JP7224395B2 - 推薦システムの最適化方法、装置、デバイス及びコンピュータ記憶媒体 - Google Patents
推薦システムの最適化方法、装置、デバイス及びコンピュータ記憶媒体 Download PDFInfo
- Publication number
- JP7224395B2 JP7224395B2 JP2021100020A JP2021100020A JP7224395B2 JP 7224395 B2 JP7224395 B2 JP 7224395B2 JP 2021100020 A JP2021100020 A JP 2021100020A JP 2021100020 A JP2021100020 A JP 2021100020A JP 7224395 B2 JP7224395 B2 JP 7224395B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- optimized
- recommendation system
- parameters
- long
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2178—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2193—Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0221—Re-usable coupons
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0225—Avoiding frauds
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Medical Informatics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Entrepreneurship & Innovation (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
Description
Claims (12)
- コンピュータによって実施される、推薦システムの最適化方法であって、
前記推薦システムを意思決定主体とし、ユーザを環境とし、前記推薦システムの1回ごとの推薦内容を前記意思決定主体の行動とし、ユーザの長期行動収益を前記環境の報酬とすることと、
強化学習の方式により前記推薦システムにおける最適化すべきパラメータを最適化して前記環境の報酬を最大化することと、を含み、
前記強化学習の方式は進化学習を含み、
前記推薦システムにおける最適化すべきパラメータを最適化することは、一回以上の反復更新を含み、
毎回の反復更新は、
各ユーザに対して不規則外乱のセットをそれぞれ生成することと、
最適化すべきパラメータと同じ次元の前記不規則外乱のセットを前記最適化すべきパラメータに増加することと、
不規則外乱が増加された推薦システムに基づいてユーザにコンテンツを推薦した後の各ユーザの長期行動収益を統計することと、
統計された各ユーザの長期行動収益に基づいて、各セットの不規則外乱から前記最適化すべきパラメータの進化方向を決定し、決定された進化方向に基づいて前記最適化すべきパラメータを更新することと、を含む、
方法。 - 前記最適化すべきパラメータは、前記推薦システムにおけるモデルパラメータ及び/又はスーパーパラメータの少なくとも一部を含む、
請求項1に記載の方法。 - 前記反復更新は繰り返し実行され、或いは、
前記反復更新は、前記推薦システムが収束条件を満たすまで実行され、或いは、
前記反復更新は、反復回数が予め設定された回数閾値に達するまで実行される、
請求項1に記載の方法。 - 前記推薦システムは、教師付き学習方式、又は教師付き学習と人工規則とを組み合わせた方式で予め得られた推薦システムである請求項1に記載の方法。
- 前記ユーザの長期行動利益は、
ユーザが前記推薦システムに属するサービスを利用した総時間、前記推薦システムが推薦したコンテンツに対するユーザの総クリック回数又は総クリック率、前記推薦システムにおけるユーザのプロモーション転化率、又は前記推薦システムに属するサービスのユーザのリテンション率を含む、
請求項1~4のいずれか一項に記載の方法。 - 推薦システムの最適化装置であって、
前記推薦システムを意思決定主体とし、ユーザを環境とし、前記推薦システムの1回ごとの推薦内容を意思決定主体の行動とし、ユーザの長期行動収益を前記環境の報酬とするモデリングユニットと、
強化学習の方式により前記推薦システムにおける最適化すべきパラメータを最適化して前記環境の報酬を最大化する最適化ユニットと、
を備え、
前記強化学習の方式は進化学習を含み、
前記最適化ユニットは、一回以上の反復更新を実行するために、具体的に、
各ユーザに対して不規則外乱のセットをそれぞれ生成する外乱生成サブユニットと、
最適化すべきパラメータと同じ次元の前記不規則外乱のセットを前記最適化すべきパラメータに増加する外乱増加サブユニットと、
不規則外乱が増加された推薦システムに基づいてユーザにコンテンツを推薦した後の各ユーザの長期行動収益を統計する収益統計サブユニットと、
前記収益統計サブユニットにより統計された各ユーザの長期行動収益に基づいて、各セットの不規則外乱から前記最適化すべきパラメータの進化方向を決定し、決定された進化方向に基づいて前記最適化すべきパラメータを更新するパラメータ進化サブユニットと、を備える、
装置。 - 前記最適化すべきパラメータは、前記推薦システムにおけるモデルパラメータ及び/又はスーパーパラメータの少なくとも一部を含む、請求項6に記載の装置。
- 前記推薦システムは、教師付き学習方式、又は教師付き学習と人工規則とを組み合わせた方式で予め得られた推薦システムである、請求項6に記載の装置。
- 前記ユーザの長期行動利益は、
ユーザが前記推薦システムに属するサービスを利用した総時間、前記推薦システムが推薦したコンテンツに対するユーザの総クリック回数又は総クリック率、前記推薦システムにおけるユーザのプロモーション転化率、又は前記推薦システムに属するサービスのユーザのリテンション率を含む、
請求項6~8のいずれか一項に記載の装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信接続されたメモリと、を備え、
前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項1~5のいずれか一項に記載の方法を実行させる電子デバイス。 - コンピュータに請求項1~5のいずれか一項に記載の方法を実行させるためのコンピュータコマンドが記憶された非一時的なコンピュータ可読記憶媒体。
- コンピュータに請求項1~5のいずれか一項に記載の方法を実行させるためのプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010561785.5 | 2020-06-18 | ||
CN202010561785.5A CN111859114A (zh) | 2020-06-18 | 2020-06-18 | 推荐系统的优化方法、装置、设备和计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022000755A JP2022000755A (ja) | 2022-01-04 |
JP7224395B2 true JP7224395B2 (ja) | 2023-02-17 |
Family
ID=72986806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021100020A Active JP7224395B2 (ja) | 2020-06-18 | 2021-06-16 | 推薦システムの最適化方法、装置、デバイス及びコンピュータ記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11836222B2 (ja) |
EP (1) | EP3926554A1 (ja) |
JP (1) | JP7224395B2 (ja) |
KR (1) | KR20210157337A (ja) |
CN (1) | CN111859114A (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022033310A (ja) * | 2018-02-15 | 2022-02-28 | 株式会社三洋物産 | 遊技機 |
JP2022033309A (ja) * | 2018-02-15 | 2022-02-28 | 株式会社三洋物産 | 遊技機 |
JP2022033308A (ja) * | 2018-02-15 | 2022-02-28 | 株式会社三洋物産 | 遊技機 |
CN112598021A (zh) * | 2020-11-27 | 2021-04-02 | 西北工业大学 | 一种基于自动机器学习的图结构搜索方法 |
CN112597391B (zh) * | 2020-12-25 | 2022-08-12 | 厦门大学 | 一种基于动态递归机制的分层强化学习的推荐系统 |
KR102518825B1 (ko) * | 2022-11-25 | 2023-04-06 | 이정수 | 자기 개발을 위한 강화 학습 시스템 |
CN116703529B (zh) * | 2023-08-02 | 2023-10-20 | 山东省人工智能研究院 | 基于特征空间语义增强的对比学习推荐方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008009805A (ja) | 2006-06-30 | 2008-01-17 | Eqs Kk | アフィリエイト管理方法およびアフィリエイト管理システム |
JP2019028899A (ja) | 2017-08-03 | 2019-02-21 | 株式会社アスコン | 販売促進システム、機械学習装置、機械学習用データ提供装置およびプログラム |
JP2020027517A (ja) | 2018-08-15 | 2020-02-20 | 株式会社Nttドコモ | 行動データ識別システム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010053991A1 (en) * | 2000-03-08 | 2001-12-20 | Bonabeau Eric W. | Methods and systems for generating business models |
WO2017035519A1 (en) * | 2015-08-27 | 2017-03-02 | Skytree, Inc. | Supervised learning based recommendation system |
US11429892B2 (en) * | 2018-03-23 | 2022-08-30 | Adobe Inc. | Recommending sequences of content with bootstrapped reinforcement learning |
CN108829846B (zh) * | 2018-06-20 | 2021-09-10 | 中国联合网络通信集团有限公司 | 一种基于用户特征的业务推荐平台数据聚类优化系统及方法 |
-
2020
- 2020-06-18 CN CN202010561785.5A patent/CN111859114A/zh active Pending
- 2020-10-29 US US17/083,704 patent/US11836222B2/en active Active
-
2021
- 2021-03-17 EP EP21163211.2A patent/EP3926554A1/en not_active Ceased
- 2021-06-14 KR KR1020210076843A patent/KR20210157337A/ko not_active Application Discontinuation
- 2021-06-16 JP JP2021100020A patent/JP7224395B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008009805A (ja) | 2006-06-30 | 2008-01-17 | Eqs Kk | アフィリエイト管理方法およびアフィリエイト管理システム |
JP2019028899A (ja) | 2017-08-03 | 2019-02-21 | 株式会社アスコン | 販売促進システム、機械学習装置、機械学習用データ提供装置およびプログラム |
JP2020027517A (ja) | 2018-08-15 | 2020-02-20 | 株式会社Nttドコモ | 行動データ識別システム |
Also Published As
Publication number | Publication date |
---|---|
CN111859114A (zh) | 2020-10-30 |
EP3926554A1 (en) | 2021-12-22 |
US11836222B2 (en) | 2023-12-05 |
US20210397901A1 (en) | 2021-12-23 |
JP2022000755A (ja) | 2022-01-04 |
KR20210157337A (ko) | 2021-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7224395B2 (ja) | 推薦システムの最適化方法、装置、デバイス及びコンピュータ記憶媒体 | |
US20220027359A1 (en) | Online hyperparameter tuning in distributed machine learning | |
JP7214954B2 (ja) | 言語モデルのトレーニング方法、装置、電子機器、プログラム及び可読記憶媒体 | |
US10560546B2 (en) | Optimizing user interface data caching for future actions | |
US11044949B2 (en) | Systems and methods for dynamic delivery of web content | |
JP2022031624A (ja) | コンテンツ推奨方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
JP7350815B2 (ja) | リソース推奨およびパラメータ確定方法、装置、機器、並びに媒体 | |
JP2022548654A (ja) | 機械学習モデルにおいて動的外れ値偏り低減を実装するように構成されるコンピュータベースシステム、コンピュータコンポーネント及びコンピュータオブジェクト | |
KR102476056B1 (ko) | 아이템 추천방법, 시스템, 전자기기 및 기록매체 | |
JP7206515B2 (ja) | 言語モデルに基づいて単語ベクトルを取得する方法、装置、デバイス及び記憶媒体 | |
CN111311321B (zh) | 用户消费行为预测模型训练方法、装置、设备及存储介质 | |
JP2022023776A (ja) | オンライン予測モデルのトレーニング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム | |
US20230117499A1 (en) | Systems and Methods for Simulating a Complex Reinforcement Learning Environment | |
US20190228105A1 (en) | Dynamic website content optimization | |
CN111506803B (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN111598616B (zh) | 对象集合筛选的实现方法、装置、设备以及存储介质 | |
JP7220733B2 (ja) | ユーザappインタレストの埋め込み方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
CN111160552B (zh) | 新闻信息的推荐处理方法、装置、设备和计算机存储介质 | |
CN111311000B (zh) | 用户消费行为预测模型训练方法、装置、设备及存储介质 | |
CN112580723A (zh) | 多模型融合方法、装置、电子设备和存储介质 | |
Dong et al. | A hierarchical network with user memory matrix for long sequence recommendation | |
Wan et al. | A contextual multi-armed bandit approach based on implicit feedback for online recommendation | |
Tang et al. | Real-time incremental recommendation for streaming data based on apache flink |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220803 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221031 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7224395 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |