CN115034847A - 基于深度学习的产品推荐方法、系统、存储介质及设备 - Google Patents
基于深度学习的产品推荐方法、系统、存储介质及设备 Download PDFInfo
- Publication number
- CN115034847A CN115034847A CN202210574295.8A CN202210574295A CN115034847A CN 115034847 A CN115034847 A CN 115034847A CN 202210574295 A CN202210574295 A CN 202210574295A CN 115034847 A CN115034847 A CN 115034847A
- Authority
- CN
- China
- Prior art keywords
- user
- product
- data
- matrix
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000013135 deep learning Methods 0.000 title claims abstract description 29
- 239000011159 matrix material Substances 0.000 claims abstract description 100
- 239000013598 vector Substances 0.000 claims abstract description 68
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 230000006399 behavior Effects 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000013136 deep learning model Methods 0.000 description 20
- 238000010586 diagram Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 229940050561 matrix product Drugs 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及基于深度学习的产品推荐方法、系统、存储介质及设备,包括以下步骤:获取用户数据集以及产品数据集并预处理,得到用户‑产品评分矩阵作为推荐模型的输入参数;根据推荐模型的输出数据,预测用户对产品的评分,并保存评分列表;根据当前用户信息与训练好的模型数据,按照评分降序排列输出前设定数量的产品作为推荐结果。将用户数据和产品数据依据预设的对照表转换为用户‑产品评分矩阵输入到推荐模型,利用该模型从用户‑产品评分矩阵中学习出有效的潜在因子,利用模型的用户隐向量和产品隐向量的内积作为预测评分,按照评分降序排列输出前若干个产品作为推荐结果。
Description
技术领域
本发明涉及数据处理技术领域,具体为基于深度学习的产品推荐方法、系统、存储介质及设备。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
电子商务平台中的产品种类繁多,需要在有限的页面中展示用户可能感兴趣的产品,即向用户推荐产品。
目前,产品的推荐方法通常以用户静态画像数据作为基础来实现特定用户的产品推荐,由于用户静态画像数据无法及时更新数据,存在较差的时效性,从而导致现有的推荐方法效果较差。以金融产品(基金产品)为例,用户为投资者,投资者对自身的投资条件和需要的基金产品进行定位时,定位通常准确性较低,将会影响用户投资的收益率。
此外,当用户历史行为数据,例如浏览或购买数据太少时,现有的推荐算法推荐结果不准确,即存在冷启动问题。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供基于深度学习的产品推荐方法、系统、存储介质及设备,将用户数据和产品数据依据预设的对照表转换为用户-产品评分矩阵输入到推荐模型,利用该模型从用户-产品评分矩阵中学习出有效的潜在因子,利用模型的用户隐向量和产品隐向量的内积作为预测评分,按照评分降序排列输出前若干个产品作为推荐结果。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供基于深度学习的产品推荐方法,包括以下步骤:
获取用户数据集以及产品数据集并预处理,得到用户-产品评分矩阵作为推荐模型的输入参数;用户数据集包括与用户标识相关联的用户数据和预设时间段内的用户历史行为数据,产品数据集包括产品标识和产品类型;
根据推荐模型的输出数据,预测用户对产品的评分,并保存评分列表;
根据当前用户信息与训练好的模型数据,按照评分降序排列输出前设定数量的产品作为推荐结果,更新输出的推荐结果。
预处理,具体为:
筛选预设时间段内的用户历史行为数据,当某用户的操作数据少于预设数量时,剔除该用户数据;
对剔除后的用户数据和产品数据参数化;
根据用户的历史行为数据将用户对产品的操作记录参数化,得到用户-产品的评分矩阵。
对剔除后的用户数据和产品数据参数化,具体为:根据预设的用户数据标准对照表和预设的转换函数,将用户数据中的非字符型数据转化为数字型数据;根据预设的对照表对产品标识和产品类型编号,将产品数据转化为数字型数据。
根据用户的历史行为数据将用户对产品的操作记录参数化,得到用户-产品的评分矩阵,具体为:根据预设的行为对照表,将用户行为数据转化为数字型数据形成用户-产品的评分矩阵。
推荐模型的训练过程,具体为:
假设用户对产品的评分矩阵A是m乘n维,即共有m个用户,n个产品,矩阵A分解为为两个矩阵U和V相乘,矩阵U的维度是m乘k,矩阵V的维度是n乘k,矩阵U和矩阵V相乘复原矩阵A;
根据分解后的矩阵矩阵U和V得到每个用户和每个产品的隐因子向量,其中,矩阵的每一行代表该用户的隐因子向量,而产品矩阵的每一列代表对应产品的隐因子向量;
在用户侧输入处理后的用户数据集作为用户向量,依次经过嵌入层与两层全连层将用户向量转化为表征用户特征的用户特征矩阵Xn×k,其中,n为用户数量,k为隐因子数;
在产品侧输入处理后的产品数据集作为产品向量,依次经过嵌入层与两层全连层将产品向量转化为表征产品特征的产品特征矩阵Yk×m,其中,m为产品数量,k为隐因子数;
用户特征矩阵和产品特征矩阵,分别与用户的隐因子向量和产品的隐因子向量相对应;
输出层根据用户隐因子向量和产品隐因子向量的内积作为预测评分。
推荐模型的训练过程,还包括:
将预测数据与真实评分数据进行对比,构造误差函数,通过最小化误差函数,进行反向梯度传播,训练整个网络;
根据梯度下降法求解损失函数的负梯度,根据负梯度的方向更新变量,直到算法收敛;
训练完成后,每个用户和每个产品将会得到对应的嵌入表达,即用户特征矩阵的对应行与产品特征矩阵的对应列。
实时调整用户的推荐结果,具体为:当用户的操作行为发生变化时,根据用户最近一次的操作行为更新推荐结果;或者出现新产品时,更新用户的特征矩阵与产品特征矩阵以及预测的评分结果,更新对用户的推荐结果。
本发明的第二个方面提供实现上述方法的系统,包括:
数据采集与预处理模块,被配置为:获取用户数据集以及产品数据集并预处理,得到推荐模型的输入参数;用户数据集包括与用户标识相关联的用户数据和预设时间段内的用户历史行为数据,产品数据集包括产品标识和产品类型;
评分预测模块,被配置为:根据推荐模型的输出数据,预测用户对产品的评分,并保存评分列表;
产品推荐与调整模块,被配置为:根据当前用户信息与训练好的模型数据,对用户推荐预设数量的产品,更新输出的推荐结果。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的基于深度学习的产品推荐方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的基于深度学习的产品推荐方法中的步骤。
与现有技术相比,以上一个或多个技术方案存在以下有益效果:
1、根据预设时间段内的用户历史行为信息,使得对用户的推荐结果更为准确,而且将训练好的模型数据进行保存,当对用户进行推荐时可以直接对数据进行调用,使得对用户的推荐结果更为迅速。对于线上平台来说,提高了用户的体验满意度,有利于平台的运营。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明一个或多个实施例提供的基于深度学习的产品推荐方法的流程示意图;
图2是本发明一个或多个实施例提供的针对金融产品推荐方法使用的深度学习模型流程示意图;
图3是本发明一个或多个实施例提供的特征向量嵌入向量化的过程示意图;
图4是本发明一个或多个实施例提供的协同过滤分解矩阵原理示意图;
图5是本发明一个或多个实施例提供的基于深度学习的产品推荐系统示意图;
图6是本发明实施例提供的数据处理模块的结构示意图;
图7是本发明实施例提供的深度学习模块的结构示意图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
以下实施例给出了基于深度学习的产品推荐方法、系统、存储介质及设备,将用户数据和产品数据依据预设的对照表转换为用户-产品评分矩阵输入到双塔DNN模型,利用该模型从用户-产品评分矩阵中学习出有效的潜在因子,利用模型的用户隐向量和产品隐向量的内积作为预测评分,按照评分降序排列返回前预设数量的产品作为推荐结果。
实施例一:
如图1所示,基于深度学习的产品推荐方法,根据用户数据和产品数据,训练深度学习模型,得到预测的用户对产品的评分,根据当前用户信息对用户推荐预设数量的产品,方法包括如下步骤:
101:采集数据;
102:对采集的数据进行预处理;
103:将处理后的数据作为深度学习模型的训练数据,得到训练好的深度学习模型,保存模型数据;
104:根据模型数据,预测用户对产品的评分,并保存评分列表;
105:根据当前用户信息与训练好的模型数据,对用户推荐预设数量个产品;
106:实时调整用户的推荐结果。
步骤101:采集数据;具体包括:
通过线上平台获取用户数据集以及产品数据集,用户数据集包括与用户标识(用户ID或者用户账号)关联的用户数据,用户数据可以为性别,年龄,职业,收入等数据,以及预设时间段内用户历史行为数据;产品数据集包括(候选产品库中的所有)产品标识,产品类型。
需要注意,本实施例以“金融产品”推荐过程中所需的用户数据为例阐述技术方案,其中涉及的用户信息仅作为产品推荐使用,不作为其他目的使用,并且采集的用户数据是在得到用户授权许可的前提下获取的(例如在获取用户数据之前,通过经用户确认的隐私协议获得授权后再采集用户数据)。
步骤102:对采集的数据进行预处理;具体包括:
首先根据采集的数据中,预设时间段内的用户历史行为数据进行筛选,当某用户的操作数据少于预设数量时,剔除该用户数据;然后对用户数据以及产品数据参数化,构建模型的输入参数;根据用户的历史行为记录将用户对产品的操作记录参数化,得到用户对产品的评分矩阵。
进一步地,对用户数据以及产品数据参数化;具体包括:将数据中的非字符型数据转化为数字型数据;例如:
可以将用户数据中的性别男记为0,性别女记为1;
职业可根据预先设置的职业标准特征数据对照表进行编号,例如,职业老师根据对照表为编号为10;
年龄与收入,可以根据预设转换函数转化为标准特征数据,例如某用户年龄为32,经过转换函数的得到的标准数据为3,进而可以得到表征用户特征的用户向量;
同样的,将产品数据中的类型进行参数化,得到产品向量;
例如,基金产品类型可以分为股票型基金、债券型基金、混合型基金、货币型基金,将其根据预设对照表进行编号;
本实施例中,对用户数据参数化后得到的对标表如表1所示:
表1 用户数据参数化
进一步地,根据用户的历史行为数据将用户对产品的操作记录参数化,得到用户对产品的评分矩阵。具体包括:
如果用户对某产品进行了浏览操作,则评分为1;如果如果用户对某产品进行了收藏操作,则评分为2;如果用户对某产品进行了购买操作,则评分为3;否则,评分为0;由此可得到用户对产品的评分矩阵;本实施例中,根据用户的历史行为数据得到的用户对产品的评分矩阵如表2所示:
表2 用户对产品的评分矩阵
I1 | I2 | I3 | ... | Im | |
U1 | 3 | 2 | 3 | ... | 5 |
U2 | 2 | 1 | 3 | ... | 2 |
U3 | 2 | 2 | 0 | ... | 2 |
.... | ... | ... | ... | ... | ... |
Un | 0 | 3 | 4 | ... | 0 |
进一步地,步骤103:将处理后的数据作为深度学习模型的训练数据,得到训练好的深度学习模型,保存模型数据;训练深度学习模型,具体包括:
上述深度学习模型,采用的是双塔DNN模型,如图2所示,对于用户侧的塔根据用户特征数据构建user_embedding,对于产品侧的塔根据产品特征构建product_embedding。两个塔分别是相互独立的网络。具体包括:
将处理后的用户数据和产品数据作为深度学习模型的输入参数,数据依次经过嵌入层与两层全连层,得到用户特征矩阵与产品特征矩阵,进而输出预测评分,根据真实评分矩阵训练模型。
其中,嵌入层可以是一个参数量庞大的权重矩阵,也可以是向量字典表。它把输入的稀疏矩阵,通过一些线性变换(也称为查表操作),映射为一个密集矩阵,于是,基于嵌入层设置的隐向量(权重矩阵或者向量字典表),可以将用户向量和产品向量映射为稠密向量;
具体地,如图3所示,假设嵌入层的嵌入维度为100,随机选取10个用户对应的用户ID,性别,年龄,职业,收入等处理后的数据作为用户向量输入嵌入层,即一个10*5的用户向量,将会输出一个10*100的用户向量,这一过程也称为用户特征的嵌入向量化;
其中,将嵌入层得到的数据传递到两层全连接层,全连接层包括多个神经元以及多层神经网络,通过全连接层对特征向量进行非线性拟合,进而得到用户特征矩阵user_embedding与产品特征矩阵product_embedding;
将得到的用户特征矩阵与产品特征矩阵进行点积操作,得到预测的用户对产品的评分列表,通过最小化预测评分与真实评分之间的误差对上述深度学习模型进行训练。
经过以上步骤训练出的权重矩阵和神经网络,可以用来生成预测用户对产品评分的双塔DNN模型。
进一步地,在得到训练好的深度学习模型后,本发明实施例还包括如下步骤:
将上述训练好的隐向量层输出数据进行保存,也即将训练好的用户特征矩阵与产品特征矩阵存入数据库;在需要对用户进行金融产品推荐时,由于用户数据模型预先训练好并存储在数据库中,可直接从数据库中调用该用户对应的模型数据,即可进行相应推荐处理,操作过程简单快捷。
关于通过双塔DNN模型预测用户对产品的评分。
本实施例中采用的用户侧模型+产品侧模型+互操作层的模型结构,统称为“双塔模型”结构。
双塔DNN模型的思想主要来源于协同过滤与矩阵分解,在基于协同过滤的方法中,最成功的是通过矩阵分解的方法,这种方法从用户-产品评分矩阵中学习出有效的潜在因子。
矩阵分解原理如图4所示;
假设用户对产品的评分矩阵A是m乘n维,即一共有m个用户,n个产品。通过某算法可以将矩阵A转化为两个矩阵U和V相乘,矩阵U的维度是m乘k,矩阵V的维度是n乘k。也就是说,这矩阵U和矩阵V的通过下面这个公式可以复原矩阵A:
Um×k*Vk×n=Am×n;
得到分解后的矩阵之后,实质上就是得到每个用户和每个产品的隐因子向量,其中,矩阵的每一行代表该用户的隐因子向量,而产品矩阵的每一列代表对应产品的隐因子向量。
通过双塔DNN模型进行金融产品推荐的原理:
在用户侧输入用户ID,性别,年龄,职业,收入等处理后的用户数据作为用户向量X,经过嵌入层与全连接层将用户向量转化为表征用户特征的用户特征矩阵Xn×k,即为user_embedding(用户嵌入)。其中,n为用户数量,k为隐因子数;
在产品侧输入产品标识,产品类型等处理后的数据作为产品向量Y,经过产品塔的一系列变换,得到表征产品特征的产品特征矩阵Yk×m,即为product_embedding(产品嵌入),其中,m为产品数量,k为隐因子数;这部分对应的是矩阵分解中的用户隐向量和产品隐向量。
将预测数据与真实评分数据进行对比,构造误差函数,通过最小化误差函数,进行反向梯度传播,训练整个网络。
其中,误差函数构造为:
根据梯度下降法求解损失函数的负梯度,根据负梯度的方向更新变量,直到算法收敛;
具体地,首先求解损失函数的负梯度:
根据负梯度的方向更新变量:
通过迭代,直到算法收敛;
训练完成后,每个用户和每个产品将会得到对应的embedding表达,也就是用户特征矩阵的对应行与产品特征矩阵的对应列。此时,就可以预测某个用户对某个产品的评分:
此时,将训练好的用户特征矩阵与产品特征矩阵存入特征数据库,当进行线上服务的时候,只需要根据用户信息调取相应数据,就可以得出训练好的模型预估结果。
步骤104:根据模型数据,预测用户对产品的评分并保存;预测用户对产品的评分,具体包括:
根据训练好的模型,调取训练好的用户特征向量user embedding与产品特征向量product embedding,进行点积操作,将会得到用户对产品的预测评分;将得到的预测评分进行储存。
步骤105:根据用户信息与训练好的模型数据,对用户推荐预设数量个产品;具体包括:
当某用户登陆或者刷新页面时,可以根据当前用户的信息从数据库中调取出其对应的隐特征向量user embedding,然后和数据库中存储的产品特征向量productembedding做内积计算,剔除该用户已经购买过的产品数据,按照评分降序排列返回前预设数量T个产品作为推荐结果。(这里的计算量巨大,如果产品库中的产品数量很多,例如一些生活用品或常见的标准化工业制品,所以这里也可以采用抽样的方式,根据产品类别进行随机抽样,根据抽样产品的特征向量计算内积,将评分排序,再计算评分前几的产品的相似产品,根据结果进行推荐)
步骤106:实时调整用户的推荐结果;具体包括:
当用户对一产品进行操作后,比如购买操作,根据该产品信息对应的特征向量,计算数据库中各产品与该产品特征向量的相似度,根据相似度降序排列,实时更新用户的推荐结果。
本实施例在得到对用户的推荐列表之后,还可以包括:
当新用户进入平台时,该用户没有历史行为数据,则可以根据新用户的基本信息获取用户向量,计算与平台已有用户的相似度,根据模型预测出的评分矩阵,根据相似用户的评分结果,对新用户进行推送相应的产品。
上述方法根据用户在平台上真实的历史行为数据,推荐给用户相应的产品,还能根据用户最近一次的操作记录对用户进行实时推荐,使得推荐结果更加贴合用户需求,提高了推荐的准确性与时效性;并且将模型数据进行储存,提高了推荐的速度,另外根据相似度对新用户的推荐,提升了对每位用户推荐服务的质量。
需要说明的是,对于前述的各方法实施例,为了简单描述,均表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
实施例二:
本实施例提供了实现上述方法的系统,如图5所示,包括:
数据采集模块:用于获取用户数据集与产品数据集,用户数据集包括与用户标识(用户ID或者用户账号)关联的用户数据,用户数据可以为性别,年龄,职业,收入等数据,以及预设时间段内用户历史行为数据;产品数据集包括(候选产品库中的所有)产品标识和产品类型。
数据处理模块:首先根据采集的数据中的用户历史行为数据进行筛选,当某一用户的操作数据少于预设数量时,剔除该用户数据;然后对用户数据以及产品数据参数化,构建模型的输入参数;根据用户的历史行为记录将用户对产品的操作记录参数化,得到用户对产品的评分矩阵;
深度学习模块:将处理后的数据作为深度学习模型的训练数据,得到训练好的深度学习模型,保存模型数据;
预测评分模块:根据模型数据,预测用户对产品的评分,并保存评分矩阵;
推荐模块:根据当前用户信息与训练好的模型数据,对用户推荐预设数量个产品;当用户登陆或者刷新页面时,可以根据用户信息从数据库中取出其对应的特征向量userembedding,然后和数据库中存储的产品特征向量product embedding做内积计算,剔除该用户已经购买过的产品数据,按照评分降序排列返回前预设数量T个产品作为推荐结果。
实时调整模块:实时调整用户的推荐结果;当用户对产品进行操作后,比如购买操作,根据该产品信息对应的特征向量,计算数据库中各产品与该产品特征向量的相似度,根据相似度降序排列,实时更新用户的推荐结果。
如图6所示,数据处理模块,包括:
数据筛选单元,根据采集的数据中的用户历史行为数据进行筛选,当用户的操作数据少于预设数量时,剔除该用户数据;
数据参数化单元,将用户数据中的性别男记为0,女性记为1,职业可根据预先设置的职业标准特征数据对照表进行编号(将该非字符型数据转化为数值型数据)等,比如,职业老师根据对照表将会编号为10,年龄与收入,可以根据预设转换函数转化为标准特征数据,比如某用户年龄为32,经过转换函数的得到的标准数据为3,进而得到表征用户特征的用户向量;同样,将产品数据中的类型进行参数化,得到产品向量。比如,基金产品类型可以分为股票型基金、债券型基金、混合型基金、货币型基金,根据预设对照表进行编号;
获取评分列表单元,所述用户历史行为数据包括但不限于:点击,收藏,购买等交互行为。可选的,在本发明的一些实施例中,如果用户对某产品进行了浏览操作,则评分为1;如果如果用户对某产品进行了收藏操作,则评分为2;如果用户对某产品进行了购买操作,则评分为3;否则,评分为0;由此可得到用户对产品的评分列表。
如图7所示,深度学习模块503,包括:
训练单元,将输入的将处理后的用户数据和产品数据作为深度学习模型的输入,数据传入嵌入层,再将嵌入层得到的数据传递到两层全连接层,进而输出预测评分,根据真实评分列表训练模型。
预测单元,将提取的用户特征与产品特征进行点积计算,根据真实评分,更新网络参数循环计算,直至达到模型最优,输出预测评分。
存储单元,将训练好的模型数据,包括训练得到的用户特征与产品特征,以及预测的评分列表,进行储存。
产品推荐系统首先从线上平台中获取用户数据以及产品数据,然后根据采集数据构建深度学习模型的输入参数,最后通过深度学习模型得到预测出的用户对产品的评分列表。本发明实施例中采用真实数据来构建模型参数,采用深度学习方法识别用户的隐藏特征,对用户进行准确及时的推荐,相比于传统推荐方式,本发明实施例可以有效识别用户的隐藏特征,且还可以基于用户实时的真实操作数据进行分析推荐,因此还具有推荐准确及时的效果。
上述产品推荐系统能够实现在线上平台针对不同的用户推荐不同的金融产品,提高客户满意度,进而避免客户流失,并且该方法基于人能智能技术实现,不需要培训专业工作人员,还可以降低运营成本。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一中提出的基于深度学习的产品推荐方法中的步骤。
本实施例中的计算机程序所执行的基于深度学习的产品推荐方法中,首先从线上平台中获取用户数据以及产品数据,然后根据采集数据构建深度学习模型的输入参数,最后通过深度学习模型得到预测出的用户对产品的评分列表。本发明实施例中采用真实数据来构建模型参数,采用深度学习方法识别用户的隐藏特征,对用户进行准确及时的推荐,相比于传统推荐方式,本发明实施例可以有效识别用户的隐藏特征,且还可以基于用户实时的真实操作数据进行分析推荐,因此还具有推荐准确及时的效果。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行所述程序时实现如上述实施例一提出的基于深度学习的产品推荐方法中的步骤。
本实施例处理器执行的基于深度学习的产品推荐方法中,首先从线上平台中获取用户数据以及产品数据,然后根据采集数据构建深度学习模型的输入参数,最后通过深度学习模型得到预测出的用户对产品的评分列表。本发明实施例中采用真实数据来构建模型参数,采用深度学习方法识别用户的隐藏特征,对用户进行准确及时的推荐,相比于传统推荐方式,本发明实施例可以有效识别用户的隐藏特征,且还可以基于用户实时的真实操作数据进行分析推荐,因此还具有推荐准确及时的效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体或随机存储记忆体等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于深度学习的产品推荐方法,其特征在于:包括以下步骤:
获取用户数据集以及产品数据集并预处理,得到用户-产品评分矩阵作为推荐模型的输入参数;用户数据集包括与用户标识相关联的用户数据和预设时间段内的用户历史行为数据,产品数据集包括产品标识和产品类型;
根据推荐模型的输出数据,预测用户对产品的评分,并保存评分列表;
根据当前用户信息与训练好的模型数据,按照评分降序排列输出前设定数量的产品作为推荐结果。
2.如权利要求1所述的基于深度学习的产品推荐方法,其特征在于:预处理的过程,包括以下步骤:
筛选预设时间段内的用户历史行为数据,当某用户的操作数据少于预设数量时,剔除该用户数据;
对剔除后的用户数据和产品数据参数化;
根据用户的历史行为数据将用户对产品的操作记录参数化,得到用户对产品的评分矩阵。
3.如权利要求2所述的基于深度学习的产品推荐方法,其特征在于:对剔除后的用户数据参数化和对产品数据参数化,具体为:根据预设的用户数据标准对照表和预设的转换函数,将用户数据中的非字符型数据转化为数字型数据;根据预设的对照表对产品标识和产品类型编号,将产品数据转化为数字型数据。
4.如权利要求2所述的基于深度学习的产品推荐方法,其特征在于:根据用户的历史行为数据将用户对产品的操作记录参数化,得到用户对产品的评分矩阵,具体为:根据预设的行为对照表,将用户行为数据转化为数字型数据形成用户对产品的评分矩阵。
5.如权利要求1所述的基于深度学习的产品推荐方法,其特征在于:推荐模型的训练过程,包括以下步骤:
假设用户对产品的评分矩阵A是m乘n维,即共有m个用户,n个产品,矩阵A分解为为两个矩阵U和V相乘,矩阵U的维度是m乘k,矩阵V的维度是n乘k,矩阵U和矩阵V相乘复原矩阵A;
根据分解后的矩阵矩阵U和V得到每个用户和每个产品的隐因子向量,其中,矩阵的每一行代表该用户的隐因子向量,而产品矩阵的每一列代表对应产品的隐因子向量;
在用户侧输入处理后的用户数据集作为用户向量,依次经过嵌入层与两层全连层将用户向量转化为表征用户特征的用户特征矩阵Xn×k,其中,n为用户数量,k为隐因子数;
在产品侧输入处理后的产品数据集作为产品向量,依次经过嵌入层与两层全连层将产品向量转化为表征产品特征的产品特征矩阵Yk×m,其中,m为产品数量,k为隐因子数;
用户特征矩阵和产品特征矩阵,分别与用户的隐因子向量和产品的隐因子向量相对应;
输出层根据用户隐因子向量和产品隐因子向量的内积作为预测评分。
6.如权利要求5所述的基于深度学习的产品推荐方法,其特征在于:推荐模型的训练过程,还包括以下步骤:
将预测数据与真实评分数据进行对比,构造误差函数,通过最小化误差函数,进行反向梯度传播,训练整个网络;
根据梯度下降法求解损失函数的负梯度,根据负梯度的方向更新变量,直到算法收敛;
训练完成后,每个用户和每个产品将会得到对应的嵌入表达,即用户特征矩阵的对应行与产品特征矩阵的对应列。
7.如权利要求5所述的基于深度学习的产品推荐方法,其特征在于:实时调整用户的推荐结果,具体为:
当用户的操作行为发生变化时,根据用户最近一次的操作行为更新推荐结果;或者出现新产品时,更新用户的特征矩阵与产品特征矩阵以及预测的评分结果,更新对用户的推荐结果。
8.基于基于深度学习的产品系统,其特征在于:包括:
数据采集与预处理模块,被配置为:获取用户数据集以及产品数据集并预处理,得到用户-产品评分矩阵作为推荐模型的输入参数;用户数据集包括与用户标识相关联的用户数据和预设时间段内的用户历史行为数据,产品数据集包括产品标识和产品类型;
评分预测模块,被配置为:根据推荐模型的输出数据,预测用户对产品的评分,并保存评分列表;
产品推荐与调整模块,被配置为:根据当前用户信息与训练好的模型数据,按照评分降序排列输出前设定数量的产品作为推荐结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的基于深度学习的产品推荐方法中的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的基于深度学习的产品推荐方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210574295.8A CN115034847A (zh) | 2022-05-25 | 2022-05-25 | 基于深度学习的产品推荐方法、系统、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210574295.8A CN115034847A (zh) | 2022-05-25 | 2022-05-25 | 基于深度学习的产品推荐方法、系统、存储介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115034847A true CN115034847A (zh) | 2022-09-09 |
Family
ID=83120191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210574295.8A Pending CN115034847A (zh) | 2022-05-25 | 2022-05-25 | 基于深度学习的产品推荐方法、系统、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115034847A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117573158A (zh) * | 2023-11-02 | 2024-02-20 | 睿智合创(北京)科技有限公司 | 一种信用评分产品的无感升级切换方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108650532A (zh) * | 2018-03-22 | 2018-10-12 | 中国传媒大学 | 有线电视点播节目推荐方法及系统 |
CN111553759A (zh) * | 2020-03-25 | 2020-08-18 | 平安科技(深圳)有限公司 | 一种产品信息推送方法、装置、设备及存储介质 |
CN112800344A (zh) * | 2021-01-29 | 2021-05-14 | 重庆邮电大学 | 一种基于深度神经网络的电影推荐方法 |
CN113220936A (zh) * | 2021-06-04 | 2021-08-06 | 黑龙江广播电视台 | 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质 |
CN113987363A (zh) * | 2021-10-20 | 2022-01-28 | 南京航空航天大学 | 一种基于隐因子预测的冷启动推荐算法 |
CN113987200A (zh) * | 2021-10-19 | 2022-01-28 | 云南大学 | 神经网络结合知识图谱的推荐方法、系统、终端、介质 |
-
2022
- 2022-05-25 CN CN202210574295.8A patent/CN115034847A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108650532A (zh) * | 2018-03-22 | 2018-10-12 | 中国传媒大学 | 有线电视点播节目推荐方法及系统 |
CN111553759A (zh) * | 2020-03-25 | 2020-08-18 | 平安科技(深圳)有限公司 | 一种产品信息推送方法、装置、设备及存储介质 |
CN112800344A (zh) * | 2021-01-29 | 2021-05-14 | 重庆邮电大学 | 一种基于深度神经网络的电影推荐方法 |
CN113220936A (zh) * | 2021-06-04 | 2021-08-06 | 黑龙江广播电视台 | 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质 |
CN113987200A (zh) * | 2021-10-19 | 2022-01-28 | 云南大学 | 神经网络结合知识图谱的推荐方法、系统、终端、介质 |
CN113987363A (zh) * | 2021-10-20 | 2022-01-28 | 南京航空航天大学 | 一种基于隐因子预测的冷启动推荐算法 |
Non-Patent Citations (2)
Title |
---|
周思鸣等: "一种基于深度学习 的精准商品推荐方法", 上海电力大学学报, 31 October 2021 (2021-10-31) * |
杨晓敏: "基于矩阵分解和蚁群算法的旅游路线优化算法", 信息技术与信息化, 25 March 2022 (2022-03-25), pages 139 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117573158A (zh) * | 2023-11-02 | 2024-02-20 | 睿智合创(北京)科技有限公司 | 一种信用评分产品的无感升级切换方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112990284B (zh) | 一种基于XGBoost算法的个体出行行为预测方法、系统及终端 | |
CN115641097B (zh) | 基于云平台的非标准机械加工协同制造管理方法及系统 | |
CN113535963B (zh) | 一种长文本事件抽取方法、装置、计算机设备及存储介质 | |
CN112418653A (zh) | 一种基于机器学习算法的携号转网潜客识别系统及方法 | |
CN108549658A (zh) | 一种基于语法分析树上注意力机制的深度学习视频问答方法及系统 | |
CN110751038A (zh) | 一种基于图注意力机制的pdf表格结构识别方法 | |
CN107766929A (zh) | 模型分析方法及装置 | |
CN116541911B (zh) | 一种基于人工智能的包装设计系统 | |
CN116611131B (zh) | 一种包装图形自动生成方法、装置、介质及设备 | |
CN111221881B (zh) | 用户特征数据合成方法、装置及电子设备 | |
CN114266443A (zh) | 数据评估方法和装置、电子设备、存储介质 | |
CN115221387A (zh) | 一种基于深度神经网络的企业信息整合方法 | |
CN115034847A (zh) | 基于深度学习的产品推荐方法、系统、存储介质及设备 | |
CN112241785B (zh) | 一种基于深度强化学习的图书采访方法 | |
CN113988951A (zh) | 基于张量分解和协同过滤的商品推荐学习模型构建方法 | |
CN116522912B (zh) | 一种包装设计语言模型的训练方法、装置、介质及设备 | |
Reddy et al. | Stock Market Prediction Using Recurrent Neural Network | |
CN116756347A (zh) | 一种基于大数据的语义信息检索方法 | |
CN110782221A (zh) | 一种面试智能评测系统及方法 | |
Heys | Machine learning as a tool to identify critical assignments | |
CN113742495B (zh) | 基于预测模型的评级特征权重确定方法及装置、电子设备 | |
CN115841269A (zh) | 一种基于多维指标分析的期刊动态评价方法 | |
CN114969511A (zh) | 基于分片的内容推荐方法、设备及介质 | |
CN114936279A (zh) | 一种面向协同制造企业的非结构化图表数据分析方法 | |
CN113570455A (zh) | 股票推荐方法及装置、计算机设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |