CN116340635A - 物品推荐方法、模型训练方法、装置及设备 - Google Patents
物品推荐方法、模型训练方法、装置及设备 Download PDFInfo
- Publication number
- CN116340635A CN116340635A CN202310330968.XA CN202310330968A CN116340635A CN 116340635 A CN116340635 A CN 116340635A CN 202310330968 A CN202310330968 A CN 202310330968A CN 116340635 A CN116340635 A CN 116340635A
- Authority
- CN
- China
- Prior art keywords
- feature matrix
- article
- matrix
- information
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000012549 training Methods 0.000 title claims abstract description 33
- 239000011159 matrix material Substances 0.000 claims abstract description 253
- 230000004927 fusion Effects 0.000 claims abstract description 73
- 239000013598 vector Substances 0.000 claims description 52
- 230000003993 interaction Effects 0.000 claims description 34
- 238000013527 convolutional neural network Methods 0.000 claims description 29
- 238000003062 neural network model Methods 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 11
- 238000011176 pooling Methods 0.000 claims description 11
- 239000013604 expression vector Substances 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 3
- 238000007634 remodeling Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 9
- 238000001914 filtration Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000002452 interceptive effect Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Technology Law (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开一种物品推荐方法、模型训练方法、装置及设备,属于数据处理技术领域。该方法包括:对目标用户的基本信息、推荐物品的基本信息以及推荐物品的附加信息进行提取运算得到推荐物品的基本特征矩阵;对目标用户的偏好信息以及推荐物品的属性信息进行提取运算得到推荐物品的隐藏特征矩阵;对基本特征矩阵以及隐藏特征矩阵进行融合得到推荐物品的第一融合特征矩阵;以及根据第一融合特征矩阵利用预先训练的物品推荐模型对目标用户接受推荐物品的概率进行预测,并根据预测结果对目标用户进行相应物品推荐。本发明实施例能够提高为目标用户推荐物品时目标用户对该物品的接受概率,提高推荐成功率。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种物品推荐方法、模型训练方法、装置及设备。
背景技术
现有技术对于物品,例如金融理财产品进行推荐时,依赖用户和物品自有信息构建用户特征和产品特征,根据用户间关系、产品间关系及用户购买物品数据,再基于机器学习算法,包括聚类算法、K近邻算法及因子分解机等,将相似用户和相似产品归类后实现推荐。但是现有技术依赖的是用户和物品各自的特征,并且用户购买物品的场景可能涉及到复杂的时空环境,导致反映用户-物品关系的数据具有非线性的底层结构,而现有的基于机器学习的推荐算法并不适用于这种非线性的底层机构。因此现有技术中的物品推荐方法无法对目标用户推荐合适的物品。
发明内容
本发明实施例提供一种物品推荐方法、模型训练方法、装置及设备,能够提高为目标用户推荐物品时目标用户对该物品的接受概率,提高推荐物品的成功率。
第一方面,本发明实施例提供一种物品推荐方法,包括:对目标用户的基本信息、推荐物品的基本信息以及所述推荐物品的附加信息进行提取运算得到所述推荐物品的基本特征矩阵;对所述目标用户的偏好信息以及所述推荐物品的属性信息进行提取运算得到所述推荐物品的隐藏特征矩阵;对所述基本特征矩阵以及所述隐藏特征矩阵进行融合得到所述推荐物品的第一融合特征矩阵;以及根据所述第一融合特征矩阵利用预先训练的物品推荐模型对所述目标用户接受所述推荐物品的概率进行预测,并根据预测结果对所述目标用户进行相应物品推荐。
第二方面,本发明实施例提供一种物品推荐模型训练方法,包括:对多个历史获取记录中每个历史获取记录的历史用户的基本信息以及历史获取物品的基本信息和附加信息进行提取运算得到所述每个历史获取记录的样本基本特征矩阵;对所述历史用户的偏好信息以及所述历史获取物品的属性信息进行提取运算得到所述每个历史获取记录的样本隐藏特征矩阵;对所述样本基本特征矩阵以及所述样本隐藏特征矩阵进行融合得到所述每个历史获取记录的第一样本特征融合矩阵;以及,利用所述第一样本特征融合矩阵对包括卷积神经网络和多层感知机的神经网络模型进行训练,得到推荐物品的物品推荐模型;所述推荐物品与所述历史获取物品为同类物品。
第三方面,本发明实施例还提供了一种物品推荐装置,包括:基本特征矩阵获取模块,用于对目标用户的基本信息、推荐物品的基本信息以及所述推荐物品的附加信息进行提取运算得到所述推荐物品的基本特征矩阵;隐藏特征矩阵获取模块,用于对所述目标用户的偏好信息以及所述推荐物品的属性信息进行提取运算得到所述推荐物品的隐藏特征矩阵;第一融合特征矩阵获取模块,用于对所述基本特征矩阵以及所述隐藏特征矩阵进行融合得到所述推荐物品的第一融合特征矩阵;以及,预测模块,用于根据所述第一融合特征矩阵利用预先训练的物品推荐模型对所述目标用户接受所述推荐物品的概率进行预测,并根据预测结果对所述目标用户进行相应物品推荐。
第四方面,本发明实施例还提供了一种物品推荐模型训练装置,包括:样本基本特征矩阵获取模块,用于对多个历史获取记录中每个历史获取记录的历史用户的基本信息以及历史获取物品的基本信息和附加信息进行提取运算得到所述每个历史获取记录的样本基本特征矩阵;样本隐藏特征矩阵获取模块,用于对所述历史用户的偏好信息以及所述历史获取物品的属性信息进行提取运算得到所述每个历史获取记录的样本隐藏特征矩阵;第一样本特征融合矩阵获取模块,用于对所述样本基本特征矩阵以及所述样本隐藏特征矩阵进行融合得到所述每个历史获取记录的第一样本特征融合矩阵;以及模型训练模块,用于利用所述第一样本特征融合矩阵对包括卷积神经网络和多层感知机的神经网络模型进行训练,得到推荐物品的物品推荐模型;所述推荐物品与所述历史获取物品为同类物品。
第五方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明实施例中任一所述的物品推荐方法或者物品推荐模型训练方法。
本发明通过从目标用户和想要推荐的物品的基本信息,和包括用户偏好信息和物品属性信息的隐藏信息中进行特征提取,并对提取得到的基本信息特征和隐藏信息进行融合后利用神经网络模型,对用户对所推荐的物品的接受概率基于多维度、深层次的特征进行精确有效地预测,为如何高效的从多源信息中捕获关键特征提供了一种新的解决方案;本发明充分挖掘用户偏好信息和物品属性信息,构建了多维评分矩阵提取了用户和推荐物品的隐藏特征,从而更加细粒度地挖掘了用户和推荐物品的深层特征,使得为目标用户推荐的物品更加符合其需求,从而提高推荐物品时的推荐成功率。
附图说明
图1是本发明实施例提供的物品推荐方法的一个流程示意图;
图2是本发明实施例提供的物品推荐方法的另一个流程示意图;
图3是本发明实施例提供的物品推荐模型训练方法的一个流程示意图;
图4是本发明实施例提供的物品推荐装置的一个结构示意图;
图5是本发明实施例提供的物品推荐模型训练装置的一个结构示意图;
图6是本发明实施例提供一个电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
现有技术对于物品,例如金融理财产品进行推荐时,通常基于传统的协同过滤推荐算法或者基于机器学习的推荐算法进行推荐。其中传统的协同过滤算法包括基于内存的协同过滤算法和基于模型的协同过滤算法。基于内存的协同过滤算法主要基于用户-理财产品评分矩阵,通过皮尔逊相关性系数计算用户间相似度,从而获取当前用户邻居的行为信息实现预测。基于模型的协同过滤算法主要通过矩阵分解的方法,利用用户-理财产品评分矩阵中的部分取值构建全局模型,通过补充完整的评分矩阵实现预测。因此基于传统的协同过滤推荐算法的方案的缺点是:在性能上十分依赖用户及产品邻域的确定,当出现数据高稀疏性问题时,此类算法很难找到高质量的邻居,从而影响最终的预测精度。此外,此类算法常常受限于自身的扩展性问题,当面对大量金融理财数据时,其计算量会大大增加,可能无法达到令人满意的预测效果。
基于机器学习的推荐方法,通常包括聚类算法、K近邻算法及因子分解机等方法实现预测,此类方法根据用户间关系、产品间关系及用户购买理财产品数据,对用户和理财产品的特征信息进行建模,并学习用户和理财产品间的交互关系从而实现预测。用户购买理财产品的场景涉及到复杂的时空环境,影响因素众多,因此导致反映用户-理财产品关系的数据具有非线性的底层结构,而现有的基于机器学习的推荐算法作为一种浅层的学习模型,无法有效的学习原始特征间深层的高阶特征交互,导致无法获得精确有效的预测结果。
本发明提供一种物品推荐方法、模型训练方法、装置及设备,通过从目标用户和想要推荐的物品的基本信息,和包括用户偏好信息和物品属性信息的隐藏信息中进行特征提取,并对提取得到的基本信息特征和隐藏信息进行融合后利用包括卷积神经网络模型以及多层感知机的神经网络模型对用户对所推荐的物品的接受概率进行精确有效地预测,使得为目标用户推荐的物品更加符合其需求,从而提高推荐物品时的推荐成功率。
图1为本发明实施例提供的物品推荐方法的一个流程示意图,该方法可以由本发明实施例提供的物品推荐装置来执行,该装置可采用软件和/或硬件的方式实现。在一个具体的实施例中,该装置可以集成在电子设备中,电子设备比如可以是计算机、服务器等。以下实施例将以该装置集成在电子设备中为例进行说明。参考图1,该方法具体可以包括如下步骤:
步骤101,对目标用户的基本信息、推荐物品的基本信息以及所述推荐物品的附加信息进行提取运算得到所述推荐物品的基本特征矩阵,能够利于根据基本特征矩阵得到融合特征矩阵,并进一步根据融合特征矩阵利用神经网络模型对符合目标用户需求的物品进行推荐。
具体的,上述推荐物品可以是工业产品、虚拟产品或者虚拟服务等。其中虚拟产品可以是金融理财产品。
具体的,上述目标用户的基本信息可以包括目标用户的年龄、用户的性别、用户的资产规模或者用户的收支信息等。
具体的,上述物品为金融理财产品时,上述物品的基本信息可以包括产品的期限或者产品风险等级等。
具体的,上述物品为金融理财产品时,上述推荐物品的附加信息可以包括相应产品额外的文本信息,例如产品说明书以及产品介绍等信息。产品的文本信息包含了丰富的语义信息,包括扩展信息、产品消费信息。两个具有相似语义的产品通常意味着这两个产品具有相似的属性,本发明实施例将附加信息加入到基本信息特征中,能够提高物品推荐的准确性。
在本发明的可选具体实施例中,上述对目标用户的基本信息、推荐物品的基本信息以及所述推荐物品的附加信息进行提取运算得到所述推荐物品的基本特征矩阵的过程包括:根据所述目标用户的基本信息以及推荐物品的基本信息建立基本信息嵌入特征矩阵。
在本发明的可选具体实施例中,上述根据所述目标用户的基本信息以及推荐物品的基本信息建立基本信息嵌入特征矩阵的过程包括:根据所述目标用户的基本信息以及推荐物品的基本信息建立基本信息特征表示向量;对所述基本信息特征表示向量基于独热编码进行转换得到基本信息高维稀疏向量;对所述基本信息高维稀疏向量通过嵌入层网络进行映射得到基本信息嵌入特征矩阵。
具体的,嵌入层常被应用在神经网络模型的第一个网络层,其目的是将索引标号映射到密集的低维向量中。嵌入层通常用于词语的表征,每个词语都由一个密集向量表示,词语间的关系由嵌入层学习的权重参数进行表征,经过多次训练学习后,词语间的关系都可以由密集向量进行正确表达。
在本发明的可选具体实例中,上述目标用户的基本信息包括目标用户的年龄和资产规模,上述推荐物品的基本信息包括推荐物品的产品期限和产品风险等级,则上述基本信息特征表示向量可以表示为:
xE=(uid,uage,,…,uasset,,pid,pterm,…,prisk)
由于用户和理财产品的每个特征都基于字段分类的形式收集,因此每条用户购买记录都可以基于独热编码转换为高维的稀疏(二进制)向量,得到基本信息高维稀疏向量:
xE(1000,0100,…,0001,000010,0100,…,0100)
之后在基本信息高维稀疏向量上应用一个旨在将稀疏的独热编码映射为一个固定程度的稠密向量嵌入层,其中每个特征都将由一个密集的嵌入向量表示,在仅保留独热编码标识为1的特征后,可以得到基本信息嵌入特征矩阵,表示为:
可选的,对上述基本信息嵌入特征矩阵进行初始化得到基本特征矩阵。
在本发明的可选具体实施例中,上述对对所述基本信息嵌入特征矩阵进行初始化得到上述基本特征矩阵的过程包括,对上述基本信息嵌入特征矩阵进行随机初始化。
在本发明的优选具体实施例中,上述对所述基本信息嵌入特征矩阵进行初始化得到上述基本特征矩阵的过程包括:获取所述推荐物品的附加信息,并利用文本向量提取算法对所述推荐物品的附加信息进行提取得到物品附加信息语义向量;以及,利用所述物品附加信息语义向量对所述嵌入特征向量进行初始化得到所述基本特征矩阵。
在本发明的可选具体实例中,对上述推荐物品的附加信息利用自然语言处理中的Doc2Vec算法,在每个产品的附加信息文档中添加一个短路向量和词语向量用于训练,基于PV-DW模型学习后得到所述物品附加信息语义向量。
具体的,利用推荐物品附加信息语义向量对基本信息嵌入特征矩阵进行初始化,能够保证产品基本特征向量中嵌入了产品附加信息的先验知识,有效避免了产品向量随机初始化导致的不确定性。
步骤102,对所述目标用户的偏好信息以及所述推荐物品的属性信息进行提取运算得到所述推荐物品的隐藏特征矩阵,以利于根据隐藏特征矩阵得到融合特征矩阵,并进一步根据融合特征矩阵利用神经网络模型对符合目标用户需求的物品进行推荐。
具体的,上述目标用户的偏好信息以及推荐物品的属性信息可以包括用户接受上述推荐物品的时间或者数量等。例如,当上述推荐物品为金融理财产品时,上述用户的偏好信息可以包括购买期限、购买数量及购买金额。
在本发明的可选具体实施例中,上述对所述目标用户的偏好信息以及所述推荐物品的属性信息进行提取运算得到所述推荐物品的隐藏特征矩阵的过程包括:获取所述目标用户的偏好信息以及所述推荐物品的属性信息,并根据所述目标用户的偏好信息以及所述推荐物品的属性信息建立隐藏信息表示向量。
可选的,根据上述目标用户的偏好信息以及推荐物品的属性信息生成多维矩阵,并对多维矩阵进行概率矩阵分解,获取多个维度的包含目标用户的偏好特征隐因子和推荐物品的产品属性特征隐因子的隐藏矩阵。
具体的,矩阵分解是推荐系统中一种比较典型的协同过滤算法,它通常基于用户产品评分矩阵构建目标函数来获取用户和产品的两个独立特征空间,并通过训练出预定义的特征向量后基于低秩假设实现概率预测。概率矩阵分解是对传统矩阵分解的进一步优化,它基于用户和产品的特征向量均服从高斯分布的先验分布实现预测。
优选的,将上述多维矩阵进行概率矩阵分解,得到单维度的包含目标用户的偏好特征隐因子和推荐物品的产品属性特征隐因子的隐藏信息表示向量,具体可以表示为:
xI=(uid,pid,uimpa,uimpb,uimpc,pimpa,pimpb,pimpc)
其中,每个隐因子都为浮点型数值。因此本发明实施例可以基于小数点后位数对特征进行离散化,进而将每个离散化特征都表示为分类特征。
在本发明的可选具体实施例中,上述对目标用户的偏好信息以及所述推荐物品的属性信息进行提取运算得到所述推荐物品的隐藏特征矩阵的过程包括:对所述隐藏信息表示向量基于独热编码进行转换得到隐藏信息高维稀疏向量;以及,对所述隐藏信息高维稀疏向量通过嵌入层网络进行映射得到所述隐藏特征矩阵。
具体的,可以将上述隐藏信息表示向量拼接后,引入独热编码和嵌入层网络,将每个隐藏特征都映射为一个嵌入向量,初始化后得到上述隐藏特征矩阵,具体可以表示为:
步骤103,对所述基本特征矩阵以及所述隐藏特征矩阵进行融合得到所述推荐物品的第一融合特征矩阵,以利于根据所得到的第一融合矩阵利用神经网络模型对符合目标用户需求的物品进行推荐。
在本发明的优选具体实施例中,上述对基本特征矩阵以及所述隐藏特征矩阵进行融合得到所述推荐物品的第一融合特征矩阵的过程包括:对所述基本特征矩阵以及所述隐藏特征矩阵进行拼接得到所述第一融合特征矩阵。
可选的,也可以通过其他的方式对所述基本特征矩阵以及所述隐藏特征矩阵进行融合。
具体的,基于步骤102以及步骤103分别获取的基本特征矩阵和隐藏特征矩阵。为了更好地利用以上信息提高推荐物品时的推荐准确性,本发明实施例将基本特征矩阵和隐藏特征矩阵进行拼接融合,得到一个融合矩阵,可以表示如下:
其中,f表示特征总数和,d表示嵌入向量维度。
步骤104,根据所述第一融合特征矩阵利用预先训练的物品推荐模型对所述目标用户接受所述推荐物品的概率进行预测,并根据预测结果对所述目标用户进行相应物品推荐,这样就能够通过对目标用户接收推荐物品概率的准确预测,为目标用户推荐更加符合其需求的物品,从而提高推荐物品时的成功率。
具体的,上述物品推荐模型可以包括卷积神经网络和多层感知机,可以具体将上述卷积神经网络以及多层感知机连接起来得到上述推荐模型。
在本发明的可选具体实施例中,根据上述第一融合特征得到上述卷积神经网络的输入,并在上述多层感知机的最后一个输出层输出得到上述用户接收上述推荐物品的概率。
下面进一步介绍物品推荐方法的方法,如图2所示,即图1中的步骤104可以包括如下步骤:
步骤1041,对所述第一融合特征矩阵进行维度扩展得到扩展特征矩阵。
步骤1042,将所述扩展特征矩阵作为所述卷积神经网络的输入,利用所述卷积神经网路的卷积层和池化层,对所述扩展特征矩阵的局部高阶特征进行学习,并提取得到所述扩展特征矩阵的局部高阶特征交互矩阵。
可选的,将扩展特征矩阵输入卷积神经网络的卷积层,对第一融合特征矩阵的局部高阶特征交互进行学习:
C1=Ψ(C0*W1+b1)
其中*表示卷积操作,W1和b1表示第一层的卷积核和偏置,Ψ()表示激活函数RELU。
其中hi表示第i个池化层的高度,i表示层数。最终,第一融合特征矩阵的局部高阶特征交互由多次卷积和池化操作获得,即:
其中,I表示卷积-池化层的个数。
鉴于基于线性模型的传统推荐方法拟合能力不足,本发明实施例基于卷积神经网络实现对用户-理财产品的多源特征交互学习。其中,卷积神经网络的权值共享机制和池化机制可以最大程度的减少寻找关键局部模式所需的参数数量,从而有效地识别稀疏的高阶特征交互
步骤1043,根据所述局部高阶特征交互矩阵利用所述多层感知机预测得到所述目标用户接受所述推荐物品的概率。
可选的,上述根据所述局部高阶特征交互矩阵利用所述多层感知机预测得到所述目标用户接受所述推荐物品的概率的过程包括:
根据所述第一融合特征矩阵对所述局部高阶特征交互矩阵进行重塑得到重塑局部特征交互矩阵;对所述重塑局部特征交互矩阵以及所述第一融合特征矩阵进行拼接得到第二融合特征矩阵;利用所述多层感知机通过对所述第二融合特征矩阵的全局高阶特征进行学习,并在所述多层感知机模型的最后一层输出得到所述目标用户接受所述推荐物品的概率。
再将重塑局部特征交互矩阵与第一融合特征矩阵进行拼接得到第二融合特征矩阵:
之后,引入多层感知机对第二融合特征矩阵的全局高阶特征进行学习,其中多层感知机由多个隐藏层堆叠实现:
R0=flatten(Q)…
Ri=Φ(XiRi-1+Zi)…
其中,R0表示第二融合特征矩阵的一维化向量,即多层感知机的输入,Xi和Zi分别表示第i个隐藏层的权重矩阵和偏置向量Ri表示第i个隐藏层的输出。
可选的,上述隐藏层的个数为λ,则上述全局高阶特征交互表示为:
Rλ-1=Φ(Xλ-1Rλ-2+Zλ-1)
因此最终预测目标用户目标接受一推荐物品的概率可以由最后一层输出得到:
R*=Φ(XλRλ-1+Zλ1)
卷积神经网络作为一种非线性的深层网络模型,能够高效地学习多个连续特征的局部高阶特征交互,这些局部高阶特征交互中涵盖大量相邻特征的模式,因此,卷积神经网络在一定程度上忽略对全局高阶特征交互的有效学习。因此本发明实施例进一步引入多层感知机,学习第一融合特征矩阵的全局高阶特征交互进行学习,并最终对目标用户接收一推荐物品的概率进行预测,提高预测的准确率。
本发明实施例得到的目标用户接收一推荐物品的概率R*,是通过目标用户和推荐物品的基本信息和附加信息,在提取了目标用户和推荐物品的基本特征,用户偏好隐藏特征以及推荐物品属性隐藏特征的基础上,学习了目标用户间、推荐间及目标用户与推荐物品间的高阶特征交互预测实现的。
本发明实施例充分考虑了目标用户和推荐物品之间的非线性底层逻辑关系,基于神经网络模型对目标用户购买推荐物品的概率进行了预测,实现了从局部到全局的高阶多源特征交互学习,使得对目标用户推荐物品得以高精度实现。
图3是本发明实施例提供的一种物品推荐模型训练方法的一个流程示意图,该方法可以由本发明实施例提供的物品推荐模型训练装置来执行,该装置可采用软件和/或硬件的方式实现。在一个具体的实施例中,该装置可以集成在电子设备中,电子设备比如可以是计算机、服务器等。以下实施例将以该装置集成在电子设备中为例进行说明。参考图3,该方法具体可以包括如下步骤:
步骤301,多个历史获取记录中每个历史获取记录的历史用户的基本信息以及历史获取物品的基本信息和附加信息进行提取运算得到所述每个历史获取记录的样本基本特征矩阵。
具体的,上述历史获取物品与前述推荐物品为同类物品。例如,上述历史获取物品以及前述推荐物品都可以是金融理财产品,也可以是同一种工业产品。
步骤302,对所述历史用户的偏好信息以及所述历史获取物品的属性信息进行提取运算得到所述每个历史获取记录的样本隐藏特征矩阵。
步骤303对所述样本基本特征矩阵以及所述样本隐藏特征矩阵进行融合得到所述每个历史获取记录的第一样本特征融合矩阵。
步骤304,利用所述第一样本特征融合矩阵对包括卷积神经网络和多层感知机的神经网络模型进行训练,得到推荐物品的物品推荐模型;其中所述推荐物品与所述历史获取物品为同类物品。
具体的,可以将上述卷积神经网络和多层感知机连接起来得到上述神经网络模型。
可选的,将上述卷积神经网络的最后一个池化层与上述多层感知机的输入层进行连接,得到上述神经网络模型。
可选的,上述利用所述第一样本特征融合矩阵对包括卷积神经网络和多层感知机的神经网络模型进行训练,得到推荐物品的物品推荐模型的过程包括:对上述第一样本特征融合矩阵进行维度扩展,得到扩展特征矩阵;将上述扩展特征矩阵作为上述卷积神经网络的输入,利用上述卷积神经网络的卷积层和池化层对上述第一样本特征融合特征学习后在最后一个池化层得到局部高阶特征交互矩阵;将上述部高阶特征交互矩阵根据第一样本特征融合矩阵后与第一样本特征融合矩阵连接得到第二样本特征融合矩阵;将上述第二样本特征融合矩阵作为上述多层感知机的输入,在多层感知机的最后一层得到上述历史用户接受上述历史获取物品的概率;调整上述卷积神经网络及多层感知机的权重和偏置,以使上述历史用户接受上述历史获取物品的概率不小于预设的概率阈值,就可以得到上述推荐物品的物品推荐模型。
具体的,上述预设的概率阈值可以是90%.
本发明实施例充分考虑了目标用户和推荐物品之间的非线性底层逻辑关系,基于神经网络模型设计了一种全新的高阶特征交互学习模型,使得利用本模型对目标用户接受推荐物品接受的概率进行预测时,可以从局部到全局的高阶多源特征交互学习,使得对目标用户推荐物品得以高精度实现。
图4是本发明实施例提供的物品推荐装置的一个结构图,该装置适用于执行本发明实施例提供的物品推荐方法。如图4所示,该装置具体可以包括:
基本特征矩阵获取模块401,用于对目标用户的基本信息、推荐物品的基本信息以及所述推荐物品的附加信息进行提取运算得到所述推荐物品的基本特征矩阵,能够利于根据所得到的基本特征矩阵得到融合特征矩阵,并进一步根据融合特征矩阵利用神经网络模型对符合目标用户需求的物品进行推荐。
在本发明的可选具体实施例中,上述基本特征矩阵获取模块401具体用于根据所述目标用户的基本信息以及推荐物品的基本信息建立基本信息特征表示向量,并对所述基本信息特征表示向量基于独热编码进行转换得到基本信息高维稀疏向量,以及对所述基本信息高维稀疏向量通过嵌入层网络进行映射得到基本信息嵌入特征矩阵;获取所述推荐物品的附加信息,并利用文本向量提取算法对所述推荐物品的附加信息进行提取得到物品附加信息语义向量;以及利用所述物品附加信息语义向量对所述嵌入特征向量进行初始化得到所述基本特征矩阵。
隐藏特征矩阵获取模块402,用于对所述目标用户的偏好信息以及所述推荐物品的属性信息进行提取运算得到所述推荐物品的隐藏特征矩阵,能够利于根据所得到的隐藏特征矩阵得到融合特征矩阵,并进一步根据融合特征矩阵利用神经网络模型对符合目标用户需求的物品进行推荐。
在本发明的可选具体实施例中,上述隐藏特征矩阵获取模块402具体用于获取所述目标用户的偏好信息以及所述推荐物品的属性信息,并根据所述目标用户的偏好信息以及所述推荐物品的属性信息建立隐藏信息表示向量;对所述隐藏信息表示向量基于独热编码进行转换得到隐藏信息高维稀疏向量;以及,对所述隐藏信息高维稀疏向量通过嵌入层网络进行映射得到所述隐藏特征矩阵。
第一融合特征矩阵获取模块403,用于对所述基本特征矩阵以及所述隐藏特征矩阵进行融合得到所述推荐物品的第一融合特征矩阵,能够利于根据所得到的第一融合矩阵利用神经网络模型对符合目标用户需求的物品进行推荐。
在本发明的可选具体实施例中,上述第一融合特征矩阵获取模块403具体用于对所述基本特征矩阵以及所述隐藏特征矩阵进行拼接得到所述第一融合特征矩阵。
预测模块404,用于根据所述第一融合特征矩阵利用预先训练的物品推荐模型对所述目标用户接受所述推荐物品的概率进行预测,并根据预测结果对所述目标用户进行相应物品推荐。
在本发明的可选具体实施例中,上述预测模块404能够具体用于对所述第一融合特征矩阵进行维度扩展得到扩展特征矩阵;将所述扩展特征矩阵作为所述卷积神经网络的输入,利用所述卷积神经网路的卷积层和池化层,对所述扩展特征矩阵的局部高阶特征进行学习,并提取得到所述扩展特征矩阵的局部高阶特征交互矩阵;以及根据所述局部高阶特征交互矩阵利用所述多层感知机预测得到所述目标用户接受所述推荐物品的概率。
在本发明的可选具体实施例中,上述预测模块404具体用于根据所述第一融合特征矩阵对所述局部高阶特征交互矩阵进行重塑得到重塑局部特征交互矩阵;对所述重塑局部特征交互矩阵以及所述第一融合特征矩阵进行拼接得到第二融合特征矩阵;利用所述多层感知机通过对所述第二融合特征矩阵的全局高阶特征进行学习,并在所述多层感知机模型的最后一层输出得到所述目标用户接受所述推荐物品的概率。
本发明实施例对用户对所推荐的物品的接受概率基于多维度、深层次的特征进行精确有效地预测,为如何高效的从多源信息中捕获关键特征提供了一种新的解决方案;本发明实施例充分挖掘用户偏好信息和物品属性信息,构建了多维评分矩阵提取了用户和推荐物品的隐藏特征,从而更加细粒度地挖掘了用户和推荐物品的深层特征,使得能够有效的实现了用户-物品高精度推荐,为目标用户推荐的物品更加符合其需求。
图5是本发明实施例提供的物品推荐装置的一个结构图,该装置适用于执行本发明实施例提供的物品推荐方法。如图5所示,该装置具体可以包括:
样本基本特征矩阵获取模块501,用于多个历史获取记录中每个历史获取记录的历史用户的基本信息以及历史获取物品的基本信息和附加信息进行提取运算得到所述每个历史获取记录的样本基本特征矩阵,所述推荐物品与所述历史获取物品为同类物品。
样本隐藏特征矩阵获取模块502,用于对所述历史用户的偏好信息以及所述历史获取物品的属性信息进行提取运算得到所述每个历史获取记录的样本隐藏特征矩阵。
第一样本特征融合矩阵获取模块503,用于对所述样本基本特征矩阵以及所述样本隐藏特征矩阵进行融合得到所述每个历史获取记录的第一样本特征融合矩阵。
模型训练模块504,用于利用所述第一样本特征融合矩阵对包括卷积神经网络和多层感知机的神经网络模型进行训练,得到推荐物品的物品推荐模型。
本发明实施例训练得到的物品推荐模型,能够使利用本模型对目标用户接受推荐物品接受的概率进行预测时,可以从局部到全局的高阶多源特征交互学习,使得对目标用户推荐物品得以高精度实现。
本领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述功能模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例提供的物品推荐方法或者物品推荐模型训练方法。
本发明实施例还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例提供的物品推荐方法或者物品推荐模型训练方法。
下面参考图6,其示出了适于用来实现本发明实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块和/或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块和/或单元也可以设置在处理器中,例如,可以描述为:一种处理器包括基本特征矩阵获取模块、隐藏特征矩阵获取模块、第一融合特征矩阵获取模块和预测模块;或者,可以描述为:一种处理器包括获取样本基本特征矩阵获取模块、样本隐藏特征矩阵获取模块、第一样本特征融合矩阵获取模块和模型训练模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种物品推荐方法,其特征在于,包括:
对目标用户的基本信息、推荐物品的基本信息以及所述推荐物品的附加信息进行提取运算得到所述推荐物品的基本特征矩阵;
对所述目标用户的偏好信息以及所述推荐物品的属性信息进行提取运算得到所述推荐物品的隐藏特征矩阵;
对所述基本特征矩阵以及所述隐藏特征矩阵进行融合得到所述推荐物品的第一融合特征矩阵;以及
根据所述第一融合特征矩阵利用预先训练的物品推荐模型对所述目标用户接受所述推荐物品的概率进行预测,并根据预测结果对所述目标用户进行相应物品推荐。
2.根据权利要求1所述的物品推荐方法,其特征在于,所述对目标用户的基本信息、推荐物品的基本信息以及所述推荐物品的附加信息进行提取运算得到所述推荐物品的基本特征矩阵的过程包括:
根据所述目标用户的基本信息以及所述推荐物品的基本信息建立基本信息特征表示向量,并对所述基本信息特征表示向量基于独热编码进行转换得到基本信息高维稀疏向量,以及对所述基本信息高维稀疏向量通过嵌入层网络进行映射得到基本信息嵌入特征矩阵;
获取所述推荐物品的附加信息,并利用文本向量提取算法对所述推荐物品的附加信息进行提取得到物品附加信息语义向量;以及
利用所述物品附加信息语义向量对所述嵌入特征向量进行初始化得到所述基本特征矩阵。
3.根据权利要求1所述的物品推荐方法,其特征在于,所述对所述目标用户的偏好信息以及所述推荐物品的属性信息进行提取运算得到所述推荐物品的隐藏特征矩阵的过程包括:
获取所述目标用户的偏好信息以及所述推荐物品的属性信息,并根据所述目标用户的偏好信息以及所述推荐物品的属性信息建立隐藏信息表示向量;
对所述隐藏信息表示向量基于独热编码进行转换得到隐藏信息高维稀疏向量;以及
对所述隐藏信息高维稀疏向量通过嵌入层网络进行映射得到所述隐藏特征矩阵。
4.根据权利要求1所述的物品推荐方法,其特征在于,所述对所述基本特征矩阵以及所述隐藏特征矩阵进行融合得到所述推荐物品的第一融合特征矩阵的过程包括:
对所述基本特征矩阵以及所述隐藏特征矩阵进行拼接得到所述第一融合特征矩阵。
5.根据权利要求1所述的物品推荐方法,其特征在于,所述物品推荐模型包括卷积神经网络和多层感知机;
所述根据所述第一融合特征矩阵利用预先训练的物品推荐模型对所述目标用户接受所述推荐物品的概率进行预测的过程包括:
对所述第一融合特征矩阵进行维度扩展得到扩展特征矩阵;
将所述扩展特征矩阵作为所述卷积神经网络的输入,利用所述卷积神经网路的卷积层和池化层,对所述扩展特征矩阵的局部高阶特征进行学习,并提取得到所述扩展特征矩阵的局部高阶特征交互矩阵;以及
根据所述局部高阶特征交互矩阵利用所述多层感知机预测得到所述目标用户接受所述推荐物品的概率。
6.根据权利要求5所述的物品推荐方法,其特征在于,所述根据所述局部高阶特征交互矩阵利用所述多层感知机预测得到所述目标用户接受所述推荐物品的概率的过程包括:
根据所述第一融合特征矩阵对所述局部高阶特征交互矩阵进行重塑得到重塑局部特征交互矩阵;
对所述重塑局部特征交互矩阵以及所述第一融合特征矩阵进行拼接得到第二融合特征矩阵;以及
利用所述多层感知机通过对所述第二融合特征矩阵的全局高阶特征进行学习,并在所述多层感知机模型的最后一层输出得到所述目标用户接受所述推荐物品的概率。
7.一种物品推荐模型训练方法,其特征在于,包括:
对多个历史获取记录中每个历史获取记录的历史用户的基本信息以及历史获取物品的基本信息和附加信息进行提取运算得到所述每个历史获取记录的样本基本特征矩阵;
对所述历史用户的偏好信息以及所述历史获取物品的属性信息进行提取运算得到所述每个历史获取记录的样本隐藏特征矩阵;
对所述样本基本特征矩阵以及所述样本隐藏特征矩阵进行融合得到所述每个历史获取记录的第一样本特征融合矩阵;以及
利用所述第一样本特征融合矩阵对包括卷积神经网络和多层感知机的神经网络模型进行训练,得到推荐物品的物品推荐模型;
所述推荐物品与所述历史获取物品为同类物品。
8.一种物品推荐装置,其特征在于,包括:
基本特征矩阵获取模块,用于对目标用户的基本信息、推荐物品的基本信息以及所述推荐物品的附加信息进行提取运算得到所述推荐物品的基本特征矩阵;
隐藏特征矩阵获取模块,用于对所述目标用户的偏好信息以及所述推荐物品的属性信息进行提取运算得到所述推荐物品的隐藏特征矩阵;
第一融合特征矩阵获取模块,用于对所述基本特征矩阵以及所述隐藏特征矩阵进行融合得到所述推荐物品的第一融合特征矩阵;以及
预测模块,用于根据所述第一融合特征矩阵利用预先训练的物品推荐模型对所述目标用户接受所述推荐物品的概率进行预测,并根据预测结果对所述目标用户进行相应物品推荐。
9.一种物品推荐模型训练装置,其特征在于,包括:
样本基本特征矩阵获取模块,用于对多个历史获取记录中每个历史获取记录的历史用户的基本信息以及历史获取物品的基本信息和附加信息进行提取运算得到所述每个历史获取记录的样本基本特征矩阵;
样本隐藏特征矩阵获取模块,用于对所述历史用户的偏好信息以及所述历史获取物品的属性信息进行提取运算得到所述每个历史获取记录的样本隐藏特征矩阵;
第一样本特征融合矩阵获取模块,用于对所述样本基本特征矩阵以及所述样本隐藏特征矩阵进行融合得到所述每个历史获取记录的第一样本特征融合矩阵;以及
模型训练模块,用于利用所述第一样本特征融合矩阵对包括卷积神经网络和多层感知机的神经网络模型进行训练,得到推荐物品的物品推荐模型;
所述推荐物品与所述历史获取物品为同类物品。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6中任一所述的物品推荐方法或者如权利要求7所述的物品推荐模型训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310330968.XA CN116340635A (zh) | 2023-03-30 | 2023-03-30 | 物品推荐方法、模型训练方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310330968.XA CN116340635A (zh) | 2023-03-30 | 2023-03-30 | 物品推荐方法、模型训练方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116340635A true CN116340635A (zh) | 2023-06-27 |
Family
ID=86875941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310330968.XA Pending CN116340635A (zh) | 2023-03-30 | 2023-03-30 | 物品推荐方法、模型训练方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116340635A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117408786A (zh) * | 2023-12-11 | 2024-01-16 | 深圳须弥云图空间科技有限公司 | 一种基于门控机制的物品推荐方法及装置 |
-
2023
- 2023-03-30 CN CN202310330968.XA patent/CN116340635A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117408786A (zh) * | 2023-12-11 | 2024-01-16 | 深圳须弥云图空间科技有限公司 | 一种基于门控机制的物品推荐方法及装置 |
CN117408786B (zh) * | 2023-12-11 | 2024-04-16 | 深圳须弥云图空间科技有限公司 | 一种基于门控机制的物品推荐方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7360497B2 (ja) | クロスモーダルな特徴の抽出方法、抽出装置、ならびに、プログラム | |
CN111581510A (zh) | 分享内容处理方法、装置、计算机设备和存储介质 | |
CN106447066A (zh) | 一种大数据的特征提取方法和装置 | |
CN113256367B (zh) | 用户行为历史数据的商品推荐方法、系统、设备及介质 | |
CN106445988A (zh) | 一种大数据的智能处理方法和系统 | |
CN112395487B (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
CN112800344B (zh) | 一种基于深度神经网络的电影推荐方法 | |
CN107239532B (zh) | 数据挖掘方法及装置 | |
CN115878904A (zh) | 基于深度学习的知识产权个性化推荐方法、系统及介质 | |
CN111178986B (zh) | 用户-商品偏好的预测方法及系统 | |
Ciaburro et al. | Python Machine Learning Cookbook: Over 100 recipes to progress from smart data analytics to deep learning using real-world datasets | |
CN115344698A (zh) | 标签处理方法、装置、计算机设备、存储介质和程序产品 | |
CN116340635A (zh) | 物品推荐方法、模型训练方法、装置及设备 | |
CN117251622A (zh) | 对象推荐的方法、装置、计算机设备和存储介质 | |
CN114595787A (zh) | 推荐模型的训练方法、推荐方法、装置、介质及设备 | |
CN114819140A (zh) | 模型剪枝方法、装置和计算机设备 | |
CN113901175A (zh) | 物品关系判别方法和装置 | |
Rad et al. | A multi-view-group non-negative matrix factorization approach for automatic image annotation | |
CN115239404A (zh) | 召回模型生成、召回方法、装置、电子设备及存储介质 | |
CN117252665B (zh) | 业务推荐方法、装置、电子设备及存储介质 | |
CN111444331A (zh) | 基于内容的分布式特征提取方法、装置、设备及介质 | |
CN113255891B (zh) | 对事件特征进行处理的方法、神经网络模型和装置 | |
CN117786234B (zh) | 一种基于两阶段对比学习的多模态资源推荐方法 | |
CN115310547B (zh) | 模型训练方法、物品识别方法及装置、电子设备、介质 | |
CN113420561B (zh) | 一种命名实体识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |