CN114581161B - 一种基于深度学习的信息推送方法和系统 - Google Patents
一种基于深度学习的信息推送方法和系统 Download PDFInfo
- Publication number
- CN114581161B CN114581161B CN202210483164.9A CN202210483164A CN114581161B CN 114581161 B CN114581161 B CN 114581161B CN 202210483164 A CN202210483164 A CN 202210483164A CN 114581161 B CN114581161 B CN 114581161B
- Authority
- CN
- China
- Prior art keywords
- matrix
- vector
- interest
- distance
- access
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000013135 deep learning Methods 0.000 title claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 359
- 239000013598 vector Substances 0.000 claims abstract description 340
- 238000013528 artificial neural network Methods 0.000 claims abstract description 41
- 230000002123 temporal effect Effects 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 238000012886 linear function Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种基于深度学习的信息推送方法,包括如下步骤:构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵;通过将感兴趣物品的访问矩阵、距离邻近矩阵和种类关联矩阵进行分解,得到访问矩阵的隐含因子矩阵、距离邻近矩阵的隐含因子矩阵和种类关联矩阵的隐含因子矩阵,并得到感兴趣物品的访问潜在向量,感兴趣物品的距离潜在向量;感兴趣物品的种类潜在向量;计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;将感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量输入训练好的神经网络推荐模型中,得到推荐结果,并进行推送;本发明方法提升了推荐的准确性和合理性。
Description
技术领域
本发明涉及信息推荐领域,特别是指一种基于深度学习的信息推送方法和系统。
背景技术
互联网的高速发展和移动电子设备的普及,给人们的生活带来了前所未有的改变。人们可以突破时间和空间的限制,自由获取海量的在线信息资源。互联网在促进生活方便的同时,也给人们带来了信息过载的困扰。推荐系统应运而生,作为解决信息过载问题的最有效工具,被广泛的应用于生活的各方面。推荐系统不仅帮助在线用户从海量的信息中发掘有用的信息、发现潜在感兴趣的物品和服务,还帮助内容提供商和生产者提高物品的曝光度、增加销量和保持用户黏度。
但目前的推荐方法还存在这推荐不合理以及推荐不够合理的问题。
发明内容
本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于深度学习的信息推送方法和系统,首先通过矩阵的构造和分解,得出感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量,并通过神经网络推荐模型得出推荐结果,提升了推荐的准确性和合理性。
一种基于深度学习的信息推送方法,包括如下步骤:
构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵;
通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量;
通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量;
通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量;
基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;
将感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量输入训练好的神经网络推荐模型中,得到推荐结果,并进行推送。
具体地,构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵,具体为:
初始化感兴趣物品的访问矩阵,其中,n为感兴趣物品个数,并将初始值设置为0,对于每一个客户,统计得到该客户访问过的感兴趣物品的集合,对于集合中的每个感兴趣物品v,将该感兴趣物品v在访问矩阵中对应的对角线元素的值,加1;
具体地,通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量,具体为:
具体地,通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量,具体为:
具体地,通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量,具体为:
具体地,基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;具体为:
感兴趣物品特征向量:
客户特征向量:
时间上下文特征向量:
序次上下文特征向量:
具体地,所述神经网络推荐模型,具体为:
其中,是神经网络推荐模型的输入层的特征向量,是神经网络推荐模型中第i层隐含层的输出向量,是神经网络推荐模型用于u在时刻t对感兴趣物品v的访问预测结果,L为隐含层个数,和为第i层隐含层的权重矩阵、偏移向量;和为神经网络推荐模型输出层的权重矩阵、偏移向量,为激活函数,为整流线性函数。
本发明实施例另一方面提供一种基于深度学习的信息推送系统, 包括:
矩阵构造单元:构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵;
访问潜在向量获取单元:通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量;
距离潜在向量获取单元:通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量;
种类潜在向量获取单元:通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量;
特征向量获取单元:基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;
推荐结果获取单元:将感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量输入训练好的神经网络推荐模型中,得到推荐结果,并进行推送。
本发明再一实施例提供一种电子设备,包括:存储器,处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述一种基于深度学习的信息推送方法步骤。
本发明又一实施例提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述一种基于深度学习的信息推送方法步骤。
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
本发明提出了一种基于深度学习的信息推送方法,首先构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵;通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量;通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量;通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量;基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;将感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量输入训练好的神经网络推荐模型中,得到推荐结果,并进行推送;本发明提供的方法,首先通过矩阵的构造和分解,得出感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量,并通过神经网络推荐模型得出推荐结果,提升了推荐的准确性和合理性。
附图说明
图1为本发明实施例提供的一种基于深度学习的信息推送方法流程图;
图2为本发明实施例提供的一种基于深度学习的信息推送系统结构图;
图3为本发明实施例提供的一种电子设备的实施例示意图;
图4为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
具体实施方式
本发明提出了一种基于深度学习的信息推送方法,首先通过矩阵的构造和分解,得出感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量,并通过神经网络推荐模型得出推荐结果,提升了推荐的准确性和合理性。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
如图1,为本发明实施例提供的一种基于深度学习的信息推送方法,包括如下步骤:
S101:构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵;
本发明构建感兴趣物品的访问矩阵,用于建立感兴趣物品在用户访问模式上的关联,访问矩阵中对角线元素的值越高,表明频繁被同时访问,存在的关联也就越强,访问矩阵实际上表现了感兴趣物品在用户访问上的关联。
通过距离邻近矩阵来表征感兴趣物品之间的量化距离的远近,并同时设定了距离阈值进行比较,若量化距离小于距离阈值,则表明为两感兴趣物品相似。
种类关联矩阵是表明种类之间的关系而构造是矩阵,只有是同类别,矩阵中的元素才是1,其余均为0。
具体地,构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵,具体为:
初始化感兴趣物品的访问矩阵,其中,n为感兴趣物品个数,并将初始值设置为0,对于每一个客户,统计得到该客户访问过的感兴趣物品的集合,对于集合中的每个感兴趣物品v,将该感兴趣物品v在访问矩阵中对应的对角线元素的值,加1;
S102:通过将感兴趣物品的访问矩阵进行分解,其实质是映射到一个低秩的特征向量空间,得到的分解后低秩矩阵即为访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量;
具体为:
其中,是对访问矩阵分解得到的隐含因子矩阵,为中访问潜在向量的维度,表示访问矩阵的Frobenius范数,为正则化参数;前半部分通过最小化原始矩阵与近似矩阵之间的误差来最优化隐含因子矩阵,后半部分则通过加入正则项来放置隐含因子矩阵过渡拟合感兴趣物品的访问矩阵中的噪声,隐含因子矩阵的优化可以通过常用的最优化算法如随机梯度下降等予以实现。
S103:通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量;
对距离邻近矩阵采用了同样的对称矩阵分解方法:
距离邻近矩阵做对称矩阵分解可以将感兴趣物品在现实世界中的关系转到特征空间当中,令关系邻近的感兴趣物品在特征空间中的潜在向量也具有较高的相似度。
S104:通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量;
与前面两个特征矩阵的分解类似,对于种类关联矩阵的分解实际上建立感兴趣物品在种类上的关联,即我们希望属于相同种类物品,在向量表达上具有更高的相似度,具体为:
S105:基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;
具体地,基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;具体为:
感兴趣物品特征向量:
其中,是感兴趣物品的访问潜在向量,感兴趣物品的距离潜在向量,感兴趣物品的种类潜在向量;通过将这三个潜在向量拼接成感兴趣物品的特征向量,使得推荐算法在推荐过程中可以同时利用感兴趣物品的用户反馈信息、邻近信息以及内容信息,从而起到了缓解数据稀疏和物品冷启动问题的作用。
客户特征向量:
其中,是用户访问过的感兴趣物品的集合,为用户访问过的感兴趣物品的数量;也就是对该用户访问过的所有感兴趣物品特征向量做平均池化,从而得到客户特征向量,方面可以将所有客户都表示成定长的向量形式,另一方面拥有相似访问记录的用户之间的通过这种池化的计算方式也能拥有比较接近的特征向量,从而进一步建立起了客户之间的关联。
时间上下文特征向量:
序次上下文特征向量:
将特征向量进行了拼接,从而得到了完整的序列上下文的特征向量表示,同时考虑了连续访问中前一个访问感兴趣物品的自身特征以及转移趋势。
S106:将感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量输入训练好的神经网络推荐模型中,得到推荐结果,并进行推送。
具体地,所述神经网络推荐模型,具体为:
其中,是神经网络推荐模型的输入层的特征向量,是神经网络推荐模型中第i层隐含层的输出向量,是神经网络推荐模型用于u在时刻t对感兴趣物品v的访问预测结果,L为隐含层个数,和为第i层隐含层的权重矩阵、偏移向量;和为神经网络推荐模型输出层的权重矩阵、偏移向量,为激活函数,为整流线性函数。
具体地,网络的每一个隐含层都通过引入权重矩阵F和偏移向量b来建模特征在不同层次上的交互,隐含层的激活函数进一步在模型中引入了非线性,从而可以学习特征在不同层次间的非线性映射,采用在深度神经网络中经常使用的整流线性单元ReLU,此前的研宄表明ReLU可以有效地加快深度神经网络的收敛速度并缓解模型训练中的梯度消失问题。
如图2,本发明实施例另一方面提供一种基于深度学习的信息推送系统,包括如下:
矩阵构造单元201:构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵;
本发明构建感兴趣物品的访问矩阵,用于建立感兴趣物品在用户访问模式上的关联,访问矩阵中对角线元素的值越高,表明频繁被同时访问,存在的关联也就越强,访问矩阵实际上表现了感兴趣物品在用户访问上的关联。
通过距离邻近矩阵来表征感兴趣物品之间的量化距离的远近,并同时设定了距离阈值进行比较,若量化距离小于距离阈值,则表明为两感兴趣物品相似。
种类关联矩阵是表明种类之间的关系而构造是矩阵,只有是同类别,矩阵中的元素才是1,其余均为0。
具体地,构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵,具体为:
初始化感兴趣物品的访问矩阵,其中,n为感兴趣物品个数,并将初始值设置为0,对于每一个客户,统计得到该客户访问过的感兴趣物品的集合,对于集合中的每个感兴趣物品v,将该感兴趣物品v在访问矩阵中对应的对角线元素的值,加1;
访问潜在向量获取单元202:通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量;
具体地,通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量,具体为:
其中,是对访问矩阵分解得到的隐含因子矩阵,为中访问潜在向量的维度,表示访问矩阵的Frobenius范数,为正则化参数,前半部分通过最小化原始矩阵与近似矩阵之间的误差来最优化隐含因子矩阵,后半部分则通过加入正则项来放置隐含因子矩阵过渡拟合感兴趣物品的访问矩阵中的噪声,隐含因子矩阵的优化可以通过常用的最优化算法如随机梯度下降等予以实现。
距离潜在向量获取单元203:通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量;
具体地,通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量,具体为:
距离邻近矩阵做对称矩阵分解可以将感兴趣物品在现实世界中的关系转到特征空间当中,令关系邻近的感兴趣物品在特征空间中的潜在向量也具有较高的相似度。
种类潜在向量获取单元204:通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量;
与前面两个特征矩阵的分解类似,对于种类关联矩阵的分解实际上建立感兴趣物品在种类上的关联,即我们希望属于相同种类物品,在向量表达上具有更高的相似度,具体为:
特征向量获取单元205:基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;
具体地,基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;具体为:
感兴趣物品特征向量:
其中,是感兴趣物品的访问潜在向量,感兴趣物品的距离潜在向量,感兴趣物品的种类潜在向量,通过将这三个潜在向量拼接成感兴趣物品的特征向量,使得推荐算法在推荐过程中可以同时利用感兴趣物品的用户反馈信息、邻近信息以及内容信息,从而起到了缓解数据稀疏和物品冷启动问题的作用;
客户特征向量:
其中,是用户访问过的感兴趣物品的集合,为用户访问过的感兴趣物品的数量;也就是对该用户访问过的所有感兴趣物品特征向量做平均池化,从而得到客户特征向量,方面可以将所有客户都表示成定长的向量形式,另一方面拥有相似访问记录的用户之间的通过这种池化的计算方式也能拥有比较接近的特征向量,从而进一步建立起了客户之间的关联。
时间上下文特征向量:
序次上下文特征向量:
其中,表示被至少一次以上连续访问的感兴趣物品的集合,表示被至少一次以上连续访问的感兴趣物品的数量;将特征向量进行了拼接,从而得到了完整的序列上下文的特征向量表示,同时考虑了连续访问中前一个访问感兴趣物品的自身特征以及转移趋势。
推荐结果获取单元206:将感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量输入训练好的神经网络推荐模型中,得到推荐结果,并进行推送。
具体地,所述神经网络推荐模型,具体为:
其中,是神经网络推荐模型的输入层的特征向量,是神经网络推荐模型中第i层隐含层的输出向量,是神经网络推荐模型用于u在时刻t对感兴趣物品v的访问预测结果,L为隐含层个数,和为第i层隐含层的权重矩阵、偏移向量;和为神经网络推荐模型输出层的权重矩阵、偏移向量;
具体地,网络的每一个隐含层都通过引入权重矩阵F和偏移向量6来建模特征在不同层次上的交互,隐含层的激活函数进一步在模型中引入了非线性,从而可以学习特征在不同层次间的非线性映射,采用在深度神经网络中经常使用的整流线性单元ReLU,此前的研宄表明ReLU可以有效地加快深度神经网络的收敛速度并缓解模型训练中的梯度消失问题。
如图3所示,本发明实施例提供了一种电子设备300,包括存储器310、处理器320及存储在存储器310上并可在处理器320上运行的计算机程序311,处理器320执行计算机程序311时实现本发明实施例提供的一种基于深度学习的信息推送方法。
在具体实施过程中,处理器320执行计算机程序311时,可以实现图1对应的实施例中任一实施方式。
由于本实施例所介绍的电子设备为实施本发明实施例中一种数据处理装置所采用的设备,故而基于本发明实施例中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本发明实施例中的方法不再详细介绍,只要本领域所属技术人员实施本发明实施例中的方法所采用的设备,都属于本发明所欲保护的范围。
请参阅图4,图4为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
如图4所示,本实施例提供了一种计算机可读存储介质400,其上存储有计算机程序401,该计算机程序401被处理器执行时实现本发明实施例提供的一种基于深度学习的信息推送方法;
在具体实施过程中,该计算机程序401被处理器执行时可以实现图1对应的实施例中任一实施方式。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明提出了一种基于深度学习的信息推送方法,首先构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵;通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量;通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量;通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量;基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;将感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量输入训练好的神经网络推荐模型中,得到推荐结果,并进行推送;本发明提供的方法,首先通过矩阵的构造和分解,得出感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量,并通过神经网络推荐模型得出推荐结果,提升了推荐的准确性和合理性。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围行为。
Claims (4)
1.一种基于深度学习的信息推送方法,其特征在于,包括如下步骤:
构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵;
通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量;
通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量;
通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量;
基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;
将感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量输入训练好的神经网络推荐模型中,得到推荐结果,并进行推送;
构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵,具体为:初始化感兴趣物品的访问矩阵,其中,n为感兴趣物品个数,并将初始值设置为0,对于每一个客户,统计得到该客户访问过的感兴趣物品的集合,对于集合中的每个感兴趣物品v,将该感兴趣物品v在访问矩阵中对应的对角线元素的值,加1;
通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量,具体为:
通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量,具体为:
通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量,具体为:
基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;具体为:
感兴趣物品特征向量:
客户特征向量:
时间上下文特征向量:
序次上下文特征向量:
所述神经网络推荐模型,具体为:
2.一种基于深度学习的信息推送系统,其特征在于,包括:
矩阵构造单元:构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵;
访问潜在向量获取单元:通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量;
距离潜在向量获取单元:通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量;
种类潜在向量获取单元:通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量;
特征向量获取单元:基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;
推荐结果获取单元:将感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量输入训练好的神经网络推荐模型中,得到推荐结果,并进行推送;
构造感兴趣物品的访问矩阵,距离邻近矩阵以及种类关联矩阵,具体为:初始化感兴趣物品的访问矩阵,其中,n为感兴趣物品个数,并将初始值设置为0,对于每一个客户,统计得到该客户访问过的感兴趣物品的集合,对于集合中的每个感兴趣物品v,将该感兴趣物品v在访问矩阵中对应的对角线元素的值,加1;
通过将感兴趣物品的访问矩阵进行分解,得到访问矩阵的隐含因子矩阵,并得到感兴趣物品在访问矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的访问潜在向量,具体为:
通过将距离邻近矩阵进行分解,得到距离邻近矩阵的隐含因子矩阵,并得到感兴趣物品在距离邻近矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的距离潜在向量,具体为:
通过将种类关联矩阵进行分解,得到种类关联矩阵的隐含因子矩阵,并得到感兴趣物品在种类关联矩阵的隐含因子矩阵中对应的行向量,称为感兴趣物品的种类潜在向量,具体为:
基于感兴趣物品的访问潜在向量、感兴趣物品的距离潜在向量和感兴趣物品的种类潜在向量,计算感兴趣物品特征向量、客户特征向量、时间上下文特征向量以及序次上下文特征向量;具体为:
感兴趣物品特征向量:
客户特征向量:
时间上下文特征向量:
序次上下文特征向量:
所述神经网络推荐模型,具体为:
3.一种电子设备,其特征在于,包括:存储器,处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现权利要求1所述的方法步骤。
4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210483164.9A CN114581161B (zh) | 2022-05-06 | 2022-05-06 | 一种基于深度学习的信息推送方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210483164.9A CN114581161B (zh) | 2022-05-06 | 2022-05-06 | 一种基于深度学习的信息推送方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114581161A CN114581161A (zh) | 2022-06-03 |
CN114581161B true CN114581161B (zh) | 2022-08-16 |
Family
ID=81784879
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210483164.9A Active CN114581161B (zh) | 2022-05-06 | 2022-05-06 | 一种基于深度学习的信息推送方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114581161B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241440A (zh) * | 2018-09-29 | 2019-01-18 | 北京工业大学 | 一种基于深度学习的面向隐式反馈推荐方法 |
CN111127142A (zh) * | 2019-12-16 | 2020-05-08 | 东北大学秦皇岛分校 | 一种基于广义神经注意力的物品推荐方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102426686A (zh) * | 2011-09-29 | 2012-04-25 | 南京大学 | 一种基于矩阵分解的互联网信息产品推荐方法 |
US11481652B2 (en) * | 2015-06-23 | 2022-10-25 | Gregory Knox | System and method for recommendations in ubiquituous computing environments |
US20170206551A1 (en) * | 2016-01-15 | 2017-07-20 | Adobe Systems Incorporated | Personalized Recommendation Computation in Real Time using Incremental Matrix Factorization and User Factor Clustering |
CN107273438B (zh) * | 2017-05-24 | 2021-02-23 | 深圳大学 | 一种推荐方法、装置、设备及存储介质 |
CN110503508A (zh) * | 2019-07-15 | 2019-11-26 | 电子科技大学 | 一种层级多粒度矩阵分解的物品推荐方法 |
US11532025B2 (en) * | 2019-08-12 | 2022-12-20 | International Business Machines Corporation | Deep cognitive constrained filtering for product recommendation |
CN111061961B (zh) * | 2019-11-19 | 2023-05-26 | 江西财经大学 | 一种融合多特征的矩阵分解兴趣点推荐方法及其实现系统 |
CN111552852B (zh) * | 2020-04-27 | 2021-09-28 | 北京交通大学 | 基于半离散矩阵分解的物品推荐方法 |
CN111949887B (zh) * | 2020-08-31 | 2024-04-05 | 华东理工大学 | 物品推荐方法、装置及计算机可读存储介质 |
CN112632403B (zh) * | 2020-12-24 | 2024-04-09 | 北京百度网讯科技有限公司 | 推荐模型的训练方法、推荐方法、装置、设备和介质 |
-
2022
- 2022-05-06 CN CN202210483164.9A patent/CN114581161B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241440A (zh) * | 2018-09-29 | 2019-01-18 | 北京工业大学 | 一种基于深度学习的面向隐式反馈推荐方法 |
CN111127142A (zh) * | 2019-12-16 | 2020-05-08 | 东北大学秦皇岛分校 | 一种基于广义神经注意力的物品推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114581161A (zh) | 2022-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110781409B (zh) | 一种基于协同过滤的物品推荐方法 | |
Sharan et al. | Temporal-relational classifiers for prediction in evolving domains | |
Lin et al. | Personalized news recommendation via implicit social experts | |
CN114048331A (zh) | 一种基于改进型kgat模型的知识图谱推荐方法及系统 | |
Hu et al. | Bayesian personalized ranking based on multiple-layer neighborhoods | |
CN109840833B (zh) | 贝叶斯协同过滤推荐方法 | |
CN112487199B (zh) | 一种基于用户购买行为的用户特征预测方法 | |
Hornick et al. | Extending recommender systems for disjoint user/item sets: The conference recommendation problem | |
Zhu et al. | Differential privacy for collaborative filtering recommender algorithm | |
Rettinger et al. | Context-aware tensor decomposition for relation prediction in social networks | |
CN113326384A (zh) | 一种基于知识图谱的可解释推荐模型的构建方法 | |
CN110413880B (zh) | 基于用户人格分层结构的单分类协同过滤方法 | |
Raziperchikolaei et al. | Shared neural item representations for completely cold start problem | |
Zhang et al. | Causal neural fuzzy inference modeling of missing data in implicit recommendation system | |
CN114461906A (zh) | 一种聚焦于用户核心兴趣的序列推荐方法及装置 | |
CN114581161B (zh) | 一种基于深度学习的信息推送方法和系统 | |
US6529895B2 (en) | Determining a distribution of a numeric variable | |
Gu et al. | Robust and efficient algorithms for conversational contextual bandit | |
Jang et al. | Attention-based multi attribute matrix factorization for enhanced recommendation performance | |
CN115687757A (zh) | 融合层次注意与特征交互的推荐方法及其应用系统 | |
CN114491266A (zh) | 一种物品推荐方法、装置以及存储介质 | |
Wang et al. | CFSH: Factorizing sequential and historical purchase data for basket recommendation | |
KR101949808B1 (ko) | 부가 정보를 반영한 개인화 회귀 분석을 이용하여 품목의 이용자가 상기 품목에 부여하는 선호도를 예측하기 위하여 정보를 정화하는 방법 및 이를 이용한 컴퓨팅 장치 | |
Degeest et al. | Reading grid for feature selection relevance criteria in regression | |
CN116720005B (zh) | 一种基于自适应噪声的数据协同对比推荐模型的系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230605 Address after: 16/F, Building 4, Zone F, Fuzhou Software Park, No. 89 Software Avenue, Gulou District, Fuzhou City, Fujian Province, 350001 Patentee after: Fuzhou Zhangzhong cloud Technology Co.,Ltd. Address before: 518054 room 205, building 5, Shenzhen software industry base, No. 11, 13 and 15, Haitian 1st Road, Binhai community, Yuehai street, Nanshan District, Shenzhen, Guangdong Patentee before: Shenzhen mingluofeng Technology Co.,Ltd. |