CN102135989A - 一种基于正规化矩阵因式分解的增量协同过滤推荐方法 - Google Patents
一种基于正规化矩阵因式分解的增量协同过滤推荐方法 Download PDFInfo
- Publication number
- CN102135989A CN102135989A CN2011100562325A CN201110056232A CN102135989A CN 102135989 A CN102135989 A CN 102135989A CN 2011100562325 A CN2011100562325 A CN 2011100562325A CN 201110056232 A CN201110056232 A CN 201110056232A CN 102135989 A CN102135989 A CN 102135989A
- Authority
- CN
- China
- Prior art keywords
- model
- training
- latent
- normalized matrix
- matrix factorization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于正规化矩阵因式分解的增量协同过滤推荐方法:基于规范化正规化矩阵因式分解模型的输入顺序无关性改进:基于正规化矩阵因式分解的隐向量模型中,提出与训练实例输入顺序无关的模型;隐特征向量的增量更新:对隐特征向量在每轮训练中的增量数学表达式进行分析,提出了隐特征向量的增量更新规则;整合线性偏差的增量更新:整合了能够增量更新的统计观测偏差。本发明能够以增量更新的方式,反映新增用户反馈信息对推荐结果的影响。在不重建整个推荐模型的前提下,本方法根据新增的用户反馈信息进行正确的增量实时更新,能够对新增的用户反馈数据做出实时反馈。
Description
技术领域
本发明涉及到一种基于正规化矩阵因式分解的增量协同过滤推荐方法,特别是一种基于正规化矩阵因式分解的增量协同过滤个性化推荐方法,用于快速增量更新个性化推荐模型,属于数据挖掘技术领域。
背景技术
在互联网技术普及化程度逐步加深的同时,如何从海量的互联网资源中提取用户所需信息成为人们关注的问题。传统的搜索算法只能呈现给所有的用户一样的排序结果,无法针对不同用户的兴趣爱好提供相应的服务。个性化推荐,被认为是当前解决这一问题最有效的工具之一。个性化推荐技术能够根据不同的用户需求,为用户提供个性化的信息服务,从而解决互联网用户面临的信息超载问题,具有良好的发展和应用前景。
现有的协同过滤推荐模型已经能够提供较为精确的推荐,但绝大多数协同过滤推荐模型都是批量推荐模型,需要基于静态的训练数据集构造,并暗含用户集合与项目集合保持不变的前提。而在电子商务实际应用中,用户反馈数据时时刻刻都在不停更新,同时也不断会有新用户和新项目加入。使用批量推荐模型来处理动态数据更新的唯一方式,是当更新数据累积超过预定阈值时,重新训练整个推荐模型;但是这种方式将会导致大量的重复工作,同时也不能对新增的用户反馈数据做出实时反馈。
发明内容
本发明解决的技术问题:克服现有技术的不足,提供一种基于正规化矩阵因式分解的增量协同过滤个性化推荐方法。该方法以正规化矩阵因式分解模型为基础,在不重建整个推荐模型的前提下,根据新增的用户反馈信息进行正确的增量实时更新,能够对新增的用户反馈数据做出实时反馈。
本发明的技术解决方案:基于正规化矩阵因式分解的增量协同过滤个性化推荐方法,其特点在于:能够以增量更新的方式,正确反映新增用户反馈信息对推荐结果的影响,整个方法涉及到三个过程:基于正规化矩阵因式分解模型的输入顺序无关性改进,隐特征向量的增量更新,整合现行偏差的增量更新。
(1)基于正规化矩阵因式分解模型的输入顺序无关性改进:在基于正规化矩阵因式分解的隐向量模型中对隐特征向量的训练过程进行分析,并以简化隐特征向量训练规则为目的,提出与训练实例输入顺序无关的、基于正规化矩阵因式分解的隐向量模型;
(2)隐特征向量的增量更新:以输入顺序无关性模型为基础,对隐特征向量在每轮训练中的增量数学表达式进行分析,提出了隐特征向量的增量更新规则;
(3)整合线性偏差的增量更新:整合了能够增量更新的统计观测偏差,从而提出一种基于正规化矩阵因式分解的增量协同过滤推荐模型。
所述步骤(1)中的基于正规化矩阵因式分解模型的输入顺序无关性改进的方法如下:
①分析基于正规化矩阵因式分解的协同过滤推荐模型在一轮训练结束后,隐特征向量pu、qi的状态值,表示为:
②假设模型同时对所有相关的训练实例进行学习,则可得到简化A、B的表达式,表示为:
③根据αK、βH中各参数对结果的意义和影响进行近似简化,得到αK、βH的近似表达式,表示为:
④根据以上①至③的简化和处理,得到基于正规化矩阵因式分解的输入顺序无关性模型在一轮训练结束后,隐特征向量pu、qi的状态值,表示为:
(1)式
所述步骤(2)中的隐特征向量的增量更新方法如下:
①分析基于正规化矩阵因式分解的输入顺序无关性模型在每轮训练结束后,隐特征向量pu、qi的状态值,表示为:
在每轮训练结束后pu、qi的值将被缓存,D表示模型收敛所需训练轮数。
(3)式
其中
所述的步骤(3)中的整合线性偏差的增量更新方法如下:
①μ的增量更新公式,表示如下:
②对bu和bi的计算公式进行分解如下:
其中,参数si、ni、su和nu都可以根据新训练实例中的评分值进行相应的增量更新。
③在系统中缓存计算出的bi和bu的值进行推荐,当相关的新训练实例到达时,这些缓存的参数值则会被判定过期并进行更新。
本发明与现有技术相比的优点在于:现有的协同过滤推荐模型绝大多数都是只能处理静态训练数据的批量推荐模型,不具备动态更新能力,不能根据新增用户反馈数据进行增量更新。本发明的基于正规化矩阵因式分解的增量协同过滤个性化推荐方法,能够以增量更新的方式,反映新增用户反馈信息对推荐结果的影响。在不重建整个推荐模型的前提下,本方法根据新增的用户反馈信息进行正确的增量实时更新,能够对新增的用户反馈数据做出实时反馈。
具体实施方式
下面结合具体实施例对本发明的技术方案做进一步的说明。
1.在构建基于正规化矩阵因式分解的隐向量模型时,采用(1)式提供的输入顺序无关性的模型训练规则,这样所获得的模型即为输入顺序无关性模型。
2.基于正规化矩阵因式分解的增量协同过滤个性化推荐模型的实施过程被划分为批量训练和隐向量的增量更新两个阶段。批量训练阶段与原始的基于正规化矩阵因式分解模型的区别在于新模型需要缓存第d轮训练中产生的中间训练结果隐向量的增量更新阶段,对于新的训练实例ru,i,当训练轮数d<D时,进行如下步骤的增量更新:对于用户u和项目k∈R(u),k≠i,使用(2)式所示的增量更新规则更新知对于项目i和用户h∈R(i),h≠u,使用式(3)所示的增量更新规则更新和更新缓存的第d轮训练中产生的中间训练结果
3.当模型整合线性偏差之后,其相应的批量训练和隐向量的增量更新阶段都需要作出相应的改变,具体的实施方式如下:
(1)在批量训练过程中,模型首先计算全局平均评分μ,和用以计算用户观测偏差bu和项目观测偏差bi的参数si、no、su和nu;其后,模型将会使用计算移除统计观测偏差的训练数据集T′;最后,模型将会在T′上构造用户和项目隐特征向量,并将每轮隐特征向量训练过程产生的中间结果缓存。在已知训练数据集{rui(u,i)∈T}、训练总轮数D、隐向量空间维数f后,具体步骤如下:
p′u=pu+η(qi·(ru,i-pu·qi)-λpu)
q′i=qi+η(pu·(ru,i-pu·qi)-λqi)
(2).在增量更新过程中,当新训练实例到达时,模型将会首先对μ和相关的参数si、ni、su和nu进行更新,然后使用计算移除统计观测偏差的评分值,最后使用增量更新规则对相关的隐特征向量进行增量更新。当已知新的训练实例ru,i时,具体步骤如下:
②当训练轮数d<D时,进行增量更新:对于用户u和项目k∈R(u),k≠i,使用(2)式所示的增量更新规则更新和对于项目i和用户h∈R(i),h≠u,使用式(3)所示的增量更新规则更新和更新缓存的第d轮训练中产生的中间训练结果
新训练实例的到达,将会改变整个训练数据集上的评分分布,严格地说,需要对去除了统计观测偏差的训练数据集T′中的所有训练值进行更新,并重新构造隐特征向量。但是,上述操作在要求实时更新的增量推荐模型中,是无法满足的;所以,在设计模型的构造过程时,对于新到达的训练实例,只会将统计观测偏差的增量更新用于计算该训练实例对应的训练值,而不会对T′进行全面更新。
Claims (4)
1.一种基于正规化矩阵因式分解的增量协同过滤推荐方法,其特征在于:能够以增量更新的方式,正确反映新增用户反馈信息对推荐结果的影响,步骤如下:
(1)基于正规化矩阵因式分解模型的输入顺序无关性改进:在基于正规化矩阵因式分解的隐向量模型中对隐特征向量的训练过程进行分析,并以简化隐特征向量训练规则为目的,提出与训练实例输入顺序无关的、基于正规化矩阵因式分解的隐向量模型;
(2)隐特征向量的增量更新:以输入顺序无关性模型为基础,对隐特征向量在每轮训练中的增量数学表达式进行分析,提出隐特征向量的增量更新规则;
(3)整合线性偏差的增量更新:整合能够增量更新的统计观测偏差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011100562325A CN102135989A (zh) | 2011-03-09 | 2011-03-09 | 一种基于正规化矩阵因式分解的增量协同过滤推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011100562325A CN102135989A (zh) | 2011-03-09 | 2011-03-09 | 一种基于正规化矩阵因式分解的增量协同过滤推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102135989A true CN102135989A (zh) | 2011-07-27 |
Family
ID=44295775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011100562325A Pending CN102135989A (zh) | 2011-03-09 | 2011-03-09 | 一种基于正规化矩阵因式分解的增量协同过滤推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102135989A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722552A (zh) * | 2012-05-28 | 2012-10-10 | 重庆大学 | 一种协同过滤推荐模型中调整学习速率的方法 |
CN102930341A (zh) * | 2012-10-15 | 2013-02-13 | 罗辛 | 一种协同过滤推荐模型的优化训练方法 |
WO2013131278A1 (en) * | 2012-03-09 | 2013-09-12 | Nokia Corporation | Method and apparatus for performing an incremental update of a recommendation model |
CN104850645A (zh) * | 2015-05-28 | 2015-08-19 | 苏州大学张家港工业技术研究院 | 一种基于矩阵分解的主动学习评分引导方法及系统 |
CN104903885A (zh) * | 2012-12-21 | 2015-09-09 | 微软技术许可有限责任公司 | 矩阵因式分解中的特征嵌入 |
CN105164675A (zh) * | 2013-04-30 | 2015-12-16 | 惠普发展公司,有限责任合伙企业 | 增量式地更新统计 |
CN106537376A (zh) * | 2014-06-06 | 2017-03-22 | 诺基亚技术有限公司 | 通过应用有效的自适应矩阵分解进行推荐的方法和装置 |
CN107562875A (zh) * | 2017-08-31 | 2018-01-09 | 北京麒麟合盛网络技术有限公司 | 一种模型的更新方法、装置及系统 |
CN109669996A (zh) * | 2018-12-29 | 2019-04-23 | 恒睿(重庆)人工智能技术研究院有限公司 | 信息动态更新方法及装置 |
CN110851734A (zh) * | 2019-11-01 | 2020-02-28 | 广州视源电子科技股份有限公司 | 内容的推荐方法和装置 |
CN111881345A (zh) * | 2020-07-13 | 2020-11-03 | 汕头大学 | 基于位置上下文感知的神经协同过滤服务质量预测方法 |
CN112183757A (zh) * | 2019-07-04 | 2021-01-05 | 创新先进技术有限公司 | 模型训练方法、装置及系统 |
-
2011
- 2011-03-09 CN CN2011100562325A patent/CN102135989A/zh active Pending
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9710480B2 (en) | 2012-03-09 | 2017-07-18 | Nokia Corporation | Method and apparatus for performing an incremental update of a recommendation model |
WO2013131278A1 (en) * | 2012-03-09 | 2013-09-12 | Nokia Corporation | Method and apparatus for performing an incremental update of a recommendation model |
CN102722552B (zh) * | 2012-05-28 | 2014-02-26 | 重庆大学 | 一种协同过滤推荐模型中调整学习速率的方法 |
CN102722552A (zh) * | 2012-05-28 | 2012-10-10 | 重庆大学 | 一种协同过滤推荐模型中调整学习速率的方法 |
CN102930341A (zh) * | 2012-10-15 | 2013-02-13 | 罗辛 | 一种协同过滤推荐模型的优化训练方法 |
CN104903885A (zh) * | 2012-12-21 | 2015-09-09 | 微软技术许可有限责任公司 | 矩阵因式分解中的特征嵌入 |
US10430411B2 (en) | 2013-04-30 | 2019-10-01 | Micro Focus Llc | Incrementally updating statistics |
CN105164675A (zh) * | 2013-04-30 | 2015-12-16 | 惠普发展公司,有限责任合伙企业 | 增量式地更新统计 |
EP3152679A4 (en) * | 2014-06-06 | 2018-04-04 | Nokia Technologies Oy | Method and apparatus for recommendation by applying efficient adaptive matrix factorization |
CN106537376A (zh) * | 2014-06-06 | 2017-03-22 | 诺基亚技术有限公司 | 通过应用有效的自适应矩阵分解进行推荐的方法和装置 |
CN104850645B (zh) * | 2015-05-28 | 2018-08-14 | 苏州大学张家港工业技术研究院 | 一种基于矩阵分解的主动学习评分引导方法及系统 |
CN104850645A (zh) * | 2015-05-28 | 2015-08-19 | 苏州大学张家港工业技术研究院 | 一种基于矩阵分解的主动学习评分引导方法及系统 |
CN107562875A (zh) * | 2017-08-31 | 2018-01-09 | 北京麒麟合盛网络技术有限公司 | 一种模型的更新方法、装置及系统 |
CN109669996A (zh) * | 2018-12-29 | 2019-04-23 | 恒睿(重庆)人工智能技术研究院有限公司 | 信息动态更新方法及装置 |
CN112183757A (zh) * | 2019-07-04 | 2021-01-05 | 创新先进技术有限公司 | 模型训练方法、装置及系统 |
CN112183757B (zh) * | 2019-07-04 | 2023-10-27 | 创新先进技术有限公司 | 模型训练方法、装置及系统 |
CN110851734A (zh) * | 2019-11-01 | 2020-02-28 | 广州视源电子科技股份有限公司 | 内容的推荐方法和装置 |
CN110851734B (zh) * | 2019-11-01 | 2023-09-05 | 广州视源电子科技股份有限公司 | 内容的推荐方法和装置 |
CN111881345A (zh) * | 2020-07-13 | 2020-11-03 | 汕头大学 | 基于位置上下文感知的神经协同过滤服务质量预测方法 |
CN111881345B (zh) * | 2020-07-13 | 2023-06-09 | 汕头大学 | 基于位置上下文感知的神经协同过滤服务质量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102135989A (zh) | 一种基于正规化矩阵因式分解的增量协同过滤推荐方法 | |
CN103544212B (zh) | 一种内容推荐方法及系统 | |
Dudík et al. | Doubly robust policy evaluation and learning | |
CN106528693B (zh) | 面向个性化学习的教育资源推荐方法及系统 | |
CN102411583B (zh) | 一种文本匹配方法及装置 | |
CN104573359B (zh) | 一种基于任务难度与标注者能力的众包标注数据整合方法 | |
CN102982107B (zh) | 一种融合用户、项目和上下文属性信息的推荐系统优化方法 | |
CN109816101A (zh) | 一种基于图卷积神经网络的会话序列推荐方法及系统 | |
CN102262681B (zh) | 一种博客信息传播中识别关键博客集的方法 | |
WO2021129055A1 (zh) | 信息预测模型训练方法及装置、信息预测方法及装置、存储介质、设备 | |
CN103731738A (zh) | 基于用户群组行为分析的视频推荐方法及装置 | |
Kobayashi et al. | Bayesian analysis of quantile regression for censored dynamic panel data | |
CN106021329A (zh) | 基于用户相似度的稀疏数据协同过滤推荐方法 | |
CN107545444B (zh) | 一种业务广告数据推荐方法以及装置 | |
CN103116582A (zh) | 一种信息检索方法及相关系统和装置 | |
CN105589917A (zh) | 浏览器日志信息的分析方法和装置 | |
US20180005261A9 (en) | A method , computer readable medium and system for determining touchpoint attribution | |
US20140257972A1 (en) | Method, computer readable medium and system for determining true scores for a plurality of touchpoint encounters | |
CN103679484A (zh) | 基于行为Petri网的电子商务一致性分析新方法 | |
CN103440328A (zh) | 一种基于鼠标行为的用户分类方法 | |
CN102402552B (zh) | 一种基于分析结果提供推广账户优化建议的方法与设备 | |
CN102567536A (zh) | 一种基于数据统计学的关键绩效指标分析方法 | |
Renuka et al. | On measuring total factor productivity growth in Singapore's manufacturing industries | |
CN103310027A (zh) | 用于地图模板匹配的规则提取方法 | |
CN107644042B (zh) | 软件程序点击率预估排序方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110727 |