CN103559623A - 一种基于联合非负矩阵分解的个性化产品推荐方法 - Google Patents
一种基于联合非负矩阵分解的个性化产品推荐方法 Download PDFInfo
- Publication number
- CN103559623A CN103559623A CN201310439089.7A CN201310439089A CN103559623A CN 103559623 A CN103559623 A CN 103559623A CN 201310439089 A CN201310439089 A CN 201310439089A CN 103559623 A CN103559623 A CN 103559623A
- Authority
- CN
- China
- Prior art keywords
- user
- product
- matrix
- data
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
基于联合非负矩阵分解的个性化产品推荐方法,从互联网中抓取数据信息,包括用户对已购买产品的评分、用户之间的好友关系,用户对于已购买产品的文字评价;将数据信息转化成数据矩阵,每一个用户的数据信息是其中的一个行向量;利用联合非负矩阵分解的方法,将原始数据矩阵分解成多个低维空间下的数据矩阵;根据低维空间下的数据矩阵,估算每一个用户对于所有未购买产品的评分,按照评分高低进行产品推荐。本方法的优点在于综合考虑了社交网络中的用户结构关系和产品评价信息,解决了传统方法不能有效处理新用户的问题,对没有购买过任何产品的新用户进行有效的产品推荐。
Description
技术领域
本发明涉及非负矩阵分解,产品推荐等技术领域,特别是考虑到用户复杂的社交网络结构和联合非负矩阵分解的产品推荐工作。
背景技术
随着互联网的高速发展,越来越的实体商品开始转向网络销售。网络销售省去了实体销售的店面投资,降低了店面维护的人力成本,同时也更容易摆脱地域的限制,将产品销往全国各地,甚至其他国家。然而面对大批量的潜在用户,如何对特定人群进行合理的产品推荐则成为扩大产品收益的最有效途径之一。与此同时,除了产品的定向营销,推荐算法还被广泛的使用在其他应用场景之中,如音乐推荐、电影推荐、图书推荐,美食推荐等,虽然很多以推荐为核心竞争力的网站直接获益不多,但间接收益却十分可观。因此一种好的推荐算法,在产品推广和提高普通用户生活质量方面都起到了很重要的作用。
传统的产品推荐工作,主要采用协同过滤的推荐方法,一般基于两点假设:1)用户会喜欢与自己评分较高的产品相似的产品;2)对相同产品给出相近评价的用户,往往会喜欢对方评分较高的产品。然而,现有的协同过滤方法大多只考虑“用户对已购买产品的评分”这部分数据,而且对于那些购买产品很少的用户,推荐效果很差,尤其对于那些完全没有购买过产品的新用户,几乎不能给出任何有效的建议。
本发明提出了一种基于联合非负矩阵分解的方法,综合考虑了社 交网络中的用户结构关系和产品评价信息,解决了传统方法不能有效处理新用户的问题,对没有购买过任何产品的新用户进行有效的产品推荐。
发明内容
为了进行网络上的产品营销和推广,方便大众的日程生活,同时提高普通用户的生活质量,本发明提出了一种基于联合非负矩阵分解的个性化产品推荐方法:
1、该方法包括以下步骤:
1)从互联网中抓取数据信息,包括用户对已购买产品的评分、用户之间的好友关系,用户对于已购买产品的文字评价;
2)将数据信息转化成数据矩阵,每一个用户的数据信息是其中的一个行向量;
3)利用联合非负矩阵分解的方法,将原始数据矩阵分解成多个低维空间下的数据矩阵;
4)根据低维空间下的数据矩阵,估算每一个用户对于所有未购买产品的评分,按照评分高低进行产品推荐。
进一步,步骤1)中所述的用户对已购买产品的评分、用户之间的好友关系,其特征在于:
用户对已购买产品的评分是一个非负实数,用户之间的好友关系可以是“微博”中的关注关系,也可以是其他社交网络中的好友关系、信任关系等。
进一步,步骤2)中所述的将数据信息转化成数据矩阵,每一个 用户的数据信息是其中的一个行向量,其特征在于:
3)对于用户对于已购买产品的文字评价,去掉所有停止词(a,the,or等使用频率很多但没有特定意义或明显区分价值的字或词,常为冠词、介词、副词或连词等),将单词词干化,即去掉ed,ing等分词形式或ment等词缀,只保留词干形式,遍历所有用户的文字评价,统计所有出现过的不同的单词,针对每一个用户,定义向量 j表示第j个用户,m为所有评价中不同单词的个数,(i≤m)表示第i个单词在向量vj中的权重,用它的TF-IDF值表示,即 其中numj(i)为在用户j的所有评价中,第i个单词出现的个数,total(words)为用户 j的所有评价中包含的单词总数,total(documents)为所有用户的所有评价的总数,documents(i)为所有用户的所有评价中含有第i个单词的评价的数目;
4)针对每一种数据类型,将其对应的向量拼接成一个数据矩阵,定义数据类型i对应的数据矩阵为X(i)(i≤m,t为数据类型个数),X(i)的每一个行向量就是该数据类型下每一个用户j的表示向量
进一步,步骤3)中所述的利用联合非负矩阵分解的方法,将原始数据矩阵分解成多个低维空间下的数据矩阵,其特征在于:
假定我们有t个不同数据类型,用X(1),X(2),……X(t)表示,定义下述目标函数
s.t.U(i),V(i),V(*)≥0,λi≥0,γi≥0,i=1,...,t
X(i)为n*m(i)维矩阵(n为所有用户总数,m(i)与特定数据类型相关,不同数据类型维度取值不同),U(i)为m(i)*k维矩阵,V(i)为n*k维矩阵,其中k为原始矩阵分解后的低维空间的维度(根据实际情况人为 设定),V(*)是保持V(i)(i=1,...,t)一致的最优值,运算符号 是弗罗贝尼乌斯范数的平方,λi,γi是可调参数,求解上述公式得到最优解V(*),U(i),V(i),其中U(i),V(i)为低维表示下的潜在的特征空间,V(*)是保持V(i)(i=1,...,t)一致的最优值。
进一步,步骤4)中所述的根据低维空间下的数据矩阵,估算每一个用户对于所有未购买产品的评分,按照评分高低进行产品推荐,其特征在于:
2)针对每一个用户i,对于已经购买且有评分的产品j,将 更新为原始评分矩阵中Xij的值,此时矩阵则为所有用户对所有产品的评分矩阵。
本发明提出了一种基于联合非负矩阵分解的方法,综合考虑了社交网络中的用户结构关系和产品评价信息,解决了传统方法不能有效处理新用户的问题,对没有购买过任何产品的新用户进行有效的产品推荐。
附图说明
图1是本发明的方法流程图。
具体实施方式
参照附图,进一步说明本发明:
一种基于联合非负矩阵分解的产品推荐方法:
1、该方法包括以下步骤:
1)从互联网中抓取数据信息,包括用户对已购买产品的评分、用户之间的好友关系,用户对于已购买产品的文字评价;
2)将数据信息转化成数据矩阵,每一个用户的数据信息是其中的一个行向量;
3)利用联合非负矩阵分解的方法,将原始数据矩阵分解成多个低维空间下的数据矩阵;
4)根据低维空间下的数据矩阵,估算每一个用户对于所有未购买产品的评分,按照评分高低进行产品推荐。
步骤1)中所述的用户对已购买产品的评分、用户之间的好友关系,其特征在于:
用户对已购买产品的评分是一个非负实数,用户之间的好友关系可以是“微博”中的关注关系,也可以是其他社交网络中的好友关系、 信任关系等。
步骤2)中所述的将数据信息转化成数据矩阵,每一个用户的数据信息是其中的一个行向量,其特征在于:
3)对于用户对于已购买产品的文字评价,去掉所有停止词(a,the,or等使用频率很多但没有特定意义或明显区分价值的字或词,常为冠词、介词、副词或连词等),将单词词干化,即去掉ed,ing等分词形式或ment等词缀,只保留词干形式,遍历所有用户的文字评价,统计所有出现过的不同的单词,针对每一个用户,定义向量 j表示第j个用户,m为所有评价中不同单词的个数,(i≤m)表示第i个单词在向量vj中的权重,用它的TF-IDF 值表示,即 其中numj(i)为在用户j的所有评价中,第i个单词出现的个数,total(words)为用户j的所有评价中包含的单词总数,total(documents)为所有用户的所有评价的总数,documents(i)为所有用户的所有评价中含有第i个单词的评价的数目;
4)针对每一种数据类型,将其对应的向量拼接成一个数据矩阵,定义数据类型i对应的数据矩阵为X(i)(i≤t,t为数据类型个数),X(i)的每一个行向量就是该数据类型下每一个用户j的表示向量
步骤3)中所述的利用联合非负矩阵分解的方法,将原始数据矩阵分解成多个低维空间下的数据矩阵,其特征在于:
假定我们有t个不同数据类型,用X(1),X(2),……X(t)表示,定义下述目标函数
s.t.U(i),V(i),V(*)≥0,λi≥0,γi≥0,i=1,...,t
X(i)为n*m(i)维矩阵(n为所有用户总数,m(i)与特定数据类型相关, 不同数据类型维度取值不同),U(i)为m(i)*k维矩阵,V(i)为n*k维矩阵,其中k为原始矩阵分解后的低维空间的维度(根据实际情况人为设定),V(*)是保持V(i)(i=1,...,t)一致的最优值,运算符号 是弗罗贝尼乌斯范数的平方,λi,γi是可调参数,求解上述公式得到最优解V(*),U(i),V(i),其中U(i),V(i)为低维表示下的潜在的特征空间,V(*)是保持V(i)(i=1,...,t)一致的最优值。
步骤4)中所述的根据低维空间下的数据矩阵,估算每一个用户对于所有未购买产品的评分,按照评分高低进行产品推荐,其特征在于:
3)根据用户对所有产品的评分矩阵 针对目标用户i,在其所 有未购满的产品中,选取前N个评分最高的产品进行推荐。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (5)
1.一种基于联合非负矩阵分解的个性化产品推荐方法,该方法的特征在于:
1)从互联网中抓取数据信息,包括用户对已购买产品的评分、用户之间的好友关系,用户对于已购买产品的文字评价;
2)将数据信息转化成数据矩阵,每一个用户的数据信息是其中的一个行向量;
3)利用联合非负矩阵分解的方法,将原始数据矩阵分解成多个低维空间下的数据矩阵;
4)根据低维空间下的数据矩阵,估算每一个用户对于所有未购买产品的评分,按照评分高低进行产品推荐。
2.如权利要求1所述的基于联合非负矩阵分解的个性化产品推荐方法,步骤1)中所述的用户对已购买产品的评分、用户之间的好友关系,其特征在于:
用户对已购买产品的评分是一个非负实数,用户之间的好友关系可以是“微博”中的关注关系,也可以是其他社交网络中的好友关系、信任关系等。
3.如权利要求2所述的基于联合非负矩阵分解的个性化产品推荐方法,步骤2)中所述的将数据信息转化成数据矩阵,每一个用户的数据信息是其中的一个行向量,其特征在于:
3)对于用户对于已购买产品的文字评价,去掉所有停止词(a,the,or等使用频率很多但没有特定意义或明显区分价值的字或词,常为冠词、介词、副词或连词等),将单词词干化,即去掉ed,ing等分词形式或ment等词缀,只保留词干形式,遍历所有用户的文字评价, 统计所有出现过的不同的单词,针对每一个用户,定义向量 j表示第j个用户,m为所有评价中不同单词的个数,(i≤m)表示第i个单词在向量vj中的权重,用它的TF-IDF值表示,即 其中numj(i)为在用户j的所有评价中,第i个单词出现的个数,total(words)为用户j的所有评价中包含的单词总数,total(documents)为所有用户的所有评价的总数,documents(i)为所有用户的所有评价中含有第i个单词的评价的数目;
4)针对每一种数据类型,将其对应的向量拼接成一个数据矩阵,定义数据类型i对应的数据矩阵为X(i)(i≤t,t为数据类型个数),X(i)的每一个行向量就是该数据类型下每一个用户j的表示向量
4.如权利要求3所述的基于联合非负矩阵分解的个性化产品推荐方法,步骤3)中所述的利用联合非负矩阵分解的方法,将原始数据矩阵分解成多个低维空间下的数据矩阵,其特征在于:
假定我们有t个不同数据类型,用X(1),X(2),……X(t)表示,定义下述目标函数
s.t.U(i),V(i),V(*)≥0,λi≥0,γi≥0,i=1,...,t
5.如权利要求4所述的基于联合非负矩阵分解的个性化产品推荐方法,步骤4)中所述的根据低维空间下的数据矩阵,估算每一个用户对于所有未购买产品的评分,按照评分高低进行产品推荐,其特征在于:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310439089.7A CN103559623A (zh) | 2013-09-24 | 2013-09-24 | 一种基于联合非负矩阵分解的个性化产品推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310439089.7A CN103559623A (zh) | 2013-09-24 | 2013-09-24 | 一种基于联合非负矩阵分解的个性化产品推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103559623A true CN103559623A (zh) | 2014-02-05 |
Family
ID=50013863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310439089.7A Pending CN103559623A (zh) | 2013-09-24 | 2013-09-24 | 一种基于联合非负矩阵分解的个性化产品推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103559623A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933082A (zh) * | 2014-03-21 | 2015-09-23 | 华为技术有限公司 | 评价信息处理方法及其装置 |
CN105069666A (zh) * | 2015-09-14 | 2015-11-18 | 浙江工商大学 | 一种融入用户隐性信息的电子商务个性化推荐方法 |
CN106296337A (zh) * | 2016-07-13 | 2017-01-04 | 扬州大学 | 基于非负矩阵分解的动态推荐方法 |
CN108021645A (zh) * | 2017-11-30 | 2018-05-11 | 华南理工大学 | 一种基于择友偏好和矩阵分解的潜在好友推荐方法 |
CN108629618A (zh) * | 2017-03-22 | 2018-10-09 | 董泽平 | 一种无模型推测基础的产品销售预测方法及系统 |
CN110163692A (zh) * | 2018-01-30 | 2019-08-23 | 哈尔滨学院 | 一种基于大数据的商品推荐方法及其系统 |
WO2020048062A1 (zh) * | 2018-09-05 | 2020-03-12 | 平安科技(深圳)有限公司 | 产品销售的智能推荐方法、装置、计算机设备和存储介质 |
CN110969449A (zh) * | 2018-09-28 | 2020-04-07 | 北京嘀嘀无限科技发展有限公司 | 车辆尾号的确定方法和装置 |
WO2020073526A1 (zh) * | 2018-10-12 | 2020-04-16 | 平安科技(深圳)有限公司 | 基于信任网络的推送方法、装置、计算机设备及存储介质 |
CN112560087A (zh) * | 2020-12-11 | 2021-03-26 | 中国人民解放军陆军工程大学 | 基于矩阵补全技术的敏感数据补全方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100262658A1 (en) * | 2009-04-10 | 2010-10-14 | Accenture Global Services Gmbh | System for transmitting an electronic recommendation |
CN102073717A (zh) * | 2011-01-07 | 2011-05-25 | 南京大学 | 一种面向垂直电子商务网站的首页推荐方法 |
CN102231166A (zh) * | 2011-07-12 | 2011-11-02 | 浙江大学 | 基于社会上下文的协同推荐方法 |
CN102426686A (zh) * | 2011-09-29 | 2012-04-25 | 南京大学 | 一种基于矩阵分解的互联网信息产品推荐方法 |
CN102789499A (zh) * | 2012-07-16 | 2012-11-21 | 浙江大学 | 基于物品间情景化隐式关系的协同过滤方法 |
-
2013
- 2013-09-24 CN CN201310439089.7A patent/CN103559623A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100262658A1 (en) * | 2009-04-10 | 2010-10-14 | Accenture Global Services Gmbh | System for transmitting an electronic recommendation |
CN102073717A (zh) * | 2011-01-07 | 2011-05-25 | 南京大学 | 一种面向垂直电子商务网站的首页推荐方法 |
CN102231166A (zh) * | 2011-07-12 | 2011-11-02 | 浙江大学 | 基于社会上下文的协同推荐方法 |
CN102426686A (zh) * | 2011-09-29 | 2012-04-25 | 南京大学 | 一种基于矩阵分解的互联网信息产品推荐方法 |
CN102789499A (zh) * | 2012-07-16 | 2012-11-21 | 浙江大学 | 基于物品间情景化隐式关系的协同过滤方法 |
Non-Patent Citations (1)
Title |
---|
李改等: "基于矩阵分解的协同过滤算法", 《计算机工程与应用》, 21 October 2011 (2011-10-21) * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104933082B (zh) * | 2014-03-21 | 2019-05-03 | 华为技术有限公司 | 评价信息处理方法及其装置 |
CN104933082A (zh) * | 2014-03-21 | 2015-09-23 | 华为技术有限公司 | 评价信息处理方法及其装置 |
CN105069666A (zh) * | 2015-09-14 | 2015-11-18 | 浙江工商大学 | 一种融入用户隐性信息的电子商务个性化推荐方法 |
CN106296337A (zh) * | 2016-07-13 | 2017-01-04 | 扬州大学 | 基于非负矩阵分解的动态推荐方法 |
CN108629618A (zh) * | 2017-03-22 | 2018-10-09 | 董泽平 | 一种无模型推测基础的产品销售预测方法及系统 |
CN108021645B (zh) * | 2017-11-30 | 2021-11-19 | 华南理工大学 | 一种基于择友偏好和矩阵分解的潜在好友推荐方法 |
CN108021645A (zh) * | 2017-11-30 | 2018-05-11 | 华南理工大学 | 一种基于择友偏好和矩阵分解的潜在好友推荐方法 |
CN110163692A (zh) * | 2018-01-30 | 2019-08-23 | 哈尔滨学院 | 一种基于大数据的商品推荐方法及其系统 |
WO2020048062A1 (zh) * | 2018-09-05 | 2020-03-12 | 平安科技(深圳)有限公司 | 产品销售的智能推荐方法、装置、计算机设备和存储介质 |
CN110969449A (zh) * | 2018-09-28 | 2020-04-07 | 北京嘀嘀无限科技发展有限公司 | 车辆尾号的确定方法和装置 |
CN110969449B (zh) * | 2018-09-28 | 2023-12-05 | 北京嘀嘀无限科技发展有限公司 | 车辆尾号的确定方法和装置 |
WO2020073526A1 (zh) * | 2018-10-12 | 2020-04-16 | 平安科技(深圳)有限公司 | 基于信任网络的推送方法、装置、计算机设备及存储介质 |
CN112560087A (zh) * | 2020-12-11 | 2021-03-26 | 中国人民解放军陆军工程大学 | 基于矩阵补全技术的敏感数据补全方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103559623A (zh) | 一种基于联合非负矩阵分解的个性化产品推荐方法 | |
CN104463630B (zh) | 一种基于网购保险产品特性的产品推荐方法及系统 | |
CN105260899A (zh) | 一种电商主体可信度评价方法及系统 | |
CN103150667A (zh) | 一种基于本体结构的个性化推荐方法 | |
CN105955957A (zh) | 一种商家总体评论中方面评分的确定方法及装置 | |
Bonchek et al. | The most successful brands focus on users—not buyers | |
Mirmiran et al. | The study of differences between e-commerce impacts on developed countries and developing countries, case study: USA and Iran | |
Di Maria et al. | The long Covid effect in marketing and consumer research | |
Wang et al. | Analysis of Online Word-of-Mouth in Online Forums Regarding Notebook Computers. | |
Miao et al. | How Perceived Factors of Review Contents Influence Consumers' Purchase Decision | |
Gumeni et al. | Green marketing as a key strategy for sustainable development: A case study of Albanian consumers. | |
Ritch et al. | Sustainable consumption and the retailer: Will fashion ethics follow food? | |
Lei et al. | Research on Guiding Consumer Behavior Based on App Information Management of Fresh Food E-commerce in the Post-epidemic Era | |
Samsami et al. | The Effect of Banking Facilities on the Value-Added of the Industry and Mining Sector, In Iran | |
Stojanovska et al. | Challenges and opportunities in the use of marketing tools and the promotion of non wood forest products-based small and medium enterprises in the South east Europe | |
Ilham et al. | How Can Digital Strategy Help Sme’s for Export Expansion of Pepper | |
Zhou | The Game Analysis Based on the Third-party Platform Supervision in E-commerce | |
Seisto et al. | The future magazine: Transition from product to service | |
Sinayi et al. | Pricing and Greening Policies in a Green and Nongreen Products Supply Chain: A Game Theoretic Approach | |
Zarei et al. | Investigating the Effect of Social Responsibility and Pro-Environmental Behavior of the Brand on the Willingness to Pay of Consumers with the Mediating Role of Brand Equity | |
Bizen et al. | The effects of athlete as a product endorser on consumers' purchase behaviors | |
Liang | Analysis of the Development of Chinese Tea Trade in Five Central Asian Countries (2017–2022) | |
Hwa et al. | The significance of information technology on real estate agency firm earnings | |
Li | THE RESEARCH OF ENTERPRISES WE MEDIA MARKETING’S INFLUENCE ON BRAND LOYALTY | |
Linna | Research on Strategy Planning of Network Marketing Product |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140205 |