CN102799656A - 一种面向目标用户的个性化产品包的提取方法 - Google Patents

一种面向目标用户的个性化产品包的提取方法 Download PDF

Info

Publication number
CN102799656A
CN102799656A CN2012102272514A CN201210227251A CN102799656A CN 102799656 A CN102799656 A CN 102799656A CN 2012102272514 A CN2012102272514 A CN 2012102272514A CN 201210227251 A CN201210227251 A CN 201210227251A CN 102799656 A CN102799656 A CN 102799656A
Authority
CN
China
Prior art keywords
user
product
scoring
nearest
neighbors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012102272514A
Other languages
English (en)
Inventor
赵进
邱锡鹏
范雄雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN2012102272514A priority Critical patent/CN102799656A/zh
Publication of CN102799656A publication Critical patent/CN102799656A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于计算机技术领域,具体为广播电视产品管理中面向目标用户的个性化产品包的提取方法。主要过程为:收集用户对产品的评分和评价信息,形成用户-产品评分矩阵;用相似度度量算法,寻找与目标用户相似的用户群,得到目标用户的最近邻居集;根据最近邻居集,引入用户间的好友关系作为产品评分的权重,来预测用户对未使用过的产品的评分;跟阈值比较,将评分超过阈值的产品打包组成面向目标用户的个性化产品包。本发明方法将零散的产品进行组合打包,以满足用户个性化的需求。

Description

一种面向目标用户的个性化产品包的提取方法
技术领域
本发明属于计算机技术领域,具体涉及广播电视产品管理中面向目标用户的个性化产品包的提取方法。
背景技术
近年来,随着NGB网络的发展以及市场化竞争的日趋激烈,广电的业务和产品发展也随之面临转型,一个重要的理念转变就是从以产品为核心转为以用户为核心,用户体验上升到了一个全新的高度,由此,产品信息模型也需调整设计,与之相适应。用户在购买产品时,很有可能多个产品一起购买,另外,当产品种类增长到一定数量时,用户主动了解到每个产品信息的意愿可能会有所下降,并且以往的产品包都是运营商或者产品提供商根据自己的经验来制定,并且制定的产品包是面向所有用户的,这体现不出用户的个性化。
发明内容
本发明的目的在于提供一种组合打包零散的产品以满足用户个性化的需求的、面向目标用户的个性化产品包的提取方法。
根据统计数据和以往经验表明,同类别的用户群中,用户的大多数兴趣点是相似的,相似的兴趣映射到对产品的评分是相近的,所以本发明力求通过找到与用户相似较高的用户群来预测用户对未使用过的产品的评分,并将所有产品的评分与事先设定阈值的比较得到用户已确定的和预测的较为偏爱的产品集合,得到面向目标用户的个性化产品包。其流程图如图1所示,具体步骤为:
(1)收集用户对产品的评分和评价信息,形成用户-产品评分矩阵;
(2)用相似度量方法,寻找与目标用户相似的用户群,得到目标用户的最近邻居集;
(3)根据最近邻居集,引入用户间的好友关系作为产品评分的权重,来预测用户对未使用过的产品的评分;
(4)跟阈值比较,将评分超过阈值的产品打包组成面向目标用户的个性化产品包。
在步骤(1)中,有些用户因为觉得评价产品麻烦,所以没有显式的对产品进行评分,本发明通过采集用户连续订购产品的次数,并转化为用户对产品的评分,来填充用户未评分留下的空白,这对方法的后面几个步骤是较为关键的,因为后续的流程很大程度上依赖于用户对产品的评分。
所以第一步先建立用户-产品配置文件,收集用户的评分、评价行为等,并进行数据清理转换等,最终形成用户-产品矩阵,如图2所示,矩阵的表示方法为:
行为用户标识,列为产品标识;
一个用户可订购多个产品,一个产品可对应多个用户。
矩阵中的元素                                               
Figure 2012102272514100002DEST_PATH_IMAGE002
(其中1≤i≤m,1≤j≤n)为用户与产品间的关系与评价,如果用户未购买该产品或未对该产品进行评分,则元素内容为0;如果用户购买了该产品,并且对该产品进行了评分,则元素内容为用户对该产品的评分,评分的范围为{1,2,3,4,5}。
由于用户对产品的评分对第二步工作即为重要,所以本方法采取一种更新方法:
若该用户连续n次购买该产品,MIN_4<n<MAX_4,并且n次均未对该产品进行评分,则认为该用户对该产品的用户体验较好,系统更新配置文件的该项元素内容为评分4。其中,MIN_4为连续订购该产品的最小次数,MAX_4为连续订购该产品的最大次数,在这段订购次数范围内,认为该用户对产品的评价为4分。
若该用户若该用户连续n次购买该产品,MIN_5<n,并且n次均未对该产品进行评分,则认为该用户对该产品的用户体验较好,系统更新配置文件的该项元素内容为评分5。其中,MIN_5为连续订购该产品的最小次数,在这段订购次数范围内,认为该用户对产品的评价为5分。
步骤(2)通过相似度度量算法寻找与目标用户相似的用户群,由于单个用户的兴趣点受教育背景、知识领域、文化和地区差异等因素的影响,所以单个用户未必能发现自己潜在的兴趣点,但是有了相似兴趣的用户群之后,群内成员的兴趣点相互补充,很大程度上挖掘了目标用户的潜在兴趣,这对用户的个性化的产品包以及用户体验的提高是非常重要的。
其具体内容为:根据目标用户(产品包的推送对象)进行最近邻居搜索。最近邻居搜索的思想是:如果一些用户对某些产品的评分比较相似,则说明这些用户的兴趣偏好相似,找出跟目标用户相似度较大的用户群,来预测目标用户对未使用过的产品的评分。
如图2所示,要找到最近邻居就要度量用户间的相似性,相似度越高,用户就越相近,把用户i和用户j之间的相似性记为。每个用户对产品的评分可看作是一个m维向量,度量用户间相似度就可以用不同的m维向量间的相似度进行度量如图3所示。
Figure 2012102272514100002DEST_PATH_IMAGE006
其中为用户i和用户j共同评分的产品集合。
Figure 2012102272514100002DEST_PATH_IMAGE010
表示用户i对产品c的评分,
Figure 2012102272514100002DEST_PATH_IMAGE012
Figure 2012102272514100002DEST_PATH_IMAGE014
分别表示用户i和用户j的平均评分(
Figure 2012102272514100002DEST_PATH_IMAGE016
Figure 324714DEST_PATH_IMAGE010
=0的不计算在内),
Figure 963506DEST_PATH_IMAGE016
为用户j对产品c的评分。通过上面提出的相似度度量方法得到用户的最近邻居集合。
步骤(3)中引入了用户间的好友关系作为产品评分的权重等来预测用户对未使用过的产品的评分,这是由于用户更加偏爱自己信任的好友所推荐的产品。
其具体内容为:根据从第二步产生的K个最近邻居中,产生面向目标用户的个性化产品包。方法如下:设用户u的最近邻居集合用Nu表示,则用户u对未使用过的产品的预测评分Pu,i可以通过用户u对最近邻居集合Nu中项的评分得到:
其中,
Figure 2012102272514100002DEST_PATH_IMAGE020
为权重,一般当用户n和用户u为好友关系时,则
Figure 561978DEST_PATH_IMAGE020
设为1,当用户n和用户u为非好友关系时,
Figure 986137DEST_PATH_IMAGE020
设为0到1之间的某个数。
Figure 2012102272514100002DEST_PATH_IMAGE022
表示用户u和用户n之间的相似性,
Figure 2012102272514100002DEST_PATH_IMAGE024
表示用户n对产品i的评分。
Figure 2012102272514100002DEST_PATH_IMAGE026
Figure 2012102272514100002DEST_PATH_IMAGE028
分别表示用户u和用户n对产品的平均评分。通过上述方法预测用户对所有未评分的产品的评分。
步骤(4)比较目标用户预测的和已有的对所有产品的评分与事先设定的阈值进行比较(一般设定阈值为评分4或者为
Figure 2012102272514100002DEST_PATH_IMAGE030
Figure 182501DEST_PATH_IMAGE030
为目标用户的平均评分),超过阈值的表明是用户较为偏爱的产品,打包组合这些产品即可得到面向目标用户的个性化产品包。
附图说明
图1 本发明方法流程图示。
图2 用户-产品评分矩阵。
图3 最原始的用户-产品评分矩阵实例。
图4 经过步骤(1)更新后的用户-产品评分矩阵。
图5 用户2的好友链表。
图6 经过步骤(2)和(3)更新后的用户-产品评分矩阵。
具体实施方式
为了使本技术领域的人员能够更好的理解本发明,下面结合附图对本发明作进一步的详细说明。
如图3所示,以4个用户和4类产品为例,根据用户产品评价信息,得到初步的用户-产品评分矩阵,现在要产生针对用户2的产品组合包。根据用户的订购信息,对其进行更新,假设MIN_4=3,MAX_4=6,MIN_4=7,并且用户1购买了4次产品3,用户3购买了8次产品1,则因为4落在MIN_4和MAX_4之间,所以更新
Figure 2012102272514100002DEST_PATH_IMAGE032
为4,因为8>MIN_4,所以更新
Figure 2012102272514100002DEST_PATH_IMAGE034
为5,得到如图新的4所示的用户-产品评分矩阵。
根据图4和算式:
Figure DEST_PATH_IMAGE036
得到用户2与其他用户间的相似性度量sim(2,1)=0.408, sim(2,3)=-0.224, sim(2,4)=-0.094,取
Figure DEST_PATH_IMAGE038
小的作为用户的2的最近邻居,这里取用户3和用户4,查询用户2的最近邻居是否是用户2的好友(用链表存储用户2的所有好友),如图5所示,用户3为用户2的好友,根据算式:
Figure DEST_PATH_IMAGE040
(本例取非好友是=0.8)得到
Figure DEST_PATH_IMAGE042
=2.6,
Figure DEST_PATH_IMAGE044
=5.2,
Figure DEST_PATH_IMAGE046
=3.3,由于评分必须是{1,2,3,4,5}中的元素,所以四舍五入,得到
Figure 98034DEST_PATH_IMAGE042
=3,
Figure 625968DEST_PATH_IMAGE044
=5,
Figure 88173DEST_PATH_IMAGE046
=3,更新后得到如图6所示的用户-产品评分矩阵。本例取阈值为评分4,有图6可知,
Figure DEST_PATH_IMAGE048
超过阈值,所以提取产品1和产品3,组合成为针对用户2的个性化产品包,在用户2浏览选购产品时,呈现给用户作为订购参考。
以上应用了具体的实施方式对本发明进行了阐述,对于本领域的技术人员,依据本发明思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (5)

1. 一种面向目标用户的个性化产品包的提取方法,其特征在于,具体步骤为:
(1)收集用户对产品的评分和评价信息,形成用户-产品评分矩阵;
(2)用相似度度量算法,寻找与目标用户相似的用户群,得到目标用户的最近邻居集;
(3)根据最近邻居集,引入用户间的好友关系作为产品评分的权重,来预测用户对未使用过的产品的评分;
(4)跟阈值比较,将评分超过阈值的产品打包组成面向目标用户的个性化产品包。
2. 根据权利要求1所述提取方法,其特征在于在步骤(1)中:
首先,建立用户-产品配置文件,收集用户的评分、评价行为,并进行数据清理转换,最终形成用户-产品矩阵;该矩阵的表示方法为:
行为用户标识,列为产品标识;
一个用户可订购多个产品,一个产品可对应多个用户;
矩阵中的元素                                               
Figure 2012102272514100001DEST_PATH_IMAGE002
为用户与产品间的关系与评价,1≤i≤m,1≤j≤n;如果用户未购买该产品或未对该产品进行评分,则元素内容为0;如果用户购买了该产品,并且对该产品进行了评分,则元素内容为用户对该产品的评分,评分的范围为{1,2,3,4,5};
然后,对产品的评分进行更新,更新的方法为: 
若该用户连续n次购买该产品,MIN_4<n<MAX_4,并且n次均未对该产品进行评分,则认为该用户对该产品的用户体验较好,系统更新配置文件的该项元素内容为评分4;其中,MIN_4为连续订购该产品的最小次数,MAX_4为连续订购该产品的最大次数,在这段订购次数范围内,认为该用户对产品的评价为4分;
若该用户若该用户连续n次购买该产品,MIN_5<n,并且n次均未对该产品进行评分,则认为该用户对该产品的用户体验较好,系统更新配置文件的该项元素内容为评分5;其中,MIN_5为连续订购该产品的最小次数,在这段订购次数范围内,认为该用户对产品的评价为5分。
3. 根据权利要求2所述提取方法,其特征在于在步骤(2)中:
所述通过相似度度量算法寻找与目标用户相似的用户群,具体步骤为:根据目标用户即产品包的推送对象进行最近邻居搜索,所谓最近邻居搜索是:如果一些用户对某些产品的评分比较相似,则说明这些用户的兴趣偏好相似,找出跟目标用户相似度较大的用户群,来预测目标用户对未使用过的产品的评分;
设用户i和用户j之间的相似性记为
Figure 2012102272514100001DEST_PATH_IMAGE004
,每个用户对产品的评分看作是一个m维向量,度量用户间相似度就用不同的m维向量间的相似度进行度量,其算式为:
Figure DEST_PATH_IMAGE006
其中,
Figure DEST_PATH_IMAGE008
为用户i和用户j共同评分的产品集合,
Figure DEST_PATH_IMAGE010
表示用户i对产品c的评分,
Figure DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE014
分别表示用户i和用户j的平均评分,为用户j对产品c的评分;通过相似度度量算法得到用户的最近邻居集合。
4. 根据权利要求3所述提取方法,其特征在于在步骤(3)中:
所述引入用户间的好友关系作为产品评分的权重,来预测用户对未使用过的产品的评分,是从步骤(2)产生的K个最近邻居,产生面向目标用户的个性化产品包,方法如下:设用户u的最近邻居集合用Nu表示,则用户u对未使用过的产品的预测评分Pu,i通过用户u对最近邻居集合Nu中项的评分得到:
Figure DEST_PATH_IMAGE018
其中,
Figure DEST_PATH_IMAGE020
为权重,当用户n和用户u为好友关系时,则
Figure DEST_PATH_IMAGE022
设为1,当用户n和用户u为非好友关系时,
Figure DEST_PATH_IMAGE024
设为0到1之间的某个数;
Figure DEST_PATH_IMAGE026
表示用户u和用户n之间的相似性,
Figure DEST_PATH_IMAGE028
表示用户n对产品i的评分,
Figure DEST_PATH_IMAGE030
Figure DEST_PATH_IMAGE032
分别表示用户u和用户n对产品的平均评分,通过上述方法预测用户对所有未评分的产品的评分。
5. 根据权利要求4所述提取方法,其特征在于在步骤(4)中:
比较目标用户预测的和已有的对所有产品的评分与事先设定的阈值进行比较,超过阈值的表明是用户较为偏爱的产品,打包组合这些产品即可得到面向目标用户的个性化产品包;所述阈值设定为评分4或者为
Figure 391430DEST_PATH_IMAGE034
为目标用户的平均评分。
CN2012102272514A 2012-07-03 2012-07-03 一种面向目标用户的个性化产品包的提取方法 Pending CN102799656A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012102272514A CN102799656A (zh) 2012-07-03 2012-07-03 一种面向目标用户的个性化产品包的提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012102272514A CN102799656A (zh) 2012-07-03 2012-07-03 一种面向目标用户的个性化产品包的提取方法

Publications (1)

Publication Number Publication Date
CN102799656A true CN102799656A (zh) 2012-11-28

Family

ID=47198766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012102272514A Pending CN102799656A (zh) 2012-07-03 2012-07-03 一种面向目标用户的个性化产品包的提取方法

Country Status (1)

Country Link
CN (1) CN102799656A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020784A (zh) * 2012-12-27 2013-04-03 智比特信息技术(镇江)有限公司 一种对事物的评价系统
CN105247555A (zh) * 2013-05-09 2016-01-13 微软技术许可有限责任公司 在生成推荐时考虑社交信息
CN105574198A (zh) * 2015-12-28 2016-05-11 海信集团有限公司 一种栏目推荐方法及装置
CN106022838A (zh) * 2016-05-27 2016-10-12 天津大学 一种电子商务推荐系统中用户最近邻居集的优化选取方法
WO2018006575A1 (zh) * 2016-07-05 2018-01-11 福建福昕软件开发股份有限公司 一种基于共同兴趣的互联文档更新方法
CN107958338A (zh) * 2017-12-08 2018-04-24 合肥工业大学 用电策略推荐方法及装置、存储介质
CN109087138A (zh) * 2018-07-26 2018-12-25 北京京东金融科技控股有限公司 数据处理方法及系统、计算机系统和可读存储介质
CN113962335A (zh) * 2021-12-22 2022-01-21 北京恒信启华信息技术股份有限公司 一种可灵活配置的数据全过程处理方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4996642A (en) * 1987-10-01 1991-02-26 Neonics, Inc. System and method for recommending items

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4996642A (en) * 1987-10-01 1991-02-26 Neonics, Inc. System and method for recommending items

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
乔秀全等: "社交网络服务中一种基于用户上下文的信任度计算方法", 《计算机学报》 *
李媛: "电子商务个性化推荐关键技术研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
黄创光等: "不确定近邻的协同过滤推荐算法", 《计算机学报》 *
黄武汉等: "移动通信网中基于用户社会化关系挖掘的协同过滤算法", 《电子与信息学报》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020784A (zh) * 2012-12-27 2013-04-03 智比特信息技术(镇江)有限公司 一种对事物的评价系统
CN105247555A (zh) * 2013-05-09 2016-01-13 微软技术许可有限责任公司 在生成推荐时考虑社交信息
CN105574198A (zh) * 2015-12-28 2016-05-11 海信集团有限公司 一种栏目推荐方法及装置
CN105574198B (zh) * 2015-12-28 2019-12-06 海信集团有限公司 一种栏目推荐方法及装置
CN106022838A (zh) * 2016-05-27 2016-10-12 天津大学 一种电子商务推荐系统中用户最近邻居集的优化选取方法
WO2018006575A1 (zh) * 2016-07-05 2018-01-11 福建福昕软件开发股份有限公司 一种基于共同兴趣的互联文档更新方法
CN107577684A (zh) * 2016-07-05 2018-01-12 福建福昕软件开发股份有限公司 一种基于共同兴趣的互联文档更新方法
CN107958338A (zh) * 2017-12-08 2018-04-24 合肥工业大学 用电策略推荐方法及装置、存储介质
CN109087138A (zh) * 2018-07-26 2018-12-25 北京京东金融科技控股有限公司 数据处理方法及系统、计算机系统和可读存储介质
CN113962335A (zh) * 2021-12-22 2022-01-21 北京恒信启华信息技术股份有限公司 一种可灵活配置的数据全过程处理方法
CN113962335B (zh) * 2021-12-22 2022-04-12 北京恒信启华信息技术股份有限公司 一种可灵活配置的数据全过程处理方法

Similar Documents

Publication Publication Date Title
CN102799656A (zh) 一种面向目标用户的个性化产品包的提取方法
CN104935963B (zh) 一种基于时序数据挖掘的视频推荐方法
CN103412948B (zh) 基于聚类的协同过滤的商品推荐方法及系统
CN102750336B (zh) 一种基于用户关联性的资源个性化推荐方法
CN102063433A (zh) 相关项推荐方法和装置
CN110580649B (zh) 一种商品潜力值的确定方法和装置
CN103246980B (zh) 信息输出方法及服务器
CN103995839A (zh) 基于协同过滤的商品推荐优化方法和系统
CN102982466B (zh) 一种基于用户活跃度的评分预测方法
CN104281956A (zh) 基于时间信息的适应用户兴趣变化的动态推荐方法
CN103745100A (zh) 一种基于项目的混合显性隐性反馈的协同过滤推荐算法
CN103886001A (zh) 一种个性化商品推荐系统
CN102231166A (zh) 基于社会上下文的协同推荐方法
CN105976229A (zh) 一种基于用户和项目混合的协同过滤算法
CN104462336A (zh) 信息推送方法和装置
CN106777200A (zh) 项目推荐的方法及装置
CN101489107A (zh) 一种基于人口属性关键字向量的协作过滤推荐方法
CN104657336B (zh) 一种基于半余弦函数的个性化推荐方法
CN104239496A (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
CN110334284B (zh) 一种新型融合多因素决策的推荐方法
CN105426550A (zh) 一种基于用户质量模型的协同过滤标签推荐方法及系统
CN105430505A (zh) 一种基于组合策略的iptv节目推荐方法
US20170046768A1 (en) Hybrid recommendation system for recommending product advertisements
CN105678590A (zh) 一种面向社交网络基于云模型的topN推荐方法
CN106776859A (zh) 基于用户偏好的移动应用App推荐系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121128