CN106095974A - 基于网络结构相似性的推荐系统评分预测与推荐算法 - Google Patents
基于网络结构相似性的推荐系统评分预测与推荐算法 Download PDFInfo
- Publication number
- CN106095974A CN106095974A CN201610442816.9A CN201610442816A CN106095974A CN 106095974 A CN106095974 A CN 106095974A CN 201610442816 A CN201610442816 A CN 201610442816A CN 106095974 A CN106095974 A CN 106095974A
- Authority
- CN
- China
- Prior art keywords
- user
- article
- scoring
- alpha
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000006185 dispersion Substances 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 230000005611 electricity Effects 0.000 claims description 3
- 238000011524 similarity measure Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于网络结构相似性的推荐系统评分预测与推荐算法,基于用户和物品作为网络中节点,用户对物品的评分作为边,边的权值由用户对物品的评分大小决定,构造网络,将推荐系统中用户对物品的评分作为构造网络的基础,并以其网络结构相似性作为推荐选择的主要依据,通过全面考察推荐系统商品、电影等物品之间的联系,借助用户评分物品网络在结构上的相似性,提高了推荐系统推荐物品的多样性,并且使推荐的准确性得到提升。
Description
技术领域
本发明涉及一种信息处理技术,特别涉及一种基于网络结构相似性的推荐系统评分预测与推荐算法。
背景技术
个性化服务作为热点问题被许多研究领域关注和研究。个性化服务的一个重要研究内容是个性化推荐,它可以根据用户的兴趣寻找与之具有相似兴趣的物品集合,然后基于物品之间的相似性推荐用户感兴趣的物品。使用个性化推荐技术向用户推荐适宜其自身的电影、商品等等,使得用户可以迅速得到符合喜欢和选择倾向的物品信息,而这对于推荐系统而言,既可以得到用户的信任,获得更多的青睐和使用,也使得系统推荐节省了用户在大量浏览过程中所消耗的系统资源,从而节省带宽等运营成本,并更好的为用户服务。
作为电子商务推荐系统中应用最成功的推荐技术,传统的协同过滤推荐算法存在两方面问题。其仅仅依靠用户之间的相似度来选取目标用户的邻居,导致推荐精度较低,并且在推荐时,存在推荐商品的多样性较差的缺点。
因此,需要一种更为有效的且具有适当多样性的推荐系统,来实现方便而高效的服务。
发明内容
本发明是针对传统的推荐算法准确度低、系统易受攻击的问题,提出了一种基于网络结构相似性的推荐系统评分预测与推荐算法,通过全面考察推荐系统商品、电影等物品之间的联系,借助用户评分物品网络在结构上的相似性,实现更加精准的评分计算和推荐服务。
本发明的技术方案为:一种基于网络结构相似性的推荐系统评分预测与推荐算法,具体包括如下步骤:
1)建立当前推荐系统中的用户评分库:遍历当前用户,获得每个用户对所有物品的评分记录,列出其中部分用户评分数据;
2)用下面公式将用户评分数据归一化:
其中riα为用户Ui对物品a的评分,ri max和ri min代表用户Ui评分记录中的最高分和最低分,若最高分与最低分相等,可将归一化值赋为0,eiα∈[-1,1],eiα为归一化后用户Ui对电影a的评分值;
3)目标用户Ui搜索物品a;
4)基于用户和物品作为网络中节点,用户对物品的评分作为边,边的权值由用户对物品的评分大小决定,构造网络;
5)计算物品之间的相似性,对于任意两个物品α和β,其相关性计算公式为:
Sαβ为物品α和物品β的相似性,其中Cαβ表示物品α和物品β被共同的用户评分过的共同用户集合中的用户个数,Cα表示所有对物品α评分过的用户集合中用户的数量,μ′和σ′同样是通过计算得到的两个系数,物品α和物品β共同评分过的用户集合B中有t个用户,表示其中第q个用户对物品α的评分,表示其中第q个用户对物品β的评分,σ′表示评分B集合的离散程度,σ′越大,评分离散程度越高,物品α和物品β的相似性程度越低,Cα不一定等于Cβ,Sαβ与Sβα不一定相等;
6)对于任意两个用户Ui和Uj,其相似性计算公式为:
其中Sij为用户Ui和Uj的相似性,Cij表示用户Ui和用户Uj共同评分过的物品集合中物品的个数,Ci表示用户Ui评分过所有的物品集合中物品的数量,μ和σ是通过计算得到的两个系数。假设用户Ui和用户Uj共同评分过的物品集合A中有v个物品,则表示用户Ui对其中第p个物品的评分,表示用户Uj对其中第p个物品的评分,σ表示评分A集合的离散程度,σ越大,评分离散程度越高,用户Ui和用户Uj的相似性程度越低,Ci不一定等于Cj,因此Sij与Sji不一定相等;
7)依据下面公式,基于物品相似性,对用户Ui搜索或评分物品a进行计算:
其中和分别是物品a与物品β的历史平均评分,n是物品a的邻居个数,是用户Ui对物品a的预测评分值,β代表a物品的邻居集合从1至n,riβ为用户Ui对该集合中物品β的评分,Sβα是物品β与物品a的相似性,由步骤5)公式进行计算,;取n=1时,a物品的邻居集合与其相似性最高的邻居并没有被用户Ui评分,不符合条件,则增大n,直到新的邻居集合中被Ui评分的邻居数量等于1,计算
8)依据下面公式,基于用户相似性,对用户Ui搜索或评分物品a进行计算:
其中和分别是用户Ui和Uj的历史平均评分,m是用户Ui的邻居个数,也是用户Ui对物品a的预测评分值,j代表用户Ui的邻居集合从1至m,rjα为集合中用户Uj对该集合中物品a的评分,sji是用户Uj和用户Ui的相似性,由步骤6)公式进行计算,取m=1时,最先获取的邻居Uj对物品a未进行过评分,则增大m的值,直到出现符合要求的一个邻居,计算
9)最终用户Ui搜索或评分物品a的结果为两者的加权和,计算公式如下:
10)将物品a的所有邻居中,评分预测最高的h项,按照预测评分从高到低推荐给用户Ui。
本发明的有益效果在于:本发明基于网络结构相似性的推荐系统评分预测与推荐算法,将推荐系统中用户对物品的评分作为构造网络的基础,并以其网络结构相似性作为推荐选择的主要依据,提高了推荐系统推荐物品的多样性,并且使推荐的准确性得到提升。
附图说明
图1为本发明基于网络结构相似性的推荐系统评分预测与推荐算法流程图;
图2为本发明用户对物品评分所构造的网络结构图。
具体实施方式
假设Ui(在公式中用下标i表示)为电影推荐系统的用户,曾经对网站数据库中的若干电影予以评分,分值分布在1-5之间。
如图1所示基于网络结构相似性的推荐系统评分预测与推荐算法流程图,以用户Ui搜索物品a为例,其他物品步骤相同,具体步骤如下:
S1:建立当前推荐系统中的用户评分库:
遍历当前用户,获得每个用户对所有电影的评分记录,列出其中部分用户评分数据,如表1所示。
表1
S2:用下面公式将用户评分数据归一化:
其中riα为用户Ui对电影a的评分,ri max和ri min代表用户Ui评分记录中的最高分和最低分,若最高分与最低分相等,可将归一化值赋为0,eiα∈[-1,1],eiα为归一化后用户Ui对电影a的评分值,与原值不同之处在于:其值域分布在正负1之间,并考虑了用户对不同电影的总体评分数量,修正了用户对电影可能存在的偏见;得到如表2所示数据;
表2
S3:目标用户Ui搜索物品a(设a为电影3);
S4:基于用户和物品作为网络中节点,用户对物品的评分作为边,边的权值由用户对物品的评分大小决定,构造网络的如图2所示;
S5:计算物品之间的相似性,对于任意两个物品α和β,其相关性计算公式为:
Sαβ为物品α和物品β的相似性,其中Cαβ表示物品a和物品β被共同的用户评分过的共同用户集合中的用户个数,Cα表示所有对物品α评分过的用户集合中用户的数量,μ′和σ′同样是通过计算得到的两个系数。物品α和物品β共同评分过的用户集合B中有t个用户,表示其中第q个用户对物品α的评分,表示其中第q个用户对物品β的评分。σ′表示评分B集合的离散程度,σ′越大,评分离散程度越高,物品α和物品β的相似性程度越低。同理,因为Cα不一定等于Cβ,所以Sαβ与Sβα不一定相等;
按照相关性计算公式,进行电影相关性计算,可得电影之间相关性如表3所示:
表3
S6:对于任意两个用户Ui和Uj,其相似性计算公式为:
其中Sij为用户Ui和Uj的相似性,Cij表示用户Ui和用户Uj共同评分过的物品集合中物品的个数,Ci表示用户Ui评分过所有的物品集合中物品的数量,μ和σ是通过计算得到的两个系数。假设用户Ui和用户Uj共同评分过的物品集合A中有v个物品,则表示用户Ui对其中第p个物品的评分,表示用户Uj对其中第p个物品的评分。σ表示评分A集合的离散程度,σ越大,评分离散程度越高,用户Ui和用户Uj的相似性程度越低。需要注意的是,因为Ci不一定等于Cj,所以Sij与Sji不一定相等。计算结果如表4所示;
表4
S7:依据下面公式,基于物品相似性,对用户Ui搜索或评分物品a进行计算:
其中和分别是物品a与物品β的历史平均评分,n是物品a的邻居个数,是用户Ui对物品a的预测评分值,β代表a物品的邻居集合从1至n,riβ为用户Ui对该集合中物品β的评分,Sβα是物品β与物品a的相似性,由步骤S5公式进行计算;取n=1时,a物品的邻居集合与其相似性最高的邻居并没有被用户Ui评分,不符合条件,因此需要增大n,直到新的邻居集合中被Ui评分的邻居数量等于1,此时,Ui对a的预测评分为
S8:依据下面公式,基于用户相似性,对用户Ui搜索或评分物品a进行计算:
其中和分别是用户Ui和Uj的历史平均评分,m是用户Ui的邻居个数,也是用户Ui对物品a的预测评分值,j代表用户Ui的邻居集合从1至m,rjα为集合中用户Uj对该集合中物品a的评分,sji是用户Uj和用户Ui的相似性,由步骤S6公式进行计算;取m=1时,最先获取的邻居Uj对物品a未进行过评分,因此需要增大m的值,直到出现符合要求的一个邻居,此时Ui对a的预测评分为
S9:最终用户Ui搜索或评分物品a的结果为两者的加权和,计算公式如下:则Ui对a的最终预测评分为
S10:将a的所有邻居中,评分预测最高的h项(通常按照推荐系统的需求给定,一般在1至20之间),按照预测评分从高到低推荐给用户Ui。对物品a的邻居进行相似的预测,可得Ui对电影4的评分为5,Ui对电影5的评分为4.9,因此想用户Ui推荐电影的顺序为电影4、电影5、电影3。
Claims (1)
1.一种基于网络结构相似性的推荐系统评分预测与推荐算法,其特征在于,具体包括如下步骤:
1)建立当前推荐系统中的用户评分库:遍历当前用户,获得每个用户对所有物品的评分记录,列出其中部分用户评分数据;
2)用下面公式将用户评分数据归一化:
其中ria为用户Ui对物品a的评分,和代表用户Ui评分记录中的最高分和最低分,若最高分与最低分相等,可将归一化值赋为0,eiα∈[-1,1],eiα为归一化后用户Ui对电影a的评分值;
3)目标用户Ui搜索物品a;
4)基于用户和物品作为网络中节点,用户对物品的评分作为边,边的权值由用户对物品的评分大小决定,构造网络;
5)计算物品之间的相似性,对于任意两个物品α和β,其相关性计算公式为:
Sαβ为物品α和物品β的相似性,其中Cαβ表示物品α和物品β被共同的用户评分过的共同用户集合中的用户个数,Cα表示所有对物品α评分过的用户集合中用户的数量,μ′和σ′同样是通过计算得到的两个系数,物品α和物品β共同评分过的用户集合B中有t个用户,表示其中第q个用户对物品α的评分,表示其中第q个用户对物品β的评分,σ′表示评分B集合的离散程度,σ′越大,评分离散程度越高,物品α和物品β的相似性程度越低,Cα不一定等于Cβ,Sαβ与Sβα不一定相等;
6)对于任意两个用户Ui和Uj,其相似性计算公式为:
其中Sij为用户Ui和Uj的相似性,Cij表示用户Ui和用户Uj共同评分过的物品集合中物品的个数,Ci表示用户Ui评分过所有的物品集合中物品的数量,μ和σ是通过计算得到的两个系数。假设用户Ui和用户Uj共同评分过的物品集合A中有v个物品,则表示用户Ui对其中第p个物品的评分,表示用户Uj对其中第p个物品的评分,σ表示评分A集合的离散程度,σ越大,评分离散程度越高,用户Ui和用户Uj的相似性程度越低,Ci不一定等于Cj,因此Sij与Sji不一定相等;
7)依据下面公式,基于物品相似性,对用户Ui搜索或评分物品a进行计算:
其中和分别是物品α与物品β的历史平均评分,n是物品α的邻居个数,是用户Ui对物品α的预测评分值,β代表a物品的邻居集合从1至n,riβ为用户Ui对该集合中物品β的评分,Sβα是物品β与物品a的相似性,由步骤5)公式进行计算,;取n=1时,a物品的邻居集合与其相似性最高的邻居并没有被用户Ui评分,不符合条件,则增大n,直到新的邻居集合中被Ui评分的邻居数量等于1,计算
8)依据下面公式,基于用户相似性,对用户Ui搜索或评分物品a进行计算:
其中和分别是用户Ui和Uj的历史平均评分,m是用户Ui的邻居个数,也是用户Ui对物品α的预测评分值,j代表用户Ui的邻居集合从1至m,rjα为集合中用户Uj对该集合中物品a的评分,sji是用户Uj和用户Ui的相似性,由步骤6)公式进行计算,取m=1时,最先获取的邻居Uj对物品α未进行过评分,则增大m的值,直到出现符合要求的一个邻居,计算
9)最终用户Ui搜索或评分物品a的结果为两者的加权和,计算公式如下:
10)将物品a的所有邻居中,评分预测最高的h项,按照预测评分从高到低推荐给用户Ui。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610442816.9A CN106095974B (zh) | 2016-06-20 | 2016-06-20 | 基于网络结构相似性的推荐系统评分预测与推荐算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610442816.9A CN106095974B (zh) | 2016-06-20 | 2016-06-20 | 基于网络结构相似性的推荐系统评分预测与推荐算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106095974A true CN106095974A (zh) | 2016-11-09 |
CN106095974B CN106095974B (zh) | 2019-12-24 |
Family
ID=57237257
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610442816.9A Expired - Fee Related CN106095974B (zh) | 2016-06-20 | 2016-06-20 | 基于网络结构相似性的推荐系统评分预测与推荐算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106095974B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106802956A (zh) * | 2017-01-19 | 2017-06-06 | 山东大学 | 一种基于加权异构信息网络的电影推荐方法 |
CN106991199A (zh) * | 2017-06-07 | 2017-07-28 | 上海理工大学 | 基于用户行为倾向概率的推荐系统评分预测与推荐方法 |
CN109033233A (zh) * | 2018-06-29 | 2018-12-18 | 武汉斗鱼网络科技有限公司 | 一种直播间推荐方法、存储介质、电子设备及系统 |
CN109063120A (zh) * | 2018-08-01 | 2018-12-21 | 北京邮电大学 | 一种基于聚类的协同过滤推荐方法和装置 |
CN111143699A (zh) * | 2020-01-03 | 2020-05-12 | 上海理工大学 | 基于相似性与置信度聚类的推荐系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609523A (zh) * | 2012-02-10 | 2012-07-25 | 上海视畅信息科技有限公司 | 基于物品分类和用户分类的协同过滤推荐算法 |
CN104021230A (zh) * | 2014-06-27 | 2014-09-03 | 重庆邮电大学 | 一种基于社区发现的协同过滤方法 |
CN104063481A (zh) * | 2014-07-02 | 2014-09-24 | 山东大学 | 一种基于用户实时兴趣向量的电影个性化推荐方法 |
CN104598643A (zh) * | 2015-02-13 | 2015-05-06 | 成都品果科技有限公司 | 一种物品相似度贡献系数、相似度获取方法及物品推荐方法及其系统 |
-
2016
- 2016-06-20 CN CN201610442816.9A patent/CN106095974B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609523A (zh) * | 2012-02-10 | 2012-07-25 | 上海视畅信息科技有限公司 | 基于物品分类和用户分类的协同过滤推荐算法 |
CN104021230A (zh) * | 2014-06-27 | 2014-09-03 | 重庆邮电大学 | 一种基于社区发现的协同过滤方法 |
CN104063481A (zh) * | 2014-07-02 | 2014-09-24 | 山东大学 | 一种基于用户实时兴趣向量的电影个性化推荐方法 |
CN104598643A (zh) * | 2015-02-13 | 2015-05-06 | 成都品果科技有限公司 | 一种物品相似度贡献系数、相似度获取方法及物品推荐方法及其系统 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106802956A (zh) * | 2017-01-19 | 2017-06-06 | 山东大学 | 一种基于加权异构信息网络的电影推荐方法 |
CN106802956B (zh) * | 2017-01-19 | 2020-06-05 | 山东大学 | 一种基于加权异构信息网络的电影推荐方法 |
CN106991199A (zh) * | 2017-06-07 | 2017-07-28 | 上海理工大学 | 基于用户行为倾向概率的推荐系统评分预测与推荐方法 |
CN106991199B (zh) * | 2017-06-07 | 2020-07-14 | 上海理工大学 | 基于用户行为倾向概率的推荐系统评分预测与推荐方法 |
CN109033233A (zh) * | 2018-06-29 | 2018-12-18 | 武汉斗鱼网络科技有限公司 | 一种直播间推荐方法、存储介质、电子设备及系统 |
CN109033233B (zh) * | 2018-06-29 | 2021-05-28 | 武汉斗鱼网络科技有限公司 | 一种直播间推荐方法、存储介质、电子设备及系统 |
CN109063120A (zh) * | 2018-08-01 | 2018-12-21 | 北京邮电大学 | 一种基于聚类的协同过滤推荐方法和装置 |
CN109063120B (zh) * | 2018-08-01 | 2021-05-28 | 北京邮电大学 | 一种基于聚类的协同过滤推荐方法和装置 |
CN111143699A (zh) * | 2020-01-03 | 2020-05-12 | 上海理工大学 | 基于相似性与置信度聚类的推荐系统 |
CN111143699B (zh) * | 2020-01-03 | 2023-07-28 | 上海理工大学 | 基于相似性与置信度聚类的推荐系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106095974B (zh) | 2019-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104935963B (zh) | 一种基于时序数据挖掘的视频推荐方法 | |
Pirasteh et al. | Exploiting matrix factorization to asymmetric user similarities in recommendation systems | |
US10460247B2 (en) | Attribute weighting for media content-based recommendation | |
Philip et al. | Application of content-based approach in research paper recommendation system for a digital library | |
Jain et al. | A survey of similarity measures for collaborative filtering-based recommender system | |
CN106095974A (zh) | 基于网络结构相似性的推荐系统评分预测与推荐算法 | |
CN104281956B (zh) | 基于时间信息的适应用户兴趣变化的动态推荐方法 | |
Subbian et al. | Recommendations for streaming data | |
CN104111946B (zh) | 基于用户兴趣的聚类方法和装置 | |
CN110879864B (zh) | 一种基于图神经网络和注意力机制的上下文推荐方法 | |
CN105138653B (zh) | 一种基于典型度和难度的题目推荐方法及其推荐装置 | |
KR20150023432A (ko) | 사용자 데모그래픽을 추정하는 방법 및 장치 | |
CN103559622A (zh) | 基于特征的协同过滤推荐方法 | |
CN103744966A (zh) | 一种物品推荐方法、装置 | |
CN109460519B (zh) | 浏览对象推荐方法及装置、存储介质、服务器 | |
US10970296B2 (en) | System and method for data mining and similarity estimation | |
Zheng et al. | Integrating context similarity with sparse linear recommendation model | |
CN107145541B (zh) | 基于超图结构的社交网络推荐模型构建方法 | |
CN104008193B (zh) | 一种基于典型用户群组发现技术的信息推荐方法 | |
CN104751353A (zh) | 基于聚类和Slope One预测的协同过滤方法 | |
Rastogi | Machine learning@ amazon | |
CN106096029B (zh) | 一种基于用户双向关系的推荐方法 | |
CN106951459A (zh) | 基于熵值法的改进协同过滤推荐算法 | |
Phan et al. | Collaborative recommendation of photo-taking geolocations | |
CN108960954B (zh) | 一种基于用户群行为反馈的内容推荐方法及推荐系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191224 |