CN106919647B - 一种基于聚类的网络结构相似性推荐方法 - Google Patents

一种基于聚类的网络结构相似性推荐方法 Download PDF

Info

Publication number
CN106919647B
CN106919647B CN201710034492.XA CN201710034492A CN106919647B CN 106919647 B CN106919647 B CN 106919647B CN 201710034492 A CN201710034492 A CN 201710034492A CN 106919647 B CN106919647 B CN 106919647B
Authority
CN
China
Prior art keywords
user
cluster
similarity
clustering
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710034492.XA
Other languages
English (en)
Other versions
CN106919647A (zh
Inventor
付明磊
杨鸿博
乐孜纯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Wanxin Communication Engineering Co ltd
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201710034492.XA priority Critical patent/CN106919647B/zh
Publication of CN106919647A publication Critical patent/CN106919647A/zh
Application granted granted Critical
Publication of CN106919647B publication Critical patent/CN106919647B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于聚类的网络结构相似性推荐方法,包括以下步骤:步骤1:在数据库中标记用户形成集合;步骤2:在集合User中选择k个用户作为聚类中心,形成集合UC={uc1,uc2,…uck},uck代表一个聚类中心用户;步骤3:初始化k个聚类集合C={c1,c2,c3…ck},所述ck代表包含有用户聚类中心uck和与uck相似度高的其他用户的集合;步骤4:计算用户un与聚类中心uck的相似度,将用户un归类为某一聚类集合ck中;步骤5:计算每个聚类ck中每种产品被购买的次数,将数量大于阀值b*n的产品标记出来作为特征商品;步骤6:计算需要推荐的用户Ui与每个聚类中心的相似性,将Ui归为某一聚类ck中;步骤7:计算Ui与ck特征向量的值,得出推荐列表。本发明提出了一种精度较高、计算时间较短的基于聚类的网络结构相似性推荐方法。

Description

一种基于聚类的网络结构相似性推荐方法
技术领域
本发明涉及一种信息处理技术的算法,特别涉及一种基于聚类网络结构相似性推荐方法。
背景技术
现代社会中物质资源极大丰富,人民生活水平极大提高,市面上有着各种各样的物质产品和文化产品。每个人的喜好各不相同,每个人都想要找到自己喜爱的产品,个性化的服务正越来越成为人们关注的焦点,越来越多的研究者也加入到了研究个性化推荐算法的领域中来。个性化服务主要是是向用户推荐其可能感兴趣、或者将会购买的产品的信息,使得用户能够快速的找到其兴趣点。
研究网络数据的推荐算法,已经成为国内数据挖掘热点,也产生了很多推荐算法。陈克寒等在论文《基于用户聚类的异构社交网络推荐算法》中提出了一种处理冷启动和数据稀疏性的推荐算法GCCR。在《多维加权社会网络中的个性化推荐算法》的论文中张华青等使用加权网络不但建立了用户和商品的关系网还建立了用户和用户的关系网。在论文《基于项目聚类的协同过滤推荐算法》邓爱林等提出了一种根据用户评分项判断产品相似性的聚类推荐算法。现有聚类推荐方式存在的技术缺陷:精度低、计算时间长。
发明内容
为了克服传统推荐方法的精度较低、计算时间较长的不足,本发明提出了一种精度较高、计算时间较短的基于聚类的网络结构相似性推荐方法。
本发明解决其技术问题所采用的技术方案是:
一种基于聚类的网络结构相似性推荐方法,所述推荐方法包括以下步骤:
步骤1:在数据库中标记用户形成集合User={u1,u2,u3…un};
步骤2:在集合User中选择k个用户作为聚类中心,形成集合UC={uc1,uc2,…uck},所述uck代表一个聚类中心用户;
步骤3:初始化k个聚类集合C={c1,c2,c3…ck},所述ck代表包含有用户聚类中心uck和与uck相似度高的其他用户的集合;
步骤4:计算用户un与聚类中心uck的相似度,将用户un归类为某一聚类集合ck中;
步骤5:计算每个聚类ck中每种产品被购买的次数,将数量大于阀值b*n的产品标记出来作为特征商品,b为0~1之间的预设系数;
步骤6:计算需要推荐的用户Ui与每个聚类中心的相似性,将Ui归为某一聚类ck中;
步骤7:计算Ui与ck特征向量的值,得出推荐列表。
进一步,所述步骤1中,用户集合User={u1,u2,u3…un}中每一个un包含用户所购买过的产品信息,un代表用户购买产品的行向量。
再进一步,所述步骤2中,使用公式(1)计算用户的购买指数,选择购买指数较高的前几个用户作为聚类中心,步骤如下:
步骤2.1使用公式(1)计算用户的购买指数,计算后的数值直接保存在c向量中,公式(1)中
Figure BDA0001211223100000031
是元素全为1的一维列向量,c是一维行向量;
A×α1=c (1)
步骤2.2使用循环程序计算,当h<k-1,d<k-1-h时,比较cd和cd+1的大小,如果cd<cd+1,将cd和cd+1中的值互换,将d+1赋值给ranki,将d赋值给ranki+1,所述rank是包含了用户标号d顺序的列向量,ranki代表向量rank中的第i个元素;
步骤2.3:取rank中前k个用户的标号赋值给聚类中心,形成集合UC={uc1,uc2,uc3…uck}。
再进一步,所述步骤4中,用户un聚类的步骤如下:
步骤4.1:当f<k,t<n时,利用循环程序通过公式(2)计算用户un与聚类中心uck的相似度。
Simtf=ut×ucf′ (2)
步骤4.2:将un放入Simtf最大的对应的聚类集合ck中。
再进一步,所述步骤5中,利用循环程序计算每个类中每种产品被购买的次数,再将产品按购买次数的多少进行排序得到每个聚类的购买特性向量,步骤如下:
步骤5.1:利用公式(3)提取聚类集合ck中用户共同购买特征,其中α′1={1,1,…,1}是一维行向量,traitk是包含用户购买特征的一维行向量;
α′1×ck=traitk (3)
步骤5.2:利用公式(4)对traitk中的数据进行特征处理,对于traitkj-0.6k>0的数,将trij中的对应位置赋值为1,traitkj-0.6k<0时赋值为0,traitkj代表第k个聚类中关于第j个产品的特征值,tri是将traitkj中对应的产品标记出来的列向量,trij代表tri中的第j个元素;
Figure BDA0001211223100000041
再进一步,所述步骤6中,计算Ui与每个聚类中心的相似性,步骤如下:
6.1:使用公式(5)计算需要推荐的用户Ui和聚类中心uck之间的相似性,Simik代表用户Ui和聚类中心uck的相似性;
Simik=Ui×uck (5)
步骤6.2:将Ui归为相似性最大的聚类uck中。
更进一步,所述步骤7中,利用公式(6)对Ui和uck的特征向量进行与非运算得到推荐列表:
Figure BDA0001211223100000042
本发明的技术构思为:首先对数据库中用户进行聚类运算,将具有高相似性的用户归为同一类,进一步在每一用户类型中找到此类中用户购买最多的产品列表,再进一步,当需要为用户Ui推荐时,只要找到与其最相似的聚类,然后将聚类中用户还没有购买的排列在列表前端的产品推荐给用户即可。
本发明的有益效果主要表现在:聚类计算的步骤可以放在服务器中提前进行计算,计算的结果可以存储起来。当用户需要推荐时只需先对用户和类进行相似性的计算,然后调用已经计算好的数据即可。这样可以简化计算的过程,大大减少计算的时间。
附图说明
图1是一种基于聚类的网络结构相似性推荐方法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1,一种基于聚类的网络结构相似性推荐方法,包括以下步骤:
步骤1:在数据库中标记用户形成集合User={u1,u2,u3…un}。
步骤2:在集合User中选择k个用户作为聚类中心,形成集合UC={uc1,uc2,…uck}。所述uck代表一个聚类中心用户。
步骤3:初始化k个聚类集合C={c1,c2,c3…ck}。所述ck代表包含有用户聚类中心uck和与uck相似度高的其他用户的集合。
步骤4:计算用户un与聚类中心uck的相似度,将用户un归类为某一聚类集合ck中。
步骤5:计算每个聚类ck中每种产品被购买的次数,将数量大于阀值b*n的产品标记出来作为特征商品,b为0~1之间的预设系数,例如b取0.6。
步骤6:计算需要推荐的用户Ui与每个聚类中心的相似性,将Ui归为某一聚类ck中。
步骤7:计算Ui与ck特征向量的值,得出推荐列表。
进一步,所述步骤1中,用户集合User={u1,u2,u3…un}中每一个un包含用户所购买过的产品信息。un代表用户购买产品的行向量。如下表所示是代表用户和产品关系的邻接矩阵A。其中un代表用户,Pj代表产品,矩阵中的元素anj代表用户是否购买过此产品,anj=1代表用户n曾经购买过商品j,anj=0表示没有购买过。
Figure BDA0001211223100000061
再进一步,所述步骤2中使用公式(1)计算用户的购买指数,选择购买指数较高的前几个用户作为聚类中心。具体步骤如下:
步骤2.1使用公式(1)计算用户的购买指数,计算后的数值直接保存在c向量中。公式(1)中
Figure BDA0001211223100000062
是元素全为1的一维列向量。c是一维行向量。
A×α1=c (1)
步骤2.2使用循环程序计算,当h<k-1,d<k-1-h时,比较cd和cd+1的大小,如果cd<cd+1,将cd和cd+1中的值互换,将d+1赋值给ranki,将d赋值给ranki+1。所述rank是包含了用户标号d顺序的列向量。ranki代表向量rank中的第i个元素。
步骤2.3:取rank中前k个用户的标号赋值给聚类中心,形成集合UC={uc1,uc2,uc3…uck}
再进一步。所述步骤4中用户un聚类的具体步骤如下:
步骤4.1:当f<k,t<n时,利用循环程序通过公式(2)计算用户un与聚类中心uck的相似度。
Simtf=ut×ucf′ (2)
步骤4.2:将un放入Simtf最大的对应的聚类集合ck中。
再进一步,所述步骤5中,利用循环程序计算每个类中每种产品被购买的次数,再将产品按购买次数的多少进行排序得到每个聚类的购买特性向量。具体步骤如下:
步骤5.1:利用公式(3)提取聚类集合ck中用户共同购买特征。其中α′1={1,1,…,1}是一维行向量。traitk是包含用户购买特征的一维行向量。
α′1×ck=traitk (3)
步骤5.2:利用公式(4)对traitk中的数据进行特征处理,系数b取0.6为例,对于traitkj-0.6k>0的数,将trij中的对应位置赋值为1,traitkj-0.6k<0时赋值为0。traitkj代表第k个聚类中关于第j个产品的特征值。tri是将traitkj中对应的产品标记出来的列向量。trij代表tri中的第j个元素。
Figure BDA0001211223100000071
再进一步,所述步骤6中,计算Ui与每个聚类中心的相似性的具体步骤如下:
步骤6.1:使用公式(5)计算需要推荐的用户Ui和聚类中心uck之间的相似性。Simik代表用户Ui和聚类中心uck的相似性。
Simik=Ui×uck (5)
步骤6.2:将Ui归为相似性最大的聚类uck中。
更近一步,在步骤7中利用公式(6)对Ui和uck的特征向量进行与非运算得到推荐列表。
Figure BDA0001211223100000081
实例:取如下邻接矩阵作为包含用户和产品关系的矩阵A
Figure BDA0001211223100000082
采用公式(1)A×α1=c对矩阵A进行计算得到购买指数
c={6,4,6,7,4,5,4,6,5,5}
对c向量进行排序后得到包含了用户标号d顺序的列向量
rank′={4,1,3,8,6,9,10,2,5,7}
将排序最前的u4和u1赋值给聚类中心集合UC={u4,u1}。
通过(2)Simtf=ut×ucf′将用户un都聚类到集合C={c1,c2}中,其中c1={u1,u3,u5,u7},c2={u2,u4,u6,u8,u9,u10}。
通过公式(3)α′1×ck=traitk以聚类集合c2为例计算出trait2={5,2,4,4,3,2,4,1,2,5},在通过(4)
Figure BDA0001211223100000091
处理后得tri={1,0,1,1,0,0,1,0,0,1}
最后对于需要推荐的用户Ui={0,0,1,0,0,0,1,1,1,1}利用公式(6)
Figure BDA0001211223100000092
得到推荐列表list={1,1,0,1,1,1,0,1,1,0}。

Claims (3)

1.一种基于聚类的网络结构相似性推荐方法,其特征在于:所述推荐方法包括以下步骤:
步骤1:在数据库中标记用户形成集合User={u1,u2,u3…un};用户集合User={u1,u2,u3…un}中每一个un包含用户所购买过的产品信息,un代表用户购买产品的行向量,邻接矩阵A代表用户和产品关系,其中un代表用户,Pj代表产品,矩阵中的元素anj代表用户是否购买过此产品,anj=1代表用户n曾经购买过商品j,anj=0表示没有购买过;
步骤2:在集合User中选择k个用户作为聚类中心,形成集合UC={uc1,uc2,…uck},所述uck代表一个聚类中心用户;
步骤3:初始化k个聚类集合C={c1,c2,c3…ck},所述ck代表包含有用户聚类中心uck和与uck相似度高的其他用户的集合;
步骤4:计算用户un与聚类中心uck的相似度,将用户un归类为某一聚类集合ck中;
步骤5:计算每个聚类ck中每种产品被购买的次数,将数量大于阀值b*n的产品标记出来作为特征商品,b为0~1之间的预设系数;
所述步骤5中,利用循环程序计算每个类中每种产品被购买的次数,再将产品按购买次数的多少进行排序得到每个聚类的购买特性向量,步骤如下:
步骤5.1:利用公式(3)提取聚类集合ck中用户共同购买特征,其中α′1={1,1,...,1}是一维行向量,traitk是包含用户购买特征的一维行向量;
α′1×ck=traitk (3)
步骤5.2:利用公式(4)对traitk中的数据进行特征处理,对于traitkj-0.6k>0的数,将trij中的对应位置赋值为1,traitkj-0.6k<0时赋值为0,traitkj代表第k个聚类中关于第j个产品的特征值,tri是将traitkj中对应的产品标记出来的列向量,trij代表tri中的第j个元素;
Figure FDA0002571013940000021
步骤6:计算需要推荐的用户Ui与每个聚类中心的相似性,将Ui归为某一聚类ck中;
步骤7:计算Ui与ck特征向量的值,得出推荐列表;
利用公式(6)对Ui和uck的特征向量进行与非运算得到推荐列表:
Figure FDA0002571013940000022
2.如权利要求1所述的一种基于聚类的网络结构相似性推荐方法,其特征在于:所述步骤4中,用户un聚类的步骤如下:
步骤4.1:当f<k,t<n时,利用循环程序通过公式(2)
计算用户un与聚类中心uck的相似度;
Simtf=ut×ucf′ (2)
步骤4.2:将un放入Simtf最大的对应的聚类集合ck中。
3.如权利要求1所述的一种基于聚类的网络结构相似性推荐方法,其特征在于:所述步骤6中,计算Ui与每个聚类中心的相似性,步骤如下:
步骤6.1:使用公式(5)计算需要推荐的用户Ui和聚类中心uck之间的相似性,Simik代表用户Ui和聚类中心uck的相似性;
Simik=Ui×uck (5)
步骤6.2:将Ui归为相似性最大的聚类uck中。
CN201710034492.XA 2017-01-17 2017-01-17 一种基于聚类的网络结构相似性推荐方法 Active CN106919647B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710034492.XA CN106919647B (zh) 2017-01-17 2017-01-17 一种基于聚类的网络结构相似性推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710034492.XA CN106919647B (zh) 2017-01-17 2017-01-17 一种基于聚类的网络结构相似性推荐方法

Publications (2)

Publication Number Publication Date
CN106919647A CN106919647A (zh) 2017-07-04
CN106919647B true CN106919647B (zh) 2020-10-30

Family

ID=59453464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710034492.XA Active CN106919647B (zh) 2017-01-17 2017-01-17 一种基于聚类的网络结构相似性推荐方法

Country Status (1)

Country Link
CN (1) CN106919647B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108804605B (zh) * 2018-05-29 2021-10-22 重庆大学 一种基于层次结构的推荐方法
CN110209922B (zh) * 2018-06-12 2023-11-10 中国科学院自动化研究所 对象推荐方法、装置、存储介质及计算机设备
CN112148995A (zh) * 2020-11-02 2020-12-29 深圳壹账通智能科技有限公司 产品推荐方法、装置、电子设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886003A (zh) * 2013-09-22 2014-06-25 天津思博科科技发展有限公司 一种协同过滤处理器
CN104239338A (zh) * 2013-06-19 2014-12-24 阿里巴巴集团控股有限公司 信息推荐方法及装置
CN104063801B (zh) * 2014-06-23 2016-05-25 有米科技股份有限公司 一种基于聚类的移动广告推荐方法
CN106156333A (zh) * 2016-07-06 2016-11-23 合肥工业大学 一种融合社会化信息的改进单类协同过滤方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239338A (zh) * 2013-06-19 2014-12-24 阿里巴巴集团控股有限公司 信息推荐方法及装置
CN103886003A (zh) * 2013-09-22 2014-06-25 天津思博科科技发展有限公司 一种协同过滤处理器
CN104063801B (zh) * 2014-06-23 2016-05-25 有米科技股份有限公司 一种基于聚类的移动广告推荐方法
CN106156333A (zh) * 2016-07-06 2016-11-23 合肥工业大学 一种融合社会化信息的改进单类协同过滤方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于 K-means 算法的 Web 访问用户关联规则挖掘算法;肖强;《图书情报工作》;20110831;第55卷(第16期);136-139 *
基于客户聚类的商品推荐方法的研究;王宏超等;《计算机技术与发展》;20080731;第18卷(第7期);212-214 *

Also Published As

Publication number Publication date
CN106919647A (zh) 2017-07-04

Similar Documents

Publication Publication Date Title
CN110458627B (zh) 一种面向用户动态偏好的商品序列个性化推荐方法
CN108363804B (zh) 基于用户聚类的局部模型加权融合Top-N电影推荐方法
CN109064285B (zh) 一种获得商品推荐序列及商品推荐方法
CN111062775B (zh) 一种基于注意力机制的推荐系统召回方法
CN102609523B (zh) 基于物品分类和用户分类的协同过滤推荐方法
CN108665323B (zh) 一种用于理财产品推荐系统的集成方法
CN106777051A (zh) 一种基于用户组的多反馈协同过滤推荐方法
WO2018014759A1 (zh) 一种聚类数据表的展现方法、装置和系统
US20100223258A1 (en) Information retrieval system and method using a bayesian algorithm based on probabilistic similarity scores
CN110175895B (zh) 一种物品推荐方法及装置
CN109241366B (zh) 一种基于多任务深度学习的混合推荐系统及其方法
US10970296B2 (en) System and method for data mining and similarity estimation
CN107895303B (zh) 一种基于ocean模型的个性化推荐的方法
CN111651678B (zh) 一种基于知识图谱的个性化推荐方法
CN106919647B (zh) 一种基于聚类的网络结构相似性推荐方法
CN110083766B (zh) 一种基于元路径引导嵌入的查询推荐方法及装置
JP5723835B2 (ja) 興味分析方法、興味分析装置及びそのプログラム
Liang et al. Top-N-rank: A scalable list-wise ranking method for recommender systems
TW201243627A (en) Multi-label text categorization based on fuzzy similarity and k nearest neighbors
CN110020918B (zh) 一种推荐信息生成方法和系统
Xu et al. Exploiting interactions of review text, hidden user communities and item groups, and time for collaborative filtering
Alfarhood et al. Collaborative attentive autoencoder for scientific article recommendation
CN111598645A (zh) 一种融合随机森林与协同过滤二手房推荐方法
Shuxian et al. Design and implementation of movie recommendation system based on naive bayes
CN108182288A (zh) 一种基于人工免疫的推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240411

Address after: Building 2, Science and Technology Entrepreneurship Park, No. 968 Xuefeng West Road, Beiyuan Street, Yiwu City, Jinhua City, Zhejiang Province, 322000, C406

Patentee after: Zhejiang Wanxin Communication Engineering Co.,Ltd.

Country or region after: China

Address before: 310014 Zhejiang University of Technology, 18, Chao Wang Road, Xiacheng District, Hangzhou, Zhejiang

Patentee before: JIANG University OF TECHNOLOGY

Country or region before: China