CN109166016A - 基于聚类的信息推送方法、装置、计算机设备及存储介质 - Google Patents
基于聚类的信息推送方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN109166016A CN109166016A CN201811191629.3A CN201811191629A CN109166016A CN 109166016 A CN109166016 A CN 109166016A CN 201811191629 A CN201811191629 A CN 201811191629A CN 109166016 A CN109166016 A CN 109166016A
- Authority
- CN
- China
- Prior art keywords
- user
- project
- node
- bigraph
- scoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims abstract description 92
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012552 review Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 15
- 238000001914 filtration Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 235000013399 edible fruits Nutrition 0.000 description 4
- 239000013065 commercial product Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于聚类的信息推送方法、装置、计算机设备及存储介质。该方法通过与用户‑评分矩阵对应的用户‑项目二部图获取目标节点的相似用户聚类结果,根据所述用户‑评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户‑项目二部图中每一项目节点之间的最终评分以组成最终评分集合,根据最终评分集合中大于预设的评分阈值的最终评分获取对应的项目节点集合,将项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端。该方法避免了推荐系统固有稀疏矩阵和冷启动问题,而且具有拓展性和高性能,实现了更优化的信息推荐方式。
Description
技术领域
本发明涉及信息推送技术领域,尤其涉及一种基于聚类的信息推送方法、装置、计算机设备及存储介质。
背景技术
目前,在基于互联网的在线商城上进行网络购物已越来越频繁,这些在线商城对用户进行商品推荐时,通常使用的是基于协同过滤的推荐算法(协同过滤算法,原理是用户喜欢那些具有相似兴趣的用户喜欢过的商品,比如你的朋友喜欢电影哈利波特I,那么就会推荐给你,这是最简单的基于用户的协同过滤算法),但是使用协同过滤算法时会遇到稀疏矩阵和冷启动的问题,从而影响到推荐过程。
发明内容
本发明实施例提供了一种基于聚类的信息推送方法、装置、计算机设备及存储介质,旨在解决现有技术中商品信息推荐使用基于协同过滤的推荐算法会遇到稀疏矩阵和冷启动,从而影响到推荐过程的问题。
第一方面,本发明实施例提供了一种基于聚类的信息推送方法,其包括:
获取用户-评分矩阵,创建与所述用户-评分矩阵对应的用户-项目二部图;
获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果;
根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合;
遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合;以及
将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端。
第二方面,本发明实施例提供了一种基于聚类的信息推送装置,其包括:
二部图构建单元,用于获取用户-评分矩阵,创建与所述用户-评分矩阵对应的用户-项目二部图;
相似用户聚类单元,用于获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果;
最终评分集合获取单元,用于根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合;
评分筛选单元,用于遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合;
信息推送单元,用于将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于聚类的信息推送方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于聚类的信息推送方法。
本发明实施例提供了一种基于聚类的信息推送方法、装置、计算机设备及存储介质。该方法通过与用户-评分矩阵对应的用户-项目二部图获取目标节点的相似用户聚类结果,根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合,根据最终评分集合中大于预设的评分阈值的最终评分获取对应的项目节点集合,将项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端。该方法避免了推荐系统固有稀疏矩阵和冷启动问题,而且具有拓展性和高性能,实现了更优化的信息推荐方式。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于聚类的信息推送方法的流程示意图;
图2为本发明具体实施例提供的用户-项目二部图的示意图;
图3为本发明实施例提供的基于聚类的信息推送方法的子流程示意图;
图4为本发明实施例提供的基于聚类的信息推送方法的另一子流程示意图;
图5为本发明实施例提供的基于聚类的信息推送方法的另一子流程示意图;
图6为本发明实施例提供的基于聚类的信息推送装置的示意性框图;
图7为本发明实施例提供的基于聚类的信息推送装置的子单元示意性框图;
图8为本发明实施例提供的基于聚类的信息推送装置的另一子单元示意性框图;
图9为本发明实施例提供的基于聚类的信息推送装置的另一子单元示意性框图;
图10为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的基于聚类的信息推送方法的流程示意图,该基于聚类的信息推送方法应用于管理服务器中,该方法通过安装于管理服务器中的应用软件进行执行,管理服务器即是用于进行基于聚类的信息推送的企业终端。
如图1所示,该方法包括步骤S110~S150。
S110、获取用户-评分矩阵,创建与所述用户-评分矩阵对应的用户-项目二部图。
在本实施例中,用户-评分矩阵表示用户对项目(项目可以理解为具体的商品)的评分,用户-评分矩阵的横轴为项目,纵轴为用户,当中的值是用户i对项目j的评分。例如用户-评分矩阵S为3×2的矩阵,如:
当管理服务器从数据库中获取了用户-评分矩阵后,即可根据用户-评分矩阵对应创建用户-项目二部图。
其中,二部图又称为二分图,二分图是图论中的一种特殊模型。设G=(V,E)是一个无向图,如果顶点V可分割为两个互不相交的子集(A,B),并且图中的每条边(i,j)所关联的两个顶点i和j分别属于这两个不同的顶点集(i inA,j in B),则称图G为一个二分图。
根据用户-评分矩阵创建用户-项目二部图时可以用户维度建立子集A,以项目维度建立子集B。例如,根据上述用户-评分矩阵S所对应创建的用户-项目二部图如图2所示。
用户-评分矩阵S中第一行的行向量表示用户1分别针对项目1和项目2的评分,第二行的行向量表示用户2分别针对项目1和项目2的评分,第三行的行向量表示用户3分别针对项目1和项目2的评分,在用户-项目二部图中用户1以用户节点1来表示,用户2以用户节点2来表示,用户3以用户节点3来表示,项目1以项目节点1来表示,项目2以项目节点2来表示。
完成了用户-项目二部图中用户节点和项目节点的创建后,通过用户-评分矩阵中的用户针对项目的评分为计算参数来得到用户与对应项目之间连线的边长。若在用户-评分矩阵中用户i对项目j对评分不为0,则表示用户i对应的用户节点与项目j对应的项目节点有边相连接。如图2所示的用户-项目二部图中左侧为用户维度的顶点集,右侧为项目维度的顶点集,图2中每条边的两个顶点分别位于两个顶点集中,每个顶点集内部的顶点之间没有边相连接。
通过将用户-评分矩阵对应转化为用户-项目二部图,之后通过用户-项目二部图作为用户聚类和推荐项目获取的数据基础,避免了直接通过用户-评分矩阵及协同过滤算法而产生的稀疏矩阵和冷启动的问题。
在一实施例中,如图3所示,步骤S110包括:
S111、根据用户-评分矩阵进行二部图的节点初始化,得到初始用户-项目二部图;
S112、获取用户-评分矩阵中的非空值,以对应构建初始用户-项目二部图中用户节点与项目节点之间的边,得到用户-项目二部图。
在本实施例中,显示根据用户-评分矩阵进行二部图的节点初始化,得到初始用户-项目二部图,也即以用户维度建立一个顶点子集,以项目维度建立另一个顶点子集。完成上述两个维度的顶点子集的建立后,若在用户-评分矩阵中用户i对项目j对评分不为0,则表示用户i对应的用户节点与项目j对应的项目节点有边相连接,且用户i对应的用户节点与项目j对应的项目节点之间连接边的长度为用户i对项目j的评分的倒数。例如,如图2中用户1对项目1的评分由用户-评分矩阵S可知为1,则用户1对应的用户节点1与项目1对应的项目节点1之间连接边的长度为1/1=1;用户1对项目2的评分由用户-评分矩阵S可知为5,则用户1对应的用户节点1与项目2对应的项目节点2之间连接边的长度为1/5。通过上述方式,能快速的将用户-评分矩阵转化成包括2个顶点集且已知顶点集之间连接边边长的用户-项目二部图。
S120、获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果。
其中,当完成了用户-项目二部图的构建后,可在用户维度的顶点集中选取任意一个用户作为目标用户,此时所选定的目标用户在用户维度的顶点集中记为目标节点。为了获取目标节点的相似用户节点,可以通过选取与目标节点之间的距离小于预设的路径距离阈值的用户节点来组成相似用户聚类结果。而根据二部图的定义可知,同一顶点集内的各顶点之间是不存在连接边的,故在计算目标节点与用户节点之间的距离时,需采用分段距离求和的方式来计算,具体如先计算某一用户节点i到某一项目节点j的第一分段距离,再计算该项目节点j到目标节点的第二分段距离,最后将上述第一分段距离与第二分段距离相加得到某一用户节点i到目标节点的路径距离。以二部图的方式进行用户聚类,计算过程能更快速。
在一实施例中,如图4所示,步骤S120包括:
S121、获取在用户-项目二部图中所选定的目标用户对应的目标节点,遍历所述用户-项目二部图以获取其他用户节点中每一用户节点经由项目节点与所述目标节点之间的最短路径距离,以生成最短路径距离集合;其中,其他用户节点为在用户-项目二部图对应的用户节点集合中目标节点的补集;
S122、获取所述最短路径距离集合中小于预设的路径距离阈值的最短路径距离,并获取所述最短路径距离对应的用户节点,以组成相似用户聚类结果。
在本实施例中,在如图2所述的用户-项目二部图中,若选定用户1为目标节点,则用户2与用户1之间的最短路径为用户节点2-项目节点2-用户节点1,该最短路径的距离为(1/3+1/5)=8/15;用户3与用户1之间的最短路径为用户节点3-项目节点2-用户节点1,该最短路径的距离为(1/3+1/5)=8/15。
若设置的路径距离阈值为2/3,用户2与用户1之间的最短路径的距离为8/15,用户3与用户1之间的最短路径的距离为8/15,上述两个最短路径的距离均小于预先设置的路径距离阈值,故以用户2和用户3对应的用户节点组成相似用户聚类结果。
在一实施例中,所述步骤S121中遍历所述用户-项目二部图以获取其他用户节点中每一用户节点与所述目标节点之间的最短路径距离,具体包括:
遍历所述用户-项目二部图,以通过迪杰斯特拉算法获取获取其他用户节点中每一用户节点经由项目节点与所述目标节点之间的最短路径距离。
迪杰斯特拉算法即Dijkstra算法,其采用的是一种贪心的策略,声明一个数组dis来保存源点到各个顶点的最短距离和一个保存已经找到了最短路径的顶点的集合。例如用户2与用户1之间的最短路径为用户节点2-项目节点2-用户节点1,该最短路径对应的最短路径距离和该最短路径对应的3个顶点均保存在一个数组中。通过迪杰斯特拉算法能准确获取用户-项目二部图中同一顶点集中目标节点与其它顶点之间的最短路径及最短路径距离。
S130、根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合。
在本实施例中,若根据用户-项目二部图获知了相似用户聚类结果,此时可再次根据所述用户-评分矩阵、相似用户聚类结果及所述最终评分算法来计算目标节点与每一项目节点之间的最终评分,以组成最终评分集合。获取了目标节点与每一项目节点之间的最终评分,即可获知目标用户对每一项目的感兴趣程度,可选择其中最终评分较高的项目推送至目标用户。
在一实施例中,如图5所示,步骤S130包括:
S131、根据用户-评分矩阵及综合评分算法,获取相似用户聚类结果所对应用户节点与每一项目节点与之间的综合评分;其中,综合评分算法为Score_Neark表示相似用户聚类结果所对应用户节点与项目节点k之间的综合评分,dij表示目标节点i与相似用户聚类结果所对应用户节点j之间的最短路径距离,Sjk表示相似用户聚类结果所对应用户节点j对项目节点k的评分;
S132、获取所述目标节点与用户-项目二部图中每一项目节点之间的最短路径距离;
S133、根据目标节点与用户-项目二部图中每一项目节点之间最终评分=调节参数*相似用户聚类结果所对应用户节点与每一项目节点与之间的综合评分+(1-调节参数)*目标节点与用户-项目二部图中每一项目节点之间的最短路径距离,计算得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分,以组成最终评分集合。
在本实施例中,通过来计算所述目标节点与用户-项目二部图中每一项目节点之间的最终评分;其中,Score_Neark表示相似用户聚类结果所对应用户节点与项目节点k之间的综合评分,dij表示目标节点i与相似用户聚类结果所对应用户节点j之间的最短路径距离,Sjk表示相似用户聚类结果所对应用户节点j对项目节点k的评分。
例如,参考用户-评分矩阵S和如图2所示的用户-项目的二部图,若用户节点1为目标节点,目标节点与用户节点2之间的最短路径距离d12=8/15,目标节点与用户节点3之间的最短路径距离d13=8/15,用户节点2与项目节点1之间评分S21为0,用户节点2与项目节点2之间评分S22为4,用户节点3与项目节点1之间评分S31为3,用户节点3与项目节点2之间评分S32为3,则相似用户聚类结果中对项目节点1的综合评分如下:
1)相似用户聚类结果所对应用户节点与项目节点1之间的综合评分Score_Near1为:
2)相似用户聚类结果所对应用户节点与项目节点2之间的综合评分Score_Near2为:
所述目标节点与用户-项目二部图中项目节点1之间的最短路径距离Score_direct11为1,目标节点与用户-项目二部图中项目节点2之间的最短路径距离Score_direct12为1/5;若预设的调节参数为0.6,则
目标节点与项目节点1之间最终评分记为Total1,且
Total1=λ×Score_Near1+(1-λ)×Score_direct11=1.3;
目标节点与项目节点2之间最终评分记为Total2,且
Total2=λ×Score_Near2+(1-λ)×Score_direct12=2.18;
由上述两个最终评分组成得到最终评分集合。
S140、遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合。
在一实施例中,所述步骤S140中具体包括:
将所述最终评分集合中的最终评分按降序排序以得到降序评分集合,遍历所述降序评分集合中最终评分评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合。
在本实施例中,目标节点与项目节点1之间最终评分为Total1=1.3,目标节点与项目节点2之间最终评分为Total2=2.18。若预设的排名阈值为2,则表示需在最终评分集合中获取评分排名位于第2名之前的最终评分(也即获取第1名的最终评分)。由于上述两个最终评分中Total2的排名位于第一名,故将项目节点2作为筛选出来的结果放入项目节点集合中。通过筛选降序评分集合中位于预设排名阈值之前的最终评分对应的项目节点以组成项目节点集合,能准确的筛选项目评分高的项目作为推荐项目。
S150、将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端。
在一实施例中,所述步骤S150中具体包括:
将所述项目节点集合中的各项目节点根据对应的最终评分进行降序排序,将根据最终评分进行降序排序的项目节点一一对应的项目信息推送至所述目标用户的接收终端。
为了更客观的根据最终评分的高低顺序来推荐项目节点,此时可以先将所述最终评分集合中的最终评分按降序排序以得到降序评分集合。若降序评分集合中排名位于所述排名阈值之前的最终评分对应的项目节点有多个,则将这多个项目节点对应的项目信息按照最终评分的排名顺序推送至目标用户。
该方法实现了通过二部图的方式对用户进行聚类,得到目标用户的相似用户,通过相似用户对商品的评分作为对目标用户商品推荐的依据,避免了推荐系统固有稀疏矩阵和冷启动问题,而且具有拓展性和高性能,实现了更优化的信息推荐方式。
本发明实施例还提供一种基于聚类的信息推送装置,该基于聚类的信息推送装置用于执行前述基于聚类的信息推送方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的基于聚类的信息推送装置的示意性框图。该基于聚类的信息推送装置100可以配置于管理服务器中。
如图6所示,基于聚类的信息推送装置100包括二部图构建单元110、相似用户聚类单元120、最终评分集合获取单元130、评分筛选单元140、和信息推送单元150。
二部图构建单元110,用于获取用户-评分矩阵,创建与所述用户-评分矩阵对应的用户-项目二部图。
在本实施例中,用户-评分矩阵表示用户对项目(项目可以理解为具体的商品)的评分,用户-评分矩阵的横轴为项目,纵轴为用户,当中的值是用户i对项目j的评分。例如用户-评分矩阵S为3×2的矩阵,如:
当管理服务器从数据库中获取了用户-评分矩阵后,即可根据用户-评分矩阵对应创建用户-项目二部图。
其中,二部图又称为二分图,二分图是图论中的一种特殊模型。设G=(V,E)是一个无向图,如果顶点V可分割为两个互不相交的子集(A,B),并且图中的每条边(i,j)所关联的两个顶点i和j分别属于这两个不同的顶点集(i inA,j in B),则称图G为一个二分图。
根据用户-评分矩阵创建用户-项目二部图时可以用户维度建立子集A,以项目维度建立子集B。例如,根据上述用户-评分矩阵S所对应创建的用户-项目二部图如图2所示。
用户-评分矩阵S中第一行的行向量表示用户1分别针对项目1和项目2的评分,第二行的行向量表示用户2分别针对项目1和项目2的评分,第三行的行向量表示用户3分别针对项目1和项目2的评分,在用户-项目二部图中用户1以用户节点1来表示,用户2以用户节点2来表示,用户3以用户节点3来表示,项目1以项目节点1来表示,项目2以项目节点2来表示。
完成了用户-项目二部图中用户节点和项目节点的创建后,通过用户-评分矩阵中的用户针对项目的评分为计算参数来得到用户与对应项目之间连线的边长。若在用户-评分矩阵中用户i对项目j对评分不为0,则表示用户i对应的用户节点与项目j对应的项目节点有边相连接。如图2所示的用户-项目二部图中左侧为用户维度的顶点集,右侧为项目维度的顶点集,图2中每条边的两个顶点分别位于两个顶点集中,每个顶点集内部的顶点之间没有边相连接。
通过将用户-评分矩阵对应转化为用户-项目二部图,之后通过用户-项目二部图作为用户聚类和推荐项目获取的数据基础,避免了直接通过用户-评分矩阵及协同过滤算法而产生的稀疏矩阵和冷启动的问题。
在一实施例中,如图7所示,所述二部图构建单元110,包括:
二部图初始化单元111,用于根据用户-评分矩阵进行二部图的节点初始化,得到初始用户-项目二部图;
节点连接边构建单元112,用于获取用户-评分矩阵中的非空值,以对应构建初始用户-项目二部图中用户节点与项目节点之间的边,得到用户-项目二部图。
在本实施例中,显示根据用户-评分矩阵进行二部图的节点初始化,得到初始用户-项目二部图,也即以用户维度建立一个顶点子集,以项目维度建立另一个顶点子集。完成上述两个维度的顶点子集的建立后,若在用户-评分矩阵中用户i对项目j对评分不为0,则表示用户i对应的用户节点与项目j对应的项目节点有边相连接,且用户i对应的用户节点与项目j对应的项目节点之间连接边的长度为用户i对项目j的评分的倒数。例如,如图2中用户1对项目1的评分由用户-评分矩阵S可知为1,则用户1对应的用户节点1与项目1对应的项目节点1之间连接边的长度为1/1=1;用户1对项目2的评分由用户-评分矩阵S可知为5,则用户1对应的用户节点1与项目2对应的项目节点2之间连接边的长度为1/5。通过上述方式,能快速的将用户-评分矩阵转化成包括2个顶点集且已知顶点集之间连接边边长的用户-项目二部图。
相似用户聚类单元120,用于获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果。
其中,当完成了用户-项目二部图的构建后,可在用户维度的顶点集中选取任意一个用户作为目标用户,此时所选定的目标用户在用户维度的顶点集中记为目标节点。为了获取目标节点的相似用户节点,可以通过选取与目标节点之间的距离小于预设的路径距离阈值的用户节点来组成相似用户聚类结果。而根据二部图的定义可知,同一顶点集内的各顶点之间是不存在连接边的,故在计算目标节点与用户节点之间的距离时,需采用分段距离求和的方式来计算,具体如先计算某一用户节点i到某一项目节点j的第一分段距离,再计算该项目节点j到目标节点的第二分段距离,最后将上述第一分段距离与第二分段距离相加得到某一用户节点i到目标节点的路径距离。以二部图的方式进行用户聚类,计算过程能更快速。
在一实施例中,如图8所示,所述相似用户聚类单元120,包括:
路径距离获取单元121,用于获取在用户-项目二部图中所选定的目标用户对应的目标节点,遍历所述用户-项目二部图以获取其他用户节点中每一用户节点经由项目节点与所述目标节点之间的最短路径距离,以生成最短路径距离集合;其中,其他用户节点为在用户-项目二部图对应的用户节点集合中目标节点的补集;
路径距离筛选单元122,用于获取所述最短路径距离集合中小于预设的路径距离阈值的最短路径距离,并获取所述最短路径距离对应的用户节点,以组成相似用户聚类结果。
在本实施例中,在如图2所述的用户-项目二部图中,若选定用户1为目标节点,则用户2与用户1之间的最短路径为用户节点2-项目节点2-用户节点1,该最短路径的距离为(1/3+1/5)=8/15;用户3与用户1之间的最短路径为用户节点3-项目节点2-用户节点1,该最短路径的距离为(1/3+1/5)=8/15。
若设置的路径距离阈值为2/3,用户2与用户1之间的最短路径的距离为8/15,用户3与用户1之间的最短路径的距离为8/15,上述两个最短路径的距离均小于预先设置的路径距离阈值,故以用户2和用户3对应的用户节点组成相似用户聚类结果。
在一实施例中,所述路径距离获取单元121中遍历所述用户-项目二部图以获取其他用户节点中每一用户节点与所述目标节点之间的最短路径距离,具体包括:
遍历所述用户-项目二部图,以通过迪杰斯特拉算法获取获取其他用户节点中每一用户节点经由项目节点与所述目标节点之间的最短路径距离。
迪杰斯特拉算法即Dijkstra算法,其采用的是一种贪心的策略,声明一个数组dis来保存源点到各个顶点的最短距离和一个保存已经找到了最短路径的顶点的集合。例如用户2与用户1之间的最短路径为用户节点2-项目节点2-用户节点1,该最短路径对应的最短路径距离和该最短路径对应的3个顶点均保存在一个数组中。通过迪杰斯特拉算法能准确获取用户-项目二部图中同一顶点集中目标节点与其它顶点之间的最短路径及最短路径距离。
最终评分集合获取单元130,用于根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合。
在本实施例中,若根据用户-项目二部图获知了相似用户聚类结果,此时可再次根据所述用户-评分矩阵、相似用户聚类结果及所述最终评分算法来计算目标节点与每一项目节点之间的最终评分,以组成最终评分集合。获取了目标节点与每一项目节点之间的最终评分,即可获知目标用户对每一项目的感兴趣程度,可选择其中最终评分较高的项目推送至目标用户。
在一实施例中,如图9所示,最终评分集合获取单元130包括:
综合评分计算单元131,用于根据用户-评分矩阵及综合评分算法,获取相似用户聚类结果所对应用户节点与每一项目节点与之间的综合评分;其中,综合评分算法为Score_Neark表示相似用户聚类结果所对应用户节点与项目节点k之间的综合评分,dij表示目标节点i与相似用户聚类结果所对应用户节点j之间的最短路径距离,Sjk表示相似用户聚类结果所对应用户节点j对项目节点k的评分;
用户项目节点距离计算单元132,用于获取所述目标节点与用户-项目二部图中每一项目节点之间的最短路径距离;
最终评分计算单元133,用于根据目标节点与用户-项目二部图中每一项目节点之间最终评分=调节参数*相似用户聚类结果所对应用户节点与每一项目节点与之间的综合评分+(1-调节参数)*目标节点与用户-项目二部图中每一项目节点之间的最短路径距离,计算得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分,以组成最终评分集合。
在本实施例中,通过来计算所述目标节点与用户-项目二部图中每一项目节点之间的最终评分;其中,Score_Neark表示相似用户聚类结果所对应用户节点与项目节点k之间的综合评分,dij表示目标节点i与相似用户聚类结果所对应用户节点j之间的最短路径距离,Sjk表示相似用户聚类结果所对应用户节点j对项目节点k的评分。
例如,参考用户-评分矩阵S和如图2所示的用户-项目的二部图,若用户节点1为目标节点,目标节点与用户节点2之间的最短路径距离d12=8/15,目标节点与用户节点3之间的最短路径距离d13=8/15,用户节点2与项目节点1之间评分S21为0,用户节点2与项目节点2之间评分S22为4,用户节点3与项目节点1之间评分S31为3,用户节点3与项目节点2之间评分S32为3,则相似用户聚类结果中对项目节点1的综合评分如下:
1)相似用户聚类结果所对应用户节点与项目节点1之间的综合评分Score_Near1为:
2)相似用户聚类结果所对应用户节点与项目节点2之间的综合评分Score_Near2为:
所述目标节点与用户-项目二部图中项目节点1之间的最短路径距离Score_direct11为1,目标节点与用户-项目二部图中项目节点2之间的最短路径距离Score_direct12为1/5;若预设的调节参数为0.6,则
目标节点与项目节点1之间最终评分记为Total1,且
Total1=λ×Score_Near1+(1-λ)×Score_direct11=1.3;
目标节点与项目节点2之间最终评分记为Total2,且
Total2=λ×Score_Near2+(1-λ)×Score_direct12=2.18;
由上述两个最终评分组成得到最终评分集合。
评分筛选单元140,用于遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合。
在一实施例中,所述评分筛选单元140还用于:
将所述最终评分集合中的最终评分按降序排序以得到降序评分集合,遍历所述降序评分集合中最终评分评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合。
在本实施例中,目标节点与项目节点1之间最终评分为Total1=1.3,目标节点与项目节点2之间最终评分为Total2=2.18。若预设的排名阈值为2,则表示需在最终评分集合中获取评分排名位于第2名之前的最终评分(也即获取第1名的最终评分)。由于上述两个最终评分中Total2的排名位于第一名,故将项目节点2作为筛选出来的结果放入项目节点集合中。通过筛选降序评分集合中位于预设排名阈值之前的最终评分对应的项目节点以组成项目节点集合,能准确的筛选项目评分高的项目作为推荐项目。
信息推送单元150,用于将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端。
在一实施例中,所述信息推送单元150还用于:
将所述项目节点集合中的各项目节点根据对应的最终评分进行降序排序,将根据最终评分进行降序排序的项目节点一一对应的项目信息推送至所述目标用户的接收终端。
为了更客观的根据最终评分的高低顺序来推荐项目节点,此时可以先将所述最终评分集合中的最终评分按降序排序以得到降序评分集合。若降序评分集合中排名位于所述排名阈值之前的最终评分对应的项目节点有多个,则将这多个项目节点对应的项目信息按照最终评分的排名顺序推送至目标用户。
该装置实现了通过二部图的方式对用户进行聚类,得到目标用户的相似用户,通过相似用户对商品的评分作为对目标用户商品推荐的依据,避免了推荐系统固有稀疏矩阵和冷启动问题,而且具有拓展性和高性能,实现了更优化的信息推荐方式。
上述基于聚类的信息推送装置可以实现为计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
请参阅图10,图10是本发明实施例提供的计算机设备的示意性框图。
参阅图10,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于聚类的信息推送方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于聚类的信息推送方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图10中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:获取用户-评分矩阵,创建与所述用户-评分矩阵对应的用户-项目二部图;获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果;根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合;遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合;以及将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端。
在一实施例中,处理器502在执行所述创建与所述用户-评分矩阵对应的用户-项目二部图的步骤时,执行如下操作:根据用户-评分矩阵进行二部图的节点初始化,得到初始用户-项目二部图;获取用户-评分矩阵中的非空值,以对应构建初始用户-项目二部图中用户节点与项目节点之间的边,得到用户-项目二部图。
在一实施例中,处理器502在执行所述获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果的步骤时,执行如下操作:获取在用户-项目二部图中所选定的目标用户对应的目标节点,遍历所述用户-项目二部图以获取其他用户节点中每一用户节点经由项目节点与所述目标节点之间的最短路径距离,以生成最短路径距离集合;其中,其他用户节点为在用户-项目二部图对应的用户节点集合中目标节点的补集;获取所述最短路径距离集合中小于预设的路径距离阈值的最短路径距离,并获取所述最短路径距离对应的用户节点,以组成相似用户聚类结果。
在一实施例中,处理器502在执行所述遍历所述用户-项目二部图以获取其他用户节点中每一用户节点与所述目标节点之间的最短路径距离的步骤时,执行如下操作:遍历所述用户-项目二部图,以通过迪杰斯特拉算法获取获取其他用户节点中每一用户节点经由项目节点与所述目标节点之间的最短路径距离。
在一实施例中,处理器502在执行所述根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合的步骤时,执行如下操作:根据用户-评分矩阵及综合评分算法,获取相似用户聚类结果所对应用户节点与每一项目节点与之间的综合评分;其中,综合评分算法为Score_Neark表示相似用户聚类结果所对应用户节点与项目节点k之间的综合评分,dij表示目标节点i与相似用户聚类结果所对应用户节点j之间的最短路径距离,Sjk表示相似用户聚类结果所对应用户节点j对项目节点k的评分;获取所述目标节点与用户-项目二部图中每一项目节点之间的最短路径距离;根据目标节点与用户-项目二部图中每一项目节点之间最终评分=调节参数*相似用户聚类结果所对应用户节点与每一项目节点与之间的综合评分+(1-调节参数)*目标节点与用户-项目二部图中每一项目节点之间的最短路径距离,计算得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分,以组成最终评分集合。
在一实施例中,处理器502在执行所述遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合的步骤时,执行如下操作:将所述最终评分集合中的最终评分按降序排序以得到降序评分集合,遍历所述降序评分集合中最终评分评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合。
在一实施例中,处理器502在执行所述将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端的步骤时,执行如下操作:将所述项目节点集合中的各项目节点根据对应的最终评分进行降序排序,将根据最终评分进行降序排序的项目节点一一对应的项目信息推送至所述目标用户的接收终端。
本领域技术人员可以理解,图10中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图10所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:获取用户-评分矩阵,创建与所述用户-评分矩阵对应的用户-项目二部图;获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果;根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合;遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合;以及将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端。
在一实施例中,所述创建与所述用户-评分矩阵对应的用户-项目二部图,包括:根据用户-评分矩阵进行二部图的节点初始化,得到初始用户-项目二部图;获取用户-评分矩阵中的非空值,以对应构建初始用户-项目二部图中用户节点与项目节点之间的边,得到用户-项目二部图。
在一实施例中,所述获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果,包括:获取在用户-项目二部图中所选定的目标用户对应的目标节点,遍历所述用户-项目二部图以获取其他用户节点中每一用户节点经由项目节点与所述目标节点之间的最短路径距离,以生成最短路径距离集合;其中,其他用户节点为在用户-项目二部图对应的用户节点集合中目标节点的补集;获取所述最短路径距离集合中小于预设的路径距离阈值的最短路径距离,并获取所述最短路径距离对应的用户节点,以组成相似用户聚类结果。
在一实施例中,所述遍历所述用户-项目二部图以获取其他用户节点中每一用户节点与所述目标节点之间的最短路径距离,包括:遍历所述用户-项目二部图,以通过迪杰斯特拉算法获取获取其他用户节点中每一用户节点经由项目节点与所述目标节点之间的最短路径距离。
在一实施例中,所述根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合,包括:根据用户-评分矩阵及综合评分算法,获取相似用户聚类结果所对应用户节点与每一项目节点与之间的综合评分;其中,综合评分算法为Score_Neark表示相似用户聚类结果所对应用户节点与项目节点k之间的综合评分,dij表示目标节点i与相似用户聚类结果所对应用户节点j之间的最短路径距离,Sjk表示相似用户聚类结果所对应用户节点j对项目节点k的评分;获取所述目标节点与用户-项目二部图中每一项目节点之间的最短路径距离;根据目标节点与用户-项目二部图中每一项目节点之间最终评分=调节参数*相似用户聚类结果所对应用户节点与每一项目节点与之间的综合评分+(1-调节参数)*目标节点与用户-项目二部图中每一项目节点之间的最短路径距离,计算得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分,以组成最终评分集合。
在一实施例中,所述遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合,包括:将所述最终评分集合中的最终评分按降序排序以得到降序评分集合,遍历所述降序评分集合中最终评分评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合。
在一实施例中,所述将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端,包括:将所述项目节点集合中的各项目节点根据对应的最终评分进行降序排序,将根据最终评分进行降序排序的项目节点一一对应的项目信息推送至所述目标用户的接收终端。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于聚类的信息推送方法,其特征在于,包括:
获取用户-评分矩阵,创建与所述用户-评分矩阵对应的用户-项目二部图;
获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果;
根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合;
遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合;以及
将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端。
2.根据权利要求1所述的基于聚类的信息推送方法,其特征在于,所述创建与所述用户-评分矩阵对应的用户-项目二部图,包括:
根据用户-评分矩阵进行二部图的节点初始化,得到初始用户-项目二部图;
获取用户-评分矩阵中的非空值,以对应构建初始用户-项目二部图中用户节点与项目节点之间的边,得到用户-项目二部图。
3.根据权利要求1所述的基于聚类的信息推送方法,其特征在于,所述获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果,包括:
获取在用户-项目二部图中所选定的目标用户对应的目标节点,遍历所述用户-项目二部图以获取其他用户节点中每一用户节点经由项目节点与所述目标节点之间的最短路径距离,以生成最短路径距离集合;其中,其他用户节点为在用户-项目二部图对应的用户节点集合中目标节点的补集;
获取所述最短路径距离集合中小于预设的路径距离阈值的最短路径距离,并获取所述最短路径距离对应的用户节点,以组成相似用户聚类结果。
4.根据权利要求1所述的基于聚类的信息推送方法,其特征在于,所述遍历所述用户-项目二部图以获取其他用户节点中每一用户节点与所述目标节点之间的最短路径距离,包括:
遍历所述用户-项目二部图,以通过迪杰斯特拉算法获取获取其他用户节点中每一用户节点经由项目节点与所述目标节点之间的最短路径距离。
5.根据权利要求4所述的基于聚类的信息推送方法,其特征在于,所述根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合,包括:
根据用户-评分矩阵及综合评分算法,获取相似用户聚类结果所对应用户节点与每一项目节点与之间的综合评分;其中,综合评分算法为 Score_Neark表示相似用户聚类结果所对应用户节点与项目节点k之间的综合评分,dij表示目标节点i与相似用户聚类结果所对应用户节点j之间的最短路径距离,Sjk表示相似用户聚类结果所对应用户节点j对项目节点k的评分;
获取所述目标节点与用户-项目二部图中每一项目节点之间的最短路径距离;
根据目标节点与用户-项目二部图中每一项目节点之间最终评分=调节参数*相似用户聚类结果所对应用户节点与每一项目节点与之间的综合评分+(1-调节参数)*目标节点与用户-项目二部图中每一项目节点之间的最短路径距离,计算得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分,以组成最终评分集合。
6.根据权利要求1所述的基于聚类的信息推送方法,其特征在于,所述遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合,包括:
将所述最终评分集合中的最终评分按降序排序以得到降序评分集合,遍历所述降序评分集合中最终评分评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合。
7.根据权利要求6所述的基于聚类的信息推送方法,其特征在于,所述将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端,包括:
将所述项目节点集合中的各项目节点根据对应的最终评分进行降序排序,将根据最终评分进行降序排序的项目节点一一对应的项目信息推送至所述目标用户的接收终端。
8.一种基于聚类的信息推送装置,其特征在于,包括:
二部图构建单元,用于获取用户-评分矩阵,创建与所述用户-评分矩阵对应的用户-项目二部图;
相似用户聚类单元,用于获取在用户-项目二部图中所选定的目标用户对应的目标节点,获取与所述目标节点之间的路径距离小于预设的路径距离阈值的用户节点,以组成相似用户聚类结果;
最终评分集合获取单元,用于根据所述用户-评分矩阵、相似用户聚类结果及预设的最终评分算法,得到所述目标节点与用户-项目二部图中每一项目节点之间的最终评分以组成最终评分集合;
评分筛选单元,用于遍历所述最终评分集合中评分排名小于预设的排名阈值的最终评分以获取对应的项目节点集合;
信息推送单元,用于将所述项目节点集合中各项目节点对应的项目信息推送至所述目标用户的接收终端。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的基于聚类的信息推送方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至7任一项所述的基于聚类的信息推送方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811191629.3A CN109166016A (zh) | 2018-10-12 | 2018-10-12 | 基于聚类的信息推送方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811191629.3A CN109166016A (zh) | 2018-10-12 | 2018-10-12 | 基于聚类的信息推送方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109166016A true CN109166016A (zh) | 2019-01-08 |
Family
ID=64878147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811191629.3A Pending CN109166016A (zh) | 2018-10-12 | 2018-10-12 | 基于聚类的信息推送方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109166016A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263862A (zh) * | 2019-06-21 | 2019-09-20 | 北京字节跳动网络技术有限公司 | 信息的推送方法、装置、电子设备及可读存储介质 |
CN110413896A (zh) * | 2019-06-06 | 2019-11-05 | 腾讯科技(北京)有限公司 | 网络信息推送方法、装置、计算机设备及存储介质 |
CN111242165A (zh) * | 2019-12-30 | 2020-06-05 | 北京顺达同行科技有限公司 | 商户聚类方法、装置、计算机设备和存储介质 |
CN110413896B (zh) * | 2019-06-06 | 2024-06-28 | 腾讯科技(北京)有限公司 | 网络信息推送方法、装置、计算机设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103412948A (zh) * | 2013-08-27 | 2013-11-27 | 北京交通大学 | 基于聚类的协同过滤的商品推荐方法及系统 |
CN103778145A (zh) * | 2012-10-22 | 2014-05-07 | 中国移动通信集团广东有限公司 | 一种信息推荐方法和系统 |
CN104317900A (zh) * | 2014-10-24 | 2015-01-28 | 重庆邮电大学 | 一种面向社交网络的多属性协同过滤推荐方法 |
CN104966125A (zh) * | 2015-05-06 | 2015-10-07 | 同济大学 | 一种社交网络的物品评分及推荐方法 |
-
2018
- 2018-10-12 CN CN201811191629.3A patent/CN109166016A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778145A (zh) * | 2012-10-22 | 2014-05-07 | 中国移动通信集团广东有限公司 | 一种信息推荐方法和系统 |
CN103412948A (zh) * | 2013-08-27 | 2013-11-27 | 北京交通大学 | 基于聚类的协同过滤的商品推荐方法及系统 |
CN104317900A (zh) * | 2014-10-24 | 2015-01-28 | 重庆邮电大学 | 一种面向社交网络的多属性协同过滤推荐方法 |
CN104966125A (zh) * | 2015-05-06 | 2015-10-07 | 同济大学 | 一种社交网络的物品评分及推荐方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413896A (zh) * | 2019-06-06 | 2019-11-05 | 腾讯科技(北京)有限公司 | 网络信息推送方法、装置、计算机设备及存储介质 |
CN110413896B (zh) * | 2019-06-06 | 2024-06-28 | 腾讯科技(北京)有限公司 | 网络信息推送方法、装置、计算机设备及存储介质 |
CN110263862A (zh) * | 2019-06-21 | 2019-09-20 | 北京字节跳动网络技术有限公司 | 信息的推送方法、装置、电子设备及可读存储介质 |
CN110263862B (zh) * | 2019-06-21 | 2021-05-07 | 北京字节跳动网络技术有限公司 | 信息的推送方法、装置、电子设备及可读存储介质 |
CN111242165A (zh) * | 2019-12-30 | 2020-06-05 | 北京顺达同行科技有限公司 | 商户聚类方法、装置、计算机设备和存储介质 |
CN111242165B (zh) * | 2019-12-30 | 2020-10-23 | 北京顺达同行科技有限公司 | 商户聚类方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109166017A (zh) | 基于重聚类的推送方法、装置、计算机设备及存储介质 | |
CN105677715B (zh) | 一种基于多用户的视频推荐方法及装置 | |
CN103329151B (zh) | 基于话题聚类的推荐 | |
CN109360057A (zh) | 信息推送方法、装置、计算机设备及存储介质 | |
Noordhuis et al. | Mining twitter in the cloud: A case study | |
CN108108821A (zh) | 模型训练方法及装置 | |
CN109087177A (zh) | 向目标用户推荐商品的方法、装置及计算机可读存储介质 | |
CN105049353B (zh) | 一种为业务配置路由路径的方法及控制器 | |
US20150220530A1 (en) | Efficient similarity ranking for bipartite graphs | |
KR20160137935A (ko) | 소셜 네트워크 정보흐름 표시방법, 장치, 서버, 프로그램 및 컴퓨터가 판독가능한 기록매체 | |
CN106156127A (zh) | 选择数据内容向终端推送的方法及装置 | |
CN109710611B (zh) | 存储表数据的方法、查询表数据的方法、装置及存储介质 | |
CN109146193A (zh) | 产品智能推荐方法、装置、计算机设备及存储介质 | |
KR101567684B1 (ko) | 협업필터링 기반의 상품 추천 시스템에서 추천 기법을 선택하는 방법 | |
CN109166016A (zh) | 基于聚类的信息推送方法、装置、计算机设备及存储介质 | |
CN104778237A (zh) | 一种基于关键用户的个性化推荐方法和系统 | |
CN110322318A (zh) | 一种客户分群方法、装置及计算机存储介质 | |
CN110533453A (zh) | 基于用户匹配的产品推荐方法、装置、计算机设备 | |
CN108366012A (zh) | 一种社交关系建立方法、装置及电子设备 | |
CN107169398A (zh) | 信号处理方法及装置 | |
CN106156113A (zh) | 一种视频推荐的方法、系统及电子设备 | |
CN112989211B (zh) | 一种确定信息相似度的方法及系统 | |
Pan et al. | Weighted bipartite network and personalized recommendation | |
CN105138684B (zh) | 一种信息处理方法和信息处理装置 | |
CN102231158B (zh) | 一种数据集推荐方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |