CN107330115B - 一种信息推荐方法及装置 - Google Patents

一种信息推荐方法及装置 Download PDF

Info

Publication number
CN107330115B
CN107330115B CN201710565977.1A CN201710565977A CN107330115B CN 107330115 B CN107330115 B CN 107330115B CN 201710565977 A CN201710565977 A CN 201710565977A CN 107330115 B CN107330115 B CN 107330115B
Authority
CN
China
Prior art keywords
information
user
users
matrix
current user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710565977.1A
Other languages
English (en)
Other versions
CN107330115A (zh
Inventor
刘文印
范文琦
李青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201710565977.1A priority Critical patent/CN107330115B/zh
Publication of CN107330115A publication Critical patent/CN107330115A/zh
Application granted granted Critical
Publication of CN107330115B publication Critical patent/CN107330115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本发明实施例公开了一种信息推荐方法及装置,其中,方法包括从社交关系网络中通过根据node2vec算法学习网络中各个用户的embedding特征向量来选取K个近邻用户,根据CNN算法从K个近邻用户生成的embedding特征矩阵中提取当前用户的潜在特征;根据潜在特征,利用预设的算法对历史信息评分矩阵进行迭代交替运算,获取当前用户的用户特征矩阵及信息特征矩阵;根据用户特征矩阵和/或所述信息特征矩阵,为当前用户进行信息推荐。有利于挖掘当前用户深层次的潜在特征,从而提高信息推荐的效率以及准确率。

Description

一种信息推荐方法及装置
技术领域
本发明实施例涉及信息处理技术领域,特别是涉及一种信息推荐方法及装置。
背景技术
随着云计算及大数据技术的快速发展,数据呈现爆炸式增长。用户从海量信息中找到自己感兴趣的信息越来越难,为用户精准的推荐所需信息,成为本领域技术人员亟待解决的问题。
现有的推荐系统,一般基于协调过滤算法,但是,随着用户群体的增加,商品数量以及信息的大幅增长,用户对商品行为数据极度稀疏,推荐系统的准确度较低。
发明内容
本发明实施例的目的是提供一种信息推荐方法及装置,以提高信息推荐的准确率。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例一方面提供了一种信息推荐方法,包括:
获取当前用户在待信息推荐系统中的社交关系网络,根据node2vec算法学习所述社交关系网络中包含的各个用户的embedding特征表达,以获取每个所述用户的embedding特征向量;
根据所述社交关系网络中的用户总数设置KNN算法中的参数K值,根据所述K值及多个所述embedding特征向量,从各个所述用户中选取与所述当前用户关系满足预设条件的K个近邻用户,根据K个所述近邻用户的embedding特征向量生成embedding特征矩阵;
利用CNN算法在所述embedding特征矩阵上学习所述社交关系网络的潜在特征;
根据所述潜在特征,利用预设的算法对历史信息评分矩阵进行迭代交替运算,以获取所述当前用户的用户特征矩阵及信息特征矩阵,所述历史信息评分矩阵根据所述待信息推荐系统中多个用户的历史信息数据获取;
根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐。
可选的,所述根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐包括:
根据所述用户特征矩阵及所述信息特征矩阵为所述当前用户的潜在信息进行评分预测;
将满足预设阈值的所述评分值对应的潜在信息进行推荐。
可选的,所述根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐包括:
当检测到所述当前用户进入所述待信息推荐系统中时,根据所述用户特征矩阵为所述当前用户进行信息推荐。
可选的,所述根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐包括:
当检测到所述当前用户进入所述待信息推荐系统中时,根据所述用户特征矩阵以及所述信息特征矩阵为所述当前用户进行信息推荐。
可选的,所述根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐包括:
当检测到所述当前用户在所述待信息推荐系统中进行信息搜索或浏览信息时,根据所述当前用户的搜索信息、浏览信息以及所述信息特征矩阵为所述当前用户进行信息推荐。
可选的,所述根据所述社交关系网络中的用户总数设置KNN算法中的参数K值为:
所述K值不小于所述社交关系网络包含的用户总个数的1.5%,且不大于所述社交关系网络包含的用户总个数的2%。
可选的,所述K值为所述社交关系网络包含的用户总个数的1.5%。
可选的,所述信息为商品。
可选的,所述根据所述K值及多个所述embedding特征向量,从各个所述用户中选取与所述当前用户关系满足预设条件的K个近邻用户包括:
计算所述当前用户依次与各个所述用户的embedding特征向量的欧式距离;
对多个所述欧式距离的值进行从小到大排序,前K个欧式距离值对应的K个用户为满足预设条件的K个所述近邻用户。
本发明实施例另一方面提供了一种信息推荐装置,包括:
社交关系网络获取模块,用于获取当前用户在待信息推荐系统中的社交关系网络,根据node2vec算法学习所述社交关系网络中包含的各个用户的embedding特征表达,以获取每个所述用户的embedding特征向量;
近邻用户选取模块,用于根据所述社交关系网络中的用户总数设置KNN算法中的参数K值,根据所述K值及多个所述embedding特征向量,从各个所述用户中选取与所述当前用户关系满足预设条件的K个近邻用户,根据K个所述近邻用户的embedding特征向量生成embedding特征矩阵;
CNN算法学习模块,用于利用CNN算法在所述embedding特征矩阵上学习所述社交关系网络的潜在特征;
推荐参数生成模块,用于根据所述潜在特征,利用预设的算法对历史信息评分矩阵进行迭代交替运算,以获取所述当前用户的用户特征矩阵及信息特征矩阵,所述历史信息评分矩阵根据所述待信息推荐系统中多个用户的历史信息数据获取;
信息推荐模块,用于根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐。
本发明实施例提供了一种信息推荐方法,从社交关系网络中通过根据node2vec算法学习网络中各个用户的embedding特征向量来选取K个近邻用户,根据CNN算法从K个近邻用户生成的embedding特征矩阵中提取当前用户的潜在特征;根据潜在特征,利用预设的算法对历史信息评分矩阵进行迭代交替运算,获取当前用户的用户特征矩阵及信息特征矩阵;根据用户特征矩阵和/或所述信息特征矩阵,为当前用户进行信息推荐。
本申请提供的技术方案的优点在于,由于社交关系网络的数据量大、稀疏性、结构复杂性等特点,在利用CNN算法对社交关系网络进行深层特征学习之前对根据node2vec算法及KNN算法从网络中选取K个近邻用户,只针对K个近邻用户构成的特征矩阵进行学习,减少了处理的数据量,且有利于挖掘当前用户深层次的潜在特征,从而提高信息推荐的效率以及准确率。
此外,本发明实施例还针对信息推荐方法提供了相应的实现装置,进一步使得所述方法更具有实用性,所述装置具有相应的优点。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种信息推荐方法的流程示意图;
图2为本发明实施例提供的K值对推荐准确率影响的示意图;
图3为本发明实施例提供的DeepSoR方法的原理示意图;
图4为本发明实施例提供的另一种信息推荐方法的流程示意图;
图5为本发明实施例提供的信息推荐装置的一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
本申请的发明人经过研究发现,用户行为和喜好与其社交关系网络极其类似,并受其社交关系的好友影响。为此,融合用户社交关系网络信息对用户进行信息和商品推荐具有很强的社会学意义。近年来,诸如Facebook、新浪微博、微信公众号等基于社交属性的信息传播平台的兴起,融合用户社交关系网络进行推荐具有很大的必要性,用户社交关系网络必对用户线上行为造成影响。
现有的融合社交关系网络的推荐算法,如基于用户喜好对用户进行聚类方法,先根据用户的喜好对用户进行聚类分析,产生用户兴趣倾向标签的音乐推荐方法。现有的根据朋友、用户、项目信息构建朋友集-用户集-项目集三层模型得到用户间的综合近邻度,再搜索目标用户的近邻集合的面向社交网络的多属性协同过滤推荐方法,现有的通过社团划分算法对社交网络进行社团划分,并对单个社团用户影响力排名分析,再根据用户兴趣标签对用户价值进行分析,最后对划分出的较大社团进行用户影响力价值分析的智能社交网络推荐系统。
然而,社交关系网络的数据量大和稀疏性、结构的复杂性、社交行为的传递性等特点,在推荐系统中融合用户社交关系网络带了严重的挑战。具体地,社交关系网络数据量大和稀疏性的特点,使得传统的基于矩阵分解的推荐方法不能很好捕获用户行为和喜好特点,即用户的特征表达不能很好地被学习到,很难适用于精准的用户信息推荐;同时,社交关系网络结构的复杂性和用户社交行为的传递性对用户兴趣建模产生了极大的挑战。因此,急需要特征学习能力强的方法对用户社交关系网络进行特征学习,进而提高信息或产品推荐的准确性。
目前,深度卷积神经网络(Convolutional Neural Network,CNN)凭借着强大的特征学习能力,在计算机视觉和自然语言处理中获得极大的成功。
鉴于此,本申请所提供的技术方案基于深度神经网络的信息推荐方法(Deepneural network on Social Relations for information recommendation,DeepSoR),通过融合深度卷积神经网络和用户社交关系网络来提高推荐系统的准确率。具体地,采用深度卷积神经网络的方法对用户社交关系网络进行深层特征学习,使得用户的潜在特征能更好地别表示出来。
在介绍了本发明实施例的技术方案后,下面详细的说明本申请的各种非限制性实施方式。
首先参见图1,图1为本发明实施例提供的一种信息推荐方法的流程示意图,本发明实施例可包括以下内容:
S101:获取当前用户在待信息推荐系统中的社交关系网络,根据node2vec算法学习所述社交关系网络中包含的各个用户的embedding特征表达,以获取每个所述用户的embedding特征向量。
待信息推荐系统为当前用户登录的符合权限条件的系统,为该当前用户进行信息推荐的系统,例如豆瓣、微博、今日头条等新闻类的客户端。待信息推荐系统可为文字信息推荐的系统,例如新闻,也可为视频推荐系统,还可为商品推荐,当前,还可为其他类型的推荐系统,这均不影响本申请的实现。
社交关系网络为由与当前用户在待信息推荐系统有某种关系的其他用户组成的群体,例如,当微博为待信息推荐系统时,当前用户的社交关系网络即为关注了当前用户的其他用户、当前用户关注的用户以及与当前用户共同关注的用户组成的群体;当淘宝为待信息推荐系统时,在为当前用户进行推荐商品时,社交关系网络中包含的用户可为与当前用户购买过同一类型产品或同一件产品或买过同一个卖家产品的其他用户,或共同关注过同一类型产品或同一件产品或买过同一个卖家产品的其他用户。
node2vec算法为一种训练网络节点潜在特征向量表示的方法,通过结合宽度优先搜索(BFS)和深度优先搜索(DFS)进行邻居节点的选择,借鉴语言模型,基于深度学习方法进行训练,以保存其邻居节点的信息和学习网络节点的embedding特征向量。
利用node2vec算法学习embedding特征向量可为:构造q维空间,将实体(例如网络节点)映射为q维实数特征向量,保留其基本特征属性。
当然,也可采用其他算法学习社交关系网络中包含的各个用户的embedding特征表达,但是经过多次试验证明,node2vec算法对社交关系网络中各个用户的特征学习,获取到的用户特征较为准确。
社交关系网络embedding特征表达可挖掘用户在社交网络中的特征表达,采用node2vec学习当前用户在社交网络中的特征表达,有效地将当前用户社交关系网络中的特征转化成q维连续型的embedding特征向量,即将社交网络中的包含的每个用户都转化了q维连续型的embedding特征向量,例如社交关系网络中包含100个用户,生成100个q维连续型的embedding特征向量,q可为200,当然,也可为其他任何数值,本申请对此不做任何限定。
S102:根据所述社交关系网络中的用户总数设置KNN算法中的参数K值,根据所述K值及多个所述embedding特征向量,从各个所述用户中选取与所述当前用户关系满足预设条件的K个近邻用户,根据K个所述近邻用户的embedding特征向量生成embedding特征矩阵。
在社会关系学理论中,用户的行为跟其身边人相似,或者受其身边人的影响。所以,仅仅通过node2vec把用户的社交网络的特征转化成连续型的特征向量不足以把用户的特征行为完全表示出来。为了进一步挖掘出用户社交网络的行为特征,本申请进一步采用了KNN算法(K-Nearest Neighbor,K近邻)来选取K个最相似的用户来组成其近邻集合。其中,K值的选取至关重要。为了提高整个算法的鲁棒性,K值的选取基于该推荐系统中用户量的大小来决定。
K值不小于社交关系网络包含的用户总个数的1.5%,且不大于所述社交关系网络包含的用户总个数的2%。举例来说,当社交关系网络中用户的总个数为100个时,那么K值在[15,20]范围内。
优选的,K值为社交关系网络包含的用户总个数的1.5%,也就是从100个用户中选取15个近邻用户。
关于K值对整个推荐方法的影响,本申请还做了系列的试验证明,具体如下:
为了有效学习到用户社交关系网络的潜在特征向量,本申请的DeepSoR方法利用KNN算法把用户embedding特征向量与CNN连接在一起。KNN控制着用户的喜好受最相似的近邻用户个数的影响。K值的设置使得该社交网络中的用户平均近邻用户数占该社交网络中用户总量的P%。图2显示了P%(横轴为P%值)的设置对DeepSoR方法的影响(结果归一化到[0,1]之间)。由图可知,当P%∈[1.5%,2%]时,DeepSoR能取得非常不错的实验效果,即DeepSoR方法在多个测试数据集(例如图2中的Ciao数据集和Epinions数据集)上的预测误差(RMSE和MAE)在该区间范围最小。
此外,当P值太小或太大时,DeepSoR的预测准确率都有可能下降。当P值太小,因近邻用户数太少,用户潜在特征很难用深度学习技术学习出用户在社交关系网络中的特征表达;而P值太大,用户潜在特征通过其没有相关关系的近邻用户过度地学习了其不应具有的特征。
在一种具体的实施方式中,可以采用下述方式进行选取:
计算所述当前用户依次与各个所述用户的embedding特征向量的欧式距离;
对多个所述欧式距离的值进行从小到大排序,前K个欧式距离值对应的K个用户为满足预设条件的K个所述近邻用户。
也可采用其他距离公式进行向量间的距离,通过向量的距离的大小作为判断二者相似性的依据,当然,也可采用其他方式来衡量两个用户间的相似性,本申请对此不做任何限定。
根据K个用户的q维的embedding特征向量,生成embedding特征矩阵,例如10个用户,每个用户的embedding特征向量为200维,那么embedding特征矩阵为10*200的矩阵。
S103:利用CNN算法在所述embedding特征矩阵上学习所述社交关系网络的潜在特征。
以商品推荐为例介绍CNN算法对社交关系网络学习的原理,图3为本申请提供的DeepSoR方法的原理示意图,基于深度卷积神经网络的社交关系的信息推荐系统可包括概率矩阵分解模型(Probabilistic Matrix Factorization,PMF)模块和用户社交关系卷积神经网络(Social CNN,Netu)模块。
概率矩阵分解模型用于预测商品评分和商品推荐,假设用户和商品的潜在特征矩阵均服从某一概率分布,通过分解用户-商品中已知的评分信息矩阵得到用户、商品潜在特征矩阵,然后通过用户、商品的潜在特征矩阵预测用户-商品评分矩阵中的空值。假设有I个用户,J个商品,及用户对商品的评分信息矩阵
Figure BDA0001348374710000091
如果把R映射到l维的特征空间,那么
Figure BDA0001348374710000092
Figure BDA0001348374710000093
分别表示用户的特征矩阵和商品的特征矩阵。概率矩阵分解从概率的角度出发来构建矩阵分解模型,其假设预测结果满足高斯分布,对已知的评分矩阵
Figure BDA0001348374710000094
构建条件概率分布,即:
Figure BDA0001348374710000095
式中,
Figure BDA0001348374710000096
是以μ为均值,方差为
Figure BDA0001348374710000097
的高斯正态分布;Cij为指示函数,如果用户ui评论了商品vi,Cij为1,否则为0。
同时,假设用户特征矩阵
Figure BDA0001348374710000098
商品特征矩阵
Figure BDA0001348374710000099
服从均值为0,方差分别为
Figure BDA00013483747100000910
Figure BDA00013483747100000911
的高斯分布,即:
Figure BDA00013483747100000912
Figure BDA0001348374710000101
需要说明的是,不同于传统的概率矩阵分解,本申请融合了用户社交关系信息来优化用户特征矩阵
Figure BDA0001348374710000102
具体地,本申请提出用户社交关系卷积神经网络(SocialCNN,Netu)来学习用户在社交关系网络中的潜在社交关系特征。
假设用户潜在模型由Netu模块生成,Z为在Netu所有权重参数和偏置量,且Z服从均值为0的高斯分布,即:
Figure BDA0001348374710000103
Figure BDA0001348374710000104
ui=Netu(Z,Si)+∈i
其中,Si为用户i的社交关系,∈i变量为定义为高斯噪声。
因此,给定Z和S,用户特征矩阵U可为:
Figure BDA0001348374710000105
其中,通过社交关系卷积神经网络Netu得到的用户社交关系网络的潜在特征作为高斯分布的均值,高斯噪声作为高斯分布的方差。
用户社交关系卷积神经网络(Social CNN,Netu)包括用户社交关系网络embedding特征表示,用户K近邻关系集合表示,深度卷积神经网络的用户潜在特征学习。假设用户i的embedding特征向量为
Figure BDA0001348374710000106
用户i的K近邻集合为
Figure BDA0001348374710000107
通过大量的实验表明,当P%∈[1.5%,2%]时,推荐系统的效果能达到理想状态。所以,该近邻集合Nk(i)构成了用户i的近邻embedding特征表达矩阵
Figure BDA0001348374710000108
即:
Figure BDA0001348374710000109
其中,符号
Figure BDA00013483747100001010
为连接操作,映射函数φ(sa)返回近邻用户sa对应的embedding特征向量xa
深度卷积神经网络CNN的用户潜在特征学习为通过卷积神经网络CNN来提取用户的潜在特征。具体可包括卷积层、池化层、输出层。
卷积层包含m个神经元,通过在用户embedding特征表达矩阵上进行卷积操作产生新的高层次抽象特征。对于第g个共享卷积核
Figure BDA0001348374710000111
在窗口长度为t内进行卷积操作获得,输出特征为
Figure BDA0001348374710000112
为:
Figure BDA0001348374710000113
其中,符号*为卷积操作,
Figure BDA0001348374710000114
为偏置项,f(x)为非线性激活函数。为了最大限度地加速训练收敛速度和避免梯度消失,可采用ReLUs函数做为每个神经元的激活函数,即:
f(x)=max{0,x};
共享卷积核
Figure BDA0001348374710000115
对输入用户embedding特征矩阵
Figure BDA0001348374710000116
进行卷积操作,就可以得到潜在特征向量
Figure BDA0001348374710000117
即:
Figure BDA0001348374710000118
池化层为一个非线性的子抽样函数,用于进一步参数约减的作用,使得模型泛化能力更强,即:
Figure BDA0001348374710000119
但是,在深度卷积神经网络中,一个共享卷积核产生一类型的特征表达,为了提取出不同粒度大小的局部特征,本发明采用多个不同的共享卷积核(不同长达大小t的窗口)来获取多种类型的特征输出O,即:
Figure BDA00013483747100001110
其中,nc为共享卷积核的个数。
经过卷积和池化操作之后,需要把O投影到维度为l的用户潜在特征空间。可采用传统的非线性映射函数,即:
s=tanh(Zf×O+bf);
其中,
Figure BDA00013483747100001111
为带权参数矩阵,
Figure BDA00013483747100001112
为偏置量。
通过上述过程,基于用户社交关系网络的深度卷积神经网络以用户的社交关系信息为输入,输出用户的潜在特征向量,可以表示为:
Yi=Netu(Z,Si);
其中,Z包括神经网络各层共享卷积核和偏置量。
通过贝叶斯推断得到用户特征矩阵U,商品特征V,深度卷积神经网络的参数Z的后验分布,即:
Figure BDA0001348374710000121
为了计算化简,可利用对数函数性质,极大化后验概率等于极大化其联合对数似然函数,即:
Figure BDA0001348374710000122
其中,
Figure BDA0001348374710000123
S104:根据所述潜在特征,利用预设的算法对历史信息评分矩阵进行迭代交替运算,以获取所述当前用户的用户特征矩阵及信息特征矩阵,所述历史信息评分矩阵根据所述待信息推荐系统中多个用户的历史信息数据获取。
历史信息评分矩阵为待信息推荐系统中所有用户与商品交互构成的矩阵,用户的特征是根据用户的历史信息来获取,举例来说,当信息为商品时,该历史信息评分矩阵包括待推荐信息系统中所有用户对买过的商品或感兴趣的商品的评分信息。
由于历史信息评分矩阵包含的数据太多,仅仅依据历史数据进行推荐,推荐准确率较低,故,可以用上述步骤中获取的潜在特征作为辅助,从历史信息评分矩阵中选取更符合当前用户的一些信息。
具体的可采用预设算法进行迭代优化,预设的算法可采用BP算法和EM算法,当然,也可采用其他算法,本申请对此不作任何限定。
依然以商品为例,说明S104的一种具体实施方式:
在参数估计中,很难直接得到参数ui,vj。可使用EM算法(ExpectationMaximization,期望最大化算法)进行参数估计,即固定剩余参数变量,而优化某一参数变量,即:
ui←(VCiVTUIk)-1(VCiRiUNetu(Z,Si));
vj←(UCjUTVIk)-1UCjRj
其中,
Figure BDA0001348374710000131
对于用户ui,Ci为Cij的对角矩阵,j=1,2,..,J,J是对角元素,Ri
Figure BDA0001348374710000132
对于商品vj,Ci和Ri的定义与上述ui定义类似。上述公式反映了通过用户社交关系深度卷积神经网络学习到的用户潜在社交关系特征对用户特征向量ui的影响,其中,λU是用来权衡社交关系的影响。当λU=0时,仅利用评分矩阵R进行预测评分;当λU=∞时,仅仅利用了社交关系来预测评分。
给定用户特征矩阵U,商品特征V,通过BP算法(Back Propagation algorithm,后向传播算法)来学习深度卷积神经网络的参数Z。
在估计得到所有参数U、V、Z后,通过下述公式得到商品预测评分值,并在预测评分值的基础上选择一定范围内的商品进行推荐。
rij≈(ui)T(vj)=(Netu(Z,Si)+∈i)T(vj)。
S105:根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐。
信息推荐可为商品推荐,也可为其他,例如在豆瓣中,可对当前用户进行电影推荐。在进行推荐时,可以同时根据用户特征矩阵和信息特征矩阵进行推荐,也可仅仅根据用户特征矩阵,或信息特征矩阵。根据用户特征矩阵推荐,为根据社交关系网络中的K个近邻用户的某些特征,作为当前用户的潜在特征,并将该特征相关的信息进行推荐。例如,在社交关系网络中,当前用户在体育爱好的特征为篮球,但是与当前用户较为相似的另外一个用户A(近邻用户),A用户在体育爱好的特征为篮球和足球,故在进行信息推荐时,可认为当前用户对足球也是感兴趣的,可以将与足球有关的商品或其他信息进行推荐。
信息特征矩阵为根据当前用户历史的感兴趣的信息构成的特征矩阵,例如,当前用户在过去一段时间中,对足球相关信息进行了大量搜索并查阅,可认为该用户对足球相关的商品或其他信息比较感兴趣,可以将足球有关的商品或其他信息进行推荐。
二者皆考虑,可进行相互筛选,一定程度上有利于提高信息推荐的准确率。
在本发明实施例提供的技术方案中,由于社交关系网络的数据量大、稀疏性、结构复杂性等特点,在利用CNN算法对社交关系网络进行深层特征学习之前对根据node2vec算法及KNN算法从网络中选取K个近邻用户,只针对K个近邻用户构成的特征矩阵进行学习,减少了处理的数据量,且有利于挖掘当前用户深层次的潜在特征,从而提高信息推荐的效率以及准确率。
在一种具体的实施方式中,请参阅图4,本申请基于上述实施例,还提供了另外一个实施例,具体可为:
S401-S404:具体的与上述实施例S101-S104所描述一致,此处不再赘述。
S405:根据所述用户特征矩阵及所述信息特征矩阵为所述当前用户的潜在信息进行评分预测。
S406:将满足预设阈值的所述评分值对应的潜在信息进行推荐。
潜在信息为潜在的感兴趣信息。根据用户特征矩阵及信息特征矩阵可选取较多的潜在的感兴趣的信息,如果都推荐,往往有部分不准确,故可对这些潜在特征信息进行评分,评分越大的,可认为为当前用户最为感兴趣的,优先可先推荐评分较高的信息。
为了进一步提高推荐信息的高效性以及准确性,可设置预设阈值,当评分值小于预设阈值时,即其中一些信息的评分太低,可认为这不是用户感兴趣的特征信息,可不将其进行推荐。以10分制为例,预设阈值可为3.5分,当某些信息的评分低于3.5时,就不进行推荐。
通过进行预测评分,可进一步的提高推荐信息的准确性,提升用户的使用体验。
在另外一些具体的场景下,信息推荐的方法可为:
当检测到所述当前用户进入所述待信息推荐系统中时,根据所述用户特征矩阵为所述当前用户进行信息推荐;或
当检测到所述当前用户进入所述待信息推荐系统中时,根据所述用户特征矩阵以及所述信息特征矩阵为所述当前用户进行信息推荐;或
当检测到所述当前用户在所述待信息推荐系统中进行信息搜索或浏览信息时,根据所述当前用户的搜索信息、浏览信息以及所述信息特征矩阵为所述当前用户进行信息推荐。
根据用户检索过的信息,或浏览过的信息,进行相关信息的推荐,举例来说,例如当用户浏览牙膏商品时,可以向用户进行推荐牙刷等产品,当用户检索过某一部电影时,可将其相关的其他系列进行推荐,如检索加勒比海盗4时,可推荐加勒比海盗5。
当然,上述列举的方式仅仅为一种优选方式,本申请并不对此做任何限定。
本发明实施例还针对信息推荐方法提供了相应的实现装置,进一步使得所述方法更具有实用性。下面对本发明实施例提供的信息推荐装置进行介绍,下文描述的信息推荐装置与上文描述的信息推荐方法可相互对应参照。
参见图5,图5为本发明实施例提供的信息推荐装置在一种具体实施方式下的结构图,该装置可包括:
社交关系网络获取模块501,用于获取当前用户在待信息推荐系统中的社交关系网络,根据node2vec算法学习所述社交关系网络中包含的各个用户的embedding特征表达,以获取每个所述用户的embedding特征向量。
近邻用户选取模块502,用于根据所述社交关系网络中的用户总数设置KNN算法中的参数K值,根据所述K值及多个所述embedding特征向量,从各个所述用户中选取与所述当前用户关系满足预设条件的K个近邻用户,根据K个所述近邻用户的embedding特征向量生成embedding特征矩阵。
CNN算法学习模块503,用于利用CNN算法在所述embedding特征矩阵上学习所述社交关系网络的潜在特征。
推荐参数生成模块504,用于根据所述潜在特征,利用预设的算法对历史信息评分矩阵进行迭代交替运算,以获取所述当前用户的用户特征矩阵及信息特征矩阵,所述历史信息评分矩阵根据所述待信息推荐系统中多个用户的历史信息数据获取。
信息推荐模块505,用于根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐。
在本实施例的一些实施方式中,所述信息推荐模块505可为根据所述用户特征矩阵及所述信息特征矩阵为所述当前用户的潜在信息进行评分预测;将满足预设阈值的所述评分值对应的潜在信息进行推荐的模块。
所述信息推荐模块505可为当检测到所述当前用户进入所述待信息推荐系统中时,根据所述用户特征矩阵为所述当前用户进行信息推荐的模块。
所述信息推荐模块505还可为当检测到所述当前用户进入所述待信息推荐系统中时,根据所述用户特征矩阵以及所述信息特征矩阵为所述当前用户进行信息推荐的模块。
所述信息推荐模块505仍可为当检测到所述当前用户在所述待信息推荐系统中进行信息搜索或浏览信息时,根据所述当前用户的搜索信息、浏览信息以及所述信息特征矩阵为所述当前用户进行信息推荐的模块。
可选的,在本实施例的另一些实施方式中,所述近邻用户选取模块502可以包括:
计算单元5021,用于计算所述当前用户依次与各个所述用户的embedding特征向量的欧式距离;
选取单元,用于对多个所述欧式距离的值进行从小到大排序,前K个欧式距离值对应的K个用户为满足预设条件的K个所述近邻用户。
本发明实施例所述信息推荐装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例由于社交关系网络的数据量大、稀疏性、结构复杂性等特点,在利用CNN算法对社交关系网络进行深层特征学习之前对根据node2vec算法及KNN算法从网络中选取K个近邻用户,只针对K个近邻用户构成的特征矩阵进行学习,减少了处理的数据量,且有利于挖掘当前用户深层次的潜在特征,从而提高信息推荐的效率以及准确率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或近邻部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种信息推荐方法以及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种信息推荐方法,其特征在于,包括:
获取当前用户在待信息推荐系统中的社交关系网络,根据node2vec算法学习所述社交关系网络中包含的各个用户的embedding特征表达,以获取每个所述用户的embedding特征向量;
根据所述社交关系网络中的用户总数设置KNN算法中的参数K值,根据所述K值及多个所述embedding特征向量,从各个所述用户中选取与所述当前用户关系满足预设条件的K个近邻用户,根据K个所述近邻用户的embedding特征向量生成embedding特征矩阵;
利用CNN算法在所述embedding特征矩阵上学习所述社交关系网络的潜在特征;
根据所述潜在特征,利用预设的算法对历史信息评分矩阵进行迭代交替运算,以获取所述当前用户的用户特征矩阵及信息特征矩阵,所述历史信息评分矩阵根据所述待信息推荐系统中多个用户的历史信息数据获取;
根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐。
2.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐包括:
根据所述用户特征矩阵及所述信息特征矩阵为所述当前用户的潜在信息进行评分预测;
将满足预设阈值的所述评分值对应的潜在信息进行推荐。
3.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐包括:
当检测到所述当前用户进入所述待信息推荐系统中时,根据所述用户特征矩阵为所述当前用户进行信息推荐。
4.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐包括:
当检测到所述当前用户进入所述待信息推荐系统中时,根据所述用户特征矩阵以及所述信息特征矩阵为所述当前用户进行信息推荐。
5.根据权利要求1所述的信息推荐方法,其特征在于,所述根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐包括:
当检测到所述当前用户在所述待信息推荐系统中进行信息搜索或浏览信息时,根据所述当前用户的搜索信息、浏览信息以及所述信息特征矩阵为所述当前用户进行信息推荐。
6.根据权利要求1至5任意一项所述的信息推荐方法,其特征在于,所述根据所述社交关系网络中的用户总数设置KNN算法中的参数K值为:
所述K值不小于所述社交关系网络包含的用户总个数的1.5%,且不大于所述社交关系网络包含的用户总个数的2%。
7.根据权利要求6所述的信息推荐方法,其特征在于,所述K值为所述社交关系网络包含的用户总个数的1.5%。
8.根据权利要求1至5任意一项所述的信息推荐方法,其特征在于,所述信息为商品。
9.根据权利要求8所述的信息推荐方法,其特征在于,所述根据所述K值及多个所述embedding特征向量,从各个所述用户中选取与所述当前用户关系满足预设条件的K个近邻用户包括:
计算所述当前用户依次与各个所述用户的embedding特征向量的欧式距离;
对多个所述欧式距离的值进行从小到大排序,前K个欧式距离值对应的K个用户为满足预设条件的K个所述近邻用户。
10.一种信息推荐装置,其特征在于,包括:
社交关系网络获取模块,用于获取当前用户在待信息推荐系统中的社交关系网络,根据node2vec算法学习所述社交关系网络中包含的各个用户的embedding特征表达,以获取每个所述用户的embedding特征向量;
近邻用户选取模块,用于根据所述社交关系网络中的用户总数设置KNN算法中的参数K值,根据所述K值及多个所述embedding特征向量,从各个所述用户中选取与所述当前用户关系满足预设条件的K个近邻用户,根据K个所述近邻用户的embedding特征向量生成embedding特征矩阵;
CNN算法学习模块,用于利用CNN算法在所述embedding特征矩阵上学习所述社交关系网络的潜在特征;
推荐参数生成模块,用于根据所述潜在特征,利用预设的算法对历史信息评分矩阵进行迭代交替运算,以获取所述当前用户的用户特征矩阵及信息特征矩阵,所述历史信息评分矩阵根据所述待信息推荐系统中多个用户的历史信息数据获取;
信息推荐模块,用于根据所述用户特征矩阵和/或所述信息特征矩阵,为所述当前用户进行信息推荐。
CN201710565977.1A 2017-07-12 2017-07-12 一种信息推荐方法及装置 Active CN107330115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710565977.1A CN107330115B (zh) 2017-07-12 2017-07-12 一种信息推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710565977.1A CN107330115B (zh) 2017-07-12 2017-07-12 一种信息推荐方法及装置

Publications (2)

Publication Number Publication Date
CN107330115A CN107330115A (zh) 2017-11-07
CN107330115B true CN107330115B (zh) 2020-04-28

Family

ID=60197625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710565977.1A Active CN107330115B (zh) 2017-07-12 2017-07-12 一种信息推荐方法及装置

Country Status (1)

Country Link
CN (1) CN107330115B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107866071A (zh) * 2017-11-03 2018-04-03 杭州电魂网络科技股份有限公司 游戏角色推荐方法和装置
CN107885841A (zh) * 2017-11-10 2018-04-06 郑州云海信息技术有限公司 一种微信小程序智慧推荐系统
CN108416607A (zh) * 2017-12-29 2018-08-17 南京邮电大学 一种基于旅客信任度的智能旅馆推荐方法
CN108320187B (zh) * 2018-02-02 2021-04-06 合肥工业大学 一种基于深度社交关系的推荐方法
CN108335177A (zh) * 2018-03-09 2018-07-27 京东方科技集团股份有限公司 购物推荐方法、用户端、服务端、设备和存储介质
CN108737491B (zh) * 2018-03-23 2020-09-01 腾讯科技(深圳)有限公司 信息推送方法和装置以及存储介质、电子装置
CN108596774B (zh) * 2018-04-24 2021-10-01 山东师范大学 基于深层次网络嵌入特征的社会化信息推荐算法及系统
CN108711075A (zh) * 2018-05-22 2018-10-26 阿里巴巴集团控股有限公司 一种产品推荐方法和装置
CN108765076B (zh) * 2018-05-24 2021-08-03 蜜芽宝贝(北京)网络科技有限公司 母婴内容推荐方法、装置及可读存储介质
CN109241424B (zh) * 2018-08-29 2019-08-27 陕西师范大学 一种推荐方法
CN109300057B (zh) * 2018-08-31 2021-08-10 合肥工业大学 基于社交用户隐特征表示的网络群体形成机制发现方法
CN109388731A (zh) * 2018-08-31 2019-02-26 昆明理工大学 一种基于深度神经网络的音乐推荐方法
CN109145050B (zh) * 2018-09-29 2022-04-01 智器云南京信息科技有限公司 一种计算设备
CN109495328B (zh) * 2018-12-30 2021-12-21 深圳市万通信息技术有限公司 一种保障网络通信可靠性的方法
CN109726790B (zh) * 2018-12-30 2020-11-13 苏州创力波科技有限公司 一种判断分布式标签工作状态的方法
CN110149541B (zh) * 2019-04-23 2021-08-03 腾讯科技(深圳)有限公司 视频推荐方法、装置、计算机设备及存储介质
CN112000819B (zh) * 2019-05-27 2023-07-11 北京达佳互联信息技术有限公司 多媒体资源推荐方法、装置、电子设备及存储介质
CN110134881A (zh) * 2019-05-28 2019-08-16 东北师范大学 一种基于多信息源图嵌入的好友推荐方法及系统
CN110442618B (zh) * 2019-07-25 2023-04-18 昆明理工大学 融合专家信息关联关系的卷积神经网络评审专家推荐方法
CN112449217B (zh) * 2019-09-02 2022-12-27 北京京东尚科信息技术有限公司 一种推送视频的方法、装置、电子设备和计算机可读介质
CN110608521A (zh) * 2019-09-27 2019-12-24 广东美的制冷设备有限公司 空调器、空调器系统及其控制方法
CN111144976B (zh) * 2019-12-10 2022-08-09 支付宝(杭州)信息技术有限公司 推荐模型的训练方法及装置
CN111210233B (zh) * 2020-01-02 2023-12-26 联想(北京)有限公司 用户特征确定方法、装置和电子设备
CN111368203A (zh) * 2020-03-09 2020-07-03 电子科技大学 一种基于图神经网络的新闻推荐方法及其系统
CN111581522B (zh) * 2020-06-05 2021-03-09 预见你情感(北京)教育咨询有限公司 一种基于用户身份辨别的社交分析方法
CN111737575B (zh) * 2020-06-19 2023-11-14 北京字节跳动网络技术有限公司 内容分发方法、装置、可读介质及电子设备
CN112380453B (zh) * 2021-01-15 2021-06-11 腾讯科技(深圳)有限公司 物品推荐方法、装置、存储介质及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916256A (zh) * 2010-07-13 2010-12-15 北京大学 综合行动者兴趣与网络拓扑的社区发现方法
CN106326367A (zh) * 2016-08-11 2017-01-11 华南师范大学 基于wnbi和rsvd混合协同推荐算法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9082082B2 (en) * 2011-12-06 2015-07-14 The Trustees Of Columbia University In The City Of New York Network information methods devices and systems
US9123259B2 (en) * 2013-03-14 2015-09-01 Microsoft Technology Licensing, Llc Discovering functional groups of an area

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916256A (zh) * 2010-07-13 2010-12-15 北京大学 综合行动者兴趣与网络拓扑的社区发现方法
CN106326367A (zh) * 2016-08-11 2017-01-11 华南师范大学 基于wnbi和rsvd混合协同推荐算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
node2vec: Scalable Feature Learning for Networks;Aditya Grover 等;《In KDD"16.ACM》;20160801;第855-864页 *

Also Published As

Publication number Publication date
CN107330115A (zh) 2017-11-07

Similar Documents

Publication Publication Date Title
CN107330115B (zh) 一种信息推荐方法及装置
You et al. Image-based appraisal of real estate properties
CN108287864B (zh) 一种兴趣群组划分方法、装置、介质及计算设备
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
CN109543109B (zh) 一种融合时间窗技术和评分预测模型的推荐算法
WO2017165774A1 (en) Systems and methods for multi-modal automated categorization
Hu et al. Bayesian personalized ranking based on multiple-layer neighborhoods
CN112861967A (zh) 基于异构图神经网络的社交网络异常用户检测方法及设备
Lee et al. How to impute missing ratings? Claims, solution, and its application to collaborative filtering
Cao et al. An improved collaborative filtering recommendation algorithm based on community detection in social networks
CN113918833B (zh) 通过社交网络关系的图卷积协同过滤实现的产品推荐方法
CN113761359B (zh) 数据包推荐方法、装置、电子设备和存储介质
CN107545471A (zh) 一种基于高斯混合的大数据智能推荐方法
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
CN113918832A (zh) 基于社交关系的图卷积协同过滤推荐系统
CN115270007B (zh) 一种基于混合图神经网络的poi推荐方法及系统
CN110727872A (zh) 基于隐式反馈进行不明确选择行为挖掘的方法及装置
Xu et al. Personalized product recommendation method for analyzing user behavior using DeepFM
CN112396492A (zh) 基于图注意力网络和双向长短期记忆网络的会话推荐方法
Yu et al. Spectrum-enhanced pairwise learning to rank
Gao et al. A link prediction algorithm based on low-rank matrix completion
Ardimansyah et al. Preprocessing matrix factorization for solving data sparsity on memory-based collaborative filtering
Chen et al. A hybrid recommender system for Gaussian mixture model and enhanced social matrix factorization technology based on multiple interests
Deng et al. A Trust-aware Neural Collaborative Filtering for Elearning Recommendation.
CN108389113B (zh) 一种协同过滤推荐方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant