CN109034960B - 一种基于用户节点嵌入的多属性推断的方法 - Google Patents

一种基于用户节点嵌入的多属性推断的方法 Download PDF

Info

Publication number
CN109034960B
CN109034960B CN201810763816.8A CN201810763816A CN109034960B CN 109034960 B CN109034960 B CN 109034960B CN 201810763816 A CN201810763816 A CN 201810763816A CN 109034960 B CN109034960 B CN 109034960B
Authority
CN
China
Prior art keywords
user
attribute
commodity
edge
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810763816.8A
Other languages
English (en)
Other versions
CN109034960A (zh
Inventor
罗绪成
谢敏锐
彭愈翔
李升阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201810763816.8A priority Critical patent/CN109034960B/zh
Publication of CN109034960A publication Critical patent/CN109034960A/zh
Application granted granted Critical
Publication of CN109034960B publication Critical patent/CN109034960B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Abstract

本发明公开了一种基于用户节点嵌入UNE(User Node Embedding)的多属性推断的方法,构建一种边带权重的用户‑商品二部有向图G并在其上进行有偏置的随机游走,从而获得用户‑商品序列;将所有用户‑商品序列放入CBOW模型中训练得到所有用户在低维空间的实值向量表示;构建一个多属性推断神经网络模型,利用用户的低维向量表示和对应的多属性表示作为训练集进行训练得到一个多属性推断模型。将需要推断用户属性的用户在低维空间的实值向量表示,输入到已经训练好的多属性推断模型中,从而得到该用户的多个属性值。本发明可应用于市场分析中定义不同的客户类型,深度挖掘用户属性信息以优化个性化推荐算法等与用户属性紧密相关的领域。

Description

一种基于用户节点嵌入的多属性推断的方法
技术领域
本发明属于图数据挖掘技术领域,更为具体来讲,涉及一种基于用户节点嵌入(User Node Embedding,简称UNE)的多属性推断方法。
背景技术
网络嵌入(也称网络表示学习)是指将网络中的节点嵌入到一个低维向量空间,使得该向量保留了节点在网络中的拓扑结构信息。节点嵌入使得自动学习节点的低维特征成为了可能,同时所学到的特征表示可以用于许多下游的机器学习任务,因此成为了近年来的研究热点之一。
现实世界中,很多的数据都可以映射成网络的图结构形式,如社交网络、引用网络、生物网络等。利用图的定义,我们可以将任意实体映射成图中的节点,实体之间的交互行为映射成图中的边,因此,网络嵌入也称为图嵌入。
属性推断是用来自动推断在线社交网络中用户的未知属性和潜在特质的主要技术手段,可应用于市场分析中定义不同的客户类型,深度挖掘用户属性信息以优化个性化的推荐方法,同时针对可能的用户属性推断攻击采取相应的保护措施。如推测用户的年龄、性别、地理位置、兴趣、职业等,这些信息可用于商品推荐、资讯推荐。
现有属性推断方法大多采用高维稀疏特征降维的方式来获得用户表示,忽略了用户之间本身的内在联系,学习到的用户表示具有一定的局限性。
发明内容
本发明的目的在于克服现有网络嵌入的不足,提出一种基于用户节点嵌入UNE(User Node Embedding)的多属性推断的方法,充分利用不同用户相互之间的内在联系来建模用户,学习到的用户向量具有更强的特征表达能力,以提高属性推断的效率和准确性。
为实现上述发明目的,本发明基于用户节点嵌入的多属性推断的方法,其特征在于,包括以下步骤:
(1)、用户多个属性的向量表示
根据需求,确定一个用户购买记录数据集用于用户属性推断,提取用户购买记录数据集中所有用户的属性信息并进行属性规范,得到各用户的多个属性,然后构建各用户的多个属性的one-hot向量表示;
(2)、利用已知的购买记录构建边带权的用户-商品二部有向图
利用用户购买记录数据集构建用户-商品二部有向图G=(V,E,W),其中,节点集V由用户购买记录数据集中所有用户构成的用户节点集U和用户购买记录数据集中所有商品构成的商品节点集P组成,即V=U∪P;若第i个用户ui(ui∈U)购买过第j个商品pj(pj∈P),则形成用户-商品二部有向图G中的两条有向边(ui,pj)和(pj,ui)E表示用户-商品二部有向图G中所有的有向边构成的边集;权重集W为边集E中每条边的权重集合;
对于每条边的权重,采取以下步骤获取:
2.1)、对于第i个用户ui到第j个商品pj的有向边(ui,pj)而言,首先统计用户ui购买商品pj的次数cij以及用户ui购买过的所有商品的总次数ci,则有向边(ui,pj)对应的权重计算公式如下:
Figure BDA0001728537330000021
其中,|U|表示用户-商品二部有向图G中所有的用户节点数,|Uj|表示购买过商品pj的用户节点数;
2.2)、对于第j个商品pj到第i个用户ui的有向边(pj,ui)而言,对应的权重计算公式如下:
Figure BDA0001728537330000022
其中,cji表示商品pj被用户ui购买的次数,cj表示商品pj被所有用户购买的总次数,|P|表示用户-商品二部有向图G中所有的商品节点数,|Pi|表示被用户ui购买过的商品节点数;
2.3)、将每个用户所有对应边的权重和每个商品对应所有边的权重进行归一化处理,即:
Figure BDA0001728537330000023
Figure BDA0001728537330000031
其中,P(i)表示用户ui购买过的所有商品列表,U(j)表示购买过商品pj的所有用户列表;
(3)、利用图节点嵌入算法学习用户-商品二部有向图G中所有用户节点的低维向量表示
3.1)、在构建的用户-商品二部有向图G上进行有偏置的随机游走,从而获得节点的上下文语义序列,若起始节点为用户ui时,则所有与用户ui构成边的商品节点集P(i)中,权重越大的边被访问的概率越大,即
Figure BDA0001728537330000032
越大,则pk成为下一跳节点的概率越大;
以每个用户节点为起始节点,进行m趟有偏置的随机游走,最终得到多条固定长度为m的用户-商品序列;
3.2)、利用Word2vec的连续词袋(CBOW)模型,将所有用户-商品序列放入CBOW模型中训练得到所有用户在低维空间的实值向量表示;
(4)、训练得到一个多属性推断模型
用步骤(3)得到的用户在低维空间的实值向量以及步骤(1)中得到的用户对应的多个属性的one-hot向量对一个神经网络进行训练,所述神经网络是一个多任务学习框架,网络的最后一层对应多个属性推断任务的输出,每个任务单独训练自己的参数,其余各层则共享参数,最终得到一个多属性推断模型;
(5)、推断用户属性
将需要推断用户属性的用户在低维空间的实值向量表示,输入到步骤(4)训练好的多属性推断模型中,通过各层网络计算,最终输出用户多个属性的one-hot向量表示,再根据步骤(1)得到该用户的多个属性。
本发明的目的是这样实现的。
本发明基于用户节点嵌入UNE(User Node Embedding)的多属性推断的方法,可从电商平台用户中提取其购买记录来同时推断用户的多个属性。根据推断属性需求,提取一个电商平台网站中所有用户的多个属性以及他们的购买记录进行预处理,利用已知的用户购买记录数据集构建用户和商品的节点集V,边集E以及每条边的权重W组成的用户-商品二部有向图G;在构建的有向权重二部图G上进行有偏置的随机游走,从而获得节点的上下文语义序列即用户-商品序列;将所有用户-商品序列放入CBOW模型中训练得到所有用户在低维空间的实值向量表示;再构建用户多个属性的one-hot向量表示,并构建一个神经网络模型进行训练,得到一个多属性推断模型。将需要推断用户属性的用户在低维空间的实值向量表示,输入到已经训练好的多属性推断模型中,计算得出用户多个属性的one-hot向量表示,从而得到该用户的多个属性。
本发明可应用于市场分析中定义不同的客户类型,深度挖掘用户属性信息以优化个性化的推荐方法,同时针对可能的属性推断攻击采取相应的保护措施。
本发明具有以下有益效果:
(1)、本发明仅基于电商平台用户的购买记录来推断用户属性,只需提取用户的购买记录,无需获取额外的用户行为特征数据,提高了用户属性推断方法的效率和可移植性,同时减少了资源的消耗;
(2)、本发明实现了同时推断多个用户属性,考虑到用户不同属性之间本身存在的相关关系,在嵌入过程中,能充分利用不同用户相互之间的内在联系来建模用户,学习到的用户向量具有更强的特征表达能力。这种用户节点嵌入方法表示包含更丰富的属性信息,提高了属性推断的准确度;
(3)、本发明根据已知的用户购买记录,构建用户-商品二部有向图,然后在构建的有向权重二部图上进行有偏置的随机游走,获得每个用户节点的上下文语义序列集,最后将所有用户-商品序列放入CBOW模型中训练得到所有用户在低维空间的实值向量表示,这种节点嵌入方法形成的用户节点向量能充分利用不同用户相互之间的内在联系,具有更强的特征表达能力。使得仅基于用户购买记录的多重属性推断成为可能。
附图说明
图1是本发明基于用户节点嵌入的多属性推断的方法一种具体实施方式的流程图;
图2是本发明中用户节点嵌入UNE模型框架图;
图3是本发明多属性推断模型框架图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
一、基本原理
对于一个电商平台的用户来说,两个用户购买过同一件商品,则可以认为这两个用户之间存在一定的相似性,两个用户购买的相同商品越多,则这个两个用户的相似度越高。比如淘宝中用户1购买了物品1和2,用户2同时也购买了物品1和2,则用户1、2的属性可能相同或相近。直观上,若两个用户对商品的购买偏好越接近,则它们在语料库中共现的概率越大,最终训练得到的两个用户多个属性的one-hot向量也越相似。因此,本发明考虑利用用户的购买记录这一表现来进行用户的属性推断。
二、属性推断方法
在本实施例中,如图1所示,本发明基于用户节点嵌入UNE的多属性推断的方法包括五个步骤:用户多个属性的向量表示(步骤S1)、利用已知的购买记录构建用户-商品二部有向图(步骤S2)、学习用户-商品二部有向图中所有用户在低维空间的实值向量表示(步骤S3)、训练得到一个多属性推断模型(步骤S4)、推断用户属性(步骤S5)。
步骤S1:用户多个属性的向量表示
根据需求,确定一个用户购买记录数据集用于用户属性推断,提取用户购买记录数据集中所有用户的属性信息并进行属性规范,得到各用户的多个属性,然后构建各用户的多个属性的one-hot向量表示。
在本实施例中,将用户属性规范为P个,对于用户的第p个属性ap,统计其属性值个数tp,将用户的每个属性ap(p=1,2,...,P)(单值属性)以one-hot的形式编码,形成每个属性的向量表示
Figure BDA0001728537330000051
其中,
Figure BDA0001728537330000052
为第p个属性ap的tp个属性值的one-hot向量表示构成的集合。
在本实施例中,用户购买记录数据集来源于一个名为BeiRen的电商平台下的数据集(http://www.bigdatalab.ac.cn/benchmark/bm/dd?data=Beiren),该数据集包含一段时间内57693个用户对于61087个物品的购买记录,同时每个用户都拥有性别、婚姻状况、年龄、收入水平、教育等级这五个人口属性,每个属性都为单值属性,即对于每个属性而言,一个用户只能有一个对应的属性值。在本实施例中,用户属性信息统计如表1所示。
Figure BDA0001728537330000061
表1
由于用户的年龄和收入都属于连续型属性,分别将其划分为四个区间段,因此,年龄和收入水平均有四个可能的属性值,每个用户只有对应属性的一个属性值。将用户的性别、婚姻状况、年龄、收入水平和教育等级这五个属性分别映射成一个one-hot向量,每个用户则拥有五个不同的属性向量表示。
经过one-hot编码,最终获得的用户属性向量模型attriModel如下所示:
attriModel=[[-1,1.0,0.0,0.0,1.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,1.0,0.0,0.0,0.0]
[-2,1.0,0.0,0.0,1.0,0.0,0.0,0.0,1.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0]
......
[-57692,1.0,0.0,1.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0]
[-57693,0.0,1.0,1.0,0.0,0.0,1.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0]
]。
其中,每个括号的第一个数字为用户的编号。
步骤S2:利用已知的购买记录构建用户-商品二部有向图
利用用户购买记录数据集构建用户-商品二部有向图G=(V,E,W),其中,节点集V由用户购买记录数据集中所有用户构成的用户节点集U和用户购买记录数据集中所有商品构成的商品节点集P组成,即V=U∪P;若第i个用户ui(ui∈U)购买过第j个商品pj(pj∈P),则形成用户-商品二部有向图G中的两条有向边(ui,pj)和(pj,ui),E表示用户-商品二部有向图G中所有的有向边构成的边集;权重集W为边集E中每条边的权重集合。
对于每条边的权重,采取以下步骤获取:
2.1)、对于第i个用户ui到第j个商品pj的有向边(ui,pj)而言,首先统计用户ui购买商品pj的次数cij以及用户ui购买过的所有商品的总次数ci,则有向边(ui,pj)对应的权重计算公式如下:
Figure BDA0001728537330000071
其中,|U|表示用户-商品二部有向图G中所有的用户节点数,|Uj|表示购买过商品pj的用户节点数;
其中,
Figure BDA0001728537330000072
表示对于用户ui而言商品pj所占的权重,该式中将所有商品的重要性同等对待,加1的目的是为了防止该权重为0;则
Figure BDA0001728537330000073
表示商品pj对于所有用户的重要性,若大部分用户都购买过商品pj,说明该商品属于大众消费,因减小该商品最终对于用户ui的权重,上式中分母加1的目的是为了防止整个分式出现0的情况。
2.2)、对于第j个商品pj到第i个用户ui的有向边(pj,ui)而言,对应的权重计算公式如下:
Figure BDA0001728537330000074
其中,cji表示商品pj被用户ui购买的次数,cj表示商品pj被所有用户购买的总次数,|P|表示用户-商品二部有向图G中所有的商品节点数,|Pi|表示被用户ui购买过的商品节点数。
其中,
Figure BDA0001728537330000075
表示对于商品pj而言用户ui所占的权重,该式中将所有用户的重要性同等对待,加1的目的是为了防止该权重为0;则
Figure BDA0001728537330000076
表示用户ui对于所有商品的重要性,若大部分商品都被用户ui购买过商品pj,说明该用户属于购买商品较多这,因减小该用户最终对于商品pj的权重,上式中分母加1的目的是为了防止整个分式出现0的情况。
2.3)、将每个用户所有对应边的权重和每个商品对应所有边的权重进行归一化处理,即:
Figure BDA0001728537330000081
Figure BDA0001728537330000082
其中,P(i)表示用户ui购买过的所有商品列表,U(j)表示购买过商品pj的所有用户列表。
图2是本发明中用户节点嵌入UNE模型框架图。
在本实施例中,如图1所示,首先按照上述方法构建用户-商品二部有向图,其为有向权重二部图,然后进行有偏置的随机游走,从而获得每个用户节点的上下文语义序列集即用户-商品序列,最后将所有用户-商品序列放入CBOW模型中训练得到所有用户在低维空间的实值向量表示。
步骤S3:利用图节点嵌入算法学习用户-商品二部有向图G中所有用户节点的低维向量表示
在构建的用户-商品二部有向图G上进行有偏置的随机游走,从而获得节点的上下文语义序列,若起始节点为用户ui时,则所有与用户ui构成边的商品节点集P(i)中,权重越大的边被访问的概率越大,即
Figure BDA0001728537330000083
越大,则pk成为下一跳节点的概率越大;以每个用户节点为起始节点,进行m趟有偏置的随机游走,最终得到多条固定长度为m的用户-商品序列。
在本实施例中,最终获得的序列集WalkList如下所示:
WalkList=[-1,27456,-20293,35274,...,-18609,15281,-36885,53110
-2,42072,-45532,34216,...,-44893,16588,-23179,19820
......
-38752,43581,-7298,10893,...,54346,-40810,25134,-6304
-41061,19041,-56768,44136,...,-55687,52741,-11180,17226]
利用Word2vec的连续词袋(CBOW)模型,将所有用户-商品序列放入CBOW模型中训练得到所有用户在低维空间的实值向量表示。
本次实施例中,最终所有用户在低维空间的实值向量表示如下所示:
UModel=[[-1,-0.480352,-0.378879,0.265173,0.136623,-0.246036,...,0.281629,-0.109039,0.339801,0.049934,0.019654]
[-2.0,-1.133038,0.062593,-0.402204,-0.675431,-1.197359,...,0.988778,-1.206643,0.992456,-0.590323,-0.173576]
......
[-57692.0,-0.402704,-0.425099,-0.442212,-0.848911,-0.31584,...,0.319322,-0.248001,0.064863,0.204108,0.249493]
[-57693.0,-0.897837,-0.052606,-0.42653,-0.639667,-0.683501,...,0.590713,-0.583492,0.101694,-0.24164,-0.062689]
]。
步骤S4、训练得到一个多属性推断模型
用步骤S3得到的用户在低维空间的实值向量以及步骤S1中得到的用户对应的多个属性的one-hot向量对一个神经网络进行训练,得到一个多属性推断模型。所述的神经网络是一个多任务学习框架,网络的最后一层对应多个属性推断任务的输出,每个任务单独训练自己的参数,其余各层则共享参数。
在本实施例中,模型训练采用随机梯度下降(SGD)算法,将用户的低维向量表示作为多属性推断模型的输入,对应的多个属性向量作为输出,模型的损失函数采用softmax交叉熵函数,每个任务对应一个交叉熵函数,最终的损失由P个属性推断的损失和正则化项相加构成,联合训练如下目标函数:
Figure BDA0001728537330000091
其中,
Figure BDA0001728537330000092
表示第p个属性推断任务的交叉熵损失,Lreg表示L2-范数正则化项,用于防止神经网络的过拟合,α是超参数,用于平衡正则化项在整个目标函数中所占权重。其中,交叉熵损失和正则化项的定义如下:
Figure BDA0001728537330000093
Figure BDA0001728537330000101
其中,
Figure BDA0001728537330000102
表示用户ui第p个属性对应的属性编码,yj'(j=1,2,...,tp)为实际神经网络的输出;M为神经网络的层数,W(k)(k=1,2,...,M)和b(k)(k=1,2,...,M)对应神经网络各层的权重和偏置参数。
利用反向传播(BP)算法进行参数更新,为了防止过拟合,加入了Droupout训练模型,最终学习到用户的低维向量表示和用户的多个属性向量之间的非线性映射函数。对于一个未知属性的用户,可利用训练好的推断模型同时推断该用户的多个属性。
步骤S5:推断用户属性
将需要推断用户属性的用户在低维空间的实值向量表示,输入到步骤S4训练好的多属性推断模型中,通过各层网络计算,最终输出用户多个属性的one-hot向量表示,再根据步骤S1得到该用户的多个属性。
图3是本发明多属性推断模型框架图。
如图3所示,要同时推断用户的P个属性,每个属性有tp(p=1,2,...,P)个可能的属性值,将用户的每个属性ap(p=1,2,...,P)(单值属性)以one-hot的形式编码,形成每个属性的向量表示
Figure BDA0001728537330000103
于是,如图2所示,多属性推断模型框架采用随机梯度下降(SGD)算法训练模型,将部分用户的低维向量表示作为多属性推断模型的输入,对应的多个属性向量作为输出。训练完成后,输入一个未知属性的用户,可推断该用户的多个属性信息。如此便可实现用户的多重属性推断。
三、实例验证
在上述实施例中,采用本发明所阐述的方法推断了多组不同的训练比/测试比进行实验,同时分别计算了各个属性推断的准确率,本次实施例的多组实验结果平均值如表2所示:
Figure BDA0001728537330000104
Figure BDA0001728537330000111
表2
表2表明仅利用用户的行为数据即可自动地学习用户特征表示,无需人工手动提取特征,且学到的用户特征表示包含丰富的属性信息,相比其它需要利用大量用户行为特征信息的方法而言,本发明的方法具有很好的移植性和较高的推断准确度。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (2)

1.一种基于用户节点嵌入的多属性推断的方法,其特征在于,包括以下步骤:
(1)、用户多个属性的向量表示
根据需求,确定一个用户购买记录数据集用于用户属性推断,提取用户购买记录数据集中所有用户的属性信息并进行属性规范,得到各用户的多个属性,然后构建各用户的多个属性的one-hot向量表示;
(2)、利用已知的购买记录构建边带权的用户-商品二部有向图
利用用户购买记录数据集构建用户-商品二部有向图G=(V,E,W),其中,节点集V由用户购买记录数据集中所有用户构成的用户节点集U和用户购买记录数据集中所有商品构成的商品节点集P组成,即V=U∪P;若第i个用户ui(ui∈U)购买过第j个商品pj(pj∈P),则形成用户-商品二部有向图G中的两条有向边(ui,pj)和(pj,ui),E表示用户-商品二部有向图G中所有的有向边构成的边集;权重集W为边集E中每条边的权重集合;
对于每条边的权重,采取以下步骤获取:
2.1)、对于第i个用户ui到第j个商品pj的有向边(ui,pj)而言,首先统计用户ui购买商品pj的次数cij以及用户ui购买过的所有商品的总次数ci,则有向边(ui,pj)对应的权重计算公式如下:
Figure FDA0003514647330000011
其中,|U|表示用户-商品二部有向图G中所有的用户节点数,|Uj|表示购买过商品pj的用户节点数;
2.2)、对于第j个商品pj到第i个用户ui的有向边(pj,ui)而言,对应的权重计算公式如下:
Figure FDA0003514647330000012
其中,cji表示商品pj被用户ui购买的次数,cj表示商品pj被所有用户购买的总次数,|P|表示用户-商品二部有向图G中所有的商品节点数,|Pi|表示被用户ui购买过的商品节点数;
2.3)、将每个用户所有对应边的权重和每个商品对应所有边的权重进行归一化处理,即:
Figure FDA0003514647330000021
Figure FDA0003514647330000022
其中,P(i)表示用户ui购买过的所有商品列表,U(j)表示购买过商品pj的所有用户列表;
(3)、利用图节点嵌入算法学习用户-商品二部有向图G中所有用户节点的低维向量表示
3.1)、在构建的用户-商品二部有向图G上进行有偏置的随机游走,从而获得节点的上下文语义序列,若起始节点为用户ui时,则所有与用户ui构成边的商品节点集P(i)中,权重越大的边被访问的概率越大,即
Figure FDA0003514647330000023
越大,则pk成为下一跳节点的概率越大;
以每个用户节点为起始节点,进行m趟有偏置的随机游走,最终得到多条固定长度为m的用户-商品序列;
3.2)、利用Word2vec的连续词袋(CBOW)模型,将所有用户-商品序列放入CBOW模型中训练得到所有用户在低维空间的实值向量表示;
(4)、训练得到一个多属性推断模型
用步骤(3)得到的用户在低维空间的实值向量以及步骤(1)中得到的用户对应的多属性one-hot向量对一个神经网络进行训练,该网络是一个多任务学习框架,网络的最后一层对应多个属性推断任务的输出,每个任务单独训练自己的参数,其余各层则共享参数,最终得到一个多属性预测模型;
(5)、推断用户属性
将需要推断用户属性的用户在低维空间的实值向量表示,输入到步骤(4)训练好的多属性推断模型中,通过各层网络计算,最终输出用户多个属性的one-hot向量表示,再根据步骤(1)得到该用户的多个属性。
2.根据权利要求1所述的基于用户节点嵌入的多属性推断的方法,其特征在于,所述步骤(4)中,采用随机梯度下降(SGD)算法进行训练。
CN201810763816.8A 2018-07-12 2018-07-12 一种基于用户节点嵌入的多属性推断的方法 Active CN109034960B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810763816.8A CN109034960B (zh) 2018-07-12 2018-07-12 一种基于用户节点嵌入的多属性推断的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810763816.8A CN109034960B (zh) 2018-07-12 2018-07-12 一种基于用户节点嵌入的多属性推断的方法

Publications (2)

Publication Number Publication Date
CN109034960A CN109034960A (zh) 2018-12-18
CN109034960B true CN109034960B (zh) 2022-09-06

Family

ID=64641994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810763816.8A Active CN109034960B (zh) 2018-07-12 2018-07-12 一种基于用户节点嵌入的多属性推断的方法

Country Status (1)

Country Link
CN (1) CN109034960B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008348B (zh) * 2019-01-29 2023-07-11 创新先进技术有限公司 结合节点和边进行网络图嵌入的方法和装置
CN110059254A (zh) * 2019-04-24 2019-07-26 秒针信息技术有限公司 一种资讯推送方法及装置
CN110263250B (zh) * 2019-06-12 2023-04-28 深圳前海微众银行股份有限公司 一种推荐模型的生成方法及装置
CN110750598B (zh) * 2019-09-18 2022-07-01 精锐视觉智能科技(深圳)有限公司 一种物品标签预测方法、装置、终端设备及存储介质
CN111695042B (zh) * 2020-06-10 2023-04-18 湖南湖大金科科技发展有限公司 基于深度游走和集成学习的用户行为预测方法及系统
CN112270570B (zh) * 2020-11-03 2022-03-11 重庆邮电大学 一种基于特征组合与表示学习的点击转化率预测方法
CN112783990B (zh) * 2021-02-02 2023-04-18 贵州大学 一种基于图数据属性推理方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254028A (zh) * 2011-07-22 2011-11-23 青岛理工大学 一种集成属性和结构相似性的个性化商品推荐方法和系统
CN103812872A (zh) * 2014-02-28 2014-05-21 中国科学院信息工程研究所 一种基于混合狄利克雷过程的网络水军行为检测方法及系统
CN103955535A (zh) * 2014-05-14 2014-07-30 南京大学镇江高新技术研究院 一种基于元路径的个性化推荐方法及系统
CN104376083A (zh) * 2014-11-18 2015-02-25 电子科技大学 一种基于关注关系和多用户行为的图推荐方法
CN105894327A (zh) * 2016-04-01 2016-08-24 昆明理工大学 一种在线商品评价方法
CN107633263A (zh) * 2017-08-30 2018-01-26 清华大学 基于边的网络图嵌入方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6760084B2 (ja) * 2015-02-09 2020-09-23 日本電気株式会社 分析用情報表示システム、方法およびプログラム
US9977797B2 (en) * 2015-09-28 2018-05-22 Salesforce.Com, Inc. Combined directed graphs
CN105718573B (zh) * 2016-01-20 2018-12-25 电子科技大学 一种针对用户兴趣的关注关系提取及标注方法
CN106096653B (zh) * 2016-06-12 2019-10-22 中国科学院自动化研究所 基于跨平台用户社交多媒体行为的人口属性推断方法
CN106055710A (zh) * 2016-07-01 2016-10-26 传线网络科技(上海)有限公司 基于视频的商品推荐方法及装置
CN107145977B (zh) * 2017-04-28 2020-07-31 电子科技大学 一种对在线社交网络用户进行结构化属性推断的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254028A (zh) * 2011-07-22 2011-11-23 青岛理工大学 一种集成属性和结构相似性的个性化商品推荐方法和系统
CN103812872A (zh) * 2014-02-28 2014-05-21 中国科学院信息工程研究所 一种基于混合狄利克雷过程的网络水军行为检测方法及系统
CN103955535A (zh) * 2014-05-14 2014-07-30 南京大学镇江高新技术研究院 一种基于元路径的个性化推荐方法及系统
CN104376083A (zh) * 2014-11-18 2015-02-25 电子科技大学 一种基于关注关系和多用户行为的图推荐方法
CN105894327A (zh) * 2016-04-01 2016-08-24 昆明理工大学 一种在线商品评价方法
CN107633263A (zh) * 2017-08-30 2018-01-26 清华大学 基于边的网络图嵌入方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Directed-Hypergraph Based E-Learning Process Modeling Supporting Dynamic-Personalized-Combined Resource Optimization;Xuedong Sun等;《2014 International Conference on Digital Home》;20141229;324-330 *
一种基于结构及节点特征相似度的社交网络图数据去匿名方法;王照永等;《现代计算机(专业版)》;20180228;14-20 *

Also Published As

Publication number Publication date
CN109034960A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN109034960B (zh) 一种基于用户节点嵌入的多属性推断的方法
CN111428147B (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN110956497B (zh) 一种电子商务平台用户重复购买行为预测方法
Kosinski et al. Mining big data to extract patterns and predict real-life outcomes.
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及系统
Li et al. Hierarchical bipartite graph neural networks: Towards large-scale e-commerce applications
CN107145977B (zh) 一种对在线社交网络用户进行结构化属性推断的方法
CN102902691B (zh) 推荐方法及系统
CN111784455A (zh) 一种物品推荐方法及推荐设备
CN106933996A (zh) 一种采用深度特征匹配的推荐方法
CN112487199B (zh) 一种基于用户购买行为的用户特征预测方法
CN110737730B (zh) 基于无监督学习的用户分类方法、装置、设备及存储介质
CN106384259A (zh) 一种融合社交信息的推荐系统解决方法
CN112380453B (zh) 物品推荐方法、装置、存储介质及设备
CN110704692A (zh) 基于图嵌入的员工离职行为预测方法及装置
Yadagiri et al. A non-parametric approach to the multi-channel attribution problem
Kim et al. seq2vec: Analyzing sequential data using multi-rank embedding vectors
CN114298851A (zh) 基于图表征学习的网络用户社交行为分析方法、装置及存储介质
CN116304299A (zh) 一种融和用户兴趣演化和梯度提升算法的个性化推荐方法
Li Accurate digital marketing communication based on intelligent data analysis
CN113409157B (zh) 一种跨社交网络用户对齐方法以及装置
CN111429161A (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN111178986A (zh) 用户-商品偏好的预测方法及系统
CN112560105A (zh) 保护多方数据隐私的联合建模方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant