CN112288195A - 基于好友行为预测中心用户行为的方法、装置和电子设备 - Google Patents

基于好友行为预测中心用户行为的方法、装置和电子设备 Download PDF

Info

Publication number
CN112288195A
CN112288195A CN202011328501.4A CN202011328501A CN112288195A CN 112288195 A CN112288195 A CN 112288195A CN 202011328501 A CN202011328501 A CN 202011328501A CN 112288195 A CN112288195 A CN 112288195A
Authority
CN
China
Prior art keywords
local
subgraph
representation
graph
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011328501.4A
Other languages
English (en)
Other versions
CN112288195B (zh
Inventor
张帆进
唐杰
刘雪怡
侯振宇
谢若冰
庄凯
张旭
林乐宇
刘德兵
仇瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhipu Huazhang Technology Co ltd
Original Assignee
Beijing Zhiyuan Artificial Intelligence Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhiyuan Artificial Intelligence Research Institute filed Critical Beijing Zhiyuan Artificial Intelligence Research Institute
Priority to CN202011328501.4A priority Critical patent/CN112288195B/zh
Publication of CN112288195A publication Critical patent/CN112288195A/zh
Application granted granted Critical
Publication of CN112288195B publication Critical patent/CN112288195B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于社交圈好友行为预测中心用户行为的方法和电子设备。该方法为:首先生成局部子图和第一输入特征,然后将第一输入特征在局部子图调制后的谱空间上进行传播,得到第二输入特征,再然后采用图表示学习方法编码局部子图中的分层子图,生成局部子图的分层子图的表示,进而得到局部子图的表示,最后,将所述局部子图的表示经过全连接网络生成所述中心用户行为的二维预测结果。采用本发明的技术方案,不仅可以实现端到端的训练,而且,实验表明预测结果的精准度更高。

Description

基于好友行为预测中心用户行为的方法、装置和电子设备
技术领域
本发明涉及推荐技术领域,尤其涉及一种基于社交圈好友行为预测中心用户行为的方法和电子设备。
背景技术
在线社交网络在人们日常生活中的应用,使得用户不仅可以很容易看到好友在社交网络上的动态,其行为也会或多或少的受到社交圈的影响。基于此,近些年涌现了很多结合社交网络的推荐和广告系统。一方面,很多推荐引擎隐式地利用社交关系和用户的喜好为用户推荐产品;另一方面,一些在线社交平台例如Facebook,微信等,显式地利用用户社交关系,为每个用户展示其好友喜欢或分享的内容。例如,在微信看一看应用中,用户可以看到其朋友“在看”(表示喜欢和分享)的内容,用户可以有不同的反馈,如“在看”,“点击”或者没有反馈。因此,基于社交圈好友的行为预测中心用户行为是推荐和广告系统中一个广泛存在的问题。
目前,对中心用户行为的预测主要包括两类方法,一类方法是利用人工设计的用户特征和网络特征,通过分类器(如逻辑回归、支持向量机)预测中心用户的行为。例如,"Social influence locality for modeling retweeting behaviors."(In IJCAI,vol.13,pp.2761-2767.2013.)定义了基于随机游走的用户之间成对相似度,以及基于用户局部子图的连通分量数量的结构相似度,之后用逻辑回归对中心用户的行为进行分类。另一类方法是利用神经网络进行端到端的预测,在DeepInf方法中,以用户的局部子图作为输入,经过图神经网络(例如图注意力网络)去学习用户的隐层表示,之后基于中心用户的隐层表示进行预测。其中,第一类方法依赖于人工设计的特征,第二类方法的设计动机没有考虑社交影响力的特性,如结构影响力,所以,两类方法的预测效果都未能达到满意的效果。
发明内容
为了解决现有技术中存在的问题,本发明提供了如下技术方案。
本发明的一方面提供了一种基于好友行为预测中心用户行为的方法,包括:
根据社交网络上所述中心用户的好友关系和好友行为生成局部子图,所述局部子图中的每个结点表示一个用户;
为所述局部子图中的每个结点生成第一输入特征;
将所述第一输入特征在所述局部子图调制后的谱空间上进行传播,生成第二输入特征;
以第二输入特征为输入,采用图表示学习方法编码所述局部子图中的分层子图,生成所述局部子图的分层子图的表示;
将各分层子图的表示进行拼接,得到所述局部子图的表示;
将所述局部子图的表示经过全连接网络生成所述中心用户行为的二维预测结果。
优选地,以所述中心用户为初始结点,根据所述中心用户的好友关系和好友行为采用宽度优先搜索(BFS)方式采样,生成所述局部子图。
优选地,所述第一输入特征由以下部分拼接而成:结点的网络嵌入表示、结点对应用户的个人画像特征和在社交网络上的结构特征、结点对应用户的活跃状态以及是否为中心用户的表示。
优选地,所述将所述第一输入特征在所述局部子图调制后的谱空间上进行传播,生成第二输入特征,包括:
采用如下公式调制所述局部子图的拉普拉斯矩阵:
Figure BDA0002795093190000031
Figure BDA0002795093190000032
其中,
Figure BDA0002795093190000033
是调制后的拉普拉斯矩阵,λj是拉普拉斯矩阵的第j个特征值,U是特征向量矩阵,g是调制器函数,μ∈[0,2],θ是一个可训练的标量参数;
采用如下公式将所述第一输入特征在调制后的谱空间上进行传播
Figure BDA0002795093190000034
其中,
Figure BDA0002795093190000035
是在谱空间传播后生成的第二输入特征的矩阵,X是第一输入特征的矩阵,A是局部子图的邻接矩阵,m是局部子图中结点的数量,Im是单位矩阵,D是度数矩阵。
优选地,所述以第二输入特征为输入,采用图表示学习方法编码所述局部子图中的分层子图,生成所述局部子图的分层子图的表示,包括:
生成所述局部子图中的结点表示;
学习得到一个分配矩阵;
利用所述分配矩阵和结点表示将所述局部子图转化为分层子图;
生成各分层子图中的结点表示;
对各分层子图中的结点表示进行池化操作,得到各分层子图的表示。
优选地,利用图神经网络GNN生成所述局部子图中的结点表示和各分层子图中的结点表示。
优选地,还包括:
将所述二维预测结果与所述中心用户的真实行为比较,根据比较结果利用交叉熵损失函数和优化器进行训练。
本发明第二方面提供了一种基于好友行为预测中心用户行为的装置,包括:
局部子图生成模块,用于根据社交网络上所述中心用户的好友关系和好友行为生成局部子图,所述局部子图中的每个结点表示一个用户;
第一输入特征生成模块,用于为所述局部子图中的每个结点生成第一输入特征;
第二输入特征生成模块,用于将所述第一输入特征在所述局部子图调制后的谱空间上进行传播,生成第二输入特征;
分层子图表示生成模块,用于以第二输入特征为输入,采用图表示学习方法编码所述局部子图中的分层子图,生成所述局部子图的分层子图的表示;
局部子图表示生成模块,用于将各分层子图的表示进行拼接,得到所述局部子图的表示;
二维预测结果生成模块,用于将所述局部子图的表示经过全连接网络生成所述中心用户行为的二维预测结果。
本发明第三方面还提供了一种存储器,存储有多条指令,所述指令用于实现上述的方法。
本发明第四方面还提供了一种电子设备,包括处理器和与所述处理器连接的存储器,所述存储器存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如上述的方法。
本发明的有益效果是:本发明提供的技术方案中,首先生成局部子图和第一输入特征,然后将第一输入特征在局部子图调制后的谱空间上进行传播,得到第二输入特征,再然后,采用图表示学习方法编码局部子图中的分层子图,生成局部子图的分层子图的表示,进而得到局部子图的表示,最后,将所述局部子图的表示经过全连接网络生成所述中心用户行为的二维预测结果。本发明中,采用分层子图表示中心用户的不同维度的小社交圈,符合中心用户行为和其局部子图的结构具有相关性的规律。所以,采用本发明的技术方案,不仅可以实现端到端的训练,而且,实验表明预测结果的精准度更高。
附图说明
图1为本发明所述基于好友行为预测中心用户行为的方法流程示意图;
图2为本发明实施例所述一个局部子图的示例;
图3为本发明实施例所述将图层次化聚类的过程示意图;
图4为本发明所述基于好友行为预测中心用户行为的装置结构示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
本发明提供的方法可以在如下的终端环境中实施,该终端可以包括一个或多个如下部件:处理器、存储器和显示屏。其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行以实现下述实施例所述的方法。
处理器可以包括一个或者多个处理核心。处理器利用各种接口和线路连接整个终端内的各个部分,通过运行或执行存储在存储器内的指令、程序、代码集或指令集,以及调用存储在存储器内的数据,执行终端的各种功能和处理数据。
存储器可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。存储器可用于存储指令、程序、代码、代码集或指令。
显示屏用于显示各个应用程序的用户界面。
除此之外,本领域技术人员可以理解,上述终端的结构并不构成对终端的限定,终端可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端中还包括射频电路、输入单元、传感器、音频电路、电源等部件,在此不再赘述。
实施例一
如图1所示,本发明实施例提供了一种基于好友行为预测中心用户行为的方法,包括:
S101,根据社交网络上所述中心用户的好友关系和好友行为生成局部子图,所述局部子图中的每个结点表示一个用户;
S102,为所述局部子图中的每个结点生成第一输入特征;
S103,将所述第一输入特征在所述局部子图调制后的谱空间上进行传播,生成第二输入特征;
S104,以第二输入特征为输入,采用图表示学习方法编码所述局部子图中的分层子图,生成所述局部子图的分层子图的表示;
S105,将各分层子图的表示进行拼接,得到所述局部子图的表示;
S106,将所述局部子图的表示经过全连接网络生成所述中心用户行为的二维预测结果。
本发明中,为了构建一种社交影响力驱动的用户行为预测模型,首先对大规模用户日志数据进行了分析,结果发现用户行为(如点击、转发)和其局部子图连通分量的个数有较强相关性,当子图被清洗(如去除子图中的孤立结点)后,这种相关性变得更强。
其中,局部子图连通分量的个数可以记为#CC。比如,在微信看一看数据上,假设在活跃好友数量一定的情况下(活跃代表好友和展示内容有交互关系),#CC越大,中心用户转发该内容的概率越小,而点击该内容的概率更大。#CC代表了中心用户具有的不同维度的小社交圈的数量。基于此,本发明采用分层的图表示方法来表示这些小社交圈,采用这种方式,使得相似的结点依次聚集成小的子图,聚集后的子图可以对应于连通分量。另外,研究发现局部子图中有些边缘结点对中心用户的影响可能是比较小的,因此本发明中通过将用户的特征在其局部子图调制后的谱空间进行传播的方式去除噪声,对局部子图进行清洗,得到它的1-core子图(1-core子图要求得到的子图中的结点至少有一条邻边),使得基于1-core子图,中心用户的行为(转发和点击)和#CC的相关性变得更强。所以,采用本发明提供的方法,不仅可以实现端到端的训练,实验表明该方法的预测效果优于现有的预测方法。
本发明中,可以将要解决的问题形式化定义为,令
Figure BDA0002795093190000071
是用户u的τ度子图(ego network),
Figure BDA0002795093190000072
是用户集合,
Figure BDA0002795093190000073
是用户之间的边集合,这里τ度子图是用户u的τ度邻居导出的子图。用户集合
Figure BDA0002795093190000074
的属性矩阵用
Figure BDA0002795093190000075
表示。假设用户u在时间戳ts时被展示了一个物品d,该物品和其部分好友有交互关系。用户集合
Figure BDA0002795093190000076
关于物品d的活跃状态记为
Figure BDA0002795093190000077
状态为1表示用户和物品之间有交互关系,反之则没有交互关系。问题的目标是基于好友行为预测中心用户行为,即计算中心用户在时间戳ts后被影响的概率
Figure BDA0002795093190000078
实际计算过程中,输入:用户日志L={(u,d,ts,act,af(u,d,ts))|u∈U,d∈D}、用户社交网络G={U,E}和用户特征C。其中,U是用户集合,D是物品集合,ts表示时间戳,act表示中心用户的反馈行为,af(u,d,ts)表示用户u的朋友里在时间ts之前已经和物品d有交互的用户集合,
Figure BDA0002795093190000081
表示用户之间的边集,用户特征C可以包括性别、年龄、区域等属性。
执行步骤S101,由于真实的社交网络非常稠密,比如在微信中可以有上千好友,生成的局部子图可以非常大,计算二度邻居的话子图会更大。所以,可以采用采样策略生成每条日志中中心用户的局部子图,比如,可以采用基于随机游走的方式生成随机子图。本发明中,采样策略根据实际社交网络特性来决定,比如在微信社交网络中,信息的传播呈局部化,用户只能看到其直接好友的动态,因此,可以以中心用户为中心,采用宽度优先搜索(BFS)采样近邻结点。生成采样的结点集后,再诱导生成中心结点的局部子图。局部子图中结点的数量可以设置为固定值。
图2为根据社交网络上所述中心用户的好友关系和好友行为生成的一个局部子图示例。其中,结点1为中心结点,结点之间的边表示双向的好友关系,结点2、4、6表示对应用户和某个物品有交互(点击或转发行为),节点3、5表示对应用户和某个物品目前没有交互。图2所示的局部子图的生成过程可以为:先考虑中心结点1的一度邻居(即直接邻居)中的活跃用户,包括结点2和4,将其加入局部子图;之后,再将中心结点1的一度邻居中的不活跃用户加入局部子图,包括结点3和5;下一轮,考虑中心结点1的二度邻居(即所述中心结点的一度邻居的直接邻居,中心结点及其一度邻居除外),根据一度邻居的加入顺序来选择二度邻居(符合BFS的流程),例如,结点2的邻居优先于结点5的邻居加入局部子图,因此,结点2的邻居结点6优先加入局部子图,之后才轮到结点5的邻居结点7加入局部子图。在此过程中,可以设定局部子图中结点的最大数量m,比如可以设为32。局部子图的生成只考虑了中心结点的1度邻居和2度邻居,若这些邻居加入后仍没有达到设定的结点的最大数量,可以选择加入一些孤立“假结点”,即这些孤立结点和其他任何结点没有连边。
执行步骤S102,为所述局部子图中的每个结点生成第一输入特征。其中,第一输入特征由以下部分拼接而成:结点的网络嵌入表示、结点对应用户的个人画像特征和在社交网络上的结构特征、结点对应用户的活跃状态以及是否为中心用户的表示。
其中,对于结点的网络嵌入表示,考虑到计算效率和效果,本实施例中采用ProNE算法生成大规模网络上的用户嵌入表示。ProNE算法分为2步,第一步通过稀疏矩阵分解生成网络上结点的初始表示。第二步将第一步生成的结点表示在调制后的谱空间上进行传播,得到增强的结点表示。
本实施例中,用户的个人画像特征和在社交网络上的结构特征,可以包括用户的性别、年龄、地域和是否是意见领袖和结构洞用户。性别可以用0或1表示。可以将年龄属性按年龄段分类,每10岁一个年龄段,用独热编码进行描述。类似地,地域可以按照其地域分片(如华北、华东等)进行独热编码。对于意见领袖属性,首先在大规模用户转发网络(若用户1在用户2之后转发了一条内容,则用户1到用户2有一条有向边)上运行PageRank算法,将PageRank值最高的百分之一的用户定义为意见领袖,其他用户为非意见领袖,用一维表示。对于结构洞属性,首先在社交网络上用Targan算法寻找割点,将割点用户定义为结构洞用户,其他为非结构洞用户,用一维表示。
对于结点对应用户的活跃状态以及是否为中心用户的表示,可以图2为例进行说明。其中,结点2,4,6为活跃用户,其状态为1,其余结点状态为0;对于另外一维特征,结点1是中心用户,用1表示,其他结点用0表示。
经过此步骤生成的局部子图中结点的第一输入特征可以记为特征矩阵X。
执行步骤S103,首先将每个局部子图在谱空间上进行调制,然后将第一输入特征在调制后的谱空间上进行传播。通过调制谱空间可以过滤掉局部子图中的噪音。
在大规模网络中预训练的用户特征只捕捉了全局的网络结构特征,用户处于不同的局部子图中可能会起不同的作用,比如结点1在图2所示的局部子图中是中心用户,但是在别的局部子图中可能是活跃好友。因此,本步骤中采用图滤波器调制局部子图的拉普拉斯矩阵,并让S102中生成的特征矩阵X在调制后的谱空间传播,生成新的特征矩阵。这里调制局部子图的拉普拉斯矩阵可以过滤图中的噪音信号,实现对局部子图的清洗。
在图论中,随机游走的归一化的拉普拉斯矩阵定义为:L=Im-D-1A,这里A是局部子图的邻接矩阵,m是局部子图中结点的数量,Im表示单位矩阵,度数矩阵D=∑jAij。拉普拉斯矩阵可以分解为L=UΛUT,这里特征值矩阵Λ表示为Λ=diag[λ12,…,λm],在图的谱分析理论中,拉普拉斯矩阵中小的特征值控制着图被划分成几个大的子图的划分效果,也就是图的全局聚类效果;而大的特征值控制着图被划分为很多个小的子图的划分效果,也就是图的相对局域的聚类效果。L的第j个特征值λj越小,那么图被划分为j个子图的效果越好。本发明中,采用如下公式去调整拉普拉斯矩阵的特征值:
Figure BDA0002795093190000101
Figure BDA0002795093190000102
其中,
Figure BDA0002795093190000103
是调制后的拉普拉斯矩阵,λj是拉普拉斯矩阵的第j个特征值,U是特征向量矩阵,g是调制器函数,这里μ∈[0,2],θ是一个可训练的标量参数;调制器g可以被看做一个带通滤波,它可以使某个范围内的特征值通过,并且过滤掉其他范围的特征值,这样可以减少图中的噪音。为了防止显式进行特征值分解带来的高复杂度,本发明实施例中,可以用切比雪夫展开式和Bessel函数进行高效近似计算。在本步骤中,μ被设定为一个可以训练的参数,可以被自适应地学习到。
然后,采用如下公式将步骤S102中得到的特征矩阵X在调制后的谱空间上进行传播,得到第二输入特征:
Figure BDA0002795093190000111
其中,
Figure BDA0002795093190000112
是在谱空间传播后生成的第二输入特征的矩阵,X是第一输入特征的矩阵,A是局部子图的邻接矩阵,m是局部子图中结点的数量,Im是单位矩阵,D是度数矩阵,
Figure BDA0002795093190000113
是归一化邻接矩阵D-1A被调制后的结果。
执行步骤S104,包括:
生成所述局部子图中的结点表示;
学习得到一个分配矩阵;
利用所述分配矩阵和结点表示将所述局部子图转化为分层子图;
生成各分层子图中的结点表示;
对各分层子图中的结点表示进行池化操作,得到各分层子图的表示。
其中,可以利用图神经网络GNN生成所述局部子图中的结点表示和各分层子图中的结点表示。具体的,可以采用图注意力网络来实现,图注意力网络的思想是它可以用注意力参数学习结点之间的权重,再用这个权重对每个结点的表示根据其邻居结点的表示加权进行更新。
研究发现,中心用户的行为与其局部子图的连通分量相关,本步骤的思想是设计一个分层的图表示学习方法来编码局部子图中的子结构。图中的子结构,例如连通分量,社区(community)等,可以视作图中高层次抽象的结构,因此,可以考虑将图中相似的结点依次聚类,形成一个个“超级结点”,超级结点之间连接有“超边”,超边上有不同的权重,并对聚类结果进行编码表示。本发明中可以使用图神经网络(GNN)来学习子结构的编码表示。
具体地,首先采用如下公式为局部子图中的结点用GNN来生成结点表示,GNN的输入结点特征是步骤S103中生成的第二输入特征:
Figure BDA0002795093190000121
其中,
Figure BDA0002795093190000122
是结点在第l1层的隐层表示,
Figure BDA0002795093190000123
是局部子图的邻接矩阵A,
Figure BDA0002795093190000124
是结点输入特征。
为了生成层次化的子图结构,本实施例中参考DIFFPOOL工作,使用另一个GNN模块学习得到一个“分配矩阵”
Figure BDA0002795093190000125
Figure BDA0002795093190000126
其中,
Figure BDA0002795093190000127
矩阵
Figure BDA0002795093190000128
中的元素
Figure BDA0002795093190000129
表示在第lk+1层将结点i分配到类簇j的概率。
根据分配矩阵
Figure BDA00027950931900001210
局部子图可以依次被转化为更小的图(形如图3所示),相似的结点会被聚集成“超级结点”,参加下一轮聚类。更小的图的可以按照如下公式生成:
Figure BDA00027950931900001211
Figure BDA00027950931900001212
其中,
Figure BDA00027950931900001213
是分层子图中结点的特征矩阵,
Figure BDA00027950931900001214
是分层子图的邻接矩阵,矩阵中的边权表示不同类簇之间的连接强度。各分层子图中的结点表示矩阵可以用下面的公式计算,
Figure BDA00027950931900001215
在生成不同层级子图结点的表示后,在结点表示的基础上施加池化操作得到每个层级的子图表示。
执行步骤S105,采用如下公式由不同层级子图的表示拼接得到整个局部子图的表示:
Figure BDA0002795093190000131
其中,Zgraph为整个局部子图的表示,σ定义为对图中不同结点表示的每一维度做最大池化操作(max pooling),即图的每一维表示是所有结点表示中该维度最大的值。
执行步骤S106,将所述局部子图的表示经过全连接网络生成所述中心用户行为的二维预测结果,表示为如下公式:
ypred=δ(WZgraph+b)
其中,全连接网络即线性变换后施加激活函数(例如ReLU函数)。ypred为二维预测结果,δ为ReLU激活函数,W为可训练的投影矩阵参数,Zgraph为局部子图的表示,b为可训练的偏置量。
本发明提供的方法,还包括步骤:
将所述二维预测结果与所述中心用户的真实行为比较,根据比较结果利用交叉熵损失函数和优化器进行训练。具体的,可以采用Adagrad优化器。
实施例二
如图4所示,本发明的另一方面还包括和前述方法流程完全对应一致的功能模块架构,即本发明实施例还提供了一种基于好友行为预测中心用户行为的装置,包括:
局部子图生成模块401,用于根据社交网络上所述中心用户的好友关系和好友行为生成局部子图,所述局部子图中的每个结点表示一个用户;
第一输入特征生成模块402,用于为所述局部子图中的每个结点生成第一输入特征;
第二输入特征生成模块403,用于将所述第一输入特征在所述局部子图调制后的谱空间上进行传播,生成第二输入特征;
分层子图表示生成模块404,用于以第二输入特征为输入,采用图表示学习方法编码所述局部子图中的分层子图,生成所述局部子图的分层子图的表示;
局部子图表示生成模块405,用于将各分层子图的表示进行拼接,得到所述局部子图的表示;
二维预测结果生成模块406,用于将所述局部子图的表示经过全连接网络生成所述中心用户行为的二维预测结果。
其中,在局部子图生成模块中,以所述中心用户为初始结点,根据所述中心用户的好友关系和好友行为采用宽度优先搜索(BFS)方式采样,生成所述局部子图。
进一步地,所述第一输入特征由以下部分拼接而成:结点的网络嵌入表示、结点对应用户的个人画像特征和在社交网络上的结构特征、结点对应用户的活跃状态以及是否为中心用户的表示。
在所述在第二输入特征生成模块中,采用如下公式调制所述局部子图的拉普拉斯矩阵:
Figure BDA0002795093190000144
Figure BDA0002795093190000141
其中,
Figure BDA0002795093190000142
是调制后的拉普拉斯矩阵,λj是拉普拉斯矩阵的第j个特征值,U是特征向量矩阵,g是调制器函数,μ∈[0,2],θ是一个可训练的标量参数;
采用如下公式将所述第一输入特征在调制后的谱空间上进行传播
Figure BDA0002795093190000143
其中,
Figure BDA0002795093190000151
是在谱空间传播后生成的第二输入特征的矩阵,X是第一输入特征的矩阵,A是局部子图的邻接矩阵,m是局部子图中结点的数量,Im是单位矩阵,D是度数矩阵。
在分层子图表示生成模块中,生成所述局部子图的分层子图的表示,包括:
生成所述局部子图中的结点表示;
学习得到一个分配矩阵;
利用所述分配矩阵和结点表示将所述局部子图转化为分层子图;
生成各分层子图中的结点表示;
对各分层子图中的结点表示进行池化操作,得到各分层子图的表示。
进一步地,利用图神经网络GNN生成所述局部子图中的结点表示和各分层子图中的结点表示。
本发明实施例提供的装置还包括训练模块,用于将所述二维预测结果与所述中心用户的真实行为比较,根据比较结果利用交叉熵损失函数和优化器进行训练。
该装置可通过上述实施例一提供的基于好友行为预测中心用户行为的方法实现,具体的实现方法可参见实施例一中的描述,在此不再赘述。
本发明还提供了一种存储器,存储有多条指令,所述指令用于实现如实施例一所述的方法。
本发明还提供了一种电子设备,包括处理器和与所述处理器连接的存储器,所述存储器存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如实施例一所述的方法。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于好友行为预测中心用户行为的方法,其特征在于,包括:
根据社交网络上所述中心用户的好友关系和好友行为生成局部子图,所述局部子图中的每个结点表示一个用户;
为所述局部子图中的每个结点生成第一输入特征;
将所述第一输入特征在所述局部子图调制后的谱空间上进行传播,生成第二输入特征;
以第二输入特征为输入,采用图表示学习方法编码所述局部子图中的分层子图,生成所述局部子图的分层子图的表示;
将各分层子图的表示进行拼接,得到所述局部子图的表示;
将所述局部子图的表示经过全连接网络生成所述中心用户行为的二维预测结果。
2.如权利要求1所述的方法,其特征在于,以所述中心用户为初始结点,根据所述中心用户的好友关系和好友行为采用宽度优先搜索(BFS)方式采样,生成所述局部子图。
3.如权利要求2所述的方法,其特征在于,所述第一输入特征由以下部分拼接而成:结点的网络嵌入表示、结点对应用户的个人画像特征和在社交网络上的结构特征、结点对应用户的活跃状态以及是否为中心用户的表示。
4.如权利要求3所述的方法,其特征在于,所述将所述第一输入特征在所述局部子图调制后的谱空间上进行传播,生成第二输入特征,包括:
采用如下公式调制所述局部子图的拉普拉斯矩阵:
Figure FDA0002795093180000011
Figure FDA0002795093180000013
其中,
Figure FDA0002795093180000012
是调制后的拉普拉斯矩阵,λj是拉普拉斯矩阵的第j个特征值,U是特征向量矩阵,g是调制器函数,μ∈[0,2],θ是一个可训练的标量参数;
采用如下公式将所述第一输入特征在调制后的谱空间上进行传播
Figure FDA0002795093180000021
其中,
Figure FDA0002795093180000022
是在谱空间传播后生成的第二输入特征的矩阵,X是第一输入特征的矩阵,A是局部子图的邻接矩阵,m是局部子图中结点的数量,Im是单位矩阵,D是度数矩阵。
5.如权利要求4所述的方法,其特征在于,所述以第二输入特征为输入,采用图表示学习方法编码所述局部子图中的分层子图,生成所述局部子图的分层子图的表示,包括:
生成所述局部子图中的结点表示;
学习得到一个分配矩阵;
利用所述分配矩阵和结点表示将所述局部子图转化为分层子图;
生成各分层子图中的结点表示;
对各分层子图中的结点表示进行池化操作,得到各分层子图的表示。
6.如权利要求5所述的方法,其特征在于,利用图神经网络GNN生成所述局部子图中的结点表示和各分层子图中的结点表示。
7.如权利要求1所述的方法,其特征在于,还包括:
将所述二维预测结果与所述中心用户的真实行为比较,根据比较结果利用交叉熵损失函数和优化器进行训练。
8.一种基于好友行为预测中心用户行为的装置,其特征在于,包括:
局部子图生成模块,用于根据社交网络上所述中心用户的好友关系和好友行为生成局部子图,所述局部子图中的每个结点表示一个用户;
第一输入特征生成模块,用于为所述局部子图中的每个结点生成第一输入特征;
第二输入特征生成模块,用于将所述第一输入特征在所述局部子图调制后的谱空间上进行传播,生成第二输入特征;
分层子图表示生成模块,用于以第二输入特征为输入,采用图表示学习方法编码所述局部子图中的分层子图,生成所述局部子图的分层子图的表示;
局部子图表示生成模块,用于将各分层子图的表示进行拼接,得到所述局部子图的表示;
二维预测结果生成模块,用于将所述局部子图的表示经过全连接网络生成所述中心用户行为的二维预测结果。
9.一种存储器,其特征在于,存储有多条指令,所述指令用于实现如权利要求1-7任一项所述的方法。
10.一种电子设备,其特征在于,包括处理器和与所述处理器连接的存储器,所述存储器存储有多条指令,所述指令可被所述处理器加载并执行,以使所述处理器能够执行如权利要求1-7任一项所述的方法。
CN202011328501.4A 2020-11-24 2020-11-24 基于好友行为预测中心用户行为的方法、装置和电子设备 Active CN112288195B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011328501.4A CN112288195B (zh) 2020-11-24 2020-11-24 基于好友行为预测中心用户行为的方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011328501.4A CN112288195B (zh) 2020-11-24 2020-11-24 基于好友行为预测中心用户行为的方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN112288195A true CN112288195A (zh) 2021-01-29
CN112288195B CN112288195B (zh) 2021-08-31

Family

ID=74425246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011328501.4A Active CN112288195B (zh) 2020-11-24 2020-11-24 基于好友行为预测中心用户行为的方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN112288195B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468227A (zh) * 2021-06-25 2021-10-01 北京达佳互联信息技术有限公司 基于图神经网络的信息推荐方法、系统、设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117325A (zh) * 2011-02-24 2011-07-06 清华大学 动态社会网络用户行为的预测方法
CN104820945A (zh) * 2015-04-17 2015-08-05 南京大学 基于社团结构挖掘算法的在线社会网络信息传播最大化方法
CN108776844A (zh) * 2018-04-13 2018-11-09 中国科学院信息工程研究所 基于上下文感知张量分解的社交网络用户行为预测方法
CN109376746A (zh) * 2018-10-25 2019-02-22 黄子骞 一种图片识别方法及系统
US10356107B1 (en) * 2015-04-16 2019-07-16 Triad National Security, Llc Detecting anomalous behavior via user authentication graphs
CN111950707A (zh) * 2020-08-10 2020-11-17 中国平安人寿保险股份有限公司 基于行为共现网络的行为预测方法、装置、设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102117325A (zh) * 2011-02-24 2011-07-06 清华大学 动态社会网络用户行为的预测方法
US10356107B1 (en) * 2015-04-16 2019-07-16 Triad National Security, Llc Detecting anomalous behavior via user authentication graphs
CN104820945A (zh) * 2015-04-17 2015-08-05 南京大学 基于社团结构挖掘算法的在线社会网络信息传播最大化方法
CN108776844A (zh) * 2018-04-13 2018-11-09 中国科学院信息工程研究所 基于上下文感知张量分解的社交网络用户行为预测方法
CN109376746A (zh) * 2018-10-25 2019-02-22 黄子骞 一种图片识别方法及系统
CN111950707A (zh) * 2020-08-10 2020-11-17 中国平安人寿保险股份有限公司 基于行为共现网络的行为预测方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵姝: "社交关系挖掘研究综述", 《计算机学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468227A (zh) * 2021-06-25 2021-10-01 北京达佳互联信息技术有限公司 基于图神经网络的信息推荐方法、系统、设备和存储介质
CN113468227B (zh) * 2021-06-25 2024-05-24 北京达佳互联信息技术有限公司 基于图神经网络的信息推荐方法、系统、设备和存储介质

Also Published As

Publication number Publication date
CN112288195B (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
CN111931062B (zh) 一种信息推荐模型的训练方法和相关装置
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN111651671B (zh) 用户对象推荐方法、装置、计算机设备和存储介质
CN110866145B (zh) 一种共同偏好辅助的深度单类协同过滤推荐方法
CN111949886B (zh) 一种用于信息推荐的样本数据生成方法和相关装置
CN111881350A (zh) 一种基于混合图结构化建模的推荐方法与系统
CN111611488B (zh) 基于人工智能的信息推荐方法、装置、电子设备
CN110619081A (zh) 一种基于交互图神经网络的新闻推送方法
CN113672811A (zh) 一种基于拓扑信息嵌入的超图卷积协同过滤推荐方法、系统及计算机可读存储介质
Abduljabbar et al. Nature-inspired optimization algorithms for community detection in complex networks: a review and future trends
Liu et al. Libero: Benchmarking knowledge transfer for lifelong robot learning
CN114265986A (zh) 一种融合知识图谱结构与路径语义的信息推送方法和系统
WO2024067373A1 (zh) 一种数据处理方法及相关装置
CN111949885A (zh) 一种面向旅游景点的个性化推荐方法
Hartmann Federated learning
CN112288195B (zh) 基于好友行为预测中心用户行为的方法、装置和电子设备
CN117216281A (zh) 一种基于知识图谱的用户兴趣扩散推荐方法及系统
D’Amico et al. Item graph convolution collaborative filtering for inductive recommendations
CN117251586A (zh) 多媒体资源推荐方法、装置及存储介质
CN116842277A (zh) 一种基于跨主题对比学习的社交推荐方法
Wistuba Practical deep learning architecture optimization
CN115423016A (zh) 多任务预测模型的训练方法、多任务预测方法及装置
CN115599990A (zh) 一种知识感知结合深度强化学习的跨域推荐方法及系统
CN115809339A (zh) 跨领域推荐方法、系统、设备及存储介质
CN115248894A (zh) 一种信息推荐方法、装置和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210323

Address after: B201d-1, 3rd floor, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing 100083

Applicant after: Beijing innovation Zhiyuan Technology Co.,Ltd.

Address before: B201d-1, 3rd floor, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing 100083

Applicant before: Beijing Zhiyuan Artificial Intelligence Research Institute

TA01 Transfer of patent application right

Effective date of registration: 20210625

Address after: 603a, 6th floor, building 6, yard 1, Zhongguancun East Road, Haidian District, Beijing 100083

Applicant after: Beijing Zhipu Huazhang Technology Co.,Ltd.

Address before: B201d-1, 3rd floor, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing 100083

Applicant before: Beijing innovation Zhiyuan Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Zhang Fanjin

Inventor after: Liu Xueyi

Inventor after: Hou Zhenyu

Inventor after: Xie Ruobing

Inventor after: Zhuang Kai

Inventor after: Zhang Xu

Inventor after: Lin Leyu

Inventor after: Liu Debing

Inventor after: Chou Yu

Inventor before: Zhang Fanjin

Inventor before: Chou Yu

Inventor before: Tang Jie

Inventor before: Liu Xueyi

Inventor before: Hou Zhenyu

Inventor before: Xie Ruobing

Inventor before: Zhuang Kai

Inventor before: Zhang Xu

Inventor before: Lin Leyu

Inventor before: Liu Debing

CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Zhang Fanjin

Inventor after: Liu Xueyi

Inventor after: Hou Zhenyu

Inventor after: Xie Ruobing

Inventor after: Zhuang Kai

Inventor after: Zhang Xu

Inventor after: Lin Leyu

Inventor after: Liu Debing

Inventor after: Qiu Yu

Inventor before: Zhang Fanjin

Inventor before: Qiu Yu

Inventor before: Tang Jie

Inventor before: Liu Xueyi

Inventor before: Hou Zhenyu

Inventor before: Xie Ruobing

Inventor before: Zhuang Kai

Inventor before: Zhang Xu

Inventor before: Lin Leyu

Inventor before: Liu Debing