CN111797327A - 社交网络建模的方法及装置 - Google Patents
社交网络建模的方法及装置 Download PDFInfo
- Publication number
- CN111797327A CN111797327A CN202010502413.5A CN202010502413A CN111797327A CN 111797327 A CN111797327 A CN 111797327A CN 202010502413 A CN202010502413 A CN 202010502413A CN 111797327 A CN111797327 A CN 111797327A
- Authority
- CN
- China
- Prior art keywords
- node
- feature vector
- updating
- attention
- social network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 239000013598 vector Substances 0.000 claims abstract description 86
- 238000013528 artificial neural network Methods 0.000 claims abstract description 52
- 238000010586 diagram Methods 0.000 claims abstract description 48
- 230000007246 mechanism Effects 0.000 claims abstract description 46
- 230000002452 interceptive effect Effects 0.000 claims abstract description 39
- 230000003993 interaction Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 10
- 238000005295 random walk Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Molecular Biology (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种社交网络建模的方法及装置,本申请的方法包括获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系;根据身份标识、交互关系、无权重图结构,基于预设的节点表示方法得到图神经网络结构图,以及图神经网络结构图中每个节点的特征向量;基于注意力机制对每个节点的特征向量进行更新,以提供一种社交网络结构来更加好的刻画用户在社交网络中复杂关系。
Description
技术领域
本申请涉及自然语言处理技术领域,具体而言,涉及一种社交网络建模的 方法及装置。
背景技术
伴随着互联网及自媒体行业的蓬勃发展,舆情信息的传播方式和传播 速度较之以往已经发生了本质上的变化,传统的人工舆情监测方式已经远 远不能满足于现阶段的舆情处理需求。
现有的舆情分析技术解决方案大多是用舆情事件关键词匹配的方式识 别舆情事件,再将舆情情绪分析任务当作分类任务用有监督方法去预测归 类。在分析舆情传播任务上,现有解决方案也大多只是静态的给出舆论事 件在网络传播过程中的转发评论人,并没有尝试去从社交网络的角度通过 分析人与人、人与舆情文章产生的交互行为及信息数据去细致分析。因此 为了提高预测的准确性,需要结合社交网络结构进行预测,用户在社交网 络中的关系是非常复杂,而现有的交互方式中只是记录文章的转发评论人, 无法满足复杂性的需求,因此亟需提出一种社交网络结构来更加好的刻画 用户在社交网络中复杂关系。
发明内容
本申请的主要目的在于提供一种社交网络建模的方法及装置,以提供一 种社交网络结构来更加好的刻画用户在社交网络中复杂关系。
为了实现上述目的,根据本申请的第一方面,提供了一种社交网络建 模的方法。
根据本申请的社交网络建模的方法包括:
获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交 互关系;
根据身份标识、交互关系、无权重图结构,基于预设的节点表示方法得到 图神经网络结构图,以及图神经网络结构图中每个节点的特征向量;
基于注意力机制对每个节点的特征向量进行更新。
可选的,所述基于注意力机制对每个节点的特征向量进行更新包括:
基于单个注意力机制或者多头注意力机制计算每个节点与其邻节点的注 意力系数;
根据注意力系数对每个节点的特征向量进行更新。
可选的,所述基于单个注意力机制或者多头注意力机制计算每个节点与其 邻节点的注意力系数包括:
基于共享线性变换权重矩阵对每个节点的特征向量进行特征增强处理;
基于增强处理后的特征向量计算每个节点与其邻节点的注意力系数。
可选的,根据注意力系数对每个节点的特征向量进行更新包括:
根据注意力系数为每个节点对应的邻节点分配权重系数;
根据权重系数对每个节点的邻节点的特征向量进行加权求和得到每个节 点对应的更新特征向量。
可选的,所述方法还包括:
获取平台的更新数据,所述更新数据包括新增加的用户和/或新增加的交 互关系;
根据所述更新数据更新所述图神经网络结构图以及图神经网络结构图中 每个节点的特征向量;
基于注意力机制再次对更新后的图神经网络结构图中每个节点的特征向 量进行更新。
可选的,在根据注意力系数对每个节点的特征向量进行更新之前,所述方 法包括:
通过预设的回归函数对注意力系数进行归一化处理。
为了实现上述目的,根据本申请的第二方面,提供了一种社交网络建 模的装置。
根据本申请的社交网络建模的装置包括:
第一获取单元,用于获取平台上与文章有交互关系的所有用户的身份标识 以及用户之间的交互关系;
建立单元,用于根据身份标识、交互关系、无权重图结构,基于预设的节 点表示方法得到图神经网络结构图,以及图神经网络结构图中每个节点的特征 向量;
第一更新单元,用于基于注意力机制对每个节点的特征向量进行更新。
可选的,所述第一更新单元包括:
计算模块,用于基于单个注意力机制或者多头注意力机制计算每个节点与 其邻节点的注意力系数;
更新模块,用于根据注意力系数对每个节点的特征向量进行更新。
可选的,所述计算模块用于:
基于共享线性变换权重矩阵对每个节点的特征向量进行特征增强处理;
基于增强处理后的特征向量计算每个节点与其邻节点的注意力系数。
可选的,更新模块用于:
根据注意力系数为每个节点对应的邻节点分配权重系数;
根据权重系数对每个节点的邻节点的特征向量进行加权求和得到每个节 点对应的更新特征向量。
可选的,所述装置还包括:
第二获取单元,用于获取平台的更新数据,所述更新数据包括新增加的用 户和/或新增加的交互关系;
第二更新单元,用于根据所述更新数据更新所述图神经网络结构图以及图 神经网络结构图中每个节点的特征向量;
第三更新单元,用于基于注意力机制再次对更新后的图神经网络结构图中 每个节点的特征向量进行更新。
可选的,所述装置包括:
归一化处理单元,用于在根据注意力系数对每个节点的特征向量进行更新 之前,通过预设的回归函数对注意力系数进行归一化处理。
为了实现上述目的,根据本申请的第三方面,提供了一种计算机可读存 储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使 所述计算机执行上述第一方面中任意一项所述的社交网络建模的方法。
为了实现上述目的,根据本申请的第四方面,提供了一种电子设备,包 括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程 序被所述至少一个处理器执行,以使所述至少一个处理器执行上述第一方面中 任意一项所述的社交网络建模的方法。
在本申请实施例中,社交网络建模的方法及装置中,首先,获取平台上 与文章有交互关系的所有用户的身份标识以及用户之间的交互关系;其次,根 据身份标识、交互关系、无权重图结构,基于预设的节点表示方法得到图神经 网络结构图,以及图神经网络结构图中每个节点的特征向量;最后,基于注意 力机制对每个节点的特征向量进行更新。可以看出,本申请中得到的图神经网 络结构图即为社交网络结构图,在建立时参考了用户与文章之间的交互关系 (交互关系包括用户对文章的转发评论等交互行为)、用户之间的交互关系, 因此得到结构图相比于现有的记录方式可以更好的表达用户在社交网络中复 杂关系。另外,得到的图神经网络结构图中每个用户节点的向量表示(节 点的特征向量)是采用静态预先计算(基于预设的节点表示方法得到的图神 经网络结构图中每个节点的特征向量)和动态更新(基于注意力机制对特征 向量进行更新)相结合的技术方式,能够更好的应对不断变化的社交网络 关系。会进行动态的更新。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本 申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及 其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的一种社交网络建模的方法流程图;
图2是根据本申请实施例提供的一种有偏随机游走方法的示意图;
图3是根据本申请实施例提供的另一种社交网络建模的方法流程图;
图4是根据本申请实施例提供的一种社交网络建模的装置的组成框图;
图5是根据本申请实施例提供的另一种社交网络建模的装置的组成框 图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施 例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所 描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申 请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所 有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第 一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次 序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请 的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆 盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品 或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的 或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征 可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请实施例,提供了一种社交网络建模的方法,如图1所示,该方 法包括如下的步骤:
S101.获取平台上与文章有交互关系的所有用户的身份标识以及用户之 间的交互关系。
平台是指社交平台,比如微博、微信、头条新闻、网易新闻等。与文章有 交互关系的用户为对目标文章有过观看、转发、评论、点赞等行为的用户,其 中也包括文章的发布者。发布者或者称为发布源,可以是个人或者是机构。用 户之间的交互关系是指确定哪些用户之间存在交互行为。目标文章是根据实际 的需求可以选择某个文章或某类文章或某时段文章等等。
本步骤中获取各种数据的方式可以为从平台相关API中直接获取数据的 方式,或者以网络爬虫的方式去爬取需要的数据。
S102.根据身份标识、交互关系、无权重图结构,基于预设的节点表示方 法得到图神经网络结构图,以及图神经网络结构图中每个节点的特征向量。
需要说明的是,在得到图神经网络结构图时是基于图神经网络模型得到 的。
首先,通过无权重图结构G=(V,E)来表示上述步骤中得到的每个用户 以及交互关系的用户(包括直接有交互,或者通过同一篇文章有间接交互)。 其中V是节点的集合,每个节点都表示一个用户,每个节点通过对应的用户 的身份标识进行区别。E是边的集合,每条边都表示其所连接节点间的关系。 然后,基于预设的节点表示方法(可以为node2vec、word2vec、Bert等表示方 法)来初始化用户的向量化表示即得到每个节点的特征向量。本实施例以 node2vec为例进行具体说明。node2vec是一种综合考虑DFS邻域和BFS邻域 的graph embedding方法。简单来说,可以看作是deepwalk的一种扩展,可以 看作是结合了DFS和BFS随机游走的deepwalk。
具体的基于Node2Vec来初始化用户的向量化表示,具体方法如下:将V 集合中的每个节点v通过最大化已观测到的节点概率产生,下述公式为每个节 点v通过最大化已观测到的节点概率:
其中,f(u)是大小为|V|*d的矩阵参数,u为源观测节点,f(u)是将节点u 映射为embedding向量的映射函数,对于图结构中每个节点u,定义NS(u)为 通过邻居节点采样策略S采样出的节点u的近邻节点集合,NS(u)被包括于V。 观测到的节点集合S(u)是由从v节点开始的随机漫步所产生的。d为每个用 户节点输入向量的维数(比如年龄、性别、等维度)。
另外,对节点集合S(u)的产生进行详细说明:具体为基于有偏随机游 走的方法得到的。
如图2所示,假设我们从t节点开始了一个randomWalk,现在到达了v 节点,为了计算下一步路线,Node2Vec设计了一个二阶转移概率算法:节点 间转移概率为:
πvx=αpq(t,x)·wvx
wvx为两个节点间边的权重(对应与前述的权重系数),αpq为节点在路径 搜索中设置的偏移量,x为下一步节点。
其中,当dtx=0时,v回到t节点,搜索偏置为1/p;当dtx=1时,x为t 的直接邻居,相当于广度优先搜索,这时的搜索偏置为1;当dtx=2时,x是t 的邻居的邻居,相当于深度优先搜索,这时的搜索偏置为1/q。可以使用beam search(集束搜索)的方式来寻找最优的p和q,也可以根据具体的舆情场景 任务需要来手动选择p和q。
该方法整体上是一种有偏的二阶随机游走方法,p和q为控制节点随机游 走的参数,参数p控制立即重新访问遍历中的节点的可能性。参数q用来控制 节点继续向内部节点跳转还是向外部节点跳转。dtx指的是节点t到节点x的 距离。Node2vec这种方法通过调整随机游走权重的方法使graph embedding的 结果在网络的同质性和结构性中进行权衡。
S103.基于注意力机制对每个节点的特征向量进行更新。
基于注意力机制是为了计算结构图中每个节点与邻近节点的相关性系数, 然后根据相关性系数来对不同的邻近点分配不同的权重系数。注意力机制是对 对邻近节点特征加权求和,在得到不同邻近点的权重系数后进行加权求和可以 得到更新的特征向量。在社交网络中,用户之间交互的权重是不同的,因次通 过注意力机制能够更好的表示不同的用户之间的交互权重。
最后需要说明的是,本实施例实际是基于图注意力神经网络(GraphAttensionNetwork,GAT)模型来建立图神经网络结构图。
从以上的描述中,可以看出,本申请实施例的社交网络建模的方法中,首 先,获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互 关系;其次,根据身份标识、交互关系、无权重图结构,基于预设的节点表示 方法得到图神经网络结构图,以及图神经网络结构图中每个节点的特征向量; 最后,基于注意力机制对每个节点的特征向量进行更新。可以看出,本申请中 得到的图神经网络结构图即为社交网络结构图,在建立时参考了用户与文章之 间的交互关系(交互关系包括用户对文章的转发评论等交互行为)、用户之间 的交互关系,因此得到结构图相比于现有的记录方式可以更好的表达用户在 社交网络中复杂关系。另外,得到的图神经网络结构图中每个用户节点的 向量表示(节点的特征向量)是采用静态预先计算(基于预设的节点表示方 法得到的图神经网络结构图中每个节点的特征向量)和动态更新(基于注意 力机制对特征向量进行更新)相结合的技术方式,能够更好的应对不断变 化的社交网络关系。会进行动态的更新。
作为上述实施例的进一步的补充和细化,本实施例提供了另一种社交网络 建模的方法流程,如图3所示,包括如下步骤:
S201.获取平台上与文章有交互关系的所有用户的身份标识以及用户之 间的交互关系。
本步骤的实现方式与图1步骤是S101的实现方式相同,此处不再赘述。
S202.根据身份标识、交互关系、无权重图结构,基于预设的节点表示方 法得到图神经网络结构图,以及图神经网络结构图中每个节点的特征向量。
本步骤的实现方式与图1步骤是S102的实现方式相同,此处不再赘述。
S203.基于单个注意力机制或者多头注意力机制计算每个节点与其邻节 点的注意力系数。
本步骤中结合具体的示例进行说明:
首先,基于共享线性变换权重矩阵对每个节点的特征向量进行特征增强处 理;然后,基于增强处理后的特征向量计算每个节点与其邻节点的注意力系数; 最后,通过预设的回归函数对注意力系数进行归一化处理。
假设某一节点v的特征向量为hv,其邻节点u的特征向量为hu,则对应的 计算每个节点与其邻节点的注意力系数的公式如下:
其中,evu为节点v与邻节点u的注意力系数,W为共享线性变换权重矩 阵,a为attension系数。
需要说明的是为了更好的表达节点间的社会网络关系特征,在节点上运用 共享线性变换权重矩阵W,再为每个节点加上self-attension。W是一个权重矩 阵共享参数作用于所有网络节点,相当于对节点特征进行了增维,算是一种常 见的特征增强方法。
另外,邻节点只考虑一度邻居,为了简化计算,使用softmax(即为预设 的回归函数)对前述得到的注意力系数evu使进行归一化操作得到αvu,αvu是 经过归一化处理后的注意力系数,也是本步骤中最终需要得到的注意力系数, 注意力机制是一个单层前馈神经网络,使用LeakyRelu作为激活函数,Ni为V 节点的邻近节点结合。则αvu的计算公式如下:
前述为基于单个注意力机制计算得到的注意力系数。下面对基于多头注意 力机制multi-head attension计算注意力系数进行说明。
每一个注意力的头都有它自己的参数,基于多头注意力机制计算注意力系 数即整合多个注意力机制的输出结果。一般整合的方式有两种:拼接或者加和 求平均。即基于多个独立的注意力机制分别得到多个注意力系数,然后将多个 注意力系数进行拼接或者加和求平均。每个注意力系数的计算可以参见上述基 于单个注意力机制计算注意力系数的过程。
S204.根据注意力系数对每个节点的特征向量进行更新。
对应于上述计算得到的注意力系数αvu对每个节点的特征向量进行更新, 更新的过程包括:
首先,根据注意力系数为每个节点对应的邻节点分配权重系数;
在为每个邻节点分配权重系数时,权重系数与注意力系数成正比,注意力 系数越大对应的权重系数也越大。也可以直接将注意力系数作为权重系数。
然后,根据权重系数对每个节点的邻节点的特征向量进行加权求和得到每 个节点对应的更新特征向量。
另外,如有新增加的用户和/或新增加的交互关系新的文章或者用户加入, 则对应的图神经网络结构图也会根据更新的数据进行动态的调整更新,具体的 更新过程如下:
首先,获取平台的更新数据,更新数据包括新增加的用户和/或新增加的 交互关系;其次,根据更新数据更新图神经网络结构图以及图神经网络结构图 中每个节点的特征向量;再次,基于注意力机制再次对更新后的图神经网络结 构图中每个节点的特征向量进行更新。
比如,有发布者发布新的文章,多个用户对该文章进行转发、观看、评论 等行为。相当于社交网络发生了变化,因此为了实时的记录更新社交网络的变 化,需要对之前建立的图神经网络结构图进行更新以及每个用户的特征向量进 行更新。具体的,获取更新数据对应的用户身份标识、交互关系,对于新的用 户身份标识和/或交互关系,结构图中的节点和/或边会发生变化,对应的节点 向量需要重新进行初始化以及更新的过程。向量初始化的过程可以参见前述图 1中步骤S102中的实现方式,不同的是身份标识和交互关系中增加了更新数 据的身份标识和交互关系。对于重新进行更新的过程可以参见前述图1和图2 中的步骤S103以及步骤S203-S204的实现过程。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行 指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某 些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本申请实施例,还提供了一种用于实施上述图1和图3方法的社交网 络建模的装置,如图4所示,该装置包括:
第一获取单元41,用于获取平台上与文章有交互关系的所有用户的身份 标识以及用户之间的交互关系;
建立单元42,用于根据身份标识、交互关系、无权重图结构,基于预设 的节点表示方法得到图神经网络结构图,以及图神经网络结构图中每个节点的 特征向量;
第一更新单元43,用于基于注意力机制对每个节点的特征向量进行更新。
从以上的描述中,可以看出,本申请实施例的社交网络建模的装置中,首 先,获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互 关系;其次,根据身份标识、交互关系、无权重图结构,基于预设的节点表示 方法得到图神经网络结构图,以及图神经网络结构图中每个节点的特征向量; 最后,基于注意力机制对每个节点的特征向量进行更新。可以看出,本申请中 得到的图神经网络结构图即为社交网络结构图,在建立时参考了用户与文章之 间的交互关系(交互关系包括用户对文章的转发评论等交互行为)、用户之间 的交互关系,因此得到结构图相比于现有的记录方式可以更好的表达用户在 社交网络中复杂关系。另外,得到的图神经网络结构图中每个用户节点的 向量表示(节点的特征向量)是采用静态预先计算(基于预设的节点表示方 法得到的图神经网络结构图中每个节点的特征向量)和动态更新(基于注意 力机制对特征向量进行更新)相结合的技术方式,能够更好的应对不断变 化的社交网络关系。会进行动态的更新。
进一步的,如图5所示,所述第一更新单元43包括:
计算模块431,用于基于单个注意力机制或者多头注意力机制计算每个节 点与其邻节点的注意力系数;
更新模块432,用于根据注意力系数对每个节点的特征向量进行更新。
进一步的,如图5所示,所述计算模块431用于:
基于共享线性变换权重矩阵对每个节点的特征向量进行特征增强处理;
基于增强处理后的特征向量计算每个节点与其邻节点的注意力系数。
进一步的,如图5所示,更新模块432用于:
根据注意力系数为每个节点对应的邻节点分配权重系数;
根据权重系数对每个节点的邻节点的特征向量进行加权求和得到每个节 点对应的更新特征向量。
进一步的,如图5所示,所述装置还包括:
第二获取单元44,用于获取平台的更新数据,所述更新数据包括新增加 的用户和/或新增加的交互关系;
第二更新单元45,用于根据所述更新数据更新所述图神经网络结构图以 及图神经网络结构图中每个节点的特征向量;
第三更新单元46,用于基于注意力机制再次对更新后的图神经网络结构 图中每个节点的特征向量进行更新。
进一步的,如图5所示,所述装置包括:
归一化处理单元47,用于在根据注意力系数对每个节点的特征向量进行 更新之前,通过预设的回归函数对注意力系数进行归一化处理。
具体的,本申请实施例的装置中各单元、模块实现其功能的具体过程可参 见方法实施例中的相关描述,此处不再赘述。
根据本申请实施例,还提供了一种计算机可读存储介质,其特征在于,所 述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机 执行上述方法实施例中的社交网络建模的方法。
根据本申请实施例,还提供了一种电子设备,包括:至少一个处理器;以 及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所 述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器 执行,以使所述至少一个处理器执行上述方法实施例中的社交网络建模的方 法。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以 用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多 个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码 来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们 分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集 成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领 域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则 之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之 内。
Claims (10)
1.一种社交网络建模的方法,其特征在于,所述方法包括:
获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系;
根据身份标识、交互关系、无权重图结构,基于预设的节点表示方法得到图神经网络结构图,以及图神经网络结构图中每个节点的特征向量;
基于注意力机制对每个节点的特征向量进行更新。
2.根据权利要求1所述的社交网络建模的方法,其特征在于,所述基于注意力机制对每个节点的特征向量进行更新包括:
基于单个注意力机制或者多头注意力机制计算每个节点与其邻节点的注意力系数;
根据注意力系数对每个节点的特征向量进行更新。
3.根据权利要求2所述的社交网络建模的方法,其特征在于,所述基于单个注意力机制或者多头注意力机制计算每个节点与其邻节点的注意力系数包括:
基于共享线性变换权重矩阵对每个节点的特征向量进行特征增强处理;
基于增强处理后的特征向量计算每个节点与其邻节点的注意力系数。
4.根据权利要求2所述的社交网络建模的方法,其特征在于,根据注意力系数对每个节点的特征向量进行更新包括:
根据注意力系数为每个节点对应的邻节点分配权重系数;
根据权重系数对每个节点的邻节点的特征向量进行加权求和得到每个节点对应的更新特征向量。
5.根据权利要求1所述的社交网络建模的方法,其特征在于,所述方法还包括:
获取平台的更新数据,所述更新数据包括新增加的用户和/或新增加的交互关系;
根据所述更新数据更新所述图神经网络结构图以及图神经网络结构图中每个节点的特征向量;
基于注意力机制再次对更新后的图神经网络结构图中每个节点的特征向量进行更新。
6.根据权利要求4所述的社交网络建模的方法,其特征在于,在根据注意力系数对每个节点的特征向量进行更新之前,所述方法包括:
通过预设的回归函数对注意力系数进行归一化处理。
7.一种社交网络建模的装置,其特征在于,所述装置包括:
第一获取单元,用于获取平台上与文章有交互关系的所有用户的身份标识以及用户之间的交互关系;
建立单元,用于根据身份标识、交互关系、无权重图结构,基于预设的节点表示方法得到图神经网络结构图,以及图神经网络结构图中每个节点的特征向量;
第一更新单元,用于基于注意力机制对每个节点的特征向量进行更新。
8.根据权利要求7所述的社交网络建模的装置,其特征在于,所述第一更新单元包括:
计算模块,用于基于单个注意力机制或者多头注意力机制计算每个节点与其邻节点的注意力系数;
更新模块,用于根据注意力系数对每个节点的特征向量进行更新。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-6任意一项所述的社交网络建模的方法。
10.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-6任意一项所述的社交网络建模的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010502413.5A CN111797327B (zh) | 2020-06-04 | 2020-06-04 | 社交网络建模的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010502413.5A CN111797327B (zh) | 2020-06-04 | 2020-06-04 | 社交网络建模的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111797327A true CN111797327A (zh) | 2020-10-20 |
CN111797327B CN111797327B (zh) | 2021-06-18 |
Family
ID=72804164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010502413.5A Active CN111797327B (zh) | 2020-06-04 | 2020-06-04 | 社交网络建模的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111797327B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112347260A (zh) * | 2020-11-24 | 2021-02-09 | 深圳市欢太科技有限公司 | 数据处理方法、装置以及电子设备 |
CN113034298A (zh) * | 2021-03-23 | 2021-06-25 | 福建师范大学 | 移动社会网络中一种基于节点吸引力的重要用户识别方法 |
CN113407861A (zh) * | 2021-05-19 | 2021-09-17 | 中国科学技术大学 | 基于去中心化图神经网络的社交推荐方法 |
CN113792937A (zh) * | 2021-09-29 | 2021-12-14 | 中国人民解放军国防科技大学 | 一种基于图神经网络的社交网络影响力预测方法、装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100020891A1 (en) * | 2008-07-23 | 2010-01-28 | Sony Corporation | Wireless communication system, wireless communication apparatus and wireless communication method, encoding apparatus and encoding method, and computer program |
CN108256678A (zh) * | 2018-01-04 | 2018-07-06 | 浙江大学 | 一种利用排序度量的双层注意力网络进行用户关系预测的方法 |
CN109214599A (zh) * | 2018-10-25 | 2019-01-15 | 北京师范大学 | 一种对复杂网络进行链路预测的方法 |
US20190122117A1 (en) * | 2017-10-19 | 2019-04-25 | Yahoo Japan Corporation | Learning device, non-transitory computer readable storage medium, and learning method |
CN109919316A (zh) * | 2019-03-04 | 2019-06-21 | 腾讯科技(深圳)有限公司 | 获取网络表示学习向量的方法、装置和设备及存储介质 |
CN110138595A (zh) * | 2019-04-12 | 2019-08-16 | 中国科学院深圳先进技术研究院 | 动态加权网络的时间链路预测方法、装置、设备及介质 |
US20190258925A1 (en) * | 2018-02-20 | 2019-08-22 | Adobe Inc. | Performing attribute-aware based tasks via an attention-controlled neural network |
CN110413844A (zh) * | 2019-05-24 | 2019-11-05 | 浙江工业大学 | 基于时空注意力深度模型的动态链路预测方法 |
CN110503531A (zh) * | 2019-08-30 | 2019-11-26 | 中国科学技术大学 | 时序感知的动态社交场景推荐方法 |
CN111079056A (zh) * | 2019-10-11 | 2020-04-28 | 深圳壹账通智能科技有限公司 | 提取用户画像的方法、装置、计算机设备和存储介质 |
-
2020
- 2020-06-04 CN CN202010502413.5A patent/CN111797327B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100020891A1 (en) * | 2008-07-23 | 2010-01-28 | Sony Corporation | Wireless communication system, wireless communication apparatus and wireless communication method, encoding apparatus and encoding method, and computer program |
US20190122117A1 (en) * | 2017-10-19 | 2019-04-25 | Yahoo Japan Corporation | Learning device, non-transitory computer readable storage medium, and learning method |
CN108256678A (zh) * | 2018-01-04 | 2018-07-06 | 浙江大学 | 一种利用排序度量的双层注意力网络进行用户关系预测的方法 |
US20190258925A1 (en) * | 2018-02-20 | 2019-08-22 | Adobe Inc. | Performing attribute-aware based tasks via an attention-controlled neural network |
CN109214599A (zh) * | 2018-10-25 | 2019-01-15 | 北京师范大学 | 一种对复杂网络进行链路预测的方法 |
CN109919316A (zh) * | 2019-03-04 | 2019-06-21 | 腾讯科技(深圳)有限公司 | 获取网络表示学习向量的方法、装置和设备及存储介质 |
CN110138595A (zh) * | 2019-04-12 | 2019-08-16 | 中国科学院深圳先进技术研究院 | 动态加权网络的时间链路预测方法、装置、设备及介质 |
CN110413844A (zh) * | 2019-05-24 | 2019-11-05 | 浙江工业大学 | 基于时空注意力深度模型的动态链路预测方法 |
CN110503531A (zh) * | 2019-08-30 | 2019-11-26 | 中国科学技术大学 | 时序感知的动态社交场景推荐方法 |
CN111079056A (zh) * | 2019-10-11 | 2020-04-28 | 深圳壹账通智能科技有限公司 | 提取用户画像的方法、装置、计算机设备和存储介质 |
Non-Patent Citations (3)
Title |
---|
SONGMING HOU等: "Numerical method for solving matrix coefficient elliptic equation with sharp-edged interfaces", 《JOURNALS& BOOKS》 * |
刘振宇: "面向公安情报分析的知识图谱推理技术研究与实现", 《中国优秀硕士学位论文全文数据库 社会科学I辑》 * |
周炀: "基于语义权重和注意力的实体关系抽取研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112347260A (zh) * | 2020-11-24 | 2021-02-09 | 深圳市欢太科技有限公司 | 数据处理方法、装置以及电子设备 |
CN113034298A (zh) * | 2021-03-23 | 2021-06-25 | 福建师范大学 | 移动社会网络中一种基于节点吸引力的重要用户识别方法 |
CN113407861A (zh) * | 2021-05-19 | 2021-09-17 | 中国科学技术大学 | 基于去中心化图神经网络的社交推荐方法 |
CN113407861B (zh) * | 2021-05-19 | 2022-07-15 | 中国科学技术大学 | 基于去中心化图神经网络的社交推荐方法 |
CN113792937A (zh) * | 2021-09-29 | 2021-12-14 | 中国人民解放军国防科技大学 | 一种基于图神经网络的社交网络影响力预测方法、装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111797327B (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111797327B (zh) | 社交网络建模的方法及装置 | |
Lombardi et al. | Boosting combinatorial problem modeling with machine learning | |
US7418434B2 (en) | Forward-chaining inferencing | |
JP7083375B2 (ja) | 個人化コンテンツ推薦のためのリアルタイムグラフに基づく埋め込み構築方法およびシステム | |
KR20210018384A (ko) | 개인화 컨텐츠 추천을 위한 실시간 그래프기반 임베딩 구축 방법 및 시스템 | |
CN108549909B (zh) | 基于众包的对象分类方法及对象分类系统 | |
CN111797333B (zh) | 舆情传播任务展示的方法及装置 | |
Di Tollo et al. | Neural networks to model the innovativeness perception of co-creative firms | |
Pishgoo et al. | A hybrid distributed batch-stream processing approach for anomaly detection | |
Chen et al. | Generative inverse deep reinforcement learning for online recommendation | |
CN114072809A (zh) | 经由神经架构搜索的小且快速的视频处理网络 | |
Ong et al. | Comparative study of prey predator algorithm and firefly algorithm | |
CN116431914A (zh) | 一种基于个性化偏好转移模型的跨域推荐方法及系统 | |
Chamoso et al. | Social computing for image matching | |
KR102559590B1 (ko) | 신경망의 불확실성에 기반한 지식 증강 방법 및 장치 | |
Li et al. | Rough set-based approach for modeling relationship measures in product planning | |
CN110717537B (zh) | 训练用户分类模型、执行用户分类预测的方法及装置 | |
Wong et al. | State-space decomposition for reinforcement learning | |
WO2022252694A1 (zh) | 神经网络优化方法及其装置 | |
CN111027709B (zh) | 信息推荐方法、装置、服务器及存储介质 | |
Sunitha et al. | Political optimizer-based automated machine learning for skin lesion data | |
Alhammad et al. | Evolutionary neural network classifiers for software effort estimation | |
Makarova et al. | A case-based reasoning approach with fuzzy linguistic rules: Accuracy validation and application in interface design-support intelligent system | |
WO2019220653A1 (ja) | 因果関係推定装置、因果関係推定方法および因果関係推定プログラム | |
Erdeniz et al. | Cluster-specific heuristics for constraint solving |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |