CN115391710A - 基于图神经网络的社交媒体账号影响力评估方法及装置 - Google Patents

基于图神经网络的社交媒体账号影响力评估方法及装置 Download PDF

Info

Publication number
CN115391710A
CN115391710A CN202211321735.5A CN202211321735A CN115391710A CN 115391710 A CN115391710 A CN 115391710A CN 202211321735 A CN202211321735 A CN 202211321735A CN 115391710 A CN115391710 A CN 115391710A
Authority
CN
China
Prior art keywords
nodes
node
neural network
graph
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211321735.5A
Other languages
English (en)
Inventor
黄斐然
王泽钒
支庭荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan University
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN202211321735.5A priority Critical patent/CN115391710A/zh
Publication of CN115391710A publication Critical patent/CN115391710A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种基于图神经网络的社交媒体账号影响力评估方法及装置,该方法构建先构建知识图谱知识图谱和图神经网络,将图神经网络中的节点的特征向量替换为知识图谱的重要指数,并将节点聚合为聚合节点,采用注意力机制以及基于节点的重要指数计算节点对应的邻居的权重;计算图神经网络中每一个节点的中心性指数,并根据所述节点的中心性指数和重要指数计算该节点的最终预测分数。实施例将图神经网络和知识图谱进行关联,用知识图谱的节点重要性问题表示社交媒体账户的影响力,用知识图谱的节点重要性替代图神经网络的特征向量,能够灵活的利用知识图谱中包含的社交媒体信息,从已知的节点重要性学习到准确率高的评估方法。

Description

基于图神经网络的社交媒体账号影响力评估方法及装置
技术领域
本发明涉及社交网络技术领域,具体涉及一种基于图神经网络的社交媒体账号影响力评估方法及装置。
背景技术
近年来随着社交媒体平台的爆炸式增长,人们通过手机、电脑等终端就能够访问平台上任何一个用户的主页,看到其公开发布的任何言论、图片、音视频等多媒体数据,可以跟其他用户进行交互(如关注、留言、打赏等),也可以对多媒体数据产生多种行为(如点赞、评论、收藏等)。各大社交媒体平台上,用户与用户、用户与多媒体数据之间形成了一个庞大的社交网络。把握社交网络,对于新时代把握互联网治理和社会舆论具有重要意义。把握社交网络,关键在于把握社交媒体中的重点人物。如何找出社交媒体中的重点人物,评估社交媒体账号在社交网络中的影响力就成了重中之重。
通常,社交媒体账号影响力评估问题可以转化为图的节点重要性估计问题。传统的图的节点重要性的评估方法中,PageRank 算法是早期的经典方法,单纯地基于整个图来从头计算所有节点的重要性分数。个性化的 PageRank 算法在前者的基础上开始引入外界对于节点重要性的标注。HAR 方法拓展了前面两种方法的思路,开始考虑评估知识图谱上实体的重要性。知识图谱中存在实体之间不同种类的关系,HAR 在考虑到这一点的基础上来建模图结构和实体重要性。这些方法大多是基于不可学习的固定的映射或转化来计算节点重要性分数的,即在图上执行固定的传播过程,计算出其他节点的重要性分数。这些方法在面对不同种类的图时,不会针对某种图做出特定的适配,这限制了这些方法评估节点重要性分数的能力上限。
发明内容
针对所述缺陷,本发明实施例公开了一种基于图神经网络的社交媒体账号影响力评估方法及装置,其评估灵活性高,准确性高。
本发明实施例第一方面公开了基于图神经网络的社交媒体账号影响力评估方法,包括:
构建知识图谱,所述知识图谱包含若干个节点和搭建两个节点之间关系的边线,所述节点包括社交媒体账号,每一个节点分别对应有重要指数,且其中一部分节点在所述知识图谱中的重要指数为已知,并计算获取另一部分节点的重要指数;
构建图神经网络,所述图神经网络包含若干层神经网,每一层神经网接收上一层神经网的节点的特征向量;
将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数,并将节点聚合为聚合节点;
采用注意力机制以及基于节点的重要指数计算节点对应的邻居的权重;
计算图神经网络中每一个节点的中心性指数,并根据所述节点的中心性指数和重要指数计算该节点的最终预测分数。
作为一种可选的实施方式,在本发明实施例第一方面中,所述知识图谱表示为(G, E),其中
Figure 955273DEST_PATH_IMAGE001
,G为所述节点,E为所述边线, Q为所有边线的总数量,
Figure 784689DEST_PATH_IMAGE002
表示第
Figure 437387DEST_PATH_IMAGE003
种节点的集合,
Figure 213713DEST_PATH_IMAGE004
表示第
Figure 307571DEST_PATH_IMAGE005
种边线的集合。
作为一种可选的实施方式,在本发明实施例第一方面中,计算获取另一部分节点 的重要指数具体为:通过学习函数预估知识图谱中所有节点的重要性分数,所述学习函数 为:
Figure 635785DEST_PATH_IMAGE006
,其中,i为节点。
作为一种可选的实施方式,在本发明实施例第一方面中,定义所述图神经网络包 括
Figure 385566DEST_PATH_IMAGE007
层神经网,则每一层神经网接收来自
Figure 508460DEST_PATH_IMAGE008
层神经网的节点的特征向量,定义所述节点 为i,所述特征向量为
Figure 50300DEST_PATH_IMAGE009
作为一种可选的实施方式,在本发明实施例第一方面中,所述将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数,并将节点聚合为聚合节点,包括:
将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数;
通过以下方式将节点聚合为聚合节点:
Figure 424780DEST_PATH_IMAGE010
,其中,
Figure 786492DEST_PATH_IMAGE011
表示节点
Figure 904620DEST_PATH_IMAGE012
在图神经网络中的第
Figure 300967DEST_PATH_IMAGE007
层 的重要性分数
Figure 643086DEST_PATH_IMAGE013
是节点
Figure 367460DEST_PATH_IMAGE012
的邻居j的集合。
作为一种可选的实施方式,在本发明实施例第一方面中,通过以下公式计算节点对应的邻居的权重:
Figure 86017DEST_PATH_IMAGE014
其中
Figure 336870DEST_PATH_IMAGE015
非线性的激活函数,
Figure 787574DEST_PATH_IMAGE016
为注意力机制中的可学习参数,
Figure 795981DEST_PATH_IMAGE017
表示连接 操作,
Figure 583809DEST_PATH_IMAGE018
表示节点的邻居的权重,
Figure 830113DEST_PATH_IMAGE019
表示节点
Figure 841932DEST_PATH_IMAGE012
和 邻居
Figure 540897DEST_PATH_IMAGE020
之间的边线。
作为一种可选的实施方式,在本发明实施例第一方面中,通过以下公式计算中心性指数:
Figure 663574DEST_PATH_IMAGE021
,其中
Figure 764385DEST_PATH_IMAGE022
为中心性指数,
Figure 212684DEST_PATH_IMAGE023
为节点在图神经网络上的 入度,
Figure 398946DEST_PATH_IMAGE024
为一个数值极小正常量;
通过以下公式计算解决的最终预测分数:
Figure 997418DEST_PATH_IMAGE025
,其中
Figure 342948DEST_PATH_IMAGE026
为最终预测分数,
Figure 571936DEST_PATH_IMAGE027
为重要性指数。
本发明实施例第二方面公开一种基于图神经网络的社交媒体账号影响力评估装置,包括:
图谱构建模块:用于构建知识图谱,所述知识图谱包含若干个节点和搭建两个节点之间关系的边线,所述节点包括社交媒体账号,每一个节点分别对应有重要指数,且其中一部分节点在所述知识图谱中的重要指数为已知,并计算获取另一部分节点的重要指数;
网络构建模块:用于构建图神经网络,所述图神经网络包含若干层神经网,每一层神经网接收上一层神经网的节点的特征向量;
节点聚合模块:用于将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数,并将节点聚合为聚合节点;
权重计算模块:用于采用注意力机制以及基于节点的重要指数计算节点对应的邻居的权重;
分数预测模块:用于计算图神经网络中每一个节点的中心性指数,并根据所述节点的中心性指数和重要指数计算该节点的最终预测分数。
本发明实施例第三方面公开一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行本发明实施例第一方面公开的基于图神经网络的社交媒体账号影响力评估方法。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的基于图神经网络的社交媒体账号影响力评估方法。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中的基于图神经网络的社交媒体账号影响力评估方法先构建知识图谱,再构建图神经网络,将图神经网络和知识图谱进行关联,用知识图谱的节点重要性问题表示社交媒体账户的影响力,用知识图谱的节点重要性替代图神经网络的特征向量,能够灵活的利用知识图谱中包含的社交媒体信息,从已知的节点重要性学习到准确率高的评估方法。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的基于图神经网络的社交媒体账号影响力评估方法的流程示意图;
图2是本发明实施例公开的知识图谱示例图;
图3是本发明实施例提供的一种基于图神经网络的社交媒体账号影响力评估装置的结构示意图;
图4是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,示例性地,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了基于图神经网络的社交媒体账号影响力评估方法、装置、电子设备及存储介质,先构建知识图谱,再构建图神经网络,将图神经网络和知识图谱进行关联,用知识图谱的节点重要性问题表示社交媒体账户的影响力,用知识图谱的节点重要性替代图神经网络的特征向量,能够灵活的利用知识图谱中包含的社交媒体信息,从已知的节点重要性学习到准确率高的评估方法。
实施例一
请参阅图1,图1是本发明实施例公开的基于图神经网络的社交媒体账号影响力评估方法的流程示意图,图2是本发明实施例公开的知识图谱示例图。其中,本发明实施例所描述的方法的执行主体为由软件或/和硬件组成的执行主体,该执行主体可以通过有线或/和无线方式接收相关信息,并可以发送一定的指令。当然,其还可以具有一定的处理功能和存储功能。该执行主体可以控制多个设备,例如远程的物理服务器或云服务器以及相关软件,也可以是对某处安置的设备进行相关操作的本地主机或服务器以及相关软件等。在一些场景中,还可以控制多个存储设备,存储设备可以与设备放置于同一地方或不同地方。结合图1和图2所示,该基于基于图神经网络的社交媒体账号影响力评估方法包括以下步骤:
101、构建知识图谱,所述知识图谱包含若干个节点和搭建两个节点之间关系的边线,所述节点包括社交媒体账号,每一个节点分别对应有重要指数,且其中一部分节点在所述知识图谱中的重要指数为已知,并计算获取另一部分节点的重要指数。
实施例中,所述知识图谱表示为(G,E),其中
Figure 370127DEST_PATH_IMAGE001
,G为所述节点,E为所述边 线,Q为所有边线的总数量,
Figure 303448DEST_PATH_IMAGE002
表示第
Figure 378852DEST_PATH_IMAGE003
种节点的集合,
Figure 903374DEST_PATH_IMAGE004
表示第
Figure 329807DEST_PATH_IMAGE005
种边线的集合。 该知识图谱用于表示社交关系,社交关系必然包含用户种类的实体,也即是节点至少包含 用户,结合图2,节点还可以是热门推文、推文、热门用户等等。而用户与热门推文或者普通 的推文之间的关系以及用户与用户之间的关系,包括收藏、转发、关注、点赞、发布等等,这 些关系也即是构成知识图谱中的边线。
Figure 597977DEST_PATH_IMAGE028
中存在子集
Figure 527887DEST_PATH_IMAGE029
Figure 692152DEST_PATH_IMAGE030
表示用户的 集合。与
Figure 464936DEST_PATH_IMAGE029
中的节点相连接的节点可能也属于
Figure 412164DEST_PATH_IMAGE029
,此时两边节点的关系可能是关注与 被关注的关系;与
Figure 586793DEST_PATH_IMAGE029
中的节点相连接的节点也可能不属于
Figure 62905DEST_PATH_IMAGE029
,可能是属于推文种类的 实体,此时两边节点的关系可能是发布与被发布的关系、评论与被评论的关系等。
将社交媒体账号影响力表示成知识图谱
Figure 588564DEST_PATH_IMAGE031
上节点的重要性分数,这里用
Figure 73903DEST_PATH_IMAGE032
表示节点
Figure 306302DEST_PATH_IMAGE012
的重要性分数,该分数为非负值。这里假设
Figure 609107DEST_PATH_IMAGE031
上的一部分节点
Figure 966270DEST_PATH_IMAGE033
的重要性分数
Figure 645513DEST_PATH_IMAGE034
是已知的,作为推断其他节点的重要性分数的 依据。实施例计算获取另一部分节点的重要指数具体为:通过学习函数预估知识图谱中所 有节点的重要性分数,所述学习函数为:
Figure 404522DEST_PATH_IMAGE006
,其中,
Figure 81491DEST_PATH_IMAGE012
为节点。给定知识图谱
Figure 50584DEST_PATH_IMAGE031
和 部分节点的重要性分数
Figure 877725DEST_PATH_IMAGE035
,学习一个函数
Figure 147033DEST_PATH_IMAGE006
,估计
Figure 667007DEST_PATH_IMAGE031
中所有节点的重要性分 数。图2展示了一个知识图谱社交网络的示例,图上部分实体已经提前给出了重要性分数, 通过一种监督学习的方法来学习一个函数,能够将图上的任一节点映射为它的重要性分 数,该重要性分数能够尽可能地近似它的真实重要性分数,解决该图上的节点重要性估计 问题,进而解决该社交网络下的社交媒体账号影响力评估问题
102、构建图神经网络,所述图神经网络包含若干层神经网,每一层神经网接收上一层神经网的节点的特征向量。
实施例中构建一般化的图神经网络,应用于社交网络知识图谱,聚合节点的邻居 信息。定义所述图神经网络包括
Figure 326658DEST_PATH_IMAGE007
层神经网,则每一层神经网接收来自
Figure 82125DEST_PATH_IMAGE008
层神经网的节 点的特征向量,定义所述节点为i,所述特征向量为
Figure 550146DEST_PATH_IMAGE036
在该图神经网络中,第
Figure 631235DEST_PATH_IMAGE008
层神经网定义为上一层神经网,通过聚合节点
Figure 450286DEST_PATH_IMAGE012
的 邻居的特征向量
Figure 212706DEST_PATH_IMAGE037
,来更新节点
Figure 925447DEST_PATH_IMAGE012
的特征向量为
Figure 521644DEST_PATH_IMAGE038
,对于节点
Figure 952626DEST_PATH_IMAGE012
在第
Figure 190840DEST_PATH_IMAGE007
层的聚合操作可以表示为:
Figure 23667DEST_PATH_IMAGE039
Figure 790766DEST_PATH_IMAGE040
其中,
Figure 912306DEST_PATH_IMAGE041
为对节点
Figure 813266DEST_PATH_IMAGE012
的邻居信息进行整合的聚合函数,
Figure 110386DEST_PATH_IMAGE018
表示节点
Figure 704178DEST_PATH_IMAGE012
Figure 719539DEST_PATH_IMAGE020
之间的关系权重;
Figure 627452DEST_PATH_IMAGE042
为合并节点
Figure 169292DEST_PATH_IMAGE012
自身信息及其邻居信息的融合函数,融合后通 过可学习参数
Figure 532054DEST_PATH_IMAGE043
和非线性的激活函数
Figure 159344DEST_PATH_IMAGE015
进行一次非线性转换。更新后的特征向量
Figure 543052DEST_PATH_IMAGE044
又成为
Figure 939398DEST_PATH_IMAGE045
层网络的输入,重复聚合过程直至第
Figure 812676DEST_PATH_IMAGE007
层,第
Figure 802629DEST_PATH_IMAGE007
层输出即为融合了节点 的
Figure 583503DEST_PATH_IMAGE007
阶邻居信息的特征向量。
103、将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数,并将节点聚合为聚合节点。
实施例中具体为将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数;通过以下方式将节点聚合为聚合节点:
Figure 240881DEST_PATH_IMAGE046
;其中,
Figure 81798DEST_PATH_IMAGE011
表示节点
Figure 559047DEST_PATH_IMAGE012
在图神经网络中的第
Figure 143612DEST_PATH_IMAGE007
层 的重要性分数
Figure 717812DEST_PATH_IMAGE013
是节点
Figure 604997DEST_PATH_IMAGE012
的邻居j的集合。
对一般的图神经网络做出针对节点重要性评估任务的修改,将聚合的对象由节点 嵌入调整为节点重要性。实施例采用分数聚合方式取代传统的特征向量聚合,具体是将前 面中第
Figure 100700DEST_PATH_IMAGE008
层节点的特征向量替换为节点的重要性分数,结合
Figure 488956DEST_PATH_IMAGE047
,这里通过对节点
Figure 917664DEST_PATH_IMAGE012
及其邻居在
Figure 975750DEST_PATH_IMAGE008
层的重 要性分数进行加权聚合,来计算节点
Figure 817804DEST_PATH_IMAGE012
Figure 619538DEST_PATH_IMAGE007
层的重要性分数。
Figure 699489DEST_PATH_IMAGE048
时,由于不存在第 0 层网络,因而没有可用的
Figure 521952DEST_PATH_IMAGE049
。这里使用节点经过 向量化的初始特征,即社交网络中经过向量化的实体特征,例如用户实体的性别、年龄、地 域等信息,推文实体的标签、文本等信息等作为输入,学习一种将节点初始特征映射为节点 初始重要性分数的映射,即
Figure 195509DEST_PATH_IMAGE050
,其中
Figure 191147DEST_PATH_IMAGE051
即为可学习的映射,该映射可以是任何神经网 络,能够输入在节点初始特征后输出节点初始重要性分数,
Figure 971DEST_PATH_IMAGE052
为该映射的可学习参数。
104、采用注意力机制以及基于节点的重要指数计算节点对应的邻居的权重。
具体通过以下公式计算节点对应的邻居的权重:
Figure 791073DEST_PATH_IMAGE053
,其中
Figure 279823DEST_PATH_IMAGE015
非线性的激活函数,
Figure 423360DEST_PATH_IMAGE016
为注意力机制中的可学习参数,
Figure 477903DEST_PATH_IMAGE017
表示连接操作,
Figure 579852DEST_PATH_IMAGE018
表示节 点的邻居的权重,
Figure 87056DEST_PATH_IMAGE019
表示节点
Figure 362180DEST_PATH_IMAGE012
和 邻居
Figure 412175DEST_PATH_IMAGE020
之间的边线。
实施例考虑到设计网络中实体之间关系的多样性,不同的关系在重要性分数的传 播过程中的重要性不同,例如某条推文成为热门推文,与点赞该推文的用户关系不大,与发 布该推文的用户有较大的关系。又考虑到节点自身重要性也在一定程度上影响了重要性分 数的传播过程,例如热门用户发布的推文通常也会具备较高的热度。基于上述两个考虑,提 出一种实体关系和重要性驱动的自注意力机制,将实体的具体关系种类和实体自身的重要 性分数作为决定节点
Figure 278500DEST_PATH_IMAGE012
的邻居
Figure 679526DEST_PATH_IMAGE054
的权重
Figure 289499DEST_PATH_IMAGE018
的依据。用
Figure 521897DEST_PATH_IMAGE019
表示节点
Figure 434489DEST_PATH_IMAGE012
Figure 181865DEST_PATH_IMAGE020
之间的关系,若
Figure 736475DEST_PATH_IMAGE012
Figure 620117DEST_PATH_IMAGE020
之间存在关系
Figure 969190DEST_PATH_IMAGE055
(即种类为
Figure 141545DEST_PATH_IMAGE055
的边),则
Figure 93321DEST_PATH_IMAGE056
,否则
Figure 237994DEST_PATH_IMAGE057
。 进一步地,为每种关系
Figure 617023DEST_PATH_IMAGE058
提供可学习的向量表示
Figure 948778DEST_PATH_IMAGE059
用于表征关系
Figure 438665DEST_PATH_IMAGE055
105、计算图神经网络中每一个节点的中心性指数,并根据所述节点的中心性指数和重要指数计算该节点的最终预测分数。
本步骤中,通过以下公式计算中心性指数:
Figure 172266DEST_PATH_IMAGE060
,其中
Figure 253355DEST_PATH_IMAGE022
为中心性指数,
Figure 72406DEST_PATH_IMAGE023
为节点在图神经网络上的入 度,
Figure 365984DEST_PATH_IMAGE024
为一个数值极小正常量。
实施例通过定义节点的中心性,结合节点的中心性和最后一层图神经网络输出的节点重要性,计算最终的节点重要性作为预测结果。
社交网络中通常会有一种很明显而重要的现象:越是在社交网络中扮演中心角色的实体,其重要性往往越大,反之则重要性越小。举例来说,一个坐拥大量粉丝的热门用户实体,作为大量粉丝用户实体的中心,其账号影响力是巨大的。利用这一先验知识对于评估社交媒体账号影响力十分有效,尤其是当已知影响力的社交媒体账号数目相对于总数目越小时,能够有效地过滤数据中的噪音,保证影响力评估模型的鲁棒性。
原始的节点中心性
Figure 281988DEST_PATH_IMAGE061
提供了关于节点重要性的有用信息,为了使其能够与图 聚合操作计算出的第
Figure 143764DEST_PATH_IMAGE062
层结果
Figure 840325DEST_PATH_IMAGE027
协同建模节点的重要性,先对
Figure 812960DEST_PATH_IMAGE061
其进行放缩和偏 移转换,以对齐
Figure 583470DEST_PATH_IMAGE027
,将
Figure 740782DEST_PATH_IMAGE063
改写为
Figure 534426DEST_PATH_IMAGE064
, 其中
Figure 169806DEST_PATH_IMAGE065
Figure 998085DEST_PATH_IMAGE066
分别为可学习的放缩因子和偏移因子。
实施例定义损失函数,将已知的部分节点重要性分数作为标签,计算前面描述的各个步骤中定义的模型的输出与实际标签之间的差距作为优化目标,执行优化算法更新模型参数。
将通过以下公式计算解决的最终预测分数:
Figure 326298DEST_PATH_IMAGE067
,其中
Figure 669555DEST_PATH_IMAGE026
为最终 预测分数,
Figure 249572DEST_PATH_IMAGE027
为重要性指数。
在已知部分节点
Figure 56991DEST_PATH_IMAGE033
的重要性分数的情况下,通过训练步骤103-105中描述 的模型,能够让模型具备预测剩余的其他节点
Figure 431471DEST_PATH_IMAGE068
的节点重要性的泛化能力。具体 地,这里使用均方差损失作为损失函数,计算模型的预测分数
Figure 58762DEST_PATH_IMAGE026
和实际分数
Figure 239208DEST_PATH_IMAGE069
的差距 如下:
Figure 307658DEST_PATH_IMAGE070
其中
Figure 853040DEST_PATH_IMAGE071
即为模型训练时的损失,即优化目标。为了避免过拟合,在模型训练时,以 模型在验证集上的表现为指标,使用通用的权重衰减和提前停止策略。
实施例利用社交媒体平台上的各种信息(包括用户与用户、用户与推文之间的多种关系,用户特征、推文特征)构建知识图谱,从已知的部分社交媒体账号的影响力中学习到影响力的近似评估方法。特别地,将社交媒体上用户和多媒体对象的关系网络(社交网络)建模为知识图谱,以描述社交网络中的多种实体间的多种关系。具体地,在该社交网络知识图谱中,包含2种以上类型的实体,其中必然有一种实体为用户实体,其实体种类多为多媒体数据实体,如推文、音乐、视频等。相比于传统图只描述了单一实体的单一关系,该社交网络知识图谱中的多种实体之间存在不同种类的关系,如用户与用户之间的好友关系和订阅关系、用户与多媒体数据之间的点赞、转发、收藏等行为关系。同时,本专利将账号影响力建模为知识图谱中的节点重要性,基于图神经网络学习节点重要性的评估方法。账号影响力通常是通过账号的订阅量、账号推文的点赞数量、转发数量、评论数量进行计算的,例如通过对订阅量、点赞总数、转发总数、评论总数进行简单的加权求和来作为其账号影响力的数值。为了获取更准确、更符合社交媒体特点的账号影响力评估方法,这里基于各大社交媒体平台公开访问的部分账号的影响力作为图神经网络进行节点重要性评估任务的监督信息,训练图神经网络以推断其他节点的重要性,即其他社交媒体账号的影响力。
实施例二
请参阅图3,图3是本发明实施例公开的基于图神经网络的社交媒体账号影响力评估装置的结构示意图。如图3所示,该基于图神经网络的社交媒体账号影响力评估装置可以包括图谱构建模块301、网络构建模块302、节点聚合模块303、权重计算模块304和分数预测模块305,其中,图谱构建模块301:用于构建知识图谱,所述知识图谱包含若干个节点和搭建两个节点之间关系的边线,所述节点包括社交媒体账号,每一个节点分别对应有重要指数,且其中一部分节点在所述知识图谱中的重要指数为已知,并计算获取另一部分节点的重要指数;网络构建模块302:用于构建图神经网络,所述图神经网络包含若干层神经网,每一层神经网接收上一层神经网的节点的特征向量;节点聚合模块303:用于将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数,并将节点聚合为聚合节点;权重计算模块304:用于采用注意力机制以及基于节点的重要指数计算节点对应的邻居的权重;分数预测模块305:用于计算图神经网络中每一个节点的中心性指数,并根据所述节点的中心性指数和重要指数计算该节点的最终预测分数。
本实施例的技术手段与技术效果与实施例一实质相同,在此不再赘述。
实施例三
请参阅图4,图4是本发明实施例公开的一种电子设备的结构示意图。电子设备可以是计算机以及服务器等,当然,在一定情况下,还可以是手机、平板电脑以及监控终端等智能设备,以及具有处理功能的图像采集装置。如图4所示,该电子设备可以包括:
存储有可执行程序代码的存储器401;
与存储器401耦合的处理器402;
其中,处理器402调用存储器401中存储的可执行程序代码,执行实施例一中的基于图神经网络的社交媒体账号影响力评估方法中的部分或全部步骤。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行实施例一中的基于图神经网络的社交媒体账号影响力评估方法中的部分或全部步骤。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于图神经网络的社交媒体账号影响力评估方法中的部分或全部步骤。
本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一中的基于图神经网络的社交媒体账号影响力评估方法中的部分或全部步骤。
在本发明的各种实施例中,应理解,所述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的部分或全部步骤。
在本发明所提供的实施例中,应理解,“与A对应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的基于图神经网络的社交媒体账号影响力评估方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于图神经网络的社交媒体账号影响力评估方法,其特征在于,包括:
构建知识图谱,所述知识图谱包含若干个节点和搭建两个节点之间关系的边线,所述节点包括社交媒体账号,每一个节点分别对应有重要指数,且其中一部分节点在所述知识图谱中的重要指数为已知,并计算获取另一部分节点的重要指数;
构建图神经网络,所述图神经网络包含若干层神经网,每一层神经网接收上一层神经网的节点的特征向量;
将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数,并将节点聚合为聚合节点;
采用注意力机制以及基于节点的重要指数计算节点对应的邻居的权重;
计算图神经网络中每一个节点的中心性指数,并根据所述节点的中心性指数和重要指数计算该节点的最终预测分数。
2.根据权利要求1所述的社交媒体账号影响力评估方法,其特征在于,所述知识图谱表 示为(G,E),其中
Figure 422860DEST_PATH_IMAGE001
,G为所述节点,E为所 述边线,Q为所有边线的总数量,
Figure 890750DEST_PATH_IMAGE002
表示第
Figure 267505DEST_PATH_IMAGE003
种节点的集合,
Figure 356815DEST_PATH_IMAGE004
表示第
Figure 793612DEST_PATH_IMAGE005
种边线的集 合。
3.根据权利要求2所述的社交媒体账号影响力评估方法,其特征在于,计算获取另一部 分节点的重要指数具体为:通过学习函数预估知识图谱中所有节点的重要性分数,所述学 习函数为:
Figure 155323DEST_PATH_IMAGE006
,其中,
Figure 460403DEST_PATH_IMAGE007
为节点。
4.根据权利要求1所述的社交媒体账号影响力评估方法,其特征在于,定义所述图神经 网络包括
Figure 794432DEST_PATH_IMAGE008
层神经网,则每一层神经网接收来自
Figure 265778DEST_PATH_IMAGE009
层神经网的节点的特征向量,定义所 述节点为i,所述特征向量为
Figure 52469DEST_PATH_IMAGE010
5.根据权利要求1所述的社交媒体账号影响力评估方法,其特征在于,所述将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数,并将节点聚合为聚合节点,包括:
将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数;
通过以下方式将节点聚合为聚合节点:
Figure 833343DEST_PATH_IMAGE011
其中,
Figure 412092DEST_PATH_IMAGE012
表示节点
Figure 190692DEST_PATH_IMAGE007
在图神经网络中的第
Figure 74466DEST_PATH_IMAGE008
层的重要性分数
Figure 596714DEST_PATH_IMAGE013
是节点
Figure 295548DEST_PATH_IMAGE007
的邻 居j的集合。
6.根据权利要求1所述的社交媒体账号影响力评估方法,其特征在于,通过以下公式计算节点对应的邻居的权重:
Figure 245050DEST_PATH_IMAGE014
,其中
Figure 147278DEST_PATH_IMAGE015
非线性的激活函数,
Figure 207638DEST_PATH_IMAGE016
为注意力机制中的可学习参数,
Figure 495400DEST_PATH_IMAGE017
表示连接操作,
Figure 615802DEST_PATH_IMAGE018
表示节点的邻居的权重,
Figure 739747DEST_PATH_IMAGE019
表示 节点
Figure 400536DEST_PATH_IMAGE007
和 邻居
Figure 683750DEST_PATH_IMAGE020
之间的边线。
7.根据权利要求1所述的社交媒体账号影响力评估方法,其特征在于,通过以下公式计算中心性指数:
Figure 834108DEST_PATH_IMAGE021
,其中
Figure 569983DEST_PATH_IMAGE022
为中心性指数,
Figure 113091DEST_PATH_IMAGE023
为节点在图神经网络上的入度,
Figure 47549DEST_PATH_IMAGE024
为一个数值极小正常量;
通过以下公式计算解决的最终预测分数:
Figure 509754DEST_PATH_IMAGE025
,其中
Figure 857559DEST_PATH_IMAGE026
为最终预测分数,
Figure 328992DEST_PATH_IMAGE027
为重要性指数。
8.一种基于图神经网络的社交媒体账号影响力评估装置,其特征在于,包括:
图谱构建模块:用于构建知识图谱,所述知识图谱包含若干个节点和搭建两个节点之间关系的边线,所述节点包括社交媒体账号,每一个节点分别对应有重要指数,且其中一部分节点在所述知识图谱中的重要指数为已知,并计算获取另一部分节点的重要指数;
网络构建模块:用于构建图神经网络,所述图神经网络包含若干层神经网,每一层神经网接收上一层神经网的节点的特征向量;
节点聚合模块:用于将所述图神经网络中的节点的特征向量替换为知识图谱的重要指数,并将节点聚合为聚合节点;
权重计算模块:用于采用注意力机制以及基于节点的重要指数计算节点对应的邻居的权重;
分数预测模块:用于计算图神经网络中每一个节点的中心性指数,并根据所述节点的中心性指数和重要指数计算该节点的最终预测分数。
9.一种电子设备,其特征在于,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行权利要求1至7任一项所述的基于图神经网络的社交媒体账号影响力评估方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1至7任一项所述的基于图神经网络的社交媒体账号影响力评估方法。
CN202211321735.5A 2022-10-27 2022-10-27 基于图神经网络的社交媒体账号影响力评估方法及装置 Pending CN115391710A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211321735.5A CN115391710A (zh) 2022-10-27 2022-10-27 基于图神经网络的社交媒体账号影响力评估方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211321735.5A CN115391710A (zh) 2022-10-27 2022-10-27 基于图神经网络的社交媒体账号影响力评估方法及装置

Publications (1)

Publication Number Publication Date
CN115391710A true CN115391710A (zh) 2022-11-25

Family

ID=84128821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211321735.5A Pending CN115391710A (zh) 2022-10-27 2022-10-27 基于图神经网络的社交媒体账号影响力评估方法及装置

Country Status (1)

Country Link
CN (1) CN115391710A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117670572A (zh) * 2024-02-02 2024-03-08 南京财经大学 一种基于图对比学习的社交行为预测方法、系统及产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160753A (zh) * 2019-12-25 2020-05-15 大连理工大学 一种基于知识图谱的路网节点重要性评估的方法
CN111400504A (zh) * 2020-03-12 2020-07-10 支付宝(杭州)信息技术有限公司 企业关键人的识别方法和装置
US20210081780A1 (en) * 2019-09-13 2021-03-18 Honda Motor Co., Ltd. System and method for providing object-level driver attention reasoning with a graph convolution network
CN112905891A (zh) * 2021-03-05 2021-06-04 中国科学院计算机网络信息中心 基于图神经网络的科研知识图谱人才推荐方法及装置
CN113792937A (zh) * 2021-09-29 2021-12-14 中国人民解放军国防科技大学 一种基于图神经网络的社交网络影响力预测方法、装置
CN114611384A (zh) * 2022-02-25 2022-06-10 北京工业大学 基于图神经网络的医学知识图谱节点重要性评估方法
CN115048530A (zh) * 2022-05-27 2022-09-13 昆明理工大学 融合邻居重要度和特征学习的图卷积推荐系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210081780A1 (en) * 2019-09-13 2021-03-18 Honda Motor Co., Ltd. System and method for providing object-level driver attention reasoning with a graph convolution network
CN111160753A (zh) * 2019-12-25 2020-05-15 大连理工大学 一种基于知识图谱的路网节点重要性评估的方法
CN111400504A (zh) * 2020-03-12 2020-07-10 支付宝(杭州)信息技术有限公司 企业关键人的识别方法和装置
CN112905891A (zh) * 2021-03-05 2021-06-04 中国科学院计算机网络信息中心 基于图神经网络的科研知识图谱人才推荐方法及装置
CN113792937A (zh) * 2021-09-29 2021-12-14 中国人民解放军国防科技大学 一种基于图神经网络的社交网络影响力预测方法、装置
CN114611384A (zh) * 2022-02-25 2022-06-10 北京工业大学 基于图神经网络的医学知识图谱节点重要性评估方法
CN115048530A (zh) * 2022-05-27 2022-09-13 昆明理工大学 融合邻居重要度和特征学习的图卷积推荐系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117670572A (zh) * 2024-02-02 2024-03-08 南京财经大学 一种基于图对比学习的社交行为预测方法、系统及产品
CN117670572B (zh) * 2024-02-02 2024-05-03 南京财经大学 一种基于图对比学习的社交行为预测方法、系统及产品

Similar Documents

Publication Publication Date Title
KR102203252B1 (ko) 생성적 적대 신경망에 기반한 협업 필터링을 위한 방법 및 시스템
KR102203253B1 (ko) 생성적 적대 신경망에 기반한 평점 증강 및 아이템 추천 방법 및 시스템
Snijders Longitudinal methods of network analysis
CN107909427A (zh) 一种提升推荐模型时序数据挖掘能力的循环神经网络方法
JP2016505974A (ja) インスタンス重み付け学習機械学習モデル
CN111274501B (zh) 推送信息的方法、系统和非暂时性存储介质
CN113761388B (zh) 一种推荐方法、装置、电子设备及存储介质
CN112395515B (zh) 一种信息推荐方法、装置、计算机设备及存储介质
CN115631008B (zh) 商品推荐方法、装置、设备及介质
Wang et al. A proactive decision support method based on deep reinforcement learning and state partition
CN113221019A (zh) 基于即时学习的个性化推荐方法和系统
Bebarta et al. Comparative study of stock market forecasting using different functional link artificial neural networks
CN115391710A (zh) 基于图神经网络的社交媒体账号影响力评估方法及装置
CN116308551A (zh) 基于数字金融ai平台的内容推荐方法及系统
CN115760271A (zh) 基于图神经网络的机电商品个性化推荐方法和系统
CN116992008A (zh) 知识图谱多跳问答推理方法、装置和计算机设备
CN116992151A (zh) 一种基于双塔图卷积神经网络的在线课程推荐方法
CN117633371B (zh) 基于多注意力机制的推荐方法、设备和可读存储介质
Ardimansyah et al. Preprocessing matrix factorization for solving data sparsity on memory-based collaborative filtering
CN113259163B (zh) 一种基于网络拓扑感知的Web服务质量预测方法及系统
CN114493674A (zh) 一种广告点击率预测模型及方法
CN113762477A (zh) 一种构建序列推荐模型的方法和序列推荐方法
CN106096653B (zh) 基于跨平台用户社交多媒体行为的人口属性推断方法
CN117251626A (zh) 一种课程推荐方法、系统及电子设备
CN116204723A (zh) 一种基于动态超图表示学习的社交推荐方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination