CN111754356A - 边符号预测方法、装置及设备 - Google Patents
边符号预测方法、装置及设备 Download PDFInfo
- Publication number
- CN111754356A CN111754356A CN202010613871.6A CN202010613871A CN111754356A CN 111754356 A CN111754356 A CN 111754356A CN 202010613871 A CN202010613871 A CN 202010613871A CN 111754356 A CN111754356 A CN 111754356A
- Authority
- CN
- China
- Prior art keywords
- node
- vector
- neighbor structure
- status
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000013528 artificial neural network Methods 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 134
- 230000006870 function Effects 0.000 claims description 34
- 238000010276 construction Methods 0.000 claims description 15
- 230000004913 activation Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 5
- 240000000037 Prosopis spicigera Species 0.000 claims description 2
- 235000006629 Prosopis spicigera Nutrition 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 abstract description 5
- 238000013135 deep learning Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 3
- 230000002996 emotional effect Effects 0.000 description 3
- 238000003012 network analysis Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 240000004760 Pimpinella anisum Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种边符号预测方法、装置及设备,属于边符号预测技术领域,该发明中,使用深度学习技术从符号社交网络的复杂结构信息中抓取与边符号形成有关的非线性结构特征;同时,该发明还通过级联节点的出/入邻居结构来综合性地考虑边所涉及的“三角形”结构信息,扩展了平衡理论;最后,该发明还涉及了一个两层的神经网络架构来合理地融合平衡理论和地位理论,以此来更好地解决边符号预测任务。
Description
技术领域
本发明属于边符合预测技术领域,具体涉及一种边符合预测方法、装置及设备。
背景技术
随着用户情感表达需求的增强,越来越多的在线社交网络开始允许用户表达正面或负面的情感倾向,从而形成了一个符号社交网络,也就是说符号社交网络(SignedSocial Networks,SSN)是一种能让用户向其他参与者表达多种不同类型(正边或负边)的情感倾向的网络。在一个符号社交网络中,用户不仅能向其它用户表达诸如喜欢、信任、朋友、以及支持之类正面的情感(正边),同时还能表达像不喜欢、不信任、敌人、以及反对这一类负面的态度(负边)。
在社交网络分析领域,大多数的研究专注于无符号社交网络,对符号社交网络的研究相对较少。由于负边的存在性,许多杰出的无符号社交网络分析方法并不能很好地解决符号社交网络中的分析任务。在众多符号社交网络分析任务中,边符号预测是一个相对基础并且关键的分析任务,是其它分析任务的基础。符号预测也可称为态度预测,它指的是根据在线社交网络中已知的个体间的正负关系推断出其他个体之间的潜在态度。符号预测可以为个性化服务提供强有力的支撑,因此在现实生活中具有非常广泛的应用。
现存的边符号预测方法大致可以划分为两大类:第一类是基于监督学习的方法。一般而言,基于监督学习的方法首先从符号社交网络中提取与边符号形成有关的重要特征,接着使用提取的特征以及边的符号信息训练一个分类模型来完成边符号预测任务。根据从网络中提取特征的方式不同,基于监督学习的方法还能够细分为基于特征工程的方法以及基于网络嵌入的方法。第二类是基于无监督学习的方法。基于无监督学习的方法通常是设计一些网络中节点对之间的相似性计算标准,然后对节点对的相似性值进行排序来完成边符号预测任务,或者是通过在符号社交网络上执行信任传播机制来完成边符号预测。
但是,符号社交网络日渐复杂,而现有的预测方法只是从某一个角度来解决边符号预测问题,无法综合性地考虑每条边可能卷入的所有“三角形”结构信息,具有一定的片面性,因此很难获得最优的边符号预测性能。
发明内容
为了至少解决现有技术存在的上述问题,本发明提供了一种边符号预测方法、装置及设备。
本发明提供的技术方案如下:
一方面,一种边符号预测方法,包括:
获取目标符号社交网络中的目标有向边eij,所述目标有向边eij的起始节点为i,所述目标有向边eij的终止节点为j;
基于平衡理论,为所述起始节点i、终止节点j,分别生成平衡的邻居结构向量b_sti和邻居结构向量b_enj;
基于第一预设规则、所述邻居结构向量b_sti和邻居结构向量b_enj,获取所述目标节点的平衡嵌入表示b_emi和b_emj;
根据第二预设规则、出邻居结构向量和入邻居结构向量,分别获取节点i和节点j的地位邻居结构向量s_nei和s_nej;
根据第三预设规则、地位邻居结构向量s_nei和s_nej,分别获取节点i和节点j的地位嵌入向量s_emi和s_emj;
基于所述潜在特征向量b_emi、b_emj和所述地位嵌入向量s_emi、s_emj,确定最终嵌入向量finalij;
基于所述平衡嵌入表示finalij和预设预测模型,获取所述目标有向边的预测概率pij。
可选的,还包括:
基于地位理论,根据节点i的地位值和节点j的地位值,获取地位损失函数Lst;
根据交叉熵及所述地位损失函数Lst,获取符号预测损失。
可选的,所述第一预设规则,为基于两层全连接神经网络构建的第一模型;
所述第一模型,为:
b_emi=tanh(tanh(b_stiW0+b0)W1+b1)),
b_emj=tanh(tanh(b_enjW0+b0)W1+b1)),
其中,tanh为非线性的激活函数;W0∈R4|V|×2d,W1∈R2d×d;w0和w1均为权重参数(Weight Parameter);b0∈R1×2d,b1∈R1×d;b0和b1,均为偏置参数(Bias Parameter)。
可选的,所述第二预设规则,为基于逐元素加法来构建的第二模型;
所述第二模型为函数g;所述节点i和节点j的地位邻居结构向量s_nei和s_nej,为:
可选的,所述第三预设规则,为基于一层全连接神经网络构建的第三模型;
所述第三模型,为:s_emi=tanh(s_neiW2+b2);
s_emj=tanh(s_nejW3+b3);
其中,W2∈R|V|×d,W3∈R|V|×d;w2和w3均为权重参数;b2∈R1×d,b3∈R1×d;b2和b3均为偏置参数;tanh为非线性的激活函数。
可选的,所述节点i的地位值的获取方式为:根据节点i的地位嵌入向量和非线性映射函数sta_h,获取所述节点i的地位值,即:
Statusi=sta_h(s_emi);
所述节点j的地位值的获取方式为:根据节点j的地位嵌入向量和非线性映射函数sta_h,获取所述节点j的地位值,即:
Statusj=sta_h(s_emj)。
可选的,基于地位理论和目标有向边eij,节点i的地位值和节点j的地位值的关系为:
(Statusi-Statusj)×(-Sij)≥δ;
式中:Statusi∈(-1,1),为节点i的地位值;Statusj∈(-1,1),为节点j的地位值;Sij为边eij的符号、δ是两个节点的“地位值”之差的阈值
又一方面,一种边符号预测装置,包括:获取模块、生成模块、第一构建模块、第二构建模块、第三构建模块、确定模块和预测模块;
所述获取模块,用于获取目标符号社交网络中的目标有向边eij,所述目标有向边eij的起始节点为i,所述目标有向边eij的终止节点为j;
所述生成模块,用于基于平衡理论,为所述起始节点i、终止节点j,分别生成平衡的邻居结构向量b_sti和邻居结构向量b_enj;
所述第一构建模块,用于基于第一预设规则、所述邻居结构向量b_sti和邻居结构向量b_enj,获取所述目标节点的平衡嵌入表示b_emi和b_emj;
所述第二构建模块,用于根据第二预设规则、出邻居结构向量和入邻居结构向量,分别获取节点i和节点j的地位邻居结构向量s_nei和s_nej;
所述第三构建模块,用于根据第三预设规则、地位邻居结构向量s_nei和s_nej,分别获取节点i和节点j的地位嵌入向量s_emi和s_emj;
所述确定模块,用于基于所述平衡嵌入表示b_emi、b_emj和所述地位嵌入向量s_emi、s_emj,确定最终嵌入向量finalij;
所述预测模块,用于基于所述最终嵌入向量finalij和预设预测模型,获取所述目标有向边的预测概率pij。
又一方面,一种边符号预测设备,包括:处理器,以及与所述处理器相连接的存储器;
所述存储器用于存储计算机程序,所述计算机程序至少用于执行上述任一项所述的边符号预测方法;
所述处理器用于调用并执行所述存储器中的所述计算机程序。
本发明的有益效果为:
本发明实施例提供的边符号预测方法、装置及设备中,方法包括获取目标符号社交网络中的目标有向边eij,目标有向边eij的起始节点为i,目标有向边eij的终止节点为j;基于平衡理论,为起始节点i、终止节点j,分别生成平衡的邻居结构向量b_sti和邻居结构向量b_enj;基于第一预设规则、出邻居结构向量b_sti和入邻居结构向量b_enj,获取目标节点的平衡嵌入表示b_emi和b_emj;根据第二预设规则、出邻居结构向量和入邻居结构向量,分别获取节点i和节点j的地位邻居结构向量s_nei和s_nej;根据第三预设规则、地位邻居结构向量s_nei和s_nej,分别获取节点i和节点j的地位嵌入向量s_emi和s_emj;基于平衡嵌入表示b_emi、b_emj和地位嵌入向量s_emi、s_emj,确定最终嵌入向量finalij;基于最终嵌入向量finalij和预设预测模型,获取目标有向边的预测概率pij。该发明使用深度学习技术从符号社交网络的复杂结构信息中抓取与边符号形成有关的非线性结构特征。同时,该方法还通过级联节点的出/入邻居结构来综合性地考虑边所涉及的“三角形”结构信息,这种解决方案扩展了平衡理论。最后,该发明还涉及了一个两层的神经网络架构来合理地融合平衡理论和地位理论,以此来更好地解决边符号预测任务。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种边符号预测方法流程示意图;
图2为本发明实施例提供的每一条边可能卷入的四种类型的三角形结构;
图3为本发明实施例提供的一种边符号预测装置结构示意图;
图4为本发明实施例提供的一种边符号预测设备结构示意图。
附图标记:31-获取模块;32-生成模块;33-第一构建模块;34-第二构建模块;35-第三构建模块;36-确定模块;37-预测模块;41-处理器;42-存储器。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
为了至少解决本发明中提出的技术问题,本发明实施例提供一种边符号预测方法。
图1为本发明实施例提供的一种边符号预测方法流程示意图,请参阅图1,本发明实施例提供的方法,可以包括以下步骤:
S11、获取目标符号社交网络中的目标有向边eij,目标有向边eij的起始节点为i,目标有向边eij的终止节点为j。
具体的,可以定义符号社交网络G为目标符号社交网络,本实施例中,以目标符号社交网络为例,对本申请的方案进行说明。在符号社交网络G中,对于任意的有向边eij和任意的结点k(k≠i以及k≠j),如果节点i和节点k之间以及节点j和节点k之间同时存在交互(也就是,存在有向边的连接),那么在这三个节点之间能够形成一个符号三角形(总共可能存在32种不同类型的符号三角形)。
图2为本发明实施例提供的每一条边可能卷入的四种类型的三角形结构示意图,参阅图2,在不考虑边符号信息的情况下,任意的一条有向边eij和任意的一个节点k之间能够形成四种不同类型的“三角形”结构(图2中的虚线指示着这条有向边可能不存在)。图2中每一种类型的“三角形”结构都对应着一条有向边eij的起始节点i的邻居结构和终止节点j的邻居结构(出邻居结构或入邻居结构)之间可能存在的相互作用。
在本实施例中,可以定义要预测边符号的边为目标有向边eij,目标有向边eij的起始节点为i,目标有向边eij的终止节点为j,从而进行说明。
S12、基于平衡理论,为起始节点i、终止节点j,分别生成平衡的邻居结构向量b_sti和邻居结构向量b_enj。
具体的,在本发明实施例中,针对四种不同类型的“三角形”结构,对于符号社交网络中的一条有向边eij,可以基于社会学理论的平衡理论,为起始节点i生成一个“平衡”的邻居结构向量(“Balance”Neighborhood Structure Vector)b_sti,同时也为终止节点j生成一个“平衡”的邻居结构向量b_enj:
S13、基于第一预设规则、邻居结构向量b_sti和邻居结构向量b_enj,获取目标节点的平衡嵌入表示b_emi和b_emj。
可选的,第一预设规则,为基于两层全连接神经网络构建的第一模型;第一模型f,为:
b_emi=tanh(tanh(b_stiW0+b0)W1+b1)),
b_emj=tanh(tanh(b_enjW0+b0)W1+b1)),
其中,tanh为非线性的激活函数;W0∈R4|V|×2d,W1∈R2d×d;w0和w1均为权重参数(Weight Parameter);b0∈R1×2d,b1∈R1×d;b0和b1,均为偏置参数(Bias Parameter)。
在本发明实施例中,对于第一模型,可以为函数f,它输入b_sti和b_enj,同时输出两个低维的潜在特征表示b_emi和b_emj。即,
b_emi=f(b_sti)
b_emj=f(b_enj)。
优选的,本发明使用2层全连接神经网络(Full-Connected Neural Network)来定义函数f,即:
b_emi=tanh(tanh(b_stiW0+b0)W1+b1)),
b_emj=tanh(tanh(b_enjW0+b0)W1+b1));
上式中:tanh是一个非线性的激活函数、W0∈R4|V|×2d,W1∈R2d×d是两个权重参数(Weight Parameter)、b0∈R1×2d,b1∈R1×d是两个偏置参数(Bias Parameter)。
S14、根据第二预设规则、出邻居结构向量和入邻居结构向量,分别获取节点i和节点j的地位邻居结构向量s_nei和s_nej。
可选的,第二预设规则,为基于逐元素加法来构建的第二模型;第二模型为函数g;节点i和节点j的地位邻居结构向量s_nei和s_nej,为:
具体的,对于符号社交网络中的一个用户来说,他/她的地位由两部分确定:第一部分是他/她的“主观性”地位,即他/她在符号社交网络中自我评价的情况;第二个部分是他/她的“客观性”地位,即他/她在符号社交网络中被其它用户评价的情况。“主观性”地位能够由该用户的出邻居结构向量来反映,“客观性”地位能够由该用户的入邻居结构向量来反映。对于符号社交网络中的一个节点i,本发明可通过第二模型函数g来联合节点i的“主观性”地位和“客观性”地位,从而生成该节点的最终“地位”向量表示。也就是说,函数g输入和同时输出一个“地位”邻居结构向量:s_nei。
优选的,为了方便模型的处理,本文使用向量的逐元素加法来定义函数g,具体的不再赘述,本领域技术人员可以通过逐元素加法来获取具体函数g。
S15、根据第三预设规则、地位邻居结构向量s_nei和s_nej,分别获取节点i和节点j的地位嵌入向量s_emi和s_emj。
可选的,第三预设规则,为基于一层全连接神经网络构建的第三模型;述第三模型,为:s_emi=tanh(s_neiW2+b2);
s_emj=tanh(s_nejW3+b3);
其中,W2∈R|V|×d,W3∈R|V|×d;w2和w3均为权重参数;b2∈R1×d,b3∈R1×d;b2和b3均为偏置参数;tanh为非线性的激活函数。
例如,在获得节点i和j的“地位”邻居结构向量之后,本发明中,可以为有向边eij的起始节点i学习一个函数st_h以及为终止节点j学习一个函数en_h,来分别获得节点i和节点j的“地位”嵌入向量:s_emi和s_emj。
s_emi=st_h(s_nei)
s_emj=en_h(s_nej)。
优选的,本发明可以分别使用一层全连接神经网络来定义st_h和en_h,即:
s_emi=tanh(s_neiW2+b2)
s_emj=tanh(s_nejW3+b3);
上式中:W2∈R|V|×d,W3∈R|V|×d是两个权重参数、b2∈R1×d,b3∈R1×d是两个偏置参数。
S16、基于平衡嵌入表示b_emi、b_emj和地位嵌入向量s_emi、s_emj,确定最终嵌入向量finalij。
具体的,根据地位理论,对于符号社交网络中一条有向的正边或负边eij,节点i的地位值是小或大于j的地位值。即,
(Statusi-Statusj)×(-Sij)≥δ
式中:Statusi∈(-1,1)是节点i的“地位”值、Statusj∈(-1,1)是节点j的“地位”值。节点的“地位”值是由节点的“地位”嵌入向量和非线性映射函数sta_h共同产生的:
Statusi=sta_h(s_emi),
Statusj=sta_h(s_emj);
Sij是边eij的符号、δ是两个节点的“地位值”之差的阈值。根据预先在多个数据集上对模型的实验和研究,在本发明实施例中,可以设定δ=0.5。本发明使用一层全连接神经网络来定义函数sta_h。
可选的,本发明实施例中,可以定义一个地位损失函数Lst来控制符号社交网络中一条有向边两个端点之间“地位”值之差与该边符号的关系:
为了实现全面预测一条边的符合的目的,本发明实施例中级联(Concatenate)每一条边两个端点的“平衡”嵌入以及“地位”嵌入作为该条边最终的特征表示。在最终的特征表示中保存与符号预测任务有关的重要特征,这种级联方式也合理地融合了平衡理论和地位理论。
finalij=[b_emi;b_emj;s_emi;s_emj]
式中:finalij是最终嵌入向量,这个向量将输入到模型的预测层来完成边符号预测任务。
S17、基于最终嵌入向量finalij和预设预测模型,获取目标有向边的预测概率pij。
优选的,本发明实施例中,可以使用三层全连接神经网络来定义模型的预测层,来生成负边和正边的预测概率pij。即:
pij=softmax(ReLU(ReLU(finalijW5+b5)W6+b6)W7+b7);
上式中:ReLU和softmax是两个非线性的激活函数,W5∈R4d×d, 是三个权重参数;b5∈R1×d,b7∈R1×2是三个偏置参数。本实施例中,pij是一个两维的向量,第一维是指负边的概率,第二维是指正边的概率(两个求和等于1)。取概率大的为该边的符号。
优选的,本发明使用交叉熵(Cross Entropy)来定义符号预测的损失。
式中:m∈{0,1}是向量的下标、y指示着边符号的独热编码向量、p定义每一种类型符号的预测概率。因此本发明的最终目标函数为:
式中:|E|为网络中边的数目。
在本发明实施例中,可以使用Adam算法来训练深度神经网络。模型初始的学习速率为0.0001,batch的大小为128。
本发明实施例提供的边符号预测方法,包括获取目标符号社交网络中的目标有向边eij,目标有向边eij的起始节点为i,目标有向边eij的终止节点为j;基于平衡理论,为起始节点i、终止节点j,分别生成平衡的邻居结构向量b_sti和邻居结构向量b_enj;基于第一预设规则、出邻居结构向量b_sti和入邻居结构向量b_enj,获取目标节点的平衡嵌入表示b_emi和b_emj;根据第二预设规则、出邻居结构向量和入邻居结构向量,分别获取节点i和节点j的地位邻居结构向量s_nei和s_nej;根据第三预设规则、地位邻居结构向量s_nei和s_nej,分别获取节点i和节点j的地位嵌入向量s_emi和s_emj;基于平衡嵌入表示b_emi、b_emj和地位嵌入向量s_emi、s_emj,确定最终嵌入向量finalij;基于最终嵌入向量finalij和预设预测模型,获取目标有向边的预测概率pij。该发明使用深度学习技术从符号社交网络的复杂结构信息中抓取与边符号形成有关的非线性结构特征。同时,该方法还通过级联节点的出/入邻居结构来综合性地考虑边所涉及的“三角形”结构信息,这种解决方案扩展了平衡理论。最后,该发明还涉及了一个两层的神经网络架构来合理地融合平衡理论和地位理论,以此来更好地解决边符号预测任务。
基于一个总的发明构思,本发明实施例还提供一种边符号预测装置。
图3为本发明实施例提供的一种边符号预测装置结构示意图,参阅图3,本发明实施例提供的装置,可以包括以下结构:获取模块31、生成模块32、第一构建模块33、第二构建模块34、第三构建模块35、确定模块36和预测模块37。
其中,获取模块31,用于获取目标符号社交网络中的目标有向边eij,目标有向边eij的起始节点为i,目标有向边eij的终止节点为j;
生成模块32,用于基于平衡理论,为起始节点i、终止节点j,分别生成平衡的邻居结构向量b_sti和邻居结构向量b_enj;
第一构建模块33,用于基于第一预设规则、邻居结构向量b_sti和邻居结构向量b_enj,获取目标节点的平衡嵌入表示b_emi和b_emj;
第二构建模块34,用于根据第二预设规则、出邻居结构向量和入邻居结构向量,分别获取节点i和节点j的地位邻居结构向量s_nei和s_nej;
第三构建模块35,用于根据第三预设规则、地位邻居结构向量s_nei和s_nej,分别获取节点i和节点j的地位嵌入向量s_emi和s_emj;
确定模块36,用于基于平衡嵌入表示b_emi、b_emj和地位嵌入向量s_emi、s_emj,确定最终嵌入向量finalij;
预测模块37,用于基于最终嵌入向量finalij和预设预测模型,获取目标有向边的预测概率pij。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供的边符号预测装置中,包括获取目标符号社交网络中的目标有向边eij,目标有向边eij的起始节点为i,目标有向边eij的终止节点为j;基于平衡理论,为起始节点i、终止节点j,分别生成平衡的邻居结构向量b_sti和邻居结构向量b_enj;基于第一预设规则、出邻居结构向量b_sti和入邻居结构向量b_enj,获取目标节点的平衡嵌入表示b_emi和b_emj;根据第二预设规则、出邻居结构向量和入邻居结构向量,分别获取节点i和节点j的地位邻居结构向量s_nei和s_nej;根据第三预设规则、地位邻居结构向量s_nei和s_nej,分别获取节点i和节点j的地位嵌入向量s_emi和s_emj;基于平衡嵌入表示b_emi、b_emj和地位嵌入向量s_emi、s_emj,确定最终嵌入向量finalij;基于最终嵌入向量finalij和预设预测模型,获取目标有向边的预测概率pij。该发明使用深度学习技术从符号社交网络的复杂结构信息中抓取与边符号形成有关的非线性结构特征。同时,该方法还通过级联节点的出/入邻居结构来综合性地考虑边所涉及的“三角形”结构信息,这种解决方案扩展了平衡理论。最后,该发明还涉及了一个两层的神经网络架构来合理地融合平衡理论和地位理论,以此来更好地解决边符号预测任务。
基于一个总的发明构思,本发明实施例还提供一种边符号预测设备。
图4为本发明实施例提供的一种边符号预测设备结构示意图。,请参阅图4,本发明实施例提供的一种边符号预测设备,包括:处理器41,以及与处理器相连接的存储器42。
存储器42用于存储计算机程序,计算机程序至少用于上述任一实施例记载的边符号预测方法;
处理器41用于调用并执行存储器中的计算机程序。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种边符号预测方法,其特征在于,包括:
获取目标符号社交网络中的目标有向边eij,所述目标有向边eij的起始节点为i,所述目标有向边eij的终止节点为j;
基于平衡理论,为所述起始节点i、终止节点j,分别生成平衡的邻居结构向量b_sti和邻居结构向量b_enj;
基于第一预设规则、所述邻居结构向量b_sti和邻居结构向量b_enj,获取所述目标节点的平衡嵌入表示b_emi和b_emj;
根据第二预设规则、出邻居结构向量和入邻居结构向量,分别获取节点i和节点j的地位邻居结构向量s_nei和s_nej;
根据第三预设规则、地位邻居结构向量s_nei和s_nej,分别获取节点i和节点j的地位嵌入向量s_emi和s_emj;
基于所述平衡嵌入表示b_emi、b_emj和所述地位嵌入向量s_emi、s_emj,确定最终嵌入向量finalij;
基于所述最终嵌入向量finalij和预设预测模型,获取所述目标有向边的预测概率pij。
2.根据权利要求1所述的方法,其特征在于,还包括:
基于地位理论,根据节点i的地位值和节点j的地位值,获取地位损失函数Lst;
根据交叉熵及所述地位损失函数Lst,获取符号预测损失。
4.根据权利要求1所述的方法,其特征在于,所述第一预设规则,为基于两层全连接神经网络构建的第一模型;
所述第一模型,为:
b_emi=tanh(tanh(b_stiW0+b0)W1+b1)),
b_emj=tanh(tanh(b_enjW0+b0)W1+b1)),
其中,tanh为非线性的激活函数;W0∈R4|V|×2d,W1∈R2d×d;w0和w1均为权重参数(WeightParameter);b0∈R1×2d,b1∈R1×d;b0和b1,均为偏置参数(Bias Parameter)。
6.根据权利要求1所述的方法,其特征在于,所述第三预设规则,为基于一层全连接神经网络构建的第三模型;
所述第三模型,为:s_emi=tanh(s_neiW2+b2);
s_emj=tanh(s_nejW3+b3);
其中,W2∈R|V|×d,W3∈R|V|×d;w2和w3均为权重参数;b2∈R1×d,b3∈R1×d;b2和b3均为偏置参数;tanh为非线性的激活函数。
7.根据权利要求2所述的方法,其特征在于,所述节点i的地位值的获取方式为:根据节点i的地位嵌入向量和非线性映射函数sta_h,获取所述节点i的地位值,即:
Statusi=sta_h(s_emi);
所述节点j的地位值的获取方式为:根据节点j的地位嵌入向量和非线性映射函数sta_h,获取所述节点j的地位值,即:
Statusj=sta_h(s_emj)。
8.根据权利要求7所述的方法,其特征在于,基于地位理论和目标有向边eij,节点i的地位值和节点j的地位值的关系为:
(Statusi-Statusj)×(-Sij)≥δ;
式中:Statusi∈(-1,1),为节点i的地位值;Statusj∈(-1,1),为节点j的地位值;Sij为边eij的符号、δ是两个节点的“地位值”之差的阈值。
9.一种边符号预测装置,其特征在于,包括:获取模块、生成模块、第一构建模块、第二构建模块、第三构建模块、确定模块和预测模块;
所述获取模块,用于获取目标符号社交网络中的目标有向边eij,所述目标有向边eij的起始节点为i,所述目标有向边eij的终止节点为j;
所述生成模块,用于基于平衡理论,为所述起始节点i、终止节点j,分别生成平衡的邻居结构向量b_sti和邻居结构向量b_enj;
所述第一构建模块,用于基于第一预设规则、所述邻居结构向量b_sti和邻居结构向量b_enj,获取所述目标节点的平衡嵌入表示b_emi和b_emj;
所述第二构建模块,用于根据第二预设规则、出邻居结构向量和入邻居结构向量,分别获取节点i和节点j的地位邻居结构向量s_nei和s_nej;
所述第三构建模块,用于根据第三预设规则、地位邻居结构向量s_nei和s_nej,分别获取节点i和节点j的地位嵌入向量s_emi和s_emj;
所述确定模块,用于基于所述平衡嵌入表示b_emi、b_emj和所述地位嵌入向量s_emi、s_emj,确定最终嵌入向量finalij;
所述预测模块,用于基于所述最终嵌入向量finalij和预设预测模型,获取所述目标有向边的预测概率pij。
10.一种边符号预测设备,其特征在于,包括:处理器,以及与所述处理器相连接的存储器;
所述存储器用于存储计算机程序,所述计算机程序至少用于执行权利要求1~8任一项所述的边符号预测方法;
所述处理器用于调用并执行所述存储器中的所述计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010613871.6A CN111754356A (zh) | 2020-06-30 | 2020-06-30 | 边符号预测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010613871.6A CN111754356A (zh) | 2020-06-30 | 2020-06-30 | 边符号预测方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111754356A true CN111754356A (zh) | 2020-10-09 |
Family
ID=72676752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010613871.6A Pending CN111754356A (zh) | 2020-06-30 | 2020-06-30 | 边符号预测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111754356A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106780067A (zh) * | 2016-12-14 | 2017-05-31 | 南京工业职业技术学院 | 一种考虑节点局部标注特性的符号预测方法 |
US20180018553A1 (en) * | 2015-03-20 | 2018-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Relevance score assignment for artificial neural networks |
CN111078820A (zh) * | 2019-11-26 | 2020-04-28 | 复旦大学 | 基于权重符号社交网络嵌入的边权预测方法 |
CN111178414A (zh) * | 2019-12-20 | 2020-05-19 | 大连民族大学 | 符号网络中连边符号的预测方法 |
-
2020
- 2020-06-30 CN CN202010613871.6A patent/CN111754356A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180018553A1 (en) * | 2015-03-20 | 2018-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Relevance score assignment for artificial neural networks |
CN106780067A (zh) * | 2016-12-14 | 2017-05-31 | 南京工业职业技术学院 | 一种考虑节点局部标注特性的符号预测方法 |
CN111078820A (zh) * | 2019-11-26 | 2020-04-28 | 复旦大学 | 基于权重符号社交网络嵌入的边权预测方法 |
CN111178414A (zh) * | 2019-12-20 | 2020-05-19 | 大连民族大学 | 符号网络中连边符号的预测方法 |
Non-Patent Citations (5)
Title |
---|
张晓琴;王秀芳;: "基于结构平衡理论及LP算法的符号网络预测", 云南民族大学学报(自然科学版), no. 01 * |
沈鹏飞: ""符号社交网络中负关系预测以及网络嵌入的研究"", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 * |
苏晓萍;宋玉蓉;: "符号网络的局部标注特征与预测方法", 智能系统学报, no. 03 * |
蓝梦微;李翠平;王绍卿;赵;林志侠;邹本友;陈红;: "符号社会网络中正负关系预测算法研究综述", 计算机研究与发展, no. 02 * |
许小可;耿雪娜;王雪;: "参照零模型的符号社交网络理论研究", 科技导报, no. 08 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111309824B (zh) | 实体关系图谱显示方法及系统 | |
He et al. | Structured pruning for deep convolutional neural networks: A survey | |
CN113792937B (zh) | 一种基于图神经网络的社交网络影响力预测方法、装置 | |
CN112396189A (zh) | 一种多方构建联邦学习模型的方法及装置 | |
Wei et al. | The fairness‐accuracy Pareto front | |
CN112446310A (zh) | 基于区块链的年龄识别系统、方法及装置 | |
Salunkhe et al. | A hybrid approach for class imbalance problem in customer churn prediction: A novel extension to under-sampling | |
Nguyen et al. | Meta transfer learning for facial emotion recognition | |
CN113822315A (zh) | 属性图的处理方法、装置、电子设备及可读存储介质 | |
CN112667920A (zh) | 基于文本感知的社交影响力预测方法、装置及设备 | |
CN112395515A (zh) | 一种信息推荐方法、装置、计算机设备及存储介质 | |
CN111708823A (zh) | 异常社交账号识别方法、装置、计算机设备和存储介质 | |
Breindl | Activists as news producers | |
CN111754356A (zh) | 边符号预测方法、装置及设备 | |
Luan et al. | LRP‐based network pruning and policy distillation of robust and non‐robust DRL agents for embedded systems | |
WO2022267816A1 (zh) | 人脸识别方法、装置、电子设备和存储介质 | |
CN112966809B (zh) | 基于隐私保护的两方模型预测方法、装置及系统 | |
CN116110074A (zh) | 一种基于图神经网络的动态小股行人识别方法 | |
Cui et al. | Deep Bayesian optimization on attributed graphs | |
Tao et al. | Structural identity representation learning of blockchain transaction network for metaverse | |
CN114817758A (zh) | 一种基于nsgc-gru集成模型的推荐系统方法 | |
Wu | An evolutionary multi-layer perceptron neural network for solving unconstrained global optimization problems | |
Mousavi | Testing optimization algorithms easier with a new test function for single-optimization problems and validating evolutionary algorithms | |
Zhang et al. | Shoreline: Data-Driven Threshold Estimation of Online Reserves of Cryptocurrency Trading Platforms | |
Lin et al. | Minimization of number of neurons in Voronoi diagram-based artificial neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |