CN116049695B - 跨社交网络的群体感知与立场分析方法、系统和电子设备 - Google Patents

跨社交网络的群体感知与立场分析方法、系统和电子设备 Download PDF

Info

Publication number
CN116049695B
CN116049695B CN202211643877.3A CN202211643877A CN116049695B CN 116049695 B CN116049695 B CN 116049695B CN 202211643877 A CN202211643877 A CN 202211643877A CN 116049695 B CN116049695 B CN 116049695B
Authority
CN
China
Prior art keywords
network
node
community
fusion
hyperbolic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211643877.3A
Other languages
English (en)
Other versions
CN116049695A (zh
Inventor
李晓宇
金力
张泽群
李树超
刘庆
姚方龙
关世昌
马豪伟
董鹏程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Information Research Institute of CAS
Original Assignee
Aerospace Information Research Institute of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Information Research Institute of CAS filed Critical Aerospace Information Research Institute of CAS
Priority to CN202211643877.3A priority Critical patent/CN116049695B/zh
Publication of CN116049695A publication Critical patent/CN116049695A/zh
Application granted granted Critical
Publication of CN116049695B publication Critical patent/CN116049695B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Human Resources & Organizations (AREA)
  • Algebra (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种跨社交网络的群体感知与立场分析方法、系统和电子设备,所述方法包括:基于非欧双曲空间的社区网络表征方式,实现跨社交网络的用户对齐和聚合关联的表征空间的选择;融合用户内容属性和拓扑结构的多源异构信息;获取用户群体立场倾向态度。本发明能够提高群体感知与立场态度预测问题的效率与准确率。

Description

跨社交网络的群体感知与立场分析方法、系统和电子设备
技术领域
本发明涉及人工智能领域,特别是涉及一种跨社交网络的群体感知与立场分析方法、系统和电子设备。
背景技术
立场检测是自然语言处理领域的前沿研究分支之一,其目标是通过用户发布的信息中检测出其对话题事件及其关联对象的看法或者态度倾向性,例如“赞成、中立或反对”。立场检测算法是文本分类算法的一个重要应用分支,相比于情感分析任务,其检测的数据更为隐晦,且和对象目标高度相关,因此,分类任务难度更大。
传统的立场检测任务主要针对线下交流数据和线上论坛发言进行立场检测,然而随着新媒体技术的发展,新型的社交网络平台已经成为用户发布意见立场的主要渠道,例如国内的新浪、抖音和国外的推特、脸书等平台。因此,衍生出设计媒体平台的立场检测任务,现已有国内外发布基于社交媒体平台的数据集,并提出具有探索意义的模型和方法。
此外,传统的立场检测是针对用户级的,但一方面用户的立场是相互影响演化的,即个体不会完全接受或忽略其他个体的观点,另一方面,用户的立场态度汇聚起来才能形成整体的舆论观点。因此,许多研究展开群体立场分析与决策预测的相关研究,其核心思路是将用户作为一个群体,通过研究用户之间的交互过程,从而预测网络用户群体的整体立场态度,最终形成舆情感知。社交媒体的群体立场检测任务考虑用户群体在社交媒体的交互过程,并不断更新和融合群体对同一问题的意见和态度,最终形成共识、意见极化或观点分裂等不同的舆情状态。
基于特征表示和提取的不同,现有的社交网络群体立场检测方法主要包括基于特征工程的方法、基于机器学习的方法和基于表示学习的方法。
基于特征工程的立场检测算法是指通过专业人员对原始数据进行处理提取特征,然后将特征输入算法模型的一种方法,在立场检测任务中,主要是通过语言学、心理学等专业学科提供的词汇以及抽取句式结构、句法依存等表达方式,即语意特征和结构特征。现有的方法基本可以分为基于语意特征的立场检测和基于语意和结构特征融合的立场检测方法,然而,此类算法严重依赖研究者的领域专业知识,算法性能好坏直接取决于特征的区分度,智能化程度低,算法准确率不稳定。
基于机器学习的方法是指一种通过搭建神经网络等深度学习的模型,通过真实数据的训练网络,自动拟合立场检测任务的输入和输出之间的非线性复杂映射关系。深度学习模型可以通过真实的训练数据自动调节优化网络的参数,减少人工定义特征的过程,即将立场检测中的文本和话题映射为高维空间的向量,再利用向量计算输出最终的立场类型。现有基于卷积神经网络、循环神经网络、图注意力神经网络等一系列方法进行立场检测,其核心是通过模型自动学习立场态度与文本特征的相关性,并利用这种特征信息进行分类。机器学习方法的准确率和鲁棒性优于特征工程的方法,但方法往往重点考虑的文本特征的表达和映射,缺少用户属性和拓扑的表达,单一文本维度的模态计算导致信息的利用率较低。
基于表示学习的方法是指在特定的嵌入空间内获取研究对象的低维特征向量表示,再利用特征向量的度量计算实现任务分类,其不再需要通过特征工程提取特征,具有泛化性和解释性良好的性能,在立场检测任务中主要涉及用户表示和文本表示学习等理论和方法。其中,文本表示学习主要是将用户文本特征在嵌入空间编码表示,主要有独热编码、词袋模型编码、TF-IDF等离散表示方法和Word2Vec、Bert预训练模型等连续编码模型;用户表示学习主要包括用户属性、内容生成、行为表示、关系表达等维度的表示建模。表示学习的方法将群体立场检测建模的刻画维度进一步扩充,但由于社交网络是一种真实复杂网络,现有的方法往往在传统欧式空间建模,由于欧式空间缺少数据层级结构特征的表达能力,因此,其会造成社交网络结构属性的失真,导致表示的能力不足。此外,文本表示特征和用户表示特征等不同维度的特征融合计算也是一个瓶颈问题,影响模型的性能效果。
发明内容
针对上述技术问题,本发明采用的技术方案为:
本发明实施例提供一种跨社交网络的群体感知与立场分析方法,所述方法包括如下步骤:
S100,获取Q个社交网络SN1,SN2,…,SNr,…,SNQ;r的取值为1到Q;
S200,基于非欧双曲空间的庞加莱球模型将SN1和SN2进行对齐,得到初始融合网络以及初始融合网络中的每个节点在非欧双曲空间中的表征向量;执行S200;所述表征向量包括内容属性特征向量和拓扑结构特征向量;
S300,设置c=c+1,如果c<Q-1,执行S400;否则,执行S500;
S400,基于非欧双曲空间将当前融合网络和SN(c+2)进行对齐,得到融合网络(c+1)以及融合网络(c+1)中的每个节点在非欧双曲空间中的表征向量;执行S300;
S500,将当前融合网络作为目标融合网络G=(V,X,E),其中,
Figure GDA0004238194430000031
为G中的节点集合,vs为G中的第s个节点,s的取值为1到n,n为G中的节点数量;内容属性特征集合X={X1,X2,…,Xm,…,Xh(m)},第m个社区的内容属性特征集合/>
Figure GDA0004238194430000032
Figure GDA0004238194430000033
表示G中的第m个社区中的节点vi的表征向量;拓扑结构特征集合E={E1,E2,…,Em,…,Eh(m)},/>
Figure GDA0004238194430000034
Figure GDA0004238194430000035
表示G中的第m个社区的节点vi和vj之间的边的集合;m的取值为1到L,i,j的取值为1到h(m),i≠j,L为G中的社区数量,h(m)为第m个社区中的节点数量;
S600,获取G中的第m个社区的内容属性特征图Cm和拓扑结构图Tm;其中,Cm为基于G中第m个社区中的各节点之间的距离获取得到,
Figure GDA0004238194430000036
Figure GDA0004238194430000037
Figure GDA0004238194430000038
为Cm对应的邻接矩阵;/>
Figure GDA0004238194430000039
为Tm对应的邻接矩阵;
Figure GDA00042381944300000310
为Cm中的第i个节点的内容属性特征向量,/>
Figure GDA00042381944300000311
为Tm中的第i个节点的拓扑结构特征向量;
S700,将Cm和Tm输入到第一层注意力机制中,分别得到对应的内容属性融合特征
Figure GDA00042381944300000312
和拓扑结构融合特征
Figure GDA00042381944300000313
Figure GDA00042381944300000314
Figure GDA00042381944300000315
和/>
Figure GDA00042381944300000316
分别为Cm和Tm中的节点vi的内容属性融合特征和拓扑结构融合特征;
S800,将
Figure GDA00042381944300000317
和/>
Figure GDA00042381944300000318
输入到第二层注意力机制中,得到第m个社区的融合特征Zm={zm 1,zm 2,…,zm i,…,zm h(m)};zm i为第m个社区的节点vi的融合特征;
S900,将zm i输入到设定的观点立场倾向预测模型中,得到对应的预测结果
Figure GDA00042381944300000319
Pcm ie为节点vi对应的用户立场属于第e个观点立场的概率,H为观点立场的数量;
S1000,获取第m个社区的观点立场值
Figure GDA00042381944300000320
ke为第e个观点立场的属性值。
本发明至少具有以下有益效果:
本发明实施例提供的跨社交网络的群体感知与立场分析方法,采用融合群体节点交互和自身内容属性特征进行立场倾向态度挖掘和聚合,通过节点内容属性和拓扑结构多维特征的特征级融合,从而通过基于真实数据驱动训练,自动获取文本观点,能够提高群体决策预测问题的效率与准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的本发明实施例提供的跨社交网络的群体感知与立场分析方法的流程图。
图2为本发明实施例提供的跨社交网络的群体感知与立场分析系统的架构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的技术思想在于,当发生一个突发话题事件时,可以自动挖掘不同社交网络平台用户的言论,并分析其所形成的群体立场态度。具体而言,话题事件的立场态度可以由用户的言论所体现,且由不同用户的相互关注和共同爱好所组成的虚拟社群会总体形成一个群体立场态度,不同社群的态度共同构成社交网络的整体舆情态势。从数据流的角度分析,通过对不同社交网络的用户属性和结构数据及各用户发表的言论数据进行分析,从而得到虚拟社群的在某时刻针对话题事件的立场态度。
图1为本发明实施例提供的本发明实施例提供的跨社交网络的群体感知与立场分析方法的流程图。
本发明实施例提供了一种本发明实施例提供的跨社交网络的群体感知与立场分析方法,如图1所示,所述方法可包括如下步骤:
S100,获取Q个目标社交网络SN1,SN2,…,SNr,…,SNQ,r的取值为1到Q。
在本发明实施例中,目标社交网络可基于现有的社交平台获取,例如,新浪、微博等社交平台,不同的社交平台形成不同的社交网络。Q的大小可基于实际需要进行设置。
每个社交网络可由一个二元组G=(V,δ)表示,其中,
Figure GDA0004238194430000041
为由用户构成的节点集{vi},其基数/>
Figure GDA0004238194430000042
为N;δ为边集{(vi,vj)},将δ的边元素称为网络的边。在社交网络中,社区为用户集/>
Figure GDA0004238194430000043
的一个子集,记作集合/>
Figure GDA0004238194430000044
其元素用户均被赋予相同的社区标签。全体社区集称为
Figure GDA0004238194430000045
任意两个社区之间不存在交集。针对两个社交网络,例如,源网络/>
Figure GDA0004238194430000046
和目标网络/>
Figure GDA0004238194430000047
其中s和t分别表示源和目标,不同的下标i,j用于区分用户,下标p和q用以区分社区。目标网络为基准网络,源网络中的用户需要向目标网络中的用户对齐。
其中,将目标网络中的节点看作网络用户的实体对象,定义为象。相应的,源网络中节点看做网络用户的原始对象,定义为原象。由于一个用户同时加入多社交网络是一个较为普遍的现象,其在不同的社交网络中行为相近,亦或各有侧重。下面,定义这类用户:
锚用户:若一自然人用户在源网络
Figure GDA0004238194430000051
中存在象节点,记为/>
Figure GDA0004238194430000052
且在目标网络/>
Figure GDA0004238194430000053
中存在象节点,记节点/>
Figure GDA0004238194430000054
则将该用户称为锚用户。
锚链接:令节点
Figure GDA0004238194430000055
和节点/>
Figure GDA0004238194430000056
分别为源节点集/>
Figure GDA0004238194430000057
和目标节点集/>
Figure GDA0004238194430000058
之节点,若二者为同一用户在源网络/>
Figure GDA0004238194430000059
和目标网络/>
Figure GDA00042381944300000510
中的象,则构建网际链接,称之为锚链接,记作二元组
Figure GDA00042381944300000511
锚用户集A:锚用户集为己知锚用户的全体,记作集合。类似地,同一个自然人群体通常参与到多个社交网络中,其在不同的社交网络中行为相近,有时也各有侧重。
锚社区:若社区
Figure GDA00042381944300000512
和/>
Figure GDA00042381944300000513
分别为源网络/>
Figure GDA00042381944300000514
和目标网络/>
Figure GDA00042381944300000515
的社区,则社区/>
Figure GDA00042381944300000516
和社区
Figure GDA00042381944300000517
为锚社区。
由于同一用户在不同社交平台注册账号,并在不同社交平台进行消息的转发和传播,会在虚拟空间形成多个用户和多个社区,若需要穿透到真实用户对象层面,实现不同社交网络用户立场态度的汇集与挖掘,首先需要解决的是不同虚拟社区的对齐问题,即跨社交网络的不同用户对齐问题。而要解决社区的精准对齐是需要以准确的数据表征为基础,数据表征的核心工作是将数据对象表示为表征空间内的一种高维向量。考虑到社交网络具有复杂的层级拓扑结构,即社交网络具有潜在的非欧结构,但传统的基于欧几里德空间的表征空间无法体现数据本身的结构特征,容易造成数据结构属性的表征失真。针对上述问题,本发明提出基于双曲非欧空间的社区网络表征方式,相比于欧式空间的数据表征,双曲空间提供了内聚性更高,外分性更强的社区表征模式,更有利于互相混叠的社区对齐任务开展。然后,将各个社交网络表征映射到双曲公共子空间中进行社区相识度计算并对齐。具体而言,模型利用已知的锚用户以表示迁移的方式对齐各社交网络的双曲表征空间,令该对齐的表征空间为公共子空间,并在该公共子空间中进行社交社区对齐。通过上述双曲空间的嵌入映射和公共子空间的迁移计算完成跨社交网络的社区对齐任务。具体地,如下述S200~S400所示出的内容:
S200,基于非欧双曲空间的庞加莱球模型将SN1和SN2进行对齐,得到初始融合网络以及初始融合网络中的每个节点在非欧双曲空间中的表征向量;执行S200。
在本发明实施例中,采用非欧双曲空间的庞加莱球模型作为表征模型,其预测的向量为表征向量。每个节点的表征向量为高维向量,可包括内容属性特征向量和拓扑结构特征向量。
在本发明实施例中,内容属性特征可包括用户的属性信息和发布的文本信息,属性信息可包括用户名、性别、年龄、邮箱、地址、职业、所属地等,文本信息可包括发布信息、交互评论等,即内容属性特征的组成元素可包括用户名、性别、年龄、邮箱、地址、职业、所属地、发布信息、交互评论等。拓扑结构特征包括用户的网络活动信息和社交关系信息,网络活动信息可包括用户登录时间、登录频次以及登录时长等,社交关系信息可包括用户兴趣好爱、习惯浏览类型等标签信息,以及社交平台关注者、被关注着、好友、粉丝等,即拓扑结构特征的组成元素可包括用户登录时间、登录频次、登录时长、社交平台关注者、被关注着、好友、粉丝等。
在具体实施时,每获取每个特征所包含的元素对应的数值,然后将这些数值经过编码后形成对应的特征向量,然后嵌入非欧双曲空间,转换成非欧空间内的表征向量。
S300,设置c=c+1,如果c<Q-1,执行S400;否则,执行S500。
S400,基于非欧双曲空间将当前融合网络和SN(c+2)进行对齐,得到融合网络(c+1)以及融合网络(c+1)中的每个节点在非欧双曲空间中的表征向量;执行S300。
在本发明实施例中,将社交网络嵌入非欧双曲空间的庞加莱球模型的核心思想是通过庞加莱球模型的距离度量节点间的亲密度,从而学习各节点的双曲表征向量。
首先,在社交网络上随机游走以捕捉节点间的亲密度。在一游走序列中,给定节点前后的几个邻节点称为其上下文节点。那么,节点vi有两重身份:当其作为其中心节点时,对应于双曲表征向量θi;当其作为其他节点的上下文时,对应于上下文向量θi′。
进一步地,在S200和S400中,每个融合网络中的节点的表征向量通过如下步骤获取:
S10,在需要融合的两个社交网络的每个节点中嵌入双曲空间庞加莱球模型,构建每个节点的节点表征向量目标约束函数
Figure GDA0004238194430000061
在本发明实施例中,嵌入是机器学习的公知表达,在机器学习中,利用神经网络将高位的局部表示映射到低维的分布式空间中,这个映射过程称为嵌入。本领域技术人员知晓,任何在社交网络的节点中嵌入双曲空间庞加莱球模型的方法均属于本发明的保护范围。
其中,
Figure GDA0004238194430000071
为网络x中的节点/>
Figure GDA0004238194430000072
和/>
Figure GDA0004238194430000073
之间的双曲距离,用于描述两个节点之间的亲密度。/>
Figure GDA0004238194430000074
为网络x中的节点/>
Figure GDA0004238194430000075
的邻居节点集合,/>
Figure GDA0004238194430000076
为网络x的节点集合;网络s表示SN1和SN2中作为源网络的网络,网络t表示SN1和SN2中作为目标网络的网络。
在本发明实施例中,
Figure GDA0004238194430000077
其中σ()为sigmoid函数。/>
Figure GDA0004238194430000078
Figure GDA0004238194430000079
的双曲表征向量,/>
Figure GDA00042381944300000710
为/>
Figure GDA00042381944300000711
的上下文向量。,d()为双曲距离函数,例如,向量x和y之间的双曲距离/>
Figure GDA00042381944300000712
通过基于黎曼几何随机梯度下降法优化Fu,可获得网络中每个节点的表征向量。
S20,利用非欧双曲聚类模型对嵌入了双曲空间庞加莱球模型的两个社交网络中的每个社区进行建模,构建每个社区的社区表征向量目标约束函数
Figure GDA00042381944300000713
在本发明实施例中,以非欧双曲空间的节点的表征向量为基础,再设计一个非欧混合双曲聚类模型,用以发现和表征社区。在混合聚类模型中,一个双曲空间的混合分布由聚类在该社区的一系列节点组成。
其中,
Figure GDA00042381944300000714
为网络x中的节点/>
Figure GDA00042381944300000715
属于网络x中的社区p的概率,为隶属度矩阵,隶属度矩阵Zip中各行元素之和为1。/>
Figure GDA00042381944300000716
基于广义双曲分布构建的社区p的模型的概率密度分布函数,/>
Figure GDA00042381944300000717
为/>
Figure GDA00042381944300000718
的双曲表征向量,/>
Figure GDA00042381944300000719
为网络x中的社区p的双曲参数;Cx为网络x中的社区数量。
在互双曲聚类模型中,节点表征由一个双曲空间中的混合分布生成。该混合分布中的每一个分量均对应一个社区。若给定节点表征{θ(.)},则一节点属于该社区的似然概率由下式计算可知:
Figure GDA00042381944300000720
本发明实施例中,使用广义双曲分布建模社区,建模后的社区的概率密度函数为:
Figure GDA00042381944300000721
其中,
Figure GDA00042381944300000722
β和μ分别为扭曲向量和位置向量,其中,位置向量μ为社区的双曲表征向量。ω为聚集因子,Δ为度量矩阵,为d维正定矩阵,用以刻画黎曼度量。|Δ|为Δ的行列式,Kr(·)为r阶修正的贝塞尔函数,该函数关于阶数r和变元皆可导,
Figure GDA00042381944300000723
为/>
Figure GDA0004238194430000081
阶修正的贝塞尔函数,该函数关于阶数r和变元皆可导。
在本发明实施例中,给定节点表征向量并将其作为观测值,通过基于黎曼几何随机梯度下降法优化Fc,可同时获取到社区隶属度矩阵和双曲社区的表征向量。
S30,基于社交网络中的锚用户,构建嵌入了非欧双曲聚类模型的两个社交网络的对齐概率函数
Figure GDA0004238194430000082
Figure GDA0004238194430000083
为目标网络中与源网络中的节点/>
Figure GDA0004238194430000084
通过锚链接连接的节点,/>
Figure GDA0004238194430000085
表示节点/>
Figure GDA0004238194430000086
和/>
Figure GDA0004238194430000087
之间的双曲距离,/>
Figure GDA0004238194430000088
表示节点/>
Figure GDA0004238194430000089
和/>
Figure GDA00042381944300000810
之间的双曲距离;U为两个社交网络中的锚用户集合,即两个社交网络中的节点ID交集。
本发明实施例中,在非欧双曲空间内,采用锚用户表征迁移的方法构建结合所有节点共同的维度组成的向量空间-双曲公共子空间。在双曲公共子空间中,两个社交网络在锚用户上对齐,通过锚用户的表征可以通过锚链接迁移。如果(vi′,ν′k)是一个锚链接,则节点
Figure GDA00042381944300000811
的表征向量可以用以推断ν′k的上下文向量,同理,节点ν′k也可以推理其原象节点。
S40,构建如下联合目标函数:
Figure GDA00042381944300000812
Figure GDA00042381944300000813
其中,α1和α2为权重因子,θ为节点的双曲标准向量,θ′为节点的上下文向量,
Figure GDA00042381944300000814
为网络x中的社区p的度量矩阵。
S50,对所述联合目标函数进行优化,得到每个节点的表征向量。
通过基于黎曼几何随机梯度下降法优化上述联合目标函数,可以实现在公共的庞加莱球模型中每个对齐节点在非欧双曲空间的表征向量和对齐社区。
在本发明实施例中,S100~S400的技术效果在于:由于首先将不同的社交网络嵌入到相同的高维空间,然后在高维公共子空间内实现社交网络中的社区对齐与用户对齐,并将各个用户的属性特征进行对齐,能够实现网络社区用户的多源异构信息的对齐和网络关联融合。
S500,将当前融合网络作为目标融合网络G=(V,X,E)其中,
Figure GDA00042381944300000815
为G中的节点集合,vs为G中的第s个节点,s的取值为1到n,n为G中的节点数量;内容属性特征集合X={X1,X2,…,Xm,…,Xh(m)},第m个社区的内容属性特征集合/>
Figure GDA00042381944300000816
Figure GDA00042381944300000817
表示G中的第m个社区中的节点vi的内容属性特征向量;拓扑结构特征集合E={E1,E2,…,Em,…,Eh(m)},
Figure GDA0004238194430000091
表示G中的第m个社区的节点vi和vj之间的边的集合,多个邻接矩阵/>
Figure GDA0004238194430000092
用来代表图G的网络拓扑结构,若/>
Figure GDA0004238194430000093
则表示/>
Figure GDA0004238194430000094
m的取值为1到L,i,j的取值为1到h(m),L为G中的社区数量,h(m)为第m个社区中的节点数量。
S600,获取G中的第m个社区的内容属性特征图Cm和拓扑结构图Tm;其中,Cm为基于G中的各节点之间的距离获取得到,
Figure GDA0004238194430000095
Figure GDA0004238194430000096
为Cm对应的邻接矩阵;/>
Figure GDA0004238194430000097
为Tm对应的邻接矩阵;/>
Figure GDA0004238194430000098
为Cm中的第i个节点的内容属性特征向量,
Figure GDA0004238194430000099
为Tm中的第i个节点的拓扑结构特征向量。
在本发明实施例中,节点的拓扑结构图由用户通过关注、点赞、评论、转发等互动与其他用户之间产生的联系构成,因此,可与目标融合网络的拓扑结构一致,即为网络G,相应的,
Figure GDA00042381944300000910
为G中第m个社区对应的邻接矩阵。
在本发明实施例中,节点的内容属性特征图Cm为基于G中第m个社区中的各节点之间的距离获取得到,即为通过计算第m个社区中的各节点间的距离后重新构建的图,具体地,Cm可通过如下步骤获取得到:
S601,获取第m个社区中与vi对应的相似度
Figure GDA00042381944300000911
Figure GDA00042381944300000912
为节点vi和节点vj的内容属性特征向量之间的相似度;。
在本发明实施例中,
Figure GDA00042381944300000913
可为余弦相似度,即/>
Figure GDA00042381944300000914
Figure GDA00042381944300000915
为Cm中的第j个节点的内容属性特征向量。
S602,将
Figure GDA00042381944300000916
中的相似度按照由大到小的顺序进行排序,得到排序后的相似度/>
Figure GDA00042381944300000917
S603,获取
Figure GDA00042381944300000918
中的前B个相似度对应的节点作为vo的邻居节点;得到第m个社区中的所有节点的邻居节点。
B的大小可自定义设置,在一个示意性实施例中,B=5。
S604,基于第m个社区中的所有节点的邻居节点,构建Cm
具体地,基于每个节点的邻居节点可构建该节点对应的内容属性特征图,这样就可以从节点的内容属性特征数据中获得第m个社区对应的邻接矩阵
Figure GDA00042381944300000919
具体,基于每个节点的邻居节点可构建该节点对应的内容属性特征图,并利用内容特征属性图构建对应的邻接矩阵,即如果两个节点相连,则其矩阵对应位置的值为1,反之为0。
由于社交网络所构成的图结构是错综复杂的,有的节点单独形成单一图,有的节点交互形成关联图。此外,不同节点的属性信息也是多源异构的,节点本身具有用户实体、博文状态、地点位置等数据信息,节点之间包含社交关系、撰写关系、位置关系等异质边。挖掘有效的用户聚类特征及社群意见特征的关键在于如何从拓扑结构和节点本身内容属性中共同提取全面、合理的特征,但目前方法缺少同时交互协同提取节点拓扑和属性特征的机制。因此,本发明提出将社交网络上的群体特征挖掘问题抽象建模为多维度节点聚类问题。为了满足已经融合的复杂网络结构,设计了一种挖掘节点间属性和结构的多维度深度神经网络聚类模型,具体为两层注意力机制的神经网络。模型首先根据节点的内容属性相似度构建节点的属性特征图,然后与节点间的拓扑图共同作为输入,接下来通过两层注意力机制自适应提取不同维度下的节点内容和节点拓扑的隐藏特征,实现每个社区的节点内容和属性复合特征的深度挖掘,为节点间社区聚合和社群态度立场挖掘提供基础特征。具体实现可如下述S700~S800所示:
S700,将Cm和Tm输入到第一层注意力机制中,分别得到对应的内容属性融合特征
Figure GDA0004238194430000101
和拓扑结构融合特征/>
Figure GDA0004238194430000102
Figure GDA0004238194430000103
Figure GDA0004238194430000104
和/>
Figure GDA0004238194430000105
分别为Cm和Tm中的节点vi的内容属性融合特征和拓扑结构融合特征。
在本发明实施例中,使用第一层注意力机制来学习顶点vi的各邻居节点vj,j∈Ni特征的权重系数。
以第m个社区对应的内容属性特征图为例进行介绍。首先,将第m个社区对应的内容属性特征图输入到多维度深度神经网络聚类模型中,通过下式学习顶点vi,vj之间的相关系数
Figure GDA0004238194430000106
其中运算符[·|·]表示拼接操作,a(·)是单层前馈神经网络,激活函数使用LeakyRelu。
Figure GDA0004238194430000107
其中,
Figure GDA0004238194430000108
为/>
Figure GDA0004238194430000109
的邻居节点集合,W权重矩阵。
对相关系数进行softmax归一化即得到注意力分布
Figure GDA00042381944300001010
根据注意力分布系数来聚合邻域特征,即Cm中的第i个节点融合了领域信息的新特征
Figure GDA00042381944300001011
类似地,拓扑结构特征图中的节点i的拓扑结构融合特征
Figure GDA0004238194430000111
Figure GDA0004238194430000112
其中,
Figure GDA0004238194430000113
为Tm中的第j个节点的拓扑结构特征向量,/>
Figure GDA0004238194430000114
为/>
Figure GDA0004238194430000115
的邻居节点集合,W为权重矩阵,符号[·|·]表示拼接操作,a(·)是单层前馈神经网络,LeakyRelu为激活函数,σ()为sigmoid函数。
在本发明实施例中,为了使模型更加健壮,可以引入多头注意力机制在不同投影空间中捕捉不同的交互信息,即第一层注意力机制包括K个注意力机制。如下式所示,连接重复独立执行K次的上式得到特征,其中
Figure GDA0004238194430000116
表示第m个特征图(包括内容属性特征图和拓扑结构特征图)由第k个注意力机制计算得到的注意力系数,Wk是相应的输入线性映射的权重矩阵。
Figure GDA0004238194430000117
||表示拼接。
即,每个节点的融合特征可为多个注意力机制得到的特征拼接之后得到的特征。
S800,将Hm a和Hm t输入到第二层注意力机制中,得到第m个社区的融合特征Zm={zm 1,zm 2,…,zm i,…,zm h(m)};zm i为第m个社区的节点vi的融合特征。
为了学习拓扑结构图和内容属性特征图各自的重要性,实施第二层注意力机制。对于第m个社区的拓扑图结构图中任一节点vi
Figure GDA0004238194430000118
先对其进行非线性变换,然后使用点积模型获得变换的嵌入与查询向量q的相关性,取所有节点的关注值的平均值作为拓扑图关注值/>
Figure GDA0004238194430000119
如下式所示,其中,W是权重矩阵,b是偏置向量,公式(·)T代表转秩运算。同理对于内容属性特征图的融合特征/>
Figure GDA00042381944300001110
的关注值为/>
Figure GDA00042381944300001111
其中,内容属性特征图和拓扑结构图的融合特征共享上述参数。
Figure GDA00042381944300001112
接着使用softmax函数对关注值
Figure GDA00042381944300001113
进行归一化,分别获得拓扑图和特征图各自的注意力权重/>
Figure GDA00042381944300001114
具体地,内容属性特征图中的任一节点i的注意力系数
Figure GDA00042381944300001115
Figure GDA0004238194430000121
拓扑结构特征图中的任一节点i的注意力系数/>
Figure GDA0004238194430000122
Figure GDA0004238194430000123
最后使用注意力结合拓扑结构图和内容属性特征图各自对应的融合特征,得到
Figure GDA0004238194430000124
Figure GDA0004238194430000125
即/>
Figure GDA0004238194430000126
S900,将zm i输入到设定的观点立场倾向预测模型中,得到对应的预测结果Pcm i={Pcm ie}H e=1,Pcm ie为节点vi对应的用户立场属于第e个观点立场的概率,H为观点立场的数量。
在本发明实施例中,用户立场可包括支持、中立和反对。
在本发明实施例中,设定的观点立场倾向预测模型可为两层注意力机制的神经网络,可为全连接层构成的模型。可为训练后的模型,具体地,可获取多个社区的目标融合特征作为样本输入到构建的深度神经网络模型中进行训练。在模型训练时,可采用梯度下降法进行训练,损失函数可采用KL三度计算损失。具体的训练步骤可为现有技术,为避免赘述,省略对其的具体介绍。
其中,对于输入的社区m中的第i个节点对应的用户的目标融合特征
Figure GDA0004238194430000127
经过全连接层后得到的输出特征
Figure GDA0004238194430000128
Wout是输出权重,Bout是偏置向量。
最后,通过由Softmax层组成的输出层,得到H个立场标签取值的概率分布
Figure GDA0004238194430000129
S1000,获取第m个社区的观点立场值
Figure GDA00042381944300001210
ke为第e个观点立场的属性值。
在本发明实施例中,可根据用户对不同话题事件的评论言论和响应行为的不同,可以将用户对事件所表现出来的支持、中立或反对的不同立场倾向态度量化评估为1,0,-1,即支持、中立和反对的属性值可分别为1,0,-1。
本发明实施例中,通过节点内容属性和拓扑结构多维特征的特征级融合,从而通过基于真实数据驱动训练来自动获取文本观点,能够提高群体决策预测问题的效率与准确率。
本发明另一实施例提供一种跨社交网络的群体感知与立场分析系统,用于实现前述的方法,如图2所示,提供的系统可包括自底而上设置的社交网络嵌入模块、特征融合挖掘模块和群体立场决策模块。
其中,社交网络嵌入模块,用于基于非欧双曲空间的庞加莱球模型将不同的社交网络嵌入到相同的高维公共子空间,并在高维公共子空间内实现社交网络中的社区对齐与用户对齐,实现网络社区用户的多源异构信息的对齐和网络关联融合,得到对齐后的目标融合网络和目标融合网络中的每个用户在非欧双曲空间中的表征向量并发送给所述特征融合挖掘模块,所述表征向量包括内容属性特征向量和拓扑结构特征向量。该模块具体用于执行前述S100~S500所示出的步骤。
特征融合挖掘模块用于通过两层注意力机制来对目标融合网络中的特征进行挖掘和融合,得到目标融合网络中每个社区的融合特征并发送给所述群体立场决策模块,具体地特征融合挖掘模块进一步社交网络嵌入模块所传递的已对齐的社交网络的社区多源异构数据,通过对社区数据的深度挖掘和融合,支撑群体立场决策模块中群体的划分和立场倾向性的分析。特特征融合挖掘模块堆叠了两层注意力机制来自适应提取图数据中的有效特征,其中第一层注意力图注意力网络用来聚合邻居节点特征,第二层注意力融合拓扑图和特征图的所提取的特征。该模块具体用于执行前述S600~S800所示出的步骤。
群体立场决策模块用于基于接收到的融合特征对社区的立场倾向态度进行预测,得到每个社区的立场倾向态度。具体地,用于基于融合群体节点交互和自身内容属性特征的立场倾向态度挖掘和聚合方法,基于特征融合挖掘模块挖掘的深度共享特征,即通过节点内容属性和拓扑结构多维特征的特征级融合,从而通过基于真实数据驱动训练,自动获取文本观点并且引入环境因素影响的群体决策预测算法,来提高群体决策预测问题的效率与准确率。该模块具体用于执行前述S900~S1000所示出的步骤。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
本发明的实施例还提供了一种非瞬时性计算机可读存储介质,该存储介质可设置于电子设备之中以保存用于实现方法实施例中一种方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述实施例提供的方法。
在一些可能的实施方式中,本申请的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ARM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
本发明的实施例还提供了一种电子设备,包括处理器和前述的非瞬时性计算机可读存储介质。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
根据本申请的这种实施方式的电子设备。电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:上述至少一个处理器、上述至少一个储存器、连接不同系统组件(包括储存器和处理器)的总线。
其中,所述储存器存储有程序代码,所述程序代码可以被所述处理器执行,使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
储存器可以包括易失性储存器形式的可读介质,例如随机存取储存器(ARM)和/或高速缓存储存器,还可以进一步包括只读储存器(ROM)。
储存器还可以包括具有一组(至少一个)程序模块的程序/实用工具,这样的程序模块包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线可以为表示几类总线结构中的一种或多种,包括储存器总线或者储存器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
电子设备也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口进行。并且,电子设备还可以通过网络适配器与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器通过总线与电子设备的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
本发明的实施例还提供一种计算机程序产品,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使该电子设备执行本说明书上述描述的根据本发明各种示例性实施方式的方法中的步骤。
虽然已经通过示例对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员还应理解,可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明公开的范围由所附权利要求来限定。

Claims (8)

1.一种跨社交网络的群体感知与立场分析方法,其特征在于,所述方法包括如下步骤:
S100,获取Q个社交网络SN1,SN2,…,SNr,…,SNQ;r的取值为1到Q;
S200,基于非欧双曲空间的庞加莱球模型将SN1和SN2进行对齐,得到初始融合网络以及初始融合网络中的每个节点在非欧双曲空间中的表征向量;执行S200;所述表征向量包括内容属性特征向量和拓扑结构特征向量;
S300,设置c=c+1,如果c<Q-1,执行S400;否则,执行S500;
S400,基于非欧双曲空间将当前融合网络和SN(c+2)进行对齐,得到融合网络(c+1)以及融合网络(c+1)中的每个节点在非欧双曲空间中的表征向量;执行S300;
S500,将当前融合网络作为目标融合网络G=(V,X,E),其中,
Figure FDA0004238194420000011
为G中的节点集合,vs为G中的第s个节点,s的取值为1到n,n为G中的节点数量;内容属性特征集合X={X1,X2,…,Xm,…,Xh(m)},第m个社区的内容属性特征集合/>
Figure FDA0004238194420000012
表示G中的第m个社区中的节点vi的表征向量;拓扑结构特征集合E={E1,E2,…,Em,…,Eh(m)},/>
Figure FDA0004238194420000013
表示G中的第m个社区的节点vi和vj之间的边的集合;m的取值为1到L,i,j的取值为1到h(m),i≠j,L为G中的社区数量,h(m)为第m个社区中的节点数量;
S600,获取g中的第m个社区的内容属性特征图Cm和拓扑结构图Tm;其中,Cm为基于G中第m个社区中的各节点之间的距离获取得到,
Figure FDA0004238194420000014
Figure FDA0004238194420000015
为Cm对应的邻接矩阵;/>
Figure FDA0004238194420000016
为Tm对应的邻接矩阵;
Figure FDA0004238194420000017
为Cm中的第i个节点的内容属性特征向量,/>
Figure FDA0004238194420000018
为Tm中的第i个节点的拓扑结构特征向量;
S700,将Cm和Tm输入到第一层注意力机制中,分别得到对应的内容属性融合特征
Figure FDA0004238194420000019
和拓扑结构融合特征/>
Figure FDA00042381944200000110
Figure FDA00042381944200000111
Figure FDA00042381944200000112
和/>
Figure FDA00042381944200000113
分别为Cm和Tm中的节点vi的内容属性融合特征和拓扑结构融合特征;其中,/>
Figure FDA00042381944200000114
Figure FDA00042381944200000115
为Cm中的第j个节点的内容属性特征向量,/>
Figure FDA00042381944200000116
为/>
Figure FDA00042381944200000117
的邻居节点集合,W为权重矩阵,符号[·|·]表示拼接操作,a(·)是单层前馈神经网络,LeakyRelu为激活函数,σ(·)为sigmoid函数;/>
Figure FDA0004238194420000021
Figure FDA0004238194420000022
Figure FDA0004238194420000023
为Tm中的第j个节点的拓扑结构特征向量,/>
Figure FDA0004238194420000024
为/>
Figure FDA0004238194420000025
的邻居节点集合,W为权重矩阵,符号[·|·]表示拼接操作,a(·)是单层前馈神经网络,LeakyRelu为激活函数,σ()为sigmoid函数;
S800,将
Figure FDA0004238194420000026
和/>
Figure FDA0004238194420000027
输入到第二层注意力机制中,得到第m个社区的融合特征Zm={zm 1,zm 2,…,zm i,…,zm h(m)};zm i为第m个社区的节点vi的融合特征;
S900,将zm i输入到设定的观点立场倾向预测模型中,得到对应的预测结果Pcm i={Pcm ie}H e=1,Pcm ie为节点vi对应的用户立场属于第e个观点立场的概率,H为观点立场的数量;
S1000,获取第m个社区的观点立场值
Figure FDA0004238194420000028
ke为第e个观点立场的属性值。
2.根据权利要求1所述的方法,其特征在于,所述每个融合网络中的节点的表征向量通过如下步骤获取:
S10,在需要融合的两个社交网络的每个节点中嵌入双曲空间庞加莱球模型,构建每个节点的节点表征向量目标约束函数
Figure FDA0004238194420000029
为网络x中的节点/>
Figure FDA00042381944200000210
和/>
Figure FDA00042381944200000211
之间的双曲距离,/>
Figure FDA00042381944200000212
为网络x中的节点/>
Figure FDA00042381944200000213
的邻居节点集合,/>
Figure FDA00042381944200000214
为网络x的节点集合;网络s表示两个社交网络中的源网络,网络t表示两个社交网络中的目标网络;
S20,利用非欧双曲聚类模型对嵌入了双曲空间庞加莱球模型的两个社交网络中的每个社区进行建模,构建每个社区的社区表征向量目标约束函数
Figure FDA00042381944200000215
为网络x中的节点/>
Figure FDA00042381944200000216
属于网络x中的社区p的概率,/>
Figure FDA00042381944200000217
基于广义双曲分布构建的社区p的模型的概率密度分布函数,/>
Figure FDA00042381944200000218
为/>
Figure FDA00042381944200000219
的双曲表征向量,/>
Figure FDA00042381944200000220
为网络x中的社区p的双曲参数;Cx为网络x中的社区数量;
S30,基于社交网络中的锚用户,构建嵌入了非欧双曲聚类模型的两个社交网络的对齐概率函数
Figure FDA00042381944200000221
为目标网络中与源网络中的节点/>
Figure FDA00042381944200000222
通过锚链接连接的节点,/>
Figure FDA00042381944200000223
表示节点/>
Figure FDA00042381944200000224
和/>
Figure FDA00042381944200000225
之间的双曲距离,/>
Figure FDA0004238194420000031
表示节点/>
Figure FDA0004238194420000032
和/>
Figure FDA0004238194420000033
之间的双曲距离;U为两个社交网络中的锚用户集合;
S40,构建如下联合目标函数:
Figure FDA0004238194420000034
Figure FDA0004238194420000035
其中,α1和α2为权重因子,θ为节点的双曲标准向量,θ′为节点的上下文向量,
Figure FDA0004238194420000036
为网络x中的社区p的度量矩阵;
S50,对所述联合目标函数进行优化,得到每个节点的表征向量。
3.根据权利要求2所述的方法,其特征在于,
Figure FDA0004238194420000037
Figure FDA0004238194420000038
其中,
Figure FDA0004238194420000039
β和μ分别为扭曲和位置向量,ω为聚集因子,Δ为度量矩阵,为d维正定矩阵,用以刻画黎曼度量,|Δ|为Δ的行列式,Kr(·为r阶修正的贝塞尔函数,/>
Figure FDA00042381944200000310
为/>
Figure FDA00042381944200000311
阶修正的贝塞尔函数。
4.根据权利要求1所述的方法,其特征在于,所述第一层注意力机制包括K个注意力机制。
5.根据权利要求1所述的方法,其特征在于,Cm通过如下步骤获取得到:
S601,获取第m个社区中与任一节点vi对应的相似度
Figure FDA00042381944200000312
Figure FDA00042381944200000313
为节点vi和节点vj的内容属性特征向量之间的相似度;
S602,将
Figure FDA00042381944200000314
中的相似度按照由大到小的顺序进行排序,得到排序后的相似度/>
Figure FDA00042381944200000315
S603,获取
Figure FDA00042381944200000316
中的前B个相似度对应的节点作为vi的邻居节点;得到第m个社区中的所有节点的邻居节点;
S604,基于第m个社区中的所有节点的邻居节点,构建Cm
6.根据权利要求1所述的方法,其特征在于,所述内容属性特征包括用户的属性信息和发布的文本信息,所述拓扑结构特征包括用户的网络活动信息和社交关系信息。
7.一种跨社交网络的群体感知与立场分析系统,其特征在于,用于执行如权利要求1至6任一项所述方法,所述系统包括:社交网络嵌入模块、特征融合挖掘模块和群体立场决策模块;
其中,所述社交网络嵌入模块,用于基于非欧双曲空间的庞加莱球模型将不同的社交网络嵌入到相同的高维公共子空间内,并在高维公共子空间内实现社交网络中的社区对齐与用户对齐,实现网络社区用户的多源异构信息的对齐和网络关联融合,得到对齐后的目标融合网络和目标融合网络中的每个用户在非欧双曲空间中的表征向量并发送给所述特征融合挖掘模块,所述表征向量包括内容属性特征向量和拓扑结构特征向量;
所述特征融合挖掘模块,用于通过两层注意力机制来对目标融合网络中的特征进行挖掘和融合,得到目标融合网络中每个社区的融合特征并发送给所述群体立场决策模块;
所述群体立场决策模块,用于基于接收到的融合特征对社区的立场倾向态度进行预测,得到每个社区的立场倾向态度。
8.一种电子设备,其特征在于,包括处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如权利要求1至6任一项所述方法的步骤。
CN202211643877.3A 2022-12-20 2022-12-20 跨社交网络的群体感知与立场分析方法、系统和电子设备 Active CN116049695B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211643877.3A CN116049695B (zh) 2022-12-20 2022-12-20 跨社交网络的群体感知与立场分析方法、系统和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211643877.3A CN116049695B (zh) 2022-12-20 2022-12-20 跨社交网络的群体感知与立场分析方法、系统和电子设备

Publications (2)

Publication Number Publication Date
CN116049695A CN116049695A (zh) 2023-05-02
CN116049695B true CN116049695B (zh) 2023-07-04

Family

ID=86119166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211643877.3A Active CN116049695B (zh) 2022-12-20 2022-12-20 跨社交网络的群体感知与立场分析方法、系统和电子设备

Country Status (1)

Country Link
CN (1) CN116049695B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145109A (zh) * 2017-06-19 2019-01-04 国家计算机网络与信息安全管理中心 基于社交网络的用户群体消息传播异常分析方法及装置
CN109471995A (zh) * 2018-10-26 2019-03-15 武汉大学 一种复杂网络的双曲嵌入方法
CN111931903A (zh) * 2020-07-09 2020-11-13 北京邮电大学 一种基于双层图注意力神经网络的网络对齐方法
CN114254093A (zh) * 2021-12-17 2022-03-29 南京航空航天大学 多空间知识增强的知识图谱问答方法及系统
CN114329227A (zh) * 2021-08-13 2022-04-12 北京计算机技术及应用研究所 基于话题知识图谱的社交关系网络构建与拓展方法
CN115080871A (zh) * 2022-07-07 2022-09-20 国家计算机网络与信息安全管理中心 一种跨社交网络社交用户对齐方法
CN115186197A (zh) * 2022-08-19 2022-10-14 中国科学技术大学 一种基于端到端双曲空间的用户推荐方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8117281B2 (en) * 2006-11-02 2012-02-14 Addnclick, Inc. Using internet content as a means to establish live social networks by linking internet users to each other who are simultaneously engaged in the same and/or similar content
US9922465B2 (en) * 2016-05-17 2018-03-20 Disney Enterprises, Inc. Systems and methods for changing a perceived speed of motion associated with a user

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145109A (zh) * 2017-06-19 2019-01-04 国家计算机网络与信息安全管理中心 基于社交网络的用户群体消息传播异常分析方法及装置
CN109471995A (zh) * 2018-10-26 2019-03-15 武汉大学 一种复杂网络的双曲嵌入方法
CN111931903A (zh) * 2020-07-09 2020-11-13 北京邮电大学 一种基于双层图注意力神经网络的网络对齐方法
CN114329227A (zh) * 2021-08-13 2022-04-12 北京计算机技术及应用研究所 基于话题知识图谱的社交关系网络构建与拓展方法
CN114254093A (zh) * 2021-12-17 2022-03-29 南京航空航天大学 多空间知识增强的知识图谱问答方法及系统
CN115080871A (zh) * 2022-07-07 2022-09-20 国家计算机网络与信息安全管理中心 一种跨社交网络社交用户对齐方法
CN115186197A (zh) * 2022-08-19 2022-10-14 中国科学技术大学 一种基于端到端双曲空间的用户推荐方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于CNN-BiLSTM的中文微博立场分析研究;张翠肖;郝杰辉;刘星宇;孙月肖;;计算机技术与发展(第07期);全文 *
基于注意力的BiLSTM-CNN中文微博立场检测模型;白静;李霏;姬东鸿;;计算机应用与软件(第03期);全文 *
基于融合表示学习的跨社交网络用户身份匹配;杨奕卓;于洪涛;黄瑞阳;刘正铭;;计算机工程(第09期);全文 *

Also Published As

Publication number Publication date
CN116049695A (zh) 2023-05-02

Similar Documents

Publication Publication Date Title
Chen et al. Deep reinforcement learning in recommender systems: A survey and new perspectives
CN111737552A (zh) 训练信息抽取模型和获取知识图谱的方法、装置和设备
CN111506714A (zh) 基于知识图嵌入的问题回答
CN112069302B (zh) 会话意图识别模型的训练方法、会话意图识别方法及装置
Xu et al. User memory reasoning for conversational recommendation
US11501547B1 (en) Leveraging text profiles to select and configure models for use with textual datasets
CN112819024B (zh) 模型处理方法、用户数据处理方法及装置、计算机设备
Cheng et al. Adaptive algorithm recommendation and application of learning resources in English fragmented reading
Guo et al. Who is answering whom? Finding “Reply-To” relations in group chats with deep bidirectional LSTM networks
KR20200041199A (ko) 챗봇 구동 방법, 장치 및 컴퓨터 판독가능 매체
CN113535949B (zh) 基于图片和句子的多模态联合事件检测方法
Sandiwarno et al. A novel hybrid machine learning model for analyzing e-learning users’ satisfaction
Yang et al. Anchor link prediction across social networks based on multiple consistency
WO2023164312A1 (en) An apparatus for classifying candidates to postings and a method for its use
CN116049695B (zh) 跨社交网络的群体感知与立场分析方法、系统和电子设备
Seth et al. Sentiment data analysis for detecting social sense after COVID-19 using hybrid optimization method
Shi et al. Practical POMDP-based test mechanism for quality assurance in volunteer crowdsourcing
Wang et al. [Retracted] Learning Behavior Based on Data Mining Technology
Mudigonda et al. IDEAL: an inventive optimized deep ensemble augmented learning framework for opinion mining and sentiment analysis
CN111444338A (zh) 文本处理、装置、存储介质及设备
US11977515B1 (en) Real time analysis of interactive content
CN117151247B (zh) 机器学习任务建模的方法、装置、计算机设备和存储介质
US20240168918A1 (en) Systems for cluster analysis of interactive content
US20240168610A1 (en) Optimized analysis and access to interactive content
US12032605B2 (en) Searchable data structure for electronic documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant