CN112667864A - 图对齐方法、装置、电子设备及存储介质 - Google Patents
图对齐方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112667864A CN112667864A CN202110287585.XA CN202110287585A CN112667864A CN 112667864 A CN112667864 A CN 112667864A CN 202110287585 A CN202110287585 A CN 202110287585A CN 112667864 A CN112667864 A CN 112667864A
- Authority
- CN
- China
- Prior art keywords
- feature
- graph
- node
- feature set
- target domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种图对齐方法、装置、电子设备及存储介质,涉及人工智能技术在数据挖掘技术领域的应用。该方法包括:获取源域图以及目标域图;提取源域图对应的第一特征集合,提取目标域图对应的第二特征集合,第一特征集合以及第二特征集合位于同一向量空间;基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合;基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。该方法可以同时考虑图自身结构信息以及图间关联性,提高图对齐效果。
Description
技术领域
本申请涉及数据挖掘技术领域,更具体地,涉及一种图对齐方法、装置、电子设备及存储介质。
背景技术
图作为一种抽象程度高、表达能力强的数据结构,广泛用于社交网络、商品网络以及蛋白质结构的表达中,其通过对节点和边的定义来描述实体和实体之间的关联关系。
以社交网络为例,可以根据社交网络中的用户以及用户之间的关联关系建立社交网络图。当需要在不同社交网络图中确定同一个用户时,需要将不同社交网络图进行图对齐。
然而,相关技术中的图对齐方法,图对齐效果较差。
发明内容
鉴于上述问题,本申请实施例提出了一种图对齐方法、装置、电子设备及存储介质,以改善上述问题。
第一方面,本申请实施例提供了一种图对齐方法,方法包括:获取源域图以及目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点;提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间;基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合;基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。
第二方面,本申请实施例提供了一种图对齐装置,装置包括:获取模块、特征提取模块、特征传递模块以及对齐模块。其中,获取模块,用于获取源域图以及目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点;特征提取模块,用于提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间;特征传递模块,用于基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合;对齐模块,用于基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。
第三方面,本申请实施例提供了一种电子设备,包括处理器以及存储器;一个或多个程序被存储在存储器中并被配置为由处理器执行以实现上述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有程序代码,其中,在程序代码被处理器运行时执行上述的方法。
第五方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的方法。
本申请实施例提供的一种图对齐方法、装置、电子设备及存储介质,在获取源域图以及目标域图之后,提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间,然后基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合,最后基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。从而通过提取源域图中的每个源域节点的源域节点特征,以及提取目标域图中的每个目标域节点的目标域节点特征的过程,使得在进行图对齐时能够考虑图自身结构信息,又通过基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,进行特征传递的过程,使得在进行图对齐时还能够考虑到图间关联性,使得两个不同的图不再是完全独立的,实现不同图间信息传递和信息聚合,学习和弱化图间差异性,提高了图对齐效果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例提出的一种图对齐方法的流程图;
图2示出了本申请实施例提出的一种社交网络图的示意图;
图3示出了本申请实施例提出的另一种图对齐方法的流程图;
图4示出了本申请实施例提出的一种深度神经网络模型的结构示意图;
图5示出了本申请实施例提出的另一种图对齐方法的流程图;
图6示出了本申请实施例提出的图对齐方法的一种应用场景示意图;
图7示出了本申请实施例提出的一种图对齐装置的框图;
图8示出了本申请实施例提出的另一种图对齐装置的框图;
图9示出了用于执行根据本申请实施例的图对齐方法的另一种电子设备的结构框图;
图10示出了本申请实施例的用于保存或者携带实现根据本申请实施例的图对齐方法的程序代码的存储单元。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
其中,随着机器学习技术的发展,机器学习技术在多个领域展开了广泛的研究和应用,本申请实施例提供的技术方案涉及到机器学习技术在数据挖掘领域的应用。具体地,涉及到一种图对齐方法。
首先需要说明的是,本申请实施例中的图对齐方法可以应用于社交网络图、商品网络图以及蛋白质结构图等需要进行对齐的图。为了便于理解和说明,以下实施例中主要以社交网络图为例对本申请中的图对齐方法进行详细说明。但是可以理解的是,本申请的图对齐方法不仅仅局限于社交网络图,也即社交网络图并不构成对于本发明实施例提供的技术方案的限定。
需要说明的是,本申请实施例公开的图对齐方法中用到的源域图数据以及目标域图数据可保存于区块链上。
随着各种在线社交平台的快速普及,人们往往在各个独立的社交网络中创建不同的帐户。
针对单一社交网络的信息挖掘工作受限于网络资源的有限性,使得挖掘工作得到的某个用户的信息往往是不全面的,因此,可以考虑针对多个社交网络的信息,来共同挖掘得到某个用户的信息。这就需要在不同的社交网络中确定同一个用户,这个过程称为社交网络对齐,而社交网络可以表达成图,因此,社交网络对齐可以转换成社交网络图对齐。也即在不同的社交网络中,图对齐可以理解为在不同的社交网络图中找到同一个用户。
发明人在研究中发现,相关技术中的图对齐方法,无法有效地兼顾图内结构信息和图间信息关联性,使得图对齐效果较差。
鉴于此,发明人提出了本申请提供的图对齐方法、装置、电子设备及存储介质,在该方法中,在获取源域图以及目标域图之后,提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间,然后基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合,最后基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。前述方式中,可以同时考虑图自身结构信息以及图间关联性,提高图对齐效果。
本申请实施例提供的方法,各步骤的执行主体可以是计算机设备,该计算机设备是指具备数据计算、处理和存储能力的电子设备。该计算机设备可以是诸如PC(PersonalComputer,个人计算机)、平板电脑、智能手机、智能音响、可穿戴设备、智能机器人、车载终端等终端设备,也可以是服务器。
需要说明的是,其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN( Content DeliveryNetwork,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器,还可以是提供车联网服务、路网协同、车路协同、智能交通、自动驾驶、工业互联网服务、数据通信(如4G、5G等)等专门或平台服务器。
下面将结合附图具体描述本申请的各实施例。
请参阅图1,图1所示为本申请一实施例提出的一种图对齐方法的流程图,该方法包括:
S110,获取源域图以及目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点。
源域图以及目标域图可以是任意两个需要对齐处理的图。源域图与目标域图是相对的概念,用于区别两个图,不特指某一个图,图对齐实质上是找出两个图中相互对应的节点,因此,在一些实施方式中,源域图与目标域图可以相互调换,也即,当对两个图进行对齐时,可以任意确定其中一个图为源域图,则剩下的一个图为目标域图。
源域图以及目标域图均是通过对节点和边的定义来描述实体和实体之间的关联关系,因此,源域图以及目标域图中均存在节点以及连接节点的边,从而源域节点可以理解为源域图中的节点,目标域节点可以理解为目标域图中的节点。
在对两个社交网络图进行对齐之前,首先需要将两个社交网络表达成图。作为一种实施方式,可以获取到第一社交网络中的用户信息,该用户信息描述了第一社交网络中的不同用户,以及不同用户间的关系,由此,即可根据该用户信息将第一社交网络中的用户表达为社交网络图中的节点,以及将用户间的关系表达为社交网络图中连接节点的边,得到第一社交网络的社交网络图。同理,可以得到第二社交网络图。如图2所示,图2为某社交网络对应的社交网络图,该社交网络图中包括由用户构成的节点,以及用户之间关系构成的边。
示例地,图2中的节点可以分别表示用户A、用户B、用户C、用户D以及用户E这5个用户,用户A与用户B之间的边、用户A与用户C之间的边、用户B与用户E之间的边等,可以表示相连接的两个用户在社交网络中是好友关系,或者有过消息交互,或者有过交易记录等。也就是说,当在某个社交网络中,如果用户A与用户B是好友关系,则可以在社交网络图中用一条边将用户A与用户B进行连接。
可选地,可以将第一社交网络图看作是源域图,将第二社交网络图看作是目标域图。可选地,也可以将第一社交网络图看作是目标域图,将第二社交网络图看作是源域图。
其中,第一社交网络和第二社交网络为不同的社交网络,即异构社交网络,应当说明的是,第一和第二并非特指某一社交网络,仅用于区分两个不同的社交网络,第一社交网络和第二社交网络可以为任意两个不同的社交网络。
S120,提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间。
提取图中节点的节点特征可以采用图嵌入的方式。图嵌入,又称网络表示学习,是将一个网络中的节点基于网络的特点映射成一个低维度的向量,进而可以定量的衡量节点之间的相似性,便于更加方便地应用。
可选地,可以采用DeepWalk算法来对社交网络图进行图嵌入处理。DeepWalk是一种将随机游走(random walk)和word2vec两种算法相结合的图结构数据挖掘算法。该算法能够学习网络的隐藏信息,能够将图中的节点表示为一个包含潜在信息的向量。
可选地,也可以采用GCN(Graph Convoluti onalnetworks,图卷积神经网络)来对社交网络图进行图嵌入处理。图卷积神经网络算法以每个节点的全局邻域作为输入,通过在图上定义卷积算法,迭代地聚合节点的邻域嵌入,并使用在前一次迭代中获得的嵌入及其嵌入的函数来获得新的嵌入。仅局部邻域的聚合嵌入使其具有可扩展性,并且多次迭代允许学习嵌入一个节点来描述全局邻域。
不管是采用DeepWalk算法,还是采用图卷积神经网络算法或者其他图嵌入方式进行特征提取,均可以得到图中所有节点的节点特征组成的节点特征集合。对源域图中每个源域节点的源域节点特征进行特征提取,得到的是源域图中各个源域节点对应的节点特征(即源域节点特征)的集合,即第一特征集合,对目标域图进行特征提取,得到的是目标域图中各个目标域节点对应的节点特征(即目标域节点特征)的集合,即第二特征集合。其中,节点特征包括节点本身属性特征以及节点之间的拓扑特征或者连接关系特征。其中,节点本身属性特征可以是年龄、性别以及个性签名等属性对应的特征。源域节点特征包括的是源域节点本身属性特征以及源域节点之间的拓扑特征或者连接关系特征。目标域节点特征包括的是目标域节点本身属性特征以及目标域节点之间的拓扑特征或者连接关系特征。
在图嵌入处理之后,得到的是节点对应的向量,因此,节点特征集合也可以看作是图中各节点对应的向量的集合。
需要注意的是,本申请实施例中的第一特征集合以及第二特征集合是位于同一个向量空间的。可以有多种方式对源域图以及目标域图中节点分别进行特征提取,得到位于同一向量空间的第一特征集合以及第二特征集合。
作为一种实施方式,可以使用具有相同参数的图嵌入规则,对源域图以及目标域图分别进行图嵌入处理,得到位于同一向量空间的第一特征集合以及第二特征集合。例如,可以通过参数共享的方式,使得对源域图进行特征提取的图嵌入规则对应的参数与对目标域图进行特征提取的图嵌入规则对应的参数相同,从而在分别进行图嵌入处理之后,使得第一特征集合以及第二特征集合位于同一向量空间。
作为另外一种实施方式,也可以使用具有不同参数的图嵌入规则,对源域图以及目标域图分别进行图嵌入处理,得到源域图中各节点对应节点特征所组成的源域中间特征集合,以及目标域图中各节点对应的节点特征所组成的目标域中间特征集合,此时源域中间特征集合以及目标域中间特征集合位于不同的向量空间,然后再使用映射规则,将源域中间特征集合以及目标域中间特征集合映射到同一向量空间,进而得到源域中间特征集合对应的第一特征集合,以及得到目标域中间特征集合对应的第二特征集合,此时第一特征集合与第二特征集合位于同一向量空间。
使用参数共享的方式,可以避免将源域图中节点对应中间特征集合以及目标域图中节点对应中间特征集合映射到同一向量空间,减少对数据的操作,使得数据更加真实,提高后续对齐效果,同时,也能够减少整个图对齐处理过程的操作步骤。
可以理解的是,通过上述对图中节点的节点特征提取过程,得到的第一特征集合以及第二特征集合包含了单个图中的结构信息,能够有效建模图内部节点之间的关系。
S130,基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合。
不同图的节点特征之间是存在潜在关联性的,这种关联性根据节点特征所在的向量空间会有所区别,本申请实施例中,由于提取的到的第一特征集合以及第二特征集合位于同一向量空间,因此,可以基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合。其中,特征传递可以理解为提取源域节点特征或者目标域节点特征的低维特征的过程,该过程中考虑到同一向量空间中源域节点特征与目标域节点特征之间的关联性。
可以理解的是,由于第一特征集合以及第二特征集合是基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性进行特征传递的,因此,在通过上述特征传递过程之后,可以使得两个不同的图不再是完全独立的,即第三特征集合与第四特征集合不再是完全独立的,实现了不同图间信息传递和信息聚合,使得图间差异性能够在特征传递过程中被学习和弱化。
S140,基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。
对齐规则可以采用基于相似度进行判断的规则,即首先通过确定第三特征集合中的某个源域节点特征与第四特征集合中每个目标域节点特征之间的相似度,从而再通过判断第三特征集合中的某个源域节点特征对应的相似度最大的目标域节点特征,从而将某个源域节点特征对应的相似度最大的目标域节点特征确定为相互对齐的节点特征,进而得到相互对齐的源域节点以及目标域节点。
示例性地,假设源域图包括A、B、C、D、E这5个节点,则第三特征集合中包括节点A、节点B、节点C、节点D以及节点E分别对应的特征,假设目标域图包括a、b、c、d、e这5个节点,则第四特征集合中包括节点a、节点b、节点c、节点d以及节点e分别对应的特征,针对节点A,分别确定节点A对应的节点特征与节点a、节点b、节点c、节点d以及节点e分别对应的节点特征之间的相似度,从而从中确定相似度最大的目标域节点特征,假设节点A对应的特征与节点b对应的特征之间的相似度最大,则确定节点A与节点b对齐,即得到相互对齐的节点A与节点b。
同理,针对源域图中每个其他节点B、C、D、E,也可以采用相似的方法确定相互对齐的目标域节点。
此外,考虑到两个社交网络中,用户并不一定能够完全对齐,例如,第一社交网络中,包括用户甲、乙、丙、戊、戌,而第二社交网络中,包括用户甲、乙、丁、戊、戌,此时,不管如何进行图对齐也不能将多余的丙和丁进行对齐。因此,在一些实施方式中,可以设置相似度阈值,此时,在确定第三特征集合中的某个源域节点特征与第四特征集合中每个目标域节点特征之间的相似度,从而再判断第三特征集合中的某个源域节点特征对应的相似度最大的目标域节点特征之后,可以将最大相似度与相似度阈值进行比较,当最大相似度大于相似度阈值时,将某个源域节点特征对应的相似度最大的目标域节点特征确定为相互对齐的节点特征,进而得到相互对齐的源域节点以及目标域节点。当最大相似度小于相似度阈值时,不能将某个源域节点特征与对应的相似度最大的目标域节点特征确定为相互对齐的节点特征,即该源域节点不存在相互对齐的目标域节点。
其中,源域节点特征与目标域节点特征之间的相似度可以有多种类型。
可选地,相似度可以是绝对相似度。这种情况下,需要获取第三特征集合中每个源域节点特征分别与第四特征集合中每个目标域节点特征之间的绝对相似度,然后再基于每个源域节点特征对应的绝对相似度最大的目标域节点特征,得到相互对齐的源域节点以及目标域节点。
其中,源域节点特征与目标域节点特征之间的绝对相似度可以是源域节点特征与目标域节点特征之间的欧式距离或者余弦距离等。
可选地,在对齐过程中可以进一步考虑因节点聚集性导致的中心点问题。对齐任务通常不存在多对一的对齐情况,而位于嵌入空间中高密度区域的节点又通常容易成为多个节点的对齐目标,因此需要在对齐之前对节点之间的相似度进行细化,即相似度还可以是去中心相似度。这种情况下,需要获取第三特征集合中每个源域节点特征分别与第四特征集合中每个目标域节点特征之间的去中心相似度,然后再基于每个源域节点特征对应的去中心相似度最大的目标域节点特征,得到相互对齐的源域节点以及目标域节点。
通过去中心相似度可以平衡高、低密度区域节点之间的相似度,使得低密度区域的节点更容易被作为对齐对象,以此来弱化中心点问题的影响,进而提高相似度对齐效果。
需要说明的是,在一些实施方式中,在本实施中的S120到S140可以由训练得到的深度神经网络模型来执行。其中,作为一种方式,在该深度神经网络模型的训练过程中,所采用的训练数据可以包括标记有部分节点对齐结果的源域图以及目标域图的训练样本,或者标记有准确节点以及边缘属性信息的源域图以及目标域图的训练样本。以使得该深度神经网络模型可以在监督学习之后,对输入的需要对齐的源域图以及目标域图实现对齐的功能。
在这种方式中,提取图中每个节点的节点特征的规则,以及基于同一向量空间中的源域图节点与目标域图节点之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递的规则,可以为在深度神经网络模型的基于前述的监督学习过程中的训练数据所训练得到。
该深度神经网络模型在监督学习过程中,可以基于图对齐结果以及源域图和目标域图之间的节点对应关系构造损失函数。也即可以将图对齐结果作为预测值,将源域图和目标域图之间的节点对应关系作为真实值构造损失函数。
作为另外一种方式,在该深度神经网络模型的训练过程中,所采用的训练数据可以包括未标记有任何节点对齐结果的源域图以及目标域图的训练样本,或者未标记有准确节点以及边缘属性信息的源域图以及目标域图的训练样本。以使得该深度神经网络模型可以在无监督学习之后,对输入的需要对齐的源域图以及目标域图实现对齐的功能。在这种方式中,提取图中每个节点的节点特征的规则,以及基于同一向量空间中的源域图节点与目标域图节点之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递的规则,可以为在深度神经网络模型的基于前述的无监督学习过程中的训练数据所训练得到。
该深度神经网络模型在无监督学习过程中,可以基于图对齐结果中相互对齐的源域节点以及目标域节点构造损失函数。也即可以将图对齐结果中包括的相互对齐的源域节点以及目标域节点之间的特征相似度作为预测值,将最大可能的相似度1作为真实值构造损失函数。
可以理解的是,本申请实施例的图对齐方法可以灵活应用于监督学习以及无监督学习,能够在更多缺乏标注数据的场景下实现图对齐功能,摆脱了对标注数据的依赖,不仅降低了实现图对齐的人力成本,还提高了图对齐的效率。
本申请提供的一种图对齐方法,在获取源域图以及目标域图之后,提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间,然后基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合,最后基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。从而通过前述提取源域图中的每个源域节点的源域节点特征,以及提取目标域图中的每个目标域节点的目标域节点特征的过程,使得在进行图对齐时能够考虑图自身结构信息,又通过前述基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,进行特征传递的过程,使得在进行图对齐时还能够考虑到图间关联性,使得两个不同的图不再是完全独立的,实现不同图间信息传递和信息聚合,学习和弱化图间差异性,进而提高图对齐效果。
请参阅图3,图3所示为本申请另一实施例提出的一种图对齐方法的流程图,该方法包括:
S210,获取源域图以及目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点。
S220,提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间。
在一些实施方式中,可以采用图卷积神经网络的图卷积层,提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合。图卷积层即对应图嵌入规则。
其中,图卷积层可以表示为:
在一些实施方式中,可以进行参数共享,也即将上述图卷积层用于提取源域图中的每个源域节点的源域节点特征,同时用于提取目标域图中的每个源域节点的目标域节点特征。
因此,在得到源域图以及目标域图的包含自环的邻接矩阵之后,便可以使用具
有相同预设卷积矩阵以及相同激活函数的图卷积层提取源域图中的每个源域节点的源域
节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,
得到第二特征集合,并且,由于使用了具有相同预设卷积矩阵以及相同激活函数的图卷积
层,因此,得到的第一特征集合以及第二特征集合位于同一向量空间。
S230,基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,得到关联性矩阵。
同一向量空间中的源域图节点特征与目标域图节点特征之间的关联性可以用关联性矩阵来表示。
在一些实施方式中,关联性矩阵可以通过关联性计算函数计算得到,关联性计算函数可以设置为双线性映射函数,即关联性矩阵可以为:
其中,Z的维度可以与节点属性特征的维度相同。例如,节点属性特征包括年龄、性别以及个性签名这3个维度,则Z是一个三维矩阵。
通过上述关联性矩阵,可以将同一向量空间中的源域图节点i的特征与目标域节点j的特征之间的关联性表示为:
其中,表示源域图中第i个节点特征与目标域图中第j个节点特征之间的关联
性性,表示关联性计算函数,表示第一特征集合中的第i个节点特征,表示第
二特征集合中的第j个节点特征,表示源域图中节点集合,表示目标域图中节点集
合。
S240,基于关联性矩阵以及图嵌入规则,得到特征传递规则。
在提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合时,是基于源域图以及目标域图分别对应的邻接矩阵进行图嵌入处理的,因此,得到的第一特征集合包含的是单个源域图中的结构信息,第二特征集合包含的是单个目标域图中的结构信息。第一特征集合以及第二特征集合均是表征图内部节点之间的关系。
而为了使得源域图以及目标域图不再是完全独立的,即第三特征集合与第四特征集合不再是完全独立的,从而实现不同图间信息传递和信息聚合,使得图间差异性能够在特征传递过程中被学习和弱化,因此,在基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性进行特征传递的时候,可以对前面的图卷积层对应的图嵌入规则进行拓展,具体为利用关联性矩阵来代替邻接矩阵,从而得到特征传递规则对应的计算式,实现特征传递。特征传递规则可以表示为:
S250,基于特征传递规则,对第一特征集合以及第二特征集合分别进行特征传递处理,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合。
在得到特征传递规则之后,便可以对第一特征集合中的各个节点特征进行特征传递处理,得到第一特征集合中的各个节点特征对应节点特征,从而得到对应的第三特征集合,以及对第二特征集合中的各个节点特征进行特征传递处理,得到第二特征集合中的各个节点特征对应节点特征,从而得到第二特征集合对应的第四特征集合。
S260,基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。
对齐规则可以采用基于相似度进行判断的规则。相似度可以是绝对相似度或者去中心相似度。
需要说明的是,在本实施中的S220到S260同样可以由训练得到的深度神经网络模型来执行。下面本实施例将会进一步的对该深度神经网络模型结构以及模型处理过程进行介绍。
在本实施例中,用于执行S220到S260的深度神经网络模型可以包括有图卷积层、特征传递层以及对齐层。
其中,图卷积层用于分别对源域图以及目标域图进行特征提取,提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合。图卷积层可以表示为:
其中,可选地,图卷积层可以只有一组,此时是使用同一组图卷积层分别对源域图以及目标域图进行特征提取。可选地,图卷积层可以有两组,这两组图卷积层使用的参数进行参数共享,此时是使用不同组的图卷积层分别对源域图以及目标域图进行特征提取。可以理解的是,每组图卷积层的层数可以是一层、两层、三层等层数。即每一组图卷积层可以级联有多层图卷积层。为了便于理解,以下实施例均以每组图卷积层为一层图卷积层为例进行说明。
特征传递层则用于对第一特征集合中的各个节点特征进行特征传递处理,得到第一特征集合中的各个节点特征进行特征传递后的节点特征,从而组成第三特征集合,以及对第二特征集合中的各个节点特征进行特征传递处理,得到第二特征集合中的各个节点特征进行特征传递后的节点特征,从而组成第四特征集合。特征传递层可以表示为:
且又有:
因此,可以理解的是,图卷积层有一个参数W1需要通过对模型进行训练得到,特征传递层有两个参数Z以及W2需要通过对模型进行训练得到。
在一些实施方式中,参数W1、参数Z以及参数W2还可以是同时训练得到的。如此,可以使得最终的特征传递结果在学习弱化图间差异性的同时能够有效保留单图的结构信息,使特征传递达到更好的可比较性,进而提高后续的对齐效果。
在一些实施方式中,为了简化特征传递规则的设置过程,可以直接设置特征传递规则对应的预设卷积矩阵与图卷积层的预设卷积矩阵相同。
同样地,特征传递层可以只有一个,此时是使用同一个特征传递层分别对源域图以及目标域图进行特征提取。可选地,特征传递层可以有两个,这两个特征传递层使用的参数进行参数共享,此时是使用不同的特征传递层分别对第一特征集合中的源域节点特征进行特征传递,以及对第二特征集合中的目标域节点特征进行特征传递。
其中,对齐层用于执行前述的S260,以基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。
如图4所示,深度神经网络模型可以包括有图卷积层11A、图卷积层11B、图卷积层11C以及图卷积层11D,特征传递层12以及对齐层13,其中,图卷积层11A和图卷积层11C之间进行参数共享,图卷积层11B和图卷积层11D之间进行参数共享。
在获取源域图Gs以及目标域图Gt之后,便可以将获取的源域图Gs依次经过图卷积
层11A以及图卷积层11B进行处理,图卷积层11A以及图卷积层11B便可以提取源域图Gs中的
每个源域节点的源域节点特征,得到第一特征集合,以及将目标域图Gt分别经过图卷积
层11C以及图卷积层11D进行处理,图卷积层11C以及图卷积层11D便可以提取目标域图Gt中
的每个目标域节点的目标域节点特征,得到第二特征集合,然后图卷积层11B再将第一
特征集合输入到特征传递层12,图卷积层11D将第二特征集合输入到特征传递层12,
特征传递层12便可以对第一特征集合以及第二特征集合分别进行特征传递,得到第
一特征集合对应的第三特征集合Xs以及第二特征集合对应的第四特征集合Xt,然后再
将第三特征集合Xs以及第四特征集合Xt输入到对齐层13,由对齐层13进行对齐处理,得到相
互对齐的源域节点以及目标域节点。
本申请提供的一种图对齐方法,基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,得到关联性矩阵,再基于关联性矩阵以及图嵌入规则,得到特征传递规则,通过引入关联性矩阵的方式,实现不同图间信息传递和信息聚合,使得图间差异性能够在特征传递过程中被学习和弱化,在提高图对齐效果的同时也能够提高图对齐效率。
请参阅图5,图5所示为本申请另一实施例提出的一种图对齐方法的流程图,该方法包括:
S310,获取源域图以及目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点。
S320,提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间。
S330,基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合。
S340,获取第三特征集合中每个源域节点特征与第四特征集合中每个目标域节点特征之间的绝对相似度。
S350,获取第三特征集合中每个源域节点特征对应的第一平均相似度,获取第四特征集合中每个目标域节点特征对应的第二平均相似度,源域节点特征对应的第一平均相似度为源域节点特征与每个目标域节点特征之间的绝对相似度的平均值,目标域节点特征对应的第二平均相似度为目标域节点特征与每个源域节点特征之间的绝对相似度的平均值。
考虑到直接基于绝对相似度确定相互对齐的源域节点以及目标域节点的话,忽略了节点聚集性导致的中心点问题,降低了对齐效果,因此,可以在绝对相似度的基础上进一步细化,采用去中心相似度来确定相互对齐的源域节点以及目标域节点。
第三特征集合中的每个源域节点特征均对应有一个第一平均相似度,第三特征集合中的某个源域节点特征的第一平均相似度是指,该源域节点特征与第四特征集合中的各个目标域节点特征之间的绝对相似度的平均值。同理,第四特征集合中的每个目标域节点特征均对应有一个第二平均相似度,第四特征集合中的某个目标域节点特征的第二平均相似度是指,该目标域节点特征与第三特征集合中的各个源域节点特征之间的绝对相似度的平均值。
第三特征集合中的源域节点特征对应的第一平均相似度可以用以下公式表示:
其中,Nt表示目标域图中目标域节点的数量,表示第三特征集合中的第i个源
域节点特征,表示第四特征集合中的第j个目标域节点特征,表示第三特征集
合中的第i个源域节点特征与第四特征集合中的第j个目标域节点特征之间的绝对相似度,
Xt表示第四特征集合。
同理,第四特征集合中的目标域节点特征对应的第二平均相似度可以用以下公式表示:
示例地,沿用前述示例,源域图包括A、B、C、D、E这5个节点,则第三特征集合中包括节点A、节点B、节点C、节点D以及节点E分别对应的源域特征,假设目标域图包括a、b、c、d、e这5个节点,则第四特征集合中包括节点a、节点b、节点c、节点d以及节点e分别对应的目标域特征。
针对源域图中的节点A,分别确定节点A对应的第三特征集合中的源域节点特征与目标域图中的节点a、节点b、节点c、节点d以及节点e分别对应的第四特征集合中的目标域节点特征之间的5个绝对相似度,然后对这5个绝对相似度求平均,得到节点A对应的第一平均相似度。同理,可以得到源域图中其他节点B、C、D、E各自对应的第一平均相似度。
利用相同的方法,针对目标域图中的节点a,分别确定节点a对应的第四特征集合中的目标域节点特征与节点A、节点B、节点C、节点D以及节点E分别对应的第三特征集合中的源节点特征之间的5个绝对相似度,然后对这5个绝对相似度求平均,得到节点a对应的第二平均相似度。同理再得到目标域图中的节点b、节点c、节点d、节点e各自对应的第二平均相似度。
S360,基于第一平均相似度、第二平均相似度,以及绝对相似度,得到每个源域节点特征与每个目标域节点特征之间的去中心相似度。
在一些实施方式中,源域图中的某个节点特征与目标域图中的某个节点特征之间的去中心相似度可以基于该源域节点特征的第一平均相似度、该目标域节点特征第二平均相似度,以及该源域节点特征与该目标域节点特征之间的绝对相似度共同得到。
第三特征集合中的源域节点特征与第四特征集合中的目标域节点特征之间的去中心相似度用以下公式表示:
在另一些实施方式中,可以进一步考虑到去中心相似度的影响程度,避免过度去中心化,从而导致源域节点与目标域节点之间原本的相对位置信息被遗漏,因此,可以加入一个去中心影响系数,通过去中心影响系数来调节去中心相似度的影响程度。这种情况下,基于第一平均相似度、第二平均相似度,以及绝对相似度,得到每个源域节点特征与每个目标域节点特征之间的去中心相似度,包括:基于第一平均相似度、第二平均相似度、去中心影响系数以及绝对相似度,得到每个源域节点特征与每个目标域节点特征之间的去中心相似度。
此时,第三特征集合中的源域节点特征与第四特征集合中的目标域节点特征之间的去中心相似度用以下公式表示:
S370,基于每个源域节点特征对应的去中心相似度最大的目标域节点特征,得到相互对齐的源域节点以及目标域节点。
在得到每个源域节点特征与每个目标域节点特征之间的去中心相似度之后,便可以基于每个源域节点特征对应的去中心相似度最大的目标域节点特征,得到相互对齐的源域节点以及目标域节点。
本申请提供的一种图对齐方法,在图对齐过程中引入去中心相似度,可以平衡高低密度区域节点之间的相似度,鼓励低密度区域的节点更容易被作为对齐对象,以此来弱化中心点问题的影响,从而进一步提高图对齐效果。
下面再结合图6对本申请实施例提供的图对齐方法在信息挖掘以及信息推荐场景中的应用作进一步详细介绍。
随着社交网络的繁荣,人们不只局限于使用一个社交网络,而是会同时使用多个社交网络以享受更多的应用。然而单一的社交网络往往不能反映用户的所有信息,这就需要将不同的网络进行对齐之后,在不同的社交网络中共同挖掘用户的信息,以便于后续向用户准确推荐感兴趣的内容。
如图6所示,在一个应用于服务器的示例性场景中,不同的社交网络可以是A平台以及B平台,对于某个用户而言,使用A平台或者B平台的侧重点不同,可能B平台更多的是用于工作,A平台更多的是用于生活,因此,从B平台中更多的挖掘的是与用户工作相关的信息,而从A平台中更多的是挖掘与用户生活相关的信息,因此,服务器为了更好地挖掘用户信息,并向用户准确推荐信息,首先可以获取A平台中的用户以及用户之间的关联关系构建的源域图,以及获取B平台中的用户以及用户之间的关联关系构建的目标域图,从而根据源域图以及目标域图,得到相互对齐的源域节点以及目标域节点,然后便可以从A平台以及B平台中获取相互对齐的源域节点以及目标域节点的信息,即获取到某个用户的较为全面的信息,进而便可以根据该用户较为全面的信息,在用户在使用A平台的客户端或者B平台的客户端的时候向用户准确推荐。
需要说明的是,本申请提供以上一些具体可实施方式的示例,在互不抵触的前提下,各个实施例示例之间可任意组合,以形成新一种业务定时处理方法。应当理解的,对于由任意示例所组合形成的新一种业务定时处理方法,均应落入本申请的保护范围。
请参阅图7,图7示出了本申请一实施例提出的一种图对齐装置400的框图,该装置400包括:获取模块410、特征提取模块420、特征传递模块430以及对齐模块440。
获取模块410,用于获取源域图以及目标域图,源域图包括多个源域节点,目标域图包括多个目标域节点。
特征提取模块420,用于提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间。
特征传递模块430,用于基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合。
对齐模块440,用于基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点
作为一种实施方式,对齐模块440,用于获取第三特征集合中每个源域节点特征与第四特征集合中每个目标域节点特征之间的绝对相似度;基于每个源域节点特征对应的绝对相似度最大的目标域节点特征,得到相互对齐的源域节点以及目标域节点。
作为一种实施方式,对齐模块440,用于获取第三特征集合中每个源域节点特征与第四特征集合中每个目标域节点特征之间的去中心相似度;基于每个源域节点特征对应的去中心相似度最大的目标域节点特征,得到相互对齐的源域节点以及目标域节点。
作为一种实施方式,对齐模块440,用于获取第三特征集合中每个源域节点特征与第四特征集合中每个目标域节点特征之间的绝对相似度;获取第三特征集合中每个源域节点特征对应的第一平均相似度,获取第四特征集合中每个目标域节点特征对应的第二平均相似度,源域节点特征对应的第一平均相似度为源域节点特征与每个目标域节点特征之间的绝对相似度的平均值,目标域节点特征对应的第二平均相似度为目标域节点特征与每个源域节点特征之间的绝对相似度的平均值;基于第一平均相似度、第二平均相似度,以及绝对相似度,得到每个源域节点特征与每个目标域节点特征之间的去中心相似度。
作为一种实施方式,对齐模块440,用于基于第一平均相似度、第二平均相似度、去中心影响系数以及绝对相似度,得到每个源域节点特征与每个目标域节点特征之间的去中心相似度。
作为一种实施方式,源域节点与目标域节点之间的绝对相似度为源域节点与目标域节点之间的欧氏距离。
作为一种实施方式,特征提取模块420,用于基于具有相同参数的图嵌入规则,提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间。
作为一种实施方式,特征传递模块430,用于基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,得到关联性矩阵;基于关联性矩阵以及图嵌入规则,得到特征传递规则;基于特征传递规则,对第一特征集合以及第二特征集合分别进行特征传递处理,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合。
作为一种实施方式,请参考图8,该装置400还包括:监督学习模块450以及无监督学习模块460。
监督学习模块450,用于在获取到具有节点对应关系的源域图以及目标域图的情况下,基于具有节点对应关系的源域图以及目标域图进行监督学习,得到图嵌入规则、关联性矩阵以及特征传递规则,其中,在监督学习中,基于图对齐结果以及源域图以及目标域图之间的节点对应关系构造损失函数。
无监督学习模块460,用于在获取到不具有节点对应关系的源域图以及目标域图的情况下,基于不具有节点对应关系的源域图以及目标域图进行无监督学习,得到图嵌入规则、关联性矩阵以及特征传递规则,其中,在无监督学习中,基于图对齐结果中相互对齐的源域节点以及目标域节点构造损失函数。
本申请提供的一种图对齐装置,通过提取源域图中的每个源域节点的源域节点特征,以及提取目标域图中的每个目标域节点的目标域节点特征的过程,使得在进行图对齐时能够考虑图自身结构信息,又通过基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,进行特征传递的过程,使得在进行图对齐时还能够考虑到图间关联性,使得两个不同的图不再是完全独立的,实现不同图间信息传递和信息聚合,学习和弱化图间差异性,进而提高图对齐效果。
需要说明的是,本申请中装置实施例与前述方法实施例是相互对应的,装置实施例中具体的原理可以参见前述方法实施例中的内容,此处不再赘述。
下面将结合图9对本申请提供的一种电子设备进行说明。
请参阅图9,基于上述的图对齐方法,本申请实施例还提供的另一种包括可以执行前述图对齐方法的处理器104的电子设备200,该电子设备200可以为智能手机、平板电脑、计算机或者便携式计算机等设备。电子设备200还包括存储器104、网络模块106以及屏幕108。其中,该存储器104中存储有可以执行前述实施例中内容的程序,而处理器102可以执行该存储器104中存储的程序。
其中,处理器102可以包括一个或者多个用于处理数据的核以及消息矩阵单元。处理器102利用各种接口和线路连接整个电子设备200内的各个部分,通过运行或执行存储在存储器104内的指令、程序、代码集或指令集,以及调用存储在存储器104内的数据,执行电子设备200的各种功能和处理数据。可选地,处理器102可以采用数字信号处理(DigitalSignal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器102可集成中央处理器(Central Processing Unit,CPU)、图像处理器(GraphicsProcessing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器102中,单独通过一块通信芯片进行实现。
存储器104可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器104可用于存储指令、程序、代码、代码集或指令集。存储器104可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
网络模块106用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯,例如和音频播放设备进行通讯。网络模块106可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。网络模块106可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。例如,网络模块106可以与基站进行信息交互。
屏幕108可以进行界面内容的显示,也可以用于响应触控手势。
需要说明的是,为了实现更多的功能,电子设备200还可以保护更多的器件,例如,还可以保护用于进行人脸信息采集的结构光传感器或者还可以保护用于采集虹膜的摄像头等。
请参考图10,其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质1100中存储有程序代码,程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质1100可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质1100包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质1100具有执行上述方法中的任何方法步骤的程序代码1110的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码1110可以例如以适当形式进行压缩。
基于上述的图对齐方法,根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的各种可选实现方式中提供的方法。
综上,本申请实施例提供的一种图对齐方法、装置、电子设备、存储介质及计算机程序产品或计算机程序,在获取源域图以及目标域图之后,提取源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,第一特征集合以及第二特征集合位于同一向量空间,然后基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,对第一特征集合以及第二特征集合分别进行特征传递,得到第一特征集合对应的第三特征集合以及第二特征集合对应的第四特征集合,最后基于对齐规则对第三特征集合以及第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。从而通过前述提取源域图中的每个源域节点的源域节点特征,以及提取目标域图中的每个目标域节点的目标域节点特征的过程,使得在进行图对齐时能够考虑图自身结构信息,又通过前述基于同一向量空间中的源域节点特征与目标域节点特征之间的关联性,进行特征传递的过程,使得在进行图对齐时还能够考虑到图间关联性,使得两个不同的图不再是完全独立的,实现不同图间信息传递和信息聚合,学习和弱化图间差异性,进而提高图对齐效果。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (12)
1.一种图对齐方法,其特征在于,包括:
获取源域图以及目标域图,所述源域图包括多个源域节点,所述目标域图包括多个目标域节点;
提取所述源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取所述目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,所述第一特征集合以及所述第二特征集合位于同一向量空间;
基于同一向量空间中的所述源域节点特征与所述目标域节点特征之间的关联性,对所述第一特征集合以及所述第二特征集合分别进行特征传递,得到所述第一特征集合对应的第三特征集合以及所述第二特征集合对应的第四特征集合;
基于对齐规则对所述第三特征集合以及所述第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。
2.根据权利要求1所述的方法,其特征在于,基于对齐规则对所述第三特征集合以及所述第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点,包括:
获取所述第三特征集合中每个源域节点特征与所述第四特征集合中每个目标域节点特征之间的绝对相似度;
基于每个源域节点特征对应的绝对相似度最大的目标域节点特征,得到相互对齐的源域节点以及目标域节点。
3.根据权利要求1所述的方法,其特征在于,所述基于对齐规则对所述第三特征集合以及所述第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点,包括:
获取所述第三特征集合中每个源域节点特征与所述第四特征集合中每个目标域节点特征之间的去中心相似度;
基于每个源域节点特征对应的去中心相似度最大的目标域节点特征,得到相互对齐的源域节点以及目标域节点。
4.根据权利要求3所述的方法,其特征在于,所述获取第三特征集合中每个源域节点特征与第四特征集合中每个目标域节点特征之间的去中心相似度,包括:
获取所述第三特征集合中每个源域节点特征与所述第四特征集合中每个目标域节点特征之间的绝对相似度;
获取所述第三特征集合中每个源域节点特征对应的第一平均相似度,获取所述第四特征集合中每个目标域节点特征对应的第二平均相似度,所述源域节点特征对应的第一平均相似度为所述源域节点特征与所述每个目标域节点特征之间的绝对相似度的平均值,所述目标域节点特征对应的第二平均相似度为所述目标域节点特征与所述每个源域节点特征之间的绝对相似度的平均值;
基于所述第一平均相似度、所述第二平均相似度,以及所述绝对相似度,得到每个源域节点特征与每个目标域节点特征之间的去中心相似度。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一平均相似度、所述第二平均相似度,以及所述绝对相似度,得到每个源域节点特征与每个目标域节点特征之间的去中心相似度,包括:
基于所述第一平均相似度、所述第二平均相似度、去中心影响系数以及所述绝对相似度,得到每个源域节点特征与每个目标域节点特征之间的去中心相似度。
6.根据权利要求4所述的方法,其特征在于,所述源域节点与所述目标域节点之间的绝对相似度为所述源域节点与所述目标域节点之间的欧氏距离。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述提取所述源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取所述目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,包括:
基于具有相同参数的图嵌入规则,提取所述源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取所述目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,所述第一特征集合以及所述第二特征集合位于同一向量空间。
8.根据权利要求7所述的方法,其特征在于,所述基于同一向量空间中的所述源域节点特征与所述目标域节点特征之间的关联性,对所述第一特征集合以及所述第二特征集合分别进行特征传递,得到所述第一特征集合对应的第三特征集合以及所述第二特征集合对应的第四特征集合,包括:
基于同一向量空间中的源域节点特征与所述目标域节点特征之间的关联性,得到关联性矩阵;
基于所述关联性矩阵以及图嵌入规则,得到特征传递规则;
基于所述特征传递规则,对所述第一特征集合以及所述第二特征集合分别进行特征传递处理,得到所述第一特征集合对应的第三特征集合以及所述第二特征集合对应的第四特征集合。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在获取到具有节点对应关系的源域图以及目标域图的情况下,基于所述具有节点对应关系的源域图以及目标域图进行监督学习,得到所述图嵌入规则、关联性矩阵以及特征传递规则,其中,在所述监督学习中,基于图对齐结果以及源域图以及目标域图之间的节点对应关系构造损失函数;或者
在获取到不具有节点对应关系的源域图以及目标域图的情况下,基于不具有节点对应关系的源域图以及目标域图进行无监督学习,得到所述图嵌入规则、关联性矩阵以及特征传递规则,其中,在所述无监督学习中,基于图对齐结果中相互对齐的源域节点以及目标域节点构造损失函数。
10.一种图对齐装置,其特征在于,所述装置包括:
获取模块,用于获取源域图以及目标域图,所述源域图包括多个源域节点,所述目标域图包括多个目标域节点;
特征提取模块,用于提取所述源域图中的每个源域节点的源域节点特征,得到第一特征集合,以及提取所述目标域图中的每个目标域节点的目标域节点特征,得到第二特征集合,所述第一特征集合以及所述第二特征集合位于同一向量空间;
特征传递模块,用于基于同一向量空间中的所述源域节点特征与所述目标域节点特征之间的关联性,对所述第一特征集合以及所述第二特征集合分别进行特征传递,得到所述第一特征集合对应的第三特征集合以及所述第二特征集合对应的第四特征集合;
对齐模块,用于基于对齐规则对所述第三特征集合以及所述第四特征集合进行对齐处理,得到相互对齐的源域节点以及目标域节点。
11.一种电子设备,其特征在于,包括处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述处理器执行以实现权利要求1-9任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行权利要求1-9任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110287585.XA CN112667864B (zh) | 2021-03-17 | 2021-03-17 | 图对齐方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110287585.XA CN112667864B (zh) | 2021-03-17 | 2021-03-17 | 图对齐方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112667864A true CN112667864A (zh) | 2021-04-16 |
CN112667864B CN112667864B (zh) | 2021-06-22 |
Family
ID=75399386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110287585.XA Active CN112667864B (zh) | 2021-03-17 | 2021-03-17 | 图对齐方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112667864B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113887544A (zh) * | 2021-12-07 | 2022-01-04 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636658A (zh) * | 2019-01-17 | 2019-04-16 | 电子科技大学 | 一种基于图卷积的社交网络对齐方法 |
CN110347932A (zh) * | 2019-06-04 | 2019-10-18 | 中国科学院信息工程研究所 | 一种基于深度学习的跨网络用户对齐方法 |
CN110442758A (zh) * | 2019-07-23 | 2019-11-12 | 腾讯科技(深圳)有限公司 | 一种图对齐方法、装置和存储介质 |
CN111159426A (zh) * | 2019-12-30 | 2020-05-15 | 武汉理工大学 | 一种基于图卷积神经网络的产业图谱融合方法 |
CN111611785A (zh) * | 2020-04-30 | 2020-09-01 | 北京理工大学 | 一种生成式对抗网络嵌入式表示学习方法 |
CN111931505A (zh) * | 2020-05-22 | 2020-11-13 | 北京理工大学 | 一种基于子图嵌入的跨语言实体对齐方法 |
-
2021
- 2021-03-17 CN CN202110287585.XA patent/CN112667864B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636658A (zh) * | 2019-01-17 | 2019-04-16 | 电子科技大学 | 一种基于图卷积的社交网络对齐方法 |
CN110347932A (zh) * | 2019-06-04 | 2019-10-18 | 中国科学院信息工程研究所 | 一种基于深度学习的跨网络用户对齐方法 |
CN110442758A (zh) * | 2019-07-23 | 2019-11-12 | 腾讯科技(深圳)有限公司 | 一种图对齐方法、装置和存储介质 |
CN111159426A (zh) * | 2019-12-30 | 2020-05-15 | 武汉理工大学 | 一种基于图卷积神经网络的产业图谱融合方法 |
CN111611785A (zh) * | 2020-04-30 | 2020-09-01 | 北京理工大学 | 一种生成式对抗网络嵌入式表示学习方法 |
CN111931505A (zh) * | 2020-05-22 | 2020-11-13 | 北京理工大学 | 一种基于子图嵌入的跨语言实体对齐方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113887544A (zh) * | 2021-12-07 | 2022-01-04 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN113887544B (zh) * | 2021-12-07 | 2022-02-15 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112667864B (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110990631A (zh) | 视频筛选方法、装置、电子设备和存储介质 | |
CN114331829A (zh) | 一种对抗样本生成方法、装置、设备以及可读存储介质 | |
CN113011387B (zh) | 网络训练及人脸活体检测方法、装置、设备及存储介质 | |
CN112396106A (zh) | 内容识别方法、内容识别模型训练方法及存储介质 | |
CN111652181B (zh) | 目标跟踪方法、装置及电子设备 | |
CN113688814B (zh) | 图像识别方法及装置 | |
CN112667864B (zh) | 图对齐方法、装置、电子设备及存储介质 | |
CN115114480A (zh) | 数据处理方法、装置、设备、可读存储介质及程序产品 | |
CN112700464B (zh) | 地图信息的处理方法、装置、电子设备以及存储介质 | |
CN112069412B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN111914809A (zh) | 目标对象定位方法、图像处理方法、装置和计算机设备 | |
CN115601283B (zh) | 图像增强方法、装置、计算机设备及计算机可读存储介质 | |
CN116958729A (zh) | 对象分类模型的训练、对象分类方法、装置及存储介质 | |
CN115272794A (zh) | 模型训练方法、计算机设备及存储介质 | |
CN114819138A (zh) | 图数据处理方法、装置、电子设备及存储介质 | |
CN116883708A (zh) | 图像分类方法、装置、电子设备及存储介质 | |
CN113010772A (zh) | 一种数据处理方法、相关设备及计算机可读存储介质 | |
CN112308093A (zh) | 基于图像识别的空气质量感知方法、模型训练方法及系统 | |
CN117152567B (zh) | 特征提取网络的训练方法、分类方法、装置及电子设备 | |
CN116798052B (zh) | 文本识别模型的训练方法和装置、存储介质及电子设备 | |
CN113569887B (zh) | 图片识别模型训练和图片识别方法、装置和存储介质 | |
CN117475340A (zh) | 视频数据处理方法、装置、计算机设备和存储介质 | |
CN116665157B (zh) | 道路图像处理方法、装置、计算机设备和存储介质 | |
WO2022262603A1 (zh) | 多媒体资源的推荐方法、装置、设备、存储介质及计算机程序产品 | |
CN115130539A (zh) | 分类模型训练、数据分类方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40042036 Country of ref document: HK |