CN112232492B - 一种基于解耦的异质网络嵌入方法、装置及电子设备 - Google Patents

一种基于解耦的异质网络嵌入方法、装置及电子设备 Download PDF

Info

Publication number
CN112232492B
CN112232492B CN202011193283.8A CN202011193283A CN112232492B CN 112232492 B CN112232492 B CN 112232492B CN 202011193283 A CN202011193283 A CN 202011193283A CN 112232492 B CN112232492 B CN 112232492B
Authority
CN
China
Prior art keywords
meta
vectors
path
loss function
embedded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011193283.8A
Other languages
English (en)
Other versions
CN112232492A (zh
Inventor
石川
王啸
王睿嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202011193283.8A priority Critical patent/CN112232492B/zh
Publication of CN112232492A publication Critical patent/CN112232492A/zh
Application granted granted Critical
Publication of CN112232492B publication Critical patent/CN112232492B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明实施例提供了一种基于解耦的异质网络嵌入方法、装置及电子设备,该方法包括:将从待处理异质网络获取的不同元路径下的嵌入向量输入至编码层,获得待定的共有特征向量,并基于元路径鉴别网络模型,得到该待定的共有特征向量的损失函数值;将从嵌入向量查找层获取的待定的特有特征向量与待定的共有特征向量进行合成,并基于语义鉴别网络模型,得到合成嵌入向量的损失函数值;在两个损失函数值小于或等于预设损失函数阈值时;输出该待定的共有特征向量与待定的特有特征向量,否则,调整编码层、嵌入向量查找层和生成层的参数,并重复执行将多组嵌入向量输入至编码层的步骤。从而实现在不选择元路径的前提下,保证异质网络的低维向量的准确度。

Description

一种基于解耦的异质网络嵌入方法、装置及电子设备
技术领域
本发明涉及信息处理技术领域,特别是涉及一种基于解耦的异质网络嵌入方法、装置及电子设备。
背景技术
包含多种类型节点和链接的异质网络在现实世界中无处不在,例如生物网络、文献网络和社交网络等。基于异质网络可以对实际场景中复杂的交互关系和丰富的语义信息进行建模,因此,异质网络分析已经成为数据挖掘的研究热点之一。而随着网络嵌入的兴起,许多工作转向异质网络嵌入的研究,其目的是得到节点低维向量的同时保留不同类型节点间的语义和结构关系。通过异质网络嵌入得到的低维向量,可以解决实际应用中的许多基本问题,如节点分类、链接预测和推荐等。
通常在异质网络中,包括多种类型的节点和边,其中,节点的边表示节点之间的关系,例如,在图1所示的异质网络中,可以包括三种类型的节点:作者、论文和会议,还可以包括他们之间的关系,例如:作者与论文间的撰写/被撰写关系和论文和会议之间的发表/被发表关系等。
为了能够通过异质网络嵌入得到异质网络的低维向量,最主要的一类方法是基于元路径的异质网络嵌入方法,具体的,可以先利用元路径来描述异质网络中节点间的结构和语义联系,然后基于元路径进行随机游走提取节点序列,并通过优化模型得到每条元路径的嵌入向量,再将多条元路径下的嵌入向量通过融合得到异质网络的低维向量。
然而,申请人发现,如果想要基于元路径的异质网络嵌入方法来得到准确度较高的低维向量,就必须先选择元路径。否则得到的异质网络的低维向量的准确度往往比较低。
发明内容
本发明实施例的目的在于提供一种基于解耦的异质网络嵌入方法、装置及电子设备,以实现在不选择元路径的前提下,保证异质网络的低维向量的准确度。具体技术方案如下:
第一方面,本发明实施例提供了一种基于解耦的异质网络嵌入方法,该方法包括:
获取待处理异质网络的多组嵌入向量,其中,待处理异质网络中的每条元路径具有一组嵌入向量,每组嵌入向量包括对应的元路径中的所有节点的节点嵌入向量;
将多组嵌入向量输入至编码层,获得多组待定的共有特征向量,其中,编码层为初始化后的编码层或调整参数后的编码层;共有特征向量用于表征待处理异质网络的所有元路径共有的属性信息,每组共有特征向量对应一条元路径;
将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;
获取嵌入向量查找层输出的多组待定的特有特征向量,其中,嵌入向量查找层为初始化后的嵌入向量查找层或调整参数后的嵌入向量查找层;每组特有特征向量对应一条元路径,特有特征向量用于表征每条元路径特有的属性信息;
将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,其中,生成层为初始化后的生成层或调整参数后的生成层;多组合成嵌入向量中的任一合成嵌入向量与多组嵌入向量的任一嵌入向量不同;
将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值;
判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值;
如果是,将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;
否则,基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,并重复执行将多组嵌入向量输入至编码层,获得多组待定的共有特征向量的步骤。
可选的,获取待处理异质网络的多组嵌入向量,包括:
将待处理异质网络的每条元路径输入至预设节点嵌入网络模型,获得预设节点嵌入网络模型输出的多组嵌入向量。
可选的,获取嵌入向量查找层输出的多组待定的特有特征向量,包括:
获取待处理异质网络的每条元路径的标识信息,将每条元路径的标识信息输入至嵌入向量查找层,以使得嵌入向量查找层查找预先生成的与每条元路径的标识信息对应的一组待定的特有特征向量,并输出查找出的与每条元路径对应的一组待定的特有特征向量,其中,嵌入向量查找层在每次调整参数后,会生成与每条元路径对应的待定的特有特征向量。
可选的,将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,包括:
针对每条元路径,将该元路径的一组待定的共有特征向量和待处理异质网络中除该元路径外的其他元路径的待定的特有特征向量合成,得到多组合成嵌入向量。
可选的,语义鉴别网络模型包括真伪分类网络子模型和语义分类网络子模型;
将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值,包括:
将多组合成嵌入向量分别输入至真伪分类网络子模型和语义分类网络子模型,得到真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值;
相应的,基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,包括:
基于元路径鉴别网络模型对应的损失函数值调整编码层的参数;基于真伪分类网络子模型对应的损失函数值调整生成层的参数;基于语义鉴别网络模型对应的损失函数值调整嵌入向量查找层的参数。
第二方面,本发明实施例还提供了一种基于解耦的异质网络嵌入装置,该装置包括:
嵌入向量获取模块,用于获取待处理异质网络的多组嵌入向量,其中,待处理异质网络中的每条元路径具有一组嵌入向量,每组嵌入向量包括对应的元路径中的所有节点的节点嵌入向量;
共有特征向量获得模块,用于将多组嵌入向量输入至编码层,获得多组待定的共有特征向量,其中,编码层为初始化后的编码层或调整参数后的编码层;共有特征向量用于表征待处理异质网络的所有元路径共有的属性信息,每组共有特征向量对应一条元路径;
第一损失函数值获得模块,用于将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;
特有特征向量获得模块,用于获取嵌入向量查找层输出的多组待定的特有特征向量,其中,嵌入向量查找层为初始化后的嵌入向量查找层或调整参数后的嵌入向量查找层;每组特有特征向量对应一条元路径,特有特征向量用于表征每条元路径特有的属性信息;
合成模块,用于将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,其中,生成层为初始化后的生成层或调整参数后的生成层;多组合成嵌入向量中的任一合成嵌入向量与多组嵌入向量的任一嵌入向量不同;
第二损失函数值获得模块,用于将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值;
判断模块,用于判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值;如果是,触发输出模块,如果否,触发调整模块;
输出模块,用于将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;
调整模块,用于基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,并触发共有特征向量获得模块。
可选的,嵌入向量获取模块,具体用于:
将待处理异质网络的每条元路径输入至预设节点嵌入网络模型,获得预设节点嵌入网络模型输出的多组嵌入向量。
可选的,特有特征向量获得模块,具体用于:
获取待处理异质网络的每条元路径的标识信息,将每条元路径的标识信息输入至嵌入向量查找层,以使得嵌入向量查找层查找预先生成的与每条元路径的标识信息对应的一组待定的特有特征向量,并输出查找出的与每条元路径对应的一组待定的特有特征向量,其中,嵌入向量查找层在每次调整参数后,会生成与每条元路径对应的待定的特有特征向量。
可选的,合成模块,具体用于:
针对每条元路径,将该元路径的一组待定的共有特征向量和待处理异质网络中除该元路径外的其他元路径的待定的特有特征向量合成,得到多组合成嵌入向量。
可选的,语义鉴别网络模型包括真伪分类网络子模型和语义分类网络子模型;
第二损失函数值获得模块,具体用于:
将多组合成嵌入向量分别输入至真伪分类网络子模型和语义分类网络子模型,得到真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值;
相应的,调整模块,具体用于:
基于元路径鉴别网络模型对应的损失函数值调整编码层的参数;基于真伪分类网络子模型对应的损失函数值调整生成层的参数;基于语义鉴别网络模型对应的损失函数值调整嵌入向量查找层的参数。
第三方面,本发明实施例还提供了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一基于解耦的异质网络嵌入方法的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一基于解耦的异质网络嵌入方法的步骤。
第五方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一基于解耦的异质网络嵌入方法。
本发明实施例有益效果:
本发明实施例提供的一种基于解耦的异质网络嵌入方法、装置及电子设备,可以先获取待处理异质网络的多组嵌入向量,然后将该多组嵌入向量输入至编码层,获得多组待定的共有特征向量,并将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;再获取嵌入向量查找层输出的多组待定的特有特征向量,并将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,进而可以将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值;最后判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值;如果是,则可以将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;否则,基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,并重复执行将多组嵌入向量输入至编码层,获得多组待定的共有特征向量的步骤。这样,可以在对待处理异质网络不进行元路径选择的前提下,对每条元路径的嵌入向量进行解耦,使得最终得到的共有特征向量能够更准确的表征所有元路径共有的属性信息,而每组特有特征向量能够更准确地表征该组特有特征向量对应的元路径特有的属性信息。进一步的,本发明通过使用元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,可以实现自监督学习,从而使得异质网络的低维向量的准确度更高。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中的异质网络示意图;
图2为本发明实施例的一种基于解耦的异质网络嵌入方法第一种实施方式的流程图;
图3为本发明实施例的一种基于解耦的异质网络嵌入方法第二种实施方式的流程图;
图4为本发明实施例的一种基于解耦的异质网络嵌入方法第三种实施方式的流程图;
图5为本发明实施例的一种基于解耦的异质网络嵌入模型的框架示意图;
图6a为本发明实施例的一种基于解耦的异质网络嵌入方法的解耦分析示意图;
图6b为本发明实施例的一种基于解耦的异质网络嵌入方法中元路径鉴别网络模型和语义分类网络子模型的损失值变化曲线图;
图6c为本发明实施例的一种基于解耦的异质网络嵌入方法中真伪分类网络子模型中真语义和伪语义的损失值变化曲线图;
图6d、图6e以及图6f为本发明实施例的一种基于解耦的异质网络嵌入方法中包含不同元路径的性能对比柱状图;
图7为本发明实施例的一种基于解耦的异质网络嵌入装置的结构示意图;
图8为本发明实施例的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在现有技术中,为了提高异质网络的低维向量的准确度,通常需要先进行元路径选择,然而,元路径选择在很大程度上依赖于选择元路径的研究人员的领域知识。如果研究人员对异质网络熟悉,则可以选择出合适的元路径,从而可以使得异质网络的低维向量具有较高的准确度,但是,如果研究人员对异质网络不熟悉,或者异质网络过于复杂,则很难选择合适的元路径,从而使得异质网络的低维向量的准确度较低,另外,在现有技术中,一些研究人员尝试为元路径学习权重,从而加权融合元路径信息,但这通常需要昂贵的监督信息,增加了异质网络嵌入的成本。
为此,本发明实施例提供了一种基于解耦的异质网络嵌入方法、装置及电子设备,以实现在不选择元路径的前提下,保证异质网络的低维向量的准确度。
下面,首先对本发明实施例的一种基于解耦的异质网络嵌入方法进行介绍,如图2所示,为本发明实施例的一种基于解耦的异质网络嵌入方法第一种实施方式的流程图,该方法可以包括:
S201,获取待处理异质网络的多组嵌入向量,其中,待处理异质网络中的每条元路径具有一组嵌入向量,每组嵌入向量包括对应的元路径中的所有节点的节点嵌入向量;
S202,将多组嵌入向量输入至编码层,获得多组待定的共有特征向量,其中,编码层为初始化后的编码层或调整参数后的编码层;共有特征向量用于表征待处理异质网络的所有元路径共有的属性信息,每组共有特征向量对应一条元路径;
S203,将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;
S204,获取嵌入向量查找层输出的多组待定的特有特征向量,其中,嵌入向量查找层为初始化后的嵌入向量查找层或调整参数后的嵌入向量查找层;每组特有特征向量对应一条元路径,特有特征向量用于表征每条元路径特有的属性信息;
S205,将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,其中,生成层为初始化后的生成层或调整参数后的生成层;多组合成嵌入向量中的任一合成嵌入向量与多组嵌入向量的任一嵌入向量不同;
S206,将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值;
S207,判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值;如果是,则执行步骤S208,否则执行步骤S209;
S208,将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;
S209,基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,并重复执行步骤S202。
本发明实施例提供的一种基于解耦的异质网络嵌入方法,可以先获取待处理异质网络的多组嵌入向量,然后将该多组嵌入向量输入至编码层,获得多组待定的共有特征向量,并将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;再获取嵌入向量查找层输出的多组待定的特有特征向量,并将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,进而可以将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值;最后判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值;如果是,则可以将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;否则,基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,并重复执行将多组嵌入向量输入至编码层,获得多组待定的共有特征向量的步骤。这样,可以在对待处理异质网络不进行元路径选择的前提下,对每条元路径的嵌入向量进行解耦,使得最终得到的共有特征向量能够更准确的表征所有元路径共有的属性信息,而每组特有特征向量能够更准确地表征该组特有特征向量对应的元路径特有的属性信息。进一步的,本发明通过使用元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,可以实现自监督学习,从而使得异质网络的低维向量的准确度更高。
在图2所示的一种基于解耦的异质网络嵌入方法的基础上,本发明实施例还提供了一种可能的实现方式,如图3所示,为本发明实施例的一种基于解耦的异质网络嵌入方法第二种实施方式的流程图,该方法可以包括:
S301,将待处理异质网络的每条元路径输入至预设节点嵌入网络模型,获得预设节点嵌入网络模型输出的多组嵌入向量,其中,待处理异质网络中的每条元路径具有一组嵌入向量,每组嵌入向量包括对应的元路径中的所有节点的节点嵌入向量;
在一些示例中,为了得到待处理异质网络的低维向量,并且,使得该低维向量更加准确,可以先将待处理异质网络的每条元路径输入至预设节点嵌入网络模型,获得预设节点嵌入网络模型输出的多组嵌入向量。
在一些示例中,该预设节点嵌入网络模型可以是现有技术中的网络模型,例如可以是HIN2vec网络模型或者HERec(Heterogeneous Information Network Embedding forRecommendation,面向推荐的异质信息网络嵌入)网络模型。
通过本步骤,可以加快后续输出共有特征向量和特有特征向量的速度,减少时间开支,并且,可以在后续调整参数时,避免参数陷入局部最优解,并且,可以使得后续步骤可以成为增强现有技术中的异质网络嵌入方法的一种途径。
S302,将多组嵌入向量输入至编码层,获得多组待定的共有特征向量,其中,编码层为初始化后的编码层或调整参数后的编码层;共有特征向量用于表征待处理异质网络的所有元路径共有的属性信息,每组共有特征向量对应一条元路径;
S303,将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;
在得到多组嵌入向量后,可以将该多组嵌入向量输入至编码层中,该编码层可以基于该多组嵌入向量,输出每组嵌入向量对应的共有特征向量。其中,该共有属性信息表示待处理异质网络中节点的本质属性信息。例如,对于表示作者的节点而言,其本质属性信息是该作者的研究领域。
在一些示例中,该编码层为多层感知机。该多层感知机的任意相邻的两层之间是全连接的。
在又一些示例中,当该编码层为初始化后的编码层时,该初始化后的编码层的参数可以是预先人工设置的参数。
在一些示例中,在得到多组待定的共有特征向量后,为了确定该多组待定的共有特征向量是否为该待处理异质网络的共有特征向量,可以将该多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型输出的表示元路径种类的概率,然后基于该表示元路径种类的概率,得到该元路径鉴别网络模型对应的损失函数值。
在又一些示例中,该元路径鉴别网络模型可以包括两个元路径分类网络子模型,该两个元路径分类网络子模型也可以是多层感知机。该两个元路径分类子模型的层数与编码层的层数可以相同也可以不同。
S304,获取待处理异质网络的每条元路径的标识信息,将每条元路径的标识信息输入至嵌入向量查找层,以使得嵌入向量查找层查找预先生成的与每条元路径的标识信息对应的一组待定的特有特征向量,并输出查找出的与每条元路径对应的一组待定的特有特征向量,其中,嵌入向量查找层在每次调整参数后,会生成与每条元路径对应的待定的特有特征向量,嵌入向量查找层为初始化后的嵌入向量查找层或调整参数后的嵌入向量查找层;每组特有特征向量对应一条元路径,特有特征向量用于表征每条元路径特有的属性信息。
在一些示例中,该嵌入向量查找层可以是神经网络模型,也可以是包含多组特有特征向量的向量集合。
在一些示例中,当该嵌入向量查找层为初始化后的嵌入向量查找层时,该嵌入向量查找层可以是预先设置有初始化参数的神经网络模型,可以是包含多组预先设置的待调整的特有特征向量的向量集合。
在又一些示例中,当该嵌入向量查找层为调整参数后的嵌入向量查找层时,该嵌入向量查找层可以是调整参数后的神经网络模型,也可以是调整每组特有特征向量中的元素后的向量集合。
在一种可选择的实施方式中,在该嵌入向量查找层是调整参数后的神经网络模型时,该调整参数后的神经网络模型可以生成与每条元路径的标识信息对应的一组待定的特有特征向量。
在另一种可选择的实施方式中,在该嵌入向量查找层是包含多组预先设置的待调整的特有特征向量的向量集合时,当对每条元路径的标识信息对应的一组预先设置的待调整的特有特征向量中的元素进行调整后,即可生成一组与该元路径的标识信息对应的待定的特有特征向量。
因此,在将每条元路径的标识信息输入至嵌入向量查找层后,该嵌入向量查找层可以查找出预先生成的与每条元路径的标识信息对应的一组待定的特有特征向量,并输出。
在一些示例中,上述的特有属性信息指待处理异质网络中元路径的特有信息。例如,对于APA(作者-论文-作者)元路径而言,其特有属性信息是共同作者关系。
S305,将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,其中,生成层为初始化后的生成层或调整参数后的生成层;多组合成嵌入向量中的任一合成嵌入向量与多组嵌入向量的任一嵌入向量不同;
S306,将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值;
在得到多组待定的共有特征向量与多组待定的特有特征向量后,可以将该多组待定的共有特征向量与多组待定的特有特征向量输入至生成层,该生成层可以对该多组待定的共有特征向量与多组待定的特有特征向量进行合成,从而可以得到多组合成嵌入向量。
在一些示例中,在对该多组待定的共有特征向量与多组待定的特有特征向量进行合成时,可以针对每条元路径,将该元路径的一组待定的共有特征向量和待处理异质网络中除该元路径外的其他元路径的待定的特有特征向量合成,从而得到多组合成嵌入向量。
可以理解的是,在对共有特征向量和特有特征向量进行合成时,可以将该共有特征向量与特有特征向量按列进行合成,也即合成嵌入向量的列数等于共有特征向量的列数和特有特征向量的列数的总和。
在又一些示例中,该生成层也可以是多层感知机,其中,该生成层的层数与上述的编码层的层数可以相同也可以不同。
在得到多组合成向量后,可以将该多组合成向量输入到语义鉴别网络模型中,该语义鉴别网络可以对该多组合成向量进行语义鉴别,得到该多组合成向量属于真实语义的概率以及该多组嵌入向量对应的元路径的预测种类属于真实种类的概率,然后可以基于该表示真实语义的概率以及该多组嵌入向量对应的元路径的预测种类属于真实种类的概率,得到该语义鉴别网络模型对应的损失函数值。
在又一些示例中,该语义鉴别网络模型也可以是多层感知机,其中,该语义鉴别网络模型的层数可以与元路径鉴别网络模型的层数相同,也可以不同。
S307,判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值;如果是,则执行步骤S308,否则执行步骤S309;
S308,将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;
S309,基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,并重复执行步骤S302。
在得到元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值后,为了确定编码层输出的多组待定的共有特征向量和嵌入向量查找层输出的多组待定的特有特征向量是否满足输出条件,可以判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值,如果是,则可以认为编码层输出的多组待定的共有特征向量和嵌入向量查找层输出的多组待定的特有特征向量满足输出条件,否则,认为不满足输出条件。
在一些示例中,在判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值时,可以将元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值相加,然后将相加后的损失函数值与预设损失函数阈值进行比较。也可以将元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值分别与预设损失函数值进行比较,这都是可以的。
在编码层输出的多组待定的共有特征向量和嵌入向量查找层输出的多组待定的特有特征向量满足输出条件时,可以将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量。
在编码层输出的多组待定的共有特征向量和嵌入向量查找层输出的多组待定的特有特征向量不满足输出条件时,则说明需要对编码层、嵌入向量查找层以及生成层的参数进行调整,则可以基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,然后重复执行步骤S302。
可以理解的是,本发明实施例中的步骤S303和S305~S309与第一种实施方式中的步骤S202和S205~S209相同或相似,这里不再赘述。
在一些示例中,语义鉴别网络模型包括真伪分类网络子模型和语义分类网络子模型;对此,在图3所示的一种基于解耦的异质网络嵌入方法的基础上,本发明实施例还提供了一种可能的实现方式,如图4所示,为本发明实施例的一种基于解耦的异质网络嵌入方法第二种实施方式的流程图,该方法可以包括:
S401,将待处理异质网络的每条元路径输入至预设节点嵌入网络模型,获得预设节点嵌入网络模型输出的多组嵌入向量,其中,待处理异质网络中的每条元路径具有一组嵌入向量,每组嵌入向量包括对应的元路径中的所有节点的节点嵌入向量;
S402,将多组嵌入向量输入至编码层,获得多组待定的共有特征向量,其中,编码层为初始化后的编码层或调整参数后的编码层;共有特征向量用于表征待处理异质网络的所有元路径共有的属性信息,每组共有特征向量对应一条元路径;
S403,将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;
S404,获取待处理异质网络的每条元路径的标识信息,将每条元路径的标识信息输入至嵌入向量查找层,以使得嵌入向量查找层查找预先生成的与每条元路径的标识信息对应的一组待定的特有特征向量,并输出查找出的与每条元路径对应的一组待定的特有特征向量,其中,嵌入向量查找层在每次调整参数后,会生成与每条元路径对应的待定的特有特征向量,嵌入向量查找层为初始化后的嵌入向量查找层或调整参数后的嵌入向量查找层;每组特有特征向量对应一条元路径,特有特征向量用于表征每条元路径特有的属性信息;
S405,针对每条元路径,将该元路径的一组待定的共有特征向量和待处理异质网络中除该元路径外的其他元路径的待定的特有特征向量合成,得到多组合成嵌入向量,其中,生成层为初始化后的生成层或调整参数后的生成层;多组合成嵌入向量中的任一合成嵌入向量与多组嵌入向量的任一嵌入向量不同;
S406,将多组合成嵌入向量分别输入至真伪分类网络子模型和语义分类网络子模型,得到真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值;
S407,判断元路径鉴别网络模型对应的损失函数值、真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值,是否小于或等于预设损失函数阈值;如果是,则执行步骤S408,否则执行步骤S409;
S408,将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;
S409,基于元路径鉴别网络模型对应的损失函数值调整编码层的参数;基于真伪分类网络子模型对应的损失函数值调整生成层的参数;基于语义鉴别网络模型对应的损失函数值调整嵌入向量查找层的参数。并重复执行步骤S402。
在一些示例中,为了使得得到的待处理异质网络的低维向量更准确,可以语义鉴别网络模型设置两个子网络模型,例如,包括真伪分类网络子模型和语义分类网络子模型;
在又一些示例中,该真伪分类网络子模型和语义分类网络子模型也可以是多层感知机;该真伪分类网络子模型和语义分类网络子模型的层数与元路径鉴别网络模型的层数可以是相同的,也可以是不同的,这里不进行限定。
在得到多组合成嵌入向量后,可以将该多组合成嵌入向量分别输入至真伪分类网络子模型和语义分类网络子模型,该真伪分类网络子模型可以输出该多组嵌入向量所表征的语义属于真实语义的概率,进而基于该多组嵌入向量所表征的语义属于真实语义的概率,来得到该多组嵌入向量的语义偏差的损失函数值,该真伪分类网络子模型对应的损失函数值可以反映出该多组合成嵌入向量所表征的语义与各个元路径所对应的真实语义之间的偏差。
该语义分类网络子模型可以输出该多组嵌入向量对应的元路径的预测种类属于真实种类的概率,然后可以基于该多组嵌入向量对应的元路径的预测种类属于真实种类的概率,得到该该多组嵌入向量对应的元路径的种类偏差的损失函数值,该语义分类网络子模型对应的损失函数值可以反映出该多组嵌入向量对应的元路径的预测种类与真实种类之间的偏差。
通过设置语义分类网络子模型,可以使得从合成嵌入向量中更准确的识别出特有特征向量,从而使得识别出的特有特征向量能够更准确的表征元路径的特有属性信息。
通过设置真伪分类网络子模型,可以使得每条元路径的合成嵌入向量的语义能够更接近该条元路径的真实语义,从而可以减少对共有特征向量的影响。
在得到真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值后,为了确定该多组待定的共有特征向量与多组待定的特有特征向量是否为该待处理异质网络的各个元路径对应的共有特征向量和特有特征向量。可以判断元路径鉴别网络模型对应的损失函数值、真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值,是否小于或等于预设损失函数阈值。
如果是,则可以将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量。否则,则需要对编码层、生成层以及嵌入向量查找层的参数进行调整。
具体的,可以基于元路径鉴别网络模型对应的损失函数值调整编码层的参数;基于真伪分类网络子模型对应的损失函数值调整生成层的参数;基于语义鉴别网络模型对应的损失函数值调整嵌入向量查找层的参数。
在分别调整编码层、生成层以及嵌入向量查找层的参数后,可以重复执行步骤S402。
可以理解的是,本发明实施例中的步骤S401~S405和S408与第一种实施方式中的步骤S301~S305和S308相同或相似,这里不再赘述。
为了更清楚的说明本发明实施例的一种基于解耦的异质网络嵌入方法,下面,结合图5进行介绍,如图5所示,为本发明实施例的一种基于解耦的异质网络嵌入模型的框架示意图;
假设异质网络为G,共有2条元路径,对应的元路径为(Φ1,Φ2),将该2条元路径输入至图5所示的节点嵌入网络模型,获得该节点嵌入网络模型输出的2组嵌入向量(xΦ1,xΦ2),然后将2组嵌入向量输入至图5所示的编码层,获得2组待定的共有特征向量
Figure BDA0002753309920000161
然后将该2组待定的共有特征向量
Figure BDA0002753309920000162
输入至图5所示的元路径鉴别网络模型,得到该元路径鉴别网络模型对应的损失函数值;
在一些示例中,该元路径鉴别网络模型包括两个元路径分类网络子模型,通过使用该两个元路径分类网络子模型,可以通过该2组待定的共有特征向量
Figure BDA0002753309920000163
预测出两条元路径的类别,然后基于该预测出的两条元路径的类别和该两条元路径的真实类别,通过元路径鉴别网络模型的目标函数,得到该元路径鉴别网络模型对应的损失函数值。
进而基于该元路径鉴别网络模型对应的损失函数值对编码层的参数进行调整,这样,可以使得在对抗的情况下,编码层产生共有特征向量,而元路径鉴别网络模型尝试从共有特征向量中辨别出元路径的特有特征向量。经训练,分辨能力越强的元路径鉴别网络模型会促使编码层产生更与元路径无关的共有特征向量。重复以上迭代,编码层和元路径鉴别网络模型互相强化、互相增益。
在一些示例中,该元路径鉴别网络模型的目标函数
Figure BDA0002753309920000164
为:
Figure BDA0002753309920000165
其中,E代表熵,P表示共有特征向量属于某一条元路径的概率,
Figure BDA0002753309920000166
表示预测出的元路径的类别,lmp为元路径的真实类别,
Figure BDA0002753309920000167
Figure BDA0002753309920000168
表示共有特征向量的元路径类别。
在又一些示例中,该元路径鉴别网络模型的目标函数即为元路径鉴别网络模型的损失函数。
在一些示例中,在得到该两条元路径的待定的共有特征向量后,可以获取待处理异质网络的每条元路径的标识信息,将每条元路径的标识信息输入至图5所示的嵌入向量查找层,以使得嵌入向量查找层查找预先生成的与每条元路径的标识信息对应的一组待定的特有特征向量,并输出查找出的与每条元路径对应的一组待定的特有特征向量,例如,查找出的该两条元路径对应的2组待定的特有特征向量为图5所示的
Figure BDA0002753309920000169
然后可以将该2组待定的特有特征向量
Figure BDA00027533099200001610
和2组待定的共有特征向量
Figure BDA00027533099200001611
输入至图5所示的生成层,从而可以得到2组合成嵌入向量
Figure BDA00027533099200001612
Figure BDA00027533099200001613
具体的,可以将待定的特有特征向量
Figure BDA0002753309920000171
和待定的共有特征向量
Figure BDA0002753309920000172
进行合成,得到合成嵌入向量
Figure BDA0002753309920000173
将待定的特有特征向量
Figure BDA0002753309920000174
和待定的共有特征向量
Figure BDA0002753309920000175
进行合成,得到合成嵌入向量
Figure BDA0002753309920000176
然后将2组合成嵌入向量
Figure BDA0002753309920000177
Figure BDA0002753309920000178
分别输入至图5所示的真伪分类网络子模型和语义分类网络子模型,得到真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值。
尽管合成嵌入向量是由一组共有特征向量和其他元路径的特有特征向量合成的,但合成嵌入向量反映的语义需要准确表示特有特征向量所属元路径的语义,因为特有特征向量是富含元路径特定信息的,而共有特征向量应该不依赖于元路径。因此,语义分类网络子模型促使合成嵌入向量属于特有特征向量所属元路径的类型。同时,真伪分类网络子模型使得合成嵌入向量的语义更接近所属元路径的真实语义,从而减少对语义分类的影响。
在一些示例中,可以基于语义分类网络子模型的目标函数
Figure BDA0002753309920000179
为:
Figure BDA00027533099200001710
得到语义分类网络子模型对应的损失函数值;
基于真伪分类网络子模型的目标函数
Figure BDA00027533099200001711
为:
Figure BDA00027533099200001712
得到真伪分类网络子模型对应的损失函数值;
其中,
Figure BDA00027533099200001713
表示元路径属于某一类别的概率,xΦ=(xΦ1,xΦ2)表示输入嵌入向量集合,
Figure BDA00027533099200001714
表示合成嵌入向量集合,lmp|xΦ表示输入嵌入向量的元路径类别,
Figure BDA00027533099200001715
表示特有特征向量对应的元路径的种类,
Figure BDA00027533099200001716
表示合成嵌入向量的元路径类别,
Figure BDA00027533099200001717
表示特有特征向量所反映的语义为合成语义的概率,Cr/f(xΦ)表示特有特征向量所反映的语义为真实语义的概率。
在一些示例中,该语义分类网络子模型的目标函数即为语义分类网络子模型的损失函数,该真伪分类网络子模型的目标函数即为该真伪分类网络子模型的损失函数。
在得到元路径鉴别网络模型对应的损失函数值、真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值后,可以将该三个损失函数值相加,然后判断相加的总的损失函数值是否小于或等于预设损失函数阈值;如果是,将该2组待定的共有特征向量与2组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;
否则,基于元路径鉴别网络模型对应的损失函数值调整编码层的参数;基于真伪分类网络子模型对应的损失函数值调整生成层的参数;基于语义鉴别网络模型对应的损失函数值调整嵌入向量查找层的参数。并重复将2组嵌入向量输入至图5所示的编码层的步骤。
在一些示例中,在将该2组待定的共有特征向量与2组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量时,可以将特有特征向量
Figure BDA0002753309920000181
和2组待定的共有特征向量
Figure BDA0002753309920000182
进行重组,得到该2条元路径的重组后的嵌入向量
Figure BDA0002753309920000183
Figure BDA0002753309920000184
为了更清楚的说明本发明实施例的基于解耦的异质网络嵌入方法的效果,发明人采用本发明实施例的基于解耦的异质网络嵌入方法,对三种异质信息网络进行了实验,分别为:包含作者(A)、论文(P)和主题(S)三种类型的节点的异质网络;包含作者(A)、论文(P)、会议(C)和关键词(T)四种类型的节点的异质网络;以及包含作者(A),论文(P)和引用(R)三种类型的节点的异质网络。
如图6a所示,本发明实施例的基于解耦的异质网络嵌入方法可以有效地解耦出元路径的共有特征向量和特有特征向量。在图6a中,共有特征向量的NMI(Normalized MutualInformation,归一化互信息)快速收敛且较高,而特有特征向量的性能始终在低水平波动且增加缓慢。从而可以说明元路径中的共有特征向量揭示了节点的本质特征。
接下来,为了了解语义分类网络子模型和元路径鉴别网络模型的对抗学习过程,我们展示了各自的损失变化。如图6b所示,由于特有特征向量越来越依赖元路径语义,语义分类网络子模型的损失逐渐减少;编码层通过解耦出更加准确的共有特征向量来欺骗元路径鉴别网络模型,导致元路径鉴别网络模型的损失增加。经过约1万步的对抗训练后,各自的损失趋于收敛。
从图6c中可以观察到,真伪分类网络子模型中真语义的损失值和伪语义的损失值逐渐增大,可见,真伪分类网络子模型的分类性能也逐渐变差,从而表明合成语义越来越接近真实语义。经过约1万步的对抗训练后,损失趋于收敛。实验结果表明:语义分类网络子模型和元路径鉴别网络模型可以通过对抗地学习来稳定、持续地提高性能。其中,图6b和图6c中的横坐标代表训练步数,纵坐标代表损失值。
为研究不同元路径的影响,我们使用了元路径PAP、PSP、APCPA、APTPA、APA、以及PRP分别进行了实验,如图6d、6e和6f所示,随着元路径数量的增加,评估所得共有特征向量在节点分类上的性能持续增长,这进一步表明本发明实施例的基于解耦的异质网络嵌入方法可以吸收来自各元路径的共有因素,从而获得更好的性能。值得注意的是,尽管现有技术中的多种异质网络嵌入方法在添加更多元路径时可以提高性能,但需要监督信息。而本发明实施例的基于解耦的异质网络嵌入方法可以实现无监督学习。实验还证明,在不进行路径选择的前提下,本发明实施例的基于解耦的异质网络嵌入方法也可以通过添加元路径来稳健地提高性能,其中,6d、6e和6f的横坐标为训练过程的百分比,纵坐标为将不同数量的元路径输入至本发明实施例的基于解耦的异质网络嵌入方法的性能值。
相应于上述的方法实施例,本发明实施例还提供了一种基于解耦的异质网络嵌入装置,如图7所示,为本发明实施例的一种基于解耦的异质网络嵌入装置的结构示意图,该装置可以包括:
嵌入向量获取模块701,用于获取待处理异质网络的多组嵌入向量,其中,待处理异质网络中的每条元路径具有一组嵌入向量,每组嵌入向量包括对应的元路径中的所有节点的节点嵌入向量;
共有特征向量获得模块702,用于将多组嵌入向量输入至编码层,获得多组待定的共有特征向量,其中,编码层为初始化后的编码层或调整参数后的编码层;共有特征向量用于表征待处理异质网络的所有元路径共有的属性信息,每组共有特征向量对应一条元路径;
第一损失函数值获得模块703,用于将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;
特有特征向量获得模块704,用于获取嵌入向量查找层输出的多组待定的特有特征向量,其中,嵌入向量查找层为初始化后的嵌入向量查找层或调整参数后的嵌入向量查找层;每组特有特征向量对应一条元路径,特有特征向量用于表征每条元路径特有的属性信息;
合成模块705,用于将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,其中,生成层为初始化后的生成层或调整参数后的生成层;多组合成嵌入向量中的任一合成嵌入向量与多组嵌入向量的任一嵌入向量不同;
第二损失函数值获得模块706,用于将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值;
判断模块707,用于判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值;如果是,触发输出模块708,如果否,触发调整模块709;
输出模块708,用于将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;
调整模块709,用于基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,并触发共有特征向量获得模块702。
本发明实施例提供的一种基于解耦的异质网络嵌入装置,可以先获取待处理异质网络的多组嵌入向量,然后将该多组嵌入向量输入至编码层,获得多组待定的共有特征向量,并将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;再获取嵌入向量查找层输出的多组待定的特有特征向量,并将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,进而可以将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值;最后判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值;如果是,则可以将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;否则,基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,并重复执行将多组嵌入向量输入至编码层,获得多组待定的共有特征向量的步骤。这样,可以在对待处理异质网络不进行元路径选择的前提下,对每条元路径的嵌入向量进行解耦,使得最终得到的共有特征向量能够更准确的表征所有元路径共有的属性信息,而每组特有特征向量能够更准确地表征该组特有特征向量对应的元路径特有的属性信息。进一步的,本发明通过使用元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,可以实现自监督学习,从而使得异质网络的低维向量的准确度更高。
在一些示例中,嵌入向量获取模块701,具体用于:
将待处理异质网络的每条元路径输入至预设节点嵌入网络模型,获得预设节点嵌入网络模型输出的多组嵌入向量。
在一些示例中,特有特征向量获得模块704,具体用于:
获取待处理异质网络的每条元路径的标识信息,将每条元路径的标识信息输入至嵌入向量查找层,以使得嵌入向量查找层查找预先生成的与每条元路径的标识信息对应的一组待定的特有特征向量,并输出查找出的与每条元路径对应的一组待定的特有特征向量,其中,嵌入向量查找层在每次调整参数后,会生成与每条元路径对应的待定的特有特征向量。
在一些示例中,合成模块705,具体用于:
针对每条元路径,将该元路径的一组待定的共有特征向量和待处理异质网络中除该元路径外的其他元路径的待定的特有特征向量合成,得到多组合成嵌入向量。
在一些示例中,语义鉴别网络模型包括真伪分类网络子模型和语义分类网络子模型;
第二损失函数值获得模块706,具体用于:
将多组合成嵌入向量分别输入至真伪分类网络子模型和语义分类网络子模型,得到真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值;
相应的,调整模块709,具体用于:
基于元路径鉴别网络模型对应的损失函数值调整编码层的参数;基于真伪分类网络子模型对应的损失函数值调整生成层的参数;基于语义鉴别网络模型对应的损失函数值调整嵌入向量查找层的参数。
本发明实施例还提供了一种电子设备,如图8所示,包括处理器801、通信接口802、存储器803和通信总线804,其中,处理器801,通信接口802,存储器803通过通信总线804完成相互间的通信,
存储器803,用于存放计算机程序;
处理器801,用于执行存储器803上所存放的程序时,实现如下步骤:
获取待处理异质网络的多组嵌入向量,其中,待处理异质网络中的每条元路径具有一组嵌入向量,每组嵌入向量包括对应的元路径中的所有节点的节点嵌入向量;
将多组嵌入向量输入至编码层,获得多组待定的共有特征向量,其中,编码层为初始化后的编码层或调整参数后的编码层;共有特征向量用于表征待处理异质网络的所有元路径共有的属性信息,每组共有特征向量对应一条元路径;
将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;
获取嵌入向量查找层输出的多组待定的特有特征向量,其中,嵌入向量查找层为初始化后的嵌入向量查找层或调整参数后的嵌入向量查找层;每组特有特征向量对应一条元路径,特有特征向量用于表征每条元路径特有的属性信息;
将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,其中,生成层为初始化后的生成层或调整参数后的生成层;多组合成嵌入向量中的任一合成嵌入向量与多组嵌入向量的任一嵌入向量不同;
将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值;
判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值;
如果是,将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;
否则,基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,并重复执行将多组嵌入向量输入至编码层,获得多组待定的共有特征向量的步骤。
本发明实施例提供的一种电子设备,可以先获取待处理异质网络的多组嵌入向量,然后将该多组嵌入向量输入至编码层,获得多组待定的共有特征向量,并将多组待定的共有特征向量输入至元路径鉴别网络模型,得到元路径鉴别网络模型对应的损失函数值;再获取嵌入向量查找层输出的多组待定的特有特征向量,并将多组待定的共有特征向量与多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,进而可以将多组合成嵌入向量输入至语义鉴别网络模型中,得到语义鉴别网络模型对应的损失函数值;最后判断元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,是否小于或等于预设损失函数阈值;如果是,则可以将多组待定的共有特征向量与多组待定的特有特征向量对应作为待处理异质网络的各个元路径共有特征向量和特有特征向量;否则,基于元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,并重复执行将多组嵌入向量输入至编码层,获得多组待定的共有特征向量的步骤。这样,可以在对待处理异质网络不进行元路径选择的前提下,对每条元路径的嵌入向量进行解耦,使得最终得到的共有特征向量能够更准确的表征所有元路径共有的属性信息,而每组特有特征向量能够更准确地表征该组特有特征向量对应的元路径特有的属性信息。进一步的,本发明通过使用元路径鉴别网络模型对应的损失函数值和语义鉴别网络模型对应的损失函数值,调整编码层、嵌入向量查找层和生成层的参数,可以实现自监督学习,从而使得异质网络的低维向量的准确度更高。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。在一些示例中,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一基于解耦的异质网络嵌入方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一基于解耦的异质网络嵌入方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备及存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种基于解耦的异质网络嵌入方法,其特征在于,所述方法包括:
获取待处理异质网络的多组嵌入向量,其中,所述待处理异质网络中的每条元路径具有一组所述嵌入向量,每组所述嵌入向量包括对应的元路径中的所有节点的节点嵌入向量;
将所述多组嵌入向量输入至编码层,获得多组待定的共有特征向量,其中,所述编码层为初始化后的编码层或调整参数后的编码层;所述共有特征向量用于表征所述待处理异质网络的所有元路径共有的属性信息,每组所述共有特征向量对应一条元路径;
将所述多组待定的共有特征向量输入至元路径鉴别网络模型,得到所述元路径鉴别网络模型对应的损失函数值;
获取嵌入向量查找层输出的多组待定的特有特征向量,其中,所述嵌入向量查找层为初始化后的嵌入向量查找层或调整参数后的嵌入向量查找层;每组所述特有特征向量对应一条元路径,所述特有特征向量用于表征每条元路径特有的属性信息;
将所述多组待定的共有特征向量与所述多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,其中,所述生成层为初始化后的生成层或调整参数后的生成层;所述多组合成嵌入向量中的任一合成嵌入向量与所述多组嵌入向量的任一嵌入向量不同;
将所述多组合成嵌入向量输入至语义鉴别网络模型中,得到所述语义鉴别网络模型对应的损失函数值;
判断所述元路径鉴别网络模型对应的损失函数值和所述语义鉴别网络模型对应的损失函数值相加后的损失函数值,是否小于或等于预设损失函数阈值;或者,判断所述元路径鉴别网络模型对应的损失函数值和所述语义鉴别网络模型对应的损失函数值,是否均小于或等于预设损失函数阈值;
如果是,将所述多组待定的共有特征向量与所述多组待定的特有特征向量对应作为所述待处理异质网络的各个元路径共有特征向量和特有特征向量;
否则,基于所述元路径鉴别网络模型对应的损失函数值和所述语义鉴别网络模型对应的损失函数值,调整所述编码层、所述嵌入向量查找层和所述生成层的参数,并重复执行所述将所述多组嵌入向量输入至编码层,获得多组待定的共有特征向量的步骤。
2.根据权利要求1所述的方法,其特征在于,所述获取待处理异质网络的多组嵌入向量,包括:
将所述待处理异质网络的每条元路径输入至预设节点嵌入网络模型,获得所述预设节点嵌入网络模型输出的多组嵌入向量。
3.根据权利要求1所述的方法,其特征在于,所述获取嵌入向量查找层输出的多组待定的特有特征向量,包括:
获取所述待处理异质网络的每条元路径的标识信息,将所述每条元路径的标识信息输入至所述嵌入向量查找层,以使得所述嵌入向量查找层查找预先生成的与所述每条元路径的标识信息对应的一组待定的特有特征向量,并输出查找出的与所述每条元路径对应的一组待定的特有特征向量,其中,所述嵌入向量查找层在每次调整参数后,会生成与所述每条元路径对应的待定的特有特征向量。
4.根据权利要求1所述的方法,其特征在于,所述将所述多组待定的共有特征向量与所述多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,包括:
针对每条元路径,将该元路径的一组待定的共有特征向量和所述待处理异质网络中除该元路径外的其他元路径的待定的特有特征向量合成,得到多组合成嵌入向量。
5.根据权利要求1所述的方法,其特征在于,所述语义鉴别网络模型包括真伪分类网络子模型和语义分类网络子模型;
所述将所述多组合成嵌入向量输入至语义鉴别网络模型中,得到所述语义鉴别网络模型对应的损失函数值,包括:
将所述多组合成嵌入向量分别输入至所述真伪分类网络子模型和语义分类网络子模型,得到所述真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值;
相应的,所述基于所述元路径鉴别网络模型对应的损失函数值和所述语义鉴别网络模型对应的损失函数值,调整所述编码层、所述嵌入向量查找层和所述生成层的参数,包括:
基于所述元路径鉴别网络模型对应的损失函数值调整所述编码层的参数;基于所述真伪分类网络子模型对应的损失函数值调整所述生成层的参数;基于所述语义鉴别网络模型对应的损失函数值调整所述嵌入向量查找层的参数。
6.一种基于解耦的异质网络嵌入装置,其特征在于,所述装置包括:
嵌入向量获取模块,用于获取待处理异质网络的多组嵌入向量,其中,所述待处理异质网络中的每条元路径具有一组所述嵌入向量,每组所述嵌入向量包括对应的元路径中的所有节点的节点嵌入向量;
共有特征向量获得模块,用于将所述多组嵌入向量输入至编码层,获得多组待定的共有特征向量,其中,所述编码层为初始化后的编码层或调整参数后的编码层;所述共有特征向量用于表征所述待处理异质网络的所有元路径共有的属性信息,每组所述共有特征向量对应一条元路径;
第一损失函数值获得模块,用于将所述多组待定的共有特征向量输入至元路径鉴别网络模型,得到所述元路径鉴别网络模型对应的损失函数值;
特有特征向量获得模块,用于获取嵌入向量查找层输出的多组待定的特有特征向量,其中,所述嵌入向量查找层为初始化后的嵌入向量查找层或调整参数后的嵌入向量查找层;每组所述特有特征向量对应一条元路径,所述特有特征向量用于表征每条元路径特有的属性信息;
合成模块,用于将所述多组待定的共有特征向量与所述多组待定的特有特征向量输入至生成层进行合成,得到多组合成嵌入向量,其中,所述生成层为初始化后的生成层或调整参数后的生成层;所述多组合成嵌入向量中的任一合成嵌入向量与所述多组嵌入向量的任一嵌入向量不同;
第二损失函数值获得模块,用于将所述多组合成嵌入向量输入至语义鉴别网络模型中,得到所述语义鉴别网络模型对应的损失函数值;
判断模块,用于判断所述元路径鉴别网络模型对应的损失函数值和所述语义鉴别网络模型对应的损失函数值相加后的损失函数值,是否小于或等于预设损失函数阈值;或者,用于判断所述元路径鉴别网络模型对应的损失函数值和所述语义鉴别网络模型对应的损失函数值,是否均小于或等于预设损失函数阈值;如果是,触发输出模块,如果否,触发调整模块;
所述输出模块,用于将所述多组待定的共有特征向量与所述多组待定的特有特征向量对应作为所述待处理异质网络的各个元路径共有特征向量和特有特征向量;
所述调整模块,用于基于所述元路径鉴别网络模型对应的损失函数值和所述语义鉴别网络模型对应的损失函数值,调整所述编码层、所述嵌入向量查找层和所述生成层的参数,并触发共有特征向量获得模块。
7.根据权利要求6所述的装置,其特征在于,所述特有特征向量获得模块,具体用于:
获取所述待处理异质网络的每条元路径的标识信息,将所述每条元路径的标识信息输入至所述嵌入向量查找层,以使得所述嵌入向量查找层查找预先生成的与所述每条元路径的标识信息对应的一组待定的特有特征向量,并输出查找出的与所述每条元路径对应的一组待定的特有特征向量,其中,所述嵌入向量查找层在每次调整参数后,会生成与所述每条元路径对应的待定的特有特征向量。
8.根据权利要求6所述的装置,其特征在于,所述合成模块,具体用于:
针对每条元路径,将该元路径的一组待定的共有特征向量和所述待处理异质网络中除该元路径外的其他元路径的待定的特有特征向量合成,得到多组合成嵌入向量。
9.根据权利要求6所述的装置,其特征在于,所述语义鉴别网络模型包括真伪分类网络子模型和语义分类网络子模型;
所述第二损失函数值获得模块,具体用于:
将所述多组合成嵌入向量分别输入至所述真伪分类网络子模型和语义分类网络子模型,得到所述真伪分类网络子模型对应的损失函数值和语义分类网络子模型对应的损失函数值;
相应的,所述调整模块,具体用于:
基于所述元路径鉴别网络模型对应的损失函数值调整所述编码层的参数;基于所述真伪分类网络子模型对应的损失函数值调整所述生成层的参数;基于所述语义鉴别网络模型对应的损失函数值调整所述嵌入向量查找层的参数。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
CN202011193283.8A 2020-10-30 2020-10-30 一种基于解耦的异质网络嵌入方法、装置及电子设备 Active CN112232492B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011193283.8A CN112232492B (zh) 2020-10-30 2020-10-30 一种基于解耦的异质网络嵌入方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011193283.8A CN112232492B (zh) 2020-10-30 2020-10-30 一种基于解耦的异质网络嵌入方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN112232492A CN112232492A (zh) 2021-01-15
CN112232492B true CN112232492B (zh) 2022-04-12

Family

ID=74121553

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011193283.8A Active CN112232492B (zh) 2020-10-30 2020-10-30 一种基于解耦的异质网络嵌入方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112232492B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112948625B (zh) * 2021-02-01 2022-08-05 重庆邮电大学 一种基于属性异质信息网络嵌入的电影推荐方法
CN113762334B (zh) * 2021-07-26 2022-03-01 南昌航空大学 一种采用深度强化学习评估异质社交网络关键节点的方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503022B (zh) * 2015-09-08 2020-12-01 北京邮电大学 推送推荐信息的方法和装置
US10264048B2 (en) * 2016-02-23 2019-04-16 Microsoft Technology Licensing, Llc Graph framework using heterogeneous social networks
CN109800232B (zh) * 2019-01-21 2021-03-19 北京邮电大学 一种异质信息网络嵌入方法、装置、电子设备及存储介质
CN110046698B (zh) * 2019-04-28 2021-07-30 北京邮电大学 异质图神经网络生成方法、装置、电子设备及存储介质
CN110516146B (zh) * 2019-07-15 2022-08-19 中国科学院计算机网络信息中心 一种基于异质图卷积神经网络嵌入的作者名字消歧方法
CN110555139A (zh) * 2019-08-30 2019-12-10 南开大学 基于节点签名的保留标签信息的异质网络嵌入方法
CN110830291B (zh) * 2019-10-30 2023-01-10 辽宁工程技术大学 一种基于元路径的异质信息网络的节点分类方法
CN110851662B (zh) * 2019-11-05 2023-08-11 中国人民解放军国防科技大学 基于元路径的异质信息网络链路预测方法

Also Published As

Publication number Publication date
CN112232492A (zh) 2021-01-15

Similar Documents

Publication Publication Date Title
CN109471938B (zh) 一种文本分类方法及终端
US11809828B2 (en) Systems and methods of data augmentation for pre-trained embeddings
CN107346326B (zh) 用于信息检索的方法和系统
CN110162695B (zh) 一种信息推送的方法及设备
US20200364307A1 (en) Cross-lingual information retrieval and information extraction
JP2013519138A (ja) アイテム関連付けのための結合埋込
CN112232492B (zh) 一种基于解耦的异质网络嵌入方法、装置及电子设备
CN110502677B (zh) 一种设备识别方法、装置及设备、存储介质
CN112732883A (zh) 基于知识图谱的模糊匹配方法、装置和计算机设备
Kang et al. Nafm: neural and attentional factorization machine for web api recommendation
CN113656660B (zh) 跨模态数据的匹配方法、装置、设备及介质
Peng et al. Multi-level preference regression for cold-start recommendations
CN111985228A (zh) 文本关键词提取方法、装置、计算机设备和存储介质
CN111460783B (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN116601626A (zh) 个人知识图谱构建方法、装置及相关设备
KR20200119370A (ko) 인공지능 기반의 유사 디자인 검색 장치
Zhang et al. Gaussian metric learning for few-shot uncertain knowledge graph completion
Peng et al. Hierarchical visual-textual knowledge distillation for life-long correlation learning
CN114756733A (zh) 一种相似文档搜索方法、装置、电子设备及存储介质
Li et al. Neural model robustness for skill routing in large-scale conversational ai systems: A design choice exploration
CN112417147A (zh) 训练样本的选取方法与装置
Xu et al. A multi-rnn research topic prediction model based on spatial attention and semantic consistency-based scientific influence modeling
Yu et al. Enhancing attributed network embedding via similarity measure
CN114969439A (zh) 一种模型训练、信息检索方法及装置
He et al. A method for detecting phishing websites based on tiny-bert stacking

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant