CN115238073A - 一种融合异构信息网络与生成对抗网络的服务分类方法 - Google Patents

一种融合异构信息网络与生成对抗网络的服务分类方法 Download PDF

Info

Publication number
CN115238073A
CN115238073A CN202210856551.2A CN202210856551A CN115238073A CN 115238073 A CN115238073 A CN 115238073A CN 202210856551 A CN202210856551 A CN 202210856551A CN 115238073 A CN115238073 A CN 115238073A
Authority
CN
China
Prior art keywords
service
discriminator
network
embedding
generator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210856551.2A
Other languages
English (en)
Inventor
曹步清
谢湘
刘建勋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University of Science and Technology
Original Assignee
Hunan University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University of Science and Technology filed Critical Hunan University of Science and Technology
Priority to CN202210856551.2A priority Critical patent/CN115238073A/zh
Publication of CN115238073A publication Critical patent/CN115238073A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种融合异构信息网络与生成对抗网络的服务分类方法,包括如下步骤:(1)服务异构信息网络构建及Metapath2vec网络表征;(2)GAN对抗训练;(3)服务分类。本发明属于互联网技术领域,具体是指一种首先针对Web服务之间的结构关系和自身的属性信息构建出异构信息网络;然后,基于元路径的随机游走并联合服务节点与邻居节点进行训练得到服务的特征嵌入;最后,采用具有关系感知的GAN模型实现对抗训练,通过生成器和判别器的极大极小化博弈学习高质量的负样本信息,对服务的特征嵌入进行优化,从而实现Web服务分类的融合异构信息网络与生成对抗网络的服务分类方法。

Description

一种融合异构信息网络与生成对抗网络的服务分类方法
技术领域
本发明属于互联网技术领域,具体是指一种融合异构信息网络与生成对抗网络的服务分类方法。
背景技术
近年来,随着服务计算的发展,Web服务的发现和挖掘成为一个热门的研究方向。研究表明:正确高效的Web服务分类能够有效提高Web服务发现的性能。目前,对Web服务分类的大量研究主要是基于功能语义的服务分类。其中,Crosso等人将WSDL中的元素进行分割去除停用词后,归至词根,然后利用不同的分类算法进行分类。Katakis等人考虑了Web服务的文本描述和语义标注,解决了Web服务在其应用领域的自动分类问题。Ye等人将Web服务描述文档中的所有离散特征结合起来,利用Wide&Bi-LSTM模型对Web服务类别进行预测。Chen等人利用LSA模型对移动应用内容文本进行全局主题建模,再通过BiLSTM模型对内容文本进行局部隐藏表征,提出一种主题注意力机制增强的移动应用分类方法。Shi等人提出了一种考虑多重Web服务关系的概率主题模型MR-LDA,其可对Web服务之间相互组合的关系以及Web服务之间共享标签的关系进行建模。但由于WSDL文档数据的稀疏性,主题模型难以获取有效的服务表征,其服务分类的效果提升并不明显。
最近,一些研究者开始研究网络嵌入模型与技术并应用于分类任务中。网络嵌入具有学习保留结构的节点表示的能力,典型的模型与方法包括随机游走(例如Node2vec),邻近表征(例如LINE)等。然而,这些模型与方法大都只适用于同构网络,却无法学习HIN中的语义保留表示。为了结合HIN和网络嵌入的优势,已有一些方法用于HIN中的表示学习,利用基于元路径的上下文进行语义保留嵌入,在分类任务中取得了较好的效果。其中,Wan等人提出使用类级元路径可以在HIN中实现非常有效的主动学习和良好的分类性能。Du等人为了有效缓解数据稀疏的问题,提出通过权重主动学习多语义元路径实现分类。
上述这些工作中,异构信息网络方法主要关注于在异构信息网络上捕获丰富的语义信息,并未注意节点的底层分布,因此对于通常稀疏且有噪声的真实的网络缺乏鲁棒性。据调研,生成对抗网络(GAN)利用对抗原则可以学习更具鲁棒性的表示形式,在许多问题中表现出优异的性能。通常,它们在嵌入空间上施加了固定的先验分布,以增强学习表示的鲁棒性。但是,这些方法忽略了节点和关系的异质性,无法捕获HIN上的丰富语义。
发明内容
为了解决上述难题,本发明提供了一种融合异构信息网络与生成对抗网络的服务分类方法,该方法首先针对Web服务之间的结构关系和自身的属性信息构建出异构信息网络;然后,基于元路径的随机游走并联合服务节点与邻居节点进行训练得到服务的特征嵌入;最后,采用具有关系感知的GAN模型实现对抗训练,通过生成器和判别器的极大极小化博弈学习高质量的负样本信息,对服务的特征嵌入进行优化,从而实现Web服务分类。
为了实现上述功能,本发明采取的技术方案如下:一种融合异构信息网络与生成对抗网络的服务分类方法,包括如下步骤:
(1)服务异构信息网络构建及Metapath2vec网络表征:构建如下表1所示元路径,采用Metapath2vec模型计算出两两服务之间的嵌入表征,Metapath2vec通过基于元路径的随机游走及异构Skip-gram模型学习网络表征,捕获不同类型节点之间的语义和结构相关性;
表1服务相关的元路径
Figure BDA0003754611990000031
(2)GAN对抗训练:SC-GAN主要由两个相互竞争的模块组成,即判别器和生成器,给定一个服务节点,生成器尝试生成与给定服务节点相关联的伪样本,以提供给判别器,判别器则尝试改进其参数来将假样本与实际连接到给定节点的真实样本分离,在这个重复的过程中,训练好的判别器会迫使生产器产生更好的假样本,而判别器则也会增强其判断能力,在这样的迭代过程中,生成器和判别器都得到正强化;
(3)服务分类:将SC-GAN模型的服务节点嵌入表征输入到一个完整的连接层中,并使用多元Logistic回归函数输出所有候选Web服务类别的概率分布;
Logistic回归用来预测一个具有类别分布的因变量不同可能结果的概率的模型,将多分类的输出值转换为相对概率,表示节点属于特定类别的概率,其计算方式见公式(10)。其中,k个模型分别预测训练数据属于那个类别的概率,k为候选Web服务类别数,w表示服务节点对应的权重矩阵,
Figure BDA0003754611990000032
表示向量的特征嵌入;
Figure BDA0003754611990000033
在模型训练过程中,对于所有K个可能的分类结果,运行K-1个独立二元逻辑回归模型,在运行过程中把其中一个类别看成是主类别,然后将其它K-1个类别和所选择的主类别分别进行回归运算;在对数似然取最大值等价于损失函数取最小值,其中,对数似然计算方式如下:
Figure BDA0003754611990000041
进一步地,所述步骤(2)中,在TransE异构信息网络嵌入方法中,服务异构信息网络中的每一个三元组<s,r,v>(s和v表示两个关系相联的服务节点,r表示它们之间链接的边类型),两个服务节点的潜在向量表示为s和v∈V,关系的潜在向量表示r∈R;
生成器G(·;θG)利用了以下高斯分布从基础连续分布中生成样本:
Figure BDA0003754611990000042
其中,
Figure BDA0003754611990000043
Figure BDA0003754611990000044
分别表示生成器
Figure BDA0003754611990000045
的服务节点嵌入和
Figure BDA0003754611990000046
的关系矩阵;
生成器的公式如下:
G(s,r;θG)=f(WL…f(W1e+b1)+bL)
从分布
Figure BDA0003754611990000047
中得出,W*和b*分别表示每一层的权重矩阵和偏差矢量,f是激活函数;
生成器的参数集为
Figure BDA0003754611990000048
即所有节点嵌入和关系矩阵以及MLP的参数的并集;
其中,λG>0控制正则项;
生成器参数θG通过最小化来优化:
Figure BDA0003754611990000049
进一步地,所述步骤(2)中判别器D(ev|s,r;θD)评估服务节点对s和v的关系之间的连通性;
Figure BDA0003754611990000051
是给定的服务节点,
Figure BDA0003754611990000052
是来自HIN的给定关系,ev是样本服务节点的嵌入,θD表示D模型参数;
D在关系r下输出样本连接到服务的概率为:
Figure BDA0003754611990000053
其中,ev是样本的嵌入输入,
Figure BDA0003754611990000054
是服务节点s的可学习嵌入,
Figure BDA0003754611990000055
是关系r的可学习关系矩阵;
Figure BDA0003754611990000056
形成判别器D的模型参数,D为获得的所有服务节点嵌入和关系矩阵的并集;
当v是与s到r相关的正样本时,概率应该较高;当是负样本时,则概率应该较低;
样本v与给定的服务s和关系r形成三元组<s,r,v>,并且每个三元组在极性方面都属于以下三种情况之一,在有条件的GAN的启发下,每种情况也导致了一部分判别器损失:
情况1:在给定关系下连接,即:服务节点和样本确实通过HIN
Figure BDA00037546119900000510
上的正确关系连接,这样的三元组被认为是正向的,用下面的损失来建模。
Figure BDA0003754611990000057
情况2:连接关系不正确,s和v在HIN中以错误的关系r′≠r连接,由于它们的关联性与给定关系r所携带的期望语义不匹配,该判别器也将它们标记为负。这部分损失定义如下:
Figure BDA0003754611990000058
情况3:来自关系感知生成器的假服务节点,给定一个服务节点,它可以与生成器提供的服务节点形成假对,,判别器旨在将该三元组标识为负数,表示如下:
Figure BDA0003754611990000059
其中,伪样本v的嵌入e′v是从生成器G的学习分布中提取的;
整合以上三个部分训练判别器:
Figure BDA0003754611990000061
其中,λD>0控制正则项以避免过度拟合,判别器的参数θD可以通过最小化
Figure BDA0003754611990000062
来优化。
本发明取得有益效果如下:
(1)将对抗性学习应用于面向异构信息网络的服务节点表示并进行服务分类,不仅保留服务异构信息网络上丰富语义,同时保证学习到的服务节点表示的鲁棒性,提高了服务分类的准确性;
(2)提出了一种新型的融合异构信息网络及对抗训练的服务分类方法,不仅能够感知关系以获取丰富的语义,而且还具有高效的生成负样本的机制;
(3)基于ProgrammableWeb真实数据集进行实验评估与分析,提升了服务分类的精度及质量。
附图说明
图1为本发明提供的一种融合异构信息网络与生成对抗网络的服务分类方法的SC-GAN模型整体框架;
图2为本发明提供的一种融合异构信息网络与生成对抗网络的服务分类方法的行走组件的服务异构信息网络框架;
图3为本发明提供的一种融合异构信息网络与生成对抗网络的服务分类方法的ATA输入SC-GAN对抗训练的示例;
图4为本发明提供的一种融合异构信息网络与生成对抗网络的服务分类方法的Micro F1值和Macro F1值随类别数的变化;
图5为本发明提供的一种融合异构信息网络与生成对抗网络的服务分类方法的SC-GAN在数据集上的学习曲线。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。以下结合附图,对本发明做进一步详细说明。
方法总体框架如图1所示,包括三个部分:(1)服务异构信息网络构建及Metapath2vec网络表征;(2)GAN对抗训练;(3)服务分类。首先,从网络上抓取服务数据,经过预处理得到服务描述文档、Tags和Labels等信息,构建服务异构信息网络;然后将元路径下服务节点s和邻居服务节点v的关系输入Metapath2vec模型中,通过基于元路径的随机游走训练获得每个服务节点。的表征;接着,将得到的服务节点嵌入输入到具有多层感知器的GAN模型中进行对抗训练捕获到服务节点更鲁棒性的表征;最后,使用多元Logistic回归预测API服务的类别。
如图2所述,“ATA”就是一个元路径,表达的是具有相同标签的服务可能属于同一类别(A是Web服务API节点类型,T是服务标签类型)。一般来说,元路径是事先由先验知识给定的。而基于元路径的随机游走指的是:“下一跳服务节点的节点类型由当前服务节点类型和元路径模式确定,按照元路径的指导选择相应的服务节点类型进行跳转,如果有多个相同服务节点类型的邻居,则随机选择一个”。基于元路径的随机游走策略能够捕获不同节点类型之间的联系,并且确保不同类型节点的语义关系可以恰当的融合到skip-gram模型中。
在语义保持的表征学习方面,SC-GAN引入了一个关系感知的判别器和生成器,以区分服务节点之间的各种类型的语义关系。如图3所示,将服务异构信息网络上基于元路径ATA的节点输入GAN进行对抗训练,例如,给定节点服务1和一个关系,比如标注/被标注,判别器能够分辨出标签1和标签2,同时,为了更好的样本生成,引入一个广义生成器,可以生成例如标签'之类的假样本,其中,标签'可能并不属于V。标签'可能是标签2、标签3的“平均”,更类似于真正的样本标签1而不是标签2的假样本。
具体实施例一:
1.数据集预处理及实验设置
为评估模型,我们从ProgrammableWeb.com网站上爬取了17782个API的信息,包括它们的名称、描述文档、主次分类等信息,为了提高分类的精确度,我们首先要对这些服务的描述文档进行分词(tokenize)、去停用词(stop words)、词干化处理(stemming)等预处理。并分别选择前10、15、20、25和30个类别作为实验数据集。其中,数量最大的前30个类别的分布如表2所示。在实验中,我们选择80%的数据作为训练集,20%的数据作为测试集;随机游走次数为10,游走步长为20,表征维度大小d为128,窗口大小c为5。此外,为保证实验客观性,SC-GAN与其它方法之间共有的参数设置为相同值,而其余参数设置为默认最优值。
表2按数量排序的前30个类别
Figure BDA0003754611990000091
2.对比方法
(1)Node2ve:Node2vec类似于Deepwalk,该方法改进了随机游走策略,定义了两个参数p和q,在广度优先搜索(BFS)和深度优先搜索(DFS)中达到一个平衡,同时考虑到了局部和宏观的信息,并且具有较高的适应性。
(2)LINE:利用训练顶点之间一阶相似模型和二阶相似模型,采用边缘抽样方法测量服务节点之间的紧密程度,获得相似服务节点进行分类。
(3)Metapath2vec:专门针对异构图的网络表征学习方法,使用基于元路径随机游走构建节点的异质邻居,然后使用一个异质skip-gram训练模型,建模结构上和语义上相近的节点,用于保留语义的HIN嵌入。
(4)HERec:设计了一种类型约束策略来过滤节点序列以保留语义HIN嵌入。
3.实验结果
该实验分别测试了前10、15、20、25和30个服务类别情况下的分类效果,实验中,采用Macro F1值和Micro F1值作为性能评价指标。实验结果如表3所示。
表3不同模型的实验结果比较
Figure BDA0003754611990000101
从实验结果可以看出:SC-GAN方法在MicroF1、MacroF1指标上都优于四种基线方法。更具体地说:
(1)随着数据集所取分类的类别数增多,分类效果逐渐下降。其原因可能是:1)分类的类别数越多,包含的信息(噪声)就越多且越复杂,模型分类难度增大;2)分类是按照每个类别包含的API的数量进行排名的,而排名靠后的类别由于所包含的API数量的减少,其所能利用到的有用信息相对来说就会减少,从而影响分类效果。
(2)基于异构信息网络嵌入的方法(HERec、Metapath2vec),其分类效果要远优于传统的同构信息网络方法(LINE、Node2vec)。这是因为:服务的异构性更能保留丰富的语义,HERec和Metapath2vec将服务的异构信息以元路径的方式嵌入到了服务表征向量中。
(3)同时融合异构信息网络和生成对抗网络的方法SC-GAN,其表现要明显优于只使用单一异构信息的方法(HERec、Metapath2vec)。SC-GAN通过对抗性原理以更具鲁棒性的方式学习保留语义的表示形式,服务节点特征向量的表征往往就越准确,分类的效果也就会随之提升。
以25个服务类别为例,SC-GAN的生成器(Gen)和判别器(Dis)的学习曲线如图5所示。从图中可以看出:(1)损失函数变化,在损失发生最初的波动后,Gen和Dis开始进行Maxmin博弈,逐渐减少两者的损失,经过约20个时间单位的对抗训练后两者的损失趋于收敛,胜利者(即Dis)获得更好的表现;(2)分类性能,为了更准确评估SC-GAN模型的分类性能,最终选取判别器经对抗训练优化后的服务节点表征,经约20个时间单位后Micro_F1达到最大值,当训练更多的时间单位时,由于过度拟合,分类质量下降。
以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。

Claims (3)

1.一种融合异构信息网络与生成对抗网络的服务分类方法,其特征在于,包括如下步骤:
(1)服务异构信息网络构建及Metapath2vec网络表征:构建如下表1所示元路径,采用Metapath2vec模型计算出两两服务之间的嵌入表征,Metapath2vec通过基于元路径的随机游走及异构Skip-gram模型学习网络表征,捕获不同类型节点之间的语义和结构相关性;
表1 服务相关的元路径
Figure FDA0003754611980000011
(2)GAN对抗训练:SC-GAN主要由两个相互竞争的模块组成,即判别器和生成器,给定一个服务节点,生成器尝试生成与给定服务节点相关联的伪样本,以提供给判别器,判别器则尝试改进其参数来将假样本与实际连接到给定节点的真实样本分离,在这个重复的过程中,训练好的判别器会迫使生产器产生更好的假样本,而判别器则也会增强其判断能力,在这样的迭代过程中,生成器和判别器都得到正强化;
(3)服务分类:将SC-GAN模型的服务节点嵌入表征输入到一个完整的连接层中,并使用多元Logistic回归函数输出所有候选Web服务类别的概率分布;
Logistic回归用来预测一个具有类别分布的因变量不同可能结果的概率的模型,将多分类的输出值转换为相对概率,表示节点属于特定类别的概率,其计算方式见公式(10)。其中,k个模型分别预测训练数据属于那个类别的概率,k为候选Web服务类别数,w表示服务节点对应的权重矩阵,
Figure FDA0003754611980000021
表示向量的特征嵌入;
Figure FDA0003754611980000022
在模型训练过程中,对于所有K个可能的分类结果,运行K-1个独立二元逻辑回归模型,在运行过程中把其中一个类别看成是主类别,然后将其它K-1个类别和所选择的主类别分别进行回归运算;在对数似然取最大值等价于损失函数取最小值,其中,对数似然计算方式如下:
Figure FDA0003754611980000023
2.根据权利要求1所述的一种融合异构信息网络与生成对抗网络的服务分类方法,其特征在于:所述步骤(2)中,在TransE异构信息网络嵌入方法中,服务异构信息网络中的每一个三元组<s,r,v>(s和v表示两个关系相联的服务节点,r表示它们之间链接的边类型),两个服务节点的潜在向量表示为s和v∈V,关系的潜在向量表示r∈R;
生成器G(·;θG)利用了以下高斯分布从基础连续分布中生成样本:
Figure FDA0003754611980000024
其中,
Figure FDA0003754611980000025
Figure FDA0003754611980000026
分别表示生成器s∈v的服务节点嵌入和
Figure FDA0003754611980000029
的关系矩阵;
生成器的公式如下:
G(s,r;θG)=f(WL…f(W1e+b1)+bL)
从分布
Figure FDA0003754611980000027
中得出,W*和b*分别表示每一层的权重矩阵和偏差矢量,f是激活函数;
生成器的参数集为
Figure FDA0003754611980000028
即所有节点嵌入和关系矩阵以及MLP的参数的并集;
其中,λG>0控制正则项;
生成器参数θG通过最小化来优化:
Figure FDA0003754611980000031
3.根据权利要求2所述的一种融合异构信息网络与生成对抗网络的服务分类方法,其特征在于:所述步骤(2)中判别器D(ev|s,r;θD)评估服务节点对s和v的关系之间的连通性;
s∈v是给定的服务节点,
Figure FDA0003754611980000037
是来自HIN的给定关系,ev是样本服务节点的嵌入,θD表示D模型参数;
D在关系r下输出样本连接到服务的概率为:
Figure FDA0003754611980000032
其中,ev是样本的嵌入输入,
Figure FDA0003754611980000033
是服务节点s的可学习嵌入,
Figure FDA0003754611980000034
是关系r的可学习关系矩阵;
Figure FDA0003754611980000035
形成判别器D的模型参数,D为获得的所有服务节点嵌入和关系矩阵的并集;
当v是与s到r相关的正样本时,概率应该较高;当是负样本时,则概率应该较低;
样本v与给定的服务s和关系r形成三元组<s,r,v>,并且每个三元组在极性方面都属于以下三种情况之一,在有条件的GAN的启发下,每种情况也导致了一部分判别器损失:
情况1:在给定关系下连接,即:服务节点和样本确实通过
Figure FDA0003754611980000038
上的正确关系连接,这样的三元组被认为是正向的,用下面的损失来建模。
Figure FDA0003754611980000036
情况2:连接关系不正确,s和v在HIN中以错误的关系r′≠r连接,由于它们的关联性与给定关系r所携带的期望语义不匹配,该判别器也将它们标记为负。这部分损失定义如下:
Figure FDA0003754611980000041
情况3:来自关系感知生成器的假服务节点,给定一个服务节点,它可以与生成器提供的服务节点形成假对,,判别器旨在将该三元组标识为负数,表示如下:
Figure FDA0003754611980000042
其中,伪样本v的嵌入e′v是从生成器G的学习分布中提取的;
整合以上三个部分训练判别器:
Figure FDA0003754611980000043
其中,λD>0控制正则项以避免过度拟合,判别器的参数θD可以通过最小化
Figure FDA0003754611980000044
来优化。
CN202210856551.2A 2022-07-20 2022-07-20 一种融合异构信息网络与生成对抗网络的服务分类方法 Pending CN115238073A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210856551.2A CN115238073A (zh) 2022-07-20 2022-07-20 一种融合异构信息网络与生成对抗网络的服务分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210856551.2A CN115238073A (zh) 2022-07-20 2022-07-20 一种融合异构信息网络与生成对抗网络的服务分类方法

Publications (1)

Publication Number Publication Date
CN115238073A true CN115238073A (zh) 2022-10-25

Family

ID=83673660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210856551.2A Pending CN115238073A (zh) 2022-07-20 2022-07-20 一种融合异构信息网络与生成对抗网络的服务分类方法

Country Status (1)

Country Link
CN (1) CN115238073A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115617694A (zh) * 2022-11-30 2023-01-17 中南大学 基于信息融合的软件缺陷预测方法、系统、设备及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115617694A (zh) * 2022-11-30 2023-01-17 中南大学 基于信息融合的软件缺陷预测方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
Razavi-Far et al. Similarity-learning information-fusion schemes for missing data imputation
Cavallari et al. Embedding both finite and infinite communities on graphs [application notes]
Liu et al. A new incomplete pattern classification method based on evidential reasoning
Mantovani et al. To tune or not to tune: recommending when to adjust SVM hyper-parameters via meta-learning
CN112906770A (zh) 一种基于跨模态融合的深度聚类方法及系统
CN112417097A (zh) 一种用于舆情解析的多模态数据特征提取与关联方法
CN113869424A (zh) 基于双通道图卷积网络的半监督节点分类方法
Zhou et al. Betweenness centrality-based community adaptive network representation for link prediction
CN115238073A (zh) 一种融合异构信息网络与生成对抗网络的服务分类方法
CN116206327A (zh) 一种基于在线知识蒸馏的图像分类方法
Fan et al. A two-layer Wang-Mendel fuzzy approach for predicting the residuary resistance of sailing yachts
Lonij et al. Open-world visual recognition using knowledge graphs
González-Almagro et al. Semi-supervised constrained clustering: An in-depth overview, ranked taxonomy and future research directions
Wang et al. Photo to family tree: Deep kinship understanding for nuclear family photos
Stracuzzi et al. Quantifying Uncertainty to Improve Decision Making in Machine Learning.
Darling et al. Toward uncertainty quantification for supervised classification
Woo et al. Tackling the challenges in scene graph generation with local-to-global interactions
Moholkar et al. Lioness adapted GWO-based deep belief network enabled with multiple features for a novel question answering system
Liu et al. Learning implicit labeling-importance and label correlation for multi-label feature selection with streaming labels
Xue et al. Solution transfer in evolutionary optimization: An empirical study on sequential transfer
Zhang et al. Multi-component Similarity Graphs for Cross-network Node Classification
CN113159976B (zh) 一种微博网络重要用户的识别方法
Adib et al. Ckh: Causal knowledge hierarchy for estimating structural causal models from data and priors
CN114529096A (zh) 基于三元闭包图嵌入的社交网络链路预测方法及系统
Prajapati et al. A survey of link prediction in social network using deep learning approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination