CN114896514A - 一种基于图神经网络的Web API标签推荐方法 - Google Patents

一种基于图神经网络的Web API标签推荐方法 Download PDF

Info

Publication number
CN114896514A
CN114896514A CN202210825930.5A CN202210825930A CN114896514A CN 114896514 A CN114896514 A CN 114896514A CN 202210825930 A CN202210825930 A CN 202210825930A CN 114896514 A CN114896514 A CN 114896514A
Authority
CN
China
Prior art keywords
web api
meta
path
information
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210825930.5A
Other languages
English (en)
Other versions
CN114896514B (zh
Inventor
徐悦甡
赵新瑜
李�瑞
蒋志平
黑蕾
邱志博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202210825930.5A priority Critical patent/CN114896514B/zh
Publication of CN114896514A publication Critical patent/CN114896514A/zh
Application granted granted Critical
Publication of CN114896514B publication Critical patent/CN114896514B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于图神经网络的Web API标签推荐方法,包括:根据元路径从Web API数据中抽取出Web API节点的邻居节点,将其映射到欧几里德空间中。使用注意力机制将各邻居节点的向量表示聚合,得到局部聚合信息;使用注意力机制将不同元路径下局部聚合信息进行聚合,得到语义信息;将语义信息输入多标签分类器中,完成对Web API的标签推荐。本发明使用图神经网络,每次从Web API节点中抽取邻居节点,避免了数据稀疏性问题;聚合了Web API节点的局部结构信息和语义信息,提高了服务查找结果的精确性,减少了推荐模型的计算量,解决了物品冷启动问题。

Description

一种基于图神经网络的Web API标签推荐方法
技术领域
本发明涉及软件工程技术领域,尤其是一种基于图神经网络的Web API标签推荐方法。
背景技术
随着信息产业的快速发展,海量Web API的管理是一个影响广泛的问题。Web API的提供者要消耗大量的精力才能从海量的Web API标签中选择合适的标签分配给Web API;而开发人员同样需要消耗大量的精力才能从海量的Web API中选择合适的Web API进行使用。
标签推荐任务可以分为两个子任务:以对象为中心的标签推荐和个性化标签推荐。个性化标签推荐的任务是利用用户不同的背景和偏好信息,为该用户浏览过的目标对象推荐相对应的标签,通过向不同背景和偏好的用户推荐个性化的标签来获得用户的反馈,从而消除标签的语义差异来改善用户体验,提高用户的满意度。相比之下,以对象为中心的标签推荐任务更多考虑的是标签与目标对象之间的关联性。以对象为中心的标签推荐任务不考虑用户的偏好信息,总是为一个目标对象推荐相同的标签,目的是提高目标对象的标签质量,提高标签和目标对象之间的关联系,为目标对象推荐可靠、准确的标签。
现有技术中采用了多种API标签的推荐方法,例如:
由江苏幻网软件科技有限公司申请的“一种基于随机游走的服务和标签推荐方法”(申请号:201210206198.X)所采用的方案为:方法包括服务推荐步骤以及标签推荐步骤,服务推荐步骤包括:搜集Mashup服务和Web API服务的信息,用关联网抽象它们之间的关系,在标签之间的共现网上进行随机游走之后给每个标签列表排序,再利用标签和Mashup服务之间的关联关系以及Mashup语义扩充的方法对Mashup服务进行推荐。标签推荐步骤包括:利用Web API服务描述文本的相似性找最近邻,再随机游走标签排序的方法进行Web API服务的标签推荐。该方法的缺点是,并未充分利用数据本身的信息,如Mashup的使用者、包含相同Web API的Mashup等信息,且基于随机游走的方式在训练阶段会消耗大量的时间以及硬件资源。
再例如,由焦点科技股份有限公司申请的“一种融合文本相似度和协同过滤的标签推荐方法和系统”(申请号:202111059171.8)所采用的方案为:方法包括步骤一:生成标签知识库;步骤二:物品标签映射得到物品标签相似度矩阵;步骤三:计算用户标签相似度矩阵;步骤四:计算物品协同相似矩阵和用户协同相似矩阵;步骤五:计算用户对物品的兴趣预测评分。该方法的缺点是,物品标签相似度矩阵、用户标签相似度矩阵、物品协同相似矩阵和用户协同相似矩阵稀疏性强,生成预测评分时计算量大。
再例如,由西安交通大学申请的“一种融合节点偏好的异构图歌单多标签推荐方法”(申请号:202110477214.8)采用的方案为:通过歌单训练集的异构数据构建歌单异构图;通过歌单异构图,对每个歌单进行融合节点偏好的邻居采样,得到包含歌曲邻居特征的歌单信息和包含歌手邻居特征的歌单信息;包含歌曲邻居特征的歌单信息和包含歌手邻居特征的歌单信息使用 word2vec 技术进行歌单连续特征表示;采用谱聚类算法对歌单的连续特征表示进行聚类分析,得到歌单聚类结果;根据歌单聚类结果,计算出每类中各导航类标签的权重值,再使用局部敏感哈希技术,完成对目标歌单的标签推荐。该方法的缺点是,分类信息依赖于word2vec 生成的歌单连续特征表示的质量,且未充分利用异构图中包含的丰富的语义信息。
发明内容
本发明的发明目的在于:针对上述存在的问题,提供一种基于图神经网络的WebAPI标签推荐方法,以减少模型的计算量,解决数据稀疏性问题,提高服务查找结构的精确度。
本发明采用的技术方案如下:
一种基于图神经网络的Web API标签推荐方法,包括以下步骤:
元路径构建步骤:以元路径为维度,构建Web API节点在各元路径下的邻居节点序列;
元路径内融合步骤:对于每一个邻居节点序列,以各邻居节点的权重聚合该邻居节点序列,得到局部聚合信息;
元路径间融合步骤:以各元路径的权重对Web API节点的各局部聚合信息进行聚合,得到语义信息;
标签推荐步骤:根据语义信息得到Web API标签。
进一步的,所述元路径构建步骤包括:
从异质信息网络中分别提取Web API节点在各元路径下的邻居节点;
以元路径为维度分别构建邻居节点序列;
将各邻居节点序列分别转换到欧几里德空间内表示。
进一步的,所述元路径内融合步骤包括:
对于每一个邻居节点序列,分别计算各邻居节点的权重;
根据各邻居节点的权重聚合该邻居节点序列,得到对应的局部聚合信息;
对局部聚合信息进行表达能力增强。
进一步的,所述根据各邻居节点的权重聚合邻居节点序列的步骤中,包括对局部聚合信息进行归一化处理的过程。
进一步的,所述元路径间融合步骤包括:
分别计算各元路径的权重;
根据各元路径的权重对Web API节点的各局部聚合信息进行聚合,得到语义信息;
对语义信息进行表达能力增强。
进一步的,所述分别计算各元路径的权重,包括:
聚合Web API节点在各元路径下的局部聚合信息;
根据聚合结果分别计算各元路径的权重。
进一步的,所述元路径内聚合步骤和/或元路径间聚合步骤中,聚合的过程采用输入顺序不影响输出结果的聚合机制。
进一步的,所述标签推荐步骤使用多标签分类器为Web API节点分配Web API标签。
进一步的,所述多标签分类器为:
Figure 100002_DEST_PATH_IMAGE001
其中,
Figure 197859DEST_PATH_IMAGE002
是Web API节点n a 的预测标签序列;
Figure 100002_DEST_PATH_IMAGE003
是输入的语义信息;L1和L2是线性变换矩阵,参数随机初始化;top(x,k)是一个函数,将x中最大的k个数置为1,其余的置为0;sigmoid (x)ReLU(x)均为激活函数。
或者,所述标签推荐步骤使用循环神经网络为Web API节点生成Web API标签。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
与现有技术相比,本发明将Web API 数据构建为异质信息网络,使用图神经网络,每次从 Web API节点中抽取邻居节点,避免了数据稀疏性问题;聚合了 Web API 节点的局部结构信息和语义信息,提高了服务查找结果的精确性,减少了推荐模型的计算量,解决了物品冷启动问题。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是异质信息网络架构及实例。
图2是元路径及元路径实例。
图3是本发明基于图神经网络的Web API标签推荐模型架构图。
图4是本发明基于图神经网络的Web API标签推荐模型的性能测试指标示图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
此处先对本发明的理论进行简要说明。
在真实的 Web API 数据中,每条 Web API 记录都含有使用者、提供者以及标签信息,这些不同类型的对象以及它们之间关系包含有丰富的信息。对于这些信息,可采用同质信息网络或异质信息网络进行建模。同质信息网络不区分数据中所包含的对象以及对象之间的关系类别,这种建模方式粗暴的将所有的对象以及对象之间的关系视为同一种,会导致大量的信息丢失。与同质信息网络不同的是,异质信息网络保留了对象以及对象之间的关系类别,将它们视为不同种类,这种建模方式能够很好的保留数据中的丰富的信息。
本发明将Web API数据构建为含有:Web API、使用者、提供者、标签四种不同类型对象(节点);API-使用者(A-U)/使用者-API(U-A)、API-提供者(A-P)/提供者-API(P-A) 、API-标签(A-T)/标签-API(T-A)三种不同类型关系的异质信息网络。异质信息网络图架构以及实例如图 1 所示。
本发明还涉及到元路径的知识。元路径是一个实体类型和关系交替的序列,即元路径实际上是一个对象节点与具体边的交替序列,依据不同类型对象的关系,可简单归类为三种元路径:APA、AUA以及UAPAU。不同的元路径具有不同的语义信息,如元路径AUA表示被同一个使用者所使用的 Web API,元路径APA表示同一个提供者所提供的 Web API,而UAPAU表示使用同一个提供者所提供的 Web API 的用户。不同长度的元路径具有不同复杂度的语义信息,长元路径所表示的语义信息比短元路径所表示的语义信息更加复杂。元路径以及元路径实例如图 2 所示。
实施例一
本实施例提供了一种基于图神经网络的Web API标签推荐方法,其流程如图3所示,包括:
S1、元路径构建步骤。
该步骤以元路径为维度,构建Web API节点在各元路径下的邻居节点序列。
在一些实施方式中,该步骤包括:
S1.1、从异质信息网络中分别提取Web API节点在各元路径下的邻居节点。
前文说过,异质信息网络包含有丰富的对象关系,本实施例从异质信息网络中提取三个元路径下的Web API节点n a 的邻居节点。
S1.2、以元路径为维度分别构建邻居节点序列。
对于每一条元路径,将提取出的各邻居节点组织成一个邻居节点序列,后续生成该Web API节点的标签。
对于任一元路径p,有p∈{AUA, APA,UAPAU},该元路径下的邻居节点序列为:
Figure 219911DEST_PATH_IMAGE004
其中,
Figure DEST_PATH_IMAGE005
是Web API节点n a 在元路径p下的邻居节点序列。以图2所示的实例为例,对于一个 Web API节点Apple Camera,它在元路径AUA 下的邻居节点序列是
Figure 26193DEST_PATH_IMAGE006
= {n rezwan ,n lenonardturpin ,…,n rbcafe }。
S1.3、将各邻居节点序列分别转换到欧几里德空间内表示。
由于异质信息网络中的节点是表示在非欧几里德空间中的,而神经网络只能接受欧几里德空间的输入,因此,需要将异质信息网络中的节点从非欧几里德空间映射到欧几里德空间。
将S1.2得到的邻居节点序列
Figure 935243DEST_PATH_IMAGE005
经过映射处理,得到其在欧几里德空间的向量表示。对于一个Web API节点n,有:
Figure DEST_PATH_IMAGE007
其中,
Figure 801568DEST_PATH_IMAGE008
是节点n在欧几里德空间中的向量表示,embedding()为转换到欧几里德空间的嵌入函数。|N|是异质信息网络中节点的个数。d是节点向量表示的维度。因此,给定一个节点,它的邻居节点序列S经过映射处理后,可以得到E={e1,e2,…, el}。
在一些实施方式中,可以通过配置一个嵌入层来实现非欧几里德空间到欧几里德空间的映射,上述的各元路径下的邻居节点序列经过该嵌入层后,即可得到对应的欧几里德空间的向量表示。
S2、元路径内融合步骤。
在本步骤中,对于每一个邻居节点序列,以各邻居节点的权重聚合Web API节点的局部结构信息。
图具有置换不变性,不论图中节点编号的顺序,图的结构不会发生改变;且图与图像不同,图像中某个像素点的周围像素点的个数是确定的,而图中节点的邻居节点的数目是不定的。图是使用邻接矩阵保存的,图中节点的编号是任意的。不同的顺序的节点编号会导致同一个图的邻接矩阵互不相同,然而这些邻接矩阵经过初等变换最终会变为相同的矩阵。图的置换不变性要求本发明的模型可以接受任意顺序的输入而输出相同的结果,即模型的输入顺序与输出结果无关;图中节点的邻居节点数目的不定性要求本发明的模型可以接受任意长度的输出序列,有:
Figure DEST_PATH_IMAGE009
其中F(x)是一个可以接受不同数量参数的函数。
节点n的邻居节点序列S n 表示了节点n在异质信息网络中的局部结构信息。在节点序列S n 中每个邻居节点n i S n 对节点n的局部结构信息的贡献度不同,当本发明聚合节点n的局部结构信息时,本发明需要确定每个邻居节点n i 对节点n的局部结构信息的贡献度,即每个邻居节点n i 对节点n的局部结构信息的权重。为帮助理解邻居节点的权重设计的目的,本实施例进行了举例说明,例如,一个云计算领域的资深开发人员所调用的 API 大部分都应该是云计算领域的 API,当确定这个开发人员所擅长的领域时,云计算领域的 API 的贡献度应该比非云计算领域的 API 大。
注意力机制实际上就是将人的感知方式、注意力的行为应用在机器上,让机器学会去感知数据中重要和不重要的部分。如人在观察一张图片时,人们很难全面的观察图片中所有的部分,而会将大部分的注意力集中在某个部分上。而且注意力机制也是顺序无关的,满足本发明的需求,因此,对于邻居节点权重的计算以及对各邻居节点的聚合,本发明采用注意力机制实现,由此可以解决图的置换不变性以及自动地计算出不同的邻居节点的权重,从而聚合节点n的局部结构信息。
S2.1、对于每一个邻居节点序列,分别计算各邻居节点的权重。
经过元路径构建步骤后,对于Web API节点n a ,可得
Figure 796068DEST_PATH_IMAGE010
。本步骤分别计算Web API节点n a 在不同元路径p下的邻居节点序列
Figure 140462DEST_PATH_IMAGE005
中每个邻居节点的注意力分数,即每个邻居节点的权重:
Figure DEST_PATH_IMAGE011
Figure 920330DEST_PATH_IMAGE012
其中,
Figure DEST_PATH_IMAGE013
分别是元路径p的查询矩阵、关键矩阵、值矩阵,它们的参数是被随机初始化的,q p 、k p 、val p 分别是对应查询矩阵、关键矩阵、值矩阵的中间计算参数,供其他计算式使用。d’是注意力层的隐维度。
Figure 223136DEST_PATH_IMAGE014
中每个邻居节点的注意力分数。softmax(x)是一种激活函数,它可以将一个数值向量x归一化为一个概率分布向量,且各个概率之和为 1。
S2.2、根据各邻居节点的权重聚合该邻居节点序列,得到对应的局部聚合信息,即聚合Web API节点的局部结构信息的向量表示。参见附图3,聚合的过程可通过配置注意力层来实现,该注意力层执行注意力机制以执行局部结构信息的聚合过程。
前文计算出了各邻居节点的注意力分数,本步骤根据注意力分数a p 聚合Web API节点n a 在元路径p下的邻居节点序列
Figure 439354DEST_PATH_IMAGE005
中每个邻居节点信息,即聚合Web API节点n a 在元路径p下的局部结构信息,得到元路径p下的局部聚合信息。
Figure DEST_PATH_IMAGE015
其中,
Figure 853017DEST_PATH_IMAGE016
是 Web API节点n a 在元路径p下的邻居节点序列
Figure 471080DEST_PATH_IMAGE005
中每个邻居节点聚合之后的向量表示,即Web API节点n a 在元路径p下的邻居节点序列
Figure 931405DEST_PATH_IMAGE005
对应的局部聚合信息。norm(x)是一个归一化函数,它可以将每个训练样本归一化到一个相同的分布上,即对局部聚合信息增加了归一化处理的过程,以起到平滑损失平面、加速收敛的作用。
S2.3、对局部聚合信息进行表达能力增强。
上述聚合出局部聚合信息后,为了增强聚合局部结构信息后所得到的局部聚合信息
Figure 634919DEST_PATH_IMAGE016
,本发明将
Figure 321115DEST_PATH_IMAGE016
输入一个前馈神经网络层中。
Figure DEST_PATH_IMAGE017
其中,
Figure 324843DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE019
是变换矩阵,它们的参数是随机初始化的。sigmoid(x)ReLU (x)都是一种激活函数,增强模型的非线性表达能力。
本步骤中,对于每一个邻居节点序列,均需要进行元路径内融合步骤,得到对应的局部聚合信息。
S3、元路径间融合步骤。
对于每一个Web API节点,经上述步骤S2后,其在各元路径下均会得到对应的局部聚合信息。前文已经提到,不同的元路径具有不同的语义表示,这些不同的元路径对所表示的语义信息的重要程度不一致,本步骤仍采用注意力机制以各元路径的权重(对应各局部聚合信息的权重)对Web API节点的各局部聚合信息进行聚合,得到语义信息。
S3.1、分别计算各元路径的权重。
本步骤将计算每条元路径对最终语义信息的贡献度,即每条元路径的权重。在一些实施方式中,聚合Web API节点在各元路径下的聚合结构信息局部聚合信息,根据聚合结果计算每条元路径的权重a,具体如下:
Figure 969451DEST_PATH_IMAGE020
其中,
Figure DEST_PATH_IMAGE021
是将 Web API节点n a 经过元路径内融合所得到的在不同元路径p下向量表示的聚合。
Figure 176573DEST_PATH_IMAGE022
分别查询矩阵、关键矩阵、值矩阵,它们的参数是被随机初始化的,q、k、val分别为对应查询矩阵、关键矩阵、值矩阵的中间计算参数,供其他计算式使用。d’’是注意力层的隐维度。
Figure DEST_PATH_IMAGE023
是元路径的注意力分数,即每条元路径的权重。
S3.2、根据各元路径的权重对Web API节点的在每条元路径下的局部聚合信息进行聚合,得到语义信息,即聚合了元路径局部聚合信息的Web API节点的向量表示。同样的,可通过配置一注意力层来执行局部聚合信息的聚合过程。
Figure 932039DEST_PATH_IMAGE024
其中,
Figure DEST_PATH_IMAGE025
是 API节点n a 聚合元路径语义信息后的向量表示。
S3.3、对语义信息进行表达能力增强。
在本步骤最后,本实施例将
Figure 524695DEST_PATH_IMAGE025
输入一个前馈神网络层增强
Figure 340204DEST_PATH_IMAGE025
的表示能力。
Figure 18310DEST_PATH_IMAGE026
其中,
Figure DEST_PATH_IMAGE027
为增强后的语义信息,W 1 W 2 是变换矩阵,它们的参数是随机初始化的。
S4、标签推荐步骤。
本步骤根据前述步骤聚合的语音信息得到Web API节点的Web API标签。在具体实施中,Web API标签可以通过神经网络生成,也可通过分类器推荐。
在一些实施方式中,标签推荐步骤使用多标签分类器为Web API节点分配Web API标签。
一个 Web API同时具有多个标签,因此给 Web API分配标签是多标签分类问题。多标签分类问题有区别于二分类问题和多分类问题。二分类问题是,存在两个种类,任何一个对象都属于两者其中一种;而多分类问题是,存在两个以上的种类,任何一个对象属于多个类别其中的一种,但是每个对象同时只能属于其中一种,不能同时属于多个类别。对此,本实施例提供了一种多标签分类器,将语义信息
Figure 561156DEST_PATH_IMAGE027
输入该多标签分类器中,输出对应的Web API标签。该多标签分类器为:
Figure 8317DEST_PATH_IMAGE028
其中,
Figure 463570DEST_PATH_IMAGE002
是Web API节点n a 的预测标签序列;
Figure 894551DEST_PATH_IMAGE003
是输入的语义信息;L1和L2是线性变换矩阵,参数随机初始化;top(x,k)是一个函数,将x中最大的k个数置为1,其余的置为0,k的值通过配置设定。
而在另一些实施方式中,标签推荐步骤使用循环神经网络为Web API节点生成WebAPI标签。该循环神经网络前期已对训练样本进行学习,所输入的训练样本为由大量语义信息和对应标签构成的样本集,之后,将待推荐标签的Web API节点的异质信息网络执行前述各步骤后,将对应语义信息输入到循环神经网络,以得到推荐的Web API标签。
实施例二
本实施例公开了另一种基于图神经网络的Web API标签推荐方法,其与实施例一所提供的的方法大致相同,不同之处在于,在本实施例中,在元路径内融合步骤、元路径间融合步骤中,原用于计算对象权重和融合所使用的注意力机制替换为求和、均值池化、最大池化、最小池化等输入顺序不影响输出的聚合机制。
实施例三
本实施例对本发明的基于图神经网络的Web API标签推荐系统,包括元路径构建模块、元路径内融合模块、元路径间融合模块以及推荐输出模块,其中,元路径构建模块被配置为执行实施例一中的元路径构建步骤,元路径内融合模块被配置为执行实施例一中的元路径内融合步骤,元路径间融合模块被配置为执行实施例一中的元路径间融合步骤,推荐输出模块被配置为执行实施例一中的标签推荐步骤。
实施例四
本实施例提供了对本发明基于图神经网络的Web API标签推荐方案进行效果验证的实例。
GoT为本发明的标签推荐方法/系统对应的模型,GoT@pp∈{ NoneAUA, APA,UAPAU}表示模型忽略了元路径p。图4展示了模型在 F1、精准率 和 召回率 的分数。GoT@AUA的 F1、精准率、召回率 在四种情况下都是最高的;然而当k = 10时,GoT@AUA的三个指标上都比其他模型差,其原因可能是,本数据集包含大量的 API-使用者关系,忽略了元路径AUA会导致大量的局部结构信息和语义信息丢失,导致模型性能指标低于其他情况。GoT@UAPAUk = 3到k = 10的三个指标都比其他的情况差,因为元路径UAPAU是一条长元路径,其中包含复杂的局部结构信息和语义信息,不考虑元路径UAPAU会丢失大量的局部结构信息和语义信息。当k = 5时,GoT@APA的 F1 从 0.2560 下降到 0.2427,而GoT@None的 F1则从 0.2525 上升到了0.2582;当k = 7时,GoT@APA的F1从0.2427增加到了0.2518,而GoT@None的 F1 则从 0.2582 减少到 0.2326。这两个模型的趋势是相反的,这可以说明元路径APA提供的局部结构信息和语义信息对模型的最终性能没有明显的贡献,甚至可能有相反的效果。
表1、表2和表3显示了模型在使用不同比例数据集情况下四个模型的F1(准确率和召回率的调和指标)、精准率、召回率的分数。在使用不同比例的训练集训练后,GoT@UAPAU的三个指标都低于其他三个模型,这进一步证明了长元路径中包含的复杂的局部结构信息和语义信息能够很好地保证模型的性能。用不同比例的训练集训练后,GoT@None的性能指标几乎是最好的一个,尤其是用30%的训练集训练后,其性能指标都是最好的,F1比最低的高0.0194,精准率比最低的高0.0139,召回率比最低的高0.0344。这一证明表明,元路径中包含的丰富语义信息确实可以提高标签推荐任务的准确性,特别是在数据相对稀缺的情况下,元路径中包含的语义信息可以很好地提高模型的性能。当训练数据从90%减少到30%时,GoT@None的F1从0.1685下降到0.1421,下降了15.67%;精准率从0.1216下降到0.1022,下降了15.95%;召回率从0.2935下降到0.2509,下降了4.56%。在相同条件下,GoT@UAPAU的F1从0.1679下降到0.1227,下降了26.92%。精准率从0.1215下降到0.0883,下降了27.33%;召回率从0.2940下降到0.2165,下降了26.32%。与90%的训练样本相比,在30%的训练样本下,GoT@None降低了F1和精准率不到16%,召回率不到5%,而GoT@UAPAU降低了所有三个指标超过25%。这一观察结果表明,在面对有限的训练样本量时,丰富的局部结构信息和语义信息可以明显地提高模型的性能。GoT@APA的性能落后于GoT@None,当使用更多的训练样本时,GoT@APA的一些指标超过了GoT@None,当只使用30%的训练样本时,其F1低于GoT@None的0.0082,精准率低了0.0062、召回率低了0.0130。可以看出,当元路径中包含的局部结构信息和语义信息较弱时,它对提高模型的性能影响较小。
Figure DEST_PATH_IMAGE029
根据以上分析,可以得出结论:不同的元路径包含不同的局部结构信息和语义信息,它对模型的性能有不同的影响。长元路径比短元路径所包含的局部结构信息和语义信息更复杂,这可以明显提高模型的性能。本发明的方案充分考虑了异质信息网络所包含的节点关系,以及各邻居节点对标签推荐的贡献,由此可知本发明的方案所推荐的标签是客观准确的。此外,充分利用数据中的固有信息可以很好地提高模型的性能,尤其是在训练样本稀少的情况下,这对模型的性能提高有很大的意义,可以较好地解决冷启动问题。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。

Claims (10)

1.一种基于图神经网络的Web API标签推荐方法,其特征在于,包括:
元路径构建步骤:以元路径为维度,构建Web API节点在各元路径下的邻居节点序列;
元路径内融合步骤:对于每一个邻居节点序列,以各邻居节点的权重聚合该邻居节点序列,得到局部聚合信息;
元路径间融合步骤:以各元路径的权重对Web API节点的各局部聚合信息进行聚合,得到语义信息;
标签推荐步骤:根据语义信息得到Web API标签。
2.如权利要求1所述的基于图神经网络的Web API标签推荐方法,其特征在于,所述元路径构建步骤包括:
从异质信息网络中分别提取Web API节点在各元路径下的邻居节点;
以元路径为维度分别构建邻居节点序列;
将各邻居节点序列分别转换到欧几里德空间内表示。
3.如权利要求1所述的基于图神经网络的Web API标签推荐方法,其特征在于,所述元路径内融合步骤包括:
对于每一个邻居节点序列,分别计算各邻居节点的权重;
根据各邻居节点的权重聚合该邻居节点序列,得到对应的局部聚合信息;
对局部聚合信息进行表达能力增强。
4.如权利要求3所述的基于图神经网络的Web API标签推荐方法,其特征在于,根据各邻居节点的权重聚合邻居节点序列的步骤中,包括对局部聚合信息进行归一化处理的过程。
5.如权利要求1所述的基于图神经网络的Web API标签推荐方法,其特征在于,所述元路径间融合步骤包括:
分别计算各元路径的权重;
根据各元路径的权重对Web API节点的各局部聚合信息进行聚合,得到语义信息;
对语义信息进行表达能力增强。
6.如权利要求5所述的基于图神经网络的Web API标签推荐方法,其特征在于,所述分别计算各元路径的权重,包括:
聚合Web API节点在各元路径下的局部聚合信息;
根据聚合结果分别计算各元路径的权重。
7.如权利要求3或5所述的基于图神经网络的Web API标签推荐方法,其特征在于,所述元路径内聚合步骤和/或元路径间聚合步骤中,聚合的过程采用输入顺序不影响输出结果的聚合机制。
8.如权利要求1所述的基于图神经网络的Web API标签推荐方法,其特征在于,所述标签推荐步骤使用多标签分类器为Web API节点分配Web API标签。
9.如权利要求8所述的基于图神经网络的Web API标签推荐方法,其特征在于,所述多标签分类器为:
Figure DEST_PATH_IMAGE001
其中,
Figure 585489DEST_PATH_IMAGE002
是Web API节点n a 的预测标签序列;
Figure DEST_PATH_IMAGE003
是输入的语义信息;L1和L2是线性变换矩阵,参数随机初始化;top(x,k)是一个函数,将x中最大的k个数置为1,其余的置为0;sigmoid (x)ReLU(x)均为激活函数。
10.如权利要求1所述的基于图神经网络的Web API标签推荐方法,其特征在于,所述标签推荐步骤使用循环神经网络为Web API节点生成Web API标签。
CN202210825930.5A 2022-07-14 2022-07-14 一种基于图神经网络的Web API标签推荐方法 Active CN114896514B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210825930.5A CN114896514B (zh) 2022-07-14 2022-07-14 一种基于图神经网络的Web API标签推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210825930.5A CN114896514B (zh) 2022-07-14 2022-07-14 一种基于图神经网络的Web API标签推荐方法

Publications (2)

Publication Number Publication Date
CN114896514A true CN114896514A (zh) 2022-08-12
CN114896514B CN114896514B (zh) 2022-09-30

Family

ID=82729714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210825930.5A Active CN114896514B (zh) 2022-07-14 2022-07-14 一种基于图神经网络的Web API标签推荐方法

Country Status (1)

Country Link
CN (1) CN114896514B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115729532A (zh) * 2023-01-10 2023-03-03 西安电子科技大学 基于生成对抗网络的Java程序方法名推荐方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140310053A1 (en) * 2013-04-10 2014-10-16 Xerox Corporation Method and systems for providing business process suggestions and recommendations utilizing a business process modeler
CN111259388A (zh) * 2020-01-09 2020-06-09 中山大学 一种基于图卷积的恶意软件api调用序列检测方法
CN112861006A (zh) * 2021-02-22 2021-05-28 中国科学院计算技术研究所 融合元路径语义的推荐方法及系统
CN112990431A (zh) * 2021-02-25 2021-06-18 电子科技大学 一种基于异质图神经网络的邻域探索方法
CN113723608A (zh) * 2021-08-31 2021-11-30 昆山清社网络科技有限公司 基于迭代知识蒸馏的异质图神经网络模型构建方法
CN113836395A (zh) * 2021-08-30 2021-12-24 河南大学 一种基于异构信息网络的服务开发者按需推荐方法及系统
CN114238750A (zh) * 2021-11-18 2022-03-25 浙江工业大学 基于异构网络信息嵌入模型的交互可视推荐方法
CN114398462A (zh) * 2022-03-24 2022-04-26 之江实验室 一种基于多源异构信息网络的目的地推荐方法及系统
CN114416159A (zh) * 2022-04-01 2022-04-29 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于信息增强调用序列的api推荐方法及装置
CN114676331A (zh) * 2022-03-31 2022-06-28 广东外语外贸大学 一种基于异质信息网络元路径的api推荐方法
CN114741429A (zh) * 2022-04-20 2022-07-12 西安电子科技大学 一种基于图神经网络的Web API关联模式挖掘方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140310053A1 (en) * 2013-04-10 2014-10-16 Xerox Corporation Method and systems for providing business process suggestions and recommendations utilizing a business process modeler
CN111259388A (zh) * 2020-01-09 2020-06-09 中山大学 一种基于图卷积的恶意软件api调用序列检测方法
CN112861006A (zh) * 2021-02-22 2021-05-28 中国科学院计算技术研究所 融合元路径语义的推荐方法及系统
CN112990431A (zh) * 2021-02-25 2021-06-18 电子科技大学 一种基于异质图神经网络的邻域探索方法
CN113836395A (zh) * 2021-08-30 2021-12-24 河南大学 一种基于异构信息网络的服务开发者按需推荐方法及系统
CN113723608A (zh) * 2021-08-31 2021-11-30 昆山清社网络科技有限公司 基于迭代知识蒸馏的异质图神经网络模型构建方法
CN114238750A (zh) * 2021-11-18 2022-03-25 浙江工业大学 基于异构网络信息嵌入模型的交互可视推荐方法
CN114398462A (zh) * 2022-03-24 2022-04-26 之江实验室 一种基于多源异构信息网络的目的地推荐方法及系统
CN114676331A (zh) * 2022-03-31 2022-06-28 广东外语外贸大学 一种基于异质信息网络元路径的api推荐方法
CN114416159A (zh) * 2022-04-01 2022-04-29 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于信息增强调用序列的api推荐方法及装置
CN114741429A (zh) * 2022-04-20 2022-07-12 西安电子科技大学 一种基于图神经网络的Web API关联模式挖掘方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUESHEN XU ET AL.: ""Collaborative APIs recommendation for Artificial Intelligence of Things with informaiton fusion"", 《FUTURE GENERATION COMPUTER SYSTEMS》 *
蒋宗礼 等: ""基于融合元路径权重的异质网络表征学习"", 《计算机系统应用》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115729532A (zh) * 2023-01-10 2023-03-03 西安电子科技大学 基于生成对抗网络的Java程序方法名推荐方法及系统

Also Published As

Publication number Publication date
CN114896514B (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
Xie et al. Factorization machine based service recommendation on heterogeneous information networks
CN112488791A (zh) 一种基于知识图谱卷积算法的个性化推荐方法
CN111382283B (zh) 资源类别标签标注方法、装置、计算机设备和存储介质
WO2021227091A1 (zh) 一种基于图卷积神经网络的多模态分类方法
Du et al. Classification by multi-semantic meta path and active weight learning in heterogeneous information networks
CN114896514B (zh) 一种基于图神经网络的Web API标签推荐方法
CN116127177A (zh) 一种利用知识图谱嵌入负采样优化的推荐方法
Chen et al. RRGCCAN: Re-ranking via graph convolution channel attention network for person re-identification
Zhou et al. Betweenness centrality-based community adaptive network representation for link prediction
Fu et al. Collaborative filtering recommendation algorithm towards intelligent community
Huang et al. Accurate Item Recommendation Algorithm of itemrank based on tag and context information
AL-Bakri et al. A study on the accuracy of prediction in recommendation system based on similarity measures
Chen et al. Poverty/investment slow distribution effect analysis based on Hopfield neural network
Zhang et al. Multi-label relational classification via node and label correlation
Agarwal et al. WGSDMM+ GA: A genetic algorithm-based service clustering methodology assimilating dirichlet multinomial mixture model with word embedding
CN116932923A (zh) 一种结合行为特征与三角协作度量的项目推荐方法
Dai et al. DAS-GNN: Denoising autoencoder integrated with self-supervised learning in graph neural network-based recommendations
Chu et al. Towards a deep learning autoencoder algorithm for collaborative filtering recommendation
CN113343100B (zh) 一种基于知识图谱的智慧城市资源推荐方法和系统
Duan et al. A Hybrid Recommendation System based on Fuzzy C-Means Clustering and Supervised Learning.
Nikolaou et al. Calibrating AdaBoost for asymmetric learning
JP2010073195A (ja) 協調フィルタリング処理方法および協調フィルタリング処理プログラム
Bachan et al. Predicting customer churn in the internet service provider industry of developing nations: A single, explanatory case study of trinidad and tobago
Roy et al. Learning multigraph node embeddings using guided lévy flights
Xu et al. Fast and accurate transferability measurement by evaluating intra-class feature variance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant