CN114676331A - 一种基于异质信息网络元路径的api推荐方法 - Google Patents

一种基于异质信息网络元路径的api推荐方法 Download PDF

Info

Publication number
CN114676331A
CN114676331A CN202210336742.6A CN202210336742A CN114676331A CN 114676331 A CN114676331 A CN 114676331A CN 202210336742 A CN202210336742 A CN 202210336742A CN 114676331 A CN114676331 A CN 114676331A
Authority
CN
China
Prior art keywords
api
mashup
path
meta
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210336742.6A
Other languages
English (en)
Inventor
唐明董
盘先豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Foreign Studies
Original Assignee
Guangdong University of Foreign Studies
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Foreign Studies filed Critical Guangdong University of Foreign Studies
Priority to CN202210336742.6A priority Critical patent/CN114676331A/zh
Publication of CN114676331A publication Critical patent/CN114676331A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明一种基于异质信息网络元路径的API推荐方法,包括:获取API及其Mashup应用的描述信息,构建围绕API的异质信息网络;生成API与Mashup的初始低维嵌入;生成基于API与Mashup交互的上下文元路径嵌入;融合API与Mashup的初始低维嵌入和基于API与Mashup交互的上下文元路径嵌入,训练神经网络模型,实现API推荐。本发明可以帮助用户在开发Mashup应用时,通过准确推荐从庞大的API库中快速发现合适的API,从而提高应用的开发效率。

Description

一种基于异质信息网络元路径的API推荐方法
技术领域
本发明涉及服务计算以及数据分析领域,具体是一种异质信息网络元路径的API(Application Programming Interface,应用程序接口)推荐方法。
背景技术
Web API即网络应用程序接口,包含了广泛的功能,网络应用通过API接口,可以实现存储服务、消息服务、计算服务、信息服务、搜索服务等能力,利用这些能力可以开发出强大功能的Web应用。尽管网络上存在很多优秀的API,但是面对信息社会的快速发展和大量附加要求的出现,单一API的功能己越来越无法应对复杂的业务需求。因此,通过将不同API混搭在一起创建新应用的开发模式,受到了开发者乃至普通Web 2.0用户的广泛欢迎。这种由API混搭产生的应用称为Mashup。
尽管基于Mashup的应用开发已经十分流行。但是想要在大规模的、包含形形色色各种功能的API数据库中,快速地发现和选择适合Mashup需求的API,仍然是具有挑战性的难题。除此之外,由于大多数API是使用纯文本或HTML而非结构化语言来描述的,这进一步增加了自动的API发现难度。传统的推荐方法没有学习描述API和Mashup之间关系的推荐方法中元路径的显式表示,且将辅助信息描述为孤立的特征而不是完整的语义信息,因此推荐性能仍有待进一步提高。
发明内容
本发明的目的是提供一种基于异质信息网络元路径的API推荐方法,用以克服现有技术中存在的问题。
为了实现上述任务,本发明采用以下技术方案:
一种基于异质信息网络元路径的API推荐方法,包括:
获取API及其Mashup应用的描述信息,构建围绕API的异质信息网络;
生成API与Mashup的初始低维嵌入;
生成基于API与Mashup交互的上下文元路径嵌入;
融合API与Mashup的初始低维嵌入和基于API与Mashup交互的上下文元路径嵌入,训练神经网络模型,实现API推荐。
进一步地,所述API及其Mashup应用的描述信息,包括API名称、API类别、API提供者、Mashup名称、Mashup与API调用关系,合并得到名为PW的数据集;将Mashup和API的调用关系视为两者的交互,围绕PW数据集中的Mashup、API交互,构建Mashup-API二部;选取类别、提供者作为二部图的补充信息构建API异质信息网络,所述API异质信息网络包括四种类型的对象和四种类型的关系,其中四种类型的对象也称为四类节点,包括Mashup、API、类别、提供商;四种类型的关系包括Mashup与API的关系M-A、API与提供商的关系A-P、Mashup与类别的关系M-C、API与类别的关系A-C;
所述异质信息网络中,当在API异质信息网络进行元路径采样时,包含具体节点信息的元路径称为路径实例。
进一步地,所述生成API与Mashup的初始低维嵌入,包括:
分别通过两个线性变换层对Mashup和API的嵌入进行随机初始化,输入Mashup和API的One-hot向量um、va,得到其映射后的初始低维嵌入em、ea,公式如下:
em=WM·um
ea=WA·va
其中WM∈Rm×d和WA∈Ra×d为随机初始化的特征矩阵,m和a分别为用户和API的个数,d是Mashup和API的嵌入维度,R表示实数集。
进一步地,所述生成基于API与Mashup交互的上下文元路径嵌入,包括:
通过图表示学习框架预训练,获得初始节点表达;
根据选定的元路径,对路径实例进行采样,并生成元路径嵌入;
通过注意力机制按不同权重参数合并元路径嵌入,获得元路径的注意力分布值;
通对元路径的注意力分布值进行归一化计算,得到不同元路径n对API与Mashup交互作用的贡献,最后通过权重求和方法根据权重贡献融合元路径上下文信息,得到基于元路径的上下文嵌入表示。
进一步地,所述通过图表示学习框架预训练,获得初始节点表达,包括:
通过将API异质信息网络中的节点与节点之间的连接关系输入图表示学习框架进行预训练,最后得到节点的预训练向量;在每一轮训练过程中,通过输入任意两个节点x,y和通过正则化处理后的节点x,y间的关系向量r的三个one-hot编码向量,分别经过线性变换层的特征矩阵映射得到三个初始低维嵌入;当获得所述三个初始低维嵌入后,对三个向量运用一个Hadamard函数,对乘积再运用一个线性激活函数,最后输出层对乘积求和后的值进行一个sigmoid非线性转换,最后输出两个节点x,y经过预训练后的特征表达,为API异质信息网络的节点预训练向量。
进一步地,所述根据选定的元路径,对路径实例进行采样,并生成元路径嵌入,包括:
在API异质信息网络中进行随机游走,采样得到所有固定长度的路径实例;根据Mashup、API节点进行路径实例的选取,当路径的两个端点为指定的Mashup和API时,选择同样包含这两个端点的所有路径实例作为当前M-A交互元路径的采样实例集合;
对采样实例集合中的Mashup或API节点进行相似度计算、排序,选择L条路径实例;
将指定交互M-A下元路径的L条路径实例分别进行合并,得到元路径嵌入。
进一步地,所述通过注意力机制按不同权重参数合并元路径嵌入,获得注意力分布值,包括:
基于Mashup、API的初始低维嵌入em、ea,结合元路径嵌入
Figure BDA0003574613920000031
通过两层线性结构构建注意力模型结构,获得元路径的注意力分布值
Figure BDA0003574613920000032
公式如下:
Figure BDA0003574613920000033
Figure BDA0003574613920000034
其中,
Figure BDA0003574613920000035
表示两层注意力模型结构得到的注意力分布值,W1∈R3d×v,W2∈Rv×1是随机初始化的特征矩阵,d为em、ea
Figure BDA0003574613920000036
三个输入向量维度之和,v是向量的维度,LeakyReLU(·)是激活函数。
进一步地,所述融合API与Mashup的初始低维嵌入和基于API与Mashup交互M-A的上下文元路径嵌入,训练模型,实现API推荐,包括:
给定Mashup和API之间的交互,合并操作定义如下:
Figure BDA0003574613920000041
其中
Figure BDA0003574613920000042
是连接操作,eP是基于元路径的上下文嵌入表示,em和ea分别是Mashup和API的初始低维嵌入;
然后将合并后的向量xm,a输入到MLP组件中以实现非线性变换来模拟Mashup和API之间的复杂交互,进行模型训练,最后得到Mashup和API之间的交互得分
Figure BDA0003574613920000043
利用损失函数Jm,a来优化模型,在模型训练完成后,固定模型参数,对用户进行API推荐。
一种终端设备,包括处理器、存储器以及存储在所述存储器中的计算机程序;处理器执行计算机程序时,实现所述基于异质信息网络元路径的API推荐方法步骤。
一种计算机可读存储介质,所述介质中存储有计算机程序;计算机程序被处理器执行时,实现所述基于异质信息网络元路径的API推荐方法的步骤。
与现有技术相比,本发明具有以下技术特点:
1.可以构建API异质信息网络;2.可以利用图预训练模型融入节点间的关系,获得异质信息网络中的节点表示;3.引入API异质信息网络中的元路径,定义用户创建API应用时,对API选择的不同偏好;4.利用注意力模块区分元路径中用户不同偏好的力度;5.利用元路径的显式表示,将辅助信息在一个统一的空间下进行表征利,进行API、Mashup以及用户的不同偏好进行非线性评分预测建模。
附图说明
图1为本发明的方法流程图;
图2为API异质信息网络的示例图;
图3为本发明中基于相似性对路径实例进行选择的示例图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,有必要在此指出的是以下技术方案只是用于对本发明进行进一步的说明,不能理解为对本发明保护范围的限制,该领域的技术熟练人员根据上述发明内容所做出的一些非本质的改进和调整,仍属于本发明保护范围。
如图1所示,本发明提供了一种基于异质信息网络元路径的API推荐方法,包括以下步骤:
S1,构建API异质信息网络:获取API及其Mashup应用的描述信息,构建围绕API的异质信息网络。
在本实施例中,从网络API门户网站与注册中心(Prgrammableweb.com)中抓取了API和Mashup的描述信息,包括API名称、API类别、API提供者、Mashup名称、Mashup与API调用关系等,合并得到名为PW的数据集。进一步地,将Mashup和API的调用关系视为两者的交互,围绕PW数据集中的Mashup、API交互,构建Mashup-API二部图。选取类别、提供者作为二部图的补充信息构建如图2所示的API异质信息网络,所述API异质信息网络由四种类型的对象,也称为四类节点,(即Mashup(M)、API(A)、类别(C)、提供商(P))和四种类型的关系,即Mashup与API的关系M-A、API与提供商的关系A-P、Mashup与类别的关系M-C、API与类别的关系A-C组成。
其中,Mashup与API的连接关系(M-A)代表了它们的交互信息,他们构成Mashup-API二部图;在此基础上,Mashup与类别、API与类别(M-C、A-C)、API与提供者(A-P)的连接关系为辅助信息,合并交互信息与辅助信息构成API异质信息网络。由于异质信息网络包含丰富的高阶结构信息,元路径(两个节点类型之间的关系类型序列)被广泛用作获取此类信息的基本工具,如图1中API:Twitter-Category:Social-API:LinkedIn(A-C-A),意为属于同一类别的API,此三个节点连线连通,长度为3。当在API异质信息网络进行元路径采样时,包含具体节点信息的元路径称为路径实例。
S2,生成API与Mashup的初始低维嵌入
在本实施例中,分别通过两个线性变换层对Mashup和API的嵌入进行随机初始化,分别输入Mashup和API的One-hot向量um、va,得到其映射后的初始低维嵌入em、ea,公式如下:
em=WM·um
ea=WA·va
其中WM∈Rm×d和WA∈Ra×d为随机初始化的特征矩阵,m和a分别为用户和API的个数,d是Mashup和API的嵌入维度,R表示实数集;该步骤可减少建模中计算资源的开销。
S3,生成基于API与Mashup交互的上下文元路径嵌入
根据API异质信息网络中API与Mashup的元路径,获得用户对于API选择的不同偏好,并生成基于上下文元路径的嵌入。在本实施例中,S3由三部分组成。
第一部分,通过图表示学习框架预训练,获得初始节点表达。具体方式是:
通过将训练数据API异质信息网络中的节点与节点之间的连接关系输入图表示学习框架进行预训练,最后得到节点的预训练向量。在每一轮训练过程中,通过输入任意两个节点x,y和通过正则化处理后的节点x,y间的关系向量r的三个one-hot编码向量,分别经过线性变换层的特征矩阵映射得到三个初始低维嵌入,类似步骤S2;进一步地,当获得所述三个初始低维嵌入后,图表示学习框架对三个向量运用一个Hadamard函数(例如,对应元素相乘),对乘积再运用一个线性激活函数,最后输出层对乘积求和后的值进行一个sigmoid非线性转换,最后输出两个节点x,y经过预训练后的特征表达,为API异质信息网络的节点预训练向量。本实施例中,所述图表示学习框架可采用HIN2vec。
其中预训练时目标函数为O,为方便计算取与O成正比(∝)的logO作为优化目标,具体公式如下:
Figure BDA0003574613920000061
其中logOx,y,r(x,y,r)衡量的是预训练模型如何正确预测训练数据,具体为
Figure BDA0003574613920000062
其中L(x,y,r)用来指示x,y之间是否存在关系r,若存在则L(x,y,r)置为1,否则置0。P(r|x,y)为当节点是x,y时,关系为r的概率。
该部分运用一种合理的训练框架及评价体系,确保了经过初始预训练的节点向量是包含了足够API异质信息网络上下文语义及网络信息,对于元路径的偏好信息提取至关重要。
第二部分,根据选定的元路径(例如表1中的4条元路径),对路径实例进行采样,并生成元路径嵌入。具体方式是:
在API异质信息网络中进行随机游走,采样得到所有固定长度的路径实例。本实施例中所采样的元路径如表1所示,当采样所有固定长度的路径实例后,根据Mashup、API节点进行路径实例的选取,当路径的两个端点为指定的Mashup和API时,选择同样包含这两个端点的所有路径实例作为当前M-A交互元路径的采样实例集合。
表1
Figure BDA0003574613920000071
进一步地,在第一部分获取节点预训练向量的基础上,对采样实例集合中的Mashup或API节点进行相似度计算,排序,选择L条路径实例。具体计算方式如图3所示:
首先计算路径实例中两个同类型节点,Mashup或API相似度,例如在MCMA的元路径中,我们可以计算两个相同Mashup节点M1和M2的相似度(如果元路径是MACA或MAPA,计算两个相同API节点A1和A2的相似度),对采样实例集合中相同类型节点的相似度得分进行排序,最后保留路径实例中,Mashup节点M1和M2相似度最高的L条,具体公式如下:
Figure BDA0003574613920000072
其中node1,node2为同一类型的节点,分子表示节点向量node1与节点向量node2的点乘,分母表示二者的L2相乘,即将所有维度值的平方相加后开方。
进一步地,将指定交互M-A下最优用户偏好表达的元路径的L条路径实例分别进行合并,得到元路径嵌入。具体方式是:
如元路径MACA的一条路径实例由四个节点的节点预训练向量组成,分别是Mashup、API1、Category和API2,构造卷积神经网络CNN,将四个节点的节点预训练向量以节点嵌入矩阵的形式输入进CNN,得到映射在低维向量空间的路径实例嵌入hp,具体公式如下:
hp=CNN(Xp;θ)
其中,Xp∈Rs×d为路径实例的节点嵌入矩阵,s为路径实例的节点数,d为预训练节点的嵌入维度;θ是卷积层中的所有相关参数;在获得元路径MACA下的L条路径实例嵌入
Figure BDA0003574613920000081
后,其中l=1,2,...,L;通过最大池化操作获得M-A交互下MACA元路径嵌入
Figure BDA0003574613920000082
Figure BDA0003574613920000083
其中,max-pooling为最大池化操作,CNN()表示卷积神经网络。
该部分创新地在API异质信息网络中使用了元路径嵌入表示作为相似度计算的依据,相较于传统的矩阵分解更具可解释性。
第三部分,通过注意力机制按不同权重参数合并元路径嵌入。具体方式:
首先输入由S2得到的Mashup、API的向量表示,和S3得到的元路径嵌入
Figure BDA0003574613920000084
n为元路径类型(MACA、MAMA、MAPA、MCMA),通过两层线性结构构建注意力模型结构,获得元路径的注意力分布值
Figure BDA0003574613920000085
公式如下:
Figure BDA0003574613920000086
Figure BDA0003574613920000087
其中,
Figure BDA0003574613920000088
表示两层注意力模型结构得到的注意力分布值,W1∈R3d×v,W2∈Rv×1是随机初始化的特征矩阵,d为em、ea
Figure BDA0003574613920000089
三个输入向量维度之和,v是的维度,em和ea分别为Mashup和API的初始低维嵌入,LeakyReLU(·)是激活函数。
进一步地,通过SoftMax函数对元路径的注意力分布值进行归一化计算,得到不同元路径n对M-A交互作用的贡献
Figure BDA00035746139200000810
公式如下:
Figure BDA00035746139200000811
其中,exp为自然常数e为底的指数函数,最后通过权重求和方法根据权重贡献融合元路径上下文信息,得到基于元路径的上下文嵌入表示:
Figure BDA0003574613920000091
该部分在对多条元路径的贡献分数的计算上创新地引入了注意力机制,更好地捕捉到用户的选择偏好,并体现在元路径的上下文嵌入表示中,也使得后续的API推荐更加精准。
S4,融合API与Mashup的初始低维嵌入和基于API与Mashup交互M-A的上下文元路径嵌入,训练模型,实现API推荐。
在本实施例中,给定Mashup和API之间的交互,通过步骤S2、S3得到Mashup和API的嵌入以及它们之间交互的上下文元路径的嵌入表示。我们将这三个嵌入在统一的向量空间下合并为M-A交互的向量表示xm,a。合并操作定义如下:
Figure BDA0003574613920000092
其中
Figure BDA0003574613920000093
是连接操作,eP是基于元路径的上下文嵌入表示,em和ea分别是Mashup和API的初始低维嵌入。
进一步地,然后将合并后的向量xm,a输入到MLP组件中以实现非线性变换来模拟Mashup和API之间的复杂交互,进行模型训练,最后得到Mashup和API之间的交互得分
Figure BDA0003574613920000094
具体公式如下:
Figure BDA0003574613920000095
其中,MLP(·)为非线性变换组件。在进行评分预测时,利用损失函数Jm,a来优化模型,具体公式为:
Figure BDA0003574613920000096
其中θneg为负采样概率。
最后,在模型训练完成后,固定模型参数,对用户进行API推荐。
实际应用时,对于一个用户待完成的Mashup,首先通过前面的步骤S2,得到该Mashup的输入向量,和所有候选API的输入向量;进一步,通过步骤S3,计算Mashup和每一个候选API之间的上下文元路径嵌入;最后对Mashup、API和上下文元路径向量合并为表示xm,a,计算Mashup和每一个API之间的交互得分
Figure BDA0003574613920000101
通过对所有交互得分进行排序,从高到低输出API推荐列表,从而实现推荐。
在本实施例中,借助A平均召回率(Recall)、归一化折损累计增益(NDCG)与准确率(Precision)评价指标来对比分析注意力机制训练方法,其中PHRec-avg为四条元路径按平均贡献进行融合,生成元路径的上下文嵌入表示,PHRec-att为S3第三部分,通过注意力机制按不同权重参数生成的上下文嵌入表示。在不同训练方法下的结果如表2所示。
表2融合元路径方法的性能比较
Figure BDA0003574613920000102
本发明在采用以上两种训练策略下训练获得的API推荐评价指标下,召回率、归一化折损累计增益与准确率提升分别为1.34%、0.57%和1.29%。根据表2数据可知,与将所有元路径视为同等重要相比,区分不同元路径的权重分数后有助于提高推荐性能。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于异质信息网络元路径的API推荐方法,其特征在于,包括:
获取API及其Mashup应用的描述信息,构建围绕API的异质信息网络;
生成API与Mashup的初始低维嵌入;
生成基于API与Mashup交互的上下文元路径嵌入;
融合API与Mashup的初始低维嵌入和基于API与Mashup交互的上下文元路径嵌入,训练神经网络模型,实现API推荐。
2.根据权利要求1所述的基于异质信息网络元路径的API推荐方法,其特征在于,所述API及其Mashup应用的描述信息,包括API名称、API类别、API提供者、Mashup名称、Mashup与API调用关系,合并得到名为PW的数据集;将Mashup和API的调用关系视为两者的交互,围绕PW数据集中的Mashup、API交互,构建Mashup-API二部;选取类别、提供者作为二部图的补充信息构建API异质信息网络,所述API异质信息网络包括四种类型的对象和四种类型的关系,其中四种类型的对象也称为四类节点,包括Mashup、API、类别、提供商;四种类型的关系包括Mashup与API的关系M-A、API与提供商的关系A-P、Mashup与类别的关系M-C、API与类别的关系A-C;
所述异质信息网络中,当在API异质信息网络进行元路径采样时,包含具体节点信息的元路径称为路径实例。
3.根据权利要求1所述的基于异质信息网络元路径的API推荐方法,其特征在于,所述生成API与Mashup的初始低维嵌入,包括:
分别通过两个线性变换层对Mashup和API的嵌入进行随机初始化,输入Mashup和API的One-hot向量um、va,得到其映射后的初始低维嵌入em、ea,公式如下:
em=WM·um
ea=WA·va
其中WM∈Rm×d和WA∈Ra×d为随机初始化的特征矩阵,m和a分别为用户和API的个数,d是Mashup和API的嵌入维度,R表示实数集。
4.根据权利要求1所述的基于异质信息网络元路径的API推荐方法,其特征在于,所述生成基于API与Mashup交互的上下文元路径嵌入,包括:
通过图表示学习框架预训练,获得初始节点表达;
根据选定的元路径,对路径实例进行采样,并生成元路径嵌入;
通过注意力机制按不同权重参数合并元路径嵌入,获得元路径的注意力分布值;
通对元路径的注意力分布值进行归一化计算,得到不同元路径n对API与Mashup交互作用的贡献,最后通过权重求和方法根据权重贡献融合元路径上下文信息,得到基于元路径的上下文嵌入表示。
5.根据权利要求4所述的基于异质信息网络元路径的API推荐方法,其特征在于,所述通过图表示学习框架预训练,获得初始节点表达,包括:
通过将API异质信息网络中的节点与节点之间的连接关系输入图表示学习框架进行预训练,最后得到节点的预训练向量;在每一轮训练过程中,通过输入任意两个节点x,y和通过正则化处理后的节点x,y间的关系向量r的三个one-hot编码向量,分别经过线性变换层的特征矩阵映射得到三个初始低维嵌入;当获得所述三个初始低维嵌入后,对三个向量运用一个Hadamard函数,对乘积再运用一个线性激活函数,最后输出层对乘积求和后的值进行一个sigmoid非线性转换,最后输出两个节点x,y经过预训练后的特征表达,为API异质信息网络的节点预训练向量。
6.根据权利要求4所述的基于异质信息网络元路径的API推荐方法,其特征在于,所述根据选定的元路径,对路径实例进行采样,并生成元路径嵌入,包括:
在API异质信息网络中进行随机游走,采样得到所有固定长度的路径实例;根据Mashup、API节点进行路径实例的选取,当路径的两个端点为指定的Mashup和API时,选择同样包含这两个端点的所有路径实例作为当前M-A交互元路径的采样实例集合;
对采样实例集合中的Mashup或API节点进行相似度计算、排序,选择L条路径实例;
将指定交互M-A下元路径的L条路径实例分别进行合并,得到元路径嵌入。
7.根据权利要求4所述的基于异质信息网络元路径的API推荐方法,其特征在于,所述通过注意力机制按不同权重参数合并元路径嵌入,获得注意力分布值,包括:
基于Mashup、API的初始低维嵌入em、ea,结合元路径嵌入
Figure FDA0003574613910000039
通过两层线性结构构建注意力模型结构,获得元路径的注意力分布值
Figure FDA0003574613910000031
公式如下:
Figure FDA0003574613910000032
Figure FDA0003574613910000033
其中,
Figure FDA0003574613910000034
表示两层注意力模型结构得到的注意力分布值,W1∈R3d×v,W2∈Rv ×1是随机初始化的特征矩阵,d为em、ea
Figure FDA0003574613910000035
三个输入向量维度之和,v是向量的维度,LeakyReLU(·)是激活函数。
8.根据权利要求4所述的基于异质信息网络元路径的API推荐方法,其特征在于,所述融合API与Mashup的初始低维嵌入和基于API与Mashup交互M-A的上下文元路径嵌入,训练模型,实现API推荐,包括:
给定Mashup和API之间的交互,合并操作定义如下:
Figure FDA0003574613910000036
其中
Figure FDA0003574613910000037
是连接操作,eP是基于元路径的上下文嵌入表示,em和ea分别是Mashup和API的初始低维嵌入;
然后将合并后的向量xm,a输入到MLP组件中以实现非线性变换来模拟Mashup和API之间的复杂交互,进行模型训练,最后得到Mashup和API之间的交互得分
Figure FDA0003574613910000038
利用损失函数Jm,a来优化模型,在模型训练完成后,固定模型参数,对用户进行API推荐。
9.一种终端设备,包括处理器、存储器以及存储在所述存储器中的计算机程序;其特征在于,处理器执行计算机程序时,实现根据权利要求1至8中任一权利要求所述基于异质信息网络元路径的API推荐方法步骤。
10.一种计算机可读存储介质,所述介质中存储有计算机程序;其特征在于,计算机程序被处理器执行时,实现根据权利要求1至8中任一权利要求所述基于异质信息网络元路径的API推荐方法步骤。
CN202210336742.6A 2022-03-31 2022-03-31 一种基于异质信息网络元路径的api推荐方法 Pending CN114676331A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210336742.6A CN114676331A (zh) 2022-03-31 2022-03-31 一种基于异质信息网络元路径的api推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210336742.6A CN114676331A (zh) 2022-03-31 2022-03-31 一种基于异质信息网络元路径的api推荐方法

Publications (1)

Publication Number Publication Date
CN114676331A true CN114676331A (zh) 2022-06-28

Family

ID=82075209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210336742.6A Pending CN114676331A (zh) 2022-03-31 2022-03-31 一种基于异质信息网络元路径的api推荐方法

Country Status (1)

Country Link
CN (1) CN114676331A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114896514A (zh) * 2022-07-14 2022-08-12 西安电子科技大学 一种基于图神经网络的Web API标签推荐方法
CN115795177A (zh) * 2022-11-25 2023-03-14 人民网股份有限公司 社交媒体内容推荐方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114896514A (zh) * 2022-07-14 2022-08-12 西安电子科技大学 一种基于图神经网络的Web API标签推荐方法
CN114896514B (zh) * 2022-07-14 2022-09-30 西安电子科技大学 一种基于图神经网络的Web API标签推荐方法
CN115795177A (zh) * 2022-11-25 2023-03-14 人民网股份有限公司 社交媒体内容推荐方法及装置
CN115795177B (zh) * 2022-11-25 2023-04-28 人民网股份有限公司 社交媒体内容推荐方法及装置

Similar Documents

Publication Publication Date Title
CN112633010B (zh) 基于多头注意力和图卷积网络的方面级情感分析方法及系统
CN114676331A (zh) 一种基于异质信息网络元路径的api推荐方法
Kang et al. Neural and attentional factorization machine-based Web API recommendation for mashup development
CN115204183B (zh) 基于知识增强的双通道情感分析方法、装置以及设备
Zhang et al. Personalized recommendation of social images by constructing a user interest tree with deep features and tag trees
JP2021193595A (ja) 会話推薦方法、装置及び機器
CN113064968B (zh) 一种基于张量融合网络的社交媒体情感分析方法及系统
Sha et al. A user requirement oriented web service discovery approach based on logic and threshold petri net
CN112699215B (zh) 基于胶囊网络与交互注意力机制的评级预测方法及系统
CN113704460A (zh) 一种文本分类方法、装置、电子设备和存储介质
CN116258145B (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN111881345B (zh) 基于位置上下文感知的神经协同过滤服务质量预测方法
CN115455171A (zh) 文本视频的互检索以及模型训练方法、装置、设备及介质
Mirtalaie et al. Sentiment analysis of specific product’s features using product tree for application in new product development
CN113449840A (zh) 神经网络训练方法及装置、图像分类的方法及装置
CN114676332A (zh) 一种面向开发者的网络api推荐方法
Martinez-Gil A comparative study of ensemble techniques based on genetic programming: A case study in semantic similarity assessment
CN112486467B (zh) 一种双重交互关系和注意力机制的交互式服务推荐方法
CN113343692A (zh) 搜索意图的识别方法、模型训练方法、装置、介质及设备
CN111382232A (zh) 问答信息处理方法、装置及计算机设备
CN110633363A (zh) 一种基于nlp和模糊多准则决策的文本实体推荐方法
CN114429384A (zh) 基于电商平台的产品智能推荐方法及系统
CN111460169B (zh) 语义表达式生成方法、装置及设备
CN112818658B (zh) 文本对分类模型的训练方法、分类方法、设备及存储介质
CN113821610A (zh) 信息匹配方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination