CN114462707B

CN114462707B - 一种基于特征深度融合的Web服务多维QoS联合预测方法

Info

Publication number: CN114462707B
Application number: CN202210126027.XA
Authority: CN
Inventors: 康国胜; 刘建勋; 丁领航
Original assignee: Hunan University of Science and Technology
Current assignee: Hunan University of Science and Technology
Priority date: 2022-02-10
Filing date: 2022-02-10
Publication date: 2023-11-17
Anticipated expiration: 2042-02-10
Also published as: CN114462707A

Abstract

本发明提供一种基于特征深度融合的Web服务多维QoS联合预测方法，首先使用图卷积网络提取单维QoS的环境偏好特征，并将多维QoS的特征嵌入映射到同一空间；然后通过交互层、自注意力层和全连接层捕获多维QoS特征的二阶及高阶交互特征以进行特征深度融合，最后聚合以上各个特征进行多维QoS的联合预测。本发明在真实数据集上进行了全面的实验，以此证明本方法的有效性，即能够有效提高QoS预测的性能。

Description

一种基于特征深度融合的Web服务多维QoS联合预测方法

技术领域

本发明主要涉及Web服务QoS预测相关技术领域，具体为一种基于特征深度融合的Web服务多维QoS联合预测方法。

背景技术

近年来，随着面向服务架构(SOA)、云计算、移动计算等技术的广泛应用，大量Web服务被创建并发布在互联网上供人们使用，如何从大量功能相似的Web服务中快速、准确地找到高质量的服务是一个挑战性问题。服务质量(QualityofService，QoS)描述了服务的非功能属性，是区分功能相似服务的重要参考依据，广泛用于QoS感知的服务发现、服务推荐、服务组合等服务管理任务中。Web服务的QoS同时依赖于用户和服务双方。此外，由于动态的网络环境，同一Web服务被不同用户调用的QoS可能存在差异性。由于很多服务的调用是需要付费的，导致通过调用及监测的方式获取用户-服务对的QoS是不现实的，因此准确和个性化的QoS预测是一种可行的解决方案。

协同过滤(CollaborativeFiltering，CF)技术目前已广泛应用于Web服务的QoS预测，该类方法可细分为基于邻域的CF方法、基于模型的CF方法和混合的CF方法。基于邻域的CF方法的核心思想是依据历史QoS数据计算用户或服务之间的相似度并生成相似邻居，然后依据相似邻居的已有QoS估算目标服务的QoS。基于邻域的CF方法较为简单，并且一定程度上利用了难以量化的潜在的用户特征或服务特征，但其预测性能受到数据稀疏性问题的影响，同时很难利用与目标节点相似度较低的节点所隐含的全局结构信息。基于模型的CF方法的核心思想是预定义一个具有适当结构和参数的模型并使用已有的QoS数据进行训练，训练后的模型具有较好的QoS预测能力，且对整体结构有较好的估计。基于模型的CF方法性能较高，在面对数据稀疏性问题时鲁棒性较强，但传统基于模型的CF方法，如矩阵分解方法，难以学习用户和服务的深层特征和隐藏信息，可扩展性有限。

近年来，深度学习技术发展迅猛，在Web服务的QoS预测任务上得到了一些应用。其中，图卷积神经网络(GraphConvolutionalNetwork，GCN)可通过聚合相邻节点的信息获得目标节点的信息，缓解数据稀疏性问题；同时，它可以通过神经网络的逐层融合获取图的结构信息和深层特征，能有效解决基于邻域的CF方法和传统基于模型的CF方法面临的问题，为目前基于深度学习的QoS预测方法中性能较好的方法。

然而，现有的基于GCN的CF方法只考虑用户与服务交互的显式信息，未考虑用户终端的环境特征信息和服务器的环境特征信息。环境特征是指特定于客户端主机或服务器主机的特征，例如：网络地址、子网、自治系统、地理位置等。这些因素可通过不同的组合影响Web服务的QoS，本发明使用“偏好”来代表客户端主机和服务器主机对对方环境的适应程度，对对方环境特征适应程度更高的用户-服务组合可获得更好的QoS，适应程度高可认为该服务满足了用户的“偏好”，用户也满足了该服务的“偏好”。因此，如果能够从用户-服务交互信息中挖掘出潜在的环境特征信息，就可提供更全面和更复杂的特征信息来提高QoS的预测精度。多组件图卷积协同过滤方法是最近提出的一种基于GCN的CF方法，它考虑用户-项目的交互信息中潜在的用户对项目的偏好，并将抽象的偏好映射为具体的组件，具有挖掘用户或项目潜在偏好的能力，因此我们的前期工作采用该方法挖掘用户和服务的潜在偏好，并针对QoS预测任务提出一种新的方法MGCQP。然而，该工作依然存在以下两个可改进的地方：(1)现有的基于GCN的CF方法大多只应用于单维QoS属性。在真实环境中，多维QoS属性分别从不同的角度反映了用户特征或服务特征，不同类别的QoS属性之间存在潜在的共同特征，这些共同特征是单维QoS属性的预测模型无法挖掘出来的。例如，一个拥有较优响应时间的用户-服务对可能保持了非常通畅的网络，也说明服务器此时可能负载较小，这些特征使得该用户-服务对可能也有较优的吞吐量；同理，拥有较优吞吐量的用户-服务对也很可能具有较优的响应时间。如果能将多维QoS属性用合适的方法映射到同一空间，就能以此建模多维QoS属性存在的共同特征及联系，提升QoS预测模型的准确度；(2)预测模块应用DeepFM对用户和服务的特征向量的一阶特征、二阶和高阶特征进行建模，但没有区分不同交互特征的重要性，也没有探究高阶交互特征对预测性能的影响。

发明内容

为解决以上问题，本发明提出一种多维QoS联合预测方法JQSP(JointQoSPrediction)，能够有效提高Web服务QoS的预测性能。

为实现上述目的，本发明的技术方案如下：

一种基于特征深度融合的Web服务多维QoS联合预测方法，其特征在于，包括以下步骤：

(1)多维QoS环境偏好特征提取：应用多个结构相同、参数独立的MGCN模块对多维QoS进行环境偏好特征提取；(2)特征融合：使用加权融合方法将多维QoS的环境偏好特征映射到同一空间；(3)多维QoS联合预测：应用ANFM模块建模融合嵌入的各阶交互特征并训练神经网络进行多维QoS联合预测。

进一步地，所述步骤(1)中，在MGCN模块处理多维QoS前对QoS进行预处理过程，所述预处理过程包括以下步骤：

(1)、将响应时间QoS矩阵中的0值和超过20的值置为NULL；

(2)、将响应时间QoS矩阵和吞吐量QoS矩阵分别进行Min-Max归一化；

(3)、将两维QoS矩阵按用户标识和服务标识进行对齐，构建“用户标识-服务标识-响应时间QoS-吞吐量QoS”的输入向量。

进一步地，所述步骤(1)中，在获得预处理的输入向量以后，将其分别作为多个结构相同、参数独立的MGCN模块的输入，将抽象的环境偏好映射为具体的组件，从而得到用户嵌入和服务嵌入。

进一步地，所述步骤(1)中，MGCN模块应用多组件图卷积协同过滤方法，将目标节点的邻居节点信息聚合到目标节点上，同时使用节点级注意力区分不同重要性的邻居节点。

进一步地，所述步骤(2)中，在获得用户嵌入和服务嵌入之后，先将同一类QoS的两类嵌入拼接成合并嵌入，再使用加权融合的方式将多维QoS的合并嵌入聚合为融合嵌入。

进一步地，所述步骤(3)中，在ANFM模块挖掘融合嵌入特征的过程中，采用线性部分挖掘一阶特征，采用交互池层挖掘二阶交互，采用自注意力层和多层感知机挖掘高阶交互，最后结合多个部分的结果进行多维QoS联合预测。

本发明的有益效果：

本发明中，引入一个包含多个卷积核的偏好提取模块来提取各单维QoS的用户-服务矩阵中隐含的用户偏好特征和服务偏好特征。与此同时，使用加权融合方法将多维QoS的特征提取向量映射到同一向量空间，并引入自注意力建模融合嵌入向量中的一阶特征和各阶交互特征，提升多维QoS的联合预测的精度。最后，在真实数据集上进行大量综合性实验，实验结果表明，与其他先进的模型相比，本发明所提方法在RMSE和MAE两个指标上均有显著提升。

附图说明

图1为本发明的Web服务多维QoS联合预测方法总体框架图；

图2为转换矩阵数的超参数实验对比图；

图3为神经网络嵌入维度数的超参数实验对比图；

图4为自注意力嵌入维度数的超参数实验对比图。

具体实施方式

结合附图和具体实施例，对本发明作进一步说明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可对本发明作各种改动或修改，这些等价形式同样落于本申请所限定的范围。

由于现有Web服务QoS预测技术只考虑用户与服务交互的显式信息，未考虑用户终端的环境特征信息和服务器的环境特征信息，同时主要聚焦于利用单维Web服务QoS属性，而没有考虑多维QoS属性隐含的共同信息。为此，本发明提出一种新的Web服务多维QoS联合预测方法JQSP，旨在结合环境偏好特征和多维QoS隐含共同特征来提高预测的准确性。本发明首先建模单维QoS的环境偏好特征，并应用节点级注意力和组件级注意力来为节点和组件分配权重。其次，使用加权实现多维QoS嵌入的融合。最后，设计一种引入了自注意力的改进因子分解机，该因子分解机能有效建模嵌入中的低维和高维交互特征。

本发明所提出的Web服务QoS预测方法的总体框架如图1所示，包括两个部分：1)多维QoS环境偏好特征提取：应用多个结构相同、参数独立的MGCN模块对多维QoS进行环境偏好特征提取；2)特征融合：使用加权融合方法将多维QoS的环境偏好特征映射到同一空间；3)多维QoS联合预测：应用ANFM模块建模融合嵌入的各阶交互特征并训练神经网络进行多维QoS联合预测。MGCN模块用于提取各单维QoS的多维偏好特征，并将多维QoS的特征嵌入映射到同一空间，然后通过采用ANFM模块将拼接的多维QoS偏好特征进行深度融合，并实现多维QoS的联合预测。作为一个端到端模型，JQSP以数据预处理后的多个用户-服务QoS矩阵作为输入，每个矩阵针对一维QoS属性。在整个JQSP方法框架中，MGCN模块包含三个子模块：1)具有节点级注意力的分解器，该子模块可从服务的特征信息和用户的特征信息中识别和捕获用户-服务交互关系的潜在偏好，并将其映射为具体的组件；2)具有组件级注意力的组合器，该子模块可获得上述组件的权重系数，然后通过聚合组件与对应的权重系数得到用户嵌入向量和服务嵌入向量；3)加权融合器，该子模块负责将多维QoS的用户嵌入向量和服务嵌入向量采用加权融合的方式聚合为融合嵌入向量。ANFM模块由改进的注意力因子分解机构成，它使用线性部分建模融合嵌入向量的一阶特征，使用交互部分建模其二阶交互特征，使用全连接层部分建模其高阶交互特征并应用自注意力为交互特征分配权重，最后将多个部分的结果相加得到最终的多维QoS预测结果。

下面对本发明的数据预处理、模型构建与训练进行详细说明。

数据预处理：

数据预处理的目的是将QoS矩阵转换为模型可识别的标准格式。所述预处理过程包括以下步骤：

1.将响应时间QoS矩阵中的0值和超过20的值设置为NULL；

2.将响应时间QoS矩阵和吞吐量QoS矩阵分别进行Min-Max归一化；

3.将两维QoS矩阵按用户标识和服务标识进行对齐，构建“用户标识-服务标识-响应时间QoS-吞吐量QoS”的输入向量。

4.在QoS预测背景下，逻辑上将用户-服务的历史QoS建模为用户-服务二部图，并将QoS二部图分别从用户和服务视角来建模，即用户特征矩阵和服务特征矩阵。

模型构建与训练：

JQSP方法的总体过程由三个主要部分组成：1)多维QoS环境偏好特征提取：应用多个结构相同、参数独立的MGCN模块对多维QoS进行环境偏好特征提取；(2)特征融合：使用加权融合方法将多维QoS的环境偏好特征映射到同一空间；(3)多维QoS联合预测：应用ANFM模块建模融合嵌入的各阶交互特征并训练神经网络进行多维QoS联合预测。

一、多维QoS环境偏好特征提取

多维QoS环境偏好特征提取由多个结构相同、参数独立的MGCN模块完成，MGCN模块可以细分为分解器和组合器两个部分，将QoS矩阵表征为嵌入向量。MGCN模块的输入为单维QoS的用户特征矩阵和服务特征矩阵，输出为该类QoS的用户嵌入向量和服务嵌入向量。下面分别描述这两个子模块的细节。

1.1分解器

分解器可从特征信息中识别和捕获交互中的潜在偏好，并将其映射为组件。分解器的输入为用户特征矩阵和服务特征矩阵，输出为用户聚合组件和服务聚合组件。

(1)多组件提取：假定用户-服务二部图G受M个潜在偏好影响，分别为用户和服务设计M个转换矩阵作为卷积核，对二部图进行卷积操作：用户转换矩阵组W＝{W₁,W₂,…,W_M}和服务转换矩阵组Q＝{Q₁,Q₂,…,Q_M}，第m个转换矩阵捕获第m个用户-服务交互潜在偏好。对于服务i，其第m个服务特有组件可按公式(1)提取；对于用户j，其第m个用户特有组件可以按公式(2)提取。

(2)节点级注意力应用：在用户-服务二部图中，每个节点都有若干可用于获取邻域信息的邻居节点。对节点应用节点级注意力，可学习该节点的各邻居节点的重要性，区分邻居之间的差别并为其分配不同的权重，以提升特征提取的效果。

经过多组件提取步骤，用户j得到M个用户特有组件服务i得到M个服务特有组件/>考虑到用户与不同服务的交互对描述各组件影响不同，分解器应用节点级注意力来凸显对描述组件影响较大的服务。

具体来说，考虑到第m个组件对用户j调用服务i的QoS值的影响同时表现在用户特有组件和服务特有组件中，则其影响因子可由注意力公式(3)学习得到，其中att_node表示执行节点级注意力的神经网络，W_att,m表示第m个组件的节点级注意力参数矩阵，σ表示激活函数，||表示拼接操作。在获得影响因子/>后，将其按softmax函数(4)进行标准化，以获得其权重系数/>

对于用户j的调用服务集P_u中的服务，通过公式(5)聚合其服务特有组件与对应的权重系数/>可得到用户j特有的第m个服务聚合组件/>它描述了用户j的客户端主机受第m个偏好影响的程度。经过分解器的处理，所有用户都获得了M个服务聚合组件所有服务也获得了M个用户聚合组件/>

1.2组合器

组合器可学习潜在组件的权重系数并聚合它们，得到嵌入向量。组合器的输入为用户聚合组件和服务聚合组件，输出为用户嵌入向量和服务嵌入向量。(1)组件级注意力应用：客户端主机对服务环境的偏好可通过服务聚合组件反映，而服务器对用户环境的偏好可通过用户聚合组件反映。考虑到不同组件对学习用户嵌入向量或服务嵌入向量有不同的贡献，组合器应用组件级注意力来凸显对学习嵌入向量影响较大的组件。

具体来说，考虑到第m个服务聚合组件的权重系数同时受到原始的用户特征信息和节点级注意力加权的用户特征信息的影响，本发明通过拼接服务聚合组件/>和用户特有组件/>并通过全连接层，按公式(6)得到用户联合向量/>其中C_m是参数矩阵，b_m是偏置向量。然后，按公式(7)学习得到第m个服务聚合组件的影响因子w_m，其中att_com是执行组件级注意力的神经网络，q是组件级注意力参数矩阵，b是偏置值，q和b由所有用户聚合组件和服务聚合组件共享，这两个参数表示客户端主机对不同服务环境和服务器对不同用户环境的共同偏好倾向。然后，将影响因子w_m按softmax函数(8)进行标准化，获得第m个服务聚合组件的权重系数/>

(2)权重聚合：按公式(9)聚合服务聚合组件与其对应的权重系数，获得用户j的嵌入向量z_j。类似地，可获得服务i的嵌入向量v_i。用户嵌入向量z_j和服务嵌入向量v_i不仅捕获了低维的用户相似关系和服务相似关系，也捕获了高维的用户-服务交互中隐含的客户端主机对服务环境、服务器对用户环境的偏好信息。

二、特征融合

获得用户嵌入向量z_j和服务嵌入向量v_i后，将它们按公式(10)进行拼接，得到合并嵌入向量所有合并嵌入向量组合获得合并嵌入矩阵e_merge。

注意，合并嵌入矩阵e_merge是MGCN模块处理单个QoS矩阵所获得的单维QoS合并嵌入矩阵，仅包含单维QoS的用户特征和服务特征。对于多个MGCN获得的多维QoS合并嵌入矩阵e_merge,k，在对齐用户标识和服务标识后，采用加权聚合的方式进行特征深度融合，按公式(11)获得融合嵌入矩阵z_union作为下一个模块的输入，其中λ_k是可训练的权重系数。融合嵌入矩阵z_union中的每个融合嵌入向量z_ij均包含了用户j和服务i在多维QoS上的特征。

z_union＝λ₁e_merge,1+λ₂e_merge,2+…+λ_ke_merge,k,∑λ_k＝1 (11)

三、多维QoS联合预测

多维QoS联合预测由ANFM模块完成。ANFM模块的输入为融合嵌入向量，使用线性部分提取向量中的一阶特征，使用交互部分和自注意力神经网络部分提取向量中的二阶和高阶交互特征，输出为多维QoS预测值。

3.1 ANFM介绍及线性部分计算

ANFM的核心公式如公式(12)所示，其中w₀表示全局偏置，W₁表示一阶特征提取的参数向量，h(x为高阶特征提取函数。由此，对于输入的混合嵌入向量z_ij，首先可获得线性部分y_linear,ij＝w₀+W₁z_ij。

y_ANFM(X)＝w₀+W₁X+h(X) (12)

传统FM的h(x为该项为二阶因式分解交互项，可有效提取输入向量中的二阶交互特征，但在处理复杂的现实数据时表达受限。考虑到各组交互对最终预测的贡献不同，本发明应用注意力来凸显贡献更大的交互项，可减少注意力特征提取对外部信息的依赖，有效捕捉特征的内部相关性。

3.2交互层计算

为提取特征之间的交互，对于给定的d维输入特征向量z_ij＝{z₁,z₂,…,z_d}，首先为其每个特征元素z_i构建交互嵌入向量e_i，按公式(13)得到元素嵌入向量所有交互嵌入向量构成交互嵌入矩阵E，它由所有输入特征向量共享。然后，按公式(14)得到二阶交互向量z_pair，其中°表示哈达玛积。

3.3自注意力应用

自注意力机制是注意力机制的变体，它依据输入向量的内部元素相关性计算各元素的自注意力值，减少了对外部信息的依赖，相比于传统注意力机制更加灵活。对二阶交互向量的自注意力机制实现过程如下：对于e维二阶交互向量z_pair＝{z₁,z₂,…,z_e}，首先为每个交互特征元素z_j构建注意力嵌入向量att_j，按公式(15)得到元素注意力嵌入向量然后构建三个由全部元素嵌入向量共享的自注意力参数矩阵：W^Q，W^K，W^V，按公式(16)至(18)分别计算得到查询向量Q_j，键向量K_j和值向量V_j。接着将Q_j与K_j按公式(19)相乘得到/>的注意力分数值score_j，其中⊙表示点乘。

score_j＝Q_j⊙K_j (19)

对于多个交互特征元素z_j，将它们的注意力分数值按公式(20)进行softmax归一化，得到对应的权重值weight_j，该权重值能判断Q_j和K_j相似程度，也决定了V_j的重要程度。最后，将weight_j和V_j按公式(21)进行加权求和，得到带自注意力的二阶交互特征向量z_ij,att。

weight_j＝softmax(score_j) (20)

z_ij,att＝∑{weight_j×V_j} (21)

3.4多维QoS联合预测

在获得带自注意力的二阶交互特征向量后，为提取高阶交互特征，将z_ij,att传入一组全连接层，按公式(22)—(25)计算高阶特征提取向量h(z_ij)，其中W_i和b_i表示第i层神经网络的权重矩阵和偏置值，σ表示激活函数，q表示预测层权重矩阵。

l₁＝σ(W₁z_ij,att+b₁ (22)

l₂＝σ(W₂l₁+b₂ (23)

……

l_n＝σ(W_nl_n-1+b_n) (24)

h(z_ij)＝q^Tl_n (25)

公式(25)中q为一个权重矩阵而非列向量，其列数等于MGCN模块输入的QoS矩阵的个数，h(z_ij)的输出为一个多维向量，其维度等于QoS的类别数。

综合以上结果，按公式(26)获得A个最终预测结果其中/>表示用户j调用服务i在第a类QoS上的预测结果，h_a(z_ij)表示高阶特征提取向量h(z_ij)的第a个分量，线性回归部分y_linear,ij由所有类的QoS预测结果共享。

实施例：

在本实施例中，针对本发明提供的QoS预测方法，进行实验验证，下面对本实施例的数据集与实验设置、评估指标、对比方法以及实验结果进行详细描述。

数据集与实验设置：

我们使用公开数据集WS-DREAM数据集。该数据集包含339个用户与5825个Web服务交互的1974675个真实QoS结果，包括响应时间和吞吐量两类重要QoS属性。为去除无效数据，本发明对响应时间数据集进行如下预处理：舍弃响应时间为0(代表用户未调用该Web服务)和响应时间超过20(代表响应时间过长，用户可能放弃调用该服务，所以该响应时间数据没有意义)的元素；为保证联合预测时多维QoS的数据在同一尺度，将响应时间数据集进行Min-Max归一化，使其数据尺度为(0,1)。吞吐量数据集中的元素均为有效数据，故仅进行Min-Max归一化。

实际中，用户通常只会调用少量服务，导致QoS数据的用户服务矩阵稀疏。考虑到预处理后的吞吐量矩阵和响应时间矩阵为稠密矩阵，为在实验中模拟真实情况，本发明在训练模型时使用DoT(Density of Training Set)较低的QoS矩阵。例如，DoT＝5％表示随机选择5％的QoS数据作为训练集，剩余95％的QoS数据作为测试集。考虑数据稀疏性的影响，本发明将QoS数据集按如下比例随机分成训练集和测试集：DoT＝{5％,10％,15％,20％,25％,30％}，共六组实验，注意随机拆分时对齐多维QoS的用户标识和服务标识。然后，本发明对所有方法在所有DoT数据集上各进行5次实验并取平均值，以评价QoS预测性能，进行对比分析。对于JQSP方法及其消融实验，具体参数设置如表1所示。

表1参数设置

评价指标：

为评价模型的效果，本发明采用以下两种广泛使用的评价参数：均方根误差(RMSE)和平均绝对误差(MAE)。

(1)均方根误差：RMSE表示预测值与真实值偏差的平方与观测次数比值的平方根，反映了样本的分散程度。RMSE的计算方法如式(29)所示。

(2)平均绝对误差：MAE表示预测值和观测值之间绝对误差的平均值，其所有差值的权重相等。MAE的计算方法如式(30)所示。

其中y_pred,i表示第i个预测QoS值，y_true,i表示第i个真实QoS值。RMSE和MAE的值越小，表示模型预测的准确性越高，结果越好。

对比方法：

将JQSP方法与基于邻域、基于因子分解模型和基于神经网络的CF方法以及JQSP方法的消融实验进行比较，以证明JQSP方法的性能。

(1)UIPCC：UIPCC结合了基于用户和基于项目的协作预测方法，采用PCC来度量节点之间的相似度，并使用相似用户和相似服务进行QoS预测。它属于基于邻域的CF方法。

(2)PMF：PMF采用概率矩阵分解方法对用户-服务QoS矩阵进行因子分解来提取隐藏特征，在面对大型稀疏数据集时具有良好的预测效果。它属于基于因子分解模型的CF方法。

(3)DNM：DNM是一种基于上下文的QoS预测模型，具有较好的预测精度，在面对挖掘异构上下文特征的任务时具有较好的鲁棒性和可扩展性。它属于基于神经网络的CF方法，本发明选用该方法作为基准方法。

(4)MLP-ANFM：该方法使用MLP替代MGCN模块作为Encoder部分，和ANFM模块一起组成完整的端到端模型。该方法的实验结果可以论证MGCN模块是否对QoS预测的准确度有影响。

(5)MGCN-MLP：该方法使用MLP替代ANFM模块作为Decoder部分，和MGCN模型一起组成完整的端到端模型。该方法的实验结果可以论证ANFM模块是否能有效地利用特征交互信息来提升QoS预测准确度。

(6)Single-MGCN：该方法使用单个single-MGCN模块，同时去掉了加权聚合层，使得整个模型只训练和预测单维QoS。该方法的实验结果可以论证联合预测是否比单独预测更精确。

实验结果与分析：

表2给出了基于响应时间数据集的所有QoS预测评价结果，表3给出了基于吞吐量数据集的所有QoS预测评价结果，并对每个DoT训练集的最优数据进行加粗表示。表中Gains计算方式如公式(31)所示，代表了JQSP方法与基准方法DNM相比性能提升的程度。

表2响应时间预测评价结果

表3吞吐量预测评价结果

根据实验结果，可得出如下观察结果：由表2和表3可以得出，对于RMSE和MAE两项评价指标，PMF显著优于UIPCC，在训练集占比低的情况下更为明显，说明矩阵分解方法在缓解数据稀疏性问题上比基于邻域的方法表现更优。DNM一定程度上优于PMF，在少数训练集占比上持平，这说明神经网络方法有比矩阵分解方法更优的建模能力。本发明提出的JQSP方法及其消融实验(即MLP-ANFM，MGCN-MLP，Single-MGCN)在RMSE和MAE上始终优于对比方法，且在吞吐量数据集、DoT＝30％的RMSE评价指标上相比基准方法DNM有28.96％的提升率，说明JQSP方法相比其他基线方法有更优的表现。

对比表2和表3中的MLP-ANFM方法和JQSP方法，可看到JQSP方法性能全面领先MLP-ANFM方法，这证明用于提取环境偏好特征的MGCN模块对QoS预测准确度的提升是有帮助的。对比表2和表3中的MGCN-MLP方法和JQSP方法，可以看到JQSP方法依然有较优的表现，这证明ANFM模块因为有效提取了输入向量的二阶及高阶交互特征而提升了预测的准确性。同时注意到MGCN-MLP方法和MLP-ANFM方法的性能差距较小，说明MGCN和ANFM两个模块对模型预测性能的影响是接近的。

对比表2和表3中的Single-MGCN方法和JQSP方法，可看到JQSP方法依然有着较大的领先优势，这证明了与提取单维QoS特征相比，将多维相关的QoS数据的特征映射到同一空间进行特征提取有更优的表现。同时注意到，与MGCN-MLP和MLP-ANFM方法相比，Single-MGCN方法更接近JQSP方法的性能，这可能说明与MGCN和ANFM两个模块相比，单独应用联合预测框架对模型的预测精确度的提升较少。

超参数对比分析：

本发明针对以下超参数在DoT＝30％的数据集上进行单一变量实验，以探究它们各自对JQSP模型性能的影响：转换矩阵数m∈{1,2,3,4,5}，神经网络嵌入维度d_neu∈{8,16,32,64,128}，自注意力嵌入维度d_att∈{8,16,32,64,128}。简便起见，本发明仅列出响应时间数据集上的结果。当一个参数的效果正在检查时，其他参数被设置为默认值。

(1)转换矩阵数：转换矩阵数m代表了模型捕获潜在环境偏好的数量，增加m可以提高模型的捕获能力，但过高的m可能超过了真实数据中的潜在环境偏好数，增加了模型复杂度的同时无法提升模型性能。从图2的实验结果可以得出，随着m数量的增加，模型性能有所提升，m＝3时模型获得了最优的性能，后续进一步增加m无法获得明显性能提升，同时还会大幅增加模型训练的时间。

(2)神经网络嵌入维度：嵌入维度表示神经网络层使用多少维度来表达特征，维度越高，表达特征越细腻，但过高的维度会引入过多的参数，可能造成过拟合和难以收敛的问题，大幅增加模型训练时间。从图3的实验结果可以得出，随着d_neu增加，模型性能明显提高，d_neu＝64时模型获得最优表达能力，继续增加d_neu反而导致性能下降。

(3)自注意力嵌入维度：自注意力嵌入维度表示自注意力参数矩阵使用多少维度来表达自注意力特征。从图4的实验结果可以得出，从8开始增加d_att有效提升了模型的性能，d_att＝32时模型获得了最优的表达能力，继续增加d_att降低了模型的性能。

本发明提出了一种JQSP方法用于多维QoS联合预测，与现有的QoS预测方法相比，它有以下优点：(1)它能有效识别和挖掘用户偏好信息和服务偏好信息，从而为特征提取提供了更丰富的信息；(2)它将多维相关QoS的特征映射到同一空间进行特征提取，这能获取到处理单维QoS无法获取的多维QoS相关性特征；(3)它引入带自注意力的因子分解机来挖掘特征提取向量中的一阶特征、二阶和高阶交互特征，并为交互特征赋予注意力权重，有效提升了特征提取的效果，该效果优于传统因子分解机和MLP。

Claims

1.一种基于特征深度融合的Web服务多维QoS联合预测方法，其特征在于，包括以下步骤：(1)多维QoS环境偏好特征提取：应用多个结构相同、参数独立的多分量图卷积网络模块MGCN对多维QoS进行环境偏好特征提取；(2)特征融合：使用加权融合方法将多维QoS的环境偏好特征映射到同一空间；（3）多维QoS联合预测：应用注意力神经分解机模块ANFM挖掘融合嵌入的各阶交互特征并训练神经网络进行多维QoS的联合预测；

所述步骤（1）中，在获得预处理的输入向量以后，将输入向量分别作为多个结构相同、参数独立的MGCN模块的输入，将抽象的环境偏好映射为具体的组件，从而得到用户嵌入和服务嵌入；

所述步骤（1)中，MGCN模块应用多组件图卷积协同过滤方法，将目标节点的邻居节点信息聚合到目标节点上，同时使用节点级注意力区分不同邻居节点的重要性；

所述步骤（3）中，在ANFM模块建模融合嵌入特征的过程中，采用线性部分建模一阶特征，采用交互池化层建模二阶交互，采用自注意力层和多层感知机建模高阶交互，最后结合多个部分的结果进行多维QoS的联合预测。

2.根据权利要求1所述的一种基于特征深度融合的Web服务多维QoS联合预测方法，其特征在于，所述步骤（1)中，在MGCN模块处理多维QoS前对QoS进行预处理过程，以两个QoS属性维度为例，即响应时间和吞吐量，其预处理过程包括以下步骤：

（1）、将响应时间QoS矩阵中的0值和超过20的值置为NULL；

（2）、将响应时间QoS矩阵和吞吐量QoS矩阵分别进行Min-Max归一化；

（3）、将两个QoS属性的QoS矩阵按用户标识和服务标识进行对齐，构建“用户标识-服务标识-响应时间QoS-吞吐量QoS”的输入向量。

3.根据权利要求1所述的一种基于特征深度融合的Web服务多维QoS联合预测方法，其特征在于，所述步骤（2）中，在获得用户嵌入和服务嵌入之后，先将同一维QoS的两类嵌入拼接成合并嵌入，再使用加权融合的方式将多维QoS的合并嵌入聚合为融合嵌入。