CN111541570A - 基于多源特征学习的云服务QoS预测方法 - Google Patents

基于多源特征学习的云服务QoS预测方法 Download PDF

Info

Publication number
CN111541570A
CN111541570A CN202010322208.0A CN202010322208A CN111541570A CN 111541570 A CN111541570 A CN 111541570A CN 202010322208 A CN202010322208 A CN 202010322208A CN 111541570 A CN111541570 A CN 111541570A
Authority
CN
China
Prior art keywords
service
user
matrix
source
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010322208.0A
Other languages
English (en)
Other versions
CN111541570B (zh
Inventor
丁丁
夏有昊
李浥东
畅振华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202010322208.0A priority Critical patent/CN111541570B/zh
Publication of CN111541570A publication Critical patent/CN111541570A/zh
Application granted granted Critical
Publication of CN111541570B publication Critical patent/CN111541570B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于多源特征学习的云服务QoS预测方法。该方法包括:利用用户和服务的上下文数据提取用户和服务的显式特征;基于矩阵分解和神经网络相结合的隐式因子嵌入方法,从用户‑服务矩阵中提取用户和服务的深层隐式特征;将显式特征与隐式特征拼接,得到用户‑服务调用记录对应的多源特征矩阵;利用基于卷积神经网络的联合深层网络,学习得到多源特征矩阵的局部‑全局特征组合,进而得到用户对云服务的QoS预测。本发明实现了从多源信息中学习高阶特征组合,并充分考虑了特征序列对特征组合学习的影响,从而有效的提高了QoS预测精度。

Description

基于多源特征学习的云服务QoS预测方法
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种基于多源特征学习的云服务QoS预测方法。
背景技术
云服务作为面向服务的体系结构技术,通过云计算提供商提供的互联网按需的为用户提供服务。然而,随着服务计算的日益火热,越来越多的同质化云服务随之诞生,导致用户很难在具有相同功能的云服务中判断其能够满足个人需求的程度。在这种情况下,描述服务非功能属性的服务质量(Quality of Service,QoS)成为区分同质化云服务差别的关键。
服务质量是描述服务非功能属性的若干质量组合,例如响应时间,吞吐量,信誉度等。然而,在实际的服务调用场景中,执行大规模的服务评估用于获得准确的QoS是不现实的。一方面,同一服务的QoS值很容易受到用户地理位置、网络状态等异构环境的影响,使得在客户端进行真实的服务评估非常昂贵和耗时。另一方面,大多数用户并非专业人士,很难充分并准确的对服务质量进行评估。因此,基于QoS预测的服务推荐技术成为帮助用户选择最佳服务的关键。
QoS预测的方法通常是利用历史的QoS信息为相关的用户找到合适的服务。目前,利用协同过滤技术对QoS进行预测是学术界和工业界进行服务推荐的主流方法,包括基于近邻的协同过滤方法和基于模型的协同过滤方法。其中基于近邻的协同过滤方法主要是通过计算相似度找到用户和服务的邻域集,利用邻域信息预测目标QoS值。然而该方法在历史数据高度稀疏的情况下很难找到高质量的邻域集,从而对QoS值进行精确的预测。基于模型的协同过滤方法主要通过对用户-服务矩阵进行阵分解,找到用户和服务的隐因子矩阵进行预测,在一定程度上提高了预测精度。
然而,云环境的多样性和动态性的与日俱增,对服务推荐中的QoS预测提出了许多新的挑战,其中一个关键的挑战就是如何提取和学习用户/服务的深层特征,而现有方法的表达能力明显不足。此外,协同过滤技术主要通过收集相似用户或服务的历史信息来预测缺失的QoS值,然而此类方法在大多数情况下,仅利用了QoS矩阵的信息,而忽略了许多其他的关键因素。例如,在客户端测量的QoS值(响应时间,吞吐量,可用性等),在受到不可预知的网络连接或异构用户环境的影响时,可能存在很大差异。地理位置、网络状态等各种环境特征都会对QoS值有很大的影响,单一维度的上下文信息很难完全反映复杂的环境。考虑到QoS值在不同异构环境下的不同表现问题,利用多源信息对QoS预测和服务推荐至关重要。
发明内容
本发明的实施例提供了一种基于多源特征学习的云服务QoS预测方法,以克服现有技术的问题。
为了实现上述目的,本发明采取了如下技术方案。
一种基于多源特征学习的云服务QoS预测方法,包括:
利用用户和服务的上下文数据提取用户和服务的显式特征;
基于矩阵分解和神经网络相结合的隐式因子嵌入方法,从用户-服务矩阵中提取用户和服务的深层隐式特征;
将所述用户和服务的显式特征与隐式特征拼接,得到用户-服务调用记录对应的多源特征矩阵;
利用基于卷积神经网络的联合深层网络,学习得到所述多源特征矩阵的局部特征组合,基于所述局部特征组合学习多源特征间的全局特征组合,根据所述多源特征间的全局特征组合得到用户对云服务的QoS预测。
优选地,所述的利用用户和服务的上下文数据提取用户和服务的显式特征,包括:
将上下文数据中用户-服务的环境特征划分为包含多个显式特征的显式字段,所述环境特征包括地理位置和网络状态,利用独热编码对环境特征进行编码,通过嵌入层网络将编码后的环境特征映射为嵌入向量,将每条用户-服务调用记录表示为由显式特征构成的嵌入矩阵。
利用Doc2Vec算法学习服务描述文档中的语义信息,从而获得每个服务的语义向量,并用于对服务嵌入向量的初始化。
优选地,所述的基于矩阵分解和神经网络相结合的隐式因子嵌入方法,从用户-服务矩阵中提取用户和服务的深层隐式特征,包括:
对用户-服务矩阵进行概率矩阵分解获得用户和服务的隐因子矩阵,该隐因子矩阵中的用户向量和服务向量的因子表示了用户偏好特征和服务属性特征,所述用户偏好特征和服务属性特征构成了用户服务的隐式特征,利用独热编码对所述用户服务的隐式特征进行编码,通过嵌入层网络将编码后的用户服务的隐式特征映射为嵌入向量,将每条用户-服务调用记录表示为隐式特征矩阵。
优选地,将所述用户和服务的显式特征与隐式特征拼接,得到用户-服务调用记录对应的多源特征矩阵,包括:
针对每条用户-服务调用记录,分别获得表示用户-服务环境特征的显示特征矩阵表示,以及表示用户偏好特征和服务属性特征的隐式特征矩阵表示。拼接显示特征矩阵与隐式特征矩阵,使每条用户-服务调用记录通过一个多源特征矩阵表示。
优选地,所述的利用基于卷积神经网络的联合深层网络,学习得到所述多源特征矩阵的局部特征组合,包括:
构建基于卷积神经网络的联合深层网络,该联合深层网络包括单隐层神经网络、卷积神经网络和多层感知机,所述单隐层神经网络用于降低不同特征序列对卷积神经网络的影响,将多源特征矩阵P转化为一维向量
Figure BDA0002461859890000041
Figure BDA0002461859890000042
再将一维向量P1输入至单隐层网络中自适应学习新的特征序列,表达式如下:
Figure BDA0002461859890000043
其中
Figure BDA0002461859890000044
表示激活函数RELU,
Figure BDA0002461859890000045
Figure BDA00024618598900000413
分别表示权重矩阵和偏置向量,再将P′1重塑回原始维度,获得新序列下的多源特征矩阵P′;
将所述多源特征矩阵P′扩展为
Figure BDA0002461859890000046
利用卷积操作学习新序列下多源特征间的局部特征组合,卷积操作如下所示:
Figure BDA0002461859890000047
其中*表示卷积操作,W1和b1分布表示第一层的卷积核和偏置,
Figure BDA0002461859890000048
表示激活函数RELU,利用卷积核
Figure BDA0002461859890000049
对多源特征矩阵进行一维列卷积,保证特征维度不变,其中pi,1,qi分别表示卷积核的高度、宽度及数量,利用池化操作捕捉重要特征组合,池化操作如下所示:
Figure BDA00024618598900000410
其中i表示层数,hi表示第i个池化层的高度;
通过多次卷积操作和池化操作获得多源特征间的局部特征组合D*
优选地,所述的基于所述局部特征组合学习多源特征间的全局特征组合,根据所述多源特征间的全局特征组合得到用户对云服务的QoS预测,包括:
引入了多层感知机,利用多层感知机学习多源特征间的全局特征组合,将局部特征组合
Figure BDA00024618598900000411
重塑为
Figure BDA00024618598900000412
再与原始的多源特征矩阵P拼接生成混合特征:
Figure BDA0002461859890000051
其中ι表示卷积-池化层的个数,利用多层感知器从多源特征矩阵P和局部特征组合P*的组合中学习出全局特征组合,所述多层感知器由多个隐藏层堆叠实现:
R0=flatten(Q)…
Figure BDA0002461859890000052
其中Xi和zi分别是第i个隐藏层的权重矩阵和偏置向量,R0表示混合特征的一维化向量,即多层感知机的输入,Ri表示第i个隐藏层的输出。
设共有λ个隐藏层,则最终预测的用户对云服务的QoS值R*可以由第λ层得到:
Figure BDA0002461859890000053
由上述本发明的实施例提供的技术方案可以看出,本发明实施例以卷积神经网络为核心,设计了一种基于联合深层网络的特征组合学习方法,实现了多源信息中局部-全局的高阶特征组合学习,并充分考虑了特征序列对特征组合学习的影响,从而有效的提高了QoS预测精度。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提出的一种基于多源特征学习的云服务QoS预测方法的处理流程图;
图2为本发明实施例提出的一种显式特征提取的示意图;
图3为本发明实施例提供的一种用户调用服务的示意图;
图4为本发明实施例提出的一种隐式特征提取的示意图;
图5为本发明实施例提出的一种多源特征提取模型的示意图;
图6为本发明实施例提出的一种特征组合学习模型中联合深层网络的示意图。
图7为本发明实施例提出的基于多源特征学习的云服务QoS预测方法与基于协同过滤的QoS预测方法的实验对比示意图。
图8为本发明实施例提出的基于多源特征学习的云服务QoS预测方法与基于神经网络的QoS预测方法的实验对比示意图。
具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。
本发明实施例考虑服务调用中的多种影响因素,结合矩阵分解和神经网络技术,提出一种基于联合深层网络的多源特征学习方法,该方法包括多源特征提取和特征组合学习两个部分。神经网络模型作为一种有效的非线性模型,在学习深层特征方面具有显著的优势,目前已被广泛应用于服务推荐中的点击率预测和QoS预测问题。
本发明实施例设计了一种基于隐因子嵌入的多源特征提取模型,该模型不仅能够充分地考虑服务调用中的影响因素,利用上下文数据和服务描述文档提取用户和服务异构环境的显式特征,还能有效地利用神经网络技术,从历史QoS数据中提取用户偏好和服务属性的深层隐式特征,最终实现从多源数据中捕捉用户和服务的关键特征的目的。之后,本发明以卷积神经网络为核心,设计了一种基于联合深层网络的特征组合学习方法,实现了局部-全局的高阶特征组合学习,并充分考虑了特征序列对特征组合学习的影响,从而有效的提高了预测精度。
本发明实施例提出的一种基于多源特征学习的云服务QoS预测方法的处理流程如图1所示,包括如下的处理步骤:
步骤S1:显式特征提取及服务特征初始化。
图2为本发明实施例提出的一种显式特征提取的示意图。本步骤主要利用上下文数据和服务描述文档提取用户及服务的显式特征。
上下文感知是QoS预测不可缺少的内容。因此,在本发明实施例中,从上下文信息中提取相关的显式特征,该显式特征包括用户和服务的异构环境因素,如地理位置(区域和IP地址)、网络状态(自治系统和子网)。如果一个用户调用了一个服务,该用户和服务的每个环境因素都被认为是一个包含多个显式特性的显式字段,则调用记录可以简单表示为(包括ID信息):
xE=(UID,SID,U-Region,U-subnet,S-region,S-subnet)
由于上下文信息通常以多字段分类的形式收集,因此通过独热(one-hot)编码将每个调用实例转换为一个高维的稀疏(二进制)向量xE。图3为本发明实施例提供的一种用户调用服务的示意图,假设用户u1调用服务s3,则调用实例可以表示为输入向量:
xE=(1000,0010,01,100,10,010)
其中如果用户和服务位于同一区域(例如u3和s1),则该区域将被标识为用户和服务的一个独立特性。
然后在输入向量上应用一个嵌入层,将独热编码映射到一个固定长度的稠密向量,以细粒度的方式反映特征的语义信息。在仅保留独热编码中标识为1的特征后,每条调用记录被表示为一个由显式特征构成的嵌入矩阵PE,记为:
Figure BDA0002461859890000081
其中
Figure BDA0002461859890000082
为保留的显式特征数。
为了更加精确的描述服务信息,我们结合Web服务描述语言(Web ServicesDescription Language,WSDL)对显式特征矩阵中的服务嵌入向量进行初始化操作。作为Web服务的描述语言,WSDL文档包含丰富的语义信息,包括服务的端口类型、服务的调用方法等。具有相似语义信息的服务通常意味着它们具有相似的属性和功能。因此,本发明使用WSDL文档来初始化服务特性,以提高QoS预测的准确性。本发明使用了自然语言处理中的一种先进的方法Doc2Vec算法,用于从WSDL文档获取每个服务的语义向量。具体来说,该算法在每个WSDL文档中添加一个段落向量和单词向量用于训练。通过Doc2vec中的PV-DW模型处理后,将每个服务的描述文档表示为一个语义向量,再用语义向量初始化服务的嵌入向量。从而避免了服务向量随机初始化所带来的不稳定性,避免了服务向量的相似性和差异性,从而更准确地提取WSDL文档中的语义信息,这确保了服务向量嵌入了服务信息的先验知识,缓解了数据稀疏性问题。
步骤S2:基于隐因子嵌入的隐式特征提取。
用户偏好和服务属性在QoS预测中也起着至关重要的作用。本发明实施例提出了一种基于矩阵分解和神经网络相结合的隐式因子嵌入方法,从用户-服务矩阵中提取用户和服务的隐式特征。图4为本发明实施例提出的一种隐式特征提取的示意图。该步骤中主要是利用隐因子嵌入方法来提取反映用户偏好和服务属性的隐式特征。首先对用户-服务矩阵进行概率矩阵分解(Probabilistic Matrix Factorization,PMF),获得用户和服务的隐因子矩阵,隐因子矩阵中的每个用户向量和服务向量的因子都表示了用户偏好特征和服务属性特征,即用户服务的隐式特征。假设用户和服务的隐式特征表示为(Ima,Imb,Imc),则调用记录可以通过隐式字段来表示为:
xE=(UID,SID,U-Ima,U-Imb,S-Imc)
由于每个特征为浮点型数值,通过控制小数点后位数对特征进行离散化表示,从而将每个离散化的特征都表示为分类特征。
之后同样利用独热编码以及嵌入层网络,将每个隐式特征都映射为一个嵌入向量。因此每条用户-服务调用记录也可以由一个隐式特征矩阵表示,记为PI
Figure BDA0002461859890000091
其中
Figure BDA0002461859890000101
为保留的隐式特征数。
步骤S3:显-隐特征结合的多源特征的生成。
为了更好地利用以上信息来提高QoS预测精度,本发明提出了一种显-隐特征结合的多源特征提取方法。图5为本发明实施例提出的一种多源特征提取模型的示意图。将隐式特征与显示特征拼接,最终每条用户-服务调用记录可以用一个多源特征矩阵表示,记为P,表达式如下:
Figure BDA0002461859890000102
其中fr和d分别表示特征总数及嵌入向量维度。
步骤S4:基于单隐层神经网络的特征序列学习。
考虑到传统线性模型拟合能力不足,本发明构建了基于卷积神经网络的联合深度网络(Joint Deep Networks,JDN)来学习特征组合并实现QoS预测。与基于深度神经网络的方法相比,JDN可以利用卷积神经网络中的权值共享和池化机制来减少寻找关键局部模式所需的参数数量,从而有效地识别稀疏的高阶特征组合。此外,JDN减轻了特征序列对局部特征组合学习的影响,能够同时学习局部-全局的特征组合。
图6为本发明实施例提出的一种特征组合学习模型中联合深层网络的示意图,如图6所示,联合深层网络由单隐层神经网络、卷积神经网络和多层感知机三部分构成。其中,单隐层神经网络用于降低不同特征序列对卷积神经网络的影响。首先,多源特征矩阵被转化为一维向量
Figure BDA0002461859890000103
再将一维向量P1输入至单隐层网络中自适应学习新的特征序列,表达式如下:
Figure BDA0002461859890000104
其中
Figure BDA0002461859890000105
表示激活函数RELU,
Figure BDA0002461859890000106
Figure BDA0002461859890000107
分别表示权重矩阵和偏置向量。之后,再将P1′重塑回原始维度,获得新序列下的多源特征矩阵P′,便于卷积神经网络学习更有意义的局部特征组合。
步骤S5:基于卷积神经网络的局部特征组合学习。
本步骤将利用卷积神经网络,学习在新序列下多源特征间的局部特征组合。首先为了便于卷积神经网络的输入,将多源特征矩阵P′扩展为
Figure BDA0002461859890000111
Figure BDA0002461859890000112
之后利用卷积层学习局部特征组合,卷积操作如下所示:
Figure BDA0002461859890000113
其中*表示卷积操作,W1和b1分布表示第一层的卷积核和偏置,
Figure BDA0002461859890000114
表示激活函数RELU。卷积层主要利用卷积核
Figure BDA0002461859890000115
对多源特征矩阵进行一维列卷积,保证特征维度不变,其中pi,1,qi分别表示卷积核的高度、宽度及数量。之后,利用池化层捕捉重要的特征组合,并减少所需参数的数量,具体操作如下:
Figure BDA0002461859890000116
其中i表示层数,hi表示第i个池化层的高度。最终,多源特征间的局部特征组合
Figure BDA0002461859890000117
由多次卷积操作和池化操作获得。
步骤S6:基于多层感知机的全局特征组合学习及QoS预测。
卷积神经网络能够有效地学习多个连续特征的局部特征组合,其作为新特征包含了许多相邻特征的模式,然而缺乏对全局特征组合的有效学习。因此,本发明实施例引入了多层感知机(Multilayer Perceptron,MLP)来解决这一问题。利用MLP学习多源特征间的全局特征组合,并最终对服务质量进行预测。首先,将局部特征组合
Figure BDA0002461859890000118
重塑为
Figure BDA0002461859890000119
再与原始的多源特征矩阵P拼接生成混合特征:
Figure BDA00024618598900001110
其中ι表示卷积-池化层的个数。之后,利用多层感知器从多源特征矩阵P和局部特征组合P*组合中学习出全局特征组合。多层感知器由多个隐藏层堆叠实现:
R0=flatten(Q)…
Figure BDA00024618598900001111
其中Xi和zi分别是第i个隐藏层的权重矩阵和偏置向量,R0表示混合特征的一维化向量,即多层感知机的输入,Ri表示第i个隐藏层的输出。
假设共有λ个隐藏层,则全局特征组合表示为
Figure BDA0002461859890000121
最终预测的服务对用户的服务质量R*可以由第λ层得到:
Figure BDA0002461859890000122
其中R*是通过利用用户-服务调用记录及用户和服务上下文数据,在提取了用户和服务的显式环境特征,用户偏好隐式特征,服务属性隐式特征的基础上,学习用户之间、服务之间及用户与服务间的特征组合预测得到的。
本发明实施例在真实的数据集上进行了大量的实验,以验证所提方法的有效性。为了模拟云服务调用的真实情况,我们随机删除QoS数据,在四种矩阵密度(2.5%、5%、7.5%和10%)下,对两种服务质量(响应时间和吞吐量)进行实验评估。评估指标为MAE(Mean Square Error,平均值误差),其定义为:
Figure BDA0002461859890000123
其中Ri,j
Figure BDA0002461859890000124
分别表示真实值与预测值。数值越低的平均值误差表示的预测结果更加准确。
实验结果如图7、图8所示,图7为我们的方法JDNMFL(Joint Deep Networks basedMulti-source Feature Learning)方法与其他协同过滤模型的对比,图8为JDNMFL方法其他神经网络模型的对比。
如图7所示,随着矩阵密度从2.5%增加到10%,JDNMFL总能在响应时间和吞吐量上获得最佳的MAE,这意味着JDNMFL比协同过滤方法(包括基于邻域的方法和基于模型的方法)具有更高的预测精度。此外,对比FM(Factorization Machine)方法,JDNMFL仍然可以实现MAE在响应时间和吞吐量上分别提高40.30%和39.33%。这是因为FM作为浅模型只学习了低阶特征组合进行预测,而我们的JDNMFL可以使用更强大的神经网络模型来学习高阶特征组合,进而提高预测精度。
如图8所示,虽然DNM(deep neural networks)作为一种先进的神经网络模型,可以获得比其他模型较优的结果,在响应时间和吞吐量上的MAE分别比最佳基线指标提高了30.3%和33.5%。但是,我们的JDNMFL能够获得更好的结果,在响应时间和吞吐量上的MAE分别比最佳基线指标提高了34.7%和37.3%,证明了JDNMFL与DNM相比的优越性。这可以归因于多源特征的提取和局部-全局特征组合相结合的学习方法,因为传统的深度神经网络很难在巨大的参数空间中有效地学习稀疏高阶特征组合。以上结果表明,本发明实施例的JDNMFL明显优于几个目前最先进的模型。
综上所述,本发明实施例针对服务调用中存在多种不同的影响因素的事实,有效的利用了多源信息,提出了一种基于多源特征学习的云服务QoS预测方法。
本发明实施例提出了一种基于矩阵分解和神经网络结合的多源特征提取方法,将隐式特征和显式特征集于一体,为如何有效地从不同的多源信息中捕获关键特性提供了一种新的解决方案。
本发明实施例提出了一种新的隐因子嵌入方法,该方法充分考虑了用户偏好和服务属性的深度信息,从QoS矩阵中提取了隐式特征,有效地细粒度地表示了用户和服务的深度特征。
本发明实施例以卷积神经网络为核心设计了一种基于联合深层网络的特征组合学习方法,实现了局部-全局的高阶特征组合学习,并充分考虑了特征序列对特征组合学习的影响,从而有效的提高了QoS预测精度。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (6)

1.一种基于多源特征学习的云服务QoS预测方法,其特征在于,包括:
利用用户和服务的上下文数据提取用户和服务的显式特征;
基于矩阵分解和神经网络相结合的隐式因子嵌入方法,从用户-服务矩阵中提取用户和服务的深层隐式特征;
将所述用户和服务的显式特征与隐式特征拼接,得到用户-服务调用记录对应的多源特征矩阵;
利用基于卷积神经网络的联合深层网络,学习得到所述多源特征矩阵的局部特征组合,基于所述局部特征组合学习多源特征间的全局特征组合,根据所述多源特征间的全局特征组合得到用户对云服务的QoS预测。
2.根据权利要求1所述的方法,其特征在于,所述的利用用户和服务的上下文数据提取用户和服务的显式特征,包括:
将上下文数据中用户-服务的环境特征划分为包含多个显式特征的显式字段,所述环境特征包括地理位置和网络状态,利用独热编码对环境特征进行编码,通过嵌入层网络将编码后的环境特征映射为嵌入向量,将每条用户-服务调用记录表示为由显式特征构成的嵌入矩阵。
利用Doc2Vec算法学习服务描述文档中的语义信息,从而获得每个服务的语义向量,并用于对服务嵌入向量的初始化。
3.根据权利要求1所述的方法,其特征在于,所述的基于矩阵分解和神经网络相结合的隐式因子嵌入方法,从用户-服务矩阵中提取用户和服务的深层隐式特征,包括:
对用户-服务矩阵进行概率矩阵分解获得用户和服务的隐因子矩阵,该隐因子矩阵中的用户向量和服务向量的因子表示了用户偏好特征和服务属性特征,所述用户偏好特征和服务属性特征构成了用户服务的隐式特征,利用独热编码对所述用户服务的隐式特征进行编码,通过嵌入层网络将编码后的用户服务的隐式特征映射为嵌入向量,将每条用户-服务调用记录表示为隐式特征矩阵。
4.根据权利要求1所述的方法,其特征在于,将所述用户和服务的显式特征与隐式特征拼接,得到用户-服务调用记录对应的多源特征矩阵,包括:
针对每条用户-服务调用记录,分别获得表示用户-服务环境特征的显示特征矩阵表示,以及表示用户偏好特征和服务属性特征的隐式特征矩阵表示。拼接显示特征矩阵与隐式特征矩阵,使每条用户-服务调用记录通过一个多源特征矩阵表示。
5.根据权利要求1或者2或者3或者4所述的方法,其特征在于,所述的利用基于卷积神经网络的联合深层网络,学习得到所述多源特征矩阵的局部特征组合,包括:
构建基于卷积神经网络的联合深层网络,该联合深层网络包括单隐层神经网络、卷积神经网络和多层感知机,所述单隐层神经网络用于降低不同特征序列对卷积神经网络的影响,将多源特征矩阵P转化为一维向量
Figure FDA0002461859880000021
Figure FDA0002461859880000022
再将一维向量P1输入至单隐层网络中自适应学习新的特征序列,表达式如下:
Figure FDA0002461859880000023
其中
Figure FDA0002461859880000024
表示激活函数RELU,
Figure FDA0002461859880000025
Figure FDA0002461859880000026
分别表示权重矩阵和偏置向量,再将P′1重塑回原始维度,获得新序列下的多源特征矩阵P′;
将所述多源特征矩阵P′扩展为
Figure FDA0002461859880000027
利用卷积操作学习新序列下多源特征间的局部特征组合,卷积操作如下所示:
Figure FDA0002461859880000028
其中*表示卷积操作,W1和b1分布表示第一层的卷积核和偏置,
Figure FDA0002461859880000029
表示激活函数RELU,利用卷积核
Figure FDA00024618598800000210
对多源特征矩阵进行一维列卷积,保证特征维度不变,其中pi,1,qi分别表示卷积核的高度、宽度及数量,利用池化操作捕捉重要特征组合,池化操作如下所示:
Figure FDA0002461859880000031
其中i表示层数,hi表示第i个池化层的高度;
通过多次卷积操作和池化操作获得多源特征间的局部特征组合D*
6.根据权利要求5所述的方法,其特征在于,所述的基于所述局部特征组合学习多源特征间的全局特征组合,根据所述多源特征间的全局特征组合得到用户对云服务的QoS预测,包括:
引入了多层感知机,利用多层感知机学习多源特征间的全局特征组合,将局部特征组合
Figure FDA0002461859880000032
重塑为
Figure FDA0002461859880000033
再与原始的多源特征矩阵P拼接生成混合特征:
Figure FDA0002461859880000034
其中ι表示卷积-池化层的个数,利用多层感知器从多源特征矩阵P和局部特征组合P*的组合中学习出全局特征组合,所述多层感知器由多个隐藏层堆叠实现:
R0=flatten(Q)…
Figure FDA0002461859880000035
其中Xi和zi分别是第i个隐藏层的权重矩阵和偏置向量,R0表示混合特征的一维化向量,即多层感知机的输入,Ri表示第i个隐藏层的输出。
设共有λ个隐藏层,则最终预测的用户对云服务的QoS值R*可以由第λ层得到:
Figure FDA0002461859880000036
CN202010322208.0A 2020-04-22 2020-04-22 基于多源特征学习的云服务QoS预测方法 Active CN111541570B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010322208.0A CN111541570B (zh) 2020-04-22 2020-04-22 基于多源特征学习的云服务QoS预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010322208.0A CN111541570B (zh) 2020-04-22 2020-04-22 基于多源特征学习的云服务QoS预测方法

Publications (2)

Publication Number Publication Date
CN111541570A true CN111541570A (zh) 2020-08-14
CN111541570B CN111541570B (zh) 2021-05-07

Family

ID=71976950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010322208.0A Active CN111541570B (zh) 2020-04-22 2020-04-22 基于多源特征学习的云服务QoS预测方法

Country Status (1)

Country Link
CN (1) CN111541570B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200251A (zh) * 2020-10-15 2021-01-08 重庆科技学院 一种基于多尺度卷积神经网络的监测系统数据评估方法
CN112288154A (zh) * 2020-10-22 2021-01-29 汕头大学 一种基于改进神经协同过滤的区块链服务可靠性预测方法
CN112328912A (zh) * 2020-11-03 2021-02-05 重庆大学 一种利用地点感知的QoS预测方法
CN112633931A (zh) * 2020-12-28 2021-04-09 广州博冠信息科技有限公司 点击率预测方法、装置、电子设备及介质
CN112866037A (zh) * 2021-03-02 2021-05-28 中国科学院重庆绿色智能技术研究院 基于后邻域正则化的联网服务质量隐特征提取装置与方法
CN113393056A (zh) * 2021-07-08 2021-09-14 山东大学 基于时间序列的众包服务供需缺口预测方法及系统
CN113949646A (zh) * 2021-10-15 2022-01-18 安徽大学 一种基于深度学习的Web服务QoS预测方法
CN114070751A (zh) * 2021-10-25 2022-02-18 汕头大学 基于双子图的服务质量预测方法、系统、设备及介质
CN114117945A (zh) * 2022-01-26 2022-03-01 南京信息工程大学 基于用户-服务交互图的深度学习云服务QoS预测方法
CN114462707A (zh) * 2022-02-10 2022-05-10 湖南科技大学 一种基于特征深度融合的Web服务多维QoS联合预测方法
CN114757391A (zh) * 2022-03-17 2022-07-15 重庆大学 一种基于网络数据空间设计的服务质量预测方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574685A (zh) * 2016-02-02 2016-05-11 浙江工业大学 一种基于主客观结合的云服务评价方法
CN108537428A (zh) * 2018-03-28 2018-09-14 校宝在线(杭州)科技股份有限公司 一种基于官网变化情况的云服务商服务质量评测方法
US20180295065A1 (en) * 2009-07-27 2018-10-11 New Renaissance Technology And Intellectual Property FLOW STATE AWARE MANAGEMENT OF QoS WITH A DISTRIBUTED CLASSIFIER
CN109376901A (zh) * 2018-09-07 2019-02-22 苏州大学 一种基于去中心化矩阵分解的服务质量预测方法
CN109508377A (zh) * 2018-11-26 2019-03-22 南京云思创智信息科技有限公司 基于融合模型的文本特征提取方法、装置、聊天机器人和存储介质
CN109657725A (zh) * 2018-12-24 2019-04-19 云南大学 一种基于复杂时空情境感知的服务质量预测方法及系统
CN109726396A (zh) * 2018-12-20 2019-05-07 泰康保险集团股份有限公司 问答文本的语义匹配方法、装置、介质及电子设备
US20190230046A1 (en) * 2018-01-19 2019-07-25 Ciena Corporation Autonomic resource partitions for adaptive networks
CN110060086A (zh) * 2019-03-01 2019-07-26 汕头大学 一种基于Web云服务中用户可信度的在线预测方法
CN110460463A (zh) * 2019-07-24 2019-11-15 海南大学 基于深度神经网络的服务质量预测方法及其系统
CN110717098A (zh) * 2019-09-20 2020-01-21 中国科学院自动化研究所 基于元路径的上下文感知用户建模方法、序列推荐方法
CN110832596A (zh) * 2017-10-16 2020-02-21 因美纳有限公司 基于深度学习的深度卷积神经网络训练方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180295065A1 (en) * 2009-07-27 2018-10-11 New Renaissance Technology And Intellectual Property FLOW STATE AWARE MANAGEMENT OF QoS WITH A DISTRIBUTED CLASSIFIER
CN105574685A (zh) * 2016-02-02 2016-05-11 浙江工业大学 一种基于主客观结合的云服务评价方法
CN110832596A (zh) * 2017-10-16 2020-02-21 因美纳有限公司 基于深度学习的深度卷积神经网络训练方法
US20190230046A1 (en) * 2018-01-19 2019-07-25 Ciena Corporation Autonomic resource partitions for adaptive networks
CN108537428A (zh) * 2018-03-28 2018-09-14 校宝在线(杭州)科技股份有限公司 一种基于官网变化情况的云服务商服务质量评测方法
CN109376901A (zh) * 2018-09-07 2019-02-22 苏州大学 一种基于去中心化矩阵分解的服务质量预测方法
CN109508377A (zh) * 2018-11-26 2019-03-22 南京云思创智信息科技有限公司 基于融合模型的文本特征提取方法、装置、聊天机器人和存储介质
CN109726396A (zh) * 2018-12-20 2019-05-07 泰康保险集团股份有限公司 问答文本的语义匹配方法、装置、介质及电子设备
CN109657725A (zh) * 2018-12-24 2019-04-19 云南大学 一种基于复杂时空情境感知的服务质量预测方法及系统
CN110060086A (zh) * 2019-03-01 2019-07-26 汕头大学 一种基于Web云服务中用户可信度的在线预测方法
CN110460463A (zh) * 2019-07-24 2019-11-15 海南大学 基于深度神经网络的服务质量预测方法及其系统
CN110717098A (zh) * 2019-09-20 2020-01-21 中国科学院自动化研究所 基于元路径的上下文感知用户建模方法、序列推荐方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200251A (zh) * 2020-10-15 2021-01-08 重庆科技学院 一种基于多尺度卷积神经网络的监测系统数据评估方法
CN112288154A (zh) * 2020-10-22 2021-01-29 汕头大学 一种基于改进神经协同过滤的区块链服务可靠性预测方法
CN112288154B (zh) * 2020-10-22 2023-11-03 汕头大学 一种基于改进神经协同过滤的区块链服务可靠性预测方法
CN112328912B (zh) * 2020-11-03 2023-05-19 重庆大学 一种利用地点感知的QoS预测方法
CN112328912A (zh) * 2020-11-03 2021-02-05 重庆大学 一种利用地点感知的QoS预测方法
CN112633931A (zh) * 2020-12-28 2021-04-09 广州博冠信息科技有限公司 点击率预测方法、装置、电子设备及介质
CN112866037A (zh) * 2021-03-02 2021-05-28 中国科学院重庆绿色智能技术研究院 基于后邻域正则化的联网服务质量隐特征提取装置与方法
CN113393056A (zh) * 2021-07-08 2021-09-14 山东大学 基于时间序列的众包服务供需缺口预测方法及系统
CN113949646A (zh) * 2021-10-15 2022-01-18 安徽大学 一种基于深度学习的Web服务QoS预测方法
CN113949646B (zh) * 2021-10-15 2023-06-13 安徽大学 一种基于深度学习的Web服务QoS预测方法
CN114070751A (zh) * 2021-10-25 2022-02-18 汕头大学 基于双子图的服务质量预测方法、系统、设备及介质
CN114117945A (zh) * 2022-01-26 2022-03-01 南京信息工程大学 基于用户-服务交互图的深度学习云服务QoS预测方法
CN114117945B (zh) * 2022-01-26 2022-04-15 南京信息工程大学 基于用户-服务交互图的深度学习云服务QoS预测方法
CN114462707A (zh) * 2022-02-10 2022-05-10 湖南科技大学 一种基于特征深度融合的Web服务多维QoS联合预测方法
CN114462707B (zh) * 2022-02-10 2023-11-17 湖南科技大学 一种基于特征深度融合的Web服务多维QoS联合预测方法
CN114757391A (zh) * 2022-03-17 2022-07-15 重庆大学 一种基于网络数据空间设计的服务质量预测方法
CN114757391B (zh) * 2022-03-17 2024-05-03 重庆大学 一种面向服务质量预测的网络数据空间设计与应用方法

Also Published As

Publication number Publication date
CN111541570B (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN111541570B (zh) 基于多源特征学习的云服务QoS预测方法
Qi et al. Finding all you need: web APIs recommendation in web of things through keywords search
Krishnaraj et al. An efficient radix trie‐based semantic visual indexing model for large‐scale image retrieval in cloud environment
CN112529168B (zh) 一种基于gcn的属性多层网络表示学习方法
CN111667022A (zh) 用户数据处理方法、装置、计算机设备和存储介质
Chang et al. A graph-based QoS prediction approach for web service recommendation
CN112035743A (zh) 数据推荐方法、装置、计算机设备以及存储介质
Liu et al. GNNRec: gated graph neural network for session-based social recommendation model
CN110502701B (zh) 引入注意力机制的好友推荐方法、系统和存储介质
Xu et al. Towards machine-learning-driven effective mashup recommendations from big data in mobile networks and the Internet-of-Things
Zhou et al. Learning object placement via dual-path graph completion
Yang et al. Xception-based general forensic method on small-size images
Lian et al. Towards effective personalized service QoS prediction from the perspective of multi-task learning
Zhang et al. Small files storing and computing optimization in Hadoop parallel rendering
Huang et al. Generalized regression neural network optimized by genetic algorithm for solving out-of-sample extension problem in supervised manifold learning
Zin et al. Deep learning model for integration of clustering with ranking in social networks
CN113705071A (zh) 设备识别方法、装置、设备及存储介质
Wang et al. CAW: A Remote‐Sensing Scene Classification Network Aided by Local Window Attention
CN111737591A (zh) 一种基于异质重边信息网络翻译模型的产品推荐方法
Guo Design and implementation of a machine learning-based English intelligent test system
Deng et al. Visual computing resources distribution and balancing by multimodal cat swarm optimization
CN117786234B (zh) 一种基于两阶段对比学习的多模态资源推荐方法
Huang et al. SRACas: A Social Role-Aware Graph Neural Network-Based Model for Popularity Prediction of Information Cascades
CN116881575B (zh) 内容推送方法、装置、计算机设备和存储介质
Bai et al. Application of Deep Autoencoders in Commerce Recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant