CN116760735A - 一种基于多关系概率矩阵分解的服务质量快速预测方法 - Google Patents
一种基于多关系概率矩阵分解的服务质量快速预测方法 Download PDFInfo
- Publication number
- CN116760735A CN116760735A CN202310547397.5A CN202310547397A CN116760735A CN 116760735 A CN116760735 A CN 116760735A CN 202310547397 A CN202310547397 A CN 202310547397A CN 116760735 A CN116760735 A CN 116760735A
- Authority
- CN
- China
- Prior art keywords
- service
- user
- matrix
- probability
- qos
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 123
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 20
- 238000009826 distribution Methods 0.000 claims abstract description 32
- 230000004044 response Effects 0.000 claims abstract description 16
- 238000005457 optimization Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 29
- 230000003993 interaction Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 4
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 66
- 230000006870 function Effects 0.000 description 31
- 230000008901 benefit Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/142—Network analysis or design using statistical or mathematical methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Algebra (AREA)
- Environmental & Geological Engineering (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Pure & Applied Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于多关系概率矩阵分解的服务质量快速预测方法,属于通信技术领域。该方法包括:S1:根据历史数据集构建全局图并对其降噪处理,即消除G中权值小于阈值θ1的边,得到A个关联密切的子图;S2:将A个子图融合到初始的QoS矩阵中,从而融合响应时间QoS矩阵;S3:根据事件发生的概率特点,构建满足高斯分布的用户特征矩阵U和服务特征矩阵S;S4:根据预测的QoS矩阵与真实的QoS矩阵R之差服从正态分布,得出R满足条件概率,计算先验概率;S5:根据贝叶斯定理,由已知的数据为先验概率,计算后验概率;S6:根据随机梯度下降的优化方法,不断迭代求最小化目标函数E。本发明可以提高服务质量QoS预测的准确度和高效性。
Description
技术领域
本发明属于通信技术领域,涉及一种基于多关系概率矩阵分解的服务质量快速预测方法。
背景技术
在当今数字化时代,人们对于Web服务的需求日益增长,物联网服务、云服务、移动服务和其它服务在互联网上被广泛应用。为了更好地为用户提供服务,网络服务提供商提前预测用户的需求,从而优化网络服务供应,提高用户的满意度。因此,面对用户对服务的高需求,如何提高服务质量(Quality of Service,QoS)预测的性能成为一项具有时代意义的研究课题。由于QoS在评估服务的稳定性和可靠性等性能方面起到了不可小觑的作用,它成为感知用户需求的关键指标,因此准确快速地预测未知的QoS值是提升用户调用服务体验感的关键。预测的精度决定着服务商提供的服务是否满足用户的高需求,精度越高,服务商可以更准确的感知用户的需求,进而提供高质量的服务。同时,预测速度是在预测算法中一个非常重要的指标,它对于用户体验的影响非常明显。在现实生活中,人们需要在短时间内获得高质量的服务,这就要求预测算法能够快速地进行预测。尤其是在处理大规模数据时,如果预测速度太慢,不仅会导致用户等待时间过长,而且还会使预测系统的效率大幅降低。
因此,亟需一种能同时提高QoS预测的精确度和速度的方法。
发明内容
有鉴于此,本发明的目的在于提供一种基于多关系概率矩阵分解(MultiRelationship Probabilistic Matrix Factorization,MRPMF)的服务质量快速预测方法,通过考虑用户与服务的显性关联与隐性关联,挖掘用户与服务的多关系,结合概率论中事件发生的概率模型,加强预测方法的有效性和高效性,从而提高QoS预测的精确度和速度。
为达到上述目的,本发明提供如下技术方案:
一种基于多关系概率矩阵分解的服务质量快速预测方法,具体包括以下步骤:
S1:根据历史数据集构建全局图G,对全局图降噪处理,即消除G中权值小于阈值θ1的边,得到A个关联密切的子图G1,G2,…,GA;
S2:为增强用户与服务的显性关联和隐性关联,将A个子图融合到初始的QoS矩阵中,从而得到融合响应时间的QoS矩阵R,即真实的QoS矩阵R;
S3:根据事件发生的概率特点,构建满足高斯分布的用户特征矩阵U和服务特征矩阵S;
S4:根据预测的QoS矩阵R'与真实的QoS矩阵R之差服从正态分布,得出R满足条件概率,从而计算出先验概率p(R|U,S,σR 2);
S5:根据贝叶斯定理,由已知的数据为先验概率p(R|U,S,σR 2),计算后验概率p(U,S|R,σR 2,σU 2,σS 2),从而得到目标函数E;
S6:根据随机梯度下降的优化方法,不断迭代求最小化目标函数E。
S7:以特征矩阵维度和数据集密度为变量寻找最优参数,以平均绝对误差、均方根误差、预测时间来评估该预测方法的性能。
进一步,步骤S1具体包括:
全局图G:将用户集、服务集和用户服务交互集映射为用户图、服务图和用户与服务交互图,基于三个图构建全局图G;其中,所述用户图由用户节点集合和用户ua与ub的关联性权值集合构建而成;计算两个用户节点的权值,将网络环境自治域(Autonomous System,AS)中的关联性的权值与地理位置得到的关联性权值进行线性加权处理,得到两个用户节点之边的权值。
所述服务图由服务节点集合和服务sa与sb之间的关联权值集合构建而成,服务所在的AS域系统与服务网页本身的内容对服务节点的关联性起着关键性作用,两者线性叠加求和为两个服务节点之边的权值。
所述用户服务图包括三要素:用户节点、服务节点,以及用户与服务交互的边,其中用户与服务之间的关联性通过吞吐量创建。
节点:包括用户节点集合和服务节点集合。
边权值:用户之间的关系,由用户所在的AS域和地理位置决定;服务之间的节点,由服务的页面特征向量和AS域决定;用户与服务之间的关系,由服务质量吞吐量决定;所有的权值均归一化处理,范围在[0,1]。
响应时间:用户发出服务请求到获取到服务结果的时间之和,其中包括网络往返的时间和Web服务处理用户的请求时间。
吞吐量:一个网络在单位时间内能传输的数据量大小,通常用Mbps(兆位每秒)或Gbps(千兆位每秒)来计量。
噪声:全局图中权值小于阈值θ1的边。
子图:将全局图G的边进行切割,形成子图G1,G2,…GA,通过子图可以挖掘用户与服务之间的隐性关联,可以强调数据集中的矩阵特征。
进一步,步骤S2具体包括:
显性关联:相似的用户,相似的服务和用户直接调用服务的关系均为显性关联;
隐性关联:子图中存在的间接关系;
矩阵历史数据流中,初始的用户调用服务的响应时间QoS矩阵,未调用的对应位置为0或者空缺,因此矩阵/>是稀疏矩阵;
矩阵R:基于矩阵与A个子图对应的响应时间QoS矩阵线性加权得到矩阵R,矩阵R是未满秩的。
进一步,步骤S3具体包括:
用户特征矩阵U:用户与隐性因子的矩阵,其列向量表示用户潜在特征向量;
服务特征矩阵S:隐性因子与服务的矩阵,其行向量表示服务潜在特征向量;
高斯分布:一种数据分布,也称为正态分布;
用户特征向量和服务的特征向量都服从均值为0的球形高斯分布,如公式(1)、(2)所示:
其中,p(U|σU 2)表示用户特征的先验概率,p(S|σS 2)表示服务特征的先验概率,σU 2表示用户特征矩阵的方差,σS 2表示服务特征矩阵的方差,Ui表示用户的潜在偏好向量,Sj表示服务的潜在属性,I表示指数函数,N表示用户个数,M表示服务数量。
进一步,步骤S4具体包括:假设有N个用户,M个服务,则真实的QoS矩阵R=UTS,U是维度为N*K的用户潜在特征矩阵,S是维度为K*M的服务潜在特征矩阵,K为用户和服务的隐性因子;
首先采用一个含有高斯观测噪声的概率线性模型;用户的潜在偏好向量Ui和服务的潜在属性Sj的内积构成QoS矩阵R中的元素Ri,j,如公式(3)所示:
其中,σ2表示方差;
用户对服务调用的QoS矩阵R与预测的QoS的矩阵R'之差服从高斯分布,则矩阵R满足条件概率,如公式(4)所示:
其中,p(R|U,S,σR 2)是期望为μ,方差为σ2的高斯分布的概率密度函数,即先验概率;其中 表示方差;Iij是指示函数,如果用户调用过服务有QoS值,该值为1;否则为0。
进一步,步骤S5具体包括:根据概率论中贝叶斯公式,后验概率为先验概率函数与似然函数的乘积,可以得出潜变量U,S的后验概率p(U,S|R,σR 2,σU 2,σS 2),如公式(5)所示:
p(U,S|R,σR 2,σU 2,σS 2)=p(R|U,S,σR 2)·p(U|σU 2)·p(S|σS 2) (5)
根据后验概率,得到目标函数E,如公式(6)所示:
其中,为预测QoS矩阵;λU=σR 2/σU 2,λS=σR 2/σS 2,为正则化系数;||·||Fro表示Frobenius范数。
进一步,步骤S6具体包括:首先,对Ui,Sj求导,如公式(7)、(8)所示:
采用随机梯度下降方法更新优化Ui,Sj,如公式(9)、(10)所示:
直到公式(9)、(10)收敛达到最大迭代次数,从结果中选择最优值。
本发明的有益效果在于:本发明的创新主要是步骤S1、S2与步骤S5的结合,步骤S1避免传统方法考虑角度的单一性与片面性,以图的形式展示用户与服务的显性关联,并挖掘用户与服务间的隐性关联,全面挖掘用户与服务间的多关系。步骤2将处理后的子图与原始图进行融合,使得数据特征更鲜明。步骤S3、S4结合概率论中事件发生的概率,构建事件符合的指定的分布模型。步骤S5采用贝叶斯公式,将预测的QoS值视为后验概率。步骤S6不断迭代更新得到最优值。综合全局考虑,避免在QoS预测中考虑角度单一、噪声影响过大、预测时间长等缺陷,以图模型结合概率论中贝叶斯定理解决了上述问题,在不断的迭代更新预测矩阵中优化QoS值。基于联合图的多关系与概率矩阵分解的预测方法MRPMF在一定程度上更具有明显优势。总之,本发明方法结合了图论中图模型和概率论中概率矩阵分解和不断迭代更新预测值的优势,规避了预测的噪声,通过本发明方法可以提高服务质量QoS预测的精确性和高效性。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为本发明基于多关系概率矩阵分解的服务质量快速预测方法的模型;
图2为本发明中模拟用户调用服务的关系图(a)和子图(b);
图3为现有的MF算法、MRMF算法、PMF算法与本发明提出的MRPMF算法的Loss函数对比图;
图4为本发明中K对MAE的影响趋势图;
图5为本发明中K对RMSE的影响趋势图;
图6为现有的MF算法、MRMF算法、PMF算法与本发明提出的MRPMF算法的MAE对比图;
图7为现有的MF算法、MRMF算法、PMF算法与本发明提出的MRPMF算法的RMSE对比图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1~图7,一种基于多关系概率矩阵分解的服务质量快速预测方法的模型如图1所示,包括以下步骤:
步骤1:根据历史数据集,将用户集、服务集、用户服务交互集,映射为用户图、服务图、用户与服务交互图,基于三个图构建全局图G,对全局图降噪处理,G中权值小于阈值θ1的边进行消除,得到A个关联密切的子图G1,G2,…GA。其中,
用户图:由用户节点集合和用户ua与ub的关联性权值集合构建而成。计算两个用户节点的权值,将网络环境自治域(Autonomous System,AS)中的关联性的权值与地理位置得到的关联性权值进行线性加权处理,得到两个用户节点之边的权值。
服务图:由服务节点集合和服务sa与sb之间的关联权值集合构建而成,服务所在的AS域系统与服务网页本身的内容对服务节点的关联性起着关键性作用,两者线性叠加求和为两个服务节点之边的权值。
用户服务图:包括三要素:用户节点、服务节点、用户与服务交互的边,其中用户与服务之间的关联性通过吞吐量创建。
全局图G:用户图、服务图、用户与服务图构建为一个完整的全局图。
节点:用户节点集合,服务节点集合。
边权值:用户之间的关系,由用户所在的AS域和地理位置决定;服务之间的节点,由服务的页面特征向量向量和AS域决定;用户与服务之间的关系,由服务质量吞吐量决定;所有的权值均归一化处理,范围在[0,1]。
响应时间:用户发出服务请求到获取到服务结果的时间之和,其中包括网络往返的时间和Web服务处理用户的请求时间。
吞吐量:一个网络在单位时间内可以传输的数据量大小,通常用Mbps(兆位每秒)或Gbps(千兆位每秒)来计量。
噪声:全局图中权值小于阈值θ1的边。
子图:将全局图G的边进行切割,形成子图G1,G2,…,GA,通过子图可以挖掘用户与服务之间的隐性关联,可以强调数据集中的矩阵特征。
步骤2:为增强用户与服务的显性关联和隐性关联,将A个子图融合到初始的QoS矩阵中,从而融合响应时间QoS矩阵R。其中,
显性关联:相似的用户,相似的服务和用户直接调用服务的关系均为显性关联。
隐性关联:包括联系密切的多个用户和同一个服务的关系,如图2(b)所示,用户邻居群1中用户u1,u2,u3密切相关,服务邻居群1中服务s1,s2密切相关,仅有u2,u3调用过服务s1,那么,用户u1与服务s1存在潜在关系,用户u1,u3与服务s2也存在隐性关联。
矩阵历史数据流中,初始的用户调用服务的响应时间QoS矩阵,未调用的对应位置为0或者空缺,因此矩阵/>是稀疏矩阵,如表1所示。
表1 QoS值矩阵
矩阵R:基于矩阵与A个子图对应的响应时间QoS矩阵线性加权得到矩阵R,矩阵R是未满秩的。
步骤3:根据事件发生的概率特点,构建满足高斯分布的用户特征矩阵U和服务特征矩阵S。
用户特征矩阵U:用户与隐性因子的矩阵,其列向量表示用户潜在特征向量。
服务特征矩阵S:隐性因子与服务的矩阵;其行向量表示服务潜在特征向量。
高斯分布:一种数据分布,也称为正态分布。
用户特征向量和服务的特征向量都服从均值为0的球形高斯分布,如公式(1)、(2)所示:
步骤4:根据预测的QoS矩阵R'与真实的QoS矩阵R之差服从正态分布,得出R满足条件概率,从而计算出先验概率p(R|U,S,σR 2)。具体包括:
假设有N个用户,M个服务,由于步骤2得到融合响应时间的QoS矩阵R,那么,真实的QoS矩阵R=UTS,U是维度为N*K的用户潜在特征矩阵,S是维度为K*M的服务潜在特征矩阵,其中列向量分别表示特定用户的和特定服务的潜在特征向量,K为用户和服务的隐性因子。
首先采用一个含有高斯观测噪声的概率线性模型。用户的潜在偏好向量Ui和服务的潜在属性Sj的内积构成服务质量矩阵中的元素Ri,j,如公式(3)所示:
用户对服务调用的QoS矩阵R与预测的QoS的矩阵R'之差服从高斯分布,则矩阵R满足条件概率,如公式(4)所示:
公式(4)是期望为μ,方差为σ2的高斯分布的概率密度函数;其中Iij是指示函数,如果用户调用过服务有QoS值,该值为1;否则为0。
步骤5:根据贝叶斯定理,由已知的数据为先验概率p(R|U,S,σR 2),计算后验概率p(U,S|R,σR 2,σU 2,σS 2);
步骤5:根据贝叶斯定理,由已知的数据为先验概率p(R|U,S,σR 2),计算后验概率p(U,S|R,σR 2,σU 2,σS 2);具体包括:
根据概率论中贝叶斯公式,后验概率为先验函数与似然函数的乘积,可以得出潜变量U,S的后验概率,如公式(5)所示:
p(U,S|R,σR 2,σU 2,σS 2)=p(R|U,S,σR 2)·p(U|σU 2)·p(S|σS 2) (5)
根据后验概率,得到最终目标函数,如公式(6)所示:
其中,为预测QoS矩阵;λU=σR 2/σU 2,λS=σR 2/σS 2,为正则化系数;||·||Fro表示Frobenius范数。
计算通过贝叶斯公式得到后验概率,如何推算到目标函数,具体过程如下:
对公式(5)两边取对数得到(7)公式:
其中,N为用户的个数;K是潜变量的维度;M为服务的个数;C是不依赖参数的常量。
最大化在含有固定不变的超参数的用户与服务特征上的后验概率如公式(8)所示:
公式(8)其等价于最小化含有二次正则项的平方误差和的目标函数。
最小化含有二次正则项的平方误差和的目标函数来求解最小目标函数,具体是:公式(6)用二范数L2有两个原因,从学习理论的角度Frobenius范数可以防止过拟合:让L2规则化的项和/>最小,可以使Ui和Sj中的每个元素都很小,但是不是像L1范数那样使元素等于0,而是接近于零。越小的参数说明模型越简单,越简单的模型越不容易产生过拟合的现象。通过L2范数可以防止过拟合,提升模型的泛化能力。从优化计算的角度L2范数可以有助于处理初始数值不乐观地情况下矩阵求逆很困难的问题。L2范数不仅可以防止过拟合,还可以让我们的优化求解变的稳定和迅速。
根据经验及有关数据推测出主观概率,对其是否准确没有充分把握,采用概率论中的贝叶斯公式进行修正,如公式(9)。修正前的概率为先验概率,修正后的概率为后验概率,根据对实际观测数据,即本发明中已经调用的QoS值,不断地更新后验概率,直至求得目标函数的最大值。
其中,P(Θ|X)为后验概率,P(X|Θ)为确定了参数的情况下的试验数据的概率分布,即矩阵R满足的高斯分布,P(Θ)为先验概率,P(X)为边缘概率,在这里作为归一化系数。后验概率是不断的处于动态更新的过程中,直至得到目标函数的最优值。
步骤6:根据随机梯度下降的优化方法,不断迭代求最小化目标函数E。
首先,对Ui,Sj求导,如公式(10)、(11)所示:
采用随机梯度下降方法更新优化Ui,Sj,如公式(12)、(13)所示:
直到公式(12)、(13)收敛达到最大迭代次数,从结果中选择最优值。损失趋势如图3所示。
步骤7:以平均绝对误差、均方根误差、预测时间来评估该预测方法的性能。
为了验证特征向量矩阵Ui、Sj的维度K对误差的影响,仿真分别做了K对MAE,K对RMSE的影响趋势,实验结果如图4、6所示。选择在最佳参数K,通过仿真验证本方法的预测高效性,如图6、图7和表2所示。
平均绝对误差:绝对误差的平均值,是预测值与实际观测值之间的平均差,MAE的具体计算如下:
其中,Ri,j为融合响应时间矩阵,为预测的响应时间矩阵,L为矩阵中元素的总个数。如图6所示。
均方根误差:测量误差的平均大小,是预测值与实际观测值之间平方差异平均值的平方根,RMSE的计算方式如下:
其中,Ri,j为融合响应时间矩阵,为预测的响应时间矩阵,L为矩阵中元素的总个数。如图7所示。
通过概率矩阵分解与一种基于多关系的概率矩阵分解的改进算法进行QoS预测准确性的比较,通过平均绝对误差、均方根误差评估QoS预测的准确性,通过时间评估QoS预测的高效性,进而说明本发明的改进方法的准确性和高效性,如表2所示。
表2现有的MF算法、MRMF算法、PMF算法与本发明MRPMF算法的预测速度表
本发明提出了一种基于多关系概率矩阵分解的服务质量快速预测方法,联合图模型与概率矩阵分解的服务质量预测机制整体流程图如图1所示,在数据集、服务器相同的条件下,MRPMF算法(本发明方法)是将融合矩阵分解成两个用户特征矩阵和服务特征矩阵,构建满足高斯先验分布的特征矩阵,融合矩阵满足高斯概率分布,通过贝叶斯公式,不断更新迭代预测矩阵值,同时仅检测原始矩阵中有调用值的项分解结果是否准确,判别标准则是平均绝对误差和均方根误差,并找出最佳特征矩阵的维度,利用指标时间进一步验证预测的高效性。对比算法用到MF算法、MRMF算法、PMF算法,其中MF算法是矩阵分解预测算法,MRMF算法是联合用户与服务多关系的QoS预测算法,PMF算法是概率矩阵分解预测算法。相比传统的算法,一种基于多关系概率矩阵分解的服务质量快速预测方法在损失函数收敛程度上更具有明显优势,如图3所示,在评判准则平均绝对误差和均方根误差上均具有优势。本方案在不同数据集密度上运行的结果可看出,预测的准确性均提高,如图6、图7所示。另外,本发明在预测速度上有了较大的提升,如表2所示。
图3是MF算法、MRMF算法、PMF算法与MRPMF算法的Loss函数对比图,从展示的实验结果看,随着数据集迭代次数的不断增加,四个算法的损失函数Loss值逐渐收敛的趋势。PMF算法与MRPMF算法的损失函数Loss值逐渐收敛的趋势。由图可知,MRPMF算法中的损失函数值一直处于MF算法、MRMF算法、PMF算法的损失函数值的下方,说明该方法的损失值在同等条件下最小。MRPMF算法的Loss值随着迭代步数的增加而越来越小,有助于QoS预测精度的提升。为了验证MRPMF算法的有效性,计算指标函数MAE和RMSE的值进行对比,倘若MRPMF算法中的两个指标函数值在不同的数据密度下,均小于MF算法、MRMF算法、PMF算法的指标函数值,则该算法有效。
图4、图5展示了参数K对MRPMF模型的影响。参数K值决定了一种基于多关系概率矩阵分解的服务质量快速预测方法的特征因子的个数,如果K越大,表示MRPMF模型中矩阵的特征维度越大。为了研究参数K的影响,我们结合改进的矩阵R,在MRPMF模型中将参数K设4,8,16,32,64,128,256不同的数值,分别展示在不同的数据集密度的情况下的MAE和RMSE的趋势。从图4中可以看出,随着K值的不断增大,MAE的值逐渐趋于平缓,在K=64的时候,MAE曲线接近于平缓,意味着在不同的数据集密度,最佳的特征因子可设置为64。从图5中可以看出K对RMSE的影响趋势和对MAE的影响趋势是相似的。特征因子K为64时,RMSE值的趋势开始趋于平缓。
图6展示了MF、MRMF、PMF与MRPMF的MAE指标比较。由图可知,除了数据集10*10,在不同的数据集密度下运行的结果是MRPMF算法的MAE均小于MF、MRMF、PMF算法的MAE。其原因是数据集密度太小,假设的概率分布模型不准确,MRPMF适用于数据集密度大的场景。在数据集密度10*10时,MRPMF比PMF的MAE减小了25%;在数据集密度30*30时,MRPMF比PMF的MAE减小了11%;在数据集密度50*50时,MRPMF比PMF的MAE减小了12%;在数据集密度100*100时,MRPMF比PMF的MAE减小了12%;在数据集密度200*200时,MRPMF比PMF的MAE减小了20%。这说明MRPMF比MF、MRMF、PMF具有更好的性能,这可以归因于MRPMF利用图的模型和概率论中高斯函数模型的相结合,在考虑用户与服务的综合关系外,还考虑了事件发生的概率问题,因此,MRPMF算法减小了MAE,提高了QoS预测精度。
图7展示了MF、MRMF、PMF与MRPMF的RMSE指标比较,从图中可以看出,由图可知,除了数据集10*10,在不同的数据集密度下运行的结果是MRPMF算法的RMSE均小于MF、MRMF、PMF算法的RMSE。其原因是数据集密度太小,概率模型不准确,MRPMF适用于数据集密度大的场景。在不同的数据集密度下,MRMF的RMSE值始终低于MF的RMSE值。两种算法在RMSE指标上的误差减小率,在数据集密度10*10时,MRPMF比PMF的RMSE减小了10.57%;在数据集密度30*30时,MRPMF比PMF的RMSE减小了6.88%;在数据集密度50*50时,MRPMF比PMF的RMSE减小了5.72%;在数据集密度100*100时,MRPMF比PMF的RMSE减小了6.58%;在数据集密度200*200时,MRPMF比PMF的RMSE减小了11.20%。从整体结果看,相比其它三种算法而言,MRPMF算法对QoS预测结果的精度提升明显。
表2展示了MF、MRMF、PMF与MRPMF的预测速度对比图。其MRPMF算法的优点之一就是在预测准确性和预测速度之间找到了平衡点。通过在实验仿真中对四个算法进行比较,单位为秒。在数据集密度为10*10时,MF、MRMF与PMF、MRPMF的预测速度相差2倍,随着数据集密度的不断增大,在数据集密度为200*200时,MF、MRMF的预测时长达到12小时,然而PMF、MRPMF算法只需要143秒,可见两者的差距也变得越来越明显。显然,MRPMF的预测速度要远远快于MF、MRMF,尤其是在处理大规模数据时,MRPMF算法的速度优势更加明显。由此可见,采用MRPMF预测大数据量更符合现实生活的需求,MRPMF预测算法不仅提高了预测准确性,而且大大加快了预测速率。这也说明,在预测算法中,预测速度的提高对于满足用户需求和提升用户体验感是至关重要的。此外,在实际应用中,预测系统往往需要面对高并发访问的情况。如果预测算法的预测速度无法满足高并发的需求,就会导致系统崩溃、用户访问异常等问题。因此,在设计和优化预测算法时,必须充分考虑预测速度的因素,以确保预测算法的可用性和稳定性。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种基于多关系概率矩阵分解的服务质量快速预测方法,其特征在于,该方法具体包括以下步骤:
S1:根据历史数据集构建全局图G,对全局图降噪处理,即消除G中权值小于阈值θ1的边,得到A个关联密切的子图G1,G2,…,GA;
S2:将A个子图融合到初始的QoS矩阵中,从而得到融合响应时间的QoS矩阵R,即真实的QoS矩阵R;
S3:根据事件发生的概率特点,构建满足高斯分布的用户特征矩阵U和服务特征矩阵S;
S4:根据预测的QoS矩阵R'与真实的QoS矩阵R之差服从正态分布,得出R满足条件概率,从而计算出先验概率p(R|U,S,σR 2);
S5:根据贝叶斯定理,由已知的数据为先验概率p(R|U,S,σR 2),计算后验概率p(U,S|R,σR 2,σU 2,σS 2),从而得到目标函数E;
S6:根据随机梯度下降的优化方法,不断迭代求最小化目标函数E。
2.根据权利要求1所述的服务质量快速预测方法,其特征在于,步骤S1具体包括:
全局图G:将用户集、服务集和用户服务交互集映射为用户图、服务图和用户与服务交互图,基于三个图构建全局图G;其中,所述用户图由用户节点集合和用户ua与ub的关联性权值集合构建而成;计算两个用户节点的权值,将AS中的关联性的权值与地理位置得到的关联性权值进行线性加权处理,得到两个用户节点之边的权值;其中,AS表示网络环境自治域;
所述服务图由服务节点集合和服务sa与sb之间的关联权值集合构建而成,服务所在的AS域系统与服务网页本身的内容对服务节点的关联性起着关键性作用,两者线性叠加求和为两个服务节点之边的权值;
所述用户服务图包括三要素:用户节点、服务节点,以及用户与服务交互的边,其中用户与服务之间的关联性通过吞吐量创建;
节点:包括用户节点集合和服务节点集合;
边权值:用户之间的关系,由用户所在的AS域和地理位置决定;服务之间的节点,由服务的页面特征向量和AS域决定;用户与服务之间的关系,由服务质量吞吐量决定;所有的权值均归一化处理,范围在[0,1];
响应时间:用户发出服务请求到获取到服务结果的时间之和,其中包括网络往返的时间和Web服务处理用户的请求时间;
吞吐量:一个网络在单位时间内能传输的数据量大小;
噪声:全局图中权值小于阈值θ1的边;
子图:将全局图G的边进行切割,形成子图G1,G2,…GA,通过子图可以挖掘用户与服务之间的隐性关联。
3.根据权利要求2所述的服务质量快速预测方法,其特征在于,步骤S3具体包括:
用户特征矩阵U:用户与隐性因子的矩阵,其列向量表示用户潜在特征向量;
服务特征矩阵S:隐性因子与服务的矩阵,其行向量表示服务潜在特征向量;
高斯分布:一种数据分布,也称为正态分布;
用户特征向量和服务的特征向量都服从均值为0的球形高斯分布,如公式(1)、(2)所示:
其中,p(U|σU 2)表示用户特征的先验概率,p(S|σS 2)表示服务特征的先验概率,σU 2表示用户特征矩阵的方差,σS 2表示服务特征矩阵的方差,Ui表示用户的潜在偏好向量,Sj表示服务的潜在属性,I表示指数函数,N表示用户个数,M表示服务数量。
4.根据权利要求3所述的服务质量快速预测方法,其特征在于,步骤S4具体包括:假设有N个用户,M个服务,则真实的QoS矩阵R=UTS,U是维度为N*K的用户潜在特征矩阵,S是维度为K*M的服务潜在特征矩阵,K为用户和服务的隐性因子;
首先采用一个含有高斯观测噪声的概率线性模型;用户的潜在偏好向量Ui和服务的潜在属性Sj的内积构成QoS矩阵R中的元素Ri,j,如公式(3)所示:
其中,σ2表示方差;
用户对服务调用的QoS矩阵R与预测的QoS的矩阵R'之差服从高斯分布,则矩阵R满足条件概率,如公式(4)所示:
其中,p(R|U,S,σR 2)是期望为μ,方差为σ2的高斯分布的概率密度函数,即先验概率;其中 表示方差;Iij是指示函数,如果用户调用过服务有QoS值,该值为1;否则为0。
5.根据权利要求4所述的服务质量快速预测方法,其特征在于,步骤S5具体包括:根据概率论中贝叶斯公式,后验概率为先验概率函数与似然函数的乘积,得出潜变量U,S的后验概率p(U,S|R,σR 2,σU 2,σS 2),如公式(5)所示:
p(U,S|R,σR 2,σU 2,σS 2)=p(R|U,S,σR 2)·p(U|σU 2)·p(S|σS 2) (5)
根据后验概率,得到目标函数E,如公式(6)所示:
其中,为预测QoS矩阵;λU=σR 2/σU 2,λS=σR 2/σS 2,为正则化系数;||·||Fro表示Frobenius范数。
6.根据权利要求5所述的服务质量快速预测方法,其特征在于,步骤S6具体包括:首先,对Ui,Sj求导,如公式(7)、(8)所示:
采用随机梯度下降方法更新优化Ui,Sj,如公式(9)、(10)所示:
直到公式(9)、(10)收敛达到最大迭代次数,从结果中选择最优值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310547397.5A CN116760735A (zh) | 2023-05-15 | 2023-05-15 | 一种基于多关系概率矩阵分解的服务质量快速预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310547397.5A CN116760735A (zh) | 2023-05-15 | 2023-05-15 | 一种基于多关系概率矩阵分解的服务质量快速预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116760735A true CN116760735A (zh) | 2023-09-15 |
Family
ID=87957988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310547397.5A Pending CN116760735A (zh) | 2023-05-15 | 2023-05-15 | 一种基于多关系概率矩阵分解的服务质量快速预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116760735A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117274616A (zh) * | 2023-09-26 | 2023-12-22 | 南京信息工程大学 | 一种多特征融合深度学习服务QoS预测系统及预测方法 |
-
2023
- 2023-05-15 CN CN202310547397.5A patent/CN116760735A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117274616A (zh) * | 2023-09-26 | 2023-12-22 | 南京信息工程大学 | 一种多特征融合深度学习服务QoS预测系统及预测方法 |
CN117274616B (zh) * | 2023-09-26 | 2024-03-29 | 南京信息工程大学 | 一种多特征融合深度学习服务QoS预测系统及预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10609433B2 (en) | Recommendation information pushing method, server, and storage medium | |
CN112184391B (zh) | 一种推荐模型的训练方法、介质、电子设备和推荐模型 | |
US20100169328A1 (en) | Systems and methods for making recommendations using model-based collaborative filtering with user communities and items collections | |
Lee et al. | Location-based web service QoS prediction via preference propagation for improving cold start problem | |
CN110995487A (zh) | 多服务质量预测方法、装置、计算机设备及可读存储介质 | |
CN116760735A (zh) | 一种基于多关系概率矩阵分解的服务质量快速预测方法 | |
WO2020135144A1 (zh) | 对象偏好预测的方法、装置和计算机可读介质 | |
US20230342606A1 (en) | Training method and apparatus for graph neural network | |
Su et al. | Web service QoS prediction by neighbor information combined non-negative matrix factorization | |
Xu et al. | A unified framework of QoS-based web service recommendation with neighborhood-extended matrix factorization | |
Ma et al. | Improving uncertainty calibration of deep neural networks via truth discovery and geometric optimization | |
Wang et al. | QoS prediction of web services based on reputation-aware network embedding | |
CN110232151A (zh) | 一种混合概率分布检测的QoS预测模型的构建方法 | |
CN115103029B (zh) | 基于截断核范数的低秩张量补全QoS预测方法及装置 | |
CN115794586A (zh) | 云服务器软件老化预测方法、装置、设备和介质 | |
CN109728958A (zh) | 一种网络节点信任预测方法、装置、设备及介质 | |
CN111460318B (zh) | 基于显性和隐性信任的协同过滤推荐方法 | |
Le et al. | Bounded-SVD: A matrix factorization method with bound constraints for recommender systems | |
CN111428741B (zh) | 网络社区的发现方法、装置、电子设备及可读存储介质 | |
Liu et al. | Recommendation algorithm fusing implicit similarity of users and trust | |
KR20190129422A (ko) | 뉴럴 네트워크를 이용한 변분 추론 방법 및 장치 | |
Abdullah et al. | Predicting qos for web service recommendations based on reputation and location clustering with collaborative filtering | |
US20230098656A1 (en) | Data subsampling for recommendation systems | |
Zhang et al. | S2NMF: Information Self‐Enhancement Self‐Supervised Nonnegative Matrix Factorization for Recommendation | |
US20230127832A1 (en) | Bnn training with mini-batch particle flow |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |