CN112328912B - 一种利用地点感知的QoS预测方法 - Google Patents

一种利用地点感知的QoS预测方法 Download PDF

Info

Publication number
CN112328912B
CN112328912B CN202011210800.8A CN202011210800A CN112328912B CN 112328912 B CN112328912 B CN 112328912B CN 202011210800 A CN202011210800 A CN 202011210800A CN 112328912 B CN112328912 B CN 112328912B
Authority
CN
China
Prior art keywords
service
user
qos
location
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011210800.8A
Other languages
English (en)
Other versions
CN112328912A (zh
Inventor
鄢萌
张文燕
徐玲
罗兆林
阳欢欢
王子梁
付春雷
张小洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202011210800.8A priority Critical patent/CN112328912B/zh
Publication of CN112328912A publication Critical patent/CN112328912A/zh
Application granted granted Critical
Publication of CN112328912B publication Critical patent/CN112328912B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • G06Q50/40
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明涉及通信技术领域,具体涉及一种利用地点感知的QoS预测方法。本发明以用户、服务以及他们的地点信息为特征作为预测模型的输入,预测模型将输入特征映射成为高维稠密向量,并利用特征重用的方式实现对QoS值的预测。该方法在网络深度较深的情况下缓解了梯度消失和特征丢失的问题,相比现有技术,在稀疏数据的情况下,能够更加准确的预测出用户调用服务的QoS值。

Description

一种利用地点感知的QoS预测方法
技术领域
本发明涉及通信技术领域,具体涉及一种利用地点感知的QoS预测方法。
背景技术
随着各种云应用平台的兴起,各种服务的数量也在不断增加迅速。同时,相较于下载各类应用软件,用户也更加倾向调用云服务来实现相关功能。然而在云环境中存在大量的候选服务,这使得用户难以选择一个合适的服务。服务质量(QoS)是服务的非功能评估标准,包括服务可用性、响应时间、吞吐量、价格等。QoS已成为服务选择、发现和推荐的关键标准,它可以根据预测的QoS结果在功能等价的服务中区分出适合的服务。在不同的网络环境下,即使调用相同的服务,用户得到的QoS也可能产生较大的差异,因此针对不同用户预测QoS值对于个性化的服务推荐十分重要。
协同过滤(collaborative filtering,CF)方法被广泛应用于QoS预测,它依赖于寻找相似用户和项目的特征来预测目标。在QoS预测中,协同过滤方法首先为目标用户或服务匹配相似用户或服务,然后利用这些相似用户或服务的历史调用数据来计算缺失的目标QoS值。但是,CF方法只能学习低维的线性特征,在数据稀疏的情况下难以发挥其优势。
现有技术Zhang,Yiwen & Yin,Chunhui & Wu,Qilin & He,Qiang & Zhu,Haibin.(2019).Location-Aware Deep Collaborative Filtering for ServiceRecommendation.IEEE Transactions on Systems,Man,and Cybernetics:Systems.PP.1-12.10.1109/TSMC.2019.2931723.以及Yin Y,Chen L,Xu Y,et al.QoS Prediction forService Recommendation with Deep Feature Learning in Edge ComputingEnvironment[J].Mobile Networks and Applications,2019:391-401.通过使用深度学习方法对QoS进行预测,解决数据稀疏情况下预测性能低的问题,但是,由于现有用于QoS预测的深度学习方法在网络深度较深时,出现梯度消失和特征丢失的问题,无法准确地对QoS进行预测。
发明内容
针对现有技术存在的上述问题,本发明要解决的技术问题是:在数据稀疏和深度学习方法网络深度较深时对QoS的预测准确度低。
为解决上述技术问题,本发明采用如下技术方案:一种利用地点感知的QoS预测方法,包括如下步骤:
S1000;数据的预处理;
将记录得到的真实用户与服务进行编号,用户记为U={ui|i=1,2,3,…,n},服务记为S={si|i=1,2,3,…,n},将用户调用服务的QoS值记为Q={qi|i=1,2,3,…,n},并将用户,服务以及对应的用户调用服务的QoS值组成数据组{U,S,Q},所有的数据组形成数据集;
S2000;模型的建立;
S2100;将用户中的用户ID和用户地点,服务中的服务ID和服务地点作为输入特征,使用One-hot对输入特征进行编码,用户ID,用户地点,服务ID和服务地点分别编码为
Figure GDA0004056979130000021
Figure GDA0004056979130000022
和/>
Figure GDA0004056979130000023
S2200;将输入特征映射为高维稠密向量:
Figure GDA0004056979130000024
Figure GDA0004056979130000025
Figure GDA0004056979130000026
Figure GDA0004056979130000027
其中Iu为用户ID映射的高维稠密向量,Lu为用户地点映射的高维稠密向量,Is为服务ID映射的高维稠密向量,Ls为服务地点映射的高维稠密向量,fe为RELU线性整流函数,
Figure GDA0004056979130000028
为用户ID的权重矩阵,/>
Figure GDA0004056979130000029
为用户地点的权重矩阵,/>
Figure GDA00040569791300000210
为服务ID的权重矩阵,/>
Figure GDA00040569791300000211
为服务地点的权重矩阵,/>
Figure GDA00040569791300000212
为用户ID的偏置项,/>
Figure GDA00040569791300000213
为用户地点的偏置项,/>
Figure GDA00040569791300000214
为服务ID的偏置项,/>
Figure GDA00040569791300000215
为服务地点的偏置项;
S2300;将高维稠密向量连接成为一维向量:
Figure GDA00040569791300000216
S2400;提出预测模型,如下述等式(6):
Figure GDA00040569791300000217
Figure GDA00040569791300000218
Figure GDA00040569791300000219
Figure GDA00040569791300000220
其中,
Figure GDA00040569791300000221
为QoS的预测值,xk为第k次特征重用后的特征向量,mk为第k次特征重用前的特征向量,k为特征重用次数,fe为RELU线性整流函数,sk,j表示第k次特征重用中第j个重用的特征向量,/>
Figure GDA0004056979130000031
为xj的权重矩阵,bk,j为xj的偏置项,/>
Figure GDA0004056979130000032
为xk-1的权重矩阵,bk为xk-1的偏置项,/>
Figure GDA0004056979130000033
为xn的权重矩阵,bn+1为xn的偏置项;
S3000;对预测模型进行训练;
S3100;随机初始化所有的权重矩阵和所有的偏置项;
S3200;随机抽取数据集中的数据组作为训练集,训练集占数据集的比例范围为5%~30%,将数据集其余数据组作为测试集;
S3300;使用设定好学习率的优化器,将训练集中的数据代入等式(9),对权重矩阵和偏置项进行训练,得到QoS预测模型;
S3400;使用MAE作为损失函数,公式如下:
Figure GDA0004056979130000034
其中,N为测试集中数据组的数量,Qu,s为用户ui调用服务si的真实QoS值,
Figure GDA0004056979130000035
为用户ui调用服务si的预测QoS值;
将测试集数据带入QoS预测模型,并计算出模型预测的QoS值的MAE值;S3500;将步骤S3400得到的QoS预测模型记为Kt,将Kt的权重矩阵和偏置项重新作为模型初始值,返回所述步骤S3300,执行步骤S3300-S3400,并记重新得到的QoS预测模型Kt+1,比较Kt和Kt+1对应的MAE值,取MAE值较小的QoS预测模型;
S3600;重复T次步骤S3500后,所得QoS预测模型即为最优QoS预测模型;
S4000;QoS值的预测;
将需要预测用户调用服务的QoS值的用户ID,用户地点,服务ID和服务地点带入最优QoS预测模型中,即可得到该用户与服务的QoS预测值。
本发明通过将用户、服务以及他们的地点信息映射成为高维稠密向量,使用特征重用的方法构建QoS预测模型,并训练得到最优QoS预测模型,可以准确地预测出用户调用服务的QoS值。
作为优选,所述步骤S2400中特征重用次数k的选择范围为3-12。特征重用次数小于3时,得到的预测模型预测性能低,特征重用次数大于12时,会增加预测模型的训练难度和训练时间,限定特征重用次数的范围可以在保证QoS预测准确度的情况下,降低模型的训练难度以及节省模型的训练时间。
作为优选,所述步骤S3300中,使用的优化器为Adam优化器。Adam优化器使用的是一种适应性方法,具有优异的收敛速度,同时,Adam优化器具有bias-correction和momentum,使用稀疏的梯度数据时具有良好的优化性能。
作为优选,所述步骤S3300中,优化器的学习率设置为0.0004。在模型学习过程中,学习率影响模型收敛至最优的速度。学习率偏高往往导致模型无法达到最优点,而学习率偏低往往导致模型达到局部最优,在学习率为0.0004时模型具有优质的收敛速度。
作为优选,所述步骤S3600中,T取值为50。通过对QoS预测模型进行迭代,控制迭代次数,在确保建立的预测模型具有良好的预测性能的同时,节省了模型训练的时间。
相对于现有技术,本发明至少具有如下优点:
1.本发明以用户、服务以及他们的地点信息为特征作为预测模型的输入,预测模型将输入特征映射成为高维稠密向量,并利用特征重用的方式实现对QoS值的预测。该方法在网络深度较深的情况下缓解了梯度消失和特征丢失的问题,相比现有技术,无论是稀疏数据还是稠密数据都能够更加准确的预测出用户调用服务的QoS值。
2.本发明将用户ID,用户地点,服务ID和服务地点同时作为特征进行QoS值的预测,用户地点和服务地点的使用,一方面,可以反映出用户与服务之间的距离对服务效率的影响,对用户与服务的关系研究有积极意义,另一方面,对于从未调用过任何服务的客户,根据相近的用户地点与服务的QoS预测能够推测出该用户的QoS信息,完善对用户与服务的关系研究。
附图说明
图1为将QoS矩阵转化为调用记录示意图;
图2为MAE性能测试对比折线示意图;
图3为RMSE性能测试对比折线示意图;
图4为本发明方法的流程示意图;
具体实施方式
下面对本发明作进一步详细说明。
实施例:一种利用地点感知的QoS预测方法,包括如下步骤:
S1000;数据的预处理;
将记录得到的真实用户与服务进行编号,用户记为U={ui|i=1,2,3,…,n},服务记为S={si|i=1,2,3,…,n},将用户调用服务的QoS值记为Q={qi|i=1,2,3,…,n},并将用户,服务以及对应的用户调用服务的QoS值组成数据组{U,S,Q},所有的数据组形成数据集;
具体实施时,使用WS-DREAM数据集中的数据作为真实用户与服务,对WS-DREAM数据集中的数据进行编号,形成数据集。
S2000;模型的建立;
S2100;将用户中的用户ID和用户地点,服务中的服务ID和服务地点作为输入特征,使用One-hot对输入特征进行编码,用户ID,用户地点,服务ID和服务地点分别编码为
Figure GDA0004056979130000051
Figure GDA0004056979130000052
和/>
Figure GDA0004056979130000053
S2200;将输入特征映射为高维稠密向量:
Figure GDA0004056979130000054
Figure GDA0004056979130000055
Figure GDA0004056979130000056
Figure GDA0004056979130000057
其中Iu为用户ID映射的高维稠密向量,Lu为用户地点映射的高维稠密向量,Is为服务ID映射的高维稠密向量,Ls为服务地点映射的高维稠密向量,fe为RELU线性整流函数,
Figure GDA0004056979130000058
为用户ID的权重矩阵,/>
Figure GDA0004056979130000059
为用户地点的权重矩阵,/>
Figure GDA00040569791300000510
为服务ID的权重矩阵,/>
Figure GDA00040569791300000511
为服务地点的权重矩阵,/>
Figure GDA00040569791300000512
为用户ID的偏置项,/>
Figure GDA00040569791300000513
为用户地点的偏置项,/>
Figure GDA00040569791300000514
为服务ID的偏置项,/>
Figure GDA00040569791300000515
为服务地点的偏置项;
S2300;将高维稠密向量连接成为一维向量:
Figure GDA00040569791300000516
S2400;提出预测模型,如下述等式(6):
Figure GDA00040569791300000517
Figure GDA00040569791300000518
Figure GDA00040569791300000519
Figure GDA00040569791300000520
其中,
Figure GDA00040569791300000521
为QoS的预测值,xk为第k次特征重用后的特征向量,mk为第k次特征重用前的特征向量,k为特征重用次数,fe为RELU线性整流函数,sk,j表示第k次特征重用中第j个重用的特征向量,/>
Figure GDA00040569791300000522
为xj的权重矩阵,bk,j为xj的偏置项,/>
Figure GDA00040569791300000523
为xk-1的权重矩阵,bk为xk-1的偏置项,/>
Figure GDA00040569791300000524
为xn的权重矩阵,bn+1为xn的偏置项;
具体实施时,特征重用次数k的具体可以选择3,4,5,6,7,8,9,10,11,12。特征重用次数小于3时,得到的预测模型预测性能低,特征重用次数大于12时,会增加预测模型的训练难度和训练时间,限定特征重用次数的范围可以在保证QoS预测准确度的情况下,降低模型的训练难度以及节省模型的训练时间。
S3000;对预测模型进行训练;
S3100;随机初始化所有的权重矩阵和所有的偏置项;
S3200;随机抽取数据集中的数据组作为训练集,训练集占数据集的比例范围为5%~30%,将数据集其余数据组作为测试集;
具体实施时,训练集占数据集的比例可以选择5%,10%,15%,20%,25%或30%,则依次对应测试集占数据集的比例为95%,90%,85%,80%,75%,70%。
S3300;使用设定好学习率的优化器,将训练集中的数据代入等式(9),对权重矩阵和偏置项进行训练,得到QoS预测模型;
具体实施时,使用的优化器为Adam优化器。Adam优化器使用的是一种适应性方法,具有优异的收敛速度,同时,Adam优化器具有bias-correction和momentum,使用稀疏的梯度数据时具有良好的优化性能。Adam优化器为现有技术,此处不做过多说明。
具体实施时,优化器的学习率设置为0.0004。
S3400;使用MAE作为损失函数,公式如下:
Figure GDA0004056979130000061
其中,N为测试集中数据组的数量,Qu,s为用户ui调用服务si的真实QoS值,
Figure GDA0004056979130000062
为用户ui调用服务si的预测QoS值;
将测试集数据带入QoS预测模型,并计算出模型预测的QoS值的MAE值;S3500;将步骤S3400得到的QoS预测模型记为Kt,将Kt的权重矩阵和偏置项重新作为模型初始值,返回所述步骤S3300,执行步骤S3300-S3400,并记重新得到的QoS预测模型Kt+1,比较Kt和Kt+1对应的MAE值,取MAE值较小的QoS预测模型;
S3600;重复T次步骤S3500后,所得QoS预测模型即为最优QoS预测模型;
具体实施时,T取值为50。通过对QoS预测模型进行迭代,控制迭代次数,在确保建立的预测模型具有良好的预测性能的同时,节省了模型训练的时间。
S4000;QoS值的预测;
将需要预测用户调用服务的QoS值的用户ID,用户地点,服务ID和服务地点带入最优QoS预测模型中,即可得到该用户与服务的QoS预测值。
实验对比
为验证该方法的准确性,将本发明一种利用地点感知的QoS预测方法,以下简称LocDense,与现有的QoS预测方法进行比较。
实验数据的准备;
使用WS-DREAM数据集作为原始数据集,WS-DREAM数据集是从真实世界收集的Web服务QoS数据集。数据集包含5825个服务上从339个用户收集的Web服务的1,873,838个有效的QoS值,包括响应时间和吞吐量。数据集还包括用户和服务的其他信息,比如他们的国家、IP地址、经纬度等,本实验使用“国家”和“网络代理商”信息作为地点特征。在本实验中使用响应时间来验证LocDense的有效性。以响应时间为例,数据形式如图1左侧所示QoS矩阵形式。在训练前,需要将用户-服务矩阵中的所有有效QoS值划分为训练集和测试集。为方便数据集的划分以及对模型的输入,我们将QoS矩阵转换为调用记录的形式。数据集中的所有id和地点都用预先分配的唯一数字表示,由于在现实世界中QoS矩阵是非常稀疏的,我们所设置的训练集的大小远远小于测试集的大小。设置矩阵密度分别为5%~30%进行6组实验,步长为5%,密度的变化意味着对数据的稀疏调整。例如,密度为5%的矩阵表示用户-服务Qos矩阵中只有5%的值作为训练集,其余95%的值作为测试集。
实验对比方法;
选择以下QoS预测方法与LocDense进行性能的比较:
UIPCC(基于用户和服务的协同过滤):这是一种传统的协同过滤方法,它利用皮尔逊相关系数计算相似度,通过相似用户和相似服务的历史记录计算确实QoS值,它是UPCC(基于用户的协同过滤)和IPCC(基于服务的协同过滤)的结合。
PMF(概率矩阵分解):这是推荐领域中一种非常流行的方法。MF(矩阵分解)将QoS矩阵分解为隐式用户矩阵和隐式服务矩阵,两个矩阵的相乘可还原QoS矩阵,达到预测缺失QoS值得目的,PMF在此基础上还引入了概率因子。
LACF:这是一种位置感知的协作动态过滤方法。该方法与传统协同过滤的不同之处在于,它将地理位置上接近目标用户的用户作为相似用户,将地理位置上接近目标服务的服务作为相似服务。
NCF:该方法结合了CF和MLP,将用户和服务的隐式向量输入MLP网络中,利用MLP学习这些隐式特征间的关联。
LDCF:这是一种地点感知的方法,它将深度学习与协同过滤方法相结合,是一种目前较为先进的QoS预测方法。
在这些方法中,UIPCC和PMF分别是基于内容和基于模型的协同过滤方法,LACF和LDCF是位置感知方法,NCF和LDCF是与神经网络相关的模型方法。
预测评价指标;
QoS的预测可以归为一个回归问题,因此我们使用绝对平均误差(MAE)和均方根误差(RMSE)来衡量预测的性能。MAE和RMSE被定义为:
Figure GDA0004056979130000081
Figure GDA0004056979130000082
其中Qu,s表示用户u调用服务s的真实QoS值,
Figure GDA0004056979130000083
表示对该QoS的预测值,N表示预测的QoS的总数。
实验结果;
对比前,使用相同的训练集训练对比方法和LocDense,并用相同的测试集进行性能测试。对于需要寻找相似用户或相似服务的协同过滤方法(UIPCC和LACF),设置其邻居数量为10,对于深度学习方法(NCF,LDCF和LocDense),我们设置隐藏层数为7,对于LocDense来说,隐藏层数即为特征重用次数,对于矩阵分解方法(PMF和NCF),设置隐式特征的维度为10。至于其他的一些模型通用的参数,设置批大小为256,设置学习率为0.0004,最大迭代次数,即所述重复次数T,为50。
将对比方法和LocDense训练完成后,带入测试集数据,对QoS值进行预测,并计算MAE值和RMSE值,结果如下表1和表2所示:
表1:MAE性能测试结果
密度 5% 10% 15% 20% 25% 30%
UIPCC 0.625 0.581 0.501 0.450 0.427 0.411
PMF 0.570 0.490 0.460 0.442 0.433 0.428
LACF 0.630 0.560 0.510 0.477 0.456 0.44
NCF 0.440 0.403 0.385 0.359 0.344 0.337
LDCF 0.391 0.371 0.346 0.325 0.319 0.307
LocDense 0.354 0.316 0.296 0.285 0.276 0.268
表2:RMSE性能测试结果
密度 5% 10% 15% 20% 25% 30%
UIPCC 1.388 1.330 1.250 1.197 1.166 1.145
PMF 1.537 1.320 1.230 1.179 1.155 1.137
LACF 1.440 1.338 1.269 1.222 1.188 1.163
NCF 1.333 1.274 1.242 1.218 1.184 1.177
LDCF 1.277 1.206 1.181 1.124 1.111 1.100
LocDense 1.228 1.167 1.140 1.118 1.098 1.077
由表1和表2可知,使用LocDense对QoS值进行预测的MAE和RMSE值比对现有的其他方法都有所降低,为了直观的展示LocDense的性能,将表1和表2分别制成如图2和图3所示的折线图,图2中横坐标为矩阵密度,纵坐标为MAE值,图3中横坐标为矩阵密度,纵坐标为RMSE值。如图2所示,使用深度学习的模型(NCF、LDCF和LocDense)在5%的矩阵密度下MAE值均小于0.45,小于其他三个模型(UIPCC、PMF、LACF)。在其他密度下,NCF、LDCF和LocDense的MAE值均小于UIPCC、PMF、LACF。深度学习的模型在QoS预测中拟合非线性特征的能力更好,能够更加准确的预测出QoS值。并且,本发明提供的方案LocDense的MAE值在深度学习的模型中为最小,LocDense与目前较为先进的QoS预测方法LDCF相比,在5%,10%,15%,20%,25%和30%六种矩阵密度下,MAE性能分别提升了9.46%,12.95%,13.95%,12.31%,13.48%和12.70%。
如图3所示,同时使用地点信息和深度学习的模型LDCF和本发明LocDense在不同的矩阵密度下,RMSE值均小于其他模型方法,并且,不同矩阵密度下,LocDense的RMSE值均小于LDCF,LocDense与目前较为先进的QoS预测方法LDCF相比,在5%,10%,15%,20%,25%和30%六种矩阵密度下,RMSE性能分别提升了3.81%,3.25%,3.41%,1.06%,1.13%和2.1%。
综上,本发明提供的技术方案对QoS预测的性能明显优于现有方法,能够更加准确的对用户调用服务的QoS值进行预测,对用户进行个性化的服务推荐有着积极影响。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (5)

1.一种利用地点感知的QoS预测方法,其特征在于:包括如下步骤:
S1000;数据的预处理;
将记录得到的真实用户与服务进行编号,用户记为U={ui|i=1,2,3,…,n},服务记为S={si|i=1,2,3,…,n},将用户调用服务的QoS值记为Q={qi|i=1,2,3,…,n},并将用户,服务以及对应的用户调用服务的QoS值组成数据组{U,S,Q},所有的数据组形成数据集;
S2000;模型的建立;
S2100;将用户中的用户ID和用户地点,服务中的服务ID和服务地点作为输入特征,使用One-hot对输入特征进行编码,用户ID,用户地点,服务ID和服务地点分别编码为
Figure FDA0004056979120000011
Figure FDA0004056979120000012
和/>
Figure FDA0004056979120000013
S2200;将输入特征映射为高维稠密向量:
Figure FDA0004056979120000014
Figure FDA0004056979120000015
Figure FDA0004056979120000016
Figure FDA0004056979120000017
其中Iu为用户ID映射的高维稠密向量,Lu为用户地点映射的高维稠密向量,Is为服务ID映射的高维稠密向量,Ls为服务地点映射的高维稠密向量,fe为RELU线性整流函数,
Figure FDA0004056979120000018
为用户ID的权重矩阵,/>
Figure FDA0004056979120000019
为用户地点的权重矩阵,/>
Figure FDA00040569791200000110
为服务ID的权重矩阵,/>
Figure FDA00040569791200000111
为服务地点的权重矩阵,/>
Figure FDA00040569791200000112
为用户ID的偏置项,/>
Figure FDA00040569791200000113
为用户地点的偏置项,/>
Figure FDA00040569791200000114
为服务ID的偏置项,/>
Figure FDA00040569791200000115
为服务地点的偏置项;
S2300;将高维稠密向量连接成为一维向量:
Figure FDA00040569791200000116
S2400;提出预测模型,如下述等式:
Figure FDA00040569791200000117
Figure FDA00040569791200000118
Figure FDA00040569791200000119
Figure FDA0004056979120000021
其中,
Figure FDA0004056979120000022
为QoS的预测值,xk为第k次特征重用后的特征向量,mk为第k次特征重用前的特征向量,k为特征重用次数,fe为RELU线性整流函数,sk,j表示第k次特征重用中第j个重用的特征向量,/>
Figure FDA0004056979120000023
为xj的权重矩阵,bk,j为xj的偏置项,/>
Figure FDA0004056979120000024
为xk-1的权重矩阵,bk为xk-1的偏置项,/>
Figure FDA0004056979120000025
为xn的权重矩阵,bn+1为xn的偏置项;
S3000;对预测模型进行训练;
S3100;随机初始化所有的权重矩阵和所有的偏置项;
S3200;随机抽取数据集中的数据组作为训练集,训练集占数据集的比例范围为5%~30%,将数据集其余数据组作为测试集;
S3300;使用设定好学习率的优化器,将训练集中的数据代入等式(9),对权重矩阵和偏置项进行训练,得到QoS预测模型;
S3400;使用MAE作为损失函数,公式如下:
Figure FDA0004056979120000026
其中,N为测试集中数据组的数量,Qu,s为用户ui调用服务si的真实QoS值,
Figure FDA0004056979120000027
为用户ui调用服务si的预测QoS值;
将测试集数据带入QoS预测模型,并计算出模型预测的QoS值的MAE值;
S3500;将步骤S3400得到的QoS预测模型记为Kt,将Kt的权重矩阵和偏置项重新作为模型初始值,返回所述步骤S3300,执行步骤S3300-S3400,并记重新得到的QoS预测模型Kt+1,比较Kt和Kt+1对应的MAE值,取MAE值较小的QoS预测模型;
S3600;重复T次步骤S3500后,所得QoS预测模型即为最优QoS预测模型;
S4000;QoS值的预测;
将需要预测用户调用服务的QoS值的用户ID,用户地点,服务ID和服务地点带入最优QoS预测模型中,即可得到该用户与服务的QoS预测值。
2.如权利要求1所述的一种利用地点感知的QoS预测方法,其特征在于:所述步骤S2400中特征重用次数k的选择范围为3-12。
3.如权利要求1所述的一种利用地点感知的QoS预测方法,其特征在于:所述步骤S3300中,使用的优化器为Adam优化器。
4.如权利要求1所述的一种利用地点感知的QoS预测方法,其特征在于:所述步骤S3300中,优化器的学习率设置为0.0004。
5.如权利要求1所述的一种利用地点感知的QoS预测方法,其特征在于:所述步骤S3600中,T取值为50。
CN202011210800.8A 2020-11-03 2020-11-03 一种利用地点感知的QoS预测方法 Active CN112328912B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011210800.8A CN112328912B (zh) 2020-11-03 2020-11-03 一种利用地点感知的QoS预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011210800.8A CN112328912B (zh) 2020-11-03 2020-11-03 一种利用地点感知的QoS预测方法

Publications (2)

Publication Number Publication Date
CN112328912A CN112328912A (zh) 2021-02-05
CN112328912B true CN112328912B (zh) 2023-05-19

Family

ID=74323188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011210800.8A Active CN112328912B (zh) 2020-11-03 2020-11-03 一种利用地点感知的QoS预测方法

Country Status (1)

Country Link
CN (1) CN112328912B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113949646B (zh) * 2021-10-15 2023-06-13 安徽大学 一种基于深度学习的Web服务QoS预测方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102629341A (zh) * 2012-04-13 2012-08-08 浙江大学 一种基于用户地理位置信息的Web服务QoS在线预测方法
CN103139310A (zh) * 2013-03-06 2013-06-05 杭州电子科技大学 一种基于混合协同过滤的Web服务QoS预测方法
CN103533648A (zh) * 2013-10-24 2014-01-22 哈尔滨工业大学 基于支持向量机的无线异构网络移动用户位置预测方法
CN107679415A (zh) * 2017-09-25 2018-02-09 深圳大学 隐私保护协同Web服务质量预测的基于模型的协同过滤方法
CN108235356A (zh) * 2017-12-28 2018-06-29 广东南方电信规划咨询设计院有限公司 一种异构网络中用户关联的ga-bpnn方法
CN109167673A (zh) * 2018-07-18 2019-01-08 广西大学 一种融合异常Qos数据检测的新型云服务筛选方法
CN109685252A (zh) * 2018-11-30 2019-04-26 西安工程大学 基于循环神经网络和多任务学习模型的建筑能耗预测方法
CN110249596A (zh) * 2017-01-09 2019-09-17 思杰系统有限公司 用于saas应用的基于qos的分类和优先级排序的学习技巧
CN111541570A (zh) * 2020-04-22 2020-08-14 北京交通大学 基于多源特征学习的云服务QoS预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8719253B2 (en) * 2010-12-01 2014-05-06 Cisco Technology, Inc. Method and apparatus for efficiently organizing hierarchical QoS policies
US9161169B2 (en) * 2014-01-02 2015-10-13 International Business Machines Corporation Using location and propensity based predictive analytics to provide mobile message QOS
US9942085B2 (en) * 2016-07-13 2018-04-10 Incelligent P.C. Early warning and recommendation system for the proactive management of wireless broadband networks
US11010516B2 (en) * 2018-11-09 2021-05-18 Nvidia Corp. Deep learning based identification of difficult to test nodes

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102629341A (zh) * 2012-04-13 2012-08-08 浙江大学 一种基于用户地理位置信息的Web服务QoS在线预测方法
CN103139310A (zh) * 2013-03-06 2013-06-05 杭州电子科技大学 一种基于混合协同过滤的Web服务QoS预测方法
CN103533648A (zh) * 2013-10-24 2014-01-22 哈尔滨工业大学 基于支持向量机的无线异构网络移动用户位置预测方法
CN110249596A (zh) * 2017-01-09 2019-09-17 思杰系统有限公司 用于saas应用的基于qos的分类和优先级排序的学习技巧
CN107679415A (zh) * 2017-09-25 2018-02-09 深圳大学 隐私保护协同Web服务质量预测的基于模型的协同过滤方法
CN108235356A (zh) * 2017-12-28 2018-06-29 广东南方电信规划咨询设计院有限公司 一种异构网络中用户关联的ga-bpnn方法
CN109167673A (zh) * 2018-07-18 2019-01-08 广西大学 一种融合异常Qos数据检测的新型云服务筛选方法
CN109685252A (zh) * 2018-11-30 2019-04-26 西安工程大学 基于循环神经网络和多任务学习模型的建筑能耗预测方法
CN111541570A (zh) * 2020-04-22 2020-08-14 北京交通大学 基于多源特征学习的云服务QoS预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Location-aware and personalized collaborative filtering for web service recommendation";J. Liu 等;《IEEE Transactions on Services Computing》;20150514;第686-699页 *
"基于历史用户QoS感知的Web服务发现方法";杨岳明 等;《计算机应用》;20120501;第1351-1354页 *

Also Published As

Publication number Publication date
CN112328912A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
Wu et al. Location estimation via support vector regression
CN108536851B (zh) 一种基于移动轨迹相似度比较的用户身份识别方法
Munk et al. Neural network models for infrared spectrum interpretation
CN112364908B (zh) 一种面向决策树的纵向联邦学习方法
CN104169946B (zh) 用于视觉搜索的可扩展查询
CN105024886B (zh) 一种基于用户元数据的快速Web服务QoS预测方法
CN107704868B (zh) 基于移动应用使用行为的用户分群聚类方法
CN113379176B (zh) 电信网络异常数据检测方法、装置、设备和可读存储介质
CN114385376A (zh) 一种异构数据下边缘侧联邦学习的客户端选择方法
CN104268142A (zh) 基于可拒绝策略的元搜索结果排序算法
CN112328912B (zh) 一种利用地点感知的QoS预测方法
JP6924571B2 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
CN110738647A (zh) 融合多感受野特征映射与高斯概率模型的老鼠检测方法
CN116681104B (zh) 分布式空间图神经网络的模型建立及实现方法
Deng et al. A two-step learning and interpolation method for location-based channel database construction
CN111985623A (zh) 基于最大化互信息和图神经网络的属性图群组发现方法
CN102629341A (zh) 一种基于用户地理位置信息的Web服务QoS在线预测方法
CN113037410A (zh) 信道识别方法、装置、传输方法、传输设备、基站、介质
Deng et al. Network latency estimation with leverage sampling for personal devices: An adaptive tensor completion approach
Mazlan et al. A fast indoor positioning using a Knowledge-Distilled Convolutional Neural Network (KD-CNN)
CN112200375A (zh) 预测模型生成方法、预测模型生成装置和计算机可读介质
CN110490002B (zh) 一种基于本地化差分隐私的多维众包数据真值发现方法
CN109412661B (zh) 一种大规模mimo系统下的用户分簇方法
CN114626550A (zh) 分布式模型协同训练方法和系统
CN117119377A (zh) 基于滤波Transformer的室内指纹定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant