CN111708936A - 基于相似性传播策略的Web服务推荐系统及方法 - Google Patents

基于相似性传播策略的Web服务推荐系统及方法 Download PDF

Info

Publication number
CN111708936A
CN111708936A CN202010457337.0A CN202010457337A CN111708936A CN 111708936 A CN111708936 A CN 111708936A CN 202010457337 A CN202010457337 A CN 202010457337A CN 111708936 A CN111708936 A CN 111708936A
Authority
CN
China
Prior art keywords
web service
similarity
web
users
services
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010457337.0A
Other languages
English (en)
Other versions
CN111708936B (zh
Inventor
苏凯
刘宝平
肖斌
胡涛
林名驰
陈国卫
刘少华
苏晓光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naval University of Engineering PLA
Original Assignee
Naval University of Engineering PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naval University of Engineering PLA filed Critical Naval University of Engineering PLA
Priority to CN202010457337.0A priority Critical patent/CN111708936B/zh
Publication of CN111708936A publication Critical patent/CN111708936A/zh
Application granted granted Critical
Publication of CN111708936B publication Critical patent/CN111708936B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Abstract

本发明公开了一种基于相似性传播策略的Web服务推荐系统,其特征在于:它包括远程服务器、输入处理模块、直接相似度计算模块、相似度图构建模块、传播路径发现模块、相似度聚合模块、间接相似度计算模块、相似邻居发现模块、QoS值预测及服务推荐模块,本发明能有效提升相似度评估的准确度,从而为用户提供高质量的服务推荐。

Description

基于相似性传播策略的Web服务推荐系统及方法
技术领域
本发明相似性传播策略技术领域,具体涉及一种基于相似性传播策略的Web服务推荐系统及方法。
技术背景
Web服务是一种自描述、独立于平台和松耦合的分布式组件,由于其建立在一系列基于可扩展标记语言(XML,Extensible Markup Language)的开放标准和协议基础上,使得Web服务可在网络中被发布、发现、绑定和调用。Web服务技术作为一种新型的分布式计算模型,近年来被广泛用于面向互联网的分布式应用构建上。
随着面向服务计算技术、云计算和大数据等技术的发展,网络中出现大量功能相似的Web服务,服务质量(QoS,Quality of Service)成为用户区分不同Web服务时的主要关注点。QoS主要包括响应时间、吞吐量、可靠性和可用性等非功能性属性。在现实环境中,由于服务的QoS受网络状况、地理位置等客观因素影响较大,不同用户感受到的QoS是不同的。因此如何为用户个性化地预测服务的QoS,然后基于预测值推荐最优的服务给用户,成为服务计算和云计算中的关键问题。近年来,由于协同过滤技术在亚马逊、YouTube和Netfix等商业推荐系统中取得了较大成功,许多学者提出将协同过滤技术应用于Web服务推荐。协同过滤技术主要通过挖掘活动用户的相似用户或者目标服务的相似服务的历史QoS数据来预测当前活动用户调用目标服务后的QoS。然而,由于现实环境中的历史QoS数据是非常稀疏的,现有的相似度评估方法不能准确地评估用户间或者服务间的相似度,导致无法为用户提供高质量的Web服务推荐。
发明内容
本发明的目的是针对上述技术问题,提供一种基于相似性传播策略的Web服务推荐方法,本发明能有效提升相似度评估的准确度,从而为用户提供高质量的服务推荐。
为实现此目的,本发明所设计的一种基于相似性传播策略的Web服务推荐系统,其特征在于:它包括远程服务器、输入处理模块、直接相似度计算模块、相似度图构建模块、传播路径发现模块、相似度聚合模块、间接相似度计算模块、相似邻居发现模块、QoS值预测及服务推荐模块,其中,需要调用Web服务的软件通过网络调用远程服务器上的Web服务,并将调用后观察到的Web服务的QoS数据反馈给输入处理模块;
输入处理模块用于去除Web服务QoS数据中的噪声数据和错误数据得到规范化的Web服务QoS数据;
直接相似度计算模块用于根据规范化的Web服务QoS数据计算Web服务用户之间或Web服务之间的直接相似度,并构建Web服务用户直接相似度矩阵和Web服务直接相似度矩阵;
相似度图构建模块用于以Web服务用户直接相似度矩阵和Web服务直接相似度矩阵为邻接矩阵,构造无向加权Web服务用户相似度图和无向加权Web服务相似度图;
传播路径发现模块用于搜索无向加权Web服务用户相似度图和无向加权Web服务相似度图上的Web服务用户之间或Web服务之间的相似性传播路径;
相似度聚合模块用于将每条相似性传播路径上的相似性进行聚合,得到每条传播路径上的相似度;
间接相似度计算模块用于对所有传播路径上的相似度进行集成,得到Web服务用户之间或Web服务之间的间接相似度;
相似邻居发现模块用于根据Web服务用户之间的直接相似度和间接相似度计算Web服务用户之间或Web服务之间的集成相似度,并根据Web服务用户之间或Web服务之间的集成相似度发现当前活动用户的一组相似Web服务用户,或者目标Web服务的一组相似Web服务;
QoS值预测及服务推荐模块用于将当前活动用户的相似Web服务用户或目标Web服务的相似Web服务的QoS数据,作为当前活动用户预测目标Web服务的QoS数据,并将当前活动用户预测目标Web服务的QoS数据中QoS数值最高的一个或多个Web服务推荐给活动用户。
本发明提出一种相似性传播策略,通过该策略可以评估服务推荐系统中用户之间以及服务之间的间接相似度。首先基于用户-服务QoS数据计算用户间和服务间的直接相似度。其次基于直接相似度数据分别构造用户相似度图和服务相似度图。进而采用基于Flyod的图算法来搜索用户间及服务间的相似度传播路径。最后将传播路径上的相似性进行聚合,得到用户间及服务间的间接相似度。最后将直接相似度和间接相似度进行集成得到集成相似度,进而为活动用户或者目标服务寻找一组相似邻居用于QoS预测。该方法不但利用了用户或服务间的直接关系,还挖掘了用户或服务间的间接关系,因此有利于在现实的稀疏数据环境下更深入地挖掘相似性关系,从而实现准确的QoS预测,达到高质量服务推荐的目的。
附图说明
图1为本发明的结构框图;
图2为本发明的中的用户相似度图;
图2中u1~u7均表示用户,用户之间连线上的数字表示用户间的相似度,与表1对应。
其中,1—远程服务器、2—输入处理模块、3—QoS数据库、4—直接相似度计算模块、5—相似度图构建模块、6—传播路径发现模块、7—相似度聚合模块、8—间接相似度计算模块、9—相似邻居发现模块、10—QoS值预测及服务推荐模块。
具体实施方式
以下结合附图和实施例对本发明作进一步的详细说明:
假设服务推荐系统中包含m个用户和n个服务,用户对服务的QoS历史调用信息可以表示为一个m×n矩阵R,其中任意项Rij表示用户ui调用服务sj后观测到的QoS值,假如用户ui之前未调用过服务sj,则Rij=null。服务推荐系统的目标就是通过矩阵中已有的数据项来预测这些缺失的数据项,然后将QoS预测值最优的Web服务推荐给活动用户。
如图1所示的一种基于相似性传播策略的Web服务推荐系统,它包括远程服务器1、输入处理模块2、直接相似度计算模块4、相似度图构建模块5、传播路径发现模块6、相似度聚合模块7、间接相似度计算模块8、相似邻居发现模块9、QoS值预测及服务推荐模块10,其中,需要调用Web服务的软件通过网络调用远程服务器1上的Web服务,并将观察到的Web服务的QoS数据反馈给输入处理模块2;
输入处理模块2用于去除Web服务QoS数据中的噪声数据和错误数据(违背事实的数据,比如评分要求1~10分,用户提交了11分的数据,响应时间一般几秒到几分钟,用户提交了几小时)得到规范化Web服务QoS数据;
直接相似度计算模块4用于根据规范化的Web服务QoS数据计算Web服务用户之间或Web服务之间的直接相似度,并构建Web服务用户直接相似度矩阵和Web服务直接相似度矩阵;
相似度图构建模块5用于以Web服务用户直接相似度矩阵和Web服务直接相似度矩阵为邻接矩阵,构造无向加权Web服务用户相似度图和无向加权Web服务相似度图;
传播路径发现模块6用于搜索无向加权Web服务用户相似度图和无向加权Web服务相似度图上的Web服务用户之间或Web服务之间的相似性传播路径;
相似度聚合模块7用于将每条相似性传播路径上的相似性进行聚合,得到每条传播路径上的相似度;
间接相似度计算模块8用于对所有传播路径上的相似度进行集成,得到Web服务用户之间或Web服务之间的间接相似度;
相似邻居发现模块9用于根据Web服务用户之间的直接相似度和间接相似度计算Web服务用户之间或Web服务之间的集成相似度,并根据Web服务用户之间或Web服务之间的集成相似度发现当前活动用户(正在用WEB服务的用户)的一组相似Web服务用户,或者目标Web服务的一组相似Web服务;
QoS值预测及服务推荐模块10用于将当前活动用户的相似Web服务用户或目标Web服务的相似Web服务的QoS数据,作为当前活动用户预测目标Web服务的QoS数据,并将当前活动用户预测目标Web服务的QoS数据中QoS数值最高的一个或多个Web服务推荐给活动用户。
上述技术方案中,它还包括QoS数据库3,输入处理模块2还用于将规范化的Web服务QoS数据存储到QoS数据库3中。
上述技术方案中,所述直接相似度计算模块4用于根据规范化的Web服务QoS数据利用改进皮尔森相关系数法(PCC,Pearson Correlation Coefficient)计算Web服务用户之间或Web服务之间的直接相似度。该方法采用了Sigmoid函数作为衰减系数,避免了由于公共集较小所造成的高估或低估相似度的问题。
上述技术方案中,传播路径发现模块6用于采用基于Flyod图算法的相似度传播路径搜索无向加权Web服务用户相似度图和无向加权Web服务相似度图上的不同Web服务用户之间或不同Web服务之间的相似性传播路径。该方法实现简单,且可以搜索到全局最优路径。
上述技术方案中,所述相似度聚合模块7用于采用Min-max策略将每条相似性传播路径上的相似性进行聚合,得到每条相似性传播路径上的相似度。
上述技术方案中,所述间接相似度计算模块8对所有传播路径上的相似度进行集成,并采用基于最短路径的最小最大化相似性传播策略(SPaS)和基于所有路径的最小最大化相似性传播策略(SPaA),得到Web服务用户之间或Web服务之间的间接相似度。SPaS主要考虑用户间或服务间的最短传播路径,因为路径越长,则相似性传播的强度会越弱,最短路径可以得到一个高强度和可信的相似度。SPaA考虑了用户间或服务间的所有传播路径,因为最短路径有可能会忽略QoS数据中有价值的近邻信息。两个方法都采用了Min-max策略来进行间接相似度的集成计算。在Min-max策略中,路径中最小的相似度作为该路径的相似度,当节点之间有多条传播路径的时候,选取相似度最大的那条路径的相似度作为节点之间的最终间接相似度。
上述技术方案中,采用改进皮尔森相关系数法计算Web服务用户之间或Web服务之间的直接相似度的方法为:
Web服务用户之间的直接相似度计算如下:
Figure BDA0002509744750000061
其中SimDU(u,v)表示Web服务用户u和Web服务用户v之间的直接相似度,Suv=Su∩Sv是Web服务用户u和Web服务用户v都调用过的Web服务组成的集合,Rui是Web服务用户u调用Web服务i后观察到的QoS值,Rvi是Web服务用户v调用Web服务i后观察到的QoS值,
Figure BDA0002509744750000062
Figure BDA0002509744750000063
分别表示Web服务用户u和Web服务用户v观察到的所有Web服务的平均QoS值,|Suv|是Web服务用户u和Web服务用户v都调用过的Web服务组成的集合中的元素数量,e为自然常数;
Web服务之间的直接相似度计算如下:
Figure BDA0002509744750000071
其中SimDS(i,j)表示Web服务i和Web服务j之间的直接相似度,Uij=Ui∩Uj是同时调用过Web服务i和Web服务j的所有Web服务用户构成的集合,
Figure BDA0002509744750000072
Figure BDA0002509744750000073
分别表示Web服务i和Web服务j被所有Web服务用户调用的平均QoS值,|Uij|是同时调用过Web服务i和Web服务j的所有Web服务用户构成的集合中的元素数量,Rui是Web服务用户u调用Web服务i后观察到的QoS值,Ruj是Web服务用户u调用Web服务j后观察到的QoS值。
上述技术方案中,所述得到Web服务用户之间或Web服务之间的间接相似度的方法为:
所述无向加权Web服务用户相似度图为GU(U,E,SimDU),其中U表示所有Web服务用户,E表示无向加权Web服务用户相似度图中Web服务用户间的共同交互经历(两个用户调用过一些共同的服务,表示他们有共同交互经历,即无向加权Web服务相似度图中服务用户间的所有边),SimDU表示Web服务用户间的直接相似度,在基于所有路径的最小最大化相似性传播策略中,一条自Web服务用户u出发到Web服务用户v为终点的传播路径相似度计算如下:
Figure BDA0002509744750000074
其中Pk(u→v)是源自Web服务用户u到Web服务用户v的第k条传播路径,Str(Pk(u→v))是路径Pk(u→v)的相似度,E(u→v)是源自Web服务用户u到Web服务用户v路径上的所有边的集合,其中(a,b)是E(u→v)中的一条边,例如,假如u到v之间的有一条路径:u→a→b→v,则E(u→v)={(u,a),(a,b),(b,v)};
Web服务用户u和Web服务用户v之间的间接相似度通过聚合它们之间所有路径的相似性来得到:
Figure BDA0002509744750000081
其中,SimIU(u,v)表示Web服务用户u和Web服务用户v之间的间接相似度,P表示通过搜索用户相似度图GU找到的Web服务用户u和Web服务用户v之间所有传播路径构成的集合,SPaS方法与SPaA方法不同的地方在于,只搜索Web服务用户u和Web服务用户v之间的最短路径,然后将相似性最强的最短路径作为最终的Web服务用户之间的间接相似度,这里的最短路径需要至少一个中间传播节点;
所述无向加权Web服务相似度图为GS(S,E1,SimDS),其中S表示所有Web服务,E1表示无向加权Web服务相似度图中Web服务间的共同交互经历,即无向加权Web服务相似度图中服务间的所有边,SimDS表示服务间的直接相似度,在SPaA中,一条自服务i到服务j为终点的传播路径强度可以计算如下:
Figure BDA0002509744750000082
其中,Pk(i→j)是源自Web服务i到Web服务j的第k条传播路径,Str(Pk(i→j))是路径Pk(i→j)的相似度,E1(i→j)是源自Web服务i到Web服务j路径上的所有边的集合,其中,(c,d)是E1(i→j)中的一条边;
Web服务i和Web服务j之间的间接相似度可以通过聚合它们之间所有路径的相似性来得到:
Figure BDA0002509744750000083
其中,SimIS(i,j)表示Web服务i和Web服务j之间的间接相似度,P表示通过搜索服务相似度图GS找到Web服务i和Web服务j之间所有传播路径构成的集合。同理,SPaS方法与SPaA方法不同的地方在于,只搜索Web服务i和Web服务j之间的最短路径,然后将相似性最强的最短路径作为最终的Web服务之间的间接相似度。
上述技术方案中,Web服务用户之间的集成相似度的计算方法为:采用相似度权重α(0≤α≤1)来综合直接相似度和间接相似度,得到Web服务用户之间或Web服务之间的集成相似度,Web服务用户u和v之间的集成相似度定义为:
sim'(u,v)=αuvsimDU(u,v)+(1-αuv)simIU(u,v) (7)
其中,sim'(u,v)表示Web服务用户u和v之间的集成相似度,αuv表示Web服务用户u和v之间的相似度权重,simDU(u,v)表示Web服务用户u和v之间的直接相似度,simIU(u,v)表示Web服务用户u和v之间的间接相似度,Web服务用户u和v之间的相似度权重αuv计算如下:
Figure BDA0002509744750000091
其中,|Su∩Sv|是Web服务用户u和v都调用过的服务数量,|Su∪Sv|是Web服务用户u或v调用过的服务数量,式(8)表示当Web服务用户u和v调用过的公共服务集|Su∩Sv|中的元素较少时,相似度权重αuv会降低直接相似度在集成相似度中的贡献程度,同时提升间接相似度在集成相似度中的贡献程度,由于αuv取值范围为[0,1],simDU(u,v)和simIU(u,v)取值范围都为[0,1],因此sim'(u,v)取值范围为[-1,1];
同理,Web服务i和j之间的集成相似度计算如下:
sim'(i,j)=αijsimDS(i,j)+(1-αij)simIS(i,j) (9)
其中,sim'(i,j)表示Web服务i和j之间的集成相似度,αij表示Web服务i和j之间的相似度权重,simDS(i,j)表示Web服务i和j之间的直接相似度,simIS(i,j)表示Web服务i和j之间的间接相似度,Web服务i和j之间的相似度权重αij计算如下:
Figure BDA0002509744750000092
其中,|Ui∩Uj|是调用过Web服务i和j的用户数量,|Ui∪Uj|是调用过Web服务i或j的用户数量,sim'(i,j)的取值范围同样为[-1,1];
在集成相似度基础上,选取TopK个最相似的邻居用户或邻居服务用于预测,在基于相似用户的预测方法里,预测值计算如下:
Figure BDA0002509744750000101
其中,rui表示需要预测的Web服务用户u对Web服务i的QoS值,Sim'(u,v)是Web服务用户u和v的集成相似度,Web服务用户v是Web服务用户u的相似邻居,T(u)是用户u的TopK个最相似邻居构成的集合,Rvi是Web服务用户v观察到的Web服务i的QoS值,
Figure BDA0002509744750000102
表示Web服务用户u所调用过的所有Web服务的QoS数据的平均值,
Figure BDA0002509744750000103
表示Web服务用户v所调用过的所有Web服务的QoS数据的平均值;
或采用基于相似服务的预测方法计算如下:
Figure BDA0002509744750000104
其中,rui表示需要预测的Web服务用户u对Web服务i的QoS值,Sim'(i,j)是Web服务i和j的集成相似度,Web服务i是Web服务j的相似邻居,T(i)是Web服务i的TopK个最相似邻居构成的集合,Ruj是Web服务用户u观察到的服务j的QoS值,
Figure BDA0002509744750000105
Figure BDA0002509744750000106
分别表示Web服务i和Web服务j被所有Web服务用户调用的平均QoS值;
当为活动用户预测完所有目标服务的QoS以后,将QoS值最高的一个或多个Web服务推荐给活动用户。
一种基于相似性传播策略的Web服务推荐方法,它包括如下步骤:
步骤1:需要调用Web服务的软件通过网络调用远程服务器1上的Web服务,并将观察到的Web服务的QoS数据反馈给输入处理模块2;
步骤2:输入处理模块2去除Web服务QoS数据中的噪声数据和错误数据得到规范化的Web服务QoS数据;
步骤3:直接相似度计算模块4根据规范化的Web服务QoS数据计算Web服务用户之间或Web服务之间的直接相似度,并构建Web服务用户直接相似度矩阵和Web服务直接相似度矩阵;
步骤4:相似度图构建模块5以Web服务用户直接相似度矩阵和Web服务直接相似度矩阵为邻接矩阵,构造无向加权Web服务用户相似度图和无向加权Web服务相似度图;
表1给出一个简单的用户相似度矩阵例子,假设用户相似度矩阵定义为SU,则表1中的SU12=0.5表示u1和u2之间的直接相似度为0.5,SU23=0表示u2和u3没有过直接交互经历(即根据式(1)所示共同调用过的服务数小于2个),以表1为邻接矩阵,可以构建图2所示的无向加权用户相似度图。
u<sub>1</sub> u<sub>2</sub> u<sub>3</sub> u<sub>4</sub> u<sub>5</sub> u<sub>6</sub> u<sub>7</sub>
u<sub>1</sub> 0 0.5 0 0.1 0 0.6 0.3
u<sub>2</sub> 0.5 0 0 0.4 0 0 0
u<sub>3</sub> 0 0 0 0 0 0.2 0.6
u<sub>4</sub> 0.1 0.4 0 0 0.4 0 0
u<sub>5</sub> 0 0 0 0.4 0 0.2 0.5
u<sub>6</sub> 0.6 0 0.2 0 0.2 0 0
u<sub>7</sub> 0.3 0 0.6 0 0.5 0 0
表1用户相似度矩阵
图2中用户相似度图中的节点表示用户,边表示两个用户之间的直接交互经历,边上的权值表示该边连接的两个用户之间的直接相似度。对于两个非直接相连的用户,他们之间的间接相似度可以通过其他用户传播得到,比如u1和u5之间的间接相似度可以通过u1→u6→u5、u1→u7→u5、u1→u2→u4→u5、u1→u6→u3→u7→u5等传播路径得到,同理,也可以根据服务相似度矩阵构建无向加权服务相似度图;
步骤5:传播路径发现模块6采用基于Flyod图算法的相似度传播路径搜索无向加权Web服务用户相似度图和无向加权Web服务相似度图上的Web服务用户之间或Web服务之间的相似性传播路径;
基于Floyd的图算法来实现SPaS和SPaA两种相似性传播策略,表2给出了算法的实现细节:
Figure BDA0002509744750000121
在SPaA算法中的第9步,两个节点的距离不超过6是基于社会网络中的“六度分离原则”,避免传播路径过长的问题。在SPaS中的第1步,间接相似度矩阵SimI初始化的时候,赋值为只含一个中间传播节点的间接相似度,是因为最短传播路径需要至少一个中间传播节点。服务之间的间接相似度计算和以上算法相同,只需将输入参数“用户直接相似度矩阵”更改为“服务直接相似度矩阵”即可;
步骤6:相似度聚合模块7将每条相似性传播路径上的相似性进行聚合,得到每条传播路径上的相似度;
步骤7:间接相似度计算模块8对所有传播路径上的相似度进行集成,得到Web服务用户之间或Web服务之间的间接相似度;
步骤8:相似邻居发现模块9根据Web服务用户之间的直接相似度和间接相似度计算Web服务用户之间或Web服务之间的集成相似度,并根据Web服务用户之间或Web服务之间的集成相似度发现当前活动用户的一组相似Web服务用户,或者目标Web服务的一组相似Web服务;
步骤9:QoS值预测及服务推荐模块10将当前活动用户的相似Web服务用户或目标Web服务的相似Web服务的QoS数据,作为当前活动用户预测目标Web服务的QoS数据,并将前活动用户预测目标Web服务的QoS数据中QoS数值最高的一个或多个Web服务推荐给活动用户。
本发明采用Min-max策略来聚合传播路径上的相似度,并设计了基于Flyod的图算法实现了该相似性传播策略,算法简单有效,可以准确评估用户间或服务间在稀疏数据条件下的相似度。
本说明书未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (10)

1.一种基于相似性传播策略的Web服务推荐系统,其特征在于:它包括远程服务器(1)、输入处理模块(2)、直接相似度计算模块(4)、相似度图构建模块(5)、传播路径发现模块(6)、相似度聚合模块(7)、间接相似度计算模块(8)、相似邻居发现模块(9)、QoS值预测及服务推荐模块(10),其中,需要调用Web服务的软件通过网络调用远程服务器(1)上的Web服务,并将Web服务用户反馈的Web服务QoS数据反馈给输入处理模块(2);
输入处理模块(2)用于去除Web服务QoS数据中的噪声数据和错误数据得到规范化的Web服务QoS数据;
直接相似度计算模块(4)用于根据规范化的Web服务QoS数据计算Web服务用户之间或Web服务之间的直接相似度,并构建Web服务用户直接相似度矩阵和Web服务直接相似度矩阵;
相似度图构建模块(5)用于以Web服务用户直接相似度矩阵和Web服务直接相似度矩阵为邻接矩阵,构造无向加权Web服务用户相似度图和无向加权Web服务相似度图;
传播路径发现模块(6)用于搜索无向加权Web服务用户相似度图和无向加权Web服务相似度图上的Web服务用户之间或Web服务之间的相似性传播路径;
相似度聚合模块(7)用于将每条相似性传播路径上的相似性进行聚合,得到每条传播路径上的相似度;
间接相似度计算模块(8)用于对所有传播路径上的相似度进行集成,得到Web服务用户之间或Web服务之间的间接相似度;
相似邻居发现模块(9)用于根据Web服务用户之间的直接相似度和间接相似度计算Web服务用户之间或Web服务之间的集成相似度,并根据Web服务用户之间或Web服务之间的集成相似度发现当前活动用户的一组相似Web服务用户,或者目标Web服务的一组相似Web服务;
QoS值预测及服务推荐模块(10)用于将当前活动用户的相似Web服务用户或目标Web服务的相似Web服务的QoS数据,作为当前活动用户预测目标Web服务的QoS数据,并将当前活动用户预测目标Web服务的QoS数据中QoS数值最高的一个或多个Web服务推荐给活动用户。
2.根据权利要求1所述的基于相似性传播策略的Web服务推荐系统,其特征在于:它还包括QoS数据库(3),输入处理模块(2)还用于将规范化的Web服务QoS数据存储到QoS数据库(3)中。
3.根据权利要求1所述的基于相似性传播策略的Web服务推荐系统,其特征在于:所述直接相似度计算模块(4)用于根据规范化的Web服务QoS数据利用改进皮尔森相关系数法计算Web服务用户之间或Web服务之间的直接相似度。
4.根据权利要求1所述的基于相似性传播策略的Web服务推荐系统,其特征在于:传播路径发现模块(6)用于采用基于Flyod图算法的相似度传播路径搜索无向加权Web服务用户相似度图和无向加权Web服务相似度图上的不同Web服务用户之间或不同Web服务之间的相似性传播路径。
5.根据权利要求1所述的基于相似性传播策略的Web服务推荐系统,其特征在于:所述相似度聚合模块(7)用于采用Min-max策略将每条相似性传播路径上的相似性进行聚合,得到每条相似性传播路径上的相似度。
6.根据权利要求1所述的基于相似性传播策略的Web服务推荐系统,其特征在于:所述间接相似度计算模块(8)对所有传播路径上的相似度进行集成,并采用基于最短路径的最小最大化相似性传播策略和基于所有路径的最小最大化相似性传播策略,得到Web服务用户之间或Web服务之间的间接相似度。
7.根据权利要求3所述的基于相似性传播策略的Web服务推荐系统,其特征在于:采用改进皮尔森相关系数法计算Web服务用户之间或Web服务之间的直接相似度的方法为:
Web服务用户之间的直接相似度计算如下:
Figure FDA0002509744740000031
其中SimDU(u,v)表示Web服务用户u和Web服务用户v之间的直接相似度,Suv=Su∩Sv是Web服务用户u和Web服务用户v都调用过的Web服务组成的集合,Rui是Web服务用户u调用Web服务i后观察到的QoS值,Rvi是Web服务用户v调用Web服务i后观察到的QoS值,
Figure FDA0002509744740000032
Figure FDA0002509744740000033
分别表示Web服务用户u和Web服务用户v观察到的所有Web服务的平均QoS值,|Suv|是Web服务用户u和Web服务用户v都调用过的Web服务组成的集合中的元素数量,e为自然常数;
Web服务之间的直接相似度计算如下:
Figure FDA0002509744740000034
其中SimDS(i,j)表示Web服务i和Web服务j之间的直接相似度,Uij=Ui∩Uj是同时调用过Web服务i和Web服务j的所有Web服务用户构成的集合,
Figure FDA0002509744740000035
Figure FDA0002509744740000036
分别表示Web服务i和Web服务j被所有Web服务用户调用的平均QoS值,|Uij|是同时调用过Web服务i和Web服务j的所有Web服务用户构成的集合中的元素数量,Rui是Web服务用户u调用Web服务i后观察到的QoS值,Ruj是Web服务用户u调用Web服务j后观察到的QoS值。
8.根据权利要求6所述的基于相似性传播策略的Web服务推荐系统,其特征在于:所述得到Web服务用户之间或Web服务之间的间接相似度的方法为:
所述无向加权Web服务用户相似度图为GU(U,E,SimDU),其中U表示所有Web服务用户,E表示无向加权Web服务用户相似度图中Web服务用户间的共同交互经历,SimDU表示Web服务用户间的直接相似度,在基于所有路径的最小最大化相似性传播策略中,一条自Web服务用户u出发到Web服务用户v为终点的传播路径相似度计算如下:
Figure FDA0002509744740000041
其中Pk(u→v)是源自Web服务用户u到Web服务用户v的第k条传播路径,Str(Pk(u→v))是路径Pk(u→v)的相似度,E(u→v)是源自Web服务用户u到Web服务用户v路径上的所有边的集合,其中(a,b)是E(u→v)中的一条边;
Web服务用户u和Web服务用户v之间的间接相似度通过聚合它们之间所有路径的相似性来得到:
Figure FDA0002509744740000042
其中,SimIU(u,v)表示Web服务用户u和Web服务用户v之间的间接相似度,P表示通过搜索用户相似度图GU找到的Web服务用户u和Web服务用户v之间所有传播路径构成的集合,搜索Web服务用户u和Web服务用户v之间的最短路径,然后将相似性最强的最短路径作为最终的Web服务用户之间的间接相似度;
所述无向加权Web服务相似度图为GS(S,E1,SimDS),其中S表示所有Web服务,E1表示无向加权Web服务相似度图中Web服务间的共同交互经历,SimDS表示服务间的直接相似度,在SPaA中,一条自服务i到服务j为终点的传播路径强度可以计算如下:
Figure FDA0002509744740000043
其中,Pk(i→j)是源自Web服务i到Web服务j的第k条传播路径,Str(Pk(i→j))是路径Pk(i→j)的相似度,E1(i→j)是源自Web服务i到Web服务j路径上的所有边的集合,其中,(c,d)是E1(i→j)中的一条边;
Web服务i和Web服务j之间的间接相似度可以通过聚合它们之间所有路径的相似性来得到:
Figure FDA0002509744740000051
其中,SimIS(i,j)表示Web服务i和Web服务j之间的间接相似度,P表示通过搜索服务相似度图GS找到Web服务i和Web服务j之间所有传播路径构成的集合,搜索Web服务i和Web服务j之间的最短路径,然后将相似性最强的最短路径作为最终的Web服务用户之间的间接相似度。
9.根据权利要求1所述的基于相似性传播策略的Web服务推荐系统,其特征在于:Web服务用户之间的集成相似度的计算方法为:采用相似度权重α(0≤α≤1)来综合直接相似度和间接相似度,得到Web服务用户之间或Web服务之间的集成相似度,Web服务用户u和v之间的集成相似度定义为:
sim'(u,v)=αuvsimDU(u,v)+(1-αuv)simIU(u,v) (7)
其中,sim'(u,v)表示Web服务用户u和v之间的集成相似度,αuv表示Web服务用户u和v之间的相似度权重,simDU(u,v)表示Web服务用户u和v之间的直接相似度,simIU(u,v)表示Web服务用户u和v之间的间接相似度,Web服务用户u和v之间的相似度权重αuv计算如下:
Figure FDA0002509744740000052
其中,|Su∩Sv|是Web服务用户u和v都调用过的服务数量,|Su∪Sv|是Web服务用户u或v调用过的服务数量;
同理,Web服务i和j之间的集成相似度计算如下:
sim'(i,j)=αijsimDS(i,j)+(1-αij)simIS(i,j) (9)
其中,sim'(i,j)表示Web服务i和j之间的集成相似度,αij表示Web服务i和j之间的相似度权重,simDS(i,j)表示Web服务i和j之间的直接相似度,simIS(i,j)表示Web服务i和j之间的间接相似度,Web服务i和j之间的相似度权重αij计算如下:
Figure FDA0002509744740000053
其中,|Ui∩Uj|是调用过Web服务i和j的用户数量,|Ui∪Uj|是调用过Web服务i或j的用户数量;
在集成相似度基础上,选取TopK个最相似的邻居用户或邻居服务用于预测,在基于相似用户的预测方法里,预测值计算如下:
Figure FDA0002509744740000061
其中,rui表示需要预测的Web服务用户u对Web服务i的QoS值,Sim'(u,v)是Web服务用户u和v的集成相似度,Web服务用户v是Web服务用户u的相似邻居,T(u)是用户u的TopK个最相似邻居构成的集合,Rvi是Web服务用户v观察到的Web服务i的QoS值,
Figure FDA0002509744740000062
表示Web服务用户u所调用过的所有Web服务的QoS数据的平均值,
Figure FDA0002509744740000063
表示Web服务用户v所调用过的所有Web服务的QoS数据的平均值;
或采用基于相似服务的预测方法计算如下:
Figure FDA0002509744740000064
其中,rui表示需要预测的Web服务用户u对Web服务i的QoS值,Sim'(i,j)是Web服务i和j的集成相似度,Web服务i是Web服务j的相似邻居,T(i)是Web服务i的TopK个最相似邻居构成的集合,Ruj是Web服务用户u观察到的服务j的QoS值,
Figure FDA0002509744740000065
Figure FDA0002509744740000066
分别表示Web服务i和Web服务j被所有Web服务用户调用的平均QoS值;
当为活动用户预测完所有目标服务的QoS以后,将QoS值最高的一个或多个Web服务推荐给活动用户。
10.一种基于相似性传播策略的Web服务推荐方法,其特征在于,它包括如下步骤:
步骤1:需要调用Web服务的软件通过网络调用远程服务器(1)上的Web服务,并将Web服务用户反馈的Web服务QoS数据反馈给输入处理模块(2);
步骤2:输入处理模块(2)去除Web服务QoS数据中的噪声数据和错误数据得到规范化的Web服务QoS数据;
步骤3:直接相似度计算模块(4)根据规范化的Web服务QoS数据计算Web服务用户之间或Web服务之间的直接相似度,并构建Web服务用户直接相似度矩阵和Web服务直接相似度矩阵;
步骤4:相似度图构建模块(5)以Web服务用户直接相似度矩阵和Web服务直接相似度矩阵为邻接矩阵,构造无向加权Web服务用户相似度图和无向加权Web服务相似度图;
步骤5:传播路径发现模块(6)搜索无向加权Web服务用户相似度图和无向加权Web服务相似度图上的Web服务用户之间或Web服务之间的相似性传播路径;
步骤6:相似度聚合模块(7)将每条相似性传播路径上的相似性进行聚合,得到每条传播路径上的相似度;
步骤7:间接相似度计算模块(8)对所有传播路径上的相似度进行集成,得到Web服务用户之间或Web服务之间的间接相似度;
步骤8:相似邻居发现模块(9)根据Web服务用户之间的直接相似度和间接相似度计算Web服务用户之间或Web服务之间的集成相似度,并根据Web服务用户之间或Web服务之间的集成相似度发现当前活动用户的一组相似Web服务用户,或者目标Web服务的一组相似Web服务;
步骤9:QoS值预测及服务推荐模块(10)将当前活动用户的相似Web服务用户或目标Web服务的相似Web服务的QoS数据,作为当前活动用户预测目标Web服务的QoS数据,并将前活动用户预测目标Web服务的QoS数据中QoS数值最高的一个或多个Web服务推荐给活动用户。
CN202010457337.0A 2020-05-26 2020-05-26 基于相似性传播策略的Web服务推荐系统及方法 Active CN111708936B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010457337.0A CN111708936B (zh) 2020-05-26 2020-05-26 基于相似性传播策略的Web服务推荐系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010457337.0A CN111708936B (zh) 2020-05-26 2020-05-26 基于相似性传播策略的Web服务推荐系统及方法

Publications (2)

Publication Number Publication Date
CN111708936A true CN111708936A (zh) 2020-09-25
CN111708936B CN111708936B (zh) 2022-10-11

Family

ID=72537917

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010457337.0A Active CN111708936B (zh) 2020-05-26 2020-05-26 基于相似性传播策略的Web服务推荐系统及方法

Country Status (1)

Country Link
CN (1) CN111708936B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114500636A (zh) * 2022-01-19 2022-05-13 中国科学院软件研究所 一种基于图的科技资源服务发现方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106027317A (zh) * 2016-07-21 2016-10-12 中国人民解放军海军工程大学 信任感知的Web服务质量预测系统及方法
CN107133268A (zh) * 2017-04-01 2017-09-05 南京邮电大学 一种用于Web服务推荐的协同过滤算法
CN107590243A (zh) * 2017-09-14 2018-01-16 中国人民解放军信息工程大学 基于随机游走和多样性图排序的个性化服务推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106027317A (zh) * 2016-07-21 2016-10-12 中国人民解放军海军工程大学 信任感知的Web服务质量预测系统及方法
CN107133268A (zh) * 2017-04-01 2017-09-05 南京邮电大学 一种用于Web服务推荐的协同过滤算法
CN107590243A (zh) * 2017-09-14 2018-01-16 中国人民解放军信息工程大学 基于随机游走和多样性图排序的个性化服务推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
唐明董等: "基于因子分解机的质量感知Web服务推荐方法", 《计算机学报》 *
方晨等: "基于随机游走和多样性图排序的个性化服务推荐方法", 《电子学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114500636A (zh) * 2022-01-19 2022-05-13 中国科学院软件研究所 一种基于图的科技资源服务发现方法及装置

Also Published As

Publication number Publication date
CN111708936B (zh) 2022-10-11

Similar Documents

Publication Publication Date Title
US10257678B2 (en) Scalable data discovery in an internet of things (IoT) system
US8713151B2 (en) Configuration method and system of complex network and configuration and management module of server resources
US7627542B2 (en) Group identification in large-scaled networks via hierarchical clustering through refraction over edges of networks
CN105631707A (zh) 基于决策树的广告点击率预估方法与应用推荐方法及装置
Bobbio et al. Analysis of large scale interacting systems by mean field method
CN107590243A (zh) 基于随机游走和多样性图排序的个性化服务推荐方法
US20120317142A1 (en) Systmen and method for data management in large data networks
CN112764920A (zh) 一种边缘应用部署方法、装置、设备和存储介质
CN111708936B (zh) 基于相似性传播策略的Web服务推荐系统及方法
KR20180089479A (ko) 사용자 데이터 공유 방법 및 디바이스
CN114385376A (zh) 一种异构数据下边缘侧联邦学习的客户端选择方法
CN110929172A (zh) 信息选择方法、装置、电子设备及可读存储介质
CN103577899A (zh) 一种基于可靠性预测与QoS相结合的服务组合方法
CN114338675A (zh) 一种基于边缘计算的遥感卫星大数据处理方法及系统
He et al. A hierarchical matrix factorization approach for location-based web service QoS prediction
CN114065033A (zh) 用于推荐Web服务组合的图神经网络模型的训练方法
CN115174580B (zh) 一种基于大数据的数据处理方法及系统
Zhang et al. Quality of web service prediction by collective matrix factorization
KR101609457B1 (ko) 대용량 그래프 데이터베이스에서 하한 경계값에 기초하여 메디안 노드를 검색하는 방법
CN115146199A (zh) 一种基于网络偏置的Web服务质量预测方法
CN114003727A (zh) 一种知识图谱路径的检索方法及其系统
CN109978333B (zh) 众包系统中基于社区发现与链接预测的独立工人选择方法
CN114417433A (zh) 基于区块链安全认证的策略决策训练方法及云认证服务器
CN112084425A (zh) 一种基于节点连接和属性相似度的社团发现方法和系统
CN111639741A (zh) 一种用于多目标QoS优化的服务自动组合代理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant