CN103095849B - 基于QoS属性预测和纠错的有监督Web服务发现方法及系统 - Google Patents

基于QoS属性预测和纠错的有监督Web服务发现方法及系统 Download PDF

Info

Publication number
CN103095849B
CN103095849B CN201310048474.9A CN201310048474A CN103095849B CN 103095849 B CN103095849 B CN 103095849B CN 201310048474 A CN201310048474 A CN 201310048474A CN 103095849 B CN103095849 B CN 103095849B
Authority
CN
China
Prior art keywords
service
qos
web service
matrix
error correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310048474.9A
Other languages
English (en)
Other versions
CN103095849A (zh
Inventor
陈蕾
杨庚
陈正宇
王传栋
朱薇
莫燕章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201310048474.9A priority Critical patent/CN103095849B/zh
Publication of CN103095849A publication Critical patent/CN103095849A/zh
Application granted granted Critical
Publication of CN103095849B publication Critical patent/CN103095849B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种基于QoS属性预测和纠错的有监督Web服务发现方法及系统,主要用于解决开放网络环境下准确、高效地发现满足用户需求的可信Web服务,从而为高可信服务应用系统的构建提供重要的技术支撑。本发明一方面采用矩阵补全技术对缺失或失真的服务QoS属性进行预测或纠错,使得基于QoS属性的可信服务发现得以有效地实施;另一方面将服务的先验类别信息引入服务表示的特征提取阶段,增强了服务表示的区分性和查询匹配的准确性。真实Web服务数据集上的评测结果表明,本发明不仅具有较高的服务发现效率和精度,而且实现简单,系统灵活,代价低,易推广。

Description

基于QoS属性预测和纠错的有监督Web服务发现方法及系统
技术领域
本发明属于Web服务领域,主要实现一种基于QoS属性预测和纠错的有监督Web服务发现方法以及由此方法架构出的系统。
背景技术
随着互联网技术的应用日益广泛和逐渐深入,人们已不再满足于仅仅简单使用网络资源,如浏览网页、收发邮件等,而是一方面希望能够简捷、快速的将自己开发的软件资源发布在互联网上供他人复用,另一方面也希望能方便地复用现有的软件资源以满足自己个性化的需求。软件服务化是实现这种软件资源复用的有效途径,而面向服务的体系架构(Service Oriented Architecture,SOA)为软件服务化提供了理论支持,很大程度上推动了软件资源的复用、集成、以及网络资源的多样化。Web服务作为SOA架构的一种具体实现方式,具有良好的封装性和广泛的适用性,已经成为企业信息规划、动态电子商务和应用集成的重要支撑技术。近年来,互联网上出现了大量的Web服务,这些服务正在构成云计算平台的基础。但是,由于网络环境的开放、服务资源的快速演变以及用户需求的变更和使用模式的偏好等,导致服务具有很大的不确定性和不可控性,这些不确定性和不可控性的程度往往通过服务质量(Quality of Service,QoS)属性来表征。常用的QoS属性包括响应时间、用户满意度、服务价格、可用性、可扩展性、并发处理能力、准确性、安全性、可靠性、吞吐量等等。
由于Web服务由分布于网络上的众多组织和个人独立开发,其数量众多且增长迅速,因此存在很多提供相似或相同功能的服务。当服务使用者进行服务选择时,不仅应考虑服务所能满足的功能性需求,而且应考虑服务所能满足的非功能性需求,即服务QoS属性。近年来,有很多关于QoS感知的Web服务发现方法的研究,但是这些研究基于一个共同的假设前提,那就是假定用户拥有候选服务的全部QoS信息。但是,在真实的服务消费环境中这种假设并不成立。这是因为用户获取服务QoS信息的一个重要途径是基于历史调用信息,但由于网络上存在海量的服务资源,如果服务使用者试图通过穷尽调用所有的候选服务获取服务QoS信息,不仅需要耗费大量的时间,而且要占用大量的网络资源。因此,在实际的应用场景中,服务用户所能获取的QoS信息往往是不全面的,QoS属性的缺失或者失真严重影响了基于QoS的Web服务发现的准确性和可信性。由此可见,提供精确的QoS属性预测是准确发现和选取可信Web服务的重要前提和保障。
现有的服务QoS属性预测方法主要有两类:一类是基于协同过滤的QoS属性预测方法,该方法以收集到的用户-服务QoS采样矩阵为基础,通过采用Pearson相关系数分别计算用户之间和Web服务之间的相似程度对目标用户进行个性化的QoS属性预测。然而,Pearson相关系数一般用于度量数据之间的线性相关关系,并不能很好地解释客观QoS数据之间的相似性;另一类是基于矩阵分解的QoS属性预测方法,该方法同样以收集到的QoS采样信息为基础,通过采用矩阵分解技术将QoS采样矩阵分解为服务特征向量和用户特征向量。然而,由于QoS数据的稀疏性,从服务特征向量和用户特征向量中获得的信息还不足以提供精确的QoS属性预测。更为重要的是,现有的服务QoS属性预测方法都假设已知的QoS采样信息是真实可信的。但实际上采样到的QoS信息不可避免地会受到少量的结构化噪声污染。例如:少数服务调用者为了自身的利益恶意反馈一些失真的QoS采样信息,在QoS采样矩阵中体现为该服务调用者对应的行存在结构化噪声。因此,在进行QoS属性预测时,研究如何减少由结构化噪声污染带来的负面影响是非常有必要的。
另一方面,虽然已有一些聚类优化的服务发现方法被提出来,但这些方法的共同点是仅仅利用分类信息来缩小服务查询的搜索空间,从而提高服务发现的速度。这些服务发现方法鲜有利用服务的先验类别信息来改进服务表示的区分性,它们均无一例外地采用了无监督的服务表示机制,即tf·idf(termfrequency-inverse document frequency)术语加权机制。该机制并没有利用已有的服务类别标记信息,即使所抽取的特征向量能够很好地表达服务的语义信息,但由于缺乏类判别信息,也将导致所抽取的高维特征向量在特征空间中趋同而变得不可分,这显然是不利于服务发现和查找的。
因此,针对上述两点不足,本发明一方面引入机器学习领域流行的矩阵补全技术,针对服务QoS采样矩阵中存在的行结构化噪声问题,提出了一种l2,1范数正则化约束的矩阵补全算法来对缺失的QoS信息进行预测,同时对失真的QoS信息进行纠错;另一方面结合有监督的服务特征提取方法,将服务的先验类别信息引入服务表示中,实现了一个QoS感知的有监督Web服务发现原型系统。真实Web服务数据集上的评测结果验证了本发明的有效性。
发明内容
本发明所要解决的技术问题是提供一种基于QoS属性预测和纠错的有监督Web服务发现方法,用于解决开放网络环境下准确、高效地发现满足用户需求的可信Web服务,从而为高可信服务应用系统的构建提供重要的技术支撑。
本发明的提出基于如下两个基本事实:(1)用户-服务QoS矩阵满足近似低秩特性,即该矩阵的奇异值呈幂式衰减。由于QoS属性具有较高的空间相关性,相邻地区的用户或相邻地区部署的服务共同使用相同或者类似的IT基础设施(网络带宽和网络拓扑结构等),使得用户-服务QoS矩阵通常表现出良好的近似低秩特性。(2)矩阵补全理论表明,虽然一般情况下从矩阵的采样元素预测未知元素是不可能的,但如果矩阵具有低秩或近似低秩特性,采用矩阵补全技术对采样矩阵的缺失元素进行预测和对含噪元素进行纠错在理论上是可行的。
本发明为解决所述的技术问题采用如下技术方案:
一种基于QoS属性预测和纠错的有监督Web服务发现方法,该方法适用于用户-服务QoS矩阵满足近似低秩特性的情况下,具体步骤包括:
步骤(1)QoS数据收集中心按QoS属性类别收集服务调用者反馈的QoS历史数据,对其进行预处理后产生用户-服务QoS采样矩阵;
步骤(2)采用矩阵补全技术对用户-服务QoS采样矩阵中缺失的QoS属性值进行预测,同时对失真的QoS属性值进行纠错,生成QoS完全矩阵;
步骤(3)服务提供者发布所开发Web服务的WSDL文档至服务注册中心,服务注册中心对所收集的WSDL文档进行分类;
步骤(4)对服务注册中心的分类WSDL文档进行有监督特征提取,生成低维紧致的Web服务语义特征表示向量;
步骤(5)服务查询者构造Web服务查询请求描述文档提交给服务发现中介;
步骤(6)服务发现中介根据Web服务查询请求描述文档计算每一个候选服务与用户总需求的匹配度并按匹配度大小排序;
步骤(7)服务发现中介将符合查询请求的前n个查询结果包装成HTML页面格式,通过查询结果展示模块反馈给服务查询者,n为自然数;
步骤(8)服务查询者根据查询结果选择并调用相应的Web服务,同时将获得的QoS信息反馈给QoS数据收集中心。
进一步的,前述的基于QoS属性预测和纠错的有监督Web服务发现方法,步骤(2)所述的采用矩阵补全技术对缺失的QoS属性值进行预测,同时对失真的QoS属性值进行纠错,生成QoS完全矩阵,包括以下步骤:
(2-1)根据矩阵补全理论将QoS属性预测和纠错问题建模为:
min X , Z | | X | | * + α | | Z | | 2,1 , s.t.PΩ(Q(k))=PΩ(X+Z)    (1)
其中,Q(k)为步骤(1)产生的第k类用户-服务QoS采样矩阵,k∈N表示用户-服务QoS采样矩阵的类别区分,Z为采样噪声矩阵,X为待预测和纠错的QoS完全矩阵,||X||*为矩阵X的核范数,||Z||2,1为矩阵Z的l2,1范数,α为正则化因子,Ω是由所有采样元素的下标组成的集合,PΩ(·)为投影算子,定义为:
[ P Ω ( M ) ] ij = M ij if ( i , j ) ∈ Ω , 0 otherwise .
其中M为任意矩阵,i为矩阵M的行数,j为矩阵M的列数。
(2-2)对公式(1)采用l2,1范数正则化约束的结构化噪声矩阵补全算法进行求解,求解后得到QoS完全矩阵。
进一步的,在步骤(2-2)中求解QoS完全矩阵的算法,具体描述如下:
在步骤(2-2)中,将采样矩阵Q、投影算子PΩ、正则化因子α、参数ξ作为所述l2,1范数正则化约束的结构化噪声矩阵补全算法的输入,将QoS完全矩阵X,噪声矩阵Z作为所述l2,1范数正则化约束的结构化噪声矩阵补全算法的输出,其中,参数ξ为1×10-6;具体计算过程如下:
步骤(a):将公式(1)松弛为QoS属性预测和纠错问题的一个近似问题:
min X , Z τ ( | | X | | * + α | | Z | | 2,1 ) + 1 2 | | X | | F , s.t.PΩ(Q)=PΩ(X+Z)    (2)
其中τ为一个常数因子,取值为m,n为矩阵Q的阶;
步骤(b):将式(2)转换为拉格朗日乘子式:
L ( X , Y , Z ) = &tau; ( | | X | | * + &alpha; | | Z | | 2,1 ) + 1 2 | | X | | F + < Y , P &Omega; ( Q - X - Z ) > - - - ( 3 )
其中Y为拉格朗日参数矩阵
步骤(c):通过迭代求解的方法求解公式(3)。
进一步的,前述的基于QoS属性预测和纠错的有监督Web服务发现方法,步骤(4)所述的对服务注册中心的分类WSDL文档进行有监督特征提取,生成低维紧致的Web服务语义特征表示向量,包括以下步骤:
(4-1)使用开源软件WSDL4J对服务注册中心的WSDL文档进行服务解析;
(4-2)对解析后的WSDL文档进行分词、缩写词补全、拼写错误纠正、停用词过滤和词干抽取,生成Web服务特征词项空间;
(4-3)基于步骤(4-2)生成的Web服务特征词项空间,引入先验类别信息,利用有监督的词频tf-逆文档频率idf-逆类别频率icf术语加权机制生成Web服务特征表示向量;
(4-4)基于隐含语义索引技术对步骤(4-3)生成的Web服务特征表示向量进行词义消岐和概念语义空间降维,生成低维紧致的Web服务语义特征表示向量;
(4-5)对步骤(4-4)生成的Web服务语义特征表示向量进行规一化处理,将每个向量的长度均设定为1。
进一步的,前述的基于QoS属性预测和纠错的有监督Web服务发现方法,步骤(5)所述的服务查询者构造Web服务查询请求描述文档提交给服务发现中介,该文档内容包括服务查询者对服务的功能性需求和非功能性需求描述、功能性需求匹配度计算权重λ(0≤λ≤1),QoS属性效用评价权重向量w=[w(1),…,w(k),…,w(l)],其中w(k)表示第k类QoS属性在效用评价中的权重,且满足 &Sigma; k = 1 l w ( k ) = 1 .
进一步的,前述的基于QoS属性预测和纠错的有监督Web服务发现方法,步骤(6)所述的服务发现中介根据Web服务查询请求描述文档计算每一个候选服务与用户总需求的匹配度并按照匹配度大小进行排序,步骤(6)具体包括如下步骤:
(6-1)服务发现中介对Web服务查询请求描述文档中的功能性需求描述采用词频tf-逆文档频率idf术语加权机制进行特征提取,生成查询请求特征表示向量;(6-2)采用公式: Similarity j = cos ( q , d j ) = < q , d j > / ( &Sigma; k = 1 m q k 2 &CenterDot; &Sigma; k = 1 m d kj 2 ) 计算查询请求特征表示向量与Web服务语义特征表示向量的功能性需求匹配度,其中q表示查询请求特征表示向量,dj表示Web服务语义特征表示向量,qk表示向量q的第k个分量,dkj表示向量dj的第k个分量,m表示向量的维数;
(6-3)调用步骤(2)生成的QoS完全矩阵Q(k),根据服务查询者提供的非功能性需求描述,如果第j个服务的第k类QoS属性满足用户需求,则相应的QoS效用值等于1,否则等于0;
(6-4)根据服务查询者提供的QoS属性效用评价权重向量w计算第j个服务满足查询者非功能性需求的QoS总效用值:w(k)表示QoS属性效用评价权重向量w的第k个分量,即第k类QoS属性效用评价权重,表示第j个服务的第k类QoS属性效用值;
(6-5)根据服务查询者提供的功能性需求匹配度计算权重λ计算第j个服务与用户总需求的匹配度:Matchj=λ·Similarityj+(1-λ)·Utilityj
(6-6)按照匹配度大小对候选Web服务进行排序。
本发明还公开了一种基于QoS属性预测和纠错的有监督Web服务发现方法架架构出的系统,该系统由服务请求子系统、服务提供子系统和服务发现子系统组成,
服务请求子系统包括第一服务调用单元、第一Web服务调用支撑模块、QoS监控模块和查询结果展示模块,其中,第一服务调用单元用于为服务查询者提供服务调用机制,第一Web服务调用支撑模块用于为服务查询者提供服务查询交互,QoS监控模块用于实现QoS在线监控功能,查询结果展示模块用于显示服务发现子系统反馈的查询结果;
服务提供子系统包括第二服务调用单元和第二Web服务调用支撑模块,其中,第二服务调用单元用于为服务提供者提供服务调用机制,第二Web服务调用支撑模块用于为服务提供者提供服务注册;
服务发现子系统包括QoS数据收集中心、服务注册中心和基于QoS属性预测和纠错的有监督Web服务发现中介;其中,
在所述的服务发现子系统中,QoS数据收集中心主要涉及以下处理流程:
(101)服务调用者将调用服务所获得的QoS历史数据反馈至QoS数据收集中心;
(102)服务调用者反馈某个服务的QoS属性值时,如果QoS数据收集中心已经存在该QoS数据,则将原来的QoS数据进行替换;
(103)如果服务调用者反馈的QoS属性值是非数值化的数据,则将其进行分级量化处理;
(104)将收集到的QoS数据按属性类别分别构建用户-服务QoS采样矩阵;
在所述的服务发现子系统中,服务注册中心主要涉及以下处理流程:
(201)服务提供者发布所开发的Web服务至服务注册中心;
(202)如果服务提供者选择人工参与的自助分类机制,则在发布服务时按类别自助注册;
(203)如果服务提供者选择自适应分类/聚类机制,则由服务注册中心对注册的服务进行自适应分类;
在所述的服务发现子系统中,基于QoS属性预测和纠错的有监督Web服务发现中介由Web服务功能性需求评价模块、Web服务非功能性需求评价模块和Web服务排序模块组成,其中:
Web服务功能性需求评价模块完成服务的有监督特征提取和服务功能性需求匹配度计算,输出候选服务与用户需求的功能性需求匹配度;
Web服务非功能性需求评价模块完成服务QoS属性预测和纠错以及非功能性QoS需求效用值计算,输出候选服务满足用户非功能性需求的QoS总效用值;
Web服务排序模块调用Web服务功能性需求评价模块、Web服务非功能性需求评价模块输出的功能性需求匹配度和非功能性需求QoS总效用值,计算出候选服务与用户总需求的匹配度并根据匹配度大小按降序排序,然后返回前n个查询结果给服务查询者,n为自然数。
本发明主要用于解决开放网络环境下准确、高效地发现满足用户需求的可信Web服务,其意义在于为云计算平台上高可信服务应用系统的构建提供重要技术支撑。与现有技术相比,其显著优点为:
(1)代价低、易推广。本发明针对普遍采用的基于WSDL语言描述的Web服务,无需引进新的语言和本体来描述Web服务,而是尽可能地利用WSDL文档描述信息,可节约企业为支持新的Web资源所需要的投资。
(2)系统简单、灵活。本发明一方面由于其基于统一的开发标准而便于维护和使用,从而使得创建跨越多个应用程序的业务流程处理变得相对简单。另一方面,可以根据目标用户的查询需求调整本发明中所涉及的各种参数,使得系统更加灵活。
(3)发现结果可信。本发明通过引入机器学习领域流行的矩阵补全技术,对不完全和失真的服务QoS属性进行预测和纠错,使得基于QoS属性的可信服务发现得以有效地实施;
(4)查询精度高。本发明采用有监督的术语加权机制在服务特征提取阶段引入先验类别信息,增强了服务表示的区分性和查询匹配的准确性,真实Web服务数据集上的评测结果表明,本发明不仅改善了服务发现结果的可信度,也提高了服务查询的查准率和查全率,改进了服务发现的效率。
附图说明
图1是Web服务发现原型系统总体架构图;
图2是服务发现子系统模块结构图。
具体实施方式
本发明针对现有的Web服务发现机制中存在的服务查询精度不高和查询结果可信度低的两个主要问题,一方面通过引入机器学习领域流行的矩阵补全技术,对缺失和失真的服务QoS属性进行预测和纠错,使得基于QoS属性的可信服务发现得以有效地实施;另一方面通过引入服务的先验类别信息对服务进行有监督特征提取,增强了服务表示的区分性,提高了服务发现的效率和精度。并且在此基础上实现了一个原型系统,用以验证本发明的合理性。
如图1所示,该原型系统由服务请求子系统、服务提供子系统和服务发现子系统三部分组成。其中,服务请求子系统又包括Web服务请求编辑工具、预处理模块、Web服务调用支撑模块、QoS监控模块和查询结果展示模块;服务提供子系统包括Web服务开发编辑工具、预处理模块和Web服务调用支撑模块;服务发现子系统是该系统的核心构件,包括服QoS数据收集中心、服务注册中心(提供预分类机制)和基于QoS属性预测和纠错的有监督Web服务发现中介。
Web服务请求编辑工具、预处理模块构成本领域常见的服务调用模块,起到服务调用机制的作用。
如图2所示,服务发现子系统是本发明的核心构件,主要包括服QoS数据收集中心、服务注册中心(提供预分类机制)和基于QoS属性预测和纠错的有监督Web服务发现中介三个功能模块。
1、QoS数据收集中心
QoS数据收集中心收集服务调用者反馈的QoS历史数据,对其进行预处理后产生用户-服务QoS采样矩阵。
QoS数据收集中心主要涉及以下处理流程:
(1)基于Web2.0思想鼓励服务调用者将调用服务所获得的QoS历史数据反馈至QoS数据收集中心;
(2)服务调用者反馈某个服务的QoS属性值时,如果QoS数据收集中心已经存在该QoS数据,则将原来的QoS数据进行替换;
(3)如果服务调用者反馈的QoS属性值是非数值化的数据,则将其进行分级量化处理;
(4)将收集到的QoS数据按属性类别(如响应时间、吞吐量等)分别构建用户-服务QoS采样矩阵;
2、服务注册中心(提供预分类机制)
服务注册中心提供两种预分类机制供服务提供者选择,一种是人工参与的自助分类机制,另一种是机器学习中流行的自适应分类/聚类机制。
服务注册中心主要涉及以下处理流程:
(1)服务提供者发布所开发的Web服务至服务注册中心;
(2)如果服务提供者选择人工参与的自助分类机制,则在发布服务时按类别自助注册;
(3)如果服务提供者选择自适应分类/聚类机制,则由服务注册中心对注册的服务进行自适应分类;
3、基于QoS属性预测和纠错的有监督Web服务发现中介
基于QoS属性预测和纠错的有监督Web服务发现中介由Web服务功能性需求评价模块、Web服务非功能性需求评价模块和Web服务排序模块组成。其中Web服务功能性需求评价模块主要完成服务的有监督特征提取和服务功能性需求匹配度计算,输出候选服务与用户需求的功能性需求匹配度;Web服务非功能性需求评价模块主要完成服务QoS属性预测和纠错以及非功能性QoS需求效用值计算,输出候选服务满足用户非功能性需求的QoS总效用值;Web服务排序模块调用前两个模块输出的功能性需求匹配度和非功能性需求QoS总效用值,计算出候选服务与用户总需求的匹配度并根据匹配度大小按降序排序,然后返回top-n个查询结果给服务查询者。
其中,l2,1范数正则化约束的结构化噪声矩阵补全算法是基于QoS属性预测和纠错的有监督Web服务发现中介模块的核心算法,描述如下:
算法1.l2,1范数正则化约束的结构化噪声矩阵补全算法
输入:采样矩阵Q,投影算子PΩ,正则化因子α,参数ξ(一般为1×10-6
输出:QoS完全矩阵X,噪声矩阵Z
1:将公式(a)松弛为QoS属性预测和纠错问题的一个近似问题:
min X , Z &tau; ( | | X | | * + &alpha; | | Z | | 2,1 ) + 1 2 | | X | | F , s.t.PΩ(Q)=PΩ(X+Z)(b)
其中τ为一个常数因子,通常取值为m,n为矩阵Q的阶;
2:将式(b)转换为拉格朗日乘子式:
L ( X , Y , Z ) = &tau; ( | | X | | * + &alpha; | | Z | | 2,1 ) + 1 2 | | X | | F + < Y , P &Omega; ( Q - X - Z ) > - - - ( 3 )
3:初始化k=1,c,Y0,Z0,μ0
4:while not converged do//迭代求解公式(c)
5:(U,∑,V)=svd(PΩ(Yk-1));
6:Xk=USτ(∑)VT,其中,Sτ(x)=sgn(x)max(x-τ,0),x为∑中的任意元素;
7:Yk=Yk-1k-1PΩ(Q-Xk-1-Zk-1)
8:初始化t=1,D0∈□m×n为单位矩阵
9:while not converged do
10: Z k t = 1 2 &alpha;&tau; ( D t - 1 ) - 1 P &Omega; ( Y k - 1 ) ;
11:计算对角矩阵 D t = diag ( d ii t ) , 其中 d ii t = 1 2 | | ( Z k t ) ( i ) | | 2 + &xi; , 为矩阵的第
i行;
12:t=t+1;
13:end while
14:μk+1=cμk,
15:k=k+1;
16:end while
本发明中所述的QoS数据收集中心按QoS属性类别收集服务调用者反馈的QoS历史数据,对其进行预处理后产生用户-服务QoS采样矩阵,可采取现有技术中常见的方法,包括以下步骤:
1.基于Web2.0思想鼓励服务调用者按QoS属性类别将调用服务所获得的QoS历史数据反馈至QoS数据收集中心;
2.服务调用者反馈某个服务的QoS属性值时,如果QoS数据收集中心已经存在该QoS数据,则将原来的QoS数据进行替换;
3.如果服务调用者反馈的QoS属性值是非数值化的数据,则将其进行分级量化处理,如服务的用户满意度可以按照5级表示,其中1级表示非常满意,2级表示满意,3级表示基本满意,4级表示不满意,5级表示非常不满意;
4.将收集到的QoS数据按属性类别(如响应时间、吞吐量等)分别构建用户-服务QoS采样矩阵,不妨记其为Q(k)矩阵,其中元素表示第i个用户调用第j个服务所反馈的第k类QoS属性值,如果该属性值不存在,则记其为NULL;
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明构思的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围内。

Claims (6)

1.一种基于QoS属性预测和纠错的有监督Web服务发现方法,其特征在于:该方法适用于用户-服务QoS矩阵满足近似低秩特性的情况下,具体步骤包括:
步骤(1)、QoS数据收集中心按QoS属性类别收集服务调用者反馈的QoS历史数据,对其进行预处理后产生用户-服务QoS采样矩阵;
步骤(2)、采用矩阵补全技术对用户-服务QoS采样矩阵中缺失的QoS属性值进行预测,同时对失真的QoS属性值进行纠错,生成QoS完全矩阵;具体包括如下步骤:
(2-1)根据矩阵补全理论将QoS属性预测和纠错问题建模为:
min X , Z | | X | | * + &alpha; | | Z | | 2,1 , s . t , P &Omega; ( Q ( k ) ) = P &Omega; ( X + Z ) - - - ( 1 )
其中,Q(k)为步骤(1)产生的第k类用户-服务QoS采样矩阵,k∈N表示用户-服务QoS采样矩阵的类别区分,Z为采样噪声矩阵,X为待预测和纠错的QoS完全矩阵,||X||*为矩阵X的核范数,||Z||2,1为矩阵Z的l2,1范数,α为正则化因子,Ω是由所有采样元素的下标组成的集合,ΡΩ(·)为投影算子,定义为:
[ P &Omega; ( M ) ] ij = M ij if ( i , j ) &Element; &Omega; , 0 otherwise .
其中M为任意矩阵,i为矩阵M的行数,j为矩阵M的列数;
(2-2)对公式(1)采用l2,1范数正则化约束的结构化噪声矩阵补全算法进行求解,求解后得到QoS完全矩阵;
步骤(3)、服务提供者发布所开发Web服务的WSDL文档至服务注册中心,服务注册中心对所收集的WSDL文档进行分类;
步骤(4)、对服务注册中心的分类WSDL文档进行有监督特征提取,生成低维紧致的Web服务语义特征表示向量;
步骤(5)、服务查询者构造Web服务查询请求描述文档提交给服务发现中介;
步骤(6)、服务发现中介根据Web服务查询请求描述文档计算每一个候选服务与用户总需求的匹配度并按匹配度大小排序;
步骤(7)、服务发现中介将符合查询请求的前n个查询结果包装成HTML页面格式,通过查询结果展示模块反馈给服务查询者,n为自然数;
步骤(8)、服务查询者根据查询结果选择并调用相应的Web服务,同时将获得的QoS信息反馈给QoS数据收集中心。
2.如权利要求1所述的一种基于QoS属性预测和纠错的有监督Web服务发现方法,其特征在于:在步骤(2-2)中,将采样矩阵Q、投影算子ΡΩ、正则化因子α、参数ξ作为所述l2,1范数正则化约束的结构化噪声矩阵补全算法的输入,将QoS完全矩阵X,噪声矩阵Z作为所述l2,1范数正则化约束的结构化噪声矩阵补全算法的输出,其中,参数ξ为1×10-6;具体计算过程如下:
步骤(a):将公式(1)松弛为QoS属性预测和纠错问题的一个近似问题:
min X , Z &tau; ( | | X | | * + &alpha; | | Z | | 2,1 ) + 1 2 | | X | | F , s . t , P &Omega; ( Q ) = P &Omega; ( X + Z ) - - - ( 2 )
其中τ为一个常数因子,取值为m,n为矩阵Q的阶;
步骤(b):将式(2)转换为拉格朗日乘子式:
L ( X , Y , Z ) = &tau; ( | | X | | * + &alpha; | | Z | | 2,1 ) + 1 2 | | X | | F + &lang; Y , P &Omega; ( Q - X - Z ) &rang; - - - ( 3 )
其中Y为拉格朗日参数矩阵;
步骤(c):通过迭代求解的方法求解公式(3)。
3.如权利要求1所述的一种基于QoS属性预测和纠错的有监督Web服务发现方法,其特征在于:步骤(4)具体包括如下步骤:
(4-1)使用开源软件WSDL4J对服务注册中心的WSDL文档进行服务解析;
(4-2)对解析后的WSDL文档进行分词、缩写词补全、拼写错误纠正、停用词过滤和词干抽取,生成Web服务特征词项空间;
(4-3)基于步骤(4-2)生成的Web服务特征词项空间,引入先验类别信息,利用有监督的词频tf-逆文档频率idf-逆类别频率icf术语加权机制生成Web服务特征表示向量;
(4-4)基于隐含语义索引技术对步骤(4-3)生成的Web服务特征表示向量进行词义消岐和概念语义空间降维,生成低维紧致的Web服务语义特征表示向量;
(4-5)对步骤(4-4)生成的Web服务语义特征表示向量进行规一化处理,将每个向量的长度均设定为1。
4.如权利要求1所述的一种基于QoS属性预测和纠错的有监督Web服务发现方法,其特征在于:步骤(5)所述Web服务查询请求描述文档的内容包括服务查询者对服务的功能性需求和非功能性需求描述、功能性需求匹配度计算权重λ,0≤λ≤1;QoS属性效用评价权重向量w=[w(1),…,w(k),…,w(l)],其中w(k)表示第k类QoS属性在效用评价中的权重,且满足
5.如权利要求1所述的一种基于QoS属性预测和纠错的有监督Web服务发现方法,其特征在于:步骤(6)具体包括如下步骤:
(6-1)服务发现中介对Web服务查询请求描述文档中的功能性需求描述采用词频tf-逆文档频率idf术语加权机制进行特征提取,生成查询请求特征表示向量;
(6-2)采用公式: Similarity j = cos ( q , d j ) = &lang; q , d j &rang; / ( &Sigma; k = 1 m q k 2 &CenterDot; &Sigma; k = 1 m d kj 2 ) 计算查询请求特征表示向量与Web服务语义特征表示向量的功能性需求匹配度,其中q表示查询请求特征表示向量,dj表示Web服务语义特征表示向量,qk表示向量q的第k个分量,dkj表示向量dj的第k个分量,m表示向量的维数;
(6-3)调用步骤(2)生成的QoS完全矩阵Q(k),根据服务查询者提供的非功能性需求描述,如果第j个服务的第k类QoS属性满足用户需求,则相应的QoS效用值等于1,否则等于0;
(6-4)根据服务查询者提供的QoS属性效用评价权重向量w计算第j个服务满足查询者非功能性需求的QoS总效用值:w(k)表示QoS属性效用评价权重向量w的第k个分量,即第k类QoS属性效用评价权重,表示第j个服务的第k类QoS属性效用值;
(6-5)根据服务查询者提供的功能性需求匹配度计算权重λ计算第j个服务与用户总需求的匹配度:Matchj=λ·Similarityj+(1-λ)·Utilityj
(6-6)按照匹配度大小对候选Web服务进行排序。
6.一种采用如权利要求1所述的基于QoS属性预测和纠错的有监督Web服务发现方法架构出的系统,其特征在于:该系统由服务请求子系统、服务提供子系统和服务发现子系统组成,
服务请求子系统包括第一服务调用单元、第一Web服务调用支撑模块、QoS监控模块和查询结果展示模块,其中,第一服务调用单元用于为服务查询者提供服务调用机制,第一Web服务调用支撑模块用于为服务查询者提供服务查询交互,QoS监控模块用于实现QoS在线监控功能,查询结果展示模块用于显示服务发现子系统反馈的查询结果;
服务提供子系统包括第二服务调用单元和第二Web服务调用支撑模块,其中,第二服务调用单元用于为服务提供者提供服务调用机制,第二Web服务调用支撑模块用于为服务提供者提供服务注册;
服务发现子系统包括QoS数据收集中心、服务注册中心和基于QoS属性预测和纠错的有监督Web服务发现中介;其中,
在所述的服务发现子系统中,QoS数据收集中心涉及以下处理流程:
(101)服务调用者将调用服务所获得的QoS历史数据反馈至QoS数据收集中心;
(102)服务调用者反馈某个服务的QoS属性值时,如果QoS数据收集中心已经存在该QoS数据,则将原来的QoS数据进行替换;
(103)如果服务调用者反馈的QoS属性值是非数值化的数据,则将其进行分级量化处理;
(104)将收集到的QoS数据按属性类别分别构建用户-服务QoS采样矩阵;在所述的服务发现子系统中,服务注册中心涉及以下处理流程:
(201)服务提供者发布所开发的Web服务至服务注册中心;
(202)如果服务提供者选择人工参与的自助分类机制,则在发布服务时按类别自助注册;
(203)如果服务提供者选择自适应分类/聚类机制,则由服务注册中心对注册的服务进行自适应分类;
在所述的服务发现子系统中,基于QoS属性预测和纠错的有监督Web服务发现中介由Web服务功能性需求评价模块、Web服务非功能性需求评价模块和Web服务排序模块组成,其中:
Web服务功能性需求评价模块完成服务的有监督特征提取和服务功能性需求匹配度计算,输出候选服务与用户需求的功能性需求匹配度;
Web服务非功能性需求评价模块完成服务QoS属性预测和纠错以及非功能性QoS需求效用值计算,输出候选服务满足用户非功能性需求的QoS总效用值;
Web服务排序模块调用Web服务功能性需求评价模块、Web服务非功能性需求评价模块输出的功能性需求匹配度和非功能性需求QoS总效用值,计算出候选服务与用户总需求的匹配度并根据匹配度大小按降序排序,然后返回前n个查询结果给服务查询者,n为自然数。
CN201310048474.9A 2013-02-07 2013-02-07 基于QoS属性预测和纠错的有监督Web服务发现方法及系统 Expired - Fee Related CN103095849B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310048474.9A CN103095849B (zh) 2013-02-07 2013-02-07 基于QoS属性预测和纠错的有监督Web服务发现方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310048474.9A CN103095849B (zh) 2013-02-07 2013-02-07 基于QoS属性预测和纠错的有监督Web服务发现方法及系统

Publications (2)

Publication Number Publication Date
CN103095849A CN103095849A (zh) 2013-05-08
CN103095849B true CN103095849B (zh) 2015-05-20

Family

ID=48207972

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310048474.9A Expired - Fee Related CN103095849B (zh) 2013-02-07 2013-02-07 基于QoS属性预测和纠错的有监督Web服务发现方法及系统

Country Status (1)

Country Link
CN (1) CN103095849B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279461B (zh) * 2013-06-17 2016-04-06 天津大学 面向领域的Web服务文档质量评价方法
CN103581309A (zh) * 2013-10-22 2014-02-12 华中科技大学 一种基于需求的动态服务组合与选择方法和系统
CN104778636B (zh) * 2015-04-08 2017-11-07 中国人民解放军海军工程大学 船舶装备维修保障信息服务推荐方法
CN107103542B (zh) * 2016-02-23 2021-05-14 平安科技(深圳)有限公司 投保单抽样方法、装置和系统
CN109389409B (zh) * 2018-09-17 2021-10-15 内蒙古易商信息科技有限公司 业务处理方法和系统
CN110138612B (zh) * 2019-05-15 2020-09-01 福州大学 一种基于QoS模型自校正的云软件服务资源分配方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645934A (zh) * 2009-08-31 2010-02-10 东软集团股份有限公司 基于加权的Web服务评价方法、Web服务查找方法及其装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987163B2 (en) * 2008-02-12 2011-07-26 Bae Systems Information And Electronic Systems Integration Inc. Apparatus and method for dynamic web service discovery

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645934A (zh) * 2009-08-31 2010-02-10 东软集团股份有限公司 基于加权的Web服务评价方法、Web服务查找方法及其装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Trustworthy web services discovery via supervised services representation and collaborative QoS prediction;Lei Chen等;《Journal of Computational Information Systems》;20121101;摘要,第1部分至6部分 *

Also Published As

Publication number Publication date
CN103095849A (zh) 2013-05-08

Similar Documents

Publication Publication Date Title
CN110674407B (zh) 基于图卷积神经网络的混合推荐方法
CN103095849B (zh) 基于QoS属性预测和纠错的有监督Web服务发现方法及系统
CN104899273B (zh) 一种基于话题和相对熵的网页个性化推荐方法
Li et al. Comparison of word embeddings and sentence encodings as generalized representations for crisis tweet classification tasks
Liao et al. Evaluating the effectiveness of search task trails
CN106776881A (zh) 一种基于微博平台的领域信息推荐系统及方法
Yang et al. Enhancing sentence-level clustering with ranking-based clustering framework for theme-based summarization
CN105893609A (zh) 一种基于加权混合的移动app推荐方法
Giannakidou et al. Co-clustering tags and social data sources
CN102207946B (zh) 一种知识网络的半自动生成方法
CN102123172B (zh) 一种基于神经网络聚类优化的Web服务发现的实现方法
CN102789449B (zh) 对评论文本进行评价的方法和装置
CN102521248A (zh) 一种网络用户分类方法及其装置
CN102693316B (zh) 基于线性泛化回归模型的跨媒体检索方法
Bin et al. Web mining research
Kim et al. Event diffusion patterns in social media
CN103593336A (zh) 一种基于语义分析的知识推送系统及方法
CN106547864A (zh) 一种基于查询扩展的个性化信息检索方法
CN103869999A (zh) 对输入法所产生的候选项进行排序的方法及装置
CN106708926A (zh) 一种支持海量长文本数据分类的分析模型的实现方法
CN103886072B (zh) 煤矿搜索引擎中检索结果聚类系统
Kaur et al. Sentiment analysis on electricity Twitter posts
CN111753151B (zh) 一种基于互联网用户行为的服务推荐方法
CN104462241A (zh) 基于url中锚文字和周边文本的人口属性分类方法及装置
Goldberg et al. CASTLE: crowd-assisted system for text labeling and extraction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20130508

Assignee: Jiangsu Nanyou IOT Technology Park Ltd.

Assignor: Nanjing Post & Telecommunication Univ.

Contract record no.: 2016320000214

Denomination of invention: A method and a system of spervised web service finding based on attribution forecast and error correction of quality of service (QoS)

Granted publication date: 20150520

License type: Common License

Record date: 20161117

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EC01 Cancellation of recordation of patent licensing contract
EC01 Cancellation of recordation of patent licensing contract

Assignee: Jiangsu Nanyou IOT Technology Park Ltd.

Assignor: Nanjing Post & Telecommunication Univ.

Contract record no.: 2016320000214

Date of cancellation: 20180116

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150520

Termination date: 20180207