CN109255125A - 一种基于改进DBSCAN算法的Web服务聚类方法 - Google Patents

一种基于改进DBSCAN算法的Web服务聚类方法 Download PDF

Info

Publication number
CN109255125A
CN109255125A CN201810939293.8A CN201810939293A CN109255125A CN 109255125 A CN109255125 A CN 109255125A CN 201810939293 A CN201810939293 A CN 201810939293A CN 109255125 A CN109255125 A CN 109255125A
Authority
CN
China
Prior art keywords
service
prop
concept
similarity
sim
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810939293.8A
Other languages
English (en)
Other versions
CN109255125B (zh
Inventor
陆佳炜
吴涵
卢成炳
赵伟
周焕
徐俊
肖刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN201810939293.8A priority Critical patent/CN109255125B/zh
Publication of CN109255125A publication Critical patent/CN109255125A/zh
Application granted granted Critical
Publication of CN109255125B publication Critical patent/CN109255125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于改进DBSCAN算法的Web服务聚类方法,所述服务聚类方法包括以下步骤:第一步、计算领域本体中两个概念A和B之间的语义相似度;第二步、结合概念相似度计算方法,给出服务S1与服务S2输入相似度Siminput的计算方法;第三步、结合概念相似度计算方法,给出服务S1与服务S2输出相似度Simoutput的计算方法;第四步、结合求得的服务输入相似度Siminput与服务输出相似度SimOutput计算服务S1与服务S2的功能相似性FunctionalSim(S1,S2);第五步、结合第四步的服务功能相似性度量方式给出服务聚类算法。本发明实现较好的服务聚类效果,从而缩短服务演化时间。

Description

一种基于改进DBSCAN算法的Web服务聚类方法
技术领域
本发明涉及Web服务演化领域,具体涉及一种基于改进DBSCAN算法的Web服务聚类方法。
背景技术
Web服务是一种软件系统,旨在支持机器之间的跨网络交互。目前主要有两种类型的Web服务:一种是基于SOAP,另一种是基于REST。两者的区别是使用的接口不同,基于SOAP的Web服务使用SOAP接口传递消息,并且使用Web服务描述语言(WSDL)来描述Web服务,WSDL为Web服务提供者指定了使用协议和编码独立机制,它是一个XML词汇表,描述了网络上可访问的服务并将它们映射到具有消息传递功能的通信端点集合中。而使用REST接口的Web服务则使用通用的HTTP方法(GET、DELETE、POST和PUT)来描述、发布和使用相关资源。
目前的研究工作旨在通过使用称为本体的概念化知识来提供Web服务的语义描述。本体是一个词汇表,用于描述一个领域内的一组概念(领域可被定义为特定的主题领域或知识领域)以及这些概念之间存在的关系。它被应用于领域内的属性推理,或是领域本身的定义。在Web服务的上下文中,本体作为提供Web服务语义描述的一种方式,发挥着重要的作用。Web服务描述的增强促进了语义Web服务的发展,以机器可理解的方式对Web服务进行语义描述将对诸如电子商务和应用程序集成等领域产生重大影响,因为它可以实现不同系统和组织之间动态、可扩展及高效性的协作。
随着Web服务的不断发展,为了适应环境改变和用户需求的变更,互联网中的Web服务需要持续不断地进行演化。因此,Web服务演化成为服务计算领域重要的研究点之一。同时,Web服务作为构建软件服务的重要技术,如何使软件系统能够自适应运行并且支持服务动态演化具有重要的研究意义和应用价值。
Web服务演化泛指服务在发布、运行之后,为适应环境变化、持续满足用户需求,而进行一系列变更的过程。根据演化实施的方式,可以将服务演化分为静态演化和动态演化,静态演化必须经过暂停服务,更新软件,重新启动服务这样一个过程,而动态演化是指软件在运行时的演化,即边运行边更新。动态演化过程一般通过服务聚类操作来缩小服务样本的搜索空间,使服务匹配过程可以在一个特定的聚类中进行,而不是一个具有许多不相关服务的大型服务池。
目前,国内外的研究人员对Web服务聚类进行了大量的研究。昆士兰理工大学的Nayak等人将Web服务描述转化到多维词向量空间,利用两个向量之间夹角的余弦,计算两个服务之间的距离,对服务进行聚簇。清华大学的Shou等人提出了一种复杂的服务距离度量方法,该方法同时结合了服务之间基于描述信息的相似度和基于输入输出信息的相似度,并采用高效的星形聚类算法进行聚类。东北大学的Zhang等人提出从日志中构建Web服务执行网络并使用谱聚类算法进行聚类。
发明内容
服务聚类的目的是减少搜索空间,使服务匹配过程可以在一个特定的聚类中进行,而不是一个具有许多不相关服务的大型服务池。因此选取使用合适的聚类算法来进行服务聚类对最终的聚类效果以及服务匹配的执行效率有着重要的影响。基于密度的空间聚类算法(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)利用聚类的密度连通性可以快速发现任意形状的簇,当聚类不规则或存在噪声点及异常值时,性能表现较佳。在DBSCAN算法中,搜索半径Eps和最小数量MinPts这两个参数的选取,将直接影响到服务聚类的质量,本发明给出了一种改进的DBSCAN算法来确定搜索半径Eps和最小数量MinPts这两个参数,并结合一种基于本体的Web服务功能相似性度量方法,对Web服务功能相似性进行计算,在此基础上,将本发明改进的DBSCAN算法运用到服务样本距离度量中,实现较好的服务聚类效果,从而缩短服务演化时间。
为了解决上述技术问题本发明所采用的技术方案是:
一种基于改进DBSCAN算法的Web服务聚类方法,所述服务聚类方法包括以下步骤:
第一步、计算领域本体中两个概念A和B之间的语义相似度,过程如下:
步骤(1.1)若概念A和B是相同的或者它们被声明为equivalent classes,则概念A,B的相似度Simconcept为1,否则进行步骤(1.2);
步骤(1.2)若概念A直接或间接为概念B的一个子类,则概念A,B的相似度Simconcept计算公式如下:
其中prop(A)与prop(B)分别表示概念A与概念B的属性集合,Size(prop(B))与Size(prop(A))分别表示概念B和概念A的属性个数,否则进行步骤(1.3)
步骤(1.3)若概念B直接或间接为概念A的一个子类,则概念A,B的相似度Simconcept计算公式如下:
否则进行步骤(1.4);
步骤(1.4)若概念A与概念B没有父子关系,但两个概念直接或间接有一个共同的父类概念C,则采用基于朴素贝叶斯模型的单词语义相似度度量方法,首先分别遍历概念A与概念B的各个属性,通过ComputeFeature函数对概念A与概念B的属性名称进行特征提取,然后采用样本训练后的条件概率分布列和调整因子,计算概念属性之间的相似度Simword,根据概念属性之间的相似度Simword与相似判定因子η的比较,判断两个属性是否为同一属性并进行统计,最后计算出概念A,B的相似度Simconcept
步骤(1.5)若概念A和概念B的关系在上述情况中均不符合,则概念A,B的相似度Simconcept设为0;
第二步、结合第一步的概念相似度计算方法,给出服务S1与服务S2输入相似度Siminput的计算方法,过程如下:
步骤(2.1)创建服务输入参数相似度最大匹配数组InSim并初始化,进行步骤(2.2);
步骤(2.2)将服务S1的输入参数数量减去服务S2的输入参数数量得到参数数量差值d,进行步骤(2.3);
步骤(2.3)若d小于或等于0,则将服务S1设为Sshort,服务S2设为Slong,否则将服务S2设为Sshort,服务S1设为Slong,进行步骤(2.4);
步骤(2.4)遍历Slong中的输入参数,若遍历完成,则进行步骤(2.8),否则从Slong中取出下一个输入参数longi,进行步骤(2.5);
步骤(2.5)遍历Sshort中的输入参数,若遍历完成,则返回步骤(2.4),否则从Sshort中取出下一个输入参数shortj,进行步骤(2.6);
步骤(2.6)根据第一步的概念相似度计算方法计算参数longi与参数shortj的相似度Simij,进行步骤(2.7);
步骤(2.7)将Simij与InSim[i]进行比较,若Simij大于InSim[i],则将InSim[i]的值设为Simij的值,否则InSim[i]值为原值,返回步骤(2.5);
步骤(2.8)计算服务S1与服务S2输入相似度Siminput,计算公式如下:
其中Size(Slong.Input)与Size(Sshort.Input)分别表示服务Slong的输入参数个数与服务Sshort的输入参数个数,|d|表示两个服务的输入参数数量差值,InSim为输入参数的相似度最大匹配数组;
第三步、结合第一步的概念相似度计算方法,给出服务S1与服务S2输出相似度Simoutput的计算方法,过程如下:
步骤(3.1)创建服务输出参数相似度最大匹配数组OutSim并初始化,进行步骤(3.2);
步骤(3.2)将服务S1的输出参数数量减去服务S2的输出参数数量得到参数数量差值d,进行步骤(3.3);
步骤(3.3)若d小于或等于0,则将服务S1设为Sshort,服务S2设为Slong,否则将服务S2设为Sshort,服务S1设为Slong,进行步骤(3.4);
步骤(3.4)遍历Slong中的输出参数,若遍历完成,则进行步骤(3.8),否则从Slong中取出下一个输出参数longi,进行步骤(3.5);
步骤(3.5)遍历Sshort中的输出参数,若遍历完成,则返回步骤(3.4),否则从Sshort中取出下一个输出参数shortj,进行步骤(3.6);
步骤(3.6)根据第一步的概念相似度计算方法计算参数longi与参数shortj的相似度Simij,进行步骤(3.7);
步骤(3.7)将Simij与OutSim[i]进行比较,若Simij大于OutSim[i],则将OutSim[i]的值设为Simij的值,否则OutSim[i]值为原值,返回步骤(3.5);
步骤(3.8)计算服务S1与服务S2输出相似度SimOutput,计算公式如下:
其中Size(Slong.Output)与Size(Sshort.Output)分别表示服务Slong的输出参数个数与服务Sshort的输出参数个数,|d|表示两个服务的输出参数数量差值,OutSim为输出参数的相似度最大匹配数组;
第四步、结合第二步与第三步求得的服务输入相似度Siminput与服务输出相似度SimOutput计算服务S1与服务S2的功能相似性FunctionalSim(S1,S2),计算公式如下:
FunctionalSim(S1,S2)=w1×Siminput+w2×SimOutput,其中权重w1和w2是0和1之间的实数值并且总和为1,它们表示服务消费者对输入相似性和输出相似性认定的重要性;
第五步、结合第四步的服务功能相似性度量方式给出服务聚类算法,首先任意选择一个未分配的核心对象作为种子,然后寻找该核心对象所有密度可达的样本集合,形成一个聚簇。接着继续选择另一个未分配的核心对象去寻找密度可达的样本集合,得到另一个聚簇,直到所有核心对象被分配完毕。本发明中搜索半径Eps由公式确定,其中n表示服务的维度大小,即所有服务的平均属性个数,k表示形成聚簇所需的最少服务数量,r表示由n维服务组成的超球面半径,m则是这个超球面包含的n维服务数量;而最小数量MinPts遵循经验启发式:MinPts=round(m/25),其中round是取整函数,m是样本集中的样本数量。
进一步,所述步骤(1.4)的步骤如下:
步骤(1.4.1)设变量i表示概念A与概念B中属性相同的个数并置初始值为0,进行步骤(1.4.2);
步骤(1.4.2)若概念A的属性集合prop(A)遍历完成,则进行步骤(1.4.7),否则从prop(A)取出下一个prop(A)j并将其从prop(A)中移除,进行步骤(1.4.3);
步骤(1.4.3)若概念B的属性集合prop(B)遍历完成,则返回步骤(1.4.2),否则从prop(B)取出下一个prop(B)k并将其从prop(B)中移除,进行步骤(1.4.4);
步骤(1.4.4)基于朴素贝叶斯模型,结合WorkNet英语词典,通过ComputeFeature函数对prop(A)j与prop(B)k的属性名称进行特征提取进而得出L(prop(A)j,prop(B)k)和D(prop(A)j,prop(B)k),其过程如下:
计算每个属性名称的单词语义,由于每个单词对应一个或多个语义,那么每一单词对也就对应一个或多个语义对,将与单词对相应的所有语义对中距离最短的语义节点距离定义为该单词对距离L(prop(A)j,prop(B)k),并将语义节点距离最短的语义对深度定义为单词对深度D(prop(A)j,prop(B)k),已知属性名称prop(A)j存在于语义节点vj1,vj2,…,vjn的同义词组中,属性名称prop(B)k存在于语义节点vk1,vk2,…vkm的同义词组中,那么prop(A)j与prop(B)k的距离计算公式与深度计算公式如下:
其中L(vja,vkb)表示语义节点vja与语义节点vkb的距离,D(vja,vkb)表示语义对(vja,vkb)的深度;
进一步,依据朴素贝叶斯模型的训练集生成均值函数LW(i)和DW(o),再利用均值函数LW(i)和DW(o)计算条件概率分布列P(L(prop(A)j,prop(B)k)|C)和P(D(prop(A)j,prop(B)k)|C),其中C为单词类别分类,其值域为{U,N},其中U代表“一致”,N代表“不一致”,最后计算调整因子α和β,计算公式如下:
之后转入步骤(1.4.5);
步骤(1.4.5)基于朴素贝叶斯模型,将本体概念属性的特征L(prop(A)j,prop(B)k)和D(prop(A)j,prop(B)k)注入到步骤(1.4.4)所得的条件概率分布列中,并依次提取条件概率V1=P(L(prop(A)j,prop(B)k)=i|C=U),V2=P(D(prop(A)j,prop(B)k)=o|C=U),V3=P(L(prop(A)j,prop(B)k)=i|C=N)与V4=P(D(prop(A)j,prop(B)k)=o|C=N),最后结合步骤(1.4.4)中的调整因子α和β来计算prop(A)j与prop(B)k之间的相似度Simword,计算公式如下:
Simword(prop(A)j,prop(B)k)=(αV1×V2)/(αV1×V2+βV3×V4),进行步骤(1.4.6);
步骤(1.4.6)若Simword大于或等于相似判定因子η,则prop(A)j与prop(B)k为同一属性并将变量i加1,返回步骤(1.4.2),否则返回步骤(1.4.3);
步骤(1.4.7)计算概念A,B的相似度Simconcept,计算公式如下:
其中i表示概念A与概念B中属性相同的个数,prop(A)与prop(B)分别表示概念A与概念B的属性集合,Size(prop(B))与Size(prop(A))分别表示概念B和概念A的属性个数,进行步骤(1.5)。
再进一步,所述步骤(5)包括以下步骤:
步骤(5.1)初始化未访问样本集合为原始样本集T,簇集合C划分为空集,进行步骤(5.2);
步骤(5.2)遍历原始样本集T,若遍历完成,则结束,否则从T中取出下一个服务Si并将其从T中移除,进行步骤(5.3);
步骤(5.3)结合第四步定义的服务功能相似性度量方式寻找服务Si的Eps邻域;
步骤(5.4)创建新聚类簇Ck,若Si的Eps邻域样本数不少于MinPts,则将Si加入到该簇中,进行步骤(5.5),否则返回步骤(5.2);
步骤(5.5)遍历服务Si的邻域集合NEps(Si),若遍历完成,则进行步骤(5.13),否则取出集合NEps(Si)中的下一个服务S’k,进行步骤(5.6);
步骤(5.6)创建服务S’k的邻域集合NEps(S’k),进行步骤(5.7);
步骤(5.7)若原始样本集T包含服务S’k,则将服务S’k从T中移除,进行步骤(5.8),否则返回步骤(5.5);
步骤(5.8)遍历原始样本集T,若遍历完成,则进行步骤(5.11),否则从T中取出下一个服务S’l,进行步骤(5.9);
步骤(5.9)采用第四步定义的服务功能相似性度量方式来计算服务S’k与服务S’l的功能相似度FunctionalSim(S’k,S’l),进行步骤(5.10)
步骤(5.10)若服务S’k与服务S’l的功能相似度FunctionalSim(S’k,S’l)小于或等于搜索半径Eps,则将服务S’l加入服务S’k的邻域集合NEps(S’k),返回步骤(5.8),否则直接返回步骤(5.8);
步骤(5.11)若服务S’k的Eps邻域样本数不少于MinPts,则将该邻域中的服务加入到服务Si的Eps邻域集合NEps(Si),进行步骤(5.12),否则返回步骤(5.5);
步骤(5.12)若簇集合C中不包含含有服务S’k的聚类簇,则将服务S’k加入步骤(5.4)创建的聚类簇Ck,返回步骤(5.5),否则直接返回步骤(5.5);
步骤(5.13)将聚类簇Ck加入簇集合C,返回步骤(5.2)。
更进一步,步骤(5.3)所述寻找服务Si的Eps邻域的步骤如下:
步骤(5.3.1)创建服务Si的邻域集合NEps(Si),进行步骤(5.3.2);
步骤(5.3.2)遍历原始样本集T,若遍历完成,则进行步骤(5.4),否则从T中取出下一个服务Sj,进行步骤(5.3.3);
步骤(5.3.3)采用第四步定义的功能相似度来计算服务Si与服务Sj的功能相似度FunctionalSim(Si,Sj),进行步骤(5.3.4);
步骤(5.3.4)若服务Si与服务Sj的功能相似度FunctionalSim(Si,Sj)小于或等于搜索半径Eps,则将服务Sj加入服务Si的邻域集合NEps(Si),返回步骤(5.3.2),否则直接返回步骤(5.3.2)。
本发明的有益效果是,通过提出改进的DBSCAN算法来确定搜索半径Eps和最小数量MinPts这两个参数。在此基础上,本发明结合一种基于本体的Web服务功能相似性度量方法,对Web服务功能相似性进行计算,并运用于DBSCAN算法的服务样本距离度量中,服务样本距离度量即寻找服务Eps邻域的过程。将此聚类方法应用在Web服务动态演化的过程中可以有效缩小服务的搜索空间,从而缩短服务演化时间。
具体实施方式
下面对本发明做进一步说明。
一种基于改进DBSCAN算法的Web服务聚类方法,所述服务聚类方法包括以下步骤:
功能相似性度量考虑服务间输入和输出的领域本体概念,输入(输出)之间的匹配主要指与输入(输出)相关的概念的匹配。为了计算两个概念A和B的相似性,需要考虑领域本体中两个概念之间的关系。
领域本体是描述指定领域知识的一种专门本体,这里的“领域”是根据本体构建者的需求来确立的,它可以是一个学科领域,可以是某几个领域的一种结合,也可以是一个领域中的一个小范围。若领域本体中两个概念具有不同的名字但拥有相同的个体集合,则它们被称为等价类(equivalent classes)。
第一步、计算领域本体中两个概念A和B之间的语义相似度,具体过程如下:
步骤(1.1)若概念A和B是相同的或者它们被声明为equivalent classes,则概念A,B的相似度Simconcept为1,否则进行步骤(1.2);
步骤(1.2)若概念A直接或间接为概念B的一个子类,则概念A,B的相似度Simconcept计算公式如下:
其中prop(A)与prop(B)分别表示概念A与概念B的属性集合,Size(prop(B))与Size(prop(A))分别表示概念B和概念A的属性个数,否则进行步骤(1.3)
步骤(1.3)若概念B直接或间接为概念A的一个子类,则概念A,B的相似度Simconcept计算公式如下:
否则进行步骤(1.4);
步骤(1.4)若概念A与概念B没有父子关系,但两个概念直接或间接有一个共同的父类概念C,则采用基于朴素贝叶斯模型的单词语义相似度度量方法,首先分别遍历概念A与概念B的各个属性,通过ComputeFeature函数对概念A与概念B的属性名称进行特征提取,然后采用样本训练后的条件概率分布列和调整因子,计算概念属性之间的相似度Simword,根据概念属性之间的相似度Simword与相似判定因子η的比较,判断两个属性是否为同一属性并进行统计,最后计算出概念A,B的相似度Simconcept,步骤如下:
步骤(1.4.1)设变量i表示概念A与概念B中属性相同的个数并置初始值为0,进行步骤(1.4.2);
步骤(1.4.2)若概念A的属性集合prop(A)遍历完成,则进行步骤(1.4.7),否则从prop(A)取出下一个prop(A)j并将其从prop(A)中移除,进行步骤(1.4.3);
步骤(1.4.3)若概念B的属性集合prop(B)遍历完成,则返回步骤(1.4.2),否则从prop(B)取出下一个prop(B)k并将其从prop(B)中移除,进行步骤(1.4.4);
步骤(1.4.4)基于朴素贝叶斯模型,结合WorkNet英语词典,通过ComputeFeature函数对prop(A)j与prop(B)k的属性名称进行特征提取进而得出L(prop(A)j,prop(B)k)和D(prop(A)j,prop(B)k)。其中朴素贝叶斯模型是最为广泛的两种分类模型之一,WorkNet是由普林斯顿大学认识科学实验室在心理学教授米勒的指导下建立和维护的英语词典。具体计算过程如下:
计算每个属性名称的单词语义,由于每个单词对应一个或多个语义,那么每一单词对也就对应一个或多个语义对。将与单词对相应的所有语义对中距离最短的语义节点距离定义为该单词对距离L(prop(A)j,prop(B)k),并将语义节点距离最短的语义对深度定义为单词对深度D(prop(A)j,prop(B)k),已知属性名称prop(A)j存在于语义节点vj1,vj2,…,vjn的同义词组中,属性名称prop(B)k存在于语义节点vk1,vk2,…vkm的同义词组中,那么prop(A)j与prop(B)k的距离计算公式与深度计算公式如下:
其中L(vja,vkb)表示语义节点vja与语义节点vkb的距离,D(vja,vkb)表示语义对(vja,vkb)的深度。
进一步,依据朴素贝叶斯模型的训练集生成均值函数LW(i)和DW(o),再利用均值函数LW(i)和DW(o)计算条件概率分布列P(L(prop(A)j,prop(B)k)|C)和P(D(prop(A)j,prop(B)k)|C),其中C为单词类别分类,其值域为{U,N},其中U代表“一致”,N代表“不一致”。最后计算调整因子α和β,计算公式如下:
之后转入步骤(1.4.5);
步骤(1.4.5)基于朴素贝叶斯模型,将本体概念属性的特征L(prop(A)j,prop(B)k)和D(prop(A)j,prop(B)k)注入到步骤(1.4.4)所得的条件概率分布列中,并依次提取条件概率V1=P(L(prop(A)j,prop(B)k)=i|C=U),V2=P(D(prop(A)j,prop(B)k)=o|C=U),V3=P(L(prop(A)j,prop(B)k)=i|C=N)与V4=P(D(prop(A)j,prop(B)k)=o|C=N)。最后结合步骤(1.4.4)中的调整因子α和β来计算prop(A)j与prop(B)k之间的相似度Simword,计算公式如下:
Simword(prop(A)j,prop(B)k)=(αV1×V2)/(αV1×V2+βV3×V4),进行步骤(1.4.6);
步骤(1.4.6)若Simword大于或等于相似判定因子η,则prop(A)j与prop(B)k为同一属性并将变量i加1,返回步骤(1.4.2),否则返回步骤(1.4.3);
步骤(1.4.7)计算概念A,B的相似度Simconcept,计算公式如下:
其中i表示概念A与概念B中属性相同的个数,prop(A)与prop(B)分别表示概念A与概念B的属性集合,Size(prop(B))与Size(prop(A))分别表示概念B和概念A的属性个数,进行步骤(1.5);
步骤(1.5)若概念A和概念B的关系在上述情况中均不符合,则概念A,B的相似度Simconcept设为0;
第二步、结合第一步的概念相似度计算方法,给出服务S1与服务S2输入相似度Siminput的计算方法,具体过程如下:
步骤(2.1)创建服务输入参数相似度最大匹配数组InSim并初始化,进行步骤(2.2);
步骤(2.2)将服务S1的输入参数数量减去服务S2的输入参数数量得到参数数量差值d,进行步骤(2.3);
步骤(2.3)若d小于或等于0,则将服务S1设为Sshort,服务S2设为Slong,否则将服务S2设为Sshort,服务S1设为Slong,进行步骤(2.4);
步骤(2.4)遍历Slong中的输入参数,若遍历完成,则进行步骤(2.8),否则从Slong中取出下一个输入参数longi,进行步骤(2.5);
步骤(2.5)遍历Sshort中的输入参数,若遍历完成,则返回步骤(2.4),否则从Sshort中取出下一个输入参数shortj,进行步骤(2.6);
步骤(2.6)根据第一步的概念相似度计算方法计算参数longi与参数shortj的相似度Simij,进行步骤(2.7);
步骤(2.7)将Simij与InSim[i]进行比较,若Simij大于InSim[i],则将InSim[i]的值设为Simij的值,否则InSim[i]值为原值,返回步骤(2.5);
步骤(2.8)计算服务S1与服务S2输入相似度Siminput,计算公式如下:
其中Size(Slong.Input)与Size(Sshort.Input)分别表示服务Slong的输入参数个数与服务Sshort的输入参数个数,|d|表示两个服务的输入参数数量差值,InSim为输入参数的相似度最大匹配数组;
第三步、结合第一步的概念相似度计算方法,给出服务S1与服务S2输出相似度Simoutput的计算方法,具体过程如下:
步骤(3.1)创建服务输出参数相似度最大匹配数组OutSim并初始化,进行步骤(3.2);
步骤(3.2)将服务S1的输出参数数量减去服务S2的输出参数数量得到参数数量差值d,进行步骤(3.3);
步骤(3.3)若d小于或等于0,则将服务S1设为Sshort,服务S2设为Slong,否则将服务S2设为Sshort,服务S1设为Slong,进行步骤(3.4);
步骤(3.4)遍历Slong中的输出参数,若遍历完成,则进行步骤(3.8),否则从Slong中取出下一个输出参数longi,进行步骤(3.5);
步骤(3.5)遍历Sshort中的输出参数,若遍历完成,则返回步骤(3.4),否则从Sshort中取出下一个输出参数shortj,进行步骤(3.6);
步骤(3.6)根据第一步的概念相似度计算方法计算参数longi与参数shortj的相似度Simij,进行步骤(3.7);
步骤(3.7)将Simij与OutSim[i]进行比较,若Simij大于OutSim[i],则将OutSim[i]的值设为Simij的值,否则OutSim[i]值为原值,返回步骤(3.5);
步骤(3.8)计算服务S1与服务S2输出相似度SimOutput,计算公式如下:
其中Size(Slong.Output)与Size(Sshort.Output)分别表示服务Slong的输出参数个数与服务Sshort的输出参数个数,|d|表示两个服务的输出参数数量差值,OutSim为输出参数的相似度最大匹配数组;
第四步、结合第二步与第三步求得的服务输入相似度Siminput与服务输出相似度SimOutput计算服务S1与服务S2的功能相似性FunctionalSim(S1,S2),计算公式如下:
FunctionalSim(S1,S2)=w1×Siminput+w2×SimOutput,其中权重w1和w2是0和1之间的实数值并且总和为1。它们表示服务消费者对输入相似性和输出相似性认定的重要性。默认情况下,w1和w2均设置为0.5。
第五步、结合第四步的服务功能相似性度量方式给出本发明的服务聚类算法,步骤如下:
DBSCAN算法的工作原理如下:首先任意选择一个未分配的核心对象作为种子,然后寻找该核心对象所有密度可达的样本集合,形成一个聚簇。接着继续选择另一个未分配的核心对象去寻找密度可达的样本集合,得到另一个聚簇,直到所有核心对象被分配完毕。假设样本集为D=(S1,S2,…,Sm),则DBSCAN算法具有如下关键定义:
■Eps邻域:对于Si∈D,其Eps邻域包含样本集D中与xi的距离不大于Eps的样本集,即NEps(Si)={Si∈D|distance(Si,Sj)≤Eps},该集合的样本数记为|NEps(Si)|。
■核心对象:对于任一样本Sj∈D,如果其Eps邻域对应的NEps(Sj)至少包含MinPts个样本,即如果|NEps(Sj)|≥MinPts,则Sj是核心对象。
本算法中搜索半径Eps由公式确定,其中n表示服务的维度大小,即所有服务的平均属性个数,k表示形成聚簇所需的最少服务数量,r表示由n维服务组成的超球面半径,m则是这个超球面包含的n维服务数量;而最小数量MinPts遵循经验启发式:MinPts=round(m/25),其中round是取整函数,m是样本集中的样本数量。
步骤(5.1)初始化未访问样本集合为原始样本集T,簇集合C划分为空集,进行步骤(5.2);
步骤(5.2)遍历原始样本集T,若遍历完成,则结束,否则从T中取出下一个服务Si并将其从T中移除,进行步骤(5.3);
步骤(5.3)结合第四步定义的功能相似度寻找服务Si的Eps邻域;
进一步,步骤(5.3)所述寻找服务Si的Eps邻域的步骤如下:
步骤(5.3.1)创建服务Si的邻域集合NEps(Si),进行步骤(5.3.2);
步骤(5.3.2)遍历原始样本集T,若遍历完成,则进行步骤(5.4),否则从T中取出下一个服务Sj,进行步骤(5.3.3);
步骤(5.3.3)采用第四步定义的服务功能相似性度量方式来计算服务Si与服务Sj的功能相似度FunctionalSim(Si,Sj),进行步骤(5.3.4);
步骤(5.3.4)若服务Si与服务Sj的功能相似度FunctionalSim(Si,Sj)小于或等于搜索半径Eps,则将服务Sj加入服务Si的邻域集合NEps(Si),返回步骤(5.3.2),否则直接返回步骤(5.3.2);
步骤(5.4)创建新聚类簇Ck,若Si的Eps邻域样本数|NEps(Si)|不少于MinPts,则将Si加入到该簇中,进行步骤(5.5),否则返回步骤(5.2);
步骤(5.5)遍历服务Si的邻域集合NEps(Si),若遍历完成,则进行步骤(5.13),否则取出集合NEps(Si)中的下一个服务S’k,进行步骤(5.6);
步骤(5.6)创建服务S’k的邻域集合NEps(S’k),进行步骤(5.7);
步骤(5.7)若原始样本集T包含服务S’k,则将服务S’k从T中移除,进行步骤(5.8),否则返回步骤(5.5);
步骤(5.8)遍历原始样本集T,若遍历完成,则进行步骤(5.11),否则从T中取出下一个服务S’l,进行步骤(5.9);
步骤(5.9)采用第四步定义的功能相似度来计算服务S’k与服务S’l的功能相似度FunctionalSim(S’k,S’l),进行步骤(5.10)
步骤(5.10)若服务S’k与服务S’l的功能相似度FunctionalSim(S’k,S’l)小于或等于搜索半径Eps,则将服务S’l加入服务S’k的邻域集合NEps(S’k),返回步骤(5.8),否则直接返回步骤(5.8);
步骤(5.11)若服务S’k的Eps邻域样本数|NEps(S’k)|不少于MinPts,则将该邻域中的服务加入到服务Si的Eps邻域集合NEps(Si),进行步骤(5.12),否则返回步骤(5.5);
步骤(5.12)若簇集合C中不包含含有服务S’k的聚类簇,则将服务S’k加入步骤(5.4)创建的聚类簇Ck,返回步骤(5.5),否则直接返回步骤(5.5);
步骤(5.13)将聚类簇Ck加入簇集合C,返回步骤(5.2)。

Claims (4)

1.一种基于改进DBSCAN算法的Web服务聚类方法,其特征在于,所述服务聚类方法包括以下步骤:
第一步、计算领域本体中两个概念A和B之间的语义相似度,过程如下:
步骤(1.1)若概念A和B是相同的或者它们被声明为equivalent classes,则概念A,B的相似度Simconcept为1,否则进行步骤(1.2);
步骤(1.2)若概念A直接或间接为概念B的一个子类,则概念A,B的相似度Simconcept计算公式如下:
其中prop(A)与prop(B)分别表示概念A与概念B的属性集合,Size(prop(B))与Size(prop(A))分别表示概念B和概念A的属性个数,否则进行步骤(1.3)
步骤(1.3)若概念B直接或间接为概念A的一个子类,则概念A,B的相似度Simconcept计算公式如下:
否则进行步骤(1.4);
步骤(1.4)若概念A与概念B没有父子关系,但两个概念直接或间接有一个共同的父类概念C,则采用基于朴素贝叶斯模型的单词语义相似度度量方法,首先分别遍历概念A与概念B的各个属性,通过ComputeFeature函数对概念A与概念B的属性名称进行特征提取,然后采用样本训练后的条件概率分布列和调整因子,计算概念属性之间的相似度Simword,根据概念属性之间的相似度Simword与相似判定因子η的比较,判断两个属性是否为同一属性并进行统计,最后计算出概念A,B的相似度Simconcept
步骤(1.5)若概念A和概念B的关系在上述情况中均不符合,则概念A,B的相似度Simconcept设为0;
第二步、结合第一步的概念相似度计算方法,给出服务S1与服务S2输入相似度Siminput的计算方法,过程如下:
步骤(2.1)创建服务输入参数相似度最大匹配数组InSim并初始化,进行步骤(2.2);
步骤(2.2)将服务S1的输入参数数量减去服务S2的输入参数数量得到参数数量差值d,进行步骤(2.3);
步骤(2.3)若d小于或等于0,则将服务S1设为Sshort,服务S2设为Slong,否则将服务S2设为Sshort,服务S1设为Slong,进行步骤(2.4);
步骤(2.4)遍历Slong中的输入参数,若遍历完成,则进行步骤(2.8),否则从Slong中取出下一个输入参数longi,进行步骤(2.5);
步骤(2.5)遍历Sshort中的输入参数,若遍历完成,则返回步骤(2.4),否则从Sshort中取出下一个输入参数shortj,进行步骤(2.6);
步骤(2.6)根据第一步的概念相似度计算方法计算参数longi与参数shortj的相似度Simij,进行步骤(2.7);
步骤(2.7)将Simij与InSim[i]进行比较,若Simij大于InSim[i],则将InSim[i]的值设为Simij的值,否则InSim[i]值为原值,返回步骤(2.5);
步骤(2.8)计算服务S1与服务S2输入相似度Siminput,计算公式如下:
其中Size(Slong.Input)与Size(Sshort.Input)分别表示服务Slong的输入参数个数与服务Sshort的输入参数个数,|d|表示两个服务的输入参数数量差值,InSim为输入参数的相似度最大匹配数组;
第三步、结合第一步的概念相似度计算方法,给出服务S1与服务S2输出相似度Simoutput的计算方法,过程如下:
步骤(3.1)创建服务输出参数相似度最大匹配数组OutSim并初始化,进行步骤(3.2);
步骤(3.2)将服务S1的输出参数数量减去服务S2的输出参数数量得到参数数量差值d,进行步骤(3.3);
步骤(3.3)若d小于或等于0,则将服务S1设为Sshort,服务S2设为Slong,否则将服务S2设为Sshort,服务S1设为Slong,进行步骤(3.4);
步骤(3.4)遍历Slong中的输出参数,若遍历完成,则进行步骤(3.8),否则从Slong中取出下一个输出参数longi,进行步骤(3.5);
步骤(3.5)遍历Sshort中的输出参数,若遍历完成,则返回步骤(3.4),否则从Sshort中取出下一个输出参数shortj,进行步骤(3.6);
步骤(3.6)根据第一步的概念相似度计算方法计算参数longi与参数shortj的相似度Simij,进行步骤(3.7);
步骤(3.7)将Simij与OutSim[i]进行比较,若Simij大于OutSim[i],则将OutSim[i]的值设为Simij的值,否则OutSim[i]值为原值,返回步骤(3.5);
步骤(3.8)计算服务S1与服务S2输出相似度SimOutput,计算公式如下:
其中Size(Slong.Output)与Size(Sshort.Output)分别表示服务Slong的输出参数个数与服务Sshort的输出参数个数,|d|表示两个服务的输出参数数量差值,OutSim为输出参数的相似度最大匹配数组;
第四步、结合第二步与第三步求得的服务输入相似度Siminput与服务输出相似度SimOutput计算服务S1与服务S2的功能相似性FunctionalSim(S1,S2),计算公式如下:
FunctionalSim(S1,S2)=w1×Siminput+w2×SimOutput,其中权重w1和w2是0和1之间的实数值并且总和为1,它们表示服务消费者对输入相似性和输出相似性认定的重要性;
第五步、结合第四步的服务功能相似性度量方式给出服务聚类算法,首先任意选择一个未分配的核心对象作为种子,然后寻找该核心对象所有密度可达的样本集合,形成一个聚簇。接着继续选择另一个未分配的核心对象去寻找密度可达的样本集合,得到另一个聚簇,直到所有核心对象被分配完毕。本发明中搜索半径Eps由公式确定,其中n表示服务的维度大小,即所有服务的平均属性个数,k表示形成聚簇所需的最少服务数量,r表示由n维服务组成的超球面半径,m则是这个超球面包含的n维服务数量;而最小数量MinPts遵循经验启发式:MinPts=round(m/25),其中round是取整函数,m是样本集中的样本数量。
2.如权利要求1所述的一种基于改进DBSCAN算法的Web服务聚类方法,其特征在于,所述步骤(1.4)的步骤如下:
步骤(1.4.1)设变量i表示概念A与概念B中属性相同的个数并置初始值为0,进行步骤(1.4.2);
步骤(1.4.2)若概念A的属性集合prop(A)遍历完成,则进行步骤(1.4.7),否则从prop(A)取出下一个prop(A)j并将其从prop(A)中移除,进行步骤(1.4.3);
步骤(1.4.3)若概念B的属性集合prop(B)遍历完成,则返回步骤(1.4.2),否则从prop(B)取出下一个prop(B)k并将其从prop(B)中移除,进行步骤(1.4.4);
步骤(1.4.4)基于朴素贝叶斯模型,结合WorkNet英语词典,通过ComputeFeature函数对prop(A)j与prop(B)k的属性名称进行特征提取进而得出L(prop(A)j,prop(B)k)和D(prop(A)j,prop(B)k),其过程如下:
计算每个属性名称的单词语义,由于每个单词对应一个或多个语义,那么每一单词对也就对应一个或多个语义对,将与单词对相应的所有语义对中距离最短的语义节点距离定义为该单词对距离L(prop(A)j,prop(B)k),并将语义节点距离最短的语义对深度定义为单词对深度D(prop(A)j,prop(B)k),已知属性名称prop(A)j存在于语义节点vj1,vj2,…,vjn的同义词组中,属性名称prop(B)k存在于语义节点vk1,vk2,…vkm的同义词组中,那么prop(A)j与prop(B)k的距离计算公式与深度计算公式如下:
其中L(vja,vkb)表示语义节点vja与语义节点vkb的距离,D(vja,vkb)表示语义对(vja,vkb)的深度;
进一步,依据朴素贝叶斯模型的训练集生成均值函数LW(i)和DW(o),再利用均值函数LW(i)和DW(o)计算条件概率分布列P(L(prop(A)j,prop(B)k)|C)和P(D(prop(A)j,prop(B)k)|C),其中C为单词类别分类,其值域为{U,N},其中U代表“一致”,N代表“不一致”,最后计算调整因子α和β,计算公式如下:
之后转入步骤(1.4.5);
步骤(1.4.5)基于朴素贝叶斯模型,将本体概念属性的特征L(prop(A)j,prop(B)k)和D(prop(A)j,prop(B)k)注入到步骤(1.4.4)所得的条件概率分布列中,并依次提取条件概率V1=P(L(prop(A)j,prop(B)k)=i|C=U),V2=P(D(prop(A)j,prop(B)k)=o|C=U),V3=P(L(prop(A)j,prop(B)k)=i|C=N)与V4=P(D(prop(A)j,prop(B)k)=o|C=N),最后结合步骤(1.4.4)中的调整因子α和β来计算prop(A)j与prop(B)k之间的相似度Simword,计算公式如下:
Simword(prop(A)j,prop(B)k)=(αV1×V2)/(αV1×V2+βV3×V4),进行步骤(1.4.6);
步骤(1.4.6)若Simword大于或等于相似判定因子η,则prop(A)j与prop(B)k为同一属性并将变量i加1,返回步骤(1.4.2),否则返回步骤(1.4.3);
步骤(1.4.7)计算概念A,B的相似度Simconcept,计算公式如下:
其中i表示概念A与概念B中属性相同的个数,prop(A)与prop(B)分别表示概念A与概念B的属性集合,Size(prop(B))与Size(prop(A))分别表示概念B和概念A的属性个数,进行步骤(1.5)。
3.如权利要求1和2所述的一种基于改进DBSCAN算法的Web服务聚类方法,其特征在于,所述步骤(5)包括以下步骤:
步骤(5.1)初始化未访问样本集合为原始样本集T,簇集合C划分为空集,进行步骤(5.2);
步骤(5.2)遍历原始样本集T,若遍历完成,则结束,否则从T中取出下一个服务Si并将其从T中移除,进行步骤(5.3);
步骤(5.3)结合第四步定义的服务功能相似性度量方式寻找服务Si的Eps邻域;
步骤(5.4)创建新聚类簇Ck,若Si的Eps邻域样本数不少于MinPts,则将Si加入到该簇中,进行步骤(5.5),否则返回步骤(5.2);
步骤(5.5)遍历服务Si的邻域集合NEps(Si),若遍历完成,则进行步骤(5.13),否则取出集合NEps(Si)中的下一个服务S’k,进行步骤(5.6);
步骤(5.6)创建服务S’k的邻域集合NEps(S’k),进行步骤(5.7);
步骤(5.7)若原始样本集T包含服务S’k,则将服务S’k从T中移除,进行步骤(5.8),否则返回步骤(5.5);
步骤(5.8)遍历原始样本集T,若遍历完成,则进行步骤(5.11),否则从T中取出下一个服务S’l,进行步骤(5.9);
步骤(5.9)采用第四步定义的服务功能相似性度量方式来计算服务S’k与服务S’l的功能相似度FunctionalSim(S’k,S’l),进行步骤(5.10)
步骤(5.10)若服务S’k与服务S’l的功能相似度FunctionalSim(S’k,S’l)小于或等于搜索半径Eps,则将服务S’l加入服务S’k的邻域集合NEps(S’k),返回步骤(5.8),否则直接返回步骤(5.8);
步骤(5.11)若服务S’k的Eps邻域样本数不少于MinPts,则将该邻域中的服务加入到服务Si的Eps邻域集合NEps(Si),进行步骤(5.12),否则返回步骤(5.5);
步骤(5.12)若簇集合C中不包含含有服务S’k的聚类簇,则将服务S’k加入步骤(5.4)创建的聚类簇Ck,返回步骤(5.5),否则直接返回步骤(5.5);
步骤(5.13)将聚类簇Ck加入簇集合C,返回步骤(5.2)。
4.如权利要求3所述的一种基于改进DBSCAN算法的Web服务聚类方法,其特征在于,步骤(5.3)所述寻找服务Si的Eps邻域的步骤如下:
步骤(5.3.1)创建服务Si的邻域集合NEps(Si),进行步骤(5.3.2);
步骤(5.3.2)遍历原始样本集T,若遍历完成,则进行步骤(5.4),否则从T中取出下一个服务Sj,进行步骤(5.3.3);
步骤(5.3.3)采用第四步定义的功能相似度来计算服务Si与服务Sj的功能相似度FunctionalSim(Si,Sj),进行步骤(5.3.4);
步骤(5.3.4)若服务Si与服务Sj的功能相似度FunctionalSim(Si,Sj)小于或等于搜索半径Eps,则将服务Sj加入服务Si的邻域集合NEps(Si),返回步骤(5.3.2),否则直接返回步骤(5.3.2)。
CN201810939293.8A 2018-08-17 2018-08-17 一种基于改进DBSCAN算法的Web服务聚类方法 Active CN109255125B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810939293.8A CN109255125B (zh) 2018-08-17 2018-08-17 一种基于改进DBSCAN算法的Web服务聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810939293.8A CN109255125B (zh) 2018-08-17 2018-08-17 一种基于改进DBSCAN算法的Web服务聚类方法

Publications (2)

Publication Number Publication Date
CN109255125A true CN109255125A (zh) 2019-01-22
CN109255125B CN109255125B (zh) 2023-07-14

Family

ID=65050082

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810939293.8A Active CN109255125B (zh) 2018-08-17 2018-08-17 一种基于改进DBSCAN算法的Web服务聚类方法

Country Status (1)

Country Link
CN (1) CN109255125B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978075A (zh) * 2019-04-04 2019-07-05 江苏满运软件科技有限公司 车辆虚假位置信息识别方法、装置、电子设备、存储介质
CN111143479A (zh) * 2019-12-10 2020-05-12 浙江工业大学 基于dbscan聚类算法的知识图谱关系抽取与rest服务可视化融合方法
CN111475610A (zh) * 2020-02-28 2020-07-31 浙江工业大学 一种基于密度峰值检测的Mahsup服务聚类方法
CN112800304A (zh) * 2021-01-08 2021-05-14 上海海事大学 一种基于聚类的微博水军团体检测方法
WO2022156328A1 (zh) * 2021-01-19 2022-07-28 青岛科技大学 一种融合服务协作关系的Restful类型Web服务聚类方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183804A (zh) * 2015-08-26 2015-12-23 陕西师范大学 一种基于本体的聚类服务方法
CN105404619A (zh) * 2015-09-08 2016-03-16 华南理工大学 一种基于相似度的语义Web服务聚类标注方法
CN107135092A (zh) * 2017-03-15 2017-09-05 浙江工业大学 一种面向全局社交服务网的Web服务聚类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105183804A (zh) * 2015-08-26 2015-12-23 陕西师范大学 一种基于本体的聚类服务方法
CN105404619A (zh) * 2015-09-08 2016-03-16 华南理工大学 一种基于相似度的语义Web服务聚类标注方法
CN107135092A (zh) * 2017-03-15 2017-09-05 浙江工业大学 一种面向全局社交服务网的Web服务聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陆佳炜等: "面向全局社交服务网的Web服务聚类方法", 《计算机科学》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978075A (zh) * 2019-04-04 2019-07-05 江苏满运软件科技有限公司 车辆虚假位置信息识别方法、装置、电子设备、存储介质
CN109978075B (zh) * 2019-04-04 2021-09-28 江苏满运软件科技有限公司 车辆虚假位置信息识别方法、装置、电子设备、存储介质
CN111143479A (zh) * 2019-12-10 2020-05-12 浙江工业大学 基于dbscan聚类算法的知识图谱关系抽取与rest服务可视化融合方法
CN111143479B (zh) * 2019-12-10 2023-09-01 易点生活数字科技有限公司 基于dbscan聚类算法的知识图谱关系抽取与rest服务可视化融合方法
CN111475610A (zh) * 2020-02-28 2020-07-31 浙江工业大学 一种基于密度峰值检测的Mahsup服务聚类方法
CN111475610B (zh) * 2020-02-28 2022-06-17 浙江工业大学 一种基于密度峰值检测的Mashup服务聚类方法
CN112800304A (zh) * 2021-01-08 2021-05-14 上海海事大学 一种基于聚类的微博水军团体检测方法
WO2022156328A1 (zh) * 2021-01-19 2022-07-28 青岛科技大学 一种融合服务协作关系的Restful类型Web服务聚类方法

Also Published As

Publication number Publication date
CN109255125B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
CN109255125A (zh) 一种基于改进DBSCAN算法的Web服务聚类方法
US11481456B2 (en) Model and pattern structure online unital learning: mapsoul
Dhelim et al. Personality-aware product recommendation system based on user interests mining and metapath discovery
CN106055549B (zh) 利用加速器的概念分析操作的方法和系统
CN105975488B (zh) 一种关系数据库中基于主题类簇单元的关键词查询方法
Wang et al. Model: Motif-based deep feature learning for link prediction
CN109284086A (zh) 面向需求自适应的Web服务动态演化方法
KR20200034917A (ko) 속성 생성적 대립 네트워크 및 상기 네트워크를 기반으로 하는 의류 매칭 생성 방법
Zou et al. Deepwsc: Clustering web services via integrating service composability into deep semantic features
Teng et al. A dynamic large-scale multiple attribute group decision-making method with probabilistic linguistic term sets based on trust relationship and opinion correlation
You et al. QoS evaluation for web service recommendation
CA3033201A1 (en) Large scale social graph segmentation
Hu et al. Building an associative classifier with multiple minimum supports
CN112559807B (zh) 一种基于多源点并行探索的图模式匹配方法
Li et al. COCLEP: Contrastive Learning-based Semi-Supervised Community Search
IL230065A (en) Research on data-driven preference and semantic processing
CN110633348B (zh) 一种基于本体的高性能计算资源池化索引查询方法
CN116957128A (zh) 业务指标预测方法、装置、设备和存储介质
CN108256077B (zh) 一种面向中国移动智能客服的动态扩展知识图推理方法
Li et al. Mcore: Multi-Agent Collaborative Learning for Knowledge-Graph-Enhanced Recommendation
Fanoiki et al. Case-based reasoning retrieval and reuse using case resemblance hypergraphs
CN109255124B (zh) 一种基于OWL-S的Web服务综合评分计算方法
Lu et al. A new method of QoS prediction based on probabilistic latent feature analysis and cloud similarity
CN109359289A (zh) 一种基于本体的Web服务功能相似性度量方法
Radu et al. Automatic negotiation with profiles and clustering of agents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant