CN103838857A - 一种基于语义的自动服务组合系统及方法 - Google Patents

一种基于语义的自动服务组合系统及方法 Download PDF

Info

Publication number
CN103838857A
CN103838857A CN201410099241.6A CN201410099241A CN103838857A CN 103838857 A CN103838857 A CN 103838857A CN 201410099241 A CN201410099241 A CN 201410099241A CN 103838857 A CN103838857 A CN 103838857A
Authority
CN
China
Prior art keywords
service
workflow
behavior
storehouse
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410099241.6A
Other languages
English (en)
Other versions
CN103838857B (zh
Inventor
彭启民
林玲
胡晓惠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Software of CAS
Original Assignee
Institute of Software of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Software of CAS filed Critical Institute of Software of CAS
Priority to CN201410099241.6A priority Critical patent/CN103838857B/zh
Publication of CN103838857A publication Critical patent/CN103838857A/zh
Application granted granted Critical
Publication of CN103838857B publication Critical patent/CN103838857B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Abstract

本发明涉及一种基于语义的自动服务组合系统及方法,系统包括:服务器端和客户端,其中服务器端包括:数据库构建模块、自动生成工作流模块、服务发现模块和服务组合模块;客户端包括:需求语义输入模块和展示模块;方法包括:根据输入需求语义、领域库和行为库自动生成工作流;对生成的工作流进行细微调整;根据工作流和服务的语义信息,通过语义相似度计算获得候选服务集;根据服务的QoS信息选择一条既能满足用户QoS约束,同时QoS属性最优的执行路径。本发明可以实现大规模复杂软件的真正自动演化生长,不需要人工干预提供工作流,极大提高了服务组合效率。

Description

一种基于语义的自动服务组合系统及方法
技术领域
本发明涉及一种基于语义的自动服务组合系统及方法,属于计算机互联网技术领域。
背景技术
随着互联网行业的迅猛发展,越来越多的在线商业解决方案被提出。然而任何一个服务都只能满足相对单一的客户需求。服务提供商们迫切希望现有的服务能够被方便地组合成功能更加强大的增值服务,用来满足更为多样化的需求,所以人们提出了Web服务组合的概念。目前自动服务组合有两大类方法:一类是利用工作流,另一类是利用AI planning。目前利用工作流的方法都是假定工作流是由用户给定,不能完成工作流自动生成。
进一步检索发现,中国专利申请号201110051185,公开了一种基于QoS历史记录的服务组合优化方法,包括以下步骤:获取数据集,所述数据集由各个web服务的QoS历史记录组成;求解前N个最优的基于历史记录的组合方案;计算服务贡献度,利用上步中产生的前N个最优的基于QoS历史记录的组合方案,计算各个服务的贡献度值,从而为服务组合中的每个任务选择符合要求的web服务;且对每个任务的候选服务而言,拥有最高贡献度值的那个服务将被选出,参加最优服务组合方案的执行。该发明的优点在于利用了服务的QoS历史记录做决策,更加客观,可信,提出了贡献度的变量参数,根据服务贡献度值的大小,来决定哪些服务参与最终的最优组合方案,从而使得最后的组合方案的可信度更高。但是该方法没有自动生成工作流,假定工作流是用户给定的。
进一步检索发现,中国专利申请号201110030391,提供一种支持Top K查询的自动服务组合方法,包括:用户提交用于请求前K个质量最好的服务组合结果的查询请求,根据该查询请求以及多个原子服务的输入参数、输出参数、原子服务间的匹配关系建立服务依赖图,由所述服务依赖图找出满足所述查询请求第一最优关键路径;将所述第一最优关键路径保存在集合中;从所述集合中选取总服务质量值all QoS最优的关键路径作为当前的最优关键路径,并生成对应的服务组合结果,然后对当前的最优关键路径进行松弛操作,生成新的关键路径,并放入所述集合中;重复上述操作,直到已经找到的所有服务组合结果的数目达到用户所需要的K值。该发明提高了求最优服务组合的结果的自动化程度,但是该自动化研究的是在AI planning领域,而不是基于工作流的方法。
综上,现有技术都没有从根本上完成自动生成工作流,针对此不足,本发明提出了一种能够自动生成工作流的服务组合方法;并且在服务组合模块进行了改进,使得在满足服务组合查全率的同时,提高了服务组合的查准率。
发明内容
本发明技术解决问题:为了解决工作流不能自动生成,需要用户提供的问题,提供一种基于语义的自动服务组合系统及方法,实现工作流的自动生成,使得工作流生成不需要人工干预提供工作流,极大提高了服务组合的自动化效率。
本发明的技术解决方案:一种基于语义的自动服务组合系统,其特征在于包括:服务器端和客户端,其中服务器端包括:数据库构建模块、自动生成工作流模块、服务发现模块和服务组合模块;客户端包括:需求语义输入模块和展示模块,其中:
数据库构建模块包括构建领域库、行为库和服务资产库;所述领域库是指用户提出的需求所在的业务领域,领域库包括领域名以及该领域名所对应的特征性词库;所述行为库是指用户提出的需求所要完成的操作,行为库首先按业务领域来区分,对每一个具体业务领域,都有一组行为集合构成这个业务领域的所有行为,行为库包括行为名、对应的领域名、能描述该行为的特征性词库,以及该行为对应的工作流;所述服务资产库是指注册了的所有可用服务组成的服务集,服务资产库中的每一个服务均包括服务功能描述和QoS属性;所述服务功能描述指语义短语,表明这个服务所能完成的功能;所述QoS属性必须包含常用的5类属性:执行价格、执行时间、可靠性、可用性和信誉度;所述领域库和行为库为自动生成工作流模块提供分析数据;所述服务资产库为服务发现模块和服务组合模块提供数据;
自动生成工作流模块,对用户给出的需求语义进行分析,构建依存树;根据依存树,提取出需求语义中描述领域相关部分的词汇作为领域词,描述行为相关部分的词汇作为行为词;通过领域词和领域库中得领域名进行语义相似度匹配,找到与领域词最相近的领域名作为领域;通过行为词和行为库中该领域的行为集的行为名进行语义相似度匹配,找到与行为词最相近的行为名作为行为;根据领域和行为从行为库中找到对应的工作流,调整所获得的工作流,对工作流中的领域用领域词进行替换,行为用行为词进行替换,获得最终的工作流,并将工作流送至服务发现模块;
服务发现模块,根据自动生成工作流模块得到的工作流,为工作流中的每个任务从服务资产库中选择出一个能够完成该任务的候选服务集,根据任务和服务功能进行语义相似度匹配,把相似度值高于某一给定阈值的都列入候选服务集中,并将得到的每个任务对应的候选服务集送至服务组合模块;
服务组合模块,首先通过工作流聚合方法将工作流中并发、选择、循环等结构都归并成只有顺序结构的工作流,接着采用回溯算法为每个任务从服务发现模块提供的候选服务集中选择一个具体服务,使得整个工作流在满足用户提出的QoS约束下,还能使用户关注的QoS属性达到最优;其中服务QoS是通过查询数据库构建模块中的服务资产库得到的。
所述服务发现模块具体实现如下:
(1)对抽象服务进行分词,抽象服务指的是工作流中任务的语义描述,抽象服务进行分词后的结果记为集合A={A1,A2,…,Am}。
(2)对具体服务进行分词,具体服务指的是服务资产库中服务功能的语义描述,具体服务分词后的结果记为集合B={B1,B2,…,Bn};
(3)计算抽象服务和具体服务的短语相似度;
(4)根据给定的阈值,将步骤(3)中计算得到的短语相似度值大于阈值的具体服务选取到候选服务集中;
所述步骤(3)中计算抽象服务和具体服务的短语相似度的方法如下:
(31)首先计算集合A中的元素Ai(i=1)与集合B中所有元素两两之间的相似度,结果记为集合C={Ci1,Ci2,…,Cin};
(32)在集合C中选择相似度值最大的一个记为Cij,它是集合A中的Ai和集合B中的Bj的相似度;
(33)集合A中的元素Ai的相似度值simAi记为Cij,并且从集合B中删除步骤(32)中找到的Bj
(34)令i分别为2,3,…,重复步骤(31)到(33),直到i等于m或者集合B已经为空;
(35)集合A中没有建立起对应关系的元素与空元素对应,假定A集合中与空元素对应的元素的相似度值为0;
(36)通过上述计算后,得到了A集合中每个词的相似度值SimA={simA1,simA2,…,simAm},采用加权平均方法来计算短语相似度的值:
Sim = Σ l = 1 m sim A 1 / m .
所述服务组合模块具体实现如下:
(1)QoS归一化,指将单个服务的各个QoS属性值归一化为0到1的值,使不同QoS属性之间具有可比性;
(2)相似度计算,在服务发现阶段求得的,它表示的是两个服务之间的相关程度;
(3)工作流聚合,利用步骤(1)中归一化的QoS和步骤(2)中的相似度值将工作流中的选择结构,并发结构,循环结构都转化成顺序结构;
(4)计算单个服务总QoS,指将步骤(1)中归一化后的QoS的各个属性值按照一定权重比例相加作为服务的总QoS值;
(5)计算单个服务总得分,指将步骤(4)中计算得到的总QoS值和步骤(2)中的相似度按照一定权重比例相加作为服务的总得分;
(6)回溯算法,指根据步骤(5)计算得到的单个服务总得分和步骤(3)中工作流聚合之后的工作流,利用回溯算法,选择一条最优执行路径。
一种基于语义的自动服务组合系统及方法,实现步骤如下:
第一步,构建领域库
领域库由业务领域名以及该领域名所对应的特征性词库,特征性词库表示的是该领域经常出现的关键词,即该特征性词能够说明这个词很可能描述的就是该领域;领域知识库可以分级,不断缩小领域的范围;领域库将为自动生成工作流模块提供数据;
第二步,构建行为库
行为库包括行为名,对应的领域名,能描述该行为的特征性词库,以及该行为对应的工作流,行为库将为自动生成工作流模块提供数据;
第三步,构建服务资产库
服务资产库是指注册了的所有可用服务组成的服务集,服务资产库中的每一个服务必须有的属性为服务的功能描述和QoS;QoS包含常用的5类属性:执行价格、执行时间、可靠性、可用性和信誉度;对于那些QoS性能实时在改变的服务,也可以通过情景感知来实时自动的获得服务的QoS;服务资产库将为服务发现模块和服务组合模块提供数据;
第四步,自动生成工作流
根据用户提供的需求语义自动生成出能够完成用户需求的工作流,它是通过借助构建数据库模块中的领域库和行为库完成的;首先对用户的需求语义进行分析,提取出领域相关词汇和行为相关词汇;接着利用领域相关词汇在领域库中搜索匹配,得到需求所在的领域;然后利用行为相关词汇在对应领域的行为集中搜索匹配,得到需求对应的行为;最后根据行为库中提取出来的工作流,对工作流中的领域词和行为词进行替换以后,获得最终的工作流;利用构建数据库模块中的领域库和行为库的数据,获得用户给定的需求语义对应的工作流;
第五步,服务发现
服务发现是为服务组合做准备,它是指为工作流中的每个任务选择出一个可以完成该功能的候选服务集;服务发现主要是根据任务和服务功能进行语义相似度匹配,把相似度值高于某一给定阈值的都列入候选服务集中;此部分根据自动生成工作流得到的工作流,通过语义相似度匹配,得到每个任务对应的候选服务集;
第六步,服务组合
服务组合是指为每个任务需要从服务发现提供的候选服务集中选择一个具体的服务,使得整个工作流在满足用户提出的QoS约束下,还能使得用户关注的QoS达到最优,其中服务的QoS是通过查询数据库构建模块中的服务资产库得到的。
本发明与现有技术相比的优点在于:
(1)本发明通过构建领域库和行为库,分析用户的需求语义所在领域和行为解决了从语义到工作流的自动生成问题,使得工作流生成不需要人工干预提供工作流,极大提高了服务组合的自动化效率。
(2)在服务组合模块中,通过引入服务发现模块计算得到的相似度作为服务是否可靠的一个衡量因素,使得服务组合在保证查全率的同时,提高了服务组合的查准率。
附图说明
图1为本发明的系统组成框图;
图2为本发明中自动生成工作流模块实现流程图;
图3为本发明中服务发现模块流程图;
图4为本发明中服务组合模块流程图。
具体实施方式
下面结合说明书附图,对本发明的具体实施方式做详细描述。
如图1所示,本发明基于语义的自动服务组合系统及方法,其中服务器端包括:数据库构建模块、自动生成工作流模块、服务发现模块、服务组合模块;客户端包括:需求语义输入模块和展示模块。数据库构建模块主要构建3个数据库:领域库,行为库和服务资产库。其中领域库和行为库为自动生成工作流模块提供数据,服务资产库为服务发现模块和服务组合模块提供数据。自动生成工作流模块利用数据库构建模块中的领域库和行为库将用户输入的需求语义变成工作流,将求得的工作流发送至服务发现模块。服务发现模块是指为工作流中的每个任务选择出一个可以完成该功能的候选服务集,将求得的候选服务集发送至服务组合模块。服务组合模块是指为每个任务需要从服务发现模块提供的候选服务集中选择一个具体的服务,使得整个工作流在满足用户提出的QoS约束下,还能使得用户关注的QoS属性达到最优。需求语义输入模块供用户输入需求语义,需求语义将被发送至服务器端,服务器端会将最终服务组合结果返回给客户端,展示模块会将返回结果用图形化方式展现出来。
构建数据库模块实现如下:
第一步,构建领域库
领域库由业务领域名以及该领域名所对应的特征性词库,特征性词库表示的是该领域经常出现的关键词,即该特征性词能够说明这个词很可能描述的就是该领域。领域知识库可以分级,不断缩小领域的范围,比如第一级如果是旅行,第二级可以是国内旅行和国外旅行。
第二步,构建行为库
行为库包括行为名,对应的领域名,能描述该行为的特征性词库,以及该行为对应的工作流。行为知识库按领域知识来分,每一个领域知识对应一个行为集。之所以这样做的原因是因为同一个行为对应到不同领域它的意义可能不同,对应的工作流自然也会不同。
第三步,构建服务资产库
服务资产库中的服务可以是第三方提供的,只要他们将自己的服务注册到本发明的平台。服务资产库中的每一个服务必须有的属性为服务的功能描述和QoS。QoS必须包含常用的5类属性:执行价格,执行时间,可靠性,可用性和信誉度。对于那些QoS性能实时在改变的服务,也可以通过情景感知来实时自动的获得服务的QoS。
第四步,自动生成工作流
自动生成工作流的任务是要根据用户提供的语义需求自动生成出能够完成用户需求的工作流。它是通过借助领域库和行为库完成的。首先对用于的需求语义进行分析,提取出领域相关词汇和行为相关词汇。接着,利用领域相关词汇在领域库中搜索匹配,得到需求对应的领域;利用行为相关词汇在对应领域的行为集中搜索匹配,得到需求对应的行为。最后根据行为库中提取出来的工作流,对工作流中的领域词和行为词进行替换以后,获得最终的工作流。
第五步,服务发现
服务发现是为服务组合做准备,它是指为工作流中的每个任务选择出一个可以完成该功能的候选服务集。服务发现主要是根据任务和服务功能进行语义相似度匹配,把相似度值高于某一给定阈值的都列入候选服务集中。
第六步,服务组合
服务组合是指为每个任务需要从服务发现提供的候选服务集中选择一个具体的服务,使得整个工作流在满足用户提出的QoS约束下,还能使得用户关注的QoS属性达到最优。服务组合中主要用到了工作流聚合和回溯算法。
如图2所示,本发明的自动生成工作流模块的实现流程如下:
(1)对需求语义进行分析,构建依存树。依存树能够很好反应语义的从属关系。
(2)根据依存树,提取出需求语义中的领域词和行为词。主要是根据依存树反映出的语义的从属关系来判断出需求语义中的领域词和行为词。
(3)在领域库中搜索领域词相关的领域。搜索指将领域词和领域库中的特征词进行语义相似度计算,将相似度值大于给定阈值的领域标记为与该搜索领域词相关的领域。
(4)根据搜索得到的领域,在行为库中该领域的行为集中搜索行为词相关的行为。此步骤的搜索是指将行为词和对应步骤(3)获得的领域对应的行为集中的行为名称进行语义相似度计算,将相似度值大于给定阈值的行为标记为与该行为词相关的行为。
(5)根据领域和行为从行为库中找到对应的工作流。
(6)调整上一步中获得的工作流。对工作流中的领域用领域词进行替换,行为用行为词进行替换。
如图3所示,本发明的服务发现模块的实现流程如下:
(1)对抽象服务进行分词,抽象服务指的是工作流中任务的语义描述。抽象服务分词结果记为集合A={A1,A2,…,Am},其中m表示抽象服务一共分成了m个词。
(2)对具体服务进行分词,具体服务指的是服务资产库中服务的功能的语义描述。具体服务分词结果记为B={B1,B2,…,Bn},其中n表示抽象服务一共分成了n个词。
(3)计算抽象服务和具体服务的短语相似度;
(4)根据给定的阈值,将步骤(3)中计算得到的短语相似度值大于阈值的具体服务选取到候选服务集中;
所述步骤(3)中计算抽象服务和具体服务短语相似度的方法如下:
(31)首先计算集合A中的元素Ai(i=1)与集合B中所有元素两两之间的相似度,结果记为集合C={Ci1,Ci2,…,Cin}
(32)在集合C中选择相似度值最大的一个记为Cij,它是集合A中的Ai和集合B中的Bj的相似度。
(33)集合A中的元素Ai的相似度值simAi记为Cij,并且从集合B中删除步骤(32)中找到的Bj
(34)令i分别为2,3,…,重复步骤(31)到(33),直到i等于m或者集合B已经为空。
(35)集合A中没有建立起对应关系的元素与空元素对应,假定A集合中与空元素对应的元素的相似度值为0;
(36)通过上述计算后,得到了A集合中每个词的相似度值SimA={simA1,simA2,…,simAm},采用加权平均方法来计算短语相似度的值:
Sim = Σ l = 1 m sim A 1 / m .
如图4所示,本发明的服务组合模块的实现流程如下:
(1)QoS归一化,指将单个服务的各个QoS属性值归一化为0到1的值,使不同QoS属、性之间具有可比性。QoS可以分为两类:正指标和负指标。正指标表示属性值越大,服务质量越好,如:可用性、可靠性、信誉度。负指标表示属性值越大,服务质量越差,如:执行价格,响应时间。正指标和负指标的归一化算法应该不同。
(2)相似度计算,在服务发现阶段求得的,它表示的是两个服务之间的相关程度。
(3)工作流聚合,指利用步骤(1)中归一化的QoS和步骤(2)中的相似度值将工作流中的选择结构,并发结构,循环结构都转化成顺序结构。工作流的四种结构会增加服务组合的复杂度,所以本文先通过聚合算法,将工作流转化成只有顺序结构的形式。聚合算法的主要思想是将每个选择、并行和循环结构对应的服务分别看成一个完整的虚拟服务。
(4)计算单个服务总QoS,指将步骤(1)中归一化后的QoS的各个属性值按照一定权重比例相加作为服务的总QoS值,公式为:
Figure BDA0000477903500000081
其中,wi表示的QoS中第i个属性的权重,Vi表示的是QoS中第i个属性归一化之后的值。
(5)计算单个服务总得分,指将步骤(4)中计算得到的总QoS值和步骤(2)中的和相似度按照一定权重比例相加作为服务的总得分,公式为:Score(sum)=w1×Score(qos)+w2×Score(sim)/m。其中Score(qos)表示单个服务的总QoS值,Score(sim)表示单个服务的相似度值,w1和w2分别表示单个服务的总QoS得分权重和相似度的权重,w1+w2=1,m表示的是工作流中顺序的执行任务的总个数。
(6)回溯算法,指根据步骤(5)计算得到的单个服务总得分和步骤(3)中工作流聚合之后的工作流,利用回溯算法,选择一条最优执行路径。
本发明未详细阐述部分属于本领域技术人员的公知技术。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (4)

1.一种基于语义的自动服务组合系统,其特征在于包括:服务器端和客户端,其中服务器端包括:数据库构建模块、自动生成工作流模块、服务发现模块和服务组合模块;客户端包括:需求语义输入模块和展示模块,其中:
数据库构建模块包括构建领域库、行为库和服务资产库;所述领域库是指用户提出的需求所在的业务领域,领域库包括领域名以及该领域名所对应的特征性词库;所述行为库是指用户提出的需求所要完成的操作,行为库首先按业务领域来区分,对每一个具体业务领域,都有一组行为集合构成这个业务领域的所有行为,行为库包括行为名、对应的领域名、能描述该行为的特征性词库,以及该行为对应的工作流;所述服务资产库是指注册了的所有可用服务组成的服务集,服务资产库中的每一个服务均包括服务功能描述和QoS属性;所述服务功能描述指语义短语,表明这个服务所能完成的功能;所述QoS属性必须包含常用的5类属性:执行价格、执行时间、可靠性、可用性和信誉度;所述领域库和行为库为自动生成工作流模块提供分析数据;所述服务资产库为服务发现模块和服务组合模块提供数据;
自动生成工作流模块,对用户给出的需求语义进行分析,构建依存树;根据依存树,提取出需求语义中描述领域相关部分的词汇作为领域词,描述行为相关部分的词汇作为行为词;通过领域词和领域库中的领域名进行语义相似度匹配,找到与领域词最相近的领域名作为领域;通过行为词和行为库中该领域的行为集的行为名进行语义相似度匹配,找到与行为词最相近的行为名作为行为;根据领域和行为从行为库中找到对应的工作流,调整所获得的工作流,对工作流中的领域用领域词进行替换,行为用行为词进行替换,获得最终的工作流,并将工作流送至服务发现模块;
服务发现模块,根据自动生成工作流模块得到的工作流,为工作流中的每个任务从服务资产库中选择出一个能够完成该任务的候选服务集,根据任务和服务功能进行语义相似度匹配,把相似度值高于某一给定阈值的都列入候选服务集中,并将得到的每个任务对应的候选服务集送至服务组合模块;
服务组合模块,首先通过工作流聚合方法将工作流中并发、选择、循环等结构都归并成只有顺序结构的工作流,接着采用回溯算法为每个任务从服务发现模块提供的候选服务集中选择一个具体服务,使得整个工作流在满足用户提出的QoS约束下,还能使用户关注的QoS属性达到最优;其中服务QoS是通过查询数据库构建模块中的服务资产库得到的。
2.根据权利要求1所述基于语义的自动服务组合系统,其特征在于:所述服务发现模块具体实现如下:
(1)对抽象服务进行分词,抽象服务指的是工作流中任务的语义描述,抽象服务进行分词后的结果记为集合A={A1,A2,…,Am}。
(2)对具体服务进行分词,具体服务指的是服务资产库中服务功能的语义描述,具体服务分词后的结果记为集合B={B1,B2,…,Bn};
(3)计算抽象服务和具体服务的短语相似度;
(4)根据给定的阈值,将步骤(3)中计算得到的短语相似度值大于阈值的具体服务选取到候选服务集中;
所述步骤(3)中计算抽象服务和具体服务的短语相似度的方法如下:
(31)首先计算集合A中的元素Ai(i=1)与集合B中所有元素两两之间的相似度,结果记为集合C={Ci1,Ci2,…,Cin};
(32)在集合C中选择相似度值最大的一个记为Cij,它是集合A中的Ai和集合B中的Bj的相似度;
(33)集合A中的元素Ai的相似度值simAi记为Cij,并且从集合B中删除步骤(32)中找到的Bj
(34)令i分别为2,3,…,重复步骤(31)-(33),直到i等于m或者集合B已经为空;
(35)集合A中没有建立起对应关系的元素与空元素对应,假定A集合中与空元素对应的元素的相似度值为0;
(36)通过上述计算后,得到了A集合中每个词的相似度值SimA={simA1,simA2,…,simAm},采用加权平均方法来计算短语相似度的值:
Sim = Σ l = 1 m sim A 1 / m .
3.根据权利要求1所述基于语义的自动服务组合系统,其特征在于:所述服务组合模块具体实现如下:
(1)QoS归一化,指将单个服务的各个QoS属性值归一化为0到1的值,使不同QoS属
性之间具有可比性;
(2)相似度计算,在服务发现阶段求得的,它表示的是两个服务之间的相关程度;
(3)工作流聚合,利用步骤(1)中归一化的QoS和步骤(2)中的相似度值将工作流中的选择结构,并发结构,循环结构都转化成顺序结构;
(4)计算单个服务总QoS,指将步骤(1)中归一化后的QoS的各个属性值按照一定权重比例相加作为服务的总QoS值;
(5)计算单个服务总得分,指将步骤(4)中计算得到的总QoS值和步骤(2)中的相似度按照一定权重比例相加作为服务的总得分;
(6)回溯算法,指根据步骤(5)计算得到的单个服务总得分和步骤(3)中工作流聚合之后的工作流,利用回溯算法,选择一条最优执行路径。
4.一种基于语义的自动服务组合方法,其特征在于实现步骤如下:
第一步,构建领域库
领域库由业务领域名以及该领域名所对应的特征性词库,特征性词库表示的是该领域经常出现的关键词,即该特征性词能够说明这个词很可能描述的就是该领域;领域知识库可以分级,不断缩小领域的范围;领域库将为自动生成工作流模块提供数据;
第二步,构建行为库
行为库包括行为名,对应的领域名,能描述该行为的特征性词库,以及该行为对应的工作流,行为库将为自动生成工作流模块提供数据;
第三步,构建服务资产库
服务资产库是指注册了的所有可用服务组成的服务集,服务资产库中的每一个服务必须有的属性为服务的功能描述和QoS;QoS包含常用的5类属性:执行价格、执行时间、可靠性、可用性和信誉度;对于那些QoS性能实时在改变的服务,也可以通过情景感知来实时自动的获得服务的QoS;服务资产库将为服务发现模块和服务组合模块提供数据;
第四步,自动生成工作流
根据用户提供的需求语义自动生成出能够完成用户需求的工作流,它是通过借助构建数据库模块中的领域库和行为库完成的;首先对用户的需求语义进行分析,提取出领域相关词汇和行为相关词汇;接着利用领域相关词汇在领域库中搜索匹配,得到需求所在的领域;然后利用行为相关词汇在对应领域的行为集中搜索匹配,得到需求对应的行为;最后根据行为库中提取出来的工作流,对工作流中的领域词和行为词进行替换以后,获得最终的工作流;利用构建数据库模块中的领域库和行为库的数据,获得用户给定的需求语义对应的工作流;
第五步,服务发现
服务发现是为服务组合做准备,它是指为工作流中的每个任务选择出一个可以完成该功能的候选服务集;服务发现主要是根据任务和服务功能进行语义相似度匹配,把相似度值高于某一给定阈值的都列入候选服务集中;此部分根据自动生成工作流得到的工作流,通过语义相似度匹配,得到每个任务对应的候选服务集;
第六步,服务组合
服务组合是指为每个任务需要从服务发现提供的候选服务集中选择一个具体的服务,使得整个工作流在满足用户提出的QoS约束下,还能使得用户关注的QoS达到最优,其中服务的QoS是通过查询数据库构建模块中的服务资产库得到的。
CN201410099241.6A 2014-03-17 2014-03-17 一种基于语义的自动服务组合系统及方法 Expired - Fee Related CN103838857B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410099241.6A CN103838857B (zh) 2014-03-17 2014-03-17 一种基于语义的自动服务组合系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410099241.6A CN103838857B (zh) 2014-03-17 2014-03-17 一种基于语义的自动服务组合系统及方法

Publications (2)

Publication Number Publication Date
CN103838857A true CN103838857A (zh) 2014-06-04
CN103838857B CN103838857B (zh) 2017-02-15

Family

ID=50802354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410099241.6A Expired - Fee Related CN103838857B (zh) 2014-03-17 2014-03-17 一种基于语义的自动服务组合系统及方法

Country Status (1)

Country Link
CN (1) CN103838857B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105119961A (zh) * 2015-07-14 2015-12-02 中国传媒大学 基于本体的语义Web服务自动组合方法
CN106529801A (zh) * 2016-11-09 2017-03-22 北京航空航天大学 服务组合候选集构建方法及系统
CN107967135A (zh) * 2017-10-31 2018-04-27 平安科技(深圳)有限公司 计算引擎实现方法、电子装置及存储介质
CN108319591A (zh) * 2018-02-05 2018-07-24 深圳市沃特沃德股份有限公司 实现语音翻译的方法、装置和语音翻译设备
CN109783719A (zh) * 2018-12-29 2019-05-21 北京奇安信科技有限公司 基于单位名称的资产数据查找方法、装置、设备及介质
CN112765407A (zh) * 2020-12-30 2021-05-07 重庆邮电大学 物联网环境下基于用户偏好的QoS服务组合方法
US11495119B1 (en) 2021-08-16 2022-11-08 Motorola Solutions, Inc. Security ecosystem
CN117151431A (zh) * 2023-10-30 2023-12-01 四川省致链数字科技有限公司 一种木质家具订单任务的自动分发方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473100B (zh) * 2013-09-17 2016-08-17 中国科学院软件研究所 一种基于依赖关系的Web服务替换方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
武彩红: ""基于QoS的语义Web服务组合研究"", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *
陈飞: ""基于工作流的语义Web服务动态组合模型及实现"", 《中国优秀硕士学位论文全文数据库-信息科技辑》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105119961B (zh) * 2015-07-14 2019-01-15 中国传媒大学 基于本体的语义Web服务自动组合方法
CN105119961B9 (zh) * 2015-07-14 2019-03-12 中国传媒大学 基于本体的语义Web服务自动组合方法
CN105119961A (zh) * 2015-07-14 2015-12-02 中国传媒大学 基于本体的语义Web服务自动组合方法
CN106529801A (zh) * 2016-11-09 2017-03-22 北京航空航天大学 服务组合候选集构建方法及系统
CN106529801B (zh) * 2016-11-09 2019-11-01 北京航空航天大学 服务组合候选集构建方法及系统
CN107967135B (zh) * 2017-10-31 2020-11-13 平安科技(深圳)有限公司 计算引擎实现方法、电子装置及存储介质
CN107967135A (zh) * 2017-10-31 2018-04-27 平安科技(深圳)有限公司 计算引擎实现方法、电子装置及存储介质
CN108319591A (zh) * 2018-02-05 2018-07-24 深圳市沃特沃德股份有限公司 实现语音翻译的方法、装置和语音翻译设备
CN109783719A (zh) * 2018-12-29 2019-05-21 北京奇安信科技有限公司 基于单位名称的资产数据查找方法、装置、设备及介质
CN112765407A (zh) * 2020-12-30 2021-05-07 重庆邮电大学 物联网环境下基于用户偏好的QoS服务组合方法
CN112765407B (zh) * 2020-12-30 2022-11-11 重庆邮电大学 物联网环境下基于用户偏好的QoS服务组合方法
US11495119B1 (en) 2021-08-16 2022-11-08 Motorola Solutions, Inc. Security ecosystem
CN117151431A (zh) * 2023-10-30 2023-12-01 四川省致链数字科技有限公司 一种木质家具订单任务的自动分发方法及系统
CN117151431B (zh) * 2023-10-30 2024-01-26 四川省致链数字科技有限公司 一种木质家具订单任务的自动分发方法及系统

Also Published As

Publication number Publication date
CN103838857B (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN103838857A (zh) 一种基于语义的自动服务组合系统及方法
CN107609052B (zh) 一种基于语义三角的领域知识图谱的生成方法及装置
CN110704743B (zh) 一种基于知识图谱的语义搜索方法及装置
Elmeleegy et al. Mashup advisor: A recommendation tool for mashup development
Paliwal et al. Semantics-based automated service discovery
Gilson et al. From web data to visualization via ontology mapping
CN102968465B (zh) 网络信息服务平台及其基于该平台的搜索服务方法
US20160275196A1 (en) Semantic search apparatus and method using mobile terminal
CN111382276B (zh) 一种事件发展脉络图生成方法
CN112765477B (zh) 信息处理、信息推荐的方法和装置、电子设备和存储介质
CN105955981A (zh) 一种基于需求分类和主题分析的个性化旅行包推荐方法
CN105095433A (zh) 实体推荐方法及装置
CN104899229A (zh) 基于群体智能的行为聚类系统
CN112052322B (zh) 一种基于粒计算的智能机器人对话策略生成方法
CN104021125A (zh) 一种搜索引擎排序的方法、系统以及一种搜索引擎
CN112508743B (zh) 技术转移办公室通用信息交互方法、终端及介质
CN102968419A (zh) 交互式互联网实体名称的消歧方法
An et al. A heuristic approach on metadata recommendation for search engine optimization
CN103020083A (zh) 需求识别模板的自动挖掘方法、需求识别方法及对应装置
CN104156431A (zh) 一种基于实体图社团结构的rdf关键词查询方法
CN103294791A (zh) 一种可扩展标记语言模式匹配方法
CN109460506B (zh) 一种用户需求驱动的资源匹配推送方法
CN113836395B (zh) 一种基于异构信息网络的服务开发者按需推荐方法及系统
CN116186298A (zh) 信息检索方法和装置
JPH11272709A (ja) ファイル検索方式

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170215

Termination date: 20200317