CN109948150A - 一种多域环境中基于知识图谱的高性能服务语境发现方法 - Google Patents

一种多域环境中基于知识图谱的高性能服务语境发现方法 Download PDF

Info

Publication number
CN109948150A
CN109948150A CN201910155892.5A CN201910155892A CN109948150A CN 109948150 A CN109948150 A CN 109948150A CN 201910155892 A CN201910155892 A CN 201910155892A CN 109948150 A CN109948150 A CN 109948150A
Authority
CN
China
Prior art keywords
service
resource
information
matching
context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910155892.5A
Other languages
English (en)
Inventor
马殿富
杨俊臣
许文静
赵永望
韩军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201910155892.5A priority Critical patent/CN109948150A/zh
Publication of CN109948150A publication Critical patent/CN109948150A/zh
Pending legal-status Critical Current

Links

Abstract

一种多域环境中基于知识图谱的高性能服务语境发现方法,其特征在于,包括以下步骤:步骤1,通过语境标注对领域本体进行扩展,所述扩展方式是建立一个Web服务的领域语境模型,实现Web服务描述的语义扩展;步骤2,在服务发现过程中,对服务的功能进行语义相似度匹配;步骤3,对符合条件的服务进行接口匹配。

Description

一种多域环境中基于知识图谱的高性能服务语境发现方法
技术领域
本发明涉及一种语境发现方法,尤其涉及一种多域环境中基于知识图谱的高性能服务语境发现方法。
背景技术
从Web服务发现研究的趋势来看,研究方法的技术综合性越来越明显,特别是随着推荐算法和人工智能技术的发展,Web服务发现方法在查全率、查准率、检索效率和个性化需求方面的表现取得了较大的进展。但在大数据技术的驱动和影响下,Web服务发现方法面临的对象规模和算法复杂度都有层次性的提升,这也是未来Web服务发现研究中必须要考虑和解决的问题。
Web服务发现与传统的信息检索方法有较多相似之处,但它具有更高的技术复杂度,涉及的内容也更多,结果不确定性也更大。Web服务发现是Web服务研究领域的一个非常重要的组成部分,更是实现服务共享和重用的前提条件。服务发现的主要任务就是将服务消费者提出的服务查询与服务提供者发布的服务描述进行对比,从而找出最合适的服务对象。当前典型Web服务发现方法有:基于规则推理的服务发现、基于增强语义的服务发现、基于服务质量的服务发现、基于图的服务发现。从Web服务发现研究的趋势来看,研究方法的技术综合性越来越明显,特别是随着推荐算法和人工智能技术的发展,Web服务发现方法在查全率、查准率、检索效率和个性化需求方面的表现取得了较大的进展。当前的服务发现存在以下问题:一、无法保证搜索到的服务满足用户需求;二、无法自动从搜索结果中挑出最合适的服务;三、无法保证找到的服务是用户可用的。
发明内容
本发明针对上述问题和挑战建立基于认知语境的服务发现方法,实现服务的组织及高效发现。本发明提出一种多域环境中基于知识图谱的高性能服务语境发现方法,包括以下步骤:步骤1,通过语境标注对领域本体进行扩展,所述扩展方式是建立一个Web服务的领域语境模型,实现Web服务描述的语义扩展;步骤2,在服务发现过程中,对服务的功能进行语义相似度匹配;步骤3,对符合条件的服务进行接口匹配。
本发明结合服务的广域分布特性,探索去中心化的、基于语境的服务资源发现机制与访问模式,提升服务发现过程中的自动推理能力,其结果的准确性高。
附图说明
图1为本发明实施的具体流程图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明提出一种多域环境中基于知识图谱的高性能服务语境发现方法,包括以下步骤:步骤1,通过语境标注对领域本体进行扩展,所述扩展方式是建立一个Web服务的领域语境模型,实现Web服务描述的语义扩展;步骤2,在服务发现过程中,对服务的功能进行语义相似度匹配;步骤3,对符合条件的服务进行接口匹配。
对于语法级别的服务发现,采用语境技术的服务发现方法能够提升服务发现过程中的自动推理能力,其结果的准确性普遍较高,因此许多方法通过增强Web服务以及服务请求中的语境信息来提高服务发现的性能。通过语境标注、语境扩展等典型手段,增加服务发现两端的语境信息来凸显服务发布方和服务请求方的功能属性,使两者的表述针对性更强,语境特征更加明显,从而提高服务匹配的精度。
本发明基于认知语境的服务发现方法。将服务消费者提出的服务查询与服务提供者发布的服务描述进行对比,从而找出最合适的服务对象。当服务消费者提出查询请求后,依据具体算法对服务注册中心中存储的服务描述信息进行一一比较,并按照一定的标准将匹配后符合条件的服务列表返回给服务消费者,使之能从服务提供者调用相关服务。
本发明基于本体资源标注的语境服务发现算法为设置一种检索引导机制,从层次结构上,可以将基于本体资源标注的站内检索划分为5个层次:
1)信息资源和本体层,从Web网页中抽取信息资源作为站内检索系统处理的信息对象,所述信息资源主要是文本信息。目标是将文本里包含的信息进行结构化处理,变成表格一样的组织形式,本体提供概念知识体系的语义共享和表达;
2)资源组织层,主要指对信息资源的预处理工作、对信息对象的概念标引等;
资源组织层通过对本体资源标注进行预处理。具体实现为本体OntoTour的处理和转换。经Protégé本体OntoTour以OWL文件的形式存储于计算机中。为了便于对站内资源进行概念标引,笔者将本体转换成XML文件,利用JDOM生成本体可视化的树形结构。此外,提取本体OntoTour中同义的概念组对,生成同义词典,在一定程度上实现语义检索功能,弥补了基于字面匹配检索的缺陷;提取具有上下位类关系的概念三元组,为语义检索和检索分类导航的构建提供数据支持。
资源概念标注的作用就是将Web网页中的资源对象按照一定的规则组织起来,使之成为结构化的、有序的信息,从而支持信息检索服务。旅游网站Web页面包括文本、图片、视频等资源。参考主题标引方法,将网页中文本、图片和视频分离出来,运用本体中的概念术语对资源对象进行主题标引,添加概念标签,使资源对象与本体概念节点构成多对多的映射关系。即数据库存储中,除了资源对象本身的信息外,增加了与本体概念映射的概念标签字段,使URL地址、图片、视频等多媒体资源具有本体概念的规范化语义表述。
3)资源存储层,将资源组织处理的结果存入数据库中,包括网页资源元数据、资源对象概念标签索引、资源本体映射索引等;
4)检索处理层,是站内检索系统的功能层、在对用户提问进行语义处理的基础上,由基于用户提问的信息提示导航和基于检索结果分类的多维分类导航构成语境导航。将信息提示、分类导航与一般的信息检索相结合,有效引导帮助用户快速查找所需信息;所述的一般的信息检索为基于关键词匹配的信息检索和基于语义的信息检索。
5)用户交互层,将各种信息表征符号集成在人机交互界面上,实现系统功能,满足用户浏览和检索等信息获取的需求。
在步骤2中,建立基于认知语境的服务发现方法,实现服务的组织及高效发现;服务发现的主要任务就是将服务消费者提出的服务查询与服务提供者发布的服务描述进行对比,从而找出最合适的服务对象。当服务消费者提出查询请求(该请求可能是关于服务名称、服务的输入输出参数、服务的功能、服务QoS等方面的一个或者多个具体需求)后,依据具体算法对服务注册中心中存储的服务描述信息进行一一比较,此过程为服务匹配,然后按照一定的标准,将匹配后符合条件的服务列表返回给服务消费者,服务消费者从中做出选择后即可从服务提供者调用相关服务。服务匹配是服务发现的关键,服务匹配依据的算法性能决定了服务发现的结果性能,服务匹配的对象和参数也会影响最终的结果。
通过对用户的检索行为研究发现,用户查询信息时通常会先使用关键词检索,在此基础上再通过分类导航缩小检索范围,从而提高信息检索的效率,并且使得原本排在后面的查询结果也可能被用户关注。
本发明语义相似度匹配处理流程主要包括以下三个步骤:
步骤2-1,查询处理;
查询处理,分为两步:利用本体包含的同义词词典对用户提问进行规范化处理,转换成本体中规范的概念描述,并进行下位类语义扩展,从而构成用户提问的概念集合,丰富检索项的语义信息;将扩展的提问集合与网站信息资源的概念标签进行关键词匹配,得到检索结果数据,存储为临时表。对用户查询的语义处理,克服了简单字面查询匹配存在的语义信息缺失问题,提高了检索的查全率。
所述规范化处理的具体方式为,用户提问相当于检索词,是能概括要检索内容的相关词汇。检索词是表达信息需求和检索课题内容的基本单元,与系统中有关据库进行匹配运算的基本单元,根据用户的提问将其内容提取出关键字,然后拆分语句,划分类别,进行检索。
所述规范的概念描述包括:⑴从词的性质来划分,检索词可以划分为四类:表示主题的检索词、表示作者的检索词、表示分类的检索词和表示特殊意义的检索词;⑵从语言的规范性方面来划分,检索词又可以划分为两类:受控词和非受控词。
步骤2-2,检索结果概念词统计;
获取检索结果后,对所有检索结果的概念标签中出现的概念词语及其次数进行统计,形成检索结果的概念词频统计表。
步骤2-3,构建多维分类导航;
在本体中查找检索结果的标引概念,获取该概念的上位类,根据本体中概念的上下位类关系,构建具有一定层次结构的分类导航,并在类目后面标记该类目对应的网站资源对象的数量。
所述构建方法为:输入为检索结果概念集合(C1,C2,…Cn),本体体系结构;输出为分类导航树形结构。
具体包括以下步骤:
1)在本体中查找概念集合中每个概念Ci的上下位类,
构建Ci二元概念组<Cif,Ci>。Cif表示Ci的上位类。
2)以C1三元概念组创建初始分类树T,构建分类概念集合C(C1f,C1)。
3)判断概念集合C中是否包含Ci概念组<Cif,Ci>中Cif。若包含转步骤4),若不包含转步骤5)。
4)判断概念集合C中是否包含概念组<Cif,Ci>中Ci,若存在,则i加1转步骤3);若不包含,在分类树T的Cif节点下添加子节点Ci,并将Ci添加到概念集合C中,再设置i加1转步骤3)。
5)判断概念集合C中是否包含概念组<Cif,Ci>中Ci,若存在则在分类树T中增添Cif节点,将以Ci为根节点的树链接到Cif下,将Cif添加到概念集合C中,设置i加1转步骤3);若不存在,在分类树T的增添新根节点Cif,再添加它的子节点Ci,并将Cif和Ci添加到概念集合C中,设置i加1转步骤3)。
6)返回分类树T。
在步骤3对符合条件的服务再进行接口匹配的具体实现为,基于检索结果的多维分类导航是一种基于本体概念体系和检索结果的多维分类呈现,该分类导航的优点在于:本体规范的概念集和体系结构保证了分类导航的科学性和逻辑性;只对检索结果构建分类体系,将与用户检索目标无关的类目排除,有效减轻了用户对分类导航的认知负荷;将分类导航作为关键词检索的辅助工具,能有效帮助用户改善检索表达式,扩展检索意图,调整检索范围。
基于接口匹配的服务发现方法基于现有的Web服务描述信息和现有的服务实现支持协议,使用标准的WSDL(Web Services Description Language)。用户提供服务接口的输入和输出描述,根据基于接口匹配的服务发现算法从服务数据库中发现符合用户需求的服务。
在已有基于接口的服务发现算法的基础上,提出基于接口综合匹配的服务发现方法。该方法综合楼服务接口的功能性因素(即输入、输出接口的描述,包括参数次序、参数名称和参数类型)和非功能性因素(包括接口的Qos、接口上下文等问题),计算出需求接口与待选服务接口的综合匹配度。
基于接口综合匹配的服务发现方法将运用二分图匹配的方法计算服务接口中复杂类型参数的匹配。在对Web服务的参数类型进行类型分类归纳的基础上,该方法首先对参与比较的复杂类型参数进行原子化操作,然后引入二分图模型,将求解需求复杂类型参数和待选复杂类型参数的匹配度问题转化为求两个简单类型参数集合之间的最大权匹配,最后对求解得到的匹配度进行归一化取值。
二分图中左右子图中的各点都有对应的匹配。
最大权匹配是通过给每一个点一个顶标来把求最大权匹配的问题转换为求完备匹配。
设左图的顶标为A[i],右图的顶标为B[j],顶点之间的边权为w[i][j]。可行性顶标A[i]+B[j]>=w(i,j),即顶标始终满足对于任意的一条边,它连接的两个顶点的顶标和大于等于该边的边权,初始时左图中点的顶标等于与该点相连的边中边权最大的值,右图中点的顶标等于0.而将最大权匹配转换为完备匹配的关键定理就是:若由二分图中所有满足A[i]+b[j]=w[i][j]的边<i,j>构成的子图(也称相等子图)有完备匹配,那么这个完备匹配就是二分图的最大权匹配。因为完备匹配中的边都是等于两端点的顶标和的,而根据之前对顶标的定义可知非完备匹配中的边小于等于两端点的顶标和。如果当前的子图中不存在完备匹配,就修改顶标的值再求完备匹配。
所述修改方法为:在增广路径(交错树)上的左图集合中的点i减去一个值alter,右图集合中的点j加上alter。分为四种情况:1、i,j都属于增广路,A[i]-alter+B[j]+alter=w(i,j)边的可行性不变,即原来是相等子图的边现在仍是,不是仍不是。2、i属于增广路,j不属于增广路,A[i]-alter+B[j],值就变小了,那么此时这条不属于相等子图的边(属于早就被j遍历到了)就有可能加入到相等子图中。3、如果i不属于增广路,j属于增广路,A[i]+B[j]+alter,值变大了,这条不属于相等子图的边就更不可能加入了。4、i,j都不属于增广路则不对其进行任何操作,可行性不变。修改量alter的取值:因为修改顶标是为了将边加入构成相等子图,所以可以看出是选择上面的第二种情况。而且要满足A[i]+B[j]>=w(i,j)即:A[i]-alter+B[j]>=w(i,j)即:alter>=A[i]+B[j]-w(i,j)即alter=min(A[i]+B[j]-w(i,j)),此时要求i属于增广路,j不属于增广路。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (4)

1.一种多域环境中基于知识图谱的高性能服务语境发现方法,其特征在于,包括以下步骤:步骤1,通过语境标注对领域本体进行扩展,所述扩展方式是建立一个Web服务的领域语境模型,实现Web服务描述的语义扩展;步骤2,在服务发现过程中,对服务的功能进行语义相似度匹配;步骤3,对符合条件的服务进行接口匹配。
2.如权利要求1所述的方法,其特征在于,所述建立Web服务的领域语境模型的具体方式为,从层次结构上,将基于本体资源标注的站内检索划分为信息资源和本体层、资源组织层、资源存储层、检索处理层、用户交互层:所述信息资源和本体层从Web网页中抽取信息资源作为站内检索系统处理的信息对象,所述资源组织层对信息资源的预处理和对信息对象的概念标引;所述资源存储层将资源组织处理的结果存入数据库中,所述结果包括网页资源元数据、资源对象概念标签索引、资源本体映射索引等;所述检索处理层是站内检索系统的功能层、在对用户提问进行语义处理的基础上,由基于用户提问的信息提示导航和基于检索结果分类的多维分类导航构成语境导航,将信息提示、分类导航与一般的信息检索相结合;所述用户交互层将信息表征符号集成在人机交互界面上。
3.如权利要求2所述的方法,其特征在于,所述对服务的功能进行语义相似度匹配的具体方式为,包括以下步骤,步骤2-1,利用本体包含的同义词词典对用户提问进行规范化处理,转换成本体中规范的概念描述,并进行下位类语义扩展,将扩展的提问集合与网站信息资源的概念标签进行匹配,得到检索结果数据,存储为临时表;步骤2-2,获取检索结果后,对所有检索结果的概念标签中出现的概念词语及其次数进行统计,形成检索结果的概念词频统计表。步骤2-3,在本体中查找检索结果的标引概念,获取所述概念的上位类,根据本体中概念的上下位类关系,按照以下算法构建具有一定层次结构的分类导航,并在类目后面标记该类目对应的网站资源对象的数量。
4.如权利要求3所述的方法,其特征在于,所述对符合条件的服务进行接口匹配的具体方式为,采用二分图匹配的方法计算服务接口中复杂类型参数的匹配,首先对参与比较的复杂类型参数进行原子化操作,然后引入二分图模型,求两个简单类型参数集合之间的最大权匹配,最后对求解得到的匹配度进行归一化取值。
CN201910155892.5A 2019-03-01 2019-03-01 一种多域环境中基于知识图谱的高性能服务语境发现方法 Pending CN109948150A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910155892.5A CN109948150A (zh) 2019-03-01 2019-03-01 一种多域环境中基于知识图谱的高性能服务语境发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910155892.5A CN109948150A (zh) 2019-03-01 2019-03-01 一种多域环境中基于知识图谱的高性能服务语境发现方法

Publications (1)

Publication Number Publication Date
CN109948150A true CN109948150A (zh) 2019-06-28

Family

ID=67007772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910155892.5A Pending CN109948150A (zh) 2019-03-01 2019-03-01 一种多域环境中基于知识图谱的高性能服务语境发现方法

Country Status (1)

Country Link
CN (1) CN109948150A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581334A (zh) * 2020-05-12 2020-08-25 中国人民解放军国防科技大学 一种基于数据本体和列表的海洋数据服务发布方法
CN111737400A (zh) * 2020-06-15 2020-10-02 上海理想信息产业(集团)有限公司 一种基于知识推理的大数据业务标签的扩展方法及系统
CN112417171A (zh) * 2020-11-23 2021-02-26 南京大学 面向知识图谱表示学习的数据增广方法
CN114398109A (zh) * 2022-01-07 2022-04-26 福州大学 基于通用知识图谱的个性化智能助手构建方法
CN116028653A (zh) * 2023-03-29 2023-04-28 鹏城实验室 一种可视化配置多源异构数据构建图谱的方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101567005A (zh) * 2009-05-07 2009-10-28 浙江大学 一种基于WordNet的语义服务注册与查询方法
CN103425646A (zh) * 2012-05-14 2013-12-04 阿里巴巴集团控股有限公司 一种web服务发现方法及其装置
US20160026710A1 (en) * 2014-07-25 2016-01-28 International Business Machines Corporation Using ontology to discover api requirements

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101567005A (zh) * 2009-05-07 2009-10-28 浙江大学 一种基于WordNet的语义服务注册与查询方法
CN103425646A (zh) * 2012-05-14 2013-12-04 阿里巴巴集团控股有限公司 一种web服务发现方法及其装置
US20160026710A1 (en) * 2014-07-25 2016-01-28 International Business Machines Corporation Using ontology to discover api requirements

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
文俊浩 等: "基于功能语义标注的Web服务发现方法", 《计算机应用研究》 *
李晓鹏 等: "利用本体资源标注实现站内检索语境导航", 《数据知识与发现》 *
王义锦: "服务搜索引擎中基于接口匹配的服务发现功能的设计与实现", 《中国优秀硕士论文全文数据库》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581334A (zh) * 2020-05-12 2020-08-25 中国人民解放军国防科技大学 一种基于数据本体和列表的海洋数据服务发布方法
CN111737400A (zh) * 2020-06-15 2020-10-02 上海理想信息产业(集团)有限公司 一种基于知识推理的大数据业务标签的扩展方法及系统
CN111737400B (zh) * 2020-06-15 2023-06-20 上海理想信息产业(集团)有限公司 一种基于知识推理的大数据业务标签的扩展方法及系统
CN112417171A (zh) * 2020-11-23 2021-02-26 南京大学 面向知识图谱表示学习的数据增广方法
CN112417171B (zh) * 2020-11-23 2023-10-03 南京大学 面向知识图谱表示学习的数据增广方法
CN114398109A (zh) * 2022-01-07 2022-04-26 福州大学 基于通用知识图谱的个性化智能助手构建方法
CN116028653A (zh) * 2023-03-29 2023-04-28 鹏城实验室 一种可视化配置多源异构数据构建图谱的方法及系统
CN116028653B (zh) * 2023-03-29 2023-06-06 鹏城实验室 一种可视化配置多源异构数据构建图谱的方法及系统

Similar Documents

Publication Publication Date Title
CN109948150A (zh) 一种多域环境中基于知识图谱的高性能服务语境发现方法
KR100815563B1 (ko) Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법
Su A text categorization perspective for ontology mapping
Dong et al. A survey in semantic search technologies
Jung et al. Automated conversion from natural language query to SPARQL query
Loia et al. Semantic web content analysis: A study in proximity-based collaborative clustering
Zapater et al. Semantic web service discovery system for road traffic information services
Globa et al. Increasing web services discovery relevancy in the multi-ontological environment
Schraefel et al. CS AKTive space: representing computer science in the semantic web
Ristoski Exploiting semantic web knowledge graphs in data mining
WO2010089248A1 (en) Method and system for semantic searching
Hoang et al. The state of the art of ontology-based query systems: A comparison of existing approaches
Makhalova et al. Information retrieval chatbots based on conceptual models
Kalafatelis et al. Island: An interlinked semantically-enriched blockchain data framework
Brambilla et al. Semantic resource framework
KR20100070084A (ko) 대용량 온톨로지에서 사용자 질의 관련 지식을 실시간으로 검색하기 위한 장치 및 그 방법
Nguyen et al. GeTFIRST: ontology-based keyword search towards semantic disambiguation
Toch et al. Automatically grounding semantically-enriched conceptual models to concrete web services
Eichler et al. Searching linked data with a twist of serendipity
Swetha et al. Lexicon ontology driven concept lattice framework for semantic web service discovery
KR20100003084A (ko) 온톨로지 부분 그래프 추출 장치 및 그 방법과, 그를이용한 검색 사용자 질의와 온톨로지의 의미적 매칭 장치및 그 방법
Sousa et al. Collaborative elicitation of conceptual representations: a corpus-based approach
Paul et al. Enterprise geographic information system (E-GIS): A service-based architecture for geo-spatial data interoperability
Xia et al. Concept lattice-based semantic web service matchmaking
Klímek et al. Efficient Exploration of Linked Data Cloud.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination