CN104765763A - 一种基于概念格的异构空间信息服务分类的语义匹配方法 - Google Patents

一种基于概念格的异构空间信息服务分类的语义匹配方法 Download PDF

Info

Publication number
CN104765763A
CN104765763A CN201510050509.1A CN201510050509A CN104765763A CN 104765763 A CN104765763 A CN 104765763A CN 201510050509 A CN201510050509 A CN 201510050509A CN 104765763 A CN104765763 A CN 104765763A
Authority
CN
China
Prior art keywords
service
semantic
classification
spatial information
concept
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510050509.1A
Other languages
English (en)
Other versions
CN104765763B (zh
Inventor
罗安
刘纪平
张福浩
王勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese Academy of Surveying and Mapping
Original Assignee
Chinese Academy of Surveying and Mapping
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese Academy of Surveying and Mapping filed Critical Chinese Academy of Surveying and Mapping
Priority to CN201510050509.1A priority Critical patent/CN104765763B/zh
Publication of CN104765763A publication Critical patent/CN104765763A/zh
Application granted granted Critical
Publication of CN104765763B publication Critical patent/CN104765763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于概念格的异构空间信息服务分类的语义匹配方法,首先利用概念格理论与分析方法,对多种异构的空间信息服务分类进行语义因子提取,然后从服务分类模型中获取的服务分类特征属性,并构建服务分类语义概念格,再基于概念格的空间信息服务分类相似度计算,最终实现异构空间信息服务分类的语义匹配。本发明针对跨不同注册中心的异构空间信息服务共享存在的问题,充分利用分类体系中语义关系进行服务遍历和选择,实现跨多个注册中心的空间信息服务分类语义匹配,有效提高服务检索效率,促进空间信息服务的发展。有效克服异构空间信息服务分类的语义匹配技术难点。

Description

一种基于概念格的异构空间信息服务分类的语义匹配方法
技术领域
本发明属于空间信息服务语义技术领域,特别的,涉及了一种新型的异构空间信息服务分类的语义匹配方法。
背景技术
随着语义网技术的发展,大量空间信息资源和空间数据处理功能都以服务的形式提供给用户。面对数量如此庞大的互联网信息资源,用户如何快速发现自己所需要的空间信息服务,是空间信息服务领域亟待解决的问题。空间信息服务分类的语义匹配则是解决这一问题的首当其出、至关重要的一步。
围绕这一问题,国内学者开展了相关研究,并已经取得了一定的进展。从服务的角度提出功能的分类,可以追溯到TsouMing-Hslang提出的面向任务的分布式地理信息服务组件分类方式,它将GIS任务分为六大类。为了将服务分类与用户需求的匹配联系起来,张霞首次将用户分类和服务分类联系起来。詹勤通过分析遥感信息服务的领域特征及其概念的时间名词特点,结合框架语义学理论,提出了基于事件框架提取遥感信息服务概念的语义特征,并在此基础上利用形式概念分析构建遥感信息服务分类本体。
目前空间信息服务分类匹配,大多数是要求请求服务具有统一的规范服务分类语义描述,并且要求服务发布者和请求者在对服务分类进行描述时都必须采用同一种空间信息服务分类体系,同时还要建立在他们对服务的分类认识完全相同的条件下,这样描述的服务分类才能进行有效的语义匹配。这些都是一种假设,这种假设在现实中是无法满足的,其原因如下:其一,服务请求者并不一定都是行业用户,随着空间信息服务的越来越普及,普通老百姓已经开始成为空间信息服务的对象,而他们对空间信息服务的分类一无所知,就不可能在请求服务时对服务的类型进行有效地描述;其二,空间信息服务的分类体系多种多样,为了促进了空间信息服务进一步共享和互操作,各种标准化组织,如国际标准化组织(ISO)、开放地理空间信息联盟(OpenGeospatial Consortium,OGC)和其他标准化组织,都针对空间信息服务的应用和实现,提出了相关的空间信息服务分类规范。这些空间信息服务分类体系各有优缺点,并且现阶段也还不存在一种被行业人士完全认可并适合服务发现匹配和互操作的空间信息服务分类体系。
因此,可以说现阶段空间信息服务分类的语义匹配,受到服务分类所采用分类体系的限制,只能对采用相同分类体系的空间信息服务进行语义匹配,无法实现不同分类体系的异构空间信息服务分类匹配。从而使得各个组织或研究机构在利用互联网上的空间信息服务时,不能直接利用互联网上已有的语义描述空间信息服务,需要使用自己的服务分类标准/体系对服务信息重新进行语义描述,并将其注册到自己构建的空间信息服务注册中心。
发明内容
针对上述问题,本发明将语义异构互操作中的概念格引入到空间信息服务领域,提出了一种基于概念格的异构空间信息服务分类语义融合与匹配方法,利用构造服务概念格的方式来计算服务之间的语义相似度,有效解决采用不同分类体系描述的请求空间信息服务和广告服务来之间的语义匹配,并通过注册中心目录服务的语义层次关系来提高最优服务遍历和选择效率。
为达此目的,本发明采用以下技术方案:
一种基于概念格的异构空间信息服务分类的语义匹配方法,包括如下步骤:
步骤一、从空间信息服务的描述原始信息中,提取空间信息服务的分类相关信息;
步骤二、根据步骤一中提取的空间信息服务的分类信息,追踪到其采用的服务分类体系,并从中提取与该服务相关的语义因子;
步骤三、根据提取的语义因子与空间信息服务的语义关联关系,建立空间信息服务分类模型;
步骤四、从空间信息服务的描述信息和所对应分类体系的描述信息中,提取与服务类型相关的特征属性,形成与服务类型相关的特征属性集;
步骤五、将步骤三的空间信息服务分类模型与步骤四的服务类型相关的特征属性集分别作为概念格的内涵和外延,构建空间信息服务分类的概念格,形成相应的服务概念格S=(U,D),S表示服务概念格,U表示服务的内涵,D则表示服务的外延;
步骤六、对概念格的内涵部分与指定分类体系中的各个类型概念格的内涵部分进行融合匹配,根据从服务分类体系中获取的服务分类模型的原子属性,构建服务语义因子的形式化背景矩阵,形成空间信息服务语义信息的形式化知识表达;
步骤七、根据所述形式化概念背景矩阵,通过将有效的服务语义因子进行重新排列和组合,并排除一些不可能作为服务模型的节点,融合并生成新的服务语义模型;
步骤八、根据步骤七融合生成的服务语义模型之间的语义因子关系,构建服务模型的语义距离树;
步骤九.分别计算语义距离树相似度及特征属性集的集合相似度,通过统一的服务概念格计算方法,计算得到服务概念格之间的相似度,最终实现异构空间信息服务分类的语义匹配。
优选地,在步骤一中,所述分类相关信息为服务分类类别、分类体系的名称和分类体系URL地址。
优选地,在步骤二中,提取语义因子的方法为:
若两个原子服务概念之间是无交集关系,则二者同时成为服务概念语义因子;
若两个原子服务概念之间是包含关系,则子概念直接成为服务概念语义因子,同时创建一个新的服务概念语义因子,其范围为子概念相对于父概念的补集;
若两个原子服务概念之间是等价关系,则将二者融合为一个服务概念语义因子;
若两个原子服务概念之间是交叉关系,则可以分为三个服务概念语义因子,一个为两个服务概念之间的交集,另外两个为两个原子服务概念的相互补集。
优选地,在步骤三中,所述服务分类模型能够以树状的形状表型出来,其根节点的类别是一个涵盖待分类的所有服务的总分类类型,叶子节点则是分类体系中不可再分的原子分类,其它节点是根据某种分类标准对根节点细分类型。
优选地,在步骤四中,所述与服务类型相关的特征属性包括:
功能分类信息相关的服务概念属性:指的是能够代表服务功能特征的属性信息;
依赖于IO参数类型的属性,指的是以空间数据为核心来定义描述服务模型所需要的IO相关属性,包括数据、空间、时间、几何、属性、单位和数据质量;
与IO参数类型相关的属性,指的是描述空间数据的辅助性概念,包括角度、文本、单位和查询方式。
优选地,在步骤八中,建立语义距离树的方法为:首先将语义因子独立出来,然后根据每个空间信息服务包含语义因子的情况进行逐聚类,如果两个服务的语义因子具有共同的部分,则将共同的部分作为一个语义距离树的虚拟节点独立出来,使得两个服务的节点能够直接建立在公共虚拟节点之上,如此循环,直到所有的节点之间没有相同的语义因子,最终构建成空间信息服务的语义距离树。
优选地,所述语义距离树相似度计算为:通过语义距离树,来计算服务模型之间的语义距离,然后通过语义距离与相似度之间的计算公式(1),计算出空间信息服务概念格内涵之间的相似度,
Sim ( U 1 , U 2 ) = [ 1 - 1 h ( U ) · | d 1 - d 2 | d 1 + d 2 ] · 1 min ( d 1 , d 2 ) [ 1 - max ( d 1 , d 2 ) - 1 h ( U ) ]   公式(1)
其中,h(U)表示服务分类的语义距离树中层次的深度值,d1和d2是两个进行相似度计算的服务到它们最近公共祖先的语义距离;
特征属性集的集合相似度计算为:参见公式(2),通过将两个属性集交集中属性的数量除以它们中最大一个集合的属性数量,实现空间信息服务概念格外延之间的相似度计算;
Sim ( D 1 , D 2 ) = | D 1 ∩ D 2 | Max ( | D 1 | , | D 2 | )   公式(2)
式中D1∩D2表示特征属性集合之间的交集,Max(|D1|,|D2|)表示最大的一个集合中属性的数量;
服务概念格之间的相似度计算为:通过公式(3)计算得到
Sim(S1,S2)=α·Sim(U1,U2)+β·Sim(D1,D2)    公式(3)
其中,Sim(S1,S2)表示两个不同服务S1与S2的相似度,α、β作为内涵与外延的权值,Sim(D1,D2)表示特征属性集合D1、D2之间的相似度,也就是服务概念格外延D1、D2之间的相似度,Sim(U1,U2)则表示语义距离树相似度,也就是服务概念格内涵U1与U2的语义相似度。
优选地,在异构空间信息服务分类的匹配结果后,结合服务注册中心中目录服务的语义层次关系,能够有效提高最优服务遍历和选择的效率,具体的服务遍历的方法为,根据匹配服务的分类信息,首先通过与分类体系中的大类进行匹配;然后根据匹配成功与否,选择进入该类别下的子类别进行匹配,或者直接略过该类别,进行下一个大类匹配,并在与大类中的子类型匹配过程中,同样采用先与父节点匹配的方法,根据匹配成果与否,选择是否进入子类节点的匹配,如此循环,直到匹配成果,否则为匹配失败。
因此,本发明结合目前空间信息服务语义匹配与形式概念格的研究现状,针对跨不同注册中心的异构空间信息服务语义匹配存在的问题,首先利用概念格理论与分析方法,对多种异构的空间信息服务分类进行语义因子提取,然后从服务分类模型中获取的服务分类特征属性,并构建服务分类语义概念格,再基于概念格的空间信息服务分类相似度计算,最终实现异构空间信息服务分类的语义匹配。本发明能够充分利用分类体系中语义关系进行服务遍历和选择,实现跨多个注册中心的空间信息服务分类语义匹配,有效提高服务检索效率。
附图说明
图1是根据本发明的基于概念格的异构空间信息服务分类的语义匹配方法的流程图;
图2为空间信息服务分类信息示例图;
图3为空间信息服务语义距离树示例图;
图4为基于分类匹配的空间信息服务遍历与选择示例图。
具体实施方式
空间信息服务分类是空间信息服务功能信息的一种特殊的形式化表达方式之一,它能够从服务所完成的整体功能上对服务进行描述。通过分析空间信息服务的分类,人们能够大致了解这个服务主要是用来做什么的和执行该服务能够达到何种效果等。因此,空间信息服务分类匹配能够在空间信息服务查找、匹配和发现中起到一定的作用。越来越多的国内外研究者也都开始意识到这一点,并有效利用空间信息服务分类的特点,提高空间信息服务分类匹配的准确性和效率。
现实生活中,空间信息服务的描述往往是采用不同的分类体系对服务分类信息进行语义描述时,这时需要对请求服务的分类进行异构的空间信息服务分类匹配。由于两者的分类采用了不同的分类体系,而不同分类体系之间无法按照同构的服务分类匹配方法进行匹配,因此,本发明需要先建立不同分类体系之间的映射关系,使得两种分类体系之间能够完全映射,从而将这种异构的空间信息服务分类匹配转换成同构的空间信息服务分类匹配。
为了有效解决上述问题,本发明提出一种基于概念格的异构空间信息服务分类的语义匹配方法,首先通过基于形式化概念分析方法对空间信息服务分类体系融合映射,即将不同分类体系进行融合,然后根据融合后生成的新的服务分类体系能够更好地兼容融合前的各种服务分类体系的特征,有效地建立异构服务分类体系之间的映射关系,完成异构条件下的空间信息服务分类的语义匹配。
以下结合理论和实施例详细说明本发明技术方案:
1、理论基础
空间信息服务分类是空间信息服务共享和互操作的一种标准,同信息分类一样,空间信息服务分类也是根据空间信息服务的特征及作用来对服务进行分类的。同种类型的服务具有相同的特征,并且完成的功能也相似。而不同类型的服务在服务特征和服务功能上都会有一定的差别。
空间信息服务分类不仅能够表现服务的功能类别,还具有服务的一些特性属性。为了对异构空间信息服务分类进行语义匹配,在一个具体的实施例中,本发明通过扩展OWL-S本体中的服务分类(Service Category)部分对空间信息服务分类进行语义描述(如图2所示),扩展后的服务分类(Service Category)主要包括以下几个部分:
服务实例(Service Instance):指向属于该服务类型的服务实例,实现服务实例与服务类型之间的映射关系。Service Instance可以指向多个服务实例,从而通过相同服务分类,将各个服务实例语义关联起来。
服务分类体系(Service Taxonomy):标识某一特定的服务分类体系,表示该服务分类从属于某一服务分类体系或采用某一特定的服务分类标准进行的分类。
分类体系地址(Taxonomy Address):指向该服务分类所从属或采用的分类标准/体系的地址。
服务类别(Service Classification):表示服务分类类型的参数,通过引用某一服务分类体系中的特定服务类别。
当然,本发明也不局限于此,其它的一些语义分类体系也可以用于对异构空间信息服务分类进行语义匹配。
从理论上可以发现:空间信息服务分类是空间信息服务功能信息的一种特殊的形式化表达方式之一,它能够从服务所完成的整体功能上对服务进行描述。随着语义技术的出现,在空间信息服务分类中加入语义信息能够更好地帮助和辅助空间信息服务的匹配、发现、组合与选择。这种使得空间服务信息分类中也带有语义信息,不仅能够从语义的角度反应服务的功能,也能够使空间信息服务分类在服务匹配发现中得到更加广泛的应用。
2、具体实施例
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
参见图1,示出了根据本发明的基于概念格的异构空间信息服务分类的语义匹配方法的流程图,包括如下步骤:
步骤一、从空间信息服务的描述原始信息中,提取空间信息服务的分类相关信息。
空间信息服务分类不仅能够表现服务的功能类别,还具有服务的一些特性属性。一个完整的空间信息服务分类包括主要包括服务类别、服务分类体系的版本信息、服务接口标准、服务分类的概要信息、分类体系名称及分类体系URL地址等多部分内容。
优选地,本步骤提取与服务分类体系相关的服务分类类别、分类体系的名称及分类体系URL地址三部分内容,为从服务分类体系中提取语义因子奠定基础。
步骤二、根据步骤一中提取的空间信息服务的分类信息,追踪到其采用的服务分类体系,并从中提取与该服务相关的语义因子。
在一个优选的实施例中,语义因子具体提取方法如下:
◆若两个原子服务概念之间是无交集关系,则二者同时成为服务概念语义因子;
◆若两个原子服务概念之间是包含关系,则子概念直接成为服务概念语义因子,同时创建一个新的服务概念语义因子,其范围为子概念相对于父概念的补集;
◆若两个原子服务概念之间是等价关系,则将二者融合为一个服务概念语义因子;
◆若两个原子服务概念之间是交叉关系,则可以分为三个服务概念语义因子。一个为两个服务概念之间的交集,另外两个为两个原子服务概念的相互补集。
步骤三、根据提取的语义因子与空间信息服务的语义关联关系,建立空间信息服务分类模型。
服务分类模型是指服务分类体系中的各个分类节点的表达模型,是一种描述各类型服务的元数据,可以通过has-input,has-output等参数关联(如表1)来表达。在服务分类体系中,服务分类模型之间则通过Is-apart-of,associated-with等各种语义关联关系(如表2)进行连接,使得服务分类体系能够以树状的形状表型出来,其根节点的类别是一个涵盖待分类的所有服务的总分类类型,叶子节点则是分类体系中不可再分的原子分类,其它节点是根据某种分类标准对根节点细分类型。参见图2,示例性的,本发明所采用的服务分类描述可以采用图2中所示的扩展服务分类描述模型,利用服务参数进行关系表达,并通过服务语义关系进行关联。这些原子分类类型是服务分类体系中最基本的分类,其他的分类可以看作是原子分类的集合。
表1服务参数表达关系  表2服务语义关联关系
步骤四、从空间信息服务的描述信息和所对应分类体系的描述信息中,提取与服务类型相关的特征属性,形成与服务类型相关的特征属性集。
在服务分类模型包含了服务分类输入/输出参数的语义信息,但是缺少服务的特征属性信息。服务分类的特征属性信息能够从属性层面上表达服务的功能特征,对于服务分类的匹配具有重要的作用。
优选地,本发明根据服务分类匹配的要求,选取了以下三种服务分类特征属性:
◆功能分类信息相关的服务概念属性:指能够代表服务功能特征的属性信息,本发明提取的功能分类属性主要来自各分类体系中较高层级的概念属性,确保彼此之间不会产生层级关系的冲突。
◆依赖于IO参数类型的属性:本发明以空间数据为核心来定义描述服务模型所需要的IO相关属性,包括数据、空间、时间、几何、属性、单位、数据质量等概念。
◆与IO参数类型相关的属性:主要指描述空间数据的辅助性概念,如角度、文本、单位、查询方式概念。
步骤五、将步骤三的空间信息服务分类模型与步骤四的服务类型相关的特征属性集分别作为概念格的内涵和外延,构建空间信息服务分类的概念格。
本发明基于形式概念分析理论,服务分类模型和服务特征属性集合分别作为概念格的内涵与外延,形成相应的服务概念格S=(U,D),S表示服务概念格,U表示服务的内涵,D则表示服务的外延。
步骤六、对概念格的内涵部分与指定分类体系中的各个类型概念格的内涵部分进行融合匹配,根据从服务分类体系中获取的服务分类模型的原子属性,构建服务语义因子的形式化背景矩阵,形成空间信息服务语义信息的形式化知识表达。
由于组成每个服务概念格的内涵U是各种异构分类体系下的语义因子,并不能够直接利用名称进行匹配,需要通过将异构的语义因子进行融合映射,从而实现将其与指定分类体系中的各个类型概念格的内涵部分进行融合匹配。
例如:本发明以空间信息服务领域的三本经典教程《GeographicInformation Systems and Science》、《Geographic InformationSystems:A Management Perspective》以及《Principles ofGeographical Information Systems for land ResourcesAssessment》中三种空间信息服务分类体系为例,在下文中将这三种分类体系依次简称为A、B、C三种分类体系。
以A、B、C三种分类体系中的Overylay、Buffer、Shortest等服务为例,利用A、B、C分类体系中提取的语义因子(如表3所示),构建服务语义因子的形式化背景矩阵,其结果如表4所示,实现了对空间信息服务语义知识的形式化表达。
表3分类体系中局部分类模型
表4服务形式化概念背景矩阵
步骤七、根据所述形式化概念背景矩阵,通过将有效的服务语义因子进行重新排列和组合,并排除一些不可能作为服务模型的节点,融合并生成新的服务语义模型。
参见表5,示出了一个示例性的服务语义因子组合结果表。
表5服务语义因子组合结果表
步骤八、根据步骤七融合生成的服务模型之间的语义因子关系,构建服务模型的语义距离树。
参见图3,示出了一种示例性的本发明的语义距离树的一种建立方法。其主要过程包括首先将语义因子独立出来,然后根据每个空间信息服务包含语义因子的情况进行逐聚类,如果两个服务的语义因子具有共同的部分,则将共同的部分作为一个语义距离树的虚拟节点独立出来,使得两个服务的节点能够直接建立在公共虚拟节点之上,如此循环,直到所有的节点之间没有相同的语义因子,最终构建成空间信息服务的语义距离树。
步骤九.分别计算语义距离树相似度及特征属性集的集合相似度,通过统一的服务概念格计算方法,计算得到服务概念格之间的相似度,最终实现异构空间信息服务分类的语义匹配。
优选地,所述语义距离树相似度计算为:通过语义距离树,来计算服务模型之间的语义距离,然后通过语义距离与相似度之间的计算公式(1),计算出空间信息服务概念格内涵之间的相似度
Sim ( U 1 , U 2 ) = [ 1 - 1 h ( U ) · | d 1 - d 2 | d 1 + d 2 ] · 1 min ( d 1 , d 2 ) [ 1 - max ( d 1 , d 2 ) - 1 h ( U ) ]   公式(1)
其中,h(U)表示服务分类的语义距离树中层次的深度值,d1和d2是两个进行相似度计算的服务到它们最近公共祖先的语义距离。
特征属性集的集合相似度计算:参见公式(2),通过将两个属性集交集中属性的数量除以它们中最大一个集合的属性数量,实现空间信息服务概念格外延之间的相似度计算。
Sim ( D 1 , D 2 ) = | D 1 ∩ D 2 | Max ( | D 1 | , | D 2 | )    公式(2)
式中D1∩D2表示特征属性集合之间的交集,Max(|D1|,|D2|)表示最大的一个集合中属性的数量。
服务概念格之间的相似度计算为:通过公式(3)计算得到
Sim(S1,S2)=α·Sim(U1,U2)+β·Sim(D1,D2)    公式(3)
其中,Sim(S1,S2)表示两个不同服务S1与S2的相似度,α、β作为内涵与外延的权值,Sim(D1,D2)表示特征属性集合D1、D2之间的相似度,也就是服务概念格外延D1、D2之间的相似度,Sim(U1,U2)则表示语义距离树相似度,也就是服务概念格内涵U1与U2的语义相似度。
最后利用异构空间信息服务分类的匹配结果,结合服务注册中心中目录服务的语义层次关系,能够有效提高最优服务遍历和选择的效率,具体遍历方法如图4所示,根据匹配服务的分类信息,首先通过与分类体系中的大类进行匹配;然后根据匹配成功与否,选择进入该类别下的子类别进行匹配,或者直接略过该类别,进行下一个大类匹配,并在与大类中的子类型匹配过程中,同样采用先与父节点匹配的方法,根据匹配成果与否,选择是否进入子类节点的匹配,如此循环,直到匹配成果,否则为匹配失败。从而实现了服务匹配的最优化,提高服务分类的匹配速度。
本发明有效克服异构空间信息服务分类的语义匹配技术难点,利用构造服务概念格的方式来计算服务之间的语义相似度,实现不同分类体系描述的空间信息服务之间语义匹配,有效提高服务匹配、发现与选取的效率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权利要求书确定保护范围。

Claims (8)

1.一种基于概念格的异构空间信息服务分类的语义匹配方法,包括如下步骤:
步骤一、从空间信息服务的描述原始信息中,提取空间信息服务的分类相关信息;
步骤二、根据步骤一中提取的空间信息服务的分类信息,追踪到其采用的服务分类体系,并从中提取与该服务相关的语义因子;
步骤三、根据提取的语义因子与空间信息服务的语义关联关系,建立空间信息服务分类模型;
步骤四、从空间信息服务的描述信息和所对应分类体系的描述信息中,提取与服务类型相关的特征属性,形成与服务类型相关的特征属性集;
步骤五、将步骤三的空间信息服务分类模型与步骤四的服务类型相关的特征属性集分别作为概念格的内涵和外延,构建空间信息服务分类的概念格,形成相应的服务概念格S=(U,D),S表示服务概念格,U表示服务的内涵,D则表示服务的外延;
步骤六、对概念格的内涵部分与指定分类体系中的各个类型概念格的内涵部分进行融合匹配,根据从服务分类体系中获取的服务分类模型的原子属性,构建服务语义因子的形式化背景矩阵,形成空间信息服务语义信息的形式化知识表达;
步骤七、根据所述形式化概念背景矩阵,通过将有效的服务语义因子进行重新排列和组合,并排除一些不可能作为服务模型的节点,融合并生成新的服务语义模型;
步骤八、根据步骤七融合生成的服务语义模型之间的语义因子关系,构建服务模型的语义距离树;
步骤九.分别计算语义距离树相似度及特征属性集的集合相似度,通过统一的服务概念格计算方法,计算得到服务概念格之间的相似度,最终实现异构空间信息服务分类的语义匹配。
2.根据权利要求1所述的语义匹配方法,其特征在于:
在步骤一中,所述分类相关信息为服务分类类别、分类体系的名称和分类体系URL地址。
3.根据权利要求1所述的语义匹配方法,其特征在于:
在步骤二中,提取语义因子的方法为:
若两个原子服务概念之间是无交集关系,则二者同时成为服务概念语义因子;
若两个原子服务概念之间是包含关系,则子概念直接成为服务概念语义因子,同时创建一个新的服务概念语义因子,其范围为子概念相对于父概念的补集;
若两个原子服务概念之间是等价关系,则将二者融合为一个服务概念语义因子;
若两个原子服务概念之间是交叉关系,则可以分为三个服务概念语义因子,一个为两个服务概念之间的交集,另外两个为两个原子服务概念的相互补集。
4.根据权利要求1所述的,其特征在于:
在步骤三中,所述服务分类模型能够以树状的形状表型出来,其根节点的类别是一个涵盖待分类的所有服务的总分类类型,叶子节点则是分类体系中不可再分的原子分类,其它节点是根据某种分类标准对根节点细分类型。
5.根据权利要求1所述的语义匹配方法,其特征在于:
在步骤四中,所述与服务类型相关的特征属性包括:
功能分类信息相关的服务概念属性:指的是能够代表服务功能特征的属性信息;
依赖于IO参数类型的属性,指的是以空间数据为核心来定义描述服务模型所需要的IO相关属性,包括数据、空间、时间、几何、属性、单位和数据质量;
与IO参数类型相关的属性,指的是描述空间数据的辅助性概念,包括角度、文本、单位和查询方式。
6.根据权利要求1所述的语义匹配方法,其特征在于:
在步骤八中,建立语义距离树的方法为:首先将语义因子独立出来,然后根据每个空间信息服务包含语义因子的情况进行逐聚类,如果两个服务的语义因子具有共同的部分,则将共同的部分作为一个语义距离树的虚拟节点独立出来,使得两个服务的节点能够直接建立在公共虚拟节点之上,如此循环,直到所有的节点之间没有相同的语义因子,最终构建成空间信息服务的语义距离树。
7.根据权利要求1所述的语义匹配方法,其特征在于:
所述语义距离树相似度计算为:通过语义距离树,来计算服务模型之间的语义距离,然后通过语义距离与相似度之间的计算公式(1),计算出空间信息服务概念格内涵之间的相似度,
Sim ( U 1 , U 2 ) = [ 1 - 1 h ( U ) · | d 1 - d 2 | d 1 + d 2 ] · 1 min ( d 1 , d 2 ) [ 1 - max ( d 1 , d 2 ) - 1 h ( U ) ]   公式(1)
其中,h(U)表示服务分类的语义距离树中层次的深度值,d1和d2是两个进行相似度计算的服务到它们最近公共祖先的语义距离;
特征属性集的集合相似度计算为:参见公式(2),通过将两个属性集交集中属性的数量除以它们中最大一个集合的属性数量,实现空间信息服务概念格外延之间的相似度计算;
Sim ( D 1 , D 2 ) = | D 1 ∩ D 2 | Max ( | D 1 | , | D 2 | )     公式(2)
式中D1∩D2表示特征属性集合之间的交集,Max(|D1|,|D2|)表示最大的一个集合中属性的数量;
服务概念格之间的相似度计算为:通过公式(3)计算得到
Sim(S1,S2)=α·Sim(U1,U2)+β·Sim(D1,D2)       公式(3)
其中,Sim(S1,S2)表示两个不同服务S1与S2的相似度,α、β作为内涵与外延的权值,Sim(D1,D2)表示特征属性集合D1、D2之间的相似度,也就是服务概念格外延D1、D2之间的相似度,Sim(U1,U2)则表示语义距离树相似度,也就是服务概念格内涵U1与U2的语义相似度。
8.根据权利要求1-7中任意一项所述的语义匹配方法,
在异构空间信息服务分类的匹配结果后,结合服务注册中心中目录服务的语义层次关系,能够有效提高最优服务遍历和选择的效率,
具体的服务遍历的方法为,根据匹配服务的分类信息,首先通过与分类体系中的大类进行匹配;然后根据匹配成功与否,选择进入该类别下的子类别进行匹配,或者直接略过该类别,进行下一个大类匹配,并在与大类中的子类型匹配过程中,同样采用先与父节点匹配的方法,根据匹配成果与否,选择是否进入子类节点的匹配,如此循环,直到匹配成果,否则为匹配失败。
CN201510050509.1A 2015-02-02 2015-02-02 一种基于概念格的异构空间信息服务分类的语义匹配方法 Active CN104765763B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510050509.1A CN104765763B (zh) 2015-02-02 2015-02-02 一种基于概念格的异构空间信息服务分类的语义匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510050509.1A CN104765763B (zh) 2015-02-02 2015-02-02 一种基于概念格的异构空间信息服务分类的语义匹配方法

Publications (2)

Publication Number Publication Date
CN104765763A true CN104765763A (zh) 2015-07-08
CN104765763B CN104765763B (zh) 2017-12-19

Family

ID=53647594

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510050509.1A Active CN104765763B (zh) 2015-02-02 2015-02-02 一种基于概念格的异构空间信息服务分类的语义匹配方法

Country Status (1)

Country Link
CN (1) CN104765763B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273931A (zh) * 2017-04-01 2017-10-20 河北大学 一种交叉渐进提取信息的生物聚类方法
CN107315734A (zh) * 2017-05-04 2017-11-03 中国科学院信息工程研究所 一种基于时间窗口和语义的变体词规范化的方法和系统
CN110909153A (zh) * 2019-10-22 2020-03-24 中国船舶重工集团公司第七0九研究所 一种基于语义关注度模型的知识图谱可视化方法
CN113032504A (zh) * 2021-03-15 2021-06-25 北京农业智能装备技术研究中心 村镇社区公共服务时空数据汇聚方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4931935A (en) * 1987-07-03 1990-06-05 Hitachi Ltd. User interface system for permitting natural language interaction with an information retrieval system
CN101398852A (zh) * 2008-10-16 2009-04-01 北京邮电大学 语义Web服务匹配方法及系统
CN101699444A (zh) * 2009-10-20 2010-04-28 武汉大学 基于形式概念分析的遥感信息处理服务分类本体构建方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4931935A (en) * 1987-07-03 1990-06-05 Hitachi Ltd. User interface system for permitting natural language interaction with an information retrieval system
CN101398852A (zh) * 2008-10-16 2009-04-01 北京邮电大学 语义Web服务匹配方法及系统
CN101699444A (zh) * 2009-10-20 2010-04-28 武汉大学 基于形式概念分析的遥感信息处理服务分类本体构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LUO AN ET: ""A Semantic Matching Method of Heterogeneous Geospatial Service Classification Based on the Concept Lattice"", 《26TH INTERNATIONAL CARTOGRAPHIC CONFERENCE》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273931A (zh) * 2017-04-01 2017-10-20 河北大学 一种交叉渐进提取信息的生物聚类方法
CN107273931B (zh) * 2017-04-01 2019-11-08 河北大学 一种交叉渐进提取信息的生物聚类方法
CN107315734A (zh) * 2017-05-04 2017-11-03 中国科学院信息工程研究所 一种基于时间窗口和语义的变体词规范化的方法和系统
CN107315734B (zh) * 2017-05-04 2019-11-26 中国科学院信息工程研究所 一种基于时间窗口和语义的变体词规范化的方法和系统
CN110909153A (zh) * 2019-10-22 2020-03-24 中国船舶重工集团公司第七0九研究所 一种基于语义关注度模型的知识图谱可视化方法
CN113032504A (zh) * 2021-03-15 2021-06-25 北京农业智能装备技术研究中心 村镇社区公共服务时空数据汇聚方法及装置

Also Published As

Publication number Publication date
CN104765763B (zh) 2017-12-19

Similar Documents

Publication Publication Date Title
CN103699689B (zh) 事件知识库的构建方法及装置
CN108595449A (zh) 调度自动化系统知识图谱的构建与应用方法
CN102254022A (zh) 一种面向多数据类型信息资源元数据的共享方法
CN111026874A (zh) 知识图谱的数据处理方法及服务器
CN105224622A (zh) 面向互联网的地名地址提取与标准化方法
CN102831057A (zh) 一种用功能图分析软件功能变更及其影响的方法
CN102664915B (zh) 云制造环境中基于资源约束的服务选取方法
CN104765763A (zh) 一种基于概念格的异构空间信息服务分类的语义匹配方法
CN103885983A (zh) 一种旅游线路的确定方法、优化方法以及装置
EP3732587B1 (en) Systems and methods for context-independent database search paths
CN112925954B (zh) 用于在图数据库中查询数据的方法和装置
CN103257962A (zh) 信息提供方法以及装置
CN104156431A (zh) 一种基于实体图社团结构的rdf关键词查询方法
CN103092982B (zh) 基于多视图业务模型的信息服务系统
CN101916260A (zh) 一种灾害本体和关系数据库间语义映射构建的方法
CN104850623A (zh) 多维度数据分析模型动态扩展方法和系统
Adeleye et al. A fitness-based evolving network for web-apis discovery
CN104111965B (zh) 基于差别矩阵的ogc地理信息服务描述词汇约简方法
CN103970900A (zh) 基于工业现场的多维交叉数据柔性管理方法及系统
CN102508828A (zh) 一种基于多代理路由的图路径关系发现方法
CN101853307A (zh) 一种笔记的创建方法及其相应的网络搜索系统及方法
CN104063215A (zh) 一种RESTful Web服务匹配系统
CN110134730A (zh) 数据生产方法、装置、介质及电子设备
CN103353898A (zh) 一种系统数据向cim模型xml格式转化的处理系统
Pan et al. Design and implementation of library resource sharing system database based on GIS

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant