CN102360377B - 一种空间聚类挖掘pse系统及其构建方法 - Google Patents

一种空间聚类挖掘pse系统及其构建方法 Download PDF

Info

Publication number
CN102360377B
CN102360377B CN201110307623.XA CN201110307623A CN102360377B CN 102360377 B CN102360377 B CN 102360377B CN 201110307623 A CN201110307623 A CN 201110307623A CN 102360377 B CN102360377 B CN 102360377B
Authority
CN
China
Prior art keywords
class
model
service
data
pse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110307623.XA
Other languages
English (en)
Other versions
CN102360377A (zh
Inventor
康风光
董春
袁卫平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese Academy of Surveying and Mapping
Original Assignee
Chinese Academy of Surveying and Mapping
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese Academy of Surveying and Mapping filed Critical Chinese Academy of Surveying and Mapping
Priority to CN201110307623.XA priority Critical patent/CN102360377B/zh
Publication of CN102360377A publication Critical patent/CN102360377A/zh
Application granted granted Critical
Publication of CN102360377B publication Critical patent/CN102360377B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种空间聚类挖掘PSE系统,包括数据层、功能层以及用户层,所述数据层包括用于提供基础空间数据的至少一个空间数据库;所述功能层用于封装空间聚类挖掘模型并提供统一的接口,实现空间聚类模型服务的发布、发现和调用,并且将空间聚类分析的结果可视化显示和返回;所述用户层提供用于用户输入参数及模型服务选择的接口。本发明构建了空间聚类挖掘模型,并利用OGC WPS标准封装该挖掘模型服务,最终得以在任何一种系统和应用平台上实现服务共享;应用Portal架构,可扩充性良好,为从海量与位置有关的数据中发现和抽取出有利于决策的数据提供了有效的支持,大大提高和拓宽了空间数据挖掘模型的应用层次及质量。

Description

一种空间聚类挖掘PSE系统及其构建方法
技术领域
本发明涉及空间数据信息的挖掘技术,更具体地,涉及一种空间聚类挖掘PSE系统及其构建方法。 
背景技术
空间数据是研究解决人口、资源、环境、自然灾害、经济发展、军事防卫等重大问题时必需的信息资源,同时空间数据是由与地理位置相关的海量信息构成的,从海量数据中发现和抽取有利于决策的数据,是任何基于空间数据的信息系统所必须解决的问题。然而,这一问题也非常复杂,成为了制约空间数据信息系统发展的瓶颈。近年来PSE等技术理念的提出,为空间数据的挖掘开拓了新的思路。 
(1)PSE(问题解决环境) 
Rice J R,Boisvert,R F(1996),Gallopoulos Stratis,Houstis Elias,Rice Joh(1994)提出:PSE(Problem Solving Environments)是由提供面向目标的问题求解能力的计算资源和设施组成的计算机系统,其目的是构建一个分析和解决特定领域内复杂问题的服务平台,该平台能够自动或半自动化地选择求解算法和模块,用户不需要知道系统的软硬件组成就能够顺利地实现其问题求解,并借助于丰富的图形化界面以友好的、可视化的形式把结果呈现给用户。Watson(2002)提出了“问题解决环境”(PSE)的概念,即面向需要解决的问题,针对每一个问题,提出解决方法并实现,从而提供解决问题的计算环境。PSE是继DSS以及GIS之后的一种新的计算模式,是一种集成的计算系统,该系统根据问题域的要求,能够提供完整的和便利的高水平工具箱用于解决特殊领 域的问题,是GIS的DSS属性在网络时代的发展。它被要求基于WEB环境对外部提供的大量数据开展数据挖掘、模拟计算,最后提供决策支持。 
目前,PSE虽受到国内外一些学者的关注,但应用方面仍很有限,能找到的参考文献也并不多。国外,(Garbowet al.2001,2002,2003)开发了基于网络的咨询系统,该系统可令用户在客户端服务器通过网络对数据进行分析;R.Dymond·V.Lohani·D.Kibler·D.Bosch(2003)构建了土地利用变化分析问题求解环境,它给管理人员和用户提供了一个网络接口,使得用户可以探求一些有意义的土地利用变化问题并且了解这些变化在水文、生态和经济方面的影响。国内,刘扬(2003)构建了区域经济增长分析的PSE,该集成计算环境既可以从Web直接访问数据库,进行数据查询分析,也可以从Web上直接输入数据进行数据分析,从而实现了分布式的计算;陈瑞卿,周健等(2006)设计开发了支持轴承设计的问题求解环境,系统提供了轴承类产品设计部分环节的计算服务;徐俊刚,王军等(2007)构建了一个面向智能建筑的基于网络的问题求解环境,用户可以不用了解具体的硬件设备和软件开发知识就可以利用它开发分布式智能建筑应用系统,对智能建筑中的设备进行实时监控。 
(2)空间聚类 
聚类分析是数据挖掘中的一个很活跃的研究领域,并提出了许多聚类算法。这些算法可以被分为划分方法、层次方法、基于密度方法、基于网格方法和基于模型方法。 
基于划分的方法主要有K中心的方法和K平均的方法。这两种算法都需要用户指定簇的个数。所谓K中心方法,就是选取K个实际点作为K个簇的中心位置,然后把其他点分别指派到这K个簇中,在指派过程中,选取离簇中心最 近的这个点作为中心点。所谓K平均方法,就是选取K个实际点作为K个簇的中心位置,然后把其他点分别指派到这K个簇中,在指派的过程中,计算簇中所有点的中心位置作为中心,而不是选取其中某个特定点。 
层次方法包括凝聚的层次聚类方法和分裂的层次聚类方法。凝聚的层次聚类采用自底向上策略,首先将每个样本作为一个簇,然后合并这些原子簇形成越来越大的簇,减少簇的数目,直到所有的样本都在一个簇中,或某个终结条件被满足。分裂的层次聚类采用自顶向下策略,首先将所有样本置于一个簇中,然后逐渐细分为越来越小的簇,来增加簇的数目,直到每个样本自成一个簇,或者达到某个终结条件,例如达到了某个希望的簇的数目或两个最近的簇之间的距离超过了某个阈值。 
基于密度的算法,其基本思想就是将位置相对集中的点合并成簇。它不是基于各种各样的距离的,而是基于密度的。这样就能克服基于距离的算法只能发现类圆形的聚类的缺点。这个方法的指导思想就是,只要一个区域中的点的密度大过某个阈值,就把它加到与之相近的聚类中去。 
基于网格的算法是将数据空间分割成网格状(这是通过将数据空间中的每一维划分成相同的区间数来做到的,这就意味着每一个单元具有相同的体积,这样单元中点的密度的计算可以转换成简单的点计数),然后将落到某个单元中的点的个数当成这个单元的密度(density)。这时可以指定一个数值,当某个单元格的点的个数大于该数值时,我们就说这个单元格是密集的。最后,聚类也就定义为连通的所有的密的(dense)单元格的集合。代表算法有:STNIG算法、CLIQUE、WAVE一CLUSTER算法。 
基于模型的方法给每一个聚类假定一个模型,然后去寻找一个很好的满足 这个模型的数据集。这样一个模型可能是数据点在空间中的密度分布函数或者其它。它的一个潜在的假定就是:目标数据集是由一系列的概率分布所决定的。通常有三种尝试方向:统计方法、机器学习方法、神经网络方法等等。 
(3)OGC WPS规范 
OGC是一个非营利性国际组织,成立于1994年,属于论坛性国际标准化组织,以美国为中心,目前已经有近400个来自不同国家和地区的成员。OGC指定的标准已逐渐成为被广泛认可的主流标准。美国联邦地理数据委员会(FGDC)在1994年就计划引用OGC的标准实现国家空间数据基础设施工程,并于1997年正式开展地理信息数据处理互操作技术合作,实现网上地理信息数据和传播功能。OGC经过几年努力,各项规范已逐渐成熟,它提出的地理数据互操作技术被普遍接受并开始付诸实践。 
OGC的目标是通过信息基础设施,把分布式计算、对象技术、中间件软件技术等用于地理信息处理,使地理空间数据和地理处理资源集成到主流的计算技术中。由于OGC所涉及问题的挑战性,使得在地理信息与地理信息处理领域中的著名专家参与了OGC的互操作计划(Interoperability Program,简称IP)。该项计划的目标是提供一套综合的开放接口规范,以使软件开发商可以根据这些规范来编写互操作组件,从而满足互操作需求。OGC已经正式发布的标准达40种,其中应用最广泛的有WMS,WFS,WCS等。WPS(Web Processing Service)即网络处理规范,是OGC最近新推出的针对空间数据处理的OGC规范。 
OGC规范的网络处理服务规范(WPS,Web Processing Service)于2005年发布第一个版本,2008年2月22号被正式纳入OGC标准,它是承担支持加拿大空间信息数据组织(Canadian Geospatial Data Infrastructure Service, NLWIS)工作的结果,尤其是国际水土信息服务和国际森林信息服务,是OGC最新的标准之一,WPS提出了一个促进地理空间信息处理服务发布、发现和绑定的标准接口,并且发现和绑定服务的操作均由用户完成,处理服务包含任何算法、公式或者其他可以对空间数据进行处理的过程;服务发布即提供一些像元数据一样描述处理和数据信息的数据,以便用户进行搜索查询,而“绑定”则是允许网络上提供的服务能够被发现和使用。 
WPS作为一个网络处理服务,可以通过互联网为用户提供任何的GIS功能,在空间处理方面,WPS不仅可以提供简单的空间处理服务如用一系列空间参考数据减去另外一系列参考数据的计算(例如,确定不同季节流行感冒的区别等),也能够提供比较复杂的空间处理服务,如全球气候变化模型。WPS处理服务所需要的数据可以通过两种方式获得,一种是通过网络传输得到其他服务器上的数据资源,另外一种就是直接从本地服务器获得。 
WPS规范的目的是描述服务,提供可通过Web方式执行的处理服务,并且在底层机制对用户透明的情况下允许用户输入数据和调用服务。WPS标准是基于XML和Http的传输协议,通过网络为客户端提供空间数据处理相关的GIS函数功能,同时,它可以包装其他任何类型的数据处理功能。WPS处理规范是针对空间数据处理的标准,为用户提供了标准的发布、发现和绑定的接口,同时WPS服务规范也可以发布封装其他任何非空间处理服务。 
(4)、Portal 
Portal(门户)是一个信息系统的集成应用框架,通过向用户提供及时、准确地信息优化运作和提高生产力。Portal提供一个统一的操作简便的访问入口,使一系列的内部和外部作业过程转变成对各种信息有条理的综合管理过程。 
Portal系统由三部分组成:Portal Web应用、Portlet容器、Portlet。 
Portal Web应用:是一个基于web的应用程序,它主要提供个性化、单点登录、不同资源的内容整合,负责整个信息系统的展现层。此应用把用户定制的不同资源里的内容聚合在一个web页面并处理用户的请求。 
Portlet容器:Portlet在Portlet容器中运行,Portlet容器为Portlet提供必需的运行环境。Portlet容器包含Portlet(组件)并且管理它们的生命周期,它也为Portlet的参数设置提供持久化的存储。Portlet容器通过标准的PortletAPI对Portlet进行调用。 
Portlet:Portlet是基于web的Java组件。它由Portlet容器管理,能够处理请求,产生动态内容。Portlet被Portal用作为可插拔的用户接口组件,为信息系统提供展现。由Portlet动态产生的内容也被叫做fragment,是遵循某种规则的标记(例如:HTML,xHTML,WML),可与其他的fragment一起建立一个完整的文档。Portlet产生的内容和其他的Portlet产生的内容聚集在一起形成Portal网页。 
Portal架构优点:①它无需在客户端安装特定软件,仅安装浏览器或特定的查看图形的插件即可,便于用户使用;②Portal体现的是以用户为中心,面向服务的思想,为用户提供统一的服务平台,以透明的方法将网络上的各种模型算法功能集成到现有的应用界面环境,把服务整合到Portal中,提供了简洁、直观的界面。 
综上所述,聚类算法的完善为海量空间数据的发掘和利用提供了科学的算法基础,PSE、Portal等计算机解决方案的发展为空间数据发掘提供了新的平台架构,WPS标准为空间数据处理建立了统一标准和接口,如果能够将以上方面 的技术整合为一种以PSE架构为基础的空间聚类挖掘PSE系统,实现规范封装、灵活可扩展、网络共享,必将实现空间数据的高效整合和利用,极大促进基于空间数据的信息分析和科学决策。 
发明内容
针对现有空间数据发掘技术的上述不足和实际需求,本发明提供了一种空间聚类挖掘PSE系统及其构建方法。本发明首先构建了空间聚类挖掘模型,并利用OGC WPS标准封装该挖掘模型服务,即利用WPS提供的操作规范去标准化服务请求、服务描述和服务调用的消息传输机制,使其以一种与平台无关的消息模式进行通信,最终得以在任何一种系统和应用平台上实现服务共享。所述空间聚类挖掘PSE系统的架构设计采用Portal架构,Portal架构可扩充性良好,采用统一的服务访问入口,提供了从用户登陆到处理服务获取、数据提交、处理、结果可视化及结果信息提取等界面,并且通过界面的访问控制连接用户与服务端的应用模型。 
本发明所述的空间聚类挖掘PSE系统,其特征在于,包括数据层、功能层以及用户层,所述数据层包括用于提供基础空间数据的至少一个空间数据库;所述功能层用于封装空间聚类挖掘模型并提供统一的接口,实现空间聚类模型服务的发布、发现和调用,并且将空间聚类分析的结果可视化显示和返回;所述用户层提供用于用户输入参数及模型服务选择的接口。 
优选地,所述功能层包括PSE服务器,用于提供所述空间聚类模型,根据用户请求和输入参数确定空间聚类挖掘模型,根据从所述数据层或网络取得的数据执行所述空间聚类挖掘模型对所述数据进行分析并生成可视化处理结果。 
优选地,所述功能层进一步包括PSE管理中心,用于根据OGC WPS规范对 各PSE服务器提供的所述空间聚类挖掘模型进行封装并提供查询请求、描述请求及调用过程的统一接口,执行利用所述模型的标准描述文档实现对模型功能的发布,执行输入参数的判断和初始化,并返回模型处理结果。进一步优选地,所述统一接口包括数据初始化接口、模型处理接口及结果返回接口。 
优选地,所述功能层进一步包括PSE服务端,用于接收客户端发送的调用所述模型的请求,定位和调用所述模型并将处理结果生成符合OGC WPS规范的格式返回客户端,以及调用绘图类将聚类结果显示在地图上。 
优选地,所述功能层基于OGC WPS标准对空间聚类挖掘模型的服务查询请求、服务描述请求和服务调用请求及其返回结果的通信方式进行封装,并将每个功能封装为一个功能类。进一步优选地,所述功能类包括:GetCapabilities、DescribeProcess和Execute;通过GetCapabilities请求并获取服务能够实现的功能,DescribeProcess获取网络服务中输入、输出参数的类型;在本地数据库或网络获取到数据后,通过Execute调用数据挖掘模型方法对数据进行分析,并展示结果。进一步优选地,所述功能类还包括:WPS,作为功能类的基类,分别就OGC WPS规范的三个标准接口涉及的各种参数变量进行定义,同时对公共的方法进行定义;ProcessMng类,用于接受来自客户端发送的调用模型方法的请求,定位到相应的处理服务;RequestProcessor类,用于实现模型服务的处理服务调用,并将处理结果生成符合OGC WPS规范XML格式返回到客户端;GetMap类调用绘图类,通过聚类结果在地图上进行显示。 
优选地,所述空间聚类挖掘模型的算法是:①将空间数据中的各样品各自作为一类,并规定样品之间的距离和类与类之间的距离;②将距离最近的两类合并成一个新类,计算新类与其他类的距离;③重复进行步骤②,每次减少一类,直至所有的样品合并为一类。 
本发明还提供了实现上述空间聚类挖掘PSE系统的构建方法,其特征在于,包括: 
构建空间聚类模型和取得空间数据库; 
利用OGC WPS标准对空间聚类挖掘模型的服务查询请求、服务描述请求和服务调用请求及其返回结果的通信方式进行封装,提供查询请求、描述请求及调用过程的统一接口,并将每个功能封装为一个功能类; 
基于Portal结构构建PSE系统,所述系统包括数据层、功能层以及用户层,所述数据层包括用于提供基础空间数据的至少一个空间数据库;所述功能层用于封装空间聚类挖掘模型并提供统一的接口,实现空间聚类模型服务的发布、发现和调用,并且将空间聚类分析的结果可视化显示和返回;所述用户层提供用于用户输入参数及模型服务选择的接口。 
综上所述,本发明采用OGC WPS标准,实现了空间聚类模型服务封装的标准化、调用的规范化和充分的网络共享;引入PSE思想,建立了空间聚类挖掘的问题解决环境,为相关问题的解决提供了一种新的思路和方法。 
本发明属于空间数据挖掘的基础性研究范围,可广泛应用于国民经济和社会发展的各个领域中,如气象领域、城市规划、环境监测、石油天然气勘探、经济研究、人口种族研究、政府和防卫、交通研究、水资源利用、地址灾害、防灾减灾、数据统计、经济普查、动态监测、信息展示、媒介等方面,为从海量的与位置有关的数据中发现和抽取出有利于决策的数据提供了有效的支持,大大提高和拓宽了空间数据挖掘模型的应用层次及质量,具有明显的社会效益和经济效益。 
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明: 
图1A是本发明空间聚类挖掘PSE系统采用的Portal架构的基本组成框架图; 
图1B是Portlet的用户请求处理方式流程示意图; 
图2是空间聚类挖掘PSE系统的架构示意图; 
图3是空间聚类挖掘PSE系统功能层的工作流程图。 
具体实施方式
为了使本技术领域的人员更好地理解本发明的技术方案,并使本发明的上述目的、特征和优点能够更加明显易懂,下面结合实施例及实施例附图对本发明作进一步详细的说明。 
本发明设计的空间聚类挖掘PSE系统优于其他传统桌面PSE和网络PSE之处在于它的规范性和服务共享性及可扩展性。主要解决了以下技术问题:(1)模型服务的规范性封装;(2)模型服务的网络共享;(3)PSE架构的灵活性和可扩充性。为了达到上述目的,本发明实现了空间聚类挖掘模型,并利用OGC WPS标准封装挖掘模型服务,即利用WPS提供的操作规范去标准化服务请求、服务描述和服务调用的消息传输机制,使其以一种与平台无关的消息模式进行通信,最终得以在任何一种系统和应用平台上实现服务共享。PSE系统的架构设计采用Portal架构,Portal架构可扩充性良好,采用统一的服务访问入口,提供了从用户登陆到处理服务获取、数据提交、处理、结果可视化及结果信息提取等界面,并且通过界面的访问控制连接用户与服务端的应用模型。 
下面从以下几个方面对本发明的空间聚类挖掘PSE系统及其构建方法加以详细说明。 
(1)空间聚类方法的研究与实现 
系统聚类其基本过程是:①将各样品各自作为一类,并规定样品之间的距离和类与类之间的距离;②将距离最近的两类合并成一个新类,计算新类与其他类的距离;③重复进行步骤②,每次减少一类,直至所有的样品合并为一类。 
离差平方和法定义:类中各样品到类重心(均值)的平方欧式距离之和称为(类内)离差平方和。 
设GK和GL合并成新类GM,则GK、GL和GM的离差平方和分别是: 
W K = Σ i ∈ G K ( x i - x ‾ K ) ′ ( x i - x ‾ K )
W L = Σ i ∈ G L ( x i - x ‾ L ) ′ ( x i - x ‾ L )
W M = Σ i ∈ G M ( x i - x ‾ M ) ′ ( x i - x ‾ M )
它们反映了各自类内样品的分散程度。如果GK和GL这两类相距较近,则合并后所增加的离差平方和WM-WK-WL应较小;否则,应较大。于是我们定义GK和GL之间的平方距离为: 
D KL 2 = W M - W K - W L
(2)空间聚类挖掘模型服务的封装 
本发明利用OGC WPS标准对空间聚类挖掘模型的服务查询请求、服务描述请求和服务调用请求及其返回结果的通信方式进行封装,提供查询请求、描述请求及调用过程的统一接口,分别对应OGC WPS规范的三个操作: 
GetCapabilities、DescribeProcess和Execute。通过GetCapabilities方法 请求并获取服务能够实现的功能,DescribeProcess操作获取Web服务中输入、输出参数的类型,由以上两个过程确定的挖掘模型,在本地数据库或网络获取到数据后,通过Execute调用数据挖掘模型方法对数据进行分析,并展示结果。 
本节封装的三个操作集成在PSE服务端的功能类里面,每个操作为一个功能类,具体如下: 
a、GetCapabilitis操作 
GetCapabilitis操作是OGC规范的通用规范,通过此方法可以请求并获取服务的元数据文档,元数据文档描述了服务能够实现的功能。GetCapabilitis操作提供每一个WPS的通用名称、简单描述和其版本信息等内容。用户请求的服务封装的格式规范依据OGC WPS中的GetCapabilitis来划定。把请求文档发送到服务端的服务页面,同时调用RequestProcessor类来对封装好的请求文档进行解析处理,RequestProcessor对请求的消息进行拆包处理,连同WPSGetCapabilities类去实现服务列表的调用功能,最终将得到的服务描述的元数据文档返回到客户端。对请求的返回结果利用OGC WPS规范进行包装,包装后以XML文档形式返回给客户端。 
b、DescribeProcess操作 
OGC WPS规范中的DescribeProcess操作是对Web服务中输入、输出参数的类型进行详细描述,以便用户在服务列表中选择最适合与其自身所要解决问题相匹配的服务。同GetCapabilities请求原理及处理过程基本类似。该操作返回简单服务描述和输入/输出参数的类型。 
c、Execute操作 
通过以上两个过程,用户已经确定了自己需要的数据模型,通过本地数据库或网络获取到数据后,调用模型分析方法对数据进行分析,并展示结果。Execute类主要负责对服务调用请求信息的封装,经过一系列的分析处理,得到封装好的返回结果。 
(3)空间聚类挖掘PSE系统架构 
本发明根据Portal架构的特点,结合本发明构建的空间聚类挖掘PSE的实际需要,拟采用Portal架构构建PSE系统,具体如下: 
a、Portal架构: 
Portal提供了从用户登陆到处理服务获取、数据提交、处理、结果可视化及结果信息提取等界面,并且通过界面的访问控制连接用户与服务端的应用模型。具有以下技术特点: 
①统一服务访问入口,服务门户为SOA架构的应用集成中间件平台中各种服务提供一个统一的访问入口点,从这个统一的入口可以访问那些孤立的、互不相关的服务,所有的用户都可以通过单一的入口访问他们需要的信息。在服务门户中,提供服务描述、发布、发现、组合、协同、管理等Web工具的统一界面集成,为用户的服务查询、服务发布、服务获取提供便利。本发明构建的PSE系统具有一个简化版本的服务门户入口。 
②服务资源的网络组件适配器,为了在服务门户中提供服务资源的表示层信息浏览,可以在Web服务的基础上为服务资源提供一个统一的访问接口,将每个具体的服务资源通过组件适配器封装为Web组件,以统一的界面展示方式完成与用户的交互。服务的开发者只要按照Web组件定义好的服务的接口实现了具体的应用逻辑,就可以很方便的通过Web组件适配器加入到服务门户中, 提供给用户表示层的信息浏览,这样就用简单的方式提供了一个有效的解决手段,给用户一种更加透明的方式来利用服务资源,实现服务的实现和访问的分离。这一部分内容在本发明的PSE系统的构建中具有重要的地位,下面将要详细介绍的PSE管理中心就相当于一个组件适配器。基于其对空间聚类模型的封装,就能将分散在各个不同服务端的服务集成在一个界面进行统一的实现和调用。 
根据以上分析知道Portal最大的优势即在于其可扩充性,本发明PSE系统采用类似Portal架构设计原理的目的亦在于此。图1A是本发明空间聚类挖掘PSE系统采用的Portal架构的基本组成框架。 
从图1A可看出Portal的组织结构大体分为三层:最上层的是Portlet层,包括Portlet(APP)及其API,Portlet是Portal实际用来进行应用集成的组件;处于中间层的是Portlet/Servlet Container层,包括Portlet Container及其API:Container Invoker和Container Provider;最底层就是需要执行的应用Portal Web Application,它们大都是建立在基本网络协议和编程技术,如HTTP和XML的基础之上的。其中需要说明的是Portlet Container,它主要管理Portlet的生命周期并且提供其运行所需的必要环境,同时为Portlet Reference提供持久化的存取服务。这一基本组成框架就囊括了Portal的界面层和组件适配器的内容。 
Portlet是基于Web的标准化组件技术,本发明的PSE是基于.Net环境开发,Portlet的功能相当于本发明构建的PSE服务端中的一个个功能类,每一个功能类都可以被认为是一个已经封装好的功能组件,其他功能类则可以通过添加引用的方式去调用该类的各种公共方法。 
Portlet是Portal中的基础单元,在Portal中每个用户请求都需要通过某一个Portlet的某个方法来完成,因此,Portlet是Portal中最重要的功能集成模块,且每个页面都可能由一个或多个Portlet组成,用户在某个Portlet中触发了一个或多个事件,则这些事件就有相应的Portlet来处理完成。图1B描述了Portlet的用户请求处理方式。 
本发明构建的PSE是基于.Net开发环境构建的网络系统。从功能控制上看,本发明调用的地图显示模块等同于一个Portlet API,它实现将动态生成的结果可视化的显示并返回给客户端;PSE管理中心的功能等同于Portlet/Servlet Container提供的功能,负责聚类模型的接入,即调用远程服务时在PSE管理中心中必须实现几个必要的接口,并发布必要的元数据文档内容等,Portlet /Servlet Container的第二个重要任务是基于OGC WPS规范实现对聚类模型的封装;最底层的Portlet Web Application即是PSE中的聚类模型,这些模型的实现方式、编码方式没有任何限制,但要求他们的通信协议是HTTP即可,这个特性是支持PSE扩充的根本特性。 
b、PSE总体架构 
根据Portal架构思想,本发明构件的空间聚类挖掘PSE系统的架构如图2所示,由用户层、功能层和数据层组成,具体如下: 
数据层201包括用于提供基础空间数据的至少一个空间数据库,如图2所示的基础地理数据201a,人口数据201b和相关社会经济数据201c。 
所述功能层202用于按照OGC WPS标准,封装空间聚类挖掘模型并提供统一的接口,实现空间聚类模型服务的发布、发现和调用功能,并且调用对外聚类分析结果展示接口,将空间聚类分析的结果可视化显示和返回。所述功能层 包括:PSE服务器202a,用于提供所述空间聚类模型,根据用户请求和输入参数确定空间聚类挖掘模型,根据从所述数据层或网络取得的数据执行所述空间聚类挖掘模型对所述数据进行分析并生成可视化处理结果;PSE管理中心202b,用于根据OGC WPS规范对各PSE服务器提供的所述空间聚类挖掘模型进行封装并提供查询请求、描述请求及调用过程的统一接口,执行利用所述模型的标准描述文档实现对模型功能的发布,执行输入参数的判断和初始化,并返回模型处理结果,所述统一接口包括数据初始化接口、模型处理接口及结果返回接口;PSE服务端202c,用于接收客户端发送的调用所述模型的请求,定位和调用所述模型并将处理结果生成符合OGC WPS规范的格式返回客户端,以及调用绘图类将聚类结果显示在地图上。 
功能层202的工作流程如图3所示。如上文所述,PSE服务器上的空间聚类挖掘模型基于OGC WPS规范而封装为三个操作:GetCapabilities、DescribeProcess和Execute。接到客户请求,PSE服务器调用GetCapabilities操作返回包含数据处理过程的元数据信息,从而使客户获取服务能够实现的功能;DescribeProcess操作返回执行处理所需要的输入输出类型和参数描述信息的XML文档,从而获取Web服务中输入、输出参数,由以上两个过程确定的挖掘模型,在本地数据库或网络获取到数据后,通过Execute调用数据挖掘模型方法对数据进行分析,并利用Map Service可视化的返回和展示结果。 
用户层203提供用于用户输入参数及模型服务选择的接口。如图2所示,服务提供者203a经用户层控制PSE服务器202a提供服务,系统管理者203b查找各PSE服务器所提供的服务并封装服务至PSE管理中心202b,终端用户203c通过PSE管理中心202b发现服务并返回服务列表,以及由PSE服务端202c调用服务并返回空间聚类挖掘的分析结果。 
在本发明PSE的设计架构中,对空间聚类挖掘模型的封装包括两方面,第一是指在PSE管理中的模型封装,在PSE中每增加一个模型则在PSE管理器中实现该模型的三个通用接口,即数据初始化、模型处理和结果返回;另外是基于OGC WPS对模型服务的请求、调用等通信过程进行封装。 
c、PSE服务端设计 
服务端集成了PSE的全部功能模块,PSE的优劣与否将完全取决于服务端的设计。本发明设计的PSE优于其他传统桌面PSE和网络PSE之处在于它的规范性,即利用OGC WPS标准封装聚类模型服务,这大大提高了模型在GIS行业中的深入应用,其扩展性又使得PSE可以随时进行升级维护,无论是数据的更新还是模型算法的更新都非常容易。依据前面的Portal设计思想,本发明将功能层的每个功能封装在一个功能类里面,并令其协同合作共建PSE管理中心。 
除(2)提到的GetCapabilities、DescribeProcess和Execute三个功能类之外,本文对整体功能架构起支撑作用的三个功能类分别是:WPS、RequestProcessor、ProcessMng和GetMap。 
①WPS是其他功能类的基类,分别就OGC WPS规范的三个标准接口涉及的各种参数变量进行定义,同时对公共的方法进行定义,是其他功能类实现的基础。 
②ProcessMng类接受来自客户端发送的调用模型方法的请求,定位到相应的处理服务。 
③RequestProcessor类实现模型服务的处理服务调用,并将处理结果生成符合OGC WPS规范XML格式返回到客户端。 
④GetMap类调用基于第三方开源SharpMap的绘图类,通过聚类结果在地图 上进行显示。 
依据Portal的结构设计思想,每一个功能类可视为一个Portlet,多个Portlet经过协同合作成为PSE的服务管理中心。 
d、PSE管理中心 
OGC WPS规范对空间聚类模型的封装,是对模型查询请求、描述请求和调用请求过程的封装处理,是消息传递的规范化,是用户获取和查询服务的过程标准化,是用户使用层次上的规范化。而对模型的管理是实现模型的几个逻辑接口而达到其在用户端集成的目的,即是服务端对模型进行的规范化处理,是管理级别的服务管理。 
PSE管理中心对模型的管理包含以下几个方面 
第一、利用模型的标准描述文档实现对模型的功能发布,发布的模型文档有两个,一是服务功能的元数据文档,即GetCapabilities请求返回的内容;另一个是服务描述文档,文档内容包括服务的输入参数及参数类型,处理输出结果的类型等具体内容; 
第二、模型处理的数据初始化,这是针对模型发布文档中的输入参数的判断和初始化;模型的数据初始化是实现模型处理服务的数据基础,正确依据元数据文档给输入数据赋值是实现远程服务处理的共享的关键。获取聚类模型服务的操作即实现了GetCapabilities操作。 
第三、模型的数据处理,利用模型实现对数据的处理是PSE构建的核心内容,空间聚类模型处理过程在PSE管理中心实现,实际调用的模型方法可以存放在任意网络中的服务器端,而PSE管理中心只需实现一个模型处理操作的接 口即可。 
第四、模型处理结果的返回,得到返回结果就是将模型的处理结果加工成符合WPS输出形式的结果,以便返回到客户端。在PSE管理中心表现为实现GetResult()这一方法,而结果的组织则依据不同的返回类型而定。本发明以文本的形式将聚类结果返回给客户端,同时将请求结果发送到地图管理的类,经过对结果分析处理在地图上将聚类结果可视化的展示在客户端。 
综上所述,本发明采用OGC WPS标准,实现了空间聚类模型服务封装的标准化、调用的规范化和充分的网络共享;引入PSE思想,建立了空间聚类挖掘的问题解决环境,为相关问题的解决提供了一种新的思路和方法。本发明可广泛应用于国民经济和社会发展的各个领域中,如气象领域、城市规划、环境监测、石油天然气勘探、经济研究、人口种族研究、政府和防卫、交通研究、水资源利用、地址灾害、防灾减灾、数据统计、经济普查、动态监测、信息展示、媒介等方面,为从海量的与位置有关的数据中发现和抽取出有利于决策的数据提供了有效的支持,大大提高和拓宽了空间数据挖掘模型的应用层次及质量,具有明显的社会效益和经济效益。 
以上所述,仅为本发明的具体实施方式,本发明还可以应用在其它控制设备中。本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求所界定的保护范围为准。 

Claims (4)

1.一种空间聚类挖掘PSE系统,其特征在于,包括数据层、功能层以及用户层,
所述数据层包括用于提供基础空间数据的至少一个空间数据库;
所述功能层用于封装空间聚类挖掘模型并提供统一的接口,实现空间聚类模型服务的发布、发现和调用,并且将空间聚类分析的结果可视化显示和返回,所述空间聚类挖掘模型的通信协议是HTTP协议,并且所述功能层基于OGC WPS标准对空间聚类挖掘模型的服务查询请求、服务描述请求和服务调用请求及其返回结果的通信方式进行封装,并将每个功能封装为一个功能类,其它功能类可以通过添加引用的方式调用该功能类的各种公共方法;
所述功能层包括:PSE服务器,用于提供所述空间聚类模型,根据用户请求和输入参数确定空间聚类挖掘模型,根据从所述数据层或网络取得的数据执行所述空间聚类挖掘模型对所述数据进行分析并生成可视化处理结果;PSE管理中心,用于根据OGC WPS规范对各PSE服务器提供的所述空间聚类挖掘模型进行封装并提供查询请求、描述请求及调用过程的统一接口,执行利用所述模型的标准描述文档实现对模型功能的发布,执行输入参数的判断和初始化,并返回模型处理结果;其中所述统一接口包括数据初始化接口、模型处理接口及结果返回接口;PSE服务端,用于接收客户端发送的调用所述模型的请求,定位和调用所述模型并将处理结果生成符合OGC WPS规范的格式返回客户端,以及调用绘图类将聚类结果显示在地图上;
所述用户层提供用于用户输入参数及模型服务选择的接口;
其中,所述空间聚类挖掘模型的算法是:①将空间数据中的各样品各自作为一类,并规定样品之间的距离和类与类之间的距离;其中类中各样品到类重心均值的平方欧式距离之和称为类内离差平方和,设两个类GK和GL合并成新类GM,则定义GK和GL之间的平方距离其中WM,WK,WL分别为类GM,GK和GL的类内离差平方和;②将距离最近的两类合并成一个新类,计算新类与其他类的距离;③重复进行步骤②,每次减少一类,直至所有的样品合并为一类。
2.根据权利要求1所述的空间聚类挖掘PSE系统,其特征在于,所述功能类包括:GetCapabilities、DescribeProcess和Execute;通过GetCapabilities请求并获取服务能够实现的功能,DescribeProcess获取网络服务中输入、输出参数的类型;在本地数据库或网络获取到数据后,通过Execute调用数据挖掘模型方法对数据进行分析,并展示结果。
3.根据权利要求2所述的空间聚类挖掘PSE系统,其特征在于,所述功能类还包括:WPS,作为功能类的基类,分别就OGC WPS规范的三个标准接口涉及的各种参数变量进行定义,同时对公共的方法进行定义;ProcessMng类,用于接受来自客户端发送的调用模型方法的请求,定位到相应的处理服务;RequestProeessor类,用于实现模型服务的处理服务调用,并将处理结果生成符合OGC WPS规范XML格式返回到客户端;GetMap类调用绘图类,通过聚类结果在地图上进行显示。
4.一种空间聚类挖掘PSE系统的构建方法,其特征在于,包括:
构建空间聚类模型和取得空间数据库,所述空间聚类挖掘模型的通信协议是HTTP协议;
利用OGC WPS标准对空间聚类挖掘模型的服务查询请求、服务描述请求和服务调用请求及其返回结果的通信方式进行封装,提供查询请求、描述请求及调用过程的统一接口,并将每个功能封装为一个功能类,其它功能类可以通过添加引用的方式调用该功能类的各种公共方法;
基于Portal结构构建PSE系统,所述系统包括数据层、功能层以及用户层,所述数据层包括用于提供基础空间数据的至少一个空间数据库;所述功能层用于封装空间聚类挖掘模型并提供统一的接口,实现空间聚类模型服务的发布、发现和调用,并且将空间聚类分析的结果可视化显示和返回;所述功能层包括:PSE服务器,用于提供所述空间聚类模型,根据用户请求和输入参数确定空间聚类挖掘模型,根据从所述数据层或网络取得的数据执行所述空间聚类挖掘模型对所述数据进行分析并生成可视化处理结果;PSE管理中心,用于根据OGC WPS规范对各PSE服务器提供的所述空间聚类挖掘模型进行封装并提供查询请求、描述请求及调用过程的统一接口,执行利用所述模型的标准描述文档实现对模型功能的发布,执行输入参数的判断和初始化,并返回模型处理结果;其中所述统一接口包括数据初始化接口、模型处理接口及结果返回接口;PSE服务端,用于接收客户端发送的调用所述模型的请求,定位和调用所述模型并将处理结果生成符合OGC WPS规范的格式返回客户端,以及调用绘图类将聚类结果显示在地图上;所述用户层提供用于用户输入参数及模型服务选择的接口;
其中,所述空间聚类挖掘模型的算法是:①将空间数据中的各样品各自作为一类,并规定样品之间的距离和类与类之间的距离;其中类中各样品到类重心均值的平方欧式距离之和称为类内离差平方和,设两个类GK和GL合并成新类GM,则定义GK和GL之间的平方距离其中WM,WK,WL分别为类GM、GK和GL的类内离差平方和;②将距离最近的两类合并成一个新类,计算新类与其他类的距离;③重复进行步骤②,每次减少一类,直至所有的样品合并为一类。
CN201110307623.XA 2011-10-12 2011-10-12 一种空间聚类挖掘pse系统及其构建方法 Expired - Fee Related CN102360377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110307623.XA CN102360377B (zh) 2011-10-12 2011-10-12 一种空间聚类挖掘pse系统及其构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110307623.XA CN102360377B (zh) 2011-10-12 2011-10-12 一种空间聚类挖掘pse系统及其构建方法

Publications (2)

Publication Number Publication Date
CN102360377A CN102360377A (zh) 2012-02-22
CN102360377B true CN102360377B (zh) 2014-01-29

Family

ID=45585706

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110307623.XA Expired - Fee Related CN102360377B (zh) 2011-10-12 2011-10-12 一种空间聚类挖掘pse系统及其构建方法

Country Status (1)

Country Link
CN (1) CN102360377B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103235847B (zh) * 2013-04-12 2015-11-18 连云港杰瑞深软科技有限公司 基于矩阵转换的模型动态调配方法
DE102014211140A1 (de) * 2014-06-11 2015-12-17 Siemens Aktiengesellschaft Computersystem und Verfahren zum Analysieren von Daten
CN104391879B (zh) * 2014-10-31 2017-10-10 小米科技有限责任公司 层次聚类的方法及装置
CN104391922B (zh) * 2014-11-20 2018-09-11 武汉图歌信息技术有限责任公司 一种地理空间信息自适应多终端可视化方法
CN105005575A (zh) * 2015-03-05 2015-10-28 张良均 一种企业智能预测快速开发接口方法
CN105786484B (zh) 2016-01-29 2019-05-10 华为技术有限公司 一种应用融合方法及装置
CN108268562B (zh) * 2017-01-04 2020-10-02 上海大唐移动通信设备有限公司 一种空间数据获取方法及装置
CN106600141A (zh) * 2017-02-24 2017-04-26 浙江知水信息技术有限公司 一种可独立管理不同水电发电模型调度与效益参数计算的方法
CN109086052A (zh) * 2018-07-06 2018-12-25 重庆和贯科技有限公司 基于Portal的BI系统
CN109299178B (zh) * 2018-09-30 2020-01-14 北京九章云极科技有限公司 一种模型应用方法和数据分析系统
CN109408616A (zh) * 2018-10-10 2019-03-01 中南民族大学 内容相似性短文本查询方法、设备、系统及存储介质
CN114996345B (zh) * 2022-05-31 2024-04-16 中国地质大学(武汉) 基于ogc网络处理服务的在线服务组合方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7685085B2 (en) * 2003-11-10 2010-03-23 James Ralph Heidenreich System and method to facilitate user thinking about an arbitrary problem with output and interfaces to external systems, components and resources
CN101751777B (zh) * 2008-12-02 2011-11-16 同济大学 基于空间聚类分析的城市路网交通小区动态划分方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
基于OGC WPS 的GIS 空间分析方法;姜超等;《测绘科学》;20110428;第36卷(第6期);第198~199页 *
姜超等.基于OGC WPS 的GIS 空间分析方法.《测绘科学》.2011,第36卷(第6期),第198~199页.
谢明霞等.人口空间聚类规则挖掘——全国各省市产业结构分类研究.《测绘科学(增刊)》.2008,第33卷第27~29页. *
赵国富等.基于聚类的空间数据挖掘系统的设计与实现.《山东理工大学学报(自然科学版)》.2005,第19卷(第6期),第41~44页. *

Also Published As

Publication number Publication date
CN102360377A (zh) 2012-02-22

Similar Documents

Publication Publication Date Title
CN102360377B (zh) 一种空间聚类挖掘pse系统及其构建方法
Molano et al. Metamodel for integration of internet of things, social networks, the cloud and industry 4.0
Robles et al. An IoT based reference architecture for smart water management processes.
Chen et al. Integrated open geospatial web service enabled cyber-physical information infrastructure for precision agriculture monitoring
Li et al. Sharing geoscience algorithms in a Web service-oriented environment (GRASS GIS example)
US20100306272A1 (en) Systems and methods for object-based modeling using hierarchical model objects
CN103036954A (zh) 基于gis的移动信息聚合系统及其方法
Di Orio et al. NOVAAS: A Reference Implementation of Industrie4. 0 Asset Administration Shell with best-of-breed practices from IT engineering
Liu et al. CyberGIS Gateway for enabling data‐rich geospatial research and education
Kiehle Business logic for geoprocessing of distributed geodata
Cabri et al. Uncoupling coordination: Tuple-based models for mobility
Song et al. High-level internet of things applications development using wireless sensor networks
Human et al. A design framework for a system of digital twins and services
WO2021096924A1 (en) Computerized systems and methods for automatically generating and displaying a unified asset centric analytics electronic interface
Stasch et al. Coupling sensor observation services and web processing services for online geoprocessing in water dam monitoring
EP2395468A1 (en) Semantic user interface data assembling
Bhattacharya et al. Smart cities intelligence system (smacisys) integrating sensor web with spatial data infrastructures (sensdi)
Hu et al. SOCO-Field: observation capability representation for GeoTask-oriented multi-sensor planning cognition
Folino et al. A grid portal for solving geoscience problems using distributed knowledge discovery services
Patti et al. Combining building information modelling and ambient data in interactive virtual and augmented reality environments
CN103077273B (zh) 建立在网络电子地图上的工程在线选线交互设计系统及方法
Pinto et al. Web of things data visualization: from devices to web via fog and cloud computing
Lin et al. Service component architecture for geographic information system in cloud computing infrastructure
Lakshman Narayana et al. An intelligent IoT framework for handling multidimensional data generated by IoT gadgets
Dasgupta et al. A framework for ubiquitous geospatial information integration on mobile device using orchestration of geoservices

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140129

Termination date: 20181012

CF01 Termination of patent right due to non-payment of annual fee