CN113407810B - 一种基于大数据的城市信息和服务集成系统及方法 - Google Patents

一种基于大数据的城市信息和服务集成系统及方法 Download PDF

Info

Publication number
CN113407810B
CN113407810B CN202110625723.0A CN202110625723A CN113407810B CN 113407810 B CN113407810 B CN 113407810B CN 202110625723 A CN202110625723 A CN 202110625723A CN 113407810 B CN113407810 B CN 113407810B
Authority
CN
China
Prior art keywords
service
data
information
module
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110625723.0A
Other languages
English (en)
Other versions
CN113407810A (zh
Inventor
王帅
熊璋
盛浩
赵双叶
吴玉彬
黄扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202110625723.0A priority Critical patent/CN113407810B/zh
Publication of CN113407810A publication Critical patent/CN113407810A/zh
Application granted granted Critical
Publication of CN113407810B publication Critical patent/CN113407810B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/252Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/547Remote procedure calls [RPC]; Web services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于大数据的城市信息和服务集成系统及方法,包括海量多源异构数据集成模块、多维信息可视化模块、服务注册维护模块、城市服务集成模块;通过跨域异构城市服务数据的高效分发、服务组合优化技术,实现多源、异构、分布的服务主体、服务数据和服务资源的高效可靠地汇聚;克服海量城市多源异构数据多粒度结构化描述差异,实现服务对象、主体、资源和数据汇聚;克服海量异构城市服务多领域跨系统差异,实现有效调度和集成不同数据源和服务;屏蔽数据源和服务的异构性、分布性,实现通过客户端操作透明的访问与管理城市服务。

Description

一种基于大数据的城市信息和服务集成系统及方法
技术领域
本发明涉及计算机软件应用的技术领域,特别是涉及基于大数据的城市信息和服务集成系统。
背景技术
城市中的服务设施在为城市居民带来生活便利的同时,积累了海量的、多元的、异构的、时空多维的、多尺度和多粒度的城市大数据,这些数据往往种类多样,数据的具体形式难以描述。随着“信息城市”“数字城市”“物联网”如火如荼的发展,城市中建立了不同规模等级的城市数据库,基于城市大数据提供的相关城市服务的范围也越来越广泛。但是由于数据本身海量、多源、异构、分布的特点,尽管近年来基于城市数据的服务已经逐步建立和完善,各服务应用之间仍然存在壁垒。各自独立、相对封闭的城市服务应用之间无法交互和组合,彼此之间构成了一个个“信息孤岛”。
为了减少城市各服务内部与外部之间的“信息孤岛”,优化城市信息资源配置,促进城市服务资源共享,提高空间信息资源利用效率,建立一个实现城市信息和服务集成功能的系统对于社会有着巨大的作用和价值。通过跨域异构城市服务数据的高效分发、服务组合优化,实现多源、异构的服务主体、服务数据和服务资源的高效可靠地汇聚,城市信息和服务集成系统可以屏蔽数据源和服务的异构性、分布性,实现通过客户端操作透明的访问与管理服务。
城市服务集成平台接到用户提交的服务请求后通过一系列分析对于服务进行分解,根据用户需求从服务平台中选择符合需求的服务并将它们组合起来以共同执行用户任务。从众多的组合服务中选择出最符合要求的组合服务进行服务组合,是一个具有强NP-hard复杂度的组合优化问题。依据服务发现和服务集成的过程是在任务执行时还是处理树或业务流模型解析时进行,可以将物联网环境中的服务组合分为运行时组合和运行前组合两种类型。根据用户通过编程接口创建的业务流模型,组合服务执行引擎借助服务模版,为业务流程中的每一个环节动态选择和运行时绑定实体服务或云服务,并根据业务流程中的数据流设置服务之间的参数传递和参数映射,从而形成满足任务需要的组合服务。由于未来对于服务智能化的程度会日益提高,物联网环境中的服务组合多为运行时组合的形式。运行时组合方法分为基于规划理论的服务组合方法和基于图规划的服务组合方法。前者与后者一样,均是基于某种形式化方法对于服务描述进行形式化转化后,通过可满足行推理机制的方式得出服务组合的结果。而前者求解服务组合问题时往往效率低下。本发明提出了一种基于图规划的服务组合方法,该方法对于服务进行建模时,将组合问题转化成一个规划图问题,将服务映射为规划图中的动作。将服务的输入输出参数映射为状态,用过规划图的扩展和规划解求得组合方案。由于规划图问题可以在多项式时间内构造,因此可以在更短的时间内求解服务组合问题。
在对处于异构平台、分布存放的城市信息和服务进行集成时,需要跨越一系列挑战,拟解决的关键技术问题如下:
(1)海量城市多源异构数据多粒度结构化描述差异
以构建城市智能服务数据的多粒度分割与描述机制,以应用服务为导向,有效融合多源城市服务大数据,在深度与广度上提升智慧城市感知数据的理解程度与应用水平。面向城市服务的多模数据,构建统一的城市多模数据的多尺度分析模型和智能融合方法。
(2)城市服务协同的基于语义的服务数据自动分发机制
基于集成思想的高效匹配算法,通过集成多个匹配算法,根据当前系统的状态和工作负载变化,实现匹配算法的优化选择,保障服务数据分发的性能和稳定性。基于发布/订阅系统实现服务数据的动态按需分发,通过解析服务关联关系,自动生成表达服务间数据分发需求的订阅,当服务完成协同操作后,自动实现订阅的删除操作,在保持服务松耦合关系的前提下,以提高系统的可扩展性。
(3)图规划的异构城市服务的组合与优化
根据城市服务治理与协同模型,结合跨域异构城市服务的具体流程,提出了基于图规划的服务组合方法。
发明内容
本发明的技术解决问题:克服海量城市多源异构数据多粒度结构化描述差异、城市服务协同的基于语义的服务数据自动分发机制、基于图计算的异构城市服务的组合与优化。
本发明提出一种基于大数据的城市信息和服务集成系统,针对城市服务的分布异构性与可信服务汇聚需求的矛盾,数据高效分发、服务组合优化技术,突破大规模城市服务主体在接入方式、封闭程度和负载能力方面存在的障碍,实现多源、异构、分布的服务主体、服务数据和服务资源的高效可靠地汇聚。所述系统包括客户端浏览器和数据集成服务器和服务集成服务器,利用B/S架构,将多源异构数据集成模块部署在数据服务器,城市服务集成模块部署在服务集成管理服务器,在客户端利用浏览器进行各个模块的访问,所述系统模块包括海量多源异构数据集成模块、多维信息可视化模块、服务注册维护模块、城市服务集成模块。
本发明的城市信息和服务集成系统,所述海量多源异构数据集成模块,用于实现海量多源异构数据集成的功能,本模块导入来自分布在不同数据存储平台的数据,即多源数据,进行城市数据集成,为多维信息可视化模块和服务注册维护模块提供可用的数据模式和查询通用接口。此模块功能包括:查询集成数据视图、模式、结构、内容;封装源数据,将多源数据的数据转化成集成系统可以处理的同一的格式;构建多源异构数据集的XML数据视图;对于XML视图进行解析,完成节点映射,获取表、字段、数据信息;与源数据库建立JDBC连接,拷贝数据到数据集成服务器中,完成数据导入;将SQL请求结果通过集成数据模式和查询通用接口输出,完成数据的查询;用户通过客户端请求查询数据,查询返回的结果即为该模块输出的集成数据。
本发明的城市信息和服务集成系统,所述多维信息可视化模块,基于海量多源异构数据集成模块提供的集成数据,实现以图表呈现已加载的集成数据,所述功能包括:使用拖拽或填表的方式,自定义数据呈现维度、过滤数据呈现的颗粒度、设置度量项、设置度量项计算项、设置图表配置项;所述计算项包括求和、平均、最大值、最小值;所述呈现包括各种多维度的呈现类型,包括折线图、柱状图、饼图、漏斗图,数据的各个维度均可进行展现。
本发明的城市信息和服务集成系统,所述服务注册维护模块,基于海量多源异构数据集成模块提供的集成数据,用于实现系统中服务的描述、注册和管理,以便系统能够快速定位用户请求服务的所需子服务;本模块对于系统中待注册实体服务的接口说明使用语义级别的描述,主要说明包括:服务描述、服务参数和服务协议。具体将服务描述分为能力和属性两大类;上述服务描述的能力部分包括:服务输入、服务输出、服务类型。所述服务描述的属性部分包括:服务的非功能属性和服务的情景信息;服务的非功能属性包括环境信息、用户信息、平台软硬件信息;服务的情景信息包括服务代价、服务性能、服务可靠性参数;管理系统中的注册服务,本模块采用一种基于一致哈希表的结构化分布式方法。服务描述作为系统中的服务注册信息,用一对二元组表示,二元组是由包含了服务名称和服务参数两项内容。其中,服务名称是指该服务在系统中的唯一ID,可用于实现一致性哈希表的索引,服务参数包括了该服务的物理资源信息和云端资源地址。云端资源地址由IPv4地址和端口号构成,实现了服务在分布式提供下的调用;最后本模块实现了对于系统中已注册的服务服务实体进行管理,管理操作包括:创建、注册、监听、添加、修改、删除和编辑。
本发明的城市信息和服务集成系统,所述城市服务集成模块,基于服务注册维护模块,用于实现系统中服务查找和服务组合;本模块按照用户提供的请求服务描述,采用集中式的匹配查找来找到满足应用需求的城市子服务,从而为用户直接或通过服务组合获得所需的城市服务提供必要的支持;具体实现基于语义进行精确服务查找,将用户服务请求和实体服务都抽象成包含属性和操作的本体,利用基于本体的发现机制进行推理,实现了请求分解、子查询管理、感知服务发现、有效性评价管理的功能;请求分解具体是指将用户的服务请求本体分解为层次化的若干子本体;子查询管理具体是指基于子本体创建子查询;感知服务发现具体是指基于子查询获得相应的感知服务;有效性评价管理具体是指,评价查询结果与用户请求的匹配效果;本模块从客户端获取用户需求,并按照需求处理执行计划通过服务发现找到需要的实体服务和云服务,选择多个服务将它们编排起来形成可运行的物联网系统,以完成指定的应用任务;具体实现基于图规划的跨域异构城市服务组合方法,动态自适应服务组合,根据形式化逻辑模型找出相关的实体城市服务,自动确定业务流模型并将找到的相关实体服务组合起来以完成的城市应用服务。
根据本发明的另一方面,提出一种基于大数据的城市信息和服务集成系统的方法,包括以下步骤:
步骤(1)海量多源异构数据集成
首先通过构造中间件,协调各多源异构数据,为后续模块提供虚拟的集成XML数据视图和基于视图的数据模式和查询通用接口,对基于SQL的结构化数据、半结构化数据进行集成。在这一过程中,各数据源仍然相互独立,中间件相当于为异构数据提供一个高层次的检索服务;所述中间件的实现基于XML模式和关系模式之间的转换,实现了把关系模式中的相关信息用XML文档的层次关系表示出来的功能;通过对于数据库建立JDBC连接,系统自动提取数据库中的视图,完成信息抽取;根据抽取信息的字段名称、类型、主键、外键,构建DOM树,并完成信息合成;生成中间DOM文档。最后对于DOM文档序列化,生成XML文档;对于各数据库进行查询重写,完成统一的数据库查询模式;建立XML文件的解析模式;封装集成数据模式和查询通用接口,输出经过XML解析的SQL查询结果;
步骤(2)多维信息可视化
通过列表展示出海量多源异构数据集成的数据,然后通过选择相应数据集,显示选中数据集对应的所有字段;利用鼠标拖拽,将字段拖动到度量项、过滤筛选区域,选择要生成的图表类型,包括柱状图、折线图、漏斗图、饼图、通过设置各类图表的配置项;对已加载的数据集提供各类图表的呈现,功能包括:自定义数据呈现维度,过滤数据呈现的颗粒度,设置度量项,设置计算项如求和、平均、最大值、最小值,设置各图表配置项,如图表标题、参考线;
步骤(3)服务注册维护
对于待注册的服务进行语义层次的说明,说明类型包括服务描述、服务参数和服务协议;服务描述分为能力和属性两类;上述服务描述的能力部分包括:服务输入、服务输出、服务类型。所述服务描述的属性部分包括:服务的非功能属性和服务的情景信息;服务的非功能属性包括环境信息、用户信息、平台软硬件信息;服务的情景信息包括服务代价、服务性能、服务可靠性参数;采用一种基于一致哈希表的结构化分布式方法来管理系统中的注册服务。注册信息用一对二元组表示,二元组是由包含了服务名称和服务参数两项内容。其中,服务名称是指该服务在系统中的唯一ID,可用于实现一致性哈希表的索引,服务参数包括了该服务的物理资源信息和云端资源地址。云端资源地址由IPv4地址和端口号构成,实现了服务在分布式提供下的调用;最后实现对于系统中已注册的服务服务实体的管理功能,管理功能包括:创建、注册、监听、添加、修改、删除和编辑配置文件;
步骤(4)城市服务集成
城市服务集成模块接收到外界的服务请求,针对请求信息提取需求信息并进行需求调用;接受外界请求,分析并提取出服务相关的需求信息;将处理后的需求信息处理,集中式的匹配查找来找到满足应用需求的城市子服务,生成调用服务的相关数据请求命令和服务请求命令;将数据请求命令发送给数据集成模块,获取相关数据,并将数据发送给服务请求命令调用的服务。
与现有技术相比本发明的有益效果为:
(1)海量城市多源异构数据多粒度结构化描述差异
以构建城市智能服务数据的多粒度分割与描述机制,以应用服务为导向,有效融合多源城市服务大数据,在深度与广度上提升智慧城市感知数据的理解程度与应用水平。面向城市服务的多模数据,构建统一的城市多模数据的多尺度分析模型和智能融合方法。
(2)城市服务协同的基于语义的服务数据自动分发机制
基于集成思想的高效匹配算法,通过集成多个匹配算法,根据当前系统的状态和工作负载变化,实现匹配算法的优化选择,保障服务数据分发的性能和稳定性。基于发布/订阅系统实现服务数据的动态按需分发,通过解析服务关联关系,自动生成表达服务间数据分发需求的订阅,当服务完成协同操作后,自动实现订阅的删除操作,在保持服务松耦合关系的前提下,以提高系统的可扩展性。
(3)图规划的异构城市服务的组合与优化
根据城市服务治理与协同模型,结合跨域异构城市服务的具体流程,提出了基于图规划的服务组合方法,该算法可在多项式时间内求解最优服务组合结果。
(4)通过海量多源异构数据集成、多维信息可视化、服务注册维护、服务集成管理的功能,实现了海量多源异构数据和城市服务的集成系统的建立,将各自分散的数据和服务进行数据集成,通过集成系统进行了同构和统一,为用户访问城市集成数据和使用城市集成服务提供了透明、便捷的接口;
(5)本发明通过对于海量多源异构数据和服务集成,优化城市信息资源配置,促进城市服务资源共享,提升了城市信息和服务集成系统的现实应用。
附图说明
图1为本发明的总体结构图;
图2为本发明系统的组成框图;
图3为本发明系统中的海量多源异构数据集成模块实现过程;
图4为本发明系统中的多维信息可视化模块实现过程;
图5为本发明系统中的服务注册维护模块实现过程;
图6为本发明系统中的市服务集成实现过程;
图7为基于图规划实现的服务组合算法中扩展阶段的算法流程图;
图8为基于图规划实现的服务组合算法中求解阶段的算法流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1-图8所示,本发明基于大数据的城市信息和服务集成系统部署在服务器端,在系统中导入各类多源异构信息数据,数据服务器部署多源异构数据集成模块、多维信息可视化模块,服务集成管理服务器部署服务注册维护模块、城市服务集成模块;
整个系统的实现过程如下:
(1)当客户端发生服务请求功能时,与服务集成服务器对于此请求进行记录,服务集成服务器对于服务请求基于语义分析完成服务描述,基于服务描述的结果调用服务组合功能,分解服务需求,调用集成数据查询接口,获取服务数据。当客户端服务器与服务集成服务器和数据集成服务器通讯时,在客户端TCP/IP端口过滤数据流,对用户业务行为与数据资源提交行为进行记录并形成记录结果文件;
(2)海量多源异构数据集成模块,读取外界的各类多源异构数据,通过导入Excel文件、执行SQL脚本方式来输入数据源的资源地址,并存放到系统数据库中。构建数据结构转换中间件,对于多源异构数据进行集成,将集成的过程封装成集成数据模式和查询通用接口,允许各客户端通过请求服务调用接口来获取相关的数据。
(3)多维信息可视化模块,根据用户请求调用海量多源异构数据集成模块提供的集成数据模式和查询通用接口,获取需求数据。分析需求数据类型,根据用户调用结果,绘制不同的数据表;自定义数据呈现维度,过滤数据呈现的颗粒度,设置度量项,设置度量项计算项(求和、平均、最大值、最小值)。
(4)服务注册维护模块,对于待注册的服务进行语义层次的说明,说明类型包括服务描述、服务参数和服务协议;服务描述分为能力和属性两类;上述服务描述的能力部分包括:服务输入、服务输出、服务类型。上述服务描述的属性部分包括:所述服务描述的属性部分包括:服务的非功能属性和服务的情景信息;服务的非功能属性包括环境信息、用户信息、平台软硬件信息;服务的情景信息包括服务代价、服务性能、服务可靠性参数;采用一种基于一致哈希表的结构化分布式方法来管理系统中的注册服务。注册信息用一对二元组表示,二元组是由包含了服务名称和服务参数两项内容。其中,服务名称是指该服务在系统中的唯一ID,可用于实现一致性哈希表的索引,服务参数包括了该服务的物理资源信息和云端资源地址。资源地址由IPv4地址和端口号构成,实现了服务在分布式提供下的调用;最后实现对于系统中已注册的服务服务实体的管理功能,管理功能包括:创建、注册、监听、添加、修改、删除和编辑配置文件;
(5)城市服务集成模块,分为两个部分,服务查找和服务组合;基于语义匹配进行精确服务查找,将用户服请求和实体服务都抽象成包含属性和操作的本体,利用基于本体的发现算法,实现了请求分解、子查询管理、感知服务发现、有效性评价管理的功能;按照用户提供的请求服务描述,采用集中式的语义匹配查找算法需按照满足应用需求的城市子服务,从而为用户直接或通过服务组合获得所需的城市服务提供必要的支持;从客户端获得应用需求,并按照需求处理后执行计划,通过服务发现算法找到需要的实体服务和云服务,选择多个服务将它们编排起来形成可运行的物联网系统,以完成指定的应用任务;具体基于图规划算法实现跨域异构城市服务组合方法,动态自适应服务组合,根据形式化逻辑模型找出相关的实体城市服务,自动确定业务流模型并将找到的相关实体服务组合起来以完成的城市应用服务。
根据本发明的一个实施例,上述实现过程的具体实施如下:
1.硬件设备选型
上述客户端服务器与中心服务器的硬件选型如下:
客户端服务器最低配置要求:
CPU主频:1GHz
内存:2GB
硬盘容量:1T
以太网卡:百兆
中心服务器最低配置要求:
CPU主频:128GHz
内存:64GB
硬盘容量:128T
以太网卡:千兆
2.海量多源异构数据集成模块
该模块的实现过程如图3所示:构建中间件的实现基于XML模式和关系模式之间的转换,实现了把关系模式中的相关信息用XML文档的层次关系表示出来的功能;通过对于数据库建立JDBC连接,系统自动提取数据库中的视图,完成信息抽取;根据抽取信息的字段名称、类型、主键、外键,构建DOM树,并完成信息合成;生成中间DOM文档。最后对于DOM文档序列化,生成XML文档;对于各数据库进行查询重写,完成统一的数据库查询模式;建立XML文件的解析模式;封装集成数据模式和查询通用接口,输出经过XML解析的SQL查询结果;当发生数据请求时,经过数据模式和查询通用接口完成目标数据的返回。
3.多维信息可视化模块
该模块的实现过程如图4所示:根据用户请求调用海量多源异构数据集成模块提供的集成数据模式和查询通用接口,获取需求数据。分析需求数据类型,根据用户调用结果,绘制不同的数据表。当用户选择刷新操作时,重复调用集成数据查询接口获取最新的集成数据可视化展示。在用户选择保存操作时,需要保存相关的参数,则将数据集的名称保存到对应的数据集名称字段,将数据处理状态从草稿修改为保存,在数据集描述字段中写入一些描述性的信息。
4.服务注册维护模块
该模块实现了服务的描述、注册和管理功能,实现过程如图5所示。主要分为以下步骤:
(1)构建语义描述器对于服务进行语义级别的描述。描述具体包括服务描述、服务参数和服务协议。具体将服务描述分为能力和属性两大类。上述服务描述的能力部分包括:服务输入、服务输出、服务类型。所述服务描述的属性部分包括:服务的非功能属性和服务的情景信息;服务的非功能属性包括环境信息、用户信息、平台软硬件信息;服务的情景信息包括服务代价、服务性能、服务可靠性参数;
(2)构建一致哈希表管理系统中的注册服务。注册信息用一对二元组表示,二元组是由包含了服务名称和服务参数两项内容。其中,服务名称是指该服务在系统中的唯一ID,可用于实现一致性哈希表的索引,服务参数包括了该服务的物理资源信息和云端资源地址。资源地址由IPv4地址和端口号构成,实现了服务在分布式提供下的调用;
(3)实现服务的基本操作,包括创建、注册、监听、添加、修改、删除和编辑。使用数据库语句实现基于服务注册表的服务的创建、插入、删除、编辑功能。
5.城市服务集成模块
该模块的实现过程如图6所示:实现主要分为两个步骤,服务查找和服务组合;基于语义匹配进行精确服务查找,将用户服务请求和实体服务都抽象成包含属性和操作的本体,利用基于本体的发现机制进行推理,实现了请求分解、子查询管理、感知服务发现、有效性评价管理的功能;按照用户提供的请求服务描述,采用集中式的匹配查找来找到满足应用需求的城市子服务,从而为用户直接或通过服务组合获得所需的城市服务提供必要的支持;从用户端获得应用需求,并按照需求处理执行计划通过服务发现模块找到需要的实体服务和云服务,选择多个服务将它们编排起来形成可运行的物联网系统,以完成指定的应用任务;具体基于图规划算法实现跨域异构城市服务组合方法,动态自适应服务组合,根据形式化逻辑模型找出相关的实体城市服务,自动确定业务流模型并将找到的相关实体服务组合起来以完成的城市应用服务。
图规划算法实现服务组合主要过程如图7、图8所示:图规划算法分为两个阶段,扩展阶段和求解阶段。算法主要概括为,给定初始状态与目标状态,找到一组服务序列使得初始状态到达目标状态。图规划算法分为扩展阶段和求解阶段。在扩展阶段中,根据给定的初始状态使用迭代法扩展新的服务并得到新的状态,直到最终目标状态经过一步迭代不发生改变,则扩展结束。若规划图进入了不动层,则表示没有满足需求的规划解使得初始状态达到目标状态。否则,开始逆向求解阶段,该阶段将为目标状态查找一组后驱状态满足该目标状态的动作集合,并通过这一组动作集合得到新的目标状态,直到所有的目标状态均出现在初始状态中为止,则得到该规划问题的规划解,即得到一组服务序列可使初始状态转移到目标状态。
具体服务组合步骤如下:
(1)将服务组合问题映射到图规划求解问题,基于以下步骤构建规划图的边和节点。
i.城市服务service映射为图规划中的动作action;
ii.城市服务service的输入参数映射为动作action的前驱状态pre(action);
iii.城市服务service的输出参数映射为动作action的后驱状态pos(action);
iv.用户的服务请求映射为图规划中的初始状态Sinitial
v.用户的服务请求得到的服务组合结果映射为图规划中的最终状态Sfinal
vi.动作集合和状态集合和构成规划图的边和节点。
(2)完成规划图的扩展阶段建立。
重复以下步骤构建每一层状态集合和动作集合,直到最终状态全部出现在状态集合中或者状态集合不再更新。
i.将用户服务请求的内容作为规划图的初始状态构建第一层状态集合;
ii.根据上一层的状态集合查找满足服务请求条件的动作添加到新的动作集合;
iii.遍历得到的动作集合,将每个动作的后去状态添加到下一层的状态集合;
(3)完成规划图的求解阶段建立。
对于每个最终状态Sfinal,查找一组满足服务请求条件的动作集合,并将该动作集合的每一个动作的前驱状态pre(action)作为新的最终状态集合。
重复以上过程,构成新的最终状态集合,直到回溯到初始状态时得到一组从初始状态转移到最终状态的服务组合解。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变型,这些改进和变型也应视为本发明的保护范围。

Claims (3)

1.一种基于大数据的城市信息和服务集成系统,其特征在于:所述系统包括海量多源异构数据集成模块、多维信息可视化模块、服务注册维护模块和城市服务集成模块;所述城市信息指来自城市多个应用服务数据库的数据,城市数据来源、结构的不同,构成了多源异构的城市数据;
所述海量多源异构数据集成模块,实现海量多源异构数据加载和集成功能;所述数据加载是导入来自分布在不同数据存储平台的数据,进行城市数据集成过程;经过该模块处理后的数据称为集成数据,集成数据将提供给多维信息可视化模块和服务注册维护模块,为多维信息可视化模块和服务注册维护模块提供可用的数据模式和查询通用接口;所述各类多源异构数据包括以数据集的名称作为表名,数据集的字段作为表的属性,建立一一对应关系并存入数据库中;所述数据集成是对于每个数据库基于SQL的结构化数据、半结构化数据进行的集成,通过构造中间件,协调各类多源异构数据,为多维信息可视化模块提供虚拟的集成XML数据视图和基于视图的数据模式和查询通用接口;所述中间件的构造是指,基于XML模式和关系模式之间的转换,实现把关系模式中的相关信息用XML文档的层次关系表示出来,实现对基于SQL的结构化数据、半结构化数据进行集成;在数据集成的过程中,各个数据库的数据称为数据源,数据源仍然相互独立,中间件为异构数据提供检索服务;该模块得到集成数据后为服务注册维护模块和多维信息可视化模块提供数据来源;
所述多维信息可视化模块,基于海量多源异构数据集成模块提供的集成数据,实现以图表呈现集成数据的结构、并对集成数据进行多维度呈现;基于海量多源异构数据集成模块获取的数据,先将数据特征进行多维度提取并形成新的数据特征,再针对提取后形成的数据特征进行数学计算项运算,将运算后的数据进行图形化呈现,最后根据呈现效果判断是否进行数据状态的保存;所述数据多维度提取包括:数据的时间维度,空间维度和多元语义维度;所述数学计算项包括求和、平均、最大值和最小值;所述图形化呈现包括:折线图、柱状图、饼图、漏斗图和地图;对数据进行多维度呈现之后,根据呈现效果判断是否进行数据状态的保存;
所述服务注册维护模块,基于海量多源异构数据集成模块提供的集成数据,实现系统中服务的描述、注册和管理;对于系统中待注册实体服务的接口说明使用语义级别的描述,主要说明包括:服务描述、服务参数和服务协议,将服务描述分为能力和属性两大类;上述服务描述的能力部分包括:服务输入、服务输出、服务类型;所述服务描述的属性部分包括:服务的非功能属性和服务的情景信息;服务的非功能属性包括环境信息、用户信息、平台软硬件信息;服务的情景信息包括服务代价、服务性能、服务可靠性参数;采用结构化分布式方法来管理系统中的注册服务,系统中待注册服务实体的服务描述采用一对二元组表示,二元组由包含服务名称和服务参数两项内容;同时实现对系统中已注册的服务服务实体进行管理,所述管理的操作包括创建、注册、监听、添加、修改、删除和编辑配置文件;
所述城市服务集成模块,基于服务注册维护模块,用于实现系统中服务查找和服务组合;基于语义匹配进行精确服务查找,将用户服务请求和实体服务都抽象成包含属性和操作的本体,利用基于本体的查找算法进行推理,实现了请求分解、子查询管理、感知服务发现、有效性评价管理的功能;处理执行用户请求,通过服务发现找到需要的实体服务和云服务,选择多个服务将它们编排起来形成可运行的物联网系统,以完成指定的应用任务;
所述海量多源异构数据集成模块中:通过构造中间件,协调各多源异构数据,为后续模块提供虚拟的集成XML数据视图和基于视图的数据模式和查询通用接口,对基于SQL的结构化数据、半结构化数据进行集成;所述集成过程的实现依赖中间件的构建;所述中间件的实现基于XML模式和关系模式之间的转换,实现把关系模式中的相关信息用XML文档的层次关系表示出来的功能;构建中间件的过程中,首先通过对于数据库建立JDBC连接,系统自动提取数据库中的视图,完成信息抽取;根据抽取信息的字段名称、类型、主键、外键,构建DOM树,并完成信息合成;生成中间DOM文档;最后对于DOM文档序列化,生成XML文档;对于各数据库进行查询重写,完成统一的数据库查询模式;建立XML文件的解析模式;封装集成数据模式和查询通用接口,输出经过XML解析的SQL查询结果,此结果即为该模块输出的集成数据;
所述服务注册维护模块:对于待注册的服务进行语义层次的说明,说明类型包括服务描述、服务参数和服务协议;服务描述分为能力和属性两类;上述服务描述的能力部分包括:服务输入、服务输出、服务类型;所述服务描述的属性部分包括:服务的非功能属性和服务的情景信息;服务的非功能属性包括环境信息、用户信息、平台软硬件信息;服务的情景信息包括服务代价、服务性能、服务可靠性参数;基于一致哈希表的结构化分布式方法来管理系统中的注册服务,注册信息用一对二元组表示,二元组是由包含了服务名称和服务参数两项内容;其中,服务名称是指该服务在系统中的唯一ID,用于实现一致性哈希表的索引;服务参数包括该服务的物理资源信息和云端资源地址,云端资源地址由IPv4地址和端口号构成,实现服务在分布式提供下的调用;最后实现对于系统中已注册的服务服务实体的管理功能,所述管理功能包括:创建、注册、监听、添加、修改、删除和编辑配置文件。
2.根据权利要求1所述的基于大数据的城市信息和服务集成系统,其特征在于:所述城市服务集成模块:
按照用户提供的请求服务描述,采用集中式的匹配查找来找到满足应用需求的城市服务,基于语义匹配进行精确服务查找,将用户服务请求和实体服务都抽象成包含属性和操作的本体,利用基于本体的查找算法,实现请求分解、子查询管理、感知服务发现、有效性评价管理的功能;请求分解指将用户的服务请求本体分解为层次化的若干子本体;子查询管理指基于子本体创建子查询;感知服务发现是指基于子查询获得相应的感知服务;有效性评价管理指评价查询结果与用户请求的匹配效果;在客户端获得应用需求后,按照需求处理执行计划通过服务查找和服务组合找到需要的实体服务和云服务,选择多个服务将它们编排起来形成可运行的物联网系统,以完成指定的应用任务。
3.一种基于大数据的城市信息和服务集成方法,其特征在于,包括以下步骤:
(1)多源异构数据集成:分为数据加载和数据集成两个步骤:首先,获取各多源异构数据库地址,与各数据库建立JDBC连接,得到多个数据库中的视图,完成信息抽取;之后,通过构建中间件,进行数据集成,建立集成XML数据视图和基于视图的数据模式和查询通用接口,多维信息可视化和服务注册维护步骤中需要的集成数据来自该接口的查询结果;建立集成XML数据视图和基于视图的数据模式和查询通用接口的步骤是:根据得到多个数据库中的视图,抽取视图中数据的字段名称、类型、主键、外键,构建DOM树,完成信息合成;生成中间DOM文档,对于DOM文档序列化处理最终生成XML文档;建立XML文件的解析模式;根据解析模式对于各数据库SQL语句查询重写,完成统一的数据库查询模式;封装集成数据模式和查询通用接口;绘制来自XML解析的SQL语句查询结果的展示界面;
(2)多维信息可视化:首先,向多源异构数据集成步骤中建立的数据模式和查询通用接口发送查询请求,获取该接口返回集成数据的数据查询结果;绘制多维信息可视化界面;提取集成数据的数据查询结果中的数据字段、数据内容;构建数据字段与柱状图、折线图、漏斗图、饼图的对应关系;用户选择列表提供的数据字段,或者使用在地图区域使用鼠标绘制多边形选择对应区域的数据,利用鼠标拖拽,将字段拖动到横坐标、纵坐标、过滤项,选择要生成的图表类型,图表类型包括柱状图、折线图、漏斗图、饼图;
(3)服务注册维护:首先,向多源异构数据集成步骤中建立的数据模式和查询通用接口发送查询请求,获取集成数据中的服务数据;基于服务数据对服务描述、服务参数和服务协议进行语义级别上的描述;服务参数包括该服务的物理资源信息和云端资源地址,云端资源地址由IPv4地址和端口号构成;服务描述的属性部分包括:服务的非功能属性和服务的情景信息;服务的非功能属性包括环境信息、用户信息、平台软硬件信息;服务的情景信息包括服务代价、服务性能、服务可靠性参数;之后,建立注册信息,注册信息用一对二元组表示,二元组是由包含了服务名称和服务参数两项内容;其中,服务名称是指该服务在系统中的唯一ID,用于实现一致性哈希表的索引;构建一致性哈希表,作为存储和搜索注册信息的工具;编写系统中已注册的服务服务实体的管理功能,通过对一致性哈希表进行创建、添加、查询、修改操作,实现对与服务注册的创建、注册、监听、添加、修改、删除和编辑配置文件的管理功能;
(4)城市服务集成:分为服务查找和服务组合两个步骤;基于语义匹配进行精确服务查找,将用户服务请求和实体服务都抽象成包含属性和操作的本体;按照用户提供的请求,经过服务注册维护步骤后,采用集中式的匹配查找来找到满足应用需求的城市子服务;从用户获得应用需求,按照需求处理执行计划通过服务发现模块找到需要的实体服务和云服务,选择多个服务将它们编排起来形成可运行的物联网系统,以完成指定的应用任务;在实现过程中基于图规划算法实现跨域异构城市服务组合方法,给定初始状态与目标状态,找到一组服务序列使得初始状态到达目标状态,动态自适应服务组合,根据形式化逻辑模型找出相关的实体城市服务,自动确定业务流模型,将找到的相关实体服务组合起来以完成的城市应用服务。
CN202110625723.0A 2021-06-04 2021-06-04 一种基于大数据的城市信息和服务集成系统及方法 Active CN113407810B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110625723.0A CN113407810B (zh) 2021-06-04 2021-06-04 一种基于大数据的城市信息和服务集成系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110625723.0A CN113407810B (zh) 2021-06-04 2021-06-04 一种基于大数据的城市信息和服务集成系统及方法

Publications (2)

Publication Number Publication Date
CN113407810A CN113407810A (zh) 2021-09-17
CN113407810B true CN113407810B (zh) 2023-04-18

Family

ID=77676448

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110625723.0A Active CN113407810B (zh) 2021-06-04 2021-06-04 一种基于大数据的城市信息和服务集成系统及方法

Country Status (1)

Country Link
CN (1) CN113407810B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117914768B (zh) * 2024-03-19 2024-05-17 中国科学院空天信息创新研究院 贯通节点的服务访问路径构建系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008111031A2 (en) * 2007-03-12 2008-09-18 France Telecom An improved grid computing architecture and method for invoking network services for subscription
CN100573528C (zh) * 2007-10-30 2009-12-23 北京航空航天大学 数字博物馆网格及其构造方法
CN101674290B (zh) * 2008-11-26 2012-07-25 天津大学 基于语义web服务关系网络的自动服务组合系统
CN103259872A (zh) * 2013-05-31 2013-08-21 江苏物联网研究发展中心 基于开放式网格体系的多源异构地理信息服务平台
CN104243569B (zh) * 2014-09-09 2017-08-11 安徽四创电子股份有限公司 一种城市操作系统
CN107894990A (zh) * 2017-10-09 2018-04-10 中国电子科技集团公司第二十八研究所 一种城市通用功能平台
CN111259006B (zh) * 2019-11-19 2023-06-27 中国科学院计算机网络信息中心 一种通用的分布式异构数据一体化物理汇聚、组织、发布与服务方法及系统
CN112100256B (zh) * 2020-08-06 2023-05-26 北京航空航天大学 一种数据驱动的城市精准深度画像系统及方法

Also Published As

Publication number Publication date
CN113407810A (zh) 2021-09-17

Similar Documents

Publication Publication Date Title
Motro et al. Fusionplex: resolution of data inconsistencies in the integration of heterogeneous information sources
US10769165B2 (en) Computing data lineage across a network of heterogeneous systems
CN110083706B (zh) 一种面向物联网微服务框架及其服务组合方法
CN103336813A (zh) 一种基于中间件架构的物联网数据集成管理方案
CN111523003A (zh) 一种以时序动态图谱为核心的数据应用方法及平台
Zhao et al. Ontology-based geospatial data query and integration
CN111026874A (zh) 知识图谱的数据处理方法及服务器
US20200320045A1 (en) Sytems and methods for context-independent database search paths
CN105808853A (zh) 一种面向工程应用的本体构建管理与本体数据自动获取方法
Mehmood et al. Distributed real-time ETL architecture for unstructured big data
CN113407810B (zh) 一种基于大数据的城市信息和服务集成系统及方法
López et al. A component-based approach for engineering enterprise mashups
Folinas et al. Developing mobile commerce applications
CN101989939A (zh) 实时数据提供方法、服务器和网络
CN108241709A (zh) 一种数据集成方法、装置和系统
CN107239483B (zh) 一种基于数据服务的跨域电梯数据组合视图自动生成方法
Yu et al. Foundations for efficient web service selection
Cipriani et al. Exploiting constraints to build a flexible and extensible data stream processing middleware
Campaña et al. Semantic data management using fuzzy relational databases
Zhou et al. Building quick resource index list using wordnet and high-performance computing resource ontology towards efficient resource discovery
Limam et al. Managing web services communities: A cache for queries optimisation
Retima et al. A quality-aware context information selection based fuzzy logic in IoT environment.
Savnik et al. Method of Big-graph partitioning using a skeleton graph
Cuevas-Vicenttin et al. Efficiently coordinating services for querying data in dynamic environments
Harth Link traversal and reasoning in dynamic linked data knowledge bases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant