CN107301198A - 一种受限环境下的语义数据构建方法 - Google Patents
一种受限环境下的语义数据构建方法 Download PDFInfo
- Publication number
- CN107301198A CN107301198A CN201710344786.2A CN201710344786A CN107301198A CN 107301198 A CN107301198 A CN 107301198A CN 201710344786 A CN201710344786 A CN 201710344786A CN 107301198 A CN107301198 A CN 107301198A
- Authority
- CN
- China
- Prior art keywords
- data
- semantic
- equipment
- sensor
- mapping definition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W84/00—Network topologies
- H04W84/18—Self-organising networks, e.g. ad-hoc networks or sensor networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
Abstract
本发明公开了一种受限环境下的语义数据构建办法,该方法基于SSN和领域本体描述所有需要构建语义数据的设备,再基于设备描述,使用R2RML语言构建映射定义。映射定义成为传感器元数据的一部分,最后使用相关工具将传感器网关传来的数据元组转换为三元组,存入三元组数据库中。本发明对于物联网环境中数据的语义化处理具有很好的实用价值。
Description
技术领域
本发明属于数据存储与处理技术领域,具体涉及一种受限环境下的语义数据构建办法。
背景技术
传感器网络,是由许多在空间上分布的自动装置组成的一种计算机网络,这些装置使用传感器协作地监控不同位置的物理或环境状况。尽管应用场景和硬件部署不尽相同,且采集的感知数据存在异构性,但传感器网络的最终目的均为对感知数据进行获取、处理和传输,使用户从中获得感兴趣的信息。传感器网络必须充分利用有限的能量与传输带宽来及时收集与发布关键信息。
无线传感器网络(wireless sensor network,WSN)是以数据为中心的网络,无线指的是节点间通过无线协议相连,WSN简称为传感器网络(sensor network,SN)。从数据存储的角度来看,可以视为一个分布式数据库,且支持查询操作。但同时,传感器网络中节点数量庞大,且传感器节点产生的是无限的数据流,此外,对传感器网络数据的查询经常是连续或随机抽样的查询,这无法通过传统的分布式数据库的数据管理技术进行分析处理。
一个典型的传感器数据网络结构中,多个传感器节点通过一个网关节点与外界交流。
目前,实现互联传感世界还存在障碍。不同的SN以不同的方式捕获信息后通常采用不同的方式进行表达。数据模型框架各不相同,数据类型和数据结构也不一定兼容,即使是相同的数值,也可能采用不同的方式表达。例如,多个SN测量了同一种物理现象,而每个传感器部署各有一套方法来表达语义上一致的信息。比如“wind speed”和“average windspeed”,“temperature”和“thermometer”。假如一个用户想要在一个部署了各种SN的区域,获取最新的风速和温度数据,就必须有一套机制来让系统理解语义等同但表达不同的数据,以完全响应用户的查询。
不同的传感器网络间缺少融合与交流,常使重要的数据流被孤立,加剧了数据过多,知识过少的问题,也使得数据的重用十分困难。为了解决这些问题,以语义网技术为基础,语义传感器网络(Semantic Sensor Network,SSN)应运而生。
在SSN中,传感器数据包含语义元数据的注释,以增强互用性,并提供情景知识关键的上下文信息。传感器数据的注释里特别包括空间、时间和主题的语义元数据。SSNontology是由W3C语义传感网孵化器工作组发布的一个领域独立的模型,用以定义传感器的信息,以及传感器产生的观测结果。
发明内容
鉴于上述,本发明提供了一种受限环境下的语义数据构建办法,该方法解决了由于传感器网络多样性导致传感器数据共享与重用困难问题,为复杂语义查询提供基础。
一种受限环境下的语义数据构建办法,包括以下步骤:
(1)基于语义传感器网络本体和领域本体以资源描述框架(RDF)格式描述需要构建语义数据的设备,得到设备描述数据;
(2)基于设备描述数据,采用R2RML语言构建映射定义;
(3)利用支持R2RML的工具将传感器网关传来的数据根据映射定义转换为三元组,存入三元组数据库中,完成语义数据的构建。
所述的语义传感器网络本体,指的是由W3C语义传感网孵化器工作组发布的一个领域独立的模型SSN ontology(Semantic Sensor Networkontology),用以定义传感器的信息,以及传感器产生的观测结果。
所述领域本体,指的是描述设备语义所需要的其他本体。由于语义传感器网络本体的模型偏向概括性,它没有定义所有可能观测到的属性类型,但是这些属性类型定义可以从其他领域本体中获得,根据描述设备语义的需求选用。常见领域本体包括经纬度本体WGS84,有关“Quantity,Unit,Dimension and Type”的基础物理现象的本体QUDT,时间本体OWL-Time,环境测量类本体SWEET(Semantic Web for Earth and EnvironmentalTerminology)。
所述的设备描述数据包括设备元数据与设备某一刻的观测值;所述的设备元数据指的是设备名称、设备类型、设备在传感器网络中的位置(是一个底层传感器,还是一个上层网关)、与其他设备的关联关系(比如一个底层传感器从属于哪一个上层网关)以及设备能够观测的内容(如风速,温度)。
所述的设备某一时刻的观测值指的监测对象某一时刻的变量值,例如:若检测对象是温度,则此时的观测值即为温度值。
步骤(2)中,所述的映射定义描述以下内容,为方便描述假设映射定义的名字是SampleMap,使用R2RML定义映射时需要指定rr:SubjectMap,rr:graph,rr:predicateMap,和rr:objectMap:
a.所有三元组(主体-谓语-客体)中的主体根据何种原则创建。所有主体根据R2RML语言中的rr:SubjectMap创建。主体的URI使用R2RML语言中的模板rr:template rule定义,其中包括了前缀。如假设URI为www.example.url,则写作:
SampleMaprr:SubjectMap[rr:template www.example.url]
b.一个主体是设备观测值的一个实例。
c.为所有三元组创建一个虚拟RDF流节点。如将虚拟RDF流节点命名为SemanticNode.srdf,则写作SampleMaprr:graph sample:SemanticNode.srdf;
d.固定每个三元组中的谓语。假如需要使用QUDT本体中的qudt:numericValue定义成数值类型,则写作
SampleMaprr:predicateMap[rr:predicatequdt:numericValue];
e.客体的类型。假设SN中的观测值存储在数据库列columnname中,则写作:
SampleMaprr:objectMaprr:column“columnname”
另外,SampleMap属于rr:TriplesMapClass类,写作:
SampleMap a rr:TriplesMapClass
合并以上定义形成最终的映射定义。
步骤(2)中,构建的映射定义作为传感器元数据的一部分,是一种符合W3C R2RML语言的模板映射文件,供步骤(3)使用。
步骤(3)中,支持R2RML的工具包括:db2triples,morph,RDF-RDF2RDF,virtuoso,XSPARQL,这些工具具有强大的处理功能,能够准确快速地完成语义数据的转换。
由于无线传感器网络天然具有多样性,使得传感器数据的共享与重用十分困难,本发明受限环境下的语义数据构建方法通过引入无线传感器网络本体创建了映射定义,将无线传感器网络包含在数据中,使得后续在语义层面上理解与处理传感器信息,这为复杂语义查询提供基础。
附图说明
图1为本发明中的传感器网络集合与上部本体层的结构示意图;
图2为本发明中SSN ontology与领域本体的核心概念及关系示意图;
图3为本发明传感器数据到SSN ObservationValue的映射示意图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
图1所示的本发明中传感器网络集合与上部本体层的结构示意图,本发明所述的受限环境下的语义数据构建是基于这个构架进行的。
第一层是(Sensor Network Data Sources)传感器网络数据源。由各种各样的SN组成,每个SN包括不同的传感器节点。节点采集的数据汇聚后可以通过一个标准传感器网关获得。
第二层是本体层(Ontologylayer)。一旦传感器数据可以通过网关获得,就需要描述数据的语义。因此,第二层需要包括传感器本体。每个SN可以有自己本地的语义信息,这个语义信息可能是简单的内容定义,也可能是更复杂的本地本体。为了进行统一描述,来自本地语义信息的概念需要使用本体层的全局本体进行描述,在本发明中使用的是SSNontology。SSN ontology的概括性,可以涵盖不同的SN,方便按需引入领域本体,同时具有灵活性与扩展性,因为新的SN可以很容易地加入,而无需改变传感器网络数据源层其他SN的本地本体与公有词汇。来自传感器节点的传感器数据通过网关,在本层与本体匹配。
有了语义描述之后,就可以通过R2RML语言构建及配套工具,将数据处理成三元组。
可能需要描述的内容与使用的本体定义参见图2。
本实例中假设有某一个传感器网络的网关Gateway1,网关下包括多个传感器,测量的内容包括风速和温度。名为Sensor1的传感器测量风速,名为Sensor2的传感器测量温度。整个实例的统一资源标识符(URI)前缀设为sample:
步骤1:基于SSN ontology和领域本体构建RDF格式的传感器元数据;
每个传感器元件由一个URI标识(sample:Sensor1,Sample:Sensor2)。每个数据实例通过谓语ssn:observes链接到到该传感器能感知的属性上。本实例中描述感知属性使用了NASA的SWEET本体,里面包括温度和风速的定义,sweetSpeed:WindSpeed,sweetTemp:Temperature.
各部分的元数据定义如下:
Sensor1的描述:
Sensor2的描述:
网关的描述:
步骤2:基于SSN ontology和领域本体构建RDF格式的传感器某一时刻的观测值数据;
以风速传感器sensor1为例,某一时刻的观测值通过网关上传时形成一个数据库表格,如表1所示,表格包括两列,主键时间timed与观测值Wind_speed。
表格1
列名 | timed | Wind_speed |
sensor_data | sensor_data | |
sensor_data | sensor_data | |
… | … |
与步骤1中类似,ssn:ObservedProperty指示了观测值的属性。传感器采集的观测值表达成实例,通过ssn:hasValue链接到ssn:SensorOutput上。观测值的实际数据类型,可以通过引入领域本体来表达,比如double型数据可以采用QUDT本体中的qudt:numericValue,链接到xsd:double。
则某一时刻的观测值描述如下:
步骤3:构建映射定义,该映射需要说明将数据元组转换为三元组时遵循的规则,如图3所示:
所有三元组的主体根据rr:SubjectMap创建。URI使用模板rr:template rule,其中包括了前缀。
一个主体是ssn:ObservationValue的一个实例。
为所有三元组创建一个虚拟RDF流节点,SemanticWindSpeed.srdf。
每个三元组的谓语固定,在这个例子中就是qudt:numericValue。
客体的类型是xsd:double,本实例中将从传感器数据流的wind_speed属性中获取。
使用R2RML语言构建的映射定义,如下:
以db2triples为例,上述映射定义作为语义映射文件。
步骤4:利用db2triples工具将传感器网关传来的数据根据映射定义转换为三元组,存入三元组数据库中,完成语义数据的构建。
上述的对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。
Claims (3)
1.一种受限环境下的语义数据构建办法,包括以下步骤:
(1)基于语义传感器网络本体和领域本体以资源描述框架格式描述需要构建语义数据的设备,得到设备描述数据;
(2)基于设备描述数据,采用R2RML语言构建映射定义;
(3)利用支持R2RML语言的工具将传感器网关传来的数据根据映射定义转换为三元组,存入三元组数据库中,完成语义数据的构建。
2.如权利要求1所述的受限环境下的语义数据构建办法,其特征在于,所述的设备描述数据包括设备元数据与设备某一刻的观测值。
3.如权利要求1所述的受限环境下的语义数据构建办法,其特征在于,所述的映射定义描述以下内容:
所有三元组中的主体根据何种原则创建;
一个主体是设备观测值的一个实例;
为所有三元组创建一个虚拟RDF流节点;
固定每个三元组中的谓语;
客体的类型;
合并以上定义形成最终的映射定义。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710344786.2A CN107301198A (zh) | 2017-05-16 | 2017-05-16 | 一种受限环境下的语义数据构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710344786.2A CN107301198A (zh) | 2017-05-16 | 2017-05-16 | 一种受限环境下的语义数据构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107301198A true CN107301198A (zh) | 2017-10-27 |
Family
ID=60138000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710344786.2A Pending CN107301198A (zh) | 2017-05-16 | 2017-05-16 | 一种受限环境下的语义数据构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107301198A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108491509A (zh) * | 2018-03-22 | 2018-09-04 | 山东大学 | 一种传感数据映射、服务组合和智能服务方法及装置 |
WO2019178774A1 (zh) * | 2018-03-21 | 2019-09-26 | 西门子(中国)有限公司 | 传感器的模型描述方法和装置 |
CN110427352A (zh) * | 2019-06-05 | 2019-11-08 | 福建奇点时空数字科技有限公司 | 一种基于r2rml标准的数据自定义映射方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101950297A (zh) * | 2010-09-10 | 2011-01-19 | 北京大学 | 一种海量语义数据的存储和查询方法及装置 |
CN103279344A (zh) * | 2013-05-27 | 2013-09-04 | 武汉大学 | 一种支持异构传感器语义注册的方法及系统 |
-
2017
- 2017-05-16 CN CN201710344786.2A patent/CN107301198A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101950297A (zh) * | 2010-09-10 | 2011-01-19 | 北京大学 | 一种海量语义数据的存储和查询方法及装置 |
CN103279344A (zh) * | 2013-05-27 | 2013-09-04 | 武汉大学 | 一种支持异构传感器语义注册的方法及系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019178774A1 (zh) * | 2018-03-21 | 2019-09-26 | 西门子(中国)有限公司 | 传感器的模型描述方法和装置 |
CN108491509A (zh) * | 2018-03-22 | 2018-09-04 | 山东大学 | 一种传感数据映射、服务组合和智能服务方法及装置 |
CN110427352A (zh) * | 2019-06-05 | 2019-11-08 | 福建奇点时空数字科技有限公司 | 一种基于r2rml标准的数据自定义映射方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | Search techniques for the web of things: A taxonomy and survey | |
Le Phuoc et al. | Linked Open Data in Sensor Data Mashups,. | |
Compton et al. | The SSN ontology of the W3C semantic sensor network incubator group | |
Henson et al. | SemSOS: Semantic sensor observation service | |
Le-Phuoc et al. | The linked sensor middleware–connecting the real world and the semantic web | |
van den Brink et al. | Best practices for publishing, retrieving, and using spatial data on the web | |
Trilles et al. | A domain-independent methodology to analyze IoT data streams in real-time. A proof of concept implementation for anomaly detection from environmental data | |
Yu et al. | Using Linked Data in a heterogeneous Sensor Web: challenges, experiments and lessons learned | |
CN107301198A (zh) | 一种受限环境下的语义数据构建方法 | |
Liu et al. | Sensor information retrieval from Internet of Things: Representation and indexing | |
Zhu et al. | A similarity-based automatic data recommendation approach for geographic models | |
CN101699444A (zh) | 基于形式概念分析的遥感信息处理服务分类本体构建方法 | |
Wu et al. | Towards semantic web of things: from manual to semi-automatic semantic annotation on web of things | |
Petrolo et al. | Integrating wireless sensor networks within a city cloud | |
Buchel et al. | Geospatial analysis | |
Marshoodulla et al. | An approach towards removal of data heterogeneity in SDN-based IoT framework | |
Tila et al. | Semantic IoT System for Indoor Environment Control—A Sparql and SQL based hybrid model | |
Dutta et al. | Performance evaluation of south Esk hydrological sensor web: unsupervised machine learning and semantic linked data approach | |
Llanes et al. | From sensor data streams to linked streaming data: a survey of main approaches | |
Ferreira et al. | Ontology-based data integration for the Internet of Things in a scientific software ecosystem | |
Yadav et al. | An efficient sensor integrated model for hosting real-time data monitoring applications on cloud | |
Chen et al. | Semantic integration and knowledge discovery for environmental research | |
Shah Khusro et al. | Unleashing sensor data on linked open data-the story so far | |
Sandu et al. | Semantic data aggregation in heterogeneous learning environments | |
Jin et al. | Research on multi-source heterogeneous sensor information fusion method under internet of things technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171027 |