发明内容
本发明旨在解决以上现有技术的问题。提出了一种在物联网边缘设备中构建语义模型的优化方法。本发明的技术方案如下:
一种在物联网边缘设备中构建语义模型的优化方法,其包括以下步骤:
物联网领域本体的构建步骤、数据标注步骤、RDF数据存储步骤及RDF数据推理步骤;其中,
物联网领域本体的构建步骤是构建表示物联网中传感器节点信息、执行设备信息、环境状态在内的概念和数据以及他们的属性、关系;
数据标注步骤是将传感器网络节点的数据流,执行设备的数据流格式化为本体中的数据形式,即转换成RDF格式数据;
RDF数据存储步骤是将数据标注之后的数据进行持久化的本地存储;
RDF数据推理是利用推理机将标注后的RDF数据进行前项链推理,得到知识间的隐含关系,同时利用规则推理实现对特定事件的策略生成。
进一步的,所述物联网领域本体构建是利用W3C推荐的传感器网络本体SSN结合具体的物联网环境,定义一个完备的概念、关系集合;在本体的构建过程中根据删除原则去掉语义传感器网络本体(SSN)中不常用的概念以减小本体占用的存储资源,SSN是由W3C语义传感器网络孵化器工作组推出的一个描述传感器和传感器观测值的OWL 2本体,这个本体是最有代表性的传感器本体,传感器本体的构建需要考虑一些额外的概念和关系,例如:物联网环境中的执行设备的概念与关系,物联网自然环境、运行环境的概念与关系,物联网中人机交互的概念与关系。
进一步的,所述删除原则为:
(1)现实环境中并不存在的概念
(2)现实环境中存在的概念但是在本体建模中不需要的概念
(3)表达意义相同的概念。
进一步的,所述数据标注步骤是将物联网环境中的传感器、执行设备产生的原始数据描述为RDF三元组数据,其中RDF三元组是以Turtle格式的文档来描述,Turtle文档实现了以紧凑的文本形式写下RDF图,Turtle文档由一系列指令、三元组语句或空白行组成,当三元组是一个主语、谓词、宾语项的序列时,由空格分隔,并在每个三元组之后由’.’结尾,RDF术语有三种类型:RDF URI引用、文字和空白节点。
进一步的,所述的RDF存储是将三元组数据存储在边缘设备的本地ROM中,使用SPARQL语言查询和推理。其中SPARQL是为RDF开发的一种查询语言和数据获取协议,它是为RDF数据模型定义,是W3C所推荐的RDF数据存储查询语言标准。
进一步的,所述RDF数据推理是利用推理机实现本体中隐含知识的发现,以及设计规则推理实现策略生成,推理机的实现方法是基于RETE算法,具体包括:
在推理之前设计一种模式选择算法,实现剔除无用模式,提高推理的速度以及降低推理过程内存资源的占用大小,其中模式是指未实例化的三元组,在描述模式选择算法之前定义符号:
模式选择算法设计思想是在进行推理之前去除推理机中多余的规则。
进一步的,在使用RETE算法进行前项链推理之前,使用模式选择算法去除多余的模式,所述模式选择算法具体包括:
在描述模式选择算法之前定义如下符号:
A.Ont:表示定义好的物联网领域本体。
B.R:表示推理中的规则集合;
C.V:表示本体中的词汇集合亦可称作三元组集合;
D.K0:表示本体集合中的词汇和V中词汇的交集;
E.OntR+表示基于规则集R推理的本体;
F.K0 R+:表示V中词汇和OntR+中词汇的交集;
G.C
r:一条规则的前提,一条规则通常由前提和结论组成表示为:
表示由规则中的前提能推到处结论;
H.Ar:一条规则的结论;
I.
表示目标规则集,r表示一条具体的规则,t表示该条规则满足规则的前提并且不属于K
0 R+,
表示存在规则t;
模式选择算法设计思想是在进行推理之前去除推理机中多余的规则,实现步骤如下:
Step1:初始化K0为本体Ont中的所有词汇;
Step2:初始化K0 R+为K0;
Step3:判断规则集中是否有没有判定的规则,若否则算法结束,若是则判断当前规则是否属于规则集R,若是则执行step4,否则执行step3;
Step4:取出规则中的前提并判断前提是否属于K
0 R+,若是则将该规则r加入规则集
取出结论A
r,更新K
0 R+集合,即在K
0 R+中加入结论A
r;否则执行step3。
进一步的,K0的初始化步骤为:
Step1:将K0赋值为空集;
Step2:在本体Ont中不重复的取出一个模式并与已存在的模式进行匹配,若匹配则将该模式加入K0集合中,若不匹配则执行step2,直到遍历完所有模式;
Step3:返回K0;
进一步的,当应用场景为手机自动装配生产线时,手机自动装配生产线车间内有对各个部件和环境的传感器以及控制设备的控制器,在车间内设立网关对传感器网络的数据进行汇聚,实现网关侧对底层的传感器网络数据的语义化处理,物联网的领域本体用于表示手机自动装配生产线车间中传感器节点信息、执行设备信息、环境状态等概念和数据以及他们的属性、关系,综合参考W3C标准中的SSN本体和手机自动装配生产线车间具体环境中的实际情况进行本体的构建,手机自动装配生产线车间领域本体的建模准则主要参考Gruber提出的本体建模五条准则。
进一步的,用七步法作为手机自动装配生产线车间领域领域知识本体的建模方法,并遵循Gruber提出的五条建模准则,同时选择TopBraid Composer企业版软件作为本体建模工具以及使用OWL 2作为本体建模语言,其中七步法分别为:明确范围,考虑重用,列举术语,定义类,定义属性,定义约束与创建实例,生成本体模型。
进一步的,在使用推理机进行推理得到推理结果后,由推理结果所描述的事件,将事件分为简单事件(定义为物联网设备本地可以处理的事件)和复杂事件(定义为物联网设备本地无法处理的事件)。简单事件可以直接交给本地处理单元处理并将处理结果反馈给传感器和执行单元,复杂事件交给服务器端处理并将处理结果反馈给传感器和执行设备。
本发明的优点及有益效果如下:
(1)如权利要求1、2、3、4、5、6中所述,在物联网边缘设备中构建语义模型,将传统物联网中的数据语义处理从云端部分迁移至边缘设备中,减轻云端或者服务器端的计算负载,提高物联网系统的响应实时性。将相对隐私的数据放在边缘设备中处理,提高数据的安全性。实现对设备的远程监控与维护,技术人员可以身处异地而全权限地访问边缘设备进而访问其他设备,从而显著提高监测和维护效率,有效节省维护成本,预先监测并消除物联网环境中的故障;
(2)如权利要求2中所述,针对传统语义模型直接应用于边缘设备所出现的资源占用大,处理时延高的问题,在本体构建阶段针对物联网具体环境对SSN本体进行了删除与添加,降低了本体的复杂度,从而降低了后续的推理过程时延。
(3)如权利要求7、8中所述,设计了一种模式选择算法,在本体推理之前去除规则集中未使用的规则,从而有效的减少了在RETE算法进行前项链
推理时规则的匹配次数进而减少了推理过程中的内存资源的消耗。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
为了实现上述目的,本发明采用以下技术方案:
语义模型包含物联网领域本体的构建,数据标注,RDF数据存储,RDF数据推理。语义模型构建步骤见图3所示,其中包括了数据的转换与缓存,数据标注,推理,事件处理,更新知识库等。
物联网领域本体用于表示物联网中传感器节点信息、执行设备信息、环境状态等概念和数据以及他们的属性、关系。
数据标注是将传感器网络节点的数据流,执行设备的数据流格式化成本体中的数据形式,即转换成RDF格式数据。
RDF数据存储是将数据标注之后的数据进行持久化的本地存储。
RDF数据推理是利用推理机将标注后的RDF数据进行前项链推理,得到知识间的隐含关系,同时利用规则推理实现对特定事件的策略生成。
如上所述的物联网领域本体构建是利用W3C推荐的传感器网络本体SSN结合具体的物联网环境,定义一个完备的概念、关系集合。在本体的构建过程中去掉SSN中不常用的概念以减小本体占用的存储资源,例如ssn:System,sosa:Platform,sosa:Procedure,sosa:usedProcedure等。其中删除原则约定如下:
(1)现实环境中并不存在的概念
(2)现实环境中存在的概念但是在本体建模中不需要的概念
(3)表达意义相同的概念
如上所述的SSN是由W3C语义传感器网络孵化器工作组(SSN-XG)推出的一个描述传感器和传感器观测值的OWL 2本体,这个本体是最有代表性的传感器本体。SSN(SemanticSensor Network)本体主要有两个目的,一个是描述传感器和传感器网络并应用到传感器Web应用程序中,另一个是根据现有的标准(如SWE标准)研究和推荐使用本体语义化应用程序的方法。虽然SSN描述了传感器相关的基本概念及其联系,但是该传感器本体并不适用于面向物联网应用的传感网语义Web的构建,原因如下:
(1)SSN本体没有对传感器进行分类,这就无法满足物联网应用领域多种传感器类型共存的情况下对不同传感器类型的管理;
(2)对传感器数据的描述能力不足,现实生产环境中的数据变化较快、数据的关联性复杂,因此,对传感器数据的描述需要加强;
(3)SSN重点关注的是传感器方面的描述,对传感器所在网络的其他设备以及环境的描述欠缺。
因此,针对SSN的上述不足,传感器本体的构建必定要考虑一些额外的概念和关系。借鉴了SSN本体的相关概念和关系,构建用于物联网领域的传感器本体。
如上所述的数据标注是将物联网环境中的传感器、执行设备产生的原始数据描述为RDF三元组数据。其中的RDF三元组是以Turtle格式的文档来描述。Turtle文档实现了以紧凑的文本形式写下RDF图。Turtle文档由一系列指令、三元组语句或空白行组成。简单的三元组是一个(主语、谓词、宾语)项的序列,由空格分隔,并在每个三元组之后由’.’结尾。RDF术语有三种类型:RDF URI引用(简称URIs)、文字和空白节点。
如上所述的RDF存储是使用SPARQL语言将三元组数据存储在边缘设备的本地ROM中,方便查询和推理。其中SPARQL是为RDF开发的一种查询语言和数据获取协议,它是为RDF数据模型定义,是W3C所推荐的RDF数据存储查询语言标准。
如上所述的RDF数据推理是利用推理机实现本体中隐含知识的发现,以及设计规则推理实现策略生成,推理机的实现方法是基于RETE算法。
在推理之前设计一种模式选择算法,实现剔除无用模式,提高推理的速度以及降低推理过程内存资源的占用大小。其中模式是指未实例化的三元组例如:?v rdf:type?w表示主语v的类型是宾语w所表示的类型;?p rdfs:domain?d表示主语p的定义域范围为d所表示的范围;?v owl:sameAs?w表示主语和宾语表示相同的事物;在描述模式选择算法之前定义如下符号:
J.Ont:表示定义好的物联网领域本体。
K.R:表示推理中的规则集合。
L.V:表示本体中的词汇集合亦可称作三元组集合。
M.K0:表示本体集合中的词汇和V中词汇的交集。
N.OntR+表示基于规则集R推理的本体。
O.K0 R+:表示V中词汇和OntR+中词汇的交集。
P.C
r:一条规则的前提,一条规则通常由前提和结论组成表示为:
表示由规则中的前提能推到处结论。
Q.Ar:一条规则的结论。
模式选择算法设计思想是在进行推理之前去除推理机中多余的规则,实现步骤如下:
Step1:初始化K0为本体Ont中的所有词汇。
Step2:初始化K0 R+为K0。
Step3:判断规则集中是否有没有判定的规则,若否则算法结束,若是则判断当前规则是否属于规则集R,若是则执行step4,否则执行step3。
Step4:取出规则中的前提并判断前提是否属于K
0 R+,若是则将该规则r加入规则集
取出结论A
r,更新K
0 R+集合(即在K
0 R+中加入结论A
r);否则执行step3;
其中K0的初始化步骤为:
Step1:将K0赋值为空集。
Step2:在本体Ont中不重复的取出一个模式并与已存在的模式进行匹配,若匹配则将该模式加入K0集合中,若不匹配则执行step2,直到遍历完所有模式。
Step3:返回K0。
本例应用场景为手机自动装配生产线,其示例见图1。手机自动装配生产线车间内有检测各个执行设备和环境状态的传感器以及控制设备的控制器,在车间内设立网关对传感器网络的数据进行汇聚,并在网关侧实现对底层传感器网络数据的语义化处理,因此处的网关由于具有数据处理能力,它也称作为物联网边缘设备,同时网关将传感器网络的数据转发至IPv4网络,整个数据的处理流程和架构图,见图2。因为传统语义技术并不适用于储存资源小,计算资源少,功耗要求低的网关设备,因此需要在各个部分进行优化,从而减小语义模型占用资源的大小,提高语义模型处理数据的实时性。因此本发明针对手机自动装配生产线车间的本体模型在SSN本体的基础上进行了删除和扩展,对语义推理部分进行了改进,使得改进后的语义模型可以满足边缘设备的特性。
物联网的领域本体用于表示手机自动装配生产线车间中传感器节点信息、执行设备信息、环境状态等概念和数据以及他们的属性、关系。综合参考W3C标准中的SSN本体和手机自动装配生产线车间具体环境中的实际情况进行本体的构建,其中SSN需要删除的部分概念见表1。此外手机自动装配生产线车间领域本体的建模准则主要参考Gruber于1995年提出的本体建模五条准则:
(1)明确性和客观性:本体中概念和概念间关系必须明确地定义应用领域中对象和对象间关系,并能够对领域知识进行客观准确地描述。
(2)全面性:本体应尽可能多地包含领域词汇,且尽可能全面地体现应用领域中对象之间的复杂关系。
(3)一致性:本体中所有概念都必须是可满足的,且概念和概念间关系必须与应用领域中对象和对象间关系保持一致。
(4)最大单调可扩展性:本体需要更新时,尽可能不去修改已经定义的概念和概念间关系,如若必须修改,也要尽量把修改量降到最少。
(5)最小承诺和最小编码偏好:对本体中概念和概念间关系定义尽可能少的约束,且在实现同等描述效果的前提下使用最少代码量完成本体模型构建。
实施例中采用七步法作为手机自动装配生产线车间领域领域知识本体的建模方法,并遵循Gruber提出的五条建模准则。其中七步法分别为:明确范围,考虑重用,列举术语,定义类,定义属性,定义约束与创建实例。生成本体模型,见表2。
数据标注是将手机自动装配生产线车间中各个传感器采集的数据以及执行设备的数据转换成RDF数据,在手机自动装配生产线车间环境中需要标注的数据类型包括:车间的环境信息如温度,湿度,烟雾,自动,车间状态,AGV小车转态,机械臂定位转态,机械臂6轴关节角角度,机械手臂的定位坐标,工装气缸状态,工位托盘状态,生产数量数量信息,生产质量信息,故障信息等。数据标注示例,见表3。
RDF数据推理是使用基于RETE算法的推理机将标注后的RDF数据进行前项链推理,得到知识间的隐含关系。在推理之前使用模式选择算法进行模式筛选,模式选择算法的步骤如表4。在推理时可以根据本体中已有的三元组和推理机中设置好的规则进行知识推理,也可以结合自定义规则推理生成针对特定事件的解决方案。其中自定规则推理是使用RDFprolog语言,RDF Prolog可以在RDF/RDFS层面上构建更高层次的概念和复杂的语义关系,进行强大的递归计算、检索匹配或者推理。表5,展示了使用prolog语言对火灾进行推理的一般方法。
RDF数据存储是将标注之后的数据进行持久化的本地存储,RDF存储是将三元组数据存储在网关设备的本地ROM中,使用SPARQL语言查询和推理。在本实施例中手机自动装配生产线车间的RDF数据与语义标注中的数据来源相同,如温度,湿度,烟雾,自动,车间状态,AGV小车转态,机械臂定位转态,机械臂6轴关节角角度,机械手臂的定位坐标,工装气缸状态,工位托盘状态,生产数量数量信息,生产质量信息,故障信息等。在查询历史数据信息时使用SPARQL语言对RDF数据库进行查询。
进一步地,在网关设备中对汇聚的数据进行分类处理,主要有两种类型的数据:一种是对响应要求较高的数据,另一种是对响应要求不高的数据。将对响应要求的高的数据额为设立了数据实时处理单元进行处理,如图2,并将处理的结果及时反馈给传感器网络或者执行设备。将对响应要求不高的数据进行语义化处理,提升设备间的互操作性与数据的有效共享。在网关侧添加常见事件描述集合以及对应事件的处理方法集合,在推理步骤执行完成并检测到事件时,执行相应的事件处理方法。
进一步地,若推理结果不在预先设定的可处理事件集合中,则将原始数据发送到PC/服务器端进行更全面的策略生成执行过程。因此在网关侧建立网关与服务器的交互接口如图2,其中包括了本体更新接口,规则修改接口,网关管理接口,异常接口,感知设备管理接口,执行设备管理接口。实现服务器端或者PC端对网关以及现场设备的维护与管理。
综上所述,本发明设计的适用于物联网设备的本体构建方法和优化推理过程的模式选择算法可以实现将传统语义技术从PC机迁移至物联网设备,并实现存储资源消耗的减小以及语义处理效率的提升。实现将物联网传感网络和执行设备中的数据部分地在本地处理,减轻服务器端或者云端的计算负载,提高物联网系统的响应实时性。实现PC端或者服务器端对物联网系统的远程控制与维护。提高了物联网设备间的互操作性能,实现了物联网系统之间数据的有效共享,从而提升整个物联网系统的运行效率。
表1 SSN需要删除的概念列举
表2本体模型示例
表3数据标注实例
表4模式选择算法
表5对火灾事件推理的prolog语言描述
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。