发明内容
有鉴于此,本发明提供了一种物联网实体搜索方法及系统,以克服现有技术中由于传感器搜索匹配条件固定,且传感器之间不存在交互、不涉及数据互操作,在存在较多传感器和其所依附的实体时进行查询,造成整个数据库的查询负担的问题。
为实现上述目的,本发明提供如下技术方案:
一种物联网实体搜索方法,包括:
获取进行搜索的时间区间、地理范围和具体查询条件;
查询符合所述时间区间和地理范围搜索条件的预设的网格数据库;
对所述具体查询条件进行分词,提取各个查询关键词;
确定各个所述查询关键词对应的各个应用领域,在所述网格数据库中依据所述应用领域查询对应的传感器数据;
获取各个所述查询关键词对应的查询结果按优先级进行排序,并在可视化搜索界面上显示和/或标记。
优选地,基于预设的所述网格数据库的存储传感器数据的过程具体包括:
获取传感器网上各个传感器采集的数据信息;
对所述数据信息进行语义化分析,获取语义化的传感器数据;
在传感器网整合架构上统一所述传感器数据的形式;
按区域将统一形式后的所述传感器数据,存储于对应传感器的网格数据库中。
优选地,确定各个所述查询关键词对应的各个的应用领域,并进行查询的具体过程包括:
在各应用领域的词库中对所述查询关键词进行匹配;
确定与所述查询关键词匹配率大于等于预设匹配率的应用领域为查询关键词所在应用领域;
解析所述应用领域中的领域本体,获取对应所述查询关键词的查询结果。
优选地,按优先级对查询结果进行排序具体包括:
依据所述查询结果的应用领域对所述查询结果进行排序,各个所述应用领域对应各自不同的预设排列方式。
优选地,在进行查询的过程中还包括:
基于支持向量机SVM的序列预测模型,获取与所述查询关键词、所述网格数据库相关的预测结果,所述预测结果为所述查询结果的一部分。
优选地,在进行搜索之前,还包括:
设置搜索限制条件;
当满足搜索限制条件时,执行获取进行搜索的时间区间、地理范围和具体查询条件这一步骤。
优选地,所述网格数据库由该区域范围内的对应的服务器进行控制,所述服务器由传感器网的中央服务器进行控制;
当一区域加入新传感器网络时,对应更新所述区域内服务器的服务列表,并向所述中央服务器提交所述新传感器网络的信息。
一种物联网实体搜索系统,包括:
搜索应用层,用于用户输入进行搜索的时间区间、地理范围和具体查询条件,以及在搜索界面上显示和/或标记按优先级排序后的查询结果;
处理层,用于按区域存储于各类传感器对应的所述网格数据库中,依据获取到时间区间、地理范围和具体查询条件的搜索条件,在符合所述搜索条件的预设的网格数据库内查询传感器数据,获取对应的查询结果,并将所述查询结果按优先级进行排序后发送至搜索应用层进行显示和/或标记;
传感器层,用于采集各个区域中各类传感器的数据信息。
优选地,所述处理层包括:
分布式区域处理单元,用于对传感器层中获取的所述数据信息进行语义化分析和数据序列预测处理,获取语义化的传感器数据,以及在传感器网整合架构上统一所述传感器数据的形式;
集中处理单元,用于对所述具体查询条件进行分词,提取各个查询关键词;以及确定各个所述查询关键词对应的各个应用领域,在所述网格数据库中依据所述应用领域进行查询,并按优先级对查询结果进行排序。
优选地,所述分布式区域处理单元中还包括:
安全模块,用于设置搜索限制条件;当满足搜索限制条件时,执行查询;
更新模块,用于当一区域加入新传感器网络时,对应更新所述区域内服务器的服务列表,并向所述中央服务器提交所述新传感器网络的信息。
经由上述的技术方案可知,与现有技术相比,本发明公开了一种物联网实体搜索方法及系统。通过创建基于物联网的新的实体搜索系统,利用实时采集传感网中各个传感器的数据信息,将各区域采集的数据信息按SWE规范统一格式后存储在其所在的区域的网格数据库中。当按照时间区间、地理范围和查询条件三个查询条件进行查询的过程中,分区域进行处理,并基于统一格式的数据进行查询和显示、标识的互操作。通过上述操作,实现避免海量数据的集中处理,减低整个系统的处理负担,增强整个系统的搜索性能的目的。
实施例一
请参阅附图2,为本发明实施例一公开一种物联网实体搜索方法的流程图,主要包括以下步骤:
S101,获取进行搜索的时间区间、地理范围和具体查询条件。
根据传感器数据时空性强的特点在进行搜索时需要获取与其相关的搜索条件,该搜索条件一般包括时间区间、地理范围和具体查询条件。
S102,查询符合所述时间区间和地理范围搜索条件的预设网格数据库。
需要说明的是,执行步骤S102获取的符合搜索条件的网格数据库,该网格数据库分区域存储传感器网中对应区域内各个传感器所采集到的传感器数据。具体存储的过程如图3所示,主要包括:
步骤S301,获取传感器网上各个传感器采集的数据信息。
步骤S302,对所述数据信息进行语义化分析,获取语义化的传感器数据。
步骤S303,在传感器网整合架构上统一所述传感器数据的形式。
步骤S304,按区域将统一形式后的所述传感器数据,存储于对应传感器的网格数据库中。
在执行步骤S102确定所查询区域内的网格数据库之后,继续执行步骤S103。
S103,对所述具体查询条件进行分词,提取各个查询关键词。
S104,确定各个所述查询关键词对应的各个应用领域,在所述网格数据库中依据所述应用领域进行查询。
其中,在步骤S104中,确定各个所述查询关键词对应的各个的应用领域,并进行查询的具体过程如图4所示,主要包括
步骤S401,在各应用领域的词库中对所述查询关键词进行匹配。
步骤S402,确定与所述查询关键词匹配率大于等于预设匹配率的应用领域为查询关键词所在应用领域。
步骤S403,解析所述应用领域中的领域本体,获取对应所述查询关键词的查询结果。
在执行步骤S104之后,继续执行步骤S105。
S105,获取各个所述查询关键词对应的查询结果按优先级进行排序,并在可视化搜索界面上显示和/或标记。
在执行步骤S105的过程中,将获取到的各个所述查询关键词对应的查询结果按优先级进行排序,排序的方式与所述查询结果所对应的应用领域有关,各个不同的应用领域具有各自不同的预设排列方式。例如,对空停车位的查询,查询的结果可能是附近多个停车场均有空位,那么则根据用户所处位置距停车场的距离及交通状况来设置先后顺序,进而进行查询结果的排序,以及显示和/或标记。
对于在执行步骤S105中所述的显示和/或标记,则具体根据显示界面实现,如显示界面为带有地图的显示界面,则将查询获取的结果一并在地图上进行标记,使用户对结果的感知更加明显和直观。
基于上述本发明实施例公开的物联网实体搜索方法基础上,为保证其安全性,还设置了许可进行搜索的限制条件,当满足该搜索限制条件时,才能够执行上述的查询过程。如,设置用户类型、用户密码或许可密码等。对于安全设置本发明所公开的实施例并不仅限于上述方式。
此外,在上述本发明实施例公开的查询过程中还包括:基于SVM的序列预测模型,获取与所述查询关键词、所述传感器区域数据库相关的预测结果,将所述预测结果作为所述查询结果的一部分进行显示。实际上该预设结果则为依据查询条件进行分析后未来可能出现过的搜索结果。
另外,需要说明的是,上述各区域的网格数据库由该区域范围内的对应的服务器进行控制,所述服务器由传感器网的中央服务器进行控制;当一区域加入新传感器网络时,对应更新所述区域内服务器的服务列表,并向所述中央服务器提交所述新传感器网络的信息。
通过上述本发明实施例公开的物联网实体搜索方法,按照时间区间、地理范围和查询条件三个查询条件分区域进行处理,并基于统一格式的数据进行查询和显示、标识的互操作。能够实现避免海量数据的集中处理,减低整个系统的处理负担,增强整个系统的搜索性能的目的。
上述本发明公开的实施例中详细描述了一种物联网实体搜索方法,对于本发明的方法可采用多种形式的系统实现,因此本发明还公开了一种物联网实体搜索系统。下面给出具体的实施例进行详细说明。
在建立物联网实体搜索系统的过程中,与上述物联网实体搜索方法所要考虑的问题相同,主要包括:
其一,构建各个传感器网络的设备、数据采集、处理以及存储方式和通信协议等等方面的不同,使得这些网络成为各自独立的信息孤岛,很难将它们进行互联,以实现达到资源的有效分配和共享。因此,该所建立的物联网实体搜索系统需要对获取到的数据统一格式,使数据以一定形式存储应用,使机器可理解,可实现共享。其所依据的规范为OGC的SWE规范,基于该规范可以提供解决异构传感器网络的连接和传感器资源的共享问题的可行方案。
其二,基于语义网过的相关技术,将传感器数据经过处理后并赋予一定的语义,通过构建本体和推理找到各事物之间的联系,进一步实现传感器数据内容的融合,实现基于语义的实体搜索。
其三,基于传感器采集数据具有时间、空间性强,以及数据量大的特点。
通过上述内容,所建立的物联网实体搜索系统如图5所示,由负责数据采集的传感器层201,与用户交互的搜索应用层202和实现搜索功能最重要的处理层203三层组成。
传感器层201,用于采集各个区域中各类传感器的数据信息。
该传感器层201由通常的传感器网络组成,部署在各地的大量的各式传感器设备负责对自然现象的感知和信息进行采集。
各个传感器网络可以采用不同的标准。如传感器间可采用如WPAN协议、IEEE 1451等不同的标准通信协议进行通信。各个传感器将采集的信息以多跳方式汇聚到对应的基站,基站对数据做简单预处理,通过数据汇聚和融合过滤掉原始传感数据中一些错误和无效的数据,并消除冗余数据之后向上层递交。
搜索应用层202,用于用户输入进行搜索的时间区间、地理范围和具体查询条件,以及在搜索界面上显示和/或标记按优先级排序后的查询结果。
该搜索应用层202为整个物联网实体搜索系统的最上层,主要负责与用户交互。因为,进行实体搜索的多数情况为搜索满足查询条件的实体位置,所以建立的搜索界面中具有地图形式显示的界面,将查询结果以文字和/或地图标记的形式示出。
此外,鉴于传感器采集数据具有时空性强的特点,搜索条件一般具有时间区间、地理范围、具体查询条件三部分。用户在搜索界面的时间选择框中选取搜索时间区间;地理范围的选择方式则为先在地图中选定一个目标地点,以此为圆心,再选定另一点为圆边上的点,获取的搜索范围即为由这两点所示出的圆面区域;或者在搜索界面的地理范围输入框中输入中心位置及圆的半径长度进行范围限定;具体查询条件则由用户在搜索界面的查询输入框中输入即可。
另外,该物联网实体搜索系统还支持历史信息、实时信息及未来预测参考信息的搜索,因此在该搜索应用层202的搜索界面上还设置有对应的输入框。
此外,该搜索应用层202的搜索界面上还设置有可以提供搜索服务列表,指示用户该搜索系统提供哪些实体搜索服务。
处理层203,用于依据获取到时间区间、地理范围和具体查询条件的搜索条件,在符合所述搜索条件的预设传感器区域数据库内进行查询,获取对应的查询结果,并将所述查询结果按优先级进行排序后发送至搜索应用层进行显示和/或标记。
处理层203是该物联网实体搜索系统的功能核心部分,实现用户查询语句的语义解析、查询任务分配、查询结果的排序及对传感器层201采集的数据信息进行处理,以及依据SWE规范统一数据为机器可理解的格式、信息存储等功能。
由于,传感器数据的时空性强,数据量极其庞大,所以在本发明所公开的实施例中不采用现有技术中所采用的搜索引擎将网页收集集中存储索引的方法,而是对各个传感器区域分布式处理和存储,在需要时按需向各地服务器分配查询任务、提取数据。据此将该处理层203划分为上下两部分,如图6所示,该处理层203主要包括:分布式区域处理单元2031和集中处理单元2032。
分布式区域处理单元2031,用于对传感器层中获取的所述数据信息进行语义化分析和数据序列预测处理,获取语义化的传感器数据,以及在传感器网整合架构上统一所述传感器数据的形式。
有上述可知,该分布式区域处理单元2031主要负责对传感器层201采集到的数据进行处理、存储,并且该过程都基于各个传感器所分布的区域范围内对应的服务器上实现。如图7所示,在该分布式区域处理单元2031中主要包括:语义化模块301、数据序列预测模块302、SWE整合平台303和网格数据库304。
语义化模块301,用于对采集到的传感器的数据信息做前期处理,经数据分析实现传感器数据表现内容的语义化,如视频信息的结构化、语义化等。
数据序列预测模块302,用于提供对未来信息的预测结果供用户参考。
该数据序列预测模块302主要基于SVM的序列预测模型进行预测的过程。
该SVM的序列预测模型主要采用结构风险最小化原则代替经验风险最小化原则。由于,SVM的非线性变换是通过核函数来实现的,核函数的选择决定了特征空间的结构和内积形式,所以在预测中核函数的选取对预测精度有较大的影响。一般情况先会选择高斯核函数(RBF核函数):
实现预测。
SWE整合平台303,主要用于统一数据信号的形式构成统一的传感器数据,实现传感器数据之间的互操作。
上述SWE整合平台303利用SWE中构建信息模型的规范包括:
传感器建模语言Sensor ML和观测与测量O&M。基于这两种规范对传感器,以及传感器采集的数据信息进行统一描述。这两种规范组件均是SWE的标准模块,都采用XML方案。
Sensor ML的作用是描述传感器、传感器系统或传感处理方法,为传感器的发现、传感观测的定位、低级别的传感观测的处理等提供必要的信息。
O&M的作用是描述传感器观测和测量的数据。
在SWE整合平台303中,SWE将观测定义为一个带结果的事件,每一个观测包含有一个方法来测定观测值,每个观测包含有一个时间戳。因此,一个观测的结果既可以是数字量,也可以是一个图片。
另外,在SWE整合平台303中使用SWE的SPS和SOS两种服务。
其中,SPS的作用是对用户提交的传感器数据请求的可行性进行判定,分配传感器任务。SOS用来响应用户的查询,按需请求、获取和过滤传感器测量数据以及传感系统信息,它是用户与传感数据库的中间媒介。
在本发明实施例公开的物联网实体搜索系统中,将经过语义化模块301和数据序列预测模块302处理后的数据信息统一表示为观测事件的时间戳、观测位置、观测现象标识符、观测特征、观测质量、观测设备和数据元属性的形式进行存储,以备搜索时使用。
网格数据库304为本发明实施例公开的物联网实体搜索系统中的存储单元。对于一个具有海量数据的系统来说,采用网格数据库304按区域存储统一格式后的传感器数据,实现水平分区;对联系不紧密的不同类型的数据分别存储,实现垂直分区。并将各个不同区域的网格数据库按照面向服务体系架构做成不同的服务中心,对外提供数据库访问接口,以实现各个网格数据库的综合处理。
集中处理单元2032,用于对所述具体查询条件进行分词,提取各个查询关键词;以及确定各个所述查询关键词对应的各个应用领域,在所述传感器区域数据库中依据所述应用领域进行查询,并按优先级对查询结果进行排序。
该集中处理单元2032主要负责对与用户交互内容的处理,并根据用户查询地理范围的设定向下层对应区域处理中心分配查询任务。如图8所示,主要包括:查询语义解析模块401和查询结果排序模块402。
查询语义解析模块401包括三个处理子模块,为中文分词模块4011、应用领域解析模块4012和应用领域本体解析模块4013。
基于分词是语义解析基础的原来,中文分词的准确度对搜索结果准确性有相当大的影响。在中文分词模块4011中,对用户输入的查询语句经分词后提取出若干个查询关键词以备后续解析。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。
在应用领域解析模块4012中进行应用领域的解析过程中,出现了本体和领域本体的概念。
其中,本体是共享概念模型的明确的形式化规范说明。领域本体描述的是特定领域内相关概念、概念属性及其概念间关系,是对某个具体领域的知识和特性的描述。由于,顶层本体不可能穷尽所有知识,要想对信息检索尤其是某个专业领域的信息检索的分析处理有更高的质量,就需要建立并合理地使用领域本体。
因此,在对本体或领域本体解析前,利用应用领域解析模块4012来确定用户查询内容所指向的领域,通过分词后的查询关键词与各领域词库内容匹配率来确定。
应用领域本体解析模块4013是该物联网实体搜索系统中实现语义解析功能最重要的模块。领域本体的目的是获取、描述和表示相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇间相互关系的明确定义。
其中,常见的本体构成要素包括:个体(实例)、类、属性、关系、函式术语、约束(限制)、规则、公理和事件(哲学)等等。
对本体的语义描述采用OWL,它是W3C开发的旨在应用于万维网之上的一种网络本体语言。OWL继承了RDF和RDFS,以及一些早期的本体语言项目,包括:OIL、DAML和DAMLplusOIL。
如图8所示,查询结果排序模块402针对查询结果进行排序。主要是针对查询返回的结果不止一个的情况,对返回的结果按照一定方式排序后再向用户输出,即在发送至搜索应用层进行显示。在本发明中,实体搜索与网页搜索不同,对不同的应用领域需设不同的排序方式,例如空停车位的查询,可能附近多个停车场均有空位,则根据用户所处位置距停车场的距离及交通状况来设置先后顺序。
在上述本发明实施例公开的物联网实体搜索系统的基础上,其处理层中的分布式区域处理单元中,如图7所示,还包括:安全模块305和更新模块306。
安全模块305,用于设置搜索限制条件;当满足搜索限制条件时,执行查询。
基于传感器数据信息的安全和隐私问题,在该物联网实体搜索系统中设置安全模块305对用户的查询进行限制。限制某些信息需要具有一定权限的人员才可以查阅。
更新模块306,用于当一区域加入新传感器网络时,对应更新所述区域内服务器的服务列表,并向所述中央服务器提交所述新传感器网络的信息。
由于,传感器的种类繁多,可以监测采集的信息及经信息组合产生的信息量遍及生活的各个领域,但是传感器的全球布设、物联网的推进还需时日,实体搜索服务也随此过程不断完善。所以在该物联网实体搜索系统设置了更新模块306,当有新的传感器网络加入时更新服务列表,并向上层中央服务器提交。也可以实现各区域分别管理其所提供的相关服务。
基于上述本发明实施例公开的物联网实体搜索系统,如图9所示,为该系统的整体框架图。在实际应用的过程中的具体应用过程,通过以下示例进行说明。
给出一示例:
针对客运专线列车安全、高速运营的需求,利用成熟的信号采集和传输、网络通信、数据处理技术和先进的物联网技术,集异物侵限、强风、地震、水灾、雪灾、火灾、地质灾害(路基坍陷、滑波、变形等)的监控、报警、预案处理等完善的整体解决方案。
利用其监测系统布设的各类环境状况检测传感器所采集的数据,结合本发明上述实施例公开的物联网实体搜索系统实现一个客运专线防灾安全监控路段搜索系统。
通过上述系统的搜索,可以给铁路工作人员提供实时的查询铁路沿线处于某状态下(如可安全正常运行、大风限速160km/s以下等)路段的应用,将符合查询要求的路段列出,辅助工作人员对列车的调度。路段搜索系统界面如图10所示。界面分为三部分,搜索条件输入区A、搜索结果显示区B和地图标记区C。
利用Google Map Api实现地图功能,根据用户设定的时间选定搜索时间区间,指定的地理范围选择需查询的区域数据库。分析风雨雪、地质灾害等坏境因素综合对列车运行状况、运行时速的影响,构建客运专线沿线环境状况本体,对用户的输入查询条件做解析,用解析出的搜索关键词到指定区域数据库查询,返回符合条件的路段,根据风速、雨量大小等环境状况的严峻程度对路段进行排序。
综上所述:
通过创建基于物联网的新的实体搜索系统,利用实时采集传感网中各个传感器的数据信息,将各区域采集的数据信息按SWE规范统一格式后存储在其所在的区域的网格数据库中。当按照时间区间、地理范围和查询条件三个查询条件进行查询的过程中,分区域进行处理,并基于统一格式的数据进行查询和显示、标识的互操作。通过上述操作,实现避免海量数据的集中处理,减低整个系统的处理负担,增强整个系统的搜索性能的目的。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。