CN106126646A - 建立物联网智能设备的倒排索引的方法及装置 - Google Patents
建立物联网智能设备的倒排索引的方法及装置 Download PDFInfo
- Publication number
- CN106126646A CN106126646A CN201610466329.6A CN201610466329A CN106126646A CN 106126646 A CN106126646 A CN 106126646A CN 201610466329 A CN201610466329 A CN 201610466329A CN 106126646 A CN106126646 A CN 106126646A
- Authority
- CN
- China
- Prior art keywords
- smart machine
- directoryof
- url
- attribute
- inverted index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 239000000284 extract Substances 0.000 claims abstract description 5
- 238000003860 storage Methods 0.000 claims description 8
- 230000008520 organization Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 49
- 230000003068 static effect Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005538 encapsulation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 229930091051 Arenine Natural products 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9566—URL specific, e.g. using aliases, detecting broken or misspelled links
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及建立物联网智能设备的倒排索引的方法及装置。所述方法包括:获取智能设备注册到物联网的属性信息,按照设定规则生成对应的树形结构以存储所述智能设备的属性信息;逐层提取所述树形结构中的属性,获取所有包含该属性的已注册的智能设备的URL;将获取到的URL加入预先建立与该属性对应的目录清单,根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引。本发明兼容现行的各类智能设备ID编码类型的国际标准,便于从超量的物联网智能元数据中搜索到自己感兴趣的设备信息。
Description
技术领域
本发明涉及信息检索技术领域,特别是涉及建立物联网智能设备的倒排索引的方法及装置。
背景技术
目前搜索引擎已经获得了广泛使用,在海量数据中快速检索出用户查询的信息能力具有普适性。与此同时,随着物联网的高速发展,越来越多的智能设备被接入到互联网中,提供丰富的数据服务。然而,由于各种智能设备的ID编码类型不统一,且没有一个统一的资源目录服务,用户难以实现在接入到互联网中的超量的智能设备集合中发现与自感兴趣的设备信息和数据服务。本发明设计的智能设备资源字典和复合倒排索引结构提供了一种新颖的解决方案,兼容各类现行国际标准,采用互联网上最普及的URL(即统一资源定位符),适用于各类网络服务web service。
发明内容
基于此,本发明实施例提供的建立物联网智能设备的倒排索引的方法及装置,兼容现行的各类智能设备ID编码类型的国际标准,便于从超量的物联网智能元数据中搜索到自己感兴趣的设备信息。
本发明一方面提供建立物联网智能设备的倒排索引的方法,包括:
获取智能设备注册到物联网的属性信息,按照设定规则生成对应的树形结构以存储所述智能设备的属性信息;
逐层提取所述树形结构中的属性,获取所有包含该属性的已注册的智能设备的URL;
将获取到的URL加入预先建立与该属性对应的目录清单,根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引。
本发明另一方面提供一种建立物联网智能设备的倒排索引的装置,包括:
信息组织模块,用于获取智能设备注册到物联网的属性信息,按照设定规则生成对应的树形结构以存储所述智能设备的属性信息;
目录提取模块,用于逐层提取所述树形结构中的属性,获取所有包含该属性的已注册的智能设备的URL,并将获取到的URL加入预先建立的该属性对应的目录清单;
索引建立模块,用于根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引。
本发明上述实施例的方案,通过树形结构存储智能设备注册到物联网时的属性信息,通过目录清单存储对应设备的URL信息,以此根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引;基于该倒排索引的设备检索,兼容各类现行国际标准,并且由于采用互联网上最普及的资源定位符URL,适用于各类网络服务web service。
附图说明
图1为一实施例的建立物联网智能设备的倒排索引的方法的示意性流程图;
图2为一实施例的由智能设备属性信息生成的树形结构的示意图;
图3为一实施例的智能垃圾桶的树形结构的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一实施例的建立物联网智能设备的倒排索引的方法的示意性流程图;在该实施例中,是以该方法应用于服务器为例进行说明。
如图1所示,本实施例中的建立物联网智能设备的倒排索引的方法包括步骤:
S11,获取智能设备注册到物联网的属性信息,按照设定规则生成对应的树形结构以存储所述智能设备的属性信息;
本发明实施例中,按照预设规则由所述属性信息生成对应的多层嵌套的XML文件,根据所述XML文件生成对应的具有多层结构的树形结构;其中,以智能设备的唯一标识属性作为所述树形结构的根节点。
优选的,按照预设规则由所述属性信息生成对应的四层嵌套的XML文件,根据所述XML文件生成对应的具有四层结构的树形结构;在四层结构的树形结构,以智能设备的唯一标识属性作为根节点,分别从上往下设置一级节点、二级节点、三级节点、四级节点的树形结构。
由于XML文件格式对应的解析器(XML Parser)和传输协议(如SOAP)已经广泛用于各种企业级IT系统和商用自动化平台,例如在互联网上以JSON格式封装XML表单可被所有浏览器支持,因此由所述属性信息生成对应的XML文件可以广泛用于各类IT系统,有利于降低信息化更新的成本和门槛。
本发明实施例中,智能设备的唯一标识属性可为IP地址、MAC地址、IEEE1451传感器ID或者IMEI/IMSI号;所述唯一标识属性还可为具有全球唯一性和连通性的设备ID。
S12,逐层提取所述树形结构中的属性,获取所有包含该属性的已注册的智能设备的URL,并将获取到的URL加入预先建立的该属性对应的目录清单;
通过该步骤,可先后得到树形结构中每个属性对应的目录清单,每个所述目录清单中,存储有包含对应属性信息的所有已注册智能设备的URL信息。
对基于智能设备对应的树形结构的检索,用户可直接查询具体的属性名称,得到该属性名称的所有下级节点属性列表。用户还可使用通配符(*)做模糊查询,即不确定要查询的属性名称,访问对应的树形结构的根节点地址(如国家物联网标识公共服务管理平台NIOT),得到所查询硬件ID的一级节点属性列表。用户点击任何一个一级节点属性,获得该属性下级的二级节点属性列表,以此类推,直到获得所需属性名称,或者完成一次树形结构的遍历。
S13,根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引。
本发明实施例中,建立智能设备的哈希表数据结构的倒排索引HashMap<attribute,List(URLs)>;其中,attribute为所述树形结构中的属性名称,作为哈希表的键值空间,List(URLs)为所述目录清单,作为哈希表的取值空间。哈希表是一种以键值对来存储信息的数据结构。倒排索引是广泛应用于搜索引擎中的一种快速查找包含关键字的文本检索技术,以去重哈希表(HashMap)结构来实现。由于所述倒排索引是以哈希表数据结构来存储两种数据类型,可实现快速信息检索。
作为一优选实施方式,在建立所述智能设备的倒排索引之后,还可动态更新所述目录清单中的URL的排序。例如检测到设定的更新时间周期到来时,更新所述目录清单中的URL的排序;还可以在检测到所述目录清单中任一URL的用户访问量的变化幅度大于设定阈值时,立即更新所述目录清单中的URL的排序。
本发明实施例中,可通过采集所述目录清单中各URL对应的用户访问信息,根据用户访问信息更新所述目录清单中的URL的排序。具体例如:采集所述目录清单中各URL对应的最后一次用户访问时间,将所述目录清单中最后一次访问时间离当前时间越近的URL排在越前面;或者,采集所述目录清单中各URL对应的用户访问量,将所述目录清单中用户访问量的数量越大的URL排在越前面;又或者,采集所述目录清单中各URL对应的访问IP地址数量,将所述目录清单中访问IP地址数量越大的URL排在越前面。
进一步的,基于上述排序后的目录清单,接收到用于检索智能设备信息的属性名称时,便可按照取值空间目录清单中URL的排序,顺序返回对应的智能设备信息。
本发明实施例中,智能设备的唯一标识属性可为IP地址、MAC地址、IEEE1451传感器ID或者IMEI/IMSI号;还可为具有全球唯一性和连通性的设备ID。
参考如图2所示,本发明实施的存储智能设备的属性信息树形结构为四层结构,包括:自上而下组织的根节点、一级节点、二级节点和三级节点。如图2所示的树形结构,具体包括一个根节点,两个一级节点,每个一级节点下有两个二级节点,每个二级节点下有多个三级节点,三级节点下有若干四级节点。参考图2,下面对本发明实施的存储智能设备的属性信息的树形结构中节点进行具体说明。
根节点root:对应的属性名称可为智能设备的IP地址、MAC地址、IEEE1451传感器ID或者IMEI/IMSI号,或者具有全球唯一性和连通性的设备ID。
第一一级节点,对应设备的静态属性static。本节点下有两个二级子节点,对应的属性名称可分别为:产品(设备信息)和位置(绝对坐标+相对位置)。
二级节点---产品product
本级节点下有九个三级子节点,对应的属性名称可分别为:产品ID、名称、品牌、生产商、产品说明、图片、标签、IS URL、拥有者。
1)产品id:厂商内部赋予,ERP里的产品标识,可包含产品类别、版本、定型日期等信息。
2)名称name:设备名称,UTF-8字符集,支持多种语言;
3)品牌brand:同一厂商可以拥有多个品牌。如格力电器的格力空调、晶弘冰箱、TOSOT大松净化器;
4)生产商manufacturer:设备厂家,如TI、GE、STM等,还生产日期属性信息;
5)产品说明description:文字说明,产品手册下载地址等;
6)图片picture:产品照片的地址+文件名;
7)标签tag:附加信息,广告链接和营销推广等信息;
8)IS URL:权威信息服务器地址URL,如EPCIS URL,或厂商官网上的产品信息查询页面链接;还包括授权访问秘钥信息;
9)拥有者owner:买家信息,还包括部署/使用日期。
二级节点---位置location
本级节点下有两个三级子节点,对应的属性名称可分别为:地理坐标、相对位置。
1)绝对坐标absolute:经度、纬度;
2)相对位置relative;
地理坐标的三级子节点下有两个四级子节点,对应的属性名称可分别为:地址和抽象;
1.地址address:邮政编码、国家省份(州)城市地区街道;
2.抽象abstract:建筑名称、楼层、房间、场地编号。
第二一级节点,对应设备的动态属性dynamic。本节点下有两个二级子节点,对应的属性名称可分别为:服务(数据及接口信息)和评价(QoS性能+用户反馈)。
二级节点---服务service
本级节点下有四个三级子节点,对应的属性名称可分别为:操作、输入、输出、关联服务。
1)操作operations:CRUD中的一种,即增加Create、读取Read、更新Update或者删除Delete;
2)输入input_list:使用该设备服务的前置输入条件清单,如物理感知信号signal、指令cmd、时间触发trigger_time、事件触发event_trigger等;还包括必含属性信息,可选optional:是否必须true/false;
3)输出output_list:该设备输出数据清单,如温度、压力、光度、波动、视频等,还包括必含属性信息,采样日期;
4)关联服务related:预留给组合服务。
二级节点---评价qos
本级节点下有两个三级子节点,对应的属性名称可分别为:性能和用户反馈。
1)性能performance。本级节点下有八个四级子节点:精度、取值范围、延迟、功耗、尺寸、操作环境、支持接口、认证;
1.精度accuracy:测量精度;
2.取值范围range:测量值域;
3.延迟latency:反应时延,包含网络延迟和响应迟滞;
4.功耗power:工作电压、工作电流、休眠电流、电源类型;
5.尺寸size:长、宽、高;
6.操作条件condition:环境温湿度、电磁条件等;
7.支持接口interface:数据接口规范,如RS232、RS485、UART、I2C、SPI、GPIO、1wire等;
8.认证certificate:防尘防水IP等级,各类电子产品准许上市认证,如FCC/RoHS/CE等;以及应用行业认证,如医疗器械FDA认证。
2)用户反馈feedback:评分rating:X/R,在总分R中评分X;评语description;评价日期。
基于上述所述的树形结构,下面对本发明实施例的建立物联网智能设备的倒排索引的方法进行详细的说明。
本发明实施例定义基于WoT STM模型的智能设备资源字典,以通过一个资源树(即上述树形结构)对智能设备的属性信息进行分层组织。如图2所示,可按照属性特征对智能设备的若干属性信息进行分类(动态和静态)和分层组织,以加快对同一层级下的属性信息进行查询。基于所述资源树,可建立智能设备的复合倒排索引结构。下面对建立智能设备的复合倒排索引结构的具体步骤进行说明:
a)智能设备完成注册后,自动生成存储该智能设备的属性信息的资源树;
b)物联网智能设备搜索引擎按照资源树逐层提取每一个属性,并把数据库中所有包含该属性的智能设备的URL加入到一个对应的目录清单List中;根据所述资源树中的所有属性对应的目录清单建立所述智能设备的倒排索引。
通过该步骤可建立所有已注册的智能设备的倒排索引HashMap<attribute,List(URLs)>;其中,attribute为属性名称,作为哈希表的键值空间;List(URLs)为所述目录清单,作为哈希表的取值空间。此外,为提高多线程并发搜索速度,可使用ConcurrentHashMap<>。
基于建立的倒排索引,可将属性名称(attribute)作为查询关键词,通过倒排索引可获得所有包含该属性的资源路径集合(即URL集合,也可表示为URLs)。
c)另一方面,在用户查询和点击访问的过程中,还可实时收集目录清单中各URL对应的UV值(访问IP地址数量)和PV值(用户访问量),以动态更新倒排索引的取值空间里目录清单中URL的排序。使得被访问次数(用户访问量)越多的智能设备资源URL排序越靠前;反之,则排序靠后。或者,URL对应的访问IP地址数量越大,排序越靠前;反之,则排序靠后。
基于排序后的取值空间目录清单,查询时,搜索结果可按照目录清单中URL的排序来呈现对应的智能设备信息。即搜索引擎接收到用于检索智能设备信息的属性名称时,能按照取值空间中URL的排序,顺序返回对应的智能设备信息。符合互联网搜索引擎按照点击量来排序查询结果,来匹配用户兴趣的逻辑策略。
d)为了精确查询范围,进一步加快查询速度,可以把设定的检索时间范围和/或查询用户的位置作为检索约束条件,在对应的约束条件下查询,所述检索时间范围约束的设备属性信息可为设备生产时间、部署时间或者数据采用时间等。即倒排索引的键值表达的设备属性的值属于用户当前位置范围内,和/或注册时间属于所述检索时间范围内,然后返回取值空间内对应的智能设备目录清单。
如图3所示为智能垃圾桶对应的树形结构,在Java程序中数据结构封装如下:
String attribute=“广州南沙资讯科技园”;
String url=http://enevo.com/6C-0B-84-91-5C-06/;
ArrayList urls=new ArrayList();
urls.add(url);
ConcurrentHashMap<attribute,urls>。
对应的查询和搜索情况可为:
模糊查询输入:http://enevo.com/6C-0B-84-91-5C-06/*;
得到的结果集:
静态属性:http://enevo.com/6C-0B-84-91-5C-06/static/
1.http://enevo.com/6C-0B-84-91-5C-06/static/product/id
1.1.http://enevo.com/6C-0B-84-91-5C-06/static/product/name
1.2.http://enevo.com/6C-0B-84-91-5C-06/static/product/manufacturer1.3.http://enevo.com/6C-0B-84-91-5C-06/static/product/description
1.4.http://enevo.com/6C-0B-84-91-5C-06/static/product/picture
1.5.http://enevo.com/6C-0B-84-91-5C-06/static/product/tag
1.6.http://enevo.com/6C-0B-84-91-5C-06/static/product/is_url
1.7.http://enevo.com/6C-0B-84-91-5C-06/static/product/owner
2.http://enevo.com/6C-0B-84-91-5C-06/static/location
2.1.http://enevo.com/6C-0B-84-91-5C-06/static/location/absolute
2.2.http://enevo.com/6C-0B-84-91-5C-06/static/location/relative
动态属性:http://enevo.com/6C-0B-84-91-5C-06/dynamic/
1.http://enevo.com/6C-0B-84-91-5C-06/dynamic/service/
1.1http://enevo.com/6C-0B-84-91-5C-06/dynamic/service/distance
1.2http://enevo.com/6C-0B-84-91-5C-06/dynamic/service/temperature
2.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos
2.1.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/performance
2.1.1.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/performance/accuracy
2.1.2.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/performance/range
2.1.3.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/performance/latency
2.1.4.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/performance/power
2.1.5.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/performance/size
2.1.6.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/performance/weight
2.1.7.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/performance/condition
2.1.8.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/performance/interface
2.1.9.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/performance/certificate
2.2.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/feedback
2.2.1.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/feedback/rating
2.2.2.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/feedback/description
2.2.3.http://enevo.com/6C-0B-84-91-5C-06/dynamic/qos/feedback/datetime
若为精确查询,可输入信息:
http://enevo.com/6C-0B-84-91-5C-06/static/location/absolute;
对应的查询结果为:113.615746,22.754617(在地图上显示该坐标点在广州南沙资讯科技园)
根据位置进行智能设备搜索,可设定位置约束条件为:广州南沙资讯科技园附近的智能垃圾桶;输入查询信息为:http://cniotroot.cn/search?address=广州南沙资讯科技园&name=Smart+Trashbin;
对应的,查询结果为:
设备ID:6C-0B-84-91-5C-06;
信息服务器链接:http://enevo.com/6C-0B-84-91-5C-06/;
查询详细设备信息重复上述模糊查询和精确查询步骤。
本发明实施例通过树形结构存储智能设备的属性信息,作为哈希表的键值空间。使用目录清单List数据结构来存储包含某设备属性的所有物联网智能设备的URL,作为哈希表的取值空间。在物联网智能设备搜索引擎的发现服务中,所有注册的智能设备建立资源索引HashMap<attribute,List(URLs)>,便可实现对海量智能设备的快速检索的服务。
需要说明的是,对于前述的各方法实施例,为了简便描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。
基于与上述实施例中的建立物联网智能设备的倒排索引的方法相同的思想,本发明还提供建立物联网智能设备的倒排索引的装置,该装置可用于执行上述建立物联网智能设备的倒排索引的方法。
本实施例的建立物联网智能设备的倒排索引的装置包括:信息组织模块、目录提取模块、以及索引建立模块,各模块详述如下:
上述信息组织模块,用于获取智能设备注册到物联网的属性信息,按照设定规则生成对应的树形结构以存储所述智能设备的属性信息;
所述目录提取模块,用于逐层提取所述树形结构中的属性,获取所有包含该属性的已注册的智能设备的URL,并将获取到的URL加入预先建立的该属性对应的目录清单。
所述索引建立模块,用于根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引。
需要说明的是,上述示例的建立物联网智能设备的倒排索引的装置的实施方式中,各模块/单元之间的信息交互、执行过程等内容,由于与本发明前述方法实施例基于同一构思,其带来的技术效果与本发明前述方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
此外,上述示例的建立物联网智能设备的倒排索引的装置的实施方式中,各功能模块的逻辑划分仅是举例说明,实际应用中可以根据需要,例如出于相应硬件的配置要求或者软件的实现的便利考虑,将上述功能分配由不同的功能模块完成,即将所述建立物联网智能设备的倒排索引的装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。其中各功能模既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,作为独立的产品销售或使用。所述程序在执行时,可执行如上述各方法的实施例的全部或部分步骤。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。可以理解,其中所使用的术语“第一”、“第二”等在本文中用于区分对象,但这些对象不受这些术语限制。
以上所述实施例仅表达了本发明的几种实施方式,不能理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种建立物联网智能设备的倒排索引的方法,其特征在于,包括:
获取智能设备注册到物联网的属性信息,按照设定规则生成对应的树形结构以存储所述智能设备的属性信息;
逐层提取所述树形结构中的属性,获取所有包含该属性的已注册的智能设备的URL,并将获取到的URL加入预先建立的该属性对应的目录清单;
根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引。
2.根据权利要求1所述的建立物联网智能设备的倒排索引的方法,其特征在于,按照设定规则生成对应的树形结构以存储所述智能设备的属性信息,包括:
按照预设规则由所述属性信息生成对应的多层嵌套的XML文件,根据所述XML文件生成对应的具有多层结构的树形结构;在该多层结构的树形结构中,以智能设备的唯一标识属性作为根节点属性。
3.根据权利要求1所述的建立物联网智能设备的倒排索引的方法,其特征在于,根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引,包括:
建立智能设备的哈希表数据结构的倒排索引HashMap<attribute,List(URLs)>;其中,attribute为所述树形结构中的属性名称,作为哈希表的键值空间,List(URLs)为所述目录清单,作为哈希表的取值空间。
4.根据权利要求3所述的建立物联网智能设备的倒排索引的方法,其特征在于,根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引之后,还包括:
检测到设定的更新时间周期到来时,更新所述目录清单中的URL的排序;
或者,检测到所述目录清单中任一URL的用户访问量的变化幅度大于设定阈值时,更新所述目录清单中的URL的排序。
5.根据权利要求4所述的建立物联网智能设备的倒排索引的方法,其特征在于,所述更新所述目录清单中的URL的排序,包括:
采集所述目录清单中各URL对应的用户访问信息,根据用户访问信息更新所述目录清单中的URL的排序。
6.根据权利要求5所述的建立物联网智能设备的倒排索引的方法,其特征在于,所述采集所述目录清单中各URL对应的用户访问信息,根据用户访问信息更新所述目录清单中的URL的排序,包括:
采集所述目录清单中各URL对应的最后一次用户访问时间,将所述目录清单中最后一次访问时间离当前时间越近的URL排在越前面。
7.根据权利要求5所述的建立物联网智能设备的倒排索引的方法,其特征在于,所述采集所述目录清单中各URL对应的用户访问信息,根据用户访问信息更新所述目录清单中的URL的排序,包括:
采集所述目录清单中各URL对应的用户访问量,将所述目录清单中用户访问量的数量越大的URL排在越前面。
8.根据权利要求5所述的建立物联网智能设备的倒排索引的方法,其特征在于,所述采集所述目录清单中各URL对应的用户访问信息,根据用户访问信息更新所述目录清单中的URL的排序,包括:
采集所述目录清单中各URL对应的访问IP地址数量,将所述目录清单中访问IP地址数量越大的URL排在越前面。
9.根据权利要求1所述的建立物联网智能设备的倒排索引的方法,其特征在于,智能设备的属性信息包括时间信息和/或位置信息;
所述根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引之后,还包括:
接收到用户输入的用于检索智能设备信息的关键词,获取设定的检索时间范围和/或该用户的当前位置;以时间和/或位置作为检索约束条件,利用所述关键词在所述约束条件下查询所述倒排索引。
10.一种建立物联网智能设备的倒排索引的装置,其特征在于,包括:
信息组织模块,用于获取智能设备注册到物联网的属性信息,按照设定规则生成对应的树形结构以存储所述智能设备的属性信息;
目录提取模块,用于逐层提取所述树形结构中的属性,获取所有包含该属性的已注册的智能设备的URL,并将获取到的URL加入预先建立的该属性对应的目录清单;
索引建立模块,用于根据所述树形结构中所有属性对应的目录清单建立所述智能设备的倒排索引。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610466329.6A CN106126646B (zh) | 2016-06-21 | 2016-06-21 | 建立物联网智能设备的倒排索引的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610466329.6A CN106126646B (zh) | 2016-06-21 | 2016-06-21 | 建立物联网智能设备的倒排索引的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106126646A true CN106126646A (zh) | 2016-11-16 |
CN106126646B CN106126646B (zh) | 2019-04-23 |
Family
ID=57269360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610466329.6A Expired - Fee Related CN106126646B (zh) | 2016-06-21 | 2016-06-21 | 建立物联网智能设备的倒排索引的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106126646B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107391100A (zh) * | 2017-04-20 | 2017-11-24 | 阿里巴巴集团控股有限公司 | 一种支持多语言账单的配置文件生成方法及装置 |
CN107807976A (zh) * | 2017-10-25 | 2018-03-16 | 世纪龙信息网络有限责任公司 | Ip归属地查询方法和装置 |
CN108647244A (zh) * | 2018-04-13 | 2018-10-12 | 广东技术师范学院 | 思维导图形式的主题教学资源集成方法、网络存储系统 |
CN108694261A (zh) * | 2017-04-10 | 2018-10-23 | 中国石油天然气股份有限公司 | 设备模型的构建方法及装置 |
CN109040224A (zh) * | 2018-07-27 | 2018-12-18 | 佛山点度物联科技有限公司 | 一种物联网硬件数据主动采集解析系统及方法 |
CN109547294A (zh) * | 2018-12-27 | 2019-03-29 | 中国人民解放军国防科技大学 | 一种基于固件分析的联网设备型号探测方法、装置 |
CN109861975A (zh) * | 2018-12-26 | 2019-06-07 | 中国科学院计算机网络信息中心 | 面向工业互联网的标识注册信息查询方法和系统 |
CN110020243A (zh) * | 2017-10-31 | 2019-07-16 | 中移物联网有限公司 | 物联网数据的查询方法、装置、物联网服务器和存储介质 |
CN111447303A (zh) * | 2020-04-03 | 2020-07-24 | 宁波市水利水电规划设计研究院有限公司 | 一种基于gps的物联平台设备动态编码方法 |
CN111541680A (zh) * | 2020-04-17 | 2020-08-14 | 中移(杭州)信息技术有限公司 | 智能设备的注册方法、智能设备、系统、及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915346A (zh) * | 2012-09-26 | 2013-02-06 | 中国科学院软件研究所 | 面向物联网智能感知的数据索引建立与查询方法 |
CN102981933A (zh) * | 2012-12-18 | 2013-03-20 | 武汉邮电科学研究院 | 物联网感知层的数据增量备份方法及系统 |
CN103390000A (zh) * | 2012-05-09 | 2013-11-13 | 中国移动通信集团公司 | 一种网页搜索方法及网页搜索系统 |
CN103678572A (zh) * | 2013-12-09 | 2014-03-26 | 中国科学院计算机网络信息中心 | 一种基于两层dht的物联网信息查询方法及系统 |
CN103763359A (zh) * | 2014-01-09 | 2014-04-30 | 中国科学院计算机网络信息中心 | 一种基于混合式结构的发现服务体系建立方法及查询方法 |
-
2016
- 2016-06-21 CN CN201610466329.6A patent/CN106126646B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103390000A (zh) * | 2012-05-09 | 2013-11-13 | 中国移动通信集团公司 | 一种网页搜索方法及网页搜索系统 |
CN102915346A (zh) * | 2012-09-26 | 2013-02-06 | 中国科学院软件研究所 | 面向物联网智能感知的数据索引建立与查询方法 |
CN102981933A (zh) * | 2012-12-18 | 2013-03-20 | 武汉邮电科学研究院 | 物联网感知层的数据增量备份方法及系统 |
CN103678572A (zh) * | 2013-12-09 | 2014-03-26 | 中国科学院计算机网络信息中心 | 一种基于两层dht的物联网信息查询方法及系统 |
CN103763359A (zh) * | 2014-01-09 | 2014-04-30 | 中国科学院计算机网络信息中心 | 一种基于混合式结构的发现服务体系建立方法及查询方法 |
Non-Patent Citations (2)
Title |
---|
PIN NIE: ""Integrate WSN to the Web of Things by Using XMPP"", 《LNICST》 * |
杨成龙: ""面向物联网的传感器实体搜索系统"", 《计算机工程与设计》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108694261A (zh) * | 2017-04-10 | 2018-10-23 | 中国石油天然气股份有限公司 | 设备模型的构建方法及装置 |
CN107391100B (zh) * | 2017-04-20 | 2020-10-02 | 阿里巴巴集团控股有限公司 | 一种支持多语言账单的配置文件生成方法及装置 |
CN107391100A (zh) * | 2017-04-20 | 2017-11-24 | 阿里巴巴集团控股有限公司 | 一种支持多语言账单的配置文件生成方法及装置 |
CN107807976A (zh) * | 2017-10-25 | 2018-03-16 | 世纪龙信息网络有限责任公司 | Ip归属地查询方法和装置 |
CN107807976B (zh) * | 2017-10-25 | 2021-01-12 | 世纪龙信息网络有限责任公司 | Ip归属地查询方法和装置 |
CN110020243A (zh) * | 2017-10-31 | 2019-07-16 | 中移物联网有限公司 | 物联网数据的查询方法、装置、物联网服务器和存储介质 |
CN108647244A (zh) * | 2018-04-13 | 2018-10-12 | 广东技术师范学院 | 思维导图形式的主题教学资源集成方法、网络存储系统 |
CN108647244B (zh) * | 2018-04-13 | 2021-08-24 | 广东技术师范学院 | 思维导图形式的主题教学资源集成方法、网络存储系统 |
CN109040224A (zh) * | 2018-07-27 | 2018-12-18 | 佛山点度物联科技有限公司 | 一种物联网硬件数据主动采集解析系统及方法 |
CN109861975A (zh) * | 2018-12-26 | 2019-06-07 | 中国科学院计算机网络信息中心 | 面向工业互联网的标识注册信息查询方法和系统 |
CN109861975B (zh) * | 2018-12-26 | 2021-10-22 | 中国科学院计算机网络信息中心 | 面向工业互联网的标识注册信息查询方法和系统 |
CN109547294B (zh) * | 2018-12-27 | 2020-10-30 | 中国人民解放军国防科技大学 | 一种基于固件分析的联网设备型号探测方法、装置 |
CN109547294A (zh) * | 2018-12-27 | 2019-03-29 | 中国人民解放军国防科技大学 | 一种基于固件分析的联网设备型号探测方法、装置 |
CN111447303A (zh) * | 2020-04-03 | 2020-07-24 | 宁波市水利水电规划设计研究院有限公司 | 一种基于gps的物联平台设备动态编码方法 |
CN111447303B (zh) * | 2020-04-03 | 2022-09-09 | 宁波市水利水电规划设计研究院有限公司 | 一种基于gps的物联平台设备动态编码方法 |
CN111541680A (zh) * | 2020-04-17 | 2020-08-14 | 中移(杭州)信息技术有限公司 | 智能设备的注册方法、智能设备、系统、及存储介质 |
CN111541680B (zh) * | 2020-04-17 | 2022-08-05 | 中移(杭州)信息技术有限公司 | 智能设备的注册方法、智能设备、系统、及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106126646B (zh) | 2019-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106126646B (zh) | 建立物联网智能设备的倒排索引的方法及装置 | |
Mika | Flink: Semantic web technology for the extraction and analysis of social networks | |
CN105447184B (zh) | 信息抓取方法及装置 | |
CN102142003B (zh) | 兴趣点信息提供方法及装置 | |
US9043331B2 (en) | System and method for indexing documents on the world-wide web | |
CN113553305B (zh) | 一种工业互联网标识处理方法及装置 | |
CN107341215A (zh) | 一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法 | |
CN102760151B (zh) | 开源软件获取与搜索系统的实现方法 | |
CN102262650B (zh) | 链接的数据库 | |
CN103049440A (zh) | 一种相关文章的推荐处理方法和处理系统 | |
CN101655862A (zh) | 信息对象搜索的方法和装置 | |
US20110184815A1 (en) | System and method for sharing profits with one or more content providers | |
CN102053984A (zh) | 信息检索查询与信息发布的系统及方法 | |
US20090300062A1 (en) | Method for mapping an X500 data model onto a relational database | |
CN104091228A (zh) | 物联网资源管理、注册、查询和语义库管理系统 | |
CN103226609A (zh) | 一种web聚焦搜索系统的搜索方法 | |
JPH1031683A (ja) | Url情報データベース構築方法及びそれを利用したインターネット検索サーバ | |
CN105117434A (zh) | 一种网页分类方法和系统 | |
CN115168401A (zh) | 数据分级处理方法及装置、电子设备及计算机可读介质 | |
KR100925294B1 (ko) | 정보의 태그 데이터와 큐브 구조체를 이용하는 검색 시스템및 검색 방법 | |
CN108280102A (zh) | 上网行为记录方法、装置及用户终端 | |
CN102298621A (zh) | 基于关注度的同源信息搜索引擎聚合显示方法的获取网页用户关注度PageFocus的系统 | |
US20100205194A1 (en) | System and method of identifying relevance of electronic content to location or place | |
CN101576933A (zh) | 基于标题分隔符的全自动web页面分组法 | |
CN108694213A (zh) | 日志文件的生成方法、检索方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190423 |
|
CF01 | Termination of patent right due to non-payment of annual fee |