CN103150346B - 一种基于可扩展标记语言的无线传感器网络数据压缩方法 - Google Patents

一种基于可扩展标记语言的无线传感器网络数据压缩方法 Download PDF

Info

Publication number
CN103150346B
CN103150346B CN201310048475.3A CN201310048475A CN103150346B CN 103150346 B CN103150346 B CN 103150346B CN 201310048475 A CN201310048475 A CN 201310048475A CN 103150346 B CN103150346 B CN 103150346B
Authority
CN
China
Prior art keywords
node
xml
data
path
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310048475.3A
Other languages
English (en)
Other versions
CN103150346A (zh
Inventor
管有庆
唐雪娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201310048475.3A priority Critical patent/CN103150346B/zh
Publication of CN103150346A publication Critical patent/CN103150346A/zh
Application granted granted Critical
Publication of CN103150346B publication Critical patent/CN103150346B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于可扩展标记语言的无线传感器网络数据压缩方法。传统的无线传感器网络数据管理主要采用简单数据结构作为数据交换格式以减少无线传感器网络中因为数据交换带来的能量损耗,但这些简单数据结构不能有效地处理大型异构网络数据集合;当前的互联网数据传输标准XML适用于处理大型异构网络数据,但由于XML本身的自描述性,其数据格式的冗余度很大,对于能量有限的传感器节点来说是一个有待解决的问题。本发明提出了一种基于XML节点树结构的无线传感器网络数据压缩方法,简称TXC压缩方法,本方法适用于无线传感器网络并能有效支持动态查询,可以得到较好的压缩效率,在支持异构网络互连的同时有助于延长无线传感器网络的寿命。

Description

一种基于可扩展标记语言的无线传感器网络数据压缩方法
技术领域
本发明涉及一种无线传感器网络的数据压缩方法,具体涉及在无线传感器网络中使用可扩展标记语言(Extensible Markup Language,XML)格式的数据作为数据交换时的数据压缩方法。
技术背景
无线传感器网络(Wireless SensorNetworks,WSNs)是由一组在空间中分布的包含自主传感器节点装置构成的一种无线网络,这些装置使用传感器协作地监控不同位置的物理或环境状况(比如压力、运动、温度或声音等)。由于微处理器技术的进步,无线传感器网络被越来越多地应用在各个领域,但由于传感器节点硬件资源有限,这给无线传感器网络中复杂的数据管理带来了新的挑战。传统的传感器网络数据管理主要采用简单数据结构作为数据传输格式,以减少无线传感器网络中因数据交换带来的能量损耗,但这些简单数据结构不能有效地处理大型异构数据集合。
异构无线传感器网络由两个或多个不同数据类型的传感器子网组成,由于各个子网提供的数据格式是不同的,因此要求应用层对不同数据格式都能支持。XML是一种高度可替换可扩展的数据格式,它已成为事实上的互联网数据交换标准,采用XML数据格式可以使这些异构传感器子网得到更高水平的网络互连。但由于XML本身的自描述性,其数据格式的冗余度很大,对于能量有限的传感器节点来说是一个很大的难题。因此找到一种适用于传感器网络并能有效支持动态查询的XML数据压缩方法,是在无线传感器网络中使用XML作为数据交换格式以支持异构网络互连的关键。
发明内容
技术问题:本发明的目的在于提供一种基于可扩展标记语言的无线传感器网络数据压缩方法,即无线传感器网络中基于XML节点树结构的XML数据压缩方法(Tree-basedXML data Compression Algorithms in WSNs),简称TXC压缩方法。该方法能够有效降低在无线传感器网络中使用XML作为数据交换格式带来的数据冗余,从而减少因传输和处理数据带来的无线传感器网络能量损耗,提高无线传感器网络的网络寿命。
技术方案:本发明的基于可扩展标记语言的无线传感器网络数据压缩方法,对可扩展标记语言XML文档对应的XML节点树进行深度优先遍历并按遍历顺序将各个节点进行编号,XML节点树中的节点个数记为m,第i个节点可描述为Ni=(seqi,pathi,namei,parenti,valuei,atrbi),i∈[1,m];其中seqi表示第i个节点在深度优先遍历下的序号,pathi表示第i个节点的路径,namei表示第i个节点的名称,parenti表示第i个节点的双亲节点在深度优先遍历下对应的序号,valuei表示第i个节点的值,atrbi表示第i个节点的属性或附加信息;
将XML节点树用以下式子来表示:T={ROOT,N},其中N为XML节点集合即N={Ni|i∈[1,m]},ROOT为XML节点树的唯一根节点;深度优先遍历XML节点树,依次将每个节点信息Ni=(seqi,pathi,namei,parenti,valuei,atrbi)分别添加到T={ROOT,N}中,遍历完毕后得到XML节点树对应的完整节点信息T;
在XML节点树的节点集合N={Ni|i∈[1,m]}中,对于集合N中的节点Ni=(seqi,pathi,namei,parenti,valuei,atrbi),i∈[1,m],合并具有相同路径的冗余节点;
若XML节点树中存在两个叶子节点Na和Nb,Na,Nb∈N,Na和Nb的路径信息分别为:
path n a = n 0 → n i → . . . → n j → n a path n b = n 0 → n p → . . . → n q → n b , n0,ni,nj,np,nq∈N;
若路径深度 depth ( path n a ) = depth ( path n b ) name n a = name n b , 则认为Na等价于Nb,记做Na≈Nb
在XML节点树T={ROOT,N}中,查找等价节点并对其进行合并,修改合并后的等价节点路径表达式,将其置为pathk=n0→(ni||np)→...→(nj||nq)→nk,n0,ni,nj,np,nq,nk∈N;
分离XML节点结构信息和数据信息,将节点结构信息和数据信息分开进行存储和压缩:
1)XML节点结构信息
在TXC压缩方法中,XML节点结构信息用“节点路径信息+节点初始序号”的混合数据类型来表示,由于同一个XML节点树中的节点路径信息会产生重叠,而浪费很多存储空间,因此对XML节点路径信息加以简化:对消除冗余后的XML节点树再进行一次深度优先遍历,并对各节点名称进行编号,得到XML节点名称映射表;对照XML节点名称映射表将XML节点路径信息用编号替换对应的节点名称字符串;
2)XML节点数据信息
XML节点的数据信息存储采用哈希表的方式来实现,以节点路径信息作为索引值,建立起XML节点结构信息到对应节点数据信息之间的映射关系,索引值key为简化后的节点路径表达式,key被消除冗余后的节点个数m取模后所得结果即为对应数据存储的哈希地址,即
H(key)=key mod m
采用链地址法来处理冲突构造哈希表:节点数据存储的哈希地址为H(key),具有相同索引值的节点数据信息存储在同一哈希单元保存的链表中,并用初始序号来区分该数据在原始XML文档中的位置。
有益效果:本发明提出了一种基于可扩展标记语言的无线传感器网络数据压缩方法。本方法适用于无线传感器网络并能有效支持动态查询,可以得到较好的压缩效率,在支持异构网络互连的同时有助于提高无线传感器网络的寿命。
附图说明
图1异构无线传感器网络图,
图2异构无线传感器网络查询结果的一个示例XML文档,
图3示例XML文档对应的XML节点树,
图4 TXC方法处理流程,
图5消除冗余后的XML节点树,
图6 XML节点名称映射表,
图7哈希表链式结构中的节点数据格式,
图8经过TXC方法后得到的一个节点数据示例。
在图1中,描述了一个由不用类型的无线传感器网络构成的异构无线传感器网络。在图2中,描述了在异构无线传感器网络中使用XML作为数据交换格式表示网络查询结果的一个XML文档。在图3中,描述了图2中的XML文档对应的XML节点树。在图4中,描述了TXC方法处理流程图。在图5中,描述了图3中消除冗余后的XML节点树。在图6中,描述了图5中XML节点树对应的节点名称映射表。在图7中,描述了TXC方法中使用的哈希表链式结构中的节点数据格式。在图8中,描述了经过TXC方法后得到的一个节点数据示例。
具体实施方式
图1是一个简单的异构无线传感器网络的例子,这个例子中的无线传感器网络包括两个子网络:由传感器节点1组成的子网I和由传感器节点2组成的子网II,它们提供不同类型的数据格式,在无线传感器网络中使用XML作为网络间的数据交换格式。图2为在这个网络中采集到的传感器数据XML文档示例,通过子网络间的数据共享和交换,可以实现异构网络的互连。本发明提出的XML数据压缩方法能够有效降低在无线传感器网络中使用XML作为数据交换格式带来的数据冗余,从而减少因传输和处理数据带来的无线传感器网络能量损耗。
通常可以把XML文档视为一种树结构,这种树结构被称为节点树。图3是图2中示例XML文档对应的XML节点树,这棵节点树的根节点为result,根节点分别有sensor1和sensor2两种类型的孩子结点。本发明对XML节点树进行以下定义:
定义1对XML文档对应的XML节点树进行深度优先遍历并按遍历顺序对各个节点进行编号,XML节点树中的节点个数记为m。第i个节点可描述为Ni=(seqi,pathi,namei,parenti,valuei,atrbi),i∈[1,m]。其中seqi表示第i个节点在深度优先遍历下的序号,pahi表示第i个节点的路径,namei表示第i个节点的名称,parenti表示第i个节点的双亲节点在深度优先遍历下对应的序号,valuei表示第i个节点的值,atrbi表示第i个节点的属性或附加信息。
定义2根据定义1,进一步将XML节点树用以下式子来表示:T={ROOT,N},其中N为XML节点集合即N={Ni|i∈[1,m]},ROOT为XML节点树的唯一根节点。
以图3中的XML节点树为例,根据定义1和定义2,对该XML节点树进行初始化,则根节点result对应的节点信息可以表示为:N1=(1,/result,result,0,null,null),而其孩子结点index可表示为:N2=(2,/result/index,iader,1,2,null)。深度优先遍历这棵以result为根节点的XML节点树,依次将每个节点信息Ni=(seqi,pathi,namei,parenti,valuei,atrbi)分别添加到T={ROOT,N}中,遍历完毕后得到XML节点树对应的完整节点信息T。
定义3若XML节点树中存在两个叶子节点Na和Nb,Na,Nb∈N,Na和Nb的路径信息分别为:
path n a = n 0 → n i → . . . → n j → n a path n b = n 0 → n p → . . . → n q → n b , n0,ni,nj,np,nq∈N。
若路径深度 depth ( path n a ) = depth ( path n b ) name n a = name n b , 则可认为Na等价于Nb,记做Na≈Nb
XML文档中存在了大量重复节点信息从而带来了数据冗余,大部分的数据冗余是由于在XML节点树中存在等价节点造成的。如果在完整保存XML节点树结构信息的前提下,能够有效地消除等价节点带来的数据冗余,将会得到较高的XML数据压缩效率。
本发明提出的TXC方法可以有效地消除XML节点树等价节点冗余,该压缩方法主要考虑到以下几个关键点:
1)消除XML自描述性带来的数据冗余。
2)保存XML原有的树形结构,以便支持XML数据导航和XPath(XML Path Language,XML路径语言)查询。
3)尽可能地减少内存的使用,以适应无线传感器节点能量和内存有限的特点。
TXC方法的处理流程如图4所示,主要分为以下步骤:
步骤1:在XML节点树的节点集合N={Ni|i∈[1,m]}中,对于Ni=(seqi,pathi,namei,parenti,valuei,atrbi),i∈[1,m],合并具有相同路径的冗余节点。
步骤2:在XML节点树T={ROOT,N}中,查找等价节点并对其进行合并,修改合并后的等价节点路径表达式,将其置为 path n k = n 0 → ( n i | | n p ) → . . . → ( n j | | n q ) → n k , n0,ni,nj,np,nq,nk∈N。
步骤3:分离XML节点结构信息和数据信息,将节点结构信息和数据信息分开进行存储和压缩:
1)XML节点结构信息
在TXC压缩方法中,XML节点结构信息用“节点路径信息+节点初始序号”的混合数据类型来表示。由于同一个XML节点树中的不同节点的路径信息可能会产生重叠,而浪费很多存储空间,因此可以对XML节点路径信息加以简化:对消除冗余后的XML节点树再进行一次深度优先遍历,并对各节点名称进行编号,得到XML节点名称映射表;对照XML节点名称映射表将XML节点路径信息用编号替换对应的节点名称字符串,经过路径信息表达式的简化后,进一步节约了存储空间。
经过消除冗余的XML节点树如图5所示,sound节点和code节点的路径表达式分别为/result/sensor1/sound和/result/sensor1/detail/code,这两个路径表达式存在重复的前缀/result/sensor1。对图5中的XML节点树进行深度优先遍历,并对各节点名称进行编号,得到的XML节点名称映射表如图6所示。对照图6中的XML节点名称映射表将XML节点路径信息用编号替换对应的节点名称字符串,则图5中的sound节点和code节点的路径表达式可简化为/1/3/4和/1/3/5/6。
2)XML节点数据信息
XML节点数据信息的存储方式采用哈希表来实现,索引值key为简化后的XML节点树中的节点路径表达式,key被消除冗余后的XML节点树节点总数m取模后所得结果即为对应数据存储的哈希地址,即
H(key)=key mod m
考虑到以节点路径信息作为哈希表索引值会出现大量冲突,TXC采用链地址法来处理冲突构造哈希表:节点数据存储的哈希地址为H(key),具有相同索引值的节点数据信息存储在同一哈希单元保存的链表中,并用初始序号来区分该数据在原始XML文档中的位置,链表中的节点采用如图7所示的数据格式。
以图5中的节点id为例,在原XML文档中存在三个名称为id的叶子节点,它们满足等价节点的条件,经过消除冗余后具有相同的路径表达式/1/3/7,经过哈希运算后对应同一个哈希地址。因此采用链地址把三个节点的值存储在同一个哈希单元指向的链表中,如图8所示。

Claims (1)

1.一种基于可扩展标记语言的无线传感器网络数据压缩方法,其特征在于,对可扩展标记语言XML文档对应的XML节点树进行深度优先遍历并按遍历顺序将各个节点进行编号,XML节点树中的节点个数记为m,第i个节点描述为Ni=(seqi,pathi,namei,parenti,valuei,atrbi),i∈[1,m];其中seqi表示第i个节点在深度优先遍历下的序号,pathi表示第i个节点的路径,namei表示第i个节点的名称,parenti表示第i个节点的双亲节点在深度优先遍历下对应的序号,valuei表示第i个节点的值,atrbi表示第i个节点的属性或附加信息;
将XML节点树用以下式子来表示:T={ROOT,N},其中N为XML节点集合即N={Ni|i∈[1,m]},ROOT为XML节点树的唯一根节点;深度优先遍历XML节点树,依次将每个节点信息Ni=(seqi,pathi,namei,parenti,valuei,atrbi)分别添加到T={ROOT,N}中,遍历完毕后得到XML节点树对应的完整节点信息T;
在XML节点树的节点集合N={Ni|i∈[1,m]}中,对于集合N中的节点Ni=(seqi,pathi,namei,parenti,valuei,atrbi),i∈[1,m],合并具有相同路径的冗余节点;
若XML节点树中存在两个叶子节点Na和Nb,Na,Nb∈N,Na和Nb的路径信息分别为:
patha=N0→Ni→…→Nj→Na
pathb=N0→Np→…→Nq→Nb
其中,N0,Ni,Nj,Np,Nq∈N;a、b分别是标识;
若路径深度depth(patha)=depth(pathb),且namea=nameb,则认为Na等价于Nb,记做Na≈Nb
在XML节点树T={ROOT,N}中,查找等价节点并对其进行合并,修改合并后的等价节点路径表达式,将其置为pathk=N0→(Ni||Np)→…→(Nj||Nq)→Nk,其中,N0,Ni,Nj,Np,Nq,Nk∈N;
分离XML节点结构信息和数据信息,将节点结构信息和数据信息分开进行存储和压缩:
1).XML节点结构信息
在TXC压缩方法中,XML节点结构信息用“节点路径信息+节点初始序号”的混合数据类型来表示,由于同一个XML节点树中的节点路径信息会产生重叠,而浪费很多存储空间,因此对XML节点路径信息加以简化:对消除冗余后的XML节点树再进行一次深度优先遍历,并对各节点名称进行编号,得到XML节点名称映射表;对照XML节点名称映射表将XML节点路径信息用编号替换对应的节点名称字符串;
2).XML节点数据信息
XML节点的数据信息存储采用哈希表的方式来实现,以节点路径信息作为索引值,建立起XML节点结构信息到对应节点数据信息之间的映射关系,索引值key为简化后的节点路径表达式,key被消除冗余后的节点个数mkey取模后所得结果即为对应数据存储的哈希地址,即
H(key)=key mod mkey
采用链地址法来处理冲突构造哈希表:节点数据存储的哈希地址为H(key),具有相同索引值的节点数据信息存储在同一哈希单元保存的链表中,并用初始序号来区分该数据在原始XML文档中的位置。
CN201310048475.3A 2013-02-07 2013-02-07 一种基于可扩展标记语言的无线传感器网络数据压缩方法 Expired - Fee Related CN103150346B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310048475.3A CN103150346B (zh) 2013-02-07 2013-02-07 一种基于可扩展标记语言的无线传感器网络数据压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310048475.3A CN103150346B (zh) 2013-02-07 2013-02-07 一种基于可扩展标记语言的无线传感器网络数据压缩方法

Publications (2)

Publication Number Publication Date
CN103150346A CN103150346A (zh) 2013-06-12
CN103150346B true CN103150346B (zh) 2016-08-24

Family

ID=48548424

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310048475.3A Expired - Fee Related CN103150346B (zh) 2013-02-07 2013-02-07 一种基于可扩展标记语言的无线传感器网络数据压缩方法

Country Status (1)

Country Link
CN (1) CN103150346B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105530011A (zh) * 2014-09-30 2016-04-27 华东师范大学 一种基于三角形统计的图数据压缩方法和查询方法
CN104965892B (zh) * 2015-06-17 2018-08-14 重庆邮电大学 一种无线传感器网络中基于字典的xmpp压缩方法
CN113656727A (zh) * 2021-06-30 2021-11-16 云南昆钢电子信息科技有限公司 一种事件驱动系统中对象推送及高效展示装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763353A (zh) * 2008-12-24 2010-06-30 复旦大学 一种无线广播中的xml空中索引方法
CN102650992A (zh) * 2011-02-25 2012-08-29 国际商业机器公司 用于二进制xml数据的生成及其节点定位的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7664742B2 (en) * 2005-11-14 2010-02-16 Pettovello Primo M Index data structure for a peer-to-peer network

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763353A (zh) * 2008-12-24 2010-06-30 复旦大学 一种无线广播中的xml空中索引方法
CN102650992A (zh) * 2011-02-25 2012-08-29 国际商业机器公司 用于二进制xml数据的生成及其节点定位的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《基于剩余能量的无线传感器网路由算法设计》;顾礼君,管有庆;《计算机技术与发展》;20121031;第22卷(第10期);全文 *
《基于剪切的XML数据流自适应发布算法》;霍欢等;《计算机学报》;20101031;第33卷(第10期);全文 *

Also Published As

Publication number Publication date
CN103150346A (zh) 2013-06-12

Similar Documents

Publication Publication Date Title
Almeida et al. Delta state replicated data types
US8166074B2 (en) Index data structure for a peer-to-peer network
Rocha-Junior et al. Top-k spatial keyword queries on road networks
Zeinalipour-Yazti et al. The threshold join algorithm for top-k queries in distributed sensor networks
Gao et al. Relational approach for shortest path discovery over large graphs
CN102945249B (zh) 一种策略规则匹配查询树生成方法、匹配方法及装置
CN105357247B (zh) 基于分层云对等网络的多维属性云资源区间查找方法
CN103150346B (zh) 一种基于可扩展标记语言的无线传感器网络数据压缩方法
CN106874425A (zh) 基于Storm的实时关键词近似搜索算法
CN104780101A (zh) 内容中心网络转发平面fib表结构及其检索方法
CN104008205B (zh) 一种内容路由的查询方法及系统
Abraham et al. Compact routing for graphs excluding a fixed minor
CN110347676B (zh) 基于关系r树的不确定性时态数据管理与查询方法
Sun et al. A spatially-pruned vertex expansion operator in the Neo4j graph database system
CN108595588B (zh) 一种科学数据存储关联方法
Wang et al. Construction and application of knowledge graph system in computer science
Birhanu et al. Native XML document fragmentation model
Mathew et al. An efficient index based query handling model for neo4j
Wang et al. Hypergraph index: an index for context-aware nearest neighbor query on social networks
Lin et al. Virtual Dataspace--A Service Oriented Model for Scientific Big Data
Kaoudi et al. Publishing, discovering and updating semantic grid resources using DHTs
Niu et al. Keyword proximity search over large and complex rdf database
Cortés et al. GeoTrie: A scalable architecture for location-temporal range queries over massive geotagged data sets
Uddin et al. Spatial search in networked systems
Prasad et al. Graph Storage Optimization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20130612

Assignee: Jiangsu Nanyou IOT Technology Park Ltd.

Assignor: NANJING University OF POSTS AND TELECOMMUNICATIONS

Contract record no.: 2016320000215

Denomination of invention: Wireless sensor network data compression method based on extensible markup language

Granted publication date: 20160824

License type: Common License

Record date: 20161118

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EC01 Cancellation of recordation of patent licensing contract
EC01 Cancellation of recordation of patent licensing contract

Assignee: Jiangsu Nanyou IOT Technology Park Ltd.

Assignor: NANJING University OF POSTS AND TELECOMMUNICATIONS

Contract record no.: 2016320000215

Date of cancellation: 20180116

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160824