CN101667200A - 一种p2p环境中的窗口查询方法 - Google Patents

一种p2p环境中的窗口查询方法 Download PDF

Info

Publication number
CN101667200A
CN101667200A CN200910152881A CN200910152881A CN101667200A CN 101667200 A CN101667200 A CN 101667200A CN 200910152881 A CN200910152881 A CN 200910152881A CN 200910152881 A CN200910152881 A CN 200910152881A CN 101667200 A CN101667200 A CN 101667200A
Authority
CN
China
Prior art keywords
network
node
super node
data
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910152881A
Other languages
English (en)
Other versions
CN101667200B (zh
Inventor
寿黎但
胡天磊
陈珂
陈刚
汤天亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2009101528818A priority Critical patent/CN101667200B/zh
Publication of CN101667200A publication Critical patent/CN101667200A/zh
Application granted granted Critical
Publication of CN101667200B publication Critical patent/CN101667200B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Abstract

本发明公开了一种的P2P环境中的窗口查询方法。利用超级节点P2P网络同时具备集中式网络和完全无结构化网络的优点,将窗口查询方法建立在此网络结构上。针对数据的高维特性,在每个单独的网络节点上,数据通过一种降维算法iMinMax映射到一维空间,映射后的值可以通过B+树等传统的DBMS索引结构来存储和查询。然后在每个超级节点上构建数据的统计信息表以及构造网络查询树。节点P发送查询请求时,首先发送到P所属的超级节点上,然后超级节点根据数据的统计信息表在内部完成查询,同时根据网络查询树将查询发送到其他的超级节点,最终完成整个网络的查询,最后返回查询结果到P。该方法能够有效的避免网络泛洪,高效的查询返回数据。

Description

一种P2P环境中的窗口查询方法
技术领域
本发明涉及多媒体,web等高维数据映射和查询技术,超级节点P2P网络技术,特别是涉及一种P2P环境中的窗口查询方法。
背景技术
随着多媒体,web等技术的发展,新型的数据库运用应运而生,包括基于内容的视频、音频检索,流数据的匹配,数字图像处理,文本处理等。对这些高维数据的查询和匹配基本操作可以总结为三类:相似范围查询,k-NN(k-Nearest Neighbor)查询,基于窗口的范围查询。其中相似范围查询和k-NN查询主要是用在高维数据库中查找相似的对象(例如查找离学校最近的10个银行或者1公里以内的公交站牌等)。基于窗口的范围查询,主要是针对数据的属性来过滤出窗口数据,然后针对这些有用的数据做进一步分析。比如在传感器网络中,数据或者事件等都由多个属性值构成(温度,光感属性等),而这些属性值都有一个值域范围,因此一个非常有用的查询便是针对各个属性值查询感兴趣的数据或者事件(例如:找出所有的传感器数据中满足温度在40°~50°之间,光感强度在5~10之间的数据)。
随着P2P网络的兴起,针对高维数据的分布式查询与索引的需求更加明显,但是大多数的应用和研究还局限在结构化P2P等网络中,而导致了节点不能够自治管理数据等缺点。当前的技术着重利用分布式网络的路由信息来支持窗口查询,更适用于DHT网络中,因此,需要针对更加健壮和自由的P2P网络的特点提出有效的窗口查询技术。
发明内容
本发明的目的在于提供一种高效的P2P环境中的窗口查询方法。
本发明解决其技术问题采用的技术方案是:
(1)、该方法的步骤如下:
1)选择具备集中式网络和完全无结构化网络的超级节点P2P网络作为底层网络基础;
2)在每个单独的网络节点上,数据通过一种降维算法映射到一维空间;
3)在超级节点上构建数据的统计信息表以及构造网络查询树;
4)当一个节点P发起查询请求时,查询q被发送到节点P所在的超级节点,超级节点在内部完成查询;
5)超级节点查询其他所连接的超级节点的数据,并返回结果。
(2)、所述步骤1)中选用的P2P网络是超级节点P2P网络,保存了所管辖的节点的信息以及与其相连的超级节点的路由信息,能够支持复杂的分布式计算,能够避免集中式网络中的单点失败和可扩展性问题。
(3)、所述步骤2)使用iMinMax降维算法,将一个高维数据点x映射到其一维空间的最大值或最小值。
(4)、所述步骤3)负责两个任务:
1)在每个超级节点上,构建两类数据的统计信息表:a)超级节点内部管理的节点P的统计信息;b)整个P2P网络中,与超级节点相连的其他超级节点管理的数据的统计信息;
2)针对网络中的所有超级节点构成的网络图,构建一棵查询树,根据此查询树来访问P2P网络中的超级节点,避免网络泛洪。
(5)、所述步骤4)中查询首先发送到节点P所属的超级节点上,然后通过(4)中步骤1)中步骤a)建立的超级节点内部统计信息来查询与超级节点相连的所有节点Pi的数据。
(6)、所述步骤5)通过(4)中步骤2)中建立起来的网络查询树以及(4)中步骤1)中步骤b)构建的数据统计信息,来查询其他的超级节点,最终返回整个网络中的满足条件的结果数据,最终完成整个网络的查询。
本发明具有的有益效果是:
充分利用了集中式环境下的查询技术以及P2P网络的现有研究和实现成果,基于已有集中式的查询算法的扩展可以非常方便快捷的提供P2P下的查询能力,同时,避免了网络的泛洪,提供最好的性能。
附图说明
图1是超级节点P2P网络示意图。
图2是高维数据映射到一维示意图。
图3是超级节点统计信息示意图。
具体实施方式
现结合附图和具体实施例对本发明作进一步说明。
本发明具体实施过程和工作原理如下:
1)选择具备集中式网络和完全无结构化网络的超级节点(super-peer)P2P网络作为底层网络基础;
2)在每个单独的网络节点上,数据通过一种降维算法映射到一维空间;
3)在超级节点上构建数据的统计信息表以及构造网络查询树;
4)当一个节点P发起查询请求时,查询q被发送到节点P所在的超级节点,超级节点在内部完成查询;
5)超级节点查询其他所连接的超级节点的数据,并返回结果。
步骤1)中的网络结构如图1所示,每个超级节点SP管理P1到Pn个底层节点,超级节点之间互相连接构成整个P2P网络,原始数据存在底层节点上,超级节点SP仅仅存储统计信息等数据。
步骤2)中的数据空间表示为:考虑一个维度为d的数据空间,数据每个维度的值范围是[0,1],因此一个d维的点所在的范围空间可以表示为([0,1],[0,1],…[0,1],[0,1])。将一个数据点x以及其最大最小值表示为式(1):
x=(x 1,x 2...,xd)
x∈([0,1]1,[0,1]2...[0,1]d)
x max = max i = 1 d x i
x min = min i = 1 d x i - - - ( 1 )
将窗口查询q表示为式(2),将窗口查询结果集表示为window(q)。
q=([x11,x12],...[xd1,xd2])          (2)
步骤2)中选用的降维算法是iMinMax,数据映射式如(3)所示,将数据映射到所有维度的最大值或者最小值,其中θ表示用户指定的参数,c表示一个常量,通常取值为1,dmin表示数据的最小值的维度,dmax表示数据的最大值的维度。
y = d min &times; c + x min if x min + &theta; < 1 - x max d max &times; c + x max otherwise - - - ( 3 )
同时,iMinMax将窗口查询映射到式(4),其中qj表示窗口查询q的第j个维度上的分量。
q j = [ j + max i = 1 d x i 1 , j + x j 2 ] if min i = 1 d x i 1 + &theta; > = 1 - max i = 1 d x i 1 [ j + x j 1 , j + min i = 1 d x i 2 ] if min i = 1 d x i 2 + &theta; < 1 - max i = 1 d x i 2 [ j + x j 1 ,j+ x j 2 ] otherwise - - - ( 4 )
映射示意图如图2所示,例如,图2(a)中的数据B(0.2,0.7)通过式(3)映射为值1.2。因此,数据经过算法映射后,变成了1维数据,可以用B+树来索引和查询,图2(b)表示查询时需要查询的范围。
步骤3)中主要包含以下内容:
1)超级节点根据映射后的一维数据来构建统计信息。由图2(a)可知,数据都映射到Range(i)=[i*c,i*c+1]1=<i<=d)区间内,对每一个i(维度),分为RangeA(i)=[i*c,i*c+0.5]和RangeB(i)=[i*c+0.5,i*c+1]。根据iMinMax的思想,Range(i)的值大部分会分布在区间的两边,因此,取RangeA(i)和RangeB(i)的范围来构成统计信息。比如在图2(a)中,2维的统计信息为:2:(2.15,2.2),(2.75,2.8)。对节点P,所有维度的信息组合成一个节点统计信息:
  PeerID   θ   1:(X1min,X12),(X13,X1max) d:(Xdmin,Xd2),(Xd3,Xdmax)
2)由于超级节点SP之间连接是一个图结构,为了查询的方便以及避免网络的泛洪,在初始化时,构建一个超级节点网络树,如图3所示。
3)针对窗口查询,为了事先能够判断一个超级节点所在的子树是否含有满足条件的数据,需要对超级节点所在的子树的所有数据做一个统计信息表,用SPST表示此表,并保存在超级节点中,如图3所示。对于叶子节点如C,D,E,SPST只包含一项,就是所有节点Pi(1=<i<=n)统计信息的并集。针对非叶子节点B,统计信息包含儿子节点的统计信息,以及自己的统计信息,并且最后将这两类信息汇总为Btotal,然后将Btotal发送给其父亲节点。
步骤4)中查询q被发送到P所在的超级节点。根据存储在超级节点中的数据的统计信息表来判断包含数据的节点Pi,然后将查询发送到包含数据的节点Pi,在Pi上完成查询工作,并返回结果。
步骤5)中当超级节点在内部完成查询时,然后比较SPST,将查询发送给含有数据的儿子节点(也是超级节点,根据图3的网络树),最后将查询发送给超级节点的父亲节点,由父亲节点来处理剩下的子树查询,最终返回查询结果。

Claims (6)

1、一种P2P环境中的窗口查询方法,其特征在于,该方法的步骤如下:
1)选择具备集中式网络和完全无结构化网络的超级节点P2P网络作为底层网络基础;
2)在每个单独的网络节点上,数据通过一种降维算法映射到一维空间;
3)在超级节点上构建数据的统计信息表以及构造网络查询树;
4)当一个节点P发起查询请求时,查询q被发送到节点P所在的超级节点,超级节点在内部完成查询;
5)超级节点查询其他所连接的超级节点的数据,并返回结果。
2、根据权利要求1所述的一种P2P环境中的窗口查询方法,其特征在于:所述步骤1)中选用的P2P网络是超级节点P2P网络,保存了所管辖的节点的信息以及与其相连的超级节点的路由信息,能够支持复杂的分布式计算,能够避免集中式网络中的单点失败和可扩展性问题。
3、根据权利要求1所述的一种P2P环境中的窗口查询方法,其特征在于:所述步骤2)使用iMinMax降维算法,将一个高维数据点x映射到其一维空间的最大值或最小值。
4、根据权利要求1所述的一种P2P环境中的窗口查询方法,其特征在于:所述步骤3)负责两个任务:
1)在每个超级节点上,构建两类数据的统计信息表:a)超级节点内部管理的节点P的统计信息;b)整个P2P网络中,与超级节点相连的其他超级节点管理的数据的统计信息;
2)针对网络中的所有超级节点构成的网络图,构建一棵查询树,根据此查询树来访问P2P网络中的超级节点,避免网络泛洪。
5、根据权利要求1所述的一种P2P环境中的窗口查询方法,其特征在于:所述步骤4)中查询首先发送到节点P所属的超级节点上,然后通过权利要求4中步骤1)中步骤a)建立的超级节点内部统计信息来查询与超级节点相连的所有节点Pi的数据。
6、根据权利要求1所述的一种P2P环境中的窗口查询方法,其特征在于:所述步骤5)通过权利要求4中步骤2)中建立起来的网络查询树以及权利要求4中步骤1)中步骤b)构建的数据统计信息,来查询其他的超级节点,最终返回整个网络中的满足条件的结果数据,最终完成整个网络的查询。
CN2009101528818A 2009-09-18 2009-09-18 一种p2p环境中的窗口查询方法 Expired - Fee Related CN101667200B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101528818A CN101667200B (zh) 2009-09-18 2009-09-18 一种p2p环境中的窗口查询方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101528818A CN101667200B (zh) 2009-09-18 2009-09-18 一种p2p环境中的窗口查询方法

Publications (2)

Publication Number Publication Date
CN101667200A true CN101667200A (zh) 2010-03-10
CN101667200B CN101667200B (zh) 2011-06-01

Family

ID=41803816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101528818A Expired - Fee Related CN101667200B (zh) 2009-09-18 2009-09-18 一种p2p环境中的窗口查询方法

Country Status (1)

Country Link
CN (1) CN101667200B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102262711A (zh) * 2011-08-04 2011-11-30 中山爱科数字家庭产业孵化基地有限公司 一种区域健康档案管理系统及实现方法
CN102547471A (zh) * 2010-12-08 2012-07-04 中国科学院声学研究所 一种p2p流媒体系统中获取候选合作节点的方法及系统
WO2012109946A1 (zh) * 2011-12-30 2012-08-23 华为技术有限公司 一种大规模网络的数据采集方法和网络节点
CN105138674A (zh) * 2015-09-08 2015-12-09 成都博元科技有限公司 一种数据库访问方法
WO2017155464A1 (en) * 2016-03-07 2017-09-14 Agency For Science, Technology And Research Method of facilitating distributed data search in a federated cloud and system thereof
WO2020238749A1 (zh) * 2019-05-30 2020-12-03 阿里巴巴集团控股有限公司 栅格数据访问方法、装置、电子设备及计算机存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101087305B (zh) * 2007-07-09 2010-09-08 中国人民解放军国防科学技术大学 大规模非结构化p2p网络中的资源搜索方法
CN101272399A (zh) * 2008-04-25 2008-09-24 浙江大学 一种基于p2p网络实现全文检索系统的方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102547471A (zh) * 2010-12-08 2012-07-04 中国科学院声学研究所 一种p2p流媒体系统中获取候选合作节点的方法及系统
CN102547471B (zh) * 2010-12-08 2013-12-11 中国科学院声学研究所 一种p2p流媒体系统中获取候选合作节点的方法及系统
CN102262711A (zh) * 2011-08-04 2011-11-30 中山爱科数字家庭产业孵化基地有限公司 一种区域健康档案管理系统及实现方法
WO2012109946A1 (zh) * 2011-12-30 2012-08-23 华为技术有限公司 一种大规模网络的数据采集方法和网络节点
CN102652425A (zh) * 2011-12-30 2012-08-29 华为技术有限公司 一种大规模网络的数据采集方法和网络节点
CN102652425B (zh) * 2011-12-30 2014-06-25 华为技术有限公司 一种大规模网络的数据采集方法和网络节点
CN105138674A (zh) * 2015-09-08 2015-12-09 成都博元科技有限公司 一种数据库访问方法
CN105138674B (zh) * 2015-09-08 2018-11-02 成都博元科技有限公司 一种数据库访问方法
WO2017155464A1 (en) * 2016-03-07 2017-09-14 Agency For Science, Technology And Research Method of facilitating distributed data search in a federated cloud and system thereof
WO2020238749A1 (zh) * 2019-05-30 2020-12-03 阿里巴巴集团控股有限公司 栅格数据访问方法、装置、电子设备及计算机存储介质
US11907283B2 (en) 2019-05-30 2024-02-20 Alibaba Group Holding Limited Multi-resolution raster data access method, apparatus, electronic device, and computer storage medium

Also Published As

Publication number Publication date
CN101667200B (zh) 2011-06-01

Similar Documents

Publication Publication Date Title
CN101667200B (zh) 一种p2p环境中的窗口查询方法
CN106227800B (zh) 一种高度关联大数据的存储方法及管理系统
CN104182454B (zh) 基于领域本体构建的多源异构数据语义集成的模型及方法
US8166074B2 (en) Index data structure for a peer-to-peer network
Ding et al. Efficient and progressive algorithms for distributed skyline queries over uncertain data
CN102270232B (zh) 一种存储优化的语义数据查询系统
Fernández et al. Lightweighting the web of data through compact RDF/HDT
CN101853283B (zh) 面向多维数据的语义索引对等网络的构建方法
CN106021560B (zh) 面向数据流的低时延内存b+树索引构建方法
CN104123392A (zh) 一种关系型数据库迁移到HBase数据库的工具和方法
CN101272399A (zh) 一种基于p2p网络实现全文检索系统的方法
Vlachou et al. Distributed top-k query processing by exploiting skyline summaries
Salles et al. Intensional associations in dataspaces
CN104537091A (zh) 一种基于层次标识路由的网络化关系数据查询方法
CN102819600A (zh) 面向电力生产管理系统关系数据库的关键词搜索方法
CN103593435A (zh) 不确定数据PT-TopK查询近似处理系统和方法
CN103377236B (zh) 一种用于分布式数据库的连接查询方法及系统
Tiddi et al. Walking linked data: a graph traversal approach to explain clusters
CN103699556A (zh) 一种用于地方志编纂和地情资料的数字方志信息系统
CN105843555A (zh) 分布式存储中基于随机梯度下降的谱哈希方法
Li et al. Data caching based queries in multi-sink sensor networks
Liu et al. A semantic-based P2P resource organization model R-Chord
Simeoni et al. Metadata harvesting for content‐based distributed information retrieval
Shiraishi et al. Tomudb: Multi-resolution queries in heterogeneous sensor networks through overlay network
CN116136861B (zh) 基于知识图谱的分布式多源异构数据管理系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110601

Termination date: 20200918