CN105792110A - 一种多数据来源的数据融合、智能搜索的处理方法 - Google Patents

一种多数据来源的数据融合、智能搜索的处理方法 Download PDF

Info

Publication number
CN105792110A
CN105792110A CN201610191767.6A CN201610191767A CN105792110A CN 105792110 A CN105792110 A CN 105792110A CN 201610191767 A CN201610191767 A CN 201610191767A CN 105792110 A CN105792110 A CN 105792110A
Authority
CN
China
Prior art keywords
data
sigma
sensor
fusion
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610191767.6A
Other languages
English (en)
Other versions
CN105792110B (zh
Inventor
姬江涛
闵新力
薛君志
马伟华
秦玉林
张小坤
张国军
顾书林
施俊士
张余
程洁羚
周江
张达宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI SHENTENG INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI SHENTENG INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI SHENTENG INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI SHENTENG INFORMATION TECHNOLOGY Co Ltd
Priority to CN201610191767.6A priority Critical patent/CN105792110B/zh
Publication of CN105792110A publication Critical patent/CN105792110A/zh
Application granted granted Critical
Publication of CN105792110B publication Critical patent/CN105792110B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/30Services specially adapted for particular environments, situations or purposes
    • H04W4/38Services specially adapted for particular environments, situations or purposes for collecting sensor information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • H04W52/0209Power saving arrangements in terminal devices
    • H04W52/0212Power saving arrangements in terminal devices managed by the network, e.g. network or access point is master and terminal is slave
    • H04W52/0219Power saving arrangements in terminal devices managed by the network, e.g. network or access point is master and terminal is slave where the power saving management affects multiple terminals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W84/00Network topologies
    • H04W84/18Self-organising networks, e.g. ad-hoc networks or sensor networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本发明涉及传感器数据处理技术领域,具体来说是一种多数据来源的数据融合、智能搜索的处理方法及应用,传感器布局采用平面布局,传感器处于同一个平面上组成传感网,数据融合包含多个同种传感器的数据融合和不同种传感器的数据融合,传感器的数据特征及数据类型采用轮询的方式进行数据采集,采集节点在进行采集时要对数据进行冗余处理,采取基于分批估计的自适应算法。本方法通过动态采集各传感器数据,延长系统对传感器数据的识别时间,提高了数据精度,增大数据的准确率,从而提高系统识别的可靠性,适用于同类传感器较多、数据量较大、同种传感器布局在同一平面的场景,能实现种植环节种植小环境、农田气候监测多传感器等环境的数据融合。

Description

一种多数据来源的数据融合、智能搜索的处理方法
[技术领域]
本发明涉及传感器数据处理技术领域,具体来说是一种多数据来源的数据融合、智能搜索的处理方法及应用。
[背景技术]
多传感数据融合技术的雏形出现在第二次世界大战末期。在20世纪70年代美国国防部资助的声纳信号理解系统中,正式提出数据融合的概念。多传感数据融合可以将系统中各种类型传感器所提供的同时刻或不同时刻、同形式或不同形式的测量数据进行综合处理和优化,得到各种数据之间内在的联系和规律,去除无用和错误的成分,保留正确和有用的成分,把多个传感器在时间和空间上的互补或冗余数据依据某种准则进行组合,最终实现数据的优化,使之能够准确地反映环境特征,从而使系统获得更优越的性能。多传感器信息融合技术的基本原理就像人的大脑综合处理信息的过程一样,将各种传感器进行多层次、多空间的信息互补和优化组合处理,最终产生对观测环境的一致性解释。在这个过程中要充分地利用多源数据进行合理支配与使用,而信息融合的最终目标则是基于各传感器获得的分离观测信息,通过对信息多级别、多方面组合导出更多有用信息。这不仅是利用了多个传感器相互协同操作的优势,而且也综合处理了其它信息源的数据来提高整个传感器系统的智能化。
在无线传感器网络中,釆集的数据一方面由于单个传感器节点在短时间内多次釆集到的数据具有极高的相似度,另一方面,邻近传感器节点在相近时刻采集到的数据同样会具有很高的相似度,所有传感器节点采集到的数据全部传输给汇聚节点,不但没有实际意义,反而会过多消耗传感器节点的能量,影响网络寿命,由于节点资源在处理能力、能量、通信带宽以及存储容量等方面十分有限,传感器节点在收到受到干扰情况下,采集到的数据会产生错误,收集数据时采用各个节点单独传送到汇节点显然不合适。目前,多传感器数据融合还没有一种通用的方法。
[发明内容]
本发明是根据现有技术数据融合的上述问题,将信息在本地或传输过程中进行处理,通过融合多传感器的数据,提高数据质量和精度,减少冗余,提供一种多数据来源的数据融合、智能搜索的处理方法及应用。
为了实现上述目的,设计一种多数据来源的数据融合、智能搜索的处理方法,所述的传感器布局采用平面布局,传感器处于同一个平面上组成传感网,数据融合包含多个同种传感器的数据融合和不同种传感器的数据融合,传感器的数据特征及数据类型采用轮询的方式进行数据采集,采集节点在进行采集时要对数据进行冗余处理,采取基于分批估计的自适应算法,所述的算法如下:
Mij=|Xi-Xj|i,j=1,2,…n(1)
由Mij的表达形式可知,Mij越小则表明相互信任程度就越大,因此利用传感器中现有数据隐含信息相对距离和模糊集合理论的基础上定义信任度函数Rij,则Rij定义为:
R i j = 1 - M i j M a x { M i j } M i j ≥ 0 - - - ( 2 )
其中Max{Mij}表示数据间相对距离的最大值,数据间相对距离表示数据间的信任度,成正比关系,由式(2)可知,数据间的相对距离越小,则数据间的相互信任度就越大;当数据间的相对距离最大,信任度函数的值为零,可认为两数据己经不再相互信任;而数据对自身的相对距离为零,则数据对自身的信任度为1,由于Rij分布在[0,Max{Rij}]之间,信任度函数量化定义与实际工作环境的真实性相一致,融合的数值结果更加精确和稳定,由此建立数据融合信任度矩阵K,
K = R 11 ... R 1 n R 21 ... R 2 n R n 1 ... R n m - - - ( 3 )
信任度矩阵K的数据成员Rij表示两数据间的相互信任度,单个距离差数据成员值不能代表所有数据总体信任程度,每个距离差数据在K矩阵全部成员数据中可视为是权系数所有数据信息量之和与最优融合估计的信息量之和相等,即是全部成员数据Ri1,Ri2,…Rin总和,根据概率源合并定义数组注意数组值都非负,可得等式(4):
W ‾ i = V 1 R i 1 + V 2 R i 2 + ... + V n R i n - - - ( 4 )
等效为矩阵表达方式如下:
W=KV(5)
其中V=[V1,V2,…Vn]T,信任度矩阵K是所有成员值都大于或等于0,K的特征值λ>>0,通过λV=KV得特征向量V=[V1,V2,…Vn]T,则
W i ‾ = V i V 1 + V 2 + ... + V n - - - ( 6 )
得n个采集数据点融合计算公式:
T = W ‾ 1 T 1 + + W 2 ‾ T 2 + + ... + W n ‾ T n + - - - ( 7 )
上式T值就是同意区域不在同一簇内簇头节点在协调器的自适应加权估算结果。
通过对监测同一对象的多个节点采集的数据进行综合处理提高所获得信息的准确性和精确度是有效手段之一,由于监测同一区域的邻近节点,获得的信息差异小,如果个别节点采集了误差比较大的或错误的信息,在本地处理中通过简单的算法排除,通过数据融合减少传输数据、降低网络拥塞、减少传输延迟、减少数据分组个数、减少冲突碰撞现象、提高无线信道的利用率。
传感器数据需利用分布图法剔除疏失误差,首先对N个监测量结果从小到大进行排序,得到测量序列:
X1,X2,X3……XN
定义中值:
X M = X N 2 + 1 + X N 2 2 N = 2 k
上四分位数Fμ为区间[XM,XN]的中位数,下四分位数Fl为区间[Xl,XM]的中位数,四分位离散度为:
δF=Fμ-Fl
认定与中位数的距离大于βδF的数据为奇异数据,即无效数据的判断区间为[ρ1,ρ2]
ρ 1 = F 1 - β 2 δ F
ρ 2 = F μ + β 2 δ F
式中的β为常数,其大小取决于系统的测量精度,与实际情况有关,需现场实验测定、修正。
由数量众多的传感器节点组成的传感网中,每个节点的可靠性和监测范围是有限的,在部署时需要加大传感器节点的密度来增强网络的监测信息的准确性和鲁棒性,根据监测任务的不同,有时需要部署互相交叠的网络,这种情况下会产生监测区域的一定程度的冗余信息,把这些节点的冗余信息报告的数据全部发送给汇聚节点会消耗网络更多的能量,在汇聚节点会接收大量无用信息,为降低网络能耗损失和冗余数据传输,在节点聚集数据时、节点转发数据前、应利用节点对数据进行异常去除、去冗、融合操作,在满足应用需求的前提下尽量减小传输量,降低能耗。
传感器节点需采取分批估计算法,将删除了疏失误差之后的数据分成两个组,按照空间位置相邻传感器不在一组的原则进行分组,对两组测量数据的平均值釆用分批估算法对组内每个结点的测量数据进行处理,每个结点在某一时刻测得多组一致性测量数据,估计出接近真实值的融合值T+,得到准确的测量结果,消除测量过程中的不确定性,
设第一组一致性测量数据为:
T 11 , T 12 ... T 1 m m ≤ N 2
设第二组一致性测量数据为:
T 21 , T 22 ... T 2 n n ≤ N 2
两组测量数据的算术平均值分别为:
T ‾ ( 1 ) = 1 m Σ p = 1 m T 1 p
T ‾ ( 2 ) = 1 n Σ q = 1 n T 2 q
相应的标准误差分别为
σ ^ ( 1 ) = 1 m - 1 Σ p = 1 m ( T 1 p - T ‾ ( 1 ) ) 2
σ ^ ( 2 ) = 1 n - 1 Σ q = 1 n ( T 2 q - T ‾ ( 2 ) ) 2
在此之前没有任何有关测量结果的方差根据分批估计理论,得到分批估计后的融合值得方差为:
σ ^ + = [ ( σ ^ - ) - 1 + H τ R - 1 H ] - 1 = { [ 1 1 ] 1 σ ^ ( 1 ) 2 0 0 1 σ ^ ( 2 ) 2 1 1 } - 1 = σ ^ ( 1 ) 2 σ ^ ( 2 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2
式中,H为测量方程的系数矩阵,且R为测量噪声的协方差,且
R = 1 σ ^ ( 1 ) 2 0 0 1 σ ^ ( 2 ) 2
由分批估计到处的数据融和值T+为:
T + = [ σ ^ + + ( σ ^ - ) - 1 ] T - + [ σ ^ + H τ R - 1 ] T = [ σ ^ + + H τ R - 1 ] T - - - ( 8 )
将上面几个式子整理得:
T + = σ ^ ( 1 ) 2 σ ^ ( 2 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2 [ 1 1 ] 1 σ ^ ( 1 ) 2 0 0 1 σ ^ ( 2 ) 2 T ‾ ( 1 ) T ‾ ( 2 ) = σ ^ ( 2 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2 T ‾ ( 1 ) + σ ^ ( 1 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2 T ‾ ( 2 ) - - - ( 9 )
上式即为基于多传感器算术平均值与分批估计的数据融合方法得到的估计值。
所述的传感器包括土壤PH值传感器、土壤电导率传感器、土壤温度传感器、土壤湿度传感器、环境光照度传感器、二氧化碳浓度传感器、大气温湿度传感器、风向风速传感器、大气辐射度传感器、雨量传感器及地表温度传感器。
所述的处理方法应用于大棚环境监测及农田环境监测。
本发明同现有技术相比,其优点在于:
本数据融合方法通过动态采集各传感器数据,延长系统对传感器数据的识别时间,提高了数据精度,增大数据的准确率,从而提高系统识别的可靠性;基于分批估计的自适应数据融合算法,适用于同类传感器较多、数据量较大、同种传感器布局在同一平面的场景,能实现种植环节种植小环境、农田气候监测多传感器等环境的数据融合;传感器数据利用分布图法剔除疏失误差,可减少数据分组个数、减少冲突碰撞现象、提高无线信道的利用率;传感器各节点采取分批估计算法,有效分散网络的数据聚合流向,减少传输的数据,从而降低网络拥塞、减少传输延迟,降低传感器节点的能耗,延长无线传感器网络的寿命。
[附图说明]
图1是本发明的数据融合层次图。
[具体实施方式]
下面结合附图对本发明作进一步说明,这种装置的结构和原理对本专业的人来说是非常清楚的。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明是关于多传感器数据融合技术,在传感网中,一般数据采集和发送以固定的时间间隔进行,这些节点所发送的数据在语义上具有很多相关性。但由于节点资源在处理能力、能量、通信带宽以及存储容量等方面十分有限,传感器节点在收到受到干扰情况下,采集到的数据会产生错误,收集数据时采用各个节点单独传送到汇节点显然不合适。如果能将网络中具有语义相关性的数据合并成一条更有效的数据、将错误的信息删除掉,就能降低在网络中数据的传输量,避免浪费能量和通信带宽,提高数据聚集的效率,从而达到节约功耗的目的,延长网络寿命。
本发明具体可应用在在农产品安全追溯系统中。农产品质量安全追溯管理系统是追踪农产品进入市场各个阶段质量的整体系统,有助于农产品质量安全控制以及在发生安全问题查找源头和召回问题产品。在农产品种植过程监测中,主要包括种植小环境(温室内部或具体地块范围内)监测,农田气候环境监测。种植小环境监测,主要有土壤PH值、土壤电导率、土壤温度、土壤湿度、环境光照度、二氧化碳浓度、大气温湿度;农田环境监测,主要有大气温湿度、风向风速、大气辐射度、雨量及地表温度等。
在农田或大棚内安装有土壤PH值、土壤电导率、土壤温度、土壤湿度、环境光照度、二氧化碳浓度、大气温湿度等传感器,这些传感器实时采集各项指标数据,并通过wifi或4G信号,将采集数据传输到农产品安全追溯系统平台,平台获取并接收存储数据。平台基于采集数据进行分析,实时监控农产品的生长状况和对产品进行品质分析。本系统主要研究实时采集各传感器数据,并将各传感器数据格式化,然后对各传感器数据融合,传输到监控平台。
由于传感网的固有特点、无线传输的数据易受干扰特性、传感网要部署的环境一般比较恶劣,导致传感器件失效概率加大,获得的信息不可靠性很高。信息的正确性仅利用少数几个分散的传感器节点的数据较难确保得到,因此通过对监测同一对象的多个节点采集的数据进行综合处理提高所获得信息的准确性和精确度是有效手段之一。另外由于监测同一区域的邻近节点,获得的信息差异很小,如果个别节点采集了误差比较大的或错误的信息,在本地处理中很容易通过简单的算法排除。通过数据融合减少传输数据、降低网络拥塞、减少传输延迟;通过数据融合可以减少数据分组个数、减少冲突碰撞现象、提高无线信道的利用率。
不同的传感器相互接收、处理各自接收的数据,因此数据在发送到汇聚节点的各个阶段和时间段内进行融合,保证信息在尽可能大的范围内进行融合。由于传感网固有特点,不能保证网内节点的电源持续供给、高速处理能力、大存储容量和高速数据传输,导致网内节点采集数据后传送数据到汇聚节点效率很低,为提高传感网各节点效率、降低消耗,需要釆用网内融合机制处理。在传感网中数据融合作用表现在提高信息精度和准确性、降低网络节点能耗、有效分散网络的数据聚合流向三个方面。
下面以种植环节种植小环境监控中的温度监测为例说明该算法的实现。
实施例1
1)利用分布图法剔除疏失误差
首先对N个温度监测量结果从小到大进行排序,得到测量序列:
X1,X2,X3……XN
定义中值:
X M = X N 2 + 1 + X N 2 2 N = 2 k
上四分位数Fμ为区间[XM,XN]的中位数,下四分位数Fl为区间[Xl,XM]的中位数,四分位离散度为:
δF=Fμ-Fl
认定与中位数的距离大于βδF的数据为奇异数据,即无效数据的判断区间为[ρ1,ρ2],
ρ 1 = F 1 - β 2 δ F
ρ 2 = F μ + β 2 δ F
式中的β为常数,其大小取决于系统的测量精度,与实际情况有关,需现场实验测定、修正。
(2)将删除了疏失误差之后的数据分成两个组,按照空间位置相邻传感器不在一组的原则进行分组,对两组测量数据的平均值釆用分批估算法对组内每个结点的测量数据进行处理。每个结点在某一时刻测得多组一致性测量数据,估计出接近真实值的融合值T+,得到准确的测量结果,消除测量过程中的不确定性。
设第一组一致性测量数据为:
T 11 , T 12 ... T 1 m m ≤ N 2
设第二组一致性测量数据为:
T 21 , T 22 ... T 2 n n ≤ N 2
两组测量数据的算术平均值分别为:
T ‾ ( 1 ) = 1 m Σ p = 1 m T 1 p
T ‾ ( 2 ) = 1 n Σ q = 1 n T 2 q
相应的标准误差分别为
σ ^ ( 1 ) = 1 m - 1 Σ p = 1 m ( T 1 p - T ‾ ( 1 ) ) 2
σ ^ ( 2 ) = 1 n - 1 Σ q = 1 n ( T 2 q - T ‾ ( 2 ) ) 2
在此之前没有任何有关测量结果的方差根据分批估计理论,得到分批估计后的融合值得方差为:
σ ^ + = [ ( σ ^ - ) - 1 + H τ R - 1 H ] - 1 = { [ 1 1 ] 1 σ ^ ( 1 ) 2 0 0 1 σ ^ ( 2 ) 2 1 1 } - 1 = σ ^ ( 1 ) 2 σ ^ ( 2 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2
式中,H为测量方程的系数矩阵,且R为测量噪声的协方差,且
R = 1 σ ^ ( 1 ) 2 0 0 1 σ ^ ( 2 ) 2
由分批估计到处的数据融和值T+为:
T + = [ σ ^ + + ( σ ^ - ) - 1 ] T - + [ σ ^ + H τ R - 1 ] T = [ σ ^ + + H τ R - 1 ] T
将上面几个式子整理得:
T + = σ ^ ( 1 ) 2 σ ^ ( 2 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2 [ 1 1 ] 1 σ ^ ( 1 ) 2 0 0 1 σ ^ ( 2 ) 2 T ‾ ( 1 ) T ‾ ( 2 ) = σ ^ ( 2 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2 T ‾ ( 1 ) + σ ^ ( 1 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2 T ‾ ( 2 )
上式即为基于多传感器算术平均值与分批估计的数据融合方法得到的估计值。
(3)由于各传感器的精度差异,每个传感器的可信度不能完全一致,为获得更优的融合的结果,可自适应地寻找各传感器所得到的测量值对应的权数,即自适应加权融合算法。该算法中各传感器节点都有各自的加权因子,寻找适用于各节点的融合所需的权数成为自适应加权融合的首要工作。
实际测量采集数据会遇到实际测量数据微偏离正态分布;少数分布的异常数值无法被清除,误用为有效数据两个问题。釆用自适应加权估算法对同一监测区域不在同一组内的簇头节点的采集结点数据在协调器进行处理,估计出接近测量真实值的融合值T,从而得到测量值的准确结果,消除测量过程因为簇头节点失效或其他外界因数导致的不确定性。
Mij=|Xi-Xj|i,j=1,2,…n
由Mij的表达形式可知,Mij越小则表明相互信任程度就越大,因此利用传感器中现有数据隐含信息相对距离和模糊集合理论的基础上定义信任度函数Rij,则Rij定义为:
R i j = 1 - M i j M a x { M i j } M i j ≥ 0
其中Max{Mij}表示数据间相对距离的最大值,数据间相对距离表示数据间的信任度,成正比关系,由上式可知,数据间的相对距离越小,则数据间的相互信任度就越大;当数据间的相对距离最大,信任度函数的值为零,可认为两数据己经不再相互信任;而数据对自身的相对距离为零,则数据对自身的信任度为1,由于Rij分布在[0,Max{Rij}]之间,信任度函数量化定义与实际工作环境的真实性相一致,融合的数值结果更加精确和稳定,由此建立数据融合信任度矩阵K,
K = R 11 ... R 1 n R 21 ... R 2 n R n 1 ... R n m
信任度矩阵K的数据成员Rij表示两数据间的相互信任度,单个距离差数据成员值不能代表所有数据总体信任程度,每个距离差数据在K矩阵全部成员数据中可视为是权系数所有数据信息量之和与最优融合估计的信息量之和相等,即是全部成员数据Ri1,Ri2,…Rin总和,根据概率源合并定义数组注意数组值都非负,可得如下等式:
W ‾ i = V 1 R i 1 + V 2 R i 2 + ... + V n R i n
等效为矩阵表达方式如下:
W=KV
其中V=[V1,V2,…Vn]T,信任度矩阵K是所有成员值都大于或等于0,K的特征值λ>>0,通过λV=KV得特征向量V=[V1,V2,…Vn]T,则
W i ‾ = V i V 1 + V 2 + ... + V n
得n个采集数据点融合计算公式:
T = W ‾ 1 T 1 + + W ‾ 2 T 2 + + ... + W ‾ n T n +
上式T值就是同意区域不在同一簇内簇头节点在协调器的自适应加权估算结果。
(4)为测试该算法的有效性,于2014年3月在崇明某种植基地对空气温度数据进行了采集,利用该数据进行数据融合试验。将20个温湿度传感器分为4组,每组5个温度传感节点,节点间距从20米到0.5米不等,每个节点采集2组数据,数据单位为℃。采集数据如下表1所示:
表1
将这两组数据进行数据融合后,数据融合结果传送给网络协调器对节点群进行数据融合。对两组测量数据的算术平均值采用分批估计算法,估计出接近真实值的融和值T+
5个测量数据与实际温度15℃相比测量绝对误差为0.28℃。10个采集节点分两组,每组5个数据,分别计算2组量量数据的算术平均值及方差分别为:
T ‾ ( 1 ) = 15.15 σ ^ ( 1 ) = 0.71 T ‾ ( 2 ) = 14.92 σ ^ ( 2 ) = 1.71
通过分批估算法得出10个测量数据的融和值是X=15.002℃,与实际温度真实值差0.002℃。由此邮件数据融合的测量结果比算术平均值测量结果更接近设计值,原因是分批估计数据融合方法在获得两组测量数据基础上对方差进行加权处理,方差与权数成正比关系。
在此埃及节点进行数据融合的基础上进行不在同组内簇头节点融合处理实验。将不在同组内的4个簇头节点采集的数据融合值在组头网关进行第二次数据融合。每组4个数据,数据分为2组,如下表2所示:
表2
簇头节点1 簇头节点2 簇头节点3 簇头节点4
第一组 15.002 15.003 15.002 15.002
第二组 15.004 15.002 15.003 15.001
每组数据由公式Mij=|xi-xj|得到MAX{Mij}值,进而得到Rij值,建立数据间的支持度矩阵K,得出特征向量V后,通过计算得出该组测量数据值,最终得到融合结果T。

Claims (7)

1.一种多数据来源的数据融合、智能搜索的处理方法,其特征在于所述的传感器布局采用平面布局,传感器处于同一个平面上组成传感网,数据融合包含多个同种传感器的数据融合和不同种传感器的数据融合,传感器的数据特征及数据类型采用轮询的方式进行数据采集,采集节点在进行采集时要对数据进行冗余处理,采取基于分批估计的自适应算法,所述的算法如下:
Mij=|Xi-Xj|i,j=1,2,…n(1)
由Mij的表达形式可知,Mij越小则表明相互信任程度就越大,因此利用传感器中现有数据隐含信息相对距离和模糊集合理论的基础上定义信任度函数Rij,则Rij定义为:
R i j = 1 - M i j M a x { M i j } M i j ≥ 0 - - - ( 2 )
其中Max{Mij}表示数据间相对距离的最大值,数据间相对距离表示数据间的信任度,成正比关系,由式(2)可知,数据间的相对距离越小,则数据间的相互信任度就越大;当数据间的相对距离最大,信任度函数的值为零,可认为两数据己经不再相互信任;而数据对自身的相对距离为零,则数据对自身的信任度为1,由于Rij分布在[0,Max{Rij}]之间,信任度函数量化定义与实际工作环境的真实性相一致,融合的数值结果更加精确和稳定,由此建立数据融合信任度矩阵K,
K = R 11 ... R 1 n R 21 ... R 2 n R n 1 ... R n m - - - ( 3 )
信任度矩阵K的数据成员Rij表示两数据间的相互信任度,单个距离差数据成员值不能代表所有数据总体信任程度,每个距离差数据在K矩阵全部成员数据中可视为是权系数 所有数据信息量之和与最优融合估计的信息量之和相等,即是全部成员数据Ri1,Ri2,...Rin总和,根据概率源合并定义数组注意数组值都非负,可得等式(4):
W ‾ i = V 1 R i 1 + V 2 R i 2 + ... + V n R i n - - - ( 4 )
等效为矩阵表达方式如下:
W=KV(5)
其中V=[V1,V2,…Vn]T,信任度矩阵K是所有成员值都大于或等于0,K的特征值λ>>0,通过λV=KV得特征向量V=[V1,V2,…Vn],则
W ‾ i = V i V 1 + V 2 + ... + V n - - - ( 6 )
得n个采集数据点融合计算公式:
T = W ‾ 1 T 1 + + W ‾ 2 T 2 + + ... + W ‾ n T n + - - - ( 7 )
上式T值就是同意区域不在同一簇内簇头节点在协调器的自适应加权估算结果。
2.如权利要求1所述的一种多数据来源的数据融合、智能搜索的处理方法,其特征在于通过对监测同一对象的多个节点采集的数据进行综合处理提高所获得信息的准确性和精确度是有效手段之一,由于监测同一区域的邻近节点,获得的信息差异小,如果个别节点采集了误差比较大的或错误的信息,在本地处理中通过简单的算法排除,通过数据融合减少传输数据、降低网络拥塞、减少传输延迟、减少数据分组个数、减少冲突碰撞现象、提高无线信道的利用率。
3.如权利要求1所述的一种多数据来源的数据融合、智能搜索的处理方法,其特征在于传感器数据需利用分布图法剔除疏失误差,首先对N个监测量结果从小到大进行排序,得到测量序列:
X1,X2,X3……XN
定义中值:N=2k+1k∈[0,N-1]
X M = x N 2 + 1 + X N 2 2 , N = 2 k
上四分位数Fμ为区间[XM,XN]的中位数,下四分位数F1为区间[X1,XM]的中位数,四分位离散度为:
δF=Fμ-Fl
认定与中位数的距离大于βδF的数据为奇异数据,即无效数据的判断区间为[ρ1,ρ2],
ρ 1 = F 1 - β 2 δ F
ρ 2 = F μ + β 2 δ F
式中的β为常数,其大小取决于系统的测量精度,与实际情况有关,需现场实验测定、修正。
4.如权利要求1所述的一种多数据来源的数据融合、智能搜索的处理方法,其特征在于由数量众多的传感器节点组成的传感网中,每个节点的可靠性和监测范围是有限的,在部署时需要加大传感器节点的密度来增强网络的监测信息的准确性和鲁棒性,根据监测任务的不同,有时需要部署互相交叠的网络,这种情况下会产生监测区域的一定程度的冗余信息,把这些节点的冗余信息报告的数据全部发送给汇聚节点会消耗网络更多的能量,在汇聚节点会接收大量无用信息,为降低网络能耗损失和冗余数据传输,在节点聚集数据时、节点转发数据前、应利用节点对数据进行异常去除、去冗、融合操作,在满足应用需求的前提下尽量减小传输量,降低能耗。
5.如权利要求1所述的一种多数据来源的数据融合、智能搜索的处理方法,其特征在于传感器节点需采取分批估计算法,将删除了疏失误差之后的数据分成两个组,按照空间位置相邻传感器不在一组的原则进行分组,对两组测量数据的平均值釆用分批估算法对组内每个结点的测量数据进行处理,每个结点在某一时刻测得多组一致性测量数据,估计出接近真实值的融合值T+,得到准确的测量结果,消除测量过程中的不确定性,
设第一组一致性测量数据为:
T 11 , T 12 ... T 1 m , m ≤ N 2
设第二组一致性测量数据为:
T 21 , T 22 ... T 2 n , n ≤ N 2
两组测量数据的算术平均值分别为:
T ‾ ( 1 ) = 1 m Σ p = 1 m T 1 p
T ‾ ( 2 ) = 1 n Σ q = 1 n T 2 q
相应的标准误差分别为
σ ^ ( 1 ) = 1 m - 1 Σ p = 1 m ( T 1 p - T ‾ ( 1 ) ) 2
σ ^ ( 2 ) = 1 n - 1 Σ q = 1 n ( T 2 q - T ‾ ( 2 ) ) 2
在此之前没有任何有关测量结果的方差根据分批估计理论,得到分批估计后的融合值得方差为:
σ ^ + = [ ( σ ^ - ) - 1 + H τ R - 1 H ] - 1 = { [ 1 1 ] 1 σ ^ ( 1 ) 2 0 0 1 σ ^ ( 2 ) 2 1 1 } - 1 = σ ^ ( 1 ) 2 σ ^ ( 2 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2
式中,H为测量方程的系数矩阵,且R为测量噪声的协方差,且
R = 1 σ ^ ( 1 ) 2 0 0 1 σ ^ ( 2 ) 2
由分批估计到处的数据融和值T+为:
T + = [ σ ^ + + ( σ ^ - ) - 1 ] T - + [ σ ^ + H τ R - 1 ] T = [ σ ^ + + H τ R - 1 ] T - - - ( 8 )
将上面几个式子整理得:
T + = σ ^ ( 1 ) 2 σ ^ ( 2 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2 [ 1 1 ] 1 σ ^ ( 1 ) 2 0 0 1 σ ^ ( 2 ) 2 T ‾ ( 1 ) T ‾ ( 2 ) = σ ^ ( 2 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2 T ‾ ( 1 ) + σ ^ ( 1 ) 2 σ ^ ( 1 ) 2 + σ ^ ( 2 ) 2 T ‾ ( 2 ) - - - ( 9 )
上式即为基于多传感器算术平均值与分批估计的数据融合方法得到的估计值。
6.如权利要求1所述的一种多数据来源的数据融合、智能搜索的处理方法,其特征在于所述的传感器包括土壤PH值传感器、土壤电导率传感器、土壤温度传感器、土壤湿度传感器、环境光照度传感器、二氧化碳浓度传感器、大气温湿度传感器、风向风速传感器、大气辐射度传感器、雨量传感器及地表温度传感器。
7.如权利要求1所述的一种多数据来源的数据融合、智能搜索的处理方法,其特征在于所述的处理方法应用于大棚环境监测及农田环境监测。
CN201610191767.6A 2016-03-30 2016-03-30 一种多数据来源的数据融合、智能搜索的处理方法 Expired - Fee Related CN105792110B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610191767.6A CN105792110B (zh) 2016-03-30 2016-03-30 一种多数据来源的数据融合、智能搜索的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610191767.6A CN105792110B (zh) 2016-03-30 2016-03-30 一种多数据来源的数据融合、智能搜索的处理方法

Publications (2)

Publication Number Publication Date
CN105792110A true CN105792110A (zh) 2016-07-20
CN105792110B CN105792110B (zh) 2019-04-30

Family

ID=56391492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610191767.6A Expired - Fee Related CN105792110B (zh) 2016-03-30 2016-03-30 一种多数据来源的数据融合、智能搜索的处理方法

Country Status (1)

Country Link
CN (1) CN105792110B (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106019353A (zh) * 2016-07-29 2016-10-12 济南市环境监测中心站 一种环境辐射检测方法
CN106682244A (zh) * 2017-02-28 2017-05-17 中国科学院城市环境研究所 一种环境物联网的环境事件监测方法
CN106767777A (zh) * 2016-11-16 2017-05-31 江苏科技大学 一种新型水下机器人冗余捷联惯导装置
CN106840616A (zh) * 2017-04-11 2017-06-13 南京巨鲨显示科技有限公司 一种基于多传感器的显示器测量装置
CN107132567A (zh) * 2017-03-25 2017-09-05 浙江君安检测技术有限公司 封闭空间内X、γ射线电离辐射强度检测方法
CN107257292A (zh) * 2017-05-26 2017-10-17 河南职业技术学院 一种跨域分布式大数据通讯系统设计规划方法
CN107396292A (zh) * 2017-07-29 2017-11-24 陈剑桃 一种用于精准农业的土壤湿度信息获取系统
CN107451623A (zh) * 2017-09-01 2017-12-08 南京森斯哈贝电子科技有限公司 一种多传感器数据融合方法及装置
CN107450342A (zh) * 2017-09-20 2017-12-08 深圳市晟达机械设计有限公司 一种智能家居智能安防系统
CN107659974A (zh) * 2017-11-03 2018-02-02 广东工业大学 无线传感网路由方法、装置、设备及计算机可读存储介质
CN107977730A (zh) * 2017-09-18 2018-05-01 沈阳大学 一种多传感器数据融合技术的风速测量方法
CN108182817A (zh) * 2018-01-11 2018-06-19 北京图森未来科技有限公司 自动驾驶辅助系统、路侧端辅助系统和车载端辅助系统
CN108491533A (zh) * 2018-03-29 2018-09-04 百度在线网络技术(北京)有限公司 数据融合方法、装置、数据处理系统及存储介质
CN108900622A (zh) * 2018-07-10 2018-11-27 广州智能装备研究院有限公司 基于物联网的数据融合方法、装置与计算机可读存储介质
CN109636659A (zh) * 2018-10-22 2019-04-16 广东精点数据科技股份有限公司 基于品质因数的农业物联网多源数据融合方法及系统
CN109886551A (zh) * 2019-01-23 2019-06-14 北京绿里生态科技有限公司 通过大数据对农田环境监测模块装置产生的布置误差及量化误差进行纠正的方法
CN110569903A (zh) * 2019-09-10 2019-12-13 北京远舢智能科技有限公司 一种数据预测管理系统
CN110987875A (zh) * 2019-12-24 2020-04-10 上海蓝长自动化科技有限公司 一种基于支持度和信任度进行空间融合的水质浊度检测方法
CN111376833A (zh) * 2018-12-28 2020-07-07 观致汽车有限公司 用于监测对象的方法、设备和计算机程序产品
CN111614438A (zh) * 2020-05-09 2020-09-01 云南电网有限责任公司电力科学研究院 一种基于电力载波通信的数据融合系统及方法
CN111737716A (zh) * 2017-11-17 2020-10-02 阿里巴巴集团控股有限公司 可溯源的多方数据处理方法、装置及设备
CN113239979A (zh) * 2021-04-23 2021-08-10 广州市祺能电子科技有限公司 一种物联网传感器数据采集的方法及装置
CN115359807A (zh) * 2022-10-21 2022-11-18 金叶仪器(山东)有限公司 一种用于城市噪声污染的噪声在线监测系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103412220A (zh) * 2013-08-13 2013-11-27 无锡科技职业学院 一种基于数据融合的船舶电站故障诊断方法
CN105355047A (zh) * 2015-11-03 2016-02-24 吉林大学 多交通检测源动态时间粒度的数据融合处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103412220A (zh) * 2013-08-13 2013-11-27 无锡科技职业学院 一种基于数据融合的船舶电站故障诊断方法
CN103412220B (zh) * 2013-08-13 2016-03-02 无锡科技职业学院 一种基于数据融合的船舶电站故障诊断方法
CN105355047A (zh) * 2015-11-03 2016-02-24 吉林大学 多交通检测源动态时间粒度的数据融合处理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
潘良勇: "无线传感网络下的数据融合技术研究", 《武汉理工大学硕士学位论文》 *
焦竹青等: "基于信任度的多传感器数据融合及其应用", 《东南大学学报》 *

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106019353A (zh) * 2016-07-29 2016-10-12 济南市环境监测中心站 一种环境辐射检测方法
CN106019353B (zh) * 2016-07-29 2020-01-17 山东省济南生态环境监测中心 一种环境辐射检测方法
CN106767777A (zh) * 2016-11-16 2017-05-31 江苏科技大学 一种新型水下机器人冗余捷联惯导装置
CN106682244A (zh) * 2017-02-28 2017-05-17 中国科学院城市环境研究所 一种环境物联网的环境事件监测方法
CN107132567A (zh) * 2017-03-25 2017-09-05 浙江君安检测技术有限公司 封闭空间内X、γ射线电离辐射强度检测方法
CN107132567B (zh) * 2017-03-25 2019-06-18 浙江君安检测技术有限公司 封闭空间内X、γ射线电离辐射强度检测方法
CN106840616A (zh) * 2017-04-11 2017-06-13 南京巨鲨显示科技有限公司 一种基于多传感器的显示器测量装置
CN107257292A (zh) * 2017-05-26 2017-10-17 河南职业技术学院 一种跨域分布式大数据通讯系统设计规划方法
CN107257292B (zh) * 2017-05-26 2019-11-19 河南职业技术学院 一种跨域分布式大数据通讯系统设计规划方法
CN107396292A (zh) * 2017-07-29 2017-11-24 陈剑桃 一种用于精准农业的土壤湿度信息获取系统
CN107451623A (zh) * 2017-09-01 2017-12-08 南京森斯哈贝电子科技有限公司 一种多传感器数据融合方法及装置
CN107451623B (zh) * 2017-09-01 2019-11-08 南京森斯哈贝电子科技有限公司 一种多传感器数据融合方法及装置
CN107977730A (zh) * 2017-09-18 2018-05-01 沈阳大学 一种多传感器数据融合技术的风速测量方法
CN107450342A (zh) * 2017-09-20 2017-12-08 深圳市晟达机械设计有限公司 一种智能家居智能安防系统
CN107659974A (zh) * 2017-11-03 2018-02-02 广东工业大学 无线传感网路由方法、装置、设备及计算机可读存储介质
CN111737716A (zh) * 2017-11-17 2020-10-02 阿里巴巴集团控股有限公司 可溯源的多方数据处理方法、装置及设备
CN108182817A (zh) * 2018-01-11 2018-06-19 北京图森未来科技有限公司 自动驾驶辅助系统、路侧端辅助系统和车载端辅助系统
CN108491533B (zh) * 2018-03-29 2019-04-02 百度在线网络技术(北京)有限公司 数据融合方法、装置、数据处理系统及存储介质
CN108491533A (zh) * 2018-03-29 2018-09-04 百度在线网络技术(北京)有限公司 数据融合方法、装置、数据处理系统及存储介质
CN108900622A (zh) * 2018-07-10 2018-11-27 广州智能装备研究院有限公司 基于物联网的数据融合方法、装置与计算机可读存储介质
CN108900622B (zh) * 2018-07-10 2021-04-09 广州智能装备研究院有限公司 基于物联网的数据融合方法、装置与计算机可读存储介质
CN109636659A (zh) * 2018-10-22 2019-04-16 广东精点数据科技股份有限公司 基于品质因数的农业物联网多源数据融合方法及系统
CN111376833A (zh) * 2018-12-28 2020-07-07 观致汽车有限公司 用于监测对象的方法、设备和计算机程序产品
CN109886551A (zh) * 2019-01-23 2019-06-14 北京绿里生态科技有限公司 通过大数据对农田环境监测模块装置产生的布置误差及量化误差进行纠正的方法
CN110569903A (zh) * 2019-09-10 2019-12-13 北京远舢智能科技有限公司 一种数据预测管理系统
CN110569903B (zh) * 2019-09-10 2022-03-29 北京远舢智能科技有限公司 一种数据预测管理系统
CN110987875A (zh) * 2019-12-24 2020-04-10 上海蓝长自动化科技有限公司 一种基于支持度和信任度进行空间融合的水质浊度检测方法
CN110987875B (zh) * 2019-12-24 2022-08-12 上海蓝长自动化科技有限公司 一种基于支持度和信任度进行空间融合的水质浊度检测方法
CN111614438A (zh) * 2020-05-09 2020-09-01 云南电网有限责任公司电力科学研究院 一种基于电力载波通信的数据融合系统及方法
CN111614438B (zh) * 2020-05-09 2022-09-02 云南电网有限责任公司电力科学研究院 一种基于电力载波通信的数据融合系统及方法
CN113239979A (zh) * 2021-04-23 2021-08-10 广州市祺能电子科技有限公司 一种物联网传感器数据采集的方法及装置
CN113239979B (zh) * 2021-04-23 2024-01-09 广州市祺能电子科技有限公司 一种物联网传感器数据采集的方法及装置
CN115359807A (zh) * 2022-10-21 2022-11-18 金叶仪器(山东)有限公司 一种用于城市噪声污染的噪声在线监测系统
CN115359807B (zh) * 2022-10-21 2023-01-20 金叶仪器(山东)有限公司 一种用于城市噪声污染的噪声在线监测系统

Also Published As

Publication number Publication date
CN105792110B (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN105792110A (zh) 一种多数据来源的数据融合、智能搜索的处理方法
CN101953287B (zh) 基于多数据的作物需水检测系统
CN103476118B (zh) 一种用于实时监控的wlan室内位置指纹定位方法
Bandara et al. Smart farm and monitoring system for measuring the Environmental condition using wireless sensor network-IOT Technology in farming
CN106500775B (zh) 一种有效的农作物生长监测系统
TWI546759B (zh) 遠距環境資料分類系統及其方法
CN108055685A (zh) 无线传感器网络中的簇头节点和传感器节点
Guillén-Navarro et al. A deep learning model to predict lower temperatures in agriculture
Feiyang et al. Monitoring behavior of poultry based on RFID radio frequency network
CN106934451A (zh) 一种基于蚁群优化的bp神经网络wsn森林火灾防范系统
Zhu et al. A perceptron algorithm for forest fire prediction based on wireless sensor networks
Rodríguez‐Moreno et al. Weather‐data‐based model: an approach for forecasting leaf and stripe rust on winter wheat
CN116681279B (zh) 一种基于数据分析的林业有害生物防治风险评估系统
CN106092212A (zh) 仓储环境监测系统
CN107276999A (zh) 一种无线传感器网络中的事件检测方法
CN116342063A (zh) 应用于智慧农业的数据处理方法
Sahu et al. Testing some grouping methods to achieve a low error quantile estimate for high resolution (0.25 x 0.25) precipitation data
Khelifi Monitoring system based in wireless sensor network for precision agriculture
Vadlamudi Rethinking food sufficiency with smart agriculture using Internet of things
Priya et al. IoT and Machine Learning based Precision Agriculture through the Integration of Wireless Sensor Networks
McDonald Jr et al. Prediction of litter size in American black bears
Joshi et al. Cloud based real time soil moisture content monitoring using IoT and unmanned aerial vehicles
Gillespie et al. Can machine learning classification methods improve the prediction of leaf wetness in North-Western Europe compared to established empirical methods?
Ashok et al. Crop prediction based on environmental factors using machine learning ensemble algorithms
Subramani et al. Fuzzy-based intelligent crop prediction over climate fluctuation using IoT

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190430

Termination date: 20210330