CN111654874B - 一种无线传感网异常检测方法 - Google Patents

一种无线传感网异常检测方法 Download PDF

Info

Publication number
CN111654874B
CN111654874B CN202010497988.2A CN202010497988A CN111654874B CN 111654874 B CN111654874 B CN 111654874B CN 202010497988 A CN202010497988 A CN 202010497988A CN 111654874 B CN111654874 B CN 111654874B
Authority
CN
China
Prior art keywords
data
data set
sensor network
wireless sensor
penalty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010497988.2A
Other languages
English (en)
Other versions
CN111654874A (zh
Inventor
屈洪春
姜振凤
贾丽娜
曹旨昊
徐丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zaozhuang University
Original Assignee
Zaozhuang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zaozhuang University filed Critical Zaozhuang University
Priority to CN202010497988.2A priority Critical patent/CN111654874B/zh
Priority to PCT/CN2020/108778 priority patent/WO2021243848A1/zh
Publication of CN111654874A publication Critical patent/CN111654874A/zh
Application granted granted Critical
Publication of CN111654874B publication Critical patent/CN111654874B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W84/00Network topologies
    • H04W84/18Self-organising networks, e.g. ad-hoc networks or sensor networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开一种无线传感器网异常检测方法,本方法基于融合理论,融合模糊孪生支持向量机和自适应迭代寻优的无线传感网异常检测系统,主要目的是解决当前无线传感网异常检测效率不高、精度不高、泛化能力较弱的问题。该系统经过测试,展示出强大的检测能力、更高的分类准确率和更广泛的应用场景,其泛化能力较强,可广泛的应用于诸多无线传感网络异常检测环境中,更提高了检测的准确性和高效性。

Description

一种无线传感网异常检测方法
技术领域
本发明涉及一种融合模糊孪生支持向量机和自适应迭代寻优的无线传感网异常检测方法,属于传感器网数据处理技术领域。
背景技术
无线传感网络(Wireless Sensor Networks,WSN)是一种分布式传感网络,它的末梢是可以感知和检查外部世界的传感器。无线传感网部署方便、价格低廉、可以大规模自组织网络,并且传感器具备微型化、智能化、多功能化等特点。因此无线传感网被广泛应用于农业生产、环境检测、智能交通、智能家居等领域。例如在农业生产过程中,通过建立WSN农业环境自动检测系统,实时采集和控制大棚种植室内及土壤的温度、湿度,光照强度,珍贵经济作物的生长规律等影响农作物生长的因素,可以有效的提高农业集约化生产程度,提高农业生产种植的科学性。为了及时的监测出各种可能发生的突发事件(森林火灾、交通堵塞、室内空气污染),必须准确、迅速的判断出传感器采集到的异常数据,这对于应对突发事件,迅速采取有效措施,这对于避免事件的发生或者降低影响具有十分重要的意义。
近年来,在学术以及工业等领域的共同推进下,无线传感网络异常检测领域取得了许多成果。目前主要的无线传感网络异常检测方法和系统如下:
一种是基于人工免疫和K均值聚类的无线传感网异常检测方法。该方法将传感网监测节点采集到的数据进行压缩存储,然后采取K均值聚类的方法,将正常数据和异常数据聚集到不同的类簇,从而完成异常数据检测。
另一种方法是基于变宽直方图的全局异常数据的检测方法,它将动态感知数据以数据融合的方式聚合成为变宽的直方图并执行检测过程。
但是,上述利用人工免疫和K均值聚类的方法,缺点在于对监测数据进行压缩存储时,若数据没有呈现一定的规律性,并不能有效的节约资源和提高检测效率;并且单纯的利用传统的K均值聚类方法也不能有效的提高监测精度。另一种基于变宽直方图的全局异常数据的检测方法并没有有效的提升异常数据监测精度。当前无线传感网异常检测存在效率不高、精度不高、泛化能力较弱的问题。
技术方案
为了解决现有技术存在的问题,本发明提出了一种无线传感网异常检测方法,融合模糊孪生支持向量机和自适应迭代寻优,解决当前无线传感网异常检测效率不高、精度不高、泛化能力较弱的问题。
为了解决所述技术问题,本发明采用的技术方案是:一种无线传感网异常检测方法,包括以下步骤;
S1、传感器监测节点实时汇集来自各个传感器监测的数据,形式原始数据集x={x1,x2,...,xi,...,xn},xi∈Rn,i=1,2,...,n,xi表示传感器采集的数据,并以无线通信的方式进行传输和存储;
S2、对传感器采集到的数据集进行数据预处理,所述数据预处理包括数据归一化处理、类不平衡处理以及训练数据集、检测数据集的划分,归一化处理后的数据集为X={X1,X2,...,Xi,...,Xn};
S3:建立无线传感网异常检测模型,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C,将训练数据集作为数据输入,建立无线传感网异常检测模型;
S4:利用已经建立的无线传感网异常检测模型,将检测数据集作为模型的输入,根据模型的输出结果,判断检测数据集中正常数据和异常数据,完成无线传感网异常数据检测。
进一步的,无线传感网异常检测模型为模糊孪生支持向量机异常检测模型,建立该模型的步骤为:
S31)、为了避免无线传感网数据在低维空间不能线性可分的情况,引入核函数K(x,z)将低维空间的输入值映射到高维空间进行内积运算,从而实现非线性变换后的线性可分;
S32)、将训练数据集作为模糊孪生支持向量机异常检测模型训练输入数据集;
S33)、设置目标优化函数:
Figure GDA0003956463180000021
其中,C为惩罚系数,ξi为松弛变量,w表示权重,b表示偏置,
Figure GDA0003956463180000022
表示xi对应的模糊孪生支持向量机异常检测模型输出;
S34)、引入拉格朗日函数将目标优化函数转换为对偶问题:
Figure GDA0003956463180000023
Figure GDA0003956463180000024
得到最优解
Figure GDA0003956463180000025
S35)、选择
Figure GDA0003956463180000026
的一个分量
Figure GDA0003956463180000027
满足
Figure GDA0003956463180000028
计算:
Figure GDA0003956463180000029
S36)、得到分类决策函数:
Figure GDA00039564631800000210
S37)、惩罚系数C是求解目标优化函数的前提条件,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C。
进一步的,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C具体步骤为:
S38)、初始化寻优数据集M={(X1,Y1),(X2,Y2),...,(Xi,Yi)},i=1,2,...,L,L代表数据集M的大小,根据训练数据集的大小动态选择;数据集M中的数据(Xi,Yi)包含两个特征,分别是当前位置(Xaxisc,Yaxisc)和历史位置(Xaxis,Yaxis),它们的取值范围是[0,100],初始化最大迭代次数maxgen,maxgen的取值与训练数据集的数据量呈反比;
S39)、将数据集M随机划分为三个子集groupA、groupB、groupC,分别执行本地目标搜索和全局目标搜索;目标搜索行进距离DS=θ*((maxgen-k)/maxgen)α,θ∈[5,10],α∈[2,6],k是当前迭代次数,k=1,2,...,maxgen
S310)、各个子集搜索策略按照如下方式执行:
如果k<maxgen/20,
groupA根据公式(1)执行本地目标搜索:
Figure GDA0003956463180000031
groupB根据公式(2)执行全局目标搜索:
Figure GDA0003956463180000032
groupC根据公式(3)执行全局目标搜索:
Figure GDA0003956463180000033
如果k>=maxgen/20,
groupA根据公式(1)执行本地目标搜索:
Figure GDA0003956463180000034
groupB根据公式(2)执行全局目标搜索:
Figure GDA0003956463180000035
groupC根据公式(4)执行全局目标搜索:
Figure GDA0003956463180000041
RandomValue表示区间[5,20]范围内的随机数;
S311)、计算惩罚系数判定值S:计算数据集M中所有数据点与原点距离D,取距离D的和的倒数为惩罚系数判定值S,惩罚系数C=M*S,M的取值根据C的定义域进行修正,对于数据集M中每一个数据点,都能确定一个当前迭代次数中惩罚系数C,
Figure GDA0003956463180000042
S312)、适应度函数计算:求出由每一个惩罚系数C所建立的异常检测模型的分类准确率accuracyi
适应度函数Function(Si)=accuracyi×η×Si
η是权值;
S313)、惩罚系数确定值计算:
Figure GDA0003956463180000043
根据
Figure GDA0003956463180000044
的最大值找出表现最佳数据点,表现最佳数据点就是惩罚系数确定值;
S314)、表现最佳数据点处理:根据公式(5)计算出当前和历史迭代中表现最佳数据点的惩罚系数确定值和位置,
Figure GDA0003956463180000045
Figure GDA0003956463180000046
分别是当前迭代和历史迭代中表现最佳数据点的惩罚系数确定值;
如果
Figure GDA0003956463180000047
大于
Figure GDA0003956463180000048
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为当前迭代中表现最佳数据点惩罚系数确定值和位置,
如果
Figure GDA0003956463180000049
小于
Figure GDA00039564631800000410
只更新当前迭代中表现最佳数据点的位置,
得到当前迭代和历史迭代表现最佳数据点的惩罚系数确定值以及位置,
Figure GDA00039564631800000411
S315)、为了平衡数据点的全局搜索能力和本地搜索能力,每个数据点位置利用公式(7)更新:
Figure GDA00039564631800000412
此时,(Xaxis,Yaxis)和(Xaxisc,Yaxisc)代表历史迭代和当前迭代表现最佳数据点的位置;
S316)、根据公式(5)计算出每个数据点的惩罚系数确定值,
Figure GDA00039564631800000413
是步骤S315)搜索条件下最佳数据点的惩罚系数确定值,
如果
Figure GDA0003956463180000051
大于
Figure GDA0003956463180000052
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为步骤S315)搜索条件下表现最佳数据点惩罚系数确定值和位置,
如果
Figure GDA0003956463180000053
小于
Figure GDA0003956463180000054
只更新步骤S315)搜索条件下表现最佳数据点的位置;
S317)、选择
Figure GDA0003956463180000055
作为当前迭代次数惩罚系数最终确定值,根据公式(5)的逆运算求出由
Figure GDA0003956463180000056
确定的惩罚系数判定值S,由公式C=M*S求出当前迭代次数中最终确定的惩罚系数C;
S318)异常检测模型的最优惩罚系数:所有迭代寻优执行结束,得到每次迭代确定的惩罚系数C。
进一步的,步骤S2中,利用合成少数类过采样技术对检测数据集进行类不平衡处理,具体步骤为:
S21)、异常数据比例一般低于正常数据,故将异常数据作为少数类,对于异常数据中每一个传感器采集数据x,以欧氏距离为标准计算它到少数类样本集σ中所有样本的距离,得到其K近邻,σ={(xi,yi)|yi=-1},i=1,2,...,n,yi表示对训练数据集人为添加的标签信息,当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据;
S22)、根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个少数类样本x,从其K近邻中随机选择3个样本,假设选择的近邻为xn
S23)、对于每一个随机选出的近邻xn,分别与原样本按照如下的公式构建新的样本:
xnew=x+rand(0,1)*|x-xn|;
S24)、将构建的新的样本添加到训练数据集中。
进一步的,步骤S2中,对检测数据集进行归一化的处理公式为:
Figure GDA0003956463180000057
其中,xi表示原始数据集中的数据,Xi表示归一化处理后的数据,Xi∈[0,1],min是原始数据集中的最小值,max是原始数据集的最大值。
进一步的,步骤S318)中,选择最小的C值作为异常检测模型的最优惩罚系数。
进一步的,步骤S31)中,选取训练数据集数据量的
Figure GDA0003956463180000058
作为寻优数据集M的大小。
进一步的,随机选取归一化后数据集X的2/5构成训练数据集Xtrain,对训练数据集Xtrain人为添加标签信息,Xtrain={(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈Rn,yi∈{+1,-1},i=1,2,...,n,yi为对训练数据集人为添加的标签信息,当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据,数据集X中,剩下3/5的数据作为检测数据集Xtest
进一步的,步骤S31中,选择径向基核函数,
Figure GDA0003956463180000061
τ为核参数。
本发明的有益效果:本发明所述检测方法基于融合理论,融合模糊孪生支持向量机和自适应迭代寻优的无线传感网异常检测系统,主要目的是解决当前无线传感网异常检测效率不高、精度不高、泛化能力较弱的问题。该系统经过测试,展示出强大的检测能力、更高的分类准确率和更广泛的应用场景,其泛化能力较强,可广泛的应用于诸多无线传感网络异常检测环境中,更提高了检测的准确性和高效性。
附图说明
图1为实施例所述方法的流程图;
图2为模糊孪生支持向量机的惩罚系数C迭代寻优的流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的说明。
实施例1
本实施例公开一种无线传感器网异常检测方法,如图1所示,包括以下步骤:
S1:数据采集,无线传感网络监测节点每隔一个固定时间间隔Δt收集一组监测数据,并以无线多跳的方式将其发送给基站,基站将收到原始数据集x;
S2:数据预处理,对原始数据集x进行数值变量的归一化和训练数据集、检测数据集的划分以及数据不平衡的处理;
S3:建立异常检测模型,利用训练数据集构造并求解带凸约束的二次规划问题,构建模糊孪生支持向量机异常检测模型;
S4:异常数据检测,将检测数据集作为模糊孪生支持向量机异常检测模型输入,根据每组数据的标签值判断该数据是否为异常数据。
在步骤S1中,原始数据集x={x1,x2,...,xn},其中xi∈Rn,i=1,2,...,n,xi表示传感器检测到的数据。
在步骤S2中,本方法采用最大-最小值方法对原始数据集x中的每一组数据xi进行归一化处理,公式为:
Figure GDA0003956463180000062
归一化处理后得到数据集X={X1,X2,...,Xn},每组数据Xi∈[0,1],min和max分别是每组监测数据的最小值和最大值。
本实施例中,随机选取数据集X的2/5构成训练数据集Xtrain,对训练数据集Xtrain人为添加标签信息。Xtrain={(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈Rn,yi∈{+1,-1},i=1,2,...,n。yi为对训练数据集人为添加的标签信息,当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据。数据集X中,剩下3/5的数据作为检测数据集Xtest
为了克服样本的不平衡性问题,使用合成少数类过采样技术(SMOTE)进行类不平衡处理。SMOTE算法的基本思想是对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中。所述SMOTE算法包括以下步骤:
S21:异常数据比例一般低于正常数据,故将异常数据作为少数类,对于异常数据中每一个传感器采集数据x,以欧氏距离为标准计算它到少数类样本集σ中所有样本的距离,得到其K近邻。σ={(xi,yi)|yi=-1},i=1,2,...,n,yi表示对训练数据集人为添加的标签信息,当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据;
S22:根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于传感器采集数据x,从其K近邻中随机选择3个样本,假设选择的近邻为xn
S23:对于每一个随机选出的近邻xn,分别与原样本按照如下的公式构建新的样本:
xnew=x+rand(0,1)*|x-xn|,
S24:将构建的新的样本添加到训练数据集Xtrain中。
进一步,在步骤S3中,建立模糊孪生支持向量机异常检测模型包括以下步骤:
S31:为了避免无线传感网数据在低维空间不能线性可分的情况,特此引入核函数K(x,z)将低维空间的输入值映射到高维空间进行内积运算,从而实现非线性变换后的线性可分。本发明选择径向基核函数:
Figure GDA0003956463180000071
τ为核参数。
(1)将训练数据集Xtrain作为模糊孪生支持向量机异常检测模型训练输入数据集。
(2)目标优化函数:
Figure GDA0003956463180000081
Figure GDA0003956463180000082
ξi≥0,i=1,2,...,n,
其中,C为惩罚系数,ξi为松弛变量,w表示权重,b表示偏置,
Figure GDA0003956463180000083
表示xi对应的模糊孪生支持向量机异常检测模型输出;
引入拉格朗日函数将目标优化函数转换为对偶问题:
Figure GDA0003956463180000084
Figure GDA0003956463180000085
得到最优解
Figure GDA0003956463180000086
选择
Figure GDA0003956463180000087
的一个分量
Figure GDA0003956463180000088
满足
Figure GDA0003956463180000089
计算:
Figure GDA00039564631800000810
(4)得到分类决策函数:
Figure GDA00039564631800000811
S32:根据步骤S31可知,惩罚系数C是求解目标优化函数的前提条件,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C包括以下步骤:
S32.1:初始化寻优数据集M={(X1,Y1),(X2,Y2),...,(Xi,Yi)},i=1,2,...,L,L代表数据集M的大小,根据训练数据集的大小动态选择,一般选取训练数据集数据量的
Figure GDA00039564631800000812
数据集M中的数据(Xi,Yi)包含两个特征,分别是当前位置(Xaxisc,Yaxisc)和历史位置(Xaxis,Yaxis),它们的取值范围是[0,100]。初始化最大迭代次数maxgen,maxgen的取值与训练数据集的数据量呈反比。
S32.2:将数据集M随机划分为三个子集groupA、groupB、groupC,分别执行本地目标搜索和全局目标搜索;本地目标搜索是指目标搜索只在本数据集合内执行,全局搜索是指目标搜索在整个空间内执行。目标搜索行进距离DS=θ*((maxgen-k)/maxgen)α,θ∈[5,10],α∈[2,6]。k是当前迭代次数,k=1,2,...,maxgen,本实施例中,maxgen=100。
S32.3:判断当前迭代次数和最大迭代次数的大小关系
如果k<maxgen/20:
groupA根据公式(1)执行本地目标搜索:
Figure GDA0003956463180000091
groupB根据公式(2)执行全局目标搜索:
Figure GDA0003956463180000092
groupC根据公式(3)执行全局目标搜索:
Figure GDA0003956463180000093
如果k>=maxgen/20:
groupA根据公式(1)执行本地目标搜索:
Figure GDA0003956463180000094
groupB根据公式(2)执行全局目标搜索:
Figure GDA0003956463180000095
groupC根据公式(4)执行全局目标搜索:
Figure GDA0003956463180000096
其中RandomValue表示区间[5,20]范围内的随机数;
S32.4:计算数据集M中所有数据点与原点距离D,取距离D的和的倒数为惩罚系数判定值S。惩罚系数C=M*S,M的取值需要根据C的定义域进行修正。本发明取C∈[0,1000],将S的范围限制在[0,100],因此M=10。对于数据集M中每一个数据点,都能确定一个当前迭代次数中惩罚系数C。
Figure GDA0003956463180000101
S32.5:对所有确定的惩罚系数C,回到步骤S31中,将训练数据集作为数据输入,得到分类决策函数,求出由每一个惩罚系数C所建立的异常检测模型的分类准确率accuracyi。根据分类准确率得到适应度函数:
Function(Si)=accuracyi×η×Si
η是权值。
S32.6:根据公式(5)计算出每个数据点的惩罚系数确定值
Figure GDA0003956463180000102
根据
Figure GDA0003956463180000103
的最大值找出表现最佳数据点。
Figure GDA0003956463180000104
S32.7:对于表现最佳的数据点,根据公式(5)计算出当前和历史迭代中表现最佳数据点的惩罚系数确定值和位置,
Figure GDA0003956463180000105
Figure GDA0003956463180000106
分别是当前迭代和历史迭代中表现最佳数据点的惩罚系数确定值。
如果
Figure GDA0003956463180000107
大于
Figure GDA0003956463180000108
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为当前迭代中表现最佳数据点惩罚系数确定值和位置。
如果
Figure GDA0003956463180000109
小于
Figure GDA00039564631800001010
只更新当前迭代中表现最佳数据点的位置。
得到当前迭代和历史迭代表现最佳数据点的惩罚系数确定值以及位置。
Figure GDA00039564631800001011
S32.8:为了平衡数据点的全局搜索能力和本地搜索能力,每个数据点位置利用公式(7)更新:
Figure GDA00039564631800001012
此时,(Xaxis,Yaxis)和(Xaxisc,Yaxisc)代表历史迭代和当前迭代表现最佳数据点的位置。
S32.9:根据公式(5)计算出每个数据点的惩罚系数确定值,
Figure GDA00039564631800001013
是步骤S32.8搜索条件下最佳数据点的惩罚系数确定值。
如果
Figure GDA00039564631800001014
大于
Figure GDA00039564631800001015
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为步骤S32.8搜索条件下表现最佳数据点惩罚系数确定值和位置。
如果
Figure GDA00039564631800001016
小于
Figure GDA00039564631800001017
只更新步骤S32.8搜索条件下表现最佳数据点的位置。
S32.10:选择
Figure GDA0003956463180000111
作为当前迭代次数惩罚系数最终确定值,根据公式(5)的逆运算求出由
Figure GDA0003956463180000112
确定的惩罚系数判定值S,由公式C=M*S求出当前迭代次数中最终确定的惩罚系数C。
S32.11:回到步骤S32.3进行下一次迭代寻优,直到当前迭代次数满足最大迭代次数,终止搜索。此时,得到每次迭代确定的惩罚系数C。根据经验表明,惩罚系数C越大,分类误差往往会越大,因此选择最小的C值作为最终异常检测模型的惩罚系数。将最终确定的惩罚系数C作为返回值,回到步骤S31中,建立异常检测模型。
在步骤S4中,将检测数据集输入到已经建立的模糊孪生支持向量机异常检测模型中,模型输出值为-1的数据即为原始数据集中的异常数据,模型输出值为1的数据即为原始数据集中的正常数据。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

Claims (7)

1.一种无线传感网异常检测方法,其特征在于:包括以下步骤;
S1、传感器监测节点实时汇集来自各个传感器监测的数据,形成原始数据集x={x1,x2,...,xi,...,xn},xi∈Rn,i=1,2,...,n,xi表示传感器采集的数据,并以无线通信的方式进行传输和存储;
S2、对传感器采集到的数据集进行数据预处理,所述数据预处理包括数据归一化处理、类不平衡处理以及训练数据集、检测数据集的划分,归一化处理后的数据集为X={X1,X2,...,Xi,...,Xn};
S3:建立无线传感网异常检测模型,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C,将训练数据集作为数据输入,建立无线传感网异常检测模型;
S4:利用已经建立的无线传感网异常检测模型,将检测数据集作为模型的输入,根据模型的输出结果,判断检测数据集中正常数据和异常数据,完成无线传感网异常数据检测;无线传感网异常检测模型为模糊孪生支持向量机异常检测模型,建立该模型的步骤为:
S31)、为了避免无线传感网数据在低维空间不能线性可分的情况,引入核函数K(x,z)将低维空间的输入值映射到高维空间进行内积运算,从而实现非线性变换后的线性可分;
S32)、将训练数据集作为模糊孪生支持向量机异常检测模型训练输入数据集;
S33)、设置目标优化函数:
Figure FDA0003956463170000011
其中,C为惩罚系数,ξi为松弛变量,w表示权重,b表示偏置,
Figure FDA0003956463170000012
表示xi对应的模糊孪生支持向量机异常检测模型输出;
S34)、引入拉格朗日函数将目标优化函数转换为对偶问题:
Figure FDA0003956463170000013
Figure FDA0003956463170000014
得到最优解
Figure FDA0003956463170000015
S35)、选择
Figure FDA0003956463170000016
的一个分量
Figure FDA0003956463170000017
满足
Figure FDA0003956463170000018
计算:
Figure FDA0003956463170000019
S36)、得到分类决策函数:
Figure FDA00039564631700000110
S37)、惩罚系数C是求解目标优化函数的前提条件,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C;利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C具体步骤为:
S38)、初始化寻优数据集M={(X1,Y1),(X2,Y2),...,(Xi,Yi)},i=1,2,...,L,其中L代表数据集M的大小,根据训练数据集的大小动态选择;数据集M中的数据(Xi,Yi)包含两个特征,分别是当前位置(Xaxisc,Yaxisc)和历史位置(Xaxis,Yaxis),它们的取值范围是[0,100],初始化最大迭代次数maxgen,maxgen的取值与训练数据集的数据量呈反比;
S39)、将数据集M随机划分为三个子集groupA、groupB、groupC,分别执行本地目标搜索和全局目标搜索;目标搜索行进距离DS=θ*((maxgen-k)/maxgen)α,θ∈[5,10],α∈[2,6],k是当前迭代次数,k=1,2,...,maxgen
S310)、各个子集搜索策略按照如下方式执行:
如果k<maxgen/20,
groupA根据公式(1)执行本地目标搜索:
Figure FDA0003956463170000021
groupB根据公式(2)执行全局目标搜索:
Figure FDA0003956463170000022
groupC根据公式(3)执行全局目标搜索:
Figure FDA0003956463170000023
如果k>=maxgen/20,
groupA根据公式(1)执行本地目标搜索:
Figure FDA0003956463170000024
groupB根据公式(2)执行全局目标搜索:
Figure FDA0003956463170000031
groupC根据公式(4)执行全局目标搜索:
Figure FDA0003956463170000032
RandomValue表示区间[5,20]范围内的随机数;
S311)、计算惩罚系数判定值S:计算数据集M中所有数据点与原点距离D,取距离D的和的倒数为惩罚系数判定值S,惩罚系数C=M*S,M的取值根据C的定义域进行修正,对于数据集M中每一个数据点,都能确定一个当前迭代次数中惩罚系数C,
Figure FDA0003956463170000033
S312)、适应度函数计算:求出由每一个惩罚系数C所建立的异常检测模型的分类准确率accuracyi,
适应度函数Function(Si)=accuracyi×η×Si
η是权值;
S313)、惩罚系数确定值计算:
Figure FDA0003956463170000034
根据
Figure FDA0003956463170000035
的最大值找出表现最佳数据点,表现最佳数据点就是惩罚系数确定值;
S314)、表现最佳数据点处理:根据公式(5)计算出当前和历史迭代中表现最佳数据点的惩罚系数确定值和位置,
Figure FDA0003956463170000036
Figure FDA0003956463170000037
分别是当前迭代和历史迭代中表现最佳数据点的惩罚系数确定值;
如果
Figure FDA0003956463170000038
大于
Figure FDA0003956463170000039
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为当前迭代中表现最佳数据点惩罚系数确定值和位置,
如果
Figure FDA00039564631700000310
小于
Figure FDA00039564631700000311
只更新当前迭代中表现最佳数据点的位置,
得到当前迭代和历史迭代表现最佳数据点的惩罚系数确定值以及位置,
Figure FDA00039564631700000312
S315)、为了平衡数据点的全局搜索能力和本地搜索能力,每个数据点位置利用公式(7)更新:
Figure FDA0003956463170000041
此时,(Xaxis,Yaxis)和(Xaxisc,Yaxisc)代表历史迭代和当前迭代表现最佳数据点的位置;
S316)、根据公式(5)计算出每个数据点的惩罚系数确定值,
Figure FDA0003956463170000042
是步骤S315)搜索条件下最佳数据点的惩罚系数确定值,
如果
Figure FDA0003956463170000043
大于
Figure FDA0003956463170000044
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为步骤S315)搜索条件下表现最佳数据点惩罚系数确定值和位置,
如果
Figure FDA0003956463170000045
小于
Figure FDA0003956463170000046
只更新步骤S315)搜索条件下表现最佳数据点的位置;
S317)、选择
Figure FDA0003956463170000047
作为当前迭代次数惩罚系数最终确定值,根据公式(5)的逆运算求出由
Figure FDA0003956463170000048
确定的惩罚系数判定值S,由公式C=M*S求出当前迭代次数中最终确定的惩罚系数C;
S318)异常检测模型的最优惩罚系数:所有迭代寻优执行结束,得到每次迭代确定的惩罚系数C。
2.根据权利要求1所述的无线传感网异常检测方法,其特征在于:步骤S2中,利用合成少数类过采样技术对检测数据集进行类不平衡处理,具体步骤为:
S21)、异常数据比例低于正常数据,故将异常数据作为少数类,对于异常数据中每一个传感器采集数据x,以欧氏距离为标准计算它到少数类样本集σ中所有样本的距离,得到其K近邻,σ={(xi,yi)|yi=-1},i=1,2,...,n,yi表示对训练数据集人为添加的标签信息,当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据;
S22)、根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于传感器采集数据x,从其K近邻中随机选择3个样本,假设选择的近邻为xn
S23)、对于每一个随机选出的近邻xn,分别与原样本按照如下的公式构建新的样本:
xnew=x+rand(0,1)*|x-xn|;
S24)、将构建的新的样本添加到训练数据集中。
3.根据权利要求1所述的无线传感网异常检测方法,其特征在于:步骤S2中,对检测数据集进行归一化的处理公式为:
Figure FDA0003956463170000049
其中,xi表示原始数据集中的数据,Xi表示归一化处理后的数据,Xi∈[0,1],min是原始数据集中的最小值,max是原始数据集的最大值。
4.根据权利要求1所述的无线传感网异常检测方法,其特征在于:步骤S318)中,选择最小的C值作为异常检测模型的最优惩罚系数。
5.根据权利要求1所述的无线传感网异常检测方法,其特征在于:步骤S31)中,选取训练数据集数据量的
Figure FDA0003956463170000051
作为寻优数据集M的大小。
6.根据权利要求1所述的无线传感网异常检测方法,其特征在于:随机选取归一化后数据集X的2/5构成训练数据集Xtrain,对训练数据集Xtrain人为添加标签信息,Xtrain={(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈Rn,yi∈{+1,-1},i=1,2,...,n,yi为对训练数据集人为添加的标签信息,当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据,数据集X中,剩下3/5的数据作为检测数据集Xtest
7.根据权利要求1所述的无线传感网异常检测方法,其特征在于:步骤S31中,选择径向基核函数,
Figure FDA0003956463170000052
τ为核参数。
CN202010497988.2A 2020-06-03 2020-06-03 一种无线传感网异常检测方法 Active CN111654874B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010497988.2A CN111654874B (zh) 2020-06-03 2020-06-03 一种无线传感网异常检测方法
PCT/CN2020/108778 WO2021243848A1 (zh) 2020-06-03 2020-08-13 一种无线传感网异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010497988.2A CN111654874B (zh) 2020-06-03 2020-06-03 一种无线传感网异常检测方法

Publications (2)

Publication Number Publication Date
CN111654874A CN111654874A (zh) 2020-09-11
CN111654874B true CN111654874B (zh) 2023-02-24

Family

ID=72348442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010497988.2A Active CN111654874B (zh) 2020-06-03 2020-06-03 一种无线传感网异常检测方法

Country Status (2)

Country Link
CN (1) CN111654874B (zh)
WO (1) WO2021243848A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112421772B (zh) * 2020-10-23 2022-05-13 国网福建省电力有限公司 多跳d2d组网下数据驱动的配电网在线异常检测装置及方法
CN113364652B (zh) * 2021-06-30 2023-07-25 脸萌有限公司 网卡流量测试方法、装置、网络设备、系统及可读介质
CN113420825A (zh) * 2021-07-07 2021-09-21 国能龙源蓝天节能技术有限公司 一种基于支持向量机的异常数据检测方法及电子设备
CN113992718B (zh) * 2021-10-28 2022-10-04 安徽农业大学 一种基于动态宽度图神经网络的群体传感器异常数据检测方法和系统
CN114219157B (zh) * 2021-12-17 2023-10-17 西南石油大学 一种基于最优决策和动态分析的烷烃气体红外光谱测量方法
CN114240913B (zh) * 2021-12-21 2024-07-02 歌尔股份有限公司 半导体的异常分析方法、装置、终端设备以及存储介质
CN114354654B (zh) * 2022-01-07 2023-03-21 中国矿业大学 基于dw-knn的煤炭水分含量快速无损检测方法
CN114637620B (zh) * 2022-03-10 2024-04-16 南京开特信息科技有限公司 一种基于svm算法的数据库系统异常分类预测方法
CN115019510B (zh) * 2022-06-29 2024-01-30 华南理工大学 一种基于动态自适应生成对抗网络的交通数据修复方法
CN114969669B (zh) * 2022-07-27 2022-11-15 深圳前海环融联易信息科技服务有限公司 数据平衡度处理方法、联合建模系统、设备和介质
CN115766607B (zh) * 2022-11-08 2024-09-17 陕西通信规划设计研究院有限公司 一种基于5g物联网的数据压缩传输方法
CN116436819B (zh) * 2023-02-22 2024-06-21 深圳市昆腾电源科技有限公司 并机ups通信异常检测方法、装置及并机ups系统
CN116723034B (zh) * 2023-07-03 2024-05-28 深圳市奥晏科技发展有限公司 一种用于互联网信息安全的智能数据监测系统及方法
CN117100293B (zh) * 2023-10-25 2024-02-06 武汉理工大学 一种基于多维特征融合网络的肌肉疲劳检测方法和系统
CN117332359B (zh) * 2023-12-01 2024-02-09 国网江苏省电力有限公司南通供电分公司 一种电力数据传输异常检测方法及系统
CN118054552B (zh) * 2024-01-19 2024-09-13 淮阴工学院 一种配电室状态智能监测方法与报警系统
CN118115822B (zh) * 2024-04-29 2024-07-02 江西师范大学 一种基于图像块特征级联检索模型的异常检测方法及系统
CN118316753B (zh) * 2024-05-08 2024-09-17 江苏省产品质量监督检验研究院 一种智能家居在真实电磁环境下无线性能的测试方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791051A (zh) * 2016-03-25 2016-07-20 中国地质大学(武汉) 基于人工免疫和k均值聚类的无线传感网异常检测方法及系统
WO2018126984A2 (zh) * 2017-01-06 2018-07-12 江南大学 一种基于mea-bp神经网络wsn异常检测方法
CN108876001A (zh) * 2018-05-03 2018-11-23 东北大学 一种基于孪生支持向量机的短期电力负荷预测方法
CN109816119A (zh) * 2019-02-02 2019-05-28 南京邮电大学 一种基于无监督学习的无线传感器异常数据检测方法
CN110072205A (zh) * 2019-03-25 2019-07-30 南京邮电大学 一种用于无线传感网异常数据检测的分层聚合方法
CN110287896A (zh) * 2019-06-27 2019-09-27 北京理工大学 一种基于异质分层pso和svm的人体行为识别方法
CN110309886A (zh) * 2019-07-08 2019-10-08 安徽农业大学 基于深度学习的无线传感器高维数据实时异常检测方法
CN110516733A (zh) * 2019-08-23 2019-11-29 西南石油大学 一种基于改进多分类孪生支持向量机的测井岩性识别方法
CN110568127A (zh) * 2019-09-09 2019-12-13 北京工业大学 一种基于时域加权的空气污染物浓度监测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106482967B (zh) * 2016-10-09 2019-10-29 湖南工业大学 一种代价敏感支持向量机机车车轮检测系统及方法
CN109143848A (zh) * 2017-06-27 2019-01-04 中国科学院沈阳自动化研究所 基于fcm-gasvm的工业控制系统入侵检测方法
CN107379899B (zh) * 2017-07-07 2018-06-29 淮阴工学院 一种基于无线传感器网络的轮胎状态智能监测系统
CN108052968B (zh) * 2017-12-08 2021-11-12 哈尔滨工程大学 一种qsfla-svm的感知入侵检测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791051A (zh) * 2016-03-25 2016-07-20 中国地质大学(武汉) 基于人工免疫和k均值聚类的无线传感网异常检测方法及系统
WO2018126984A2 (zh) * 2017-01-06 2018-07-12 江南大学 一种基于mea-bp神经网络wsn异常检测方法
CN108876001A (zh) * 2018-05-03 2018-11-23 东北大学 一种基于孪生支持向量机的短期电力负荷预测方法
CN109816119A (zh) * 2019-02-02 2019-05-28 南京邮电大学 一种基于无监督学习的无线传感器异常数据检测方法
CN110072205A (zh) * 2019-03-25 2019-07-30 南京邮电大学 一种用于无线传感网异常数据检测的分层聚合方法
CN110287896A (zh) * 2019-06-27 2019-09-27 北京理工大学 一种基于异质分层pso和svm的人体行为识别方法
CN110309886A (zh) * 2019-07-08 2019-10-08 安徽农业大学 基于深度学习的无线传感器高维数据实时异常检测方法
CN110516733A (zh) * 2019-08-23 2019-11-29 西南石油大学 一种基于改进多分类孪生支持向量机的测井岩性识别方法
CN110568127A (zh) * 2019-09-09 2019-12-13 北京工业大学 一种基于时域加权的空气污染物浓度监测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
双重支持向量机的改进及其应用;姜鹏飞;《中国优秀硕士学位论文全文数据库》;20200331;第2节预备知识、第3节改进的双重支持向量机 *

Also Published As

Publication number Publication date
WO2021243848A1 (zh) 2021-12-09
CN111654874A (zh) 2020-09-11

Similar Documents

Publication Publication Date Title
CN111654874B (zh) 一种无线传感网异常检测方法
CN116186634B (zh) 一种建筑工程施工数据智能管理系统
CN109034177B (zh) 一种移动智能终端室内外识别方法
KR20210090394A (ko) 머신러닝을 이용한 지능형 스마트팜 운영 시스템
CN110119767A (zh) 一种基于lvq神经网络的黄瓜温室温度智能化检测装置
CN117332283B (zh) 一种中药材生长信息采集分析方法及系统
CN113435707A (zh) 基于深度学习和计权型多因子评价的测土配方施肥方法
CN110083190A (zh) 一种基于减法聚类分类器的青椒温室环境智能监测系统
CN117495205B (zh) 一种工业互联网实验系统及方法
CN117322214A (zh) 一种基于神经网络的农作物肥料精准施用方法与系统
CN110427063A (zh) 一种基于物联网的番茄生长监控管理平台
CN110020712A (zh) 一种基于聚类的优化粒子群bp网络预测方法和系统
CN112947642A (zh) 一种果蔬仓库多变量控制系统及方法
Lu et al. Image classification and identification for rice leaf diseases based on improved WOACW_SimpleNet
CN117992894A (zh) 基于物联网的农业大棚环境异常数据监测方法
CN111737294A (zh) 一种基于动态增量集成模糊的数据流分类方法
Laktionov et al. An explainable AI approach to agrotechnical monitoring and crop diseases prediction in Dnipro region of Ukraine
CN110097473A (zh) 一种农作物生命全周期的数据采集方法、装置及设备
Indumathi et al. Prediction and analysis of plant growth promoting bacteria using machine learning for millet crops
CN115619605A (zh) 一种基于语义信息的传统民居环境质量评估方法
CN117278991A (zh) 一种基于信任分布式集员滤波的目标跟踪方法及相关装置
CN111488520A (zh) 一种农作物种植种类推荐信息处理装置、方法及存储介质
Swetha et al. Advanced Soil Fertility Analysis and Crop Recommendation using Machine Learning
CN115855133A (zh) 传感器的校准方法、装置、计算机设备和可读存储介质
Tipwong et al. A novel determination of an appropriate clustering quantity of a water-soluble NPK nutrient measuring system based on K-means and SOM methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20200911

Assignee: SHANDONG ZHENGKAI NEW MATERIALS CO.,LTD.

Assignor: ZAOZHUANG University

Contract record no.: X2024980014476

Denomination of invention: A wireless sensor network anomaly detection method

Granted publication date: 20230224

License type: Common License

Record date: 20240912