CN111709299B - 一种基于加权支持向量机的水声目标识别方法 - Google Patents

一种基于加权支持向量机的水声目标识别方法 Download PDF

Info

Publication number
CN111709299B
CN111709299B CN202010427316.4A CN202010427316A CN111709299B CN 111709299 B CN111709299 B CN 111709299B CN 202010427316 A CN202010427316 A CN 202010427316A CN 111709299 B CN111709299 B CN 111709299B
Authority
CN
China
Prior art keywords
samples
sample
support vector
recognition
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010427316.4A
Other languages
English (en)
Other versions
CN111709299A (zh
Inventor
齐滨
梁国龙
付进
孙金
王燕
王逸林
张光普
王晋晋
邹男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202010427316.4A priority Critical patent/CN111709299B/zh
Publication of CN111709299A publication Critical patent/CN111709299A/zh
Application granted granted Critical
Publication of CN111709299B publication Critical patent/CN111709299B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H17/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves, not provided for in the preceding groups
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/52Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S15/00
    • G01S7/539Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S15/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种基于加权支持向量机的水声目标识别方法,所述方法包括分帧预处理、特征提取、搭建加权支持向量机识别模型、利用网格搜索法寻找最优核函数参数及惩罚因子、加权支持向量机识别模型进行训练、通过混淆矩阵反映分类器对水声目标的识别结果和统计分类器的识别正确率步骤。本发明针对水声目标特性,选取合适的特征提取方法,具备自主挑选模型参数的能力,对水声目标的正确识别率在80%以上,分类器的稳定性高于现有分类方法。

Description

一种基于加权支持向量机的水声目标识别方法
技术领域
本发明属于水声目标识别技术领域,特别是涉及一种基于加权支持向量机的水声目标识别方法。
背景技术
随着声纳技术、信号检测与估计、计算机处理等技术的进步,水声目标识别技术已经发展成为一门具有独立体系的学科。该研究从目标特性分析、目标特征提取和目标识别分类器选择与设计三个方向出发,探究水下目标的分类识别问题。随着现代水声信号处理技术的发展,各类分类器不断被应用至水声目标识别系统中,使得水下目标识别技术向着智能化、自主化的趋势得到飞跃的发展。目前应用在水声目标识别问题中的决策分类方法主要有以下四种:1.遗传算法,通过模拟生物进化过程中的基因遗传和突变原理,寻找最优种群结构的智能优化算法。2.神经网络方法,模拟人脑处理运算方式,以神经元为基点建立非线性网络,能自主的进行学习训练,自适应调节分类网络结构实现对样本的分类预测。3.模糊识别方法,利用模糊集理论中最大隶属度原则或临近原则对样本类别进行判决。4.统计学习分类方法,通过对大量样本的统计分析,获取不同类别目标统计分布特征之间的差异,对测试集样本的统计分布特征进行距离度量,实现类别模式之间的匹配。
然而,水声目标工况多变、海洋环境信道复杂以及样本数据难以获取等因素为水声目标识别带来了极大的挑战。由于神经网络是基于机器学习的经验风险最小化准则,在训练样本数目不足时可能引起“过学习”或“欠学习”问题,严重影响分类性能。而模糊识别方法主要依靠人的主观因素,不具有自主学习能力,不适用于复杂分类系统。基于统计学习的支持向量机分类器利用结构风险最小化准则解决了小样本、非线性的分类问题,有效的避免了样本有限、维度灾难、过学习以及局部最小值等问题,在水声目标识别中有重要的应用价值。
发明内容
本发明目的是为了解决由水声目标工况多变、海洋环境信道复杂以及样本数据难以获取等因素引起的目标分类器鲁棒性不强、识别效率低的问题,提出了一种基于加权支持向量机的水声目标识别方法。
本发明是通过以下技术方案实现的,本发明提出一种基于加权支持向量机的水声目标识别方法,具体包括以下步骤:
步骤一:对获取的N类水声目标样本数据,进行分帧预处理;其中N大于等于2;
步骤二:根据步骤一得到的预处理样本,利用谱分析特征提取方法获得各类样本的特征向量,作为分类器特征样本库;
步骤三:将水声目标特征样本两两组合生成
Figure BDA0002499180880000021
个二元目标分类对,添加类别标签,把N元分类问题转化为
Figure BDA0002499180880000022
个二元分类问题,搭建
Figure BDA0002499180880000023
个加权支持向量机识别模型,选取高斯径向基核函数作为内积函数;
步骤四:根据步骤三中生成的二元目标分类对,分别设定加权支持向量机识别模型的核函数参数及惩罚因子参选范围,选择各类目标40%的特征样本作为参选训练数据,以k折交叉验证方法作为分类器识别性能评价标准,设置步长,利用网格搜索法寻找最优核函数参数及惩罚因子;
步骤五:根据步骤四中获得的最优核函数参数及惩罚因子,选取各类目标70%的特征样本输入到对应的加权支持向量机识别模型进行训练,所述各类目标70%的特征样本中包含步骤四中的参选训练数据;
步骤六:根据步骤五中获得训练完成的二元水声目标识别分类器,令未参加训练的30%特征样本数据作为测试样本,同时输入到
Figure BDA0002499180880000024
个分类器中进行识别,利用一对一举手准则判定水声目标所属类别,通过混淆矩阵反映分类器对水声目标的识别结果;
步骤七:统计分类器的识别正确率,评价分类器性能,当识别正确率低于设定阈值时,返回步骤四,提高参选样本数量,重新选择模型参数。
进一步地,在步骤一中,对水声目标样本数据进行分帧,也就是将信号样本分割成一段一段的帧序列,分帧之后,每一帧的长度称为“帧长”,帧序列的数目称为“帧数”,以每一帧数据作为一个样本。
进一步地,在步骤二中,根据步骤一中获得的预处理样本,对每一帧样本数据进行谱分析提取特征,提取的特征包括:
利用LOFAR谱分析获得水声目标信号的频域线谱特征;
利用DEMON谱分析获得水声目标信号调制谱的基频特征;
利用高阶谱分析抑制水声目标信号中的高斯噪声,获得信号中非线性耦合特征;
利用小波变换分析获得水声目标信号中的能量尺度变化特征;
将谱分析获得的特征值重组降维,归一化处理后,获得的特征向量称之为水声目标的特征样本,建立分类器特征样本库。
进一步地,所述步骤三具体为:
当特征样本库中目标个数N>2时,对应的训练样本集为{x1,x2,...,xN};将样本集中按样本类别两两组成训练样本集,即训练样本集Ti-j(xi,xj)满足(i,j)∈{(i,j)|i>j,i,j=1,2,...,N};将标号为i的训练样本标记为正类点,标号为j的样本标记为负类点,形成
Figure BDA0002499180880000031
个二元目标样本对,把N元分类问题转化为
Figure BDA0002499180880000032
个二元分类问题,由此搭建
Figure BDA0002499180880000033
个加权支持向量机识别模型;
假设训练样本数据集
Figure BDA0002499180880000034
yi∈Y={-1,1},i=1,2,...,n,能够被一个高维空间中的超平面(w·x)+b=0分开,式中
Figure BDA0002499180880000035
b∈R,使对应yi=+1的样本和yi=-1的样本分布在超平面两侧,将距超平面最近的样本点称为支持向量,搜寻最优超平面的核心思想是使超平面到支持向量之间的距离最大,因此将问题转化为一个凸二次规划问题:
Figure BDA0002499180880000036
对于分类样本而言,存在部分样本线性不可分情况,即无法满足条件找到最优分类超平面,故式(1)中引入惩罚因子C和松弛变量ξ来降低yi[(w·xi)+b]≥1的约束;
支持向量机识别模型的最优分类超平面是依靠支持向量的位置确定的,与非支持向量无关,将分布在间隔面与超平面之间以及超平面一侧的支持向量称为边界支持向量,则类别中边界支持向量的比例越大样本被错分的比例也越大;从概率论的角度分类标号为-1的边界支持向量与标号为+1的边界支持向量出现的概率相同,如果正类样本数与负类样本数不相等,则表现为训练样本数少的类别边界支持向量比例大于训练样本数多的类别事件发生的概率大,即样本数少的类别中被错分的比例更大,因此引入对类别加权方法,将原始凸二次规划问题转化为:
Figure BDA0002499180880000037
式中:
Figure BDA0002499180880000038
是类yi的权值,当
Figure BDA0002499180880000039
时加权支持向量机与支持向量机完全相同,
Figure BDA00024991808800000310
的大小取决于两类样本数目的差异,由此获得加权后的拉格朗日表达式为:
Figure BDA0002499180880000041
其中,α表示拉格朗日乘子;i=1,2,...,n;j=1,2,...,n;
决策函数为:
Figure BDA0002499180880000042
选择高斯径向基核函数作为内积函数,所述内积函数表达式为:
Figure BDA0002499180880000043
其中σ表示高斯径向基核函数参数。
进一步地,所述网格搜索法寻找最优核函数参数及惩罚因子,具体为:
步骤1、首先根据经验确定惩罚因子C以及核函数参数σ的搜索范围;
步骤2、其次选择适合的步长,建立搜索网格(C,σ);
步骤3、基于每一个网格上的参数点训练加权支持向量机识别模型,以k折交叉验证的结果作为该参数点下分类器的识别精度;
步骤4、遍历全部网格后,选择使加权支持向量机识别模型对测试样本识别精度最高的参数。
进一步地,在步骤五中,选择各类目标70%的特征样本作为训练样本,分别对
Figure BDA0002499180880000044
个加权支持向量机识别模型进行训练,得到
Figure BDA0002499180880000045
个对应二元目标样本对的水声目标分类识别模型。
进一步地,在步骤六中,将剩余30%的特征样本作为测试样本,同时输入到
Figure BDA0002499180880000046
个分类器中进行识别,每一个测试样本对应
Figure BDA0002499180880000047
个分类器决策函数为:
Figure BDA0002499180880000048
对于输入样本x,建立用于表决判别意见的判别函数:
Figure BDA0002499180880000049
遍历所有的训练样本集获得
Figure BDA00024991808800000410
个判别函数,在对输入样本x进行识别时需考虑所有二元分类器的意见,通过投票的方式判定x所属类别,即当x输入至第i-j个分类器时,若判别函数si-j(x)=i则在类别i上记票数加一,反之在类别j上记票数加一,最终获得票数最多的类别即为预测目标类别,最后以混淆矩阵的形式输出识别结果。
进一步地,在步骤七中,将混淆矩阵中分类正确的样本数占总样本数的比例称为识别正确率,作为识别评价标准;所述阈值取值为80%。
本发明的有益效果为:
(1)相比于机器学习方法,本发明方法避免了因数据不足引起的过拟合问题,能够有效地应对水声目标样本数据难以获取的问题。
(2)相比于原始支持向量机方法,本发明利用类别加权系数,有效的提高了识别目标样本数据不均衡条件下的正确识别率,在水声目标识别领域有重要的应用价值。
(3)本发明针对水声目标特性,选取合适的特征提取方法,具备自主挑选模型参数的能力,对水声目标的正确识别率在80%以上,分类器的稳定性高于现有分类方法。
附图说明
图1是基于加权支持向量机的水声目标识别方法流程图。
图2是加权支持向量机基本原理图。
图3是二元加权支持向量机识别混淆矩阵。
图4是多目标识别问题中一对一举手投票准则的基本示意图。
图5是四元加权支持向量机识别混淆矩阵。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
结合图1,本发明提出一种基于加权支持向量机的水声目标识别方法,具体包括以下步骤:
步骤一:对获取的N类水声目标样本数据,进行分帧预处理;其中N大于等于2;
在步骤一中,对水声目标样本数据进行分帧,也就是将信号样本分割成一段一段的帧序列,一般称这种处理方法为分帧处理,分帧之后,每一帧的长度称为“帧长”,帧序列的数目称为“帧数”,以每一帧数据作为一个样本。
步骤二:根据步骤一得到的预处理样本,利用谱分析特征提取方法获得各类样本的特征向量,作为分类器特征样本库;
在步骤二中,根据步骤一中获得的预处理样本,对每一帧样本数据进行谱分析提取特征,提取的特征包括:
利用LOFAR谱分析获得水声目标信号的频域线谱特征;
利用DEMON谱分析获得水声目标信号调制谱的基频特征;
利用高阶谱分析抑制水声目标信号中的高斯噪声,获得信号中非线性耦合特征;
利用小波变换分析获得水声目标信号中的能量尺度变化特征;
将谱分析获得的特征值重组降维,归一化处理后,获得的特征向量称之为水声目标的特征样本,建立分类器特征样本库。
步骤三:将水声目标特征样本两两组合生成
Figure BDA0002499180880000061
个二元目标分类对,添加类别标签,把N元分类问题转化为
Figure BDA0002499180880000062
个二元分类问题,搭建
Figure BDA0002499180880000063
个加权支持向量机识别模型,选取高斯径向基核函数作为内积函数;
在模式识别问题中,存在观测数据在原始样本空间中线性不可分情况,支持向量机的基本思想是将样本点变换至高维空间的线性可分样本,再寻找最优分类超平面将样本分开。然而水声目标独特的环境因素导致样本数据难以获得且数目不均衡,由此建立加权支持向量机分类识别模型,解决小样本、样本数目不均衡的水声目标识别问题。然而支持向量机仅适用于二元分类问题,当特征样本库中目标个数N>2时,对应的训练样本集为{x1,x2,...,xN};将样本集中按样本类别两两组成训练样本集,即训练样本集Ti-j(xi,xj)满足(i,j)∈{(i,j)|i>j,i,j=1,2,...,N};将标号为i的训练样本标记为正类点,标号为j的样本标记为负类点,形成
Figure BDA0002499180880000064
个二元目标样本对,把N元分类问题转化为
Figure BDA0002499180880000065
个二元分类问题,由此搭建
Figure BDA0002499180880000066
个加权支持向量机识别模型;
假设训练样本数据集
Figure BDA0002499180880000067
yi∈Y={-1,1},i=1,2,...,n,能够被一个高维空间中的超平面(w·x)+b=0分开,式中
Figure BDA0002499180880000068
b∈R,使对应yi=+1的样本和yi=-1的样本分布在超平面两侧,将距超平面最近的样本点称为支持向量,搜寻最优超平面的核心思想是使超平面到支持向量之间的距离最大,因此将问题转化为一个凸二次规划问题:
Figure BDA0002499180880000071
对于分类样本而言,存在部分样本线性不可分情况,即无法满足条件找到最优分类超平面,故式(1)中引入惩罚因子C和松弛变量ξ来降低yi[(w·xi)+b]≥1的约束;
支持向量机识别模型的最优分类超平面是依靠支持向量的位置确定的,与非支持向量无关,将分布在间隔面与超平面之间以及超平面一侧的支持向量称为边界支持向量,则类别中边界支持向量的比例越大样本被错分的比例也越大;从概率论的角度分类标号为-1的边界支持向量与标号为+1的边界支持向量出现的概率相同,如果正类样本数与负类样本数不相等,则表现为训练样本数少的类别边界支持向量比例大于训练样本数多的类别事件发生的概率大,即样本数少的类别中被错分的比例更大,因此引入对类别加权方法,将原始凸二次规划问题转化为:
Figure BDA0002499180880000072
式中:
Figure BDA0002499180880000073
是类yi的权值,其余各项与支持向量机相同,即当
Figure BDA0002499180880000074
时加权支持向量机与支持向量机完全相同,
Figure BDA0002499180880000075
的大小取决于两类样本数目的差异,由此获得加权后的拉格朗日表达式为:
Figure BDA0002499180880000076
其中,α表示拉格朗日乘子;i=1,2,...,n;j=1,2,...,n;
决策函数为:
Figure BDA0002499180880000077
选择具有良好局部性质的高斯径向基核函数作为内积函数,所述内积函数表达式为:
Figure BDA0002499180880000078
其中σ表示高斯径向基核函数参数。
步骤四:根据步骤三中生成的二元目标分类对,分别设定加权支持向量机识别模型的核函数参数及惩罚因子参选范围,选择各类目标40%的特征样本作为参选训练数据,以k折交叉验证方法作为分类器识别性能评价标准,设置步长,利用网格搜索法寻找最优核函数参数及惩罚因子;
根据步骤三中获得的加权支持向量机识别模型,惩罚因子C的作用是用来约束最小化目标函数
Figure BDA0002499180880000081
满足最大间隔||w||2最小化和划分容忍度
Figure BDA0002499180880000082
最小化二者之间的关系,而高斯径向基核函数参数σ则反映了核函数的内推能力大小。由此,挑选训练样本中40%的数据作为参选数据,用来确定在该目标样本数据下最合适的模型参数,利用网格搜索法进行选参。
所述网格搜索法寻找最优核函数参数及惩罚因子,具体为:
步骤1、首先根据经验确定惩罚因子C以及核函数参数σ的搜索范围;
步骤2、其次选择适合的步长,建立搜索网格(C,σ);
步骤3、基于每一个网格上的参数点训练加权支持向量机识别模型,以k折交叉验证的结果作为该参数点下分类器的识别精度;
步骤4、遍历全部网格后,选择使加权支持向量机识别模型对测试样本识别精度最高的参数。
其中,k折交叉验证的基本算法思路如下:首先将n个观测样本均匀随机的分为k个互不交叉的子集,组成样本集S1,S2,...,Sk;其次进行k次机器学习算法的训练学习和测试,以第i次机器学习算法迭代为例:将Si作为测试样本,其余k-i个样本集作为训练样本输入机器学习算法获得最优决策函数fi,利用fi对测试样本Si进行识别预测。将正确的分类次数记为ti,机器学习的分类精度为:
Figure BDA0002499180880000083
则经过k次迭代运算后获得的正确识别次数为t1,t2,...,tk,机器学习平均分类精度为:
Figure BDA0002499180880000084
将平均分类精度作为该机器学习算法的优劣评价标准,值得一提的是机器学习算法的平均分类精度仅表示分类器性能,与某次测试训练识别结果无关。
步骤五:根据步骤四中获得的最优核函数参数及惩罚因子,选取各类目标70%的特征样本输入到对应的加权支持向量机识别模型进行训练,所述各类目标70%的特征样本中包含步骤四中的参选训练数据;
在步骤五中,选择各类目标70%的特征样本作为训练样本,分别对
Figure BDA0002499180880000091
个加权支持向量机识别模型进行训练,得到
Figure BDA0002499180880000092
个对应二元目标样本对的水声目标分类识别模型。
步骤六:根据步骤五中获得训练完成的二元水声目标识别分类器,令未参加训练的30%特征样本数据作为测试样本,同时输入到
Figure BDA0002499180880000093
个分类器中进行识别,利用一对一举手准则判定水声目标所属类别,通过混淆矩阵反映分类器对水声目标的识别结果;
在步骤六中,将剩余30%的特征样本作为测试样本,同时输入到
Figure BDA0002499180880000094
个分类器中进行识别,每一个测试样本对应
Figure BDA0002499180880000095
个分类器决策函数为:
Figure BDA0002499180880000096
对于输入样本x,建立用于表决判别意见的判别函数:
Figure BDA0002499180880000097
遍历所有的训练样本集获得
Figure BDA0002499180880000098
个判别函数,在对输入样本x进行识别时需考虑所有二元分类器的意见,通过投票的方式判定x所属类别,即当x输入至第i-j个分类器时,若判别函数si-j(x)=i则在类别i上记票数加一,反之在类别j上记票数加一,最终获得票数最多的类别即为预测目标类别,最后以混淆矩阵的形式输出识别结果。
步骤七:统计分类器的识别正确率,评价分类器性能,当识别正确率低于设定阈值时,返回步骤四,提高参选样本数量,重新选择模型参数。
在步骤七中,将混淆矩阵中分类正确的样本数占总样本数的比例称为识别正确率,作为识别评价标准;另设定一个阈值(例如80%),当识别正确率低于阈值时,返回步骤四,提高参选样本数据的数据量,重新选取适合的模型参数。
实施例
步骤1、对于一个二元水声目标识别问题,现有A类目标为一段时长600s的货船辐射噪声数据,B类目标为一段时长900s的摩托艇辐射噪声数据。首先对连续信号进行分帧处理,分帧之后,每一帧的长度称为“帧长”,帧序列的数目称为“帧数”。设置分帧处理的信号帧长为0.5s,每一个帧序列看作一个样本,由此获得1200个A类样本帧序列及1800个B类样本帧序列,构建水声目标样本库。由于本发明方法属于监督学习,故需将A类样本标记为“-1”类,B类样本标记为“+1”类,生成一一对应的标签矩阵Y={-1,+1}。
步骤2、根据步骤1中获得的样本帧序列,样本序列中包含了大量舰船辐射噪声特征信息,然而数据冗余度较高不利于模型计算,因此采用水声信号处理方法对样本序列进行特征提取实现数据降维。根据大量的舰船辐射噪声信号分析,舰船辐射噪声特征主要包含三个部分:线谱特征、连续谱特征以及调制特征。其中线谱特征主要由机械噪声和螺旋桨叶片振动产生,分布在1kHz以下;连续谱特征表现在100-1000Hz范围内连续谱存在一个峰值,当舰船航行速度较高时,螺旋桨高速运转产生空泡现象,连续谱在谱峰前以6dB每倍频程递增,谱峰后以-6dB每倍频程递减;舰船辐射噪声的调制是由于螺旋桨高速运转产生的基频及其谐波分量对辐射噪声信号的调制,反映了舰船的螺旋桨叶片数及运转频率。利用谱分析方法获取舰船辐射噪声特征的步骤为:
(1)对样本帧序列进行LOFAR谱分析,获取在帧长为0.5s的信号中,线谱频率的分布特征;
(2)对样本帧序列进行DEMON谱分析,获取在帧长为0.5s的信号中,调制成分中频率的分布特征;
(3)对样本帧序列进行11/2维谱分析,获取在帧长为0.5s的信号中,非线性耦合特性的分布特征;
(4)对样本帧序列进行小波变换分析,获取在帧长为0.5s的信号中,能量随尺度变化的分布特征;
(5)将所有特征首尾连接,通过降维分析,获得一个m维行向量(m的值取决于降维后有效数据的长度,本例中取m=180),称之为舰船目标的特征样本。
由此,水声目标特征样本库中包含两个部分:第一部分是一个3000×180的特征矩阵
Figure BDA0002499180880000101
第二部分是一个3000×1的标签矩阵Y,特征矩阵与标签矩阵的类别一一对应。
步骤3、建立加权支持向量机识别模型,图2反映了模型的分类原理:利用内积函数将输入的非线性样本转化至高维空间中的线性样本,在高维空间中寻求最优分类平面,使得输入样本按类别划分并保持最大距离,选取合适的类别权系数,平衡各类样本支持向量数目对超平面选择的影响。
输入样本数据集
Figure BDA0002499180880000102
yi∈Y={-1,1},i=1,2,...,n,n表示输入特征样本数,凸二次规划问题为
Figure BDA0002499180880000103
式中:
Figure BDA0002499180880000104
是类yi的权值,根据两类样本数目的比值,将类别权系数定义为
Figure BDA0002499180880000105
由此获得加权后的拉格朗日表达式为:
Figure BDA0002499180880000111
选择高斯径向基函数作为内积函数,其决策函数为:
Figure BDA0002499180880000112
步骤4、选取特征样本库中70%的样本数据作为训练样本,30%作为测试样本。从70%的训练样本中再选取40%作为参选训练数据,即选取480个A目标特征样本、720个B目标特征样本连同其对应的标签矩阵一同输入到步骤3中获得的加权支持向量机识别模型中进行训练。利用网格搜索法寻找最优参数的基本步骤如下:
1)首先,根据经验确定惩罚因子C搜索范围为(0~10),以及核函数参数σ的搜索范围为(0~5);
2)其次,选择适合的步长,惩罚因子C步长设置为0.1,核函数参数σ的步长设置为0.01,建立搜索网格(C,σ);
3)基于每一个网格上的参数点训练加权支持向量机模型,设置k折交叉验证的k=20,将参选样本分成20个均匀的子集S1,S2,...,S20,每个子集中包含24个A目标特征样本和36个B目标特征样本。当模型参数设置为C=0.1,σ=0.01时,分别将Si(i=1,2,...,20)作为测试样本,其余19个样本集作为训练样本,输入到加权支持向量机识别模型中训练,获得平均分类器精度为65.45%;
4)同理遍历全部网格后,确定当模型参数选择C=4.1,σ=1.21时具备最高的平均分类器精度为98.24%,因此确定为在类目标识别条件下的最优模型参数。
步骤5、根据步骤4中样本数据的划分,将70%的训练样本即840个A类样本和1260个B类样本连同其对应的标签矩阵一同输入到参数为C=4.1,σ=1.21的加权支持向量机识别模型中,对模型进行训练,并将训练完成的模型保存。
步骤6、根据步骤4中样本数据的划分,将剩余30%的测试样本即360个A类样本和540个B类样本连同其对应的标签矩阵一同输入已经保存的识别模型中,得到的识别混淆矩阵如图3中所示。
步骤7、根据步骤6中的混淆矩阵,将分类正确的样本数占总样本数的比例称为识别正确率,计算该分类器对A、B两类目标的识别正确率为91.33%;将正例(或负例)分类正确的样本数占全部真实为正例(或负例)样本数的比例,称之为对正例(或负例)类识别率,则对A类样本的识别率为91.38%,对B类样本的识别率为91.29%。
对于多目标分类问题,要转化为多个双目标分类问题,所采用的一对一举手投票法则基本步骤如下:
首先,待分类目标包含一段时长600s的A类目标辐射噪声信号、一段时长900s的B类目标辐射噪声信号、一段时长800s的C类目标辐射噪声信号以及一段时长400s的D四类目标样本。设置帧长等于0.5s,进行分帧预处理,生成帧长为相等的目标样本库,利用步骤2中谱分析方法,对所有样本帧序列进行特征提取,建立四类水声目标特征样本库;
其次,四类目标两两组合构建6个二元分类模型,例如,A类目标与B类目标之间构成一个二元分类问题,根据步骤3~5,生成一个针对A、B两类目标的二元加权支持向量机模型,称之为AB类分类器,计算获得的平均分类器精度为98.24%。以此类推可以获得其余5个二元分类模型:AC类分类器的平均分类器精度为97.64%、AD类分类器的平均分类器精度为95.56%、BC类分类器的平均分类器精度为96.68%、BD类分类器的平均分类器精度为98.08%、CD类分类器的平均分类器精度为97.36%。
当测试样本输入时,同时输入到6个分类器中进行识别,并对识别结果进行投票,如图4中展示了某一个测试样本的识别过程,该测试样本属于A类目标,分别通过6个分类器,包含A类目标的分类器的识别结果是正确的会使A类识别结果票数+1,另外3个分类器无法同时为某一类目标识别结果投票,因此A类识别结果必定是票数最多者,该次识别结果的输出为A类目标。由此方法,遍历30%的测试样本获得识别混淆矩阵如图5所示,该四元水声目标分类识别模型的识别正确率为88.83%,对A类样本的识别率为86.94%,对B类样本的识别率为88.89%,对C类样本的识别率为91.25%,对D类样本的识别率为86.67%。
以上对本发明所提出的一种基于加权支持向量机的水声目标识别方法,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种基于加权支持向量机的水声目标识别方法,其特征在于:具体包括以下步骤:
步骤一:对获取的N类水声目标样本数据,进行分帧预处理;其中N大于等于2;
步骤二:根据步骤一得到的预处理样本,利用谱分析特征提取方法获得各类样本的特征向量,作为分类器特征样本库;
步骤三:将水声目标特征样本两两组合生成
Figure FDA0003531048070000011
个二元目标分类对,添加类别标签,把N元分类问题转化为
Figure FDA0003531048070000012
个二元分类问题,搭建
Figure FDA0003531048070000013
个加权支持向量机识别模型,选取高斯径向基核函数作为内积函数;
步骤四:根据步骤三中生成的二元目标分类对,分别设定加权支持向量机识别模型的核函数参数及惩罚因子参选范围,选择各类目标40%的特征样本作为参选训练数据,以k折交叉验证方法作为分类器识别性能评价标准,设置步长,利用网格搜索法寻找最优核函数参数及惩罚因子;
步骤五:根据步骤四中获得的最优核函数参数及惩罚因子,选取各类目标70%的特征样本输入到对应的加权支持向量机识别模型进行训练,所述各类目标70%的特征样本中包含步骤四中的参选训练数据;
步骤六:根据步骤五中获得训练完成的二元水声目标识别分类器,令未参加训练的30%特征样本数据作为测试样本,同时输入到
Figure FDA0003531048070000014
个分类器中进行识别,利用一对一举手准则判定水声目标所属类别,通过混淆矩阵反映分类器对水声目标的识别结果;
步骤七:统计分类器的识别正确率,评价分类器性能,当识别正确率低于设定阈值时,返回步骤四,提高参选样本数量,重新选择模型参数;
所述步骤三具体为:
当特征样本库中目标个数N>2时,对应的训练样本集为{x1,x2,...,xN};将样本集中按样本类别两两组成训练样本集,即训练样本集Ti-j(xi,xj)满足(i,j)∈{(i,j)|i>j,i,j=1,2,...,N};将标号为i的训练样本标记为正类点,标号为j的样本标记为负类点,形成
Figure FDA0003531048070000015
个二元目标样本对,把N元分类问题转化为
Figure FDA0003531048070000016
个二元分类问题,由此搭建
Figure FDA0003531048070000017
个加权支持向量机识别模型;
假设训练样本数据集
Figure FDA0003531048070000018
Figure FDA0003531048070000019
能够被一个高维空间中的超平面(w·x)+b=0分开,式中
Figure FDA00035310480700000110
使对应yi=+1的样本和yi=-1的样本分布在超平面两侧,将距超平面最近的样本点称为支持向量,搜寻最优超平面的核心思想是使超平面到支持向量之间的距离最大,因此将问题转化为一个凸二次规划问题:
Figure FDA0003531048070000021
对于分类样本而言,存在部分样本线性不可分情况,即无法满足条件找到最优分类超平面,故式(1)中引入惩罚因子C和松弛变量ξ来降低yi[(w·xi)+b]≥1的约束;
支持向量机识别模型的最优分类超平面是依靠支持向量的位置确定的,与非支持向量无关,将分布在间隔面与超平面之间以及超平面一侧的支持向量称为边界支持向量,则类别中边界支持向量的比例越大样本被错分的比例也越大;从概率论的角度分类标号为-1的边界支持向量与标号为+1的边界支持向量出现的概率相同,如果正类样本数与负类样本数不相等,则表现为训练样本数少的类别边界支持向量比例大于训练样本数多的类别事件发生的概率大,即样本数少的类别中被错分的比例更大,因此引入对类别加权方法,将原始凸二次规划问题转化为:
Figure FDA0003531048070000022
式中:
Figure FDA0003531048070000023
是类yi的权值,当
Figure FDA0003531048070000024
时加权支持向量机与支持向量机完全相同,
Figure FDA0003531048070000025
的大小取决于两类样本数目的差异,由此获得加权后的拉格朗日表达式为:
Figure FDA0003531048070000026
其中,α表示拉格朗日乘子;i=1,2,...,n;j=1,2,...,n;
决策函数为:
Figure FDA0003531048070000027
选择高斯径向基核函数作为内积函数,所述内积函数表达式为:
Figure FDA0003531048070000028
其中σ表示高斯径向基核函数参数。
2.根据权利要求1所述的方法,其特征在于:在步骤一中,对水声目标样本数据进行分帧,也就是将信号样本分割成一段一段的帧序列,分帧之后,每一帧的长度称为“帧长”,帧序列的数目称为“帧数”,以每一帧数据作为一个样本。
3.根据权利要求2所述的方法,其特征在于:在步骤二中,根据步骤一中获得的预处理样本,对每一帧样本数据进行谱分析提取特征,提取的特征包括:
利用LOFAR谱分析获得水声目标信号的频域线谱特征;
利用DEMON谱分析获得水声目标信号调制谱的基频特征;
利用高阶谱分析抑制水声目标信号中的高斯噪声,获得信号中非线性耦合特征;
利用小波变换分析获得水声目标信号中的能量尺度变化特征;
将谱分析获得的特征值重组降维,归一化处理后,获得的特征向量称之为水声目标的特征样本,建立分类器特征样本库。
4.根据权利要求3所述的方法,其特征在于:所述网格搜索法寻找最优核函数参数及惩罚因子,具体为:
步骤1、首先根据经验确定惩罚因子C以及核函数参数σ的搜索范围;
步骤2、其次选择适合的步长,建立搜索网格(C,σ);
步骤3、基于每一个网格上的参数点训练加权支持向量机识别模型,以k折交叉验证的结果作为该参数点下分类器的识别精度;
步骤4、遍历全部网格后,选择使加权支持向量机识别模型对测试样本识别精度最高的参数。
5.根据权利要求4所述的方法,其特征在于:在步骤五中,选择各类目标70%的特征样本作为训练样本,分别对
Figure FDA0003531048070000031
个加权支持向量机识别模型进行训练,得到
Figure FDA0003531048070000032
个对应二元目标样本对的水声目标分类识别模型。
6.根据权利要求5所述的方法,其特征在于:在步骤六中,将剩余30%的特征样本作为测试样本,同时输入到
Figure FDA0003531048070000033
个分类器中进行识别,每一个测试样本对应
Figure FDA0003531048070000034
个分类器决策函数为:
Figure FDA0003531048070000035
对于输入样本x,建立用于表决判别意见的判别函数:
Figure FDA0003531048070000036
遍历所有的训练样本集获得
Figure FDA0003531048070000037
个判别函数,在对输入样本x进行识别时需考虑所有二元分类器的意见,通过投票的方式判定x所属类别,即当x输入至第i-j个分类器时,若判别函数si-j(x)=i则在类别i上记票数加一,反之在类别j上记票数加一,最终获得票数最多的类别即为预测目标类别,最后以混淆矩阵的形式输出识别结果。
7.根据权利要求6所述的方法,其特征在于:在步骤七中,将混淆矩阵中分类正确的样本数占总样本数的比例称为识别正确率,作为识别评价标准;所述阈值取值为80%。
CN202010427316.4A 2020-05-19 2020-05-19 一种基于加权支持向量机的水声目标识别方法 Active CN111709299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010427316.4A CN111709299B (zh) 2020-05-19 2020-05-19 一种基于加权支持向量机的水声目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010427316.4A CN111709299B (zh) 2020-05-19 2020-05-19 一种基于加权支持向量机的水声目标识别方法

Publications (2)

Publication Number Publication Date
CN111709299A CN111709299A (zh) 2020-09-25
CN111709299B true CN111709299B (zh) 2022-04-22

Family

ID=72537535

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010427316.4A Active CN111709299B (zh) 2020-05-19 2020-05-19 一种基于加权支持向量机的水声目标识别方法

Country Status (1)

Country Link
CN (1) CN111709299B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634945A (zh) * 2020-12-15 2021-04-09 浙江和达科技股份有限公司 一种基于云平台的智能漏水声识别方法
CN112649798B (zh) * 2020-12-31 2022-09-09 哈尔滨工程大学 水声目标弱线谱软判决被动探测方法
CN112906458B (zh) * 2021-01-08 2022-07-05 浙江大学 群智能优化的水下激光多目标端到端自动识别系统
CN113189556B (zh) * 2021-04-13 2022-05-03 电子科技大学 一种在复合高斯杂波环境下的mimo雷达动目标检测方法
AU2022282615A1 (en) * 2021-05-28 2023-12-07 Bae Systems Plc Method and apparatus to classifying craft
EP4095559A1 (en) * 2021-05-28 2022-11-30 BAE SYSTEMS plc Apparatus and method of classification
CN113408420B (zh) * 2021-06-18 2022-12-06 西安电子科技大学 基于多维度参数提取和支持向量机的扩频信号识别方法
CN113452637B (zh) * 2021-09-01 2021-11-30 中国海洋大学 基于特征选择和支持向量机的水声通信信号调制识别方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807254A (zh) * 2009-02-13 2010-08-18 烟台海岸带可持续发展研究所 面向数据特点的合成核支持向量机的实现方法
CN102361475A (zh) * 2011-06-15 2012-02-22 南京信息工程大学 基于混沌支持向量机优化的小波加权多模盲均衡方法
CN106250848A (zh) * 2016-07-29 2016-12-21 西北工业大学 一种基于多模型融合的单类水声目标识别方法
US9558762B1 (en) * 2011-07-03 2017-01-31 Reality Analytics, Inc. System and method for distinguishing source from unconstrained acoustic signals emitted thereby in context agnostic manner
CN107368840A (zh) * 2016-05-11 2017-11-21 中国科学院声学研究所 一种基于mfcc和支持向量机的水下机动小目标识别方法
CN110490230A (zh) * 2019-07-16 2019-11-22 西北工业大学 基于深度卷积生成对抗网络的水声目标识别方法
CN110826216A (zh) * 2019-11-01 2020-02-21 哈尔滨工程大学 一种基于决策树的水下直达声挑选方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426842B (zh) * 2015-11-19 2018-08-14 浙江大学 基于支持向量机和表面肌电信号的多类手部动作识别方法
CN106682574A (zh) * 2016-11-18 2017-05-17 哈尔滨工程大学 一维深度卷积网络的水下多目标识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101807254A (zh) * 2009-02-13 2010-08-18 烟台海岸带可持续发展研究所 面向数据特点的合成核支持向量机的实现方法
CN102361475A (zh) * 2011-06-15 2012-02-22 南京信息工程大学 基于混沌支持向量机优化的小波加权多模盲均衡方法
US9558762B1 (en) * 2011-07-03 2017-01-31 Reality Analytics, Inc. System and method for distinguishing source from unconstrained acoustic signals emitted thereby in context agnostic manner
CN107368840A (zh) * 2016-05-11 2017-11-21 中国科学院声学研究所 一种基于mfcc和支持向量机的水下机动小目标识别方法
CN106250848A (zh) * 2016-07-29 2016-12-21 西北工业大学 一种基于多模型融合的单类水声目标识别方法
CN110490230A (zh) * 2019-07-16 2019-11-22 西北工业大学 基于深度卷积生成对抗网络的水声目标识别方法
CN110826216A (zh) * 2019-11-01 2020-02-21 哈尔滨工程大学 一种基于决策树的水下直达声挑选方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Multitarget Tracking Using One Time Step Lagged Delta-Generalized Labeled Multi-Bernoulli Smoothing;GUOLONG LIANG 等;《IEEE Access》;20200204;第8卷;第28242-28256页 *
Underwater Acoustic Target Recognition Using SVM Ensemble via Weighted Sample and Feature Selection;Honghui Yang 等;《2016 13th International Bhurban Conference on Applied Sciences & Technology (IBCAST)》;20160116;第522-527页 *
近邻样本分布加权SVM及在桨叶数识别中的应用;戴卫国 等;《声学技术》;20150430;第34卷(第2期);第360-363页 *

Also Published As

Publication number Publication date
CN111709299A (zh) 2020-09-25

Similar Documents

Publication Publication Date Title
CN111709299B (zh) 一种基于加权支持向量机的水声目标识别方法
Roffo et al. Infinite latent feature selection: A probabilistic latent graph-based ranking approach
CN109582003B (zh) 基于伪标签半监督核局部费舍尔判别分析轴承故障诊断方法
Lines et al. Hive-cote: The hierarchical vote collective of transformation-based ensembles for time series classification
CN108062572B (zh) 一种基于DdAE深度学习模型的水电机组故障诊断方法与系统
Jie et al. RunPool: A dynamic pooling layer for convolution neural network
CN105224872B (zh) 一种基于神经网络聚类的用户异常行为检测方法
Aliniya et al. A novel combinatorial merge-split approach for automatic clustering using imperialist competitive algorithm
CN109581339A (zh) 一种基于头脑风暴自动调整自编码网络的声呐识别方法
CN110059756A (zh) 一种基于多目标优化的多标签分类系统
O'Neill et al. Particle swarm optimisation for feature selection and weighting in high-dimensional clustering
Dash et al. A comparative study of radial basis function network with different basis functions for stock trend prediction
Ahila et al. Particle swarm optimization-based feature selection and parameter optimization for power system disturbances classification
Chawla et al. Towards interpretable anomaly detection: Unsupervised deep neural network approach using feedback loop
Hasan et al. Multistrategy self-organizing map learning for classification problems
CN117435982A (zh) 一种多维度快速识别网络水军的方法
Liu et al. A weight-incorporated similarity-based clustering ensemble method
Jaffel et al. A symbiotic organisms search algorithm for feature selection in satellite image classification
Cheuk et al. Latent space representation for multi-target speaker detection and identification with a sparse dataset using triplet neural networks
Cai et al. Fuzzy criteria in multi-objective feature selection for unsupervised learning
Yan et al. Unsupervised feature selection through fitness proportionate sharing clustering
Jia et al. On geometric structure of activation spaces in neural networks
Dani et al. Survey on the use of CNN and Deep Learning in Image Classification
Sherin et al. GA based selection and parameter optimization for an SVM based underwater target classifier
Yao Application of Optimized SVM in Sample Classification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant