CN113591733A - 基于集成神经网络模型的水声通信调制模式分类识别方法 - Google Patents
基于集成神经网络模型的水声通信调制模式分类识别方法 Download PDFInfo
- Publication number
- CN113591733A CN113591733A CN202110888541.2A CN202110888541A CN113591733A CN 113591733 A CN113591733 A CN 113591733A CN 202110888541 A CN202110888541 A CN 202110888541A CN 113591733 A CN113591733 A CN 113591733A
- Authority
- CN
- China
- Prior art keywords
- model
- training
- underwater acoustic
- acoustic communication
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Abstract
本申请属于水声通信信号分析处理技术领域,尤其涉及一种基于集成神经网络模型的水声通信调制模式分类识别方法。具体包括:生成数据集的步骤;提取水声通信音频数据特征,获取优化模型参数的步骤;基于优化模型进行进一步训练,获取识别结果;本申请的基于集成神经网络模型的水声通信调制模式分类识别方法,对水声通信数据分别进行Mel频率倒谱系数特征提取和基于分位数的时间序列特征提取,以获得兼顾时频特征和时间序列特征的综合特征,以提高分类识别准确率;建立新颖的水声通信信号调制方式识别的深度学习方案,在仿真实验数据集上达到平均95%以上的识别准确率,为解决复杂海洋环境中水声通信信号可靠检测和识别问题方面提供新的技术方案。
Description
技术领域
本申请属于水声通信信号分析处理技术领域,尤其涉及一种基于集成神经网络模型的水声通信调制模式分类识别方法。
背景技术
目前水声通信信号调制方式识别常依赖于调制的先验知识,如精确载波频率、初始相位、符号速率等。但由于收到临海洋信道的随机时-空频变、窄带高噪、多途效应及多普勒频移等综合因素或特性的影响,使得水声通信信号调制方式的自动识别困难较大,现有的声通信信号调制方式的方法有很大局限性,通常都需要依赖人为设定的特性以及先验知识的积累,在面对多变不可预测的真实环境或者复杂工况下,往往难以有效识别,或者识别准确度大幅下降,这对于水声通信信号调制方式识别技术的实际应用和推广带来的极大的限制,阻碍了海洋声学、船舶航行技术等诸多领域的进一步发展。
发明内容
本申请的目的在于提供一种基于集成深度神经网络模型的水声通信调制模式识别方法,通过构建多种深度卷积神经网络模型结构以及Stacking模型集成方法提升识别效果,构建水声通信信号调制方式识别的深度学习技术方案,提升识别的准确率。
为实现上述目的,本申请采用如下技术方案。
一种基于集成神经网络模型的水声通信调制模式分类识别方法,具体包括:
步骤一、生成数据集的步骤;收集具有不同调制方式的水声通信信号音频数据,将已经确定调制方式的水声通信信号音频数据作为训练数据集A,将待预测调制方式的水声通信信号音频数据作为预测数据集B;对于训练数据集A内的数据,将每种调制方式的音频数据数量平均分配至训练数据集A1和训练数据集A2;
步骤二、提取水声通信音频数据特征;对于练数据集A1、训练数据集A2以及预测数据集B中的原始水声通信信号音频数据,分别提取水声通信信号的时间序列分位数特征以及水声通信信号梅尔频率特征;
步骤三、获取优化模型参数的步骤;基于单一卷积神经网络识别模型Ci,i=1、2、3...n,n为单一卷积神经网络识别模型数目;基于步骤二所提取的水声通信音频数据特征数据,以训练数据集A1对应的水声通信音频数据特征为训练数据,以训练数据集A2对应的水声通信音频数据特征为测试数据,使用非交叉验证的训练方式来训练各单一卷积神经网络识别模型Ci;得到单一卷积神经网络识别模型Ci的优化后模型参数权重;
步骤四、基于优化模型进行进一步训练的步骤;以步骤三得到的优化后模型参数权重作为初始参数初始化后得到优化后的单一卷积神经网络识别模型Di;在此基础上,利用训练数据集A2对应的水声通信音频数据特征为训练数据采用交叉训练方式,对各单一卷积神经网络识别模型Di进行进一步训练,直至各单一卷积神经网络识别模型Di达到各自的收敛精度;利用前述步骤中各步各单一卷积神经网络识别模型Di每一折训练过程中所保存的模型参数对预测数据集B进行预测,得到相应的识别结果;
步骤五、获取识别结果;在步骤四中训练的基础上,利用Stacking方法进行模型集成,得到单一卷积神经网络识别模型集成的结果。
对前述基于集成神经网络模型的水声通信调制模式分类识别方法的进一步改进或优选方案还包括,
所述步骤二中,所述水声通信信号的时间序列分位数特征采用如下方式提取:对原始水声通信信号音频数据的时间序列信号进行分段,得到一系列长度相同的子序列;针对每一个子序列分别利用分位数来刻画其数据分布特征;
所述步骤二中,所述水声通信信号的所述水声通信信号梅尔频率特征采用如下方式提取:采用预加重、分帧和加窗方法对原始音频波形文件进行处理,得到初步预处理结果;对于每个数据帧,分别进行快速傅里叶变换、Mel滤波器组、对数运算、离散余弦变换获得信号的梅尔频率特征。
对前述基于集成神经网络模型的水声通信调制模式分类识别方法的进一步改进或优选方案还包括,所述步骤二中,对于水声通信信号的时间序列分位数特征的提取过程中,对训练数据集A预测数据集B的音频数据进行分位数时间序列特征提取时的分位数选取0、1、 25、30、50、60、75、99、100九个分位数,以及幅值范围、均值以及标准差三个统计分位数共12个分位数进行处理。
对前述基于集成神经网络模型的水声通信调制模式分类识别方法的进一步改进或优选方案还包括,所述步骤三、获取优化模型参数的具体步骤包括:
建立单一卷积神经网络识别模型Ci,训练数据集A1对应的水声通信音频数据特征为训练数据,以训练数据集A2对应的水声通信音频数据特征为测试数据,使用非交叉验证的训练方式来训练各单一卷积神经网络识别模型Ci;对各单一卷积神经网络识别模型Ci设定训练次数上限,取测试数据上表现最好的模型权重参数进行存储,作为后续模型集成训练过程中模型的初始化权重参数,得到单一卷积神经网络识别模型Ci的优化后模型参数权重。
对前述基于集成神经网络模型的水声通信调制模式分类识别方法的进一步改进或优选方案还包括,所述步骤四基于优化模型进行进一步训练的步骤具体包括:
以步骤三得到的优化后模型参数权重作为初始参数初始化后得到优化后的单一卷积神经网络识别模型Di;在此基础上,利用训练数据集A2对应的水声通信音频数据特征为训练数据采用交叉训练方式,训练次数上限为50轮,在每个单一卷积神经网络识别模型Di 的每一折训练过程中,取这一折训练的测试数据上表现最好的模型参数,作为这一折训练模型的最优权重进行存储得到优化模型,利用优化模型对预测数据集B进行预测并对预测结果进行存储;同时在每一折训练中有一部分的数据作为测试数据被本轮优化模型预测得到预测结果并进行存储;在交叉训练结束后,得到每个单一卷积神经网络识别模型Di对应于训练数据集A2的预测结果数据集R1;同时对每个单一卷积神经网络识别模型Di每折训练时的预测结果求取平均值,得到预测数据集B的平均预测结果数据集R2。
对前述基于集成神经网络模型的水声通信调制模式分类识别方法的进一步改进或优选方案还包括,所述步骤五、获取识别结果,具体包括:
抽取训练数据集A2中所有水声通信音频数据特征所对应的已知真实标签作为标签集 A20,将预测结果数据集R1作为输入,标签集A20作为输出,训练元学习模型(可使用线性分类器模型、随机森林模型等);
在元学习模型训练完成后,将平均预测结果数据集R2作为输入,对其真实标签进行预测,得到最终模型集成的预测数据集的识别结果。
对前述基于集成神经网络模型的水声通信调制模式分类识别方法的进一步改进或优选方案还包括,所述步骤一中,水声通信信号音频数据的调制方式至少包括:BPSK二进制相移键控调制、QPSK正交相移键控调制、OFDM正交频分复用调制、MFSK多频移键控调制。
其有益效果在于:
本申请的基于集成神经网络模型的水声通信调制模式分类识别方法,对水声通信数据分别进行Mel频率倒谱系数特征提取和基于分位数的时间序列特征提取,以获得兼顾时频特征和时间序列特征的综合特征,以提高分类识别准确率;针对水声通信信号调制模式多样、信噪比受水声信道影响变化较大、存在多途效应等识别的现实困难设计和实现基于深度卷积神经网络不同网络结构和参数配置的多个水声通信信号调制模式分类识别单一卷积神经网络识别模型;运用基于stacking模型集成策略,建立新颖的水声通信信号调制方式识别的深度学习方案,在仿真实验数据集上达到平均95%以上的识别准确率,为解决复杂海洋环境中水声通信信号可靠检测和识别问题方面提供新的技术方案。
附图说明
图1为调制模式识别深度学习模型结构;
图2为基于交叉验证的Stacking模型集成示意图;
图3为仿真实验测试混淆矩阵图。
具体实施方式
以下结合具体实施例对本申请作详细说明。
本申请的一种基于集成神经网络模型的水声通信调制模式分类识别方法,具体包括如下步骤:
步骤一、生成数据集的步骤;
收集具有不同调制方式的水声通信信号音频数据,将已经确定调制方式的水声通信信号音频数据作为训练数据集A,将待预测调制方式的水声通信信号音频数据作为预测数据集B;对于训练数据集A内的数据,将每种调制方式的音频数据数量平均分配至训练数据集A1和训练数据集A2;
基于实际需求,在本实施例中,水声通信信号音频数据的调制方式至少包括:BPSK二进制相移键控调制、QPSK正交相移键控调制、OFDM正交频分复用调制、MFSK多频移键控调制等。水声通信信号音频数据的标签即为信号调制方式。
所获得的有标签的水声通信信号音频数据构成训练数据集。另外,收集需要对调制方式进行预测的无标签水声通信信号数据构成预测数据集。
前述步骤中,为保证数据的有效性以及便于实施,将步骤一建立的训练数据集拆分为训练数据集A1和训练数据集A2两个,训练数据集1和训练数据集2的数据数量之比为1:1,且同一种调制方式的音频数据数量在两个数据集中为1:1比例。
步骤二、提取水声通信音频数据特征;
对于练数据集A1、训练数据集A2以及预测数据集B中的原始水声通信信号音频数据,分别提取水声通信信号的时间序列分位数特征以及水声通信信号梅尔频率特征;
步骤二主要使用基于分位数的时间序列特征提取以及语音识别中广泛使用的Mel频率倒谱系数特征对原始的水声通信信号进行特征提取。
水声通信信号调制模式的分类识别通常会对原始水声通信数据进行前处理以消减原始信号当中大量的冗余信息,提取更为有效的表征特征作为识别模型的输入,从而有效提高分类识别的准确率和可靠性,为此本申请分别提取水声通信信号时间序列分位数特征以及提取水声通信信号梅尔频率特征。
其中,对于水声通信信号时间序列分位数特征提取,本领域知道,分位数可以将一个随机变量的概率分布范围进行等分的数值点。分位数能有效地描述时间序列信号在与时间维度垂直的幅值维度上的波动情况,是一种能对随机信号幅值波动进行比较有效描述的的时间序列特征;经过调制的水声通信信号时间序列具有随机性,提取分位数特征可以有效获取水声通信信号的波动特性。与此同时,可以实现水声通信信号的数据压缩,改变数据的维度,以便更好的利用后续的深度学习模型进行识别。
分位数特征提取首先需要对原始时间序列信号进行分段,得到一系列长度相同的子序列。之后,针对每一个子序列分别利用分位数来刻画其数据分布特征。分位数设置的数量要适中,太多的分位数提取会增加后续分类的计算量,太少的分位数则会失去对序列信号的特征表达能力。本申请算例采取置信概率分位数加均值、标准差和幅值范围的方式来对原始时间序列信号进行特征提取,即依次提取均值、标准差、幅值范围和0%、1%、25%、30%、 50%、60%、75%、99%、100%置信概率值所对应的分位数,共计12个。在具体实施过程中,对所有的训练数据集1、2和预测数据集的音频数据进行分位数时间序列特征提取,分位数选取0、1、25、30、50、60、75、99、100九个分位数与幅值范围(即最大值最小值之差),均值以及标准差三个统计分位数。
其中,对于水声通信信号梅尔频率特征提取,梅尔频率特征提取是语音识别等音频信号识别领域常用的特征提取方法,常用的梅尔频率特征是梅尔倒谱系数(MFCC)。梅尔倒谱系数提取过程包括:
1)声音数据预处理。即采用预加重、分帧和加窗等方法,对原始音频波形文件进行处理,得到初步预处理结果;2)多种变换。对于每个数据帧,分别进行快速傅里叶变换、Mel滤波器组、对数运算、离散余弦变换等步骤;3)动态特征提取。从而获得信号的梅尔频率特征。经过以上处理过程,一维音频信号就会变成二维梅尔频率特征,进而容易被卷积神经网络等深度学习模型识别和处理。
步骤三、获取优化模型参数的步骤;
基于单一卷积神经网络识别模型Ci,i=1、2、3...n,n为单一卷积神经网络识别模型数目;基于步骤二所提取的水声通信音频数据特征数据,以训练数据集(A1)对应的水声通信音频数据特征为训练数据,以训练数据集(A2)对应的水声通信音频数据特征为测试数据,使用非交叉验证的训练方式来训练各单一卷积神经网络识别模型Ci;得到单一卷积神经网络识别模型Ci的优化后模型参数权重;
步骤四、基于优化模型进行进一步训练的步骤;
以步骤三得到的优化后模型参数权重作为初始参数初始化后得到优化后的单一卷积神经网络识别模型Di;在此基础上,利用训练数据集A2对应的水声通信音频数据特征为训练数据采用交叉训练方式,对各单一卷积神经网络识别模型Di进行进一步训练,直至各单一卷积神经网络识别模型Di达到各自的收敛精度;利用前述步骤中各步各单一卷积神经网络识别模型Di每一折训练过程中所保存的模型参数对预测数据集B进行预测,得到相应的识别结果;
将步骤三训练好的单一卷积神经网络识别模型权重参数作为初始值初始化每个单一卷积神经网络识别模型。在此基础上,把训练数据集2的数据用于对每个模型进行进一步训练,采用5折交叉验证的方式。在单个识别模型进行5折交叉训练的过程中,每一轮训练都会得到一个优化的模型,同时利用这一轮优化的模型对预测数据集的数据进行预测。同时,在每一轮训练当中会有1折的数据作为测试数据被本轮优化模型预测得到预测结果。于是,当单个模型进行完5折交叉验证之后,会得到一组训练数据集2的预测值,同时如果对5折预测数据集的预测结果求取平均值的话,最终也会得到一组预测数据集的平均预测值。于是,每个模型进行完5折交叉训练之后都会得到1组训练数据集2的预测结果和预测数据集的预测结果。
以步骤三得到的优化后模型参数权重作为初始参数初始化后得到优化后的单一卷积神经网络识别模型Di;在此基础上,利用训练数据集A2对应的水声通信音频数据特征为训练数据采用交叉训练方式,训练次数上限为50轮,在每个单一卷积神经网络识别模型Di 的每一折训练过程中,取这一折训练的测试数据上表现最好的模型参数,作为这一折训练模型的最优权重进行存储得到优化模型,利用优化模型对预测数据集B进行预测并对预测结果进行存储;同时在每一折训练中有一部分的数据作为测试数据被本轮优化模型预测得到预测结果并进行存储;在交叉训练结束后,得到每个单一卷积神经网络识别模型Di对应于训练数据集A2的预测结果数据集R1;同时对每个单一卷积神经网络识别模型Di每折训练时的预测结果求取平均值,得到预测数据集B的平均预测结果数据集R2。
步骤五、获取识别结果;
在步骤四中训练的基础上,利用Stacking方法进行模型集成,得到单一卷积神经网络识别模型集成的结果。具体包括:抽取训练数据集A2中所有水声通信音频数据特征所对应的已知真实标签作为标签集A20,将预测结果数据集R1作为输入,标签集A20作为输出,训练元学习模型(通常基于线性分类器模型);在元学习模型训练完成后,将平均预测结果数据集R2作为输入,对其真实标签进行预测,得到最终模型集成的预测数据集的识别结果。
为便于更好的理解和说明,以及验证识别结果的准确性,以下基于前述方法结合实验仿真验证数据进行说明。
一、仿真条件:
通过Matlab仿真生成具有不同调制方式的水声通信信号数据集,其中调制方式为二进制相移键控调制(BPSK)、正交相移键控调制(QPSK)、正交频分复用调制(OFDM)、多频移键控调制(MFSK),共计4中调制方式,除此以外还生成纯白噪声信号(Noise)作为对比;仿真条件主要内容如下:
1)基于射线声学理论;
2)几何衰减按球面波传播衰减规律衰减,不考虑吸收衰减;
3)考虑水面和水底反射,即设定为浅海声信道;
4)考虑环境噪声为高斯白噪声;
5)假设整个水声空间声速均匀分布。模拟水池环境如表1所示,考虑水面与水底反射,声速设定为均匀分布。
表1模拟水池环境参数
参数 | 设定 |
声速 | 1500米/秒 |
水深 | 10~50米 |
发射换能器深度 | 1~10米 |
接收换能器深度 | 1~20米 |
接收与发射换能器水平距离 | 10~1000米 |
水面反射系数 | -0.5 |
水底反射系数 | 0.01 |
考虑最大反射次数 | 4 |
数据集:不同调制模式水声通信信号仿真数据集信息如表2所示,数据集分为训练数据集A和预测数据集B,均拥有完整的标注信息,训练数据集又分为A1和A2两个,用于对模型进行分阶段训练使用,各个类别数据在训练数据集数量上大致相等。
表2不同调制模式水声通信信号仿真数据集(音频数据文件数)
类别 | 训练数据集A1 | 训练数据集A2 | 预测数据集B |
BPSK | 1000 | 1000 | 800 |
QPSK | 800 | 800 | 1600 |
MFSK | 800 | 800 | 1600 |
OFDM | 800 | 800 | 1599 |
Noise | 1000 | 1000 | 800 |
合计 | 4400 | 4400 | 6399 |
准确率评价的指标主要通过混淆矩阵(如表3)以及查准率、查全率、准确率和综合F1值等进行量化评价;对上述五种评价指标一般都是对四种对比结果的综合统计量化。这四种对比结果包括TP(true positive)即识别结果和参考结果均指示调制模式存在,FP(false positive)即识别结果指示调制模式存在而参考结果指示不存在,FN(falsenegative)即识别结果指示调制模式不存在而参考结果指示存在,TN(true negative)即识别结果和参考结果均指示调制模式不存在。通常TN结果不计入综合评价指标体系当中。通过对四种对比结果的统计分析,可以进一步利用查准率(precision)、查全率(recall) 和准确率(accuracy)等评价指标来评价识别结果。如果将以上三种指标进一步综合,可以最终得到以F1值和误差率为核心的综合评价指标标准。
表3真实情况与预测结果量化对比(混淆矩阵)
查准率(Precision)与查全率(Recall)定义如下:
F-score为综合评价,由综合考虑Precision和Recall得来:
β用于调整两者权重,取β=1,记为F1-score
在对比多个混淆矩阵、综合考虑分类效果时,先在各混淆矩阵上分别计算出查准率和查全率,记为(P1,R1),(P2,R2),…,(Pn,Rn),通过平均运算,得到“宏查准率(macro-P)”,“宏查全率(macro-R)”和“宏F1(macro-F1)”:
二、仿真实验结果:
为便于实施验证,本实施例中基于5个单一卷积神经网络识别模型进行说明,如图1 所示,具体实施时,单一卷积神经网络模型的主要架构和参数可采用本实施例中采用表4、 5、6所示的三种,识别模型1、2、3均使用架构1,各个识别模型的区别主要在于模型参数和训练参数的不同,识别模型4使用架构2,识别模型5使用架构3;将第3步所提取的基于分位数的时间序列特征和基于Mel频率倒谱系数的特征一同输入到5个单一卷积神经网络识别模型训练中进行分别训练。
表4卷积神经网络架构1
表5卷积神经网络架构2
表6卷积神经网络架构3
图3为百分比混淆矩阵形式的模型分类识别结果,纵坐标代表真实标签,横坐标代表预测标签。进一步根据混淆矩阵所展示的结果和查准率、查全率、准确率和综合F1值等指标的含义,可以得到不同调制模式类别各自的分类识别结果以及综合的宏查准率、宏查全率、宏准确率和宏F1值。
表7为仿真实验结果,可以得到分类识别模型的平均分类识别率(宏F1值)为95.25%。从其他结果来看,OFDM调制模式的分类识别综合准确率最高,纯噪声Noise的分类识别综合准确率最低,从查准率来看BPSK模式分类识别结果最好,从查全率来看OFDM模式的分类识别效果最好,整体来看主要考虑的四种调制模式的分类识别结果类似均达到95%以上。参照以上分类识别结果,所提出模型的分类分类识别精度较为良好,体现深度学习方法的优越性。
表7仿真实验测试结果
为对比和检验所提出的基于深度卷积神经网络和模型集成策略的方法有效性,水声通信信号仿真数据所提取的梅尔频率特征和分位数特征串联作为综合特征,建立支持向量机 SVM分类器。实验所采用的SVM分类器利用LIBSVM模式分类识别与回归软件包(中国台湾大学林智仁教授开发设计)进行构建,在调参过程中,LIBSVM模型主要受两个参数的影响,即最优参数惩罚因子C和参数gamma,在模型参数最优条件下,支持向量机可以达到86.57%的准确率。
表8综合单一分类识别模型分类结果、模型集成分类结果和支持向量机分类结果。从表中结果可以看出,采用深度卷积神经网络的分类识别模型的分类结果要好于基于支持向量机的分类结果。采用stacking模型集成策略后,分类准确率相比单一卷积神经网络模型提高4%~5%。这一结果印证所提出的基于深度神经网络与模型集成的水声通信信号调制模式识别方法的有效性。
表8分类识别结果对比
宏查准率 | 宏查全率 | 宏F1值 | 准确率 | |
SVM模型 | - | - | - | 86.5% |
识别模型1 | 91.6% | 91.7% | 91.6% | 90.9% |
识别模型2 | 91.5% | 91.0% | 91.2% | 91.0% |
识别模型3 | 91.7% | 90.9% | 90.3% | 90.9% |
识别模型4 | 91.3% | 91.7% | 91.5% | 91.5% |
识别模型5 | 90.0% | 91.7% | 90.8% | 91.5% |
Stacking模型集成 | 95.1% | 95.3% | 95.2% | 95.2% |
最后应当说明的是,以上实施例仅用以说明本申请的技术方案,而非对本申请保护范围的限制,尽管参照较佳实施例对本申请作详细地说明,本领域的普通技术人员应当理解,可以对本申请的技术方案进行修改或者等同替换,而不脱离本申请技术方案的实质和范围。
Claims (7)
1.一种基于集成神经网络模型的水声通信调制模式分类识别方法,其特征在于,包括如下步骤:
步骤一、生成数据集的步骤;
收集具有不同调制方式的水声通信信号音频数据,将已经确定调制方式的水声通信信号音频数据作为训练数据集(A),将待预测调制方式的水声通信信号音频数据作为预测数据集(B);对于训练数据集(A)内的数据,将每种调制方式的音频数据数量平均分配至训练数据集(A1)和训练数据集(A2);
步骤二、提取水声通信音频数据特征;
对于练数据集(A1)、训练数据集(A2)以及预测数据集(B)中的原始水声通信信号音频数据,分别提取水声通信信号的时间序列分位数特征以及水声通信信号梅尔频率特征;
步骤三、获取优化模型参数的步骤;
基于单一卷积神经网络识别模型Ci,i=1、2、3...n,n为单一卷积神经网络识别模型数目;基于步骤二所提取的水声通信音频数据特征数据,以训练数据集(A1)对应的水声通信音频数据特征为训练数据,以训练数据集(A2)对应的水声通信音频数据特征为测试数据,使用非交叉验证的训练方式来训练各单一卷积神经网络识别模型Ci;得到单一卷积神经网络识别模型Ci的优化后模型参数权重;
步骤四、基于优化模型进行进一步训练的步骤;
以步骤三得到的优化后模型参数权重作为初始参数初始化后得到优化后的单一卷积神经网络识别模型Di;在此基础上,利用训练数据集(A2)对应的水声通信音频数据特征为训练数据采用交叉训练方式,对各单一卷积神经网络识别模型Di进行进一步训练,直至各单一卷积神经网络识别模型Di达到各自的收敛精度;利用前述步骤中各步各单一卷积神经网络识别模型Di每一折训练过程中所保存的模型参数对预测数据集(B)进行预测,得到相应的识别结果;
步骤五、获取识别结果;
在步骤四中训练的基础上,利用Stacking方法进行模型集成,得到单一卷积神经网络识别模型集成的结果。
2.根据权利要求1所述的一种基于集成神经网络模型的水声通信调制模式分类识别方法,其特征在于,
所述步骤二中,所述水声通信信号的时间序列分位数特征采用如下方式提取:对原始水声通信信号音频数据的时间序列信号进行分段,得到一系列长度相同的子序列;针对每一个子序列分别利用分位数来刻画其数据分布特征;
所述步骤二中,所述水声通信信号的所述水声通信信号梅尔频率特征采用如下方式提取:采用预加重、分帧和加窗方法对原始音频波形文件进行处理,得到初步预处理结果;对于每个数据帧,分别进行快速傅里叶变换、Mel滤波器组、对数运算、离散余弦变换获得信号的梅尔频率特征。
3.根据权利要求2所述的一种基于集成神经网络模型的水声通信调制模式分类识别方法,其特征在于,所述步骤二中,对于水声通信信号的时间序列分位数特征的提取过程中,对训练数据集(A)预测数据集(B)的音频数据进行分位数时间序列特征提取时的分位数选取0、1、25、30、50、60、75、99、100九个分位数,以及幅值范围、均值以及标准差三个统计分位数共12个分位数进行处理。
4.根据权利要求1所述的一种基于集成神经网络模型的水声通信调制模式分类识别方法,其特征在于,所述步骤三、获取优化模型参数的具体步骤包括:
建立单一卷积神经网络识别模型Ci,训练数据集(A1)对应的水声通信音频数据特征为训练数据,以训练数据集(A2)对应的水声通信音频数据特征为测试数据,使用非交叉验证的训练方式来训练各单一卷积神经网络识别模型Ci;对各单一卷积神经网络识别模型Ci设定训练次数上限,取测试数据上表现最好的模型权重参数进行存储,作为后续模型集成训练过程中模型的初始化权重参数,得到单一卷积神经网络识别模型Ci的优化后模型参数权重。
5.根据权利要求1所述的一种基于集成神经网络模型的水声通信调制模式分类识别方法,其特征在于,所述步骤四基于优化模型进行进一步训练的步骤具体包括:
以步骤三得到的优化后模型参数权重作为初始参数初始化后得到优化后的单一卷积神经网络识别模型Di;在此基础上,利用训练数据集(A2)对应的水声通信音频数据特征为训练数据采用交叉训练方式,训练次数上限为50轮,在每个单一卷积神经网络识别模型Di的每一折训练过程中,取这一折训练的测试数据上表现最好的模型参数,作为这一折训练模型的最优权重进行存储得到优化模型,利用优化模型对预测数据集(B)进行预测并对预测结果进行存储;同时在每一折训练中有一部分的数据作为测试数据被本轮优化模型预测得到预测结果并进行存储;在交叉训练结束后,得到每个单一卷积神经网络识别模型Di对应于训练数据集(A2)的预测结果数据集(R1);同时对每个单一卷积神经网络识别模型Di每折训练时的预测结果求取平均值,得到预测数据集(B)的平均预测结果数据集(R2)。
6.根据权利要求5所述的一种基于集成神经网络模型的水声通信调制模式分类识别方法,其特征在于,所述步骤五、获取识别结果,具体包括:
抽取训练数据集(A2)中所有所有水声通信音频数据特征所对应的已知真实标签作为标签集A20,将预测结果数据集(R1)作为输入,标签集(A20)作为输出,训练元学习模型;
在元学习模型训练完成后,将平均预测结果数据集(R2)作为输入,对其真实标签进行预测,得到最终模型集成的预测数据集的识别结果。
7.根据权利要求1所述的一种基于集成神经网络模型的水声通信调制模式分类识别方法,其特征在于,所述步骤一中,水声通信信号音频数据的调制方式至少包括:BPSK二进制相移键控调制、QPSK正交相移键控调制、OFDM正交频分复用调制、MFSK多频移键控调制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110888541.2A CN113591733B (zh) | 2021-08-04 | 2021-08-04 | 基于集成神经网络模型的水声通信调制模式分类识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110888541.2A CN113591733B (zh) | 2021-08-04 | 2021-08-04 | 基于集成神经网络模型的水声通信调制模式分类识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113591733A true CN113591733A (zh) | 2021-11-02 |
CN113591733B CN113591733B (zh) | 2022-09-20 |
Family
ID=78254651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110888541.2A Active CN113591733B (zh) | 2021-08-04 | 2021-08-04 | 基于集成神经网络模型的水声通信调制模式分类识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113591733B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116202611A (zh) * | 2023-05-06 | 2023-06-02 | 中国海洋大学 | 一种基于元学习的小样本声速剖面反演方法 |
CN117198330A (zh) * | 2023-11-07 | 2023-12-08 | 国家海洋技术中心 | 一种声源识别方法、系统及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109961017A (zh) * | 2019-02-26 | 2019-07-02 | 杭州电子科技大学 | 一种基于卷积循环神经网络的心音信号分类方法 |
CN110738138A (zh) * | 2019-09-26 | 2020-01-31 | 哈尔滨工程大学 | 基于循环神经网络的水声通信信号调制模式识别方法 |
CN112216287A (zh) * | 2020-09-25 | 2021-01-12 | 江苏聆世科技有限公司 | 基于集成学习和卷积神经网络的环境声音识别方法 |
CN112364779A (zh) * | 2020-11-12 | 2021-02-12 | 中国电子科技集团公司第五十四研究所 | 信号处理与深-浅网络多模型融合的水声目标识别方法 |
-
2021
- 2021-08-04 CN CN202110888541.2A patent/CN113591733B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109961017A (zh) * | 2019-02-26 | 2019-07-02 | 杭州电子科技大学 | 一种基于卷积循环神经网络的心音信号分类方法 |
CN110738138A (zh) * | 2019-09-26 | 2020-01-31 | 哈尔滨工程大学 | 基于循环神经网络的水声通信信号调制模式识别方法 |
CN112216287A (zh) * | 2020-09-25 | 2021-01-12 | 江苏聆世科技有限公司 | 基于集成学习和卷积神经网络的环境声音识别方法 |
CN112364779A (zh) * | 2020-11-12 | 2021-02-12 | 中国电子科技集团公司第五十四研究所 | 信号处理与深-浅网络多模型融合的水声目标识别方法 |
Non-Patent Citations (2)
Title |
---|
张晓龙等: "基于残差网络和随机森林的音频识别方法", 《计算机工程与科学》 * |
邓晋等: "基于迁移学习的水声目标识别", 《计算机系统应用》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116202611A (zh) * | 2023-05-06 | 2023-06-02 | 中国海洋大学 | 一种基于元学习的小样本声速剖面反演方法 |
CN117198330A (zh) * | 2023-11-07 | 2023-12-08 | 国家海洋技术中心 | 一种声源识别方法、系统及电子设备 |
CN117198330B (zh) * | 2023-11-07 | 2024-01-30 | 国家海洋技术中心 | 一种声源识别方法、系统及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113591733B (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113591733B (zh) | 基于集成神经网络模型的水声通信调制模式分类识别方法 | |
WO2019227586A1 (zh) | 语音模型训练方法、说话人识别方法、装置、设备及介质 | |
WO2019227574A1 (zh) | 语音模型训练方法、语音识别方法、装置、设备及介质 | |
US7684986B2 (en) | Method, medium, and apparatus recognizing speech considering similarity between the lengths of phonemes | |
CN107564513A (zh) | 语音识别方法及装置 | |
CN113488060B (zh) | 一种基于变分信息瓶颈的声纹识别方法及系统 | |
CN105096955A (zh) | 一种基于模型生长聚类的说话人快速识别方法及系统 | |
CN113488058A (zh) | 一种基于短语音的声纹识别方法 | |
CN103474072A (zh) | 利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法 | |
CN110850420B (zh) | 基于弹球损失的FisherSVM声纳信号判别方法 | |
CN114332500A (zh) | 图像处理模型训练方法、装置、计算机设备和存储介质 | |
EP4102500A1 (en) | System and method for robust wakeword detection in presence of noise in new unseen environments without additional data | |
CN115062678A (zh) | 设备故障检测模型的训练方法、故障检测方法及装置 | |
CN114386518A (zh) | 基于自适应宽度自注意力机制的轻量化异常声事件检测方法 | |
CN112562725A (zh) | 基于语谱图和胶囊网络的混合语音情感分类方法 | |
CN113111786B (zh) | 基于小样本训练图卷积网络的水下目标识别方法 | |
CN111091809A (zh) | 一种深度特征融合的地域性口音识别方法及装置 | |
CN112052880A (zh) | 一种基于更新权值支持向量机的水声目标识别方法 | |
CN110515065A (zh) | 一种辐射噪声线谱源深度辨识方法 | |
CN110808067A (zh) | 基于二值多频带能量分布的低信噪比声音事件检测方法 | |
CN115909040A (zh) | 一种基于自适应多特征融合模型的水声目标识别方法 | |
CN114898773A (zh) | 基于深度自注意力神经网络分类器的合成语音检测方法 | |
CN114401049A (zh) | 一种基于幅度分布特征的概率整形信号整形分布识别方法 | |
CN106373576A (zh) | 一种基于vq和svm算法的说话人确认方法及其系统 | |
CN113782051B (zh) | 广播效果分类方法及系统、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |