CN112949671B

CN112949671B - 一种基于无监督特征优化的信号分类方法及系统

Info

Publication number: CN112949671B
Application number: CN201911266932.XA
Authority: CN
Inventors: 徐及; 李琛; 颜永红
Original assignee: Institute of Acoustics CAS; Beijing Kexin Technology Co Ltd
Current assignee: Institute of Acoustics CAS; Beijing Kexin Technology Co Ltd
Priority date: 2019-12-11
Filing date: 2019-12-11
Publication date: 2023-06-30
Anticipated expiration: 2039-12-11
Also published as: CN112949671A

Abstract

本发明公开了一种基于无监督特征优化的信号分类方法及系统，所述方法包括：将待分类的信号进行预处理和分帧；提取每一帧信号的基于能量的时频分类特征；将每一帧信号的能量特征输入预先训练的无监督特征优化网络，输出优化特征；所述无监督特征优化网络的准则为最大化类间距离并最小化类内距离；将优化特征输入预先训练的分类器，输出分类结果。本发明的方法能够最大化利用训练样本的类内‑类间的关系，使得神经网络学习到的表征特征更具判别性。

Description

一种基于无监督特征优化的信号分类方法及系统

技术领域

本发明涉及目标识别领域，具体涉及一种利用类别间的相关性提高特征分辨能力的方法，特别涉及一种基于无监督特征优化的信号分类方法及系统。

背景技术

近年来，深度神经网络已经在分类任务中的应用越来越广泛，比如图像识别，说话人识别等，然而目前大多数分类算法都是聚焦于使用更加复杂的分类器来实现更加精确的分类。对于一个特定的分类任务来说，常规的特征优化方法比如倒谱均方归一(cepstralmean and variance normalization，CMVN)、L1/L2正则规整等方法虽然能一定程度的改善特征的性能，但是并没有有效的利用类别之间的相关性，通过深入挖掘类内-类间的关系能够有助于获取一个更加具有判别性的特征。

发明内容

本发明针对深度学习在分类任务针对分类器的优化遇到瓶颈时，常规的特征规整方式提升有限的情况下，提出一种新的特征优化的信号分类方法，通过利用类别之间的相关性得到一个更具判别性的特征；特征优化通过一个深度神经网络实现，通过神经网络提取的一个表征，在此表征上进行类别间的特征优化。

为实现上述目的，本发明提出了一种基于无监督特征优化的信号分类方法，所述方法包括：

将待分类的信号进行预处理和分帧；

提取每一帧信号的基于能量的时频分类特征；

将每一帧信号的能量特征输入预先训练的无监督特征优化网络，输出优化特征；所述无监督特征优化网络的准则为最大化类间距离并最小化类内距离；

将优化特征输入预先训练的分类器，输出分类结果。

作为上述方法的一种改进，所述将待分类的信号进行预处理和分帧：

取N个采样点作为一帧信号，对每一帧数字信号先补零到N点，N＝2ⁱ，i为正整数；

对每一帧的信号进行加窗或预加重处理；

利用窗函数对信号进行分帧，窗函数的长度即为帧长沿时间序列进行N/2个点的移动，得到第二帧信号，以此类推；直至分帧结束。

作为上述方法的一种改进，所述提取每一帧信号的基于能量的时频分类特征，具体包括：

对t时刻的数字信号进行快速傅里叶变换，得到t时刻的数字信号的离散频谱为：

其中，y_t,n表示t时刻的第n个采样点的信号的值，Y_t,f(f＝0,1,…N-1)表示信号在t时刻的第f个频点的傅里叶变换系数；

对指定的频率范围设计滤波器组，将变换后的频谱通过滤波器组后，计算每个滤波器内的信号能量，能量值取对数后为基于能量的时频分类特征；滤波器的数量对应着特征的维度。

作为上述方法的一种改进，所述方法还包括：对无监督特征优化网络与其后端的分类器进行联合训练，具体包括：

训练数据

包括N个样本x_i及其对应的类别y_i∈{1,2,...,Y}；样本x_i为基于能量的时频分类特征；

x_i输入无监督特征优化网络后输出一个向量f_i，然后在一次训练中对每一个类别计算一个中心点C＝{c₁,c₂,...,c_Y}，在之后的每次训练中更新这些中心点；对于每一批训练样本，特征优化的损失函数L_fo定义为：

其中D(·)定义为欧式距离：

m为代价常数，表示该样本到它对应的类别中心点与到它最容易分类错误的类别中心点的相对距离；

所述分类器的softmax准则与无监督的优化准则，共同指导无监督特征优化网络的权重更新，则联合训练的损失函数L_total定义为：

L_total＝L_fo+λL_softmax

其中，λ是一个超参数，L_softmax为后端分类器的损失函数。

本发明还提出了一种基于无监督特征优化的信号分类系统，所述系统包括：无监督特征优化网络、分类器、预处理模块、特征提取模块、优化特征提取模块和分类模块；

所述无监督特征优化网络的准则为最大化类间距离并最小化类内距离所述预处理模块，用于将待分类的信号进行预处理和分帧；

所述特征提取模块，用于提取每一帧信号的基于能量的时频分类特征；

所述优化特征提取模块，用于将每一帧信号的能量特征输入预先训练的无监督特征优化网络，输出优化特征；

所述分类模块，用于将优化特征输入预先训练的分类器，输出分类结果。

作为上述系统的一种改进，所述预处理模块的具体实现过程为：

对每一帧的信号进行加窗或预加重处理；

作为上述系统的一种改进，所述特征提取模块的具体实现过程为：

作为上述系统的一种改进，所述无监督特征优化网络与其后端的分类器进行联合训练，具体包括：

训练数据

其中D(·)定义为欧式距离：

L_total＝L_fo+λL_softmax

其中，λ是一个超参数，L_softmax为后端分类器的损失函数。

本发明的优点在于：

本发明的方法能够最大化利用训练样本的类内-类间的关系，使得神经网络学习到的表征特征更具判别性。

附图说明

图1为是本发明的信号分类方法的流程图；

图2为本发明的无监督特征优化的水下目标识别方法的框图；

图3(a)为5类仿真目标的原始时频特征的二维散点图；

图3(b)为将5类仿真目标的原始时频特征进行特征优化后，优化特征的二维散点图。

具体实施方式

下面结合附图对本发明的技术方案进行详细的说明。

本发明提出一种利用待分类目标之间的类别关系进行无监督训练的特征优化方法，包括：将信号预处理、分帧；计算每一帧信号的能量特征；以最大化类间距离、最小化类内距离为准则进行训练，得到一个无监督特征优化网络；对得到的特征优化器，将特征优化器与后端的分类器进行联合训练，分类器的softmax准则与无监督的优化准则共同指导特征优化网络的权重更新。最终在实际的应用中将原始采集到的信号特征通过固定参数的特征优化器，即可获得更具判别性的特征，以此新的特征训练新的分类模型，可以有效提高模型的分类性能。

如图1所示，本发明提出了一种基于无监督特征优化的信号分类方法，包括以下步骤：

步骤101：将音频信号进行分帧；

取N个采样点作为一帧信号，对每一帧数字信号先补零到N点，N＝2ⁱ，i为正整数；然后，对每一帧的信号进行加窗或预加重处理，加窗函数采用汉明窗(hamming)或哈宁窗(hanning)，利用窗函数对信号进行分帧，窗函数的长度即为帧长沿时间序列进行N/2个点的移动，得到第二帧信号，以此类推；直至分帧结束。

步骤102：基于步骤101的分帧信号，提取基础的基于能量的时频分类特征；

其中，y_t,n表示t时刻的第n个采样点的信号的值，Y_t,f(f＝0,1,…N-1)表示信号在t时刻的第f个频点的傅里叶变换系数。

然后对指定的频率范围设计滤波器组，将变换后的频谱通过滤波器组后，计算每个滤波器内的信号能量，能量值取对数后即为需要的特征值；滤波器的数量对应着特征的维度；

步骤103：对步骤102得到的时频特征以最大化类间距离、最小化类内距离为准则进行训练，得到一个无监督特征优化网络，具体为：

如图2所示，对于每一批的训练数据，输入样本

包括N个样本x_i及其对应的类别y_i∈{1,2,...,Y}_。样本x_i为基于能量的时频分类特征；x_i通过特征优化网络后得到一个向量f_i，然后在一次训练中对每一个类别计算一个中心点C＝{c₁,c₂,...,c_Y}，在之后的每次训练中更新这些中心点。对于每一批的N个训练样本，特征优化的损失函数L_fo定义为：

其中D(·)定义为欧式距离：

在最小化损失函数L_fo的过程中，通过一个代价常数m，将会使得容易分类错误的那些样本能够分类到它所对应的类别中。m表示着该样本到它对应的类别中心点与到它最容易分类错误的类别中心点的相对距离。

步骤104：将无监督特征优化网络与分类器进行联合训练，具体为：

将步骤103的特征优化损失函数与分类器的softmax损失函数进行整合，以一个准则进行训练，在特征进行自我优化的同时，后端的分类器能够一定程度地指导特征优化的方向。另一方面，特征优化是以每一批训练数据为基本单元进行优化的，缺少全局的视野很容易使得优化过拟合。

联合训练的准则定义为：

L_total＝L_fo+λL_softmax

其中λ是一个超参数，在训练中需要人为调节，在训练中控制特征优化和softmax损失函数的比例。

对比图3(a)和图3(b)可知，本发明的方法是有效的。

最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。