CN112949671B - 一种基于无监督特征优化的信号分类方法及系统 - Google Patents
一种基于无监督特征优化的信号分类方法及系统 Download PDFInfo
- Publication number
- CN112949671B CN112949671B CN201911266932.XA CN201911266932A CN112949671B CN 112949671 B CN112949671 B CN 112949671B CN 201911266932 A CN201911266932 A CN 201911266932A CN 112949671 B CN112949671 B CN 112949671B
- Authority
- CN
- China
- Prior art keywords
- signal
- classification
- unsupervised
- frame
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于无监督特征优化的信号分类方法及系统,所述方法包括:将待分类的信号进行预处理和分帧;提取每一帧信号的基于能量的时频分类特征;将每一帧信号的能量特征输入预先训练的无监督特征优化网络,输出优化特征;所述无监督特征优化网络的准则为最大化类间距离并最小化类内距离;将优化特征输入预先训练的分类器,输出分类结果。本发明的方法能够最大化利用训练样本的类内‑类间的关系,使得神经网络学习到的表征特征更具判别性。
Description
技术领域
本发明涉及目标识别领域,具体涉及一种利用类别间的相关性提高特征分辨能力的方法,特别涉及一种基于无监督特征优化的信号分类方法及系统。
背景技术
近年来,深度神经网络已经在分类任务中的应用越来越广泛,比如图像识别,说话人识别等,然而目前大多数分类算法都是聚焦于使用更加复杂的分类器来实现更加精确的分类。对于一个特定的分类任务来说,常规的特征优化方法比如倒谱均方归一(cepstralmean and variance normalization,CMVN)、L1/L2正则规整等方法虽然能一定程度的改善特征的性能,但是并没有有效的利用类别之间的相关性,通过深入挖掘类内-类间的关系能够有助于获取一个更加具有判别性的特征。
发明内容
本发明针对深度学习在分类任务针对分类器的优化遇到瓶颈时,常规的特征规整方式提升有限的情况下,提出一种新的特征优化的信号分类方法,通过利用类别之间的相关性得到一个更具判别性的特征;特征优化通过一个深度神经网络实现,通过神经网络提取的一个表征,在此表征上进行类别间的特征优化。
为实现上述目的,本发明提出了一种基于无监督特征优化的信号分类方法,所述方法包括:
将待分类的信号进行预处理和分帧;
提取每一帧信号的基于能量的时频分类特征;
将每一帧信号的能量特征输入预先训练的无监督特征优化网络,输出优化特征;所述无监督特征优化网络的准则为最大化类间距离并最小化类内距离;
将优化特征输入预先训练的分类器,输出分类结果。
作为上述方法的一种改进,所述将待分类的信号进行预处理和分帧:
取N个采样点作为一帧信号,对每一帧数字信号先补零到N点,N=2i,i为正整数;
对每一帧的信号进行加窗或预加重处理;
利用窗函数对信号进行分帧,窗函数的长度即为帧长沿时间序列进行N/2个点的移动,得到第二帧信号,以此类推;直至分帧结束。
作为上述方法的一种改进,所述提取每一帧信号的基于能量的时频分类特征,具体包括:
对t时刻的数字信号进行快速傅里叶变换,得到t时刻的数字信号的离散频谱为:
其中,yt,n表示t时刻的第n个采样点的信号的值,Yt,f(f=0,1,…N-1)表示信号在t时刻的第f个频点的傅里叶变换系数;
对指定的频率范围设计滤波器组,将变换后的频谱通过滤波器组后,计算每个滤波器内的信号能量,能量值取对数后为基于能量的时频分类特征;滤波器的数量对应着特征的维度。
作为上述方法的一种改进,所述方法还包括:对无监督特征优化网络与其后端的分类器进行联合训练,具体包括:
xi输入无监督特征优化网络后输出一个向量fi,然后在一次训练中对每一个类别计算一个中心点C={c1,c2,...,cY},在之后的每次训练中更新这些中心点;对于每一批训练样本,特征优化的损失函数Lfo定义为:
其中D(·)定义为欧式距离:
m为代价常数,表示该样本到它对应的类别中心点与到它最容易分类错误的类别中心点的相对距离;
所述分类器的softmax准则与无监督的优化准则,共同指导无监督特征优化网络的权重更新,则联合训练的损失函数Ltotal定义为:
Ltotal=Lfo+λLsoftmax
其中,λ是一个超参数,Lsoftmax为后端分类器的损失函数。
本发明还提出了一种基于无监督特征优化的信号分类系统,所述系统包括:无监督特征优化网络、分类器、预处理模块、特征提取模块、优化特征提取模块和分类模块;
所述无监督特征优化网络的准则为最大化类间距离并最小化类内距离所述预处理模块,用于将待分类的信号进行预处理和分帧;
所述特征提取模块,用于提取每一帧信号的基于能量的时频分类特征;
所述优化特征提取模块,用于将每一帧信号的能量特征输入预先训练的无监督特征优化网络,输出优化特征;
所述分类模块,用于将优化特征输入预先训练的分类器,输出分类结果。
作为上述系统的一种改进,所述预处理模块的具体实现过程为:
取N个采样点作为一帧信号,对每一帧数字信号先补零到N点,N=2i,i为正整数;
对每一帧的信号进行加窗或预加重处理;
利用窗函数对信号进行分帧,窗函数的长度即为帧长沿时间序列进行N/2个点的移动,得到第二帧信号,以此类推;直至分帧结束。
作为上述系统的一种改进,所述特征提取模块的具体实现过程为:
对t时刻的数字信号进行快速傅里叶变换,得到t时刻的数字信号的离散频谱为:
其中,yt,n表示t时刻的第n个采样点的信号的值,Yt,f(f=0,1,…N-1)表示信号在t时刻的第f个频点的傅里叶变换系数;
对指定的频率范围设计滤波器组,将变换后的频谱通过滤波器组后,计算每个滤波器内的信号能量,能量值取对数后为基于能量的时频分类特征;滤波器的数量对应着特征的维度。
作为上述系统的一种改进,所述无监督特征优化网络与其后端的分类器进行联合训练,具体包括:
xi输入无监督特征优化网络后输出一个向量fi,然后在一次训练中对每一个类别计算一个中心点C={c1,c2,...,cY},在之后的每次训练中更新这些中心点;对于每一批训练样本,特征优化的损失函数Lfo定义为:
其中D(·)定义为欧式距离:
m为代价常数,表示该样本到它对应的类别中心点与到它最容易分类错误的类别中心点的相对距离;
所述分类器的softmax准则与无监督的优化准则,共同指导无监督特征优化网络的权重更新,则联合训练的损失函数Ltotal定义为:
Ltotal=Lfo+λLsoftmax
其中,λ是一个超参数,Lsoftmax为后端分类器的损失函数。
本发明的优点在于:
本发明的方法能够最大化利用训练样本的类内-类间的关系,使得神经网络学习到的表征特征更具判别性。
附图说明
图1为是本发明的信号分类方法的流程图;
图2为本发明的无监督特征优化的水下目标识别方法的框图;
图3(a)为5类仿真目标的原始时频特征的二维散点图;
图3(b)为将5类仿真目标的原始时频特征进行特征优化后,优化特征的二维散点图。
具体实施方式
下面结合附图对本发明的技术方案进行详细的说明。
本发明提出一种利用待分类目标之间的类别关系进行无监督训练的特征优化方法,包括:将信号预处理、分帧;计算每一帧信号的能量特征;以最大化类间距离、最小化类内距离为准则进行训练,得到一个无监督特征优化网络;对得到的特征优化器,将特征优化器与后端的分类器进行联合训练,分类器的softmax准则与无监督的优化准则共同指导特征优化网络的权重更新。最终在实际的应用中将原始采集到的信号特征通过固定参数的特征优化器,即可获得更具判别性的特征,以此新的特征训练新的分类模型,可以有效提高模型的分类性能。
如图1所示,本发明提出了一种基于无监督特征优化的信号分类方法,包括以下步骤:
步骤101:将音频信号进行分帧;
取N个采样点作为一帧信号,对每一帧数字信号先补零到N点,N=2i,i为正整数;然后,对每一帧的信号进行加窗或预加重处理,加窗函数采用汉明窗(hamming)或哈宁窗(hanning),利用窗函数对信号进行分帧,窗函数的长度即为帧长沿时间序列进行N/2个点的移动,得到第二帧信号,以此类推;直至分帧结束。
步骤102:基于步骤101的分帧信号,提取基础的基于能量的时频分类特征;
对t时刻的数字信号进行快速傅里叶变换,得到t时刻的数字信号的离散频谱为:
其中,yt,n表示t时刻的第n个采样点的信号的值,Yt,f(f=0,1,…N-1)表示信号在t时刻的第f个频点的傅里叶变换系数。
然后对指定的频率范围设计滤波器组,将变换后的频谱通过滤波器组后,计算每个滤波器内的信号能量,能量值取对数后即为需要的特征值;滤波器的数量对应着特征的维度;
步骤103:对步骤102得到的时频特征以最大化类间距离、最小化类内距离为准则进行训练,得到一个无监督特征优化网络,具体为:
如图2所示,对于每一批的训练数据,输入样本包括N个样本xi及其对应的类别yi∈{1,2,...,Y}。样本xi为基于能量的时频分类特征;xi通过特征优化网络后得到一个向量fi,然后在一次训练中对每一个类别计算一个中心点C={c1,c2,...,cY},在之后的每次训练中更新这些中心点。对于每一批的N个训练样本,特征优化的损失函数Lfo定义为:
其中D(·)定义为欧式距离:
在最小化损失函数Lfo的过程中,通过一个代价常数m,将会使得容易分类错误的那些样本能够分类到它所对应的类别中。m表示着该样本到它对应的类别中心点与到它最容易分类错误的类别中心点的相对距离。
步骤104:将无监督特征优化网络与分类器进行联合训练,具体为:
将步骤103的特征优化损失函数与分类器的softmax损失函数进行整合,以一个准则进行训练,在特征进行自我优化的同时,后端的分类器能够一定程度地指导特征优化的方向。另一方面,特征优化是以每一批训练数据为基本单元进行优化的,缺少全局的视野很容易使得优化过拟合。
联合训练的准则定义为:
Ltotal=Lfo+λLsoftmax
其中λ是一个超参数,在训练中需要人为调节,在训练中控制特征优化和softmax损失函数的比例。
对比图3(a)和图3(b)可知,本发明的方法是有效的。
本发明还提出了一种基于无监督特征优化的信号分类系统,所述系统包括:无监督特征优化网络、分类器、预处理模块、特征提取模块、优化特征提取模块和分类模块;
所述无监督特征优化网络的准则为最大化类间距离并最小化类内距离所述预处理模块,用于将待分类的信号进行预处理和分帧;
所述特征提取模块,用于提取每一帧信号的基于能量的时频分类特征;
所述优化特征提取模块,用于将每一帧信号的能量特征输入预先训练的无监督特征优化网络,输出优化特征;
所述分类模块,用于将优化特征输入预先训练的分类器,输出分类结果。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (6)
1.一种基于无监督特征优化的信号分类方法,所述方法包括:
将待分类的信号进行预处理和分帧;
提取每一帧信号的基于能量的时频分类特征;
将每一帧信号的能量特征输入预先训练的无监督特征优化网络,输出优化特征;所述无监督特征优化网络的准则为最大化类间距离并最小化类内距离;
将优化特征输入预先训练的分类器,输出分类结果;
所述方法还包括:对无监督特征优化网络与其后端的分类器进行联合训练,具体包括:
xi输入无监督特征优化网络后输出一个向量fi,然后在一次训练中对每一个类别计算一个中心点C={c1,c2,...,cY},在之后的每次训练中更新这些中心点;对于每一批训练样本,特征优化的损失函数Lfo定义为:
其中D(·)定义为欧式距离:
m为代价常数,表示该样本到它对应的类别中心点与到它最容易分类错误的类别中心点的相对距离;
所述分类器的softmax准则与无监督的优化准则,共同指导无监督特征优化网络的权重更新,则联合训练的损失函数Ltotal定义为:
Ltotal=Lfo+λLsoftmax
其中,λ是一个超参数,Lsoftmax为后端分类器的损失函数。
2.根据权利要求1所述的基于无监督特征优化的信号分类方法,其特征在于,所述将待分类的信号进行预处理和分帧:
取N个采样点作为一帧信号,对每一帧数字信号先补零到N点,N=2i,i为正整数;
对每一帧的信号进行加窗或预加重处理;
利用窗函数对信号进行分帧,窗函数的长度即为帧长沿时间序列进行N/2个点的移动,得到第二帧信号,以此类推;直至分帧结束。
4.一种基于无监督特征优化的信号分类系统,其特征在于,所述系统包括:无监督特征优化网络、分类器、预处理模块、特征提取模块、优化特征提取模块和分类模块;
所述无监督特征优化网络的准则为最大化类间距离并最小化类内距离所述预处理模块,用于将待分类的信号进行预处理和分帧;
所述特征提取模块,用于提取每一帧信号的基于能量的时频分类特征;
所述优化特征提取模块,用于将每一帧信号的能量特征输入预先训练的无监督特征优化网络,输出优化特征;
所述分类模块,用于将优化特征输入预先训练的分类器,输出分类结果;
所述无监督特征优化网络与其后端的分类器进行联合训练,具体包括:
xi输入无监督特征优化网络后输出一个向量fi,然后在一次训练中对每一个类别计算一个中心点C={c1,c2,...,cY},在之后的每次训练中更新这些中心点;对于每一批训练样本,特征优化的损失函数Lfo定义为:
其中D(·)定义为欧式距离:
m为代价常数,表示该样本到它对应的类别中心点与到它最容易分类错误的类别中心点的相对距离;
所述分类器的softmax准则与无监督的优化准则,共同指导无监督特征优化网络的权重更新,则联合训练的损失函数Ltotal定义为:
Ltotal=Lfo+λLsoftmax
其中,λ是一个超参数,Lsoftmax为后端分类器的损失函数。
5.根据权利要求4所述的基于无监督特征优化的信号分类系统,其特征在于,所述预处理模块的具体实现过程为:
取N个采样点作为一帧信号,对每一帧数字信号先补零到N点,N=2i,i为正整数;
对每一帧的信号进行加窗或预加重处理;
利用窗函数对信号进行分帧,窗函数的长度即为帧长沿时间序列进行N/2个点的移动,得到第二帧信号,以此类推;直至分帧结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911266932.XA CN112949671B (zh) | 2019-12-11 | 2019-12-11 | 一种基于无监督特征优化的信号分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911266932.XA CN112949671B (zh) | 2019-12-11 | 2019-12-11 | 一种基于无监督特征优化的信号分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112949671A CN112949671A (zh) | 2021-06-11 |
CN112949671B true CN112949671B (zh) | 2023-06-30 |
Family
ID=76226624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911266932.XA Active CN112949671B (zh) | 2019-12-11 | 2019-12-11 | 一种基于无监督特征优化的信号分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112949671B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101650944A (zh) * | 2009-09-17 | 2010-02-17 | 浙江工业大学 | 基于保类内核Fisher判别法的说话人辨别实现方法 |
CN102662167A (zh) * | 2012-04-11 | 2012-09-12 | 西北工业大学 | 一种水下目标辐射噪声信号的特征提取方法 |
CN104819846A (zh) * | 2015-04-10 | 2015-08-05 | 北京航空航天大学 | 一种基于短时傅里叶变换和稀疏层叠自动编码器的滚动轴承声音信号故障诊断方法 |
CN107256393A (zh) * | 2017-06-05 | 2017-10-17 | 四川大学 | 基于深度学习的一维生理信号的特征提取与状态识别 |
CN108846410A (zh) * | 2018-05-02 | 2018-11-20 | 湘潭大学 | 基于稀疏自动编码深度神经网络的电能质量扰动分类方法 |
CN110458071A (zh) * | 2019-08-01 | 2019-11-15 | 北京邮电大学 | 一种基于dwt-dfpa-gbdt的光纤振动信号特征提取与分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6612855B2 (ja) * | 2014-09-12 | 2019-11-27 | マイクロソフト テクノロジー ライセンシング,エルエルシー | 出力分布による生徒dnnの学習 |
-
2019
- 2019-12-11 CN CN201911266932.XA patent/CN112949671B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101650944A (zh) * | 2009-09-17 | 2010-02-17 | 浙江工业大学 | 基于保类内核Fisher判别法的说话人辨别实现方法 |
CN102662167A (zh) * | 2012-04-11 | 2012-09-12 | 西北工业大学 | 一种水下目标辐射噪声信号的特征提取方法 |
CN104819846A (zh) * | 2015-04-10 | 2015-08-05 | 北京航空航天大学 | 一种基于短时傅里叶变换和稀疏层叠自动编码器的滚动轴承声音信号故障诊断方法 |
CN107256393A (zh) * | 2017-06-05 | 2017-10-17 | 四川大学 | 基于深度学习的一维生理信号的特征提取与状态识别 |
CN108846410A (zh) * | 2018-05-02 | 2018-11-20 | 湘潭大学 | 基于稀疏自动编码深度神经网络的电能质量扰动分类方法 |
CN110458071A (zh) * | 2019-08-01 | 2019-11-15 | 北京邮电大学 | 一种基于dwt-dfpa-gbdt的光纤振动信号特征提取与分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112949671A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10699719B1 (en) | System and method for taxonomically distinguishing unconstrained signal data segments | |
US9558762B1 (en) | System and method for distinguishing source from unconstrained acoustic signals emitted thereby in context agnostic manner | |
CN108694346B (zh) | 一种基于两级cnn的船舶辐射噪声信号识别方法 | |
US20030236661A1 (en) | System and method for noise-robust feature extraction | |
CN105206270A (zh) | 一种组合pca和rbm的孤立数字语音识别分类系统及方法 | |
CN110120230B (zh) | 一种声学事件检测方法及装置 | |
Le et al. | Robust and Discriminative Speaker Embedding via Intra-Class Distance Variance Regularization. | |
JP2014026455A (ja) | メディアデータ解析装置、方法、及びプログラム | |
CN113223536B (zh) | 声纹识别方法、装置及终端设备 | |
CN111899757A (zh) | 针对目标说话人提取的单通道语音分离方法及系统 | |
CN111243621A (zh) | 一种用于合成语音检测的gru-svm深度学习模型的构造方法 | |
CN114898773A (zh) | 基于深度自注意力神经网络分类器的合成语音检测方法 | |
AU2362495A (en) | Speech-recognition system utilizing neural networks and method of using same | |
CN113628640A (zh) | 一种基于样本均衡和最大均值差异的跨库语音情感识别方法 | |
CN111354373A (zh) | 一种基于神经网络中间层特征滤波的音频信号分类方法 | |
CN112949671B (zh) | 一种基于无监督特征优化的信号分类方法及系统 | |
Singh et al. | Deep self-supervised hierarchical clustering for speaker diarization | |
CN112052880A (zh) | 一种基于更新权值支持向量机的水声目标识别方法 | |
CN115862639A (zh) | 一种基于k—均值聚类分析的人工智能语音分析方法 | |
Liu et al. | Bird song classification based on improved Bi-LSTM-DenseNet network | |
Kanisha et al. | Speech recognition with advanced feature extraction methods using adaptive particle swarm optimization | |
Amit et al. | Robust acoustic object detection | |
CN113488069B (zh) | 基于生成式对抗网络的语音高维特征快速提取方法和装置 | |
CN113538507B (zh) | 一种基于全卷积网络在线训练的单目标跟踪方法 | |
US8185490B1 (en) | Class-specific iterated subspace classifier |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |