CN117609746B

CN117609746B - 一种基于机器学习和聚类算法的盲源分离估计方法

Info

Publication number: CN117609746B
Application number: CN202311565595.0A
Authority: CN
Inventors: 刘洋; 杨雨润
Original assignee: Jiangnan University
Current assignee: Jiangnan University
Priority date: 2023-11-22
Filing date: 2023-11-22
Publication date: 2024-06-07
Anticipated expiration: 2043-11-22
Also published as: CN117609746A

Abstract

本申请涉及信号处理技术领域，提供一种基于机器学习和聚类算法的盲源分离估计方法包括：将混合信号中的观测信号变换至时频域上；提取公共信号源数据的特征，训练解码器；对混合信号进行抽样，并提取混合信号的隐藏高阶特征；利用第一聚类算法得到待估计的混合信号中每个信号源的数目以及初始聚类中心；利用第二聚类算法对初始聚类中心进行修正；分配各信号源对应的隐藏高阶特征，重新构建信号源的隐藏高阶特征，并经由训练后的解码器恢复各信号源。本申请基于机器学习以及AP聚类算法和K‑means聚类算法对信号中高阶隐藏特征的处理，能够挖掘并分类欠定盲源分离系统中混叠信号中各源信号的高阶隐藏特征，从而实现源信号的准确分离。

Description

一种基于机器学习和聚类算法的盲源分离估计方法

技术领域

本申请涉及信号处理技术领域，尤其涉及一种基于机器学习和聚类算法的盲源分离估计方法。

背景技术

盲源分离技术是一种广泛应用在通信信号处理领域的技术，同时，随着现代社会的不断发展，盲源分离技术的应用范围也越来越广，在故障诊断方面，可通过盲源分离定位故障设备；在图像处理方面，可通过盲源分离从夹杂干扰的图像中恢复原图像；在生物医学方面，可应用盲源分离完成人体生理数据的提取或分类。

在盲源分离系统中，根据源信号与观测信号数量的不同衍生出两种盲源分离问题，当源信号数量小于观测信号的数量时为超定盲源分离问题，当源信号数量大于观测信号时称为欠定盲源分离问题。在实际的场景应用中，由于源信号的数量未知且大多数情况下数量较多，而检测设备的数量由于空间的限制与价格的约束的因素是有限的，因而欠定盲源分离问题更符合实际情况。

欠定盲源分离系统作为盲源分离系统的一个分支，由于约束条件的减少，存在病态性和特殊性，常用的盲源分离算法有独立分量分析(Independent Component Analysis,ICA)、稀疏分量分析(Sparse Component Analysis,SCA)及主成分分析(PrincipalComponent Analysis,PCA)方法等。目前稀疏成分分析方法是欠定盲源分离系统中的常用方法，使用该方法解决欠定盲源分离问题通常分为两步，即首先估计混合矩阵，然后在混合矩阵已经估计出来的基础上实现源信号的重构分离。稀疏成分分析法依赖于信号在短时傅里叶变换后，能够在得到的时频域信号内具有稀疏性，即对于一个时频方向内只有一个源信号，时频域内信号稀疏性越好，分离效果越好。目前的欠定盲源分离问题中，通常为直接估计，即在时频域内直接使用聚类算法估计混合矩阵，再在估计出的混合矩阵的基础上实现信号的分离重构。但一方面，在混合矩阵的估计算法中，常用的K均值聚类、模糊C均值聚类等算法虽然具有快速简单的特点，具有良好的收敛性，但对初始聚类中心的估计敏感，而实际的欠定盲源分离过程中信号源的数目是未知的；另一方面，直接在时频域内分离重构信号的做法没有充分利用混叠信号内存在的具有更优秀稀疏性的隐藏高阶特征，限制了信号分离的性能。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

鉴于现有技术的上述缺点、不足，本申请提供一种基于机器学习和聚类算法的盲源分离估计方法，提高欠定盲源分离系统中对隐藏特征的利用率，从而实现源信号的准确分离。

本发明提供了一种基于机器学习和聚类算法的盲源分离估计方法，包括：

接收待估计的混合信号，并将所述混合信号中的观测信号变换至时频域上，得到时频域观测信号；

提取公共信号源数据的特征，训练由DBN神经网络组成的编码器以及BP神经网络组成的解码器；所述公共信号源数据包括现有环境数据、仿真数据和实际环境数据；

对所述混合信号进行抽样，并将抽样后的混合信号输入至训练完成的编码器，提取所述混合信号的隐藏高阶特征；

利用第一聚类算法对所述隐藏高阶特征进行聚类，得到所述待估计的混合信号中每个信号源的数目以及初始聚类中心；

将所述信号源数目、所述初始聚类中心以及所述隐藏高阶特征输入至第二聚类算法中，以对所述初始聚类中心进行修正，得到修正后的聚类中心；

根据所述修正后的聚类中心分配各信号源对应的所述隐藏高阶特征，重新构建所述信号源的隐藏高阶特征，并经由所述训练后的解码器恢复各信号源。

在本发明的一个实施例中，提取公共信号源数据的特征，训练由DBN神经网络组成的编码器以及BP神经网络组成的解码器，包括：

基于DBN神经网络将所述公共信号源的视频参数搬移至高维映射上，利用梯度上升法进行训练，并提取所述公共信号源的隐藏高阶特征；

利用所述公共信号源的隐藏高阶特征训练并测试BP神经网络。

在本发明的一个实施例中，对所述混合信号进行抽样，并将抽样后的混合信号输入至训练完成的编码器，提取所述混合信号的隐藏高阶特征，包括：

根据所述观测信号的路数确定所述编码器的输入端维度和所述解码器的输出端维度；

提取所述混合信号时频域的实部作为信号特征，并对所述信号特征进行归一化，以使所述信号特征值在预设阈值内。

在本发明的一个实施例中，所述第一聚类算法为AP聚类算法。

在本发明的一个实施例中，所述第二聚类算法为K-means聚类算法。

在本发明的一个实施例中，根据所述修正后的聚类中心分配各信号源对应的所述隐藏高阶特征，重新构建所述信号源的隐藏高阶特征，并经由所述训练后的解码器恢复各信号源，包括：

根据所述修正后的聚类中心分配各信号源对应的所述隐藏高阶特征，重新构建所述信号源的隐藏高阶特征，每个聚类中心所代表的信号源在每一时刻均由聚类内各点共同决定，聚类内各点所占权重由聚类内各点到聚类中心的距离决定；

所述训练后的解码器将所述隐藏高阶特征恢复为所述混合信号中各信号源的时频特征，变换回各信号源。

在本发明的一个实施例中，所述训练后的解码器将所述隐藏高阶特征恢复为所述混合信号中各信号源的时频特征，变换回各信号源，包括：

将重新构建所述信号源的隐藏高阶特征输入所述训练后的解码器，根据所述训练后的解码器得到对应的时频特征；

根据所述时频特征对各信号源进行恢复。

在本发明的一个实施例中，将所述信号源数目、所述初始聚类中心以及所述隐藏高阶特征输入至第二聚类算法中，以对所述初始聚类中心进行修正，得到修正后的聚类中心，包括：

将所述初始聚类中心输入至所述第二聚类算法中，确定聚类中心的总个数；

计算所述隐藏高阶特征中每个样本到所述初始聚类中心的距离，并将所述样本划分到距离最小的聚类中心所对应的类别中；

根据所述聚类中心所对应的类别，重新计算每个类别的聚类中心，直至聚类中心的变化小于目标值。

在本发明的一个实施例中，接收待估计的混合信号，并将所述混合信号中的观测信号变换至时频域上，得到时频域观测信号，包括：

通过短时傅里叶变换将所述观测信号变换到时频域上，得到时频域的观测信号。

在本发明的一个实施例中，所述混合信号包含语音信号以及各类调制信号。

本申请的上述技术方案相比现有技术具有以下优点：

本申请所述的一种盲源分离估计方法，基于机器学习以及AP聚类算法和K-means聚类算法对信号中高阶隐藏特征的处理，能够挖掘并分类欠定盲源分离系统中混叠信号中各源信号的高阶隐藏特征，从而实现源信号的准确分离。

附图说明

为了使本发明的内容更容易被清楚的理解，下面根据本发明的具体实施例并结合附图，对本发明作进一步详细的说明，其中：

图1示出了本申请实施例所提供的一种基于机器学习和聚类算法的盲源分离估计方法的流程图；

图2示出了本申请实施例所提供的混合信号图像及分离结果示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中的附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例，都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容，结合特定应用场景“基于机器学习和聚类算法的盲源分离估计”中，给出以下实施方式，对于本领域技术人员来说，在不脱离本申请的精神和范围的情况下，可以将这里定义的一般原理应用于其他实施例和应用场景。

本申请实施例下述方法可以应用于任何需要进行基于机器学习和聚类算法的盲源分离估计的场景，本申请实施例并不对具体的应用场景作限制，任何使用本申请实施例提供的基于机器学习和聚类算法的盲源分离估计的方案均在本申请保护范围内。

在信号的盲源分离过程中，由于目前稀疏成分分析方法是中，常用的K均值聚类、模糊C均值聚类等算法虽然具有快速简单的特点，具有良好的收敛性，但对初始聚类中心的估计敏感，而实际的欠定盲源分离过程中信号源的数目是未知的；同时，直接在时频域内分离重构信号的做法没有充分利用混叠信号内存在的具有更优秀稀疏性的隐藏高阶特征，限制了信号分离的性能。提取信号的高阶隐藏特征并解决初始聚类数目敏感是本实施例要解决的技术问题。

为便于对本申请进行理解，下面结合具体实施例对本申请提供的技术方案进行详细说明。

图1为本申请实施例所提供的一种基于机器学习和聚类算法的盲源分离估计方法的流程图。如图1所示，包括：

S101：接收待估计的混合信号，并将所述混合信号中的观测信号变换至时频域上，得到时频域观测信号。

在一些可能的实施方式中，接收待估计的混合信号，并将所述混合信号中的观测信号变换至时频域上，得到时频域观测信号，包括：

在一些可能的实施方式中，所述混合信号包含语音信号以及各类调制信号。

示例性的，以不失一般性为目标，本实施例所用信号包含语音信号及各类调制信号。

由于混叠信号在时域上几乎不具有稀疏性，但在时频域上稀疏性会有所增强，故将信号转移至时频域后做进一步处理。

具体地，通过短时傅里叶(STFT)变换将观测信号变换到时频域上，得到时频域的观测信号X(t,ω)；相关计算公式为：X(t,ω)＝AS(t,ω)，其中，X(t,ω)表示观测信号的STFT系数，为复数形式；S(t,ω)表示源信号的STFT系数。

S102：提取公共信号源数据的特征，训练由DBN神经网络组成的编码器以及BP神经网络组成的解码器；所述公共信号源数据包括现有环境数据、仿真数据和实际环境数据。

在一些可能的实施方式中，提取公共信号源数据的特征，训练由DBN神经网络组成的编码器以及BP神经网络组成的解码器，包括：

示例性的，训练编码器的具体流程为：

对DBN神经网络中的每一个RBM层进行训练，RBM为两层网络，仅包含可见层和隐藏层，使用多个RBM网络串联形成DBN网络，训练具体流程为：

网络初始化。指定单层RBM输入输出维度(X,Y)确定网络可见层节点数p、隐含层节点数l，初始化输入层、隐含层神经元之间的连接权值ω，初始化可见层偏置a，隐藏层偏置b，给定学习速率k和神经元激励函数。

隐含层输出计算。根据输入变量X＝{x₁,x₂,…,x_q,}，q为样本数，输入层和隐含层连接权值ω以及可见层偏置a，隐藏层偏置b，计算隐含层输出H＝{h₁,h₂,…,h_q,}。

RBM为无监督学习网络，其训练过程不采用反向传播方式，而是采用计算似然函数的方式，目的为最大化似然函数其中ns为样本数目P(vⁱ)表示关于可见层数据的概率分布，θ表示参数w、a、b。

迭代过程采取梯度上升方式，梯度大小为实际操作时使用对比散度算法，先令V⁽⁰⁾＝V，然后执行k步采样，利用P(h|V^(t-1)）采样出h^(t-1)，采样流程为：产生[0,1]上的随机数r；/>

并利用P(V|h^(t-1)）采样出出V^(t)，采样流程为：产生[0,1]上的随机数r；

三个参数的梯度分别计算为下式(1)至式(3)：

达成似然函数最大化后，RBM网络训练完成，本申请训练三层RBM网络用于编码器，隐藏层大小分别为1000,500,50，第一层网络的输入为监测信号的数量，网络使用tanh函数作为激活函数。

训练解码器时，由于最终输出结果作为分离后信号容易在训练数据中已知，因而采用BP神经网络进行监督学习。训练解码器的具体流程为：

网络初始化。指定输入输出维度，输入维度为50，输出维度为监测信号的数量，确定网络隐藏层数为2层各层节点数量为200，1000。初始化输入层、隐含层神经元之间的连接权值ω，初始化隐藏层偏置a，b，给定学习速率k和神经元激励函数。

输出计算，根据编码器产生的输出H，输入层和隐含层连接权值ω，i，j以及隐藏层偏置a,b，计算输出Y＝{y₁,y₂,…,y_q,}。

反向传播迭代，通过最小化误差函数对网络进行更新，使用的误差函数为

S103：对所述混合信号进行抽样，并将抽样后的混合信号输入至训练完成的编码器，提取所述混合信号的隐藏高阶特征。

在一些可能的实施方式中，对所述混合信号进行抽样，并将抽样后的混合信号输入至训练完成的编码器，提取所述混合信号的隐藏高阶特征，包括：

示例性的，对S101提取的信号数据进行抽样，提取混合信号时频域的实部作为信号特征，根据观测信号的路数决定编码器的输入端维度和解码器的输出端维度，通过公式(4)：

X_q＝sign(Re[X_q(1)])×Re[X_q]/||Re[X_q]||₂ (4)；

对其做归一化，使值保持在[-1,1]之间，Re[X_q]＝0的点位会被舍去。将抽样后信号输入训练好的编码器，提取混合信号的隐藏高阶特征。

S104：利用第一聚类算法对所述隐藏高阶特征进行聚类，得到所述待估计的混合信号中每个信号源的数目以及初始聚类中心。

在一些可能的实施方式中，所述第一聚类算法为AP聚类算法。

示例性的，利用第一聚类算法对编码器输出的隐藏高阶特征点进行聚类，得到信号源数目以及初始聚类中心，由于在计算初始聚类时，聚类的数目所代表的源信号的数目是未知的，因此在初始聚类计算中使用对聚类数量与初始聚类不敏感的AP聚类算法，具体流程为：

根据编码器输出的隐藏高阶特征构建相似度矩阵S，s(I,k)表示点i和点k之间的相似性，表示点k适合作为点i的聚类中心的程度，越大越适合。

根据相似度矩阵S计算支持度矩阵R，支持度r(I,k)从点i发送至候选聚类中心点k。反映了在考虑其他潜在聚类中心后，点k适合作为点i的聚类中心的程度。

根据支持度矩阵R计算归属度矩阵A，a(I,k)从候选聚类中心点k发送至点i。反映了在考虑其他点对点k成为聚类中心的支持后，点i选择点k作为聚类中心的合适程度。

不断迭代更新支持度R以及归属度矩阵A，直到达到设定的迭代次数；

决策矩阵E＝R+A，矩阵E对角线上的值为正的点即为初始聚类中心，初始聚类中心的数目即估计的源信号数目；

进一步的，在训练过程中，聚类算法的超参数也在更新，以实现源信号个数的准确估计。

S105：将所述信号源数目、所述初始聚类中心以及所述隐藏高阶特征输入至第二聚类算法中，以对所述初始聚类中心进行修正，得到修正后的聚类中心。

在一些可能的实施方式中，所述第二聚类算法为K-means聚类算法。

在一些可能的实施方式中，将所述信号源数目、所述初始聚类中心以及所述隐藏高阶特征输入至第二聚类算法中，以对所述初始聚类中心进行修正，得到修正后的聚类中心，包括：

示例性的，将信号源数目、初始聚类中心以及步骤S103中得到的隐藏高阶特征作为进一步聚类算法的输入，以对初始聚类中心进行修正，得到修正后的聚类中心。第二聚类算法使用K-means聚类算法，具体流程为：

将S104步骤中得到的初始聚类中心输入，作为初始聚类中心并确定K值，即聚类中心的总个数；

针对隐藏高阶特征数据集中每个样本计算它到初始聚类中心的距离并将其分到距离最小的聚类中心所对应的类中，重复此过程直至损失函数最小。

根据新得到的每个类别，重新计算每个类别的聚类中心。

重复以上过程直到聚类中心的变化小于目标值可通过训练或设置得到。

S106：根据所述修正后的聚类中心分配各信号源对应的所述隐藏高阶特征，重新构建所述信号源的隐藏高阶特征，并经由所述训练后的解码器恢复各信号源。

在一些可能的实施方式中，根据所述修正后的聚类中心分配各信号源对应的所述隐藏高阶特征，重新构建所述信号源的隐藏高阶特征，并经由所述训练后的解码器恢复各信号源，包括：

在一些可能的实施方式中，所述训练后的解码器将所述隐藏高阶特征恢复为所述混合信号中各信号源的时频特征，变换回各信号源，包括：

根据所述时频特征对各信号源进行恢复。

示例性的，根据修正后的聚类中心分配各隐藏高阶特征，对源信号的高阶隐藏特征进行搭建，并经由解码器恢复各源信号。

具体地，为保证通用性，本申请中假设每个聚类中心所代表的源信号在每一时刻均由聚类内各点共同决定，各点所占权重有各点到聚类中心的距离决定，具体大小为下式(5)；

其中，h_p表示所计算的聚类内的点，c_k表示聚类中心，b的大小为且/>

根据重新搭建的高阶隐藏特征，对源信号进行逐个恢复。

具体地，将搭建好的新的聚类中心的高阶隐藏特征输入进解码器，根据训练好的解码器得到对应的时频特征。

根据新获得的信号时频特征对信号进行恢复。

图2为本申请基于上述实施例中使用的的混合信号图像及分离结果，通过图2可以看出来，本申请能够挖掘并分类欠定盲源分离系统中混叠信号中各源信号的高阶隐藏特征，从而实现源信号的准确分离。

综上所述，本申请实施例提供的一种基于机器学习和聚类算法的盲源分离估计方法，通过接收待估计的信号数据，将观测信号变换至时频域上；提取已有环境数据、仿真数据和实际环境数据的特征来训练由DBN神经网络及bp神经网络组成的编码器和解码器；对提取的信号数据进行抽样，将抽样后信号输入训练好的编码器，提取混合信号的隐藏高阶特征；利用第一聚类算法对编码器输出的隐藏高阶特征点进行聚类，得到信号源数目以及初始聚类中心；将信号源数目、初始聚类中心以及隐藏高阶特征作为第二聚类算法的输入，以对第一聚类中心进行修正，得到修正后的聚类中心；根据修正后的聚类中心分配各隐藏高阶特征，对源信号的高阶隐藏特征进行搭建，并经由解码器恢复各源信号。本申请能够挖掘并分类欠定盲源分离系统中混叠信号中各源信号的高阶隐藏特征，从而实现源信号的准确分离。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。

显然，上述实施例仅仅是为清楚地说明所作的举例，并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.一种基于机器学习和聚类算法的盲源分离估计方法，其特征在于，包括：

根据所述修正后的聚类中心分配各信号源对应的所述隐藏高阶特征，重新构建所述信号源的隐藏高阶特征，并经由训练后的解码器恢复各信号源。

2.根据权利要求1所述的盲源分离估计方法，其特征在于，提取公共信号源数据的特征，训练由DBN神经网络组成的编码器以及BP神经网络组成的解码器，包括：

3.根据权利要求1所述的盲源分离估计方法，其特征在于，对所述混合信号进行抽样，并将抽样后的混合信号输入至训练完成的编码器，提取所述混合信号的隐藏高阶特征，包括：

4.根据权利要求1所述的盲源分离估计方法，其特征在于，所述第一聚类算法为AP聚类算法。

5.根据权利要求1所述的盲源分离估计方法，其特征在于，所述第二聚类算法为K-means聚类算法。

6.根据权利要求1所述的盲源分离估计方法，其特征在于，根据所述修正后的聚类中心分配各信号源对应的所述隐藏高阶特征，重新构建所述信号源的隐藏高阶特征，并经由所述训练后的解码器恢复各信号源，包括：

7.根据权利要求6所述的盲源分离估计方法，其特征在于，所述训练后的解码器将所述隐藏高阶特征恢复为所述混合信号中各信号源的时频特征，变换回各信号源，包括：

根据所述时频特征对各信号源进行恢复。

8.根据权利要求1所述的盲源分离估计方法，其特征在于，将所述信号源数目、所述初始聚类中心以及所述隐藏高阶特征输入至第二聚类算法中，以对所述初始聚类中心进行修正，得到修正后的聚类中心，包括：

9.根据权利要求1所述的盲源分离估计方法，其特征在于，接收待估计的混合信号，并将所述混合信号中的观测信号变换至时频域上，得到时频域观测信号，包括：

10.根据权利要求1所述的盲源分离估计方法，其特征在于，所述混合信号包含语音信号以及各类调制信号。