CN116257780A

CN116257780A - 基于盲信号分离的无监督特征提取和自适应的dbscan聚类方法

Info

Publication number: CN116257780A
Application number: CN202310150834.XA
Authority: CN
Inventors: 张峻宁; 唐波; 胡远泽; 王海; 史英春; 黄中瑞; 秦立龙; 张硕; 王贵生; 樊甫华
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2023-02-22
Filing date: 2023-02-22
Publication date: 2023-06-13

Abstract

本发明公开了一种基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，包括如下步骤：应用CPC从未知发射源信号的高维数据中提取出有用特征，然后使用DBSCAN对提取出的有用特征进行聚类；在聚类的过程中引入相空间方法来确定DBSCAN算法的相关参数，采用相空间重构来提取时间序列的非线性特征参数嵌入维数m和延迟时间τ，将其分别视为DBSCAN算法的参数minPts和参数ε，通过相空间重构来测量未知辐射源信号数据之间的密度，自适应地设置参数。所述方法具有较高的精度和较强的泛化能力。

Description

基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法

技术领域

本发明涉及信号处理方法技术领域，尤其涉及一种基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法。

背景技术

随着无线通信和人工智能的快速发展，现代战场电磁环境变得复杂多变。特别是识别未知电磁信号对于抢占作战机会具有重要意义。然而，在实际战场中，标记发射器信号样本的数量是不够的。为了识别未知发射器，需要以有效和快速的方式对接收信号进行盲聚类，这是电子侦察系统的关键部分，并在世界范围内引起广泛关注，取得了一定的结果。

尽管如此，由于发射器信号环境复杂，传统的基于发射器信号数据库参数比较的信号聚类算法无法完成这一任务。迫切需要探索高效、智能的算法来提高未知发射源信号的分选精度。聚类算法由于其无监督学习和对先验知识的低要求，已广泛应用于发射器信号聚类。经典的K-means聚类算法最近被广泛使用。然而，它的初始聚类中心和聚类数需要手动设置，对于非凸数据集很难收敛，并且对噪声和异常值很敏感。

随着大数据和人工智能的快速发展，传统的聚类算法已经不能满足日益增长的需求，而基于深度神经网络的聚类方法已经成为一个热门的研究方向。基于粒子群优化(PSO-DBSCAN)和半监督条件生成对抗网络(SCGAN)的基于密度的应用空间聚类已被设计用于处理未知单脉冲雷达信号。提出了一种深度转移聚类(DTC)模型，自然地将特征学习与深度聚类相结合；此外，进一步采用了转移学习机制来改进嵌入式卷积神经网络(CNN)模型的特征提取，这被证明在聚类无线电信号中实现了改进的性能。

然而，现有的深度聚类算法受到目标函数容易退化、泛化能力差、训练不稳定以及无监督神经网络表达不足的困扰。

发明内容

本发明所要解决的技术问题是如何提供一种具有较高的精度和较强的泛化能力的基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法。

为解决上述技术问题，本发明所采取的技术方案是：一种基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，包括如下步骤：

应用对比预测编码(CPC)从未知发射源信号的高维数据中提取出有用特征，然后使用带噪声应用空间聚类(DBSCAN)对提取出的有用特征进行聚类；

在聚类的过程中引入相空间方法来确定DBSCAN算法的相关参数，采用相空间重构来提取时间序列的非线性特征参数嵌入维数m和延迟时间τ，将其分别视为DBSCAN算法的参数minPts和参数ε，通过相空间重构来测量未知辐射源信号数据之间的密度，自适应地设置参数。

采用上述技术方案所产生的有益效果在于：所述方法应用对比预测编码CPC从高维数据中提取有用的表示信息，然后使用DBSCAN对学习的特征进行聚类；考虑到DBSCAN的参数设置倾向于陷入局部最优解，引入相空间理论来确定相关参数。通过重构相空间来测量数据之间的密度，可以自适应地设置参数(MinPts和ε)。仿真结果表明，该方法在通信信号盲聚类中取得了最先进的性能，具有较高的精度和较强的泛化能力。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1是本发明实施例所述方法的流程图；

图2是本发明实施例中CPC框架图；

图3是本发明实施例中DBSCAN相关概念示意图；

图4a是本发明实施例中点之间存在的三种关系图(p可从q直接达到的密度，q可从p直接达到的密度)；

图4b是本发明实施例中点之间存在的三种关系图(p可从q达到的密度，q可从p达到的密度)；

图4c是本发明实施例中点之间存在的三种关系图(p和q密度通过o彼此连接)；

图5a-5f分别是本发明实施例中LFM、CP、P3、QFSK、BFSK以及BPSK的仿真信号的时域图；

图6a-图6d分别是本发明实施例中求第一类样本的前四个信号的延迟时间τ的互信息方法；

图7是本发明实施例中Cao方法求出第一类信号的嵌入维数m；

图8a-8f分别是本发明实施例中计算第一类数据前六个样本的相关维数和Kolmogorov熵的GP算法曲线图；

图9a-9f分别是本发明实施例中Rosenstein方法计算第一类数据前六个样本的最大Lyapunov指数曲线图；

图10a-10f分别是本发明实施例中计算第一类数据前六个样本的赫斯特系数的重标范围法的曲线图；

图11a是本发明实施例中用于提取CPC特征的训练集的损失曲线图；

图11b是本发明实施例中用于提取CPC特征的验证集的损失曲线图；

图12a-12d分别是本发明实施例中采用相同CPC特征提取方法的第一类模拟信号的四种聚类方法的结果；

图13a-13d分别是本发明实施例中测量信号的四种聚类方法的结果图。

具体实施方式

下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。

总体的，如图1所示，本发明实施例公开了一种基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，所述方法包括如下步骤：

本申请所述方法旨在将独特的特征提取和参数设置技术引入DBSCAN框架，以改善信号盲聚类过程中分类精度低、算法泛化能力弱等问题。

基于CPC的未知发射源信号特征提取

CPC是一种通用的无监督学习方法，用于从高维数据中提取有用的表示。关键在于通过使用强大的自回归模型预测潜在空间中的未来来学习表示。步骤如下：首先，将高维数据压缩到一个更紧凑的潜在嵌入空间，其中条件预测更容易建模。其次，在潜在空间中使用强大的自回归模型进行多步预测。最后，损失函数采用噪声对比估计，允许对整个模型进行端到端训练。

图2显示了CPC模型的架构。CPC模型通过从过去表示预测未来表示来训练，使其能够学习表示输入数据分布的“慢”特征。这是通过联合训练编码器g_enc和自动编码器g_ar来完成的。更具体地，非线性编码g_enc将观察的输入序列x_t映射到潜在表示序列z_t＝g_enc(x_t)，可能具有较低的时间分辨率。然后，自动转译器将部分潜在表示序列z_≤t总结为潜在上下文表示c_t＝g_ar(z_≤t)。为了预测未来的观测结果x_t+k，保存x_t+k和c_t之间相互信息的密度比建模如下：

用于联合训练编码器和自动编码器的InfoNCE损失函数基于噪声对比估计和重要性采样。给定一组X＝{₁,…x_N}的N个随机样本，其中包含来自p_k(_t+k|_t)和N-1个正样本和来自“建议”分布p(_t+k)，InfoNCE损失函数定义如下：

CPC模型已应用于各种领域，如语音、图像和自然语言。本文创造性地将CPC模型应用于未知辐射源信号的特征提取。具体过程如下：首先，需要降低未知发射器信号的过高维数。然后，分别设计了CPC的主干、特征提取分支和回归分支。

本申请中的编码器g_enc架构包括跨接CNN，其直接运行在通过Matlab仿真获得的公共调制信号和FSK发射器的测量信号上。采用了三个具有跨步[4，2，2]、内核大小[8，6，4]和512个具有ReLU激活的隐藏单元的卷积层。然后，将GRU RNN用于模型的自回归部分，g_ar具有256维隐藏状态。每个时间步的GRU输出被用作上下文c，从中使用对比损失预测未来的12个时间步。

基于改进DBSCAN的未知发射器信号的特征分类

DBSCAN聚类模型：

DBSCAN将聚类定义为密度连接点的最大集合，它可以将具有足够高密度的区域划分为聚类，并可以在噪声空间数据库中找到任意形状的聚类。DBSCAN通过使用两个参数来表征“密度/稀疏性”：

(1)ε-点的邻域：如果两点之间的距离小于指定的ε，则它们将是同一个簇。

(2)MinPts：相邻点数目的阈值。

基于此，DBSCAN将空间中的点分为三种：

(1)核心点：该点至少覆盖ε-邻域中的MinPts点(包括核心点本身)。

(2)边界点：该点在ε-邻域中覆盖小于MinPts的点，并且与核心点的距离小于ε。

(3)离群点：该点既不是核心点，也不是边界点，不属于任何簇。

基于上述点的定义，点之间存在三种关系：

(1)直接密度可达：如果点p在核心点q的ε邻域内，则p是从q直接密度可达的。

(2)密度可达：如果有一个点链p₁,…,p_n,p₁＝q，p_n＝p，使得p_i+1是从p_i直接密度可达的，那么点p是从q可达的密度。

(3)密度连通：如果有一个点o，使得p和q都是从o可达的密度，那么点p是从q可达的密度连通。

未知辐射源信号的相空间重构

作为非线性动力学中混沌系统理论的一个基本部分，相空间重构可以使用一维(1D)空间中的观测部分恢复非线性系统。由于发射器内部硬件的相互作用，发射器信号产生非线性动力学特性。重构的相位空间可以更好地描述发射器信号样本之间的相对距离。因此，利用相空间理论来估计DBSCAN算法的参数。

“相”是一种状态，相空间重构是指从一维时间序列中重构拓扑上等价于原始动力系统的状态矩阵。延迟坐标重建被广泛用于一维时间序列的相空间重建。本质上，它旨在通过选择延迟时间τ和嵌入维数m，将1D时间序列{x₁,x₂,x₃,...,x_n}转换为相空间矩阵。

重构的相空间矩阵具有n-(m-1)τ行向量和m列向量。也就是说，非线性系统在相空间中具有n-(m-1)个τ向量，每个向量具有m个维度。

所有采样信号被认为属于混沌空间，其中每个样本属于一个单元。相位空间矢量包括几个单元；然后，重构的相空间矩阵由具有不同距离的行向量组成。只有当相邻距离小于某个阈值时，该单元才能形成相邻向量。因此，连接所有样本的特征向量。例如，当将1000个向量维度为32的样本级联以形成单个混沌空间时，该1D信号的维度为32000。接下来，计算相位空间的延迟时间τ和嵌入维数m。延迟时间τ和嵌入维数m与DBSCAN算法中的参数(密度/稀疏性)相似。因此，需要计算相位空间的相关参数并将其应用于DBSCAN。具体流程如下。

1)计算延迟时间τ的互信息方法

当计算互信息时，重构的相位空间的1D信号的最小划分必须是每个向量维度单位。因此，τ必须是单个样本向量维数的倍数。

对于1D时间序列Xn＝{x₁,x₂,x₃,...,x_n}，假设该时间序列在延迟时间τ之后为X_n+τ＝{x_1+τ,x_2+τ,x_3+τ,...,x_n+τ}。考虑到X_n和X_n+τ是两个离散系统，它们的信息熵为：

其中P(x_i)和P(x_j)分别是X_n和X_n+τ中发生事件x_i和x_j的概率。

给定X_n,可以获得系统X_n+τ的信息，称为这两个离散系统的互信息，如下所示：

其中P(x_i,x_j)是事件x_i和x_j的联合分布概率。

当τ值从0以整数形式增加时，I(X_n,X_(n+τ))变为τ相关函数，表示为I(τ)。最小函数值表示两个系统的最大可能无关性，相空间重构将函数的第一个最小值的τ+1作为延迟时间。

2)计算嵌入尺寸m的Cao方法

类似地，当计算嵌入维度时，重构相位空间的1D信号的最小分区必须是每个向量维度单位。因此，m必须是单个样本向量维数的倍数。

一维时间序列是一维空间中高维混沌运动的投影。一维时间序列可以通过相空间重构恢复为高维混沌运动。当高维混沌空间投影到一维时，高维空间中的两个独立点可能变得相邻，即伪邻居。伪最近邻方法通过增加m值来去除伪邻居，打开混沌运动的轨道，并恢复原始的高维混沌运动。

在m维相空间中，每个点Xm(i)都有最近的相邻点X'm(i)，它们之间的距离是Rm(i)。相反，在m+1维相空间中，点Xm+1(i)与其最近的邻居Xm+1(i)之间的距离变为Rm+1(i)。如果两个距离之间的差异很大，则认为这两个点在高维混沌空间中不相邻。

单点坡度定义为：

相位空间中所有点的单点斜率的平均值被定义为m维相位空间中伪相邻点的估计值。

由于E₁(m)的定义如下，随着m的增加，E₁(m)趋于稳定。如果是随机信号，E₁(m)将发散。

为了定量描述E₁(m)的稳定性，引入了一个标准：

即m维空间中每个点与最近相邻点之间的平均距离与m+1维空间中的平均距离之比。对于随机信号，E₂(m)为1。对于给定信号，相关性与嵌入维数值m相关。

通过Takens定理，可以证明重构的相位空间在拓扑上等价于实际的发射器信号系统。它更容易获得相关的混沌不变量，并反映原始混沌系统的特征，使原始发射器信号系统能够在相位空间中进行分析和预测。

从观测(采样)时间序列重构动态系统相空间已广泛应用于数据处理。由于测量过程中采样精度和测量噪声的影响，重建的相位空间不可避免地失真。通常，非线性系统的不变量和重构误差可以用来比较重构的相空间与原始动态系统之间的差异。相关维数和最大Lyapunov指数是常用的非线性不变量。

3)相关维数和Kolmogorov熵的G-P算法

相关维数是指m维空间中任意两点之间的距离小于临界距离r的概率：

其中N＝n-(m-1)τ，N是相空间中的点数，h是Heaviside函数：

C_m(r)值与r相关。如果r太大，相位空间中的所有点都将包括在内，C_m(r)＝1；如果r太小，则相空间中没有点满足条件C_m(r)＝0。应用程序中的最大r值为：

S_max和S_min分别是相位空间中两个相位点之间的最大和最小距离。

随着r的增加，使用最小二乘法拟合ln(r)～ln[C_m(r)]，斜率是相关维数，直线与垂直轴的交点是Kolmogorov熵。

4)Rosenstein计算最大Lyapunov指数的方法

对于重构的相空间矩阵{Xi|I＝1,2,...n-(m-1)τ}，首先用傅里叶变换计算原始时间序列的平均周期T。然后，计算相位点Xi的每个最近邻点Xi’，并限制短期分离：

D_i(0)＝min||X_i-X_i'||,|i-i'|＞T (14)

对于相空间中的每个相位点X_i，在j个离散时间步长后计算出它与最近邻点之间的最小距离：

对于每个j，计算所有I的对数和的平均值：

其中Δt是用于数据生成的时间步长，通常设置为0.1，q是D_i(j)的数量。最大Lyapunov指数可以使用最小二乘法拟合直线的斜率来获得。

5)计算赫斯特指数的重标度范围分析

指数H的含义如下：

在实施例中，没有预测发射器信号，可以计算指数H来反映非线性系统特性。

1D离散时间序列x(n)被划分为s个子区间y_i(i＝1,2,...,s)，子区间长度为l，则n＝s×l。子区间y_i的以下参数可计算如下：

表1.重新缩放范围分析的相关参数

随着l值的增加，通过最小二乘法拟合的曲线斜率为赫斯特指数，如lnl-ln((R/S)_l)曲线中观察到的。

本申请通过CPC方法提取特征后，发射器信号可以被视为一个混沌空间。采用相空间重构来提取时间序列的非线性特征参数m和τ，它们可以分别被视为DBSCAN算法的minPts和ε。

实验与分析

1)实验信号介绍和数据描述

本申请包括两种类型的实验数据。第一类数据是通过Matlab仿真获得的20个常见调制信号，例如线性调频信号、常规脉冲信号、P3编码信号、QPSK信号、BFSK信号和BPSK信号，如图5所示。对于信号，采样点数为4096，采样率均匀为4GHz，信号持续时间为1μs，脉冲宽度为1μs，信噪比均匀为6dB。每种类型的信号有500个样本，总信号样本数为3000。

我们对FSK发射器的测量信号盲聚类，盲聚类是在没有先验知识的情况下对大量样本进行聚类，信号的具体参数设置如表2所示，测试信号样本号为3991。数据集涉及突发格式，具体参数如表3所示。

表2模拟调制信号参数

测试数据由一个文件组成，该文件连续存储来自各种辐射源的样本。每个样本包括13200个点，并且一个样本包含一个突发(突发在样本中的起始位置不是固定的)。

评价指标：

当测试样本包含先验知识时，可以使用外部指标来评估盲排序的性能。一个典型的外部指标是修改后的RI指数，其定义如下：

其中n是样本总数，i和j分别表示参考聚类结果和实际聚类结果的类标签。n_ij表示其类标签在参考聚类结果中是i而在实际聚类结果中为j的样本的数量。n_i表示参考聚类结果中类标签为i的样本数量，而n_j表示实际聚类结果中的类标签为j的样本数量。ARI的取值范围为[-1，1]。较大的值表示实际聚类结果和参考聚类结果之间的较大一致性以及较高的算法精度。

算法参数计算过程

根据前一节中的相空间重构的特征参数提取算法提取参数。基于重构的相位空间，在计算延迟时间和嵌入维数后，可以获得相关的特征参数。

以线性调频信号为例，算法的具体过程如下：

提取了第一类模拟LFM信号的特征：分别通过互信息法和CAO法计算延迟时间τ和嵌入维数m，如图6a-图6d和图7所示。

可以看出，延迟时间为5，嵌入维数为15。经过计算，样本之间的延迟时间和嵌入维度的差异最小，因此可以使用第一个样本作为代表。基于此，分别计算了前六个样本的相关维数、Kolmogorov熵、Lyapunov指数和Hurst系数，如图8a-图8f、图9a-图9f以及图10a-图10f所示。

消融研究

首先，展示模型训练和验证期间的性能变化，本部分旨在验证每个组件对整体性能的贡献。用于提取CPC特征的网络训练损失函数和验证集的损失曲线分别如图11a和图11b所示。可以看出，随着训练轮次的增加，所提出的算法的训练集损失和验证集损失都逐渐收敛。比较训练曲线和验证曲线可以发现，所提出的模型的验证精度与训练精度一致，并且没有过拟合现象，这反映了所提出模型在不同数据集上的鲁棒性。

然后，对该算法进行了烧蚀研究，以客观地验证该算法的有效性。表4显示了每种算法的5个实验的平均值作为消融结果。表4中的基础模型显示了DBSCAN算法的盲聚类性能。实验1将CPC特征提取模块添加到BS中，这大大降低了信号维度，并从时间序列维度中提取了单独的丰富特征。信号盲聚类的准确率和算法的运算速度分别提高了91.98％和23.13％，这表明CPC算法应用于雷达信号的无监督特征提取是有效的。值得注意的是，这种无监督特征提取方法有助于在没有任何先验信息的情况下进行盲信号聚类分析，尤其是在战场环境中。此外，在BS中添加了相空间技术，虽然增加了算法的操作时间，但盲聚类效果更稳定和准确(+29.14％)，表明相空间技术可以快速找到DBSCAN算法的聚类距离相关参数。此外，表4中的实验3进一步结合了CPC特征提取算法和相空间技术，其聚类性能和操作速度分别提高了160.7％和1.16％，这表明了所提出的算法在提取有效特征和快速实现信号盲聚类方面的优势。

表4添加算法步骤后的聚类结果

与现有技术的比较

为了评估所提出算法的优势，首先使用相同的特征提取方法(CPC)，然后采用不同的后端分类器进行盲信号聚类，以验证联合相位空间和DBSCAN算法在信号分类中的优势。图12a-12d显示了K均值、光谱、高斯混合模型和我们的算法的聚类效果。根据计算结果，与实际标签结果相比，本文方法的ARI为0.86。ARI值接近1表示验证标签结果更好。该方法的ARI为0.86，表明模拟信号具有良好的聚类效果。相比之下，与真实标签结果相比，GMM聚类方法的ARI为0.76，表明聚类结果不如我们的结果。相空间和DBSCAN算法相结合的特征提取可以更好地聚类模拟信号，优于GMM方法。K均值聚类和光谱聚类结果的ARI值均小于0.5，因此这两种聚类方法在测量信号中被丢弃。

本申请比较和评估了不同算法在模拟信号和测量信号数据集上的信号盲聚类性能，包括聚类精度和操作时间。表5总结了不同算法的聚类结果，更少的操作时间和更高的聚类精度ARI值表明更好的聚类性能。观察到，本申请的方法在模拟数据集上的聚类精度和操作时间方面达到了最先进的性能。具体而言，与先进的RP-DBSCAN和K-DBSCAN相比，本申请的算法的聚类精度和操作速度分别提高了13.23％、67.83％和32.47％、32.23％。虽然本申请增加了相空间技术来找到DBSCAN的最佳参数，这增加了额外的操作时间，但本申请结合CPC来降低信号的维数并提取聚类特征，这共同实现了本申请算法的性能远远领先于其他算法，因此说明了本申请的方法应用于信号盲聚类的重要性。

表5-本申请的算法与其他方法的性能比较

表6-本申请算法与原始DBSCAN方法的性能比较

对于测量信号，消融结果如表6所示。可以看出，CPC和相位空间有助于提高DBSCAN算法的性能。该方法的聚类准确率为78.3％，远高于其他方法。此外，运行时间为931s，与其他方法几乎一致。这表明，本申请的方法可以更好地对测量的发射器信号进行聚类。图13a-图13d描述了来自测量信号数据集的不同方法的可视化结果。显然，本申请的方法在未知发射器信号的聚类上表现得更好，因此可以对这些信号提供合理的区分。

根据仿真实验，对于模拟信号和测量信号，本申请的模型在精度、模型大小和模型泛化方面以快速运行速度优于所有现有的最先进的盲信号聚类方法。本申请的初步实验表明，在实时性能和精度要求下，具有工程应用价值。在未来的工作中，本申请将进一步提高模型的泛化性能，并将模型扩展到完整的认知电子战系统中。

Claims

1.一种基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，其特征在于包括如下步骤：

2.如权利要求1所述的基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，其特征在于，所述应用对比预测编码(CPC)从未知发射源信号的高维数据中提取出有用特征的具体方法包括如下步骤：

将高维数据压缩到一个更紧凑的潜在嵌入空间；

在潜在嵌入空间中使用自回归模型进行多步预测；

损失函数采用噪声对比估计，允许对整个模型进行端到端训练。

3.如权利要求1所述的基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，其特征在于：

CPC模型通过通过联合训练编码器g_enc和自动编码器g_ar完成从过去表示预测未来表示来训练，非线性编码g_enc将观察的输入序列x_t映射到潜在表示序列z_t＝g_enc(x_t)，具有较低的时间分辨率；

然后，自动转译器将部分潜在表示序列z_≤t总结为潜在上下文表示c_t＝g_ar(z_≤t)；为了预测未来的观测结果x_t+k，保存x_t+k和c_t之间相互信息的密度比建模如下：

用于联合训练编码器和自动编码器的InfoNCE损失函数基于噪声对比估计和重要性采样；

给定一组X＝{x₁,…x_N}的N个随机样本，其中包含来自p_k(x_t+k|c_t)和N-1个正样本和来自“建议”分布p(x_t+k)，InfoNCE损失函数定义如下：

4.如权利要求1所述的基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，其特征在于，DBSCAN通过使用两个参数来表征“密度/稀疏性”：

ε-点的邻域：如果两点之间的距离小于指定的ε，则它们将是同一个簇；

MinPts：相邻点数目的阈值。

5.如权利要求4所述的基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，其特征在于，DBSCAN将空间中的点分为三种：

核心点：该点至少覆盖ε-邻域中的MinPts点(包括核心点本身)；

边界点：该点在ε邻域中覆盖小于MinPts的点，并且与核心点的距离小于ε；

离群点：该点既不是核心点，也不是边界点，不属于任何簇；

点之间存在三种关系：

直接密度可达：如果点p在核心点q的ε邻域内，则p是从q直接密度可达的；

密度可达：如果有一个点链p₁,…,p_n,p₁＝q，p_n＝p，使得p_i+1是从p_i直接密度可达的，那么点p是从q可达的密度；

密度连通：如果有一个点o，使得p和q都是从o可达的密度，那么点p是从q可达的密度连通。

6.如权利要求1所述的基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，其特征在于：

相空间重构是指从一维时间序列中重构拓扑上等价于原始动力系统的状态矩阵，通过选择延迟时间τ和嵌入维数m，将一维时间序列{x₁,x₂,x₃,...,x_n}转换为相空间矩阵；

重构的相空间矩阵具有n-(m-1)τ行向量和m列向量；也就是说，非线性系统在相空间中具有n-(m-1)个τ向量，每个向量具有m个维度；

所有采样信号被认为属于混沌空间，其中每个样本属于一个单元；相位空间矢量包括几个单元；然后，重构的相空间矩阵由具有不同距离的行向量组成，只有当相邻距离小于某个阈值时，该单元才能形成相邻向量，连接所有样本的特征向量，计算相位空间的相关参数并将其应用于DBSCAN。

7.如权利要求6所述的基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，其特征在于，计算延迟时间τ具体包括如下步骤：

当计算计算延迟时间τ时，重构的相位空间的一维信号的最小划分必须是每个向量维度单位，因此，τ必须是单个样本向量维数的倍数；

对于1D时间序列Xn＝{x₁,x₂,x₃,...,x_n}，假设该时间序列在延迟时间τ之后为X_n+τ＝{x_1+τ,x_2+τ,x_3+τ,...,x_n+τ}；考虑到X_n和X_n+τ是两个离散系统，它们的信息熵为：

其中P(x_i)和P(x_j)分别是X_n和X_n+τ中发生事件x_i和x_j的概率；

/>

其中P(x_i,x_j)是事件x_i和x_j的联合分布概率；

当τ值从0以整数形式增加时，I(X_n,X_(n+τ))变为τ相关函数，表示为I(τ)；最小函数值表示两个系统的最大可能无关性，相空间重构将函数的第一个最小值的τ+1作为延迟时间。

8.如权利要求6所述的基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，其特征在于，计算嵌入维数m的具体方法包括如下步骤：

当计算嵌入维度时，重构相位空间的1D信号的最小分区必须是每个向量维度单位；因此，m必须是单个样本向量维数的倍数；

一维时间序列是一维空间中高维混沌运动的投影；一维时间序列可以通过相空间重构恢复为高维混沌运动；当高维混沌空间投影到一维时，高维空间中的两个独立点可能变得相邻，即伪邻居；伪最近邻方法通过增加m值来去除伪邻居，打开混沌运动的轨道，并恢复原始的高维混沌运动；

在m维相空间中，每个点Xm(i)都有最近的相邻点X'm(i)，它们之间的距离是Rm(i)；相反，在m+1维相空间中，点Xm+1(i)与其最近的邻居Xm+1(i)之间的距离变为Rm+1(i)；如果两个距离之间的差异很大，则认为这两个点在高维混沌空间中不相邻；

单点坡度定义为：

相位空间中所有点的单点斜率的平均值被定义为m维相位空间中伪相邻点的估计值；

随着m的增加，E₁(m)趋于稳定，如果是随机信号，E₁(m)将发散；

为了定量描述E₁(m)的稳定性，引入了一个标准：

即m维空间中每个点与最近相邻点之间的平均距离与m+1维空间中的平均距离之比；对于随机信号，E₂(m)为1；对于给定信号，相关性与嵌入维数值m相关。

9.如权利要求6所述的基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，其特征在于，相关维数和Kolmogorov熵的计算方法包括如下步骤：

其中N＝n-(m-1)τ，N是相空间中的点数，h是Heaviside函数：

C_m(r)值与r相关；如果r太大，相位空间中的所有点都将包括在内，C_m(r)＝1；如果r太小，则相空间中没有点满足条件C_m(r)＝0；应用程序中的最大r值为：

S_max和S_min分别是相位空间中两个相位点之间的最大和最小距离；

10.如权利要求6所述的基于盲信号分离的无监督特征提取和自适应的DBSCAN聚类方法，其特征在于，最大Lyapunov指数的计算方法包括如下步骤：

对于重构的相空间矩阵{Xi|I＝1,2,...n-(m-1)τ}，首先用傅里叶变换计算原始时间序列的平均周期T；然后，计算相位点Xi的每个最近邻点Xi’，并限制短期分离：

D_i(0)＝min||X_i-X_i'||,|i-i'|＞T (14)

对于每个j，计算所有I的对数和的平均值：

其中Δt是用于数据生成的时间步长，通常设置为0.1，q是D_i(j)的数量，最大Lyapunov指数可以使用最小二乘法拟合直线的斜率来获得。