CN108846346B - 基于密度峰值聚类算法的神经元峰电位在线分类方法 - Google Patents

基于密度峰值聚类算法的神经元峰电位在线分类方法 Download PDF

Info

Publication number
CN108846346B
CN108846346B CN201810575804.2A CN201810575804A CN108846346B CN 108846346 B CN108846346 B CN 108846346B CN 201810575804 A CN201810575804 A CN 201810575804A CN 108846346 B CN108846346 B CN 108846346B
Authority
CN
China
Prior art keywords
clustering
peak
class
density
potential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810575804.2A
Other languages
English (en)
Other versions
CN108846346A (zh
Inventor
杨泽兰
任轶佐
张韶岷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201810575804.2A priority Critical patent/CN108846346B/zh
Publication of CN108846346A publication Critical patent/CN108846346A/zh
Application granted granted Critical
Publication of CN108846346B publication Critical patent/CN108846346B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Abstract

本发明公开了一种基于密度峰值聚类算法的神经元峰电位在线分类方法,包括以下步骤:通过降维和特征提取,提取信号的波形特征向量;使用密度峰值聚类算法对特征向量进行聚类,随后使用线性判别式分析等分类方法寻找与当前聚类结果对应的最佳分类的投影空间以及峰电位投影得到的特征向量;通过迭代方法找到最佳投影空间并得到聚类结果,将测试峰电位映射到投影空间后进行分类。本发明方法具有抗噪性好、复杂度低、无监督、在线分类的特点,并且可以做到完全自动,不需要人为参与,可以适用于无线植入式脑‑机接口。

Description

基于密度峰值聚类算法的神经元峰电位在线分类方法
技术领域
本发明属于神经元峰电位信号在线处理领域,具体涉及一种基于密度峰值聚类算法的神经元峰电位在线分类方法。
背景技术
神经元峰电位信号(Spike)具有时空分辨率高、信息量大的特点,是对复杂任务的实时精确控制的重要手段,峰电位分类是峰电位信号处理的重要步骤之一,但目前的方法主要依赖于人工或半人工处理。随着多通道神经集群记录技术的发展,同步记录的神经元通道数急剧增加,从原有的几十个通道向上千个通道发展,目前的人工和半人工方法已经无法应对。另一方面,记录通道数的增加对于数据的传输和存储也提出了巨大的挑战,高通量神经数据的约简可提高数据处理的实时性,推动在线脑-机接口等技术的发展。此外,该神经信号的无线传输可以减少电缆穿过头皮引发的感染,也不会限制实验中动物的移动。因此,亟需实现一种完全自动、无监督、复杂度低的神经元峰电位在线分类算法。
发明内容
本发明提供了一种基于密度峰值聚类算法的神经元峰电位在线分类方法,通过密度峰值聚类算法进行聚类、计算特征空间,并在循环迭代的过程中提高特征空间对类的区分能力,实现对神经元峰电位的完全自动、无监督聚类,准确率高,复杂度低。
一种基于密度峰值聚类算法的神经元峰电位在线分类方法,通过以下步骤实现:
(1)对训练数据进行降维处理,获得转换矩阵以及多个特征向量;每个峰电位波形使用多个特征向量表示;
如利用主成分分析获得投射矩阵以及三个最大的主成分,每个峰电位波形可以使用三个主成分构成的特征向量表示;
(2)应用密度峰值聚类法(Density Peaks Clustering)在特征向量空间对数据进行聚类,得到聚类结果L;
所述的密度峰值聚类法主要使用了向量的局部密度ρ和到局部密度比自身大的点的最小距离δ,具体方法如下:
(a)第i个点局部密度的计算方式为
Figure BDA0001686865660000011
其中dij是特征向量yi与yj的距离,dc是截断距离,n为峰电位的总数量,i与j是峰电位序号;
(b)第i个点到局部密度比自身大的点的最小距离δi以及对应的点序号n_upi的计算方式为
Figure BDA0001686865660000021
(c)计算λi=δiρi,选择λ最大的K个特征向量为聚类中心,n_upi=i,按照ρ从大到小的顺序,使用
Figure BDA0001686865660000022
为特征向量分类,最后将类标号改为1~K之间的数。
步骤(2)使用两个指标,向量的局部密度ρ和到局部密度比自身大的点的最小距离δ,局部密度的计算方式为
Figure BDA0001686865660000023
其中dij是特征向量yi与yj的距离,n为峰电位的总数量,到局部密度比自身大的点的最小距离以及对应的点n_upi的计算方式为:
Figure BDA0001686865660000024
参数λi=δiρi,选择λ最大的K个特征向量最为聚类中心,n_upi=i,按照ρ从大到小的顺序,使用
Figure BDA0001686865660000025
为特征向量分类,最后将类标号改为1~K之间的数;
(3)按照现有的聚类结果L使用有监督降维方法(如线性判别分析,LinerDiscriminant Analysis,LDA等)来得到具有区分力的子空间投射矩阵W和特征向量Y,并将L赋给L_pre;使用密度峰值聚类法在新的特征空间对数据进行聚类,得到聚类结果L;重复本步骤直至满足迭代终止条件;迭代终止条件为:达到最大迭代次数或最近两次聚类的重合度大于等于99.5%。其中重合度定义为:两次聚类都在同一类的峰电位占所有峰电位的比例。其中同一类定义为:新聚类结果中聚类中心所在的类与其在上一次聚类结果中所在的类对应为同一类。
有监督降维方法是本方法中的一个步骤,实现对聚类结果L做降维。该步骤除了LDA之外,也可以用其他类似的方法代替。
该过程称为DR_DP聚类算法(Dimension Reduction&Density Peak Clustering);
密度峰值聚类法中,类的数目固定为特定类数K;选取局部密度与更高密度点的最小距离乘积最大的K个点位作为聚类中心;使用高斯核计算局部密度ρ。
(4)采用戴维森堡丁指数作为分类评估指标,将两个相似的类进行合并;采用任意两类别的戴维森堡丁指数(类内距离平均距离之和除以两聚类中心距离)作为聚类评估参数,并将聚类评估参数的平均值与系数的乘积作为标准聚类评估参数。
所所述的聚类评估指标戴维森堡丁指数,具体方法如下:
第i类与第j类的戴维森堡丁指数的计算方式为
Figure BDA0001686865660000031
用于比较判断的阈值为
Figure BDA0001686865660000032
其中K为分类的类别总数,n为峰电位的总数量,α为系数。
(5)计算测试数据对应特征向量到每一个类中心的特征空间距离,对其进行分类;对测试数据进行分类,将测试数据投射到特征空间,得到特征向量后,根据与类中心的欧氏距离判断其所属类。
在对峰电位波形进行聚类分析时,需要进行特征提取和聚类:
常用的特征提取方法中,提取幅值、波宽等特征,此类方法计算简单、运算量小,但由于其对峰电位的识别力低,并且需要人为参与,灵活性较差;而基于主成分分析、小波变化的方法准确率虽高,但需要的数据量较大,占据较大存储。常用聚类算法中,k-均值、超顺磁聚类、高斯混合模型等运算量大,抗噪性较差。
本发明使用维度约简方法提取信号的波形特征向量;使用密度峰值聚类算法对特征向量进行聚类,随后使用线性判别式分析等分类方法寻找与当前聚类结果对应的最佳分类的投影空间以及峰电位投影得到的特征向量;通过迭代方法找到最佳投影空间并得到聚类结果,将测试峰电位映射到投影空间后进行分类。本发明具有抗噪性好、复杂度低、无监督的特点,并且可以做到完全自动,不需要人为参与,可以适用于无线植入式脑-机接口。
附图说明
图1为方法流程图,X_data:训练数据;X_test:测试数据;W0:投影矩阵W初始值;L:聚类结果。
图2为DR_DP聚类算法流程图,其中,Y:特征向量;W:投射矩阵;L:聚类得到的类标;L_pre:上一次迭代得到的聚类结果;ck:第k类聚类中心的序号;ite:迭代系数;maxIte:最大循环次数;minIte:最小循环次数;NR:异常值数量在所有数据点中所占的比例;SR:两次聚类结果相同的数据点在所有数据点中所占的比例。
图3为数据在主成分空间的投影图。
图4为数据在DR_DP聚类后得到的特征空间的投影图。
图5为聚类中心的峰电位波形对比图。
具体实施方式
下面结合附图和实施例,对本发明基于密度峰值聚类算法的神经元峰电位在线分类方法做详细描述。
实施例1一种基于密度峰值聚类算法的神经元峰电位在线分类方法,包括以下步骤:
图1是该方法流程图。
(1)对训练数据进行主成分分析,获得投射矩阵以及三个最大的主成分;每个峰电位波形使用三个主成分构成的特征向量表示。
(2)使用密度峰值聚类法在主成分特征空间对数据进行聚类,得到聚类结果L。计算向量的局部密度ρ和到局部密度比自身大的点的最小距离δ。
局部密度的计算方式为
Figure BDA0001686865660000041
其中dij是特征向量yi与yj的距离,n为峰电位的总数量。
到局部密度比自身大的点的最小距离以及对应的点n_upi的计算方式为
Figure BDA0001686865660000042
计算λi=δiρi,选择λ最大的K个特征向量最为聚类中心,n_upi=i,按照ρ从大到小的顺序,使用
Figure BDA0001686865660000043
为特征向量分类,最后将类标号改为1~K之间的数。
例如,为了类能够尽可能分开,K=4。因为一般单通道峰电位数量不会超过4类,当类别较少时可以通过后续类的合并来使得类数目准确。
(3)按照现有的聚类结果L使用有监督降维方法(如线性判别分析,LinerDiscriminant Analysis,LDA)来得到具有区分力的子空间投射矩阵W和特征向量Y;使用密度峰值聚类法在新的特征空间对数据进行聚类,得到新的聚类结果L。
例如,密度峰值聚类法中,类的数目K=4;选取局部密度与更高密度点的最小距离乘积最大的4个点位作为聚类中心。计算数据集中特征向量彼此之间的距离,将距离升序排列,截断距离所在的位置为所有距离数目与2%的乘积。
例如,使用线性判别式分析算法对聚类结果进行有监督降维,计算投射矩阵W的具体方法如下:
矩阵S的最大的3个特征值和其对应的特征向量为w1、w2、w3,即W=[w1,w2,w3]。
其中S计算公式如下:
S=(Sw+0.1E)-1*Sb,SW是类内散度矩阵,Sb是类间散度矩阵,E是单位矩阵。
类内散度矩阵的计算方式为
Figure BDA0001686865660000051
其中K为分类的类别总数,xi为第k类的一个峰电位波形数据,μk为第k类波形的均值,nk为第k类中峰电位的数量,n为峰电位的总数量。
类间散度矩阵的计算方式为
Figure BDA0001686865660000052
其中K为分类的类别总数,μk为第k类峰电位的均值,μ为所有峰电位的均值,nk为第k类中峰电位的数量,n为峰电位的总数量。
(4)重复步骤(3)三次以上直至满足迭代终止条件,迭代终止条件为:达到最大迭代次数或相邻两次聚类的重合度大于等于99.5%。其中重合度定义为:两次聚类都在同一类的峰电位占所有峰电位的比例。其中同一类定义为:新聚类结果中聚类中心所在的类与其在上一次聚类结果中所在的类对应为同一类。
例如,最大迭代次数maxIte=100。聚类结果L的第三个聚类中心序号为278,其在上一次聚类结果中是第二类,即L_pre278=2,那么如果Li=3,L_prei=2,说明第i个峰电位两次都分在同一类。
图2为DR_DP算法,即步骤(3)与步骤(4)的流程图。
图3为峰电位经过PCA降维后的空间投影。
图4为峰电位经过LDA_DP降维后的在特征空间的投影。
对比图3与图4,可以看出图4中类与类之间的区别更为明显,类内距离更近,类间距离更远。
(5)将两个相似的类进行合并。
计算任意两类别的戴维森堡丁指数(类内距离平均距离之和除以两聚类中心距离)作为聚类评估参数,并将聚类评估参数的平均值与系数的乘积作为聚类评估参数的阈值。
如果两个类别的聚类评估参数大于标准聚类评估参数,则两个类别是同一个类别,合并为同一类。类中心为类标号小的那一类的类中心。
在判断类是否需要合并的时候,使用了戴维森堡丁指数DB作为聚类指标,考虑了特征空间内类内紧密型CP和类与类间隔性SP,具体的计算方法如下:
戴维森堡丁指数的计算方式为
Figure BDA0001686865660000053
用于比较判断的阈值为
Figure BDA0001686865660000061
其中K为分类的类别总数,n为峰电位的总数量,α为系数。
评价类内部紧密型的计算方式为
Figure BDA0001686865660000062
其中yi是第k类Ck中的一个特征向量,yck是Ck的中心,|Ck|是Ck的样本数量。
评价类与类间隔型的计算方式为SPij=||yci-ycj||,其中SPij是类Ci中心yci与类Cj的中心ycj的距离。
例如,α设为1.4。
图5为聚类中心的峰电位波形对比图。峰电位通过聚类被聚成三类,三种峰电位的形状差异明显。
(6)对测试数据进行分类
将测试数据与投射矩阵的逆矩阵相乘,得到特征向量,计算特征向量到每一个类中心的欧式距离,最近的类中心所在的类就是该数据所在的类。

Claims (2)

1.一种基于密度峰值聚类算法的神经元峰电位在线分类方法,其特征在于,通过以下步骤实现:
(1)对训练数据进行降维处理,获得转换矩阵以及多个特征向量,每个峰电位波形使用多个特征向量表示;
(2)使用密度峰值聚类法在特征向量空间对数据进行聚类,得到聚类结果L;
(3)按照现有的聚类结果L使用有监督降维方法来得到具有区分力的子空间转换矩阵W和特征向量Y,并将L赋给L_pre;使用密度峰值聚类法在新的特征空间对数据进行聚类,得到聚类结果L,重复本步骤直至满足迭代终止条件;
(4)采用戴维森堡丁指数作为分类评估指标,将两个相似的类进行合并;采用任意两类别的戴维森堡丁指数,作为聚类评估参数,并将聚类评估参数的平均值与系数的乘积作为标准聚类评估参数;
(5)计算测试数据对应特征向量到每一个类中心的特征空间距离,对测试数据进行分类,将测试数据投射到特征空间,得到特征向量后,根据与类中心的欧氏距离判断其所属类;
其特征在于,步骤(2)所述的密度峰值聚类法使用了向量的局部密度ρ和到局部密度比自身大的点的最小距离δ,具体方法如下:
(a)第i个点局部密度的计算方式为
Figure FDA0003292053540000011
其中dij是特征向量yi与yj的距离,dc是截断距离,n为峰电位的总数量,i与j是峰电位序号,
(b)第i个点到局部密度比自身大的点的最小距离δi以及对应的点序号n_upi的计算方式为
Figure FDA0003292053540000012
(c)计算λi=δiρi,选择λ最大的K个特征向量为聚类中心,n_upi=i,按照ρ从大到小的顺序,使用
Figure FDA0003292053540000013
为特征向量分类,最后将类标号改为1~K之间的数;
所述步骤(3)迭代终止条件为达到最大迭代次数或最近两次聚类的重合度大于等于99.5%,其中重合度定义为:两次聚类都在同一类的峰电位占所有峰电位的比例,其中同一类定义为:新聚类结果中聚类中心所在的类与其在上一次聚类结果中所在的类对应为同一类。
2.根据权利要求1所述的一种基于密度峰值聚类算法的神经元峰电位在线分类方法,其特征在于,所述的戴维森堡丁指数,其特征在于,具体方法如下:
第i类与第j类的戴维森堡丁指数的计算方式为
Figure FDA0003292053540000021
用于比较判断的阈值为
Figure FDA0003292053540000022
其中K为分类的类别总数,n为峰电位的总数量,α为系数。
CN201810575804.2A 2018-06-06 2018-06-06 基于密度峰值聚类算法的神经元峰电位在线分类方法 Active CN108846346B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810575804.2A CN108846346B (zh) 2018-06-06 2018-06-06 基于密度峰值聚类算法的神经元峰电位在线分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810575804.2A CN108846346B (zh) 2018-06-06 2018-06-06 基于密度峰值聚类算法的神经元峰电位在线分类方法

Publications (2)

Publication Number Publication Date
CN108846346A CN108846346A (zh) 2018-11-20
CN108846346B true CN108846346B (zh) 2022-02-18

Family

ID=64210442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810575804.2A Active CN108846346B (zh) 2018-06-06 2018-06-06 基于密度峰值聚类算法的神经元峰电位在线分类方法

Country Status (1)

Country Link
CN (1) CN108846346B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109840558B (zh) * 2019-01-25 2022-06-17 南京航空航天大学 基于密度峰值-核心融合的自适应聚类方法
CN112971813A (zh) * 2021-01-30 2021-06-18 上海麓联智能科技有限公司 一种用于神经信号的峰电位分类系统及分类方法
CN113673355B (zh) * 2021-07-23 2023-06-23 南京信息工程大学 一种海浪波谱仪回波波形分类方法
CN114925734B (zh) * 2022-07-20 2022-11-25 浙江大学 一种基于神经拟态计算的在线神经元分类方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6606105B2 (ja) * 2014-06-02 2019-11-13 カラ ヘルス,インコーポレイテッド 振戦を治療するための抹消神経刺激用のシステム及び方法
EP2985350B1 (de) * 2014-08-14 2017-10-04 microBIOMix GmbH Verfahren zur Mikrobiom-Analyse
CN106022528B (zh) * 2016-05-26 2019-06-11 上海电力学院 一种基于密度峰值层次聚类的光伏电站短期功率预测方法
CN107563260A (zh) * 2016-06-30 2018-01-09 中国矿业大学 一种基于主成分分析和最近邻图的密度峰值聚类方法及系统
CN107016407A (zh) * 2017-03-07 2017-08-04 中国矿业大学 一种反馈式密度峰值聚类方法及系统
CN107657266B (zh) * 2017-08-03 2021-01-08 华北电力大学(保定) 一种基于改进谱多流形聚类的负荷曲线聚类方法

Also Published As

Publication number Publication date
CN108846346A (zh) 2018-11-20

Similar Documents

Publication Publication Date Title
CN108846346B (zh) 基于密度峰值聚类算法的神经元峰电位在线分类方法
Hammer et al. A seismic‐event spotting system for volcano fast‐response systems
Alnajar et al. Learning-based encoding with soft assignment for age estimation under unconstrained imaging conditions
CN107844751B (zh) 引导滤波长短记忆神经网络高光谱遥感图像的分类方法
Naik et al. Multi run ICA and surface EMG based signal processing system for recognising hand gestures
Adamos et al. NASS: an empirical approach to spike sorting with overlap resolution based on a hybrid noise-assisted methodology
CN106503733A (zh) 基于na‑memd和gmm聚类的有用信号识别方法
CN109001702B (zh) 无载波超宽带雷达人体动作识别方法
CN107045624B (zh) 一种基于最大加权团的脑电信号预处理与分类方法
CN110141211B (zh) 一种基于经验模态分解的稳态视觉诱发电位的分类方法
Geng et al. Unsupervised feature selection by kernel density estimation in wavelet-based spike sorting
CN110874576A (zh) 一种基于典型相关分析融合特征的行人再识别方法
Kumar et al. Development of a novel algorithm for SVMBDT fingerprint classifier based on clustering approach
CN112750442A (zh) 一种具有小波变换的朱鹮种群生态体系监测系统及其小波变换方法
Haggag et al. Cepstrum based unsupervised spike classification
Zhao et al. A hierarchical framework for drone identification based on radio frequency machine learning
Keshtkaran et al. Unsupervised spike sorting based on discriminative subspace learning
Luczak et al. Spectral representation—analyzing single-unit activity in extracellularly recorded neuronal data without spike sorting
Cope et al. Classifying plant leaves from their margins using dynamic time warping
Wani Incremental hybrid approach for microarray classification
CN112465054B (zh) 一种基于fcn的多变量时间序列数据分类方法
CN114358191A (zh) 一种基于深度自动编码器的基因表达数据聚类方法
Mureșan et al. Spike sorting using Superlets: Evaluation of a novel feature space for the discrimination of neuronal spikes
Li et al. Strangeness based feature selection for part based recognition
Buccino et al. Real-time spike sorting for multi-electrode arrays with online independent component analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant