CN114841214A - 基于半监督判别投影的脉搏数据分类方法及装置 - Google Patents

基于半监督判别投影的脉搏数据分类方法及装置 Download PDF

Info

Publication number
CN114841214A
CN114841214A CN202210547995.8A CN202210547995A CN114841214A CN 114841214 A CN114841214 A CN 114841214A CN 202210547995 A CN202210547995 A CN 202210547995A CN 114841214 A CN114841214 A CN 114841214A
Authority
CN
China
Prior art keywords
matrix
sample
projection
pulse
pulse data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210547995.8A
Other languages
English (en)
Other versions
CN114841214B (zh
Inventor
陈子源
高亦心
阮渊鹏
张炜寒
彭勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202210547995.8A priority Critical patent/CN114841214B/zh
Publication of CN114841214A publication Critical patent/CN114841214A/zh
Application granted granted Critical
Publication of CN114841214B publication Critical patent/CN114841214B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/90ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Alternative & Traditional Medicine (AREA)
  • Artificial Intelligence (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了基于半监督判别投影的脉搏数据分类方法及装置。具体分类方法包括:1、采集压力脉搏数据。2、对步骤1中采集到的数据进行预处理及特征提取。3、建立半监督判别投影模型,利用投影矩阵寻找最优子空间,并在该空间中进行聚类,标注无标记样本,并加入下一轮训练,实现对脉搏数据的半监督学习。4、对投影矩阵进行分析,通过求取投影矩阵的“行归一化二范数”,获取各个特征对当前任务的贡献程度。所述脉搏数据分类装置用于实现上述分类步骤。本发明通过判别投影方法,提供了一种高精度脉搏数据分类任务的工具,量化了特征重要性,取得了良好实验效果。

Description

基于半监督判别投影的脉搏数据分类方法及装置
技术领域
本发明属于信号处理技术领域,涉及脉搏数据分类处理,具体涉及基于半监督判别投影的脉搏数据分类方法及装置。
背景技术
传统中医的诊断方法包括望、闻、问、切四部分,其中“切”特指中医利用手指感受脉搏跳动而产生的“脉象”。根据中医理论,对脉搏按照其跳动的特征进行判断、分类,可以为后续的疾病诊断提供辅助。
随着脉搏信号采集系统的不断发展,出现了如自动加压脉象仪这类能够适应中医灵活切脉指法的脉诊仪器,使得脉搏数据的获取变得更为容易。针对大量的脉搏数据,通过人工识别的方式进行对比分类,是一项十分复杂且繁琐的工作。因此现有技术提出了基于马尔可夫决策链、蒙特卡罗搜索等算法的方式,对脉搏数据的特征进行研究。但是这些研究大多仅从原始脉搏数据本身,进行类别判断,而忽略了不同的特征对于不同种类脉象的表现能力,无法量化表征原始特征的重要性,因此识别效果较差。
发明内容
针对现有技术的不足,本发明提出了基于半监督判别投影的脉搏数据分类方法及装置,通过半监督学习的方式,将有标签的原始数据与无标签数据投影到子空间中,在判别能力最强的子空间中进行聚类,实现对脉搏数据的分类。
基于半监督判别投影的脉搏数据分类方法,具体包括以下步骤:
步骤1、采集脉搏数据,并将对应的身体状况信息作为该数据的标签。所述身体状况信息为:表寒、表热、表虚、表实、里寒、里热、里虚、里实或正常。
作为优选,使用薄膜压力脉搏传感器,设置采样频率fs,采集原始压力脉搏信号。
步骤2、对步骤1采集到的脉搏数据进行预处理消除噪声,然后通过快速傅里叶变换,将频率能量分布序列最大值对应的频率值的倒数作为脉搏周期。
作为优选,通过小波变换与基线漂移消除,降低由于采集过程中由于手臂轻微移动与肌肉颤抖等因素产生的噪声。
步骤3、使用步骤2计算得到的脉搏周期,将预处理后的脉搏数据划分为单周期数据,然后对每个周期内的数据提取主波幅度、主波峡幅度、重搏前波幅度、降重峡幅度、重搏波幅度,以及左心室的快速射血期时间、起始点到主波峡谷底的时间间隔、起始点到重搏前波波峰的时间间隔、左心室收缩期、左心室舒张期共10个特征。将每个脉搏周期的特征作为一个样本,各样本按列合并得到脉搏数据的样本矩阵
Figure BDA0003649938320000021
d表示特征数量,n表示单周期脉搏信号的数量。同时,对样本矩阵X进行去中心化处理,即用各个样本减去所有样本平均值,保证各特征平均值为0,以简化后序计算。并将样本矩阵X划分为两部分,其中Xl为带标记样本Xu为无标记样本。
步骤4、根据步骤3得到的样本矩阵X,建立如下半监督判别投影模型:
Figure BDA0003649938320000022
上式中,
Figure BDA0003649938320000023
为投影矩阵,m为降维之后子空间的维度。
Figure BDA0003649938320000024
为子空间聚类中心,c为标签类别数量,
Figure BDA0003649938320000025
为指示矩阵,G=[Gl,Gu],包含带标记样本指示矩阵Gl与无标记样本指示矩阵Gu,带标记样本指示矩阵Gl根据原始样本标记进行初始化,Gij=1表示第i个样本属于第j类,Gij=0表示第i个样本不属于第j类;无标记样本指示矩阵Gu中各个元素初始化为
Figure BDA0003649938320000026
表示对应样本归属于各类别的概率,在后序优化过程中会逐步对无标记样本指示矩阵Gu完成更新;Sb为类间散度矩阵,用于衡量不同样本之间的离散程度,矩阵
Figure BDA0003649938320000027
为单位矩阵;
Figure BDA0003649938320000028
为全1的列向量。上标T表示转置,Tr(·)表示求取迹,||·||F表示对矩阵求F范数。
步骤5、根据步骤4建立的半监督判别投影模型,对投影矩阵W、指示矩阵G、子空间聚类中心F进行联合迭代优化,每一轮迭代中仅更新一个参数,具体优化过程如下:
步骤5.1、初始化投影矩阵W:
Figure BDA0003649938320000029
求解得到W为XXT最大的m个特征值对应的特征向量。
步骤5.2、初始化判别中心:
Figure BDA0003649938320000031
矩阵F的取值为子空间聚类中心点,因此矩阵F的第i列Fi为:
Figure BDA0003649938320000032
其中,nk表示第k类中样本的数量,lk为第k类样本的集合,xi为样本矩阵X中的一列。
步骤5.3、固定子空间聚类中心F和投影矩阵W,更新指示矩阵G,在更新过程中仅更新Gu
Figure BDA0003649938320000033
将Gu按行分解后,转化为具有单纯形约束的二次优化问题,引入辅助变量v对分解后的每一行gT进行更新,构造的增广拉格朗日函数如下:
Figure BDA0003649938320000034
其中β为拉格朗日乘子,μ为罚因子。
依次固定v、g中的一个变量,更新另一个变量,进行迭代优化以获取局部最优解。重复上述过程,对Gu中的每一行依次进行更新,完成对指示矩阵G更新。
步骤5.4、固定指示矩阵G和投影矩阵W,更新子空间聚类中心F:
Figure BDA0003649938320000035
该问题为无约束优化问题,直接对F求导,得到更新后的子空间聚类中心F:
F=WTXG(GTG)-1 (8)
步骤5.5、固定子空间聚类中心F和指示矩阵G,更新投影矩阵W:
Figure BDA0003649938320000036
并将其转化为Trace-Ratio问题进行求解。
步骤5.6、多次重复步骤5.3~步骤5.5,直至达到最大迭代次数或步骤4中半监督判别投影模型的值达到设定阈值。
步骤6、分离步骤5迭代优化后的指示矩阵G中的无标记样本部分Gu,对Gu按行分块:
Gu=[gl+1 T,gl+2 T,…,gn T] (10)
取Gu中最大元素对应的列序作为第i个样本xi T的对应类别,完成对原始脉搏数据的分类。
步骤7、借助上述过程中获取的投影矩阵W,借助行归一化二范数获取各个特征重要性。
所获得的投影矩阵W进行如下变换:
Figure BDA0003649938320000041
其中wi表示投影矩阵W的第i行θi越大,则表示第i个特征在脉搏信号分类过程中就越具有普遍意义。利用投影矩阵W,可以对不同特征的贡献度进行差异化表示,从而有效提升了分类准确率。
基于半监督判别投影的脉搏数据分类装置,包括数据采集模块、特征提取模块、优化分类模块以及结果展示模块。
所述数据采集模块使用薄膜压力脉搏传感器,采集原始压力脉搏信号,以及对应的身体状况信息,并输入特征提取模块中。
所述特征提取模块首先对数据采集模块采集的原始压力脉搏信号进行去噪处理,再通过快速傅里叶变换,计算频率能量分布序列最大值对应的频率值的倒数,作为脉搏周期对去噪后的脉搏数据进行划分。然后按照周期对划分后的数据提取主波幅度、主波峡幅度、重搏前波幅度、降重峡幅度、重搏波幅度,以及左心室的快速射血期时间、起始点到主波峡谷底的时间间隔、起始点到重搏前波波峰的时间间隔、左心室收缩期、左心室舒张期共10个特征。统计多周期的特征值,生成脉搏数据的样本矩阵
Figure BDA0003649938320000042
将样本矩阵X划分为带标记样本Xl和无标记样本Xu。并输入优化分类模块中。其中,d表示特征数量,n表示单周期数据的数量。
所述优化分类模块根据脉搏数据的样本矩阵X,建立半监督判别投影模型:
Figure BDA0003649938320000051
式中,
Figure BDA0003649938320000052
为投影矩阵,m为降维之后子空间的维度。
Figure BDA0003649938320000053
为子空间聚类中,c为标签类别数量,
Figure BDA0003649938320000054
为指示矩阵,G=[Gl,Gu],包含带标记样本指示矩阵Gl与无标记样本指示矩阵Gu,带标记样本指示矩阵Gl根据原始样本标记进行初始化,Gij=1表示第i个样本属于第j类,Gij=0表示第i个样本不属于第j类;无标记样本指示矩阵Gu中各个元素初始化为
Figure BDA0003649938320000055
表示对应样本归属于各类别的概率,在后序优化过程中会逐步对无标记样本指示矩阵Gu完成更新;Sb为类间散度矩阵,用于衡量不同样本之间的离散程度,矩阵
Figure BDA0003649938320000056
为单位矩阵;
Figure BDA0003649938320000057
为全1的列向量。上标T表示转置,Tr(·)表示求取迹,||·||F表示对矩阵求F范数。
然后对投影矩阵W、指示矩阵G、子空间聚类中心F进行联合迭代优化,每一轮迭代中仅更新一个参数。重复联合迭代优化过程,直至达到最大迭代次数或所述半监督判别投影模型的值达到设定阈值。
所述结果展示模块根据优化分类模块的分类结果,输出标签未知的原始压力脉搏信号对应的身体状况信息。
本发明具有以下有益效果:
通过对一个单周期脉搏信号中的多个特征进行抽取,借助投影矩阵的行归一化二范数,可以实现对特征重要性的量化评定,为脉搏数据分类提供了一种有效工具,增强了脉搏分类算法的鲁棒性与准确度。
附图说明
图1为脉搏数据分类流程图;
图2为脉搏数据分类装置结构框图。
具体实施方式
以下结合附图对本发明作进一步的解释说明。
如图1所示,基于半监督判别投影的脉搏数据分类方法,具体包括以下步骤:
步骤1、使用薄膜压力脉搏传感器,设置采样频率fs,采集原始脉搏数据,并将对应的身体状况信息作为该数据的标签。所述身体状况信息为:表寒、表热、表虚、表实、里寒、里热、里虚、里实或正常。
步骤2、考虑到脉搏信号为非平稳信号,因此,对步骤1得到的原始脉搏数据进行小波变换降噪,并对其做基线漂移消除,降低由于采集过程中由于手臂轻微移动与肌肉颤抖等因素对数据的影响。然后通过快速傅里叶变换,将频率能量分布序列最大值对应的频率值的倒数作为脉搏周期。
步骤3、使用步骤2计算得到的脉搏周期,将预处理后的脉搏数据划分为单周期数据,然后对每个周期内的数据提取主波幅度、主波峡幅度、重搏前波幅度、降重峡幅度、重搏波幅度,以及左心室的快速射血期时间、起始点到主波峡谷底的时间间隔、起始点到重搏前波波峰的时间间隔、左心室收缩期、左心室舒张期共10个特征。统计多周期的特征值,作为脉搏数据的样本矩阵
Figure BDA0003649938320000061
d=10,表示特征数量,n表示单周期数据的数量。
样本矩阵X中包括两部分,X=[Xl,Xu],
Figure BDA0003649938320000062
Xl为带标记样本,对应标签为
Figure BDA0003649938320000063
c为标签类别数量,Gij=1表示第i个样本属于第j类,Gij=0表示第i个样本不属于第j类;Xu为无标记样本。
步骤4、对步骤3得到的样本矩阵X进行去中心化处理,建立如下半监督判别投影模型:
Figure BDA0003649938320000064
上式中,
Figure BDA0003649938320000065
为投影矩阵,m为降维之后子空间的维度。
Figure BDA0003649938320000066
为子空间聚类中,c为标签类别数量,
Figure BDA0003649938320000067
为指示矩阵,G=[Gl,Gu],包含带标记样本指示矩阵Gl与无标记样本指示矩阵Gu,带标记样本指示矩阵Gl根据原始样本标记进行初始化,Gij=1表示第i个样本属于第j类,Gij=0表示第i个样本不属于第j类;无标记样本指示矩阵Gu中各个元素初始化为
Figure BDA0003649938320000068
表示对应样本归属于各类别的概率,c=9,在后序优化过程中会逐步对无标记样本指示矩阵Gu完成更新;Sb为类间散度矩阵,用于衡量不同样本之间的离散程度,矩阵
Figure BDA0003649938320000069
为单位矩阵;
Figure BDA00036499383200000610
为全1的列向量。上标T表示转置,Tr(·)表示求取迹,||·||F表示对矩阵求F范数。
步骤5、根据步骤4建立的半监督判别投影模型,对投影矩阵W、指示矩阵G、子空间聚类中心F进行联合迭代优化,每一轮迭代中仅更新一个参数,具体优化过程如下:
步骤5.1、初始化投影矩阵W:
Figure BDA0003649938320000071
利用拉格朗日乘子法,求解得到W为XXT最大的m个特征值对应的特征向量。
步骤5.2、初始化判别中心:
Figure BDA0003649938320000072
矩阵F的取值为子空间聚类中心点,因此矩阵F的第i列Fi为:
Figure BDA0003649938320000073
其中,nk表示第k类中样本的数量,lk为第k类样本的集合,xi为样本矩阵X中的第i列。
步骤5.3、固定子空间聚类中心F和投影矩阵W,更新指示矩阵G,在更新过程中仅更新Gu
Figure BDA0003649938320000074
令gi T为G的第i行,gi为gi T的转置,考虑到G中的每一行只是独立地将每一个样本关联至标签,因此,将(17)式分解为:
Figure BDA0003649938320000075
为简化表示,令:g=gi,M=FTF,b=FTWTgi,将(6)式转化为:
Figure BDA0003649938320000076
式(19)为具有单纯形约束的二次优化问题,为分离该函数,引入关于g的辅助变量v:
Figure BDA0003649938320000081
对于(8)式,采用增广拉格朗日乘子法进行解决,构造增广拉格朗日函数如下:
Figure BDA0003649938320000082
其中β为拉格朗日乘子,μ为罚因子。通过固定v、g中的一个变量,来更新另一个变量,完成迭代优化过程:
①固定g更新v:此时式(21)转化为无约束优化问题,直接对v求导,并令导数为0,得到:
Figure BDA0003649938320000083
②固定v更新g:此时(21)式转化为不等式约束的优化问题,利用拉格朗日乘子法与KKT条件解决,将式(21)转化为:
Figure BDA0003649938320000084
令:
Figure BDA0003649938320000085
将式(23)转化为:
Figure BDA0003649938320000086
式(25)的拉格朗日函数为:
Figure BDA0003649938320000087
这里,γ和η是待定的拉格朗日乘数。假设g*是最优解γ**是相应的拉格朗日乘数。根据KKT条件,得到:
Figure BDA0003649938320000091
其中,
Figure BDA0003649938320000092
et、ηt *分别表示g*、η*、e中的第t个元素。
将式(27)的第一行写为:
g*-e-γ*1-η*=0 (28)
考虑到约束gT1=1,将式(28)化简为:
Figure BDA0003649938320000094
将式(29)代入式(27)得到:
Figure BDA0003649938320000095
令:
Figure BDA0003649938320000096
Figure BDA0003649938320000097
将式(30)重写为:
Figure BDA0003649938320000098
对于
Figure BDA00036499383200000916
存在:
Figure BDA0003649938320000099
根据式(31)与式(34),有
Figure BDA00036499383200000910
其中(f(·))+表示取f(·)与0中的最大值。将式(34)进一步化简为:
Figure BDA00036499383200000911
如果能确定最优的
Figure BDA00036499383200000917
,就可以从式(35)中得到最优解g*;同样的,也可以将式(34)改写为
Figure BDA00036499383200000913
使得
Figure BDA00036499383200000914
因此可以将
Figure BDA00036499383200000915
写为:
Figure BDA0003649938320000101
根据限制条件gT1=1以及式(35),定义如下函数:
Figure BDA0003649938320000102
最优值
Figure BDA0003649938320000103
需满足
Figure BDA0003649938320000104
当式(37)等于零时,用牛顿法得到最优
Figure BDA0003649938320000105
Figure BDA0003649938320000106
其中
Figure BDA0003649938320000107
表示更新过程中的第k个结果。
步骤5.4、固定指示矩阵G和投影矩阵W,更新子空间聚类中心F:
Figure BDA0003649938320000108
该问题为无约束优化问题,直接对F求导,得到更新后的子空间聚类中心F:
F=WTXG(GTG)-1 (40)
步骤5.5、固定子空间聚类中心F和指示矩阵G,更新投影矩阵W:
Figure BDA0003649938320000109
考虑到在步骤3中对样本X进行了去中心化处理,因此,代入步骤5.4的更新结果,并对式(41)中的分子展开得:
Figure BDA00036499383200001010
利用迹运算的性质,得到:
Figure BDA00036499383200001011
类间散度矩阵表示为:
Sw=XXT-XG(GTG)-1GTXT (44)
因此,将式(42)转换为:
Figure BDA0003649938320000111
最终,将式(41)所示的目标函数转换为:
Figure BDA0003649938320000112
对于上述迹比问题,考虑到St=Sb+Sw,式(46)等价于:
Figure BDA0003649938320000113
利用Trace-Ratio相关问题的解决方案对式(47)进行求解。
步骤5.6、多次重复步骤5.3~步骤5.5,直至达到最大迭代次数或步骤4中半监督判别投影模型的值达到设定阈值。
步骤6、分离步骤5迭代优化后的指示矩阵G中的无标记样本部分Gu,对Gu按行分块:
Gu=[gl+1 T,gl+2 T,…,gn T] (48)
取Gu中最大元素对应的列序作为第i个样本xi T的对应类别,完成对原始脉搏数据的分类。
步骤7、借助上述过程中获取的投影矩阵W,借助行归一化二范数获取各个特征重要性。
所获得的投影矩阵W进行如下变换:
Figure BDA0003649938320000114
其中wi表示投影矩阵W的第i行θi越大,则表示第i个特征在脉搏信号分类过程中就越具有普遍意义。本方法利用投影矩阵,对不同特征的贡献度进行差异化表示,可以有效提升了分类准确率。
如图2所示,基于半监督判别投影的脉搏数据分类装置,包括数据采集模块、特征提取模块、优化分类模块以及结果展示模块。
所述数据采集模块用于实现步骤1的数据采集过程,并将采集得到的数据输入特征提取模块中。
所述特征提取模块用于实现步骤2、3的预处理及特征提取过程,并将得到的样本矩阵X输入优化分类模块中。
所述优化分类模块用于实现步骤4的模型建立与步骤5的优化分类过程。
所述结果展示模块用于显示步骤6的分类结果。

Claims (5)

1.基于半监督判别投影的脉搏数据分类方法,其特征在于:具体包括以下步骤:
步骤1、采集脉搏数据,并将对应的身体状况信息作为该数据的标签;所述身体状况信息为:表寒、表热、表虚、表实、里寒、里热、里虚、里实或正常;
步骤2、对步骤1采集到的脉搏数据进行预处理消除噪声,然后通过快速傅里叶变换,将频率能量分布序列最大值对应的频率值的倒数作为脉搏周期;
步骤3、使用步骤2计算得到的脉搏周期,将预处理后的脉搏数据划分为单周期数据,对每个单周期数据提取主波幅度、主波峡幅度、重搏前波幅度、降重峡幅度、重搏波幅度,以及左心室的快速射血期时间、起始点到主波峡谷底的时间间隔、起始点到重搏前波波峰的时间间隔、左心室收缩期、左心室舒张期共10个特征;将每个脉搏周期的特征作为一个样本,各样本按列合并得到脉搏数据的样本矩阵
Figure FDA0003649938310000011
其中,d表示特征数量,n表示单周期脉搏信号的数量;将样本矩阵X划分为两部分,其中Xl为带标记样本,Xu为无标记样本;最后,对样本矩阵X进行去中心化处理;
步骤4、根据步骤3得到的样本矩阵X,建立如下半监督判别投影模型:
Figure FDA0003649938310000012
其中,
Figure FDA0003649938310000013
为投影矩阵,m为子空间的维度;
Figure FDA0003649938310000014
为子空间聚类中心,c为标签类别数量,
Figure FDA0003649938310000015
为指示矩阵,G=[Gl,Gu],包含带标记样本指示矩阵Gl与无标记样本指示矩阵Gu,带标记样本指示矩阵Gl根据原始样本标记进行初始化,Gij=1表示第i个样本属于第j类,Gij=0表示第i个样本不属于第j类;无标记样本指示矩阵Gu中各个元素初始化为
Figure FDA0003649938310000016
表示对应样本归属于各类别的概率;Sb为类间散度矩阵,用于衡量不同样本之间的离散程度,
Figure FDA0003649938310000017
为单位矩阵;
Figure FDA0003649938310000018
为全1的列向量;上标T表示转置,Tr(·)表示求取迹,||·||F表示对矩阵求F范数;
步骤5、根据步骤4建立的半监督判别投影模型,对投影矩阵W、指示矩阵G、子空间聚类中心F进行联合迭代优化,每一轮迭代中仅更新一个参数,具体优化过程如下:
步骤5.1、初始化投影矩阵W:
Figure FDA0003649938310000021
s.t.WTW=I (2)
求解得到W为XXT最大的m个特征值对应的特征向量;
步骤5.2、初始化判别中心:
Figure FDA0003649938310000022
矩阵F的取值为子空间聚类中心点,因此矩阵F的第i列Fi为:
Figure FDA0003649938310000023
其中,nk表示第k类中样本的数量,lk为第k类样本的集合,xi为样本矩阵X中的一列,Xl为样本矩阵中带标签的样本;
步骤5.3、固定子空间聚类中心F和投影矩阵W,更新指示矩阵G中的Gu
Figure FDA0003649938310000024
将Gu按行分解后,转化为具有单纯形约束的二次优化问题,引入辅助变量v对分解后的每一行gT进行更新,构造的增广拉格朗日函数如下,:
Figure FDA0003649938310000025
其中β为拉格朗日乘子,μ为罚因子;
依次固定v、g中的一个变量,更新另一个变量,进行迭代优化以获取局部最优解;重复上述过程,对Gu中的每一行依次进行更新,完成对指示矩阵G更新;
步骤5.4、固定指示矩阵G和投影矩阵W,更新子空间聚类中心F:
Figure FDA0003649938310000026
直接对F求导,得到更新后的子空间聚类中心F:
F=WTXG(GTG)-1 (8)
步骤5.5、固定子空间聚类中心F和指示矩阵G,更新投影矩阵W:
Figure FDA0003649938310000031
并将其转化为Trace-Ratio问题进行求解;
步骤5.6、多次重复步骤5.3~步骤5.5,直至达到最大迭代次数或步骤4中半监督判别投影模型的值达到设定阈值;
步骤6、分离步骤5迭代优化后的指示矩阵G中的无标记样本部分Gu,对Gu按行分块:
Gu=[gl+1 T,gl+2 T,…,gn T] (10)
取Gu中最大元素对应的列序作为第i个样本xi T的对应类别,完成对原始脉搏数据的分类。
2.如权利要求1所述基于半监督判别投影的脉搏数据分类方法,其特征在于:步骤2中通过小波变换与基线漂移消除进行噪声消除。
3.如权利要求1所述基于半监督判别投影的脉搏数据分类方法,其特征在于:对步骤5迭代优化后的W进行如下变换:
Figure FDA0003649938310000032
其中wi表示投影矩阵W的第i行,θi越大,则表示第i个特征在脉搏信号分类过程中就越具有普遍意义。
4.如权利要求1所述基于半监督判别投影的脉搏数据分类方法,其特征在于:步骤5.3中,Gu的具体更新方法为:
令gi T为G的第i行,gi为gi T的转置,将(5)式分解为:
Figure FDA0003649938310000033
令:g=gi,M=FTF,b=FTWTgi,将(6)式转化为:
Figure FDA0003649938310000041
(19)式为具有单纯形约束的二次优化问题,为分离该函数,引入关于g的辅助变量v:
Figure FDA0003649938310000042
对于(14)式,采用增广拉格朗日乘子法进行解决,构造增广拉格朗日函数如下:
Figure FDA0003649938310000043
其中β为拉格朗日乘子,μ为罚因子;通过固定v、g中的一个变量,来更新另一个变量,完成迭代优化过程:
①固定g更新v:此时式(15)转化为无约束优化问题,直接对v求导,并令导数为0,得到:
Figure FDA0003649938310000044
②固定v更新g:此时(15)式转化为不等式约束的优化问题,利用拉格朗日乘子法与KKT条件解决,将式(15)式转化为:
Figure FDA0003649938310000045
令:
Figure FDA0003649938310000046
考虑到μ在优化过程中不影响结果,将式(17)转化为:
Figure FDA0003649938310000047
式(19)的拉格朗日函数为:
Figure FDA0003649938310000051
这里,γ和η是待定的拉格朗日乘数;假设g*是最优解γ**是相应的拉格朗日乘数;根据KKT条件,得到:
Figure FDA0003649938310000052
其中,
Figure FDA0003649938310000053
et
Figure FDA0003649938310000054
分别表示g*、η*、e中的第t个元素;
将式(21)的第一行写为:
g*-e-γ*1-η*=0 (22)
考虑到约束gT1=1,将式(22)化简为:
Figure FDA0003649938310000055
将式(23)代入式(21)得到:
Figure FDA0003649938310000056
令:
Figure FDA0003649938310000057
Figure FDA0003649938310000058
将式(24)重写为:
Figure FDA0003649938310000059
对于
Figure FDA00036499383100000510
存在:
Figure FDA00036499383100000511
根据式(31)与式(34),有
Figure FDA00036499383100000512
其中(f(·))+表示取f(·)与0中的最大值;将式(34)进一步化简为:
Figure FDA0003649938310000061
如果能确定最优的
Figure FDA0003649938310000062
就可以从式(35)中得到最优解g*;同样的,也可以将式(34)改写为
Figure FDA0003649938310000063
使得
Figure FDA0003649938310000064
因此可以将
Figure FDA0003649938310000065
写为:
Figure FDA0003649938310000066
根据限制条件gT1=1以及式(29),定义如下函数:
Figure FDA0003649938310000067
最优值
Figure FDA0003649938310000068
需满足
Figure FDA0003649938310000069
当式(31)等于零时,用牛顿法得到最优
Figure FDA00036499383100000610
Figure FDA00036499383100000611
其中
Figure FDA00036499383100000612
表示更新过程中的第k个结果。
5.基于半监督判别投影的脉搏数据分类装置,其特征在于:用于实现如权利要求1~5任意所述的脉搏数据分类过程,具体包括数据采集模块、特征提取模块、优化分类模块以及结果展示模块;
所述数据采集模块使用薄膜压力脉搏传感器,采集原始压力脉搏信号,并记录对应的身体状况信息,输入特征提取模块中;
所述特征提取模块首先对数据采集模块采集的原始压力脉搏信号进行去噪处理,再通过快速傅里叶变换,计算频率能量分布序列最大值对应的频率值的倒数,作为脉搏周期对去噪后的脉搏数据进行划分;然后按照周期对划分后的数据提取主波幅度、主波峡幅度、重搏前波幅度、降重峡幅度、重搏波幅度,以及左心室的快速射血期时间、起始点到主波峡谷底的时间间隔、起始点到重搏前波波峰的时间间隔、左心室收缩期、左心室舒张期共10个特征;统计多周期的特征值,生成脉搏数据的样本矩阵
Figure FDA00036499383100000613
去中心化后输入优化分类模块中;其中,d表示特征数量,n表示单周期数据的数量;
所述优化分类模块根据脉搏数据的样本矩阵X,建立半监督判别投影模型:
Figure FDA0003649938310000071
式中,
Figure FDA0003649938310000072
为投影矩阵,m为降维后子空间的维度;
Figure FDA0003649938310000073
为子空间聚类中,c为标签类别数量,
Figure FDA0003649938310000074
为指示矩阵,G=[Gl,Gu],包含带标记样本指示矩阵Gl与无标记样本指示矩阵Gu,带标记样本指示矩阵Gl根据原始样本标记进行初始化,Gij=1表示第i个样本属于第j类,Gij=0表示第i个样本不属于第j类;无标记样本指示矩阵Gu中各个元素初始化为
Figure FDA0003649938310000075
表示对应样本归属于各类别的概率;Sb为类间散度矩阵,用于衡量不同样本之间的离散程度,矩阵
Figure FDA0003649938310000076
为单位矩阵;
Figure FDA0003649938310000077
为全1的列向量;上标T表示转置,Tr(·)表示求取迹,||·||F表示对矩阵求F范数;
然后对投影矩阵W、指示矩阵G、子空间聚类中心F进行联合迭代优化,每一轮迭代中仅更新一个参数;重复联合迭代优化过程,直至达到最大迭代次数或所述半监督判别投影模型的值达到设定阈值;
所述结果展示模块根据优化分类模块的分类结果,输出标签未知的原始压力脉搏信号对应的身体状况信息。
CN202210547995.8A 2022-05-18 2022-05-18 基于半监督判别投影的脉搏数据分类方法及装置 Active CN114841214B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210547995.8A CN114841214B (zh) 2022-05-18 2022-05-18 基于半监督判别投影的脉搏数据分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210547995.8A CN114841214B (zh) 2022-05-18 2022-05-18 基于半监督判别投影的脉搏数据分类方法及装置

Publications (2)

Publication Number Publication Date
CN114841214A true CN114841214A (zh) 2022-08-02
CN114841214B CN114841214B (zh) 2023-06-02

Family

ID=82571229

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210547995.8A Active CN114841214B (zh) 2022-05-18 2022-05-18 基于半监督判别投影的脉搏数据分类方法及装置

Country Status (1)

Country Link
CN (1) CN114841214B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115736850A (zh) * 2023-01-05 2023-03-07 南京大经中医药信息技术有限公司 一种脉搏数据分类系统和分类方法
CN118177742A (zh) * 2024-05-15 2024-06-14 福州安玉科技有限公司 基于多任务特征对齐的脉诊信号分类方法、介质和设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069471A (zh) * 2015-07-31 2015-11-18 西安电子科技大学 基于模糊标签的高光谱数据子空间投影和分类方法
CN105956612A (zh) * 2016-04-25 2016-09-21 西安电子科技大学 基于主动学习和半监督学习的高光谱图像分类方法
US20170347906A1 (en) * 2016-06-07 2017-12-07 NeuroSteer Ltd. Systems and methods for analyzing brain activity and applications thereof
CN111914655A (zh) * 2020-07-06 2020-11-10 电子科技大学 一种基于显著信号子段提取的脉象分类方法
CN112766400A (zh) * 2021-01-28 2021-05-07 华南理工大学 高维数据基于多个数据变换空间的半监督分类集成方法
US20210142152A1 (en) * 2019-11-12 2021-05-13 Adobe Inc. User classification from data via deep segmentation for semi-supervised learning
CN113033641A (zh) * 2021-03-17 2021-06-25 华南理工大学 一种高维数据半监督分类方法
CN113469209A (zh) * 2020-12-26 2021-10-01 西北工业大学 一种基于噪声抑制的无监督数据降维方法
CN114343674A (zh) * 2021-12-22 2022-04-15 杭州电子科技大学 一种联合判别子空间发掘与半监督脑电情感识别方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069471A (zh) * 2015-07-31 2015-11-18 西安电子科技大学 基于模糊标签的高光谱数据子空间投影和分类方法
CN105956612A (zh) * 2016-04-25 2016-09-21 西安电子科技大学 基于主动学习和半监督学习的高光谱图像分类方法
US20170347906A1 (en) * 2016-06-07 2017-12-07 NeuroSteer Ltd. Systems and methods for analyzing brain activity and applications thereof
US20210142152A1 (en) * 2019-11-12 2021-05-13 Adobe Inc. User classification from data via deep segmentation for semi-supervised learning
CN111914655A (zh) * 2020-07-06 2020-11-10 电子科技大学 一种基于显著信号子段提取的脉象分类方法
CN113469209A (zh) * 2020-12-26 2021-10-01 西北工业大学 一种基于噪声抑制的无监督数据降维方法
CN112766400A (zh) * 2021-01-28 2021-05-07 华南理工大学 高维数据基于多个数据变换空间的半监督分类集成方法
CN113033641A (zh) * 2021-03-17 2021-06-25 华南理工大学 一种高维数据半监督分类方法
CN114343674A (zh) * 2021-12-22 2022-04-15 杭州电子科技大学 一种联合判别子空间发掘与半监督脑电情感识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FEIPING NIE等: "Unsupervised and Semisupervised Projection With Graph Optimization", 《IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS》 *
畅江: "基于EEG 和 ERP信号分析的情感认知研究", 《中国博士学位论文全文数据库信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115736850A (zh) * 2023-01-05 2023-03-07 南京大经中医药信息技术有限公司 一种脉搏数据分类系统和分类方法
CN118177742A (zh) * 2024-05-15 2024-06-14 福州安玉科技有限公司 基于多任务特征对齐的脉诊信号分类方法、介质和设备

Also Published As

Publication number Publication date
CN114841214B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
WO2016091017A1 (zh) 一种高光谱图像分类中光谱向量互相关特征的抽取方法
CN114841214A (zh) 基于半监督判别投影的脉搏数据分类方法及装置
CN111461176A (zh) 基于归一化互信息的多模态融合方法、装置、介质及设备
Mensch et al. Learning neural representations of human cognition across many fMRI studies
CN107330412B (zh) 一种基于深度稀疏表示的人脸年龄估计方法
CN108052975B (zh) 一种基于核主元和神经网络的车辆运行实时工况预测方法
CN112488081A (zh) 基于ddadsm跨被试迁移学习脑电精神状态检测方法
CN105117708A (zh) 人脸表情识别的方法和装置
CN113972010B (zh) 一种基于知识图谱和自适应机制的辅助疾病推理系统
CN105354532A (zh) 一种基于手部运动帧数据的手势识别方法
Zhu et al. TCRAN: Multivariate time series classification using residual channel attention networks with time correction
CN113951883B (zh) 基于脑电信号情绪识别的性别差异性检测方法
CN109033990B (zh) 基于类内类间距离的cnn模型心拍分类方法
CN105930788A (zh) 非下采样轮廓波和主成分分析相结合的人脸识别方法
CN111914655B (zh) 一种基于显著信号子段提取的脉象分类方法
CN116312484B (zh) 跨语言域不变声学特征提取方法和系统
CN112329698A (zh) 一种基于智慧黑板的人脸识别方法和系统
CN116821764A (zh) 一种基于知识蒸馏的多源域适应的eeg情绪状态分类方法
CN116720106A (zh) 基于迁移学习领域自适应的运动想象脑电信号分类方法
CN112465054B (zh) 一种基于fcn的多变量时间序列数据分类方法
Peng Research on Emotion Recognition Based on Deep Learning for Mental Health
CN112818315B (zh) 一种融合多特征信息的心电信号身份识别方法及系统
CN113066544B (zh) 基于CAA-Net与LightGBM的FVEP特征点检测方法
CN114818822A (zh) 联合半监督回归与图标签传播的脑电迁移情感识别方法
CN114036947A (zh) 一种半监督学习的小样本文本分类方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant