CN109215780B - 高拉普拉斯正则化低秩表示的多模态数据分析方法及系统 - Google Patents

高拉普拉斯正则化低秩表示的多模态数据分析方法及系统 Download PDF

Info

Publication number
CN109215780B
CN109215780B CN201810974669.9A CN201810974669A CN109215780B CN 109215780 B CN109215780 B CN 109215780B CN 201810974669 A CN201810974669 A CN 201810974669A CN 109215780 B CN109215780 B CN 109215780B
Authority
CN
China
Prior art keywords
data
matrix
low
rank
laplace
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810974669.9A
Other languages
English (en)
Other versions
CN109215780A (zh
Inventor
董爱美
赵桂新
高茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Original Assignee
Qilu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology filed Critical Qilu University of Technology
Priority to CN201810974669.9A priority Critical patent/CN109215780B/zh
Publication of CN109215780A publication Critical patent/CN109215780A/zh
Application granted granted Critical
Publication of CN109215780B publication Critical patent/CN109215780B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开了一种高拉普拉斯正则化低秩表示的多模态数据分析方法及系统,属于多模态数据分析领域,要解决的技术问题为如何捕获多模态数据的全局线性结构以及非线性几何结构;其方法包括:对多模态数据进行数据处理,得到多个数据矩阵;将低秩表示和拉普拉斯正则化项相结合构建非负稀疏超拉普拉斯正则化低秩表示模型,通过非负稀疏超拉普拉斯正则化低秩表示模型对每个数据矩阵进行学习,得到高拉普拉斯低秩子空间;以高拉普拉斯低秩子空间和支持向量机为基础进行学习,得到多个分类器;对多个分类器进行投票,得到最终分类器。其结构包括数据处理模块、数据分析模块、分类模块和投票模块。该方法可捕获多模态数据的全局线性结构及非线性几何结构。

Description

高拉普拉斯正则化低秩表示的多模态数据分析方法及系统
技术领域
本发明涉及多模态数据分析领域,具体地说是一种高拉普拉斯正则化低秩表示的多模态数据分析方法及系统。
背景技术
低秩表示技术因其对数据中嵌入的低维子空间结构的研究效果良好而受到广泛关注。对于一组观测数据,低秩表示的目标是学习观测数据低秩表示的同时将噪音数据分割开来。低秩技术在模式识别、计算机视觉和信号处理等方面有着广泛的应用。在现实世界中,数据往往存在于嵌入在高维环境空间中的低维流形上,低秩表示技术仅仅考虑了数据的全局线性结构而没有考虑到其非线性几何结构,因此在学习过程中可能会忽略数据之间的局部性和相似性信息。
为了保有高维数据的局部几何结构和相似性信息,许多学者从流行学习的角度以局部不变性为指导思想展开研究,比如局部线性嵌入方法、局部保有投影方法、拉普拉斯特征映射方法等。近年来,研究人员将低秩表示和图技术表示相结合,提出了许多卓有成效的机器学习方法。
阿尔茨海默病(AD)是一种起病隐匿的进行性发展神经系统退行性疾病。它的早期诊断、治疗将会极大地提高病人及其照顾者的生活质量。近几年来,对该病的不同方面进行了多方面的研究,因此有多种不同的模态数据(比如MRI,PET,CSF)。如何捕获多模态数据的全局线性结构以及非线性几何结构,以实现通过利用现有的多模态数据来对阿尔茨海默病进行诊断,是需要解决的而技术问题。
发明内容
本发明的技术任务是针对以上不足,提供一种高拉普拉斯正则化低秩表示的多模态数据分析方法及系统,来解决如何捕获多模态数据的全局线性结构以及非线性几何结构的问题,以便更好地对多模态数据进行正确分类。
本发明的技术任务是按以下方式实现的:
高拉普拉斯正则化低秩表示的多模态数据分析方法,其特征在于包括:
对多模态数据进行数据处理,得到多个数据矩阵,每个数据矩阵对应一种模态,每个数据矩阵中的数据为二维的矩阵数据;
将低秩表示和拉普拉斯正则化相结合构建非负稀疏超拉普拉斯正则化低秩表示模型,通过非负稀疏超拉普拉斯正则化低秩表示模型对每个数据矩阵进行学习,得到高阶拉普拉斯低秩子空间;
以高阶拉普拉斯低秩子空间和支持向量机为基础进行学习,得到多个分类器;
对上述多个分类器进行投票,得到最终分类器。
该方法中,通过低秩表示可展示多模态数据的全局线性结构,通过拉普拉斯正则化项可捕获多模态数据中数据之间的非线性几何信息,以便于通过对多模态数据的分析,实现对相关病症如阿尔茨海默病的有效诊断。
进一步的,对多模态数据进行数据处理,得到多个矩阵数据,包括如下步骤:
数据预处理:将多模态数据转化为二维的矩阵数据,矩阵数据中行数据表示样本,矩阵数据中列数据表示特征;
数据分组:基于模态之间相叠加能够产生新的模态的多模态数据的模特特征,上述多模态数据能够形成多个模态,将上述多个矩阵数据进行分组得到多个数据矩阵,每个数据矩阵对应一个模态。
进一步的,通过非负稀疏超拉普拉斯正则化项对每个数据矩阵进行学习,得到高阶拉普拉斯低秩子空间,包括如下步骤:
计算每个模态的超拉普拉斯矩阵:以每个数据矩阵为基础,构建超图,得到每个模态的超拉普拉斯矩阵;
计算每个模态的低秩表示:以构建超图过程中产生的超图数据为基础,对噪音数据进行最小化约束,对矩阵数据的低秩目标函数增加拉普拉斯正则化项,得到多个高阶拉普拉斯正则化低秩目标函数,上述多个高阶拉普拉斯正则化低秩目标函数形成高阶拉普拉斯低秩子空间。
进一步的,矩阵数据的低秩目标函数为:
minZ,E||Z||*+β||E||1
s.t.X=XZ+E
其中,X为矩阵数据,X=[x1,x2,......xn]T,X∈Rn×d,n为矩阵数据的行数量,d为矩阵数据的列数量;
Z为系数矩阵,Z∈Rn×n,表达式为:
Figure GDA0003513028570000031
Z为相似度矩阵,zi,j表示矩阵数据xi和矩阵数据xj的相似度;
Z同时为矩阵数据X的低秩表示,zi=∑jzj,ixi,zj=∑izi,jxj;1≤i≤n,1≤j≤n。
进一步的,计算每个模态的超拉普拉斯矩阵,包括如下步骤:
构建当前模态对应的超图G,G=(V,E;W),超图G中顶点的个数为N,超边的个数为Ne;V为矩阵数据的顶点集合,
Figure GDA0003513028570000032
E为超边集合,超边为连接顶点和顶点的边,
Figure GDA0003513028570000033
W为超边权值集合,
Figure GDA0003513028570000034
其元素
Figure GDA0003513028570000035
为对应模态中超边对应的权值;
Figure GDA0003513028570000036
为顶点-超边关联矩阵,其中,
Figure GDA0003513028570000037
为顶点是否和超边关联,即:
Figure GDA0003513028570000038
顶点vk的度定义为
Figure GDA0003513028570000039
超边ej的度定义为
Figure GDA00035130285700000310
设定Dv∈RN×N为顶点的度矩阵,是对角矩阵,对角元素
Figure GDA00035130285700000311
为顶点vk的度;
Figure GDA00035130285700000312
为超边的度矩阵,是对角矩阵,对角元素
Figure GDA00035130285700000313
为超边ej的度;
基于上述定义,每个模态的超拉普拉斯矩阵为:
Figure GDA00035130285700000314
进一步的,对矩阵数据的低秩目标函数增加拉普拉斯正则化项,得到多个高阶拉普拉斯正则化低秩目标函数,包括如下步骤:
构建当前模态对应的超图G,G=(V,E;W),超图G中顶点的个数为N,超边的个数为Ne;V为矩阵数据的顶点集合,
Figure GDA00035130285700000315
E为超边集合,超边为连接顶点和顶点的边,
Figure GDA0003513028570000041
W为超边权值集合,
Figure GDA0003513028570000042
其元素
Figure GDA0003513028570000043
为对应模态中超边对应的权值;
以W(e)/d(e)作为系数矩阵Z中矩阵数据zi和矩阵数据zj距离的权值,得到高阶拉普拉斯正则化低秩目标函数,数据矩阵X的高阶拉普拉斯正则化低秩目标函数为:
Figure GDA0003513028570000044
s.t.X=XZ+E
对上述数据矩阵X的高阶拉普拉斯正则化低秩目标函数进行代数变换,得到:
minZ,E||Z||*+λtr(ZLhZT)+β||E||1
s.t.X=XZ+E
其中,W(e)为超边e的权值,d(e)为超边e的度,Lh为超拉普拉斯矩阵,λ为平衡正则化项,β为低秩表示的惩罚参数。
进一步的,所述多模态数据为三模态数据,基于模态之间相叠加可产生新的模态的多模态数据的模态特征,上述三模态数据能够形成七种模态,对上述三模态数据对应的矩阵数据进行分组,得到七个数据矩阵,每个数据矩阵对应一个模态。
高阶拉普拉斯正则化低秩表示的多模态数据分析系统,包括:
数据处理模块,用于对多模态数据进行数据处理,得到多个数据矩阵,每个数据矩阵对应一种模态,每个数据矩阵中的数据为多维的矩阵数据;
数据分析模块,用于将低秩表示和图拉普拉斯正则化相结合构建非负稀疏超拉普拉斯正则化低秩表示模型,并通过非负稀疏超拉普拉斯正则化项对每个数据矩阵进行学习,得到高阶拉普拉斯低秩子空间;
分类模块,用于以高阶拉普拉斯低秩子空间和支持向量机为基础进行学习,得到多个分类器;
投票模块,用于对上述多个分类器进行投票,得到最终分类器。
进一步的,数据处理模块包括:
数据预处理单元,用于将多模态数据转化为二维的矩阵数据,矩阵数据中行数据表示样本,矩阵数据中列数据表示特征;
数据分组单元,用于基于模态之间相叠加可产生新模态的多模态数据的模态特征,将上述多个矩阵数据进行分组得到多个数据矩阵,每个数据矩阵对应一个新模态。
进一步的,数据分析模块为具有如下功能的模块:
能够通过如下步骤计算每个模态的拉普拉斯矩阵:以每个数据矩阵为基础,构建超图,得到每个模态的超拉普拉斯矩阵;
能够通过如下步骤计算每个模态的低秩表示:以构建超图过程中产生的超图数据为基础,对噪音数据进行最小化约束,对矩阵数据的低秩目标函数增加拉普拉斯正则化项,得到多个高阶拉普拉斯正则化低秩目标函数,上述多个高阶拉普拉斯正则化低秩目标函数形成高阶拉普拉斯低秩子空间。
本发明的高拉普拉斯正则化低秩表示的多模态数据分类方法及系统具有以下优点:通过低秩表示和拉普拉斯正则化项相融合构建非负稀疏超拉普拉斯正则化低秩表示模型,通过非负稀疏超拉普拉斯正则化低秩表示模型应用到用于诸如阿尔茨海默病诊断的多模态数据中,通过该分析方法可表示数据的全局线性结构,并能够捕获数据数据中固有的非线性几何信息,避免低秩表示学习过程中可能会忽略数据之间的局部性和相似性信息的问题,从而对诸如阿尔茨海默病进行有效诊断。
附图说明
下面结合附图对本发明进一步说明。
附图1为实施例1高拉普拉斯正则化低秩表示的多模态数据分析方法的流程框图。
具体实施方式
参照说明书附图和具体实施例对本发明的高拉普拉斯正则化低秩表示的多模态数据分类方法及系统作以下详细地说明。
实施例1:
如附图1所示,本发明的高拉普拉斯正则化低秩表示的多模态数据分类方法,将低秩表示和拉普拉斯正则化项相结合构建非负稀疏超拉普拉斯正则化低秩表示模型,并将非负稀疏超拉普拉斯正则化低秩表示模型应用到多模态数据分析中,具体包括如下步骤:
步骤S100、数据预处理:将多模态数据转化为二维的矩阵数据,矩阵数据中行数据表示样本,矩阵数据中列数据表示特征;
步骤S200、数据分组:基于模态之间相叠加可产生新模态的多模态数据的模态特征,将上述多个矩阵数据进行分组得到多个数据矩阵,每个数据矩阵对应一个新模态;
步骤S300、计算每个模态的超拉普拉斯矩阵:以每个数据矩阵为基础,构建超图,得到每个模态的超拉普拉斯矩阵;
步骤S400、计算每个模态的低秩表示:以构建超图过程中产生的超图数据为基础,对噪音数据进行最小化约束,对矩阵数据的低秩目标函数增加拉普拉斯正则化项,得到多个高阶拉普拉斯正则化低秩目标函数,上述多个高阶拉普拉斯正则化低秩目标函数形成高阶拉普拉斯低秩子空间;
步骤S500、以高阶拉普拉斯低秩子空间和支持向量机为基础进行学习,得到多个分类器;
步骤S600、对上述多个分类器进行投票,得到最终分类器。
本实施例中,多模态数据为用于诊断阿尔茨海默病的三模态数据,包括MRI、PET和CSF三种成像方式获取的成像图像,通过步骤S100将上述三模态数据转化为二维的矩阵数据X,X=[x1,x2,......xn]T,X∈Rn×d,其中,矩阵数据中行数据表示样本,矩阵数据中列数据表示特征,n为矩阵数据的行数量,d为矩阵数据的列数量,便于后续数据分析。
步骤S200中,基于模态之间相叠加可产生新模态的多模态数据的模特特征,上述三模态数据通过模态之间相互叠加可生成七个新模态,分别为:MRI、PET、CSF、MRI+PET、MRI+CSF、PET+CSF、MRI+PET+CSF,基于此,对上述矩阵数据进行分组,得到七个数据矩阵,每个数据矩阵对应一个新模态。
步骤S300中,计算每个模态的超拉普拉斯矩阵,包括如下步骤:
构建当前模态对应的超图G,G=(V,E;W),超图G中顶点的个数为N,超边的个数为Ne;V为矩阵数据的顶点集合,
Figure GDA0003513028570000061
E为超边集合,超边为连接顶点和顶点的边,
Figure GDA0003513028570000062
W为超边权值集合,W={wij},其元素wij为对应模态中超边对应的权值,wij的表达式为:
Figure GDA0003513028570000063
即W是以
Figure GDA0003513028570000064
为对角元素的对角矩阵,等价于
Figure GDA0003513028570000065
Figure GDA0003513028570000066
为顶点-超边关联矩阵,其中,
Figure GDA0003513028570000067
为顶点是否和超边关联,即:
Figure GDA0003513028570000068
顶点vk的度定义为
Figure GDA0003513028570000071
超边ej的度定义为
Figure GDA0003513028570000072
设定Dv∈RN×N为顶点的度矩阵,是对角矩阵,对角元素
Figure GDA0003513028570000073
为顶点vk的度;
Figure GDA0003513028570000074
为超边的度矩阵,是对角矩阵,对角元素
Figure GDA0003513028570000075
为超边ej的度;
基于上述定义,每个模态的超拉普拉斯矩阵为:
Figure GDA0003513028570000076
从而可得出,第m个模态的超拉普拉斯矩阵为:
Figure GDA0003513028570000077
骤S400中,矩阵数据的低秩目标函数为:
minZ,E||Z||*+β||E||1
s.t.X=XZ+E
Z为系数矩阵,Z∈Rn×n,表达式为:
Figure GDA0003513028570000078
Z为相似度矩阵,zi,j表示矩阵数据xi和矩阵数据xj的相似度;
Z同时为矩阵数据X的低秩表示,zi=∑jzj,ixi,zj=∑izi,jxj;1≤i≤n,1≤j≤n。
步骤S400中,对矩阵数据的低秩目标函数增加拉普拉斯正则化项,得到多个高阶拉普拉斯正则化低秩目标函数,包括如下步骤:
构建当前模态对应的超图G,G=(V,E;W),超图G中顶点的个数为N,超边的个数为Ne;V为矩阵数据的顶点集合,
Figure GDA0003513028570000079
E为超边集合,超边为连接顶点和顶点的边,
Figure GDA00035130285700000710
W为超边权值集合,
Figure GDA00035130285700000711
其元素
Figure GDA00035130285700000712
为对应模态中超边对应的权值;
以W(e)/d(e)作为系数矩阵Z中矩阵数据zi和矩阵数据zj距离的权值,得到高阶拉普拉斯正则化低秩目标函数,数据矩阵X的高阶拉普拉斯正则化低秩目标函数为:
Figure GDA0003513028570000081
对上述数据矩阵X的高阶拉普拉斯正则化低秩目标函数进行代数变换,得到:
Figure GDA0003513028570000082
其中,W(e)为超边e的权值,d(e)为超边e的度,Lh为超拉普拉斯矩阵,λ为平衡正则化项,β为低秩表示的惩罚参数。
针对阿尔茨海默病诊断应用,得到高阶拉普拉斯正则化低秩表示技术在阿尔茨海默病诊断中的应用目标函数为:
Figure GDA0003513028570000083
本实施例高拉普拉斯正则化低秩表示的多模态数据分析方法应用于阿尔茨海默病诊断中,通过构建的低秩表示和图拉普拉斯正则化项相结合构建非负稀疏超拉普拉斯正则化低秩表示模型对反应病症的三模态数据进行分析,不仅可以表示全局低维结构,而且可以捕获数据中固有的非线性几何信息,从而能够对阿尔茨海默病进行有效诊断。
实施例2:
本实施例高拉普拉斯正则化低秩表示的多模态数据分析系统,包括:
数据处理模块,用于对多模态数据进行数据处理,得到多个数据矩阵,每个数据矩阵对应一种模态,每个数据矩阵中的数据为二维的矩阵数据;
数据分析模块,用于将低秩表示和图拉普拉斯正则化项相结合构建非负稀疏超拉普拉斯正则化低秩表示模型,并通过非负稀疏超拉普拉斯正则化项对每个数据矩阵进行学习,得到高阶拉普拉斯低秩子空间;
分类模块,用于以高阶拉普拉斯低秩子空间和支持向量机为基础进行学习,得到多个分类器;
投票模块,用于对上述多个分类器进行投票,得到最终分类器。
其中,数据处理模块包括:
数据预处理单元,用于将多模态数据转化为二维的矩阵数据,矩阵数据中行数据表示样本,矩阵数据中列数据表示特征;
数据分组单元,用于基于模态之间相叠加可产生新模态的多模态数据的模态特征,将上述多个矩阵数据进行分组得到多个数据矩阵,每个数据矩阵对应一个新模态。
数据分析模块为具有如下功能的模块:
能够通过如下步骤计算每个模态的拉普拉斯矩阵:以每个数据矩阵为基础,构建超图,得到每个模态的超拉普拉斯矩阵;
能够通过如下步骤计算每个模态的低秩表示:以构建超图过程中产生的超图数据为基础,对噪音数据进行最小化约束,对矩阵数据的低秩目标函数增加拉普拉斯正则化项,得到多个高阶拉普拉斯正则化低秩目标函数,上述多个高阶拉普拉斯正则化低秩目标函数形成高阶拉普拉斯低秩子空间。
具体地,数据分析模块中计算每个模态的拉普拉斯矩阵的方法步骤为:
构建当前模态对应的超图G,G=(V,E;W),超图G中顶点的个数为N,超边的个数为Ne;V为矩阵数据的顶点集合,
Figure GDA0003513028570000091
E为超边集合,超边为连接顶点和顶点的边,
Figure GDA0003513028570000092
W为超边权值集合,
Figure GDA0003513028570000093
其元素
Figure GDA0003513028570000094
为对应模态中超边对应的权值;
Figure GDA0003513028570000095
为顶点-超边关联矩阵,其中,
Figure GDA0003513028570000096
为顶点是否和超边关联,即:
Figure GDA0003513028570000097
顶点vk的度定义为
Figure GDA0003513028570000098
超边ej的度定义为
Figure GDA0003513028570000099
设定Dv∈RN×N为顶点的度矩阵,是对角矩阵,对角元素
Figure GDA00035130285700000910
为顶点vk的度;
Figure GDA00035130285700000911
为超边的度矩阵,是对角矩阵,对角元素
Figure GDA00035130285700000912
为超边ej的度;
基于上述定义,每个模态的超拉普拉斯矩阵为:
Figure GDA00035130285700000913
Figure GDA0003513028570000101
数据分析模块中计算每个模态的低秩表示的方法步骤为:
构建当前模态对应的超图G,G=(V,E;W),超图G中顶点的个数为N,超边的个数为Ne;V为矩阵数据的顶点集合,
Figure GDA0003513028570000102
E为超边集合,超边为连接顶点和顶点的边,
Figure GDA0003513028570000103
W为超边权值集合,
Figure GDA0003513028570000104
其元素
Figure GDA0003513028570000105
为对应模态中超边对应的权值;
以W(e)/d(e)作为系数矩阵Z中矩阵数据zi和矩阵数据zj距离的权值,得到高阶拉普拉斯正则化低秩目标函数,数据矩阵X的高阶拉普拉斯正则化低秩目标函数为:
Figure GDA0003513028570000106
对上述数据矩阵X的高阶拉普拉斯正则化低秩目标函数进行代数变换,得到:
s.t.X=XZ+E (5)
其中,W(e)为超边e的权值,d(e)为超边e的度,Lh为超拉普拉斯矩阵,λ为平衡正则化项,β为低秩表示的惩罚参数。
本实施例高拉普拉斯正则化低秩表示的多模态数据分析系统可执行实施例1公开的高拉普拉斯正则化低秩表示的多模态数据分析方法,用于阿尔茨海默病诊断中,通过非负稀疏超拉普拉斯正则化低秩表示模型对三模态数据进行诊断分析。
通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (8)

1.高拉普拉斯正则化低秩表示的多模态数据分析方法,其特征在于包括:
对多模态数据进行数据处理,得到多个数据矩阵,每个数据矩阵对应一种模态,每个数据矩阵中的数据为二维的矩阵数据;
将低秩表示和拉普拉斯正则化项相结合构建非负稀疏超拉普拉斯正则化低秩表示模型,通过非负稀疏超拉普拉斯正则化低秩表示模型对每个数据矩阵进行学习,得到高阶拉普拉斯低秩子空间;
以高阶拉普拉斯低秩子空间和支持向量机为基础进行学习,得到多个分类器;
对上述多个分类器进行投票,得到最终分类器;
通过非负稀疏超拉普拉斯正则化项对每个数据矩阵进行学习,得到高阶拉普拉斯低秩子空间,包括如下步骤:
计算每个模态的超拉普拉斯矩阵:以每个数据矩阵为基础,构建超图,得到每个模态的超拉普拉斯矩阵;
计算每个模态的低秩表示:以构建超图过程中产生的超图数据为基础,对噪音数据进行最小化约束,对矩阵数据的低秩目标函数增加拉普拉斯正则化项,得到多个高阶拉普拉斯正则化低秩目标函数,上述多个高阶拉普拉斯正则化低秩目标函数形成高阶拉普拉斯低秩子空间。
2.根据权利要求1所述的高拉普拉斯正则化低秩表示的多模态数据分析方法,其特征在于对多模态数据进行数据处理,得到多个矩阵数据,包括如下步骤:
数据预处理:将多模态数据转化为二维的矩阵数据,矩阵数据中行数据表示样本,矩阵数据中列数据表示特征;
数据分组:基于模态之间相叠加能够产生新的模态的多模态数据的模态 特征,上述多模态数据能够形成多个模态,将上述多个矩阵数据进行分组得到多个数据矩阵,每个数据矩阵对应一个模态。
3.根据权利要求1所述的高拉普拉斯正则化低秩表示的多模态数据分析方法,其特征在于矩阵数据的低秩目标函数为:
minZ,E||Z||*+β||E||1
s.t.X=XZ+E
其中,X为矩阵数据,X=[x1,x2,......xn]T,X∈Rn×d,n为矩阵数据的行数量,d为矩阵数据的列数量;
Z为系数矩阵,Z∈Rn×n,表达式为:
Figure FDA0003513028560000021
Z为相似度矩阵,zi,j表示矩阵数据xi和矩阵数据xj的相似度;
Z同时为矩阵数据X的低秩表示,zi=∑jzj,ixi,zj=∑izi,jxj;1≤i≤n,1≤j≤n。
4.根据权利要求1所述的高拉普拉斯正则化低秩表示的多模态数据分析方法,其特征在于计算每个模态的超拉普拉斯矩阵,包括如下步骤:
构建当前模态对应的超图G,G=(V,E;W),超图G中顶点的个数为N,超边的个数为Ne;V为矩阵数据的顶点集合,
Figure FDA0003513028560000022
E为超边集合,超边为连接顶点和顶点的边,
Figure FDA0003513028560000023
W为超边权值集合,
Figure FDA0003513028560000024
其元素
Figure FDA0003513028560000025
为对应模态中超边对应的权值;
Figure FDA0003513028560000026
为顶点-超边关联矩阵,其中,
Figure FDA0003513028560000027
为顶点是否和超边关联,即:
Figure FDA0003513028560000028
顶点vk的度定义为
Figure FDA0003513028560000029
超边ej的度定义为
Figure FDA00035130285600000210
设定Dv∈RN×N为顶点的度矩阵,是对角矩阵,对角元素
Figure FDA00035130285600000211
为顶点vk的度;
Figure FDA00035130285600000212
为超边的度矩阵,是对角矩阵,对角元素
Figure FDA00035130285600000213
为超边ej的度;
基于上述定义,每个模态的超拉普拉斯矩阵为:
Figure FDA00035130285600000214
5.根据权利要求3所述的高拉普拉斯正则化低秩表示的多模态数据分析方法,其特征在于对矩阵数据的低秩目标函数增加拉普拉斯正则化项,得到多个高阶拉普拉斯正则化低秩目标函数,包括如下步骤:
构建当前模态对应的超图G,G=(V,E;W),超图G中顶点的个数为N,超边的个数为Ne;V为矩阵数据的顶点集合,
Figure FDA0003513028560000031
E为超边集合,超边为连接顶点和顶点的边,
Figure FDA0003513028560000032
W为超边权值集合,
Figure FDA0003513028560000033
其元素
Figure FDA0003513028560000034
为对应模态中超边对应的权值;
以W(e)/d(e)作为系数矩阵Z中矩阵数据zi和矩阵数据zj距离的权值,得到高阶拉普拉斯正则化低秩目标函数,数据矩阵X的高阶拉普拉斯正则化低秩目标函数为:
Figure FDA0003513028560000035
s.t.X=XZ+E
对上述数据矩阵X的高阶拉普拉斯正则化低秩目标函数进行代数变换,得到:
minZ,E||Z||*+λtr(ZLhZT)+β||E||1
s.t.X=XZ+E
其中,W(e)为超边e的权值,d(e)为超边e的度,Lh为超拉普拉斯矩阵,λ为平衡正则化项,β为低秩表示的惩罚参数。
6.根据权利要求2所述的高拉普拉斯正则化低秩表示的多模态数据分析方法,其特征在于所述多模态数据为三模态数据,基于模态之间相叠加可产生新的模态的多模态数据的模态特征,上述三模态数据能够形成七种模态,对上述三模态数据对应的矩阵数据进行分组,得到七个数据矩阵,每个数据矩阵对应一个模态。
7.高拉普拉斯正则化低秩表示的多模态数据分析系统,其特征在于包括:
数据处理模块,用于对多模态数据进行数据处理,得到多个数据矩阵,每个数据矩阵对应一种模态,每个数据矩阵中的数据为多维的矩阵数据;
数据分析模块,用于将低秩表示和图拉普拉斯正则化相结合构建非负稀疏超拉普拉斯正则化低秩表示模型,并通过非负稀疏超拉普拉斯正则化项对每个数据矩阵进行学习,得到高阶拉普拉斯低秩子空间;
分类模块,用于以高阶拉普拉斯低秩子空间和支持向量机为基础进行学习,得到多个分类器;
投票模块,用于对上述多个分类器进行投票,得到最终分类器;
数据分析模块为具有如下功能的模块:
能够通过如下步骤计算每个模态的拉普拉斯矩阵:以每个数据矩阵为基础,构建超图,得到每个模态的超拉普拉斯矩阵;
能够通过如下步骤计算每个模态的低秩表示:以构建超图过程中产生的超图数据为基础,对噪音数据进行最小化约束,对矩阵数据的低秩目标函数增加拉普拉斯正则化项,得到多个高阶拉普拉斯正则化低秩目标函数,上述多个高阶拉普拉斯正则化低秩目标函数形成高阶拉普拉斯低秩子空间。
8.根据权利要求7所述的高拉普拉斯正则化低秩表示的多模态数据分析系统,其特征在于数据处理模块包括:
数据预处理单元,用于将多模态数据转化为二维的矩阵数据,矩阵数据中行数据表示样本,矩阵数据中列数据表示特征;
数据分组单元,用于基于模态之间相叠加能够产生新的模态的多模态数据的模态 特征,多模态数据能够形成多个模态,将上述多个矩阵数据进行分组得到多个数据矩阵,每个数据矩阵对应一个模态,将上述多个矩阵数据进行分组得到多个数据矩阵,每个数据矩阵对应一个新模态。
CN201810974669.9A 2018-08-24 2018-08-24 高拉普拉斯正则化低秩表示的多模态数据分析方法及系统 Active CN109215780B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810974669.9A CN109215780B (zh) 2018-08-24 2018-08-24 高拉普拉斯正则化低秩表示的多模态数据分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810974669.9A CN109215780B (zh) 2018-08-24 2018-08-24 高拉普拉斯正则化低秩表示的多模态数据分析方法及系统

Publications (2)

Publication Number Publication Date
CN109215780A CN109215780A (zh) 2019-01-15
CN109215780B true CN109215780B (zh) 2022-05-31

Family

ID=64989608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810974669.9A Active CN109215780B (zh) 2018-08-24 2018-08-24 高拉普拉斯正则化低秩表示的多模态数据分析方法及系统

Country Status (1)

Country Link
CN (1) CN109215780B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110426745B (zh) * 2019-01-30 2021-01-05 西安电子科技大学 基于块混合高斯低秩矩阵分解的毫米波图像异物检测方法
CN110633732B (zh) * 2019-08-15 2022-05-03 电子科技大学 一种基于低秩和联合稀疏的多模态图像识别方法
CN111340061A (zh) * 2020-01-18 2020-06-26 中国人民解放军国防科技大学 基于svm模型参数优化的多模态数据融合和分类方法
CN111863281B (zh) * 2020-07-29 2021-08-06 山东大学 一种个性化药物不良反应预测系统、设备及介质
CN113254729B (zh) * 2021-06-29 2021-10-08 中国科学院自动化研究所 基于动态超图网络的多模态演化特征自动共形表示方法
CN114900195B (zh) * 2022-07-11 2022-09-20 山东嘉通专用汽车制造有限公司 一种用于粉罐车的安全状态监测系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899921A (zh) * 2015-06-04 2015-09-09 杭州电子科技大学 基于多模态自编码模型的单视角视频人体姿态恢复方法
CN106203470A (zh) * 2016-06-22 2016-12-07 南京航空航天大学 一种基于超图的多模态特征选择及分类方法
CN107330276A (zh) * 2017-07-03 2017-11-07 雷柏英 神经影像图检索方法及装置
CN107330953A (zh) * 2017-07-06 2017-11-07 桂林电子科技大学 一种基于非凸低秩的动态mri重建方法
CN107977991A (zh) * 2017-11-30 2018-05-01 齐鲁工业大学 基于空间距离与数据分布相似性度量的医学图像配准方法
CN108052965A (zh) * 2017-12-01 2018-05-18 杭州平治信息技术股份有限公司 一种基于组稀疏规范和局部学习的特征选择方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9697614B2 (en) * 2014-12-08 2017-07-04 Mitsubishi Electric Research Laboratories, Inc. Method for segmenting and tracking content in videos using low-dimensional subspaces and sparse vectors
KR101667141B1 (ko) * 2015-03-11 2016-10-25 한국과학기술원 소멸필터를 이용한 고속 mr 영상 복원 알고리듬 개발
US10127660B2 (en) * 2015-12-30 2018-11-13 Case Western Reserve University Radiomic features on diagnostic magnetic resonance enterography

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899921A (zh) * 2015-06-04 2015-09-09 杭州电子科技大学 基于多模态自编码模型的单视角视频人体姿态恢复方法
CN106203470A (zh) * 2016-06-22 2016-12-07 南京航空航天大学 一种基于超图的多模态特征选择及分类方法
CN107330276A (zh) * 2017-07-03 2017-11-07 雷柏英 神经影像图检索方法及装置
CN107330953A (zh) * 2017-07-06 2017-11-07 桂林电子科技大学 一种基于非凸低秩的动态mri重建方法
CN107977991A (zh) * 2017-11-30 2018-05-01 齐鲁工业大学 基于空间距离与数据分布相似性度量的医学图像配准方法
CN108052965A (zh) * 2017-12-01 2018-05-18 杭州平治信息技术股份有限公司 一种基于组稀疏规范和局部学习的特征选择方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Low-rank decomposition and Laplacian group sparse coding for image classification;zhang lihe等;《NEUROCOMPUTING》;20140705;第135卷;第339-347页,摘要,第1、3、4.1节,附图2 *
Scaling Up Graph-Based Semisupervised Learning via Prototype Vector Machines;Kai Zhang等;《IEEE Transactions on Neural Networks and Learning Systems》;20150331;第26卷(第3期);第339-347页,全文 *
Semi-Supervised SVM With Extended Hidden Features;dong aimei等;《IEEE TRANSACTIONS ON CYBERNETICS》;20161231;第46卷(第12期);第2924-2937页,全文 *
基于低秩表示和张量空间的高光谱影像分析技术研究;薛志祥;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180615(第06期);第I140-690页,全文 *
带标签和/或无标签数据综合利用的模式分类新方法研究;董爱美;《中国博士学位论文全文数据库 信息科技辑》;20170228(第02期);第I138-104页,全文 *

Also Published As

Publication number Publication date
CN109215780A (zh) 2019-01-15

Similar Documents

Publication Publication Date Title
CN109215780B (zh) 高拉普拉斯正则化低秩表示的多模态数据分析方法及系统
Wang et al. A review on extreme learning machine
CN109117864B (zh) 基于异构特征融合的冠心病风险预测方法、模型及系统
Ioannidou et al. Deep learning advances in computer vision with 3d data: A survey
Khagi et al. Comparative analysis of Alzheimer's disease classification by CDR level using CNN, feature selection, and machine‐learning techniques
Drouard et al. Robust head-pose estimation based on partially-latent mixture of linear regressions
Suhail et al. Classification of micro-calcification in mammograms using scalable linear Fisher discriminant analysis
CN107392107B (zh) 一种基于异构张量分解的人脸特征提取方法
CN111382679A (zh) 帕金森病步态运动障碍严重程度的评估方法、系统及设备
US20220148291A1 (en) Image classification method and apparatus, and image classification model training method and apparatus
CN111738344B (zh) 一种基于多尺度融合的快速目标检测方法
CN113728335A (zh) 用于3d图像的分类和可视化的方法和系统
CN106971197B (zh) 基于差异性与一致性约束的多视数据的子空间聚类方法
Wang et al. Development and experimental evaluation of machine-learning techniques for an intelligent hairy scalp detection system
Paya et al. Modeling environments hierarchically with omnidirectional imaging and global-appearance descriptors
Chen et al. Multi-SVM based Dempster–Shafer theory for gesture intention understanding using sparse coding feature
Lin et al. Feature correlation-steered capsule network for object detection
CN107480627B (zh) 行为识别方法、装置、存储介质和处理器
Jia et al. Study on optimized Elman neural network classification algorithm based on PLS and CA
He et al. Unsupervised feature selection based on decision graph
Chen et al. Capped $ l_1 $-norm sparse representation method for graph clustering
Gao et al. Image Segmentation of Retinal Blood Vessels Based on Dual-Attention Multiscale Feature Fusion.
Kumar et al. Distributed information integration in convolutional neural networks
CN112396089B (zh) 基于lfgc网络和压缩激励模块的图像匹配方法
CN112949728B (zh) 基于切片图像筛选和特征聚合的mri图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant