CN110717550A - 一种基于多模态图像缺失补全的分类方法 - Google Patents

一种基于多模态图像缺失补全的分类方法 Download PDF

Info

Publication number
CN110717550A
CN110717550A CN201910992043.5A CN201910992043A CN110717550A CN 110717550 A CN110717550 A CN 110717550A CN 201910992043 A CN201910992043 A CN 201910992043A CN 110717550 A CN110717550 A CN 110717550A
Authority
CN
China
Prior art keywords
tensor
data
matrix
order
missing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910992043.5A
Other languages
English (en)
Inventor
刘琚
杜若画
吴强
林枫茗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201910992043.5A priority Critical patent/CN110717550A/zh
Publication of CN110717550A publication Critical patent/CN110717550A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本发明提出了一种基于多模态图像缺失补全的分类方法。首先,采用多向延迟嵌入转换,捕获数据中的移位不变结构。其次,使用平滑CP分解补全高阶不完整Hankel张量,其中平滑约束有助于去除非平滑噪声。最后,利用多向延迟嵌入的逆转换恢复数据的原本阶数和尺寸,完成数据的补全。在BraTS2017数据集上进行了算法验证,我们的方法优于传统的方法,具有更好的补全效果。

Description

一种基于多模态图像缺失补全的分类方法
技术领域
本发明属于图像处理与分析技术领域,具体涉及一种基于多模态图像缺失补全的分类方法。
背景技术
在许多图像处理和计算机视觉的应用中,都需要多组输入图像来产生所需的输出。使用多模态图像进行分类可以提高分类准确率。当对多模态图像提取特征后,使用特征数据训练模型进行分类时,往往需要将具有缺失模态的特征数据丢弃掉,这就造成了数据的极大浪费。在现实生活中,再次获取缺失模态的数据是不可行的,所以通常用估算值替代缺失的特征数据,这个过程通常被称为插补。缺失值被补全后,原本应该被丢弃的特征数据可以得到利用,从而在很大程度上避免了数据的浪费。
目前在这些领域中,已经做出了相当大的努力来处理缺失的数据。比如一些众所周知的缺失值估计技术:最大期望算法,K最近邻算法,奇异值分解算法和低秩矩阵补全算法。上述传统算法虽然针对随机缺失的数据具有比较好的补全效果,但是面对特征数据的条状缺失或块状缺失,恢复效果不理想。
发明内容
针对上述问题,本发明提出了一种基于多向延迟嵌入的平滑张量CP分解模型的数据补全方法,首先通过多向延迟嵌入转换将给定的不完整N阶张量作为输入并输出2N阶的不完整Hankel张量,然后通过平滑CP分解来恢复高阶张量,最后,通过使用恢复的高阶张量的逆多向延迟嵌入变换可以获得最终补全的张量。该方法可以利用在高维空间捕获的一些延迟/移位不变结构,来恢复传统的核范数或总变差正则化方法通常无法恢复的缺失元素。
本发明采用的技术方案如下:
一种基于多模态图像缺失补全的分类方法,该方法使用多向延迟嵌入转换和平滑CP分解,捕获高维空间的移位不变结构,对数据的条状或者块状缺失进行补全,最后进行分类,具体步骤包括:
(一)数据预处理:采集多种模态的数据,进行特征提取,分别对每一种模态提取一阶统计特征和二阶纹理特征,将提取的特征依次放入张量T中,最终得到
Figure BDA0002238587720000011
其中N为张量的阶数,I1,I2,···,IN为张量维度大小;
(二)数据随机缺失设置:每个模态随机挑选一定比例的样本,将挑选出的样本的对应模态特征做缺失处理,得到不完整的张量T;
(三)对数据进行多向延迟嵌入转换,对于张量T来说,多向延迟嵌入转换可表示为Hτ(T)=fold(I,τ)(T×1S1×2S2...×NSN),其中Hτ(T)代表将T转换为汉克尔矩阵,τ表示复制长度,Si∈{0,1}τ(I-τ+1)×I为复制矩阵,符号“×1”,“×2”,“×N”分别代表张量与矩阵在第N阶上的连乘操作,
Figure BDA0002238587720000021
将输入的N阶张量折叠为2N阶张量;
(四)经过多向延迟嵌入转换后对张量T进行平滑CP分解:
Figure BDA0002238587720000022
Figure BDA0002238587720000023
Figure BDA0002238587720000024
Figure BDA0002238587720000025
其中X是完整的输出张量,Z是CP分解值,G为超对角核心张量,由缩放倍数gr构成,U(N)为因子矩阵,由分量构成,Ω代表T的可用元素的索引,代表T缺失元素的索引,
Figure BDA0002238587720000028
代表F范数;ρ=[ρ(1)(2),...,ρ(N)]T代表平滑参数,p∈{1,2}是用来选择平滑约束类型的参数,当p=1时,约束项为总变分约束,当p=2时约束项变为二次变分约束,矩阵L(n)代表平滑约束矩阵;
Figure BDA0002238587720000029
为自适应因子,R代表张量CP分解中秩的个数,N为张量阶数;对目标函数使用分层交替最小二乘法求解,最后输出张量X;
(五)得到输出张量X后,通过多向延迟嵌入转换的逆过程得到最终的补全张量T,
Figure BDA00022385877200000210
其中
Figure BDA00022385877200000211
表示摩尔-彭若斯伪逆(STS)-1ST,
unfold(I,τ)表示多向延迟嵌入的逆,
Figure BDA00022385877200000212
(六)得到补全后的张量T,使用支持向量机对样本进行分类。
附图说明
图1是本发明的方法进行分类的示意框图。
图2是基于多模态图像缺失补全的分类方法示意框图。
具体实施方式
下面通过附图和实例对本发明技术方案进行详细说明。
如图2所示,基于多模态图像缺失补全的分类方法具体结构与方法如下文所示:
(一)数据预处理:使用BraTS2017数据集,分别对每一种模态提取一阶统计特征和二阶纹理特征。一阶统计特征包括体积,坚固性和偏心度,二阶纹理特征包括3种全局纹理特征以及从灰度共生矩阵,灰度游程矩阵,灰度区域尺寸矩阵和邻域灰度差分矩阵中分别提取的9,13,13,5个特征,最后每个模态提取46种特征,一共得到184个特征,将提取的特征依次放入变量T中,对于提取特征后的数据来说,
Figure BDA0002238587720000031
其中I1为样本个数285,I2为特征个数184;
(二)数据随机缺失设置:每个模态随机挑选20%的样本,将挑选出的样本的对应模态特征做缺失处理,得到不完整的矩阵T;
(三)对数据进行多向延迟嵌入转换,对于矩阵T来说,多向延迟嵌入转换可表示为Hτ(T)=fold(I,τ)1S1×2S2...×NSN,其中Hτ(T)代表将T转换为汉克尔矩阵,τ表示复制长度,S∈{0,1}τ(I-τ+1)×I为复制矩阵,假设τ=3,I=7时S可表示为:
Figure BDA0002238587720000032
符号“×1”,“×2”,“×N”分别代表代表张量与矩阵在第N阶上的连乘操作,
Figure BDA0002238587720000033
将输入的N阶张量折叠为2N阶张量。输入步骤(一)的特征矩阵,经过多向延迟嵌入转换后得到四阶张量T;
(四)经过多向延迟嵌入转换后对张量T进行平滑CP分解:
Figure BDA0002238587720000034
Figure BDA0002238587720000035
Figure BDA0002238587720000036
Figure BDA0002238587720000037
其中X是完整的输出张量,Z是CP分解值,G为超对角核心张量,由缩放倍数gr构成,U(N)为因子矩阵,由分量构成。Ω代表T的可用元素的索引,
Figure BDA0002238587720000042
代表T缺失元素的索引,
Figure BDA0002238587720000043
代表F范数;ρ=[ρ(1)(2),...,ρ(N)]T代表平滑参数,p∈{1,2}是用来选择平滑约束类型的参数,当p=1时,约束项为总变分约束,当p=2时约束项变为二次变分约束,矩阵L(n)代表平滑约束矩阵;
Figure BDA0002238587720000044
为自适应因子,R代表张量CP分解中秩的个数,N为张量阶数;对目标函数使用分层交替最小二乘法求解,最后输出张量X。
(五)得到输出的四阶张量X后,通过多向延迟嵌入转换的逆过程得到最终的补全矩阵
Figure BDA0002238587720000049
其中
Figure BDA0002238587720000046
表示摩尔-彭若斯伪逆(STS)-1ST,
Figure BDA0002238587720000047
(六)得到补全后的矩阵T,使用支持向量机对样本进行分类。
本发明的效果可以通过实验结果进一步说明:
实验用的数据集为BraTS2017数据集,将数据随机划分为5等份,轮流将其中4份作为训练集,剩余的1份作为测试集,使用支持向量机SVM进行二分类,重复5次,将分类准确率取平均,得到最终的平均分类准确率。实验过程中与传统数据补全算法进行比较,表1记录了实验结果。其中“完整数据”代表的是直接使用完整特征数据进行分类的结果,而ZERO,KNN,EM,SVD,LRMC,HaLRTC,Hankel-Tucker均为传统方法,Hankel-SPC为本专利方法。从表中可以看到,采用本发明补全数据后,SVM分类的准确度得到了有效提升,说明基于多向延迟嵌入的张量CP分解模型的数据补全方法相对于传统数据补全算法来说,能够更好地恢复条状或者块状缺失,从而有利于分类精度的提高。
表1
Figure BDA0002238587720000048

Claims (1)

1.一种基于多模态图像缺失补全的分类方法,该方法使用多向延迟嵌入转换和平滑CP分解,捕获高维空间的移位不变结构,对数据的条状或者块状缺失进行补全,最后进行分类,具体步骤包括:
(一)数据预处理:采集多种模态的数据,进行特征提取,分别对每一种模态提取一阶统计特征和二阶纹理特征,将提取的特征依次放入变量T中,最终得到
Figure FDA0002238587710000011
其中N为张量的阶数,I1,I2,···,IN为张量维度大小;
(二)数据随机缺失设置:每个模态随机挑选一定比例的样本,将挑选出的样本的对应模态特征做缺失处理,得到不完整的张量T;
(三)对数据进行多向延迟嵌入转换,对于张量T来说,多向延迟嵌入转换可表示为Hτ(T)=fold(I,τ)(T×1S1×2S2...×NSN),其中Hτ(T)代表将T转换为汉克尔矩阵,τ表示复制长度,S∈{0,1}τ(I-τ+1)×I为复制矩阵,符号“×1”,“×2”,“×N”分别代表张量与矩阵在第N阶上的相乘操作,
Figure FDA0002238587710000012
将输入的N阶张量折叠为2N阶张量;
(四)经过多向延迟嵌入转换后对张量T进行平滑CP分解:
Figure FDA0002238587710000013
Figure FDA0002238587710000014
Figure FDA0002238587710000015
Figure FDA0002238587710000016
其中X是完整的输出张量,Z是CP分解值,G为超对角核心张量,由缩放倍数gr构成,U(N)为因子矩阵,由分量
Figure FDA0002238587710000017
构成。Ω代表T的可用元素的索引,
Figure FDA0002238587710000018
代表T缺失元素的索引,
Figure FDA0002238587710000019
代表F范数;ρ=[ρ(1)(2),...,ρ(N)]T代表平滑参数,p∈{1,2}是用来选择平滑约束类型的参数,当p=1时,约束项为总变分约束,当p=2时约束项变为二次变分约束,矩阵L(n)代表平滑约束矩阵;
Figure FDA00022385877100000110
为自适应因子,R代表张量CP分解中秩的个数,N为张量阶数;对目标函数使用分层交替最小二乘法求解,最后输出张量X。
(五)得到输出张量X后,通过多向延迟嵌入转换的逆过程得到最终的补全张量T,
Figure FDA0002238587710000021
其中表示摩尔-彭若斯伪逆(STS)-1ST,unfold(I,τ)表示多向延迟嵌入的逆,
Figure FDA0002238587710000023
(六)得到补全后的张量T,使用支持向量机对样本进行分类。
CN201910992043.5A 2019-10-18 2019-10-18 一种基于多模态图像缺失补全的分类方法 Pending CN110717550A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910992043.5A CN110717550A (zh) 2019-10-18 2019-10-18 一种基于多模态图像缺失补全的分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910992043.5A CN110717550A (zh) 2019-10-18 2019-10-18 一种基于多模态图像缺失补全的分类方法

Publications (1)

Publication Number Publication Date
CN110717550A true CN110717550A (zh) 2020-01-21

Family

ID=69211849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910992043.5A Pending CN110717550A (zh) 2019-10-18 2019-10-18 一种基于多模态图像缺失补全的分类方法

Country Status (1)

Country Link
CN (1) CN110717550A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583217A (zh) * 2020-04-30 2020-08-25 深圳开立生物医疗科技股份有限公司 一种肿瘤消融疗效预测方法、装置、设备及计算机介质
CN111938592A (zh) * 2020-08-13 2020-11-17 天津工业大学 面向阿尔兹海默症诊断的有缺失多模态表示学习算法
CN112329633A (zh) * 2020-11-05 2021-02-05 南开大学 基于张量分解的情感识别方法、装置、介质及电子设备
CN117911802A (zh) * 2024-01-17 2024-04-19 电子科技大学 基于变换域张量分解的不规则高维数据复原方法及系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103260081A (zh) * 2012-02-21 2013-08-21 中国移动通信集团公司 一种视频图像缩放处理方法及装置
CN106097268A (zh) * 2016-06-12 2016-11-09 湖北民族学院 土家织锦传统残存图案数字化修复方法
CN106203356A (zh) * 2016-07-12 2016-12-07 中国计量大学 一种基于卷积网络特征提取的人脸识别方法
CN106600552A (zh) * 2016-12-14 2017-04-26 中国科学院地质与地球物理研究所兰州油气资源研究中心 纹理图像补全方法及装置
CN107016649A (zh) * 2017-02-24 2017-08-04 同济大学 一种基于局部低秩张量估计的视觉数据补全方法
CN108460746A (zh) * 2018-04-10 2018-08-28 武汉大学 一种基于结构和纹理分层预测的图像修复方法
CN109508688A (zh) * 2018-11-26 2019-03-22 平安科技(深圳)有限公司 基于骨架的行为检测方法、终端设备及计算机存储介质
CN109598681A (zh) * 2018-11-01 2019-04-09 兰州理工大学 一种对称唐卡修复后图像的无参考质量评价方法
CN109711283A (zh) * 2018-12-10 2019-05-03 广东工业大学 一种联合双字典和误差矩阵的遮挡表情识别算法
CN109753935A (zh) * 2019-01-09 2019-05-14 中南大学 一种基于生成对抗图像补全网络的步态识别方法
CN109858562A (zh) * 2019-02-21 2019-06-07 腾讯科技(深圳)有限公司 一种医学影像的分类方法、装置和存储介质
CN109886884A (zh) * 2019-01-21 2019-06-14 长沙理工大学 一种基于限定核范数的低秩张量估计的视觉数据补全方法
CN109949268A (zh) * 2019-01-24 2019-06-28 郑州大学第一附属医院 一种基于机器学习的肝细胞癌分化水平分级方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103260081A (zh) * 2012-02-21 2013-08-21 中国移动通信集团公司 一种视频图像缩放处理方法及装置
CN106097268A (zh) * 2016-06-12 2016-11-09 湖北民族学院 土家织锦传统残存图案数字化修复方法
CN106203356A (zh) * 2016-07-12 2016-12-07 中国计量大学 一种基于卷积网络特征提取的人脸识别方法
CN106600552A (zh) * 2016-12-14 2017-04-26 中国科学院地质与地球物理研究所兰州油气资源研究中心 纹理图像补全方法及装置
CN107016649A (zh) * 2017-02-24 2017-08-04 同济大学 一种基于局部低秩张量估计的视觉数据补全方法
CN108460746A (zh) * 2018-04-10 2018-08-28 武汉大学 一种基于结构和纹理分层预测的图像修复方法
CN109598681A (zh) * 2018-11-01 2019-04-09 兰州理工大学 一种对称唐卡修复后图像的无参考质量评价方法
CN109508688A (zh) * 2018-11-26 2019-03-22 平安科技(深圳)有限公司 基于骨架的行为检测方法、终端设备及计算机存储介质
CN109711283A (zh) * 2018-12-10 2019-05-03 广东工业大学 一种联合双字典和误差矩阵的遮挡表情识别算法
CN109753935A (zh) * 2019-01-09 2019-05-14 中南大学 一种基于生成对抗图像补全网络的步态识别方法
CN109886884A (zh) * 2019-01-21 2019-06-14 长沙理工大学 一种基于限定核范数的低秩张量估计的视觉数据补全方法
CN109949268A (zh) * 2019-01-24 2019-06-28 郑州大学第一附属医院 一种基于机器学习的肝细胞癌分化水平分级方法
CN109858562A (zh) * 2019-02-21 2019-06-07 腾讯科技(深圳)有限公司 一种医学影像的分类方法、装置和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
T. YOKOTA ET AL: "Missing Slice Recovery for Tensors Using a Low-Rank Model in Embedded Space", 《2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
T. YOKOTA ET AL: "Smooth PARAFAC Decomposition for Tensor Completion", 《IEEE TRANSACTIONS ON SIGNAL PROCESSING》 *
王旭东等: "身份保持约束下的人脸图像补全", 《网络与信息安全学报》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583217A (zh) * 2020-04-30 2020-08-25 深圳开立生物医疗科技股份有限公司 一种肿瘤消融疗效预测方法、装置、设备及计算机介质
CN111938592A (zh) * 2020-08-13 2020-11-17 天津工业大学 面向阿尔兹海默症诊断的有缺失多模态表示学习算法
CN111938592B (zh) * 2020-08-13 2024-03-12 天津工业大学 面向阿尔兹海默症诊断的有缺失多模态表示学习算法
CN112329633A (zh) * 2020-11-05 2021-02-05 南开大学 基于张量分解的情感识别方法、装置、介质及电子设备
CN112329633B (zh) * 2020-11-05 2022-08-23 南开大学 基于张量分解的情感识别方法、装置、介质及电子设备
CN117911802A (zh) * 2024-01-17 2024-04-19 电子科技大学 基于变换域张量分解的不规则高维数据复原方法及系统
CN117911802B (zh) * 2024-01-17 2024-07-09 电子科技大学 基于变换域张量分解的不规则高维数据复原方法及系统

Similar Documents

Publication Publication Date Title
CN110717550A (zh) 一种基于多模态图像缺失补全的分类方法
Chen et al. Deep learning with hierarchical convolutional factor analysis
CN109993825A (zh) 一种基于深度学习的三维重建方法
CN102722896B (zh) 基于自适应压缩感知的自然图像非局部重构方法
CN104899830B (zh) 一种图像超分辨方法
CN107341776B (zh) 基于稀疏编码与组合映射的单帧超分辨率重建方法
Wen et al. FRIST—Flipping and rotation invariant sparsifying transform learning and applications
CN108961180B (zh) 红外图像增强方法及系统
CN103593825A (zh) 基于改进的非局部约束和局部自相似性的图像超分辨方法
CN111125397B (zh) 一种基于卷积神经网络的布料图像检索方法
Syam et al. An effective similarity measure via genetic algorithm for content based image retrieval with extensive features.
Mitra et al. Robust RVM regression using sparse outlier model
US20230154069A1 (en) Magnetic Resource Imaging Method Using Score-based Diffusion Model And Apparatus thereof
Li et al. Instant edit propagation on images based on bilateral grid
Huang et al. A deep dictionary model for image super-resolution
Dang et al. Image super-resolution via local self-learning manifold approximation
CN104299201B (zh) 基于遗传稀疏优化的图像重构方法
Yang et al. Xception-based general forensic method on small-size images
CN115082337A (zh) 一种基于双重全变分的高光谱混合噪声去除方法
CN116188882A (zh) 融合自注意力和多路路径图卷积的点云上采样方法及系统
Han et al. Cluster-based image super-resolution via jointly low-rank and sparse representation
Zhang et al. Image super-resolution based on dictionary learning and anchored neighborhood regression with mutual incoherence
CN102436642B (zh) 结合mrf和神经网络的多尺度彩色纹理图像分割方法
Su et al. Automatic Machine Learning Method for Hyper-parameter Search
CN111046745B (zh) 基于软块对角的多视聚类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200121

RJ01 Rejection of invention patent application after publication