CN105654110A - 一种张量模式下的有监督学习优化方法及系统 - Google Patents

一种张量模式下的有监督学习优化方法及系统 Download PDF

Info

Publication number
CN105654110A
CN105654110A CN201510882461.0A CN201510882461A CN105654110A CN 105654110 A CN105654110 A CN 105654110A CN 201510882461 A CN201510882461 A CN 201510882461A CN 105654110 A CN105654110 A CN 105654110A
Authority
CN
China
Prior art keywords
tensor
projection
objective function
sigma
alpha
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510882461.0A
Other languages
English (en)
Inventor
王书强
曾德威
施昌宏
卢哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201510882461.0A priority Critical patent/CN105654110A/zh
Publication of CN105654110A publication Critical patent/CN105654110A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明适用于模式识别技术领域,提供了一种张量模式下的有监督学习优化方法、系统,包括:接收输入的训练张量数据集;将类内散布矩阵引入目标函数,使得目标函数最大化类间距离的同时最小化类内距离;构建OPSTM子问题的目标函数的优化框架;构建OPSTM问题的目标函数的优化框架;求解修改后的对偶问题,输出拉格朗日的最优组合及偏移标量b;计算投影张量W*;计算最优投影张量W;根据W和b构建决策函数;待预测张量数据经过秩一分解后,输入到决策函数中进行预测。本发明,克服了向量模式算法在处理张量数据时出现的维度灾难、过学习、小样本等问题,并且有效地避免了现有的张量模式算法耗时的交替投影迭代过程。

Description

一种张量模式下的有监督学习优化方法及系统
技术领域
本发明属于模式识别技术领域,尤其涉及一种张量模式下的有监督学习优化方法及系统。
背景技术
随着大数据时代的到来,数据的张量表达逐渐成为主流。然而,在实现本发明过程中,发明人发现现有技术还是采用向量模式算法处理张量数据。根据向量模式算法的观点,须在预处理阶段对原始数据进行特征提取(向量化),这样,一是容易破坏张量数据特有的空间信息及内在相关性,二是模型参数过多,容易导致维度灾难、过学习、小样本等问题。
许多张量模式算法成为时代的新宠。然而,STM的目标函数求解是非凸优化问题,需要利用交替投影方法求解,算法的时间复杂度很高,并且常遭遇局部最小值问题。
发明内容
有鉴于此,本发明实施例提供一种张量模式下的有监督学习优化方法及系统,以解决现有技术提供的向量模式算法,在处理张量数据时出现的维度灾难、过学习、小样本等问题,克服现有的张量模式算法,本发明的算法是为了解决现有算法的局限,比如存在算法的时间复杂度很高,并且常遭遇局部最小值等问题。
第一方面,提供一种张量模式下的有监督学习优化方法,所述方法包括:
接收输入的训练张量数据集;
将类内散布矩阵引入目标函数,使得目标函数最大化类间距离的同时最小化类内距离;
构建最优投影张量机OPSTM子问题的目标函数的优化框架;
将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建OPSTM问题的目标函数的优化框架;
根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题,并将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题;
利用序列最小优化SMO算法,求解修改后的对偶问题,输出拉格朗日的最优组合及偏移标量b;
计算投影张量W*
对投影张量W*进行秩一分解;
对投影张量W*进行秩一分解后得到的分量进行逆投影;
对经过逆投影后的分量,进行秩一分解逆运算,得到训练张量数据集对应的最优投影张量W;
构建决策函数阶段,将最优投影张量W经过秩一分解后和偏移标量b一起构建决策函数;
在应用预测阶段,待预测张量数据经过秩一分解后,输入到所述决策函数中,进行预测。
进一步地,通过eta系数η将类内散布矩阵引入STM子问题的目标函数后,第n个子问题的二次规划问题的目标函数变为:
其中,是训练张量数据集沿第n阶展开后估计的第n阶类内散布矩阵,w(n)是训练张量数据集的第n阶的最优投影向量,n=1,2,……N,C是惩罚因子,是松弛变量,eta系数η用于衡量类内散布矩阵的重要性。
进一步地,OPSTM问题的目标函数的优化框架是N个向量模式二次规划问题的组合,分别对应着一个子问题,其中,第n个子问题的二次规划问题为:
其中,为训练张量数据集的第n阶的投影向量,Λ(n)和P(n)满足E是单位矩阵,是训练张量数据集中的张量输入数据Xm沿各阶投影后得到的张量输入数据,×i是i-mode乘运算符,b(n)为训练张量数据集的第n阶的偏移标量。
进一步地,根据公式和公式将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建的OPSTM问题的目标函数的优化框架满足:
其中,<>是内积运算符,
进一步地,根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题为:
0<αm<Cm=1,2,…M;
将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题为:
0<αm<Cm=1,2,…M。
进一步地,根据公式计算投影张量W*
第二方面,提供一种张量模式下的有监督学习优化系统,所述系统包括:
数据接收单元,用于接收输入的训练张量数据集;
类内散布引入单元,用于将类内散布矩阵引入目标函数,使得目标函数最大化类间距离的同时最小化类内距离;
子问题优化框架构建单元,用于构建最优投影张量机OPSTM子问题的目标函数的优化框架;
问题优化框架构建单元,用于将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建OPSTM问题的目标函数的优化框架;
对偶问题获得单元,用于根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题,并将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题;
对偶问题求解单元,用于利用序列最小优化SMO算法,求解修改后的对偶问题,输出拉格朗日的最优组合及偏移标量b;
投影张量计算单元,用于计算投影张量W*
投影张量分解单元,用于对投影张量W*进行秩一分解;
逆投影单元,用于对投影张量W*进行秩一分解后得到的分量进行逆投影;
最优投影张量计算单元,用于对经过逆投影后的分量,进行秩一分解逆运算,得到训练张量数据集对应的最优投影张量W;
决策函数构建单元,用于构建决策函数阶段,将最优投影张量W经过秩一分解后和偏移标量b一起构建决策函数;
预测单元,用于在应用预测阶段,待预测张量数据经过秩一分解后,输入到所述决策函数中,进行预测。
进一步地,所述类内散布引入单元通过eta系数η将类内散布矩阵引入STM子问题的目标函数后,第n个子问题的二次规划问题的目标函数变为:
其中,是训练张量数据集沿第n阶展开后估计的第n阶类内散布矩阵,w(n)是训练张量数据集的第n阶的最优投影向量,n=1,2,……N,C是惩罚因子,是松弛变量,eta系数η用于衡量类内散布矩阵的重要性。
进一步地,所述子问题优化框架构建单元中,OPSTM问题的目标函数的优化框架是N个向量模式二次规划问题的组合,分别对应着一个子问题,其中,第n个子问题的二次规划问题为:
其中,为训练张量数据集的第n阶的投影向量,Λ(n)和P(n)满足E是单位矩阵,是训练张量数据集中的张量输入数据Xm沿各阶投影后得到的张量输入数据,×i是i-mode乘运算符,b(n)为训练张量数据集的第n阶的偏移标量。
进一步地,所述问题优化框架构建单元根据公式和公式将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建的OPSTM问题的目标函数的优化框架满足:
其中,<>是内积运算符,
进一步地,所述对偶问题求解单元根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题为:
0<αm<Cm=1,2,…M;
所述对偶问题求解单元将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题为:
进一步地,所述投影张量计算单元根据公式计算投影张量W*
在本发明实施例,将N个向量模式的二次规划问题转化为单个张量模式下的多重二次规划问题,转化后的目标函数的优化框架即为OPSTM问题的目标函数的优化框架,可以大幅降低模型的参数数量,克服了传统的向量模式算法在处理张量数据时出现的维度灾难、过学习、小样本等问题,在保证高效处理的同时,凸显其极优的分类效果。综上,本发明的实施例提供的算法能够直接在张量领域高效处理张量数据,同时具备最优的分类能力的特点,具有较强的实用性和推广性。
附图说明
图1是本发明张量模式下的有监督学习优化方法实施例的实现流程图;
图2是本发明张量模式下的有监督学习优化系统实施例的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明实施例中,接收输入的训练张量数据集;将类内散布矩阵引入目标函数,使得目标函数最大化类间距离的同时最小化类内距离;构建最优投影张量机OPSTM子问题的目标函数的优化框架;构建OPSTM问题的目标函数的优化框架;根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题,并将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题;利用序列最小优化SMO算法,求解修改后的对偶问题,输出拉格朗日的最优组合及偏移标量;计算投影张量;对投影张量进行秩一分解;对投影张量进行秩一分解后得到的分量进行逆投影;对经过逆投影后的分量,进行秩一分解逆运算,得到训练张量数据集对应的最优投影张量W;构建决策函数阶段,将最优投影张量W经过秩一分解后和偏移标量一起构建决策函数;在应用预测阶段,待预测张量数据经过秩一分解后,输入到所述决策函数中,进行预测。
以下结合具体实施例对本发明的实现进行详细描述:
实施例一
图1示出了本发明实施例一提供的张量模式下的有监督学习优化方法的实现流程,详述如下:
在步骤S101中,接收输入的训练张量数据集。
在本发明实施例中,假设训练张量数据集为{Xm,ym|m=1,2.....M},其中,Xm表示张量输入数据,ym∈{+1,-1}表示标签。
以灰度图像为例,样本点以二阶张量(矩阵)的形式进行数据存储,所有样本点以列向量形式组成输入数据集,同理,标签集也是列向量,并且,每个标签的位置对应着相应样本点的位置。
在步骤S102中,将类内散布矩阵引入目标函数,使得目标函数最大化类间距离的同时最小化类内距离。
在本发明实施例中,支持张量机(SupportTensorMachine,STM)问题的目标函数优化框架是N个向量模式二次规划问题的组合,分别对应着一个子问题,其中,第n个子问题的二次规划问题为:
其中,w(n):训练张量数据集的第n阶的最优投影向量,n=1,2,……N;
b(n):训练张量数据集的第n阶的偏移标量,n=1,2,……N。
C:是惩罚因子;
松弛变量。
通过eta系数η将类内散布矩阵引入STM子问题的目标函数后,第n个子问题的二次规划问题的目标函数变为:
其中,是训练张量数据集沿第n阶展开后估计的第n阶类内散布矩阵,此时的w(n),在训练张量数据集的第n阶具有Fisher准则效果“最大化类间距,最小化类内距”,eta系数η用于衡量类内散布的重要性。
在步骤S103中,构建最优投影张量机OPSTM子问题的目标函数的优化框架。
在本发明实施例中,最优投影张量机OPSTM问题的目标函数的优化框架是N个向量模式二次规划问题的组合,分别对应着一个子问题,其中,第n个子问题的二次规划问题为:
其中,训练张量数据集的第n阶的投影向量,n=1,2,……N;w(n)是公式(1-4)中的训练张量数据集的第n阶的最优投影向量;Λ(n)和P(n)满足E是单位矩阵。
是张量输入数据Xm沿各阶投影后得到的张量输入数据,×i是i-mode乘运算符。
在步骤S104中,将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建OPSTM问题的目标函数的优化框架。
在本发明实施例中,
其中,表示范数,“ο”是外积运算符。根据公式Eq.1和Eq.2,有因此,可以将N个子问题的向量模式二次规划问题转化为单个张量模式下的多重二次规划问题,即OPSTM问题的目标函数的优化框架为:
其中,W*是投影张量,<>是内积运算符,
通过Eq.1和Eq.2,将N个向量模式的二次规划问题转化为单个张量模式下的多重二次规划问题,转化后目标函数优化框架即为OPSTM问题的目标函数优化框架。大幅度降低了模型的参数数量,克服了向量算法在处理张量数据时出现的维度灾难、过学习、小样本等问题。
在步骤S105中,根据拉格朗日乘子法,得到所述目标函数优化框架的对偶问题,并将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题。
在本发明实施例中,根据拉格朗日乘子法,得到OPSTM问题的目标函数的优化框架[(3-1)、(3-2、(3-3)]的对偶问题,其中,αm是拉格朗日乘子。
将张量CP(CANDECOMP/PARAFAC)分解引入到张量内积的计算。
张量数据Vi、Vj的秩一分解分别为:
所以对偶问题可以修改为:
0<αm<Cm=1,2,…M(4-3)
修改后的对偶问题的目标函数(4-1)中,张量内积计算部分,引入张量秩一分解辅助计算,进一步降低计算复杂度及储存代价,同时张量秩一分解能够获得张量对象更加紧凑和更有意义的表示,能够更有效提取张量数据的结构信息及内在相关性,并且有效地避免了现有的张量模式算法耗时的交替投影迭代过程。
在步骤S106中,利用序列最小优化SMO算法,求解修改后的对偶问题,输出拉格朗日的最优组合α=[α1,α2,……αM]及偏移标量b。
在步骤S107中,计算投影张量W*
在本发明实施例中,根据公式计算影张量W*
在步骤S108中,对投影张量W*进行秩一分解。
在本发明实施例中,对投影张量W*进行秩一分解,得到
在步骤S109中,对投影张量W*进行秩一分解后得到的分量进行逆投影。
在本发明实施例中,对投影张量W*进行秩一分解后的分量进行逆投影,得到w(n)对应(1-4)的最优投影向量,是训练张量数据集的第n阶的最优投影向量,n=1,2,……N。
在步骤S110中,对经过逆投影后的分量,进行秩一分解逆运算,得到训练张量数据集对应的最优投影张量W。
在本发明实施例中,将逆投影后得到的分量融合(秩一分解逆运算)成最优投影张量W,所以,最优投影张量W在各阶都能体现Fisher准则。
在步骤S111中,构建决策函数阶段,最优投影张量W经过秩一分解后和偏移标量b一起构建决策函数。
在本发明实施例中,构建决策函数阶段,最优投影张量W须经过秩一分解,分解后和偏移标量b一起构建决策函数:
在步骤S112中,在应用预测阶段,待预测张量数据经过秩一分解后,输入到决策函数中,进行预测。
在本发明实施例中,在应用预测阶段,待预测张量数据须经过秩一分解后,输入到决策函数中进行预测。
本实施例,相比现有的技术,具有以下的优点:1)、将N个向量模式的二次规划问题转化为单个张量模式下的多重二次规划问题,转化后的目标函数的优化框架即为OPSTM问题的目标函数的优化框架,可以大幅降低模型的参数数量,克服了传统的向量模式算法在处理张量数据时出现的维度灾难、过学习、小样本等问题,在保证高效处理的同时,凸显其极优的分类效果。综上,本发明的实施例提供的算法能够直接在张量领域高效处理张量数据,同时具备最优的分类能力的特点,具有较强的实用性和推广性。2)、将类内散布矩阵引入目标函数,,能够直接在张量领域接收处理张量数据,输出的最优投影张量W在各阶都能体现Fisher准则“最大化类间距,最小化类内距”。3)、对偶问题的目标函数(4-1)中,张量内积计算部分,引入张量秩一分解辅助计算,进一步降低计算复杂度及储存代价,同时张量秩一分解能够获得张量对象更加紧凑和更有意义的表示,能够更有效提取张量数据的结构信息及内在相关性,并且有效地避免了耗时的交替投影迭代过程。
应理解,在本发明实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘或光盘等。
实施例二
图2示出了本发明实施例二提供的张量模式下的有监督学习优化系统的具体结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。该张量模式下的有监督学习优化系统2包括:数据接收单元21、类内散布引入单元22、子问题优化框架构建单元23、问题优化框架构建单元24、对偶问题获得单元25、对偶问题求解单元26、投影张量计算单元27、投影张量分解单元28、逆投影单元29、最优投影张量计算单元210、决策函数构建单元211和预测单元212。
其中,数据接收单元21,用于接收输入的训练张量数据集;
类内散布引入单元22,用于将类内散布矩阵引入目标函数,使得目标函数最大化类间距离的同时最小化类内距离;
子问题优化框架构建单元23,用于构建最优投影张量机OPSTM子问题的目标函数的优化框架;
问题优化框架构建单元24,用于将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建OPSTM问题的目标函数的优化框架;
对偶问题获得单元25,用于根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题,并将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题;
对偶问题求解单元26,用于利用序列最小优化SMO算法,求解修改后的对偶问题,输出拉格朗日的最优组合及偏移标量b;
投影张量计算单元27,用于计算投影张量W*
投影张量分解单元28,用于对投影张量W*进行秩一分解;
逆投影单元29,用于对投影张量W*进行秩一分解后得到的分量进行逆投影;
最优投影张量计算单元210,用于对经过逆投影后的分量,进行秩一分解逆运算,得到训练张量数据集对应的最优投影张量W;
决策函数构建单元211,用于构建决策函数阶段,将最优投影张量W经过秩一分解后和偏移标量b一起构建决策函数;
预测单元212,用于在应用预测阶段,待预测张量数据经过秩一分解后,输入到所述决策函数中,进行预测。
进一步地,所述类内散布引入单元22通过eta系数η将类内散布矩阵引入STM子问题的目标函数后,第n个子问题的二次规划问题的目标函数变为:
其中,是训练张量数据集沿第n阶展开后估计的第n阶类内散布矩阵,w(n)是训练张量数据集的第n阶的最优投影向量,n=1,2,……N,C是惩罚因子,是松弛变量,eta系数η用于衡量类内散布矩阵的重要性。
进一步地,所述子问题优化框架构建单元23中,OPSTM问题的目标函数的优化框架是N个向量模式二次规划问题的组合,分别对应着一个子问题,其中,第n个子问题的二次规划问题为:
其中,为训练张量数据集的第n阶的投影向量,Λ(n)和P(n)满足E是单位矩阵,是训练张量数据集中的张量输入数据Xm沿各阶投影后得到的张量输入数据,×i是i-mode乘运算符,b(n)为训练张量数据集的第n阶的偏移标量。
进一步地,所述问题优化框架构建单元24根据公式和公式将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建的OPSTM问题的目标函数的优化框架满足:
其中,<>是内积运算符,
进一步地,所述对偶问题求解单元26根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题为:
0<αm<Cm=1,2,…M;
所述对偶问题求解单元26将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题为:
进一步地,所述投影张量计算单元27根据公式计算投影张量W*
本发明实施例提供的张量模式下的有监督学习优化系统2可以应用在前述对应的方法实施例一中,详情参见上述实施例一的描述,在此不再赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (12)

1.一种张量模式下的有监督学习优化方法,其特征在于,所述方法包括:
接收输入的训练张量数据集;
将类内散布矩阵引入目标函数,使得目标函数最大化类间距离的同时最小化类内距离;
构建最优投影张量机OPSTM子问题的目标函数的优化框架;
将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建OPSTM问题的目标函数的优化框架;
根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题,并将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题;
利用序列最小优化SMO算法,求解修改后的对偶问题,输出拉格朗日的最优组合及偏移标量b;
计算投影张量W*
对投影张量W*进行秩一分解;
对投影张量W*进行秩一分解后得到的分量进行逆投影;
对经过逆投影后的分量,进行秩一分解逆运算,得到训练张量数据集对应的最优投影张量W;
构建决策函数阶段,将最优投影张量W经过秩一分解后和偏移标量b一起构建决策函数;
在应用预测阶段,待预测张量数据经过秩一分解后,输入到所述决策函数中,进行预测。
2.如权利要求1所述的方法,其特征在于,通过eta系数η将类内散布矩阵引入STM子问题的目标函数后,第n个子问题的二次规划问题的目标函数变为:
min w ( n ) , b ( n ) , &xi; ( n ) 1 2 &lsqb; ( | | w ( n ) | | F 2 + &eta; ( ( w ( n ) ) T S w ( n ) w ( n ) ) ) &Pi; 1 < i < N i &NotEqual; n ( | | w ( i ) | | F 2 + &eta; ( ( w ( i ) ) T S w ( n ) w ( i ) ) ) &rsqb; + C &Sigma; m = 1 M &xi; m ( n )
其中,是训练张量数据集沿第n阶展开后估计的第n阶类内散布矩阵,w(n)是训练张量数据集的第n阶的最优投影向量,n=1,2,……N,C是惩罚因子,是松弛变量,eta系数η用于衡量类内散布矩阵的重要性。
3.如权利要求2所述的方法,其特征在于,OPSTM问题的目标函数的优化框架是N个向量模式二次规划问题的组合,分别对应着一个子问题,其中,第n个子问题的二次规划问题为:
min w * ( n ) , b ( n ) , &xi; ( n ) 1 2 | | w * ( n ) | | F 2 &Pi; 1 &le; i &le; N i &NotEqual; n | | w * ( i ) | | F 2 + C &Sigma; m = 1 M &xi; m ( n )
S . t y m ( ( w * ( n ) ) T ( V m &Pi; 1 &le; i &le; N i &NotEqual; n &times; w * ( i ) i ) + b ( n ) ) &GreaterEqual; 1 - &xi; m ( n ) &xi; m ( n ) &GreaterEqual; 0 , m = 1 , 2 , ... M
其中,为训练张量数据集的第n阶的投影向量, w * ( n ) = &Lambda; ( n ) 1 / 2 P ( n ) T w ( n ) , Λ(n)和P(n)满足 P ( n ) T ( E + &eta;S w ( n ) ) P ( n ) = &Lambda; ( n ) , E是单位矩阵,是训练张量数据集中的张量输入数据Xm沿各阶投影后得到的张量输入数据,×i是i-mode乘运算符,b(n)为训练张量数据集的第n阶的偏移标量。
4.如权利要求3所述的方法,其特征在于,根据公式和公式将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建的OPSTM问题的目标函数的优化框架满足:
m i n W * , b , &xi; 1 2 | | W * | | F 2 + C &Sigma; m = 1 M &xi; m
S . t y m ( < W * , V m > + b ) &GreaterEqual; 1 - &xi; m &xi; m &GreaterEqual; 0 , m = 1 , 2 , ... M
其中,<>是内积运算符,
5.如权利要求4所述的方法,其特征在于,根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题为:
m a x &alpha; &Sigma; m = 1 M &alpha; m - 1 2 &Sigma; i , j = 1 M &alpha; i &alpha; j y i y j < V i , V j >
S . t &Sigma; m = 1 M ( &alpha; m y m ) = 0 0 < &alpha; m < C , m = 1 , 2 , ... M ;
将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题为:
m a x &alpha; &Sigma; m = 1 M &alpha; m - 1 2 &Sigma; i , j = 1 M &Sigma; p = 1 R &Sigma; q = 1 R &alpha; i &alpha; j y i y j &Sigma; n = 1 N < v i p ( n ) , v j p ( n ) >
S . t &Sigma; m = 1 M ( &alpha; m y m ) = 0 0 < &alpha; m < C , m = 1 , 2 , ... M .
6.如权利要求5所述的方法,其特征在于,根据公式计算投影张量W*
7.一种张量模式下的有监督学习优化系统,其特征在于,所述系统包括:
数据接收单元,用于接收输入的训练张量数据集;
类内散布引入单元,用于将类内散布矩阵引入目标函数,使得目标函数最大化类间距离的同时最小化类内距离;
子问题优化框架构建单元,用于构建最优投影张量机OPSTM子问题的目标函数的优化框架;
问题优化框架构建单元,用于将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建OPSTM问题的目标函数的优化框架;
对偶问题获得单元,用于根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题,并将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题;
对偶问题求解单元,用于利用序列最小优化SMO算法,求解修改后的对偶问题,输出拉格朗日的最优组合及偏移标量b;
投影张量计算单元,用于计算投影张量W*
投影张量分解单元,用于对投影张量W*进行秩一分解;
逆投影单元,用于对投影张量W*进行秩一分解后得到的分量进行逆投影;
最优投影张量计算单元,用于对经过逆投影后的分量,进行秩一分解逆运算,得到训练张量数据集对应的最优投影张量W;
决策函数构建单元,用于构建决策函数阶段,将最优投影张量W经过秩一分解后和偏移标量b一起构建决策函数;
预测单元,用于在应用预测阶段,待预测张量数据经过秩一分解后,输入到所述决策函数中,进行预测。
8.如权利要求7所述的系统,其特征在于,所述类内散布引入单元通过eta系数η将类内散布矩阵引入STM子问题的目标函数后,第n个子问题的二次规划问题的目标函数变为:
min w ( n ) , b ( n ) , &xi; ( n ) 1 2 &lsqb; ( | | w ( n ) | | F 2 + &eta; ( ( w ( n ) ) T S w ( n ) w ( n ) ) ) &Pi; 1 < i < N i &NotEqual; n ( | | w ( i ) | | F 2 + &eta; ( ( w ( i ) ) T S w ( n ) w ( i ) ) ) &rsqb; + C &Sigma; m = 1 M &xi; m ( n )
其中,是训练张量数据集沿第n阶展开后估计的第n阶类内散布矩阵,w(n)是训练张量数据集的第n阶的最优投影向量,n=1,2,……N,C是惩罚因子,是松弛变量,eta系数η用于衡量类内散布矩阵的重要性。
9.如权利要求8所述的系统,其特征在于,所述子问题优化框架构建单元中,OPSTM问题的目标函数的优化框架是N个向量模式二次规划问题的组合,分别对应着一个子问题,其中,第n个子问题的二次规划问题为:
min w * ( n ) , b ( n ) , &xi; ( n ) 1 2 | | w * ( n ) | | F 2 &Pi; 1 &le; i &le; N i &NotEqual; n | | w * ( i ) | | F 2 + C &Sigma; m = 1 M &xi; m ( n )
S . t y m ( ( w * ( n ) ) T ( V m &Pi; 1 &le; i &le; N i &NotEqual; n &times; w * ( n ) i ) + b ( n ) ) &GreaterEqual; 1 - &xi; m ( n ) &xi; m ( n ) &GreaterEqual; 0 , m = 1 , 2 , ... M
其中,为训练张量数据集的第n阶的投影向量, w * ( n ) = &Lambda; ( n ) 1 / 2 P ( n ) T w ( n ) , Λ(n)和P(n)满足 P ( n ) T ( E + &eta;S w ( n ) ) P ( n ) = &Lambda; ( n ) , E是单位矩阵,是训练张量数据集中的张量输入数据Xm沿各阶投影后得到的张量输入数据,×i是i-mode乘运算符,b(n)为训练张量数据集的第n阶的偏移标量。
10.如权利要求9所述的系统,其特征在于,所述问题优化框架构建单元根据公式 | | W * | | F 2 = &Pi; n = 1 N | | w * ( n ) | | F 2 和公式 ( w * ( n ) ) T ( V m &Pi; 1 < i < N i &NotEqual; n &times; w * ( n ) i ) = < W * , V m > , 将N个向量模式的二次规划子问题转化为单个张量模式下的多重二次规划问题,构建的OPSTM问题的目标函数的优化框架满足:
m i n W * , b , &xi; 1 2 | | W * | | F 2 + C &Sigma; m = 1 M &xi; m
S . t y m ( < W * , V m > + b ) &GreaterEqual; 1 - &xi; m &xi; m &GreaterEqual; 0 , m = 1 , 2 , ... M
其中,<>是内积运算符,
11.如权利要求10所述的系统,其特征在于,所述对偶问题求解单元根据拉格朗日乘子法,得到所述目标函数的优化框架的对偶问题为:
m a x &alpha; &Sigma; m = 1 M &alpha; m - 1 2 &Sigma; i , j = 1 M &alpha; i &alpha; j y i y j < V i , V j >
S . t &Sigma; m = 1 M ( &alpha; m y m ) = 0 0 < &alpha; m < C , m = 1 , 2 , ... M ;
所述对偶问题求解单元将张量秩一分解引入到张量内积的计算,得到修改后的对偶问题为:
m a x &alpha; &Sigma; m = 1 M &alpha; m - 1 2 &Sigma; i , j = 1 M &Sigma; p = 1 R &Sigma; q = 1 R &alpha; i &alpha; j y i y j &Sigma; n = 1 N < v i p ( n ) , v j q ( n ) >
S . t &Sigma; m = 1 M ( &alpha; m y m ) = 0 0 < &alpha; m < C , m = 1 , 2 , ... M .
12.如权利要求11所述的系统,其特征在于,所述投影张量计算单元根据公式计算投影张量W*
CN201510882461.0A 2015-12-04 2015-12-04 一种张量模式下的有监督学习优化方法及系统 Pending CN105654110A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510882461.0A CN105654110A (zh) 2015-12-04 2015-12-04 一种张量模式下的有监督学习优化方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510882461.0A CN105654110A (zh) 2015-12-04 2015-12-04 一种张量模式下的有监督学习优化方法及系统

Publications (1)

Publication Number Publication Date
CN105654110A true CN105654110A (zh) 2016-06-08

Family

ID=56481927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510882461.0A Pending CN105654110A (zh) 2015-12-04 2015-12-04 一种张量模式下的有监督学习优化方法及系统

Country Status (1)

Country Link
CN (1) CN105654110A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017092022A1 (zh) * 2015-12-04 2017-06-08 深圳先进技术研究院 一种张量模式下的有监督学习优化方法及系统
CN107423190A (zh) * 2017-04-19 2017-12-01 国家电网公司 一种日志数据异常指向识别方法及装置
CN110765659A (zh) * 2019-11-20 2020-02-07 大连理工大学 一种针对航空发动机故障诊断的支持三阶张量机建模方法
CN112085704A (zh) * 2020-08-07 2020-12-15 深圳先进技术研究院 医学图像分类方法、装置、终端设备及存储介质
CN112926168A (zh) * 2019-12-05 2021-06-08 杭州海康威视数字技术股份有限公司 确定最优计算模板的方法和装置
US11107100B2 (en) 2019-08-09 2021-08-31 International Business Machines Corporation Distributing computational workload according to tensor optimization
CN113796874A (zh) * 2021-11-19 2021-12-17 北京大学 一种基于张量分解模型的多元脑电数据识别分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0831405A2 (en) * 1996-09-24 1998-03-25 Japan Science and Technology Corporation Function approximation method
CN103886329A (zh) * 2014-03-21 2014-06-25 西安电子科技大学 基于张量分解降维的极化图像分类方法
CN104361318A (zh) * 2014-11-10 2015-02-18 中国科学院深圳先进技术研究院 一种基于弥散张量成像技术的疾病诊断辅助系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0831405A2 (en) * 1996-09-24 1998-03-25 Japan Science and Technology Corporation Function approximation method
CN103886329A (zh) * 2014-03-21 2014-06-25 西安电子科技大学 基于张量分解降维的极化图像分类方法
CN104361318A (zh) * 2014-11-10 2015-02-18 中国科学院深圳先进技术研究院 一种基于弥散张量成像技术的疾病诊断辅助系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
牛少波: ""基于张量学习的目标识别技术研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
蔡燕: ""模糊支持张量机"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017092022A1 (zh) * 2015-12-04 2017-06-08 深圳先进技术研究院 一种张量模式下的有监督学习优化方法及系统
US10748080B2 (en) 2015-12-04 2020-08-18 Shenzhen Institutes Of Advanced Technology Method for processing tensor data for pattern recognition and computer device
CN107423190A (zh) * 2017-04-19 2017-12-01 国家电网公司 一种日志数据异常指向识别方法及装置
CN107423190B (zh) * 2017-04-19 2020-09-01 国家电网公司 一种日志数据异常指向识别方法及装置
US11107100B2 (en) 2019-08-09 2021-08-31 International Business Machines Corporation Distributing computational workload according to tensor optimization
CN110765659A (zh) * 2019-11-20 2020-02-07 大连理工大学 一种针对航空发动机故障诊断的支持三阶张量机建模方法
CN112926168A (zh) * 2019-12-05 2021-06-08 杭州海康威视数字技术股份有限公司 确定最优计算模板的方法和装置
CN112085704A (zh) * 2020-08-07 2020-12-15 深圳先进技术研究院 医学图像分类方法、装置、终端设备及存储介质
CN113796874A (zh) * 2021-11-19 2021-12-17 北京大学 一种基于张量分解模型的多元脑电数据识别分析方法
CN113796874B (zh) * 2021-11-19 2022-01-28 北京大学 一种基于张量分解模型的多元脑电数据识别分析方法

Similar Documents

Publication Publication Date Title
CN105654110A (zh) 一种张量模式下的有监督学习优化方法及系统
CN109657805B (zh) 超参数确定方法、装置、电子设备及计算机可读介质
CN111149117B (zh) 机器学习和深度学习模型的基于梯度的自动调整
EP3462385A1 (en) Sgcnn: structural graph convolutional neural network
Yang et al. Machine learning approaches to the unit commitment problem: Current trends, emerging challenges, and new strategies
US10916333B1 (en) Artificial intelligence system for enhancing data sets used for training machine learning-based classifiers
Dong et al. Hybrid surrogate-based optimization using space reduction (HSOSR) for expensive black-box functions
JP2020194560A (ja) 因果関係分析方法および電子デバイス
US11651260B2 (en) Hardware-based machine learning acceleration
EP3843017A2 (en) Automated, progressive explanations of machine learning results
CN103389966A (zh) 一种海量数据的处理、搜索、推荐方法及装置
WO2017092022A1 (zh) 一种张量模式下的有监督学习优化方法及系统
Sarwar et al. A survey of big data analytics in healthcare
EP3701403B1 (en) Accelerated simulation setup process using prior knowledge extraction for problem matching
Nagarajan et al. Accelerating machine-learning algorithms on FPGAs using pattern-based decomposition
Piccialli et al. SOS-SDP: an exact solver for minimum sum-of-squares clustering
Kang et al. Urban traffic travel time short‐term prediction model based on spatio‐temporal feature extraction
CN102693265A (zh) 构造混合模型的方法
Hull Machine learning for economics and finance in tensorflow 2
CN115688047A (zh) 基于深度学习的城市能源多源数据融合方法及存储介质
CN104679754B (zh) 用于数据预测的模型选择设备和方法
Rivotti et al. Constrained dynamic programming of mixed-integer linear problems by multi-parametric programming
CN114547307A (zh) 文本向量模型训练方法、文本匹配方法、装置及设备
Qu et al. Adaptive planning of human–robot collaborative disassembly for end-of-life lithium-ion batteries based on digital twin
CN115456680A (zh) 基于交叉特征提取模型的广告点击预测方法及其相关设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160608

RJ01 Rejection of invention patent application after publication