CN103473308A

CN103473308A - 基于最大间隔张量学习的高维多媒体数据分类方法

Info

Publication number: CN103473308A
Application number: CN2013104106049A
Authority: CN
Inventors: 张寅�; 汤斯亮; 谭谞; 邵健; 吴飞; 庄越挺
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2013-09-10
Filing date: 2013-09-10
Publication date: 2013-12-25
Anticipated expiration: 2033-09-10
Also published as: CN103473308B

Abstract

本发明公开了一种基于最大间隔张量学习的高维多媒体数据分类方法。它包括如下步骤：1）建立多媒体数据的训练数据集；2）对训练数据集建模，进行分析，得到分类模型；3）根据用户查询数据集及分类模型，对查询数据集分类。本发明针对多媒体的高维性和结构性，利用张量来表达多媒体数据，并通过最大间隔分类器的方法，对高维的多媒体数据进行分类。在对多媒体数据进行分解分析的同时完成分类，不仅保留了多媒体数据中的结构信息，而且避免了传统的通过拼合的方法产生的高维数据所引发的“维数灾难”，因此比传统的多媒体数据分类方法更加准确，并易于计算。

Description

基于最大间隔张量学习的高维多媒体数据分类方法

技术领域

本发明涉及多媒体分类，尤其涉及一种基于最大间隔张量学习的高维多媒体数据分类方法。

背景技术

随着计算机存储技术和网络技术的发展，信息不再仅仅是单一的文字或语言，而是以更加多样化的多媒体形式呈现，包括文本，图片，声音，视频，如图像数据库Picasa，视频数据库YouTube等。如何有效地获取、管理和利用这些多媒体数据成为计算机应用技术中越来越重要的研究问题。多媒体分类技术可以帮助用户有效地查询、管理这些海量的多媒体数据。一般来说，多媒体数据具有两个特点。第一，高维性，多媒体数据通常数据量巨大，特征维数高；第二，结构性：多媒体数据存在内部结构关系，如图像中物体的位置关系，视频中动作的先后关系。由于传统的分类方法往往将提取的特征进行简单的拼合，产生了非常高维的数据，从而在数据的分析中产生“维数灾难”。此外，传统的方法没有考虑多媒体数据中存在的内部结构信息，因此不能很好地处理和分析海量的高维多媒体数据，从而无法很好地适应用户需求。

针对多媒体数据的特点，张量可以用来表达和分析多媒体数据。张量，即多为数组，是对向量和矩阵的自然扩展。多媒体数据可以自然地表达成张量数据，如自然图像可以认为是由场景结构、光照及主体形象三方面因素共同作用的结果，因此，可以将自然图像表达成一个三阶张量；又如视频片断可以表达成“长×宽×时间”的三阶张量。在张量的表达中，多媒体数据中所包含的同一类型媒体数据特征被表达为张量的一阶。利用张量表达多媒体数据，一定程度避免了从不同类型媒体数据中所提取特征因为拼合而产生的维数灾难及过压缩问题，而且通过张量的表达可以自然地保留多媒体数据中的结构信息。通过对表达成张量的多媒体数据进行分解，可以得到多媒体数据分量的多维线性组合，很好地保留了多媒体数据内部的结构信息。

另一方面，在数据分类方面，近年来最大间隔的分类器，如支持向量机(support vector machines)，最大间隔马尔科夫网络(maximum margin MarkovNetworks)被广泛地应用于许多多媒体分类的问题中，并显示出了很好的分类效果。最大间隔的方法通常将数据映射到一个再生核希尔伯特空间(reproducingkernel Hilbert space)中，建立一个最优的分割超平面，将数据间的间隔最大化。最大间隔的分类器由于核的运用，具有很强的扩展性，因而近年来成为一个研究的热点。

本发明针对多媒体的高维性和结构性，利用张量来表达多媒体数据，并通过最大间隔分类器的方法，对高维的多媒体数据进行分类。在对多媒体数据进行分解分析的同时完成分类，不仅保留了多媒体数据中的结构信息，而且避免了传统的通过拼合的方法产生的高维数据所引发的“维数灾难”。

发明内容

本发明的目的在于对多媒体数据进行分类，使得相同主题图像标注为一类，以方便用户进行管理、检索多媒体数据，提出一种基于最大间隔张量学习的高维多媒体数据分类方法基于最大间隔张量学习的高维多媒体数据分类方法包括如下步骤：

(1)建立多媒体数据的训练数据集，提取不同种类的特征，并对多媒体数据进行标注；

(2)将训练数据集表达成张量，得到基于最大间隔张量学习的高维多媒体数据分类的目标函数，并对目标函数进行分析，优化，得到分类模型；

(3)对用户查询数据集提取不同种类的特征，根据分类模型，对查询数据集标注分类。

所述的步骤(1)包括：

所述的建立多媒体数据的训练数据集，其步骤如下：

1)编写爬虫程序下载用户所需的多媒体数据，构成多媒体数据集合

其中I_N是集合DATA中的多媒体数据个数；

2)对DATA中的多媒体数据提取不同种类的特征，T₁，...，T_N-1，N-1为特征的种类数；

3)对DATA中的多媒体数据进行标注，正例为“1”，反例为“0”；

4)建立训练张量

其中I₁，...，I_N-1模态对应为步骤2)中多媒体数据的特征T₁，...，T_N-1，I_N模态对应为多媒体数据个数。

所述的步骤(2)包括：

1)根据训练张量X，得到基于最大间隔张量学习的高维多媒体数据分类的目标函数：

\min_{U_{1}, . . . U_{N}} {| | X - C \times_{1} U_{1} \times_{2} . . . \times_{N} U_{N} | |}^{2} + Ω (X) - - - (1)

s.t.U_n＞0，1≤n≤N

其中Ω(X)表示训练数据的监督信息，U_n(1≤n≤N)为张量分解后得到的矩阵，C为核张量，其n阶展开矩阵C_(n)满足以下条件：

a)C_(n)的元素全由“0”或“1”组成；

b)C_(n)的所有行相互正交；

c)对于任意的n，C_(n)为满秩；

2)根据张量展开，可以将公式(1)写作：

\min_{U_{N}} {| | X_{(n)} - U_{N} B_{(n)} | |}^{2} + Ω (X_{(n)}) - - - (1)

s.t.U_n>0，1≤n≤N

其中，B_(n)=C×₁U₁×₂...×_n-1U_n-1×_n+1U_n+1×_n+2...×_NU_N，X_(n)为训练张量X的n阶展开矩阵；

令

X_{(n)} = {[x_{1}, x_{2}, . . ., x_{I_{n}}]}^{T}, U_{(n)} = {[u_{1}, u_{2}, . . ., u_{I_{n}}]}^{T}

将公式(1)中每一个矩阵U_i转置并分成I_i个独立的优化问题：

\min_{u_{i}} {| | x_{i} - B_{(n)}^{T} u_{i} | |}^{2} + Ω (x_{i}) - - - (2)

s.t.u_i>0，1≤i≤I_n

3)将公式(2)中有监督信息，即n=N时的分量引入最大间隔的分类器作为监督信息，得到如下的优化函数：

\min_{u_{i}^{(N)}, α} γ {| | x_{i}^{(N)} - B_{(N)}^{T} u_{i}^{(N)} | |}^{2} + {λα}^{T} Kα + Σ_{i = 1}^{I_{N}} L (y_{i}, K_{i}^{T} α) - - - (3)

U_{i}^{(N)} > 0,1 \leq i \leq I_{N}

其中，γ为控制近似误差的权重参数，λ为控制分类误差的权重参数，y_i为相应的标注标签，α为待优化的分类参数，L为损失函数L(y，t)=max(0，1-yt)²，K为核矩阵，其元素k_ij=k(u_i，u_j)，k为核函数；

4)使用共轭梯度下降的方法，迭代地优化参数α与矩阵分量

在优化分类参数α的过程中首先计算α的梯度：

{&dtri;}_{α} = 2 (λKα + K I^{0} (Kα - Y))

其中I⁰为I_N×I_N的对角矩阵，其中前n_v(支持向量的各数)个元素为1，其余为0。

然后计算α的Hessian矩阵：

H_α=2(λK+KI⁰K)

在优化矩阵分量的过程中，首先假定使用内积核：

k (u_{i}^{(N)}, u_{j}^{(N)}) = u_{i}^{(N) T} \cdot u_{j}^{(N)}

计算

的梯度：

\begin{matrix} {&dtri;}_{u_{i}^{(N)}} = - 2 γ B_{(N)} x_{i}^{(N)} + 2 γ (B_{(N)} B_{(N)}^{T}) u_{i}^{(N)} + 2 λ α_{i} Σ_{j = 1}^{I_{s}} α_{j} u_{j}^{(N)} \\ + 2 (Σ_{j = 1}^{n_{v}} l_{j} α_{j} u_{j}^{(N)} [i &Element; n_{v}] + α_{i} Σ_{j = 1}^{n_{v}} l_{j} u_{j}^{(N)}) \end{matrix}

然后计算

的Hessian矩阵：

H_{u_{i}^{(N)}} = 2 γ (B_{(N)} B_{(N)}^{T}) + (2 λ α_{i}^{2} + 4 l_{i} α_{i} [i &Element; n_{v}]) I_{ns}

其中，I_ns是大小为I_s的单位矩阵，[i∈n_v]是一个指示函数，当且仅当i属于支持向量的集合时函数值为1，其余为0；

5)对于公式(2)中无监督信息的模态，即n≠N时，加入稀疏选择的约束，即I₁范数：

\min_{u_{i}^{(n)}} {| | x_{i}^{(n)} - B_{(n)}^{T} u_{i}^{(n)} | |}^{2} + η_{(n)} | u_{i}^{(n)} | - - - (4)

s . t . u_{i}^{(n)} &GreaterEqual; 0, n &NotEqual; N

其中，η_(n)是控制模态n中的稀疏度；

6)使用如下方法求解公式(4)

u_{ij}^{(n)} = \{\begin{matrix} \frac{t - η_{(n)}}{b_{j} b_{j}^{T}}, & t > η_{(n)} \\ 0, & t \leq η_{(n)} \end{matrix}

其中，

为

中的元素，

B_{(n)} = {[b_{1}^{T}, b_{2}^{T}, . . ., b_{R_{n}}^{T}]}^{T}

t = b_{j} (B_{(n)}^{T} u_{i}^{(n)} - b_{j}^{T} x_{i})

7)根据步骤4)与步骤6)求得的u_i，拼合成U，反复迭代，直至收敛，得到分类模型的参数{U₁，...，U_N;α}。

所述的步骤(3)包括：

1)编写爬虫程序下载用户所需的待分类的多媒体数据，构成多媒体数据测试集合

其中I_Nt是集合TEST中的待分类的多媒体数据个数；

2)对TEST中的多媒体数据提取不同种类的特征，与训练时所提取的特征一致，Tt₁，...，Tt_N-1，N-1为特征的种类数；

3)建立测试张量

其中I₁，...，I_N-1模态对应为步骤2)中多媒体数据的特征T₁，...，T_N-1，I_N模态对应为待分类的多媒体数据个数；

4)根据步骤3中得到的分类模型参数{U₁，...，U_N;α}，以及公式(3)，计算待分类的多媒体数据的y_i；

5)根据步骤4)中得到的y_i，进行以0.5为阈值的二值化操作，获得待分类的多媒体数据的标签及分类结果。

本发明提出了一种新的针对多媒体数据分类的方法。针对多媒体的高维性和结构性，利用张量来表达多媒体数据，并通过最大间隔分类器的方法，对高维的多媒体数据进行分类。在对多媒体数据进行分解分析的同时完成分类，不仅保留了多媒体数据中的结构信息，而且避免了传统的通过拼合的方法产生的高维数据所引发的“维数灾难”，因此比传统的多媒体数据分类方法更加准确，并易于计算。

附图说明

图1是基于最大间隔张量学习的高维多媒体数据分类方法示意图。

具体实施方式

基于最大间隔张量学习的高维多媒体数据分类方法，包括如下步骤：

所述的步骤(1)包括：

其中I_N是集合DATA中的多媒体数据个数；

4)建立训练张量

所述的步骤(2)包括：

\min_{U_{1}, . . . U_{N}} | | X - C \times_{1} U_{1} \times_{2} . . . \times_{N} U_{N} {| |}^{2} + Ω (X) - - - (1)

s.t.U_n＞0，1≤n≤N

a)C_(n)的元素全由“0”或“1”组成；

b)C_(n)的所有行相互正交；

c)对于任意的n，C_(n)为满秩；

2)根据张量展开，可以将公式(1)写作：

\min_{U_{N}} {| | X_{(n)} - U_{N} B_{(n)} | |}^{2} + Ω (X_{(n)}) - - - (1)

s.t.U_n＞0，1≤n≤N

令

X_{(n)} = {[x_{1}, x_{2}, . . ., x_{I_{n}}]}^{T}, U_{(n)} = {[u_{1}, u_{2}, . . ., u_{I_{n}}]}^{T}

将公式(1)中每一个矩阵U_i转置并分成I_i个独立的优化问题：

\min_{u_{i}} {| | x_{i} - B_{(n)}^{T} u_{i} | |}^{2} + Ω (x_{i}) - - - (2)

s.t.u_i＞0，1≤i≤I_n

\min_{u_{i}^{(N)}, α} γ {| | x_{i}^{(N)} - B_{(N)}^{T} u_{i}^{(N)} | |}^{2} + {λα}^{T} K_{α} + Σ_{i = 1}^{I_{N}} L (y_{i}, K_{i}^{T} α) - - - (3)

s . t . U_{i}^{(N)} > 0,1 \leq i \leq I_{N}

其中，γ为控制近似误差的权重参数，λ为控制分类误差的权重参数，y_i为相应的标注标签，α为待优化的分类参数，L为损失函数L(yt)=max(0，1-yt)²，K为核矩阵，其元素k_ij=k(u_i，u_j)，k为核函数；

4)使用共轭梯度下降的方法，迭代地优化参数α与矩阵分量

在优化分类参数α的过程中首先计算α的梯度：

{&dtri;}_{α} = 2 (λKα + {KI}^{0} (Kα - Y))

其中I⁰为I_N×I_N的对角矩阵，其中前n_v(支持向量的各数)个元素为1，其余为0；

然后计算α的Hessian矩阵：

H_α=2(λK+KI⁰K)

在优化矩阵分量

的过程中，首先假定使用内积核：

k (u_{i}^{(N)}, u_{j}^{(N)}) = u_{i}^{(N) T} \cdot u_{j}^{(N)}

计算的梯度：

\begin{matrix} {&dtri;}_{u_{i}^{(N)}} = - 2 γ B_{(N)} x_{i}^{(N)} + 2 γ (B_{(N)} B_{(N)}^{T}) u_{i}^{(N)} + 2 λ α_{i} Σ_{i = 1}^{I_{s}} α_{j} u_{j}^{(N)} \\ + 2 (Σ_{j = 1}^{n_{v}} l_{j} α_{j} u_{j}^{(N)} [i &Element; n_{v}] + α_{i} Σ_{j = 1}^{n_{v}} l_{j} u_{j}^{(N)}) \end{matrix}

然后计算

的Hessian矩阵：

H_{u_{i}^{(N)}} = 2 γ (B_{(N)} B_{(N)}^{T}) + ({2 λα}_{i}^{2} + {4 l}_{i} α_{i} [i &Element; n_{v}]) I_{ns}

\min_{u_{i}^{(n)}} {| | x_{i}^{(n)} - B_{(n)}^{T} u_{i}^{(n)} | |}^{2} + η_{(n)} | u_{i}^{(n)} | - - - (4)

s . t . u_{i}^{(n)} &GreaterEqual; 0, n &NotEqual; N

其中，η_(n)是控制模态n中的稀疏度；

6)使用如下方法求解公式(4)

u_{ij}^{(n)} = \{\begin{matrix} \frac{t - η_{(n)}}{b_{j} b_{j}^{T}}, & t > η_{(n)} \\ 0, & t \leq η_{(n)} \end{matrix}

其中，

为

中的元素，

B_{(n)} = {[b_{1}^{T}, b_{2}^{T}, . . ., b_{R_{n}}^{T}]}^{T}

t = b_{j} (B_{(n)}^{T} u_{i}^{(n)} - b_{j}^{T} x_{i})

7)根据步骤4)与步骤6)求得的u_i，拼合成U，反复迭代，直至收敛，得到分类模型的参数{U₁，...，U_N；α}。

所述的步骤(3)包括：

其中I_Nt是集合TEST中的待分类的多媒体数据个数；

3)建立测试张量

4)根据权利要求步骤3中得到的分类模型参数{U₁，...，U_N；α}，以及公式(3)，计算待分类的多媒体数据的y_i；

实施例：

假设动作数据的分类问题，动作数据具有重要的结构信息。编写爬虫程序下载有关数据集中的动作数据50000个做训练，假设拥有49个类，提取其x，y，z三个方向的坐标作为其三种特征，构成的训练张量X∈R^3×49×50000。

对训练数据集建模，进行分析，得到分类模型，其步骤如下：

\min_{U_{1}, . . . U_{N}} | | X - C \times_{1} U_{1} \times_{2} . . . \times_{N} U_{N} {| |}^{2} + Ω (X) - - - (1)

s.t.U_n＞0，1≤n≤N

a)C_(n)的元素全由“0”或“1”组成；

b)C_(n)的所有行相互正交；

c)对于任意的n，C_(n)为满秩；

2)根据张量展开，可以将公式(1)写作：

\min_{U_{N}} {| | X_{(n)} - U_{N} B_{(n)} | |}^{2} + Ω (X_{(n)}) - - - (1)

s.t.U_n＞0，1≤n≤N

其中，B_(n)=C×₁U₁×2...×_n-1U_n-1×_n+1U_n+1×_n+2...×_NU_N，X_(n)为训练张量X的n阶展开矩阵；

令

X_{(n)} = {[x_{1}, x_{2}, . . ., x_{I_{n}}]}^{T}, U_{(n)} = {[u_{1}, u_{2}, . . ., u_{I_{n}}]}^{T}

将公式(1)中每一个矩阵U_i转置并分成I_i个独立的优化问题：

\min_{u_{i}} {| | x_{i} - B_{(n)}^{T} u_{i} | |}^{2} + Ω (x_{i}) - - - (2)

s.t.u_i＞0，1≤i≤I_n

\min_{u_{i}^{(N)}, α} γ {| | x_{i}^{(N)} - B_{(N)}^{T} u_{i}^{(N)} | |}^{2} + {λα}^{T} Kα + Σ_{i = 1}^{I_{N}} L (y_{i}, K_{i}^{T} α) - - - (3)

s . t . U_{i}^{(N)} > 0,1 \leq i \leq I_{N}

其中，γ为控制近似误差的权重参数，λ为控制分类误差的权重参数，y_i为相应的标注标签，α为待优化的分类参数，L为损失函数L(y，t)=max(0，1-yt)²，K为核矩阵，其元素k_ij=k(u_i，u_j)，k为核函数。

4)使用共轭梯度下降的方法，迭代地优化参数α与矩阵分量

在优化分类参数α的过程中首先计算α的梯度：

{&dtri;}_{α} = 2 (λKα + {KI}^{0} (Kα - Y))

然后计算α的Hessian矩阵：

H_α=2(λK+KI⁰K)

在优化矩阵分量

的过程中，首先假定使用内积核：

k (u_{i}^{(N)}, u_{j}^{(N)}) = u_{i}^{(N) T} \cdot u_{j}^{(N)}

计算

的梯度：

\begin{matrix} {&dtri;}_{u_{i}^{(N)}} = - 2 γ B_{(N)} x_{i}^{(N)} + 2 γ (B_{(N)} B_{(N)}^{T}) u_{i}^{(N)} + 2 λ α_{i} Σ_{j = 1}^{I_{s}} α_{j} u_{j}^{(N)} \\ + 2 (Σ_{j = 1}^{n_{v}} l_{j} α_{j} u_{j}^{(N)} [i &Element; n_{v}] + α_{i} Σ_{j = 1}^{n_{v}} l_{j} u_{j}^{(N)}) \end{matrix}

然后计算

的Hessian矩阵：

H_{u_{i}^{(N)}} = 2 γ (B_{(N)} B_{(N)}^{T}) + (2 λ α_{i}^{2} + 4 l_{i} α_{i} [i &Element; n_{v}]) I_{ns}

其中，I_ns是大小为I_s的单位矩阵，[i∈n_v]是一个指示函数，当且仅当i属于支持向量的集合时函数值为1，其余为0。

5)对于公式(2)中无监督信息的模态，即n≠N时，加入稀疏选择的约束，即l₁范数：

\begin{matrix} \min_{u_{i}^{(n)}} {| | x_{i}^{(n)} - B_{(n)}^{T} u_{i}^{(n)} | |}^{2} + η_{(n)} | u_{i}^{(n)} | - - - (4) \\ s . t . u_{i}^{(n)} &GreaterEqual; 0, n &NotEqual; N \end{matrix}

其中，η_(n)是控制模态n中的稀疏度。

6)使用如下方法求解公式(4)

u_{ij}^{(n)} = \{\begin{matrix} \frac{t + η_{(n)}}{b_{j} b_{j}^{T}}, t > η_{(n)} \\ 0, t \leq η_{(n)} \end{matrix}

其中，

为

中的元素，

B_{(n)} = {[b_{1}^{T}, b_{2}^{T}, . . ., b_{R_{n}}^{T}]}^{T}

t = b_{j} (B_{(n)}^{T} u_{i}^{(n)} - b_{j}^{T} x_{i})

7)根据步骤4)与步骤6)求得的u_i，拼合成U，反复迭代，直至收敛。得到分类模型的参数{U₁，...，U_N；α}。

根据用户查询数据集及分类模型，对查询数据集分类，其步骤如下：

1)编写爬虫程序下载有关数据集中的动作数据剩余的19363个做训练，提取其x，y，z三个方向的坐标作为其三种特征，构成的测试张量Xt∈R^3×49×19363；

2)根据之前得到的分类模型参数{U₁，...，U_N；α}，以及公式(3)，计算待分类的多媒体数据的y_i；

3)根据步骤2)中得到的y_i，进行以0.5为阈值的二值化操作，获得待分类的多媒体数据的标签及分类结果；

4)结果经过Accuracy，MacroF1，MicroF1，MacroAUC，MicroAUC五个分类评价标准的结果如下：

Accuracy	MacroF1	MicroF1	MacroAUC	MicroAUC
					0.8879	0.7616	0.7857	0.7212	0.7407

Claims

1.一种基于最大间隔张量学习的高维多媒体数据分类方法，其特征在于包括如下步骤：

2.根据权利要求1所述的一种基于最大间隔张量学习的高维多媒体数据分类方法，其特征在于所述的步骤(1)包括：

其中I_N是集合DATA中的多媒体数据个数；

4)建立训练张量

3.根据权利要求1所述的一种基于最大间隔张量学习的高维多媒体数据分类方法，其特征在于所述的步骤(2)包括：

\begin{matrix} \min_{U_{1}, . . . U_{N}} {| | X - C \times_{1} U_{1} \times_{2} {. . . \times}_{N} U_{N} | |}^{2} + Ω (X) \\ s . t . U_{n} > 0,1 \leq n \leq N \end{matrix} - - - (1)

a)C_(n)的元素全由“0”或“1”组成；

b)C_(n)的所有行相互正交；

c)对于任意的n，C_(n)为满秩；

2)根据张量展开，可以将公式(1)写作：

\begin{matrix} \min_{U_{N}} {| | X_{(n)} - U_{N} B_{(n)} | |}^{2} + Ω (X_{(n)}) \\ s . t . U_{n} > 0,1 \leq n \leq N \end{matrix} - - - (1)

令

X_{(n)} = {[x_{1}, x_{2}, . . ., x_{I_{n}}]}^{T}, U_{(n)} = {[u_{1}, u_{2}, . . ., u_{I_{n}}]}^{T}

将公式(1)中每一个矩阵U_i转置并分成I_i个独立的优化问题：

\begin{matrix} \min_{u_{i}} {| | x_{i} - B_{(n)}^{T} u_{i} | |}^{2} + Ω (x_{i}) \\ s . t . u_{i} > 0,1 \leq i \leq I_{n} \end{matrix} - - - (2)

\begin{matrix} \min_{u_{i}^{(N)}, α} γ {| | x_{i}^{(N)} - B_{(N)}^{T} u_{i}^{(N)} | |}^{2} + λ α^{T} Kα + Σ_{i = 1}^{I_{N}} L (y_{i}, K_{i}^{T} α) \\ s . t . U_{i}^{(N)} > 0,1 \leq i \leq I_{N} \end{matrix} - - - (3)

4)使用共轭梯度下降的方法，迭代地优化参数α与矩阵分量

在优化分类参数α的过程中首先计算α的梯度：

{&dtri;}_{α} = 2 (λKα + K I^{0} (Kα - Y))

然后计算α的Hessian矩阵：

H_α=2(λK+KI⁰K)

在优化矩阵分量

的过程中，首先假定使用内积核：

k (u_{i}^{(N)}, u_{j}^{(N)}) = u_{i}^{(N) T} \cdot u_{j}^{(N)}

计算

的梯度：

\begin{matrix} {&dtri;}_{u_{i}^{(N)}} = - 2 γ B_{(N)} x_{i}^{(N)} + 2 γ (B_{(N)} B_{(N)}^{T}) u_{i}^{(N)} + 2 λ α_{i} Σ_{j = 1}^{I_{s}} α_{j} u_{j}^{(N)} \\ + 2 (Σ_{j = 1}^{n_{v}} l_{j} α_{j} u_{j}^{(N)} [i &Element; n_{v}] + α_{i} Σ_{j = 1}^{n_{v}} l_{j} u_{j}^{(N)}) \end{matrix}

然后计算

的Hessian矩阵：

H_{u_{i}^{(N)}} = 2 γ (B_{(N)} B_{(N)}^{T}) + (2 λ α_{i}^{2} + 4 l_{i} α_{i} [i &Element; n_{v}]) I_{ns}

\begin{matrix} \min_{u_{i}^{(n)}} {| | x_{i}^{(n)} - B_{(n)}^{T} u_{i}^{(n)} | |}^{2} + η_{(n)} | u_{i}^{(n)} | \\ s . t . u_{i}^{(n)} &GreaterEqual; 0, n &NotEqual; N \end{matrix} - - - (4)

其中，η_(n)是控制模态n中的稀疏度；

6)使用如下方法求解公式(4)

u_{ij}^{(n)} = \{\begin{matrix} \frac{t - η_{(n)}}{b_{j} b_{j}^{T}}, & t > η_{(n)} \\ 0, & t \leq η_{(n)} \end{matrix}

其中，

为

中的元素，

B_{(n)} = {[b_{1}^{T}, b_{2}^{T}, . . ., b_{R_{n}}^{T}]}^{T}

t = b_{j} (B_{(n)}^{T} u_{i}^{(n)} - b_{j}^{T} x_{i})

4.根据权利要求1所述的一种基于最大间隔张量学习的高维多媒体数据分类方法，其特征在于所述的步骤(3)包括：

其中I_Nt是集合TEST中的待分类的多媒体数据个数

3)建立测试张量其中I₁，...，I_N-1模态对应为步骤2)中多媒体数据的特征T₁，...，T_N-1，I_N模态对应为待分类的多媒体数据个数；

4)根据得到的分类模型参数{U₁，...，U_N；α}，以及公式(3)，计算待分类的多媒体数据的y_i；