CN111914865A

CN111914865A - 一种基于随机核的概率主组件分析方法

Info

Publication number: CN111914865A
Application number: CN201910387628.4A
Authority: CN
Inventors: 张传雷; 张璞; 杨巨成; 陈亚瑞; 李建荣
Original assignee: Tianjin University of Science and Technology
Current assignee: Tianjin University of Science and Technology
Priority date: 2019-05-08
Filing date: 2019-05-08
Publication date: 2020-11-10

Abstract

传统主组件分析可以看做一种概率生成模型，其中隐向量先验分布及条件概率分布均为高斯分布形式，这种形式限制了隐变量空间的表示能力。本发明提出一种基于随机核的概率主组件分析方法，通过对概率主组件模型增加基于随机神经网络的方法增加主组件分析模型隐变量表示能力。本发明包括：模型建模单元、优化目标构建单元、及优化问题求解单元。模型建模单元是对传统的主组件分析模型进行概率建模。优化目标构建单元针对数据集构建基于对数边缘似然函数的目标函数。优化问题求解单元利用最大似然函数求解模型参数，其中采用基于随机神经网络构建的协方差矩阵作为传统数据集的协方差矩阵。

Description

一种基于随机核的概率主组件分析方法

技术领域

本发明涉及机器学习领域，更具体说是涉及一种基于随机核的概率主组件分析方法。

背景技术

深度学习成为人工智能领域的研究热点，生成模型是构建深层模型的基本结构之一，也是进行知识表示重要方法。主组件分析从概率模型的角度分析，可以看出一种隐变量模型。概率主组件分析模型包括隐向量和可观测向量，其中隐向量的先验分布是多元高斯分布，可观测向量基于隐向量的条件概率分布也是高斯多元分布。传统概率主组件分析模型给出模型参数，是通过对训练数据集协方差矩阵的前k个较大特征值对应特征向量构成的矩阵。但是传统概率主组件模型中，边缘概率分布和条件概率分布均是多元高斯分布，限制了隐变量空间的表示能力。

因此本发明提出一种基于随机核的概率主组件分析方法，通过对概率主组件模型增加随机核增加模型的表示能力。

发明内容

有鉴于此，本发明提供了一种基于随机核的概率主组件分析方法，不仅可以提高模型的隐变量空间表示能力，同时可以利用概率主组件生成模型生成具有更高级性能的数据。

本发明实施例公开了一种基于随机核的概率主组件分析方法，具体包括：模型建模单元、优化目标构建单元、及优化问题求解单元。

所述的建模单元，是对主组件分析进行基于随机核的概率建模。令

表示可观测向量，z∈R^M表示隐向量，p(z)表示隐变量的先验分布，p(x|z)表示隐向量下的条件概率分布。从生成数据角度看概率主组件分析模型，观测样本 x⁽ⁱ⁾的采样过程如下：先从隐变量先验分布p(z)中采样隐变量z⁽ⁱ⁾，再根据条件概率分布p(x|z)中采样观测值x⁽ⁱ⁾。D维观测向量x可以看做隐变量z的线性组合加上一个高斯噪音，即

x＝Wz+μ+ε

ε～N(0，δ²I)

其中W∈R^D×M表示参数矩阵，μ∈R^D，δ²表示方差参数。

所述的优化目标构建单元，可以通过最大似然方法求解模型参数。由于隐向量先验分布和条件概率分布均为高斯分布，则观测向量x的边缘概率分布也为高斯分布，即

C＝WW^T+δ²I

隐向量z的后验概率分布也是高斯分布，其形式为

M＝W^TW+δ²I

已知数据集D＝{x₁，x₂，…，x_n}，通过最大似然函数方法求解模型参数，数据的对数边缘似然函数为

此时的优化问题的最大化对数边缘似然求解模型参数

所述优化问题求解单元，是通过求解上述优化问题，最大化似然函数下求解的模型参数记为μ_ML，W_ML，

即

附图说明

为了更清楚的说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单介绍，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明提供的一种基于随机核的概率主组件分析方法的建模结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

表示可观测向量，z∈R^M表示隐向量，p(z)表示隐变量的先验分布，其先验分布是零均值单位协方差的高斯分布，即

p(x|z)表示隐向量下的条件概率分布，该分布形式也是高斯分布，即

其中W∈R^D×M表示参数矩阵，μ∈R^D，δ²表示方差参数。

所所述的优化目标构建单元，可以通过最大似然方法求解模型参数。已知数据集D＝{x₁，x₂，…，x_n}，通过最大似然函数方法求解模型参数，数据的对数边缘似然函数为

此时的优化问题的最大化对数边缘似然求解模型参数

对数似然对μ求导并令结果等于零求解可得

将结果带入对数边缘似然函数可得，

其中

表示数据集D的协方差矩阵。此时相对于传统数据的协方差矩阵，本发明构建一个基于随机化神经网络构建的协方差矩阵，即构建函数为φ(x_n)＝φ(cx_n+d)，其中参数c，d通过随机赋值确定。

令对数似然函数对W求导并令结果为零可得，

W_ML＝U_M(L_M-δ²I)R

其中U_M表示数据协方差矩阵S的特征向量的M个子集组成的集合，L_M表示对角矩阵，其元素为特征向量所对应的特征值，R表示任意正交矩阵。参数δ²的最大似然解为：

表示被丢弃维度的方差的平均值。

Claims

1.一种基于随机核的概率主组件分析方法，其特征在于包括：模型建模单元、优化目标构建单元、及优化问题求解单元；

所述模型建模单元用于构建基于随机核的概率主组件分析模型；

所述优化目标构建单元用于基于数据集构建最大化似然目标函数用于求解模型参数；

所述优化问题求解单元用于求解最大化似然函数求解模型参数。

2.根据权利要求1所述的一种基于随机核的概率主组件分析方法，其特征在于所述的建模单元是对主组件分析进行基于随机核的概率建模；

所述模型中的变量说明如下，令x∈R^D表示可观测向量，z∈R^M表示隐向量，p(z)表示隐变量的先验分布，p(x|z)表示隐向量下的条件概率分布；

从生成数据角度看概率主组件分析模型，观测样本x⁽ⁱ⁾的采样过程如下：先从隐变量先验分布p(z)中采样隐变量z⁽ⁱ⁾，再根据条件概率分布p(x|z)中采样观测值x⁽ⁱ⁾，D维观测向量x可以看做隐变量z的线性组合加上一个高斯噪音，即

x＝Wz+μ+ε

ε～N(0，δ²I)

其中W∈R^D×M表示参数矩阵，μ∈R^D，δ²表示方差参数。

3.根据权利要求1所述的一种基于随机核的概率主组件分析方法，其特征在于所述的优化目标构建单元，可以通过最大似然方法求解模型参数，已知数据集D＝{x₁，x₂，…，x_n}，通过最大似然函数方法求解模型参数，数据的对数边缘似然函数为

此时的优化问题的最大化对数边缘似然求解模型参数

4.根据权利要求1所述的一种基于随机核的概率主组件分析方法，其特征在于所述优化问题求解单元，是通过求解所述优化问题，最大化似然函数下求解的模型参数记为μ_ML，W_ML，

对数似然对μ求导并令结果等于零求解可得

将结果带入对数边缘似然函数可得，

其中S表示数据集D的协方差矩阵；

令对数似然函数对W求导并令结果为零可得，

W_ML＝U_M(L_M-δ²I)R

其中U_M表示数据协方差矩阵S的特征向量的M个子集组成的集合，L_M表示对角矩阵，其元素为特征向量所对应的特征值，R表示任意正交矩阵；

参数δ²的最大似然解为：

表示被丢弃维度的方差的平均值。

5.根据权利要求4中所述的数据协方差矩阵S中采用基于随机神经网络的形式，即

表示数据集D的协方差矩阵；此时相对于传统数据的协方差矩阵，本发明构建一个基于随机化神经网络构建的协方差矩阵，即构建函数为φ(x_n)＝φ(cx_n+d)，其中参数c，d通过随机赋值确定。