CN102208030A

CN102208030A - 基于支持向量机正则化路径的贝叶斯模型平均模型组合方法

Info

Publication number: CN102208030A
Application number: CN2011101492419A
Authority: CN
Inventors: 廖士中; 赵宁; 赵志辉
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2011-06-03
Filing date: 2011-06-03
Publication date: 2011-10-05

Abstract

本发明公开了一种基于支持向量机正则化路径的贝叶斯模型平均模型组合方法，该方法包括以下步骤：计算支持向量机2-分类模型的正则化路径，得到初始模型集；在得到的正则化路径上应用贝叶斯公式求解模型的后验概率；贝叶斯模型平均预测；步骤四，得到预测输出；与广义近似交叉验证方法相比，基于支持向量机正则化路径的贝叶斯模型平均模型组合算法具有更低的分类误差，在保证较高预测精确率的同时，较大的减少了运行时间并降低了操作复杂度。

Description

基于支持向量机正则化路径的贝叶斯模型平均模型组合方法

技术领域

在本发明涉及支持向量机正则化路径上的模型组合，特别是一种基于贝叶斯模型平均的模型组合方法。

背景技术

支持向量机(Support Vector Machine，SVM)是Vapnik等人提出的一种基于统计学习理论的机器学习方法，它以最大化分类间隔构造最优分类超平面来提高分类器的泛化能力，较好地解决了非线性、高维数、局部极小点等问题。与传统的神经网络学习方法相比，SVM具有结构风险最小，可以逼近任意函数且保证全局最优，适用于小样本、非线性核高维建模的领域。目前，SVM已广泛应用于手写字识别、文本分类、语音识别等方面，并取得了良好的应用效果。

对于2-分类支持向量机，已知训练集：

Figure 2011101492419100002DEST_PATH_IMAGE002

其中

Figure 2011101492419100002DEST_PATH_IMAGE004

，

Figure 2011101492419100002DEST_PATH_IMAGE006

。

寻找

Figure 2011101492419100002DEST_PATH_IMAGE008

上的一个实值函数

Figure 2011101492419100002DEST_PATH_IMAGE010

以便用决策函数

Figure 2011101492419100002DEST_PATH_IMAGE012

推断任意模式x相对应的y值即类别。

2-分类线性分类支持向量机简单模型如下：

Figure 2011101492419100002DEST_PATH_IMAGE014

， (1)

建立拉格朗日原函数：

Figure 2011101492419100002DEST_PATH_IMAGE016

, (2)

令偏导等于零且KKT条件为：

Figure 2011101492419100002DEST_PATH_IMAGE018

， (3)

Figure 2011101492419100002DEST_PATH_IMAGE020

， (4)

， (5)

Figure 2011101492419100002DEST_PATH_IMAGE024

， (6)

Figure 2011101492419100002DEST_PATH_IMAGE026

， (7)

Figure 2011101492419100002DEST_PATH_IMAGE028

， (8)

Figure 2011101492419100002DEST_PATH_IMAGE030

， (9)

Figure 2011101492419100002DEST_PATH_IMAGE032

， (10)

Figure 2011101492419100002DEST_PATH_IMAGE034

， (11)

由上述条件求解得决策函数

Figure 2011101492419100002DEST_PATH_IMAGE036

。

而现有技术中，支持向量机贝叶斯解释

假设，其中

Figure 2011101492419100002DEST_PATH_IMAGE040

是再生核希尔伯特空间。决策函数是下面优化问题的解：

Figure 2011101492419100002DEST_PATH_IMAGE044

(12)

其中，

Figure 2011101492419100002DEST_PATH_IMAGE046

称为正则化参数，

Figure 2011101492419100002DEST_PATH_IMAGE048

为定义在RKHS上的范数，损失函数

Figure 2011101492419100002DEST_PATH_IMAGE050

为“hinge loss” 的一种变化形式：

Figure 2011101492419100002DEST_PATH_IMAGE052

，其中

Figure 2011101492419100002DEST_PATH_IMAGE054

为“Heaviside”阶梯函数，确保当

Figure 2011101492419100002DEST_PATH_IMAGE056

时函数值为0。

引入核函数，SVM的决策函数

Figure 2011101492419100002DEST_PATH_IMAGE058

可表示为：

Figure 2011101492419100002DEST_PATH_IMAGE060

(13)

其中称为偏移量，

Figure 2011101492419100002DEST_PATH_IMAGE064

为核函数，且

Figure 2011101492419100002DEST_PATH_IMAGE066

为拉格朗日乘子。由于

Figure 2011101492419100002DEST_PATH_IMAGE068

，代入到上述优化问题式，得到关于

的优化问题：

Figure 2011101492419100002DEST_PATH_IMAGE072

(14)

其中

Figure 2011101492419100002DEST_PATH_IMAGE074

。

在特征空间中决策函数可表示为：

(15)

和

通过最小化下面优化问题求解：

Figure 2011101492419100002DEST_PATH_IMAGE082

(16)

上式中的第一项正比于在给定样本

及

后输出

的概率的负对数，即

Figure 2011101492419100002DEST_PATH_IMAGE088

(17)

为

取遍所有可能值时

Figure 2011101492419100002DEST_PATH_IMAGE092

的归一化常数。

第二项给出了

和b的先验知识，该先验为高斯先验，即

Figure 2011101492419100002DEST_PATH_IMAGE094

，

Figure 2011101492419100002DEST_PATH_IMAGE096

，其中

是b的先验概率的标准差。则

Figure 2011101492419100002DEST_PATH_IMAGE100

，协方差

Figure 2011101492419100002DEST_PATH_IMAGE102

。

因而，SVM的决策函数

的先验是一个高斯过程，均值为

，协方差函数为

Figure 2011101492419100002DEST_PATH_IMAGE106

。

3.正则化路径算法

Hastie等在2004年的文章中提出了支持向量机的正则化路径算法，相应的2-分类支持向量机正则化模型如下：

Figure 2011101492419100002DEST_PATH_IMAGE108

(18)

建立拉格朗日原函数:

Figure 2011101492419100002DEST_PATH_IMAGE110

， (19)

各偏导等于零及KKT条件：

Figure 2011101492419100002DEST_PATH_IMAGE112

(20)

Figure 2011101492419100002DEST_PATH_IMAGE114

(21)

Figure 2011101492419100002DEST_PATH_IMAGE116

(22)

Figure 2011101492419100002DEST_PATH_IMAGE118

(23)

(24)

由上可知

Figure 2011101492419100002DEST_PATH_IMAGE122

。当

Figure 2011101492419100002DEST_PATH_IMAGE124

时，

Figure 2011101492419100002DEST_PATH_IMAGE126

，

Figure 2011101492419100002DEST_PATH_IMAGE128

；当

Figure 2011101492419100002DEST_PATH_IMAGE130

，

Figure 2011101492419100002DEST_PATH_IMAGE132

时，；当

Figure 2011101492419100002DEST_PATH_IMAGE136

时，

Figure 2011101492419100002DEST_PATH_IMAGE138

落于

与

之间。

记为属于类的训练点，记

Figure 2011101492419100002DEST_PATH_IMAGE146

，即

中训练点数目的总和。类似的可以定义

和

。所有的观察样本有下面三个状态：

(1)

，E表示拐点，

(2)

，L表示拐点的左边，

(3)，R表示拐点的右边。

记

为

的最大初始值，随着的不断减少，递归的计算下一个

。

的每一次变化对应了下面几个事件的改变：

(1)样本从E进入R或L；(2)样本从L进入E；(3)样本从R进入E。

该算法在集合L变为空，或者

足够小的时候停止。

发明内容

基于上述现有技术，本发明提出了一种基于支持向量机正则化路径的贝叶斯模型平均模型组合方法，通过将支持向量机2-分类模型正则化路径上的给出的模型集进行组合，在较低的计算复杂度和较短的操作时间内给出预测能力强的组合分类器。

本发明提出了一种基于支持向量机正则化路径的贝叶斯模型平均模型组合方法，该方法包括以下步骤：

步骤一，计算支持向量机2-分类模型的正则化路径，得到初始模型集；

根据正则化路径算法，在训练数据集上运行正则化路径算法，得到初始模型集

，

，

中的模型个数等于svmpath算法的迭代次数

，且

为，

的取值范围大概为[4,6]，

表示正类训练样本个数；表示负类训练样本个数；220104 19640827 4312

步骤二，在得到的正则化路径上应用贝叶斯公式求解模型的后验概率；

模型

的先验被赋予一个简单的高斯过程，

高斯过程先验的协方差矩阵是正定矩阵，作为SVM的核矩阵

通过引入支持向量机的概率解释，模型的后验概率由贝叶斯公式求解；对支持向量机的损失函数进行逐点归一化，即令

，

为

取遍所有可能值时

的归一化常数，从而得到

模型的后验概率为

，为给定样本，

为决策函数的输出；

对于

中的每一个模型，概率

可计算出来，因此模型的后验概率为

步骤三，贝叶斯模型平均预测

为预测测试样本的标签，

上贝叶斯模型平均组合方法的形式如下：

步骤四，得到预测输出

并得出测试误差率，测试误差率 = 分类错误样本/样本总数。

与现有技术相比，本发明基于支持向量机正则化路径的贝叶斯模型平均模型组合算法具有更低的分类误差。在保证较高预测精确率的同时，较大的减少了运行时间并降低了操作复杂度。

附图说明

图1：R软件的安装及svmpath程序包的加载界面示意图；

图2：程序运行结果示例界面示意图。

具体实施方式

首先，计算支持向量机2-分类模型的正则化路径，得到初始模型集；然后在此基础上应用贝叶斯模型平均方法,对于给定的测试样本，得到其预测输出。实验对比新方法与经典的广义近似交叉验证方法(GACV)的预测误差和运行时间。

本发明所基于的原理是贝叶斯模型平均组合方法：

该方法的基本思想如下：首先，在上面定义的支持向量机正则化模型中，开始时赋给正则化参数

一个很大的值，让递减并趋向0。随着的减少，

（

的范数）增加，间隔的宽度减小。随着间隔的变窄，训练点从间隔里移到间隔外。由连续性，当拉格朗日乘子

从1减至0时，训练点必会落到间隔上，由此得到初始模型集。然后，通过支持向量机的贝叶斯解释，在得到的正则化路径上应用贝叶斯公式求解模型的后验概率。最后利用贝叶斯模型平均模型方法对初始模型集进行组合，求得样本预测分类概率，并得到预测输出。

本发明的实施，具体步骤如下：

第1步：得到初始模型集

计算支持向量机2-分类模型的正则化路径，得到初始模型集；即：根据背景知识中的正则化路径算法，在训练数据集上运行正则化路径算法，得到初始模型集

。初始模型集

，即为正则化路径上拐点处对应的函数集。

中的模型个数等于svmpath算法的迭代次数，svmpath算法的迭代次数

为

，

是介于

之间的某个值，表示正类训练样本个数。类似的，

表示负类训练样本个数。因而，

中模型个数等于

，

为某个较小的数。

第2步：在得到的正则化路径上应用贝叶斯公式求解模型的后验概率

模型的先验被赋予一个简单的高斯过程。高斯过程先验的协方差矩阵是正定矩阵，可作为SVM的核矩阵

。 (25)

通过引入支持向量机的概率解释，模型的后验概率由贝叶斯公式求解。对支持向量机的损失函数进行逐点归一化，即令，从而由(17)式可以得到

， (26)

模型的后验概率为

。 (27)

对于中的每一个模型，概率

可计算出来，因此模型的后验概率为

。 (28)

第3步：贝叶斯模型平均预测

贝叶斯模型平均法的出现，是为了处理统计实践中模型选择的不确定性。为预测测试样本的标签，

上贝叶斯模型平均组合方法的形式如下：

。 (29)

第4步：得到预测输出

， (30)

并得出测试误差率。

2. SVM贝叶斯模型平均模型组合方法(SVMMC)的伪码表示

表1实验数据集示例

编号	y	X1	…	Xn
					1	1	-0.727139	…	-0.879908
2	1	-0.889381	…	-0.556582
					3	1	-0.839233	…	-0.741339
4	1	-0.582596	…	-0.690531
					…	…	…	…	…
460	-1	-0.712389	…	0.413395
					461	-1	-0.240413	…	-0.769053
462	-1	-0.352507	…	-0.78291
					463	-1	-0.60472	…	-0.662818
…	…	…	…	…

表2：在数据集Australian上SVMMC算法与GACV方法的预测精度及运行时间的对比

表3：在数据集Ionosphere上SVMMC算法与GACV方法的预测精度及运行时间的对比

表4：在数据集Sonar上SVMMC算法与GACV方法的预测精度及运行时间的对比