CN103077405A

CN103077405A - 一种基于Fisher判别分析的贝叶斯分类方法

Info

Publication number: CN103077405A
Application number: CN2013100179553A
Authority: CN
Inventors: 曹玲玲
Original assignee: Inspur Electronic Information Industry Co Ltd
Current assignee: Inspur Electronic Information Industry Co Ltd
Priority date: 2013-01-18
Filing date: 2013-01-18
Publication date: 2013-05-01

Abstract

本发明提供一种基于Fisher判别分析的贝叶斯分类方法，利用变换矩阵,对原始训练样本进行变换，投影到新的样本空间，分类器在投影后的新的样本空间进行学习分类，原样本属性集中，任意两个属性间可能存在一定的依赖关系,投影后在新样本空间,新样本的属性假定为相互独立，通过变换可把维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式，这样能有效地实现分类识别，从而得到较能反映分类本质的特征，通过实验对分类效果进行了分析和比较,获得对各个类别训练样本集分布的一种参数化的近似表达。

Description

一种基于Fisher判别分析的贝叶斯分类方法

技术领域

本发明涉及模式识别及机器智能技术领域，具体地说是一种基于Fisher判别分析的贝叶斯分类方法。

背景技术

分类是机器学习，模式识别和人工智能等相关领域广泛研究的问题。近年来，随着相关领域中新技术的不断涌现，分类方法也得到了新的发展。针对不同的分类问题，分类方法多种多样，如决策树分类、支持向量机分类、神经网络分类。在众多的分类方法中，贝叶斯分类器受到了极大地重视。贝叶斯分类器是基于最大后验概率准则的，即利用某对象的先验概率计算其后验概率，并选择具有最大后验概率的类作为该对象所属的类。在贝叶斯模型中，模型分别模拟每一个类的类条件联合概率分布 ,然后应用贝叶斯定理构建后验概率分类器。但是贝叶斯分类器具有较强的限定，要求属性之间是条件独立的，并且分类器本身也缺乏对训练样本集数据信息的充分利用。在分类器构建过程中并未有效利用类与类之间的信息 ,而这种信息正是分类所需要的。

本文在认真分析了贝叶斯模型结构特点以及构造分类器方法的基础上 , 结合Fisher线性判别分析，给出了一种基于Fisher线性判别分析的贝叶斯分类器。

）经典的贝叶斯分类器

在连续情况下，设观察值

是

维特征向量

，其中

是一维随机变量。测量空间

由

个自然状态组成：

，

为第

类状态的先验概率，

为类条件概率密度函数，表示接受

属于第类的

的条件概率，也称为后验概率。基于后验概率的分类中。问题可描述为：

如果

，则

。（1）

其物理意义为：在观测得到的特征向量发生的条件下，类别的所有条件概率中最大者为应归属的类，这样做可以使识别决策的错误率最小，这一准则称为最大后验概率准则。利用

著名的贝叶斯公式

，注意到分母

在比较表达式中是一个常数，经过一系列的推导，可以把决策公式（1）表述为：

如果

，则

。（2）

这就构成了经典的贝叶斯分类器。

对于许多实际的数据集，正态假设通常是一种较合理的近似。多元正态函数的概率密度函数为

为处理方便，先对其进行对数变换，则可得到如下线性决策函数

。

　　（3）

其中

如果使

，对一切成立，则将

归于

类。在这种情况下的贝叶斯分类就是利用式（3）计算出

个判别函数

，再从中选出对应于判别函数为最大值的类作为决策结果；

2）Fisher线性判别分析

Fisher线性判别分析(Fisher Linear Discriminant Analysis， FLDA)方法是模式识别中一种行之有效的特征提取方法。Fisher线性判别分析力图找到一组最佳的投影方向,在这些投影方向上,可以最好的区分训练集中属于不同类别的样本。

设有一组

维的训练样本

,…,

(

为

维行向量,

>

) ,它们分别属于

个不同的类别,即其中大小为

的样本子集

属于类别

. Fisher线性判别分析所要解决的基本问题就是寻求一组最佳线性变换

，将原始数据通过线性变换后投影到新的样本空间，在新的空间里原始数据得以更好地划分。为确定最佳的投影方向,需要定义下面的矩阵和向量:

类均值向量:

（4）

总体均值向量:

（5）

总体散布矩阵为:

=

（6）

类内散布矩阵:

（7）

类间散布矩阵:

=

（8）

显然,类内散布矩阵表达的是同一类中样本到类内中心的距离,其值的大小表示同类样本的集中程度。其值越小,说明同类样本相对越集中;类间散布矩阵是不同类的中心距离的度量,其值越大,说明异类样本的可分性越好。如果能够使得在投影后的空间,类内样本集中,类间样本分离,即可达到我们的目的.

从高维空间向低维空间的投影过程中,类内散布矩阵和类间散布矩阵经历了一些变换.我们的目标是寻找一个投影方向变换矩阵

,能够在某种意义上使得投影后的类间散布矩阵和类内散布矩阵的比值最大.为此定义如下的准则函数:

（9）

为求解使准则函数

取极大值时的投影变换矩阵

，可以用Lagrange乘子法求解，得到

(10)

解（10）式为求一般矩阵的本征值问题。经过一系列的推导，可以得出准则函数

取极大值时的解

（11）

以上可以看出，判别准则对应的优化问题等价于求解一个复杂的广义特征值和特征向量的问题，这是实现该分类器算法的核心。一旦确定变换矩阵

，就可以依据投影方程

（12）

将原样本集向

投影，得到新的样本集

。

发明内容

本发明的技术任务是解决现有技术的不足，提供一种基于Fisher判别分析的贝叶斯分类方法。

本发明的技术方案是按以下方式实现的，利用变换矩阵,对原始训练样本进行变换，投影到新的样本空间，分类器在投影后的新的样本空间进行学习分类，原样本属性集中，任意两个属性间可能存在一定的依赖关系,投影后在新样本空间,新样本的属性假定为相互独立，通过变换可把维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式，这样能有效地实现分类识别，通过实验对分类效果进行了分析和比较, 从而得到较能反映分类本质的特征，具体步骤如下：

1）将原始数据进行归一化处理；

2）依据公式（4）

计算类均值向量；

3）依据公式（5）计算总体均值向量；

4）依据公式97):

计算类内散布矩阵；

5）依据公式(8)

=

计算类间散布矩阵；

6）依据公式(11)

计算变换矩阵；

7）利用公式(12) 将原样本集向

投影，得到新的样本集

；

8）对新样本集按照公式(3)

进行学习分类

其中

如果使

，对一切

成立，则将

归于

类，在这种情况下的贝叶斯分类就是利用式

计算出

个判别函数，再从中选出对应于判别函数为最大值的类作为决策结果。

本发明的突出的有益效果：是从另一角度出发,致力于弥补经典贝叶斯分类器不能提取类间信息的问题，通过使用Fisher判别分析方法寻找使类与类最大分离的投影空间 ,然后再将原样本向最大可分离空间投影 ,获得新样本,以判别量为新属性 ,再用经典贝叶斯分类算法在新样本中进行学习分类。实验表明将经典贝叶斯分类器与 Fisher线性判别分析方法有机结合起来，能获得更好的分类效果。

附图说明

图1是的改进的贝叶斯算法流程图；

图2 经典的贝叶斯分类器分类情况图；

图3 改进的贝叶斯分类器分类情况图。

具体实施方式

下面结合附图对本发明的基于Fisher判别分析的贝叶斯分类方法作进一步详细说明。

贝叶斯分类器的改进

虽然公式

，则

定义的贝叶斯分类器简单而有效，但是它的属性独立性假设使其无法表示现实世界属性之间的依赖关系。并且从贝叶斯分类器学习的过程来看，无法有效地使用类间信息，为了改善这一问题，本文结合Fisher线性判别分析，提出了一种基于Fisher线性判别分析的贝叶斯分类器的改进算法。

该算法的主要思想是利用变换矩阵,对原始训练样本进行变换，投影到新的样本空间，分类器在投影后的新的样本空间进行学习分类。原样本属性集中，任意两个属性间可能存在一定的依赖关系,投影后在新样本空间,新样本的属性假定为相互独立。通过变换可把维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式。这样能有效地实现分类识别，从而得到较能反映分类本质的特征。根据上述分析给出该算法的流程图如图1所示:

实验结果与分析

本实验的数据选自CORK_STOPPERS.XLS数据集，具体数据说明如下表所示

此种划分达到了严格分开的要求，评价出的分类器的正确率比较接近实际的正确率，但还是会受到训练集有限样本数产生的偏差和测试集有限样本数产生的偏差的影响。

另外，本实验对所有的训练样本和测试样本都按下式进行了归一化的预处理，y=(x-min)/(max-min)。其中，x为一个样本，y为归一化的数据，max和min分别是对所有的训练样本求出各个特征的最大值和最小值。

分别用经典的贝叶斯分类器和改进的贝叶斯分类器对a类的25个测试样本和b类的20个测试样本进行分类。结果显示见图2和图3和表2。

试验结果如表2所示

表2

通过以上试验结果的比较可以看出，改进的贝叶斯分类器在同等的测试样本和初始条件相同的情形下，误判样本数较少，分类效果较好，正确率较高。

结论

本文主要介绍了经典贝叶斯分类器和改进的贝叶斯分类器的分类原理，并通过实验对分类效果进行了分析和比较。从实验结果可以看出，虽然经典贝叶斯分类器对样本也能进行比较有效的分类，但是改进的贝叶斯分类器具体更高效的分类性能。原因在于经典贝叶斯分类器虽然是一种简单而有效的分类算法 ,但它的独立性假定使其无法表达实际数据中属性间存在的相依关系，即没有使用类间信息，获得的仅仅是对各个类别训练样本集分布的一种参数化的近似表达。

除本发明的说明书公开的技术特征外均为本专业技术人员的公职技术。

Claims

1.一种基于Fisher判别分析的贝叶斯分类方法，其特征在于利用变换矩阵,对原始训练样本进行变换，投影到新的样本空间，分类器在投影后的新的样本空间进行学习分类，原样本属性集中，任意两个属性间可能存在一定的依赖关系,投影后在新样本空间,新样本的属性假定为相互独立，通过变换可把维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式，这样能有效地实现分类识别，从而得到较能反映分类本质的特征，通过实验对分类效果进行了分析和比较,获得对各个类别训练样本集分布的一种参数化的近似表达,具体分类步骤如下：

1）将原始数据进行归一化处理；

2）依据公式（4）