CN107544944B - 一种基于图论的支持向量机核函数选择方法及其应用 - Google Patents
一种基于图论的支持向量机核函数选择方法及其应用 Download PDFInfo
- Publication number
- CN107544944B CN107544944B CN201710783725.6A CN201710783725A CN107544944B CN 107544944 B CN107544944 B CN 107544944B CN 201710783725 A CN201710783725 A CN 201710783725A CN 107544944 B CN107544944 B CN 107544944B
- Authority
- CN
- China
- Prior art keywords
- kernel function
- data
- sample
- selecting
- sample data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于图论的支持向量机核函数选择方法及其应用。本发明将图论应用于支持向量机核函数选择,是一种支持向量机核函数选择的新方法及应用。本发明包括如下步骤:数据预处理;k邻域选取;邻接矩阵构造;本征维数估计;核函数类型选择;优化支持向量机模型参数并输出预测结果。本发明是一种有指导性的SVM核函数选择方法,能够针对具体问题有效地选择合适的核函数,克服了现有的SVM模型选择方法中人为指定核函数类型而导致模型不能达到最优性能的缺陷,并具实施预测准确率高,运算速度快、非常适合实时在线SVM模型预测控制场所。
Description
技术领域
本发明将图论应用于支持向量机核函数选择,是一种支持向量机核函数选择的新方法及应用。
背景技术
核方法(Kernel Method,KM)是统计学习理论(Statistical Learning Theory,SLT)与核技术相结合的产物。它能够有效地解决非线性分类与回归问题,较好地避免高维数据常出现的维数灾难等难以解决的问题。支持向量机(Support Vector Machine,SVM)是一种基于核的学习方法,核函数选取对SVM性能有着重要的影响。由于不同的核函数所表现出的度量特性迥异,选择不同的核函数会直接影响着SVM的泛化性能。根据具体问题的样本信息,结合核函数蕴含的度量特征,如何有效地进行核函数选择,一直是SVM研究领域的一个重要问题。然而目前SVM核函数的选择大多数是根据人为经验进行,缺乏相应的理论指导,存在很大的随意性和局限性。因此,研发一种既能充分利用给定具体问题的样本信息,又能结合不同核函数蕴藏的度量特征且具有通用性的核函数选择方法,则对于SVM技术的发展以及核方法的完善有着积极意义。
由于核是通过非线性映射将样本空间嵌入至特征空间,特征空间通常为高维流形,但对原问题而言,通常仅为一个低维流形。核又可以看成是描述两个样本点之间一种的相似关系,这种关系则可用相邻图来描述,两个节点相似就用图的相邻关系来描述最终形成图的邻接矩阵。而图又可以看成是流形学习的一种实现,图中的相邻关系就是流形中每个点的邻域关系。因此,核函数选择就是图中邻接矩阵的选择问题。由于图论有坚实的数学基础,故基于图论的SVM核函数选择是一个很有潜力的方向。
发明内容
本发明的目的是提供一种基于图论的支持向量机核函数选择方法及其应用,它能克服SVM应用过程中核函数选择的盲目性。利用图论构建样本数据无向图的邻接矩阵,借助流形学习的本征维数估计,有指导性地选择SVM核函数,以提高支持向量机的泛化能力。
本发明的技术方案:一种基于图论的支持向量机核函数选择方法,包括如下步骤:
步骤2,k邻域选取:在给定样本点附近寻找一个邻域,从中找出此局部邻域的几何结构,并计算每个样本点xi与其余样本点xj(j≠i)之间的欧氏距离;当xj为xi最近的k个点时,则把xj视为与xi是相邻的,即图G中有边xixj;
①如果xi和xj是近邻点,则在图G中xi与xj之间有连接边,且连接边权值取αij=αji=1;如果xi和xj不是近邻点,则在图G中xi与xj之间没有连接边,且连接边权值取αij=αji=0;
②由无向图G的顶点和边以及相应的权值构造规模为D×D的(0,1)邻接矩阵;
步骤4,本征维数估计:利用主成分分析方法(PCA)将由样本数据构建的(0,1)邻接矩阵按照最大方差的方向予以映射变换,并通过计算协方差矩阵的特征值后估计其本征维数,具体过程如下:
假设数据样本进行了中心化,即∑ixi=0,以及投影变换后得到的新坐标系为{ω1,ω2,…,ωD},ωi为标准正交基向量,||ωi||2=1,丢弃新坐标系中的部分坐标,其维度降至d(d≤D),则样本点xi在低维坐标中的投影为zi=(zi1,zi2,…,zid),其中是xi在低维坐标系下第j维的坐标;因此,基于zi重构xi,则会得到
其中W=[ω1,ω2,…,ωD],const是一常数;
根据最近重构性,将式(1)最小化,则有
其中W=[ω1,ω2,…,ωD],式(2)即为主成分分析方法(PCA)的优化目标;
利用拉格朗日乘子法求解式(2)可得
XXTωi=λiωi (3)
由式(3)可以看出,只需要对协方差矩阵XXT进行特征值分解,并将特征值排序,设定一个阈值δ,根据保留特征值的个数来估计本征维数的大小,即
其中λi为协方差矩阵XXT的特征值,b是所选取的特征个数,l是样本个数,δ为设定的阈值;
步骤5,核函数类型选择:根据邻接矩阵的本征维数估计值,以及给定的阈值选择相应的SVM核函数类型,并确定支持向量机模型;
步骤6,优化支持向量机模型参数并输出预测结果。
本发明利用流形学习的本征维数估计方法,结合核函数蕴藏的度量特征,提出了一种基于图论的SVM核函数选择机制。这是一种有指导性的SVM核函数选择方法,能够针对具体问题有效地选择合适的核函数,克服了现有的SVM模型选择方法中人为指定核函数类型而导致模型不能达到最优性能的缺陷,并具实施预测准确率高,运算速度快、非常适合实时在线SVM模型预测控制场所。
具体实施方式
实验说明:
①本发明的应用所涉及的三组实施例数据集均来自于UCI数据库,分别是Tic-Tac-Toe Endgame Data Set(井字棋游戏数据集)、Liver Disorders Data Set(肝脏疾病数据集)和Haberman’s Survival Data Set(哈伯曼生存数据集)。
②本发明以典型的全局分布特征的多项式核函数和局部分布特征的径向基核函数(RBF)为例进行数值仿真实验。
③通过实验分析,确定核函数矩阵本征维数的阈值为d*=2,即d≤d*,则选择多项式核函数;若d>d*,则选择径向基核函数(RBF)。
④随机选取样本数据集的80%和20%分别作为SVM模型的训练集和测试集。
实施例一:Tic-Tac-Toe Endgame Data Set(井字棋游戏数据集)
A步骤:本组数据集来自UCI数据库,共有958组数据;对其进行预处理,使样本数据的范数小于1并中心化;然后选取左上角、中上方、右上角、中左方、正中间、中右方、左下方、中下方和右下角9个为输入变量,播放器为输出变量;
B步骤:在给定样本点附近寻找一个邻域,从中找出此局部邻域的几何结构,并计算每个样本点xi与其余样本点xj(j≠i)之间的欧氏距离,当xj为xi最近的k=8个点时,则把xj视为与xi是相邻的,即图G中有连接边xixj,且边权值为αij=αji=1;
C步骤:由无向图G的顶点和边以及相应的权值构造规模为9×9的(0,1)邻接矩阵;
D步骤:利用主成分分析方法(PCA)将规模为9×9的(0,1)邻接矩阵按照最大方差的方向予以映射变换,并通过计算协方差矩阵的特征值后估计其本征维数为d=2;
E步骤:根据邻接矩阵的本征维数估计值,以及给定的阈值d*=2,选择具有全局分布特征的多项式核函数,并依此确定支持向量机模型;
F步骤:随机选取767组样本数据作为训练样本,191组样本数据作为测试样本;优化由多项式核函数构建的SVM模型参数后,最后随机实验三次并取平均值,其实施预测准确率为94.45%,而采用具有局部分布特征的径向基核函数(RBF)构建的SVM模型,其实施预测准确率仅为85.25%,两者相差9.20%。
实施例二:Liver Disorders Data Set(肝脏疾病数据集)
A步骤:本组数据集来自UCI数据库,共有345组数据;对其进行预处理,使样本数据的范数小于1并中心化;然后选取平均红细胞体积、碱性磷酸酶、丙氨酸转氨酶、天冬氨酸转氨酶、γ-谷氨酰转肽酶以及每天喝相当于半品脱酒精饮料的数量6个为输入变量,疾病状态为输出变量;
B步骤:在给定样本点附近寻找一个邻域,从中找出此局部邻域的几何结构,并计算每个样本点xi与其余样本点xj(j≠i)之间的欧氏距离,当xj为xi最近的k=8个点时,则把xj视为与xi是相邻的,即图G中有连接边xixj,且边权值为αij=αji=1;
C步骤:由无向图G的顶点和边以及相应的权值构造规模为6×6的(0,1)邻接矩阵;
D步骤:利用主成分分析方法(PCA)将规模为6×6的(0,1)邻接矩阵按照最大方差的方向予以映射变换,并通过计算协方差矩阵的特征值后估计其本征维数为d=3;
E步骤:根据邻接矩阵的本征维数估计值,以及给定的阈值d*=2,选择具有局部分布特征的径向基核函数(RBF),并依此确定支持向量机模型;
F步骤:随机选取276组样本数据作为训练样本,69组样本数据作为测试样本;优化由径向基核函数(RBF)构建的SVM模型参数后,最后随机实验三次并取平均值,其实施预测准确率为100%,而采用具有全局分布特征的多项式核函数构建的SVM模型,其实施预测准确率仅为73.91%,两者相差高达26.09%之多。
实施例三:Haberman’s Survival Data Set(哈伯曼生存数据集)
A步骤:本组数据集来自UCI数据库,共有306组数据;对其进行预处理,使样本数据的范数小于1并中心化;然后选取手术时患者年龄、患者的手术年份和检测到的阳性腋窝淋巴结数3个为输入变量,生存状态(5年)为输出变量;
B步骤:在给定样本点附近寻找一个邻域,从中找出此局部邻域的几何结构,并计算每个样本点xi与其余样本点xj(j≠i)之间的欧氏距离,当xj为xi最近的k=8个点时,则把xj视为与xi是相邻的,即图G中有连接边xixj,且边权值为αij=αji=1;
C步骤:由无向图G的顶点和边以及相应的权值构造规模为3×3的(0,1)邻接矩阵;
D步骤:利用主成分分析方法(PCA)将规模为3×3的(0,1)邻接矩阵按照最大方差的方向予以映射变换,并通过计算协方差矩阵的特征值后估计其本征维数为d=2;
E步骤:根据邻接矩阵的本征维数估计值,以及给定的阈值d*=2,选择具有全局分布特征的多项式核函数,并依此确定支持向量机模型;
F步骤:随机选取245组样本数据作为训练样本,61组样本数据作为测试样本;优化由多项式核函数构建的SVM模型参数后,最后随机实验三次并取平均值,其实施预测准确率为95.48%,而采用具有局部分布特征的径向基核函数(RBF)构建的SVM模型,其实施预测准确率仅为83.42%,两者相差12.06%。
通过以上三个实施例样本数据的测试可以看出,利用图论理论所筛选出的核函数建立的支持向量机模型要优于其他核函数构建的支持向量机模型。因此,本发明将图论理论运用于支持向量机核函数选择,是一种有指导性的实用方法,弥补了传统的支持向量机模型选择方法中人为指定核函数类型导致模型不能达到最优性能的不足,并具有运算速度快、非常适合实时在线SVM模型预测控制场所。
Claims (4)
1.一种基于图论的支持向量机核函数选择方法,其特征是:包括如下步骤:
步骤2,k邻域选取:在给定样本点附近寻找一个邻域,从中找出此局部邻域的几何结构,并计算每个样本点xi与其余样本点xj(j≠i)之间的欧氏距离;当xj为xi最近的k个点时,则把xj视为与xi是相邻的,即图G中有边xixj;
①如果xi和xj是近邻点,则在图G中xi与xj之间有连接边,且连接边权值取αij=αji=1;如果xi和xj不是近邻点,则在图G中xi与xj之间没有连接边,且连接边权值取αij=αji=0;
②由无向图G的顶点和边以及相应的权值构造规模为D×D的(0,1)邻接矩阵;
步骤4,本征维数估计:利用主成分分析方法将由样本数据构建的(0,1)邻接矩阵按照最大方差的方向予以映射变换,并通过计算协方差矩阵的特征值后估计其本征维数,具体过程如下:
假设数据样本进行了中心化,即∑ixi=0,以及投影变换后得到的新坐标系为{ω1,ω2,…,ωD},ωi为标准正交基向量,||ωi||2=1,丢弃新坐标系中的部分坐标,其维度降至d(d≤D),则样本点xi在低维坐标中的投影为zi=(zi1,zi2,…,zid),其中是xi在低维坐标系下第j维的坐标;因此,基于zi重构xi,则会得到
其中W=[ω1,ω2,…,ωD],const是一常数;
根据最近重构性,将式(1)最小化,则有
其中W=[ω1,ω2,…,ωD],式(2)即为主成分分析方法的优化目标;
利用拉格朗日乘子法求解式(2)可得
XXTωi=λiωi (3)
由式(3)可以看出,只需要对协方差矩阵XXT进行特征值分解,并将特征值排序,设定一个阈值δ,根据保留特征值的个数来估计本征维数的大小,即
其中λi为协方差矩阵XXT的特征值,b是所选取的特征个数,l是样本个数,δ为设定的阈值;
步骤5,核函数类型选择:根据邻接矩阵的本征维数估计值,以及给定的阈值选择相应的SVM核函数类型,并确定支持向量机模型;
步骤6,优化支持向量机模型参数并输出预测结果。
2.根据权利要求1所述的方法,其特征是:应用于井字棋游戏数据集中,包括如下步骤:
A步骤:本组数据集来自UCI数据库,共有958组数据;对其进行预处理,使样本数据的范数小于1并中心化;然后选取左上角、中上方、右上角、中左方、正中间、中右方、左下方、中下方和右下角9个为输入变量,播放器为输出变量;
B步骤:在给定样本点附近寻找一个邻域,从中找出此局部邻域的几何结构,并计算每个样本点xi与其余样本点xj(j≠i)之间的欧氏距离,当xj为xi最近的k=8个点时,则把xj视为与xi是相邻的,即图G中有连接边xixj,且边权值为αij=αji=1;
C步骤:由无向图G的顶点和边以及相应的权值构造规模为9×9的(0,1)邻接矩阵;
D步骤:利用主成分分析方法将规模为9×9的(0,1)邻接矩阵按照最大方差的方向予以映射变换,并通过计算协方差矩阵的特征值后估计其本征维数为d=2;
E步骤:根据邻接矩阵的本征维数估计值,以及给定的阈值d*=2,选择具有全局分布特征的多项式核函数,并依此确定支持向量机模型;
F步骤:随机选取767组样本数据作为训练样本,191组样本数据作为测试样本;优化由多项式核函数构建的SVM模型参数后,最后随机实验三次并取平均值,其实施预测准确率为94.45%。
3.根据权利要求1所述的方法,其特征是:应用于肝脏疾病数据集中,包括如下步骤:
A步骤:本组数据集来自UCI数据库,共有345组数据;对其进行预处理,使样本数据的范数小于1并中心化;然后选取平均红细胞体积、碱性磷酸酶、丙氨酸转氨酶、天冬氨酸转氨酶、γ-谷氨酰转肽酶以及每天喝相当于半品脱酒精饮料的数量6个为输入变量,疾病状态为输出变量;
B步骤:在给定样本点附近寻找一个邻域,从中找出此局部邻域的几何结构,并计算每个样本点xi与其余样本点xj(j≠i)之间的欧氏距离,当xj为xi最近的k=8个点时,则把xj视为与xi是相邻的,即图G中有连接边xixj,且边权值为αij=αji=1;
C步骤:由无向图G的顶点和边以及相应的权值构造规模为6×6的(0,1)邻接矩阵;
D步骤:利用主成分分析方法将规模为6×6的(0,1)邻接矩阵按照最大方差的方向予以映射变换,并通过计算协方差矩阵的特征值后估计其本征维数为d=3;
E步骤:根据邻接矩阵的本征维数估计值,以及给定的阈值d*=2,选择具有局部分布特征的径向基核函数,并依此确定支持向量机模型;
F步骤:随机选取276组样本数据作为训练样本,69组样本数据作为测试样本;优化由径向基核函数构建的SVM模型参数后,最后随机实验三次并取平均值,其实施预测准确率为100%。
4.根据权利要求1所述的方法,其特征是:应用于哈伯曼生存数据集中,包括如下步骤:
A步骤:本组数据集来自UCI数据库,共有306组数据;对其进行预处理,使样本数据的范数小于1并中心化;然后选取手术时患者年龄、患者的手术年份和检测到的阳性腋窝淋巴结数3个为输入变量,生存状态5年为输出变量;
B步骤:在给定样本点附近寻找一个邻域,从中找出此局部邻域的几何结构,并计算每个样本点xi与其余样本点xj(j≠i)之间的欧氏距离,当xj为xi最近的k=8个点时,则把xj视为与xi是相邻的,即图G中有连接边xixj,且边权值为αij=αji=1;
C步骤:由无向图G的顶点和边以及相应的权值构造规模为3×3的(0,1)邻接矩阵;
D步骤:利用主成分分析方法将规模为3×3的(0,1)邻接矩阵按照最大方差的方向予以映射变换,并通过计算协方差矩阵的特征值后估计其本征维数为d=2;
E步骤:根据邻接矩阵的本征维数估计值,以及给定的阈值d*=2,选择具有全局分布特征的多项式核函数,并依此确定支持向量机模型;
F步骤:随机选取245组样本数据作为训练样本,61组样本数据作为测试样本;优化由多项式核函数构建的SVM模型参数后,最后随机实验三次并取平均值,其实施预测准确率为95.48%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710783725.6A CN107544944B (zh) | 2017-09-04 | 2017-09-04 | 一种基于图论的支持向量机核函数选择方法及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710783725.6A CN107544944B (zh) | 2017-09-04 | 2017-09-04 | 一种基于图论的支持向量机核函数选择方法及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107544944A CN107544944A (zh) | 2018-01-05 |
CN107544944B true CN107544944B (zh) | 2020-06-02 |
Family
ID=60957898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710783725.6A Active CN107544944B (zh) | 2017-09-04 | 2017-09-04 | 一种基于图论的支持向量机核函数选择方法及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107544944B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110909908A (zh) * | 2018-09-18 | 2020-03-24 | 天津京东深拓机器人科技有限公司 | 一种用于物品拣选时长预测的方法和装置 |
CN112231933B (zh) * | 2020-11-06 | 2023-07-28 | 中国人民解放军国防科技大学 | 一种面向雷达电磁干扰效应分析的特征选择方法 |
CN113112130B (zh) * | 2021-03-23 | 2022-09-30 | 合肥工业大学 | 高端装备制造过程质量在线监测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462019A (zh) * | 2014-12-18 | 2015-03-25 | 江西理工大学 | 一种稀疏表示下支持向量机核函数选择方法及其应用 |
CN106951471A (zh) * | 2017-03-06 | 2017-07-14 | 浙江工业大学 | 一种基于svm的标签发展趋势预测模型的构建方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7664713B1 (en) * | 2006-12-31 | 2010-02-16 | At&T Corp. | Method and apparatus for providing fast kernel learning on sparse data |
-
2017
- 2017-09-04 CN CN201710783725.6A patent/CN107544944B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462019A (zh) * | 2014-12-18 | 2015-03-25 | 江西理工大学 | 一种稀疏表示下支持向量机核函数选择方法及其应用 |
CN106951471A (zh) * | 2017-03-06 | 2017-07-14 | 浙江工业大学 | 一种基于svm的标签发展趋势预测模型的构建方法 |
Non-Patent Citations (2)
Title |
---|
基于样本分布特征的核函数选择方法研究;粱礼明 等;《计算机仿真》;20130131;第30卷(第1期);全文 * |
支持向量机核函数选择研究与仿真;梁礼明 等;《计算机工程与科学》;20150630;第37卷(第6期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN107544944A (zh) | 2018-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Unnikrishnan et al. | Toward objective evaluation of image segmentation algorithms | |
WO2022041598A1 (zh) | 一种遥感影像分割方法、系统、终端以及存储介质 | |
WO2020077858A1 (zh) | 基于神经网络的视频描述生成方法、介质、终端及装置 | |
WO2020098296A1 (zh) | 一种图像检索方法及装置 | |
CN105631436A (zh) | 基于随机森林的级联位置回归用于人脸对齐的方法 | |
CN107544944B (zh) | 一种基于图论的支持向量机核函数选择方法及其应用 | |
Gao et al. | View-based 3D model retrieval with probabilistic graph model | |
CN110543906B (zh) | 基于Mask R-CNN模型的肤质自动识别方法 | |
Zhang et al. | Global context aware convolutions for 3d point cloud understanding | |
US20150131873A1 (en) | Exemplar-based feature weighting | |
CN103559476A (zh) | 一种指纹匹配方法和装置 | |
Lu et al. | Clustering by Sorting Potential Values (CSPV): A novel potential-based clustering method | |
Mao et al. | Uasnet: Uncertainty adaptive sampling network for deep stereo matching | |
Gao et al. | Robust template matching via hierarchical convolutional features from a shape biased CNN | |
Li et al. | Differential evolution algorithm-based range image registration for free-form surface parts quality inspection | |
CN110348287A (zh) | 一种基于字典和样本相似图的无监督特征选择方法和装置 | |
Li et al. | Small Object Detection Algorithm Based on Feature Pyramid‐Enhanced Fusion SSD | |
CN114548606A (zh) | 一种气旋强度预测模型的构建方法及气旋强度预测方法 | |
CN105354845B (zh) | 一种遥感影像半监督变化检测方法 | |
Shi et al. | CEGAT: A CNN and enhanced-GAT based on key sample selection strategy for hyperspectral image classification | |
Zou et al. | Shape-based retrieval and analysis of 3D models using fuzzy weighted symmetrical depth images | |
CN108846845A (zh) | 基于缩略图与分层模糊聚类的sar图像分割方法 | |
Taşkın et al. | An adaptive affinity matrix optimization for locality preserving projection via heuristic methods for hyperspectral image analysis | |
Yang et al. | 3D model retrieval using constructive-learning for cross-model correlation | |
Chen et al. | 3D object retrieval with graph-based collaborative feature learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |