CN101571934A

CN101571934A - 一种基于支持向量机的企业自主创新能力预测方法

Info

Publication number: CN101571934A
Application number: CNA2009100850861A
Authority: CN
Inventors: 赵瑞君; 王磊; 郑晓齐
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2009-05-26
Filing date: 2009-05-26
Publication date: 2009-11-04

Abstract

本发明提供了一种基于支持向量机的企业自主创新能力预测方法。首先建立动态参数层D的层次结构模型，确立动态参数层D的要素组和指标集合之间的关系；将动态参数层D的要素组和静态参数层S的要素组经过一定预处理后组成样本集，并分为训练集和测试集两部分；然后通过训练集对模型的四个支持向量机分别进行训练，得到四个回归函数，其中，输入是动态参数层D的要素组，输出是S要素组四个要素中的一个；通过测试集对其中的参数进行调整优化，最终确定这四个回归函数；最后应用这个模型对样本自主创新能力的各方面进行预测评价。本方法建立的模型具有精度高、处理速度快、泛化能力强等优点，而且在预测方面也有突破。

Description

一种基于支持向量机的企业自主创新能力预测方法

技术领域

本发明属于人工智能应用领域，具体涉及一种基于支持向量机的企业自主创新能力预测方法。

背景技术

改革开放以来，我国科技发展水平和产业结构的技术构成发生了重大变化，劳动力素质也有了相当提高。但总的来看，面对日新月异的科学技术变革，面对日益强化的资源环境约束，面对以创新和技术升级为主要特征的激烈国际竞争，我国自主创新能力薄弱的问题已经日益成为发展的瓶颈制约。加快提高自主创新能力，是“十一五”时期引导我国经济发展的重要任务，这是加快转变经济增长方式的迫切需要，是推动产业结构优化升级的迫切需要，是增强我国综合国力和竞争力的迫切需要，也是在激烈的国际竞争中从根本上保障国家经济安全的迫切需要。而伴随着自主创新方针的贯彻执行，对于自主创新的主体企业，如何对其自主创新能力进行客观、科学和有效评价则引起了人们的注意。

山西省委党校副教授王翠芳在文章《提高国防科技工业自主创新能力的理念、制度和人才分析》中提出通过对提高国防科技工业能力的影响因素进行的分析，认为理念、制度和人才是影响和制约我国国防科技工业自主创新的主要因素。但是分析的影响因素不够具体，指标体系不够全面；哈尔滨工程大学的刘希宋等在文章《国防科技工业自主创新能力评价关键要素的识别》中提出采用群组决策特征根法对国防科技工业自主创新能力众多评价要素指标进行科学的筛选，理清了评价要素的主从地位，旨在为制定增强我国国防科技创新能力的政策及相关研究提供决策与参考。但是并未对这些具有主从地位的要素进行结构的架构；哈尔滨工程大学的陈伟等在文章《国防科技工业自主创新能力评价指标体系的构建》中提出分析影响国防科技工业自主创新能力的各方面因素的基础上，结合国防科技工业的现实情况，认为其评价指标体系是一个由多个相互联系的指标构成的复杂系统。但是并未具体建立一个方便实用的结构。上述研究中的评估指标体系普遍采用综合评价(Comprehensive Evaluation，筒称为CE)的方法，有专家评价法、层次分析法(Analytic Hierarchy Process，简称为AHP)、多目标决策、数据包络分析(Data Envelope Analytic，简称为DEA)和主成份分析法(PrimaryComponent Analysis，简称为PCA)等。虽然能够对多属性体系结构描述的系统采用的方法做出全局性、整体性的评价，但是具有需要样本多、精度低、处理速度慢、泛化能力差的缺点。同时，自主创新和创造力是动态的过程，既要考虑静态结果指标，如投入产出比、成果转化率等，又有创新过程中能力的动态指标参数，如研发(Research & Develop，简称为R&D)能力、组织管理能力等，如何根据过程数据对结果数据进行预测值得研究。

机器学习(Machine Learning，简称为ML)是预测的一种常用的新兴有效的方法，是继专家系统之后人工智能应用的又一重要研究领域，也是人工智能和神经计算的核心研究课题之一。研究从观测数据即样本出发寻找规律，利用这些规律对未来数据或无法观测的数据进行预测。至今，关于机器学习还没有统一的定义，其实现方法大致分为三种：

(1)参数估计方法

现有机器学习方法共同的重要理论基础之一是统计学。在基于传统统计学的参数方法中，参数的形式是已知的，用训练样本来估计参数的值。这种方法有两个缺点：首先，它需要已知样本分布形式，需要花费很多代价，有时是困难的，在低维空间中无法描述；其次，传统统计学研究的样本数目趋于无穷大的渐进理论，现有学习方法也多是基于此假设。但在实际问题中，样本数目往往是有限的，因此一些理论上很优秀的学习方法实际中表现却可能不尽人意。

(2)经验非线性方法

如人工神经网络(Artificial Neural Network，简称为ANN)等。这种方法利用已知样本进行训练，从而建立起非线性模型。经验非线性方法的优点是克服了传统参数估计方法的困难。不足的是，这种方法缺乏一种统一的数学理论，在实际应用中容易受经验条件的制约，存在着局部极小问题和过拟合问题等。

(3)统计学习理论

统计学习理论是一种专门研究小样本情况下机器学习规律的理论，在这种体系下的统计推理规则不仅考虑了对渐进性能的要求，而且追求在现有有限信息的条件下得到最优结果。Vapnik等从六、七十年代致力于统计学习理论方面的研究，到九十年代中期，随着其理论的不断发展和成熟，也由于神经网络等学习方法在理论上缺乏实质性进展，统计学习理论开始受到越来越广泛的重视。基于统计学习理论和结构风险最小化原理的支持向量机(SupportVector Machine，简称为SVM)在理论研究和算法实现上都取得了突破性进展，具有小样本、非线性、精度高、处理速度快、泛化能力强等优点，在模式识别、回归分析、控制论等领域得到了应用，开始成为克服“维数灾难”和“过学习”等传统困难的有利手段。目前，将此理论应用到企业自主创新能力预测上尚无先例。

发明内容

本发明在企业自主创新能力评估指标体系建立的基础上，引入SVM的方法，建立企业自主创新能力预测方法，根据创新过程中的动态参数，预测出静态目标指标。

基于SVM的企业自主创新能力预测方法，整个过程分为以下几个步骤：

步骤一，建立动态参数层D的层次结构模型；

利用层次分析法建立动态参数层D的层次结构模型，能够利用其指标集合求出要素组。其中，本发明的指标变量分为创新过程中的动态参数层D和表示创新目标和结果的静态参数层S。动态参数层D又分要素组{D₁，D₂，D₃，D₄}与要素组{D₁，D₂，D₃，D₄}所分别对应的指标集合{D₁₁，D₁₂，D₁₃，D₁₄，D₁₅，D₁₆，D₁₇，D₁₈，D₂₁，D₂₂，D₂₃，D₂₄，D₂₅，D₂₆，D₂₇，D₂₈，D₃₁，D₃₂，D₃₃，D₃₄，D₃₅，D₃₆，D₃₇，D₃₈，D₄₁，D₄₂，D₄₃，D₄₄，D₄₅，D₄₆，D₄₇，D₄₈}。

要评判企业的自主创新能力，需要明确企业的自主创新能力指标体系的构建，考虑到在创新过程中的如下特点：

其一，以研发(Research and Development，简称为R&D)为核心任务，以研发人员为核心资源的突出特点，重视人的因素在自主创新能力中的作用；

其二，考虑预先研究的投入、核心竞争力构建、领导层面对自主创新的倾向、以及科研成果转化的特殊性与计划性对自主创新的影响；

其三，既考虑到独立创新要素，又要基于国家创新系统的产学研全面协同。

确定了动态参数层D的要素组{D₁，D₂，D₃，D₄}。

同时考虑到建立指标体系的以下几个原则：

其一，定性分析与定量分析相结合的原则。设计的指标应具有可采集性、可量化性，同时在可量化的基础上，对各指标的影响程度、来源、变化趋势等要进行定性分析；

其二，科学性原则。国防科研自主创新能力指标的选择要围绕国防科研自主创新的本质，涵盖反映国防科研自主创新能力的重要因素。并把它们有机地联系起来，力求全面、客观地反映和描述国防科研自主创新能力状况；

其三，可操作性原则。评价的目的是要在国防科研技术创新工作中得到应用，这就要求指标选择具有可行性和可操作性，即设计的指标应具有可采集的特点，能从各种统计资料中直接或间接获取。指标选择相对简单，做到指标少而精，计算公式科学合理，利于掌握和推广；

其四，多目标性原则。国防科研自主创新能力是一个复杂的系统，涉及到国防科研的人力、物力、财力，涉及到科技活动投入、组织管理、产学研协同、成果转化等方方面面。所以需要建立一个国防科研自主创新能力指标体系，从多方位、多角度系统地描述国防科研自主创新能力；

其五，简单客观性原则。指标设定尽量利用客观信息，对主观因素要进行科学处理，注意评价方法的可操作性。同时应注意因素数量，选择做能体现自主创新能力的因素指标，减少指标间的交叉重复，指标总量不宜过多。

确立了要素组要素所分别对应的指标集合。

动态参数层D具体内容和动态参数层D的要素组{D₁，D₂，D₃，D₄}所分别对应的各指标集合的关系如表1所示：

表1

其中，层次分析法是美国匹兹堡大学教授A.L.Saaty于20世纪70年代提出的一种系统分析方法，它是一种定性分析与定量分析相结合的多目标决策分析方法。它的基本步骤包括：

(1)建立层次结构模型；

(2)构造成对比较矩阵；

(3)层次单排序及其一致性检验；

(4)层次总排序及其一致性检验。

步骤二，建立SVM样本集；

对动态参数层D的要素组{D₁，D₂，D₃，D₄}进行数据归一化处理得到动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}，再结合表示创新目标和结果的静态参数层S的要素组{S₁，S₂，S₃，S₄}，建立样本集，进而分成训练集和测试集两部分。

其中，表示创新目标和结果的静态参数层S仅包含要素组，要素组{S₁，S₂，S₃，S₄}表示：S₁为创新效率，S₂为创新成果，S₃为创新专利，S₄为创新产品。其中涵盖了创新目标和目的的各相关方面。

步骤三，SVM的训练与优化；

利用SVM在回归算法上的应用，建立动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}和表示创新目标和结果的静态参数层S的要素组{S₁，S₂，S₃，S₄}间的关系。其中，输入是动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}，输出是S_q∈{S₁，S₂，S₃，S₄}，q∈{1，2，3，4}。

首先确定SVM的核函数K；再对SVM参数进行选择，包括核函数的参数和惩罚因子C；然后利用训练集对SVM进行训练；最后利用测试集对SVM相关参数进行调整优化，从而确定SVM回归函数，其中相关参数包括拉格朗日系数a_i，a_i ^*和偏移系数b。

步骤四，模型的应用；

将样本代入此预测模型中，根据动态参数层各指标的评分推导出表示创新目标和结果的静态参数层S各要素的评分，进而对该样本自主创新能力的各方面进行预测评价。

本发明具有如下优点：

1)将指标分为创新过程中的动态参数层D和表示创新目标和结果的静态参数层S。其中，动态参数层中又分为要素组与指标集合。这样多方面、多角度和多层次地设立指标体系，科学性更强，可操作性也更高；

2)利用SVM精度高、处理速度快、泛化能力强等特点进行创新能力评价；

3)利用SVM回归算法上的应用进行了预测功能的实现和模型的建立，模型功能更加全面，相比以往有较大突破。

附图说明

图1为本发明所述方法流程图；

图2为本发明动态参数层D层次结构模型示意图；

图3为本发明应用现有技术SVM的原理示意图；

图4为本发明SVM训练与优化流程示意图；

图5为本发明所述方法应用流程示意图。

具体实施方式

下面结合附图，对本发明的具体实施方式进行详细说明。

本发明所述方法可以分为四个步骤完成，步骤流程如图1所示：

步骤一，建立动态参数层D的层次结构模型；

首先是采集数据，选择g家企业做问卷调查，g≥10，且为整数，分别对动态参数层D的要素组{D₁，D₂，D₃，D₄}所分别对应的指标集合{D₁₁，D₁₂，D₁₃，D₁₄，D₁₅，D₁₆，D₁₇，D₁₈，D₂₁，D₂₂，D₂₃，D₂₄，D₂₅，D₂₆，D₂₇，D₂₈，D₃₁，D₃₂，D₃₃，D₃₄，D₃₅，D₃₆，D₃₇，D₃₈，D₄₁，D₄₂，D₄₃，D₄₄，D₄₅，D₄₆，D₄₇，D₄₈}中各量在{1，2，3，4，5}范围内进行评分，其中1分为最低分，5分为最高分。然后如图2所示，确定动态参数层D的层次结构模型。

确定四个权向量ω₁、ω₂、ω₃和ω₄的方法如下：对于要素D₁，首先要建立其成对比较矩阵。为了要比较各要素组的指标集合对该要素的影响程度，确定在该层中相对于某一准则所占的比重，该矩阵通过进行同一要素的指标之间的两两比较来得到，比较时采用1～9尺度，利用a_ij表示要素D₁的第i个指标相对于第j个指标的比较结果，从而构成成对比较矩阵A₁，即

A_{1} = {(a_{ij})}_{8 \times 8} = (\begin{matrix} a_{11} & a_{12} & \cdot \cdot \cdot & a_{18} \\ a_{21} & a_{22} & \cdot \cdot \cdot & a_{28} \\ \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot \\ a_{81} & a_{82} & \cdot \cdot \cdot & a_{88} \end{matrix});

然后计算各要素的成对比较矩阵的最大特征值及其对应的特征向量，具体是将判断矩阵A₁的每一列元素做归一化处理

a_{ij}^{'} = \frac{a_{ij}}{Σ_{i = 1}^{8} a_{ij}},

然后将处理后的矩阵按行相加为

W_{1 i} = Σ_{j = 1}^{8} a_{ij}^{'},

对向量W₁＝(W₁₁，W₁₂，W₁₃，W₁₄，W₁₅，W₁₆，W₁₇，W₁₈)进行归一化处理即得到所要的权向量ω₁，其中i，j均为{1，2，3，4，5，6，7，8}间任意正整数。利用一致性指标CI、随机一致性指标RI和一致性比率CR做一致性检验。当一致性比率CR＜0.1时，认为A₁的一致性程度在容许范围之内，可用此向量ω₁作为其权向量，否则需要重新构造成对比较矩阵。其中，一致性指标

CI = \frac{κ - n}{n - 1},

κ为n阶正互反阵的最大特征根，其中n为大于1的正整数，κ∈[1，n]，κ也是整数；随机一致性指标

RI = \frac{{CI}_{1} + {CI}_{2} + \cdot \cdot \cdot + {CI}_{500}}{500}

是足够多个根据随机发生的判断矩阵计算的一致性指标的平均值，该式中取500个。1～11阶矩阵的RI值可通过查表2得出；其中，CI₁，CI₂，…，CI₅₀₀为随机进行的500次测试的一致性指标；一致性比率

CR = \frac{CI}{RI},

CI，RI含义同上。

对于要素D₂，首先建立成对比较矩阵A₂，即

A_{2} = (\begin{matrix} b_{11} & b_{12} & \cdot \cdot \cdot & b_{18} \\ b_{21} & b_{22} & \cdot \cdot \cdot & b_{28} \\ \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot \\ b_{81} & b_{82} & \cdot \cdot \cdot & b_{88} \end{matrix}) .

其中b_ij表示要素D₂的第i个指标相对于第j个指标的比较结果。

然后计算各要素的成对比较矩阵的最大特征值及其对应的特征向量，具体是将判断矩阵A₂的每一列元素做归一化处理

b_{ij}^{'} = \frac{b_{ij}}{Σ_{i = 1}^{8} b_{ij}},

然后将处理后的矩阵按行相加为

W_{2 i} = Σ_{j = 1}^{8} b_{ij}^{'},

对向量W₂＝(W₂₁，W₂₂，W₂₃，W₂₄，W₂₅，W₂₆，W₂₇，W₂₈)进行归一化处理即得到所要的权向量ω₂，其中i，j均为{1，2，3，4，5，6，7，8}间任意正整数。利用一致性指标CI、随机一致性指标RI和一致性比率CR做一致性检验。当一致性比率CR＜0.1时，认为A₂的一致性程度在容许范围之内，可用此向量ω₂作为其权向量，否则需要重新构造成对比较矩阵。

对于要素D₃，首先建立成对比较矩阵A₃，即

A_{2} = (\begin{matrix} c_{11} & c_{12} & \cdot \cdot \cdot & c_{18} \\ c_{21} & c_{22} & \cdot \cdot \cdot & c_{28} \\ \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot \\ c_{81} & c_{82} & \cdot \cdot \cdot & c_{88} \end{matrix}) .

其中c_ij表示要素D₃的第i个指标相对于第j个指标的比较结果。

然后计算各要素的成对比较矩阵的最大特征值及其对应的特征向量，具体是将判断矩阵A₃的每一列元素做归一化处理

c_{ij}^{'} = \frac{c_{ij}}{Σ_{i = 1}^{8} c_{ij}} .

然后将处理后的矩阵按行相加为

W_{3 i} = Σ_{j = 1}^{8} c_{ij}^{'},

对向量W₃＝(W₃₁，W₃₂，W₃₃，W₃₄，W₃₅，W₃₆，W₃₇，W₃₈)进行归一化处理即得到所要的权向量ω₃，其中i，j均为{1，2，3，4，5，6，7，8}间任意正整数。利用一致性指标CI、随机一致性指标RI和一致性比率CR做一致性检验。当一致性比率CR＜0.1时，认为A₃的一致性程度在容许范围之内，可用此向量ω₃作为其权向量，否则需要重新构造成对比较矩阵。

对于要素D₄，首先建立成对比较矩阵A₄，即

A_{4} = (\begin{matrix} d_{11} & d_{12} & \cdot \cdot \cdot & d_{18} \\ d_{21} & d_{22} & \cdot \cdot \cdot & d_{28} \\ \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot & \cdot \cdot \cdot \\ d_{81} & d_{82} & \cdot \cdot \cdot & d_{88} \end{matrix}) .

其中d_ij表示要素D₄的第i个指标相对于第j个指标的比较结果。

然后计算各要素的成对比较矩阵的最大特征值及其对应的特征向量，具体是将判断矩阵A₄的每一列元素做归一化处理

d_{ij}^{'} = \frac{d_{ij}}{Σ_{i = 1}^{8} d_{ij}},

然后将处理后的矩阵按行相加为

W_{4 i} = Σ_{j = 1}^{8} d_{ij}^{'},

对向量W₄＝(W₄₁，W₄₂，W₄₃，W₄₄，W₄₅，W₄₆，W₄₇，W₄₈)进行归一化处理即得到所要的权向量ω₄，其中i，j均为{1，2，3，4，5，6，7，8}间任意正整数。利用一致性指标CI、随机一致性指标RI和一致性比率CR做一致性检验。当一致性比率CR＜0.1时，认为A₄的一致性程度在容许范围之内，可用此向量ω₄作为其权向量，否则需要重新构造成对比较矩阵。

在这个步骤中，最主要的就是确定动态参数层D的要素组{D₁，D₂，D₃，D₄}的四个权向量ω₁、ω₂、ω₃和ω₄。之后通过将D的各指标{D₁₁，…，D₁₈}、{D₂₁，…，D₂₈}、{D₃₁，…，D₃₈}和{D₄₁，…，D₄₈}分别与权向量ω₁、ω₂、ω₃和ω₄矩阵相乘，得到动态参数层D的要素组{D₁，D₂，D₃，D₄}，即D₁＝{D₁₁，…，D₁₈}·ω₁，D₂＝{D₂₁，…，D₂₈}·ω₂，D₃＝{D₃₁，…，D₃₈}·ω₃和D₄＝{D₄₁，…，D₄₈}·ω₄。

表2

n	1	2	3	4	5	6	7	8	9	10	11	……
n	1	2	3	4	5	6	7	8	9	10	11	……	RI	0	0	0.58	0.90	1.12	1.24	1.32	1.41	1.45	1.49	1.51	……

步骤二，建立SVM样本集；

动态参数层D指标集合通过步骤一的计算得到动态参数层D的要素组{D₁，D₂，D₃，D₄}，进行数据归一化处理，即

D_{e}^{'} = \frac{D_{e} - D_{e \min}}{D_{e \max} - D_{e \min}},

其中，D_emin是D_e中的最小值，D_emax是D_e中的最大值，e＝1，2，3，4，得出动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}。根据动态参数层D的指标集合，专家对创新目标和结果的各方面，即表示创新目标和结果的静态参数层S的各要素，进行评分。将动态参数层D的要素组归一化后的结果和表示创新目标和结果的静态参数层S的要素组作为样本集；从该样本集中抽出

组样本作为训练集，将样本集剩余的

组样本作为测试集，g≥10，且为整数。

步骤三，SVM的训练与优化；

利用SVM在线性回归算法上的应用，建立动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}和表示创新目标和结果的静态参数层S的要素组{S₁，S₂，S₃，S₄}间的关系，从而能够通过动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}求出表示创新目标和结果的静态参数层S的要素组{S₁，S₂，S₃，S₄}；其中，SVM的输入是动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}，输出是S_q∈{S₁，S₂，S₃，S₄}，q∈{1，2，3，4}；

其中，支持向量机SVM是一种通过用内积函数定义的非线性变换将输入空间变换到一个高维特征空间，把输入空间中线性不可分问题转化为特征空间中的线性可分问题的机器学习方法。在这个高维空间中求广义最优分类面f(w，x)＝(w·x)+b，使得两类样本的间隔最大。如图3所示，在原始空间中，可以看出，黑点和白点两类样本利用l′₁或者l′₂都很难被准确分开，但是通过支持向量机SVM的核函数映射，这些点在特征空间中的映射点可以很好地被l₁或者l₂分为type1和type2两类。

对于线性回归问题，即假设l个数据{x_μ，y_μ}，μ＝1，…，l，l≥2，为整数，x_μ∈R^d，R^d表示d维实数向量，y_μ∈R，要在精度ε下用线性函数拟合，ε∈R，根据平面间距离的定义，要求两类训练样本间的最大间隔，就等价于求：

\min \frac{1}{2} {| | w | |}^{2} + C Σ_{μ = 1}^{l} (ξ_{μ} + ξ_{μ}^{*})

s . t \{\begin{matrix} y_{μ} - (w, x_{μ}) - b \leq ϵ + ξ_{μ} \\ (w, x_{μ}) + b - y_{μ} \leq ϵ + ξ_{μ}^{*} \\ ξ_{μ}, ξ_{μ}^{*} &GreaterEqual; 0 \end{matrix}

其中，w和b分别为线性拟合函数的法向量和偏移系数。C为惩罚因子。ξ_μ，ξ_μ ^*为引进的松弛变量，目的是处理函数在ε精度下不能估计的数据。变量x_μ和y_μ均为实数。

转化为求二次规划问题，建立拉格朗日方程：

l (w, ξ_{μ}, ξ_{μ}^{*}) = \frac{1}{2} {| | w | |}^{2} + C Σ_{μ = 1}^{l} (ξ_{μ} + ξ_{μ}^{*}) - Σ_{μ = 1}^{l} α_{μ} [ϵ + ξ_{μ} - y_{μ} + (w, x_{μ}) + b] -

Σ_{μ = 1}^{l} α_{μ}^{*} [ϵ + ξ_{μ} + y_{μ} - (w, x_{μ}) - b] - Σ_{μ = 1}^{l} (η_{μ} ξ_{μ} + η_{μ}^{*} ξ_{μ}^{*})

其中η_μ，η_μ ^*为ξ_μ，ξ_μ ^*的系数。

又通过对偶原理等价于求：

\max \frac{1}{2} Σ_{μ, v = 1}^{l} (α_{μ} - α_{μ}^{*}) (α_{v} - α_{v}^{*}) (x_{μ}, x_{v}) + Σ_{μ = 1}^{l} α_{μ} (ϵ - y_{μ}) + Σ_{μ = 1}^{l} α_{μ} (ϵ + y_{μ})

s . t \{\begin{matrix} Σ_{μ = 1}^{l} (α_{μ} - α_{μ}^{*}) = 0 \\ α_{μ}, α_{μ}^{*} &Element; [0, C] \end{matrix}

通过这个二次规划可求得a_μ，a_μ ^*，偏移系数b为：

b = y - Σ_{μ = 1}^{l} (a_{μ}^{*} - a_{μ}) (x_{μ} \cdot x)

也可得到回归函数：

y = Σ_{μ = 1}^{l} (a_{μ}^{*} - a_{μ}) (x_{μ} \cdot x) + b

对于非线性回归问题，回归函数可表示为：

y = Σ_{μ = 1}^{l} (a_{μ}^{*} - a_{μ}) K (x, x_{μ}) + b

其中，b是一个常数而且对于一般带有纯数值项的容许的核函数，该项可以省略；系数a_μ，a_μ ^*是拉格朗日系数，非零的a_μ，a_μ ^*对应的输入量x_μ称为支持向量，支持向量位于分类边界或分类面上；二元函数K(x，y)通常称为核函数。

在训练学习前，首先要确定SVM的核函数K(x，y)；

对于给定的核K(x，y)，若有实数λ和非零函数ψ(x)使成立

{&Integral;}_{b}^{a} K (x, y) ψ (x) dx = λψ (x),

则称λ为核的一个特征值，称ψ(x)为核的关于特征值λ的一个特征函数。关于Mercer核有如下定理，Mercer定理：Mercer核K(x，y)可以展开成一致收敛的函数项级数：

K (x, y) = \underset{ρ}{Σ} λ_{ρ} ψ (x) ψ (y),

其中λ_ρ，ψ(x)分别为核K(x，y)的特征值和特征向量，他们的个数可能有限或无穷。

常用的核函数有：

1)多项式核函数：

K(x，y)＝(μx·y+c)^d d＝1，2，…

2)径向基核函数：

K(x，y)＝exp(-γ‖x-y‖²)

3)Sigmoid核函数：

K(x，y)＝tanh(β(x·y+e)

以上各个核函数的所有参数默认为实数。由于径向基核函数的参数少，分类效果好，所以该发明中支持向量机SVM的核函数选用径向基核函数K(x，y)＝exp(-γ‖x-y‖²，其中γ为径向基核函数的宽度参数。

再对SVM参数进行选择，采用网格法选择最优的核函数的参数γ和惩罚因子C。其中，网格法指对于几个在一定范围内的数，在各自区间内按一定间隔分别取值，最后形成网状的取值情况，通过比较最后的结果来选择最优解。本步骤中，选择训练误差最小的一组作为最优解；

然后利用训练集对SVM进行训练，初步确定SVM的a_μ，a_μ ^*和b。a_μ，a_μ ^*通过二次规划求出，b通过

b = y - Σ_{μ = 1}^{l} (a_{μ}^{*} - a_{μ}) (x_{μ} \cdot x)

求出；

最后利用测试集对SVM的相关参数进行调整优化，从而确定SVM回归函数，其中相关参数包括拉格朗日系数a_μ，拉格朗日系数a_μ ^*和偏移系数b。

如图4，本发明采用4个SVM建立了4个回归函数

y_{χ} = Σ_{μ = 1}^{l} (a_{μχ}^{*} - a_{μχ}) \exp (- γ_{χ} {| | x_{χ} - x_{μχ} | |}^{2}) + b_{χ}, χ = 1,2,3,4 .

其中，S1-SVM回归函数

y_{1} = Σ_{μ = 1}^{l} (a_{μ 1}^{*} - a_{μ 1}) \exp (- γ_{1} {| | x_{1} - x_{μ 1} | |}^{2}) + b_{1}

的输入x₁是动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}，输出y₁是S₁；S2-SVM回归函数

y_{2} = Σ_{μ = 1}^{l} (a_{μ 2}^{*} - a_{μ 2}) \exp (- γ_{2} {| | x_{2} - x_{μ 2} | |}^{2}) + b_{2}

的输入x₂是动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}，输出y₂是S₂；S3-SVM回归函数

y_{3} = Σ_{μ = 1}^{l} (a_{μ 3}^{*} - a_{μ 3}) \exp (- γ_{3} {| | x_{3} - x_{μ 3} | |}^{2}) + b_{3}

的输入x₃是动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}，输出y₃是S₃；S4-SVM回归函数

y_{4} = Σ_{μ = 1}^{l} (a_{μ 4}^{*} - a_{μ 4}) \exp (- γ_{4} {| | x_{4} - x_{μ 4} | |}^{2}) + b_{4}

的输入x₄是动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}，输出y₄是S₄。第χ个SVM的训练学习，就是要找到最优的径向基核函数的参数γ_x和惩罚因子C_χ，支持向量集，拉格朗日系数a_μχ，a_μχ ^*和偏移系数b_χ；其中惩罚因子C_χ为第χ个SVM的惩罚因子。

步骤四，模型的应用；

如图5，利用层次分析法由动态参数层D的指标集合求出动态参数层D的要素组{D₁，D₂，D₃，D₄}，然后将动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}代入四个回归函数

y_{χ} = Σ_{μ = 1}^{l} (a_{μχ}^{*} - a_{μχ}) \exp (- γ_{χ} {| | x_{χ} - x_{μχ} | |}^{2}) + b_{χ}, χ = 1,2,3,4,

求出静态目标层S的要素组{S₁，S₂，S₃，S₄}，进而对该样本自主创新能力的各方面进行预测评价；

其中，对于一定的变量χ，b_χ是一个常数而且对于一般带有纯数值项的容许的核函数，该项可以省略；系数a_μχ，a_μχ ^*是拉格朗日系数，非零的a_μχ，a_μχ ^*对应的输入量x_μχ称为支持向量，支持向量位于分类边界或分类面上；γ_χ为径向基核函数的宽度参数；以上变量b_χ，a_μχ，a_μχ ^*，γ_χ默认为任意实数。

表3为本发明的一组实施实例相关统计数据，可以看出相比层次分析法，神经网络，SVM在精度、处理速度和泛化能力上都有优势。

表3

从表3可见，相比现有的自主创新能力预测方法——层次分析法，机器学习方法中的神经网络和SVM在训练时间，训练误差和预测误差上都有很大优势，而神经网络和SVM中，虽然测试误差比训练误差稍高，但后者精度更高、处理速度更快、泛化能力更强的特点，由其在泛化能力上的优势可以看出若利用至预测方面也会有较大优势，为该模型首先提出的预测能力的实现提供了保证。

Claims

1、一种基于支持向量机的企业自主创新能力预测方法，其特征在于，该方法包括如下步骤：

步骤一，建立动态参数层D的层次结构模型；

第一步，采集数据；

选择g家企业做问卷调查，其中g≥10，且为整数，分别对动态参数层D的要素组{D₁，D₂，D₃，D₄}所分别对应的指标集合{D₁₁，D₁₂，D₁₃，D₁₄，D₁₅，D₁₆，D₁₇，D₁₈，D₂₁，D₂₂，D₂₃，D₂₄，D₂₅，D₂₆，D₂₇，D₂₈，D₃₁，D₃₂，D₃₃，D₃₄，D₃₅，D₃₆，D₃₇，D₃₈，D₄₁，D₄₂，D₄₃，D₄₄，D₄₅，D₄₆，D₄₇，D₄₈}中各量在{1，2，3，4，5}范围内进行评分；其中1分为最低分，5分为最高分；其中，D₁₁表示研发资金投入强度，D₁₂表示保障资金持续供给，D₁₃表示开发人员素质，D₁₄表示拥有核心研发技术，D₁₅表示知识产权重组与有效管理，D₁₆表示预言投入，D₁₇表示主导产品成本优势，D₁₈表示现金技术动态把握，D₂₁表示协作配合，D₂₂表示交流和共享，D₂₃表示文化交流，D₂₄表示组织结构扁平化和层级淡化，D₂₅表示创新战略协调和协作方式，D₂₆表示利益分配和激励机制，D₂₇表示各部分一致性，D₂₈表示效果整体最优化，D₃₁表示创新系统的完善度，D₃₂表示科学的决策系统，D₃₃表示领导的倾向，D₃₄表示利于创新的组织情景，D₃₅表示激励机制，D₃₆表示技术人员培训的重视，D₃₇表示合适人选的安排，D₃₈表示人员绩效考核，D₄₁表示成果开发设计，D₄₂表示成果转化模式，D₄₃表示产权归属，D₄₄表示成果产权转让模式，D₄₅表示成果转化表现形式，D₄₆表示组织体系影响，D₄₇表示转化形态，D₄₈表示转化的特殊性与计划性；

第二步，确定动态参数层D的层次结构模型；

首先，建立该要素的成对比较矩阵；该矩阵通过进行该要素的指标之间的两两比较来得到，比较时采用1～9尺度，即利用a_ij表示第i个要素相对于第j个要素的比较结果，其中i，j是任意正整数，从而构成成对比较矩阵；

然后，计算各要素的成对比较矩阵的最大特征值及其对应的特征向量，具体是将判断矩阵的每一列元素做归一化处理，然后将处理后的矩阵按行相加，对新求得的向量进行归一化处理即得到所要的权向量；利用一致性指标CI、随机一致性指标RI和一致性比率CR做一致性检验；当一致性比率CR＜0.1时，认为判断矩阵的一致性程度在容许范围之内，选用该判断矩阵对应的向量作为其权向量，否则需要重新构造成对比较矩阵；通过对四个要素的上述运算，要素组的四个要素的四个权向量ω₁、ω₂、ω₃和ω₄得以确定；

最后，通过将动态参数层D的要素组{D₁，D₂，D₃，D₄}所分别对应的各指标集合{D₁₁，…，D₁₈}、{D₂₁，…，D₂₈}、{D₃₁，…，D₃₈}和{D₄₁，…，D₄₈}分别与权向量ω₁、ω₂、ω₃和ω₄矩阵相乘，得到动态参数层D的要素组{D₁，D₂，D₃，D₄}，其中D₁＝{D₁₁，…，D₁₈}·ω₁，D₂＝{D₂₁，…，D₂₈}·ω₂，D₃＝{D₃₁，…，D₃₈}·ω₃和D₄＝{D₄₁，…，D₄₈}·ω₄，D₁表示研发，D₂表示产学研协同，D₃表示组织管理，D₄表示科研成果转化；

其中，一致性指标

CI = \frac{κ - n}{n - 1},

κ为n阶正互反阵的最大特征根，其中n为大于1的正整数，κ∈[1，n]，κ也是整数；

随机一致性指标

RI = \frac{{CI}_{1} + {CI}_{2} + \cdot \cdot \cdot + {CI}_{500}}{500}

是500个根据随机发生的判断矩阵计算的一致性指标的平均值；1～11阶矩阵的RI值通过查表得出，n值表示矩阵的阶数；其中，CI₁，CI₂，…，CI₅₀₀为随机进行的500次测试的一致性指标；

一致性比率

CR = \frac{CI}{RI},

CI，RI含义同上；

步骤二，建立SVM样本集；

D_{e}^{'} = \frac{D_{e} - D_{e \min}}{D_{e \max} - D_{e \min}},

其中，D_emin是D_e中的最小值，D_emax是D_e中的最大值，e＝1，2，3，4，得出动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}；

根据步骤一中得出的的动态参数层D的指标集合，专家对表示创新目标和结果的静态参数层S的各要素，进行评分；

将动态参数层D的要素组{D₁，D₂，D₃，D₄}归一化后的结果{D′₁，D′₂，D′₃，D′₄}和表示创新目标和结果的静态参数层S的要素组作为样本集；从该样本集中抽出

组样本作为训练集，将样本集剩余的

组样本作为测试集，其中g≥10，且为整数；

其中，静态参数层S的要素组{S₁，S₂，S₃，S₄}表示：S₁为创新效率，S₂为创新成果，S₃为创新专利，S₄为创新产品；

步骤三，SVM的训练与优化；

利用SVM在回归算法上的应用，建立动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}和表示创新目标和结果的静态参数层S的要素组{S₁，S₂，S₃，S₄}间的关系，从而通过动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}求出表示创新目标和结果的静态参数层S的要素组{S₁，S₂，S₃，S₄}；其中，SVM的输入是动态参数层D的要素组{D₁，D₂，D₃，D₄}，输出是S_q∈{S₁，S₂，S₃，S₄}，q∈{1，2，3，4}；

对于线性回归问题，即假设l个数据{x_μ，y_μ}，μ＝1，…，l，l≥2，为整数，x_μ∈R^d，R^d表示d维实数向量，y_μ∈R，在精度ε下用线性函数拟合，ε∈R，求两类训练样本间的最大间隔等价于求：

\min \frac{1}{2} {| | w | |}^{2} + C Σ_{μ = 1}^{l} (ξ_{μ} + ξ_{μ}^{*})

s . t \{\begin{matrix} y_{μ} - (w, x_{μ}) - b \leq ϵ + ξ_{μ} \\ (w, x_{μ}) + b - y_{μ} \leq ϵ + ξ_{μ}^{*} \\ ξ_{μ}, ξ_{μ}^{*} &GreaterEqual; 0 \end{matrix}

其中，w和b分别为线性拟合函数的法向量和偏移系数；C为惩罚因子；ζ_μ，ζ_μ ^*为引进的松弛变量；变量x_μ和y_μ均为实数；

转化为求二次规划问题，建立拉格朗日方程：

l (w, ξ_{μ}, ξ_{μ}^{*}) = \frac{1}{2} {| | w | |}^{2} + C Σ_{μ = 1}^{l} (ξ_{μ} + ξ_{μ}^{*}) - Σ_{μ = 1}^{l} α_{μ} [ϵ + ξ_{μ} - y_{μ} + (w, x_{μ}) + b] -

Σ_{μ = 1}^{l} α_{μ}^{*} [ϵ + ξ_{μ} + y_{μ} - (w, x_{μ}) - b] - Σ_{μ = 1}^{l} (η_{μ} ξ_{μ} + η_{μ}^{*} ξ_{μ}^{*})

其中η_μ，η_μ ^*为ζ_μ，ζ_μ ^*的系数；

又通过对偶原理等价于求：

\max \frac{1}{2} Σ_{μ, v = 1}^{l} (α_{μ} - α_{μ}^{*}) (α_{v} - α_{v}^{*}) (x_{μ}, x_{v}) + Σ_{μ = 1}^{l} α_{μ} (ϵ - y_{μ}) + Σ_{μ = 1}^{l} α_{μ} (ϵ + y_{μ})

s, t \{\begin{matrix} Σ_{μ = 1}^{l} (α_{μ} - α_{μ}^{*}) = 0 \\ α_{μ}, α_{μ}^{*} &Element; [0, C] \end{matrix}

通过这个二次规划求得a_μ，a_μ ^*，偏移系数b为：

b = y - Σ_{μ = 1}^{l} (a_{μ}^{*} - a_{μ}) (x_{μ} \cdot x)

得到回归函数：

y = Σ_{μ = 1}^{l} (a_{μ}^{*} - a_{μ}) (x_{μ} \cdot x) + b

对于非线性回归问题，回归函数表示为：

y = Σ_{μ = 1}^{l} (a_{μ}^{*} - a_{μ}) K (x {, x}_{μ}) + b

其中，b是一个常数而且对于一般带有纯数值项的容许的核函数，该项能够省略；系数a_μ，a_μ ^*是拉格朗日系数，非零的a_μ，a_μ ^*对应的输入量x_μ称为支持向量，支持向量位于分类边界或分类面上；二元函数K(x，y)为核函数；

首先，确定SVM的核函数K(x，y)，本发明中支持向量机SVM的核函数选用径向基核函数K(x，y)＝exp(-γ||x-y||²)，其中γ为径向基核函数的宽度参数，x，y∈R^d，R^d表示d维实数向量；

再对SVM参数进行选择，采用网格法选择最优的核函数的参数γ和惩罚因子C；其中，网格法是指对于几个在一定范围内的数，在各自区间内按一定间隔分别取值，最后形成网状最优解；

然后，利用训练集对SVM进行训练，初步确定SVM的a_μ，a_μ ^*和b；a_μ，a_μ ^*通过二次规划求出，b通过

b = y - Σ_{μ = 1}^{l} (a_{μ}^{*} - a_{μ}) (x_{μ} \cdot x)

求出；

最后，利用测试集对SVM的相关参数进行调整优化，确定SVM回归函数，其中相关参数包括拉格朗日系数a_μ，拉格朗日系数a_μ ^*和偏移系数b；

步骤四，模型的应用；

利用层次分析法由动态参数层D的指标集合求出要素组{D₁，D₂，D₃，D₄}，然后将动态参数层D的要素组归一化后的结果{D′₁，D′₂，D′₃，D′₄}代入四个回归函数

y_{χ} = Σ_{μ = 1}^{l} (a_{μχ}^{*} - a_{μχ}) \exp (- γ_{χ} {| | x_{χ} - x_{μχ} | |}^{2}) + b_{χ},

χ＝1，2，3，4求出静态目标层S的要素组{S₁，S₂，S₃，S₄}，进而对该样本自主创新能力进行预测评价；

其中，对于一定的变量χ，b_χ是一个常数而且对于一般带有纯数值项的容许的核函数，该项能够省略；系数a_μχ，a_μχ ^*是拉格朗日系数，非零的a_μχ，a_μχ ^*对应的输入量x_μχ称为支持向量，支持向量位于分类边界或分类面上；γ_χ为径向基核函数的宽度参数；以上变量b_χ，a_μχ，a_μχ ^*，γ_χ默认为任意实数。

2、根据权利要求1所述的一种基于支持向量机的企业自主创新能力预测方法，其特征在于，步骤三所述的SVM：根据SVM在回归算法上的应用建立变量间的函数关系，利用四个回归函数确定动态参数层D和静态参数层S的四个参数的关系：SVM回归函数即

y = Σ_{μ = 1}^{l} (a_{μ}^{*} - a_{μ}) K (x, x_{μ}) + b,

其中，b是一个常数而且对于一般带有纯数值项的容许的核函数，该项能够省略；系数a_μ，a_μ ^*是拉格朗日系数，非零的a_μ，a_μ ^*对应的输入量x_i称为支持向量，支持向量位于分类边界或分类面上；其中K(x，y)＝exp(-γ||x-y||²)确定动态参数层D和静态参数层S之间的关系；b_χ，a_μχ，a_μχ ^*，γ_χ默认为任意实数。