CN107423759B

CN107423759B - 低维逐次投影寻踪聚类模型综合评价方法、装置及应用

Info

Publication number: CN107423759B
Application number: CN201710584477.2A
Authority: CN
Inventors: 于晓虹; 楼文高; 冯国珍; 司文; 汤俊
Original assignee: SHANGHAI BUSINESS SCHOOL
Current assignee: SHANGHAI BUSINESS SCHOOL
Priority date: 2017-07-18
Filing date: 2017-07-18
Publication date: 2021-04-20
Anticipated expiration: 2037-07-18
Also published as: CN107423759A

Abstract

本发明公开了一种低维逐次投影寻踪聚类(LDSPPC)模型综合评价方法、装置及应用，该方法包括以下步骤：对多个候选对象的样本数据进行规格化预处理，对候选对象构建2～4个投影向量相互正交的一维投影寻踪聚类模型；将多个候选对象的所有维度的投影寻踪聚类模型矢量合成为一个综合投影寻踪聚类模型，获得评价指标重要性排序列表和候选对象质量排序列表。本发明群搜索智能算法具有收敛速度快、收敛到全局最优解可靠性高等特点，矢量合成多个逐次投影寻踪向量，能够快速评价候选对象的优劣，且提高了候选对象质量评价的准确度。

Description

低维逐次投影寻踪聚类模型综合评价方法、装置及应用

技术领域

本发明涉及计算机应用技术领域，特别是涉及一种基于低维逐次投影寻踪聚类模型(LDSPPC)的综合评价方法、装置及应用。

背景技术

供应商选择与评价涉及处理多指标(高维)属性的非线性、非正态分布的数据处理，常规建模方法的效果较差。Friedman等1974年提出的一维投影寻踪分类(ProjectionPursuit Clustering，简称PPC)模型，在众多领域得到了广泛应用，取得了一定效果。但对于多属性少样本的供应商选择与评价问题，往往因为挖掘出的样本数据信息不充分，出现多个供应商得分相同的结果，难以选择合适的供应商。

在LDSPPC建模过程中，首先需要消除不同评价指标之间由于量纲不同而带来的不利影响，即必须对样本数据进行归一化处理。对主观(专家)确定的数据，为了消除专家偏好的影响，常采用极差归一化方法，对客观测定(确定)的数据，采用极大值归一化方法有助于保留数据的更多原始信息；对最大值和最小值未知或不作限制的数据，宜采用去均值归一化方法。

在LDSPPC模型中，选取合理的局部密度窗宽半径R值是核心和关键问题之一。楼文高等于2015年从理论和实践两个角度进行分析后，提出了合理R值取中间适度值方案，即r_max/5≤R≤r_max/3。

目前，史晓霞等(2008)建立了2维投影寻踪聚类模型，但建模结果显然是错误的，因为其第二维的目标函数值大于第一维的目标函数值，这是不可能的。龚衍等(2007)采用相对信息熵最大作为目标函数建立了9维投影寻踪聚类模型，但没有实际案例数据，无法验证其结果的可靠性。这些论文都没有讨论如何实现多个投影寻踪向量的合成问题，不利于充分挖掘样本数据信息进行分类和排序研究。

国内没有发现任何一款软件能够提供LDSPPC建模，唐启义(2013)研制的商品化DPS软件有关PPC建模的程序无法得到可靠的结果。由于LDSPPC模型是一个同时含有等式和不等式约束的高维非线性最优化问题，求解非常困难。

因此，计算机应用技术和管理科学与工程领域急需一款能够实现对多指标属性、非线性、非正态分布数据进行低维逐次投影寻踪聚类建模的综合评价计算机软件。

发明内容

本发明的目的是克服现有技术的不足，设计出一种低维逐次投影寻踪聚类模型综合评价方法、装置及应用。

为达到上述目的，本发明所采用的技术方案是：

一种低维逐次投影寻踪聚类模型综合评价方法,具体包括以下步骤：

步骤1：对多个候选对象的多个评价指标数据进行规格化预处理操作；

步骤2：根据所有候选对象预处理后的样本数据建立第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型，其中2≤k≤4，k为低维逐次投影寻踪聚类模型的空间维度；

根据建立的第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型分别计算每个候选对象的样本投影值；

步骤3：将第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型聚合生成为一个综合投影寻踪聚类模型，获得该综合投影寻踪聚类模型的最佳综合投影向量及其系数；

步骤4：根据最佳综合投影向量的系数大小确定评价指标重要性排序列表，根据所有候选对象的样本综合投影值的大小确定候选对象质量排序列表。

所述步骤1中对多个候选对象的样本数据进行规格化预处理操作的具体步骤为：

步骤1.1：读取多个候选对象的样本数据；

步骤1.2：判断样本数据类型，若样本数据为主观样本数据，则对数据进行极差归一化预处理；若样本数据为客观样本数据，则对数据进行极大值归一化预处理；若样本数据为最大值和最小值均未知的样本数据，则对数据进行去均值归一化预处理。

所述步骤2中建立第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型的具体步骤为：

步骤2.1：根据PPC建模理论分别构建第1维度逐次投影寻踪聚类模型和第2维度逐次投影寻踪聚类模型的目标函数，采用群搜索智能优化算法计算得到第1维度目标函数值和第2维度目标函数值；

步骤2.2：根据群搜索智能算法计算第1维度逐次投影寻踪聚类模型的第1维度最优投影向量及其系数和第1维度样本投影值；根据群搜索智能算法计算第2维度逐次投影寻踪聚类模型的第2维度最优投影向量及其系数和第2维度样本投影值；

步骤2.3：判断第2维度目标函数值是否小于第1维度目标函数值的0.40倍，若小于，则执行步骤3；否则，执行步骤2.4；

步骤2.4：构建第k维度逐次投影寻踪聚类模型的目标函数，并采用群搜索智能优化算法计算得到第k维度目标函数值、第k维度最优投影向量及其系数和第k维度样本投影值；

步骤2.5：判断第k维度目标函数值是否小于第1维度目标函数值的0.40倍，若小于，则执行步骤3；否则，重复执行步骤2.4、2.5。

所述步骤2中计算每个候选对象的样本综合投影值的具体步骤为：首先，根据构建的第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型分别计算出每个候选对象的第1维度样本投影值、第2维度样本投影值...第k维度样本投影值；然后，为每个候选对象的第1维度样本投影值、第2维度样本投影值...第k维度样本投影值分配权重值，将其所有维度的样本投影值按各自被分配的权重比例进行矢量合成，生成每个候选对象的样本综合投影值。

所述第k维度最优投影向量为

其中p为评价指标个数，a_k(p)为第k维度的第p个评价指标的投影向量系数；

所述第k维度样本投影值的计算公式为y_k(i)＝∑a_k(j)*x(i,j)，其中i为候选对象的序号，j为评价指标的序号，y_k(i)为第k维度的第i个候选对象的样本投影值，a_k(j)为第k维度的第j个评价指标的投影向量系数，x(i,j)为规格化后第i个样本、第j个评价指标的样本数据值；

所述第k维度目标函数值的计算公式为：

且a_k(j)满足条件：

1≥a_k(j)≥-1,(k＝1,2)或

1≥a_k(j)≥-1,(k＝1,2,3)或

1≥a_k(j)≥-1,(k＝1,2,3,4)，其中

为第k维度目标函数值，S_y,k为表示样本投影点整体上分散程度的第k维度样本投影值的标准差，D_y,k为表示样本投影点类内局部密集程度的第k维度类内样本的局部密度值，

为y_k(i)的均值，n为候选对象个数，(r_i,m)_k为第k维度逐次投影寻踪聚类模型第i个候选对象与第m个候选对象之间的距离，(r_i,m)_k＝|y_k(i)-y_k(m)|，(r_max)_k为(r_i,m)_k的最大值，u(t)为单位阶跃函数，t大于等于0时为1，否则为0；R_k为第k维度逐次投影寻踪聚类模型的窗宽半径，且(r_max)_k/5≤R_k≤(r_max)_k/3。

所述步骤3中将第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型聚合生成为一个综合投影寻踪聚类模型的具体步骤为：

步骤3.1：分别为第1维度最优投影向量、第2维度最优投影向量...第k维度最优投影向量分配权重值；

步骤3.2：将所有维度的最优投影向量按其各自被分配的权重比例进行矢量合成，生成最佳综合投影向量及其系数。

所述为第1维度样本投影值、第2维度样本投影值...第k维度样本投影值分配权重值，或为第1维度最优投影向量、第2维度最优投影向量...第k维度最优投影向量分配权重值的计算公式为：

(k＝1,2)；或

(k＝1,2,3)；或

(k＝1,2,3,4)，其中

为第k维度逐次投影寻踪聚类模型的目标函数值。

所述最佳综合投影向量满足关系：

或

或

所述每个候选对象的样本综合投影值的计算公式为：

或

或

一种低维逐次投影寻踪聚类模型综合评价装置,包括样本数据采集模块，用于读取多个候选对象的样本数据；

样本数据预处理模块，用于对多个候选对象的样本数据进行规格化预处理；PPC建模模块，用于对所有候选对象建立第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型；

矢量合成模块，用于将第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型聚合生成为一个综合投影寻踪聚类模型，并生成候选对象质量排序列表和评价指标重要性排序列表。

本发明的积极有益效果：

1、本发明提出的选取R值合理范围的方案，既修正了某些文献提出的大于r_max的错误方案，又避免了R取较小值方案可能导致最优化过程无法收敛而不能求得真正最优解的问题，更加合理；在此范围内，根据不同R值得到的最优投影向量揭示了从不同投影方向观察样本数据的结构特征，反映了PPC建模的本质。

2、本发明提出对逐次最佳投影寻踪向量应用矢量合成法构建最佳综合投影寻踪向量的算法原理，进一步提出以各维度逐次投影寻踪聚类模型的目标函数值大小作为分配权重比例的原则，既遵循了各维度投影寻踪向量重要性逐次递减的原则，又确保构建的综合投影寻踪向量是空间中的一个矢量，保持了投影寻踪的特性——“实现样本数据在某个感兴趣方向上的投影”。

附图说明

图1为本发明低维逐次投影寻踪聚类模型综合评价方法的流程图；

图2为本发明低维逐次投影寻踪聚类模型综合评价装置的结构原理框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面通过附图中示出的具体实施例来描述本发明。但是应该理解，这些描述只是示例性的，而并非要限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

如图2所示，本发明的低维逐次投影寻踪聚类模型综合评价装置,包括样本数据采集模块，用于读取多个候选对象的样本数据；

样本数据处理模块，用于对多个候选对象的样本数据进行规格化预处理；

PPC建模模块，用于对所有候选对象建立第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型，第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型的投影向量相互正交。针对每个维度的逐次投影寻踪聚类模型，通过设定合理的R值和群搜索群智能最优化算法求得其全局最优解，并根据是否求得真正全局最优解的准则判断最优化过程求得的全局最优解是否正确，从而求得2-4个相互正交的最优投影向量及其系数和样本投影值；

矢量合成模块，用于将第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型聚合生成为一个综合投影寻踪聚类模型，获得该综合投影寻踪聚类模型的最佳综合投影向量，根据该最佳综合投影向量的系数大小生成评价指标重要性排序列表；根据建立的第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型分别计算出每个候选对象的第1维度样本投影值、第2维度样本投影值...第k维度样本投影值，然后分别对每个候选对象的这k个样本投影值分配权重比例，将每个候选对象的所有维度的样本投影值按其各自的分配权重比例进行矢量合成，生成每个候选对象的样本综合投影值，根据所有候选对象的样本综合投影值的大小确定候选对象质量排序列表。

结合图1说明本实施方式，本发明的低维逐次投影寻踪聚类模型综合评价方法，具体包括以下步骤：

步骤1：对多个候选对象的样本数据进行规格化预处理操作；

具体地，首先，通过样本数据预处理模块读取多个候选对象的样本数据，由于每个候选对象的样本数据包含多个指标，且各指标之间的单位、评价标准、数值大小的变化范围等均存在较大的差异，因此，为了尽可能保留原始样本数据中评价指标之间的相对变化信息和规律，必须对样本数据进行预处理。样本数据预处理模块提供了三种不同的归一化方法对样本数据进行预处理，求出正向指标和逆向指标的规格化值。在对样本数据进行预处理之前，需要判断样本数据的类型，根据样本数据的类型，选择合适的数据预处理方法。若样本数据为主观的样本数据，则对数据进行极差归一化预处理；若样本数据为客观的样本数据，则对数据进行极大值归一化预处理；若样本数据为最大值和最小值未知或者最大值和最小值不加以限制的样本数据，则对数据进行去均值归一化预处理。三种归一化方法具体如下：

a、采用极差归一法，求出正向指标和逆向指标的规格化值：

正向指标的公式为

逆向指标的公式为

b、采用极大值归一法，求出正向指标和逆向指标的规格化值：

正向指标的公式为

逆向指标的公式为

c、采用去均值归一法，求出正向指标和逆向指标的规格化值：

正向指标的公式为

逆向指标的公式为

上述三种归一化方法的公式中，x_i,j和

分别为第i个样本、第j个指标的规格化值和原始值，

和

分别为第j个指标原始值的最大值和最小值；

和

分别为第j个指标原始值的均值和标准差。

步骤2：根据所有候选对象预处理后的样本数据建立第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型，其中2≤k≤4，k为逐次投影寻踪聚类模型的空间维度；根据建立的第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型分别计算每个候选对象的样本投影值；

具体地，包括以下步骤：

首先，根据PPC建模理论分别构建第1维度逐次投影寻踪聚类模型和第2维度逐次投影寻踪聚类模型的目标函数，采用群搜索智能最优化算法计算得到第1维度目标函数值和第2维度目标函数值；

下面具体说明获得第k维度目标函数值的具体过程：假设第k维度逐次投影寻踪聚类模型的最佳投影向量为

(p为变量个数，即评价指标个数)，则第k维度样本投影值(评价值)为y_k(i)＝∑a_k(j)*x(i,j)；

根据PPC建模要求所有样本投影点整体上尽可能分散和局部尽可能密集的基本建模思想，得出第k维度PPC模型的目标函数

为样本投影点的标准差与局部密度的乘积，通过求解目标函数

的最大值，进一步得到第k维度最优投影向量

及其系数a_k(j)，

所述第k维度目标函数值的计算公式为：

且a_k(j)满足条件：

1≥a_k(j)≥-1,(k＝1,2)或

1≥a_k(j)≥-1,(k＝1,2,3)或

1≥a_k(j)≥-1,(k＝1,2,3,4)，其中

为y_k(i)的均值，n为候选对象个数，(r_i,m)_k为第k维度逐次投影寻踪聚类模型第i个候选对象与第m个候选对象之间的距离，(r_i,m)_k＝|y_k(i)-y_k(m)|，(r_max)_k为(r_i,m)_k的最大值，u(t)为单位阶跃函数，t大于等于0时为1，否则为0；R_k为第k维度逐次投影寻踪聚类模型的窗宽半径，且(r_max)_k/5≤R_k≤(r_max)_k/3，a₁(j)为第1维度的第j个评价指标的投影向量系数，a₂(j)为第2维度的第j个评价指标的投影向量系数，a₃(j)为第3维度的第j个评价指标的投影向量系数，a₄(j)为第4维度的第j个评价指标的投影向量系数。

根据上述求取第k维度目标函数值的计算公式，可以得到第1维度逐次投影寻踪聚类模型的目标函数为：

1≥a₁(j)≥-1

其中

表示样本投影点整体上分散程度的样本投影值的标准差，其值越大表示样本点整体上越分散；

表示类内样本投影点密集程度的局部密度值，其值越大表示类内样本点越密集；

为y₁(i)的均值，R₁为局部密度窗宽半径，(r_i,m)₁＝|y₁(i)-y₁(m)|表示样本i和m之间的距离，(r_max)₁为(r_i,m)₁的最大值，u(t)为单位阶跃函数，当t≥0时为1，否则为0。窗宽半径R₁合理取值范围为(r_max)₁/5≤R₁≤(r_max)₁/3。

第2维度逐次投影寻踪聚类模型的目标函数为：

1≥a₁(j)≥-1,1≥a₂(j)≥-1

其中S_y,2和D_y,2分别为样本数据在第2维度最佳投影方向上投影值的标准差和局部密度值。

其次，根据群搜索智能算法计算得到第1维度逐次投影寻踪聚类模型的第1维度最优投影向量及其系数和第1维度样本投影值；根据群搜索智能算法计算得到第2维度逐次投影寻踪聚类模型的第2维度最优投影向量及其系数和第2维度样本投影值；

具体地，群搜索智能算法(GSO)原理及其迭代步骤如下：

在一个p维搜索空间中，群由发现者、追随者和游荡者组成，群中第i个成员在第k次迭代时的位置为

经验为

在迭代开始之前，每个成员的位置和经验值均初始化为零。

在第k次迭代时，计算群中每个成员的适应度，找出位置最好的成员作为发现者，记为

发现者在本轮迭代中保持此位置不变。如果

则随机选择10％的群成员按式(1)进行经验积累，再以式(2)调整位置，否则没有成员进行积累和调整位置。

其中，r₁和r₂为在[0，1]均匀分布的p维随机数，c₁和c₂为常量系数。

在其余成员中，以80％的概率随机选择追随者，并以一个随机步长靠近发现者：

其中r₃的性质同r₁和r₂。

余下的成员作为游荡者，向任意方向随机移动一段距离：

其中r₄、step和mutation均为p维向量。r₄为标准正态分布随机向量，step为步长向量，mutation为0、1的布尔值向量，表示是否允许各维变异，用(5)式求得：

mutation＝r₅＜mutationprobability (5)

其中，r₅为在[0，1]范围内均匀分布的p维随机向量。

为分量变异概率，其值随迭代次数递减，当r₅的某个分量小于mutationprobability时mutation取0，否则取1。

然后，判断第2维度目标函数值是否小于第1维度目标函数值的0.40倍，若小于，则执行步骤3；否则，构建第3维度逐次投影寻踪聚类模型，获得其目标函数值，并计算其最优投影向量及其系数和样本投影值，判断第3维度的逐次投影寻踪聚类模型的目标函数值是否小于第1维度目标函数值的0.40倍，若小于，则执行步骤3，否则，继续建立第4维度逐次投影寻踪聚类模型；

最后，判断最高维度的逐次投影寻踪聚类模型的目标函数值是否小于第1维度目标函数值的0.40倍，若小于，则停止建立更高维度的逐次投影寻踪聚类模型，开始执行步骤3。

根据构建的第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型，分别计算得到每个候选对象的第1维度样本投影值、第2维度样本投影值...第k维度样本投影值；然后，为每个候选对象的第1维度样本投影值、第2维度样本投影值...第k维度样本投影值分配权重值，将所有维度的样本投影值按分配的权重比例进行矢量合成，生成样本综合投影值。

具体地，首先，将每一维度的目标函数值大小作为分配权重大小的比例依据，为每个维度的最优投影向量分配权重值；所述最优投影向量分配的权重值ω_k的计算公式为：

(k＝1,2)；或

(k＝1,2,3)；或

(k＝1,2,3,4)，其中

为第k维度逐次投影寻踪聚类模型的目标函数值。

然后，将所有维度的最优投影向量按其各自被分配的权重比例进行矢量合成，生成最佳综合投影向量，最佳综合投影向量是一个比上述任何单一维度投影寻踪向量包含更多样本数据有效特征信息的空间向量，最佳综合投影向量

满足

或

或

样本综合投影值y_z(i)的计算公式为

或

或

步骤4：根据最佳综合投影向量的系数大小生成评价指标重要性排序列表，根据所有候选对象的样本综合投影值的大小生成候选对象质量排序列表。

本发明低维逐次投影寻踪聚类模型综合评价方法可应用于供应商的选择与评价，当用于供应商的选择与评价时，所述候选对象为供应商。实际上，与供应商选择与评价相类似的问题，都可以应用本发明的方法进行评价，如对已经开展的研究项目(如R&D)是否应该中止的决策问题，项目招投标问题，供应链金融风险评价问题，项目评审专家的遴选问题，学术期刊质量评价问题，企业竞争力评价问题，绩效管理评价问题，葡萄酒质量评价问题等等。

在本实施例中，我们通过供应商的选择与评价来具体说明本发明的评价方法的应用过程。用于供应商选择时，该方法中的候选对象为供应商。

以图书供应商为例来说明该方法的具体应用：

在本实施例中，我们选取了6个图书供应商，抽取了图书供应商的六个评价指标，分别为产品价格(元)、售后服务(小时)、地理位置(公里)、产品合格率(％)、新产品开发率(％)和供应能力(件)，原始数据分别用x⁰(:,j)(j＝1,2,......,6)表示。

表1为图书供应商评价指标值及其LDSPPC的逐次评价结果和综合评价结果

供应商i	x<sup>0</sup>(:,1)	x<sup>0</sup>(:,2)	x<sup>0</sup>(:,3)	x<sup>0</sup>(:,4)	x<sup>0</sup>(:,5)	x<sup>0</sup>(:,6)	y<sub>1</sub>(i)	y<sub>2</sub>(i)	y<sub>3</sub>(i)	y<sub>z</sub>(i)
											1	335	3.2	15	0.8	0.12	230	0.2261	0.3800	0.8215	0.5916
2	268	1.4	37	0.92	0.25	130	0.7711	0.1559	0.6077	0.8733
											3	304	1.9	22	0.99	0.09	220	0.3954	0.1559	0.8562	0.6282
4	270	2	16	0.98	0.35	180	0.7124	0.5468	0.8215	1.0764
											5	310	0.8	26	0.86	0.2	150	0.7124	0.1559	0.8215	0.8807
6	303	2.7	10	0.95	0.19	170	0.3954	0.4869	0.8232	0.7853

上述6个供应商的六个评价指标数据，前三个指标为越小越好的逆向指标，后三个指标为越大越好的正向指标。

根据步骤1，分别读取这6个供应商的样本数据，因为都是客观指标，因此选择极大值归一化方法进行数据规格化预处理。

根据步骤2，建立低维逐次投影寻踪聚类模型。首先得到第1维度逐次投影寻踪聚类模型，其第1维度最佳投影向量及其系数为

第1维度目标函数值

根据第1维度逐次投影寻踪聚类模型分别求得这6个供应商的第1维度样本投影值，这6个供应商的第1维度样本投影值y₁(i)如表1所示。同理得到第2维度、第3维度最佳投影向量及其系数

第2维度、第3维度目标函数值分别为

和

根据第2维度、第3维度逐次投影寻踪聚类模型分别求得这6个供应商的第2维度、第3维度样本投影值，这6个供应商的第2维度、第3维度样本投影值y₂(i)和y₃(i)分别如表1所示。

因为第3维度逐次PPC模型目标函数值

已经小于第1维度目标函数值(0.2905)的0.40倍，说明已不需要建立更高维度的逐次PPC模型了。

从

大于

的0.40倍可知，第1维度逐次投影寻踪聚类模型从样本数据中挖掘出的信息不够充分，必须采用低维逐次投影寻踪聚类模型。

从表1所示的第1维度、第2维度、第3维度逐次投影寻踪聚类模型的样本投影值y₁(i)、y₂(i)和y₃(i)可知，每一维度都有几个样本的投影值是相等的，也就是说，单一维度的PPC模型可以实现样本的分类，但对投影值相等的样本无法实现排序。因此，单一维度的投影寻踪聚类模型实际上是无法直接用于对多指标(属性)少样本供应商的评价与选择的。

根据步骤3，将上述三个维度的最佳投影寻踪向量

用矢量合成法构建最佳综合投影寻踪向量。根据最优投影向量分配权重值的计算公式

可得到第1维度、第2维度和第3维度投影寻踪向量的分配权重ω₁＝0.8252，ω₂＝0.5007，ω₃＝0.2614，进而得到最佳综合投影向量及其系数

6个供应商(样本)的样本综合投影值y_z(i)如表1所示。

将第1个供应商的第1维度样本投影值y₁(1)、第2维度样本投影值y₂(1)、第3维度样本投影值y₃(1)矢量合成为样本综合投影值y_z(1)，第1个供应商的样本综合投影值y_z(1)如表1所示；同理也可获得第2个到第6个供应商的样本综合投影值y_z(2)～y_z(6)，如表1所示。

根据步骤4，根据最佳综合投影向量的系数大小确定评价指标重要性排序列表，根据所有候选对象的样本综合投影值的大小确定候选对象质量排序列表。对于本实施例，根据最佳综合投影向量的系数大小顺序进行排序的结果是：在六个研究的评价指标中，指标5最重要，其次是指标2，然后按重要性降序排序的次序是指标3，指标1，指标4和指标6。如果要对指标重要性进行分类，指标5为极重要类指标，指标2为重要类指标，指标3为中等重要类指标，其他三个指标1,4和6为次重要类指标。

按照所有候选对象的样本综合投影值的大小顺序进行排序，本实施例6个供应商的优劣排序为供应商4,供应商5，供应商2，供应商6，供应商3和供应商1，其中供应商5和2基本相当，差异很小，供应商4明显优于其他供应商。

本发明对供应商选择与评价案例进行了实证研究。李华等(2016)采用信息熵权重(各个指标的权重为0.1566,0.1686,0.1336,0.1447,0.2099和0.1866)与各种TOPSIS的结合方法对6个供应商的优劣排序评价结果(6个供应商分别用G1、G2、G3、G4、G5和G6表示)如表2所示。

表2各种评价方法得到的供应商优劣排序结果

评价方法	G1	G2	G3	G4	G5	G6
							topSIS	2	3	6	5	1	4
马氏距离改进topSIS	6	2	4	1	5	3
							联系向量距离改进topSIS	6	5	4	1	2	3
马氏距离和联系向量距离改进topSIS	5	1	3	2	6	4
							本发明提出的低维逐次投影寻踪聚类模型	6	3	5	1	2	4

从表2可知，本发明的结果，排名前3位的供应商都曾是其他某种评价方法的第一名，而且排名第一位的供应商有两种方法的排名为第一名；排名第2位和第3位的供应商很接近，各有其他一种方法的排名为第一名；本发明排名第4位的供应商，其他方法的评价结果也都排名第3或者第4位；本发明排名第5和6位的供应商，在其他评价方法中也排名比较靠后。

从以上分析可知，本发明提出的基于低维逐次投影寻踪聚类模型的供应商优劣排名结果更合理。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制；尽管参照较佳实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解；依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换；而不脱离本发明技术方案的精神，其均应涵盖在本发明请求保护的技术方案范围当中。

Claims

1.一种低维逐次投影寻踪聚类模型综合评价方法,其特征在于，具体包括以下步骤：

步骤1.1：读取多个候选对象的样本数据；

步骤1.2：判断样本数据类型，若样本数据为主观样本数据，则对数据进行极差归一化预处理；若样本数据为客观样本数据，则对数据进行极大值归一化预处理；若样本数据为最大值和最小值均未知的样本数据，则对数据进行去均值归一化预处理；

步骤2：根据所有候选对象预处理后的所有样本数据建立第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型，其中2≤k≤4，k为低维逐次投影寻踪聚类模型的空间维度；

步骤3.2：将所有维度的最优投影向量按其各自的权重比例进行矢量合成，生成最佳综合投影向量及其系数；

步骤4：根据最佳综合投影向量的系数大小确定评价指标重要性排序列表，根据所有候选对象的样本综合投影值的大小确定候选对象质量排序列表；

所述候选对象为图书供应商；

或

或

其中

为第k维度逐次投影寻踪聚类模型的目标函数值；

所述最佳综合投影向量满足关系：

或

或

所述每个候选对象的样本综合投影值的计算公式为：

或

或

2.根据权利要求1所述的低维逐次投影寻踪聚类模型综合评价方法，其特征在于，所述步骤2中建立第1维度逐次投影寻踪聚类模型、第2维度逐次投影寻踪聚类模型...第k维度逐次投影寻踪聚类模型的具体步骤为：

步骤2.1：根据PPC建模理论分别构建第1维度逐次投影寻踪聚类模型和第2维度逐次投影寻踪聚类模型的目标函数，采用群搜索智能最优化算法计算得到第1维度目标函数值和第2维度目标函数值；

步骤2.2：根据群搜索智能算法计算得到的第1维度逐次投影寻踪聚类模型的第1维度最优投影向量及其系数和第1维度样本投影值；根据群搜索智能算法计算得到的第2维度逐次投影寻踪聚类模型的第2维度最优投影向量及其系数、第2维度样本投影值；

步骤2.4：构建第k维度逐次投影寻踪聚类模型的目标函数，并采用群搜索智能最优化算法计算得到第k维度目标函数值、第k维度最优投影向量及其系数和第k维度样本投影值；

3.根据权利要求1所述的低维逐次投影寻踪聚类模型综合评价方法，其特征在于，所述第k维度最优投影向量为

所述第k维度样本投影值的计算公式为y_k(i)＝∑a_k(j)*x(i,j)，其中i为候选对象序号，j为评价指标序号，y_k(i)为第k维度的第i个候选对象的样本投影值，a_k(j)为第k维度的第j个评价指标的投影向量系数，x(i,j)为规格化后第i个样本、第j个评价指标的样本数据值；

所述第k维度目标函数值的计算公式为：

且a_k(j)满足条件：

或

或

其中