CN112069450A

CN112069450A - 基于凸集间交互投影的多对象结构方程模型计算技术

Info

Publication number: CN112069450A
Application number: CN202011067786.0A
Authority: CN
Inventors: 童乔慧
Original assignee: Wuhan Zhuxin Technology Co ltd
Current assignee: Wuhan University WHU
Priority date: 2020-10-07
Filing date: 2020-10-07
Publication date: 2020-12-11

Abstract

本发明“基于凸集间交互投影的多对象结构方程模型计算技术”，技术领域属于电子与信息类的应用软件技术。本发明求解多对象结构方程模型，分为三个步骤。（1）将多对象结构方程模型原始数据纵向叠放，利用基于配方约束的模型确定性算法统一求解，得到每个结构变量对应的观测变量的汇总系数。(2)将叠放的数据块按结构变量纵向剖分，分别采用评估模型的凸集间的交互投影算法求解，得到每个对象每个结构变量的评估分。(3)将上一步计算得到的评估分矩阵作为新的观测矩阵，按结构方程模型求解，得到每个对象的顾客满意度最终评估分。

Description

基于凸集间交互投影的多对象结构方程模型计算技术

技术领域

本发明属于电子与信息类的应用软件技术，具体是一种基于凸集间交互投影的多对象结构方程模型计算技术。

背景技术

（一）一般的结构方程模型与顾客满意度

FORNELL教授最先将结构方程模型(SEM)引入到顾客满意度测评[1-2]。SEM包括两个方程组 ,一个是结构变量之间的关系方程组,称为结构方程组；一个是结构变量与观测变量之间的关系方程组，称为观测方程组。图1是一个典型的中国顾客满意指数模型。

我们在Excel表上把观测数据列出来，观测次数按行排列，而变量按列排列。自变量在左侧，因变量在右侧。观测数据阵

，

等等都是已知的，星号代表行数。系数是未知的，因变量也是未知的。图2只列出了模型中最左侧的3个变量。

结构方程组包含 6个结构变量(隐含变量)

、

与 11个关系 (自变量作用的关系为

，因变量之间的作用关系为

),

是残差变量，如式(1)所示。

(1)

在一般情形下，结构变量不一定是5个，结构方程系数形式也可以不同于式(1) ,自变量的个数也可以多于1个。如果采用向量与矩阵记法进行一般描述，设因变量有

个，将

排成列向量，记为

；自变量有

个，将

排成列向量,记为

。

的系数矩阵为

阶方阵，记为

；

的系数矩阵为

阶矩阵,记为

；残差向量为

，则结构方程组式(1)可以扩展为：

（2）

SEM的结构变量是隐含的 ,不能直接观测,且其对应若干个观测变量。设一共有

个观测变量,对每一个观测变量有

个观测 ,在顾客满意指数分析中就是有

个顾客的测评,这样我们手里的数据是一个

矩阵。

结构变量与观测变量之间的作用关系也可以用方程表示,按作用的因果路径有两种表示方式。

设与自变量

对应的

个观测变量为

,

；与因变量

对应的

个观测变量为

,

。于是从观测变量到结构变量的观测方程组可以表达为：

，

(3)

，

(4)

反之,从结构变量到观测变量的观测方程可以表达为：

，

(5)

,

(6)

其中,

，

为载荷项。上面两式采用矩阵记法可以表为：

(7)

(8)

上面的式子和图形结合起来称为结构方程模型，有时也称为路径分析模型。本课题组对它们开展了深入研究，提出了基于配方约束的确定性算法，可以取代传统的协方差拟合算法(Linear Structure RELationship，LISREL)与偏最小二乘算法（Partial LeastSquare, PLS）。同时本课题组还提出了多层结构方程模型，见图3（一个多层结构方程模型的变量与路径图），并且解决了它们的算法问题。

（二）配方回归模型

为了使得本专利技术通俗易懂，我们通过数据结构图逐步讲解。

先浅说什么是回归。班级考试加总分是容易理解的。一个班有

个（例如30个）学生，每个学生考了

门功课（例如4门），就有了一个数据阵，有

（30）行，

（4）列，每列向量分别记为

。现在要加总分，需要知道每门考试的满分，比如分别是150,120,100,150。这样直接把每个同学的考分相加，实际上每门功课的成绩占比或者说分量是不一样的。满分高的功课占比大一些，显得重要一些。如果我们事先把所有考分都化成了百分制，满分统统是100分，那么在汇总的时候，各门功课成绩就要乘以不同的系数，这个例子里就是要分别乘以1.5, 1.2, 1.0, 1.5。这个占比的分量或者说系数就是加权系数，记为

。汇总以后得到的总分是一个向量

，有

（30）个数据，并且：

这里

是未知待求的，而加权系数

是已知的。如果把向量

排在一起成为一个矩阵记为

，把系数

排成向量记为

，则上式可以简记为

。考试加总分的数据结构图见图4（考试加总分的数据结构图）。

普通回归就是在上述汇总过程中，假定因变量

是已知的，而加权系数

是未知待求的。回归的数据结构图看起来和图4的一样，不同的是因变量与回归系数已知与未知颠倒了，见图5（一元线性回归数据结构图）。

回归系数怎么求，肯定有误差，要使得误差平方和最小，于是采用了最小二乘法则。如图6所示（线性回归的最小二乘法则）。

误差平方和最小从欧式距离的角度理解就是投影，于是普通回归的几何意义就是求

维空间里的一个点（向量

）到一个子空间的投影，这个子空间是由

个列向量（

）张成的。理解这个几何意义对于我们下面寻找评估模型的算法非常重要，如图7(线性回归最小二乘法则的投影几何意义)。

所谓配方回归，就是在上面的回归模型中，还要求回归系数之和为1，并且每一个回归系数都不小于0。于是配方回归模型可写作

（9)

这里

是因变量（观测向量），

是自变量（设计阵），

是回归系数，

是误差向量。如果记

，则约束条件可记为

（10)

它是一般线性约束

的特殊形式。

配方回归的实际含义是各因素百分比的分摊。比如

是总的发行债券，

是各发行公司的发行能力，那么

是各发行公司承担的发行份额在总任务中所占百分比。在化学配方与药品配方中，

是待配的药品总量，

是各药品的重量，

是各药品在混料中所占的百分比。回归模型的任务是从历史数据中推断出一个比较合适而折衷的配方：

。

在配方回归模型中，不仅

是已知的，而且

也是已知的，这是与下面将要讨论的评估模型不一样的地方。配方模型是一个典型的二次规划问题，即在约束

(即

)，求二次型

（11)

的最小值。由于约束条件表示一个闭凸锥，二次型最小值总是存在的。当

列满秩时，解是唯一的。调用优化问题或规划问题中程序可以解算这个模型。

统计学家从回归原理也对此模型提出算法，主要是使用Lagrange乘子原理与原地扫除算法。简单地说，就是将约束条件分解为两部分，一个是线性约束

（12)

一个是符号约束

（13)

先解线性约束回归模型

（14)

若其解

，则它就是

的最终解。若

有某分量为负，则可以证明

的最终解必在约束边界上，即有某个或某些

。

，即在原模型中剔除了变量

，如此继续回归。

需要说明的是，建立模型时，样本组数

与自变量个数是随意的，回归系数

应该为0，

之和应为1。这是由本模型特点所决定的。

(三) 评估模型

我们先从实际工作提炼出模型。

质量评估工作是常见而又重要的。根据

个母体的

个指标的观测值，来给这

个母体打个分，排个队，现在是司空见惯的事情。如产品质量评估，作品质量评估，演出质量评估，地区部门工作质量评估，教师授课质量评估，等等。问题在于怎样打分比较合理，这需要建立数学模型。

我们还是回顾图5的数据结构图。评估模型里不仅回归系数要满足配方回归条件，而且因变量是未知的。如此而已，看样子并不复杂，但是因变量与回归系数都是未知的，那如何求得唯一解，原来这个模型里母体（班级个数）不止一个。为了适合表现现在的数据结构，我们改进图5为图8(评估模型数据结构图)。每个班级的评估分放在左边，一共有

个班级，就有

个数据块。

个指标是变量，分别以

表示。一张评估表是某一母体的一次观测，可取得数据

。对

个母体各取得

次观测，就得

阵。一张评估表是

阵的一行，一个母体的

次观测是

阵的一块。对每个变量的加权系数

待定，但需

（即

）；

(即

)。这是一种配方约束。对每个母体必须且只须给出一个分数，它也是事先未知而待定的，这就是所谓广义。因此评估模型是如下三个式子联合组成。

(15)

(16)

(17)

（15）（16）（17）三式合起来是一种广义配方模型(GP模型)，它是杨自强研究的因变量可变的广义最小二乘模型与方开泰等研究的配方模型的结合。所谓广义，就是因变量未知。这里

，

，

，

,

,即

。对

块

数据块按列分别求平均，得到压缩的数据阵

。

下面先考虑GP模型中仅满足(15)、(16)的解。令

（18)

（19)

则由

及

得

（20)

又由

，令

，不难验证

为投影阵。记p维矩阵

，当

可逆时，

解为

（21)

总结上述过程，有

定理1.若

，则在约束

下

min

有唯一解（20)、（21)。如果

各分量非负，则（20)、（21)也就是

模型的解。

当按（21）解出的

有分量为负时，要考虑模型

的解的存在性、唯一性，有如下定理。

定理2 若

，则

模型有唯一解。若（21)中

有分量为负，则

模型的解

一定有分量为0，并且

的零分量是

的分量之一。

证明（9)可以改写为

，集合

是闭凸集，故存在唯一点

满足（9)。由于

列满秩，故由

能唯一解出

。

再考虑集合

（22）

（23）

显然是两个闭凸集，

有界。由两个闭凸集间距离可达定理，存在

，

，这里

表示距离，且已证

唯一。于是问题转化为求一点到

的最短欧氏距离，即方开泰等研究的PR模型。现

，由该文中的定理1，本定理得证。

但是

的求法并没有解决，这些留待下面统一给出计算方法。

再考虑对

的约束，设

（24)

其中

均已知，也已去掉了多余约束。考虑模型

（25)

这里

，其余假定同前。

定理3. 若

，则

模型有唯一解，对于存在的

，

解的性质如定理2。对称地，对于存在的

，

解的性质也如定理2。

(四) 凸集间的交互投影算法

求一点

到闭凸集

之间的最短欧氏距离，若

, 则可以称

为

到

的投影。自然它有别于一点到子空间的投影。要求两个闭凸集

之间的最短欧氏距离，可以使用交互投影法。

任取

，求

，使

。对于

，求

，使

。对于

，求

，使

。对于

，求

，使

。当

时，停止迭代，完成计算。

上述迭代过程收敛的意思是：

（26）

定理4.设

两个闭凸集之一有界，则其交互投影的迭代过程收敛。

证明因为对

所以数列

单减有界，极限存在。

不妨设

有界，则点列

中存在子列

，

。对应

中子列

也是有界的，其中存在子列

，当然有

。

记

为过点

而与线段

垂直的平面，因为

为闭凸集，故

全在

一侧。当线段

时，

，

全在

一侧。

又对

数列

单减有界，极限存在，对上述

,对应

中子列

有界，其中存在子列

，当然还是

。由于

为闭凸集，

为定点，

，故有

。

现在是平面

全在

一侧。于是

分别在两平行平面

与

两侧，线段

是公垂线，同时

,故

,又

收敛，

。证毕

根据定理4，求两个闭凸集之间的距离可以化为累次求一点到闭凸集间的距离。于是求解广义配方模型可以化为累次求解配方模型，求解凸约束广义配方模型可以化为累次求解一般凸约束模型，实际计算表明，收敛过程非常快。见图9（凸集间的交互投影算法示意图）。

对于给定的初值

，

是超平面

上的一个点，需要求解

，模型是：

此时

有一个凸约束即配方约束，图9中是向下的投影。我们根据配方回归方法可以求解。一旦我们解得

的估计

,

就是凸集

上的一个点，我们需要求得对应的

的解，此时模型是：

这是图9中向上的投影，我们按照普通回归求得解

。如此反复迭代，参考文献证明了交互投影的收敛性。

只要理解了图6，知道回归就是求误差平方和最小；理解了图7，知道误差平方和最小就是投影，那么就可以理解图9，向

的投影是无约束的，向

的投影是有配方约束的，于是通过交互投影就可以求解模型。

主要参考文献目录

[ 1 ] Fornell C., Johnson M. D., Andrson E.W. , et al. The Americancustomer satisfaction index: nature, purpose, and findings[J ]. Journal ofMarketing, 1996, 60 (4) : 7 - 18.

[ 2 ] Claes F., A national customer satisfaction barometer: the Swedishexperience [ J ]. Journal of Marketing, 1992, 56 (1) : 6 - 21.

[ 3 ] 国家质检总局质量管理司, 清华大学中国企业研究中心. 中国顾客满意指数指南 [M ]. 北京 :中国标准出版社 , 2003: 21 - 58.

[ 4 ] Inon F. A., Llar Io R. Development of a PLS based method fordetermination of the quality of beers by use of N IR: spectral ranges andsample - introduction considerations[ J ]. Analytical and Bio analyticalChemistry, 2005, 382 (7) : 1549 - 1561.

[ 5 ] Tenenhausm Vinzive, Chatelin Y. M., et al. PLS path modeling [ J ].Computational Statistics and Data Analysis, 2005 (48) : 159 - 205.

[ 6 ] Wang C. M., Tong H. Q.. Best iterative initial values for PLS in aCSI model [J ]. Mathematical and Computer Modeling, 2007, 46 (3 - 4) : 439 -444.

[ 7 ] Tong H. Q.. Evaluation model and its iterative algorithm byalternating projection [ J ]. Mathematical and Computer Modeling, 1993, 18(8) : 55 - 60.

[ 8 ] 方开泰. 含有线性约束及非负回归系数的回归模型 [J ]. 计算数学 , 1985(7) : 97 - 102.

[ 9 ] 童恒庆, 熊丽, 彭慧. Self - organized path constraint neural networkstructure and algorithm [J ]. Neural In formation Proceeding, 2006, ( PartI): 457 - 466.

[ 10 ] 童恒庆. 理论计量经济学 [M ]. 北京 :科学出版社 , 2005: 12 - 86.

[ 11 ] 童恒庆. 数据分析与统计计算软件DASC [M /CD ]. 北京 :科学出版社，2005.

发明内容

A.发明基本步骤

以上叙述的单层或者多层结构方程模型都是针对一个对象建立的模型。一个国家或者一个行业有许多企业 (对象 )。如果每个企业都各自利用自己的样本建立模型,即使模型的两个方程结构都完全一样,但是由于样本数据不一样 ,得到的系数也不一样。这样的顾客满意度计算结果显然缺乏可比性。因此应该研究多对象的建模,既保留路径分析模型参数估计客观性的一面,又在各对象之间保持参数估计的统一性,使得计算结果具有更好的可比性。

假设有

个对象需要测评,每个对象都是同样的结构方程,同样的

个观测变量,都进行了

次观测。对于每一个对象都可得到了一个

观测数据块。将这些数据块纵向叠放形成一个

矩阵

。每一个对象都满足一个结构方程模型,如何将这些模型统一起来形成一个合理的模型群,本发明试图利用我们前期研究所提出的凸约束的广义线性回归模型,来统领这

个结构方程模型。具体算法分 3个步骤进行。

(1)将多对象结构方程模型原始数据纵向叠放，利用基于配方约束的结构方程模型确定性算法统一求解。

将

个对象看作是一个对象,对

个观测变量进行

次观测,得到

矩阵

。套用SEM模型和我们的确定性算法,得到结构方程模型中的系数

和

, 取

,

；

。于是

个结构自变量分别有了权系数

,

个结构因变量分别有了权系数

。此时的数据结构整体如图2，但是它的行数是

，有

个数据块纵向叠放。数据阵左侧部分如图10（多对象结构方程模型的数据排列图）。

这样求解得到每个结构变量对应的观测变量的汇总系数，为下一步使用评估模型提供系数约束条件。

(2) 将叠放的数据块按结构变量纵向剖分，分别采用评估模型求解，得到每个对象每个结构变量的评估分。

注意

,

是全体观测变量的个数，它分别从属于

个结构变量。矩阵

可以按列剖分成

个数据块,称之为列数据块，每个列数据块对应一个结构变量

或者

。对于每个列数据块，每个列数据块的数据结构图都类似于图8，可套用前面叙述过的评估模型，即凸约束的广义线性回归模型,约束是

以及

或者

,

或

是它的变量个数,评估对象都是

个,

或者

是它的评估分,都是

维列向量。这样就得到了每个结构变量下每个对象的评估分,形成了一个

的矩阵

。一共需要进行

个评估模型的计算，每个评估模型都会得到

个评估分。当然每个评估模型都需要进行一次独立完整的交互投影计算。

这样计算的结果相当于把原始数据压缩了，每个对象只剩下一行，这一行就是各个结构变量的评估分。

(3)将上一步计算得到的

矩阵

作为新的观测矩阵，按结构方程模型求解。

如同图2里的观测矩阵

，代回到原来的结构方程模型。由于现在每个结构变量只对应一个观测变量,结构方程模型中的系数

，

或者

，

计算都是简单的。主要的计算任务是在结构方程式(2)中计算路径系数

和

。完成了结构方程的计算,顾客满意度所在的变量

的估计值

就计算出来了。

是

维向量,它的第

个分量就是第

个对象的顾客满意度的评估数值,

。

这样计算的结果就得到每个对象的顾客满意度最终评估分。

B: 发明的关键技术。

（1）基于配方约束的结构方程模型确定性算法。

（2）基于凸集间交互投影的评估模型算法。

（3）基于配方约束和凸集间交互投影的多对象结构方程模型计算技术。

附图说明：

图1是一个中国顾客满意指数模型的变量与路径结构图。

图2是一个中国顾客满意指数模型的数据排列图。

图3是一个多层结构方程模型的变量与路径图。

图4是考试加总分的数据结构图。

图5是一元线性回归数据结构图。

图6是线性回归的最小二乘法则。

图7是线性回归最小二乘法则的投影几何意义。

图8是评估模型数据结构图。

图9是凸集间的交互投影算法示意图。

图10是多对象结构方程模型的数据排列图。

Claims

1.本发明专利“基于凸集间交互投影的多对象结构方程模型计算技术”分三个步骤求解多对象结构方程模型。第一步，将多对象结构方程模型原始数据纵向叠放，利用基于配方约束的模型确定性算法统一求解，得到每个结构变量对应的观测变量的汇总系数。第二步，将叠放的数据块按结构变量纵向剖分，分别采用评估模型的凸集间的交互投影算法求解，得到每个对象每个结构变量的评估分。第三步，将上一步计算得到的评估分矩阵作为新的观测矩阵，按结构方程模型求解，得到每个对象的顾客满意度最终评估分。