CN115062702B

CN115062702B - 基于pca-e的产品感性语义词汇提取方法

Info

Publication number: CN115062702B
Application number: CN202210684413.0A
Authority: CN
Inventors: 于淼; 蒋薇; 赵武; 姜冲; 张凯; 郭鑫
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2022-06-16
Filing date: 2022-06-16
Publication date: 2023-09-08
Anticipated expiration: 2042-06-16
Also published as: WO2023240858A1; CN115062702A

Abstract

本发明公开了一种基于PCA‑E的产品感性语义词汇提取方法，首先利用原始感性词汇构建产品感性评价向量矩阵，再通过主成分分析进行降维，并基于主成分载荷系数确定表征各主成分的感性词汇，这样提取的感性词汇能够具有更好的解释性，帮助用户更好地理解筛选出的感性词汇，准确作出评价。

Description

基于PCA-E的产品感性语义词汇提取方法

技术领域

本发明属于产品设计技术领域，涉及产品设计中的信息提取技术，尤其涉及基于PCA-E的产品感性语义词汇提取方法。

背景技术

近年来，人们普遍认为当前产品设计的一个主要关注点是如何满足用户的情感需求，而不是具体的实用性，感性设计在业界和学术界都得到了广泛的关注。以用户为导向的设计越来越受到人们的认可，设计好的产品比设计不能满足用户心理需求的产品更能吸引人们的注意。研究表明，令人愉悦的产品使用频率更高，未来的购买选择将受到产品使用的愉悦程度的影响。用户对产品的感知在很大程度上取决于产品的设计特征(包括形式、颜色、材质等)，而满足用户情感需求的产品制造对公司的成功至关重要。因此，有必要研究消费者对产品设计的主观感知。

感性工学因此被确立为一种强大的以消费者为导向的方法，将消费者的情感转化为产品设计特征。感性工学是1970年由广岛大学的长町三生创立的，提出从用户导向的角度开发产品，至今已经被应用到许多产品设计中，比如手机、汽车内饰、界面设计、家居设计、住宅设计、机器设计、医疗产品设计、服装设计、文化设计等。

在感性工学研究中，第一个也是最重要的一点是考虑产品的感性属性有哪些，以及如何获得用户对该产品的感性评价。由于传统和实际应用的原因，通常采用感性词来提取用户对产品设计特征的感知。毫无疑问，从大量的词汇中有效识别感性词，收集用户对设计特征的心理感受，对感性工学研究具有决定性作用。因子分析和聚类分析是以往感性工学研究中基于大量问卷数据识别有效感性词的常用方法。但是，这一过程需要用户的积极参与，成本高，耗时长，知识密集，劳动密集。而且，单纯通过主观问卷调查获得的感性工学词汇会造成或多或少的评价不确定性，从而可能误导感性工学研究的设计方向。这是因为，许多感性词之间可能存在相关性，如果分别对每个感性词进行分析，往往是孤立的。因此盲目减少指标会损失很多有用的信息，从而产生错误的结论。

由上可以得知，需要找到一种合理的方法，在减少感性词汇的同时，尽量缩小被删除感性词汇的信息损失，用较少的感性词汇分别代表各个变量中的各类信息，以达降维的目的。主成分分析法(Principal Component Analysis，PCA)就属于这类降维算法，它是将高维度的数据保留下最重要的一些特征，去除噪声和不重要的特征，从而实现提升数据处理速度的目的。但是，每个原始变量在主成分中都占有一定的分量，这些分量(载荷)之间的大小分布没有清晰的分界线，这就造成无法明确表述哪个主成分代表哪些原始变量，也就是说提取出来的主成分无法清晰的解释其代表的含义。基于此，本文提出了一种基于PCA降维的解释性感性词汇提取方法(PCA-E)，帮助设计者更好地筛选感性词汇。

发明内容

本发明的目的在于针对上述现有技术中存在的因减少感性词汇导致信息损失，进而影响产品设计评价的问题，提供一种基于PCA-E的产品感性语义词汇提取方法，能够帮助设计者更好地筛选感性词汇。

为达到上述目的，本发明采用以下技术方案来实现。

本发明提供的基于PCA-E的产品感性语义词汇提取方法，包括以下步骤：

S1构建产品感性评价向量矩阵；

S2基于主成分对产品感性评价向量矩阵进行降维，本步骤包括以下分步骤：

S21对产品感性评价向量矩阵中的各行分别进行零均值化；

S22获取零均值化后产品感性评价向量矩阵的协方差矩阵；

S23对步骤S22得到的协方差矩阵进行正交分解得到协方差矩阵的特征值及特征向量；

S24将特征值按照从大到小排列，提取累计贡献率大于第一阈值的前f个主成分的特征向量构建特征向量矩阵；

S3获取主成分载荷系数矩阵，并构建主成分载荷系数表；

S4依据感性词汇提取策略提取代表主成分的感性词汇。

上述步骤S1中，对同一种或同一类产品，根据不同用户对该产品的感性评价向量构建矩阵。

针对第m个产品或类别产品C_m，构建的产品感性评价向量矩阵如下：

式中，作为用户P_k对产品C_m的第n个产品感性词汇K_n的评价分数；m、n、k均取整数；V_m采用的评价标准常用李克特5、7或9量表。感性词汇K_n使用/>作为表达感性词汇属性的一组反义词词对，其中/>和/>分别表示左右两个词语。

上述步骤S2目的使对产品感性评价向量矩阵进行降维，所得主成分之间不存在相关性或者相关性较弱，从而使研究结果更具严谨性和合理性。

上述步骤S21中，对产品感性评价向量矩阵V_m中每一行进行零均值化，即V_m中同一行各元素减去对应行的均值，得到零均值化处理后的产品感性评价向量矩阵V′_m。

上述步骤S22中，按照以下公式获取零均值化处理后的产品感性评价向量矩阵V′_m的方差矩阵：

式中，n表示感性词汇总个数。

上述步骤S23中，对C进行正交分解可得：

C＝PλP^T(3)

式中，λ＝diag(λ₁,λ₂,…,λ_n)，λ_i(i＝1,2,3,…,n)为C的特征值，从λ₁到λ_n为降序排列；P＝[P₁,P₂,…,P_n]，P_i(i＝1,2,3,…,n)为λ_i对应的特征列矢量，称为第i个主元方向。

上述步骤24中，主元方向上投影后的累计贡献率按照以下公式计算得到：

根据设定的第一阈值，提取前f个特征向量构建特征向量矩阵P′，P′＝[P₁,P₂,…,P_f]，f＜n。

上述步骤3的目的是获取主成分载荷系数表，包括以下分步骤：

S31基于主成分特征值和特定向量得到主成分载荷系数矩阵；

S32利用主成分载荷系数矩阵构建主成分载荷系数表；

上述步骤S31中，主成分载荷系数矩阵F按照以下公式计算得到：

式中，F_ij表示第j个感性词汇的第i个主成分载荷系数；p_ij表示特征向量P_i中第j个元素；i＝1,2,3,…,f；j＝1,2,3,…,n。

上述步骤S32中，主成分载荷系数表主要由感性词汇(即一对反义词词对)、各主成分以及感性词汇对应各主成分的载荷系数。

上述步骤S4目的是从主成分载荷系数表提取代表主成分的感性词汇；首先对主成分载荷系数表中数据进行清洗，每个感性词汇仅对应一个主成分载荷系数；然后依据感性词汇提取策略依次提取代表主成分的感性词汇。

对主成分载荷系数表中数据进行清洗的操作包括：

(1)剔除掉主成分载荷系数表中小于第二阈值的主成分载荷系数；

(2)对于一个感性词汇，按主成分顺序，保留位于最后的主成分载荷系数。

进一步的，依据感性词汇提取策略提取代表主成分的感性词汇的同时，可以给出相应解释，获得具有解释性的关键感性词汇。

感性词汇提取策略具体如下：

(1)当感性词汇在主成分中对应的载荷系数小于0时；将感性词汇中左右词汇进行位置交换，再运用(2)-(4)策略进行筛选，并进一步给出解释。

(2)当主成分只对应一个感性词汇时，则用相应的感性词汇作为表征该主成分的感性词汇；还可以在解释中说明，该感性词汇作为所表达的感性词汇属性的唯一评价标准。

(3)当主成分对应两个以上感性词汇时，若两个以上感性词汇语义接近，选择任一个感性词汇作为表征主成分的感性词汇；还可以在解释中说明，该感应词汇作为所表达的感性词汇属性的唯一评价标准。

(4)当主成分对应两个以上感性词汇时，若两个以上感性词汇语义不接近，首先剔除与其它主成分语义接近的感性词汇，再从剩余感性词汇中选择任一个感性词汇作为表征主成分的感性；还可以在解释中说明，对该主成分的评价需要综合考虑所有的因素，甚至可以根据占比的差异让评判者重点考虑哪些因素。

在运用上述感性词汇提取策略时，可以按照主成分的载荷系数个数由少到多的顺序进行。

上述两个以上感性词汇语义接近指的是两个以上感性词汇之间为近义词或同义词；而且，两个以上感性词汇易于总结概况。

上述两个以上感性词汇语义不接近指的是两个以上感性词汇之间不是近义词和同义词，语义表达差异较大，或者说无法进行总结概况。

本发明提供的基于PCA-E的产品感性语义词汇提取方法具有以下有益效果：

(1)本发明首先利用原始感性词汇构建产品感性评价向量矩阵，再通过主成分分析进行降维，并基于主成分载荷系数确定表征各主成分的感性词汇，这样提取的感性词汇能够具有更好的解释性，帮助用户更好地理解筛选出的感性词汇，准确作出评价。

(2)本发明基于较少的评价样本便可实现，能够极大降低人力成本。

(3)本发明可拓展性更好，能处理较大规模的原始感性词汇。

(4)本发明基于主成分分析法及提出的感性词汇提取策略，优化了感性词汇的筛选过程，对感性工学和产品设计的研究与应用具有潜在的价值。

附图说明

图1为本发明提供的基于PCA-E的产品感性语义词汇提取方法流程示意图。

图2为应用例使用的样本图像。

具体实施方式

结合附图对本发明各实施例的技术方案进行清楚、完整的描述，显然，所描述实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例，都属于本发明。

实施例

如图1所示，本实施例提供的基于PCA-E的产品感性语义词汇提取方法，包括以下步骤：

S1构建产品感性评价向量矩阵。

感性词汇对于用户描述产品至关重要，如何筛选出科学合理的感性词汇，对于设计师理解用户的感性需求具有重大意义。为了更好地解释用户、感性评价和产品之间的关系，首先运用SD方法建立感性语义空间，具体流程及方法如下：

1)令C＝{C₁,C₂,…,C_m}，作为需要被评价的产品或者产品类别，m表示产品或产品类别数量；

2)令P＝{P₁,P₂,…,P_k},作为参与评价的用户，k表示用户数量；

3)令K＝{K₁,K₂,…,K_n}，是一组经过初步筛选的感性词汇集，n表示感性词汇数量；

4)令作为表达感性词汇属性的一组反义词词对，其中/>和分别表示左右两个词语。

5)令V＝{V₁,V₂,…,V_g}，作为用户对产品感性词汇的评价分数，g表示李克特评价法点数，评价标准常用李克特5、7、9点发；如选用李克特5点评价法，V＝{1,2,3,4,5}。

6)令作为用户P_k对产品C_m的产品感性词汇K_n评价分数，则对于某一个(类)选定的产品C_m，用户P_k对n个产品感性词汇的评价可以写作：

7)令的评价作为一条列向量，那么，k个用户对于产品C_m的n个产品感性词汇的评价可以写作：

形成一个n×k阶数据矩阵。

由上可知，当某种产品的感性评价属性确定时V_m准确表达了多位用户对某1个产品的感性语义评价，对于筛选该产品的感性词汇具有重要意义。

S21对产品感性评价向量矩阵中的各行分别进行零均值化。

本步骤中，对产品感性评价向量矩阵V_m中每一行进行零均值化，即V_m中同一行各元素减去对应行的均值，得到零均值化处理后的产品感性评价向量矩阵V′_m。

S22获取零均值化后产品感性评价向量矩阵的协方差矩阵。

按照以下公式获取零均值化处理后的产品感性评价向量矩阵V′_m的方差矩阵：

式中，n表示感性词汇总个数。

S23对步骤S22得到的协方差矩阵进行正交分解得到协方差矩阵的特征值及特征向量。本步骤中，对C进行正交分解可得：

C＝PλP^T(3)

S24将特征值按照从大到小排列，提取累计贡献率大于第一阈值的前f个主成分的特征向量构建特征向量矩阵。

本步骤中，主元方向上投影后的累计贡献率按照以下公式计算得到：

S3获取主成分载荷系数矩阵，并构建主成分载荷系数表；具体实现方式中，包括以下分步骤：

S31基于主成分特征值和特定向量得到主成分载荷系数矩阵。

本步骤中，主成分载荷系数矩阵F按照以下公式计算得到：

S32利用主成分载荷系数矩阵构建主成分载荷系数表。

本步骤中，主成分载荷系数表主要由感性词汇(即一对反义词词对)、各主成分以及感性词汇对应各主成分的载荷系数。

S4依据感性词汇提取策略提取代表主成分的感性词汇。

本步骤中，首先对主成分载荷系数表中数据进行清洗，每个感性词汇仅对应一个主成分载荷系数；然后依据感性词汇提取策略依次提取代表主成分的感性词汇。

对主成分载荷系数表中数据进行清洗的操作包括：

感性词汇提取策略具体如下：

(1)当感性词汇在主成分中对应的载荷系数占比小于0时；可将感性词汇中左右词汇进行位置交换，再运用(2)-(4)策略进行筛选，并进一步给出解释。

应用例

本应用例研究属于来源于Stanford Cars Dataset，由于本应用例只针对汽车某一个(类)的感性评价，于是，我们从中随机挑选了1张小汽车的图片作为产品样本，如图2所示。并搜集了有关该汽车图片的100多个感性词汇，去除重合率高的，再将意义相互独立的词汇进行配对，共得到30对感性词汇(也称反义词词对)。

运用SD法制作调查问卷，具体选用李克特7量表评价法让40位被调查者(其中男学生34名，女学生6名，年龄跨度在18～31岁)评价这张小气车的30对感性词汇分数，得到结果如表1所示。

表1不同被调查者对统一产品不同感性词汇属性的评价得分

然后基于表1，按照实施例中给出的步骤S1，构建产品感性评价向量矩阵C_m。

再按照实施例中给出的步骤S2进行主成分分析，并根据特征值，提取累计贡献率大于80％(即第一阈值设为80％)的前7个主成分。各主成分提取信息见表2所示。

表2主成分提取信息量表

之后，按照实施例中给出的步骤S3获取主成分载荷系数表，见表3所示。

表3主成分载荷系数表

最后，根据实施例中的步骤S4，对于主成分载荷系数表中任一主成分，剔除小于0.4(即这里第二阈值为0.4)的载荷系数；然后对于一个感性词汇，按主成分顺序，保留位于最后的主成分载荷系数，使得每个感性词汇仅对应一个主成分载荷系数，从而避免出现多个主成分的词对，得到的各主成分对相应变量的载荷系数，见表4所示。

表4主成分对相应变量载荷系数表

接着依据实施例中给出感性词汇提取策略提取代表主成分的感性词汇，具体分析如下：

由表4可以看出，主成分5属于PCA-E感性词汇提取策略(2)，“女性—男性”感性词汇对占绝对主导，故可用其代表主成分5。主成分5仅关注的是产品用户的性别趋势。同理，用“轻盈—臃肿”代表主成分6。主成分6仅关注产品结构的复杂程度。

由表4可以看出，主成分7的情况属于PCA-E感性词汇提取策略(3)，两对感性词(“浓艳—素淡”和“素雅—艳丽”)载荷系数相近，且语义接近易于总结，所以用“素雅—艳丽”代表。主成分7可以解释为产品的鲜艳程度。同理，用“休闲—正式”代表主成分3。主成分3仅关注产品适宜的场合。

由表4可以看出，主成分1、2、4均由多个语义不接近、表达差异较大的感性词组成，属于PCA-E感性词汇提取策略(4)的情况。结合PCA-E感性词汇提取策略(1)，通过分析可得，主成分1更关注产品的特殊性；主成分2更关注产品的时尚度；主成分4更关注产品用户的性格特征。为了更好地解释每个主成分并验证提取的准确性，我们分别选取一组反义词来代替主成分，并加以文字解释说明，详见表5。

表5 PCA-E筛选结果及解释

上述感性词汇属性依据感性词汇进行定义得到。

本发明提供的基于PCA-E的产品感性语义词汇提取方法，首先获得感性评价矩阵，再通过PCA对感性词汇进行主成分提取，并依赖成分载荷系数解释每个评价维度的具体意义，用以帮助用户更好的评价产品。该方法优化了感性词汇的筛选过程，对感性工学和产品设计的研究与应用具有潜在的价值。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

Claims

1.一种基于PCA-E的产品感性语义词汇提取方法，其特征在于，包括以下步骤：

S1构建产品感性评价向量矩阵；

S21对产品感性评价向量矩阵中的各行分别进行零均值化；

S22获取零均值化后产品感性评价向量矩阵的协方差矩阵；

S3获取主成分载荷系数矩阵，并构建主成分载荷系数表；

S4依据感性词汇提取策略提取代表主成分的感性词汇：首先对主成分载荷系数表中数据进行清洗，每个感性词汇仅对应一个主成分载荷系数；然后依据感性词汇提取策略依次提取代表主成分的感性词汇；

对主成分载荷系数表中数据进行清洗的操作包括：

(2)对于一个感性词汇，按主成分顺序，保留位于最后的主成分载荷系数；

感性词汇提取策略具体如下：

(1)当感性词汇在主成分中对应的载荷系数小于0时；将感性词汇中左右词汇进行位置交换，再运用(2)-(4)策略进行筛选；

(2)当主成分只对应一个感性词汇时，则用相应的感性词汇作为表征该主成分的感性词汇；

(3)当主成分对应两个以上感性词汇时，若两个以上感性词汇语义接近，选择任一个感性词汇作为表征主成分的感性词汇；

(4)当主成分对应两个以上感性词汇时，若两个以上感性词汇语义不接近，首先剔除与其它主成分语义接近的感性词汇，再从剩余感性词汇中选择任一个感性词汇作为表征主成分的感性。

2.根据权利要求1所述的基于PCA-E的产品感性语义词汇提取方法，其特征在于，对同一种或同一类产品，根据不同用户对该产品的感性评价向量构建矩阵，

式中，作为用户P_k对产品C_m的第n个产品感性词汇K_n的评价分数；m、n、k均取整数；V_m采用的评价标准为李克特5、7或9量表；感性词汇K_n使用/>作为表达感性词汇属性的一组反义词词对，其中/>和/>分别表示左右两个词语。

3.根据权利要求2所述的基于PCA-E的产品感性语义词汇提取方法，其特征在于，步骤S21中，对产品感性评价向量矩阵V_m中每一行进行零均值化，具体操作为：V_m中同一行各元素减去对应行的均值，得到零均值化处理后的产品感性评价向量矩阵V′_m。

4.根据权利要求3所述的基于PCA-E的产品感性语义词汇提取方法，其特征在于，步骤S22中，按照以下公式获取零均值化处理后的产品感性评价向量矩阵V′_m的方差矩阵：

式中，n表示感性词汇总个数。

5.根据权利要求4所述的基于PCA-E的产品感性语义词汇提取方法，其特征在于，步骤S23中，对C进行正交分解可得：

C＝PλP^T(3)

6.根据权利要求5所述的基于PCA-E的产品感性语义词汇提取方法，其特征在于，步骤24中，主元方向上投影后的累计贡献率按照以下公式计算得到：

7.根据权利要求6所述的基于PCA-E的产品感性语义词汇提取方法，其特征在于，步骤3的目的是获取主成分载荷系数表，包括以下分步骤：

S31基于主成分特征值和特定向量得到主成分载荷系数矩阵；

S32利用主成分载荷系数矩阵构建主成分载荷系数表。

8.根据权利要求7所述的基于PCA-E的产品感性语义词汇提取方法，其特征在于，步骤S31中，主成分载荷系数矩阵F按照以下公式计算得到：