CN115062702B - 基于pca-e的产品感性语义词汇提取方法 - Google Patents
基于pca-e的产品感性语义词汇提取方法 Download PDFInfo
- Publication number
- CN115062702B CN115062702B CN202210684413.0A CN202210684413A CN115062702B CN 115062702 B CN115062702 B CN 115062702B CN 202210684413 A CN202210684413 A CN 202210684413A CN 115062702 B CN115062702 B CN 115062702B
- Authority
- CN
- China
- Prior art keywords
- perceptual
- vocabulary
- product
- principal component
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims abstract description 61
- 238000011156 evaluation Methods 0.000 claims abstract description 54
- 239000013598 vector Substances 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims description 30
- 230000001939 inductive effect Effects 0.000 claims description 21
- 230000008447 perception Effects 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 8
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 238000000513 principal component analysis Methods 0.000 abstract description 5
- 238000013461 design Methods 0.000 description 22
- 238000011160 research Methods 0.000 description 5
- 101100161752 Mus musculus Acot11 gene Proteins 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229940127554 medical product Drugs 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于PCA‑E的产品感性语义词汇提取方法,首先利用原始感性词汇构建产品感性评价向量矩阵,再通过主成分分析进行降维,并基于主成分载荷系数确定表征各主成分的感性词汇,这样提取的感性词汇能够具有更好的解释性,帮助用户更好地理解筛选出的感性词汇,准确作出评价。
Description
技术领域
本发明属于产品设计技术领域,涉及产品设计中的信息提取技术,尤其涉及基于PCA-E的产品感性语义词汇提取方法。
背景技术
近年来,人们普遍认为当前产品设计的一个主要关注点是如何满足用户的情感需求,而不是具体的实用性,感性设计在业界和学术界都得到了广泛的关注。以用户为导向的设计越来越受到人们的认可,设计好的产品比设计不能满足用户心理需求的产品更能吸引人们的注意。研究表明,令人愉悦的产品使用频率更高,未来的购买选择将受到产品使用的愉悦程度的影响。用户对产品的感知在很大程度上取决于产品的设计特征(包括形式、颜色、材质等),而满足用户情感需求的产品制造对公司的成功至关重要。因此,有必要研究消费者对产品设计的主观感知。
感性工学因此被确立为一种强大的以消费者为导向的方法,将消费者的情感转化为产品设计特征。感性工学是1970年由广岛大学的长町三生创立的,提出从用户导向的角度开发产品,至今已经被应用到许多产品设计中,比如手机、汽车内饰、界面设计、家居设计、住宅设计、机器设计、医疗产品设计、服装设计、文化设计等。
在感性工学研究中,第一个也是最重要的一点是考虑产品的感性属性有哪些,以及如何获得用户对该产品的感性评价。由于传统和实际应用的原因,通常采用感性词来提取用户对产品设计特征的感知。毫无疑问,从大量的词汇中有效识别感性词,收集用户对设计特征的心理感受,对感性工学研究具有决定性作用。因子分析和聚类分析是以往感性工学研究中基于大量问卷数据识别有效感性词的常用方法。但是,这一过程需要用户的积极参与,成本高,耗时长,知识密集,劳动密集。而且,单纯通过主观问卷调查获得的感性工学词汇会造成或多或少的评价不确定性,从而可能误导感性工学研究的设计方向。这是因为,许多感性词之间可能存在相关性,如果分别对每个感性词进行分析,往往是孤立的。因此盲目减少指标会损失很多有用的信息,从而产生错误的结论。
由上可以得知,需要找到一种合理的方法,在减少感性词汇的同时,尽量缩小被删除感性词汇的信息损失,用较少的感性词汇分别代表各个变量中的各类信息,以达降维的目的。主成分分析法(Principal Component Analysis,PCA)就属于这类降维算法,它是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的。但是,每个原始变量在主成分中都占有一定的分量,这些分量(载荷)之间的大小分布没有清晰的分界线,这就造成无法明确表述哪个主成分代表哪些原始变量,也就是说提取出来的主成分无法清晰的解释其代表的含义。基于此,本文提出了一种基于PCA降维的解释性感性词汇提取方法(PCA-E),帮助设计者更好地筛选感性词汇。
发明内容
本发明的目的在于针对上述现有技术中存在的因减少感性词汇导致信息损失,进而影响产品设计评价的问题,提供一种基于PCA-E的产品感性语义词汇提取方法,能够帮助设计者更好地筛选感性词汇。
为达到上述目的,本发明采用以下技术方案来实现。
本发明提供的基于PCA-E的产品感性语义词汇提取方法,包括以下步骤:
S1构建产品感性评价向量矩阵;
S2基于主成分对产品感性评价向量矩阵进行降维,本步骤包括以下分步骤:
S21对产品感性评价向量矩阵中的各行分别进行零均值化;
S22获取零均值化后产品感性评价向量矩阵的协方差矩阵;
S23对步骤S22得到的协方差矩阵进行正交分解得到协方差矩阵的特征值及特征向量;
S24将特征值按照从大到小排列,提取累计贡献率大于第一阈值的前f个主成分的特征向量构建特征向量矩阵;
S3获取主成分载荷系数矩阵,并构建主成分载荷系数表;
S4依据感性词汇提取策略提取代表主成分的感性词汇。
上述步骤S1中,对同一种或同一类产品,根据不同用户对该产品的感性评价向量构建矩阵。
针对第m个产品或类别产品Cm,构建的产品感性评价向量矩阵如下:
式中,作为用户Pk对产品Cm的第n个产品感性词汇Kn的评价分数;m、n、k均取整数;Vm采用的评价标准常用李克特5、7或9量表。感性词汇Kn使用/>作为表达感性词汇属性的一组反义词词对,其中/>和/>分别表示左右两个词语。
上述步骤S2目的使对产品感性评价向量矩阵进行降维,所得主成分之间不存在相关性或者相关性较弱,从而使研究结果更具严谨性和合理性。
上述步骤S21中,对产品感性评价向量矩阵Vm中每一行进行零均值化,即Vm中同一行各元素减去对应行的均值,得到零均值化处理后的产品感性评价向量矩阵V′m。
上述步骤S22中,按照以下公式获取零均值化处理后的产品感性评价向量矩阵V′m的方差矩阵:
式中,n表示感性词汇总个数。
上述步骤S23中,对C进行正交分解可得:
C=PλPT(3)
式中,λ=diag(λ1,λ2,…,λn),λi(i=1,2,3,…,n)为C的特征值,从λ1到λn为降序排列;P=[P1,P2,…,Pn],Pi(i=1,2,3,…,n)为λi对应的特征列矢量,称为第i个主元方向。
上述步骤24中,主元方向上投影后的累计贡献率按照以下公式计算得到:
根据设定的第一阈值,提取前f个特征向量构建特征向量矩阵P′,P′=[P1,P2,…,Pf],f<n。
上述步骤3的目的是获取主成分载荷系数表,包括以下分步骤:
S31基于主成分特征值和特定向量得到主成分载荷系数矩阵;
S32利用主成分载荷系数矩阵构建主成分载荷系数表;
上述步骤S31中,主成分载荷系数矩阵F按照以下公式计算得到:
式中,Fij表示第j个感性词汇的第i个主成分载荷系数;pij表示特征向量Pi中第j个元素;i=1,2,3,…,f;j=1,2,3,…,n。
上述步骤S32中,主成分载荷系数表主要由感性词汇(即一对反义词词对)、各主成分以及感性词汇对应各主成分的载荷系数。
上述步骤S4目的是从主成分载荷系数表提取代表主成分的感性词汇;首先对主成分载荷系数表中数据进行清洗,每个感性词汇仅对应一个主成分载荷系数;然后依据感性词汇提取策略依次提取代表主成分的感性词汇。
对主成分载荷系数表中数据进行清洗的操作包括:
(1)剔除掉主成分载荷系数表中小于第二阈值的主成分载荷系数;
(2)对于一个感性词汇,按主成分顺序,保留位于最后的主成分载荷系数。
进一步的,依据感性词汇提取策略提取代表主成分的感性词汇的同时,可以给出相应解释,获得具有解释性的关键感性词汇。
感性词汇提取策略具体如下:
(1)当感性词汇在主成分中对应的载荷系数小于0时;将感性词汇中左右词汇进行位置交换,再运用(2)-(4)策略进行筛选,并进一步给出解释。
(2)当主成分只对应一个感性词汇时,则用相应的感性词汇作为表征该主成分的感性词汇;还可以在解释中说明,该感性词汇作为所表达的感性词汇属性的唯一评价标准。
(3)当主成分对应两个以上感性词汇时,若两个以上感性词汇语义接近,选择任一个感性词汇作为表征主成分的感性词汇;还可以在解释中说明,该感应词汇作为所表达的感性词汇属性的唯一评价标准。
(4)当主成分对应两个以上感性词汇时,若两个以上感性词汇语义不接近,首先剔除与其它主成分语义接近的感性词汇,再从剩余感性词汇中选择任一个感性词汇作为表征主成分的感性;还可以在解释中说明,对该主成分的评价需要综合考虑所有的因素,甚至可以根据占比的差异让评判者重点考虑哪些因素。
在运用上述感性词汇提取策略时,可以按照主成分的载荷系数个数由少到多的顺序进行。
上述两个以上感性词汇语义接近指的是两个以上感性词汇之间为近义词或同义词;而且,两个以上感性词汇易于总结概况。
上述两个以上感性词汇语义不接近指的是两个以上感性词汇之间不是近义词和同义词,语义表达差异较大,或者说无法进行总结概况。
本发明提供的基于PCA-E的产品感性语义词汇提取方法具有以下有益效果:
(1)本发明首先利用原始感性词汇构建产品感性评价向量矩阵,再通过主成分分析进行降维,并基于主成分载荷系数确定表征各主成分的感性词汇,这样提取的感性词汇能够具有更好的解释性,帮助用户更好地理解筛选出的感性词汇,准确作出评价。
(2)本发明基于较少的评价样本便可实现,能够极大降低人力成本。
(3)本发明可拓展性更好,能处理较大规模的原始感性词汇。
(4)本发明基于主成分分析法及提出的感性词汇提取策略,优化了感性词汇的筛选过程,对感性工学和产品设计的研究与应用具有潜在的价值。
附图说明
图1为本发明提供的基于PCA-E的产品感性语义词汇提取方法流程示意图。
图2为应用例使用的样本图像。
具体实施方式
结合附图对本发明各实施例的技术方案进行清楚、完整的描述,显然,所描述实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明。
实施例
如图1所示,本实施例提供的基于PCA-E的产品感性语义词汇提取方法,包括以下步骤:
S1构建产品感性评价向量矩阵。
感性词汇对于用户描述产品至关重要,如何筛选出科学合理的感性词汇,对于设计师理解用户的感性需求具有重大意义。为了更好地解释用户、感性评价和产品之间的关系,首先运用SD方法建立感性语义空间,具体流程及方法如下:
1)令C={C1,C2,…,Cm},作为需要被评价的产品或者产品类别,m表示产品或产品类别数量;
2)令P={P1,P2,…,Pk},作为参与评价的用户,k表示用户数量;
3)令K={K1,K2,…,Kn},是一组经过初步筛选的感性词汇集,n表示感性词汇数量;
4)令作为表达感性词汇属性的一组反义词词对,其中/>和分别表示左右两个词语。
5)令V={V1,V2,…,Vg},作为用户对产品感性词汇的评价分数,g表示李克特评价法点数,评价标准常用李克特5、7、9点发;如选用李克特5点评价法,V={1,2,3,4,5}。
6)令作为用户Pk对产品Cm的产品感性词汇Kn评价分数,则对于某一个(类)选定的产品Cm,用户Pk对n个产品感性词汇的评价可以写作:
7)令的评价作为一条列向量,那么,k个用户对于产品Cm的n个产品感性词汇的评价可以写作:
形成一个n×k阶数据矩阵。
由上可知,当某种产品的感性评价属性确定时Vm准确表达了多位用户对某1个产品的感性语义评价,对于筛选该产品的感性词汇具有重要意义。
S2基于主成分对产品感性评价向量矩阵进行降维,本步骤包括以下分步骤:
S21对产品感性评价向量矩阵中的各行分别进行零均值化。
本步骤中,对产品感性评价向量矩阵Vm中每一行进行零均值化,即Vm中同一行各元素减去对应行的均值,得到零均值化处理后的产品感性评价向量矩阵V′m。
S22获取零均值化后产品感性评价向量矩阵的协方差矩阵。
按照以下公式获取零均值化处理后的产品感性评价向量矩阵V′m的方差矩阵:
式中,n表示感性词汇总个数。
S23对步骤S22得到的协方差矩阵进行正交分解得到协方差矩阵的特征值及特征向量。本步骤中,对C进行正交分解可得:
C=PλPT(3)
式中,λ=diag(λ1,λ2,…,λn),λi(i=1,2,3,…,n)为C的特征值,从λ1到λn为降序排列;P=[P1,P2,…,Pn],Pi(i=1,2,3,…,n)为λi对应的特征列矢量,称为第i个主元方向。
S24将特征值按照从大到小排列,提取累计贡献率大于第一阈值的前f个主成分的特征向量构建特征向量矩阵。
本步骤中,主元方向上投影后的累计贡献率按照以下公式计算得到:
根据设定的第一阈值,提取前f个特征向量构建特征向量矩阵P′,P′=[P1,P2,…,Pf],f<n。
S3获取主成分载荷系数矩阵,并构建主成分载荷系数表;具体实现方式中,包括以下分步骤:
S31基于主成分特征值和特定向量得到主成分载荷系数矩阵。
本步骤中,主成分载荷系数矩阵F按照以下公式计算得到:
式中,Fij表示第j个感性词汇的第i个主成分载荷系数;pij表示特征向量Pi中第j个元素;i=1,2,3,…,f;j=1,2,3,…,n。
S32利用主成分载荷系数矩阵构建主成分载荷系数表。
本步骤中,主成分载荷系数表主要由感性词汇(即一对反义词词对)、各主成分以及感性词汇对应各主成分的载荷系数。
S4依据感性词汇提取策略提取代表主成分的感性词汇。
本步骤中,首先对主成分载荷系数表中数据进行清洗,每个感性词汇仅对应一个主成分载荷系数;然后依据感性词汇提取策略依次提取代表主成分的感性词汇。
对主成分载荷系数表中数据进行清洗的操作包括:
(1)剔除掉主成分载荷系数表中小于第二阈值的主成分载荷系数;
(2)对于一个感性词汇,按主成分顺序,保留位于最后的主成分载荷系数。
感性词汇提取策略具体如下:
(1)当感性词汇在主成分中对应的载荷系数占比小于0时;可将感性词汇中左右词汇进行位置交换,再运用(2)-(4)策略进行筛选,并进一步给出解释。
(2)当主成分只对应一个感性词汇时,则用相应的感性词汇作为表征该主成分的感性词汇;还可以在解释中说明,该感性词汇作为所表达的感性词汇属性的唯一评价标准。
(3)当主成分对应两个以上感性词汇时,若两个以上感性词汇语义接近,选择任一个感性词汇作为表征主成分的感性词汇;还可以在解释中说明,该感应词汇作为所表达的感性词汇属性的唯一评价标准。
(4)当主成分对应两个以上感性词汇时,若两个以上感性词汇语义不接近,首先剔除与其它主成分语义接近的感性词汇,再从剩余感性词汇中选择任一个感性词汇作为表征主成分的感性;还可以在解释中说明,对该主成分的评价需要综合考虑所有的因素,甚至可以根据占比的差异让评判者重点考虑哪些因素。
上述两个以上感性词汇语义接近指的是两个以上感性词汇之间为近义词或同义词;而且,两个以上感性词汇易于总结概况。
上述两个以上感性词汇语义不接近指的是两个以上感性词汇之间不是近义词和同义词,语义表达差异较大,或者说无法进行总结概况。
应用例
本应用例研究属于来源于Stanford Cars Dataset,由于本应用例只针对汽车某一个(类)的感性评价,于是,我们从中随机挑选了1张小汽车的图片作为产品样本,如图2所示。并搜集了有关该汽车图片的100多个感性词汇,去除重合率高的,再将意义相互独立的词汇进行配对,共得到30对感性词汇(也称反义词词对)。
运用SD法制作调查问卷,具体选用李克特7量表评价法让40位被调查者(其中男学生34名,女学生6名,年龄跨度在18~31岁)评价这张小气车的30对感性词汇分数,得到结果如表1所示。
表1不同被调查者对统一产品不同感性词汇属性的评价得分
然后基于表1,按照实施例中给出的步骤S1,构建产品感性评价向量矩阵Cm。
再按照实施例中给出的步骤S2进行主成分分析,并根据特征值,提取累计贡献率大于80%(即第一阈值设为80%)的前7个主成分。各主成分提取信息见表2所示。
表2主成分提取信息量表
之后,按照实施例中给出的步骤S3获取主成分载荷系数表,见表3所示。
表3主成分载荷系数表
最后,根据实施例中的步骤S4,对于主成分载荷系数表中任一主成分,剔除小于0.4(即这里第二阈值为0.4)的载荷系数;然后对于一个感性词汇,按主成分顺序,保留位于最后的主成分载荷系数,使得每个感性词汇仅对应一个主成分载荷系数,从而避免出现多个主成分的词对,得到的各主成分对相应变量的载荷系数,见表4所示。
表4主成分对相应变量载荷系数表
接着依据实施例中给出感性词汇提取策略提取代表主成分的感性词汇,具体分析如下:
由表4可以看出,主成分5属于PCA-E感性词汇提取策略(2),“女性—男性”感性词汇对占绝对主导,故可用其代表主成分5。主成分5仅关注的是产品用户的性别趋势。同理,用“轻盈—臃肿”代表主成分6。主成分6仅关注产品结构的复杂程度。
由表4可以看出,主成分7的情况属于PCA-E感性词汇提取策略(3),两对感性词(“浓艳—素淡”和“素雅—艳丽”)载荷系数相近,且语义接近易于总结,所以用“素雅—艳丽”代表。主成分7可以解释为产品的鲜艳程度。同理,用“休闲—正式”代表主成分3。主成分3仅关注产品适宜的场合。
由表4可以看出,主成分1、2、4均由多个语义不接近、表达差异较大的感性词组成,属于PCA-E感性词汇提取策略(4)的情况。结合PCA-E感性词汇提取策略(1),通过分析可得,主成分1更关注产品的特殊性;主成分2更关注产品的时尚度;主成分4更关注产品用户的性格特征。为了更好地解释每个主成分并验证提取的准确性,我们分别选取一组反义词来代替主成分,并加以文字解释说明,详见表5。
表5 PCA-E筛选结果及解释
上述感性词汇属性依据感性词汇进行定义得到。
本发明提供的基于PCA-E的产品感性语义词汇提取方法,首先获得感性评价矩阵,再通过PCA对感性词汇进行主成分提取,并依赖成分载荷系数解释每个评价维度的具体意义,用以帮助用户更好的评价产品。该方法优化了感性词汇的筛选过程,对感性工学和产品设计的研究与应用具有潜在的价值。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (8)
1.一种基于PCA-E的产品感性语义词汇提取方法,其特征在于,包括以下步骤:
S1构建产品感性评价向量矩阵;
S2基于主成分对产品感性评价向量矩阵进行降维,本步骤包括以下分步骤:
S21对产品感性评价向量矩阵中的各行分别进行零均值化;
S22获取零均值化后产品感性评价向量矩阵的协方差矩阵;
S23对步骤S22得到的协方差矩阵进行正交分解得到协方差矩阵的特征值及特征向量;
S24将特征值按照从大到小排列,提取累计贡献率大于第一阈值的前f个主成分的特征向量构建特征向量矩阵;
S3获取主成分载荷系数矩阵,并构建主成分载荷系数表;
S4依据感性词汇提取策略提取代表主成分的感性词汇:首先对主成分载荷系数表中数据进行清洗,每个感性词汇仅对应一个主成分载荷系数;然后依据感性词汇提取策略依次提取代表主成分的感性词汇;
对主成分载荷系数表中数据进行清洗的操作包括:
(1)剔除掉主成分载荷系数表中小于第二阈值的主成分载荷系数;
(2)对于一个感性词汇,按主成分顺序,保留位于最后的主成分载荷系数;
感性词汇提取策略具体如下:
(1)当感性词汇在主成分中对应的载荷系数小于0时;将感性词汇中左右词汇进行位置交换,再运用(2)-(4)策略进行筛选;
(2)当主成分只对应一个感性词汇时,则用相应的感性词汇作为表征该主成分的感性词汇;
(3)当主成分对应两个以上感性词汇时,若两个以上感性词汇语义接近,选择任一个感性词汇作为表征主成分的感性词汇;
(4)当主成分对应两个以上感性词汇时,若两个以上感性词汇语义不接近,首先剔除与其它主成分语义接近的感性词汇,再从剩余感性词汇中选择任一个感性词汇作为表征主成分的感性。
2.根据权利要求1所述的基于PCA-E的产品感性语义词汇提取方法,其特征在于,对同一种或同一类产品,根据不同用户对该产品的感性评价向量构建矩阵,
针对第m个产品或类别产品Cm,构建的产品感性评价向量矩阵如下:
式中,作为用户Pk对产品Cm的第n个产品感性词汇Kn的评价分数;m、n、k均取整数;Vm采用的评价标准为李克特5、7或9量表;感性词汇Kn使用/>作为表达感性词汇属性的一组反义词词对,其中/>和/>分别表示左右两个词语。
3.根据权利要求2所述的基于PCA-E的产品感性语义词汇提取方法,其特征在于,步骤S21中,对产品感性评价向量矩阵Vm中每一行进行零均值化,具体操作为:Vm中同一行各元素减去对应行的均值,得到零均值化处理后的产品感性评价向量矩阵V′m。
4.根据权利要求3所述的基于PCA-E的产品感性语义词汇提取方法,其特征在于,步骤S22中,按照以下公式获取零均值化处理后的产品感性评价向量矩阵V′m的方差矩阵:
式中,n表示感性词汇总个数。
5.根据权利要求4所述的基于PCA-E的产品感性语义词汇提取方法,其特征在于,步骤S23中,对C进行正交分解可得:
C=PλPT(3)
式中,λ=diag(λ1,λ2,…,λn),λi(i=1,2,3,…,n)为C的特征值,从λ1到λn为降序排列;P=[P1,P2,…,Pn],Pi(i=1,2,3,…,n)为λi对应的特征列矢量,称为第i个主元方向。
6.根据权利要求5所述的基于PCA-E的产品感性语义词汇提取方法,其特征在于,步骤24中,主元方向上投影后的累计贡献率按照以下公式计算得到:
根据设定的第一阈值,提取前f个特征向量构建特征向量矩阵P′,P′=[P1,P2,…,Pf],f<n。
7.根据权利要求6所述的基于PCA-E的产品感性语义词汇提取方法,其特征在于,步骤3的目的是获取主成分载荷系数表,包括以下分步骤:
S31基于主成分特征值和特定向量得到主成分载荷系数矩阵;
S32利用主成分载荷系数矩阵构建主成分载荷系数表。
8.根据权利要求7所述的基于PCA-E的产品感性语义词汇提取方法,其特征在于,步骤S31中,主成分载荷系数矩阵F按照以下公式计算得到:
式中,Fij表示第j个感性词汇的第i个主成分载荷系数;pij表示特征向量Pi中第j个元素;i=1,2,3,…,f;j=1,2,3,…,n。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210684413.0A CN115062702B (zh) | 2022-06-16 | 2022-06-16 | 基于pca-e的产品感性语义词汇提取方法 |
PCT/CN2022/125338 WO2023240858A1 (zh) | 2022-06-16 | 2022-10-14 | 基于pca-e的产品感性语义词汇提取方法 |
US18/204,973 US11868432B1 (en) | 2022-06-16 | 2023-06-02 | Method for extracting kansei adjective of product based on principal component analysis and explanation (PCA-E) |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210684413.0A CN115062702B (zh) | 2022-06-16 | 2022-06-16 | 基于pca-e的产品感性语义词汇提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115062702A CN115062702A (zh) | 2022-09-16 |
CN115062702B true CN115062702B (zh) | 2023-09-08 |
Family
ID=83202822
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210684413.0A Active CN115062702B (zh) | 2022-06-16 | 2022-06-16 | 基于pca-e的产品感性语义词汇提取方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115062702B (zh) |
WO (1) | WO2023240858A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11868432B1 (en) | 2022-06-16 | 2024-01-09 | Sichuan University | Method for extracting kansei adjective of product based on principal component analysis and explanation (PCA-E) |
CN115062702B (zh) * | 2022-06-16 | 2023-09-08 | 四川大学 | 基于pca-e的产品感性语义词汇提取方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102012985A (zh) * | 2010-11-19 | 2011-04-13 | 国网电力科学研究院 | 一种基于数据挖掘的敏感数据动态识别方法 |
CN107633513A (zh) * | 2017-09-18 | 2018-01-26 | 天津大学 | 基于深度学习的3d图像质量的度量方法 |
CN109164471A (zh) * | 2018-07-23 | 2019-01-08 | 武汉大学 | 一种基于主成分分析的区域划分方法 |
CN111414753A (zh) * | 2020-03-09 | 2020-07-14 | 中国美术学院 | 产品感性意象词汇提取方法及系统 |
CN112270461A (zh) * | 2020-10-10 | 2021-01-26 | 东华大学 | 一种基于数量化理论i的男西装款式要素感性评价方法 |
CN113902951A (zh) * | 2021-10-13 | 2022-01-07 | 中国检验检疫科学研究院 | 基于主成分分析和梯度提升决策树的油菜蜜真伪鉴别方法 |
CN114611604A (zh) * | 2022-03-11 | 2022-06-10 | 临界面(上海)智能科技有限公司 | 一种基于电驱总成载荷特征融合与聚类的用户筛选方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202481A (zh) * | 2016-07-18 | 2016-12-07 | 量子云未来(北京)信息科技有限公司 | 一种感知数据的评价方法和系统 |
TWI666558B (zh) * | 2018-11-20 | 2019-07-21 | 財團法人資訊工業策進會 | 語意分析方法、語意分析系統及非暫態電腦可讀取媒體 |
CN111985209B (zh) * | 2020-03-31 | 2024-03-29 | 北京来也网络科技有限公司 | 结合rpa和ai的文本语句识别方法、装置、设备及存储介质 |
CN115062702B (zh) * | 2022-06-16 | 2023-09-08 | 四川大学 | 基于pca-e的产品感性语义词汇提取方法 |
-
2022
- 2022-06-16 CN CN202210684413.0A patent/CN115062702B/zh active Active
- 2022-10-14 WO PCT/CN2022/125338 patent/WO2023240858A1/zh unknown
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102012985A (zh) * | 2010-11-19 | 2011-04-13 | 国网电力科学研究院 | 一种基于数据挖掘的敏感数据动态识别方法 |
CN107633513A (zh) * | 2017-09-18 | 2018-01-26 | 天津大学 | 基于深度学习的3d图像质量的度量方法 |
CN109164471A (zh) * | 2018-07-23 | 2019-01-08 | 武汉大学 | 一种基于主成分分析的区域划分方法 |
CN111414753A (zh) * | 2020-03-09 | 2020-07-14 | 中国美术学院 | 产品感性意象词汇提取方法及系统 |
CN112270461A (zh) * | 2020-10-10 | 2021-01-26 | 东华大学 | 一种基于数量化理论i的男西装款式要素感性评价方法 |
CN113902951A (zh) * | 2021-10-13 | 2022-01-07 | 中国检验检疫科学研究院 | 基于主成分分析和梯度提升决策树的油菜蜜真伪鉴别方法 |
CN114611604A (zh) * | 2022-03-11 | 2022-06-10 | 临界面(上海)智能科技有限公司 | 一种基于电驱总成载荷特征融合与聚类的用户筛选方法 |
Non-Patent Citations (1)
Title |
---|
"基于感性工学的语音交互产品形象识别设计方法";廖青林;《中国优秀硕士学位论文全文数据库工程科技辑》;参见正文第3章 * |
Also Published As
Publication number | Publication date |
---|---|
WO2023240858A1 (zh) | 2023-12-21 |
CN115062702A (zh) | 2022-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115062702B (zh) | 基于pca-e的产品感性语义词汇提取方法 | |
Hsiao et al. | Fundamental dimensions of affective responses to product shapes | |
Lotte et al. | Regularizing common spatial patterns to improve BCI designs: unified theory and new algorithms | |
JP4634736B2 (ja) | 専門的記述と非専門的記述間の語彙変換方法・プログラム・システム | |
CN107944035B (zh) | 一种融合视觉特征和用户评分的图像推荐方法 | |
CN111368088A (zh) | 一种基于深度学习的文本情感分类方法 | |
CN106909946A (zh) | 一种多模态融合的商品分类系统 | |
CN109033294B (zh) | 一种融入内容信息的混合推荐方法 | |
CN110532421A (zh) | 一种基于人的性别、心情和年龄的音乐推荐方法及系统 | |
Nishino et al. | Variable precision Bayesian rough set model and its application to Kansei engineering | |
CN112100395B (zh) | 一种专家合作可行性分析方法 | |
CN112116669B (zh) | 一种基于颜色和谐和平面构成的图像美学预测方法 | |
Caspi et al. | Measuring discourse by algorithm | |
CN113377957B (zh) | 基于知识图谱的国民经济行业分类方法和系统 | |
CN115512721A (zh) | 基于pdan的跨库语音情感识别方法及装置 | |
CN112465054B (zh) | 一种基于fcn的多变量时间序列数据分类方法 | |
US11868432B1 (en) | Method for extracting kansei adjective of product based on principal component analysis and explanation (PCA-E) | |
CN112270461A (zh) | 一种基于数量化理论i的男西装款式要素感性评价方法 | |
CN105740565A (zh) | 一种基于自然语言处理的汽车造型推导方法 | |
CN116108158B (zh) | 在线互动问答文本特征构造方法和系统 | |
Wang et al. | A two-stage emotion generation model combining CGAN and pix2pix | |
CN109739977B (zh) | 基于非监督学习的图书概念前后序关系抽取方法 | |
CN108647212B (zh) | 机器学习的影评情感倾向性分析中形成特征集合的方法 | |
Heiser et al. | Families of relational statistics for 2× 2 tables | |
Jones et al. | Decoding the language of first impressions: Natural language processing uncovers a two-topic structure in written descriptions of faces |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |