CN116822533B

CN116822533B - 一种汽车设计缺陷监测识别方法

Info

Publication number: CN116822533B
Application number: CN202310917108.6A
Authority: CN
Inventors: 刘冯源; 周伟辰
Original assignee: Beijing Maxinsight Tiancheng Data Consulting Co ltd
Current assignee: Beijing Maxinsight Tiancheng Data Consulting Co ltd
Priority date: 2023-07-25
Filing date: 2023-07-25
Publication date: 2024-02-02
Anticipated expiration: 2043-07-25
Also published as: CN116822533A

Abstract

本发明提出了一种汽车设计缺陷监测识别方法，所述方法包括：步骤1、收集评价文本数据，基于语义分析技术识别评价指标，获得原始评价指标数据；步骤2、对原始评价指标数据进行特征分析，筛选获得关键指标；步骤3、获得目标型号的评价文本数据，并识别分析评价数据中关键指标的情感倾向，得到指标情感数据；步骤4、将指标情感数据按照关键指标类型进行汇总并计算各关键指标的特征评分得到目标型号指标评分数据；步骤5、基于目标型号指标评分数据识别设计缺陷指标；基于上述方法可实现自动化汽的车设计缺陷的监测识别，且识别准确性好。

Description

一种汽车设计缺陷监测识别方法

技术领域

本发明涉及汽车设计领域，具体涉及一种汽车设计缺陷监测识别方法。

背景技术

近年来，国内汽车市场持续由增量市场转为存量市场，消费者增换购车辆和消费升级的需求愈发强劲；因此，汽车厂商亟待不断创新、提升产品以满足日益升级的消费需求。不合理的汽车设计可能会给驾乘人员带来糟糕的使用体验和负面的口碑评价，从而对汽车销售产生不利影响。因此，在汽车的改款或换代设计过程中，迅速而准确地识别汽车设计缺陷对于制造商至关重要。

当前，对于汽车设计缺陷的监测识别主要是基于人工的评价分析方法，受限于评价的主观性及时效性，在设计缺陷监测识别方面的应用效果不佳、存在较大偏差。

发明内容

针对上述存在的拘束局限性，本发明提出了一种汽车设计缺陷监测识别方法，通过对标杆车型公开评价数据分析获得当前汽车设计的关键指标，基于情感分析和重要性分析确定目标车型对应关键指标的特征评分，借助特征评分筛选出重要性高且情感倾向性偏负面的汽车设计指标，从而识别出汽车设计缺陷。

为实现上述目的，本发明采用了以下技术方案：

一种汽车设计缺陷监测识别方法，所述方法包括以下步骤：

步骤1、收集评价文本数据，基于语义分析技术识别评价指标，获得原始评价指标数据；

步骤2、对原始评价指标数据进行特征分析，筛选获得关键指标；

步骤3、获得目标型号的评价文本数据，并识别分析评价数据中关键指标的情感倾向，得到指标情感数据；

步骤4、将指标情感数据按照关键指标类型进行汇总并计算各关键指标的特征评分得到目标型号指标评分数据；

步骤5、基于目标型号指标评分数据识别设计缺陷指标。

进一步地，步骤1还包括以下步骤：

步骤11、获得预设分析时段内目标细分市场的销售数据，根据预设筛选指标筛选出标杆车型；

步骤12、收集所述标杆车型在预设分析时段内的评价文本，并进行文本预处理，得到评价文本数据；

步骤13、对所述评价文本数据进行评价指标识别，获得原始评价指标数据。

进一步地，步骤2中获得关键指标包括以下步骤：

步骤21、根据原始评价指标数据计算各二级指标的特征值；

步骤22、筛选出原始评价指标数据中的不存在于预设常规指标的二级指标，并标记为新指标；

步骤23、筛选出二级指标特征值符合预设标准、且属于新指标的二级指标，得到关键指标。

进一步地，步骤3具体包括以下步骤：

步骤31、获得目标型号的评价文本，得到目标评价文本数据；

步骤32、对目标评价文本数据进行情感倾向分析，得到文本情感数据；

步骤33、识别文本情感数据中的关键指标，得到指标情感数据。

进一步地，步骤4中目标型号指标评分数据通过以下方式得到：

步骤41、获得指标情感数据中所有关键指标的第一特征系数值；

步骤42、将指标情感数据按照关键指标类型进行汇总，得到各关键指标的所有情感类型结果；

步骤43、计算指标情感数据中所有关键指标的第二特征系数值；

步骤44、基于关键指标的第一特征系数值及第二特征系数值计算所有关键指标的特征评分，得到目标型号指标评分数据。

本发明与现有技术相对比，本发明具有以下优点：

（1）基于评价文本数据进行关键指标筛选，结合重要性及情感倾向计算目标车型关键指标的特征评分并以此进行设计缺陷指标识别，实现自动化汽的车设计缺陷的监测识别；

（2）通过获得公开渠道最新的评价数据，能及时获得最新的关键评价指标与驾乘人员的偏好倾向，识别准确性好。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例，并配合附图，详细说明如下。

附图说明

图1为本发明实施例提供的一种汽车设计缺陷监测识别方法的流程图。

图2为本发明实施例提供的一种评价指标识别方法的流程图。

具体实施方式

以下由特定的具体实施例说明本发明的实施方式，熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。为了进一步了解本发明，下面结合最佳实施例对本发明作进一步的详细说明。

本发明的发明点是提供一种汽车设计缺陷监测识别方法，

参考图1，所述方法包括以下步骤：

步骤2、对原始评价指标数据进行特征分析，筛选获得关键指标；所述关键指标为汽车设计的评价指标；

步骤5、基于目标型号指标评分数据识别设计缺陷指标，获得设计缺陷识别结果。

作为一种实施例，步骤1还包括以下步骤：

步骤12、收集所述标杆车型在预设分析时段内的评价文本，并进行文本预处理，得到评价文本数据；所述文本预处理包括文本清洗、分词、去除停用词；

步骤13、借助语义分析技术对所述评价文本数据进行评价指标识别，获得原始评价指标数据。

进一步地，所述预设筛选指标是指预设分析时段内的平均月销量排名。

进一步地，所述原始评价指标数据由词条ID、品牌车型、原始词条、指标分析结果组成；

所述指标分析结果为评价文本数据中所包含的汽车设计相关指标，由若干一级指标及对应的若干二级指标组成。

下表1是原始评价指标数据的示例性数据表。

表1原始评价指标数据数据表

进一步地，参考图2，步骤13中进行评价指标识别通过以下方式实现：

步骤131、将所述评价文本数据转换为数值特征向量，得到第一评价文本数据；

步骤132、从第一评价文本数据中提取特征数据，得到第一文本特征数据；

步骤133、将第一文本特征数据输入至一级指标识别模型中，得到一级指标识别结果；所述一级指标识别模型为按照自监督学习算法训练得到的预测模型；

步骤134、按照一级指标识别结果对第一评价文本数据进行分类得到若干一级分类组，使得具有相同一级指标的词条归类为一个一级分类组；

步骤135、对第一评价文本数据按照一级分类组分别进行特征提取，得到各一级分类组的文本特征数据；

步骤136、对各分类组的文本特征数据输入至二级指标识别模型中，得到各一级分类组的二级指标识别结果；

评价文本数据与对应的一级指标识别结果、二级指标识别结果共同组成原始评价指标数据。

作为一种实施例，步骤131中将评价文本数据转换为数值特征向量通过词袋模型、TF-IDF算法、词嵌入算法中的任意一种算法实现。

作为一种实施例，步骤132及步骤135中进行特征提取采用主题模型算法实现。

作为一种实施例，所述一级指标识别模型通过以下方式获得：

S1、收集识别模型数据集，所述识别模型数据集由若干词条特征向量和对应的一级指标标签组成；并将所述识别模型数据集拆分为原始训练集和模型测试集；

所述词条特征向量通过原始词条按照步骤131的方式得到；

S2、按照预设自监督任务生成原始训练集中词条特征向量对应的辅助标签；将词条特征向量及对应的辅助标签组合成模型训练集；

S3、基于所述模型训练集借助深度学习算法进行模型训练；

S4、利用所述模型测试集按照预设损失函数评估当前模型的模型性能，并通过反向传播算法更新模型参数；得到一级指标识别模型。

进一步地，所述预设自监督任务为自编码器。

进一步地，所述深度学习算法采用卷积神经网络、循环神经网络、transformer算法中的任意一种算法实现。

需要说明的是，自监督学习机制不依赖于预先定义的标签，可从数据自动学习识别新的标签，故采用自监督学习机制训练所述一级指标识别模型能够识别未出现过的一级指标。

作为一种实施例，所述二级指标识别模型为按照自监督学习算法训练得到的预测模型，所述二级指标识别模型的训练方法与所述一级指标识别模型的训练方法一致。

可以理解的是，二级指标识别模型与一级指标识别模型均为基于自监督学习机制训练得到的深度学习模型，二者在功能上相似，训练步骤也一致，故在此不再赘述。

作为一种实施例，步骤2中获得关键指标包括以下步骤：

步骤21、根据原始评价指标数据计算各二级指标的特征值；

下表2是关键指标的示例性数据表。

表2 关键指标示例数据表

进一步地，步骤21中所述特征值包括：二级指标被提及比例、二级指标被目标群体提及比例。

作为一种实施例，步骤3具体包括以下步骤：

进一步地，步骤32中对目标评价文本数据进行情感倾向分析包括：

步骤321、对目标评价文本数据中的各条评价文本进行分句，得到若干评价文本子句；

步骤322、基于情感倾向分析算法，对各评价文本子句进行情感倾向分析，获得各评价文本子句的情感类型结果，并汇总得到文本情感数据。

所述情感类型结果包括：正向强烈、正向一般、中立、负向一般、负向强烈。

例如，评价文本如下：“我对头部空间比较满意，坐在里面不怎么压抑，纵向距离非常宽敞，腿能伸得开，只是放脚的地方有点小。”

对上述评价文本进行分句操作，可得到以下评价文本子句：

子句1:我对头部空间比较满意，坐在里面不怎么压抑；子句2:纵向距离非常宽敞，腿能伸得开；子句3:只是放脚的地方有点小。

采用情感倾向分析算法，对上述子句1-3分别进行情感倾向分析，得到各个子句的情感类型如下：

子句1:正向一般；子句2:正向强烈；子句3:负向一般。

汇总得到文本情感数据，下表3为上述评价文本得到的文本情感数据。

表3 文本情感数据表

进一步地，所述情感倾向分析算法可采用基于词典的情感分析算法或基于机器学习的情感分析算法中的任意一种算法实现。

基于词典的情感分析算法、基于机器学习的情感分析算法均为当前已公开成熟的情感分析算法，本领域技术人员根据前述实施例的描述均可顺利实现，在此不再赘述。

进一步地，步骤33中获得指标情感数据是指：识别文本情感数据中若干评价文本的各评价文本子句对应的关键指标，提取关键指标及对应的情感类型，得到指标情感数据。

参考表4，表4给出了指标情感数据的示例。

表4指标情感数据表

作为一种实施例，步骤4中目标型号指标评分数据通过以下方式得到：

进一步地，第一特征系数值用于表示各关键指标的重要程度，取值范围为1-10，第一特征系数值越大则表示该关键指标的重要程度越高。

进一步地，第二特征系数值用于表示各关键指标的情感倾向性，取值范围为0-1，第二特征系数值的数值越大表示对该关键指标的情感倾向越消极。

第二特征系数值通过以下方式计算：

其中，ρ ^j表示编号为j的关键指标的第二特征系数值，a _i表示编号为i的情感类型的第二特征权重，x _i ^j表示编号为j的关键指标的情感类型结果中编号为i的情感类型的占比。

进一步地，所述特征评分通过以下方式计算：

其中，β _m表示编号为m的关键指标的特征评分，P _m表示编号为m的关键指标归一化后的第一特征系数值，Q _m表示编号为m的关键指标的归一化后的第二特征系数值。

作为一种实施例，步骤41中的第一特征系数值可通过以下方式获得：

步骤411、从销售回访数据中获得关键指标评价数据；

所述关键指标评价数据是指乘驾人员对关键指标的重要性评价数据；

所述关键指标评价数据由若干组驾乘评价数据组成，所述驾乘评价数据由评价人员id、预设指标数量的关键指标及对应的重要性评分组成；所述重要性评分包括最重要、最不重要和一般三种类型；

步骤412、按照评价人员id对关键指标评价数据进行汇总，计算每个评价人员id对应的所有关键指标的指标个体重要性系数，得到第一指标重要性数据；

对于某一评价人员对应的关键指标评价数据，其指标个体重要性系数的计算方法为：

其中，RPS _i为该评价人员编号为i的关键指标的指标个体重要性系数；d _i为该评价人员的关键指标评价数据中编号为i的关键指标重要性评分为“最重要”的个数；f _i为该评价人员的关键指标评价数据中编号为i的关键指标重要性评分为“最不重要”的个数；D _i为该评价人员的关键指标评价数据中重要性评分为“最重要”的总个数；F _i为该评价人员的关键指标评价数据中重要性评分为“最不重要”的总个数。

步骤413、计算每个关键指标的重要性系数及重要性方差；

关键指标的重要性系数计算方式为：关键指标在第一指标重要性数据中对应的所有指标个体重要性系数的均值；

关键指标的重要性方差计算方式为：关键指标在第一指标重要性数据中对应的所有指标个体重要性系数的方差；

步骤414、按照重要性系数对所有关键指标进行降序排序，得到每个关键指标的重要性排名；按照重要性方差对所有关键指标进行升序排序，得到每个关键指标的重要性方差排名

步骤415、根据每个关键指标的重要性系数及重要性排名计算每个关键指标的第一特征系数值。

所述第一特征系数值的计算方式如下：

其中q _n为编号为n的关键指标的第一特征系数值，PVR _n为编号为n的关键指标的重要性方差排名权值；PSR _n为编号为n的关键指标的重要性排名权值。

所述重要性方差排名权值的计算方式为：

其中VR _n为编号为n的关键指标的重要性方差排名，K为关键指标的总数。

所述重要性排名权值的计算方式为：

其中SR _n为编号为n的关键指标的重要性排名，K为关键指标的总数。

作为一种实施例，步骤5中，识别设计缺陷指标的方式为：若某关键指标的特征评分大于预设评分阈值，则该关键指标为设计缺陷指标。

可以理解的是，按照前述特征评分、第一特征系数值及第二特征系数值的含义，若特征评分的数值越大，则表示对应关键指标的重要性高且情感倾向性偏负面；因此，对于特征评分大于预设评分阈值的关键指标，应视为汽车世纪的缺陷指标，从而完成对汽车设计缺陷的监测识别。

作为一种实施例，本发明所述方法可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路(ASIC)、通用计算机或任何其他类似硬件设备来实现。

本发明所述的方法可以软件程序的形式实施，所述软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，所述软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。

另外，本发明所述方法的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

另外，本发明所述的方法的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本申请的方法和/或技术方案。而调用本发明所述方法的程序指令，可被存储在固定的或可移动的记录介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输，和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。

作为一种实施例，本发明还提供一个装置，该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发该装置运行基于前述的多个实施例的方法和/或技术方案。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本申请所必须的。

最后，需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

另外，各个实施例之间的技术方案可以互相结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求保护的范围之内。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明,任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种汽车设计缺陷监测识别方法，其特征在于，

所述方法包括以下步骤：

步骤3、获得目标型号的评价文本数据，并识别分析评价文本数据中关键指标的情感倾向，得到指标情感数据；

步骤5、基于目标型号指标评分数据识别设计缺陷指标；

其中，步骤4中目标型号指标评分数据通过以下方式得到：

步骤41、获得指标情感数据中所有关键指标的第一特征系数值，所述第一特征系数值用于表示各关键指标的重要程度，取值范围为1-10，第一特征系数值越大则表示该关键指标的重要程度越高；所述第一特征系数值的计算方式如下：

；

其中q _n为编号为n的关键指标的第一特征系数值，PVR _n为编号为n的关键指标的重要性方差排名权值；PSR _n为编号为n的关键指标的重要性排名权值；

关键指标的重要性方差计算方式为：关键指标在第一指标重要性数据中对应的所有指标个体重要性系数的方差，所述重要性方差排名权值的计算方式为：

；

其中VR _n为编号为n的关键指标的重要性方差排名，K为关键指标的总数；

关键指标的重要性系数计算方式为：关键指标在第一指标重要性数据中对应的所有指标个体重要性系数的均值，所述重要性排名权值的计算方式为：

；

其中SR _n为编号为n的关键指标的重要性排名，K为关键指标的总数；

步骤43、计算指标情感数据中所有关键指标的第二特征系数值，所述第二特征系数值用于表示各关键指标的情感倾向性，取值范围为0-1，第二特征系数值的数值越大表示对该关键指标的情感倾向越消极；

步骤44、基于关键指标的第一特征系数值及第二特征系数值计算所有关键指标的特征评分，得到目标型号指标评分数据，若关键指标的特征评分大于预设评分阈值，则该关键指标为设计缺陷指标；

所述特征评分通过以下方式计算：

；

2.根据权利要求1所述的方法，其特征在于，

步骤1还包括以下步骤：

3.根据权利要求2所述的方法，其特征在于，

步骤13中进行评价指标识别通过以下方式实现：

步骤131、将评价文本数据转换为数值特征向量，得到第一评价文本数据；

步骤133、将第一文本特征数据输入至一级指标识别模型中，得到一级指标识别结果；

所述一级指标识别模型为按照自监督学习算法训练得到的预测模型；

4.根据权利要求3所述的方法，其特征在于，

所述一级指标识别模型通过以下方式获得：

所述词条特征向量通过原始词条按照步骤131的方式得到；

S3、基于所述模型训练集借助深度学习算法进行模型训练；

5.根据权利要求1所述的方法，其特征在于，

步骤2中获得关键指标包括以下步骤：

步骤21、根据原始评价指标数据计算各二级指标的特征值；

6.根据权利要求1所述的方法，其特征在于，

步骤3具体包括以下步骤：

7.根据权利要求6所述的方法，其特征在于，

步骤32中对目标评价文本数据进行情感倾向分析包括：

8.根据权利要求1所述的方法，其特征在于，

所述第二特征系数值通过以下方式计算：

；