CN117688137B

CN117688137B - 应用于汽车营销管理系统软件的数据分析方法及系统

Info

Publication number: CN117688137B
Application number: CN202410129495.1A
Authority: CN
Inventors: 陈其超; 刘斌良; 刘纪
Original assignee: Chengdu Aeronautic Polytechnic
Current assignee: Chengdu Aeronautic Polytechnic
Priority date: 2024-01-31
Filing date: 2024-01-31
Publication date: 2024-04-12
Anticipated expiration: 2044-01-31
Also published as: CN117688137A

Abstract

本发明公开了一种应用于汽车营销管理系统软件的数据分析方法及系统，属于语义识别技术领域，包括：采用历史用户需求文本，构建训练样本对车型匹配模型进行训练，采用训练后的车型匹配模型对当前用户需求样本进行处理，得到与当前用户需求匹配的车型；本发明利用语义识别技术来处理用户需求文本，快速找到与用户需求匹配的车型，缩短了匹配时间；本发明为了提高匹配车型的准确度，在进行特征提取时，本发明的车型匹配模型中包含多个词组特征提取通道，每个词组特征提取通道处理一个词组向量，保障了一个词组向量中各个编码不掺入其他词组向量的编码，提高了特征提取的精度，从而提高了车型匹配准确度。

Description

应用于汽车营销管理系统软件的数据分析方法及系统

技术领域

本发明涉及语义识别技术领域，具体涉及一种应用于汽车营销管理系统软件的数据分析方法及系统。

背景技术

现有汽车营销管理系统软件的一部分功能是用于客服与用户进行沟通，根据用户的描述，客服找到与用户相匹配的车型，进而推荐给用户，但客服人员通常熟悉的是用户常问的指标，例如：颜色、价格和油耗等；对车有更高需求的用户更关心细节的结构和性能，涉及罕见的指标，例如：轴距、发动机最大扭矩和发动机最大功率等。因此，客服通过用户描述进行车辆选型，存在罕见指标不熟悉，造成难以快速精确匹配出最合适车型的问题，因此，需要一种基于用户需求的快速车型匹配方案。

发明内容

针对现有技术中的上述不足，本发明提供的一种应用于汽车营销管理系统软件的数据分析方法及系统解决了人工匹配车型时间长，准确度差的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种应用于汽车营销管理系统软件的数据分析方法，包括以下步骤：

S1、根据历史用户需求文本，构建训练样本；

S2、采用训练样本对车型匹配模型进行训练，得到训练完成的车型匹配模型；

S3、通过汽车营销管理系统软件录入当前用户需求文本；

S4、对当前用户需求文本进行分词和向量化处理，得到当前用户需求样本；

S5、将当前用户需求样本中每个词组向量输入车型匹配模型中每个词组特征提取通道中，进行多词组特征提取，得到与当前用户需求匹配的车型。

进一步地，所述S1包括以下分步骤：

S11、将历史用户需求文本进行分词处理，提取有效词组，构成词组样本，其中，词组样本中包含多个有效词组，有效词组包括：车辆颜色、油耗、价格、发动机功率、油耗和尺寸；

S12、将词组样本向量化处理，得到词组向量样本，其中，词组向量样本包括多个词组向量；

S13、采用车型对词组向量样本进行标注标签，得到训练样本。

上述进一步地方案的有益效果为：本发明中对用户需求文本进行了分词处理，将有效词组提取出来，构成词组样本，对词组样本向量化处理，使得词组样本变成词组向量样本，每个词组向量样本中包含各个有效词组向量化后的词组向量，再标注上标签，其标签就表明该词组向量样本的对应车型。

进一步地，所述S2中车型匹配模型包括：词组特征提取通道、Concat层、LSTM层和分类层，其中，词组特征提取通道的数量大于等于2；

每个所述词组特征提取通道的输入端用于输入一个词组向量；所述Concat层的输入端分别与多个词组特征提取通道的输出端连接，其输出端与LSTM层的输入端连接；所述分类层的输入端与LSTM层的输出端连接，其输出端作为车型匹配模型的输出端。

上述进一步地方案的有益效果为：本发明中车型匹配模型设置了多个词组特征提取通道，每个词组特征提取通道处理一个对应的词组向量，实现不同词组向量的分开处理，再在Concat层处进行特征拼接，得到拼接特征，采用LSTM层更好感应前后语义关系，提高语义特征提取精度。

进一步地，所述词组特征提取通道包括：行卷积层、列卷积层、转置运算层、乘法器、平均池化层、最大池化层、加法器、特征提取层和矩阵运算器；

所述行卷积层的输入端与转置运算层的输入端连接，并作为词组特征提取通道的输入端；所述转置运算层的输出端与列卷积层的输入端连接；所述乘法器的第一输入端与行卷积层的输出端连接，其第二输入端与列卷积层的输出端连接，其输出端分别与平均池化层的输入端和最大池化层的输入端连接；所述加法器的第一输入端与平均池化层的输出端连接，其第二输入端与最大池化层的输出端连接，其输出端分别与特征提取层的输入端和矩阵运算器的第一输入端连接；所述矩阵运算器的第二输入端与特征提取层的输出端连接，其输出端作为词组特征提取通道的输出端。

进一步地，所述转置运算层用于对词组向量进行转置运算，得到列向量，所述行卷积层用于对词组向量进行一维卷积运算，所述列卷积层用于对列向量进行一维卷积运算。

上述进一步地方案的有益效果为：本发明词组特征提取通道中设置行卷积层用于对词组向量进行一维的卷积运算，得到行特征值，设置转置运算层用于将词组向量变成列向量，再采用列卷积层进行一维卷积运算，得到列特征值，在乘法器处，构建为特征矩阵，便于后续平均池化层和最大池化层处理，加法器融合平均池化层输出的全局特征和最大池化层的显著特征，并输入特征提取层中进行再次特征提取，矩阵运算器实现将特征提取层的输出与加法器的输出进行融合，实现自适应特征增强，将增强后的特征输入Concat层进行拼接。

进一步地，所述特征提取层的表达式为：

，

其中，为特征提取层的第n个输出，tanh为双曲正切函数，sigmoid为S型激活函数，x_n为特征提取层的第n个输入，w_n为第n个输入x_n的权重，b_n为第n个输入x_n的偏置；

所述矩阵运算器的计算公式为：

，

其中，v_n为矩阵运算器的第n个输出，e为自然常数，γ为比例系数，N为特征提取层输出的数量。

上述进一步地方案的有益效果为：在特征提取层中通过双曲正切函数tanh和S型激活函数sigmoid实现双重特征提取，特征提取层的第n个输入x_n通过双曲正切函数tanh提取到的特征与采用S型激活函数sigmoid提取的特征相乘，达到充分提取特征的目的，在矩阵运算器处实现特征提取层的输出对加法器输出的加权，实现自适应的增强或削弱特征关注度。

进一步地，所述S2包括以下分步骤：

S21、将训练样本输入到车型匹配模型中，得到车型匹配模型的输出；

S22、根据车型匹配模型的输出，基于损失函数，计算损失值；

S23、判断损失值是否大于阈值，若是，则跳转至步骤S24、若否，则车型匹配模型训练完成，结束分步骤；

S24、对车型匹配模型中权重进行更新，并跳转至步骤S21。

进一步地，所述S22中损失函数为：

，

其中，E_i为第i次训练时的损失值，y_i,j为第i次训练时车型匹配模型输出的第j个数值，为第i次训练时标签的第j个数值，ln为对数函数，e为自然常数，M为车型匹配模型输出的数值的数量。

上述进一步地方案的有益效果为：本发明中将每次训练的车型匹配模型输出与标签进行比较，尽可能的体现出两者的差距，更好训练车型匹配模型的权重，本发明中损失函数一方面通过指数函数放大两者数值上的差距，并通过对数函数缩减部分指数函数放大的效果，避免权重下降幅度过大，但是仅数值上的差距无法体现两者的相似情况，因此，本发明利用两者的相似情况和数值上的差距，同时表征出训练时的损失情况。

进一步地，所述S24中对车型匹配模型中权重进行更新包括：根据损失值，更新分类层的权重；根据损失值，更新LSTM层的权重；根据损失值，更新词组特征提取通道的权重；

所述更新分类层的权重的公式为：

，

其中，w_c,i+1为第i+1次训练时分类层的权重，w_c,i为第i次训练时分类层的权重，E_i为第i次训练时的损失值，e为自然常数；

所述更新LSTM层的权重的公式为：

，

其中，w_L,i+1为第i+1次训练时LSTM层的权重，w_L,i为第i次训练时LSTM层的权重，μ为大于1的增强系数；

所述更新词组特征提取通道的权重的公式为：

，

其中，w_P,i+1为第i+1次训练时词组特征提取通道的权重，w_P,i为第i次训练时词组特征提取通道的权重，tanh为双曲正切函数。

上述进一步地方案的有益效果为：在训练时，容易出现梯度消失的问题，导致靠近车型匹配模型输入端的结构的权重无法得到有效训练，因此，本发明将车型匹配模型分成三部分，分别进行权重的更新，LSTM层的权重和词组特征提取通道的权重的下降情况依次增强，防止出现梯度消失的问题。

一种应用于汽车营销管理系统软件的数据分析方法的系统，包括：训练样本构建单元、训练单元、汽车营销管理系统软件、当前用户需求样本构建单元和匹配单元；

所述训练样本构建单元用于根据历史用户需求文本，构建训练样本；所述训练单元用于采用训练样本对车型匹配模型进行训练，得到训练完成的车型匹配模型；所述汽车营销管理系统软件用于录入当前用户需求文本；所述当前用户需求样本构建单元用于对当前用户需求文本进行分词和向量化处理，得到当前用户需求样本；所述匹配单元用于将当前用户需求样本中每个词组向量输入车型匹配模型中每个词组特征提取通道中，进行多词组特征提取，得到与当前用户需求匹配的车型。

综上，本发明的有益效果为：

1、本发明利用语义识别技术来处理用户需求文本，快速找到与用户需求匹配的车型，缩短了匹配时间。

2、现有采用语义识别技术来处理用户需求文本，从而提取出用户需求特征，存在以下问题：文本在向量化处理后是一维向量，现有技术将一维向量直接整理成矩阵，从而便于卷积神经网络进行处理，但是一维向量整理成矩阵，使得属于各个词组向量的编码位置发生了改变，容易造成语义混乱，存在用户需求提取的准确度差的问题；本发明为了提高匹配车型的准确度，在进行特征提取时，本发明的车型匹配模型中包含多个词组特征提取通道，每个词组特征提取通道处理一个词组向量，保障了一个词组向量中各个编码不掺入其他词组向量的编码，提高了特征提取的精度，从而提高了车型匹配准确度。

附图说明

图1为一种应用于汽车营销管理系统软件的数据分析方法的流程图；

图2为车型匹配模型的结构示意图；

图3为词组特征提取通道的结构示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，一种应用于汽车营销管理系统软件的数据分析方法，包括以下步骤：

S1、根据历史用户需求文本，构建训练样本；

S3、通过汽车营销管理系统软件录入当前用户需求文本；

S1包括以下分步骤：

本发明中对用户需求文本进行了分词处理，将有效词组提取出来，构成词组样本，对词组样本向量化处理，使得词组样本变成词组向量样本，每个词组向量样本中包含各个有效词组向量化后的词组向量，再标注上标签，其标签就表明该词组向量样本的对应车型。

本发明中步骤S4的分词和向量化处理与步骤S1中的分步骤相同。

如图2所示，S2中车型匹配模型包括：词组特征提取通道、Concat层、LSTM层和分类层，其中，词组特征提取通道的数量大于等于2；

每个词组特征提取通道的输入端用于输入一个词组向量；Concat层的输入端分别与多个词组特征提取通道的输出端连接，其输出端与LSTM层的输入端连接；分类层的输入端与LSTM层的输出端连接，其输出端作为车型匹配模型的输出端。

本发明中车型匹配模型设置了多个词组特征提取通道，每个词组特征提取通道处理一个对应的词组向量，实现不同词组向量的分开处理，再在Concat层处进行特征拼接，得到拼接特征，采用LSTM层更好感应前后语义关系，提高语义特征提取精度。

在本实施例中，分类层可采用BP神经网络、CTC分类器等。

如图3所示，词组特征提取通道包括：行卷积层、列卷积层、转置运算层、乘法器、平均池化层、最大池化层、加法器、特征提取层和矩阵运算器；

行卷积层的输入端与转置运算层的输入端连接，并作为词组特征提取通道的输入端；转置运算层的输出端与列卷积层的输入端连接；乘法器的第一输入端与行卷积层的输出端连接，其第二输入端与列卷积层的输出端连接，其输出端分别与平均池化层的输入端和最大池化层的输入端连接；加法器的第一输入端与平均池化层的输出端连接，其第二输入端与最大池化层的输出端连接，其输出端分别与特征提取层的输入端和矩阵运算器的第一输入端连接；矩阵运算器的第二输入端与特征提取层的输出端连接，其输出端作为词组特征提取通道的输出端。

转置运算层用于对词组向量进行转置运算，得到列向量，行卷积层用于对词组向量进行一维卷积运算，列卷积层用于对列向量进行一维卷积运算。

本发明词组特征提取通道中设置行卷积层用于对词组向量进行一维的卷积运算，得到行特征值，设置转置运算层用于将词组向量变成列向量，再采用列卷积层进行一维卷积运算，得到列特征值，在乘法器处，构建为特征矩阵，便于后续平均池化层和最大池化层处理，加法器融合平均池化层输出的全局特征和最大池化层的显著特征，并输入特征提取层中进行再次特征提取，矩阵运算器实现将特征提取层的输出与加法器的输出进行融合，实现自适应特征增强，将增强后的特征输入Concat层进行拼接。

特征提取层的表达式为：

，

矩阵运算器的计算公式为：

，

在特征提取层中通过双曲正切函数tanh和S型激活函数sigmoid实现双重特征提取，特征提取层的第n个输入x_n通过双曲正切函数tanh提取到的特征与采用S型激活函数sigmoid提取的特征相乘，达到充分提取特征的目的，在矩阵运算器处实现特征提取层的输出对加法器输出的加权，实现自适应的增强或削弱特征关注度。

S2包括以下分步骤：

S24、对车型匹配模型中权重进行更新，并跳转至步骤S21。

S22中损失函数为：

，

本发明中将每次训练的车型匹配模型输出与标签进行比较，尽可能的体现出两者的差距，更好训练车型匹配模型的权重，本发明中损失函数一方面通过指数函数放大两者数值上的差距，并通过对数函数缩减部分指数函数放大的效果，避免权重下降幅度过大，但是仅数值上的差距无法体现两者的相似情况，因此，本发明利用两者的相似情况和数值上的差距，同时表征出训练时的损失情况。

S24中对车型匹配模型中权重进行更新包括：根据损失值，更新分类层的权重；根据损失值，更新LSTM层的权重；根据损失值，更新词组特征提取通道的权重；

更新分类层的权重的公式为：

，

更新LSTM层的权重的公式为：

，

更新词组特征提取通道的权重的公式为：

，

在训练时，容易出现梯度消失的问题，导致靠近车型匹配模型输入端的结构的权重无法得到有效训练，因此，本发明将车型匹配模型分成三部分，分别进行权重的更新，LSTM层的权重和词组特征提取通道的权重的下降情况依次增强，防止出现梯度消失的问题。

本发明中，在更新LSTM层的权重时，设置增强系数，增大LSTM层的权重的下降幅度，在对更新词组特征提取通道的权重时，采用双曲正切函数tanh在更新LSTM层的权重幅度的基础上新增部分下降幅度，进一步的增加下降幅度，从而实现三部分同时进行权重更新，但是更新幅度不同，增加权重组合方式，提高车型匹配模型的匹配精度。

训练样本构建单元用于根据历史用户需求文本，构建训练样本；训练单元用于采用训练样本对车型匹配模型进行训练，得到训练完成的车型匹配模型；汽车营销管理系统软件用于录入当前用户需求文本；当前用户需求样本构建单元用于对当前用户需求文本进行分词和向量化处理，得到当前用户需求样本；匹配单元用于将当前用户需求样本中每个词组向量输入车型匹配模型中每个词组特征提取通道中，进行多词组特征提取，得到与当前用户需求匹配的车型。

本发明中系统处理的具体过程与方法相同。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种应用于汽车营销管理系统软件的数据分析方法，其特征在于，包括以下步骤：

S1、根据历史用户需求文本，构建训练样本；

S3、通过汽车营销管理系统软件录入当前用户需求文本；

S5、将当前用户需求样本中每个词组向量输入车型匹配模型中每个词组特征提取通道中，进行多词组特征提取，得到与当前用户需求匹配的车型；

所述S2中车型匹配模型包括：词组特征提取通道、Concat层、LSTM层和分类层，其中，词组特征提取通道的数量大于等于2；

每个所述词组特征提取通道的输入端用于输入一个词组向量；所述Concat层的输入端分别与多个词组特征提取通道的输出端连接，其输出端与LSTM层的输入端连接；所述分类层的输入端与LSTM层的输出端连接，其输出端作为车型匹配模型的输出端；

所述词组特征提取通道包括：行卷积层、列卷积层、转置运算层、乘法器、平均池化层、最大池化层、加法器、特征提取层和矩阵运算器；

所述行卷积层的输入端与转置运算层的输入端连接，并作为词组特征提取通道的输入端；所述转置运算层的输出端与列卷积层的输入端连接；所述乘法器的第一输入端与行卷积层的输出端连接，其第二输入端与列卷积层的输出端连接，其输出端分别与平均池化层的输入端和最大池化层的输入端连接；所述加法器的第一输入端与平均池化层的输出端连接，其第二输入端与最大池化层的输出端连接，其输出端分别与特征提取层的输入端和矩阵运算器的第一输入端连接；所述矩阵运算器的第二输入端与特征提取层的输出端连接，其输出端作为词组特征提取通道的输出端；

所述转置运算层用于对词组向量进行转置运算，得到列向量，所述行卷积层用于对词组向量进行一维卷积运算，所述列卷积层用于对列向量进行一维卷积运算；

所述特征提取层的表达式为：

，

所述矩阵运算器的计算公式为：

，

其中，v_n为矩阵运算器的第n个输出，e为自然常数，γ为比例系数，N为特征提取层输出的数量；

所述S2包括以下分步骤：

S24、对车型匹配模型中权重进行更新，并跳转至步骤S21；

所述S22中损失函数为：

，

其中，E_i为第i次训练时的损失值，y_i,j为第i次训练时车型匹配模型输出的第j个数值，为第i次训练时标签的第j个数值，ln为对数函数，e为自然常数，M为车型匹配模型输出的数值的数量；

所述S24中对车型匹配模型中权重进行更新包括：根据损失值，更新分类层的权重；根据损失值，更新LSTM层的权重；根据损失值，更新词组特征提取通道的权重；

所述更新分类层的权重的公式为：

，

所述更新LSTM层的权重的公式为：

，

所述更新词组特征提取通道的权重的公式为：

，

2.根据权利要求1所述的应用于汽车营销管理系统软件的数据分析方法，其特征在于，所述S1包括以下分步骤：

3.根据权利要求1~2任一项所述的应用于汽车营销管理系统软件的数据分析方法的系统，其特征在于，包括：训练样本构建单元、训练单元、汽车营销管理系统软件、当前用户需求样本构建单元和匹配单元；