CN117688137B - 应用于汽车营销管理系统软件的数据分析方法及系统 - Google Patents
应用于汽车营销管理系统软件的数据分析方法及系统 Download PDFInfo
- Publication number
- CN117688137B CN117688137B CN202410129495.1A CN202410129495A CN117688137B CN 117688137 B CN117688137 B CN 117688137B CN 202410129495 A CN202410129495 A CN 202410129495A CN 117688137 B CN117688137 B CN 117688137B
- Authority
- CN
- China
- Prior art keywords
- layer
- phrase
- model
- feature extraction
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000007405 data analysis Methods 0.000 title claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 86
- 238000012549 training Methods 0.000 claims abstract description 80
- 239000013598 vector Substances 0.000 claims abstract description 61
- 239000011159 matrix material Substances 0.000 claims description 26
- 238000011176 pooling Methods 0.000 claims description 26
- 230000017105 transposition Effects 0.000 claims description 15
- 230000011218 segmentation Effects 0.000 claims description 13
- 238000010276 construction Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 11
- 239000000446 fuel Substances 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 6
- 230000009191 jumping Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000004904 shortening Methods 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003313 weakening effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
- G06Q30/015—Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种应用于汽车营销管理系统软件的数据分析方法及系统,属于语义识别技术领域,包括:采用历史用户需求文本,构建训练样本对车型匹配模型进行训练,采用训练后的车型匹配模型对当前用户需求样本进行处理,得到与当前用户需求匹配的车型;本发明利用语义识别技术来处理用户需求文本,快速找到与用户需求匹配的车型,缩短了匹配时间;本发明为了提高匹配车型的准确度,在进行特征提取时,本发明的车型匹配模型中包含多个词组特征提取通道,每个词组特征提取通道处理一个词组向量,保障了一个词组向量中各个编码不掺入其他词组向量的编码,提高了特征提取的精度,从而提高了车型匹配准确度。
Description
技术领域
本发明涉及语义识别技术领域,具体涉及一种应用于汽车营销管理系统软件的数据分析方法及系统。
背景技术
现有汽车营销管理系统软件的一部分功能是用于客服与用户进行沟通,根据用户的描述,客服找到与用户相匹配的车型,进而推荐给用户,但客服人员通常熟悉的是用户常问的指标,例如:颜色、价格和油耗等;对车有更高需求的用户更关心细节的结构和性能,涉及罕见的指标,例如:轴距、发动机最大扭矩和发动机最大功率等。因此,客服通过用户描述进行车辆选型,存在罕见指标不熟悉,造成难以快速精确匹配出最合适车型的问题,因此,需要一种基于用户需求的快速车型匹配方案。
发明内容
针对现有技术中的上述不足,本发明提供的一种应用于汽车营销管理系统软件的数据分析方法及系统解决了人工匹配车型时间长,准确度差的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种应用于汽车营销管理系统软件的数据分析方法,包括以下步骤:
S1、根据历史用户需求文本,构建训练样本;
S2、采用训练样本对车型匹配模型进行训练,得到训练完成的车型匹配模型;
S3、通过汽车营销管理系统软件录入当前用户需求文本;
S4、对当前用户需求文本进行分词和向量化处理,得到当前用户需求样本;
S5、将当前用户需求样本中每个词组向量输入车型匹配模型中每个词组特征提取通道中,进行多词组特征提取,得到与当前用户需求匹配的车型。
进一步地,所述S1包括以下分步骤:
S11、将历史用户需求文本进行分词处理,提取有效词组,构成词组样本,其中,词组样本中包含多个有效词组,有效词组包括:车辆颜色、油耗、价格、发动机功率、油耗和尺寸;
S12、将词组样本向量化处理,得到词组向量样本,其中,词组向量样本包括多个词组向量;
S13、采用车型对词组向量样本进行标注标签,得到训练样本。
上述进一步地方案的有益效果为:本发明中对用户需求文本进行了分词处理,将有效词组提取出来,构成词组样本,对词组样本向量化处理,使得词组样本变成词组向量样本,每个词组向量样本中包含各个有效词组向量化后的词组向量,再标注上标签,其标签就表明该词组向量样本的对应车型。
进一步地,所述S2中车型匹配模型包括:词组特征提取通道、Concat层、LSTM层和分类层,其中,词组特征提取通道的数量大于等于2;
每个所述词组特征提取通道的输入端用于输入一个词组向量;所述Concat层的输入端分别与多个词组特征提取通道的输出端连接,其输出端与LSTM层的输入端连接;所述分类层的输入端与LSTM层的输出端连接,其输出端作为车型匹配模型的输出端。
上述进一步地方案的有益效果为:本发明中车型匹配模型设置了多个词组特征提取通道,每个词组特征提取通道处理一个对应的词组向量,实现不同词组向量的分开处理,再在Concat层处进行特征拼接,得到拼接特征,采用LSTM层更好感应前后语义关系,提高语义特征提取精度。
进一步地,所述词组特征提取通道包括:行卷积层、列卷积层、转置运算层、乘法器、平均池化层、最大池化层、加法器、特征提取层和矩阵运算器;
所述行卷积层的输入端与转置运算层的输入端连接,并作为词组特征提取通道的输入端;所述转置运算层的输出端与列卷积层的输入端连接;所述乘法器的第一输入端与行卷积层的输出端连接,其第二输入端与列卷积层的输出端连接,其输出端分别与平均池化层的输入端和最大池化层的输入端连接;所述加法器的第一输入端与平均池化层的输出端连接,其第二输入端与最大池化层的输出端连接,其输出端分别与特征提取层的输入端和矩阵运算器的第一输入端连接;所述矩阵运算器的第二输入端与特征提取层的输出端连接,其输出端作为词组特征提取通道的输出端。
进一步地,所述转置运算层用于对词组向量进行转置运算,得到列向量,所述行卷积层用于对词组向量进行一维卷积运算,所述列卷积层用于对列向量进行一维卷积运算。
上述进一步地方案的有益效果为:本发明词组特征提取通道中设置行卷积层用于对词组向量进行一维的卷积运算,得到行特征值,设置转置运算层用于将词组向量变成列向量,再采用列卷积层进行一维卷积运算,得到列特征值,在乘法器处,构建为特征矩阵,便于后续平均池化层和最大池化层处理,加法器融合平均池化层输出的全局特征和最大池化层的显著特征,并输入特征提取层中进行再次特征提取,矩阵运算器实现将特征提取层的输出与加法器的输出进行融合,实现自适应特征增强,将增强后的特征输入Concat层进行拼接。
进一步地,所述特征提取层的表达式为:
,
其中,为特征提取层的第n个输出,tanh为双曲正切函数,sigmoid为S型激活函数,xn为特征提取层的第n个输入,wn为第n个输入xn的权重,bn为第n个输入xn的偏置;
所述矩阵运算器的计算公式为:
,
其中,vn为矩阵运算器的第n个输出,e为自然常数,γ为比例系数,N为特征提取层输出的数量。
上述进一步地方案的有益效果为:在特征提取层中通过双曲正切函数tanh和S型激活函数sigmoid实现双重特征提取,特征提取层的第n个输入xn通过双曲正切函数tanh提取到的特征与采用S型激活函数sigmoid提取的特征相乘,达到充分提取特征的目的,在矩阵运算器处实现特征提取层的输出对加法器输出的加权,实现自适应的增强或削弱特征关注度。
进一步地,所述S2包括以下分步骤:
S21、将训练样本输入到车型匹配模型中,得到车型匹配模型的输出;
S22、根据车型匹配模型的输出,基于损失函数,计算损失值;
S23、判断损失值是否大于阈值,若是,则跳转至步骤S24、若否,则车型匹配模型训练完成,结束分步骤;
S24、对车型匹配模型中权重进行更新,并跳转至步骤S21。
进一步地,所述S22中损失函数为:
,
其中,Ei为第i次训练时的损失值,yi,j为第i次训练时车型匹配模型输出的第j个数值,为第i次训练时标签的第j个数值,ln为对数函数,e为自然常数,M为车型匹配模型输出的数值的数量。
上述进一步地方案的有益效果为:本发明中将每次训练的车型匹配模型输出与标签进行比较,尽可能的体现出两者的差距,更好训练车型匹配模型的权重,本发明中损失函数一方面通过指数函数放大两者数值上的差距,并通过对数函数缩减部分指数函数放大的效果,避免权重下降幅度过大,但是仅数值上的差距无法体现两者的相似情况,因此,本发明利用两者的相似情况和数值上的差距,同时表征出训练时的损失情况。
进一步地,所述S24中对车型匹配模型中权重进行更新包括:根据损失值,更新分类层的权重;根据损失值,更新LSTM层的权重;根据损失值,更新词组特征提取通道的权重;
所述更新分类层的权重的公式为:
,
其中,wc,i+1为第i+1次训练时分类层的权重,wc,i为第i次训练时分类层的权重,Ei为第i次训练时的损失值,e为自然常数;
所述更新LSTM层的权重的公式为:
,
其中,wL,i+1为第i+1次训练时LSTM层的权重,wL,i为第i次训练时LSTM层的权重,μ为大于1的增强系数;
所述更新词组特征提取通道的权重的公式为:
,
其中,wP,i+1为第i+1次训练时词组特征提取通道的权重,wP,i为第i次训练时词组特征提取通道的权重,tanh为双曲正切函数。
上述进一步地方案的有益效果为:在训练时,容易出现梯度消失的问题,导致靠近车型匹配模型输入端的结构的权重无法得到有效训练,因此,本发明将车型匹配模型分成三部分,分别进行权重的更新,LSTM层的权重和词组特征提取通道的权重的下降情况依次增强,防止出现梯度消失的问题。
一种应用于汽车营销管理系统软件的数据分析方法的系统,包括:训练样本构建单元、训练单元、汽车营销管理系统软件、当前用户需求样本构建单元和匹配单元;
所述训练样本构建单元用于根据历史用户需求文本,构建训练样本;所述训练单元用于采用训练样本对车型匹配模型进行训练,得到训练完成的车型匹配模型;所述汽车营销管理系统软件用于录入当前用户需求文本;所述当前用户需求样本构建单元用于对当前用户需求文本进行分词和向量化处理,得到当前用户需求样本;所述匹配单元用于将当前用户需求样本中每个词组向量输入车型匹配模型中每个词组特征提取通道中,进行多词组特征提取,得到与当前用户需求匹配的车型。
综上,本发明的有益效果为:
1、本发明利用语义识别技术来处理用户需求文本,快速找到与用户需求匹配的车型,缩短了匹配时间。
2、现有采用语义识别技术来处理用户需求文本,从而提取出用户需求特征,存在以下问题:文本在向量化处理后是一维向量,现有技术将一维向量直接整理成矩阵,从而便于卷积神经网络进行处理,但是一维向量整理成矩阵,使得属于各个词组向量的编码位置发生了改变,容易造成语义混乱,存在用户需求提取的准确度差的问题;本发明为了提高匹配车型的准确度,在进行特征提取时,本发明的车型匹配模型中包含多个词组特征提取通道,每个词组特征提取通道处理一个词组向量,保障了一个词组向量中各个编码不掺入其他词组向量的编码,提高了特征提取的精度,从而提高了车型匹配准确度。
附图说明
图1为一种应用于汽车营销管理系统软件的数据分析方法的流程图;
图2为车型匹配模型的结构示意图;
图3为词组特征提取通道的结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种应用于汽车营销管理系统软件的数据分析方法,包括以下步骤:
S1、根据历史用户需求文本,构建训练样本;
S2、采用训练样本对车型匹配模型进行训练,得到训练完成的车型匹配模型;
S3、通过汽车营销管理系统软件录入当前用户需求文本;
S4、对当前用户需求文本进行分词和向量化处理,得到当前用户需求样本;
S5、将当前用户需求样本中每个词组向量输入车型匹配模型中每个词组特征提取通道中,进行多词组特征提取,得到与当前用户需求匹配的车型。
S1包括以下分步骤:
S11、将历史用户需求文本进行分词处理,提取有效词组,构成词组样本,其中,词组样本中包含多个有效词组,有效词组包括:车辆颜色、油耗、价格、发动机功率、油耗和尺寸;
S12、将词组样本向量化处理,得到词组向量样本,其中,词组向量样本包括多个词组向量;
S13、采用车型对词组向量样本进行标注标签,得到训练样本。
本发明中对用户需求文本进行了分词处理,将有效词组提取出来,构成词组样本,对词组样本向量化处理,使得词组样本变成词组向量样本,每个词组向量样本中包含各个有效词组向量化后的词组向量,再标注上标签,其标签就表明该词组向量样本的对应车型。
本发明中步骤S4的分词和向量化处理与步骤S1中的分步骤相同。
如图2所示,S2中车型匹配模型包括:词组特征提取通道、Concat层、LSTM层和分类层,其中,词组特征提取通道的数量大于等于2;
每个词组特征提取通道的输入端用于输入一个词组向量;Concat层的输入端分别与多个词组特征提取通道的输出端连接,其输出端与LSTM层的输入端连接;分类层的输入端与LSTM层的输出端连接,其输出端作为车型匹配模型的输出端。
本发明中车型匹配模型设置了多个词组特征提取通道,每个词组特征提取通道处理一个对应的词组向量,实现不同词组向量的分开处理,再在Concat层处进行特征拼接,得到拼接特征,采用LSTM层更好感应前后语义关系,提高语义特征提取精度。
在本实施例中,分类层可采用BP神经网络、CTC分类器等。
如图3所示,词组特征提取通道包括:行卷积层、列卷积层、转置运算层、乘法器、平均池化层、最大池化层、加法器、特征提取层和矩阵运算器;
行卷积层的输入端与转置运算层的输入端连接,并作为词组特征提取通道的输入端;转置运算层的输出端与列卷积层的输入端连接;乘法器的第一输入端与行卷积层的输出端连接,其第二输入端与列卷积层的输出端连接,其输出端分别与平均池化层的输入端和最大池化层的输入端连接;加法器的第一输入端与平均池化层的输出端连接,其第二输入端与最大池化层的输出端连接,其输出端分别与特征提取层的输入端和矩阵运算器的第一输入端连接;矩阵运算器的第二输入端与特征提取层的输出端连接,其输出端作为词组特征提取通道的输出端。
转置运算层用于对词组向量进行转置运算,得到列向量,行卷积层用于对词组向量进行一维卷积运算,列卷积层用于对列向量进行一维卷积运算。
本发明词组特征提取通道中设置行卷积层用于对词组向量进行一维的卷积运算,得到行特征值,设置转置运算层用于将词组向量变成列向量,再采用列卷积层进行一维卷积运算,得到列特征值,在乘法器处,构建为特征矩阵,便于后续平均池化层和最大池化层处理,加法器融合平均池化层输出的全局特征和最大池化层的显著特征,并输入特征提取层中进行再次特征提取,矩阵运算器实现将特征提取层的输出与加法器的输出进行融合,实现自适应特征增强,将增强后的特征输入Concat层进行拼接。
特征提取层的表达式为:
,
其中,为特征提取层的第n个输出,tanh为双曲正切函数,sigmoid为S型激活函数,xn为特征提取层的第n个输入,wn为第n个输入xn的权重,bn为第n个输入xn的偏置;
矩阵运算器的计算公式为:
,
其中,vn为矩阵运算器的第n个输出,e为自然常数,γ为比例系数,N为特征提取层输出的数量。
在特征提取层中通过双曲正切函数tanh和S型激活函数sigmoid实现双重特征提取,特征提取层的第n个输入xn通过双曲正切函数tanh提取到的特征与采用S型激活函数sigmoid提取的特征相乘,达到充分提取特征的目的,在矩阵运算器处实现特征提取层的输出对加法器输出的加权,实现自适应的增强或削弱特征关注度。
S2包括以下分步骤:
S21、将训练样本输入到车型匹配模型中,得到车型匹配模型的输出;
S22、根据车型匹配模型的输出,基于损失函数,计算损失值;
S23、判断损失值是否大于阈值,若是,则跳转至步骤S24、若否,则车型匹配模型训练完成,结束分步骤;
S24、对车型匹配模型中权重进行更新,并跳转至步骤S21。
S22中损失函数为:
,
其中,Ei为第i次训练时的损失值,yi,j为第i次训练时车型匹配模型输出的第j个数值,为第i次训练时标签的第j个数值,ln为对数函数,e为自然常数,M为车型匹配模型输出的数值的数量。
本发明中将每次训练的车型匹配模型输出与标签进行比较,尽可能的体现出两者的差距,更好训练车型匹配模型的权重,本发明中损失函数一方面通过指数函数放大两者数值上的差距,并通过对数函数缩减部分指数函数放大的效果,避免权重下降幅度过大,但是仅数值上的差距无法体现两者的相似情况,因此,本发明利用两者的相似情况和数值上的差距,同时表征出训练时的损失情况。
S24中对车型匹配模型中权重进行更新包括:根据损失值,更新分类层的权重;根据损失值,更新LSTM层的权重;根据损失值,更新词组特征提取通道的权重;
更新分类层的权重的公式为:
,
其中,wc,i+1为第i+1次训练时分类层的权重,wc,i为第i次训练时分类层的权重,Ei为第i次训练时的损失值,e为自然常数;
更新LSTM层的权重的公式为:
,
其中,wL,i+1为第i+1次训练时LSTM层的权重,wL,i为第i次训练时LSTM层的权重,μ为大于1的增强系数;
更新词组特征提取通道的权重的公式为:
,
其中,wP,i+1为第i+1次训练时词组特征提取通道的权重,wP,i为第i次训练时词组特征提取通道的权重,tanh为双曲正切函数。
在训练时,容易出现梯度消失的问题,导致靠近车型匹配模型输入端的结构的权重无法得到有效训练,因此,本发明将车型匹配模型分成三部分,分别进行权重的更新,LSTM层的权重和词组特征提取通道的权重的下降情况依次增强,防止出现梯度消失的问题。
本发明中,在更新LSTM层的权重时,设置增强系数,增大LSTM层的权重的下降幅度,在对更新词组特征提取通道的权重时,采用双曲正切函数tanh在更新LSTM层的权重幅度的基础上新增部分下降幅度,进一步的增加下降幅度,从而实现三部分同时进行权重更新,但是更新幅度不同,增加权重组合方式,提高车型匹配模型的匹配精度。
一种应用于汽车营销管理系统软件的数据分析方法的系统,包括:训练样本构建单元、训练单元、汽车营销管理系统软件、当前用户需求样本构建单元和匹配单元;
训练样本构建单元用于根据历史用户需求文本,构建训练样本;训练单元用于采用训练样本对车型匹配模型进行训练,得到训练完成的车型匹配模型;汽车营销管理系统软件用于录入当前用户需求文本;当前用户需求样本构建单元用于对当前用户需求文本进行分词和向量化处理,得到当前用户需求样本;匹配单元用于将当前用户需求样本中每个词组向量输入车型匹配模型中每个词组特征提取通道中,进行多词组特征提取,得到与当前用户需求匹配的车型。
本发明中系统处理的具体过程与方法相同。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种应用于汽车营销管理系统软件的数据分析方法,其特征在于,包括以下步骤:
S1、根据历史用户需求文本,构建训练样本;
S2、采用训练样本对车型匹配模型进行训练,得到训练完成的车型匹配模型;
S3、通过汽车营销管理系统软件录入当前用户需求文本;
S4、对当前用户需求文本进行分词和向量化处理,得到当前用户需求样本;
S5、将当前用户需求样本中每个词组向量输入车型匹配模型中每个词组特征提取通道中,进行多词组特征提取,得到与当前用户需求匹配的车型;
所述S2中车型匹配模型包括:词组特征提取通道、Concat层、LSTM层和分类层,其中,词组特征提取通道的数量大于等于2;
每个所述词组特征提取通道的输入端用于输入一个词组向量;所述Concat层的输入端分别与多个词组特征提取通道的输出端连接,其输出端与LSTM层的输入端连接;所述分类层的输入端与LSTM层的输出端连接,其输出端作为车型匹配模型的输出端;
所述词组特征提取通道包括:行卷积层、列卷积层、转置运算层、乘法器、平均池化层、最大池化层、加法器、特征提取层和矩阵运算器;
所述行卷积层的输入端与转置运算层的输入端连接,并作为词组特征提取通道的输入端;所述转置运算层的输出端与列卷积层的输入端连接;所述乘法器的第一输入端与行卷积层的输出端连接,其第二输入端与列卷积层的输出端连接,其输出端分别与平均池化层的输入端和最大池化层的输入端连接;所述加法器的第一输入端与平均池化层的输出端连接,其第二输入端与最大池化层的输出端连接,其输出端分别与特征提取层的输入端和矩阵运算器的第一输入端连接;所述矩阵运算器的第二输入端与特征提取层的输出端连接,其输出端作为词组特征提取通道的输出端;
所述转置运算层用于对词组向量进行转置运算,得到列向量,所述行卷积层用于对词组向量进行一维卷积运算,所述列卷积层用于对列向量进行一维卷积运算;
所述特征提取层的表达式为:
,
其中,为特征提取层的第n个输出,tanh为双曲正切函数,sigmoid为S型激活函数,xn为特征提取层的第n个输入,wn为第n个输入xn的权重,bn为第n个输入xn的偏置;
所述矩阵运算器的计算公式为:
,
其中,vn为矩阵运算器的第n个输出,e为自然常数,γ为比例系数,N为特征提取层输出的数量;
所述S2包括以下分步骤:
S21、将训练样本输入到车型匹配模型中,得到车型匹配模型的输出;
S22、根据车型匹配模型的输出,基于损失函数,计算损失值;
S23、判断损失值是否大于阈值,若是,则跳转至步骤S24、若否,则车型匹配模型训练完成,结束分步骤;
S24、对车型匹配模型中权重进行更新,并跳转至步骤S21;
所述S22中损失函数为:
,
其中,Ei为第i次训练时的损失值,yi,j为第i次训练时车型匹配模型输出的第j个数值,为第i次训练时标签的第j个数值,ln为对数函数,e为自然常数,M为车型匹配模型输出的数值的数量;
所述S24中对车型匹配模型中权重进行更新包括:根据损失值,更新分类层的权重;根据损失值,更新LSTM层的权重;根据损失值,更新词组特征提取通道的权重;
所述更新分类层的权重的公式为:
,
其中,wc,i+1为第i+1次训练时分类层的权重,wc,i为第i次训练时分类层的权重,Ei为第i次训练时的损失值,e为自然常数;
所述更新LSTM层的权重的公式为:
,
其中,wL,i+1为第i+1次训练时LSTM层的权重,wL,i为第i次训练时LSTM层的权重,μ为大于1的增强系数;
所述更新词组特征提取通道的权重的公式为:
,
其中,wP,i+1为第i+1次训练时词组特征提取通道的权重,wP,i为第i次训练时词组特征提取通道的权重,tanh为双曲正切函数。
2.根据权利要求1所述的应用于汽车营销管理系统软件的数据分析方法,其特征在于,所述S1包括以下分步骤:
S11、将历史用户需求文本进行分词处理,提取有效词组,构成词组样本,其中,词组样本中包含多个有效词组,有效词组包括:车辆颜色、油耗、价格、发动机功率、油耗和尺寸;
S12、将词组样本向量化处理,得到词组向量样本,其中,词组向量样本包括多个词组向量;
S13、采用车型对词组向量样本进行标注标签,得到训练样本。
3.根据权利要求1~2任一项所述的应用于汽车营销管理系统软件的数据分析方法的系统,其特征在于,包括:训练样本构建单元、训练单元、汽车营销管理系统软件、当前用户需求样本构建单元和匹配单元;
所述训练样本构建单元用于根据历史用户需求文本,构建训练样本;所述训练单元用于采用训练样本对车型匹配模型进行训练,得到训练完成的车型匹配模型;所述汽车营销管理系统软件用于录入当前用户需求文本;所述当前用户需求样本构建单元用于对当前用户需求文本进行分词和向量化处理,得到当前用户需求样本;所述匹配单元用于将当前用户需求样本中每个词组向量输入车型匹配模型中每个词组特征提取通道中,进行多词组特征提取,得到与当前用户需求匹配的车型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410129495.1A CN117688137B (zh) | 2024-01-31 | 2024-01-31 | 应用于汽车营销管理系统软件的数据分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410129495.1A CN117688137B (zh) | 2024-01-31 | 2024-01-31 | 应用于汽车营销管理系统软件的数据分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117688137A CN117688137A (zh) | 2024-03-12 |
CN117688137B true CN117688137B (zh) | 2024-04-12 |
Family
ID=90133757
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410129495.1A Active CN117688137B (zh) | 2024-01-31 | 2024-01-31 | 应用于汽车营销管理系统软件的数据分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117688137B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118035432B (zh) * | 2024-04-12 | 2024-06-14 | 成都航空职业技术学院 | 一种基于语义识别的就业指导内容推荐方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109064265A (zh) * | 2018-07-13 | 2018-12-21 | 惠龙易通国际物流股份有限公司 | 基于网络平台的购车推荐方法及系统 |
CN109685571A (zh) * | 2018-12-24 | 2019-04-26 | 深圳市航盛车云技术有限公司 | 基于车联网的智能客服系统 |
CN112561663A (zh) * | 2020-12-24 | 2021-03-26 | 杭州搜车数据科技有限公司 | 车辆推荐方法、装置、计算机设备和存储介质 |
CN113642317A (zh) * | 2021-08-12 | 2021-11-12 | 广域铭岛数字科技有限公司 | 一种基于语音识别结果的文本纠错方法及系统 |
CN114328881A (zh) * | 2022-01-19 | 2022-04-12 | 重庆长安汽车股份有限公司 | 一种基于短文本匹配的语音问答方法及系统 |
CN115659040A (zh) * | 2022-11-07 | 2023-01-31 | 中国联合网络通信集团有限公司 | 应用于用户标签识别的模型训练方法、推荐方法和设备 |
CN115861983A (zh) * | 2022-12-29 | 2023-03-28 | 陕西省君凯电子科技有限公司 | 用于机械设备的智能化管理系统及其方法 |
CN116361839A (zh) * | 2023-05-26 | 2023-06-30 | 四川易景智能终端有限公司 | 一种基于nlp的涉密屏蔽方法 |
CN116383710A (zh) * | 2022-12-20 | 2023-07-04 | 北京百分点科技集团股份有限公司 | 标签确定方法、装置、电子设备及存储介质 |
CN117033760A (zh) * | 2022-10-28 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 一种对象推荐方法、装置、设备、存储介质及程序产品 |
CN117252186A (zh) * | 2023-08-09 | 2023-12-19 | 南京星环智能科技有限公司 | 基于xai的信息处理方法、装置、设备及存储介质 |
CN117332788A (zh) * | 2023-11-30 | 2024-01-02 | 山东同其万疆科技创新有限公司 | 一种基于英语口语文本的语义分析方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220194400A1 (en) * | 2015-05-20 | 2022-06-23 | Continental Automotive Systems, Inc. | System and method for enhancing vehicle performance using machine learning |
US11887383B2 (en) * | 2019-03-31 | 2024-01-30 | Affectiva, Inc. | Vehicle interior object management |
US11769056B2 (en) * | 2019-12-30 | 2023-09-26 | Affectiva, Inc. | Synthetic data for neural network training using vectors |
US11699085B2 (en) * | 2020-06-05 | 2023-07-11 | Intel Corporation | Methods and arrangements to identify activation profile context in training data |
-
2024
- 2024-01-31 CN CN202410129495.1A patent/CN117688137B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109064265A (zh) * | 2018-07-13 | 2018-12-21 | 惠龙易通国际物流股份有限公司 | 基于网络平台的购车推荐方法及系统 |
CN109685571A (zh) * | 2018-12-24 | 2019-04-26 | 深圳市航盛车云技术有限公司 | 基于车联网的智能客服系统 |
CN112561663A (zh) * | 2020-12-24 | 2021-03-26 | 杭州搜车数据科技有限公司 | 车辆推荐方法、装置、计算机设备和存储介质 |
CN113642317A (zh) * | 2021-08-12 | 2021-11-12 | 广域铭岛数字科技有限公司 | 一种基于语音识别结果的文本纠错方法及系统 |
CN114328881A (zh) * | 2022-01-19 | 2022-04-12 | 重庆长安汽车股份有限公司 | 一种基于短文本匹配的语音问答方法及系统 |
CN117033760A (zh) * | 2022-10-28 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 一种对象推荐方法、装置、设备、存储介质及程序产品 |
CN115659040A (zh) * | 2022-11-07 | 2023-01-31 | 中国联合网络通信集团有限公司 | 应用于用户标签识别的模型训练方法、推荐方法和设备 |
CN116383710A (zh) * | 2022-12-20 | 2023-07-04 | 北京百分点科技集团股份有限公司 | 标签确定方法、装置、电子设备及存储介质 |
CN115861983A (zh) * | 2022-12-29 | 2023-03-28 | 陕西省君凯电子科技有限公司 | 用于机械设备的智能化管理系统及其方法 |
CN116361839A (zh) * | 2023-05-26 | 2023-06-30 | 四川易景智能终端有限公司 | 一种基于nlp的涉密屏蔽方法 |
CN117252186A (zh) * | 2023-08-09 | 2023-12-19 | 南京星环智能科技有限公司 | 基于xai的信息处理方法、装置、设备及存储介质 |
CN117332788A (zh) * | 2023-11-30 | 2024-01-02 | 山东同其万疆科技创新有限公司 | 一种基于英语口语文本的语义分析方法 |
Non-Patent Citations (1)
Title |
---|
基于属性的汽车评论文本情感分析研究;耿铭涛;《CNKI优秀硕士学位论文全文库工程科技Ⅱ辑》;20230315;1-64 * |
Also Published As
Publication number | Publication date |
---|---|
CN117688137A (zh) | 2024-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107679234B (zh) | 客服信息提供方法、装置、电子设备、存储介质 | |
CN117688137B (zh) | 应用于汽车营销管理系统软件的数据分析方法及系统 | |
CN111695352A (zh) | 基于语义分析的评分方法、装置、终端设备及存储介质 | |
CN111291183A (zh) | 利用文本分类模型进行分类预测的方法及装置 | |
CN113157927B (zh) | 文本分类方法、装置、电子设备及可读存储介质 | |
CN111309915A (zh) | 联合学习的自然语言训练方法、系统、设备及存储介质 | |
CN111382248B (zh) | 一种问题回复方法、装置、存储介质及终端设备 | |
CN110516070A (zh) | 一种基于文本纠错与神经网络的中文问句分类方法 | |
CN110197213B (zh) | 基于神经网络的图像匹配方法、装置和设备 | |
CN113449084A (zh) | 基于图卷积的关系抽取方法 | |
CN113297351A (zh) | 文本数据标注方法及装置、电子设备及存储介质 | |
CN118155661A (zh) | 一种基于多模态融合的电信反欺诈方法和系统 | |
CN115358774A (zh) | 一种智慧客服机器人数据处理方法及系统 | |
WO2020042164A1 (en) | Artificial intelligence systems and methods based on hierarchical clustering | |
CN112307210B (zh) | 一种文档标签预测方法、系统、介质及电子器件 | |
CN112597299A (zh) | 文本的实体分类方法、装置、终端设备和存储介质 | |
CN111782774B (zh) | 一种问题推荐的方法及装置 | |
CN115879958A (zh) | 一种基于大数据的涉外销售话术决策方法及系统 | |
CN110852833A (zh) | 一种约车订单处理方法及装置 | |
CN116304728A (zh) | 一种基于句子表征的短文本相似度匹配方法及应用 | |
CN112182211B (zh) | 文本分类方法及装置 | |
CN114398482A (zh) | 一种词典构造方法、装置、电子设备及存储介质 | |
CN114819140A (zh) | 模型剪枝方法、装置和计算机设备 | |
CN113761935A (zh) | 一种短文本语义相似度度量方法、系统及装置 | |
CN113515591A (zh) | 文本不良信息识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |