CN113962750B - 一种基于attention机制的多尺度信息汽车销量大数据预测方法 - Google Patents

一种基于attention机制的多尺度信息汽车销量大数据预测方法 Download PDF

Info

Publication number
CN113962750B
CN113962750B CN202111356919.0A CN202111356919A CN113962750B CN 113962750 B CN113962750 B CN 113962750B CN 202111356919 A CN202111356919 A CN 202111356919A CN 113962750 B CN113962750 B CN 113962750B
Authority
CN
China
Prior art keywords
information
hidden state
time
automobile
time step
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111356919.0A
Other languages
English (en)
Other versions
CN113962750A (zh
Inventor
王进
马梦涵
李辰宇
华尹
孙开伟
刘彬
杜雨露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Nanfang Zhongyue Technology Co ltd
Yami Technology Guangzhou Co ltd
Original Assignee
Shenzhen Nanfang Zhongyue Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Nanfang Zhongyue Technology Co ltd filed Critical Shenzhen Nanfang Zhongyue Technology Co ltd
Priority to CN202111356919.0A priority Critical patent/CN113962750B/zh
Publication of CN113962750A publication Critical patent/CN113962750A/zh
Application granted granted Critical
Publication of CN113962750B publication Critical patent/CN113962750B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及大数据处理技术和汽车销量预测技术领域,特别涉及一种基于attention机制的多尺度信息汽车销量大数据预测方法,包括将加入用户行为信息的汽车基本信息数据传入encoder RNN中;在encoder RNN中采用多尺度特征解耦操作得到每个时间序列在每个时间步的多尺度信息;采用attention机制获取对不同small hidden state的重要性得分并更新;由decoder RNN输出未来时间步的汽车销量预测结果;本发明使得不同的small hidden state以不同频率更新,达到动态的选择重要尺度信息的目的,从而提升汽车销量预测的精确性。

Description

一种基于attention机制的多尺度信息汽车销量大数据预测 方法
技术领域
本发明涉及大数据处理技术和汽车销量预测技术领域,特别涉及一种基于attention机制的多尺度信息汽车销量大数据预测方法。
背景技术
汽车行业一直是我国经济的支柱产业,近几年来,国内汽车市场由增量市场逐步进入存量市场阶段,在市场整体趋势逐步改变的环境下,消费者购车决策的过程也正在从线下向线上转移,对汽车销量的预测对于零件生产商的原料储存、生产人员配备,对于汽车生产厂商产销人员配备,对于政府进行宏观调控可以给与有力的数据支撑,所以合理的汽车销量预测是非常重要的。
传统的汽车销量预测方法采用基于规律性的时间序列方法,没有考虑到互联网行为数据对于汽车销量的影响,且传统时间序列预测存在长期依赖问题,通常只关注单一尺度的信息,无法完整准确的或动态性的表征特征。
发明内容
为了解决上述问题,本发明提出一种基于attention机制的多尺度信息汽车销量大数据预测方法,包括以下步骤:
将加入用户行为信息的汽车基本信息数据传入encoder RNN中;
在encoder RNN中采用多尺度特征解耦操作得到每个时间序列在每个时间步的多尺度信息;
采用attention机制获取对不同small hidden state的重要性得分并更新;
由decoder RNN输出未来时间步的汽车销量预测结果。
进一步的,将用户行为信息和时间信息加入汽车基本信息数据,其中汽车基本信息数据包括时间、车型、车身、省份、燃料类型、交易价格、汽车相应参数、汽车销量;用户行为数据包括搜索量、评论信息;其中对时间信息提取节假日信息、季节信息;对评论信息分类为正面评论、中性评论、负面评论;将每个时间步对应的汽车基本信息数据、时间信息和用户行为信息归一化作为encoder RNN每个时间步的输入。
进一步的,在encoder RNN中采用多尺度特征解耦操作,即对于encoder RNN的每个时间步的hidden state,分为k个小的独立small hidden state,表示为每个small hidden state使用特定的更新方式来捕获信息,从而使得最终的hidden state可以学习到不同尺度的依赖关系;/>表示第t时间步骤对应的hidden state中第k个small hidden state。
进一步的,每个small hidden state使用特定的更新方式来捕获信息,即对于长度为lt的时间步被更新的比例为ρ,使得每个更新段的长度遵循平均lk的几何分布,若存在平均长度长度为的未更新段,那么对于第t个时间步的第k个small hidden state/>的更新公式为:
其中,αk、βk为第k个small hidden state的可学习参数,γ为t时刻的偏置,Ul(lk)表示平均lk的几何分布,θ为小于lt的常数且(θ+Ul(lk))≤lt;xt为t时刻的输入,mask为small hidden state不进行更新的范围区间。
进一步的,采用attention机制获取对不同small hidden state的重要性得分,对于t时刻的第k个small hidden state,重要性得分为:
其中,d为每个small hidden state的维度;qt表示t时间步输入的线性变换;表示第t个时间步的第k个small hidden state/>的重要性得分,/>表示t-1时刻第k个small hidden state。
进一步的,,当使用更新操作时,将学到的small hidden state的重要性得分来加权对第t个时间步的第k个small hidden state的更新公式为:
进一步的,由decoder RNN输出未来时间步的汽车销量预测结果,即由encoderRNN生成的最后一个时间步的hidden state作为语义向量c,该语义向量c与decoder的每个时间步输入传入decoder RNN得到汽车销量预测的结果。
进一步的,汽车销量预测的结果表示为:
yT=F(yT-1,sT,c);
其中,yT-1表示T-1时刻的decoder RNN的预测结果,sT为decoder RNN中的t时刻隐藏层,F为激活函数。
本发明采用带有加入用户行为信息的预测方法,加入趋势性、季节性等,更能完整充分的考虑汽车销量的相关性;本发明采用多尺度特征解耦操作使得模型不止关注单一尺度的特征,通过不同的small hidden state捕获时间序列的多尺度信息;本发明采用attention机制获取对不同small hidden state的重要性得分,使得不同的small hiddenstate以不同频率更新,达到动态选择重要尺度信息的目的,从而提升汽车销量预测的精确性。
附图说明
图1是本发明实施例提供的流程图;
图2是本发明实施例提供的多尺度特征解耦操作图;
图3是本发明实施例提供的算法流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出一种基于attention机制的多尺度信息汽车销量大数据预测方法,如图1,具体包括以下步骤:
将加入用户行为信息的汽车基本信息数据传入encoder RNN中;
在encoder RNN中采用多尺度特征解耦操作得到每个时间序列在每个时间步的多尺度信息;
采用attention机制获取不同small hidden state的重要性得分并更新;
由decoder RNN输出未来时间步的汽车销量预测结果。
本实施例将汽车基本信息数据加入用户行为信息的操作,具体包括:
(1)汽车基本信息数据包括时间、车型、车身、省份、燃料类型、交易价格、汽车相应参数等;用户行为数据包括车型搜索量、评论信息等;
(2)对汽车基本信息数据进行预处理,对缺失值采用同车型年度销量均值进行填充;
(3)对时间信息提取节假日信息、季节信息等趋势特征;
(4)对用户行为数据的评论信息采用Bert+LSTM模型进行情感分类,将评论信息分类为正面评论、中性评论、负面评论;
Bert结构上是Transformer的编码部分,每个block主要由多头self-Attention、标准化(Norm)、残差连接、Feed Fordawrd组成。在具体任务中,主要分为模型预训练和模型微调两个阶段;LSTM网络加入了门控单元,采用遗忘门、输入门和输出门来分别控制从细胞状态中丢弃的信息、在单元格状态下存储哪些信息、输出什么信息,来学习长期依赖关系。
以上数据归一化传入encoder RNN中。
在encoder RNN中采用多尺度特征解耦操作得到每个时间序列在每个时间步的多尺度信息,有利于模型的可解释性。对于encoder RNN的每个时间步的hidden state,分为k个小的独立hidden state,即每个small hidden state使用特定的更新方式来捕获信息,从而使得最终的hidden state可以学习到不同尺度的依赖关系。
对每个small hidden state使用特定的更新方式来捕获信息。对于长度为lt的时间步被更新的比例为ρ,使得每个更新段的长度遵循平均lk的几何分布,然后是平均长度长度为的未更新段,那么对于第t个时间步的第k个small hidden state的更新公式为:
其中为第t个时间步的第k个small hidden state,αk,βk为第k个small hiddenstate的可学习参数,γ为t时刻的偏置,Ul(lk)表示平均lk的几何分布,θ为小于lt的常数且(θ+Ul(lk))≤lt,xt为t时间步的输入。
由于每个small hidden state使用特定的更新方式捕获多尺度信息使用固定尺度进行更新,无法捕捉时间序列的动态时间模式,且不同时间步的模式也是不同的,所以采用attention机制获取不同small hidden state的重要性得分进行更新。对于t时刻的第k个small hidden state,重要性得分为:
其中,d为每个small hidden state的维度;qt表示t时间步输入的线性变换;表示第t个时间步的第k个small hidden state/>的重要性得分,/>越大,代表上一时间步的第k个small hidden对当前时间步越重要。
当使用更新操作时,将学到的small hidden state的重要性得分来加权则最终第t个时间步的第k个small hidden state的更新公式为:
其中αk,βk为第k个small hidden state的可学习参数,γ为t时刻的偏置。通过加入attention机制使得每个时间步自适应地选择最重要的尺度信息。
则encoder最后时间步得到的hidden state包含了模型捕获到的复杂时间模式的多尺度信息。
由encoder RNN生成的最后一个时间步的hidden state作为语义向量c,将语义向量c作为decoder中RNN的初始隐层状态,decoder RNN的每个时间步输入得到预测的当前时间步的汽车销量预测结果,则T时刻的是汽车销量预测结果为:
yT=F(yT-1,sT,c)
其中sT是decoder RNN中的t时刻隐藏层,c代表之前encoder RNN最后时刻hiddenstate得到的语义向量,yT-1表示decoder RNN中T-1时刻的预测结果,反过来作为T时刻的输入,F为激活函数。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种基于attention机制的多尺度信息汽车销量大数据预测方法,其特征在于,包括以下步骤:
将加入用户行为信息和时间信息的汽车基本信息数据传入encoder RNN中;
在encoder RNN中采用多尺度特征解耦操作得到每个时间序列在每个时间步的多尺度信息;在encoder RNN中采用多尺度特征解耦操作,即对于encoder RNN的每个时间步的hidden state,分为k个小的独立small hidden state,表示为每个small hidden state使用特定的更新方式来捕获信息,从而使得最终的hidden state可以学习到不同尺度的依赖关系;/>表示第t时间步骤对应的hidden state中第k个smallhidden state;
采用attention机制获取对不同small hidden state的重要性得分并更新,对于t时刻的第k个small hidden state,重要性得分为:
其中,d为每个small hidden state的维度;qt表示t时间步输入的线性变换;表示第t个时间步的第k个small hidden state/>的重要性得分,/>表示t-1时刻第k个small hidden state;
每个small hidden state使用特定的更新方式来捕获信息,即对于长度为lt的时间步被更新的比例为ρ,使得每个更新段的长度遵循平均lk的几何分布,若存在平均长度为的未更新段,那么对于第t个时间步的第k个small hidden state/>的更新公式为:
其中,αk、βk为第k个small hidden state的可学习参数,γ为t时刻的偏置,Ul(lk)表示平均lk的几何分布,θ为小于lt的常数且(θ+Ul(lk))≤lt;xt为t时刻的输入,mask为smallhidden state不进行更新的范围区间;
由decoder RNN输出未来时间步的汽车销量预测结果。
2.根据权利要求1所述的一种基于attention机制的多尺度信息汽车销量大数据预测方法,其特征在于,将用户行为信息和时间信息加入汽车基本信息数据,其中汽车基本信息数据包括时间、车型、车身、省份、燃料类型、交易价格、汽车相应参数、汽车销量;用户行为数据包括搜索量、评论信息;其中对时间信息提取节假日信息、季节信息;对评论信息分类为正面评论、中性评论、负面评论;将每个时间步对应的汽车基本信息数据、时间信息和用户行为信息归一化作为encoder RNN每个时间步的输入。
3.根据权利要求1所述的一种基于attention机制的多尺度信息汽车销量大数据预测方法,其特征在于,由decoder RNN输出未来时间步的汽车销量预测结果,即由encoder RNN生成的最后一个时间步的hidden state作为语义向量c,该语义向量c与decoder的每个时间步输入传入decoder RNN得到汽车销量预测的结果。
4.根据权利要求3述的一种基于attention机制的多尺度信息汽车销量大数据预测方法,其特征在于,汽车销量预测的结果表示为:
yT=F(yT-1,sT,c);
其中,yT-1表示T-1时刻的decoder RNN的预测结果,sT为decoder RNN中的t时刻隐藏层,F为激活函数。
CN202111356919.0A 2021-11-16 2021-11-16 一种基于attention机制的多尺度信息汽车销量大数据预测方法 Active CN113962750B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111356919.0A CN113962750B (zh) 2021-11-16 2021-11-16 一种基于attention机制的多尺度信息汽车销量大数据预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111356919.0A CN113962750B (zh) 2021-11-16 2021-11-16 一种基于attention机制的多尺度信息汽车销量大数据预测方法

Publications (2)

Publication Number Publication Date
CN113962750A CN113962750A (zh) 2022-01-21
CN113962750B true CN113962750B (zh) 2023-09-19

Family

ID=79470836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111356919.0A Active CN113962750B (zh) 2021-11-16 2021-11-16 一种基于attention机制的多尺度信息汽车销量大数据预测方法

Country Status (1)

Country Link
CN (1) CN113962750B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951514A (zh) * 2017-03-17 2017-07-14 合肥工业大学 一种考虑品牌情感的汽车销量预测方法
CN110610382A (zh) * 2019-09-10 2019-12-24 浙江大搜车软件技术有限公司 车辆销售量预测方法、装置、计算机设备和存储介质
CN112966526A (zh) * 2021-04-20 2021-06-15 吉林大学 一种基于情感词向量的汽车在线评论情感分析方法
CN113283936A (zh) * 2021-05-28 2021-08-20 深圳千岸科技股份有限公司 一种销量预测方法、销量预测装置及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10929674B2 (en) * 2016-08-29 2021-02-23 Nec Corporation Dual stage attention based recurrent neural network for time series prediction
US20190354836A1 (en) * 2018-05-17 2019-11-21 International Business Machines Corporation Dynamic discovery of dependencies among time series data using neural networks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106951514A (zh) * 2017-03-17 2017-07-14 合肥工业大学 一种考虑品牌情感的汽车销量预测方法
CN110610382A (zh) * 2019-09-10 2019-12-24 浙江大搜车软件技术有限公司 车辆销售量预测方法、装置、计算机设备和存储介质
CN112966526A (zh) * 2021-04-20 2021-06-15 吉林大学 一种基于情感词向量的汽车在线评论情感分析方法
CN113283936A (zh) * 2021-05-28 2021-08-20 深圳千岸科技股份有限公司 一种销量预测方法、销量预测装置及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
袁恒."基于网络搜索指数的市场预测模型".CNKI.2017,全文. *

Also Published As

Publication number Publication date
CN113962750A (zh) 2022-01-21

Similar Documents

Publication Publication Date Title
CN110827129B (zh) 一种商品推荐方法及装置
CN109271522A (zh) 基于深度混合模型迁移学习的评论情感分类方法及系统
CN110765260A (zh) 一种基于卷积神经网络与联合注意力机制的信息推荐方法
Majeed Improving time complexity and accuracy of the machine learning algorithms through selection of highly weighted top k features from complex datasets
Shiloh-Perl et al. Introduction to deep learning
CN111027681B (zh) 时序数据处理模型训练方法、数据处理方法、装置及存储介质
CN112307760A (zh) 基于深度学习的财务报告情感分析方法、装置及终端
CN113705238A (zh) 基于bert和方面特征定位模型的方面级情感分析方法及模型
CN110766060B (zh) 基于深度学习的时间序列相似度的计算方法、系统及介质
CN114943034A (zh) 基于细粒度方面特征的智能新闻推荐方法和系统
CN110543566A (zh) 一种基于自注意力近邻关系编码的意图分类方法
CN117151121B (zh) 一种基于波动阈值与分割化的多意图口语理解方法
CN114398893A (zh) 一种基于对比学习的临床数据处理模型的训练方法及装置
CN113962750B (zh) 一种基于attention机制的多尺度信息汽车销量大数据预测方法
CN111309849A (zh) 一种基于联合学习模型的细粒度数值信息抽取方法
Ye et al. TS2V: A transformer-based Siamese network for representation learning of univariate time-series data
Zantout et al. Ensemble Models for Enhancement of an Arabic Speech Emotion Recognition System
CN113010774B (zh) 一种基于动态深度注意力模型的点击率预测方法
Lunga et al. Online forecasting of stock market movement direction using the improved incremental algorithm
CN115017260A (zh) 一种基于子主题建模的关键词生成方法
CN114898776A (zh) 一种多尺度特征联合多任务cnn决策树的语音情感识别方法
CN114662652A (zh) 一种基于多模态信息学习的专家推荐方法
CN114595324A (zh) 电网业务数据分域的方法、装置、终端和非暂时性存储介质
CN113011163A (zh) 基于深度学习模型的复合文本多分类方法及系统
CN112465054A (zh) 一种基于fcn的多变量时间序列数据分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230824

Address after: 518000, 1st Floor, Building 1, Zone 1, Zhongguan Honghualing Industrial South Zone, No. 1213 Liuxian Avenue, Pingshan Community, Taoyuan Street, Nanshan District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Nanfang Zhongyue Technology Co.,Ltd.

Address before: Room 801, No. 85, Kefeng Road, Huangpu District, Guangzhou, Guangdong 510000 (office only)

Applicant before: Yami Technology (Guangzhou) Co.,Ltd.

Effective date of registration: 20230824

Address after: Room 801, No. 85, Kefeng Road, Huangpu District, Guangzhou, Guangdong 510000 (office only)

Applicant after: Yami Technology (Guangzhou) Co.,Ltd.

Address before: 400065 Chongwen Road, Nanshan Street, Nanan District, Chongqing

Applicant before: CHONGQING University OF POSTS AND TELECOMMUNICATIONS

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant