CN114580707A - 一种多特征融合产品的情感趋势预测模型、建立方法及预测方法 - Google Patents

一种多特征融合产品的情感趋势预测模型、建立方法及预测方法 Download PDF

Info

Publication number
CN114580707A
CN114580707A CN202210104817.8A CN202210104817A CN114580707A CN 114580707 A CN114580707 A CN 114580707A CN 202210104817 A CN202210104817 A CN 202210104817A CN 114580707 A CN114580707 A CN 114580707A
Authority
CN
China
Prior art keywords
product
data
emotion
prediction model
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210104817.8A
Other languages
English (en)
Inventor
周庆燕
李号
胡赛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Agricultural University AHAU
Original Assignee
Anhui Agricultural University AHAU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Agricultural University AHAU filed Critical Anhui Agricultural University AHAU
Priority to CN202210104817.8A priority Critical patent/CN114580707A/zh
Publication of CN114580707A publication Critical patent/CN114580707A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种多特征融合产品的情感趋势预测模型、建立方法及预测方法,旨在解决现有技术中面对海量的评论数据,很难提前预测分析出市场对于新产品的评价情感趋势走向的问题。情感趋势预测模型建立方法包括:爬取产品的评论数据以及属性特征数据;对爬取的数据进行数据清洗,对清洗后的评论数据进行情感分析获得产品的产品情感值,在产品上标记产品情感值,将产品属性特征与情感值构成模型原始数据,构建模型原始数据集;将所述原始数据集划分为训练数据集和测试数据集;搭建情感趋势预测模型:堆叠深度可分离卷积特征提取层、卷积注意力层、双向长短期记忆网络预测层和全连接层,得到情感趋势预测模型;并对情感趋势预测模型进行训练。

Description

一种多特征融合产品的情感趋势预测模型、建立方法及预测 方法
技术领域
本公开属于产品评价预测技术领域,具体涉及一种多特征融合产品的情感趋势预测模型、建立方法及预测方法。
背景技术
随着移动互联网与电子商务的发展,用户在网上购买产品并体验后,一般会在平台上写下对该产品的体验感受,对商品做出评价,分享使用体验。产品在线评论能够给其它消费者提供意见和建议,进而做出合理的购买决策。以企业的角度来说,面对海量的评论数据,不能很好地掌控市场对于产品的多样化需求,无法提前预测分析出市场对于新产品的评价情感趋势走向,使其转化为设计要求,这将成为企业开发与改进产品的关键。为了获取消费者的体验感受,研究者设计了语义分化(SD)问卷来记录受访者的感受,但这种方法为了消除个体差异,往往会对大量消费者进行调查,需要漫长的时间才可以完成。
发明内容
本公开提供了一种多特征融合产品的情感趋势预测模型、建立方法及预测方法,旨在解决现有技术中面对海量的评论数据,很难提前预测分析出市场对于新产品的评价情感趋势走向的技术问题,以及现有技术对新产品的评价情感趋势预测精度较低的问题。
为了解决上述技术问题,本公开所采用的技术方案为:一种多特征融合产品的情感趋势预测模型建立方法,包括以下步骤:
S101、爬取电商网站上产品的评论数据以及产品属性特征数据;
S102、对爬取的数据进行数据清洗,对清洗后的评论数据进行情感分析获得产品的产品情感值,并在产品上标记产品情感值,将产品属性特征与情感值构成模型原始数据,构建模型原始数据集;将所述原始数据集划分为训练数据集和测试数据集;
S201、搭建情感趋势预测模型:堆叠深度可分离卷积特征提取层、卷积注意力层、双向长短期记忆网络预测层和全连接层,得到情感趋势预测模型;
S301、采用训练数据集中的数据对情感趋势预测模型进行训练,并采用测试数据集对情感趋势预测模型进行测试,直到获得测试合格的情感趋势预测模型。
进一步改进的方案:在步骤S102中,
对爬取的数据进行数据清洗时,去除重复、无效、系统默认或字数少于设定字数的评论;
在对清洗后的评论数据进行情感分析获得评论数据的情感值时,对评论数据进行情感分析,计算每条评论的情感值,通过计算产品所有评论数据的情感值均值得到产品情感值,并在产品上标记产品情感值,将产品属性特征与情感值构成模型训练数据。
进一步改进的方案:多特征融合产品的情感趋势预测模型建立方法,还包括利用遗传算法优化训练好的情感趋势预测模型的步骤,将情感趋势预测模型中需要优化的参数编码成遗传算法中个体染色体的基因,具体包括:
S401、利用随机值初始化遗传算法的第一代种群,种群的每一个个体即代表了一种可能的最优网络模型结构;
S402、通过对适应度函数的计算来评价个体的适应度,适应度越大,被保留下来的概率也越大;
S403、被保留下来的个体被随机选择成为父代,通过染色体交叉、基因突变生成下一代理论上更优的个体,并共同组成新一代种群;
重复S402和S403步骤,直到达到设定的遗传算法的结束条件,从中选择适应度最大的个体,该个体表示了一种理论上最优的网络模型结构。
通过遗传算法对多层模型结构进行全局寻优,突出各层的学习优势,消除各层之间独立学习的壁垒,从而提高对产品评价满意度的预测精度,因此,提出了采用遗传算法对网络结构进行优化,由遗传算法在一系列决策规则下自学习地对模型确切结构进行优化。由于情感趋势预测模型中可调节的参数过多,采用遗传优化算法对整个模型的结构进行优化以提升收敛速度,获得最佳网络结构进行预测。
进一步改进的方案:在步骤S101中,采用python的Beautiful Soup爬虫框架爬取电商网站上产品的评论数据;在步骤S102中,利用正则表达式对评论数据进行数据清洗。
第二方面,本发明还提供了一种多特征融合产品的情感趋势预测模型,所述模型由上述任一方案所述的一种多特征融合产品的情感趋势预测模型建立方法建立。
第三方面,本发明还提供了一种基于多层神经网络的多特征融合产品评价预测方法,包括:输入产品属性特征数据至上述的一种多特征融合产品的情感趋势预测模型中,得到产品评价情感值的预测数据。
本公开的有益效果为:
(1)本发明将情感分析与多层神经网络相结合,将设计评价任务转化为服装分类任务,能够利用训练好的产品评价预测模型实现对大量产品评价的有效预测,提高预测效率。
(2)本发明根据网络上爬取大量的真实数据作为研究数据,所建立的模型具有较高的可信度,从而进一步提高其可行性,不仅可以科学地预测消费者对产品的感性形象评价,而且可以为产品设计提供合理的数据支持。
(3)本发明在情感趋势预测模型训练中通过引入卷积注意力层,在通道和空间维度上实现多维度分离特征注意力策略,通过通道注意力机制分析浅层特征通道与空间上的重要性,由重要性的不同进而分配多特征上不同的权重,进一步解决深度学习模型训练过程中重要特征丢失的问题,从而大幅提高预测的准确度。
(4)本发明提出同时包含堆叠深度可分离卷积特征提取层(DSCNN)、卷积注意力层(CBAM)、双向长短期记忆网络预测层(BiLSTM/双向LSTM 模型)和全连接层(Dense)的预测模型,由于网络中可调节的参数过多使预测问题变得相当复杂,这种复杂性不仅关系到每一层中传入数据的形式,还关系到神经网络确切结构的选择。采用现有的经典预测算法只能提取浅层特征,对多变量特征预测问题缺少深层次信息的分析,导致长期预测问题中精度偏低;本发明提出的情感趋势预测模型,首先利用深度可分离卷积代替经典卷积提取数据多维度多特征的信息,再添加卷积模块的注意力机制,结合注意力机制优化BiLSTM网络学习性能,强化对一次特征提取后序列中局部重要信息的关注程度;最后利用BiLSTM网络对训练数据实现前向与后向双向分析,实现二次特征的提取,进一步解决重要特征丢失与模型超参数过多等问题,从而大幅提高预测的准确度。
(5)本发明通过情感分析代替传统感性工学对产品进行打分,结合深度学习技术,在改变现有产品某些参数的情况下,用来预测新产品的情感倾向走势,给企业设计生产提供科学的指导。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简要介绍,应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关附图。
图1是本发明中情感趋势预测模型建立方法流程图。
图2是本发明中情感趋势预测模型构建流程示意图。
具体实施方式
下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚完整的描述。应当理解,此处所描述的具体实施例仅仅用于解释本公开,并不用于限定本公开。基于本公开的实施例,本领域技术人员在没有创造性劳动的前提下所获得的所有其他实施例,都属于本公开的保护范围。
本发明中,情感分析目的是从在线评论中获得用户的意见,包括对产品质量、外观、使用体验方面等产品属性特征的感受,从用户发布的所有在线评论中进行句子级的情感分析,通过百度AI自然语言处理平台对句子进行情感极性判断,分析出文本属于积极、消极的概率,以此作为文本的情感指数,得到用户综合体验的情感值序列数据,再建立基于多层深度学习的预测模型以实现对新产品的评价预测。因此,本发明作为一种将情感分析与深度学习相结合的方法,基于网上大量在线评论,构建出多层神经网络的多特征融合产品评价预测模型,科学地分析产品网络评论文本数据,使其转化为设计要求,为企业设计生产具有十分重要的指导意义。
实施例一:
参阅图1和图2,一种多特征融合产品的情感趋势预测模型建立方法,包括以下步骤:
S101、爬取电商网站上产品的评论数据以及产品属性特征数据;具体的:
通过python的Beautiful Soup爬虫框架爬取电商网站中用户发表的在线评论,之后对评论采用jieba工具进行分词、去重与去停用词,通过python进行词频统计与可视化,找出并爬取消费者最关注的产品属性特征,如价格、颜色等。
S102、对爬取的数据进行数据清洗,对清洗后的评论数据进行情感分析获得产品的产品情感值,并在产品上标记产品情感值,将产品属性特征与情感值构成模型原始数据,构建模型原始数据集;将所述原始数据集划分为训练数据集和测试数据集。
在对清洗后的评论数据进行情感分析获得评论数据的情感值时,对评论数据进行情感分析,计算每条评论的情感值,通过计算产品所有评论数据的情感值均值得到产品情感值,并在产品上标记产品情感值,将产品属性特征与情感值构成模型原始数据集。对爬取的数据进行数据清洗时:利用正则表达式对文本评论数据进行数据清洗,剔除去除重复、无效、系统默认或字数少于设定字数的评论,再利用引入百度AI开放平台的自然语言处理技术,对清洗后的评论数据进行情感分析,计算每条评论的情感值;之后对采集的产品参数特征进行缺失值处理与校正以保证数据的真实、可靠性。
数据整合与划分:由爬取的产品参数特征与对应产品的产品情感值共同组成原始数据集,其中评价的产品情感值列作为预测目标。同时为构造BiLSTM 层数据输入形式,对原始数据集进行时间窗口划分,以多步序列预测下一步,其中产品情感值既是输入也是输出;之后,对原始数据集的数据进行归一化处理以提高神经网络的训练效率,最后将原始数据集的80%作为训练数据,20%作为测试数据。
S201、搭建情感趋势预测模型:堆叠深度可分离卷积特征提取层、卷积注意力层(CBAM)、双向长短期记忆网络预测层和全连接层,得到情感趋势预测模型。
其中,深度可分离卷积(DSCNN)特征提取层利用深度可分离卷积代替经典卷积操作,深度可分离卷积主要是在网络结构上进行优化,由深度卷积 (DepthwiseConvolution,DWC)和逐点卷积(PointwiseConvolution,PWC) 两个过程组成;DSCNN在不改变最终生成的特征图大小的情况下,完成了空间与通道两个维度的分离卷积操作,从训练数据集中提取一次时空互联特征;这种做法不仅符合多维表特征提取规律,而且相对于标准卷积,其模型表征能力能够自如调节。
其中,因卷积操作将每个通道以及空间位置中所蕴含的信息视为同等重要,若重要的特征与一般特征的权重是相同的,重要的特征会因为经过多层隐藏层的训练而丢失,从而丧失了预测的精确性;本发明采用了一种轻量化的注意力模块CBAM,其包含两个独立的子模块,分别为通道注意力模块(CAM)与空间注意力模块(SAM),实现了在通道与空间维度上分离的注意力机制,自学习地对多维度上多特征分配不同的权重,获取注意力特征图,权重越大则表示该特征越重要,从而强化对一次时空互联特征中重要的特征的关注,剔除冗余特征的影响。
其中,由CBAM注意力机制优化BiLSTM学习性能,BiLSTM是对RNN、 LSTM的改进,为解决梯度消失与梯度爆炸问题,并可以同时处理前后双向序列的组合特征,由此获取对训练数据的二次深层分析的特征图。
S301、采用训练数据集中的数据对情感趋势预测模型进行训练,并采用测试数据集对情感趋势预测模型进行测试,直到获得测试合格的情感趋势预测模型。
多特征融合产品的情感趋势预测模型建立方法,还包括利用遗传算法优化训练好的情感趋势预测模型的步骤,将情感趋势预测模型中需要优化的参数编码成遗传算法中个体染色体的基因,具体包括:
S401、利用随机值初始化遗传算法的第一代种群,种群的每一个个体即代表了一种可能的最优网络模型结构;
S402、通过对适应度函数的计算来评价个体的适应度,适应度越大,被保留下来的概率也越大;
S403、被保留下来的个体被随机选择成为父代,通过染色体交叉、基因突变生成下一代理论上更优的个体,并共同组成新一代种群;
重复S402和S403步骤,直到达到设定的遗传算法的结束条件,从中选择适应度最大的个体,该个体表示了一种理论上最优的网络模型结构。
因此,提出了采用遗传算法对网络结构进行优化,由遗传算法在一系列决策规则下自学习地对模型确切结构进行优化。
遗传算法的优化目的是为了确定深度可分离卷积(DSCNN)特征提取层、双向长短期记忆网络预测层和全连接层的层数以及每层上的神经元个数。若设置每层神经网络最大不超过三层,则模型最多需要优化的属性共有12个,那么个体的染色体就可以实例化成含有12个数的列表。上述编码完成即形成一个个体的基因型,也就是使模型达到最优解的一个可能值。
对于本发明提出同时包含BiLSTM、DSCNN、Dense层的预测模型,可调节的参数过多使问题变得相当复杂,这种复杂性不仅关系到每一层中传入数据的形式,还关系到神经网络确切结构的选择。因此,本发明使用遗传算法来优化模型结构,它是根据自然界生物进化论演变而来,目标是在一定的约束条件下,以一定的顺序执行使得目标函数取得最优解。使用遗传算法优化本发明模型结构之前,需要做如下几项工作以保证遗传算法的正常执行:
1)首先,确定需要优化的模型结构,其中包括深度卷积层层数、BiLSTM 层的层数与全连接层的层数,以及上述每层中的神经元个数。
2)其次,还需要设定遗传算法的参数(如表1所示),其中population表示种群中个体数量,nc为父代染色体基因重组的概率,nm为基因突变的概率,Ep表示遗传算法进化的代数。遗传算法中染色体的长度设置为12,前三位分别表示卷积层层数、BiLSTM层的层数与全连接层的层数,每个模型层数最多为三层。若每层层数达到最多时,4-6位为每层DSCNN层的神经元个数,7-9位为 BiLSTM层的神经元个数,10-12位为dense层神经元个数。
表1遗传算法参数表
Figure BDA0003490277730000081
Figure BDA0003490277730000091
3)下一步是创建神经网络的第一个种群,每个神经网络都用描述属性的随机组合初始化。在本发明中,将需要优化的参数放进列表中并用整数编码,模型需要优化的属性共有12个,那么种群中个体的染色体就可以实例化成含有 12个整数的列表。上述编码完成即形成一个个体的基因型,也就是使模型达到最优解的一个可能值。遗传算法中population的大小表示了该种群含有的个体数量,用0至64中随机值对所有个体的染色体上每一位进行随机赋值,此时第一代种群共存在10类不同的个体,即包含十种结构不同的模型,每一个个体都代表了一种可能的最优解。
4)初始化形成第一代种群后,下一步是用本发明训练数据集对十种模型进行训练,训练过程中的损失函数是均方误差(MSE),优化器是Adam,目标是最小化MSE;而其他用来评估模型性能的指标都是在训练完成以后,用来评估其在测试集上的表现,由这些性能指标的一种作为遗传算法的适应度函数,用来评估该模型的优劣。
5)对种群中所有个体进行评估,适应度越高的个体,被选择保留下来作为父代的概率也越大;对上一代留下来的父代以nc概率下进行两两染色体交叉,nm概率下发生基因突变并产生下一代,最后组成一个新的种群;当产生第二十个种群后即代表遗传算法迭代结束,从中选取适应度最高的个体作为最优模型结构,从而输出预测结果。
本实施例公开的一种的利用遗传算法优化融合注意力机制的情感趋势预测模型,旨在预测用户对某产品的满意程度/产品情感值,其主要结论如下:
(1)基于深度可分离卷积的一次浅层特征提取模型,是从两个维度上充分提取产品与评价满意度数据之间的关联特征,有效解决了经典卷积网络的特征提取能力不足问题。
(2)嵌入注意力机制后的二次深层特征提取模型,采用CBAM注意力分配特征权重来强化BiLSTM深层特征分析的能力,提高算法的自学习能力,有效解决了长期训练过程的重要特征丢失问题。
(3)基于遗传算法对深度可分离卷积层、BiLSTM层与Dense层的层数与每层的神经元个数进行优化,通过计算适应度函数值对模型参数再训练、优化,从而获得模型的最佳网络结构。
(4)从用户体验后发表的在线评论中分析得到用户对该产品的满意程度,综合显示器一些重要影响因素,旨在分析产品某些重要属性,例如价格、分辨率等的改变等对用户满意程度的波动,对企业在研发新产品,设计产品时提供参考意见。
实施例二:
本实施例提供了一种多特征融合产品的情感趋势预测模型,所述模型由实施例一任一方案所述的一种多特征融合产品的情感趋势预测模型建立方法建立。
实施例三:
本实施例提供了一种基于多层神经网络的多特征融合产品评价预测方法,包括:输入产品属性特征数据至实施例二所述的一种多特征融合产品的情感趋势预测模型中,得到产品评价情感值的预测数据。
本公开不局限于上述可选实施方式,任何人在本公开的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是落入本公开权利要求界定范围内的技术方案,均落在本公开的保护范围之内。

Claims (7)

1.一种多特征融合产品的情感趋势预测模型建立方法,其特征在于,包括以下步骤:
S101、爬取电商网站上产品的评论数据以及产品属性特征数据;
S102、对爬取的数据进行数据清洗,对清洗后的评论数据进行情感分析获得产品的产品情感值,并在产品上标记产品情感值,将产品属性特征与情感值构成模型原始数据,构建模型原始数据集;将所述原始数据集划分为训练数据集和测试数据集;
S201、搭建情感趋势预测模型:堆叠深度可分离卷积特征提取层、卷积注意力层、双向长短期记忆网络预测层和全连接层,得到情感趋势预测模型;
S301、采用训练数据集中的数据对情感趋势预测模型进行训练,并采用测试数据集对情感趋势预测模型进行测试,直到获得测试合格的情感趋势预测模型。
2.根据权利要求1所述的一种多特征融合产品的情感趋势预测模型建立方法,其特征在于,在步骤S102中,
对爬取的数据进行数据清洗时,去除重复、无效、系统默认或字数少于设定字数的评论;
在对清洗后的评论数据进行情感分析获得评论数据的情感值时,对评论数据进行情感分析,计算每条评论的情感值,通过计算产品所有评论数据的情感值均值得到产品情感值,并在产品上标记产品情感值,将产品属性特征与情感值构成模型原始数据。
3.根据权利要求1所述的一种多特征融合产品的情感趋势预测模型建立方法,其特征在于,还包括利用遗传算法优化训练好的情感趋势预测模型的步骤,将情感趋势预测模型中需要优化的参数编码成遗传算法中个体染色体的基因,具体包括:
S401、利用随机值初始化遗传算法的第一代种群,种群的每一个个体即代表了一种可能的最优网络模型结构;
S402、通过对适应度函数的计算来评价个体的适应度,适应度越大,被保留下来的概率也越大;
S403、被保留下来的个体被随机选择成为父代,通过染色体交叉、基因突变生成下一代理论上更优的个体,并共同组成新一代种群;
重复S402和S403步骤,直到达到设定的遗传算法的结束条件,从中选择适应度最大的个体,该个体表示了一种理论上最优的网络模型结构。
4.根据权利要求1所述的一种多特征融合产品的情感趋势预测模型建立方法,其特征在于,情感趋势预测模型中需要优化的参数包括深度可分离卷积特征提取层的层数、双向长短期记忆网络预测层的层数、全连接层的层数和每层的神经元个数。
5.根据权利要求1所述的一种多特征融合产品的情感趋势预测模型建立方法,其特征在于,在步骤S101中,采用python的Beautiful Soup爬虫框架爬取电商网站上产品的评论数据;在步骤S102中,利用正则表达式对评论数据进行数据清洗。
6.一种多特征融合产品的情感趋势预测模型,其特征在于,所述模型由权利要求1至5任一所述的一种多特征融合产品的情感趋势预测模型建立方法建立。
7.一种基于多层神经网络的多特征融合产品评价预测方法,其特征在于,包括:输入产品属性特征数据至权利要求6所述的一种多特征融合产品的情感趋势预测模型中,得到产品评价情感值的预测数据。
CN202210104817.8A 2022-01-26 2022-01-26 一种多特征融合产品的情感趋势预测模型、建立方法及预测方法 Pending CN114580707A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210104817.8A CN114580707A (zh) 2022-01-26 2022-01-26 一种多特征融合产品的情感趋势预测模型、建立方法及预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210104817.8A CN114580707A (zh) 2022-01-26 2022-01-26 一种多特征融合产品的情感趋势预测模型、建立方法及预测方法

Publications (1)

Publication Number Publication Date
CN114580707A true CN114580707A (zh) 2022-06-03

Family

ID=81772518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210104817.8A Pending CN114580707A (zh) 2022-01-26 2022-01-26 一种多特征融合产品的情感趋势预测模型、建立方法及预测方法

Country Status (1)

Country Link
CN (1) CN114580707A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115481788A (zh) * 2022-08-31 2022-12-16 北京建筑大学 相变储能系统负荷预测方法及系统
CN115952291A (zh) * 2023-03-14 2023-04-11 山东大学 基于多头自注意力及lstm的金融舆情分类方法及系统
CN116385977A (zh) * 2023-06-06 2023-07-04 首都医科大学附属北京安贞医院 一种基于深度学习的术中出血点检测系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115481788A (zh) * 2022-08-31 2022-12-16 北京建筑大学 相变储能系统负荷预测方法及系统
CN115481788B (zh) * 2022-08-31 2023-08-25 北京建筑大学 相变储能系统负荷预测方法及系统
CN115952291A (zh) * 2023-03-14 2023-04-11 山东大学 基于多头自注意力及lstm的金融舆情分类方法及系统
CN116385977A (zh) * 2023-06-06 2023-07-04 首都医科大学附属北京安贞医院 一种基于深度学习的术中出血点检测系统
CN116385977B (zh) * 2023-06-06 2023-08-15 首都医科大学附属北京安贞医院 一种基于深度学习的术中出血点检测系统

Similar Documents

Publication Publication Date Title
Wu et al. A graph-based CNN-LSTM stock price prediction algorithm with leading indicators
Wang et al. A method for product form design of integrating interactive genetic algorithm with the interval hesitation time and user satisfaction
CN112667818B (zh) 融合gcn与多粒度注意力的用户评论情感分析方法及系统
CN114580707A (zh) 一种多特征融合产品的情感趋势预测模型、建立方法及预测方法
CN108363695B (zh) 一种基于双向依赖语法树表征的用户评论属性抽取方法
CN111274398A (zh) 一种方面级用户产品评论情感分析方法及系统
Dou et al. A method for product personalized design based on prospect theory improved with interval reference
CN111127146A (zh) 基于卷积神经网络与降噪自编码器的信息推荐方法及系统
CN117787569B (zh) 一种智能辅助评标方法及系统
CN112016002A (zh) 融合评论文本层级注意力和时间因素的混合推荐方法
CN109903099A (zh) 用于评分预测的模型构建方法和系统
Yang et al. Combining users’ cognition noise with interactive genetic algorithms and trapezoidal fuzzy numbers for product color design
CN110704510A (zh) 一种结合用户画像的题目推荐方法及系统
CN112182227A (zh) 基于transD知识图嵌入的文本情感分类系统及方法
CN114648031A (zh) 基于双向lstm和多头注意力机制的文本方面级情感识别方法
Wei et al. Research on intelligent design mechanism of landscape lamp with regional cultural value based on interactive genetic algorithm
Quan et al. Decoding social sentiment in dao: A comparative analysis of blockchain governance communities
CN110874392A (zh) 基于深度双向注意力机制的文本网络信息融合嵌入方法
Ren et al. A co-attention based multi-modal fusion network for review helpfulness prediction
Jin GraphCNNpred: A stock market indices prediction using a Graph based deep learning system
Lin et al. Is the linear modeling technique good enough for optimal form design? A comparison of quantitative analysis models
Wu A product styling design evaluation method based on multilayer perceptron genetic algorithm neural network algorithm
Wang et al. Construction of a novel production develop decision model based on text mined
Li et al. Case-based reasoning approach for decision-making in building retrofit: A review
CN116805010A (zh) 面向装备制造的多数据链集成与融合知识图谱构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination