CN112559683A - 基于多模态数据及多交互记忆网络的方面级情感分析方法 - Google Patents
基于多模态数据及多交互记忆网络的方面级情感分析方法 Download PDFInfo
- Publication number
- CN112559683A CN112559683A CN202011440133.2A CN202011440133A CN112559683A CN 112559683 A CN112559683 A CN 112559683A CN 202011440133 A CN202011440133 A CN 202011440133A CN 112559683 A CN112559683 A CN 112559683A
- Authority
- CN
- China
- Prior art keywords
- text
- memory network
- visual
- memory
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015654 memory Effects 0.000 title claims abstract description 101
- 230000008451 emotion Effects 0.000 title claims abstract description 53
- 238000004458 analytical method Methods 0.000 title claims abstract description 36
- 230000002452 interceptive effect Effects 0.000 claims abstract description 15
- 230000003993 interaction Effects 0.000 claims abstract description 10
- 230000009191 jumping Effects 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 73
- 230000000007 visual effect Effects 0.000 claims description 56
- 238000000034 method Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 13
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000009193 crawling Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 230000000877 morphologic effect Effects 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 230000006403 short-term memory Effects 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims 1
- 230000007787 long-term memory Effects 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 abstract description 2
- 238000012552 review Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 4
- 235000008694 Humulus lupulus Nutrition 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 241000238557 Decapoda Species 0.000 description 1
- 241000288105 Grus Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了基于多模态数据及多交互记忆网络的方面级情感分析方法,本发明中融合了文本和图像这两种不同模态的信息来进行方面级的情感分析,发明包括两个交互式记忆网络,分别对给定方面的文本和图片信息进行建模,不仅学习跨模态数据之间的交互影响,而且还学习单模态数据中的自我影响。交互式记忆网络中使用多个记忆跃点用于多交互注意力的提取并将得到的多交互注意力进行非线性组合以学习全局记忆抽象。本发明提出的基于多模态数据及多交互记忆网络的方面级情感分析方法通过增强单模态数据和跨模态数据的交互影响提升方面级情感分析的准确率,在方面级别的多模态情感分析任务上有了重大突破。
Description
技术领域
本发明涉及自然语言处理、计算机视觉、深度学习、多模态情感分析领域,具体涉及一种基于多模态数据及多交互记忆网络的方面级情感分析方法。
背景技术
方面级别的情感分析是情感分析领域中的一项基本任务,它在商业、公共管理和社会保障等领域具有许多实际应用。现有的关于方面情感分析的工作大多基于文本模态。随着近年来互联网上多模态用户生成的内容(例如文本和图像)的普及,多模态情感分析已引起越来越多的研究和关注。在方面级别的情感分析任务中,多模态数据通常比纯文本数据更重要。例如,客户将在购买产品之前浏览产品评论,而这些多模态评论更有可能吸引顾客的注意力。在每个淘宝商品条目下,大约有40%的评论同时包含文字和图片,这些多模态评论中的回复和点赞数量比纯文本评论大3倍到4倍,这凸显了分析多模态数据方面级情感的重要性。
对于方面情感分析,图像信息与文本信息一样具有指示性。一方面,在多模态数据中,文本和图像都与方面级情感高度相关。例如,当查看衣服的“上身效果”方面时,客户可能会写下正面的单词并将高质量的照片添加到评论中以表示满意,或者负面的单词和错误图像样本(例如衣服上身后与预期相差太大)以表达他们的不满。此外,不同方面可能与每个模态数据上的不同部分相关。换句话说,客户可以针对不同方面写下不同的单词或附加不同的图像。另一方面,文本和图像信息可以相互补充和互补,以增强对特定方面情感的分析。总而言之,多模态数据中存在各种相关性可用于方面级别的情感分析。然而,到目前为止,在方面级别和多模态情感分析的交叉点上尚未进行任何相关工作。
发明内容
为了应用多模数据融合方法解决方面级情感分析任务,本发明提出了一种基于多模态数据及多交互记忆网络的方面级情感分析方法。
为了达到上述目的,本发明基于多模态数据及多交互记忆网络的方面级情感分析方法通过以下技术方案实现:
一种基于多模态数据及多交互记忆网络的方面级情感分析方法,包含以下步骤:
S1:从淘宝网上爬取衣服类别中的热搜商品的第1页到第100页的带图评论,元数据共计27454条,涵盖132个品牌,1064种商品;
S2:对获取到的元数据进行清洗,筛除不相关的评论,并通过人工标注的方式,将每条元数据对应至少一个至多不超过八个的方面级标签。八个方面级标签包括性价比、面料、版型、外观、质量、颜色、尺寸、上身效果。通过将每个方式与多模态数据匹配可以得到54372个方面-评论样本对。对于每个方面,评论的情感分数都在0到10的整数之间;
S3:构建输入编码层和特征提取层对输入的多模态数据和标签进行编码,并提取其中的文本特征和图像特征;
S4:构建基于多交互注意力机制的记忆网络,其中包括一个文本记忆网络和一个视觉记忆网络,用于学习跨模态数据引起的交互影响以及单模态数据的自我影响;
S5:构建情感分类器从融合了多模态数据的特征向量中获得情感分数;
S6:将数据集按照8:1:1的比例分割成训练集、验证集和测试集,并将构建好的多交互记忆网络在此数据集上进行训练和推理,证明该方法在处理多模态方面级情感分类任务中有良好的表现。
进一步地,所述步骤3中的特征提取过程包括:
S31:使用双向长短期记忆网络(BiLSTM)模型进行方面特征嵌入,给定方面短语A={A1,A2,…,AN},则每个单词Aj的Dtext维嵌入矢量aj通过单词表示方法进行初始化。在每个时间步,LSTM单元都会学习嵌入aj的每个方面单词的隐藏表示从而获得方面特征向量;
S32:给定一个图像集{I1,I2,…,IK},使用预训练好的卷积神经网络(CNN),并删除顶部的完全连接层,以从每个图像Ik中提取Dimg维视觉特征向量xk,然后LSTM单元将视觉特征向量xk放入隐藏空间;
进一步地,所述步骤4中的构建基于多交互注意力机制的记忆网络包括:
S41:构建文本记忆网络提取重要的词来表达情感,并用给定方面的表示形式聚合文本记忆,以解决方面对文本带来的影响。它以外部文本记忆矩阵MT和方面特征向量vA作为输入,并通过多层感知器网络将每段文本存储器与方面特征向量vA组合在一起,以生成文本隐藏表示hi。最后,关注层使用关注权重ai通过这些文本存储块的加权平均值输出文本特征向量vtext;
S42:构建视觉记忆网络将图像特征与给定方面的表征相结合,以完全捕获方面对图像带来的影响。将视觉记忆MI和方面特征向量vA作为视觉记忆网络的输入,以提取视觉特征向量vimg。
进一步地,所述步骤S5中的情感分类器构成如下:
经过H次交互式记忆跃点后,提取GRU的最后输出作为最终的文本和视觉特征向量,并将它们连接起来作为softmax层的输入,以预测某个方面的情感得分。
进一步地,步骤S31中,所述最终方面特征向量vA采用所有隐藏表示形式vj的平均值:
接着按照以下方式计算归一化权重:
最后,关注层使用关注权重ai通过这些文本存储块的加权平均值输出文本特征向量vtext:
提取视觉特征向量vimg采用以下公式:
进一步地,所述步骤S4中,构建基于多交互注意力机制的记忆网络,对于文本注意力,使用文本和视觉记忆网络得到原始的文本特征向量vtext和视觉特征向量vimg后,在文本记忆网络的第t跳中,输入文本特征向量vtext来生成文本形态注意特征然后使用视觉特征向量vimg再次查询文本记忆网络MT以得到跨模态注意功能最后,将它们平均为文本注意特征向量
同时,采用GRU来合并所有交互式注意力记忆结果并将交互式注意力机制与几种记忆跃点进行堆叠,以学习多模态数据的深度抽象;在第t个记忆跃点上,使用我们的多重交互注意机制获得文本和视觉注意特征向量;然后,GRU单元为下一个操作更新新的文本和视觉特征向量。
进一步地,所述步骤S6中,,训练过程中使用Adam优化算法及最小化交叉熵损失函数来训练模型;为了避免过度拟合,采用了Dropout机制;同时,还采用了早停策略,即如果训练损失连续几个时期下降率低于预设值,则停止训练。
本发明的有益效果:
本发明中融合了文本和图像这两种不同模态的信息来进行方面级的情感分析。该发明包括两个交互式记忆网络,分别对给定方面的文本和图片信息进行建模,不仅学习跨模态数据之间的交互影响,而且还学习单模态数据中的自我影响。交互式记忆网络中使用多个记忆跃点用于多交互注意力的提取并将得到的多交互注意力进行非线性组合以学习全局记忆抽象。本发明提出的基于多模态数据及多交互记忆网络的方面级情感分析方法通过增强单模态数据和跨模态数据的交互影响提升方面级情感分析的准确率,在方面级别的多模态情感分析任务上有了重大突破。
附图说明
图1为本发明的基于多模态数据及多交互记忆网络的方面级情感分析方法的流程图;
图2为本发明的基于多模态数据及多交互记忆网络的方面级情感分析方法的网络结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实例中技术方案进行清楚,完整地描述。本发明包括但不仅限于下述实施例。
如图1所示为本发明的基于多模态数据及多交互记忆网络的方面级情感分析方法的整体实施流程图,具体步骤如下:
S1:从淘宝网上自动化爬取衣服类别中的热搜商品的第1页到第100页的带图评论,元数据共计27454条,涵盖132个品牌,1064种商品;
S2:对获取到的元数据进行清洗,筛除不相关的评论,并通过人工标注的方式,将每条元数据对应至少一个至多不超过八个的方面级标签。八个方面级标签包括性价比、面料、版型、外观、质量、颜色、尺寸、上身效果。通过将每个方式与多模态数据匹配可以得到54372个方面-评论样本对。对于每个方面,评论的情感分数都在0到10的整数之间;
S3:构建输入编码层和特征提取层对输入的多模态数据和标签进行编码,并提取其中的文本特征和图像特征;
其中使用双向长短期记忆网络(BiLSTM)模型进行方面特征嵌入,给定方面短语A={A1,A2,…,AN},则每个单词Aj的Dtext维嵌入矢量aj通过单词表示方法进行初始化。在每个时间步,LSTM单元都会学习嵌入aj的每个方面单词的隐藏表示
aj=Embed(Aj),j∈[1,N]
给定一个图像集{I1,I2,…,IK},使用预训练好的卷积神经网络(CNN),并删除顶部的完全连接层,以从每个图像Ik中提取Dimg维视觉特征向量xk,然后LSTM单元将视觉特征向量xk放入隐藏空间;
xk=CNN(Ik),k∈[1,K]
wi=Embed(Wi),i∈[1,L]
堆叠这些隐藏状态并将它们表示为外部文本存储矩阵MT。
S4:构建基于多交互注意力机制的记忆网络,其中包括一个文本记忆网络和一个视觉记忆网络,用于学习跨模态数据引起的交互影响以及单模态数据的自我影响;
其中,文本记忆网络提取重要的词来表达情感,并用给定方面的表示形式聚合文本记忆,以解决方面对文本带来的影响。它以外部文本记忆矩阵MT和方面特征向量vA作为输入,并通过多层感知器网络将每段文本存储器与方面特征向量vA组合在一起,以生成文本隐藏表示hi。
接着按照以下方式计算归一化权重:
最后,关注层使用关注权重ai通过这些文本存储块的加权平均值输出文本特征向量vtext。
构建视觉记忆网络将图像特征与给定方面的表征相结合,以完全捕获方面对图像带来的影响。将视觉记忆MI和方面特征向量vA作为视觉记忆网络的输入,以提取视觉特征向量vimg。
对于多模态数据,文本和视觉信息在情感分析中可以相互补充和互补。为了完全捕获图像和文本之间的双向交互,本发明使用了一种多交互注意力机制。该机制包括跨模态注意和单模态注意。通过这种设计,模型不仅可以学习由跨模态数据引起的交互影响,而且可以学习由单模态数据(即文本到文本及图像到图像)引起的自我影响。
对于文本注意力,使用文本和视觉记忆网络得到原始的文本特征向量vtext和视觉特征向量vimg后,在文本记忆网络的第t跳中,输入文本特征向量vtext来生成文本形态注意特征然后,为了解图像带给文本的交互影响,使用视觉特征向量vimg再次查询文本记忆网络MT以得到跨模态注意功能最后,将它们平均为文本注意特征向量
同时,采用GRU来合并所有交互式注意力记忆结果并将交互式注意力机制与几种记忆跃点进行堆叠,以学习多模态数据的深度抽象。形式上,在第t个记忆跃点上,使用我们的多重交互注意机制获得文本和视觉注意特征向量。然后,GRU单元为下一个操作更新新的文本和视觉特征向量。
S5:构建情感分类器从融合了多模态数据的特征向量中获得情感分数;
具体的,经过H次交互式记忆跃点后,提取GRU的最后输出作为最终的文本和视觉特征向量,并将它们连接起来作为softmax层的输入,以预测方面的情感得分。
Pred=Softmax(wmulti[vtext,vimg]+bmulti)
整体网络结构如图2所示。
S6:将数据集按照8:1:1的比例分割成训练集、验证集和测试集,并将构建好的多交互记忆网络在此数据集上进行训练和推理,证明该方法在处理多模态方面级情感分类任务中有良好的表现。
具体的,训练过程中使用Adam优化算法及最小化交叉熵损失函数来训练模型。为了避免过度拟合,采用了Dropout机制。同时,本发明还采用了早停策略,即如果训练损失连续几个时期下降率低于预设值,则停止训练。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员或一般模型爱好者可以无需创造性劳动或者通过软件编程就可以根据本发明的构思在现有技术的基础上通过逻辑分析,推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (8)
1.基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,包括以下步骤:
S1:从购物网站上爬取分析对象的用户带图评论的元数据;
S2:对获取到的元数据进行清洗,筛除不相关的评论,并通过人工标注的方式,将每条元数据分别对应至少一个、至多不超过八个的方面级标签;
S3:构建输入编码层和特征提取层对输入的多模态数据和标签进行编码,并提取其中的文本特征和图像特征;
S4:构建基于多交互注意力机制的记忆网络,其中包括一个文本记忆网络和一个视觉记忆网络,用于学习跨模态数据引起的交互影响以及单模态数据的自我影响;
S5:构建情感分类器,从融合了多模态数据的特征向量中获得情感分数;
S6:将数据集按照8∶1∶1的比例分割成训练集、验证集和测试集,并将构建好的多交互注意力机制的记忆网络在数据集上进行训练和推理,证明该方法在处理多模态方面级情感分类任务中有良好的表现。
2.根据权利要求1所述的基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,所述单模态数据的获取步骤包括:
S31:使用双向长短期记忆网络模型进行方面特征嵌入,给定方面短语A={A1,A2,...,AN},则每个单词Aj的Dtext维嵌入矢量aj通过单词表示方法进行初始化;在每个时间步,长短期记忆网络单元都会学习嵌入ai的每个方面单词的隐藏表示从而获得最终方面特征向量;
S32:给定一个图像集{I1,I2,...,IK},使用预训练好的卷积神经网络,并删除顶部的完全连接层,以从每个图像集中提取Dimg维视觉特征向量xk,然后长短期记忆网络单元将视觉特征向量xk放入隐藏空间;
3.根据权利要求1所述的一种基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,步骤S4中,所述构建基于多交互注意力机制的记忆网络的步骤包括:
S41:构建文本记忆网络提取词汇来表达情感,并用给定方面的表示形式聚合文本记忆,以解决方面对文本带来的影响;它以外部文本记忆矩阵MT和方面特征向量vA作为输入,并通过多层感知器网络将每段文本记忆器与方面特征向量vA组合在一起,以生成文本隐藏表示hi;最后,关注层使用关注权重ai通过这些文本存储块的加权平均值输出文本特征向量vtext;
S42:构建视觉记忆网络将图像特征与给定方面的表征相结合,以完全捕获方面对图像带来的影响;将视觉记忆MI和方面特征向量vA作为视觉记忆网络的输入,以提取视觉特征向量vimg。
4.根据权利要求1所述的基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,所述步骤S5中,情感分类器构成方法包括:经过H次交互式记忆跃点后,提取GRU的最后输出作为最终的文本和视觉特征向量,并将它们连接起来作为softmax层的输入,以预测某个方面的情感得分。
7.根据权利要求6所述的基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,所述步骤S4中,构建基于多交互注意力机制的记忆网络,对于文本注意力,使用文本和视觉记忆网络得到原始的文本特征向量vtext和视觉特征向量vimg后,在文本记忆网络的第t跳中,输入文本特征向量vtext来生成文本形态注意特征然后使用视觉特征向量vimg再次查询文本记忆网络MT以得到跨模态注意功能最后,将它们平均为文本注意特征向量
同时,采用GRU来合并所有交互式注意力记忆结果并将交互式注意力机制与几种记忆跃点进行堆叠,以学习多模态数据的深度抽象;在第t个记忆跃点上,使用我们的多重交互注意机制获得文本和视觉注意特征向量;然后,GRU单元为下一个操作更新新的文本和视觉特征向量。
8.根据权利要求1所述的基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,所述步骤S6中,,训练过程中使用Adam优化算法及最小化交叉熵损失函数来训练模型;为了避免过度拟合,采用了Dropout机制;同时,还采用了早停策略,即如果训练损失连续几个时期下降率低于预设值,则停止训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011440133.2A CN112559683A (zh) | 2020-12-11 | 2020-12-11 | 基于多模态数据及多交互记忆网络的方面级情感分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011440133.2A CN112559683A (zh) | 2020-12-11 | 2020-12-11 | 基于多模态数据及多交互记忆网络的方面级情感分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112559683A true CN112559683A (zh) | 2021-03-26 |
Family
ID=75061090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011440133.2A Pending CN112559683A (zh) | 2020-12-11 | 2020-12-11 | 基于多模态数据及多交互记忆网络的方面级情感分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112559683A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949622A (zh) * | 2021-04-08 | 2021-06-11 | 苏州大学 | 融合文本与图像的双模态性格分类方法及装置 |
CN113435496A (zh) * | 2021-06-24 | 2021-09-24 | 湖南大学 | 一种基于注意力机制的自适应融合的多模态情感分类方法 |
CN113806609A (zh) * | 2021-09-26 | 2021-12-17 | 郑州轻工业大学 | 一种基于mit和fsm的多模态情感分析方法 |
CN113822045A (zh) * | 2021-09-29 | 2021-12-21 | 深圳市易平方网络科技有限公司 | 一种基于多模态数据的影评质量的识别方法及相关装置 |
CN114048288A (zh) * | 2021-11-10 | 2022-02-15 | 北京明略软件系统有限公司 | 细粒度情感分析方法、系统、计算机设备和存储介质 |
CN114549850A (zh) * | 2022-01-24 | 2022-05-27 | 西北大学 | 一种解决模态缺失问题的多模态图像美学质量评价方法 |
CN114936623A (zh) * | 2022-04-20 | 2022-08-23 | 西北工业大学 | 一种融合多模态数据的方面级情感分析方法 |
WO2023045605A1 (zh) * | 2021-09-22 | 2023-03-30 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、计算机设备及存储介质 |
CN116108186A (zh) * | 2023-04-13 | 2023-05-12 | 南开大学 | 一种多模态方面级情感分析方法 |
CN117594184A (zh) * | 2024-01-19 | 2024-02-23 | 中国科学技术大学 | 一种基于记忆网络的医疗多模态内容分析及生成方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109472031A (zh) * | 2018-11-09 | 2019-03-15 | 电子科技大学 | 一种基于双记忆注意力的方面级别情感分类模型及方法 |
CN111079409A (zh) * | 2019-12-16 | 2020-04-28 | 东北大学秦皇岛分校 | 一种利用上下文和方面记忆信息的情感分类方法 |
CN111274398A (zh) * | 2020-01-20 | 2020-06-12 | 福州大学 | 一种方面级用户产品评论情感分析方法及系统 |
CN111814454A (zh) * | 2020-07-10 | 2020-10-23 | 重庆大学 | 一种社交网络上的多模态网络欺凌检测模型 |
US20200356724A1 (en) * | 2019-05-06 | 2020-11-12 | University Of Electronic Science And Technology Of China | Multi-hop attention and depth model, method, storage medium and terminal for classification of target sentiments |
-
2020
- 2020-12-11 CN CN202011440133.2A patent/CN112559683A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109472031A (zh) * | 2018-11-09 | 2019-03-15 | 电子科技大学 | 一种基于双记忆注意力的方面级别情感分类模型及方法 |
US20200356724A1 (en) * | 2019-05-06 | 2020-11-12 | University Of Electronic Science And Technology Of China | Multi-hop attention and depth model, method, storage medium and terminal for classification of target sentiments |
CN111079409A (zh) * | 2019-12-16 | 2020-04-28 | 东北大学秦皇岛分校 | 一种利用上下文和方面记忆信息的情感分类方法 |
CN111274398A (zh) * | 2020-01-20 | 2020-06-12 | 福州大学 | 一种方面级用户产品评论情感分析方法及系统 |
CN111814454A (zh) * | 2020-07-10 | 2020-10-23 | 重庆大学 | 一种社交网络上的多模态网络欺凌检测模型 |
Non-Patent Citations (1)
Title |
---|
NAN XU等: "multi-interactive memory network for aspect based multimodal sentiment analysis", THE THIRTY-THIRD AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, 31 December 2019 (2019-12-31), pages 371 - 378 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949622B (zh) * | 2021-04-08 | 2023-06-27 | 苏州大学 | 融合文本与图像的双模态性格分类方法及装置 |
CN112949622A (zh) * | 2021-04-08 | 2021-06-11 | 苏州大学 | 融合文本与图像的双模态性格分类方法及装置 |
CN113435496A (zh) * | 2021-06-24 | 2021-09-24 | 湖南大学 | 一种基于注意力机制的自适应融合的多模态情感分类方法 |
WO2023045605A1 (zh) * | 2021-09-22 | 2023-03-30 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、计算机设备及存储介质 |
CN113806609A (zh) * | 2021-09-26 | 2021-12-17 | 郑州轻工业大学 | 一种基于mit和fsm的多模态情感分析方法 |
CN113822045A (zh) * | 2021-09-29 | 2021-12-21 | 深圳市易平方网络科技有限公司 | 一种基于多模态数据的影评质量的识别方法及相关装置 |
CN113822045B (zh) * | 2021-09-29 | 2023-11-17 | 重庆市易平方科技有限公司 | 一种基于多模态数据的影评质量的识别方法及相关装置 |
CN114048288A (zh) * | 2021-11-10 | 2022-02-15 | 北京明略软件系统有限公司 | 细粒度情感分析方法、系统、计算机设备和存储介质 |
CN114549850A (zh) * | 2022-01-24 | 2022-05-27 | 西北大学 | 一种解决模态缺失问题的多模态图像美学质量评价方法 |
CN114549850B (zh) * | 2022-01-24 | 2023-08-08 | 西北大学 | 一种解决模态缺失问题的多模态图像美学质量评价方法 |
CN114936623A (zh) * | 2022-04-20 | 2022-08-23 | 西北工业大学 | 一种融合多模态数据的方面级情感分析方法 |
CN114936623B (zh) * | 2022-04-20 | 2024-02-27 | 西北工业大学 | 一种融合多模态数据的方面级情感分析方法 |
CN116108186B (zh) * | 2023-04-13 | 2023-06-20 | 南开大学 | 一种多模态方面级情感分析方法 |
CN116108186A (zh) * | 2023-04-13 | 2023-05-12 | 南开大学 | 一种多模态方面级情感分析方法 |
CN117594184A (zh) * | 2024-01-19 | 2024-02-23 | 中国科学技术大学 | 一种基于记忆网络的医疗多模态内容分析及生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112559683A (zh) | 基于多模态数据及多交互记忆网络的方面级情感分析方法 | |
Zahavy et al. | Is a picture worth a thousand words? A deep multi-modal architecture for product classification in e-commerce | |
CN108763362B (zh) | 基于随机锚点对选择的局部模型加权融合Top-N电影推荐方法 | |
CN106599022B (zh) | 基于用户访问数据的用户画像形成方法 | |
CN111222332B (zh) | 一种结合注意力网络和用户情感的商品推荐方法 | |
CN110263257B (zh) | 基于深度学习处理多源异构数据的推荐方法 | |
CN109344288A (zh) | 一种基于多模态特征结合多层注意力机制的结合视频描述方法 | |
CN110162703A (zh) | 内容推荐方法、训练方法、装置、设备及存储介质 | |
CN110852368A (zh) | 全局与局部特征嵌入及图文融合的情感分析方法与系统 | |
CN108491469B (zh) | 引入概念标签的神经协同过滤概念描述词推荐方法 | |
CN112288042B (zh) | 行为预测系统的更新方法及装置、存储介质和计算设备 | |
CN111309936A (zh) | 一种电影用户画像的构建方法 | |
CN109584006B (zh) | 一种基于深度匹配模型的跨平台商品匹配方法 | |
Gandhi et al. | Scalable detection of offensive and non-compliant content/logo in product images | |
CN107247755A (zh) | 一种基于上下文序列记忆网络的个性化图像字幕生成方法 | |
Liu et al. | Fact-based visual question answering via dual-process system | |
CN111985520A (zh) | 一种基于图卷积神经网络的多模态分类方法 | |
CN112667813A (zh) | 用于裁判文书的敏感身份信息的识别方法 | |
CN112101380A (zh) | 基于图文匹配的产品点击率预测方法和系统、存储介质 | |
CN111522979A (zh) | 图片排序推荐方法、装置、电子设备、存储介质 | |
CN113779245A (zh) | 一种评论情感原因三元组抽取方法 | |
CN114357167A (zh) | 基于Bi-LSTM-GCN的多标签文本分类方法和系统 | |
CN112364236A (zh) | 目标对象推荐系统、方法、装置、数据处理方法及装置 | |
Shi et al. | Product feature extraction from Chinese online reviews: application to product improvement | |
Gandhi et al. | Image matters: scalable detection of offensive and non-compliant content/logo in product images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |