CN112559683A - 基于多模态数据及多交互记忆网络的方面级情感分析方法 - Google Patents

基于多模态数据及多交互记忆网络的方面级情感分析方法 Download PDF

Info

Publication number
CN112559683A
CN112559683A CN202011440133.2A CN202011440133A CN112559683A CN 112559683 A CN112559683 A CN 112559683A CN 202011440133 A CN202011440133 A CN 202011440133A CN 112559683 A CN112559683 A CN 112559683A
Authority
CN
China
Prior art keywords
text
memory network
visual
memory
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011440133.2A
Other languages
English (en)
Inventor
何慧华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Yuanqichuang Artificial Intelligence Technology Co ltd
Original Assignee
Suzhou Yuanqichuang Artificial Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Yuanqichuang Artificial Intelligence Technology Co ltd filed Critical Suzhou Yuanqichuang Artificial Intelligence Technology Co ltd
Priority to CN202011440133.2A priority Critical patent/CN112559683A/zh
Publication of CN112559683A publication Critical patent/CN112559683A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于多模态数据及多交互记忆网络的方面级情感分析方法,本发明中融合了文本和图像这两种不同模态的信息来进行方面级的情感分析,发明包括两个交互式记忆网络,分别对给定方面的文本和图片信息进行建模,不仅学习跨模态数据之间的交互影响,而且还学习单模态数据中的自我影响。交互式记忆网络中使用多个记忆跃点用于多交互注意力的提取并将得到的多交互注意力进行非线性组合以学习全局记忆抽象。本发明提出的基于多模态数据及多交互记忆网络的方面级情感分析方法通过增强单模态数据和跨模态数据的交互影响提升方面级情感分析的准确率,在方面级别的多模态情感分析任务上有了重大突破。

Description

基于多模态数据及多交互记忆网络的方面级情感分析方法
技术领域
本发明涉及自然语言处理、计算机视觉、深度学习、多模态情感分析领域,具体涉及一种基于多模态数据及多交互记忆网络的方面级情感分析方法。
背景技术
方面级别的情感分析是情感分析领域中的一项基本任务,它在商业、公共管理和社会保障等领域具有许多实际应用。现有的关于方面情感分析的工作大多基于文本模态。随着近年来互联网上多模态用户生成的内容(例如文本和图像)的普及,多模态情感分析已引起越来越多的研究和关注。在方面级别的情感分析任务中,多模态数据通常比纯文本数据更重要。例如,客户将在购买产品之前浏览产品评论,而这些多模态评论更有可能吸引顾客的注意力。在每个淘宝商品条目下,大约有40%的评论同时包含文字和图片,这些多模态评论中的回复和点赞数量比纯文本评论大3倍到4倍,这凸显了分析多模态数据方面级情感的重要性。
对于方面情感分析,图像信息与文本信息一样具有指示性。一方面,在多模态数据中,文本和图像都与方面级情感高度相关。例如,当查看衣服的“上身效果”方面时,客户可能会写下正面的单词并将高质量的照片添加到评论中以表示满意,或者负面的单词和错误图像样本(例如衣服上身后与预期相差太大)以表达他们的不满。此外,不同方面可能与每个模态数据上的不同部分相关。换句话说,客户可以针对不同方面写下不同的单词或附加不同的图像。另一方面,文本和图像信息可以相互补充和互补,以增强对特定方面情感的分析。总而言之,多模态数据中存在各种相关性可用于方面级别的情感分析。然而,到目前为止,在方面级别和多模态情感分析的交叉点上尚未进行任何相关工作。
发明内容
为了应用多模数据融合方法解决方面级情感分析任务,本发明提出了一种基于多模态数据及多交互记忆网络的方面级情感分析方法。
为了达到上述目的,本发明基于多模态数据及多交互记忆网络的方面级情感分析方法通过以下技术方案实现:
一种基于多模态数据及多交互记忆网络的方面级情感分析方法,包含以下步骤:
S1:从淘宝网上爬取衣服类别中的热搜商品的第1页到第100页的带图评论,元数据共计27454条,涵盖132个品牌,1064种商品;
S2:对获取到的元数据进行清洗,筛除不相关的评论,并通过人工标注的方式,将每条元数据对应至少一个至多不超过八个的方面级标签。八个方面级标签包括性价比、面料、版型、外观、质量、颜色、尺寸、上身效果。通过将每个方式与多模态数据匹配可以得到54372个方面-评论样本对。对于每个方面,评论的情感分数都在0到10的整数之间;
S3:构建输入编码层和特征提取层对输入的多模态数据和标签进行编码,并提取其中的文本特征和图像特征;
S4:构建基于多交互注意力机制的记忆网络,其中包括一个文本记忆网络和一个视觉记忆网络,用于学习跨模态数据引起的交互影响以及单模态数据的自我影响;
S5:构建情感分类器从融合了多模态数据的特征向量中获得情感分数;
S6:将数据集按照8:1:1的比例分割成训练集、验证集和测试集,并将构建好的多交互记忆网络在此数据集上进行训练和推理,证明该方法在处理多模态方面级情感分类任务中有良好的表现。
进一步地,所述步骤3中的特征提取过程包括:
S31:使用双向长短期记忆网络(BiLSTM)模型进行方面特征嵌入,给定方面短语A={A1,A2,…,AN},则每个单词Aj的Dtext维嵌入矢量aj通过单词表示方法进行初始化。在每个时间步,LSTM单元都会学习嵌入aj的每个方面单词的隐藏表示
Figure BDA0002830213210000021
从而获得方面特征向量;
S32:给定一个图像集{I1,I2,…,IK},使用预训练好的卷积神经网络(CNN),并删除顶部的完全连接层,以从每个图像Ik中提取Dimg维视觉特征向量xk,然后LSTM单元将视觉特征向量xk放入隐藏空间;
S33:给定文本内容T={W1,W2,…,WL},将每个单词Wi嵌入到单词向量
Figure BDA0002830213210000022
中,并通过单词表示方法进行初始化。LSTM单元将词嵌入wi作为输入并输出隐藏状态
Figure BDA0002830213210000023
进一步地,所述步骤4中的构建基于多交互注意力机制的记忆网络包括:
S41:构建文本记忆网络提取重要的词来表达情感,并用给定方面的表示形式聚合文本记忆,以解决方面对文本带来的影响。它以外部文本记忆矩阵MT和方面特征向量vA作为输入,并通过多层感知器网络将每段文本存储器
Figure BDA0002830213210000024
与方面特征向量vA组合在一起,以生成文本隐藏表示hi。最后,关注层使用关注权重ai通过这些文本存储块的加权平均值输出文本特征向量vtext
S42:构建视觉记忆网络将图像特征与给定方面的表征相结合,以完全捕获方面对图像带来的影响。将视觉记忆MI和方面特征向量vA作为视觉记忆网络的输入,以提取视觉特征向量vimg
进一步地,所述步骤S5中的情感分类器构成如下:
经过H次交互式记忆跃点后,提取GRU的最后输出作为最终的文本和视觉特征向量,并将它们连接起来作为softmax层的输入,以预测某个方面的情感得分。
进一步地,步骤S31中,所述最终方面特征向量vA采用所有隐藏表示形式vj的平均值:
Figure BDA0002830213210000031
步骤S32中,还堆叠每个隐藏状态
Figure BDA0002830213210000032
以构建视觉记忆MI,该记忆网络记录所有视觉信息
Figure BDA0002830213210000033
步骤S33中,堆叠隐藏状态
Figure BDA0002830213210000034
并将它们表示为外部文本存储矩阵
Figure BDA0002830213210000035
进一步地,所述步骤S4中,通过多层感知器网络将每段文本存储器
Figure BDA0002830213210000036
与方面特征向量vA组合在一起,以生成文本隐藏表示hi
Figure BDA0002830213210000037
接着按照以下方式计算归一化权重:
Figure BDA0002830213210000038
最后,关注层使用关注权重ai通过这些文本存储块的加权平均值输出文本特征向量vtext
Figure BDA0002830213210000039
提取视觉特征向量vimg采用以下公式:
Figure BDA00028302132100000310
Figure BDA00028302132100000311
Figure BDA00028302132100000312
进一步地,所述步骤S4中,构建基于多交互注意力机制的记忆网络,对于文本注意力,使用文本和视觉记忆网络得到原始的文本特征向量vtext和视觉特征向量vimg后,在文本记忆网络的第t跳中,输入文本特征向量vtext来生成文本形态注意特征
Figure BDA00028302132100000313
然后使用视觉特征向量vimg再次查询文本记忆网络MT以得到跨模态注意功能
Figure BDA0002830213210000041
最后,将它们平均为文本注意特征向量
Figure BDA0002830213210000042
对于视觉注意力,同样结合视觉特征向量vimg和文本特征向量vtext,在视觉记忆网络的第t跳中具有视觉记忆MI;中间结果被平均为下一个操作的视觉注意特征向量
Figure BDA0002830213210000043
同时,采用GRU来合并所有交互式注意力记忆结果并将交互式注意力机制与几种记忆跃点进行堆叠,以学习多模态数据的深度抽象;在第t个记忆跃点上,使用我们的多重交互注意机制获得文本和视觉注意特征向量;然后,GRU单元为下一个操作更新新的文本和视觉特征向量。
进一步地,所述步骤S6中,,训练过程中使用Adam优化算法及最小化交叉熵损失函数来训练模型;为了避免过度拟合,采用了Dropout机制;同时,还采用了早停策略,即如果训练损失连续几个时期下降率低于预设值,则停止训练。
本发明的有益效果:
本发明中融合了文本和图像这两种不同模态的信息来进行方面级的情感分析。该发明包括两个交互式记忆网络,分别对给定方面的文本和图片信息进行建模,不仅学习跨模态数据之间的交互影响,而且还学习单模态数据中的自我影响。交互式记忆网络中使用多个记忆跃点用于多交互注意力的提取并将得到的多交互注意力进行非线性组合以学习全局记忆抽象。本发明提出的基于多模态数据及多交互记忆网络的方面级情感分析方法通过增强单模态数据和跨模态数据的交互影响提升方面级情感分析的准确率,在方面级别的多模态情感分析任务上有了重大突破。
附图说明
图1为本发明的基于多模态数据及多交互记忆网络的方面级情感分析方法的流程图;
图2为本发明的基于多模态数据及多交互记忆网络的方面级情感分析方法的网络结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实例中技术方案进行清楚,完整地描述。本发明包括但不仅限于下述实施例。
如图1所示为本发明的基于多模态数据及多交互记忆网络的方面级情感分析方法的整体实施流程图,具体步骤如下:
S1:从淘宝网上自动化爬取衣服类别中的热搜商品的第1页到第100页的带图评论,元数据共计27454条,涵盖132个品牌,1064种商品;
S2:对获取到的元数据进行清洗,筛除不相关的评论,并通过人工标注的方式,将每条元数据对应至少一个至多不超过八个的方面级标签。八个方面级标签包括性价比、面料、版型、外观、质量、颜色、尺寸、上身效果。通过将每个方式与多模态数据匹配可以得到54372个方面-评论样本对。对于每个方面,评论的情感分数都在0到10的整数之间;
S3:构建输入编码层和特征提取层对输入的多模态数据和标签进行编码,并提取其中的文本特征和图像特征;
其中使用双向长短期记忆网络(BiLSTM)模型进行方面特征嵌入,给定方面短语A={A1,A2,…,AN},则每个单词Aj的Dtext维嵌入矢量aj通过单词表示方法进行初始化。在每个时间步,LSTM单元都会学习嵌入aj的每个方面单词的隐藏表示
Figure BDA0002830213210000051
aj=Embed(Aj),j∈[1,N]
Figure BDA0002830213210000052
Figure BDA0002830213210000053
Figure BDA0002830213210000054
然后我们将所有隐藏表示形式vj的平均值作为最终方面特征向量
Figure BDA0002830213210000055
Figure BDA0002830213210000056
给定一个图像集{I1,I2,…,IK},使用预训练好的卷积神经网络(CNN),并删除顶部的完全连接层,以从每个图像Ik中提取Dimg维视觉特征向量xk,然后LSTM单元将视觉特征向量xk放入隐藏空间;
xk=CNN(Ik),k∈[1,K]
Figure BDA0002830213210000057
Figure BDA0002830213210000058
Figure BDA0002830213210000059
堆叠每个隐藏状态
Figure BDA00028302132100000510
以构建视觉记忆MI,该记忆网络记录所有视觉信息。
Figure BDA00028302132100000511
给定文本内容T={W1,W2,…,WL},将每个单词Wi嵌入到单词向量
Figure BDA00028302132100000512
中,并通过单词表示方法进行初始化。LSTM单元将词嵌入wi作为输入并输出隐藏状态
Figure BDA0002830213210000061
wi=Embed(Wi),i∈[1,L]
Figure BDA0002830213210000062
Figure BDA0002830213210000063
Figure BDA0002830213210000064
堆叠这些隐藏状态并将它们表示为外部文本存储矩阵MT
Figure BDA0002830213210000065
S4:构建基于多交互注意力机制的记忆网络,其中包括一个文本记忆网络和一个视觉记忆网络,用于学习跨模态数据引起的交互影响以及单模态数据的自我影响;
其中,文本记忆网络提取重要的词来表达情感,并用给定方面的表示形式聚合文本记忆,以解决方面对文本带来的影响。它以外部文本记忆矩阵MT和方面特征向量vA作为输入,并通过多层感知器网络将每段文本存储器
Figure BDA0002830213210000066
与方面特征向量vA组合在一起,以生成文本隐藏表示hi
Figure BDA0002830213210000067
接着按照以下方式计算归一化权重:
Figure BDA0002830213210000068
最后,关注层使用关注权重ai通过这些文本存储块的加权平均值输出文本特征向量vtext
Figure BDA0002830213210000069
构建视觉记忆网络将图像特征与给定方面的表征相结合,以完全捕获方面对图像带来的影响。将视觉记忆MI和方面特征向量vA作为视觉记忆网络的输入,以提取视觉特征向量vimg
Figure BDA00028302132100000610
Figure BDA00028302132100000611
Figure BDA00028302132100000612
对于多模态数据,文本和视觉信息在情感分析中可以相互补充和互补。为了完全捕获图像和文本之间的双向交互,本发明使用了一种多交互注意力机制。该机制包括跨模态注意和单模态注意。通过这种设计,模型不仅可以学习由跨模态数据引起的交互影响,而且可以学习由单模态数据(即文本到文本及图像到图像)引起的自我影响。
对于文本注意力,使用文本和视觉记忆网络得到原始的文本特征向量vtext和视觉特征向量vimg后,在文本记忆网络的第t跳中,输入文本特征向量vtext来生成文本形态注意特征
Figure BDA0002830213210000071
然后,为了解图像带给文本的交互影响,使用视觉特征向量vimg再次查询文本记忆网络MT以得到跨模态注意功能
Figure BDA0002830213210000072
最后,将它们平均为文本注意特征向量
Figure BDA0002830213210000073
Figure BDA0002830213210000074
Figure BDA0002830213210000075
Figure BDA0002830213210000076
其中
Figure BDA00028302132100000713
和H是记忆跃点数。Att是关注层。
对于视觉注意力,同样结合视觉特征向量vimg和文本特征向量vtext,在视觉记忆网络的第t跳中具有视觉记忆MI。中间结果被平均为下一个操作的视觉注意特征向量
Figure BDA0002830213210000077
Figure BDA0002830213210000078
Figure BDA0002830213210000079
Figure BDA00028302132100000710
同时,采用GRU来合并所有交互式注意力记忆结果并将交互式注意力机制与几种记忆跃点进行堆叠,以学习多模态数据的深度抽象。形式上,在第t个记忆跃点上,使用我们的多重交互注意机制获得文本和视觉注意特征向量。然后,GRU单元为下一个操作更新新的文本和视觉特征向量。
Figure BDA00028302132100000711
Figure BDA00028302132100000712
S5:构建情感分类器从融合了多模态数据的特征向量中获得情感分数;
具体的,经过H次交互式记忆跃点后,提取GRU的最后输出作为最终的文本和视觉特征向量,并将它们连接起来作为softmax层的输入,以预测方面的情感得分。
Pred=Softmax(wmulti[vtext,vimg]+bmulti)
整体网络结构如图2所示。
S6:将数据集按照8:1:1的比例分割成训练集、验证集和测试集,并将构建好的多交互记忆网络在此数据集上进行训练和推理,证明该方法在处理多模态方面级情感分类任务中有良好的表现。
具体的,训练过程中使用Adam优化算法及最小化交叉熵损失函数来训练模型。为了避免过度拟合,采用了Dropout机制。同时,本发明还采用了早停策略,即如果训练损失连续几个时期下降率低于预设值,则停止训练。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员或一般模型爱好者可以无需创造性劳动或者通过软件编程就可以根据本发明的构思在现有技术的基础上通过逻辑分析,推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

Claims (8)

1.基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,包括以下步骤:
S1:从购物网站上爬取分析对象的用户带图评论的元数据;
S2:对获取到的元数据进行清洗,筛除不相关的评论,并通过人工标注的方式,将每条元数据分别对应至少一个、至多不超过八个的方面级标签;
S3:构建输入编码层和特征提取层对输入的多模态数据和标签进行编码,并提取其中的文本特征和图像特征;
S4:构建基于多交互注意力机制的记忆网络,其中包括一个文本记忆网络和一个视觉记忆网络,用于学习跨模态数据引起的交互影响以及单模态数据的自我影响;
S5:构建情感分类器,从融合了多模态数据的特征向量中获得情感分数;
S6:将数据集按照8∶1∶1的比例分割成训练集、验证集和测试集,并将构建好的多交互注意力机制的记忆网络在数据集上进行训练和推理,证明该方法在处理多模态方面级情感分类任务中有良好的表现。
2.根据权利要求1所述的基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,所述单模态数据的获取步骤包括:
S31:使用双向长短期记忆网络模型进行方面特征嵌入,给定方面短语A={A1,A2,...,AN},则每个单词Aj的Dtext维嵌入矢量aj通过单词表示方法进行初始化;在每个时间步,长短期记忆网络单元都会学习嵌入ai的每个方面单词的隐藏表示
Figure FDA0002830213200000011
从而获得最终方面特征向量;
S32:给定一个图像集{I1,I2,...,IK},使用预训练好的卷积神经网络,并删除顶部的完全连接层,以从每个图像集中提取Dimg维视觉特征向量xk,然后长短期记忆网络单元将视觉特征向量xk放入隐藏空间;
S33:给定文本内容T={W1,W2,...,WL},将每个单词Wi嵌入到单词向量
Figure FDA0002830213200000012
中,并通过单词表示方法进行初始化;长短期记忆网络单元将词嵌入wi作为输入并输出隐藏状态
Figure FDA0002830213200000013
3.根据权利要求1所述的一种基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,步骤S4中,所述构建基于多交互注意力机制的记忆网络的步骤包括:
S41:构建文本记忆网络提取词汇来表达情感,并用给定方面的表示形式聚合文本记忆,以解决方面对文本带来的影响;它以外部文本记忆矩阵MT和方面特征向量vA作为输入,并通过多层感知器网络将每段文本记忆器
Figure FDA0002830213200000029
与方面特征向量vA组合在一起,以生成文本隐藏表示hi;最后,关注层使用关注权重ai通过这些文本存储块的加权平均值输出文本特征向量vtext
S42:构建视觉记忆网络将图像特征与给定方面的表征相结合,以完全捕获方面对图像带来的影响;将视觉记忆MI和方面特征向量vA作为视觉记忆网络的输入,以提取视觉特征向量vimg
4.根据权利要求1所述的基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,所述步骤S5中,情感分类器构成方法包括:经过H次交互式记忆跃点后,提取GRU的最后输出作为最终的文本和视觉特征向量,并将它们连接起来作为softmax层的输入,以预测某个方面的情感得分。
5.根据权利要求2所述的基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,步骤S31中,所述最终方面特征向量vA采用所有隐藏表示形式vj的平均值:
Figure FDA0002830213200000021
步骤S32中,还堆叠每个隐藏状态
Figure FDA0002830213200000022
以构建视觉记忆MI,该记忆网络记录所有视觉信息
Figure FDA0002830213200000023
步骤S33中,堆叠隐藏状态
Figure FDA0002830213200000024
并将它们表示为外部文本存储矩阵
Figure FDA0002830213200000025
6.根据权利要求3所述的基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,所述步骤S4中,通过多层感知器网络将每段文本存储器
Figure FDA0002830213200000026
与方面特征向量vA组合在一起,以生成文本隐藏表示hi
Figure FDA0002830213200000027
接着按照以下方式计算归一化权重:
Figure FDA0002830213200000028
最后,关注层使用关注权重ai通过这些文本存储块的加权平均值输出文本特征向量vtext
Figure FDA0002830213200000031
提取视觉特征向量vimg采用以下公式:
Figure FDA0002830213200000032
Figure FDA0002830213200000033
Figure FDA0002830213200000034
7.根据权利要求6所述的基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,所述步骤S4中,构建基于多交互注意力机制的记忆网络,对于文本注意力,使用文本和视觉记忆网络得到原始的文本特征向量vtext和视觉特征向量vimg后,在文本记忆网络的第t跳中,输入文本特征向量vtext来生成文本形态注意特征
Figure FDA0002830213200000035
然后使用视觉特征向量vimg再次查询文本记忆网络MT以得到跨模态注意功能
Figure FDA0002830213200000036
最后,将它们平均为文本注意特征向量
Figure FDA0002830213200000037
对于视觉注意力,同样结合视觉特征向量vimg和文本特征向量vtext,在视觉记忆网络的第t跳中具有视觉记忆MI;中间结果被平均为下一个操作的视觉注意特征向量
Figure FDA0002830213200000038
同时,采用GRU来合并所有交互式注意力记忆结果并将交互式注意力机制与几种记忆跃点进行堆叠,以学习多模态数据的深度抽象;在第t个记忆跃点上,使用我们的多重交互注意机制获得文本和视觉注意特征向量;然后,GRU单元为下一个操作更新新的文本和视觉特征向量。
8.根据权利要求1所述的基于多模态数据及多交互记忆网络的方面级情感分析方法,其特征在于,所述步骤S6中,,训练过程中使用Adam优化算法及最小化交叉熵损失函数来训练模型;为了避免过度拟合,采用了Dropout机制;同时,还采用了早停策略,即如果训练损失连续几个时期下降率低于预设值,则停止训练。
CN202011440133.2A 2020-12-11 2020-12-11 基于多模态数据及多交互记忆网络的方面级情感分析方法 Pending CN112559683A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011440133.2A CN112559683A (zh) 2020-12-11 2020-12-11 基于多模态数据及多交互记忆网络的方面级情感分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011440133.2A CN112559683A (zh) 2020-12-11 2020-12-11 基于多模态数据及多交互记忆网络的方面级情感分析方法

Publications (1)

Publication Number Publication Date
CN112559683A true CN112559683A (zh) 2021-03-26

Family

ID=75061090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011440133.2A Pending CN112559683A (zh) 2020-12-11 2020-12-11 基于多模态数据及多交互记忆网络的方面级情感分析方法

Country Status (1)

Country Link
CN (1) CN112559683A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949622A (zh) * 2021-04-08 2021-06-11 苏州大学 融合文本与图像的双模态性格分类方法及装置
CN113435496A (zh) * 2021-06-24 2021-09-24 湖南大学 一种基于注意力机制的自适应融合的多模态情感分类方法
CN113806609A (zh) * 2021-09-26 2021-12-17 郑州轻工业大学 一种基于mit和fsm的多模态情感分析方法
CN113822045A (zh) * 2021-09-29 2021-12-21 深圳市易平方网络科技有限公司 一种基于多模态数据的影评质量的识别方法及相关装置
CN114048288A (zh) * 2021-11-10 2022-02-15 北京明略软件系统有限公司 细粒度情感分析方法、系统、计算机设备和存储介质
CN114549850A (zh) * 2022-01-24 2022-05-27 西北大学 一种解决模态缺失问题的多模态图像美学质量评价方法
CN114936623A (zh) * 2022-04-20 2022-08-23 西北工业大学 一种融合多模态数据的方面级情感分析方法
WO2023045605A1 (zh) * 2021-09-22 2023-03-30 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机设备及存储介质
CN116108186A (zh) * 2023-04-13 2023-05-12 南开大学 一种多模态方面级情感分析方法
CN117594184A (zh) * 2024-01-19 2024-02-23 中国科学技术大学 一种基于记忆网络的医疗多模态内容分析及生成方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472031A (zh) * 2018-11-09 2019-03-15 电子科技大学 一种基于双记忆注意力的方面级别情感分类模型及方法
CN111079409A (zh) * 2019-12-16 2020-04-28 东北大学秦皇岛分校 一种利用上下文和方面记忆信息的情感分类方法
CN111274398A (zh) * 2020-01-20 2020-06-12 福州大学 一种方面级用户产品评论情感分析方法及系统
CN111814454A (zh) * 2020-07-10 2020-10-23 重庆大学 一种社交网络上的多模态网络欺凌检测模型
US20200356724A1 (en) * 2019-05-06 2020-11-12 University Of Electronic Science And Technology Of China Multi-hop attention and depth model, method, storage medium and terminal for classification of target sentiments

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472031A (zh) * 2018-11-09 2019-03-15 电子科技大学 一种基于双记忆注意力的方面级别情感分类模型及方法
US20200356724A1 (en) * 2019-05-06 2020-11-12 University Of Electronic Science And Technology Of China Multi-hop attention and depth model, method, storage medium and terminal for classification of target sentiments
CN111079409A (zh) * 2019-12-16 2020-04-28 东北大学秦皇岛分校 一种利用上下文和方面记忆信息的情感分类方法
CN111274398A (zh) * 2020-01-20 2020-06-12 福州大学 一种方面级用户产品评论情感分析方法及系统
CN111814454A (zh) * 2020-07-10 2020-10-23 重庆大学 一种社交网络上的多模态网络欺凌检测模型

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NAN XU等: "multi-interactive memory network for aspect based multimodal sentiment analysis", THE THIRTY-THIRD AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, 31 December 2019 (2019-12-31), pages 371 - 378 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949622B (zh) * 2021-04-08 2023-06-27 苏州大学 融合文本与图像的双模态性格分类方法及装置
CN112949622A (zh) * 2021-04-08 2021-06-11 苏州大学 融合文本与图像的双模态性格分类方法及装置
CN113435496A (zh) * 2021-06-24 2021-09-24 湖南大学 一种基于注意力机制的自适应融合的多模态情感分类方法
WO2023045605A1 (zh) * 2021-09-22 2023-03-30 腾讯科技(深圳)有限公司 数据处理方法、装置、计算机设备及存储介质
CN113806609A (zh) * 2021-09-26 2021-12-17 郑州轻工业大学 一种基于mit和fsm的多模态情感分析方法
CN113822045A (zh) * 2021-09-29 2021-12-21 深圳市易平方网络科技有限公司 一种基于多模态数据的影评质量的识别方法及相关装置
CN113822045B (zh) * 2021-09-29 2023-11-17 重庆市易平方科技有限公司 一种基于多模态数据的影评质量的识别方法及相关装置
CN114048288A (zh) * 2021-11-10 2022-02-15 北京明略软件系统有限公司 细粒度情感分析方法、系统、计算机设备和存储介质
CN114549850A (zh) * 2022-01-24 2022-05-27 西北大学 一种解决模态缺失问题的多模态图像美学质量评价方法
CN114549850B (zh) * 2022-01-24 2023-08-08 西北大学 一种解决模态缺失问题的多模态图像美学质量评价方法
CN114936623A (zh) * 2022-04-20 2022-08-23 西北工业大学 一种融合多模态数据的方面级情感分析方法
CN114936623B (zh) * 2022-04-20 2024-02-27 西北工业大学 一种融合多模态数据的方面级情感分析方法
CN116108186B (zh) * 2023-04-13 2023-06-20 南开大学 一种多模态方面级情感分析方法
CN116108186A (zh) * 2023-04-13 2023-05-12 南开大学 一种多模态方面级情感分析方法
CN117594184A (zh) * 2024-01-19 2024-02-23 中国科学技术大学 一种基于记忆网络的医疗多模态内容分析及生成方法

Similar Documents

Publication Publication Date Title
CN112559683A (zh) 基于多模态数据及多交互记忆网络的方面级情感分析方法
Zahavy et al. Is a picture worth a thousand words? A deep multi-modal architecture for product classification in e-commerce
CN108763362B (zh) 基于随机锚点对选择的局部模型加权融合Top-N电影推荐方法
CN106599022B (zh) 基于用户访问数据的用户画像形成方法
CN111222332B (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN110263257B (zh) 基于深度学习处理多源异构数据的推荐方法
CN109344288A (zh) 一种基于多模态特征结合多层注意力机制的结合视频描述方法
CN110162703A (zh) 内容推荐方法、训练方法、装置、设备及存储介质
CN110852368A (zh) 全局与局部特征嵌入及图文融合的情感分析方法与系统
CN108491469B (zh) 引入概念标签的神经协同过滤概念描述词推荐方法
CN112288042B (zh) 行为预测系统的更新方法及装置、存储介质和计算设备
CN111309936A (zh) 一种电影用户画像的构建方法
CN109584006B (zh) 一种基于深度匹配模型的跨平台商品匹配方法
Gandhi et al. Scalable detection of offensive and non-compliant content/logo in product images
CN107247755A (zh) 一种基于上下文序列记忆网络的个性化图像字幕生成方法
Liu et al. Fact-based visual question answering via dual-process system
CN111985520A (zh) 一种基于图卷积神经网络的多模态分类方法
CN112667813A (zh) 用于裁判文书的敏感身份信息的识别方法
CN112101380A (zh) 基于图文匹配的产品点击率预测方法和系统、存储介质
CN111522979A (zh) 图片排序推荐方法、装置、电子设备、存储介质
CN113779245A (zh) 一种评论情感原因三元组抽取方法
CN114357167A (zh) 基于Bi-LSTM-GCN的多标签文本分类方法和系统
CN112364236A (zh) 目标对象推荐系统、方法、装置、数据处理方法及装置
Shi et al. Product feature extraction from Chinese online reviews: application to product improvement
Gandhi et al. Image matters: scalable detection of offensive and non-compliant content/logo in product images

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination