CN115391520A - 一种文本情感分类方法、系统、装置及计算机介质 - Google Patents
一种文本情感分类方法、系统、装置及计算机介质 Download PDFInfo
- Publication number
- CN115391520A CN115391520A CN202210881339.1A CN202210881339A CN115391520A CN 115391520 A CN115391520 A CN 115391520A CN 202210881339 A CN202210881339 A CN 202210881339A CN 115391520 A CN115391520 A CN 115391520A
- Authority
- CN
- China
- Prior art keywords
- text
- emotion
- word
- vector
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 163
- 238000000034 method Methods 0.000 title claims abstract description 45
- 239000013598 vector Substances 0.000 claims abstract description 100
- 230000002996 emotional effect Effects 0.000 claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 34
- 230000007246 mechanism Effects 0.000 claims abstract description 32
- 238000013145 classification model Methods 0.000 claims abstract description 23
- 238000002372 labelling Methods 0.000 claims abstract description 17
- 238000012360 testing method Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 55
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 206010003591 Ataxia Diseases 0.000 description 1
- 206010010947 Coordination abnormal Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 208000016290 incoordination Diseases 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种文本情感分类方法、系统、装置及计算机介质,包括:获取文本数据;标签标注获得的每条文本数据,构建和标注训练集和测试集;构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量集合;构建改进情感知识增强模型;联合改进BiGRU和多头注意力机制进行文本情感特征提取;基于文本特征向量集合数据,计算焦点损失的损失度函数;进行文本情感分类模型训练;将词向量集合输入到文本情感分类模型,获得文本情感分类结果,解决了现有技术中文本情感分类准确率低的问题。
Description
技术领域
本发明涉及自然语言处理技术领域,具体为一种文本情感分类方法、系 统、装置及计算机介质。
背景技术
随着互联网技术的迅速普及和高速发展,越来越多的人会在互联网中花 上更多的时间并且热忱于发表自己的观点或看法,从而会产生数以万计且类 型不统一的文本数据。的文本数据会蕴涵丰富的个人情感信息,如何有效提 取分析文本数据情感特征成为一个关键问题。
自然语言处理技术应时而生,且对于文本信息处理产生越来越重要的影 响,若采用基于规则的方法来实现文本情感分类,其通过大量学者的语言知 识经验从而获取句子特征表示,但是获取规则的方法复杂度较高且成本巨大; 若选择采用基于统计的机器学习方法来实现文本情感分类,但人工标记训练 样本集会导致主观意识较强、效率低下等问题;由于文本情感分类方法作为 自然语言处理技术中的一项核心算法,与事件抽取、智能问答、情感分析等 多个自然语言处理任务息息相关,能够为特定领域分类出所需要的具体信息。
目前基于规则和字典的文本情感分类的前期词典构造与规则制定需要大 量时间成本且维护成本较高,分类准确率较低;基于深度学习的文本情感分 类难以适用于只具有小规模预料文本的数据,且分类准确率不高,现有技术 的问题会对于文本情感分类产生不利影响,甚至无法捕捉具体情感特征信息, 阻碍文本情感分析技术的发展。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种文本情感分类方法、系统、装 置及计算机介质,解决了上述背景技术中提出的文本情感分类准确率低的问 题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种文本情感分 类方法,包括:
获取文本数据;
标签标注获得的每条文本数据,构建和标注训练集和测试集;
构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量集 合;
构建改进情感知识增强模型;
联合改进BiGRU和多头注意力机制进行文本情感特征提取;
基于文本特征向量集合数据,计算焦点损失的损失度函数;
进行文本情感分类模型训练,将词向量集合输入到文本情感分类模型, 获得文本情感分类结果。
优选地,所述获取文本数据,包括:通过数据服务中心系统获取文本数 据,以线上方式获取包括语音和文本的格式的在线情感数据,其中,将语音 格式的数据转为文本数据。
优选地,所述构建包含文本序列的文本数据集合,并进行文本向量化, 构建词向量集合,包括:
优选地,所述构建改进情感知识增强模型,包括:
引入以自注意力机制为核心的Transformer编码器与解码器架构;
首先对情感词、情感词极性和属性词-情感词搭配二元组进行掩盖,并计 算情感词的损失函数:
其中,表示第i个词经过Transformer层后输入到softmax中所计算 得到的概率分布,Wsw表示情感词输出层的权重值,bsw表示情感词输出层的 偏差值,mi表示情感词的标识符,若第i个词为情感词时mi=1,否则mi=0,yi sw表示原始第i个词通过one-hot方式生成的向量表示;
计算情感词极性的损失函数Fwp:
其中,表示第i个情感词的极性经过Transformer层后输入到 softmax中所计算得到的概率分布,Wwp表示情感词极性输出层的权重值,bwp表示情感词极性输出层的偏差值,yi wp表示原始第i个情感词的极性通过 one-hot方式生成的向量表示;
计算属性词-情感词对的损失函数Fasp:
其中,表示第a个属性词-情感词对经过Transformer层后输入到 softmax中所计算得到的概率分布,Wasp表示属性词-情感词对的输出层权重 值,basp表示属性词-情感词对的输出层偏差值,ya asp表示原始第a个属性词-情 感词对通过one-hot方式生成的向量表示;
针对上述三个损失函数,构建三目标优化模型(9),来权衡三个优化函数 之间的关系,从而找到得到最优的多种情感任务的情感预训练目标优化函数, 具体公式如下:
max(Fsw),max(Fwp),max(Fasp) (9)
采用Pareto优化策略求解三目标优化模型(9),获得优化情感词、情感 词极性和属性词-情感词的模型权重,并改进情感知识增强模型,得到情感 知识增强模型的输出集合X={X1,X2,...,Xl,...,Xn}。
优选地,所述联合改进BiGRU和多头注意力机制进行文本情感特征提取; 包括:
引入多头注意力机制来学习不同的子空间下情感文本的情感特征,提取 联合改进BiGRU和多头注意力机制的情感文本情感特征,获取文本中的内部 结构信息;
通过公式(10)计算文本集合X中所有文本情感向量的隐藏特征值hl:
其中,p1表示第l条信息文本前向GRU所对应的权重,p2表示第l条信息 文本反向GRU所对应的权重,bz表示第l条信息文本的偏置,hl表示经过加权 求和后的隐藏特征值,表示前向GRU输出的隐藏状态值,表示反向GRU输 出的隐藏状态值。遍历计算每条文本对应的隐藏特征值,最后获得情感隐藏 特征集合H={h1,h2,...,hl,...,hn};
结合获得的情感隐藏特征集合H,通过多头注意力机制来获取情感隐藏特 征集合在不同的子空间下不同的特征表示能力,进行不同子空间下的权重计 算与分配,将情感隐藏特征集合H中的每个隐藏特征值hl赋值给查询向量Q、 键向量K和值向量V,并计算如下公式:
其中,Attention()表示注意力函数,softmax()表示归一化指数函数,dk表示键向量K的维度;
通过归一化指数函数来最大化每个查询向量Q与键向量K乘积的概率分 布,获得文本中每个字在上下文中的权重关系,从而提取情感上下文中最关 键的词语特征信息;
令第t次投影注意力函数计算后的值headt为
headt=Attention(QWt Q,KWt K,VWt V) (12)
其中,headt表示在第t次通过线性层投影下通过注意力机制计算后得到 的值,Wt Q、Wt K、Wt V表示经过第t次投影学习到的权重值;
通过多个head进行拼接得到多头注意力机制函数,计算方式如下:
Multihead(Q,K,V)=Concat(head1,head2,...,headt,...,headh)Wc (13)
其中,Wc表示在拼接过程中学习到的权重参数,Concat()表示将h个head 进行拼接的函数,从而得到新的一个情感特征向量表示;
最后,对于特征集合H的所有隐藏特征值进行多头注意力机制计算,从 而得到新的情感特征向量表示集合M={M1,M2,...,Ml,...,Mn}。
优选地,所述基于文本特征向量集合数据,计算焦点损失的损失度函数, 包括:
结合上一步骤学习到新的特征向量集合数据,通过公式(14)计算焦点损 失的损失度函数,通过调节难、易分类样本的权重系数来输出文本的情感标 签,作为最后的标签输出结果;
L=-α(1-pr)γlog(pr) (14)
其中,pr为文本情感分类模型预测情感特征向量Ml的概率,α和γ为文 本情感权重调节系数。
优选地,所述进行文本情感分类模型训练,包括:
在训练过程中,迭代计算所有文本情感特征向量预测的概率对应的损失 值
当损失函数值大于预设阈值ε,则更新模型参数继续训练,否则,通过迭 代计算得到模型的最小化损失函数值,即为模型训练的最终目标。
本发明还提供一种文本情感分类系统,包括:
文本数据预处理模块:用于获取文本数据;标签标注获得的每条文本数 据,构建和标注训练集和测试集;构建包含文本序列的文本数据集合,并进 行文本向量化,构建词向量集合;
文本情感分类模型构建模块:用于构建改进情感知识增强模型;联合改 进BiGRU和多头注意力机制进行文本情感特征提取;基于文本特征向量集合 数据,计算焦点损失的损失度函数;进行文本情感分类模型训练;
文本情感分类模块:用于将词向量集合输入到文本情感分类模型,获得 文本情感分类结果。
本发明还提供一种文本情感分类装置,包括:输入设备、输出设备、存 储器、处理器;所述输入设备、所述输出设备、所述存储器和所述处理器相 互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序 指令,所护处理器被配置调用所述程序指令,执行如前任一所述的一种文本 情感分类方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储 有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器所 执行时执行如前任一所述的一种文本情感分类方法。
(三)有益效果
本发明提供了一种文本情感分类方法、系统、装置及计算机介质。具备 以下有益效果:
为了准确识别智能社区数据分析等特定领域中的文本情感信息,引入基 于情感知识增强的预训练模型SKEP(Sentiment Knowledge Enhanced Pre-training),结合特定领域数据并在大型语料库模型中针对性的对于情感 信息和语义进行特征联合学习的预训练,增强自身语料库的情感特征表示能 力。
提出基于联合BiGRU和多头注意力机制的情感特征提取方法,即利用隐 藏状态完成情感信息的记录与传输,通过更新门与重置门计算隐藏状态的参 数值,获取文本对应的隐藏状态的输出信息,同时引入多头注意力机制来加 强文本信息中在不同子空间下情感特征的学习,从而实现文本情感特征提取。
同时,提出基于焦点损失的损失函数,解决正负文本数在不均衡的前提 下,导致难以区分文本从而影响情感分类准确率这一问题,即对于模型中难 以区分的文本,使用权重因子来平衡正负文本数,从而使得模型能够更加注 重少量文本数的特征表示。
本发明不仅结合自身特定数据在大型语料库的情感模型中进行语义特征 预训练,增强自身语料库的文本情感特征表示,而且通过多头注意力机制来 学习文本在不同子空间下的特征表示,同时结合基于焦点损失的损失函数来 解决正负文本数在不均衡的前提下导致难以区分从而影响准确率的问题,最 终提高只具有小规模语料库的特定领域中的文本情感分类准确率。
附图说明
图1为本发明提供的一种文本情感分类方法流程图;
图2为本发明提供的一种文本情感分类系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述。
为实现以上目的,本发明通过以下技术方案予以实现:
如图1所示,本发明实施例提供一种文本情感分类方法,包括:
S1获取文本数据;
S2标签标注获得的每条文本数据,构建和标注训练集和测试集;
S3构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量 集合;
S4构建改进情感知识增强模型;
S5联合改进BiGRU和多头注意力机制进行文本情感特征提取;
S6基于文本特征向量集合数据,计算焦点损失的损失度函数;
S7进行文本情感分类模型训练;将词向量集合输入到文本情感分类模型, 获得文本情感分类结果。
优选地,所述获取文本数据,包括:通过数据服务中心系统获取文本数 据,以线上方式获取包括语音和文本的格式的在线情感数据,其中,将语音 格式的数据转为文本数据,原有的文本数据则作保留。
优选地,所述构建包含文本序列的文本数据集合,并进行文本向量化, 构建词向量集合,包括:
优选地,所述构建改进情感知识增强模型,包括:
引入以自注意力机制为核心的Transformer编码器与解码器架构;
首先对情感词、情感词极性和属性词-情感词搭配二元组进行掩盖,并计 算情感词的损失函数:
其中,表示第i个词经过Transformer层后输入到softmax中所计算 得到的概率分布,Wsw表示情感词输出层的权重值,bsw表示情感词输出层的 偏差值,mi表示情感词的标识符,若第i个词为情感词时mi=1,否则mi=0,yi sw表示原始第i个词通过one-hot方式生成的向量表示;
计算情感词极性的损失函数Fwp:
其中,表示第i个情感词的极性经过Transformer层后输入到 softmax中所计算得到的概率分布,Wwp表示情感词极性输出层的权重值, bwp表示情感词极性输出层的偏差值,yi wp表示原始第i个情感词的极性通过 one-hot方式生成的向量表示;
计算属性词-情感词对的损失函数Fasp:
其中,表示第a个属性词-情感词对经过Transformer层后输入到 softmax中所计算得到的概率分布,Wasp表示属性词-情感词对的输出层权重 值,basp表示属性词-情感词对的输出层偏差值,ya asp表示原始第a个属性词-情 感词对通过one-hot方式生成的向量表示;
针对上述三个损失函数,构建三目标优化模型(9),来权衡三个优化函数 之间的关系,从而找到得到最优的多种情感任务的情感预训练目标优化函数, 具体公式如下:
max(Fsw),max(Fwp),max(Fasp) (9)
采用Pareto优化策略求解三目标优化模型(9),获得优化情感词、情感 词极性和属性词-情感词的模型权重,并改进情感知识增强模型,得到情感 知识增强模型的输出集合X={X1,X2,...,Xl,...,Xn},使得改进的情感知识增强模型 模型能够充分学习情感词、情感词极性和情感词—属性词对等多种方面的情 感特征,更利于捕捉情感信息,从而加强情感文本的情感特征提取。
优选地,所述联合改进BiGRU和多头注意力机制进行文本情感特征提取; 包括:
引入多头注意力机制来学习不同的子空间下情感文本的情感特征,提取 联合改进BiGRU和多头注意力机制的情感文本情感特征,获取文本中的内部 结构信息,从而有效提取每条句子中局部的特征;
通过公式(10)计算文本集合X中所有文本情感向量的隐藏特征值hl:
其中,p1表示第l条信息文本前向GRU所对应的权重,p2表示第l条信息 文本反向GRU所对应的权重,bz表示第l条信息文本的偏置,hl表示经过加权 求和后的隐藏特征值,表示前向GRU输出的隐藏状态值,表示反向GRU输 出的隐藏状态值。遍历计算每条文本对应的隐藏特征值,最后获得情感隐藏 特征集合H={h1,h2,...,hl,...,hn};
结合获得的情感隐藏特征集合H,通过多头注意力机制来获取情感隐藏特 征集合在不同的子空间下不同的特征表示能力,进行不同子空间下的权重计 算与分配,将情感隐藏特征集合H中的每个隐藏特征值hl赋值给查询向量Q、 键向量K和值向量V,并计算如下公式:
其中,Attention()表示注意力函数,softmax()表示归一化指数函数,dk表示键向量K的维度;
通过归一化指数函数来最大化每个查询向量Q与键向量K乘积的概率分 布,获得文本中每个字在上下文中的权重关系,从而提取情感上下文中最关 键的词语特征信息;
令第t次投影注意力函数计算后的值headt为
headt=Attention(QWt Q,KWt K,VWt V) (12)
其中,headt表示在第t次通过线性层投影下通过注意力机制计算后得到 的值,Wt Q、Wt K、Wt V表示经过第t次投影学习到的权重值;
通过多个head进行拼接得到多头注意力机制函数,计算方式如下:
Multihead(Q,K,V)=Concat(head1,head2,...,headt,...,headh)Wc (13)
其中,Wc表示在拼接过程中学习到的权重参数,Concat()表示将h个head 进行拼接的函数,从而得到新的一个情感特征向量表示;
最后,对于特征集合H的所有隐藏特征值进行多头注意力机制计算,从 而得到新的情感特征向量表示集合M={M1,M2,...,Ml,...,Mn}。
优选地,所述基于文本特征向量集合数据,计算焦点损失的损失度函数, 包括:
结合上一步骤学习到新的特征向量集合数据,通过公式(14)计算焦点损 失的损失度函数,通过调节难、易分类样本的权重系数来输出文本的情感标 签,作为最后的标签输出结果;
L=-α(1-pr)γlog(pr) (14)
其中,pr为文本情感分类模型预测情感特征向量Ml的概率,α和γ为文 本情感权重调节系数。
优选地,所述进行文本情感分类模型训练,包括:
在训练过程中,迭代计算所有文本情感特征向量预测的概率对应的损失 值
当损失函数值大于预设阈值ε,则更新模型参数继续训练,否则,通过迭 代计算得到模型的最小化损失函数值,即为模型训练的最终目标。
如图2所示,本发明还提供一种文本情感分类系统,包括:
文本数据预处理模块:用于获取文本数据;标签标注获得的每条文本数 据,构建和标注训练集和测试集;构建包含文本序列的文本数据集合,并进 行文本向量化,构建词向量集合;
文本情感分类模型构建模块:用于构建改进情感知识增强模型;联合改 进BiGRU和多头注意力机制进行文本情感特征提取;基于文本特征向量集合 数据,计算焦点损失的损失度函数;进行文本情感分类模型训练;
文本情感分类模块:用于将词向量集合输入到文本情感分类模型,获得 文本情感分类结果。
本发明还提供一种文本情感分类装置,包括:输入设备、输出设备、存 储器、处理器;所述输入设备、所述输出设备、所述存储器和所述处理器相 互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序 指令,所护处理器被配置调用所述程序指令,执行如前任一所述的一种文本 情感分类方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储 有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器所 执行时执行如前任一所述的一种文本情感分类方法。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而 言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行 多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限 定。
Claims (10)
1.一种文本情感分类方法,其特征在于,包括:
获取文本数据;
标签标注获得的每条文本数据,构建和标注训练集和测试集;
构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量集合;
构建改进情感知识增强模型;
联合改进BiGRU和多头注意力机制进行文本情感特征提取;
基于文本特征向量集合数据,计算焦点损失的损失度函数;
进行文本情感分类模型训练;将词向量集合输入到文本情感分类模型,获得文本情感分类结果。
2.根据权利要求1所述的一种文本情感分类方法,其特征在于,所述获取文本数据,包括:通过数据服务中心系统获取文本数据,以线上方式获取包括语音和文本的格式的在线情感数据,其中,将语音格式的数据转为文本数据。
3.根据权利要求1所述的一种文本情感分类方法,其特征在于,所述构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量集合,包括:
4.根据权利要求1所述的一种文本情感分类方法,其特征在于,所述构建改进情感知识增强模型,包括:
引入以自注意力机制为核心的Transformer编码器与解码器架构;
首先对情感词、情感词极性和属性词-情感词搭配二元组进行掩盖,并计算情感词的损失函数:
其中,表示第i个词经过Transformer层后输入到softmax中所计算得到的概率分布,Wsw表示情感词输出层的权重值,bsw表示情感词输出层的偏差值,mi表示情感词的标识符,若第i个词为情感词时mi=1,否则mi=0,yi sw表示原始第i个词通过one-hot方式生成的向量表示;
计算情感词极性的损失函数Fwp:
其中,表示第i个情感词的极性经过Transformer层后输入到softmax中所计算得到的概率分布,Wwp表示情感词极性输出层的权重值,bwp表示情感词极性输出层的偏差值,yi wp表示原始第i个情感词的极性通过one-hot方式生成的向量表示;
计算属性词-情感词对的损失函数Fasp:
其中,表示第a个属性词-情感词对经过Transformer层后输入到softmax中所计算得到的概率分布,Wasp表示属性词-情感词对的输出层权重值,basp表示属性词-情感词对的输出层偏差值,ya asp表示原始第a个属性词-情感词对通过one-hot方式生成的向量表示;
针对上述三个损失函数,构建三目标优化模型(9),来权衡三个优化函数之间的关系,从而找到得到最优的多种情感任务的情感预训练目标优化函数,具体公式如下:
max(Fsw),max(Fwp),max(Fasp) (9)
采用Pareto优化策略求解三目标优化模型(9),获得优化情感词、情感词极性和属性词-情感词的模型权重,并改进情感知识增强模型,得到情感知识增强模型的输出集合X={X1,X2,...,Xl,...,Xn}。
5.根据权利要求1所述的一种文本情感分类方法,其特征在于,所述联合改进BiGRU和多头注意力机制进行文本情感特征提取;包括:
引入多头注意力机制来学习不同的子空间下情感文本的情感特征,提取联合改进BiGRU和多头注意力机制的情感文本情感特征,获取文本中的内部结构信息;
通过公式(10)计算文本集合X中所有文本情感向量的隐藏特征值hl:
其中,p1表示第l条信息文本前向GRU所对应的权重,p2表示第l条信息文本反向GRU所对应的权重,bz表示第l条信息文本的偏置,hl表示经过加权求和后的隐藏特征值,表示前向GRU输出的隐藏状态值,表示反向GRU输出的隐藏状态值。遍历计算每条文本对应的隐藏特征值,最后获得情感隐藏特征集合H={h1,h2,...,hl,...,hn};
结合获得的情感隐藏特征集合H,通过多头注意力机制来获取情感隐藏特征集合在不同的子空间下不同的特征表示能力,进行不同子空间下的权重计算与分配,将情感隐藏特征集合H中的每个隐藏特征值hl赋值给查询向量Q、键向量K和值向量V,并计算如下公式:
其中,Attention()表示注意力函数,softmax()表示归一化指数函数,dk表示键向量K的维度;
通过归一化指数函数来最大化每个查询向量Q与键向量K乘积的概率分布,获得文本中每个字在上下文中的权重关系,从而提取情感上下文中最关键的词语特征信息;
令第t次投影注意力函数计算后的值headt为
headt=Attention(QWt Q,KWt K,VWt V) (12)
其中,headt表示在第t次通过线性层投影下通过注意力机制计算后得到的值,Wt Q、Wt K、Wt V表示经过第t次投影学习到的权重值;
通过多个head进行拼接得到多头注意力机制函数,计算方式如下:
Multihead(Q,K,V)=Concat(head1,head2,...,headt,...,headh)Wc (13)
其中,Wc表示在拼接过程中学习到的权重参数,Concat()表示将h个head进行拼接的函数,从而得到新的一个情感特征向量表示;
最后,对于特征集合H的所有隐藏特征值进行多头注意力机制计算,从而得到新的情感特征向量表示集合M={M1,M2,...,Ml,...,Mn}。
6.根据权利要求5所述的一种文本情感分类方法,其特征在于,所述基于文本特征向量集合数据,计算焦点损失的损失度函数,包括:
结合权利要求5学习到新的特征向量集合数据,通过公式(14)计算焦点损失的损失度函数,通过调节难、易分类样本的权重系数来输出文本的情感标签,作为最后的标签输出结果;
L=-α(1-pr)γlog(pr) (14)
其中,pr为文本情感分类模型预测情感特征向量Ml的概率,α和γ为文本情感权重调节系数。
7.根据权利要求1所述的一种文本情感分类方法,其特征在于,所述进行文本情感分类模型训练,包括:
在训练过程中,迭代计算所有文本情感特征向量预测的概率对应的损失值
当损失函数值大于预设阈值ε,则更新模型参数继续训练,否则,通过迭代计算得到模型的最小化损失函数值,即为模型训练的最终目标。
8.一种文本情感分类系统,其特征在于,包括:
文本数据预处理模块:用于获取文本数据;标签标注获得的每条文本数据,构建和标注训练集和测试集;构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量集合;
文本情感分类模型构建模块:用于构建改进情感知识增强模型;联合改进BiGRU和多头注意力机制进行文本情感特征提取;基于文本特征向量集合数据,计算焦点损失的损失度函数;进行文本情感分类模型训练;
文本情感分类模块:用于将词向量集合输入到文本情感分类模型,获得文本情感分类结果。
9.一种文本情感分类装置,其特征在于,包括:输入设备、输出设备、存储器、处理器;所述输入设备、所述输出设备、所述存储器和所述处理器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所护处理器被配置调用所述程序指令,执行如权利要求1-7中任一所述的一种文本情感分类方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器所执行时执行如权利要求1-7中任一所述的一种文本情感分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210881339.1A CN115391520A (zh) | 2022-07-22 | 2022-07-22 | 一种文本情感分类方法、系统、装置及计算机介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210881339.1A CN115391520A (zh) | 2022-07-22 | 2022-07-22 | 一种文本情感分类方法、系统、装置及计算机介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115391520A true CN115391520A (zh) | 2022-11-25 |
Family
ID=84116176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210881339.1A Pending CN115391520A (zh) | 2022-07-22 | 2022-07-22 | 一种文本情感分类方法、系统、装置及计算机介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115391520A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115544260A (zh) * | 2022-12-05 | 2022-12-30 | 湖南工商大学 | 用于文本情感分析的对比优化编解码模型及方法 |
CN116362237A (zh) * | 2023-04-17 | 2023-06-30 | 内蒙古工业大学 | 一种混合策略感知的文本情感强度标注方法及系统 |
-
2022
- 2022-07-22 CN CN202210881339.1A patent/CN115391520A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115544260A (zh) * | 2022-12-05 | 2022-12-30 | 湖南工商大学 | 用于文本情感分析的对比优化编解码模型及方法 |
CN116362237A (zh) * | 2023-04-17 | 2023-06-30 | 内蒙古工业大学 | 一种混合策略感知的文本情感强度标注方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111985239B (zh) | 实体识别方法、装置、电子设备及存储介质 | |
CN107943784B (zh) | 基于生成对抗网络的关系抽取方法 | |
CN110647619A (zh) | 一种基于问题生成和卷积神经网络的常识问答方法 | |
CN111506732B (zh) | 一种文本多层次标签分类方法 | |
CN113626589B (zh) | 一种基于混合注意力机制的多标签文本分类方法 | |
CN115391520A (zh) | 一种文本情感分类方法、系统、装置及计算机介质 | |
CN116450796B (zh) | 一种智能问答模型构建方法及设备 | |
CN111522908A (zh) | 一种基于BiGRU和注意力机制的多标签文本分类方法 | |
CN112906397B (zh) | 一种短文本实体消歧方法 | |
CN115204143B (zh) | 一种基于prompt的文本相似度计算方法及系统 | |
CN113988079A (zh) | 一种面向低数据的动态增强多跳文本阅读识别处理方法 | |
CN116303977B (zh) | 一种基于特征分类的问答方法及系统 | |
CN115270752A (zh) | 一种基于多层次对比学习的模板句评估方法 | |
CN113641809A (zh) | 一种基于XLNet-BiGRU-CRF的智能问答方法 | |
CN114780723B (zh) | 基于向导网络文本分类的画像生成方法、系统和介质 | |
CN114492460B (zh) | 基于衍生提示学习的事件因果关系抽取方法 | |
Hashana et al. | Deep Learning in ChatGPT-A Survey | |
CN114579741B (zh) | 融合句法信息的gcn-rn方面级情感分析方法和系统 | |
CN114548117A (zh) | 一种基于bert语义增强的因果关系抽取方法 | |
CN116127954A (zh) | 一种基于词典的新工科专业中文知识概念抽取方法 | |
Li et al. | Automated essay scoring incorporating multi-level semantic features | |
Jiang et al. | Network public comments sentiment analysis based on multilayer convolutional neural network | |
Alyamani | Determining Feature-Size for Text to Numeric Conversion based on BOW and TF-IDF | |
Shi et al. | Category-based strategy-driven question generator for visual dialogue | |
LU504829B1 (en) | Text classification method, computer readable storage medium and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |