CN115391520A - 一种文本情感分类方法、系统、装置及计算机介质 - Google Patents

一种文本情感分类方法、系统、装置及计算机介质 Download PDF

Info

Publication number
CN115391520A
CN115391520A CN202210881339.1A CN202210881339A CN115391520A CN 115391520 A CN115391520 A CN 115391520A CN 202210881339 A CN202210881339 A CN 202210881339A CN 115391520 A CN115391520 A CN 115391520A
Authority
CN
China
Prior art keywords
text
emotion
word
vector
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210881339.1A
Other languages
English (en)
Inventor
陈友荣
王本安
张旭东
吕晓雯
缪克雷
刘半藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Shuren University
Original Assignee
Zhejiang Shuren University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Shuren University filed Critical Zhejiang Shuren University
Priority to CN202210881339.1A priority Critical patent/CN115391520A/zh
Publication of CN115391520A publication Critical patent/CN115391520A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种文本情感分类方法、系统、装置及计算机介质,包括:获取文本数据;标签标注获得的每条文本数据,构建和标注训练集和测试集;构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量集合;构建改进情感知识增强模型;联合改进BiGRU和多头注意力机制进行文本情感特征提取;基于文本特征向量集合数据,计算焦点损失的损失度函数;进行文本情感分类模型训练;将词向量集合输入到文本情感分类模型,获得文本情感分类结果,解决了现有技术中文本情感分类准确率低的问题。

Description

一种文本情感分类方法、系统、装置及计算机介质
技术领域
本发明涉及自然语言处理技术领域,具体为一种文本情感分类方法、系 统、装置及计算机介质。
背景技术
随着互联网技术的迅速普及和高速发展,越来越多的人会在互联网中花 上更多的时间并且热忱于发表自己的观点或看法,从而会产生数以万计且类 型不统一的文本数据。的文本数据会蕴涵丰富的个人情感信息,如何有效提 取分析文本数据情感特征成为一个关键问题。
自然语言处理技术应时而生,且对于文本信息处理产生越来越重要的影 响,若采用基于规则的方法来实现文本情感分类,其通过大量学者的语言知 识经验从而获取句子特征表示,但是获取规则的方法复杂度较高且成本巨大; 若选择采用基于统计的机器学习方法来实现文本情感分类,但人工标记训练 样本集会导致主观意识较强、效率低下等问题;由于文本情感分类方法作为 自然语言处理技术中的一项核心算法,与事件抽取、智能问答、情感分析等 多个自然语言处理任务息息相关,能够为特定领域分类出所需要的具体信息。
目前基于规则和字典的文本情感分类的前期词典构造与规则制定需要大 量时间成本且维护成本较高,分类准确率较低;基于深度学习的文本情感分 类难以适用于只具有小规模预料文本的数据,且分类准确率不高,现有技术 的问题会对于文本情感分类产生不利影响,甚至无法捕捉具体情感特征信息, 阻碍文本情感分析技术的发展。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种文本情感分类方法、系统、装 置及计算机介质,解决了上述背景技术中提出的文本情感分类准确率低的问 题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种文本情感分 类方法,包括:
获取文本数据;
标签标注获得的每条文本数据,构建和标注训练集和测试集;
构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量集 合;
构建改进情感知识增强模型;
联合改进BiGRU和多头注意力机制进行文本情感特征提取;
基于文本特征向量集合数据,计算焦点损失的损失度函数;
进行文本情感分类模型训练,将词向量集合输入到文本情感分类模型, 获得文本情感分类结果。
优选地,所述获取文本数据,包括:通过数据服务中心系统获取文本数 据,以线上方式获取包括语音和文本的格式的在线情感数据,其中,将语音 格式的数据转为文本数据。
优选地,所述构建包含文本序列的文本数据集合,并进行文本向量化, 构建词向量集合,包括:
标注数据集完成之后,令S={S1,S2,...,Sl,...,Sn},
Figure BDA0003758973060000021
其中,S表示所有文本数据集合,Sl表示第l条文本序列,
Figure BDA0003758973060000022
表示第l条 文本序列中的第i个字符,n表示文本数据集合有n条序列,m表示第l条文 本序列中有m个字符;
从文本序列Sl中分别获取每个字符的向量
Figure BDA0003758973060000023
和每个字符所对应的位置 向量
Figure BDA0003758973060000024
其中位置向量
Figure BDA0003758973060000025
计算方式如下:
Figure BDA0003758973060000031
其中,pos表示文本
Figure BDA0003758973060000032
在文本序列中的具体位置,i表示向量维度,dmodel表示情感知识增强模型所接受的512维向量;
将512维的向量
Figure BDA0003758973060000033
Figure BDA0003758973060000034
进行加和运算,获得文本输入向量Tl,作为后 续模型的输入,计算方式如下:
Figure BDA0003758973060000035
其中,
Figure BDA0003758973060000036
表示通过文本
Figure BDA0003758973060000037
词嵌入和位置向量嵌入综合得到的后续情感 知识增强模型所需要的输入向量,进而构成向量集合T={T1,T2,...,Tl,...,Tn}。
优选地,所述构建改进情感知识增强模型,包括:
引入以自注意力机制为核心的Transformer编码器与解码器架构;
首先对情感词、情感词极性和属性词-情感词搭配二元组进行掩盖,并计 算情感词的损失函数:
Figure BDA0003758973060000038
Figure BDA0003758973060000039
其中,
Figure BDA00037589730600000310
表示第i个词经过Transformer层后输入到softmax中所计算 得到的概率分布,Wsw表示情感词输出层的权重值,bsw表示情感词输出层的 偏差值,mi表示情感词的标识符,若第i个词为情感词时mi=1,否则mi=0,yi sw表示原始第i个词
Figure BDA00037589730600000311
通过one-hot方式生成的向量表示;
计算情感词极性的损失函数Fwp
Figure BDA00037589730600000312
Figure BDA00037589730600000313
其中,
Figure BDA00037589730600000314
表示第i个情感词的极性经过Transformer层后输入到 softmax中所计算得到的概率分布,Wwp表示情感词极性输出层的权重值,bwp表示情感词极性输出层的偏差值,yi wp表示原始第i个情感词的极性通过 one-hot方式生成的向量表示;
计算属性词-情感词对的损失函数Fasp
Figure BDA0003758973060000041
Figure BDA0003758973060000042
其中,
Figure BDA0003758973060000043
表示第a个属性词-情感词对经过Transformer层后输入到 softmax中所计算得到的概率分布,Wasp表示属性词-情感词对的输出层权重 值,basp表示属性词-情感词对的输出层偏差值,ya asp表示原始第a个属性词-情 感词对通过one-hot方式生成的向量表示;
针对上述三个损失函数,构建三目标优化模型(9),来权衡三个优化函数 之间的关系,从而找到得到最优的多种情感任务的情感预训练目标优化函数, 具体公式如下:
max(Fsw),max(Fwp),max(Fasp) (9)
采用Pareto优化策略求解三目标优化模型(9),获得优化情感词、情感 词极性和属性词-情感词的模型权重,并改进情感知识增强模型,得到情感 知识增强模型的输出集合X={X1,X2,...,Xl,...,Xn}。
优选地,所述联合改进BiGRU和多头注意力机制进行文本情感特征提取; 包括:
引入多头注意力机制来学习不同的子空间下情感文本的情感特征,提取 联合改进BiGRU和多头注意力机制的情感文本情感特征,获取文本中的内部 结构信息;
通过公式(10)计算文本集合X中所有文本情感向量的隐藏特征值hl
Figure RE-GDA0003894903830000044
其中,p1表示第l条信息文本前向GRU所对应的权重,p2表示第l条信息 文本反向GRU所对应的权重,bz表示第l条信息文本的偏置,hl表示经过加权 求和后的隐藏特征值,
Figure RE-GDA0003894903830000051
表示前向GRU输出的隐藏状态值,
Figure RE-GDA0003894903830000052
表示反向GRU输 出的隐藏状态值。遍历计算每条文本对应的隐藏特征值,最后获得情感隐藏 特征集合H={h1,h2,...,hl,...,hn};
结合获得的情感隐藏特征集合H,通过多头注意力机制来获取情感隐藏特 征集合在不同的子空间下不同的特征表示能力,进行不同子空间下的权重计 算与分配,将情感隐藏特征集合H中的每个隐藏特征值hl赋值给查询向量Q、 键向量K和值向量V,并计算如下公式:
Figure BDA0003758973060000053
其中,Attention()表示注意力函数,softmax()表示归一化指数函数,dk表示键向量K的维度;
通过归一化指数函数来最大化每个查询向量Q与键向量K乘积的概率分 布,获得文本中每个字在上下文中的权重关系,从而提取情感上下文中最关 键的词语特征信息;
令第t次投影注意力函数计算后的值headt
headt=Attention(QWt Q,KWt K,VWt V) (12)
其中,headt表示在第t次通过线性层投影下通过注意力机制计算后得到 的值,Wt Q、Wt K、Wt V表示经过第t次投影学习到的权重值;
通过多个head进行拼接得到多头注意力机制函数,计算方式如下:
Multihead(Q,K,V)=Concat(head1,head2,...,headt,...,headh)Wc (13)
其中,Wc表示在拼接过程中学习到的权重参数,Concat()表示将h个head 进行拼接的函数,从而得到新的一个情感特征向量表示;
最后,对于特征集合H的所有隐藏特征值进行多头注意力机制计算,从 而得到新的情感特征向量表示集合M={M1,M2,...,Ml,...,Mn}。
优选地,所述基于文本特征向量集合数据,计算焦点损失的损失度函数, 包括:
结合上一步骤学习到新的特征向量集合数据,通过公式(14)计算焦点损 失的损失度函数,通过调节难、易分类样本的权重系数来输出文本的情感标 签,作为最后的标签输出结果;
L=-α(1-pr)γlog(pr) (14)
其中,pr为文本情感分类模型预测情感特征向量Ml的概率,α和γ为文 本情感权重调节系数。
优选地,所述进行文本情感分类模型训练,包括:
在训练过程中,迭代计算所有文本情感特征向量预测的概率对应的损失 值
当损失函数值大于预设阈值ε,则更新模型参数继续训练,否则,通过迭 代计算得到模型的最小化损失函数值,即为模型训练的最终目标。
本发明还提供一种文本情感分类系统,包括:
文本数据预处理模块:用于获取文本数据;标签标注获得的每条文本数 据,构建和标注训练集和测试集;构建包含文本序列的文本数据集合,并进 行文本向量化,构建词向量集合;
文本情感分类模型构建模块:用于构建改进情感知识增强模型;联合改 进BiGRU和多头注意力机制进行文本情感特征提取;基于文本特征向量集合 数据,计算焦点损失的损失度函数;进行文本情感分类模型训练;
文本情感分类模块:用于将词向量集合输入到文本情感分类模型,获得 文本情感分类结果。
本发明还提供一种文本情感分类装置,包括:输入设备、输出设备、存 储器、处理器;所述输入设备、所述输出设备、所述存储器和所述处理器相 互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序 指令,所护处理器被配置调用所述程序指令,执行如前任一所述的一种文本 情感分类方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储 有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器所 执行时执行如前任一所述的一种文本情感分类方法。
(三)有益效果
本发明提供了一种文本情感分类方法、系统、装置及计算机介质。具备 以下有益效果:
为了准确识别智能社区数据分析等特定领域中的文本情感信息,引入基 于情感知识增强的预训练模型SKEP(Sentiment Knowledge Enhanced Pre-training),结合特定领域数据并在大型语料库模型中针对性的对于情感 信息和语义进行特征联合学习的预训练,增强自身语料库的情感特征表示能 力。
提出基于联合BiGRU和多头注意力机制的情感特征提取方法,即利用隐 藏状态完成情感信息的记录与传输,通过更新门与重置门计算隐藏状态的参 数值,获取文本对应的隐藏状态的输出信息,同时引入多头注意力机制来加 强文本信息中在不同子空间下情感特征的学习,从而实现文本情感特征提取。
同时,提出基于焦点损失的损失函数,解决正负文本数在不均衡的前提 下,导致难以区分文本从而影响情感分类准确率这一问题,即对于模型中难 以区分的文本,使用权重因子来平衡正负文本数,从而使得模型能够更加注 重少量文本数的特征表示。
本发明不仅结合自身特定数据在大型语料库的情感模型中进行语义特征 预训练,增强自身语料库的文本情感特征表示,而且通过多头注意力机制来 学习文本在不同子空间下的特征表示,同时结合基于焦点损失的损失函数来 解决正负文本数在不均衡的前提下导致难以区分从而影响准确率的问题,最 终提高只具有小规模语料库的特定领域中的文本情感分类准确率。
附图说明
图1为本发明提供的一种文本情感分类方法流程图;
图2为本发明提供的一种文本情感分类系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述。
为实现以上目的,本发明通过以下技术方案予以实现:
如图1所示,本发明实施例提供一种文本情感分类方法,包括:
S1获取文本数据;
S2标签标注获得的每条文本数据,构建和标注训练集和测试集;
S3构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量 集合;
S4构建改进情感知识增强模型;
S5联合改进BiGRU和多头注意力机制进行文本情感特征提取;
S6基于文本特征向量集合数据,计算焦点损失的损失度函数;
S7进行文本情感分类模型训练;将词向量集合输入到文本情感分类模型, 获得文本情感分类结果。
优选地,所述获取文本数据,包括:通过数据服务中心系统获取文本数 据,以线上方式获取包括语音和文本的格式的在线情感数据,其中,将语音 格式的数据转为文本数据,原有的文本数据则作保留。
优选地,所述构建包含文本序列的文本数据集合,并进行文本向量化, 构建词向量集合,包括:
标注数据集完成之后,令S={S1,S2,...,Sl,...,Sn},
Figure BDA0003758973060000081
其中,S表示所有文本数据集合,Sl表示第l条文本序列,
Figure BDA0003758973060000082
表示第l条 文本序列中的第i个字符,n表示文本数据集合有n条序列,m表示第l条文 本序列中有m个字符;
考虑到情感分析的过程中字符位置信息对于情感分析会造成语义不通顺, 进而影响情感的判断,还需从文本序列Sl中分别获取每个字符的向量
Figure BDA0003758973060000091
和每 个字符所对应的位置向量
Figure BDA0003758973060000092
其中位置向量
Figure BDA0003758973060000093
计算方式如下:
Figure BDA0003758973060000094
其中,pos表示文本
Figure BDA0003758973060000095
在文本序列中的具体位置,i表示向量维度,dmodel表示情感知识增强模型所接受的512维向量;
将512维的向量
Figure BDA0003758973060000096
Figure BDA0003758973060000097
进行加和运算,获得文本输入向量Tl,作为后 续模型的输入,计算方式如下:
Figure BDA0003758973060000098
其中,
Figure BDA0003758973060000099
表示通过文本
Figure BDA00037589730600000910
词嵌入和位置向量嵌入综合得到的后续情感 知识增强模型所需要的输入向量,进而构成向量集合T={T1,T2,...,Tl,...,Tn}。
优选地,所述构建改进情感知识增强模型,包括:
引入以自注意力机制为核心的Transformer编码器与解码器架构;
首先对情感词、情感词极性和属性词-情感词搭配二元组进行掩盖,并计 算情感词的损失函数:
Figure BDA00037589730600000911
Figure BDA00037589730600000912
其中,
Figure BDA00037589730600000913
表示第i个词经过Transformer层后输入到softmax中所计算 得到的概率分布,Wsw表示情感词输出层的权重值,bsw表示情感词输出层的 偏差值,mi表示情感词的标识符,若第i个词为情感词时mi=1,否则mi=0,yi sw表示原始第i个词
Figure BDA00037589730600000914
通过one-hot方式生成的向量表示;
计算情感词极性的损失函数Fwp
Figure BDA0003758973060000101
Figure BDA0003758973060000102
其中,
Figure BDA0003758973060000103
表示第i个情感词的极性经过Transformer层后输入到 softmax中所计算得到的概率分布,Wwp表示情感词极性输出层的权重值, bwp表示情感词极性输出层的偏差值,yi wp表示原始第i个情感词的极性通过 one-hot方式生成的向量表示;
计算属性词-情感词对的损失函数Fasp
Figure BDA0003758973060000104
Figure BDA0003758973060000105
其中,
Figure BDA0003758973060000106
表示第a个属性词-情感词对经过Transformer层后输入到 softmax中所计算得到的概率分布,Wasp表示属性词-情感词对的输出层权重 值,basp表示属性词-情感词对的输出层偏差值,ya asp表示原始第a个属性词-情 感词对通过one-hot方式生成的向量表示;
针对上述三个损失函数,构建三目标优化模型(9),来权衡三个优化函数 之间的关系,从而找到得到最优的多种情感任务的情感预训练目标优化函数, 具体公式如下:
max(Fsw),max(Fwp),max(Fasp) (9)
采用Pareto优化策略求解三目标优化模型(9),获得优化情感词、情感 词极性和属性词-情感词的模型权重,并改进情感知识增强模型,得到情感 知识增强模型的输出集合X={X1,X2,...,Xl,...,Xn},使得改进的情感知识增强模型 模型能够充分学习情感词、情感词极性和情感词—属性词对等多种方面的情 感特征,更利于捕捉情感信息,从而加强情感文本的情感特征提取。
优选地,所述联合改进BiGRU和多头注意力机制进行文本情感特征提取; 包括:
引入多头注意力机制来学习不同的子空间下情感文本的情感特征,提取 联合改进BiGRU和多头注意力机制的情感文本情感特征,获取文本中的内部 结构信息,从而有效提取每条句子中局部的特征;
通过公式(10)计算文本集合X中所有文本情感向量的隐藏特征值hl
Figure RE-GDA0003894903830000111
其中,p1表示第l条信息文本前向GRU所对应的权重,p2表示第l条信息 文本反向GRU所对应的权重,bz表示第l条信息文本的偏置,hl表示经过加权 求和后的隐藏特征值,
Figure RE-GDA0003894903830000112
表示前向GRU输出的隐藏状态值,
Figure RE-GDA0003894903830000113
表示反向GRU输 出的隐藏状态值。遍历计算每条文本对应的隐藏特征值,最后获得情感隐藏 特征集合H={h1,h2,...,hl,...,hn};
结合获得的情感隐藏特征集合H,通过多头注意力机制来获取情感隐藏特 征集合在不同的子空间下不同的特征表示能力,进行不同子空间下的权重计 算与分配,将情感隐藏特征集合H中的每个隐藏特征值hl赋值给查询向量Q、 键向量K和值向量V,并计算如下公式:
Figure BDA0003758973060000114
其中,Attention()表示注意力函数,softmax()表示归一化指数函数,dk表示键向量K的维度;
通过归一化指数函数来最大化每个查询向量Q与键向量K乘积的概率分 布,获得文本中每个字在上下文中的权重关系,从而提取情感上下文中最关 键的词语特征信息;
令第t次投影注意力函数计算后的值headt
headt=Attention(QWt Q,KWt K,VWt V) (12)
其中,headt表示在第t次通过线性层投影下通过注意力机制计算后得到 的值,Wt Q、Wt K、Wt V表示经过第t次投影学习到的权重值;
通过多个head进行拼接得到多头注意力机制函数,计算方式如下:
Multihead(Q,K,V)=Concat(head1,head2,...,headt,...,headh)Wc (13)
其中,Wc表示在拼接过程中学习到的权重参数,Concat()表示将h个head 进行拼接的函数,从而得到新的一个情感特征向量表示;
最后,对于特征集合H的所有隐藏特征值进行多头注意力机制计算,从 而得到新的情感特征向量表示集合M={M1,M2,...,Ml,...,Mn}。
优选地,所述基于文本特征向量集合数据,计算焦点损失的损失度函数, 包括:
结合上一步骤学习到新的特征向量集合数据,通过公式(14)计算焦点损 失的损失度函数,通过调节难、易分类样本的权重系数来输出文本的情感标 签,作为最后的标签输出结果;
L=-α(1-pr)γlog(pr) (14)
其中,pr为文本情感分类模型预测情感特征向量Ml的概率,α和γ为文 本情感权重调节系数。
优选地,所述进行文本情感分类模型训练,包括:
在训练过程中,迭代计算所有文本情感特征向量预测的概率对应的损失 值
当损失函数值大于预设阈值ε,则更新模型参数继续训练,否则,通过迭 代计算得到模型的最小化损失函数值,即为模型训练的最终目标。
如图2所示,本发明还提供一种文本情感分类系统,包括:
文本数据预处理模块:用于获取文本数据;标签标注获得的每条文本数 据,构建和标注训练集和测试集;构建包含文本序列的文本数据集合,并进 行文本向量化,构建词向量集合;
文本情感分类模型构建模块:用于构建改进情感知识增强模型;联合改 进BiGRU和多头注意力机制进行文本情感特征提取;基于文本特征向量集合 数据,计算焦点损失的损失度函数;进行文本情感分类模型训练;
文本情感分类模块:用于将词向量集合输入到文本情感分类模型,获得 文本情感分类结果。
本发明还提供一种文本情感分类装置,包括:输入设备、输出设备、存 储器、处理器;所述输入设备、所述输出设备、所述存储器和所述处理器相 互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序 指令,所护处理器被配置调用所述程序指令,执行如前任一所述的一种文本 情感分类方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储 有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器所 执行时执行如前任一所述的一种文本情感分类方法。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而 言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行 多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限 定。

Claims (10)

1.一种文本情感分类方法,其特征在于,包括:
获取文本数据;
标签标注获得的每条文本数据,构建和标注训练集和测试集;
构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量集合;
构建改进情感知识增强模型;
联合改进BiGRU和多头注意力机制进行文本情感特征提取;
基于文本特征向量集合数据,计算焦点损失的损失度函数;
进行文本情感分类模型训练;将词向量集合输入到文本情感分类模型,获得文本情感分类结果。
2.根据权利要求1所述的一种文本情感分类方法,其特征在于,所述获取文本数据,包括:通过数据服务中心系统获取文本数据,以线上方式获取包括语音和文本的格式的在线情感数据,其中,将语音格式的数据转为文本数据。
3.根据权利要求1所述的一种文本情感分类方法,其特征在于,所述构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量集合,包括:
标注数据集完成之后,令S={S1,S2,...,Sl,...,Sn},
Figure FDA0003758973050000011
其中,S表示所有文本数据集合,Sl表示第l条文本序列,
Figure FDA0003758973050000012
表示第l条文本序列中的第i个字符,n表示文本数据集合有n条序列,m表示第l条文本序列中有m个字符;
从文本序列Sl中分别获取每个字符的向量
Figure FDA0003758973050000013
和每个字符所对应的位置向量
Figure FDA0003758973050000014
其中位置向量
Figure FDA0003758973050000015
计算方式如下:
Figure FDA0003758973050000016
其中,pos表示文本
Figure FDA0003758973050000021
在文本序列中的具体位置,i表示向量维度,dmodel表示情感知识增强模型所接受的512维向量;
将512维的向量
Figure FDA0003758973050000022
Figure FDA0003758973050000023
进行加和运算,获得文本输入向量Tl,作为后续模型的输入,计算方式如下:
Figure FDA0003758973050000024
其中,
Figure FDA0003758973050000025
表示通过文本
Figure FDA0003758973050000026
词嵌入和位置向量嵌入综合得到的后续情感知识增强模型所需要的输入向量,进而构成向量集合T={T1,T2,...,Tl,...,Tn}。
4.根据权利要求1所述的一种文本情感分类方法,其特征在于,所述构建改进情感知识增强模型,包括:
引入以自注意力机制为核心的Transformer编码器与解码器架构;
首先对情感词、情感词极性和属性词-情感词搭配二元组进行掩盖,并计算情感词的损失函数:
Figure FDA0003758973050000027
Figure FDA0003758973050000028
其中,
Figure FDA0003758973050000029
表示第i个词经过Transformer层后输入到softmax中所计算得到的概率分布,Wsw表示情感词输出层的权重值,bsw表示情感词输出层的偏差值,mi表示情感词的标识符,若第i个词为情感词时mi=1,否则mi=0,yi sw表示原始第i个词
Figure FDA00037589730500000210
通过one-hot方式生成的向量表示;
计算情感词极性的损失函数Fwp
Figure FDA00037589730500000211
Figure FDA00037589730500000212
其中,
Figure FDA00037589730500000213
表示第i个情感词的极性经过Transformer层后输入到softmax中所计算得到的概率分布,Wwp表示情感词极性输出层的权重值,bwp表示情感词极性输出层的偏差值,yi wp表示原始第i个情感词的极性通过one-hot方式生成的向量表示;
计算属性词-情感词对的损失函数Fasp
Figure FDA0003758973050000031
Figure FDA0003758973050000032
其中,
Figure FDA0003758973050000033
表示第a个属性词-情感词对经过Transformer层后输入到softmax中所计算得到的概率分布,Wasp表示属性词-情感词对的输出层权重值,basp表示属性词-情感词对的输出层偏差值,ya asp表示原始第a个属性词-情感词对通过one-hot方式生成的向量表示;
针对上述三个损失函数,构建三目标优化模型(9),来权衡三个优化函数之间的关系,从而找到得到最优的多种情感任务的情感预训练目标优化函数,具体公式如下:
max(Fsw),max(Fwp),max(Fasp) (9)
采用Pareto优化策略求解三目标优化模型(9),获得优化情感词、情感词极性和属性词-情感词的模型权重,并改进情感知识增强模型,得到情感知识增强模型的输出集合X={X1,X2,...,Xl,...,Xn}。
5.根据权利要求1所述的一种文本情感分类方法,其特征在于,所述联合改进BiGRU和多头注意力机制进行文本情感特征提取;包括:
引入多头注意力机制来学习不同的子空间下情感文本的情感特征,提取联合改进BiGRU和多头注意力机制的情感文本情感特征,获取文本中的内部结构信息;
通过公式(10)计算文本集合X中所有文本情感向量的隐藏特征值hl
Figure RE-FDA0003894903820000034
其中,p1表示第l条信息文本前向GRU所对应的权重,p2表示第l条信息文本反向GRU所对应的权重,bz表示第l条信息文本的偏置,hl表示经过加权求和后的隐藏特征值,
Figure RE-FDA0003894903820000041
表示前向GRU输出的隐藏状态值,
Figure RE-FDA0003894903820000042
表示反向GRU输出的隐藏状态值。遍历计算每条文本对应的隐藏特征值,最后获得情感隐藏特征集合H={h1,h2,...,hl,...,hn};
结合获得的情感隐藏特征集合H,通过多头注意力机制来获取情感隐藏特征集合在不同的子空间下不同的特征表示能力,进行不同子空间下的权重计算与分配,将情感隐藏特征集合H中的每个隐藏特征值hl赋值给查询向量Q、键向量K和值向量V,并计算如下公式:
Figure RE-FDA0003894903820000043
其中,Attention()表示注意力函数,softmax()表示归一化指数函数,dk表示键向量K的维度;
通过归一化指数函数来最大化每个查询向量Q与键向量K乘积的概率分布,获得文本中每个字在上下文中的权重关系,从而提取情感上下文中最关键的词语特征信息;
令第t次投影注意力函数计算后的值headt
headt=Attention(QWt Q,KWt K,VWt V) (12)
其中,headt表示在第t次通过线性层投影下通过注意力机制计算后得到的值,Wt Q、Wt K、Wt V表示经过第t次投影学习到的权重值;
通过多个head进行拼接得到多头注意力机制函数,计算方式如下:
Multihead(Q,K,V)=Concat(head1,head2,...,headt,...,headh)Wc (13)
其中,Wc表示在拼接过程中学习到的权重参数,Concat()表示将h个head进行拼接的函数,从而得到新的一个情感特征向量表示;
最后,对于特征集合H的所有隐藏特征值进行多头注意力机制计算,从而得到新的情感特征向量表示集合M={M1,M2,...,Ml,...,Mn}。
6.根据权利要求5所述的一种文本情感分类方法,其特征在于,所述基于文本特征向量集合数据,计算焦点损失的损失度函数,包括:
结合权利要求5学习到新的特征向量集合数据,通过公式(14)计算焦点损失的损失度函数,通过调节难、易分类样本的权重系数来输出文本的情感标签,作为最后的标签输出结果;
L=-α(1-pr)γlog(pr) (14)
其中,pr为文本情感分类模型预测情感特征向量Ml的概率,α和γ为文本情感权重调节系数。
7.根据权利要求1所述的一种文本情感分类方法,其特征在于,所述进行文本情感分类模型训练,包括:
在训练过程中,迭代计算所有文本情感特征向量预测的概率对应的损失值
当损失函数值大于预设阈值ε,则更新模型参数继续训练,否则,通过迭代计算得到模型的最小化损失函数值,即为模型训练的最终目标。
8.一种文本情感分类系统,其特征在于,包括:
文本数据预处理模块:用于获取文本数据;标签标注获得的每条文本数据,构建和标注训练集和测试集;构建包含文本序列的文本数据集合,并进行文本向量化,构建词向量集合;
文本情感分类模型构建模块:用于构建改进情感知识增强模型;联合改进BiGRU和多头注意力机制进行文本情感特征提取;基于文本特征向量集合数据,计算焦点损失的损失度函数;进行文本情感分类模型训练;
文本情感分类模块:用于将词向量集合输入到文本情感分类模型,获得文本情感分类结果。
9.一种文本情感分类装置,其特征在于,包括:输入设备、输出设备、存储器、处理器;所述输入设备、所述输出设备、所述存储器和所述处理器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所护处理器被配置调用所述程序指令,执行如权利要求1-7中任一所述的一种文本情感分类方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器所执行时执行如权利要求1-7中任一所述的一种文本情感分类方法。
CN202210881339.1A 2022-07-22 2022-07-22 一种文本情感分类方法、系统、装置及计算机介质 Pending CN115391520A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210881339.1A CN115391520A (zh) 2022-07-22 2022-07-22 一种文本情感分类方法、系统、装置及计算机介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210881339.1A CN115391520A (zh) 2022-07-22 2022-07-22 一种文本情感分类方法、系统、装置及计算机介质

Publications (1)

Publication Number Publication Date
CN115391520A true CN115391520A (zh) 2022-11-25

Family

ID=84116176

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210881339.1A Pending CN115391520A (zh) 2022-07-22 2022-07-22 一种文本情感分类方法、系统、装置及计算机介质

Country Status (1)

Country Link
CN (1) CN115391520A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115544260A (zh) * 2022-12-05 2022-12-30 湖南工商大学 用于文本情感分析的对比优化编解码模型及方法
CN116362237A (zh) * 2023-04-17 2023-06-30 内蒙古工业大学 一种混合策略感知的文本情感强度标注方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115544260A (zh) * 2022-12-05 2022-12-30 湖南工商大学 用于文本情感分析的对比优化编解码模型及方法
CN116362237A (zh) * 2023-04-17 2023-06-30 内蒙古工业大学 一种混合策略感知的文本情感强度标注方法及系统

Similar Documents

Publication Publication Date Title
CN111985239B (zh) 实体识别方法、装置、电子设备及存储介质
CN107943784B (zh) 基于生成对抗网络的关系抽取方法
CN110647619A (zh) 一种基于问题生成和卷积神经网络的常识问答方法
CN111506732B (zh) 一种文本多层次标签分类方法
CN113626589B (zh) 一种基于混合注意力机制的多标签文本分类方法
CN115391520A (zh) 一种文本情感分类方法、系统、装置及计算机介质
CN116450796B (zh) 一种智能问答模型构建方法及设备
CN111522908A (zh) 一种基于BiGRU和注意力机制的多标签文本分类方法
CN112906397B (zh) 一种短文本实体消歧方法
CN115204143B (zh) 一种基于prompt的文本相似度计算方法及系统
CN113988079A (zh) 一种面向低数据的动态增强多跳文本阅读识别处理方法
CN116303977B (zh) 一种基于特征分类的问答方法及系统
CN115270752A (zh) 一种基于多层次对比学习的模板句评估方法
CN113641809A (zh) 一种基于XLNet-BiGRU-CRF的智能问答方法
CN114780723B (zh) 基于向导网络文本分类的画像生成方法、系统和介质
CN114492460B (zh) 基于衍生提示学习的事件因果关系抽取方法
Hashana et al. Deep Learning in ChatGPT-A Survey
CN114579741B (zh) 融合句法信息的gcn-rn方面级情感分析方法和系统
CN114548117A (zh) 一种基于bert语义增强的因果关系抽取方法
CN116127954A (zh) 一种基于词典的新工科专业中文知识概念抽取方法
Li et al. Automated essay scoring incorporating multi-level semantic features
Jiang et al. Network public comments sentiment analysis based on multilayer convolutional neural network
Alyamani Determining Feature-Size for Text to Numeric Conversion based on BOW and TF-IDF
Shi et al. Category-based strategy-driven question generator for visual dialogue
LU504829B1 (en) Text classification method, computer readable storage medium and system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination