CN113723084A - 一种融合先验知识的蒙古语文本情感分析方法 - Google Patents
一种融合先验知识的蒙古语文本情感分析方法 Download PDFInfo
- Publication number
- CN113723084A CN113723084A CN202110842205.4A CN202110842205A CN113723084A CN 113723084 A CN113723084 A CN 113723084A CN 202110842205 A CN202110842205 A CN 202110842205A CN 113723084 A CN113723084 A CN 113723084A
- Authority
- CN
- China
- Prior art keywords
- emotion
- mongolian
- word
- model
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 106
- 238000004458 analytical method Methods 0.000 title claims abstract description 50
- 239000013598 vector Substances 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 20
- 230000014509 gene expression Effects 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 238000003012 network analysis Methods 0.000 claims abstract description 4
- 230000011218 segmentation Effects 0.000 claims description 26
- 238000005516 engineering process Methods 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 claims description 2
- 230000001537 neural effect Effects 0.000 claims 1
- 230000007246 mechanism Effects 0.000 abstract description 5
- 230000002996 emotional effect Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
一种融合先验知识的蒙古语文本情感分析方法,对含有表情符的蒙古语情感文本语料库进行预处理;将经过预处理得到的文本词和表情符转换为动态词向量;分别创建蒙古语情感词典和表情符的情感词典将二者提取的特征作为模型最终提取的情感特征;由CNN网络和门控机制组成蒙古语文本情感分析模型;将融入先验知识的模型在大规模蒙古语语料上进行预训练,得到融合先验知识的蒙古语文本情感分析模型;将该模型的分析结果与单一网络分析方法的分析结果就精确率、召回率和F1值进行对比和评价,达到提高蒙古语文本情感分析性能的目的。
Description
技术领域
本发明属于人工智能技术领域,特别涉及一种融合先验知识的蒙古语文本 情感分析方法。
背景技术
随着互联网技术的快速发展,越来越多的人开始在诸如微博、论坛、影视 网站、购物网站等平台发表各种言论,以此来分享自己的心情、观点和意见。 随着时代的发展,文本的载体出现多元化,其中表情符就是一种新的载体。用 户发表的这些内容可能包含不同的感情色彩:有开心的或是喜爱的;悲伤的亦 或是愤怒的。情感分析的核心是将一段文本所表达的情感分为happiness、 like、sadness、anger四个类别。
随着人工智能的崛起,深度学习方法得到了广泛的关注,因其模型具有强 大的特征学习能力,所以逐渐成为了解决情感分类问题的重要方法。但对于蒙 古语这样的小语种来说,现有的文本情感分析方法存在以下三点不足。其一, 由于蒙古语词汇丰富形态变化多,就造成了在蒙古语文本情感分析过程中出现 了严重的未登录词现象,而大量未登录词的存在严重影响情感分析的准确率。 其二,目前单一的神经网络模型在解决文本情感分析时不具有很好的实时性, 分类效果不佳。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种融合先验知识 的蒙古语文本情感分析方法,具有以下三个特点:第一,将BPE技术和词向量 修正方法结合,更好的缓解因蒙古语语法的复杂性而出现的未登录词问题;第 二,通过预训练模型分别将文本和表情符表示成向量的形式,以充分利用原始 数据中的文本和表情符的情感特征,达到多方位分析情感目标的目的;第三, 通过构建蒙古语情感词典和表情符的情感词典作为预训练模型的先验知识,再 利用蒙古语情感文本语料训练得到基于卷积和门控机制的神经网络的蒙古语文 本情感分析模型,提升蒙古语文本情感分析的质量。
为了实现上述目的,本发明采用的技术方案是:
一种融合先验知识的蒙古语文本情感分析方法,包括如下步骤:
步骤1:对含有表情符的蒙古语情感文本语料库进行预处理;
步骤2:BPE分词技术对蒙古语语料进行分词;
步骤3:将经过预处理得到的词转换为动态词向量;
步骤4:分别创建蒙古语情感词典和表情符的情感词典作为模型的先验知 识;
步骤5:将融合先验知识的模型在大规模的语料进行预训练,得到融合先 验知识模型的蒙古语文本情感分析模型;
步骤6:将融合先验知识的蒙古语文本情感分析模型的分析结果与单一网 络分析方法的分析结果就准确率、精确率、召回率和F1值进行对比和评价, 以达到提高蒙古语文本情感分析性能的目的。
所述步骤1中,预处理是对所获取的语料进行数据清洗,解决数据源问 题,比如原始数据错误,脏乱差。预处理包括移除用户名信息、移除URLS、 移除特殊字符等步骤。
所述步骤2中,采用字节对编码技术(BPE)分词技术对预处理的语料信 息进行切分操作,利用GloVe模型将文本语料和表情符训练生成对应的词向 量,并并使用词向量结果贪心地发现未登录词,修正切分结果。
所述利用GloVe训练生成词向量的目标函数J(W)为:
其中,W为词向量矩阵,W∈R|V|*d,|V|表示词的数量,d表示词向量维 数;Xij表示词wj在词wi的语境下出现的次数,Wi表示词wi的词向量,Wj表示 词wj的词向量,f(Xij)是权重项,用于去除低频项噪声,其表达式如下:
其中,Xmax为Xi中的最大值,Xi表示在词wi的语境下出现的所有的词的次 数,Xi=∑jXij;
对于原分词结果Y=w1w2…wm,从头开始比较当前词wi的词向量Wi与下 一个词wi+1的词向量Wi+1的夹角余弦值,夹角余弦值公式为:
若该夹角余弦值大于预先给定的阈值λ,则认为词wi和词wi+1组成新词,组 合后的词向量为二者加和归一化的结果,计算公式为:
所述步骤3中,将经过预处理得到的词转换为计算机能识别和处理的语 言,即动态词向量。
所述步骤4中,分别创建蒙古语情感词典和表情符的情感词典作为模型的 先验知识。其中,文本情感词典包含happiness、like、sadnes、sanger四种情感 的情感词语,如,喜悦、高兴、开心等词汇属于文本情感库里happiness的情感 类别,喜欢、想要等词汇属于文本情感库里like的情感类别, 等表情符属于表情符情感词典库里happiness的情感类别。
所述步骤5中,使用融合先验知识的预训练模型Convolutional Neural Net-works And Gating Mechanisms,新的门控Tanh-ReLU单元可以根据给定的方面 或实体选择性地输出情感特征。该架构比现有模型中使用的关注层简单得多。 其次,我们模型的计算在训练过程中可以很容易地并行化,因为卷积层不像 LSTM层那样具有时间依赖性,门控单元也独立工作。
所述步骤6中,准确率的计算公式精确率的计算公式 为召回率的计算公式为F1值的计算公式为其中Acc表示准确率,P表示精确率,R表示召回率,F1表示F1值,TP表示 实际为正例,且被模型预测为正例的样本数量;FN表示被模型预测为负例, 但实际上为正例的样本数量;FP表示被模型预测为正例,但实际上为负例的 样本数量;TN表示实际为负例,且被模型预测为负例的样本数,所述准确 率、精确率、召回率和F1值的分数越高说明情感分析模型性能越好。
与现有技术相比,本发明的有益效果是:
(1)本发明将BPE技术和词向量修正方法结合,更好的缓解因蒙古语语 法的复杂性而出现的未登录词问题。
(2)本发明通过预训练模型分别将文本和表情符表示成向量的形式,以 充分利用原始数据中的文本和表情符的情感特征,达到多方位分析情感目标的 目的。
(3)本发明通过构建蒙古语情感词典和表情符的情感词典作为预训练模 型的先验知识,再利用蒙古语情感文本语料训练得到基于卷积和门控机制的神 经网络的蒙古语文本情感分析模型,提升蒙古语文本情感分析的质量。
附图说明
图1是一种融合先验知识的蒙古语文本情感分析方法的流程图。
图2是门控卷积模型的架构图。
具体实施方式
下面结合附图和实施例详细说明本发明的实施方式。
如图1所示,本发明一种融合先验知识的蒙古语文本情感分析方法,过程 如下:
第一步:对含有表情符的蒙古语情感文本语料库进行预处理。处理是对所 获取的语料进行数据清洗,解决数据源问题,比如原始数据错误,脏乱差。预 处理包括移除用户名信息、移除URLS、移除特殊字符等步骤。
第二步:在进行模型训练之前,应对情感文本语料库进行预处理。本发明 使用字节对编码技术(BPE)对语料进行切分操作,由于BPE技术是用一个没 有在这个字符串中出现的字符将字符串里频率最常见的一对字符代替的层层迭 代过程,所以通过对蒙古语词汇进行词干和词缀的切分,能够让高频词保留至 词典中,而低频词被切分为更小粒度的子单元,从而缓解数据稀疏,减少未登 录词。具体步骤为:
1、将语料库中所有字符加入字典中作为初始化字典,把所有单词变成字 符分割的形式,并在末尾加入标记,方便在输入句子后回复分词信息;
2、对语料中的字符对计数,找出次数最多的字符对(A,B),并在语料中 将其用“AB”代替,从而在字典中增加键值“AB”,此步骤称为合并操作;
3、对上一步操作迭代n次,直到已经进行了一定数量的合并操作;
4、字典由字符、词素和词语等组成,此时字典大小=初始字典大小+合并 操作次数n。
随着互联网的发展使得新词不断涌现,只基于词频而不考虑词的语法、语 义信息的切分方法准确率不高。因此,为了提升切分性能,在BPE环节之后, 本发明选择使用GloVe模型训练生成词向量,并使用词向量结果贪心地发现未 登录词,修正切分结果。
GloVe模型通过对“词-词”矩阵进行分解从而得到词的向量表示。GloVe模 型需要根据语料构建词语的共现矩阵,共现矩阵统计的是词语在给定中心词和 窗口大小的限制环境下的共现次数,因此在一定程度上可以表达词语之间的关 系。由于共现频数是在整个语料库中进行统计的,不只是针对一句话或者一段 语料,所以具有全局性。对于表达意义相近的词而言,它们之间的“距离”也较 其他的词更近。例如“人民政府”一词周围的词语有“市政府”,“政府”,“行政” 等;“科学研究”一词周围的词语有“科研”,“科学技术”,“研究”等。通过 GloVe模型训练得到的词向量包含良好的语法、语义信息。
使用GloVe模型得到的词向量进行切分修正的基本原理为:如果词wi和词 wj同时出现的频率较高,那么二者以较大的概率可以组合成新词wiwj。通过 GloVe模型生成的词向量具有以下性质:如果词wi和词wj有很大可能可以组成 新词wiwj,那么这两个词对应的词向量Wi和Wj之间的夹角θ的余弦值会接近 1。
根据上述原理,可以采用如下贪婪方法进行修正,具体步骤为:
1、将通过BPE技术切分好的词转换为词向量,使用GloVe模型训练词向 量的目标函数为:
式中,W为词向量矩阵,W∈R|V|*d,|V|表示词的数量,d表示词向量维 数;Xij表示词wj在词wi的语境下出现的次数,Wi表示词wi的词向量,Wj表示 词wj的词向量,f(Xij)是权重项,用于去除低频项噪声,其表达式如下:
式中,Xmax为Xi中的最大值,Xi表示在词wi的语境下出现的所有的词的次 数,Xi=∑jXij;
2、对于原分词结果Y=w1w2…wm,从头开始比较当前词wi的词向量Wi与下一个词wi+1的词向量Wit1的夹角余弦值,夹角余弦值公式为:
3、若该夹角余弦值大于预先给定的阈值λ,则认为词wi和词wit1组成新 词,组合后的词向量为二者加和归一化的结果,计算公式为:
第三步:将经过预处理得到的词转换为动态词向量。
第四步:分别创建蒙古语情感词典和表情符的情感词典作为模型的先验知 识。其中,文本情感词典包含happiness、like、sadnes、sanger四种情感的情感 词语,如,喜悦、高兴、开心等词汇属于文本情感库里happiness的情感类别, 喜欢、想要等词汇属于文本情感库里like的情感类别, 等表情符属于表情符情感词典库里happiness的情感类别。
第五步:本发明采用融合先验知识的预训练模型,其中预训练模型为Convolutional Neural Net-works+Gating Mechanisms,模型建立在卷积层和门控 单元上。每个卷积滤波器分别从每个位置的嵌入向量计算不同粒度的n-gram特 征。卷积层顶部每个位置的选通单元也是相互独立的。因此,我们的模型更适 合并行计算。此外,我们的模型配备了两种有效的过滤机制:卷积层顶部的选通 单元和最大池层,这两种机制都可以准确地生成和选择与方面相关的情感特 征。
第六步:将融合先验知识模型的蒙古语文本情感分析模型的分析结果与单 一网络分析方法的分析结果就精确率、召回率和F1值进行对比和评价,以达 到提高蒙古语文本情感分析性能的目的。
其中精确率的计算公式为召回率的计算公式为F1 值的计算公式为其中P表示精确率,指的是在预测为正例的样本 中,实际为正例所占的比例,R表示召回率,指的是在实际的正例样本中,预 测为正例所占的比例,通常情况下,精确率和召回率是相互矛盾的,即提高一 个指标会导致另一个指标的下降。F1表示F1值,为了权衡精确率和召回率,F1值被用于综合评价分类模型的性能。TP(True Positive)表示实际为正例, 且被模型预测为正例的样本数量;FN(False Negative)表示被模型预测为负 例,但实际上为正例的样本数量;FP(False Positive)表示被模型预测为正 例,但实际上为负例的样本数量;TN(True Negative)表示实际为负例,且被 模型预测为负例的样本数,精确率、召回率和F1值的分数越高说明情感分析 模型性能越好。表1给出了计算中所需的混淆矩阵:
表1混淆矩阵
预测为正例 | 预测为负例 | |
实际为正例 | TP | FN |
预测为负例 | FP | TN |
Claims (9)
1.一种融合先验知识的蒙古语文本情感分析方法,其特征在于,包括如下步骤:
步骤1:对含有表情符的蒙古语情感文本语料库进行预处理;
步骤2:BPE分词技术对蒙古语语料进行分词;
步骤3:将经过预处理得到的词转换为动态词向量;
步骤4:分别创建蒙古语情感词典和表情符的情感词典作为模型的先验知识;
步骤5:将融合先验知识的模型在大规模的语料进行预训练,得到融合先验知识模型的蒙古语文本情感分析模型;
步骤6:将融合先验知识的蒙古语文本情感分析模型的分析结果与单一网络分析方法的分析结果就准确率、精确率、召回率和F1值进行对比和评价,以达到提高蒙古语文本情感分析性能的目的。
2.根据权利要求1所述融合先验知识的蒙古语文本情感分析方法,其特征在于,所述步骤1中,预处理是对所获取的语料进行数据清洗,解决数据源问题,比如原始数据错误,脏乱差。预处理包括移除用户名信息、移除URLS、移除特殊字符等步骤。
3.根据权利要求2所述融合先验知识的蒙古语文本情感分析方法,其特征在于,采用字节对编码技术(BPE)分词技术对预处理的语料信息进行切分操作,利用GloVe模型将文本语料和表情符训练生成对应的词向量,并并使用词向量结果贪心地发现未登录词,修正切分结果。
4.根据权利要求3所述融合先验知识的蒙古语文本情感分析方法,其特征在于,所述利用GloVe训练生成词向量的目标函数J(W)为:
其中,W为词向量矩阵,W∈R|V|*d,|V|表示词的数量,d表示词向量维数;Xij表示词wj在词wi的语境下出现的次数,Wi表示词wi的词向量,Wj表示词wj的词向量,f(Xij)是权重项,用于去除低频项噪声,其表达式如下:
其中,Xmax为Xi中的最大值,Xi表示在词wi的语境下出现的所有的词的次数,Xi=∑jXij;
对于原分词结果Y=W1W2…Wm,从头开始比较当前词wi的词向量Wi与下一个词wi+1的词向量Wi+1的夹角余弦值,夹角余弦值公式为:
若该夹角余弦值大于预先给定的阈值λ,则认为词wi和词wi+1组成新词,组合后的词向量为二者加和归一化的结果,计算公式为:
6.根据权利要求5所述融合先验知识的蒙古语文本情感分析方法,其特征在于,所述步骤5中,使用融合先验知识的预训练模型Convolutional Neural Net-works And GatingMechanisms,新的门控Tanh-ReLU单元可以根据给定的方面或实体选择性地输出情感特征。该架构比现有模型中使用的关注层简单得多。其次,我们模型的计算在训练过程中可以很容易地并行化,因为卷积层不像LSTM层那样具有时间依赖性,门控单元也独立工作。
7.根据权利要求4或5所述融合先验知识的蒙古语文本情感分析方法,其特征在于,采用集成模型的思想,将融合文本情感词典和表情符情感词典的先验知识预训练Convolutional Neural Net-works And Gating Mechanisms模型作为最终情感分析模型,提取相关情感特征。
8.根据权利要求1所述融合先验知识的蒙古语文本情感分析方法,其特征在于,所述步骤5中,利用大规模蒙古文多模态情感语料训练神经网络学到的网络参数权重为神经网络各结点联接的参数矩阵,将大规模情感分析模型中训练好的网络参数权重迁移到特定蒙古语多模态情感分析模型中进行初始化,最后再利用蒙古语情感文本语料对模型进行进一步的训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110842205.4A CN113723084A (zh) | 2021-07-26 | 2021-07-26 | 一种融合先验知识的蒙古语文本情感分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110842205.4A CN113723084A (zh) | 2021-07-26 | 2021-07-26 | 一种融合先验知识的蒙古语文本情感分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113723084A true CN113723084A (zh) | 2021-11-30 |
Family
ID=78673950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110842205.4A Pending CN113723084A (zh) | 2021-07-26 | 2021-07-26 | 一种融合先验知识的蒙古语文本情感分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723084A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115221871A (zh) * | 2022-06-24 | 2022-10-21 | 毕开龙 | 多特征融合的英文科技文献关键词提取方法 |
CN116738359A (zh) * | 2023-05-23 | 2023-09-12 | 内蒙古工业大学 | 基于预训练模型和高分辨网络的蒙古语多模态情感分析方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038166A (zh) * | 2017-12-06 | 2018-05-15 | 武汉大学 | 一种基于词项主客观偏向性的中文微博情感分析方法 |
CN110750648A (zh) * | 2019-10-21 | 2020-02-04 | 南京大学 | 一种基于深度学习和特征融合的文本情感分类方法 |
CN112163607A (zh) * | 2020-09-17 | 2021-01-01 | 平顶山学院 | 基于多维度和多层次联合建模的网络社会媒体情感分类方法 |
-
2021
- 2021-07-26 CN CN202110842205.4A patent/CN113723084A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108038166A (zh) * | 2017-12-06 | 2018-05-15 | 武汉大学 | 一种基于词项主客观偏向性的中文微博情感分析方法 |
CN110750648A (zh) * | 2019-10-21 | 2020-02-04 | 南京大学 | 一种基于深度学习和特征融合的文本情感分类方法 |
CN112163607A (zh) * | 2020-09-17 | 2021-01-01 | 平顶山学院 | 基于多维度和多层次联合建模的网络社会媒体情感分类方法 |
Non-Patent Citations (2)
Title |
---|
WEI XUE等: "Aspect Based Sentiment Analysis with Gated Convolutional Networks", 《HTTPS://ARXIV.ORG/ABS/1805.07043》, pages 1 - 10 * |
许峰等: "基于深度神经网络模型的中文分词方案", 《哈尔滨工程大学学报》, vol. 40, no. 9, pages 1662 - 1666 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115221871A (zh) * | 2022-06-24 | 2022-10-21 | 毕开龙 | 多特征融合的英文科技文献关键词提取方法 |
CN115221871B (zh) * | 2022-06-24 | 2024-02-20 | 毕开龙 | 多特征融合的英文科技文献关键词提取方法 |
CN116738359A (zh) * | 2023-05-23 | 2023-09-12 | 内蒙古工业大学 | 基于预训练模型和高分辨网络的蒙古语多模态情感分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112001185B (zh) | 一种结合中文句法和图卷积神经网络的情感分类方法 | |
CN113239181B (zh) | 基于深度学习的科技文献引文推荐方法 | |
CN108108351B (zh) | 一种基于深度学习组合模型的文本情感分类方法 | |
CN111931506B (zh) | 一种基于图信息增强的实体关系抽取方法 | |
CN114757182A (zh) | 一种改进训练方式的bert短文本情感分析方法 | |
CN112001186A (zh) | 一种利用图卷积神经网络和中文句法的情感分类方法 | |
CN109858034B (zh) | 一种基于注意力模型和情感词典的文本情感分类方法 | |
CN106202065B (zh) | 一种跨语言话题检测方法及系统 | |
CN108073571B (zh) | 一种多语言文本质量评估方法及系统、智能文本处理系统 | |
CN113723084A (zh) | 一种融合先验知识的蒙古语文本情感分析方法 | |
CN113609849A (zh) | 一种融合先验知识模型的蒙古语多模态细粒度情感分析方法 | |
Jia | Sentiment classification of microblog: A framework based on BERT and CNN with attention mechanism | |
CN111339772B (zh) | 俄语文本情感分析方法、电子设备和存储介质 | |
CN116595975A (zh) | 一种基于句信息进行词信息增强的方面级情感分析方法 | |
Zhang et al. | Exploring deep recurrent convolution neural networks for subjectivity classification | |
CN114064901B (zh) | 一种基于知识图谱词义消歧的书评文本分类方法 | |
CN115759119A (zh) | 一种金融文本情感分析方法、系统、介质和设备 | |
Putra et al. | Sentiment Analysis on Social Media with Glove Using Combination CNN and RoBERTa | |
CN114036929A (zh) | 一种基于多模型特征融合的全简称匹配的方法 | |
Lei | Research on the improved Word2Vec optimization strategy based on statistical language model | |
CN113065350A (zh) | 一种基于注意力神经网络的生物医学文本词义消岐方法 | |
CN110705277A (zh) | 一种基于循环神经网络的中文词义消岐方法 | |
Wu et al. | Sentiment analysis of weak-ruletext based on the combination of sentiment lexicon and neural network | |
CN113377901B (zh) | 一种基于多尺寸cnn和lstm模型的蒙古语文本情感分析方法 | |
CN109214007A (zh) | 一种基于卷积神经网络的汉语句子词义消岐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211130 |