CN109858034A - 一种基于注意力模型和情感词典的文本情感分类方法 - Google Patents

一种基于注意力模型和情感词典的文本情感分类方法 Download PDF

Info

Publication number
CN109858034A
CN109858034A CN201910136963.7A CN201910136963A CN109858034A CN 109858034 A CN109858034 A CN 109858034A CN 201910136963 A CN201910136963 A CN 201910136963A CN 109858034 A CN109858034 A CN 109858034A
Authority
CN
China
Prior art keywords
word
text
sentiment
emotion
sentiment dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910136963.7A
Other languages
English (en)
Other versions
CN109858034B (zh
Inventor
刘金硕
杨广益
邓娟
李晨曦
李扬眉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201910136963.7A priority Critical patent/CN109858034B/zh
Publication of CN109858034A publication Critical patent/CN109858034A/zh
Application granted granted Critical
Publication of CN109858034B publication Critical patent/CN109858034B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于注意力模型和情感词典的文本情感分类方法,首先获取需要进行情感分类的目标文本数据集,一部分用作训练集,另一部分作为测试集;并对目标文本数据集进行预处理,生成情感词典;然后基于情感词典,获取对文本数据具有情感表达作用的情感特征;接着获取文本中各词语的词向量,基于词向量和情感特征,计算目标文本的情感特征向量E1;最后基于注意力模型,通过目标文本的情感特征向量获取情感分类结果。本发明通过构建注意力模型,结合情感词典,能进行快速准确的文本情感分类。

Description

一种基于注意力模型和情感词典的文本情感分类方法
技术领域
本发明属于计算机信息处理技术领域,涉及一种文本情感分类方法,具体涉及一种基于注意力模型和情感词典的文本情感分类方法。
背景技术
随着近年来移动互联网技术的快速发展,社交网络用户量逐年增长,人们在社交方在网络上进行的信息交互活动日趋频繁,也更倾向于在社交网络平台上发布带有情感态度的内容。由于中文的语义语法特性以及网络流行语更新迅速,传统的文本情感分类方法不能满足当下对情感分析内容的挖掘需求。
文本情感分类的目的是利用情感分析技术,对包含用户表示的观点、喜好、情感等主观性文本进行识别检测。现有的技术中,分类方法主要分类两种:第一种是基于规则的情感分类,基于手工建立的情感词典和外部资源库生成情感分类模板,然后利用模板匹配来完成分类任务;第二种是基于统计的情感分类方法,该方法在语料库的基础上以机器学习的手段进行特征抽取和分类研究。
但是在上述现有技术中,基于规则的情感分类方法无法应对目前网络日渐增长的衍生词汇,因此分类效果不够理想;基于统计的情感分类方法,由于中文表达形式的多样性和复杂性,该方法存在特征表达困难所照成的语义缺失问题。同时,上述技术没有考虑到分类的时效性,对于不同粒度和长度的文本,不能够达到需要的效果。
发明内容
本发明针对社交网络上带有大量频繁衍生词的情感内容而不能有效地进行情感分类的难题,提供了一种基于注意力模型和情感词典的文本情感分类方法,通过构建注意力模型,结合情感词典,进行快速准确的文本情感分类。
本发明所采用的技术方案是:一种基于注意力模型和情感词典的文本情感分类方法,其特征在于,包括以下步骤:
步骤1:获取需要进行情感分类的目标文本数据集,一部分用作训练集,另一部分作为测试集;并对目标文本数据集进行预处理,生成情感词典;
步骤2:基于情感词典,获取对文本数据具有情感表达作用的情感特征;
步骤3:获取文本中各词语的词向量,基于词向量和情感特征,计算目标文本的情感特征向量E1
步骤4:基于注意力模型,通过目标文本的情感特征向量获取情感分类结果。
本发明具有如下优点:
(1)速度快,能够根据文本结构,基于注意力模型中的层次方法进行特征选择,通过并行加速方式快速得到文本的情感分类结果;
(2)准确性高,能够结合网络衍生词,正确识别出用户的情感倾向;
(3)通用性强,能够根据不同领域的情感词典,针对性地对不同领域的文本进行分类。
附图说明
图1是本发明实施例中流程图;
图2是本发明实施例中情感词典生成流程图;
图3是本发明实施例中情感特征构建流程图;
图4是本发明实施例中情感特征向量构建流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明针对社交网络上大量带有更新迅速的衍生词的情感内容不能有效地进行情感分类的难题,通过情感词聚类产生文本的情感特征,利用注意力模型和情感词典,进行快速准确的文本情感分类。
请见图1,本发明提供的一种基于注意力模型和情感词典的文本情感分类方法,包括以下步骤:
步骤1:获取需要进行情感分类的目标文本数据集,一部分用作训练集,另一部分作为测试集;并对目标文本数据集进行预处理,生成情感词典;
请见图2,步骤1的具体实现包括以下子步骤:
步骤1.1:对需要进行情感分类的目标文本进行分词;
步骤1.2:利用目标文本数据集,分别统计hownet或wordnet词典中的情感词语在目标文本数据集中出现的频次,按照频次进行降序排序;分别选择排序后前k个词(k为可调参数,可根据实际的数据集规模进行调整;本实施例中k设置为了200)分别构建正向情感词典和负向情感词典,记为P和N,初始化后的P和N分别有k个词;
步骤1.3:计算分词后获得的各个单词在训练集中出现的词频和情感词的共现频率,基于公式计算PMI(w,e);其中,PMI(w,e)表示词语w和e的pmi值,w表示目标词汇,e表示情感词典中的某个情感词,Pw代表目标词汇w的词频,pe代表情感词e的词频,Pwe代表w和e的共现频率;
步骤1.4:基于PMI(w,e),利用DPMI算法获取训练集中的词语情感值,记为DPMI(w),根据阈值T和DPMI(w)将词语加入对应的情感词典;
DPMI(w)=∑d(w,e+)PMI(w,e+)-∑d(w,e-)PMI(w,e-);
其中,e+和e-分别属于正向情感词典和负向情感中的词;d(w,e)为词w和词e在文本中的距离因子,两词相聚越远,则相关性越弱;距离因子是词语距离的倒数,词语距离是文本中词语w和词语e中间相隔的词语数目;当DPMI(w)<T时,将词语作为候选正向情感词,加入到正向情感词典中;当DPMI(w)<-T时,将词语作为候选负向情感词,加入到负向情感词典中。
步骤1.5:基于训练所需的迭代次数,更新P和N;最终生成包括P和N在内的情感词典。
步骤2:基于情感词典,获取对文本数据具有情感表达作用的情感特征;
请见图3,步骤2的具体实现包括以下子步骤:
步骤2.1:计算情感词典中所有情感词的情感系数X;
对于给定目标词语w,预处理过程中已对词语w所属情感倾向和类别进行了标记,其中类别记为L;则:
1.在类别为L的文档中,存在目标词语w的文本数,记为A;
2.在类别非L文档中,存在w的文本数,记为B;
3.在类别为L的文档中,不存在w的文本数,记为C;
4.在类别非L文档中,不存在w的文本数,记为D;
M为文档总数M=A+B+C+D;
步骤2.2:设置阈值T,基于情感系数X过滤情感词典中的噪音词语;
当情感系数X的值小于阈值T的时候,X所对应的目标词语,情感表达能力不足,应将其从对应的情感词典中去除;
步骤2.3:采用k-means算法分别对正向情感词典和负向情感词典进行聚类,聚类个数记为k;聚类产生的类,就是情感特征;
步骤2.4:获取两个情感词之间的语义相似度ρ;
式中,W1、W2为目标情感词1和目标情感词2的词向量。
步骤3:获取文本中各词语的词向量,基于词向量和情感特征,计算目标文本的情感特征向量E1
请见图4,步骤3的具体实现包括以下子步骤:
步骤3.1:基于词向量工具,获取文本中各词语的词向量;
步骤3.2:给定一个可调参数,用于限定情感词与修饰词的距离,记为窗口;统计窗口内与目标情感词相关的修饰词,为情感词设置权重;其中,相关的修饰词,是指在句子范围内与情感词相匹配的修饰词;
修饰词中的形容词、修饰语名词和连词是目标词的左上下文特征,需过单向遍历获取权重;修饰词中的副词是目标词的左上文特征和右上下文特征,需通过双向遍历获取权重。
步骤3.3:结合词向量与情感特征,采用向量拼接的方式,得到情感特征向量E1
步骤4:基于注意力模型,通过目标文本的情感特征向量获取情感分类结果;
步骤4的具体实现包括以下子步骤:
步骤4.1:构建四层注意力模型;
四层注意力模型:包括标题、标题加上第一个/最后一个句子加主题、标题加上前3段和最后一段、全文的其余部分;
采取不同的层时,所需的数据量是不同的,层数越大,文本处理粒度越细,数据量越大,因此形成的向量的维度也越大;在选取注意力模型层的时候,确定了计算量,也即计算出了向量维度;
步骤4.2:根据文本的段落结构,将经过维度计算的情感特征向量作为TextCNN分类模型(用于进行文本分类的卷积神经网络模型(Convolutional neural network))的输入;
步骤4.2:基于统计递归单元SRU,对文本处理进行并行加速计算;
步骤4.3:根据从输出结果中选择概率最大的值所在类别作为目标文本的情感分类结果。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (7)

1.一种基于注意力模型和情感词典的文本情感分类方法,其特征在于,包括以下步骤:
步骤1:获取需要进行情感分类的目标文本数据集,一部分用作训练集,另一部分作为测试集;并对目标文本数据集进行预处理,生成情感词典;
步骤2:基于情感词典,获取对文本数据具有情感表达作用的情感特征;
步骤3:获取文本中各词语的词向量,基于词向量和情感特征,计算目标文本的情感特征向量E1
步骤4:基于注意力模型,通过目标文本的情感特征向量获取情感分类结果。
2.根据权利要求1所述的基于注意力模型和情感词典的文本情感分类方法,其特征在于,步骤1的具体实现包括以下子步骤:
步骤1.1:对需要进行情感分类的目标文本进行分词;
步骤1.2:利用目标文本数据集,分别统计hownet或wordnet词典中的情感词语在目标文本数据集中出现的频次,按照频次进行降序排序;分别选择排序后前k个词分别构建正向情感词典和负向情感词典,记为P和N,初始化后的P和N分别有k个词;
步骤1.3:计算分词后获得的各个单词在训练集中出现的词频和情感词的共现频率,基于公式计算PMI(w,e);其中,PMI(w,e)表示词语w和e的pmi值,w表示目标词汇,e表示情感词典中的某个情感词,Pw代表目标词汇w的词频,pe代表情感词e的词频,Pwe代表w和e的共现频率;
步骤1.4:基于PMI(w,e),利用DPMI算法获取训练集中的词语情感值,记为DPMI(w),根据阈值T和DPMI(w)将词语加入对应的情感词典;
步骤1.5:基于训练所需的迭代次数,更新P和N;最终生成包括P和N在内的情感词典。
3.根据权利要求1所述的基于注意力模型和情感词典的文本情感分类方法,其特征在于:步骤1.4中,
DPMI(w)=∑d(w,e+)PMI(w,e+)-∑d(w,e-)PMI(w,e-);
其中,e+和e-分别属于正向情感词典和负向情感中的词;d(w,e)为词w和词e在文本中的距离因子,两词相聚越远,则相关性越弱;距离因子是词语距离的倒数,词语距离是文本中词语w和词语e中间相隔的词语数目;当DPMI(w)<T时,将词语作为候选正向情感词,加入到正向情感词典中;当DPMI(w)<-T时,将词语作为候选负向情感词,加入到负向情感词典中。
4.根据权利要求1所述的基于注意力模型和情感词典的文本情感分类方法,其特征在于,步骤2的具体实现包括以下子步骤:
步骤2.1:计算情感词典中所有情感词的情感系数X;
对于给定目标词语w,预处理过程中已对词语w所属情感倾向和类别进行了标记,其中类别记为L;则:
1.在类别为L的文档中,存在目标词语w的文本数,记为A;
2.在类别非L文档中,存在w的文本数,记为B;
3.在类别为L的文档中,不存在w的文本数,记为C;
4.在类别非L文档中,不存在w的文本数,记为D;
M为文档总数M=A+B+C+D;
步骤2.2:设置阈值T,基于情感系数X过滤情感词典中的噪音词语;
当情感系数X的值小于阈值T的时候,X所对应的目标词语,情感表达能力不足,应将其从对应的情感词典中去除;
步骤2.3:采用k-means算法分别对正向情感词典和负向情感词典进行聚类,聚类个数记为k;聚类产生的类,就是情感特征;
步骤2.4:获取两个情感词之间的语义相似度ρ;
式中,W1、W2为目标情感词1和目标情感词2的词向量。
5.根据权利要求1所述的基于注意力模型和情感词典的文本情感分类方法,其特征在于,步骤3的具体实现包括以下子步骤:
步骤3.1:基于词向量工具,获取文本中各词语的词向量;
步骤3.2:给定一个可调参数,用于限定情感词与修饰词的距离,记为窗口;统计窗口内与目标情感词相关的修饰词,为情感词设置权重;其中,相关的修饰词,是指在句子范围内与情感词相匹配的修饰词;
步骤3.3:结合词向量与情感特征,采用向量拼接的方式,得到情感特征向量E1
6.根据权利要求1所述的基于注意力模型和情感词典的文本情感分类方法,其特征在于:步骤3.2中,修饰词中的形容词、修饰语名词和连词是目标词的左上下文特征,需过单向遍历获取权重;修饰词中的副词是目标词的左上文特征和右上下文特征,需通过双向遍历获取权重。
7.根据权利要求1所述的基于注意力模型和情感词典的文本情感分类方法,其特征在于,步骤4的具体实现包括以下子步骤:
步骤4.1:构建四层注意力模型;
所述四层注意力模型:包括标题、标题加上第一个/最后一个句子加主题、标题加上前3段和最后一段、全文的其余部分;
采取不同的层时,所需的数据量是不同的,层数越大,文本处理粒度越细,数据量越大,因此形成的向量的维度也越大;在选取注意力模型层的时候,确定了计算量,也即计算出了向量维度;
步骤4.2:根据文本的段落结构,将经过维度计算的情感特征向量作为TextCNN分类模型的输入;
步骤4.2:基于统计递归单元SRU,对文本处理进行并行加速计算;
步骤4.3:根据从输出结果中选择概率最大的值所在类别作为目标文本的情感分类结果。
CN201910136963.7A 2019-02-25 2019-02-25 一种基于注意力模型和情感词典的文本情感分类方法 Active CN109858034B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910136963.7A CN109858034B (zh) 2019-02-25 2019-02-25 一种基于注意力模型和情感词典的文本情感分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910136963.7A CN109858034B (zh) 2019-02-25 2019-02-25 一种基于注意力模型和情感词典的文本情感分类方法

Publications (2)

Publication Number Publication Date
CN109858034A true CN109858034A (zh) 2019-06-07
CN109858034B CN109858034B (zh) 2023-02-03

Family

ID=66898785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910136963.7A Active CN109858034B (zh) 2019-02-25 2019-02-25 一种基于注意力模型和情感词典的文本情感分类方法

Country Status (1)

Country Link
CN (1) CN109858034B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321557A (zh) * 2019-06-14 2019-10-11 广州多益网络股份有限公司 一种文本分类方法、装置、电子设备及存储介质
CN110597958A (zh) * 2019-09-12 2019-12-20 苏州思必驰信息科技有限公司 文本分类模型训练和使用方法及装置
CN111027315A (zh) * 2019-11-18 2020-04-17 曲阜师范大学 一种基于Word2Vec模型的WordNet中词语相似度计算方法
CN111611455A (zh) * 2020-05-22 2020-09-01 安徽理工大学 一种微博热点话题下基于用户情感行为特征的用户群体划分方法
CN112613612A (zh) * 2020-12-29 2021-04-06 合肥工业大学 一种基于专利库的绿色设计知识库的构建方法及其装置
CN113033186A (zh) * 2021-05-31 2021-06-25 江苏联著实业股份有限公司 一种基于事件分析的纠错预警方法及系统
CN113220825A (zh) * 2021-03-23 2021-08-06 上海交通大学 面向个人推文的话题情感倾向性预测模型的建模方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101609459A (zh) * 2009-07-21 2009-12-23 北京大学 一种情感特征词提取系统
CN106383815A (zh) * 2016-09-20 2017-02-08 清华大学 结合用户和产品信息的神经网络情感分析方法
US20170169008A1 (en) * 2015-12-15 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method and electronic device for sentiment classification
CN107066583A (zh) * 2017-04-14 2017-08-18 华侨大学 一种基于紧凑双线性融合的图文跨模态情感分类方法
CN107092596A (zh) * 2017-04-24 2017-08-25 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN107220231A (zh) * 2016-03-22 2017-09-29 索尼公司 用于自然语言处理的电子设备和方法以及训练方法
CN108062300A (zh) * 2016-11-08 2018-05-22 中移(苏州)软件技术有限公司 一种基于中文文本进行情感倾向分析的方法及装置
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN108460009A (zh) * 2017-12-14 2018-08-28 中山大学 嵌入情感词典的注意力机制循环神经网络文本情感分析法
CN108763204A (zh) * 2018-05-21 2018-11-06 浙江大学 一种多层次的文本情感特征提取方法和模型
CN108804417A (zh) * 2018-05-21 2018-11-13 山东科技大学 一种基于特定领域情感词的文档级情感分析方法
CN109376251A (zh) * 2018-09-25 2019-02-22 南京大学 一种基于词向量学习模型的微博中文情感词典构建方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101609459A (zh) * 2009-07-21 2009-12-23 北京大学 一种情感特征词提取系统
US20170169008A1 (en) * 2015-12-15 2017-06-15 Le Holdings (Beijing) Co., Ltd. Method and electronic device for sentiment classification
CN107220231A (zh) * 2016-03-22 2017-09-29 索尼公司 用于自然语言处理的电子设备和方法以及训练方法
CN106383815A (zh) * 2016-09-20 2017-02-08 清华大学 结合用户和产品信息的神经网络情感分析方法
CN108062300A (zh) * 2016-11-08 2018-05-22 中移(苏州)软件技术有限公司 一种基于中文文本进行情感倾向分析的方法及装置
CN107066583A (zh) * 2017-04-14 2017-08-18 华侨大学 一种基于紧凑双线性融合的图文跨模态情感分类方法
CN107092596A (zh) * 2017-04-24 2017-08-25 重庆邮电大学 基于attention CNNs和CCR的文本情感分析方法
CN108460009A (zh) * 2017-12-14 2018-08-28 中山大学 嵌入情感词典的注意力机制循环神经网络文本情感分析法
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN108763204A (zh) * 2018-05-21 2018-11-06 浙江大学 一种多层次的文本情感特征提取方法和模型
CN108804417A (zh) * 2018-05-21 2018-11-13 山东科技大学 一种基于特定领域情感词的文档级情感分析方法
CN109376251A (zh) * 2018-09-25 2019-02-22 南京大学 一种基于词向量学习模型的微博中文情感词典构建方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘金硕 等: "一种基于联合深度神经网络的食品安全信息情感分类模型", 《计算机科学》 *
李科: "基于多源特征融合和LSTM神经网络的中文评论情感分析", 《硕士电子期刊》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321557A (zh) * 2019-06-14 2019-10-11 广州多益网络股份有限公司 一种文本分类方法、装置、电子设备及存储介质
CN110597958A (zh) * 2019-09-12 2019-12-20 苏州思必驰信息科技有限公司 文本分类模型训练和使用方法及装置
CN110597958B (zh) * 2019-09-12 2022-03-25 思必驰科技股份有限公司 文本分类模型训练和使用方法及装置
CN111027315A (zh) * 2019-11-18 2020-04-17 曲阜师范大学 一种基于Word2Vec模型的WordNet中词语相似度计算方法
CN111027315B (zh) * 2019-11-18 2023-06-09 曲阜师范大学 一种基于Word2Vec模型的WordNet中词语相似度计算方法
CN111611455A (zh) * 2020-05-22 2020-09-01 安徽理工大学 一种微博热点话题下基于用户情感行为特征的用户群体划分方法
CN112613612A (zh) * 2020-12-29 2021-04-06 合肥工业大学 一种基于专利库的绿色设计知识库的构建方法及其装置
CN112613612B (zh) * 2020-12-29 2022-08-02 合肥工业大学 一种基于专利库的绿色设计知识库的构建方法及其装置
CN113220825A (zh) * 2021-03-23 2021-08-06 上海交通大学 面向个人推文的话题情感倾向性预测模型的建模方法及系统
CN113033186A (zh) * 2021-05-31 2021-06-25 江苏联著实业股份有限公司 一种基于事件分析的纠错预警方法及系统
CN113033186B (zh) * 2021-05-31 2021-08-17 江苏联著实业股份有限公司 一种基于事件分析的纠错预警方法及系统

Also Published As

Publication number Publication date
CN109858034B (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
CN109858034A (zh) 一种基于注意力模型和情感词典的文本情感分类方法
CN109241255B (zh) 一种基于深度学习的意图识别方法
CN108108351B (zh) 一种基于深度学习组合模型的文本情感分类方法
CN103207913B (zh) 商品细粒度语义关系的获取方法和系统
CN109977413A (zh) 一种基于改进cnn-lda的情感分析方法
CN107609121A (zh) 基于LDA和word2vec算法的新闻文本分类方法
CN107391760A (zh) 用户兴趣识别方法、装置及计算机可读存储介质
CN106776713A (zh) 一种基于词向量语义分析的海量短文本聚类方法
CN111125349A (zh) 基于词频和语义的图模型文本摘要生成方法
CN108363790A (zh) 用于对评论进行评估的方法、装置、设备和存储介质
CN107038480A (zh) 一种基于卷积神经网络的文本情感分类方法
CN110362819B (zh) 基于卷积神经网络的文本情感分析方法
KR20200127020A (ko) 의미 텍스트 데이터를 태그와 매칭시키는 방법, 장치 및 명령을 저장하는 컴퓨터 판독 가능한 기억 매체
CN112989802B (zh) 一种弹幕关键词提取方法、装置、设备及介质
CN107818153A (zh) 数据分类方法和装置
WO2012083892A1 (zh) 一种网络不良信息的过滤方法及装置
CN108388554B (zh) 基于协同过滤注意力机制的文本情感识别系统
CN107122349A (zh) 一种基于word2vec‑LDA模型的文本主题词提取方法
CN108090099B (zh) 一种文本处理方法及装置
CN109271634A (zh) 一种基于用户情感倾向感知的微博文本情感极性分析方法
CN106227768B (zh) 一种基于互补语料的短文本观点挖掘方法
CN103020167B (zh) 一种计算机中文文本分类方法
CN111177386B (zh) 一种提案分类方法及系统
CN107818173B (zh) 一种基于向量空间模型的中文虚假评论过滤方法
CN106446147A (zh) 一种基于结构化特征的情感分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant