CN104899298B - 一种基于大规模语料特征学习的微博情感分析方法 - Google Patents
一种基于大规模语料特征学习的微博情感分析方法 Download PDFInfo
- Publication number
- CN104899298B CN104899298B CN201510310710.9A CN201510310710A CN104899298B CN 104899298 B CN104899298 B CN 104899298B CN 201510310710 A CN201510310710 A CN 201510310710A CN 104899298 B CN104899298 B CN 104899298B
- Authority
- CN
- China
- Prior art keywords
- microblogging
- term vector
- word
- vector
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 32
- 230000002996 emotional effect Effects 0.000 title claims abstract description 21
- 239000013598 vector Substances 0.000 claims abstract description 136
- 238000012549 training Methods 0.000 claims abstract description 47
- 230000007935 neutral effect Effects 0.000 claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 27
- 230000008451 emotion Effects 0.000 claims abstract description 22
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 5
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 5
- 230000001537 neural effect Effects 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 210000004218 nerve net Anatomy 0.000 claims description 2
- 238000007689 inspection Methods 0.000 claims 1
- 238000000034 method Methods 0.000 description 8
- 239000000463 material Substances 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于大规模语料特征学习的微博情感分析方法,其特点是利用微博文本训练一个基于Word2Vec的神经网络,将微博文本输入完成训练的神经网络,该神经网络将输入的微博,根据语法上下文、当前上下文中的情感倾向以及它是否被否定,映射到对应的词向量上,得到一个由微博中的词所对应的词向量组成的矩阵,在该矩阵上做词向量间的合成,进一步得到微博对应的特征向量,将特征向量用于情感分类器的训练和预测时,可得到一个较为准确的微博情感分析结果。本发明与现有技术相比具有成本低,分析准确率高,尤其适合大规模语料,训练速度快,结合语法上下文和情感倾向,有效处理否定关系,提高情感分析的准确率。
Description
技术领域
本发明涉及互联网信息搜索技术领域,尤其是一种基于大规模语料特征学习的微博情感分析方法。
背景技术
在信息爆炸的今天,微博作为一款社交工具,对人们生活的影响越来越大。不管你做了什么,看到了什么,听到了什么,你都希望和他人分享,微博提供了这样的一个平台,让用户可以将自己的想法、经历等自由地分享给其他人。微博情感分析是指对微博中的观点进行抽取、分析,例如对于某条包含对某部电影评价的微博,微博情感分析就是要分析出这条微博中对这部电影评价的情感倾向,即判断这个观点是正面的,还是负面的(分类问题)。由于微博平台承载着海量的用户主观想法,对微博进行自动化的情感分析,可以帮助企业、政府等更好地把握用户的偏好,从而对自己的产品或者工作上的改进产生良好的指导作用。
目前,主流的微博情感分析方法有两类,分别是基于特征工程的方法和基于特征学习的方法。基于特征工程的方法是首先人工设计一系列特征,例如微博中所用的词、短语以及它们在情感词典中的情感倾向,或微博中包含的表情数、话题数等等,然后将每一条微博都转化成一个对应的特征向量,包含了上述人工设计的所有特征,最后利用某个已标注好情感倾向的微博集合,通过上述方式转化成特征向量集合后,训练一个情感分类器,再用这个分类器去预测新微博的情感倾向。基于特征工程的方法由于依赖于人工设计特征的好坏,所以需要丰富的领域相关知识以及大量的人力物力投入。与基于特征工程的方法不同的是,基于特征学习的方法是训练一个神经网络,使得它能够输入一条原始微博文本后输出一个它对应的特征向量,该向量可用于情感分类器的训练和预测,此过程中无需任何人工设计特征,节省成本。对于基于特征学习的方法,一个重要的环节是训练词向量,而现有的词向量训练算法都只考虑语法上下文,这对情感分析来说是存在问题的,例如“好”与“坏”这两个语法上下文相似,但是情感倾向完全相反的词被映射到相邻的词向量上,因此训练词向量时还需要考虑词的情感倾向。此外,否定关系处理也是微博情感分析的一个重要环节,因为否定关系直接改变了情感倾向。
现有微博情感分析方法需人工设计特征,工作量大,成本高,网络结构复杂,无法结合语法上、下文和情感倾向,有效处理否定关系,,情感分析准确率低。
发明内容
本发明的目的是针对现有技术的不足而设计的一种基于大规模语料特征学习的微博情感分析方法,采用神经网络将微博中的每一个词,根据它的语法上下文、当前上下文中的情感倾向以及它是否被否定,映射到它对应的词向量上,得到一个由微博所对应的词向量组成的矩阵,在该矩阵上做词向量间的合成,从而得到微博所对应的特征向量,将获得的特征向量用于情感分类器的训练和预测时,对每条新微博就可得到一个较为准确的情感分析结果无需人工设计特征,节省成本,尤其适合大规模语料,训练速度快,结合语法上下文和情感倾向,有效处理否定关系,情感分析准确率高。
本发明的目的是这样实现的:一种基于大规模语料特征学习的微博情感分析方法,包括基于Word2Vec的神经网络和基于监督学习的分类器,其特点是利用微博文本训练一个基于Word2Vec的神经网络,将微博文本输入完成训练的神经网络,该神经网络将输入的微博,根据语法上下文、当前上下文中的情感倾向以及它是否被否定映射到对应的词向量上,从而得到一个与微博文本所对应的微博词向量矩阵,在微博词向量矩阵上做词向量间的合成,得到与微博文本所对应的微博特征向量,将微博特征向量对基于监督学习的分类器进行训练后得到情感分类器,使用情感分类器对微博文本进行情感分析,可较为准确的预测微博情感倾向;所述神经网络为输入层、并行词向量层和输出层组成的三层网络结构,所述并行词向量层由肯定上下文的词向量矩阵和否定上下文的词向量矩阵组成;所述输入层将输入词以未被否定和被否定词分别输入并行词向量层中所对应的词向量矩阵;所述输出层将两词向量矩阵转换成未被否定和被否定的情感倾向输出两个特征向量。
所述神经网络的训练按下述步骤进行:
第一步:设定词向量的维度并以微博的输入词为中心的窗口大小;
第二步:随机初始化,将并行词向量层中的两个词向量矩阵,使它们保持一致;Hierarchical softmax层的参数,该层用于预测以输入词为中心的窗口内的一个词;Fullsoftmax层的参数,该层用于预测输入词的情感倾向;
第三步:输入微博并进行分词,分词后去掉其中的@用户和URL,然后进行否定关系检测,标记出哪些词被否定,最后利用现有的情感词典、表情符号和带有情感倾向的话题线索,对每一个词在该微博上下文中的情感倾向进行自动化标注;
第四步:对微博中的每一个词,根据它是否被否定,使用相应的词向量层将它映射到它对应的词向量,使用随机梯度下降算法更新该词向量、Hierarchical softmax层的参数和Full softmax层的参数,使得给定该词向量,能准确地预测中心窗口内每一个词及其情感倾向;
第五步:重复第三~第四步骤,对大规模语料中的所有微博都进行神经网络训练。
所述完成训练的神经网络按下述步骤得到微博特征向量:
第一步:输入微博,对该微博进行分词并去掉@用户和URL,然后进行否定检测,标记出哪些词被否定;
第二步:对微博中的每一个词,根据它是否被否定,使用相应的词向量层将它映射到对应的词向量,并存入微博词向量矩阵中的一列;
第三步:对微博词向量矩阵的每一行,分别取最大值、最小值和平均值得到三个向量;
第四步:将上述三个向量首尾相接成一个微博特征向量输出。
第五步:对大规模语料中的每一条微博重复第一~第四步骤,得到与之对应的微博特征向量。
所述基于监督学习的分类器的训练按下述步骤进行:
第一步:输入神经网络训练中已标注情感倾向的微博以及使用该神经网络得到的该微博特征向量;
第二步:重复第一步骤,对神经网络训练集中的每一条已标注好情感倾向的微博和该微博特征向量都进行输入,得到微博特征向量集合及其与之对应的情感倾向集合;
第三步:将上述特征向量集合和情感倾向集合对基于监督学习的分类器进行训练后得到情感分类器。
所述情感分类器使用微博特征向量对输入的微博文本进行情感分析,输出微博情感倾向的预测结果。
本发明与现有技术相比具有以下优点:
、无需人工设计特征,节省成本:输入一条微博,通过完成训练的神经网络就可得到该微博对应的特征向量,该特征向量的每一维都是自动计算出来的,并非人工设计,因此节省了人工设计特征的各种成本。
、适合大规模语料,训练速度快:神经网络训练时只有三层结构,并使用了随机梯度下降、Hierical softmax等算法来加快词向量的训练,从而使得即使在单机环境下也可在短时间内完成大规模语料(百万条微博以上)的训练。
、结合语法上下文和情感倾向,有效处理否定关系,情感分析准确率高:神经网络训练的过程中更新词向量时要尽可能准确地预测语法上下文和情感倾向,解决了现有技术的词向量训练算法把语法上下文相似但情感倾向相反的词映射到相邻的词向量的问题,进一步提高了情感分析的准确率。此外,根据输入词是否被否定,使用相应的词向量层将它映射到它对应的词向量,并在训练时更新,从而得到输入词在肯定环境和否定环境下的两套词向量,从特征向量中体现否定关系改变情感倾向的程度,使得情感分析的准确率再度提升。
附图说明
图1为本发明流程图;
图2为神经网络结构示意图;
图3为神经网络训练流程图;
图4为使用完成训练的神经网络得到微博特征向量的流程图;
图5为分类器训练流程图;
图6为使用情感分类器预测微博的情感倾向流程图。
具体实施方式
参阅附图1,本发明包括基于Word2Vec的神经网络和基于监督学习的分类器,利用微博文本训练一个基于Word2Vec的神经网络,将微博文本输入完成训练的神经网络,该神经网络将输入的微博,根据语法上下文、当前上下文中的情感倾向以及它是否被否定,映射到对应的词向量上,从而得到一个与微博文本所对应的微博词向量矩阵,在微博词向量矩阵上做词向量间的合成,得到与微博文本所对应的微博特征向量,将微博特征向量对基于监督学习的分类器进行训练后得到情感分类器,使用情感分类器对微博文本进行情感分析,可较为准确预测微博情感倾向。
参阅附图2,所述神经网络为输入层、并行词向量层和输出层组成的三层网络结构,所述并行词向量层由肯定上下文的词向量矩阵和否定上下文的词向量矩阵组成;所述输入层将输入词以未被否定和被否定词分别输入并行词向量层中所对应的词向量矩阵;所述输出层将两词向量矩阵转换成未被否定和被否定的情感倾向输出两个特征向量。
参阅附图3,所述神经网络的训练按下述步骤进行:
第一步:设定词向量的维度并以微博的输入词为中心的窗口大小;
第二步:随机初始化,将并行词向量层中的两个词向量矩阵,使它们保持一致;Hierarchical softmax层的参数,该层用于预测以输入词为中心的窗口内的一个词;Fullsoftmax层的参数,该层用于预测输入词的情感倾向;
第三步:输入微博并进行分词,分词后去掉其中的@用户和URL,然后进行否定关系检测,标记出哪些词被否定,最后利用现有的情感词典、表情符号和带有情感倾向的话题线索,对每一个词在该微博上下文中的情感倾向进行自动化标注;
第四步:对微博中的每一个词,根据它是否被否定,使用相应的词向量层将它映射到它对应的词向量,使用随机梯度下降算法更新该词向量、Hierarchical softmax层的参数和Full softmax层的参数,使得给定该词向量,能准确地预测中心窗口内每一个词及其情感倾向;
第五步:重复第三~第四步骤,对大规模语料中的所有微博都进行神经网络训练。
参阅附图4,所述完成训练的神经网络按下述步骤得到微博特征向量:
第一步:输入微博,对该微博进行分词并去掉@用户和URL,然后进行否定检测,标记出哪些词被否定;
第二步:对微博中的每一个词,根据它是否被否定,使用相应的词向量层将它映射到对应的词向量,并存入微博词向量矩阵中的一列;
第三步:对微博词向量矩阵的每一行,分别取最大值、最小值和平均值得到三个向量;
第四步:将上述三个向量首尾相接成一个微博特征向量输出。
第五步:对大规模语料中的每一条微博重复第一~第四步骤,得到与之对应的微博特征向量。
参阅附图5,所述基于监督学习的分类器的训练按下述步骤进行:
第一步:输入神经网络训练中已标注情感倾向的微博以及使用该神经网络得到的该微博特征向量;
第二步:重复第一步骤,对神经网络训练集中的每一条已标注好情感倾向的微博和该微博特征向量都进行输入,得到微博特征向量集合及其与之对应的情感倾向集合;
第三步:将上述特征向量集合和情感倾向集合对基于监督学习的分类器进行训练后得到情感分类器。
参阅附图6,所述情感分类器使用微博特征向量对输入的微博文本进行情感分析,输出微博情感倾向的预测结果,其步骤如下:
第一步:输入微博;
第二步:使用完成训练的神经网络得到该微博的特征向量;
第三步:对该微博的特征向量,使用情感分类器预测该微博的情感倾向。
对上述微博情感倾向的预测结果可采用人工标注好情感倾向的微博语料(几百到上千条微博即可)进行准确率评估。本发明适合在大规模微博语料上快速地训练一个神经网络,使得它能够输入一条原始微博文本后输出一个它对应的特征向量,该特征向量不仅编码了语法上下文和情感倾向这两种信息,同时还考虑了否定关系的处理,它的获取无需任何人工设计,节省成本,这样获得的特征向量用于情感分类器的训练与预测时,可在预测微博时获得较高的准确率。
以上只是对本发明作进一步的说明,并非用以限制本专利,凡为本发明等效实施,均应包含于本专利的权利要求范围之内。
Claims (4)
1.一种基于大规模语料特征学习的微博情感分析方法,包括基于Word2Vec的神经网络和基于监督学习的分类器,其特征在于利用微博文本训练一个基于Word2Vec的神经网络,将微博文本输入完成训练的神经网络,该神经网络将输入的微博,根据语法上下文、当前上下文中的情感倾向以及它是否被否定映射到对应的词向量上,从而得到一个与微博文本所对应的微博词向量矩阵,在微博词向量矩阵上做词向量间的合成,得到与微博文本所对应的微博特征向量,将微博特征向量对基于监督学习的分类器进行训练后得到情感分类器,使用情感分类器对微博文本进行情感分析,可较为准确的预测微博情感倾向;所述神经网络为输入层、并行词向量层和输出层组成的三层网络结构,所述并行词向量层由肯定上下文的词向量矩阵和否定上下文的词向量矩阵组成;所述输入层将输入词以未被否定和被否定词分别输入并行词向量层中所对应的词向量矩阵;所述输出层将两词向量矩阵转换成未被否定和被否定的情感倾向输出两个特征向量;所述神经网络的训练按下述步骤进行:
第一步:设定词向量的维度并以微博的输入词为中心的窗口大小;
第二步:随机初始化,将并行词向量层中的两个词向量矩阵,使它们保持一致;Hierarchical softmax层的参数,该层用于预测以输入词为中心的窗口内的一个词;Fullsoftmax层的参数,该层用于预测输入词的情感倾向;
第三步:输入微博并进行分词,分词后去掉其中的@用户和URL,然后进行否定关系检测,标记出哪些词被否定,最后利用现有的情感词典、表情符号和带有情感倾向的话题线索,对每一个词在该微博上下文中的情感倾向进行自动化标注;
第四步:对微博中的每一个词,根据它是否被否定,使用相应的词向量层将它映射到它对应的词向量,使用随机梯度下降算法更新该词向量、Hierarchical softmax层的参数和Full softmax层的参数,使得给定该词向量,能准确地预测中心窗口内每一个词及其情感倾向;
第五步:重复第三~第四步骤,对大规模语料中的所有微博都进行神经网络训练。
2.根据权利要求1所述基于大规模语料特征学习的微博情感分析方法,其特征在于所述完成训练的神经网络按下述步骤得到微博特征向量:
第一步:输入微博,对该微博进行分词并去掉@用户和URL,然后进行否定检测,标记出哪些词被否定;
第二步:对微博中的每一个词,根据它是否被否定,使用相应的词向量层将它映射到对应的词向量,并存入微博词向量矩阵中的一列;
第三步:对微博词向量矩阵的每一行,分别取最大值、最小值和平均值得到三个向量;
第四步:将上述三个向量首尾相接成一个微博特征向量输出;
第五步:对大规模语料中的每一条微博重复第一~第四步骤,得到与之对应的微博特征向量。
3.根据权利要求1所述基于大规模语料特征学习的微博情感分析方法,其特征在于所述基于监督学习的分类器的训练按下述步骤进行:
第一步:输入神经网络训练中已标注情感倾向的微博以及使用该神经网络得到的该微博特征向量;
第二步:重复第一步骤,对神经网络训练集中的每一条已标注好情感倾向的微博和该微博特征向量都进行输入,得到微博特征向量集合及其与之对应的情感倾向集合;
第三步:将上述特征向量集合和情感倾向集合对基于监督学习的分类器进行训练后得到情感分类器。
4.根据权利要求1所述基于大规模语料特征学习的微博情感分析方法,其特征在于所述情感分类器使用微博特征向量对输入的微博文本进行情感分析,输出微博情感倾向的预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510310710.9A CN104899298B (zh) | 2015-06-09 | 2015-06-09 | 一种基于大规模语料特征学习的微博情感分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510310710.9A CN104899298B (zh) | 2015-06-09 | 2015-06-09 | 一种基于大规模语料特征学习的微博情感分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104899298A CN104899298A (zh) | 2015-09-09 |
CN104899298B true CN104899298B (zh) | 2018-01-16 |
Family
ID=54031960
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510310710.9A Active CN104899298B (zh) | 2015-06-09 | 2015-06-09 | 一种基于大规模语料特征学习的微博情感分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104899298B (zh) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105427869A (zh) * | 2015-11-02 | 2016-03-23 | 北京大学 | 一种基于深度学习的会话情感自动分析方法 |
CN106815592B (zh) * | 2015-11-27 | 2019-12-03 | 北京国双科技有限公司 | 文本数据处理方法及装置和错别字识别方法及装置 |
CN105512687A (zh) * | 2015-12-15 | 2016-04-20 | 北京锐安科技有限公司 | 训练情感分类模型和文本情感极性分析的方法及系统 |
CN105809186A (zh) * | 2016-02-25 | 2016-07-27 | 中国科学院声学研究所 | 情感分类的方法及系统 |
CN106569996B (zh) * | 2016-03-30 | 2019-06-21 | 广东工业大学 | 一种面向中文微博的情感倾向分析方法 |
CN105975497A (zh) * | 2016-04-27 | 2016-09-28 | 清华大学 | 微博话题自动推荐方法及装置 |
CN106055673B (zh) * | 2016-06-06 | 2019-09-13 | 中国人民解放军国防科学技术大学 | 一种基于文本特征嵌入的中文短文本情感分类方法 |
CN106095966B (zh) * | 2016-06-15 | 2019-12-27 | 成都品果科技有限公司 | 一种用户可扩展的标签标注方法及系统 |
CN106202032B (zh) * | 2016-06-24 | 2018-08-28 | 广州数说故事信息科技有限公司 | 一种面向微博短文本的情感分析方法及其系统 |
CN106326210B (zh) * | 2016-08-17 | 2019-09-10 | 深圳大学 | 一种文本话题和情感的联合检测方法及装置 |
CN106528530A (zh) * | 2016-10-24 | 2017-03-22 | 北京光年无限科技有限公司 | 一种确定句子类型的方法及装置 |
CN106599933A (zh) * | 2016-12-26 | 2017-04-26 | 哈尔滨工业大学 | 一种基于联合深度学习模型的文本情感分类方法 |
CN106874410A (zh) * | 2017-01-22 | 2017-06-20 | 清华大学 | 基于卷积神经网络的中文微博文本情绪分类方法及其系统 |
CN107066445B (zh) * | 2017-04-11 | 2018-04-24 | 华东师范大学 | 一种属性情感词向量的深度学习方法 |
CN108733675B (zh) * | 2017-04-14 | 2021-04-09 | 北大方正集团有限公司 | 基于大量样本数据的情感评价方法及装置 |
CN107273348B (zh) * | 2017-05-02 | 2020-12-18 | 深圳大学 | 一种文本的话题和情感联合检测方法及装置 |
CN107169086B (zh) * | 2017-05-12 | 2020-10-27 | 北京化工大学 | 一种文本分类方法 |
CN107578092A (zh) * | 2017-09-01 | 2018-01-12 | 广州智慧城市发展研究院 | 一种基于情绪和意见挖掘的情感复合分析方法及系统 |
CN108304468B (zh) * | 2017-12-27 | 2021-12-07 | 中国银联股份有限公司 | 一种文本分类方法以及文本分类装置 |
CN110119443B (zh) * | 2018-01-18 | 2021-06-08 | 中国科学院声学研究所 | 一种面向推荐服务的情感分析方法 |
CN108519976A (zh) * | 2018-04-04 | 2018-09-11 | 郑州大学 | 基于神经网络生成大规模情感词典的方法 |
CN108959479B (zh) * | 2018-06-21 | 2022-03-25 | 成都睿码科技有限责任公司 | 一种基于文本相似度的事件情感分类方法 |
CN109213860A (zh) * | 2018-07-26 | 2019-01-15 | 中国科学院自动化研究所 | 融合用户信息的文本情感分类方法及装置 |
CN110502757B (zh) * | 2019-08-29 | 2023-01-10 | 西安邮电大学 | 一种自然语言情感分析方法 |
CN110866390B (zh) * | 2019-10-15 | 2022-02-11 | 平安科技(深圳)有限公司 | 中文语法错误的识别方法、装置、计算机设备和存储介质 |
CN111046136A (zh) * | 2019-11-13 | 2020-04-21 | 天津大学 | 融合表情符号与短文本的多维情感强度值计算方法 |
CN111046137A (zh) * | 2019-11-13 | 2020-04-21 | 天津大学 | 一种多维情感倾向性分析方法 |
CN111221962B (zh) * | 2019-11-18 | 2023-05-26 | 重庆邮电大学 | 一种基于新词扩展与复杂句式扩展的文本情感分析方法 |
CN113705692B (zh) * | 2021-08-30 | 2023-11-21 | 平安科技(深圳)有限公司 | 基于人工智能的情感分类方法、装置、电子设备及介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103699626A (zh) * | 2013-12-20 | 2014-04-02 | 华南理工大学 | 一种微博用户个性化情感倾向分析方法及系统 |
CN104090864A (zh) * | 2014-06-09 | 2014-10-08 | 合肥工业大学 | 一种情感词典建立与情感计算方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080249764A1 (en) * | 2007-03-01 | 2008-10-09 | Microsoft Corporation | Smart Sentiment Classifier for Product Reviews |
-
2015
- 2015-06-09 CN CN201510310710.9A patent/CN104899298B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103699626A (zh) * | 2013-12-20 | 2014-04-02 | 华南理工大学 | 一种微博用户个性化情感倾向分析方法及系统 |
CN104090864A (zh) * | 2014-06-09 | 2014-10-08 | 合肥工业大学 | 一种情感词典建立与情感计算方法 |
Non-Patent Citations (1)
Title |
---|
SG++:Word Representation with Sentiment and Negation for Twitter Sentiment Classification;Qinmin Hu 等;《Proceedings of the 39th International ACM SIGIR conference on Research and Development in Information Retrieval》;20160721;997-1000 * |
Also Published As
Publication number | Publication date |
---|---|
CN104899298A (zh) | 2015-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104899298B (zh) | 一种基于大规模语料特征学习的微博情感分析方法 | |
CN105760835B (zh) | 一种基于深度学习的步态分割与步态识别一体化方法 | |
CN107092596A (zh) | 基于attention CNNs和CCR的文本情感分析方法 | |
CN107273490A (zh) | 一种基于知识图谱的组合错题推荐方法 | |
CN107563431A (zh) | 一种结合cnn迁移学习和svdd的图像异常检测方法 | |
CN106570597A (zh) | 一种sdn架构下基于深度学习的内容流行度预测方法 | |
CN106980858A (zh) | 一种语言文本检测与定位系统及应用该系统的语言文本检测与定位方法 | |
CN107168945A (zh) | 一种融合多特征的双向循环神经网络细粒度意见挖掘方法 | |
CN106951568A (zh) | 基于数据挖掘的学生贫困状态预测方法 | |
Hsu et al. | When human-computer interaction meets community citizen science | |
CN106203318A (zh) | 基于多层次深度特征融合的摄像机网络行人识别方法 | |
CN104216954A (zh) | 突发事件话题状态的预测装置及预测方法 | |
CN105069072A (zh) | 基于情感分析的混合用户评分信息推荐方法及其推荐装置 | |
CN108052505A (zh) | 文本情感分析方法及装置、存储介质、终端 | |
CN107169043A (zh) | 一种基于标准答案的知识点自动提取方法及系统 | |
Delgado | Social conflict analysis on a mining project using shannon entropy | |
JP2022028719A (ja) | 学習材推薦方法、学習材推薦装置および学習材推薦プログラム | |
CN106503123A (zh) | 一种基于计算机云数据的深度学习智能应答系统 | |
CN107481218A (zh) | 图像美感评估方法及装置 | |
CN105608075A (zh) | 一种相关知识点的获取方法及系统 | |
KR20190066849A (ko) | 빅데이터와 머신러닝 기반의 학생 맞춤형 인공지능 stem 교육 플랫폼 | |
CN107392392A (zh) | 基于深度学习的微博转发预测方法 | |
CN104598648A (zh) | 一种微博用户交互式性别识别方法及装置 | |
CN106886657A (zh) | 一种基于kriging函数的有限元模型建立方法 | |
CN103473356B (zh) | 一种篇章级情感分类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |