CN107038480A - 一种基于卷积神经网络的文本情感分类方法 - Google Patents
一种基于卷积神经网络的文本情感分类方法 Download PDFInfo
- Publication number
- CN107038480A CN107038480A CN201710332453.8A CN201710332453A CN107038480A CN 107038480 A CN107038480 A CN 107038480A CN 201710332453 A CN201710332453 A CN 201710332453A CN 107038480 A CN107038480 A CN 107038480A
- Authority
- CN
- China
- Prior art keywords
- text
- sentence
- vector
- neural networks
- convolutional neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
Abstract
本发明涉及一种基于卷积神经网络的文本情感分类方法,包括以下步骤:搜集文本语料集,将文本里的数据表示成一个句子;对搜集的文本语料集进行预处理,并将情感文本语料分为训练集语料和测试集语料;对预处理后的文本预料集用word2vec工具训练出词向量模型并得到文本向量;将训练集语料的文本向量输入卷积神经网络训练出情感分类模型;将测试集语料的文本向量输入卷积神经网络,并用已经训练好的情感分类模型进行情感类别分类并计算出情感分类的准确率。本发明克服了以往分类时需要大量的人工标注的问题。
Description
技术领域
本发明涉及文本分类技术领域,特别是涉及一种基于卷积神经网络的文本情感分类方法。
背景技术
21世纪的时代是信息的时代,随着计算机技术、数据存贮技术日新月异的发展和改进,应用领域也得到了快速扩展,世界也随着信息的大量涌入而发生着天翻地覆的变化,文本数据资源也在不断的高速增长。对于许多用户和企业来说面对如此大量的文本信息,从中获取有意义的、相关性强、具有针对性的信息变得异常艰难。所以对文本信息进行分类是一个很有价值的问题。
情感倾向分析是自然语言处理中一个重要的分支,特别是在以提取文本的情感内容为目标的分类方法中,情感分类已经有很多有用的实践,比如企业利用消费者对产品反馈的信息进行分析,或者根据评论中的好评或差评信息对自己的产品进行改进。
目前已有研究所采用的方法大多数采用支持向量机、最大熵以及随机游走等浅层学习方法,而这些方法无法捕获到很多有关情感倾向性分析的语言现象特征,还需要大量的人工标注与训练。
发明内容
本发明所要解决的技术问题是提供一种基于卷积神经网络的文本情感分类方法,克服大量的人工标注和训练。
本发明解决其技术问题所采用的技术方案是:提供一种基于卷积神经网络的文本情感分类方法,包括以下步骤:
(1)搜集文本语料集,将文本里的数据表示成一个句子;
(2)对搜集的文本语料集进行预处理,并将情感文本语料分为训练集语料和测试集语料;
(3)对预处理后的文本预料集用word2vec工具训练出词向量模型并得到文本向量;
(4)将训练集语料的文本向量输入卷积神经网络训练出情感分类模型;
(5)将测试集语料的文本向量输入卷积神经网络,并用已经训练好的情感分类模型进行情感类别分类并计算出情感分类的准确率。
所述步骤(2)中预处理的方式为去除文本语料集中的无关信息,随机选取文本语料集的80%作为训练集语料,20%作为测试集语料。
所述无关信息包括标点符号、多余空格、重复无用的单字和特殊字符。
所述步骤(3)中用word2vec工具训练时,出现次数超过五次的字会被加入字典中,对于没有出现在字典中的字符的词向量会被随机初始化。
所述步骤(4)中包括以下子步骤:
(41)词向量的串接:在包含N个以字为基本单位{r1,r2,…,rN}的句子x中,卷积层对每个大小为k的连续窗口进行矩阵向量操作,假定向量Zn∈Rdk是以句子中第n个基本单位为中心的前后各(k-1)/2个基本单位的词向量的串接,其中d为句子中基本单位向量化表示后向量的长度,则向量Zn=(rn-(k-1)/2…rn+(k-1)/2)T;
(42)句子的特征向量表示:卷积层计算句子特征向量rsent∈R的第i个元素的过程如下:其中,W∈Rdk是卷积层的权重矩阵,b为偏移量,max[]为取最大值函数;
(43)计算情感标签得分:表示句子x的全局特征的向量被传递给包含两个全连接层的神经网络处理,计算句子属于每个情感标签τ∈T的得分其中,矩阵矩阵向量向量b3∈R|T|是模型需要学习的参数,激活函数h()使用正切函数,隐藏层单元数目hlu为用户指定的超参数,dlu为卷积单元和句子级的特征向量大小相关,T为情感标签即表示积极或消极;
(44)得到情感标签:给定一个句子x,参数集合为θ的模型对每个情感标签τ∈T计算一个得分Sθ(x)τ,为了将这些得分转换为给定句子的情感标签和模型参数集θ的条件概率分布,将所有情感标签τ∈T的得分进行Softmax操作:其中,P()为条件概率,对上式取对数得到使用随机梯度下降算法最小化负似然函数其中,x表示训练语料集D的一条句子,y表示该句子的情感标签包括积极和消极两种。
所述步骤(42)中用权重矩阵计算给定句子中每个基本单位字的窗口大小为k的局部信息,对句子中所有基本单位的窗口取最大值,就抽取了一个在窗口大小为k的条件下长度为clu的句子特征向量,卷积窗口的大小不同,获取的局部信息也不同;利用并行的多个卷积层,学习不同N—gram的信息;每个卷积层经过最大值化都会生成一个固定长度的句子特征向量,将所有卷积层生成的句子特征向量进行串接,得到一个新的句子特征向量。
所述步骤(43)中在卷积层之后,加入了线性整流器ReLU层,将线性整流器ReLU作为激活函数,通过加入线性整流器ReLU层加速随机梯度下降的收敛速度。
有益效果
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明运用深度学习的方法采用一个包含多个并行卷积层的卷积神经网络,不同卷积层拥有大小不同的卷积核,可以获取多个不同的特征,卷积神经网络具有自动进行特征提取的功能,它可以从多个角度提取图像的不同特征,从而解决了如何有效地进行特征提取的问题。本发明利用字级别的词向量作为原始特征可以学习到更加具体的特征,采用无监督学习的方式提高了模型的准确率。本发明的方法实现方便,成本较低,适于大范围推广使用。
附图说明
图1是本发明的流程图;
图2是本发明中利用多个不同大小的卷积核抽取句子级别特征示意图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的实施方式涉及一种基于卷积神经网络的文本情感分类方法,包括以下步骤:
(1)搜集网络上的文本语料集,将文本里的数据表示成一个句子;
(2)对搜集的文本语料集进行预处理,并将情感文本语料分为训练集语料和测试集语料。预处理的方式为去除文本语料集中的无关信息,随机选取文本语料集的80%作为训练集语料,20%作为测试集语料。其中,无关信息包括标点符号、多余空格、重复无用的单字和特殊字符。
(3)对预处理后的文本预料集用word2vec工具训练出词向量模型并得到文本向量,用word2vec工具训练时,出现次数超过五次的字会被加入字典中,对于没有出现在字典中的字符的词向量会被随机初始化。
(4)将训练集语料的文本向量输入卷积神经网络训练出情感分类模型。该步骤具体为:
(41)词向量的串接:在包含N个以字为基本单位{r1,r2,...,rN}的句子x中,卷积层对每个大小为k的连续窗口进行矩阵向量操作,假定向量Zn∈Rdk是以句子中第n个基本单位为中心的前后各(k-1)/2个基本单位的词向量的串接,其中d为句子中基本单位向量化表示后向量的长度,则向量Zn=(rn-(k-1)/2…rn+(k-1)/2)T;
(42)句子的特征向量表示:卷积层计算句子特征向量rsent∈R的第i个元素的过程如下:其中,W∈Rdk是卷积层的权重矩阵,b为偏移量,max[]为取最大值函数;
(43)计算情感标签得分:表示句子x的全局特征的向量被传递给包含两个全连接层的神经网络处理,计算句子属于每个情感标签τ∈T的得分其中,矩阵矩阵向量向量b3∈R|T|是模型需要学习的参数,激活函数h()使用正切函数,隐藏层单元数目hlu为用户指定的超参数,dlu为卷积单元和句子级的特征向量大小相关,T为情感标签即表示积极或消极;其中,激活函数可以选用线性整流器ReLU,通过加入线性整流器ReLU层加速随机梯度下降的收敛速度。
(44)得到情感标签:给定一个句子x,参数集合为θ的模型对每个情感标签τ∈T计算一个得分Sθ(x)τ,为了将这些得分转换为给定句子的情感标签和模型参数集θ的条件概率分布,将所有情感标签τ∈T的得分进行Softmax操作:其中,P()为条件概率,对上式取对数得到使用随机梯度下降算法最小化负似然函数其中,x表示训练语料集D的一条句子,y表示该句子的情感标签包括积极和消极两种。
结合图2,本实施方式中,用该权重矩阵计算给定句子中每个基本单位字的窗口的局部信息,对句子中所有基本单位的窗口取最大值,就抽取了一个在窗口大小为k的条件下的句子特征向量,卷积窗口的大小不同,获取的局部信息也不同。因此,利用并行的多个卷积层,学习不同的信息。每个卷积层经过最大池化操作后都会生成一个固定长度的句子特征向量,将所有卷积层生成的句子特征向量进行串接,得到一个新的句子特征向量。
本发明采用预先建立的卷积神经网络分类模型,对所采集的文本集进行处理,以得出文本的情感倾向;文本情感倾向包括积极和消极两个类别,卷积神经网络分类模型为对积极和消极两个类别进行卷积神经网络模型分类。
卷积神经网络算法步骤如下:
步骤1、设定卷积神经网络的初始参数,包括非线性的固定卷积层层数、各卷积层滤波器的个数及其初始值、各池化层的窗口大小、全连接层层数及每层神经元个数,构建基本的卷积神经网络模型;
步骤2、设定模型中的训练最小目标误差、学习速率、训练步数和最小批量数据个数;
步骤3、将数据导入输入层,递归得到网络的输出;
步骤4、计算输出误差,并修改权值和参数大小。
步骤5、重复步骤1~步骤4,直至误差在设定范围内或超出训练次数限制。
卷积神经网络模型可以有效地利用反向传播的性质修改权值,从而防止产生过拟合。本发明采用的卷积神经网络可以从少量的样本集中抓取到数据的本质特征,也可以从大量未标注的文本中学习到先验知识,避免依赖于具体任务的人工特征设计,可以在一定程度上解决文本上下文信息有限的问题。
(5)将测试集语料的文本向量输入卷积神经网络,并用已经训练好的情感分类模型进行情感类别分类并计算出情感分类的准确率。
Claims (7)
1.一种基于卷积神经网络的文本情感分类方法,其特征在于,包括以下步骤:
(1)搜集文本语料集,将文本里的数据表示成一个句子;
(2)对搜集的文本语料集进行预处理,并将情感文本语料分为训练集语料和测试集语料;
(3)对预处理后的文本预料集用word2vec工具训练出词向量模型并得到文本向量;
(4)将训练集语料的文本向量输入卷积神经网络训练出情感分类模型;
(5)将测试集语料的文本向量输入卷积神经网络,并用已经训练好的情感分类模型进行情感类别分类并计算出情感分类的准确率。
2.根据权利要求1所述的基于卷积神经网络的文本情感分类方法,其特征在于,所述步骤(2)中预处理的方式为去除文本语料集中的无关信息,随机选取文本语料集的80%作为训练集语料,20%作为测试集语料。
3.根据权利要求2所述的基于卷积神经网络的文本情感分类方法,其特征在于,所述无关信息包括标点符号、多余空格、重复无用的单字和特殊字符。
4.根据权利要求1所述的基于卷积神经网络的文本情感分类方法,其特征在于,所述步骤(3)中用word2vec工具训练时,出现次数超过五次的字会被加入字典中,对于没有出现在字典中的字符的词向量会被随机初始化。
5.根据权利要求1所述的基于卷积神经网络的文本情感分类方法,其特征在于,所述步骤(4)中包括以下子步骤:
(41)词向量的串接:在包含N个以字为基本单位{r1,r2,...,rN}的句子x中,卷积层对每个大小为k的连续窗口进行矩阵向量操作,假定向量Zn∈Rdk是以句子中第n个基本单位为中心的前后各(k-1)/2个基本单位的词向量的串接,其中d为句子中基本单位向量化表示后向量的长度,则向量Zn=(rn-(k-1)/2…rn+(k-1)/2)T;
(42)句子的特征向量表示:卷积层计算句子特征向量rsent∈R的第i个元素的过程如下:其中,W∈Rdk是卷积层的权重矩阵,b为偏移量,max[]为取最大值函数;
(43)计算情感标签得分:表示句子x的全局特征的向量被传递给包含两个全连接层的神经网络处理,计算句子属于每个情感标签τ∈T的得分其中,矩阵矩阵向量向量b3∈R|T|是模型需要学习的参数,激活函数h()使用正切函数,隐藏层单元数目hlu为用户指定的超参数,dlu为卷积单元和句子级的特征向量大小相关,T为情感标签即表示积极或消极;
(44)得到情感标签:给定一个句子x,参数集合为θ的模型对每个情感标签τ∈T计算一个得分Sθ(x)τ,为了将这些得分转换为给定句子的情感标签和模型参数集θ的条件概率分布,将所有情感标签τ∈T的得分进行Softmax操作:其中,P()为条件概率,对上式取对数得到使用随机梯度下降算法最小化负似然函数其中,x表示训练语料集D的一条句子,y表示该句子的情感标签包括积极和消极两种。
6.根据权利要求5所述的基于卷积神经网络的文本情感分类方法,其特征在于,所述步骤(42)中用权重矩阵计算给定句子中每个基本单位字的窗口大小为k的局部信息,对句子中所有基本单位的窗口取最大值,就抽取了一个在窗口大小为k的条件下长度为clu的句子特征向量,卷积窗口的大小不同,获取的局部信息也不同;利用并行的多个卷积层,学习不同N—gram的信息;每个卷积层经过最大值化都会生成一个固定长度的句子特征向量,将所有卷积层生成的句子特征向量进行串接,得到一个新的句子特征向量。
7.根据权利要求5所述的基于卷积神经网络的文本情感分类方法,其特征在于,所述步骤(43)中在卷积层之后,加入了线性整流器ReLU层,将线性整流器ReLU作为激活函数,通过加入线性整流器ReLU层加速随机梯度下降的收敛速度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710332453.8A CN107038480A (zh) | 2017-05-12 | 2017-05-12 | 一种基于卷积神经网络的文本情感分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710332453.8A CN107038480A (zh) | 2017-05-12 | 2017-05-12 | 一种基于卷积神经网络的文本情感分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107038480A true CN107038480A (zh) | 2017-08-11 |
Family
ID=59538144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710332453.8A Pending CN107038480A (zh) | 2017-05-12 | 2017-05-12 | 一种基于卷积神经网络的文本情感分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107038480A (zh) |
Cited By (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107515855A (zh) * | 2017-08-18 | 2017-12-26 | 武汉红茶数据技术有限公司 | 一种结合表情符的微博情感分析方法和系统 |
CN107578092A (zh) * | 2017-09-01 | 2018-01-12 | 广州智慧城市发展研究院 | 一种基于情绪和意见挖掘的情感复合分析方法及系统 |
CN107656990A (zh) * | 2017-09-14 | 2018-02-02 | 中山大学 | 一种基于字和词两个层面特征信息的文本分类方法 |
CN107665254A (zh) * | 2017-09-30 | 2018-02-06 | 济南浪潮高新科技投资发展有限公司 | 一种基于深度学习的菜谱推荐方法 |
CN107704455A (zh) * | 2017-10-30 | 2018-02-16 | 成都市映潮科技股份有限公司 | 一种信息处理方法及电子设备 |
CN107704558A (zh) * | 2017-09-28 | 2018-02-16 | 北京车慧互动广告有限公司 | 一种用户意见抽取方法及系统 |
CN107730002A (zh) * | 2017-10-13 | 2018-02-23 | 国网湖南省电力公司 | 一种通信网关机遥控参数智能模糊比对方法 |
CN108009148A (zh) * | 2017-11-16 | 2018-05-08 | 天津大学 | 基于深度学习的文本情感分类表示方法 |
CN108073677A (zh) * | 2017-11-02 | 2018-05-25 | 中国科学院信息工程研究所 | 一种基于人工智能的多级文本多标签分类方法及系统 |
CN108399230A (zh) * | 2018-02-13 | 2018-08-14 | 上海大学 | 一种基于卷积神经网络的中文财经新闻文本分类方法 |
CN108446271A (zh) * | 2018-03-07 | 2018-08-24 | 中山大学 | 基于汉字部件特征的卷积神经网络的文本情感分析方法 |
CN108460009A (zh) * | 2017-12-14 | 2018-08-28 | 中山大学 | 嵌入情感词典的注意力机制循环神经网络文本情感分析法 |
CN108460089A (zh) * | 2018-01-23 | 2018-08-28 | 哈尔滨理工大学 | 基于Attention神经网络的多元特征融合中文文本分类方法 |
CN108595602A (zh) * | 2018-04-20 | 2018-09-28 | 昆明理工大学 | 基于浅层模型与深度模型结合的问句文本分类方法 |
CN108614875A (zh) * | 2018-04-26 | 2018-10-02 | 北京邮电大学 | 基于全局平均池化卷积神经网络的中文情感倾向性分类方法 |
CN108647219A (zh) * | 2018-03-15 | 2018-10-12 | 中山大学 | 一种结合情感词典的卷积神经网络文本情感分析方法 |
CN108717519A (zh) * | 2018-04-03 | 2018-10-30 | 北京捷通华声科技股份有限公司 | 一种文本分类方法及装置 |
CN108737859A (zh) * | 2018-05-07 | 2018-11-02 | 华东师范大学 | 基于弹幕的视频推荐方法和装置 |
CN108845560A (zh) * | 2018-05-30 | 2018-11-20 | 国网浙江省电力有限公司宁波供电公司 | 一种电力调度日志故障分类方法 |
CN109033079A (zh) * | 2018-07-06 | 2018-12-18 | 龙马智芯(珠海横琴)科技有限公司 | 语言模型的训练方法、训练装置及检验方法 |
CN109408633A (zh) * | 2018-09-17 | 2019-03-01 | 中山大学 | 一种多层注意力机制的循环神经网络模型的构建方法 |
CN109614488A (zh) * | 2018-12-04 | 2019-04-12 | 广西大学 | 基于文本分类和图像识别的配网带电作业条件判别方法 |
CN109710770A (zh) * | 2019-01-31 | 2019-05-03 | 北京牡丹电子集团有限责任公司数字电视技术中心 | 一种基于迁移学习的文本分类方法及装置 |
CN109829166A (zh) * | 2019-02-15 | 2019-05-31 | 重庆师范大学 | 基于字符级卷积神经网络的民宿顾客意见挖掘方法 |
CN110019772A (zh) * | 2017-08-14 | 2019-07-16 | 普天信息技术有限公司 | 一种文本情绪分类方法及系统 |
CN110096588A (zh) * | 2018-01-30 | 2019-08-06 | 埃森哲环球解决方案有限公司 | 跨语言文本分类 |
CN110147449A (zh) * | 2019-05-27 | 2019-08-20 | 中国联合网络通信集团有限公司 | 文本分类方法和装置 |
CN110263139A (zh) * | 2019-06-10 | 2019-09-20 | 湖北亿咖通科技有限公司 | 车辆、车机设备及其基于神经网络的文本意图识别方法 |
CN110362819A (zh) * | 2019-06-14 | 2019-10-22 | 中电万维信息技术有限责任公司 | 基于卷积神经网络的文本情感分析方法 |
CN110399339A (zh) * | 2019-06-18 | 2019-11-01 | 平安科技(深圳)有限公司 | 知识库管理系统的文件分类方法、装置、设备及存储介质 |
CN110489554A (zh) * | 2019-08-15 | 2019-11-22 | 昆明理工大学 | 基于位置感知互注意力网络模型的属性级情感分类方法 |
CN110532392A (zh) * | 2019-09-02 | 2019-12-03 | 河南理工大学 | 一种基于卷积神经网络短文本分类方法 |
CN110765243A (zh) * | 2019-09-17 | 2020-02-07 | 平安科技(深圳)有限公司 | 自然语言处理系统的构建方法、电子装置及计算机设备 |
CN110969005A (zh) * | 2018-09-29 | 2020-04-07 | 航天信息股份有限公司 | 一种确定实体语料之间的相似性的方法及装置 |
CN111078882A (zh) * | 2019-12-13 | 2020-04-28 | 北京工业大学 | 一种文本情感测量方法和装置 |
CN111241271A (zh) * | 2018-11-13 | 2020-06-05 | 网智天元科技集团股份有限公司 | 文本情感分类方法、装置及电子设备 |
CN111460818A (zh) * | 2020-03-31 | 2020-07-28 | 中国测绘科学研究院 | 一种基于增强胶囊网络的网页文本分类方法及存储介质 |
CN111782804A (zh) * | 2020-06-09 | 2020-10-16 | 中科院成都信息技术股份有限公司 | 基于TextCNN同分布文本数据选择方法、系统及存储介质 |
CN111858933A (zh) * | 2020-07-10 | 2020-10-30 | 暨南大学 | 基于字符的层次化文本情感分析方法及系统 |
CN112001187A (zh) * | 2020-08-26 | 2020-11-27 | 重庆理工大学 | 一种基于中文句法和图卷积神经网络的情感分类系统 |
CN113836304A (zh) * | 2021-09-27 | 2021-12-24 | 山东亿云信息技术有限公司 | 一种基于自然语言处理的智能打标签方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740349A (zh) * | 2016-01-25 | 2016-07-06 | 重庆邮电大学 | 一种结合Doc2vec和卷积神经网络的情感分类方法 |
CN106445919A (zh) * | 2016-09-28 | 2017-02-22 | 上海智臻智能网络科技股份有限公司 | 一种情感分类方法及装置 |
CN106599933A (zh) * | 2016-12-26 | 2017-04-26 | 哈尔滨工业大学 | 一种基于联合深度学习模型的文本情感分类方法 |
-
2017
- 2017-05-12 CN CN201710332453.8A patent/CN107038480A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740349A (zh) * | 2016-01-25 | 2016-07-06 | 重庆邮电大学 | 一种结合Doc2vec和卷积神经网络的情感分类方法 |
CN106445919A (zh) * | 2016-09-28 | 2017-02-22 | 上海智臻智能网络科技股份有限公司 | 一种情感分类方法及装置 |
CN106599933A (zh) * | 2016-12-26 | 2017-04-26 | 哈尔滨工业大学 | 一种基于联合深度学习模型的文本情感分类方法 |
Non-Patent Citations (4)
Title |
---|
CICERO NOGUEIRA DOS SANTOS 等: "Deep Convolutional Neural Networks for Sentiment Analysis of Short Texts", 《PROCEEDINGS OF THE 25TH INTERNATIONAL CONFERENCE ON COMPUTATIONAL LINGUISTICS》 * |
YOON KIM: "Convolutional Neural Networks for Sentence Classification", 《PROCEEDINGS OF THE 2014 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING》 * |
刘龙飞 等: "基于卷积神经网络的微博情感倾向性分析", 《中文信息学报》 * |
王波 等: "基于深度特征的句子级文本情感分类", 《现代计算机》 * |
Cited By (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019772A (zh) * | 2017-08-14 | 2019-07-16 | 普天信息技术有限公司 | 一种文本情绪分类方法及系统 |
CN110019772B (zh) * | 2017-08-14 | 2021-05-25 | 普天信息技术有限公司 | 一种文本情绪分类方法及系统 |
CN107515855A (zh) * | 2017-08-18 | 2017-12-26 | 武汉红茶数据技术有限公司 | 一种结合表情符的微博情感分析方法和系统 |
CN107515855B (zh) * | 2017-08-18 | 2021-02-12 | 武汉红茶数据技术有限公司 | 一种结合表情符的微博情感分析方法和系统 |
CN107578092A (zh) * | 2017-09-01 | 2018-01-12 | 广州智慧城市发展研究院 | 一种基于情绪和意见挖掘的情感复合分析方法及系统 |
CN107656990A (zh) * | 2017-09-14 | 2018-02-02 | 中山大学 | 一种基于字和词两个层面特征信息的文本分类方法 |
CN107704558A (zh) * | 2017-09-28 | 2018-02-16 | 北京车慧互动广告有限公司 | 一种用户意见抽取方法及系统 |
CN107665254A (zh) * | 2017-09-30 | 2018-02-06 | 济南浪潮高新科技投资发展有限公司 | 一种基于深度学习的菜谱推荐方法 |
CN107730002A (zh) * | 2017-10-13 | 2018-02-23 | 国网湖南省电力公司 | 一种通信网关机遥控参数智能模糊比对方法 |
CN107730002B (zh) * | 2017-10-13 | 2020-06-02 | 国网湖南省电力公司 | 一种通信网关机遥控参数智能模糊比对方法 |
CN107704455A (zh) * | 2017-10-30 | 2018-02-16 | 成都市映潮科技股份有限公司 | 一种信息处理方法及电子设备 |
CN108073677B (zh) * | 2017-11-02 | 2021-12-28 | 中国科学院信息工程研究所 | 一种基于人工智能的多级文本多标签分类方法及系统 |
CN108073677A (zh) * | 2017-11-02 | 2018-05-25 | 中国科学院信息工程研究所 | 一种基于人工智能的多级文本多标签分类方法及系统 |
CN108009148B (zh) * | 2017-11-16 | 2021-04-27 | 天津大学 | 基于深度学习的文本情感分类表示方法 |
CN108009148A (zh) * | 2017-11-16 | 2018-05-08 | 天津大学 | 基于深度学习的文本情感分类表示方法 |
CN108460009A (zh) * | 2017-12-14 | 2018-08-28 | 中山大学 | 嵌入情感词典的注意力机制循环神经网络文本情感分析法 |
CN108460009B (zh) * | 2017-12-14 | 2022-09-16 | 中山大学 | 嵌入情感词典的注意力机制循环神经网络文本情感分析法 |
CN108460089B (zh) * | 2018-01-23 | 2022-03-01 | 海南师范大学 | 基于Attention神经网络的多元特征融合中文文本分类方法 |
CN108460089A (zh) * | 2018-01-23 | 2018-08-28 | 哈尔滨理工大学 | 基于Attention神经网络的多元特征融合中文文本分类方法 |
CN110096588A (zh) * | 2018-01-30 | 2019-08-06 | 埃森哲环球解决方案有限公司 | 跨语言文本分类 |
CN108399230A (zh) * | 2018-02-13 | 2018-08-14 | 上海大学 | 一种基于卷积神经网络的中文财经新闻文本分类方法 |
CN108446271A (zh) * | 2018-03-07 | 2018-08-24 | 中山大学 | 基于汉字部件特征的卷积神经网络的文本情感分析方法 |
CN108446271B (zh) * | 2018-03-07 | 2021-11-26 | 中山大学 | 基于汉字部件特征的卷积神经网络的文本情感分析方法 |
CN108647219A (zh) * | 2018-03-15 | 2018-10-12 | 中山大学 | 一种结合情感词典的卷积神经网络文本情感分析方法 |
CN108717519B (zh) * | 2018-04-03 | 2021-02-19 | 北京捷通华声科技股份有限公司 | 一种文本分类方法及装置 |
CN108717519A (zh) * | 2018-04-03 | 2018-10-30 | 北京捷通华声科技股份有限公司 | 一种文本分类方法及装置 |
CN108595602A (zh) * | 2018-04-20 | 2018-09-28 | 昆明理工大学 | 基于浅层模型与深度模型结合的问句文本分类方法 |
CN108614875A (zh) * | 2018-04-26 | 2018-10-02 | 北京邮电大学 | 基于全局平均池化卷积神经网络的中文情感倾向性分类方法 |
CN108737859A (zh) * | 2018-05-07 | 2018-11-02 | 华东师范大学 | 基于弹幕的视频推荐方法和装置 |
CN108845560B (zh) * | 2018-05-30 | 2021-07-13 | 国网浙江省电力有限公司宁波供电公司 | 一种电力调度日志故障分类方法 |
CN108845560A (zh) * | 2018-05-30 | 2018-11-20 | 国网浙江省电力有限公司宁波供电公司 | 一种电力调度日志故障分类方法 |
CN109033079B (zh) * | 2018-07-06 | 2020-08-04 | 龙马智芯(珠海横琴)科技有限公司 | 语言模型的训练方法、训练装置及检验方法 |
CN109033079A (zh) * | 2018-07-06 | 2018-12-18 | 龙马智芯(珠海横琴)科技有限公司 | 语言模型的训练方法、训练装置及检验方法 |
CN109408633A (zh) * | 2018-09-17 | 2019-03-01 | 中山大学 | 一种多层注意力机制的循环神经网络模型的构建方法 |
CN110969005B (zh) * | 2018-09-29 | 2023-10-31 | 航天信息股份有限公司 | 一种确定实体语料之间的相似性的方法及装置 |
CN110969005A (zh) * | 2018-09-29 | 2020-04-07 | 航天信息股份有限公司 | 一种确定实体语料之间的相似性的方法及装置 |
CN111241271A (zh) * | 2018-11-13 | 2020-06-05 | 网智天元科技集团股份有限公司 | 文本情感分类方法、装置及电子设备 |
CN111241271B (zh) * | 2018-11-13 | 2023-04-25 | 网智天元科技集团股份有限公司 | 文本情感分类方法、装置及电子设备 |
CN109614488A (zh) * | 2018-12-04 | 2019-04-12 | 广西大学 | 基于文本分类和图像识别的配网带电作业条件判别方法 |
CN109614488B (zh) * | 2018-12-04 | 2022-12-02 | 广西大学 | 基于文本分类和图像识别的配网带电作业条件判别方法 |
CN109710770A (zh) * | 2019-01-31 | 2019-05-03 | 北京牡丹电子集团有限责任公司数字电视技术中心 | 一种基于迁移学习的文本分类方法及装置 |
CN109829166A (zh) * | 2019-02-15 | 2019-05-31 | 重庆师范大学 | 基于字符级卷积神经网络的民宿顾客意见挖掘方法 |
CN109829166B (zh) * | 2019-02-15 | 2022-12-27 | 重庆师范大学 | 基于字符级卷积神经网络的民宿顾客意见挖掘方法 |
CN110147449A (zh) * | 2019-05-27 | 2019-08-20 | 中国联合网络通信集团有限公司 | 文本分类方法和装置 |
CN110263139A (zh) * | 2019-06-10 | 2019-09-20 | 湖北亿咖通科技有限公司 | 车辆、车机设备及其基于神经网络的文本意图识别方法 |
CN110362819A (zh) * | 2019-06-14 | 2019-10-22 | 中电万维信息技术有限责任公司 | 基于卷积神经网络的文本情感分析方法 |
CN110399339A (zh) * | 2019-06-18 | 2019-11-01 | 平安科技(深圳)有限公司 | 知识库管理系统的文件分类方法、装置、设备及存储介质 |
CN110489554A (zh) * | 2019-08-15 | 2019-11-22 | 昆明理工大学 | 基于位置感知互注意力网络模型的属性级情感分类方法 |
CN110532392A (zh) * | 2019-09-02 | 2019-12-03 | 河南理工大学 | 一种基于卷积神经网络短文本分类方法 |
CN110765243A (zh) * | 2019-09-17 | 2020-02-07 | 平安科技(深圳)有限公司 | 自然语言处理系统的构建方法、电子装置及计算机设备 |
WO2021051585A1 (zh) * | 2019-09-17 | 2021-03-25 | 平安科技(深圳)有限公司 | 自然语言处理系统的构建方法、电子装置及计算机设备 |
CN111078882A (zh) * | 2019-12-13 | 2020-04-28 | 北京工业大学 | 一种文本情感测量方法和装置 |
CN111460818B (zh) * | 2020-03-31 | 2023-06-30 | 中国测绘科学研究院 | 一种基于增强胶囊网络的网页文本分类方法及存储介质 |
CN111460818A (zh) * | 2020-03-31 | 2020-07-28 | 中国测绘科学研究院 | 一种基于增强胶囊网络的网页文本分类方法及存储介质 |
CN111782804B (zh) * | 2020-06-09 | 2023-05-02 | 中科院成都信息技术股份有限公司 | 基于TextCNN同分布文本数据选择方法、系统及存储介质 |
CN111782804A (zh) * | 2020-06-09 | 2020-10-16 | 中科院成都信息技术股份有限公司 | 基于TextCNN同分布文本数据选择方法、系统及存储介质 |
CN111858933A (zh) * | 2020-07-10 | 2020-10-30 | 暨南大学 | 基于字符的层次化文本情感分析方法及系统 |
CN112001187A (zh) * | 2020-08-26 | 2020-11-27 | 重庆理工大学 | 一种基于中文句法和图卷积神经网络的情感分类系统 |
CN113836304A (zh) * | 2021-09-27 | 2021-12-24 | 山东亿云信息技术有限公司 | 一种基于自然语言处理的智能打标签方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107038480A (zh) | 一种基于卷积神经网络的文本情感分类方法 | |
CN107944559B (zh) | 一种实体关系自动识别方法及系统 | |
CN108763326B (zh) | 一种基于特征多样化的卷积神经网络的情感分析模型构建方法 | |
CN108984530A (zh) | 一种网络敏感内容的检测方法及检测系统 | |
CN104298651B (zh) | 一种基于深度学习的生物医学命名实体识别和蛋白质交互关系抽取在线方法 | |
CN103903164B (zh) | 基于领域信息的半监督方面自动提取方法及其系统 | |
CN107025284A (zh) | 网络评论文本情感倾向的识别方法及卷积神经网络模型 | |
CN109472024A (zh) | 一种基于双向循环注意力神经网络的文本分类方法 | |
CN107608956A (zh) | 一种基于cnn‑grnn的读者情绪分布预测算法 | |
CN107247702A (zh) | 一种文本情感分析处理方法和系统 | |
CN109145112A (zh) | 一种基于全局信息注意力机制的商品评论分类方法 | |
CN106445919A (zh) | 一种情感分类方法及装置 | |
CN103207913B (zh) | 商品细粒度语义关系的获取方法和系统 | |
CN108763216A (zh) | 一种基于中文数据集的文本情感分析方法 | |
CN109977416A (zh) | 一种多层次自然语言反垃圾文本方法及系统 | |
CN108388554B (zh) | 基于协同过滤注意力机制的文本情感识别系统 | |
CN107153642A (zh) | 一种基于神经网络识别文本评论情感倾向的分析方法 | |
CN110245229A (zh) | 一种基于数据增强的深度学习主题情感分类方法 | |
CN107203511A (zh) | 一种基于神经网络概率消歧的网络文本命名实体识别方法 | |
CN107122349A (zh) | 一种基于word2vec‑LDA模型的文本主题词提取方法 | |
CN104331506A (zh) | 一种面向双语微博文本的多类情感分析方法与系统 | |
CN109376242A (zh) | 基于循环神经网络变体和卷积神经网络的文本分类算法 | |
CN107451278A (zh) | 基于多隐层极限学习机的中文文本分类方法 | |
CN106599054A (zh) | 一种题目分类及推送的方法及系统 | |
CN107247703A (zh) | 基于卷积神经网络和集成学习的微博情感分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170811 |
|
WD01 | Invention patent application deemed withdrawn after publication |