CN107391483A - 一种基于卷积神经网络的商品评论数据情感分类方法 - Google Patents

一种基于卷积神经网络的商品评论数据情感分类方法 Download PDF

Info

Publication number
CN107391483A
CN107391483A CN201710572175.3A CN201710572175A CN107391483A CN 107391483 A CN107391483 A CN 107391483A CN 201710572175 A CN201710572175 A CN 201710572175A CN 107391483 A CN107391483 A CN 107391483A
Authority
CN
China
Prior art keywords
comment
word
neural networks
convolutional neural
commodity data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710572175.3A
Other languages
English (en)
Inventor
余啸
刘进
聂国平
崔晓晖
井溢洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201710572175.3A priority Critical patent/CN107391483A/zh
Publication of CN107391483A publication Critical patent/CN107391483A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于卷积神经网络的商品评论数据情感分类方法,针对传统的词向量表示方法只提取词汇特征和句法特征,而忽略了词语之间的语义关系的问题,传统的分类算法分类效果能以再被提升的问题,提出了一个基于卷积神经网络的商品评论数据情感分类方法。首先利用CBOW模型提取出每条评论数据的词向量特征,增强了词语之间的语义关系和词向量特征的表达能力,然后利用卷积神经网络模型这个深度学习网络模型建立情感分类模型,提升了评论数据的情感分类性能。本发明的技术方案具有简单、快速的特点,能够较好地提高评论数据情感分类的分类性能。

Description

一种基于卷积神经网络的商品评论数据情感分类方法
技术领域
本发明属于情感分类技术领域,特别是涉及一种基于卷积神经网络的商品评论数据情感分类方法。
背景技术
(1)情感分类技术
随着移动网络技术的飞速发展和智能手机的普及,人们日益趋于通过手机APP直接在一些电子商务网站上直接购买商品,用户也会通过这些电子商务网站来发表评论内容,来分享他们在购买了商品后使用商品的感受。对商品评论数据进行情感分析,又叫意见挖掘,即是对客户对商品的带有情感态度的评论信息进行搜集、预处理、并对其表达的情感倾向进行判别的过程。对电子商务网站上的评论数据进行情感分类,可以判断出购买者对某件商品的情感倾向:是喜欢这件商品还是对这件商品不满意。
到现在为止,文本情感分类这个领域主要可以分为两个研究方向。第一个方向是基于情感字典来实现情感分类。第二个方向是基于机器学习的算法来进行文本情感分类。
基于情感字典的文本情感分类方法一般是不会去考虑在这些文本中词之间的关系,而只是将这些文本当成是词与词之间的集合。最简单的基于情感字典的文本情感分类方法是利用从网络中或者传统字典中抽取出来的字典,这些字典记录了很多具有情感倾向的词语。当对文本进行情感分析时,将这个文本中含有的词语与字典中的具有情感倾向的词语比对,然后将这些词语的情感倾向值进行求和或者取平均值,从而获得了这一个文本所具有的情感倾向值。已经有很多基于情感字典的文本情感分类方法被提出,如文献[1]提出的基于情感字典的文本情感分类方法首先将文本进行分词,然后提取其中可能具有情感极性的词语,然后对比已有的情感字典来判断这些词语的情感极性。比如某个词语和“非常好”很相关,那么这个词语就被分类为积极倾向,如果某个词语和“很糟糕”很相关,那么这个词语就被分类为消极倾向,最后通过这些词语的情感极性统计这一个文本的情感极性。文献[2]提出了一种基于情感色彩词语特征的文本情感分类方法,这一个方法首先从需要被分类的文本中选取有可能带有情感色彩的特征词,然后对比情感字典,将这些特征词赋予不同的情感得分,通过这些情感得分将这片文本就分为了积极评价和消极评价两类。
相比于基于情感字典的文本情感分类方法,基于机器学习的文本情感分析方法的优势在于机器学习算法能够对多种特征进行建模,而不只限于分析每个词语的情感极性。作为最早的基于机器学习的文本情感分类方法,文献[3]首次提出了运用监督学习的方法进行情感分类,他们首先将文本提取出基本的词特征,然后利用支持向量机、最大熵和朴素贝叶斯算法这三种分类方法建立出分类模型预测出文本的情感倾向。受到这篇论文的启发,很多研究者致力于提升这些基于监督学习的文本情感分类方法的分类性能。文献[4]通过过滤掉客观句,使情感分类器更加集中于在主观句上面训练,使得情感分类的准确率提升了3.5%。文献[5]提出利用区分式的分类器去区分主观句和客观句,这样也大大的提升了分类的效果。
近年来随着深度学习技术的不断发展壮大,比如Google推出的Tensorflow开源框架,使得程序员能够更为便捷的编写深度学习的程序。这使得深度学习技术也在自然语言处理的领域得到了广泛的应用,并取得了比较好的效果。因此,本发明就将深度学习的技术应用于商品评论数据情感分类中。
(2)CBOW模型
文献[6]中提出的Word2vec模型,是由谷歌提出的一个基于深度学习的词语向量化表示工具,它通过一个三层的神经网络,结合大量的语料库的输入训练,最后得到语料库中每一个词语的向量化表示,并且在此基础上,可以用向量间的距离来衡量每两个词语之间的相似性,获得了很好的实践应用。Word2vec是由Bengio等提出的三层神经网络自然语言模型NNLM(Neural network language model发展而来的,Word2vec提供了连续词袋(CBOW,Continue Bag-of-Word Model)和Skip-Gram两种训练模型。本发明利用CBOW模型,CBOW模型在训练过程中会用到上下文已经训练得到的结果来计算当前词的词向量,CBOW的网络结构类似于前向神经网络语言模型,不同之处是CBOW用一个投影层替换了非线性的隐藏层,并且这个投影层由语料库中所有的词共享,也即所有的词都会被映射到相同的位置。CBOW模型将输入层的上下文的词向量加权求和得到投影层的向量,然后将投影层输入到一个对数线性分类器中,来预测当前中心词,也即输出层。
[1]Turney P D.Thumbs up or thumbs down?:semantic orientation appliedto unsupervised classification of reviews[C].Proceedings of the 40th annualmeeting on association for computational linguistics.Association forComputational Linguistics,2002:417-424.
[2]Hu M,Liu B.Mining and summarizing customer reviews[C].Proceedingsof the tenth ACM SIGKDD international conference on Knowledge discovery anddata mining.ACM,2004:168-177.
[3]Pang B,Lee L,Vaithyanathan S.Thumbs up?:sentiment classificationusing machine learning techniques[C].Proceedings of the ACL-02conference onEmpirical methods in natural language processing-Volume 10.Association forComputational Linguistics,2002:79-86.
[4]Pang B,Lee L.A sentimental education:Sentiment analysis usingsubjectivity summarization based on minimum cuts[C].Proceedings of the 42ndannual meeting on Association for Computational Linguistics.Association forComputational Linguistics,2004:271.
[5]Cui H,Mittal V,Datar M.Comparative experiments on sentimentclassification for onlineproduct reviews[C].AAAI.2006,6:1265-1270.
[6]Mikolov T,Sutskever I,Chen K,et al.Distributed Representations ofWords and Phrases and their Compositionality[J].Advances in NeuralInformation Processing Systems,2013,26:3111-3119.
发明内容
本发明针对传统的词向量表示方法只提取词汇特征和句法特征,而忽略了词语之间的语义关系的问题,传统的分类算法分类效果能以再被提升的问题,提供了一种基于卷积神经网络的商品评论数据情感分类方法。
本发明所采用的技术方案是:一种基于卷积神经网络的商品评论数据情感分类方法,其特征在于,包括以下步骤:
步骤1:爬取商品评论数据,标记所有的评论数据的情感倾向,标记积极评论的类标号为1,标记消极评论的类标号为0;
步骤2:对商品评论数据进行分词,将一篇文本或一句话分成一个个用空格分隔的单词;
步骤3:提取每一个单词的词向量,每一条评论包含的单词的词向量之和即为该条评论的特征向量表示;
步骤4:训练卷积神经网络情感分类模型;
步骤5:对待预测商品评论数据进行分词;
步骤6:利用步骤3中为每个单词提取出的词向量,对待预测商品评论数据形成向量表示;
步骤7:将步骤6中形成的待预测的商品评论数据的向量表示输入到步骤4中训练好的卷积神经网络情感分类模型中,得到待预测的商品评论数据的情感倾向。
相对于国内外已有的评论数据情感分类方法,本发明针对传统的词向量表示方法只提取词汇特征和句法特征,而忽略了词语之间的语义关系的问题,传统的分类算法分类效果能以再被提升的问题,提出了一个基于卷积神经网络的商品评论数据情感分类方法。首先利用CBOW模型提取出每条评论数据的词向量特征,增强了词语之间的语义关系和词向量特征的表达能力,然后利用卷积神经网络模型这个深度学习网络模型建立情感分类模型,提升了评论数据的情感分类性能。本发明的技术方案具有简单、快速的特点,能够较好地提高评论数据情感分类的分类性能。
附图说明
图1本发明实施例的流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种基于卷积神经网络的商品评论数据情感分类方法,包括以下步骤:
步骤1:利用网络爬虫爬取商品评论数据,标记所有的评论数据的情感倾向,标记积极评论的类标号为1,消极评论的类标号为0。
为了方便演示,本实施例假设爬取了6条京东商品评论数据,并标记了类标号,形成了如下的评论数据集:
(1)衣服蛮好的,是我喜欢的款式。情感倾向:1;
(2)很好质量不错,款式也不错,很满意。情感倾向:1;
(3)质量还可以哦!很好很真实。情感倾向:1;
(4)质量不好,不是纯棉的。情感倾向:0;
(5)衣服洗了之后褪色,差评。情感倾向:0;
(6)衣服太厚了,夏天穿着很热。情感倾向:0;
步骤2:由于中文丰富的表达方式和不同于英文的单词间自然分隔的特点,让中文文本情感分类多了一个预处理,即分词的步骤,分词是将一篇文本或一句话分成一个个用空格分隔的单词,然后才能进行特征提取、深度学习等方法做后续的分类工作。
本实施例采用Jieba分词系统对商品评论数据进行分词。Jieba是基于Python的开源分词系统,自带了一个2万词语的词典,用户可以根据需要编写自己的词典以替换掉默认的词典,以满足特殊的需求;Jieba提供了3种分词模式:精确模式、全模式、搜索引擎模式,以应对不同的分词需求。在分词的过程中还需要去掉标点符号、数字、英文字符以及停用词和语气助词。
本实施例对爬取的6条京东商品评论数据进行分词和去掉标点符号、数字、英文字符以及停用词和语气助词,每条评论数据形成了如下分词:
(1)“衣服”、“好”、“我”、“喜欢”、“款式”;
(2)“好”、“质量”、“不错”、“款式”、“不错”、“满意”;
(3)“质量”、“可以”、“好”、“真实”;
(4)“质量”、“不好”、“不是”、“纯棉”;
(5)“衣服”、“洗”、“褪色”、“差评”;
(6)“衣服”、“厚”、“夏天”、“穿着”、“热”;
步骤3:利用CBOW模型提取每一个单词的词向量,每一条评论包含的单词的词向量之和即为该条评论的特征向量表示;
本实施例假设CBOW模型提取的词向量维度为100维,即将“衣服”这个单词表示成(w1 1,w2 1,…,w100 1)这样一个100维的向量,“好”这个单词表示成(w1 2,w2 2,…,w100 2)这样一个100维的向量,“我”这个单词表示成(w1 3,w2 3,…,w100 3)这样一个100维的向量,“喜欢”这个单词表示成(w1 4,w2 4,…,w100 4)这样一个100维的向量,“款式”这个单词表示成(w1 5,w2 5,…,w100 5)这样一个100维的向量,“质量”这个单词表示成(w1 6,w2 6,…,w100 6)这样一个100维的向量,“不错”这个单词表示成(w1 7,w2 7,…,w100 7)这样一个100维的向量,“满意”这个单词表示成(w1 8,w2 8,…,w100 8)这样一个100维的向量,“可以”这个单词表示成(w1 9,w2 9,…,w100 9)这样一个100维的向量,“真实”这个单词表示成(w1 10,w2 10,…,w100 10)这样一个100维的向量,“不好”这个单词表示成(w1 11,w2 11,…,w100 11)这样一个100维的向量,“不是”这个单词表示成(w1 12,w2 12,…,w100 12)这样一个100维的向量,“纯棉”这个单词表示成(w1 13,w2 13,…,w100 13)这样一个100维的向量,“衣服”这个单词表示成(w1 14,w2 14,…,w100 14)这样一个100维的向量,“洗”这个单词表示成(w1 15,w2 15,…,w100 15)这样一个100维的向量,“褪色”这个单词表示成(w1 16,w2 16,…,w100 16)这样一个100维的向量,“差评”这个单词表示成(w1 17,w2 17,…,w100 17)这样一个100维的向量,“厚”这个单词表示成(w1 18,w2 18,…,w100 18)这样一个100维的向量,“夏天”这个单词表示成(w1 19,w2 19,…,w100 19)这样一个100维的向量,“穿着”这个单词表示成(w1 20,w2 20,…,w100 20)这样一个100维的向量,“热”这个单词表示成(w1 21,w2 21,…,w100 21)这样一个100维的向量。
每一条评论包含的词的词向量之和即为该条评论的特征向量表示。本实施例中,“衣服蛮好的,是我喜欢的款式”这条评论就用(w1 1+w1 2+w1 3+w1 4+w1 5,w2 1+w2 2+w2 3+w2 4+w2 5,…,w100 1+w100 2+w100 3+w100 4+w100 5)这个特征向量表示,“很好质量不错,款式也不错。”这条评论就用(w1 2+w1 6+2×w1 7+w1 5+w1 8,w2 2+w2 6+2×w2 7+w2 5+w2 8,,…,w100 2+w100 6+2×w100 7+w100 5+w100 8)这个特征向量表示,“质量还可以哦!很好很真实。”这条评论就用(w1 6+w1 9+w1 2+w1 10,w2 6+w2 9+w2 2+w2 10,…,w100 6+w100 9+w100 2+w100 10)这个特征向量表示,“质量不好,不是纯棉的”这条评论就用(w1 6+w1 11+w1 12+w1 13,w2 6+w2 11+w2 12+w2 13,…,w100 6+w100 11+w100 12+w100 13)这个特征向量表示,“衣服洗了之后褪色,差评”这条评论就用(w1 1+w1 15+w1 16+w1 17,w2 1+w2 15+w2 16+w2 17,…,w100 1+w100 15+w100 16+w100 17)这个特征向量表示,“衣服太厚了,夏天穿着很热。”这条评论就用(w1 1+w1 18+w1 19+w1 20+w1 21,w2 1+w2 18+w2 19+w2 20+w2 21,…,w100 1+w100 18+w100 19+w100 20+w100 21)来这个特征向量表示。
步骤4:训练卷积神经网络情感分类模型;
卷积神经网络包含输入层、卷积层、池化层、全连接层四个部分,其中卷积层和池化层根据需要可以反复利用、交替出现,以增强网络表达能力。
输入层将评论数据的特征向量输入到卷积神经网络中,并与下一层相连。需要说明的是卷积神经网络的输入层的数据是二维的矩阵,因为卷积神经网络最初是设计用于解决图像分类,而图像数据本身就是以矩阵存储的。本发明利用卷积神经做文本情感分类研究,输入层接收的输入为评论特征矩阵,评论特征矩阵的每一行为评论的特征向量,评论特征矩阵的行数等于评论的条数,文本特征矩阵的列数等于单词的词向量的长度。
卷积层将一个m×n的矩阵作为卷积核与输入层的文本特征矩阵的某一部分按对应元素相乘,然后所有乘积结果相加,输入到一个卷积函数中得到最后的卷积特征,数学表示为其中,上标l表示第l层卷积,kl ij表示l层卷积核的(i,j)位置的元素值,表示偏置项,f(x)为卷积核函数,本实施例选用tanh函数作为卷积核函数。tanh函数是双曲函数的一种,又叫做双曲正切函数,定义为
池化层的作用是从卷积层中得到的feature-map中提取最关键的特征,起到一个信息过滤的作用,且经过池化层处理后,feature-map的尺寸减小,起到了参数约减的作用,降低了模型的训练难度。本实施例采用最大池化方法,在给定的池化窗口中选取元素值最大的那个作为下一层对应位置的特征。
全连接层是将经过卷积和池化步骤后得到的二维的feature-map变形为一维的向量,便于后续输入到支持向量机分类器中,做情感分类操作。
步骤5:对待预测商品评论数据进行分词,在分词的过程中去掉标点符号、数字、英文字符以及停用词和语气助词。
本实施例假设待预测的商品评论数据为“衣服质量可以,我很满意”,形成了如下分词:
“衣服”、“质量”、“可以”、“我”、“满意”。
步骤6:利用步骤3中为每个单词提取出的词向量,对待预测商品评论数据形成向量表示;
由于在实际操作中,步骤3提取的单词的词向量几乎涵盖了现实生活中所有常用的词语,所以步骤3中提取的词语一定包含该步骤中待预测的商品评论数据中出现的词语。
待预测的商品评论数据包含的单词的词向量之和即为该条评论的特征向量表示,“衣服质量可以,我很满意”这条评论数据可以表示为(w1 1+w1 6+w1 9+w1 3+w1 8,w2 1+w2 6+w2 9+w2 3+w2 8,…,w100 1+w100 6+w100 9+w100 3+w100 8)这样一个100维的向量。
步骤7:将步骤6中形成的待预测的商品评论数据的向量表示输入到步骤4中训练好的卷积神经网络情感分类模型中,得到待预测的商品评论数据的情感倾向。
本实施例中,卷积神经网络情感分类模型对这条待预测的商品评论数据预测的类标号为1,即判定这条评论数据的情感倾向为积极评价。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (5)

1.一种基于卷积神经网络的商品评论数据情感分类方法,其特征在于,包括以下步骤:
步骤1:爬取商品评论数据,标记所有的评论数据的情感倾向,标记积极评论的类标号为1,标记消极评论的类标号为0;
步骤2:对商品评论数据进行分词,将一篇文本或一句话分成一个个用空格分隔的单词;
步骤3:提取每一个单词的词向量,每一条评论包含的单词的词向量之和即为该条评论的特征向量表示;
步骤4:训练卷积神经网络情感分类模型;
步骤5:对待预测商品评论数据进行分词;
步骤6:利用步骤3中为每个单词提取出的词向量,对待预测商品评论数据形成向量表示;
步骤7:将步骤6中形成的待预测的商品评论数据的向量表示输入到步骤4中训练好的卷积神经网络情感分类模型中,得到待预测的商品评论数据的情感倾向。
2.根据权利要求1所述的基于卷积神经网络的商品评论数据情感分类方法,其特征在于:步骤2中,在分词的过程中去掉标点符号、数字、英文字符以及停用词和语气助词。
3.根据权利要求1所述的基于卷积神经网络的商品评论数据情感分类方法,其特征在于:步骤3中,利用CBOW模型提取每一个词的词向量。
4.根据权利要求1所述的基于卷积神经网络的商品评论数据情感分类方法,其特征在于:步骤4中,卷积神经网络包含输入层、卷积层、池化层、全连接层四个部分;
输入层将评论数据的向量输入到卷积神经网络中,并与下一层相连,其中输入层的数据是二维的评论特征矩阵,评论特征矩阵的每一行为评论的特征向量,评论特征矩阵的行数等于评论的条数,文本特征矩阵的列数等于单词的词向量的长度;
卷积层将一个m×n的矩阵作为卷积核与输入层的文本特征矩阵的某一部分按对应元素相乘,然后所有乘积结果相加,输入到一个卷积函数中得到最后的卷积特征,数学表示为其中,上标l表示第l层卷积,表示l层卷积核的(i,j)位置的元素值,表示偏置项,f(x)为卷积核函数,本发明选用tanh函数作为卷积核函数。tanh函数是双曲函数的一种,又叫做双曲正切函数,定义为
池化层从卷积层中得到的feature-map中提取最关键的特征,起到一个信息过滤的作用,且经过池化层处理后,feature-map的尺寸减小,起到了参数约减的作用,降低了模型的训练难度;
全连接层将经过卷积和池化步骤后得到的二维的feature-map变形为一维的向量,便于后续输入到支持向量机分类器中,做情感分类操作。
5.根据权利要求4所述的基于卷积神经网络的商品评论数据情感分类方法,其特征在于:步骤4中,采用最大池化方法,在给定的池化窗口中选取元素值最大的那个作为下一层对应位置的特征。
CN201710572175.3A 2017-07-13 2017-07-13 一种基于卷积神经网络的商品评论数据情感分类方法 Pending CN107391483A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710572175.3A CN107391483A (zh) 2017-07-13 2017-07-13 一种基于卷积神经网络的商品评论数据情感分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710572175.3A CN107391483A (zh) 2017-07-13 2017-07-13 一种基于卷积神经网络的商品评论数据情感分类方法

Publications (1)

Publication Number Publication Date
CN107391483A true CN107391483A (zh) 2017-11-24

Family

ID=60339576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710572175.3A Pending CN107391483A (zh) 2017-07-13 2017-07-13 一种基于卷积神经网络的商品评论数据情感分类方法

Country Status (1)

Country Link
CN (1) CN107391483A (zh)

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108355A (zh) * 2017-12-25 2018-06-01 北京牡丹电子集团有限责任公司数字电视技术中心 基于深度学习的文本情感分析方法和系统
CN108536784A (zh) * 2018-03-29 2018-09-14 广州优视网络科技有限公司 评论信息情感分析方法、装置、计算机存储介质和服务器
CN108549641A (zh) * 2018-04-26 2018-09-18 中国联合网络通信集团有限公司 歌曲评定方法、装置、设备及存储介质
CN108647212A (zh) * 2018-05-18 2018-10-12 大连民族大学 机器学习的影评情感倾向性分析中形成特征集合的方法
CN108665339A (zh) * 2018-03-27 2018-10-16 北京航空航天大学 一种基于主观情感测度的电商产品可靠性指标及其实现方法
CN109033433A (zh) * 2018-08-13 2018-12-18 中国地质大学(武汉) 一种基于卷积神经网络的评论数据情感分类方法及系统
CN109063096A (zh) * 2018-07-27 2018-12-21 成都睿码科技有限责任公司 一种快速训练泰文情感分析模型的方法
CN109213868A (zh) * 2018-11-21 2019-01-15 中国科学院自动化研究所 基于卷积注意力机制网络的实体级别情感分类方法
CN109242516A (zh) * 2018-09-06 2019-01-18 北京京东尚科信息技术有限公司 处理服务单的方法和装置
CN109299468A (zh) * 2018-10-25 2019-02-01 四川长虹电器股份有限公司 基于条件熵和卷积神经网络的短文本分类方法
CN109388715A (zh) * 2018-10-25 2019-02-26 北京小度信息科技有限公司 用户数据的分析方法及装置
CN109636440A (zh) * 2018-11-06 2019-04-16 航天信息股份有限公司 商品满意度的评估方法和装置,存储介质和电子设备
CN109829166A (zh) * 2019-02-15 2019-05-31 重庆师范大学 基于字符级卷积神经网络的民宿顾客意见挖掘方法
CN110348024A (zh) * 2019-07-23 2019-10-18 天津汇智星源信息技术有限公司 基于法律知识图谱的智能识别系统
CN110362808A (zh) * 2018-03-26 2019-10-22 优酷网络技术(北京)有限公司 文本分析方法及装置
CN110362809A (zh) * 2018-03-26 2019-10-22 优酷网络技术(北京)有限公司 文本分析方法及装置
CN110362810A (zh) * 2018-03-26 2019-10-22 优酷网络技术(北京)有限公司 文本分析方法及装置
CN110555104A (zh) * 2018-03-26 2019-12-10 优酷网络技术(北京)有限公司 文本分析方法及装置
CN110569495A (zh) * 2018-06-05 2019-12-13 北京四维图新科技股份有限公司 一种基于用户评论的情感倾向分类方法、装置及存储介质
CN111078840A (zh) * 2019-12-20 2020-04-28 浙江大学 一种基于文档向量的电影评论情感分析方法
CN111143567A (zh) * 2019-12-30 2020-05-12 成都数之联科技有限公司 一种基于改进神经网络的评论情感分析方法
CN111241842A (zh) * 2018-11-27 2020-06-05 阿里巴巴集团控股有限公司 文本的分析方法、装置和系统
CN111259116A (zh) * 2020-01-16 2020-06-09 北京珞安科技有限责任公司 基于卷积神经网络的敏感文件检测方法
CN111259159A (zh) * 2018-11-30 2020-06-09 北京京东尚科信息技术有限公司 数据挖掘方法、装置和计算机可读存储介质
CN111309859A (zh) * 2020-01-21 2020-06-19 上饶市中科院云计算中心大数据研究院 一种景区网络口碑情感分析方法及装置
CN111597296A (zh) * 2019-02-20 2020-08-28 阿里巴巴集团控股有限公司 商品数据的处理方法、装置和系统
CN112215003A (zh) * 2020-11-09 2021-01-12 深圳市洪堡智慧餐饮科技有限公司 一种基于albert预训练模型和kmean算法的评论标签提取的方法
CN108763326B (zh) * 2018-05-04 2021-01-12 南京邮电大学 一种基于特征多样化的卷积神经网络的情感分析模型构建方法
CN112307211A (zh) * 2020-11-09 2021-02-02 深圳市洪堡智慧餐饮科技有限公司 一种基于卷积神经网络和bm25的外卖评论情感极性分析方法
WO2021051598A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 文本情感分析模型训练方法、装置、设备及可读存储介质
CN113159831A (zh) * 2021-03-24 2021-07-23 湖南大学 一种基于改进的胶囊网络的评论文本情感分析方法
CN113821628A (zh) * 2020-06-17 2021-12-21 北京瀚海云星科技有限公司 利用社交媒体短文本进行价值评估的方法和装置、程序、介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268197A (zh) * 2013-09-22 2015-01-07 中科嘉速(北京)并行软件有限公司 一种行业评论数据细粒度情感分析方法
CN105740349A (zh) * 2016-01-25 2016-07-06 重庆邮电大学 一种结合Doc2vec和卷积神经网络的情感分类方法
CN106445919A (zh) * 2016-09-28 2017-02-22 上海智臻智能网络科技股份有限公司 一种情感分类方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268197A (zh) * 2013-09-22 2015-01-07 中科嘉速(北京)并行软件有限公司 一种行业评论数据细粒度情感分析方法
CN105740349A (zh) * 2016-01-25 2016-07-06 重庆邮电大学 一种结合Doc2vec和卷积神经网络的情感分类方法
CN106445919A (zh) * 2016-09-28 2017-02-22 上海智臻智能网络科技股份有限公司 一种情感分类方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蔡慧苹: "基于卷积神经网络的短文本分类方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑(月刊 )》 *

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108355A (zh) * 2017-12-25 2018-06-01 北京牡丹电子集团有限责任公司数字电视技术中心 基于深度学习的文本情感分析方法和系统
CN110362810A (zh) * 2018-03-26 2019-10-22 优酷网络技术(北京)有限公司 文本分析方法及装置
CN110362809A (zh) * 2018-03-26 2019-10-22 优酷网络技术(北京)有限公司 文本分析方法及装置
CN110362808A (zh) * 2018-03-26 2019-10-22 优酷网络技术(北京)有限公司 文本分析方法及装置
CN110555104A (zh) * 2018-03-26 2019-12-10 优酷网络技术(北京)有限公司 文本分析方法及装置
CN108665339A (zh) * 2018-03-27 2018-10-16 北京航空航天大学 一种基于主观情感测度的电商产品可靠性指标及其实现方法
CN108536784A (zh) * 2018-03-29 2018-09-14 广州优视网络科技有限公司 评论信息情感分析方法、装置、计算机存储介质和服务器
CN108549641A (zh) * 2018-04-26 2018-09-18 中国联合网络通信集团有限公司 歌曲评定方法、装置、设备及存储介质
CN108549641B (zh) * 2018-04-26 2022-09-20 中国联合网络通信集团有限公司 歌曲评定方法、装置、设备及存储介质
CN108763326B (zh) * 2018-05-04 2021-01-12 南京邮电大学 一种基于特征多样化的卷积神经网络的情感分析模型构建方法
CN108647212A (zh) * 2018-05-18 2018-10-12 大连民族大学 机器学习的影评情感倾向性分析中形成特征集合的方法
CN110569495A (zh) * 2018-06-05 2019-12-13 北京四维图新科技股份有限公司 一种基于用户评论的情感倾向分类方法、装置及存储介质
CN109063096A (zh) * 2018-07-27 2018-12-21 成都睿码科技有限责任公司 一种快速训练泰文情感分析模型的方法
CN109033433B (zh) * 2018-08-13 2020-09-29 中国地质大学(武汉) 一种基于卷积神经网络的评论数据情感分类方法及系统
CN109033433A (zh) * 2018-08-13 2018-12-18 中国地质大学(武汉) 一种基于卷积神经网络的评论数据情感分类方法及系统
CN109242516A (zh) * 2018-09-06 2019-01-18 北京京东尚科信息技术有限公司 处理服务单的方法和装置
CN109299468A (zh) * 2018-10-25 2019-02-01 四川长虹电器股份有限公司 基于条件熵和卷积神经网络的短文本分类方法
CN109388715A (zh) * 2018-10-25 2019-02-26 北京小度信息科技有限公司 用户数据的分析方法及装置
CN109636440A (zh) * 2018-11-06 2019-04-16 航天信息股份有限公司 商品满意度的评估方法和装置,存储介质和电子设备
CN109213868A (zh) * 2018-11-21 2019-01-15 中国科学院自动化研究所 基于卷积注意力机制网络的实体级别情感分类方法
CN111241842B (zh) * 2018-11-27 2023-05-30 阿里巴巴集团控股有限公司 文本的分析方法、装置和系统
CN111241842A (zh) * 2018-11-27 2020-06-05 阿里巴巴集团控股有限公司 文本的分析方法、装置和系统
CN111259159A (zh) * 2018-11-30 2020-06-09 北京京东尚科信息技术有限公司 数据挖掘方法、装置和计算机可读存储介质
CN109829166B (zh) * 2019-02-15 2022-12-27 重庆师范大学 基于字符级卷积神经网络的民宿顾客意见挖掘方法
CN109829166A (zh) * 2019-02-15 2019-05-31 重庆师范大学 基于字符级卷积神经网络的民宿顾客意见挖掘方法
CN111597296A (zh) * 2019-02-20 2020-08-28 阿里巴巴集团控股有限公司 商品数据的处理方法、装置和系统
CN110348024A (zh) * 2019-07-23 2019-10-18 天津汇智星源信息技术有限公司 基于法律知识图谱的智能识别系统
WO2021051598A1 (zh) * 2019-09-19 2021-03-25 平安科技(深圳)有限公司 文本情感分析模型训练方法、装置、设备及可读存储介质
CN111078840A (zh) * 2019-12-20 2020-04-28 浙江大学 一种基于文档向量的电影评论情感分析方法
CN111078840B (zh) * 2019-12-20 2022-04-08 浙江大学 一种基于文档向量的电影评论情感分析方法
CN111143567A (zh) * 2019-12-30 2020-05-12 成都数之联科技有限公司 一种基于改进神经网络的评论情感分析方法
CN111259116A (zh) * 2020-01-16 2020-06-09 北京珞安科技有限责任公司 基于卷积神经网络的敏感文件检测方法
CN111309859A (zh) * 2020-01-21 2020-06-19 上饶市中科院云计算中心大数据研究院 一种景区网络口碑情感分析方法及装置
CN113821628A (zh) * 2020-06-17 2021-12-21 北京瀚海云星科技有限公司 利用社交媒体短文本进行价值评估的方法和装置、程序、介质
CN112307211A (zh) * 2020-11-09 2021-02-02 深圳市洪堡智慧餐饮科技有限公司 一种基于卷积神经网络和bm25的外卖评论情感极性分析方法
CN112215003A (zh) * 2020-11-09 2021-01-12 深圳市洪堡智慧餐饮科技有限公司 一种基于albert预训练模型和kmean算法的评论标签提取的方法
CN113159831A (zh) * 2021-03-24 2021-07-23 湖南大学 一种基于改进的胶囊网络的评论文本情感分析方法

Similar Documents

Publication Publication Date Title
CN107391483A (zh) 一种基于卷积神经网络的商品评论数据情感分类方法
Mahtab et al. Sentiment analysis on bangladesh cricket with support vector machine
Chen et al. Modeling public mood and emotion: Stock market trend prediction with anticipatory computing approach
CN108427670A (zh) 一种基于语境词向量和深度学习的情感分析方法
CN108446271B (zh) 基于汉字部件特征的卷积神经网络的文本情感分析方法
Akba et al. Assessment of feature selection metrics for sentiment analyses: Turkish movie reviews
CN105550269A (zh) 一种有监督学习的产品评论分析方法及系统
CN108388660B (zh) 一种改进的电商产品痛点分析方法
CN110765260A (zh) 一种基于卷积神经网络与联合注意力机制的信息推荐方法
CN107729309A (zh) 一种基于深度学习的中文语义分析的方法及装置
CN108388554B (zh) 基于协同过滤注意力机制的文本情感识别系统
CN108536801A (zh) 一种基于深度学习的民航微博安保舆情情感分析方法
KR20120109943A (ko) 문장에 내재한 감정 분석을 위한 감정 분류 방법
CN111666480A (zh) 一种基于滚动式协同训练的虚假评论识别方法
CN111767725A (zh) 一种基于情感极性分析模型的数据处理方法及装置
CN107818173B (zh) 一种基于向量空间模型的中文虚假评论过滤方法
CN105740382A (zh) 一种对短评论文本进行方面分类方法
CN108388654A (zh) 一种基于转折句语义块划分机制的情感分类方法
CN107688576A (zh) 一种cnn‑svm模型的构建及倾向性分类方法
CN109325120A (zh) 一种分离用户和产品注意力机制的文本情感分类方法
CN110134934A (zh) 文本情感分析方法和装置
CN105335350A (zh) 一种基于集成学习的语种识别方法
CN106250365A (zh) 基于文本分析的消费者评论中商品属性特征词的提取方法
CN110297986A (zh) 一种微博热点话题的情感倾向分析方法
Chamekh et al. Sentiment analysis based on deep learning in e-commerce

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171124