CN105930368A - 一种情感分类方法及系统 - Google Patents

一种情感分类方法及系统 Download PDF

Info

Publication number
CN105930368A
CN105930368A CN201610226987.8A CN201610226987A CN105930368A CN 105930368 A CN105930368 A CN 105930368A CN 201610226987 A CN201610226987 A CN 201610226987A CN 105930368 A CN105930368 A CN 105930368A
Authority
CN
China
Prior art keywords
node
vector
phrase
word
binary tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610226987.8A
Other languages
English (en)
Other versions
CN105930368B (zh
Inventor
傅向华
徐莹莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN201610226987.8A priority Critical patent/CN105930368B/zh
Publication of CN105930368A publication Critical patent/CN105930368A/zh
Application granted granted Critical
Publication of CN105930368B publication Critical patent/CN105930368B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用计算机技术领域,提供了一种情感分类方法及系统,该方法包括:在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量,所述结点的向量为基于短语级的向量;通过与基准词的相似度计算,确定结点的情感标签,所述基准词为具有极强正负性的情感词,所述情感标签为情感倾向值;从根结点逐层向下递归,计算得到每个结点的反馈向量,该结点的反馈向量为基于短语级的向量;根据结点的向量、反馈向量、及情感标签,通过分类器函数进行情感分类。本发明通过构建短语二叉树结构,短语级的运算,同时获取每个结点的情感标签,进而根据结点的向量、反馈向量、及情感标签进行分类,通过双向传播实现了全文信息的捕获,提高了分类准确率。

Description

一种情感分类方法及系统
技术领域
本发明属于计算机技术领域,尤其涉及一种情感分类方法及系统。
背景技术
文本情感分类是对持有情感色彩的主观性文本进行分析和处理,归纳总结并推理出文本情感倾向,根据粒度的不同可以分为篇章级,段落级,句子级,词语级。目前针对英文文本情感分析的研究较多,例如Turney运用无监督学习方法对产品评论数据进行极性探测;Pang采用机器学习方法对电影评论进行情感分类,这两个工作都是对文档级的文本数据进行二分类。
传统的情感分析方法主要基于词语级的特征表达方式,词嵌入表示方式被用于进行句子级或文档级情感分析。但是,由于词嵌入表示方式仅能表示单独的词,所以在进行更大粒度的情感分析时,需要考虑语义组合问题。目前应用于自然语言处理都存在一定的缺陷:1、现有技术都是针对词语级语法树结构进行构建深度学习网络,使得训练层级过深,时间和计算复杂度过高;2、现有技术在对分类器训练时,非终端结点情感标签的处理主要有2种方式:1)内部结点无标签,只有整个句子的标签,导致影响分类准确率,2)人工标注,花费大量劳力,而且标注人过少,容易存在主观偏差;3、在特征训练过程中采用单向传播的方法,即只能从叶子结点(词语级)向上传播,而不能从根结点(整个句子)向下传播,导致不能捕获全文信息。
发明内容
本发明的目的在于提供一种情感分类的方法及系统,旨在解决由于现有技术针对词语级训练导致计算复杂度过高、内部结点无标签影响准确率、及单向传播导致不能捕获全文信息的问题。
一方面,本发明提供了一种情感分类方法,所述方法包括下述步骤:
在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量,所述结点的向量为基于短语级的向量;
通过与基准词的相似度计算,确定结点的情感标签,所述基准词为具有极强正负性的情感词,所述情感标签为情感倾向值;
从根结点逐层向下递归,计算得到每个结点的反馈向量,所述结点的反馈向量为基于短语级的向量;
根据结点的向量、反馈向量、及情感标签,通过分类器函数进行情感分类。
另一方面,本发明提供了一种情感分类系统,所述系统包括:
向量计算单元,用于在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量,所述结点的向量为基于短语级的向量;
情感标签确定单元,用于通过与基准词的相似度计算,确定结点的情感标签,所述基准词为具有极强正负性的情感词,所述情感标签为情感倾向值;
反馈向量计算单元,用于从根结点逐层向下递归,计算得到每个结点的反馈向量,所述结点的反馈向量为基于短语级的向量;
情感分类单元,用于根据结点的向量、反馈向量、及情感标签,通过分类器函数进行情感分类。
在本发明实施例中,构建短语二叉树结构,进行短语级的运算,双向传播,先从叶子结点逐层向上递归,计算得到每个结点的向量,再从根结点逐层向下递归,计算得到每个结点的反馈向量,同时获取每个结点的情感标签,根据结点的向量、反馈向量、及情感标签进行分类,通过双向传播实现全文信息的捕获,提高分类准确率。
附图说明
图1是本发明实施例一提供的情感分类方法的实现流程图;
图2是本发明实施例一提供的情感分类方法中计算结点向量的实现流程;
图3是本发明实施例二提供的情感分类方法的实现流程;
图4示出了本发明实施例二提供的情感分类方法中转换短语二叉树的实现流程;
图5是本发明实施例三提供的情感分类系统的结构示意图;以及
图6是本发明实施例四提供的情感分类系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的情感分类方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量,所述结点的向量为基于短语级的向量。
在本发明实施例中,短语二叉树的叶子结点是短语而非词语,因此,需要获取到短语级的向量作为初始输入数据。首先,需要得到词语级的向量,然后由词语向量通过一定的组合方式计算得到短语向量,该短语向量即为短语二叉树的结点的向量。在实际应用中,可以通过随机初始化、或无监督深度学习工具Word2Vec学习语义词嵌入表示,通过随机初始化可以不需要任何预训练方法去学习词嵌入表示,而使用无监督深度学习工具Word2Vec学习语义词嵌入表示可以有效地在大量文本数据中学习到高质量的词嵌入表达。
具体地,图2示出了本发明实施例一提供的情感分类方法中计算结点向量的实现流程,在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量包括:
在步骤S201中,在短语二叉树中,计算孩子结点的向量;
其中,在短语二叉树中,计算孩子结点的向量,包括:
获取结点中每个词语的初始词语向量,将所有词语的初始词语向量映射形成一词嵌入矩阵,所述词嵌入矩阵中每一列表示一个词语;
根据每个词语的索引,在词嵌入矩阵中检索对应的词语向量;
将每个结点中所有词语的词语向量进行求和、或点积运算,得到每个结点的向量。
在本发明实施例中,短语二叉树中每个结点都是一个短语,短语由词语组成,对于词语而言,所有的词语都保存在一个词典中,每个词语通过随机初始化、或无监督深度学习工具Word2Vec学习语义词嵌入表示都得到一个初始词语向量w∈RN,其中,R为实数,N为向量维度,w是实数一维向量,把所有词语的初始词语向量映射到一个词嵌入矩阵L∈RN×V中,其中,R为实数,N为向量维度,V为词语的数量,词嵌入矩阵L∈RN×V的每一列表示一个词语,每个词语都有一索引i,索引i可以用来检索词语对应的特征向量。在进行检索时,我们需要乘上一二值向量ρ,二值向量ρ除了第i个位置之外,其余位置的数值都为0,对应检索的公式为:wi=Lρi
在得到词语向量后,通过线性组合函数计算短语向量,可以对词语向量进行求和或点积运算得到短语向量,即为结点的向量。具体地,若一短语v=(w1,w2,…,wo)由若干个词语组成,将所有的词语向量求和:或将所有的词语向量进行点积运算:v=w1⊙w2⊙…⊙wo,得到短语向量,即为孩子结点的向量。通过上述这两种方法得到的词语向量不仅捕获了语法信息,而且减少了训练复杂度。
在步骤S202中,根据所述孩子结点的向量,计算父结点的向量。
其中,根据所述孩子结点的向量,计算父结点的向量,包括:
获取左孩子结点的向量、及右孩子结点的向量;
通过公式计算出父结点p的向量,其中,p为父结点的向量,v1为左孩子结点的向量,v2为右孩子结点的向量,b为偏置项。
在本发明实施例中,在步骤S201中得到了短语向量,即孩子结点的向量,根据孩子结点的向量和短语二叉树,可以实现逐层的计算任意长度的语义组合向量。具体地,基于短语二叉树结构通过孩子结点的向量(v1,v2)利用深度学习网络计算出父结点的向量表示p,其公式为:其中,p为父结点的向量,v1为左孩子结点的向量,v2为右孩子结点的向量,b为偏置项。
进一步地,由父结点的向量p,可以得到重构层该重构层计算公式为其中,v′1为重构层的左孩子结点的向量,v′2为重构层的右孩子结点的向量,b′为偏置项。
在本实施例中,实现了通过计算重构层复现了短语二叉树初始的左、右孩子结点的向量,理想状态下,重构层的左、右孩子结点的向量与短语二叉树初始的左、右孩子结点的向量相等,但是在实际运算中会出现不可避免的误差,其误差值可以通过如下公式计算:
在步骤S102中,通过与基准词的相似度计算,确定结点的情感标签,所述基准词为具有极强正负性的情感词,所述情感标签为情感倾向值。
在本发明实施例中,通过计算和基准词的相似度得到情感倾向值,基准词的相似度计算涉及到“语法”、“语义”、“句法”、“概念”和“义原”等单位,计算到“义原”使得计算更准确。“概念”描述了一个词语的语义,每一个词语可以表达为一个或多个概念,而“义原”是描述概念的一种知识表示语言,是更小的单位,细化到“义原”层次,通过上下位关系组成树状结构层次。对两个义原o和o,它们的相似度等于树状结构层次中的路径距离长度disij,公式如下其中,α为一个可以调节的参数,disij表示两个义原o和o在义原层次结构体系中的距离长度,disij>0。通过该等式计算得到所有概念下的义原相似度,两个概念Ui和Uj的相似度就是所有义原相似度的最大值,而词语相似度则取所有概念相似度的最大值。假设给定两个词语wp和wq,如果wp包含了g个概念:Up1,Up1,…,Upg,wq有h个概念:Uq1,Uq1,…,Uqh,那么这两个词的相似度就是包含的所有概念的相似度最大值,等式如下:概念相似度则通过取其包含的义原相似度的最大值:要通过计算与基准词的相似度获取结点的情感标签,预先选出a对具有极强正负极性的情感词作为基准词,再计算结点的词语与基准词之间的相似度,相似度值作为度量该结点的词语的情感倾向度。结点的词语的情感倾向值Glabel(w)将会通过以下等式计算:其中,其中pi表示正向基准词,ni表示负向基准词,如果Glabel(w)>0,则表示词语w的情感倾向是正向;如果Glabel(w)<0,则表示词语w的情感倾向是负向;如果Glabel(w)=0,则表示词语w的情感倾向是中立。
利用下面的规则,基于树结构获取树中所有结点的情感倾向:
对于程度副词,能够很大程度地加强情感倾向的程度,基于这个理论,当短语包含程度副词时,其修饰的词语的情感倾向值Glabel(w)就翻倍,即为2Glabel(w)。例如,如果情感词“喜欢”被词语“很”修饰组成“很喜欢”这个短语v,那么该短语v的情感倾向值为Glabel(v)=2Glabel(wlike),翻倍后需要做检查,即如果Glabel(v)>1,则该短语的情感倾向值设置为Glabel(v)=1,由于预设情感倾向值的取值范围为[-1,1]。
对于反意词,当情感词被具有反意作用的词语修饰时,这个短语的意思将会发生转折。这种情况下,需要将情感倾向值反向计算。例如,情感词“喜欢”如果被连接上词语“不”而变为“不喜欢”,那么这个短语的情感倾向值就会变为Glabel(v)=-Glabel(wlike)。
除了上述两种情况,基于词语的情感倾向值利用线性组合的方法结合树结
在本发明实施例中,结合结点的向量、反馈向量、及情感标签,通过分类器函数进行情感分类,计算公式如下:其中,y(p;θ)为结点p处的预测分布,θ是参数、Wl为权值、p为结点的向量、p为结点的反馈向量。
通过构建短语二叉树结构,进行短语级的运算,先从叶子结点逐层向上递归,计算得到每个结点的向量,再从根结点逐层向下递归,计算得到每个结点的反馈向量,同时获取每个结点的情感标签,根据结点的向量、反馈向量、及情感标签进行分类,通过双向传播实现了全文信息的捕获,提高分类准确率。
实施例二:
图3示出了本发明实施例二提供的情感分类方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S301中,将短语依存树转换为短语二叉树。
图4示出了本发明实施例二提供的情感分类方法中转换短语二叉树的实现流程,将短语依存树转换为短语二叉树,包括:
在步骤S401中,对所述短语依存树从低端逐层向上解析,获取每一层中的三元组结构。
在本实施例中,在构建短语二叉树过程中,存储短语依存树中的每一个内嵌结构Ti,根据短语依存树结构,我们从低端开始逐层向上进行解析,对于每一层以三元组形式存在的结构Troot→Tleft Tright,其中,Troot为短语依存树的根结点、Tleft为短语依存树的左孩子结点、Tright为短语依存树的右孩子结点。
在步骤S402中,将所述三元组结构中的根结点存储为短语二叉树的左孩子,所述三元组结构中的右孩子存储为短语二叉树的右孩子,并连接所述短语二叉树的左孩子、右孩子,生成所述短语二叉树的父结点。
在本实施例中,短语依存树的根结点Troot存储为短语二叉树的左孩子,短语依存树的右孩子Tright仍然为短语二叉树的右孩子,连接它们并存储生成的父结点P。
在步骤S403中,将所述短语二叉树的父结点存储为短语二叉树的右孩子,所述三元组结构中的左孩子存储为短语二叉树的左孩子。
在本实施例中,再将所述短语二叉树的父结点P存储为短语二叉树的右孩子,所述三元组结构中的左孩子Tleft存储为短语二叉树的左孩子。
在步骤S302中,在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量,所述结点的向量为基于短语级的向量。
在步骤S303中,通过与基准词的相似度计算,确定结点的情感标签,所述基准词为具有极强正负性的情感词,所述情感标签为情感倾向值。
在步骤S304中,从根结点逐层向下递归,计算得到每个结点的反馈向量,所述结点的反馈向量为基于短语级的向量。
在步骤S305中,根据结点的向量、反馈向量、及情感标签,通过分类器函数进行情感分类。
在本发明实施例中,步骤S302到S305的实施方式可参考前述实施例一中步骤S101到S104的描述,在此不再赘述。
在本实施例中,短语依存树因为词语的组合,层次已经减少了许多,当转换成短语二叉树的时候,层级会变得更浅,进一步地减少了训练复杂度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
实施例三:
图5示出了本发明实施例三提供的情感分类系统的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:向量计算单元51、情感标签确定单元52、反馈向量计算单元53以及情感分类单元54,其中:
向量计算单元51,用于在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量,所述结点的向量为基于短语级的向量。
情感标签确定单元52,用于通过与基准词的相似度计算,确定结点的情感标签,所述基准词为具有极强正负性的情感词,所述情感标签为情感倾向值。
反馈向量计算单元53,用于从根结点逐层向下递归,计算得到每个结点的反馈向量,所述结点的反馈向量为基于短语级的向量。
情感分类单元54,用于根据结点的向量、反馈向量、及情感标签,通过分类器函数进行情感分类。
在本发明实施例中,情感分类系统的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。该系统各单元的实施方式具体可参考前述实施例一的描述,在此不再赘述。
实施例四:
图6示出了本发明实施例四提供的情感分类系统的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。
在本发明实施例中,情感分类系统其中包括:转换单元50、向量计算单元51、情感标签确定单元52、反馈向量计算单元53以及情感分类单元54,其中:
转换单元50,用于将短语依存树转换为短语二叉树。
向量计算单元51,用于在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量,所述结点的向量为基于短语级的向量。
情感标签确定单元52,用于通过与基准词的相似度计算,确定结点的情感标签,所述基准词为具有极强正负性的情感词,所述情感标签为情感倾向值。
反馈向量计算单元53,用于从根结点逐层向下递归,计算得到每个结点的反馈向量,所述结点的反馈向量为基于短语级的向量。
情感分类单元54,用于根据结点的向量、反馈向量、及情感标签,通过分类器函数进行情感分类。
在本发明实施例中,情感分类系统的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。该系统各单元的实施方式具体可参考前述实施例一、实施例二的描述,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种情感分类方法,其特征在于,所述方法包括下述步骤:
在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量,所述结点的向量为基于短语级的向量;
通过与基准词的相似度计算,确定结点的情感标签,所述基准词为具有极强正负性的情感词,所述情感标签为情感倾向值;
从根结点逐层向下递归,计算得到每个结点的反馈向量,所述结点的反馈向量为基于短语级的向量;
根据结点的向量、反馈向量、及情感标签,通过分类器函数进行情感分类。
2.如权利要求1所述的方法,其特征在于,在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量的步骤之前,所述方法还包括:
将短语依存树转换为短语二叉树。
3.如权利要求2所述的方法,其特征在于,将短语依存树转换为短语二叉树的步骤,包括:
对所述短语依存树从低端逐层向上解析,获取每一层中的三元组结构;
将所述三元组结构中的根结点存储为短语二叉树的左孩子,所述三元组结构中的右孩子存储为短语二叉树的右孩子,并连接所述短语二叉树的左孩子、右孩子,生成所述短语二叉树的父结点;
将所述短语二叉树的父结点存储为短语二叉树的右孩子,所述三元组结构中的左孩子存储为短语二叉树的左孩子。
4.如权利要求1所述的方法,其特征在于,在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量的步骤,包括:
在短语二叉树中,计算孩子结点的向量;
根据所述孩子结点的向量,计算父结点的向量。
5.如权利要求4所述的方法,其特征在于,在短语二叉树中,计算孩子结点的向量的步骤,包括:
获取结点中每个词语的初始词语向量,将所有词语的初始词语向量映射形成一词嵌入矩阵,所述词嵌入矩阵中每一列表示一个词语;
根据每个词语的索引,在词嵌入矩阵中检索对应的词语向量;
将每个结点中所有词语的词语向量进行求和、或点积运算,得到每个结点的向量。
6.如权利要求4所述的方法,其特征在于,根据所述孩子结点的向量,计算父结点的向量的步骤,包括:
获取左孩子结点的向量、及右孩子结点的向量;
通过公式计算出父结点p的向量,其中,p为父结点的向量,v1为左孩子结点的向量,v2为右孩子结点的向量,b为偏置项。
7.如权利要求1所述的方法,其特征在于,从根结点逐层向下递归,计算得到每个结点的反馈向量的步骤,包括:
在短语二叉树中,根据父结点的向量,计算父结点的反馈向量;
根据所述父结点的反馈向量,计算孩子结点的反馈向量。
8.如权利要求1所述的方法,其特征在于,根据所述父结点的反馈向量,计算孩子结点的反馈向量的步骤,包括:
通过公式p=f(Vp),计算父结点的反馈向量,其中,p为父结点的向量,p为父结点的反馈向量,V为转换矩阵,V∈Rn×N,其中,R为实数;n×N表示n行N列的矩阵;
通过公式计算出孩子结点的反馈向量,其中,p为父结点的向量,p为父结点的反馈向量,为左孩子结点的反馈向量,为右孩子结点的反馈向量,b为偏置项。
9.一种情感分类系统,其特征在于,所述系统包括:
向量计算单元,用于在短语二叉树中,从叶子结点逐层向上递归,计算得到每个结点的向量,所述结点的向量为基于短语级的向量;
情感标签确定单元,用于通过与基准词的相似度计算,确定结点的情感标签,所述基准词为具有极强正负性的情感词,所述情感标签为情感倾向值;
反馈向量计算单元,用于从根结点逐层向下递归,计算得到每个结点的反馈向量,所述结点的反馈向量为基于短语级的向量;
情感分类单元,用于根据结点的向量、反馈向量、及情感标签,通过分类器函数进行情感分类。
10.如权利要求9所述的系统,其特征在于,所述系统还包括:
转换单元,用于将短语依存树转换为短语二叉树。
CN201610226987.8A 2016-04-13 2016-04-13 一种情感分类方法及系统 Expired - Fee Related CN105930368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610226987.8A CN105930368B (zh) 2016-04-13 2016-04-13 一种情感分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610226987.8A CN105930368B (zh) 2016-04-13 2016-04-13 一种情感分类方法及系统

Publications (2)

Publication Number Publication Date
CN105930368A true CN105930368A (zh) 2016-09-07
CN105930368B CN105930368B (zh) 2019-07-30

Family

ID=56838798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610226987.8A Expired - Fee Related CN105930368B (zh) 2016-04-13 2016-04-13 一种情感分类方法及系统

Country Status (1)

Country Link
CN (1) CN105930368B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107066560A (zh) * 2017-03-30 2017-08-18 东软集团股份有限公司 文本分类的方法和装置
CN107122378A (zh) * 2017-01-13 2017-09-01 北京小度信息科技有限公司 对象处理方法及装置
CN107169142A (zh) * 2017-06-15 2017-09-15 厦门快商通科技股份有限公司 一种自动更新的文档情感分析系统及方法
CN107895027A (zh) * 2017-11-17 2018-04-10 合肥工业大学 个性情感知识图谱建立方法及装置
CN108205522A (zh) * 2016-12-16 2018-06-26 北京酷我科技有限公司 情感标注的方法及其系统
CN109388707A (zh) * 2017-08-11 2019-02-26 腾讯科技(深圳)有限公司 短文本分类方法及装置
CN110019779A (zh) * 2017-09-13 2019-07-16 中移(杭州)信息技术有限公司 一种文本分类方法、模型训练方法及装置
CN110263333A (zh) * 2019-06-06 2019-09-20 北京融汇金信信息技术有限公司 一种基于树模型的情感分析处理方法及装置
CN110390102A (zh) * 2019-07-22 2019-10-29 腾讯科技(深圳)有限公司 一种情感分析的方法和相关装置
CN110781289A (zh) * 2019-11-07 2020-02-11 北京邮电大学 一种保留非结构化文本语义的文本可视化方法
CN112905736A (zh) * 2021-01-27 2021-06-04 郑州轻工业大学 一种基于量子理论的无监督文本情感分析方法
CN113220893A (zh) * 2021-07-09 2021-08-06 北京邮电大学 基于情感分析的产品反馈分析系统及方法
CN114328797A (zh) * 2021-11-09 2022-04-12 腾讯科技(深圳)有限公司 内容搜索方法、装置、电子设备、存储介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106211A (zh) * 2011-11-11 2013-05-15 中国移动通信集团广东有限公司 客户咨询文本的情感识别方法及装置
CN103473380A (zh) * 2013-09-30 2013-12-25 南京大学 一种计算机文本情感分类方法
CN104965822A (zh) * 2015-07-29 2015-10-07 中南大学 一种基于计算机信息处理技术的中文文本情感分析方法
US9336192B1 (en) * 2012-11-28 2016-05-10 Lexalytics, Inc. Methods for analyzing text

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106211A (zh) * 2011-11-11 2013-05-15 中国移动通信集团广东有限公司 客户咨询文本的情感识别方法及装置
US9336192B1 (en) * 2012-11-28 2016-05-10 Lexalytics, Inc. Methods for analyzing text
CN103473380A (zh) * 2013-09-30 2013-12-25 南京大学 一种计算机文本情感分类方法
CN104965822A (zh) * 2015-07-29 2015-10-07 中南大学 一种基于计算机信息处理技术的中文文本情感分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RICHARD SOCHER 等: "Semi-Supervised Recursive Autoencoders", 《PROCEEDINGS OF THE 2011 CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE PROCESSING》 *
孙艳 等: "基于依存关联分析的情感词扩展", 《北京邮电大学学报》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108205522A (zh) * 2016-12-16 2018-06-26 北京酷我科技有限公司 情感标注的方法及其系统
CN107122378A (zh) * 2017-01-13 2017-09-01 北京小度信息科技有限公司 对象处理方法及装置
CN107122378B (zh) * 2017-01-13 2021-03-16 北京星选科技有限公司 对象处理方法、装置及移动终端
CN107066560B (zh) * 2017-03-30 2019-12-06 东软集团股份有限公司 文本分类的方法和装置
CN107066560A (zh) * 2017-03-30 2017-08-18 东软集团股份有限公司 文本分类的方法和装置
CN107169142A (zh) * 2017-06-15 2017-09-15 厦门快商通科技股份有限公司 一种自动更新的文档情感分析系统及方法
CN109388707B (zh) * 2017-08-11 2022-12-30 腾讯科技(深圳)有限公司 短文本分类方法及装置
CN109388707A (zh) * 2017-08-11 2019-02-26 腾讯科技(深圳)有限公司 短文本分类方法及装置
CN110019779A (zh) * 2017-09-13 2019-07-16 中移(杭州)信息技术有限公司 一种文本分类方法、模型训练方法及装置
CN110019779B (zh) * 2017-09-13 2021-06-08 中移(杭州)信息技术有限公司 一种文本分类方法、模型训练方法及装置
CN107895027A (zh) * 2017-11-17 2018-04-10 合肥工业大学 个性情感知识图谱建立方法及装置
CN110263333A (zh) * 2019-06-06 2019-09-20 北京融汇金信信息技术有限公司 一种基于树模型的情感分析处理方法及装置
CN110263333B (zh) * 2019-06-06 2022-11-15 北京融汇金信信息技术有限公司 一种基于树模型的情感分析处理方法及装置
CN110390102A (zh) * 2019-07-22 2019-10-29 腾讯科技(深圳)有限公司 一种情感分析的方法和相关装置
CN110781289A (zh) * 2019-11-07 2020-02-11 北京邮电大学 一种保留非结构化文本语义的文本可视化方法
CN110781289B (zh) * 2019-11-07 2022-07-15 北京邮电大学 一种保留非结构化文本语义的文本可视化方法
CN112905736A (zh) * 2021-01-27 2021-06-04 郑州轻工业大学 一种基于量子理论的无监督文本情感分析方法
CN112905736B (zh) * 2021-01-27 2023-09-19 郑州轻工业大学 一种基于量子理论的无监督文本情感分析方法
CN113220893B (zh) * 2021-07-09 2021-10-01 北京邮电大学 基于情感分析的产品反馈分析系统及方法
CN113220893A (zh) * 2021-07-09 2021-08-06 北京邮电大学 基于情感分析的产品反馈分析系统及方法
CN114328797A (zh) * 2021-11-09 2022-04-12 腾讯科技(深圳)有限公司 内容搜索方法、装置、电子设备、存储介质及程序产品
CN114328797B (zh) * 2021-11-09 2024-03-19 腾讯科技(深圳)有限公司 内容搜索方法、装置、电子设备、存储介质及程序产品

Also Published As

Publication number Publication date
CN105930368B (zh) 2019-07-30

Similar Documents

Publication Publication Date Title
CN105930368B (zh) 一种情感分类方法及系统
Perone et al. Evaluation of sentence embeddings in downstream and linguistic probing tasks
Ganegedara Natural Language Processing with TensorFlow: Teach language to machines using Python's deep learning library
CN110162636A (zh) 基于d-lstm的文本情绪原因识别方法
CN109558487A (zh) 基于层次性多注意力网络的文档分类方法
CN109933664A (zh) 一种基于情感词嵌入的细粒度情绪分析改进方法
CN110619044B (zh) 一种情感分析方法、系统、存储介质及设备
CA3135387A1 (en) Architectures for modeling comment and edit relations
CN112597302B (zh) 基于多维评论表示的虚假评论检测方法
CN112861522B (zh) 基于双重注意力机制的方面级情感分析方法、系统及模型
CN112131345B (zh) 文本质量的识别方法、装置、设备及存储介质
CN108536735A (zh) 基于多通道自编码器的多模态词汇表示方法与系统
Zhao et al. Adaptive learning of local semantic and global structure representations for text classification
Xu et al. BERT gated multi-window attention network for relation extraction
CN113157919A (zh) 语句文本方面级情感分类方法及系统
Burges Towards the machine comprehension of text: An essay
Morinaga et al. Improvement of reverse dictionary by tuning word vectors and category inference
CN117649567B (zh) 数据标注方法、装置、计算机设备和存储介质
Li et al. BERTtoCNN: Similarity-preserving enhanced knowledge distillation for stance detection
Lindén et al. Evaluating combinations of classification algorithms and paragraph vectors for news article classification
Korade et al. Strengthening Sentence Similarity Identification Through OpenAI Embeddings and Deep Learning.
Nazarizadeh et al. Using Group Deep Learning and Data Augmentation in Persian Sentiment Analysis
CN117669764A (zh) 基于语言模型与主动学习的数据标注方法、介质及设备
Yu Analysis of task degree of English learning based on deep learning framework and image target recognition
Shi et al. Attention-based bidirectional hierarchical LSTM networks for text semantic classification

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190730