CN106339368A - 文本情感倾向的获取方法及装置 - Google Patents
文本情感倾向的获取方法及装置 Download PDFInfo
- Publication number
- CN106339368A CN106339368A CN201610721351.0A CN201610721351A CN106339368A CN 106339368 A CN106339368 A CN 106339368A CN 201610721351 A CN201610721351 A CN 201610721351A CN 106339368 A CN106339368 A CN 106339368A
- Authority
- CN
- China
- Prior art keywords
- target text
- word
- text
- emotion
- evaluation object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
本发明实施例提供了一种文本情感倾向的获取方法及装置,涉及自然语言处理技术领域,用于解决现有文本情感倾向获取准确率较低的问题,本发明的主要技术方案为:获取目标文本中的情感词;根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象;基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型;根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向训练预置文本的向量空间模型得到的。本发明用于获取文本的情感倾向。
Description
技术领域
本发明实施例涉及自然语言处理技术领域,尤其涉及一种文本情感倾向的获取方法及装置。
背景技术
近些年来,情感倾向获取技术已成为自然语言处理研究领域的热门话题,情感倾向获取的目标是从文本中挖掘用户表达的观点以及情感极性,文本情感倾向中包含了较有价值的反馈,挖掘文本中情感倾向可用于帮助其他用户做决定。因此情感倾向获取技术在自然语言处理研究领域得到了广大研究者的关注,具有很大的应用价值。而情感倾向获取技术研究主要集中于情感信息提取工作,即提取文本中的情感词和评价对象,情感词指带有情感色彩的词语,在情感倾向获取技术中起着非常重要的作用。
目前,现有的文本情感倾向的获取方法主要分为两类:人工构建和关联规则挖掘。但是,发明人在实现发明的过程中发现了上述两类方法对情感评价对象抽取来说主要存在以下问题:人工构建的方法相当耗时耗力,并且构建出来的评价对象集合,对新出现的对象不能很好的识别;基于关联规则的抽取方法没有充分考虑短语评价对象的结构特征以及评价对象的领域相关性,因此现有文本情感倾向的获取准确率较低。
发明内容
本发明实施例提供一种文本情感倾向的获取方法及装置,用以解决现有文本情感倾向获取准确率较低的问题。
本发明实施例提供一种文本情感倾向的获取方法,包括:
获取目标文本中的情感词;
根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象;
基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型;
根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向,训练预置文本的向量空间模型得到的。
本发明实施例提供一种文本情感倾向的获取装置,包括:
获取单元,用于获取目标文本中的情感词;
所述获取单元,还用于根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象;
建立单元,用于基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型;
预测单元,用于根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向,训练预置文本的向量空间模型得到的。
本发明实施例提供的一种文本情感倾向的获取方法及装置,首先获取目标文本中的情感词,然后根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象,并基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型,最后根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向训练预置文本的向量空间模型得到的。与目前通过人工构建方法或关联规则挖掘方法获取文本的情感倾向相比,本发明实施例根据目标文本的依存语法分析结果及目标文本中的情感词,获取与各个情感词分别对应的评价对象,并基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型,最后根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向。从而通过本发明实施例解决了现有评价对象获取准确率低的问题,进而提高了文本情感倾向的获取准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种文本情感倾向的获取方法流程图;
图2为本发明实施例提供的另一种文本情感倾向的获取方法流程图;
图3为本发明实施例提供的一种文本情感倾向的获取装置结构示意图;
图4为本发明实施例提供的另一种文本情感倾向的获取装置结构示意图;
图5为本发明实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明技术方案的优点更加清楚,下面结合附图和实施例对本发明作详细说明。
本发明实施例提供了一种文本情感倾向的获取方法,如图1所示,所述方法包括:
101、获取目标文本中的情感词。
其中,所述目标文本可以为微博、商品评论、论坛评论、博客等形式的文本数据,本发明实施例不做具体限定。所述情感词为目标文本中带有感情色彩的词汇,包括正面情感词、负面情感词、中性情感词,本发明实施例不做具体限定。
102、根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象。
需要说明的是,依存语法(Dependency Grammar,DG)描述了句子中词之间的依存结构,依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。
在本发明实施例中,若目标文本中的某两个词之间存在依存结构,且其中的一个词为情感词,则可将依存结构中的另一个词确定成与该情感词对应的评价对象。其中,所述依存结构中词与词的关系可以包括主谓关系、动宾关系、定中关系、介宾关系、数量关系、同位关系等,本发明实施例不做具体限定。对于本发明实施例,由于目标文本的依存语法分析结果符合短语的语法结构,因此通过所述目标文本的依存语法分析结果及所述目标文本中的情感词获取的与各个情感词分别对应的评价对象,充分考虑了短语评价对象的结构特征,从而通过本发明实施例提高了评价对象的获取准确率,进而提高了后续文本情感倾向的获取准确率。
例如,目标文本中的A和B是主谓关系,如果B为目标文本中的情感词,则可将A确定成与情感词B对应的评价对象;目标文本中的C和D是动宾关系,如果C为目标文本中的情感词,则可将D确定成与情感词C对应的评价对象;目标文本中的E和F是动宾关系,如果E为目标文本中的情感词,则可将F确定成与情感词E对应的评价对象。
103、基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型。
需要说明的是,为了将情感词与评价对象的处理简化为向量空间中的向量运算,因此需要建立基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型。其中,所述向量空间模型(Vector Space Model,VSM)是将文本内容的处理简化为向量空间中的向量运算,并且它以空间上的相似度表达语义的相似度,直观易懂。当目标文本被表示为目标文本的向量,就可以通过计算向量之间的相似性来度量目标文本间的相似性。
104、根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向。
其中,所述预置分类算法模型是基于预置文本的情感倾向训练预置文本的向量空间模型得到的,所述预置文本是预先设置好的用于训练预置分类算法模型的,预置分类算法模型根据其设置的情感倾向和向量空间模型得到的。需要说明的是,预置文本的向量空间模型获取过程可参照目标文本的向量空间模型获取过程,即通过步骤101-103也可以获取预置文本的向量空间模型。在本发明实施例中,具体可以将目标文本的向量空间模型代入预置分类算法模型中计算目标文本的情感倾向。
本发明实施例提供的一种文本情感倾向的获取方法,首先获取目标文本中的情感词,然后根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象,并基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型,最后根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向训练预置文本的向量空间模型得到的。与目前通过人工构建方法或关联规则挖掘方法获取文本的情感倾向相比,本发明实施例根据目标文本的依存语法分析结果及目标文本中的情感词,获取与各个情感词分别对应的评价对象,并基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型,最后根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向。从而通过本发明实施例解决了现有评价对象获取准确率低的问题,进而提高了文本情感倾向的获取准确率。
本发明实施例提供了另一种文本情感倾向的获取方法,如图2所示,所述方法包括:
201、获取目标文本中的情感词。
其中,所述目标文本可以为微博、商品评论、论坛评论、博客等形式的文本数据,本发明实施例不做具体限定。所述情感词为目标文本中带有感情色彩的词汇,包括正面情感词、负面情感词、中性情感词。
在本发明实施例中,步骤201包括:对所述目标文本进行分词处理;将所述目标文本中的词语与预置情感词典中的情感词语进行匹配,所述预置情感词典中包括多个情感词语;将所述目标文本中与所述情感词语匹配成功的词语确定为情感词。其中,所述预置情感词典可以为现有的情感词典,也可以根据目标文本的特征设置的情感词典,本发明实施例不做具体限定。例如,对目标文本中的某句进行分词后,分词结果为“他/喜欢/这里/的/比赛”,则根据预置情感词典中的情感词,可将分词结构中的“喜欢”确定为情感词。
需要说明的是,本发明实施例可以根据现有的词库对目标文本进行分词处理,并根据词库中的词性对目标文本进行词性标注,所述词性具体可以为动词、名词、形容词、副词等,本发明实施例不做具体限定。
202、根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象。
需要说明的是,依存语法(Dependency Grammar,DG)描述了句子中词之间的依存结构,依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。
对于本发明实施例,所述根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象包括:获取所述依存语法分析结果中的语法关系;判断所述语法关系中是否包括所述情感词;若所述语法关系中包括所述情感词,则将所述语法关系中与所述情感词对应的词语确定为评价对象。其中,所述语法关系可以为主谓关系、动宾关系、定中关系、介宾关系、数量关系、同位关系等,本发明实施例不做具体限定。
例如,对目标文本中的“比赛很精彩”进行分词并词性标注的结果为:比赛/n(名词),很/d(副词),精彩/a(形容词),根据上述词性标注结果得到“比赛很精彩”的依存语法分析结果,然后获取到“比赛很精彩”的依存语法分析结果中的语法关系:“比赛”-“精彩”为主谓关系,接着判断该主谓关系中是否情感词,由于“精彩”为情感词,因此将主谓关系中与“精彩”对应的“比赛”确定为评价对象。
203、基于文档主题生成模型LDA,聚合语义相近的评价对象。
其中,LDA(Latent Dirichlet Allocation,文档主题生成模型)认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。例如,语义相近的评价对象有篮球、足球、排球,则根据文档主题生成模型可将这些语义相近的评价对象聚合。然后为聚合的评价对象配置对应的聚合对象,在本例中根据语义相近的评价对象的实际含义配置聚合对象可以为“体育”。
204、为所述聚合的评价对象配置对应的聚合对象。
其中,所述聚合对象是根据所述语义相近的评价对象归纳得到的。在本发明实施例中,基于文档主题生成模型聚合语义相近的评价对象,可以降低后续建立的目标文本的向量空间模型的稀疏性,从而提高目标文本情感倾向获取的准确率。
205、获取所述评价对象对应的聚合对象。
例如,语义相近的评价对象:篮球、足球、排球聚合后配置的聚合对象为体育;语义相近的评价对象:铅笔、钢笔、圆珠笔聚合后配置的笔。当获取到目标文本中的评价对象后,还需要获取各个评价对象分别对应的聚合对象,即评价对象:篮球、足球、排球对应聚合对象为体育,评价对象:铅笔、钢笔、圆珠笔对应聚合对象为笔。
206、基于所述情感词与所述评价对象的对应关系,以及所述情感词与所述聚合对象的对应关系,建立目标文本的向量空间模型。
在本发明实施例中,根据情感词与所述评价对象的对应关系,以及所述情感词与所述聚合对象的对应关系,建立目标文本的向量空间模型,相对于通过情感词与所述评价对象的对应关系建立目标文本的向量空间模型,增加了向量空间模型建立的维度,即降低目标文本的向量空间模型的稀疏性,而目标文本的向量空间模型建立的维度越高,后续获取目标文本的情感倾向的准确率就越高,因此通过本发明实施例可以提高目标文本情感倾向的获取准确率。
例如,情感词与评价对象的对应关系包括:喜欢-篮球、爱好-足球、偏爱-排球,评价对象篮球、足球、排球聚合后配置的聚合对象为体育,则根据情感词与所述评价对象的对应关系:喜欢-篮球、爱好-足球、偏爱-排球,情感词与所述聚合对象的对应关系:喜欢-体育、爱好-体育、偏爱-体育,建立目标文本的向量空间模型。
207、根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向。
其中,所述预置分类算法模型是基于预置文本的情感倾向训练预置文本的向量空间模型得到的。所述预置文本是预先设置好的用于训练预置分类算法模型的,预置分类算法模型根据其设置的情感倾向和向量空间模型得到的。需要说明的是,预置文本的向量空间模型获取过程可参照目标文本的向量空间模型获取过程,在本发明实施例中,具体可以将目标文本的向量空间模型代入预置分类算法模型中计算目标文本的情感倾向。
本发明实施例提供了另一种文本情感倾向的获取方法,首先获取目标文本中的情感词,然后根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象,并基于文档主题生成模型LDA聚合语义相近的评价对象,为所述聚合的评价对象配置对应的聚合对象,接着根据所述情感词与所述评价对象的对应关系,以及所述情感词与所述聚合对象的对应关系,建立目标文本的向量空间模型,最后根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向。由于根据所述情感词与所述评价对象的对应关系,以及所述情感词与所述聚合对象的对应关系,建立目标文本的向量空间模型增加了向量空间模型建立的维度,即降低目标文本的向量空间模型的稀疏性,而目标文本的向量空间模型建立的维度越高,后续获取目标文本的情感倾向的准确率就越高,因此通过本发明实施例可以进一步提高目标文本情感倾向的获取准确率。
进一步地,本发明实施例提供一种文本情感倾向的预测装置,如图3所示,所述装置包括:获取单元31、建立单元32、预测单元33。
获取单元31,用于获取目标文本中的情感词;
所述获取单元31,还用于根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象;
建立单元32,用于基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型;
预测单元33,用于根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向,训练预置文本的向量空间模型得到的。
需要说明的是,本发明实施例提供的一种文本情感倾向的获取装置所涉及各功能单元的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。
本发明实施例提供的文本情感倾向的获取装置,首先获取单元获取目标文本中的情感词,并根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象,然后建立单元基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型,最后预测单元根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向训练预置文本的向量空间模型得到的。与目前通过人工构建方法或关联规则挖掘方法获取文本的情感倾向相比,本发明实施例根据目标文本的依存语法分析结果及目标文本中的情感词,获取与各个情感词分别对应的评价对象,并基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型,最后根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向。从而通过本发明实施例解决了现有评价对象获取准确率低的问题,进而提高了文本情感倾向的获取准确率。
进一步地,本发明实施例提供另一种文本情感倾向的预测装置,如图4所示,所述装置包括:获取单元41、建立单元42、预测单元43。
获取单元41,用于获取目标文本中的情感词;
所述获取单元41,还用于根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象;
建立单元42,用于基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型;
预测单元43,用于根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向,训练预置文本的向量空间模型得到的。
进一步地,所述装置进一步包括:
聚合单元44,用于基于文档主题生成模型LDA,聚合语义相近的评价对象;
配置单元45,用于为所述聚合的评价对象配置对应的聚合对象,所述聚合对象是根据所述语义相近的评价对象归纳得到的。
对于本发明实施例,所述建立单元42包括:
获取模块421,用于获取所述评价对象对应的聚合对象;
建立模块422,用于基于所述情感词与所述评价对象的对应关系,以及所述情感词与所述聚合对象的对应关系,建立目标文本的向量空间模型。
对于本发明实施例,所述获取单元41包括:
获取模块411,用于获取所述依存语法分析结果中的语法关系;
判断模块412,用于判断所述语法关系中是否包括所述情感词;
确定模块413,用于若所述语法关系中包括所述情感词,则将所述语法关系中与所述情感词对应的词语确定为评价对象。
在本发明实施例中,所述获取单元41还包括:
分词模块414,用于对所述目标文本进行分词处理;
匹配模块415,用于将所述目标文本中的词语与预置情感词典中的情感词语进行匹配,所述预置情感词典中包括多个情感词语;
所述确定模块413,还用于将所述目标文本中与所述情感词语匹配成功的词语确定为情感词。
需要说明的是,本发明实施例提供的另一种文本情感倾向的获取装置所涉及各功能单元的其他相应描述,可以参考图2所示方法的对应描述,在此不再赘述,但应当明确,本实施例中的装置能够对应实现前述方法实施例中的全部内容。
本发明实施例提供了另一种文本情感倾向的获取装置,首先获取单元获取目标文本中的情感词,并根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象,然后聚合单元基于文档主题生成模型LDA聚合语义相近的评价对象,配置单元为所述聚合的评价对象配置对应的聚合对象,接着建立单元根据所述情感词与所述评价对象的对应关系,以及所述情感词与所述聚合对象的对应关系,建立目标文本的向量空间模型,最后预测单元根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向。由于根据所述情感词与所述评价对象的对应关系,以及所述情感词与所述聚合对象的对应关系,建立目标文本的向量空间模型增加了向量空间模型建立的维度,即降低目标文本的向量空间模型的稀疏性,而目标文本的向量空间模型建立的维度越高,后续获取目标文本的情感倾向的准确率就越高,因此通过本发明实施例可以提高目标文本情感倾向的获取准确率。
图5示例了一种服务器的结构示意图,如图5所示,该服务器可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。通信接口520可以用于服务器与客户端之间的信息传输。处理器510可以调用存储器530中的逻辑指令,以执行如下方法:获取目标文本中的情感词;根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象;基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型;根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向训练预置文本的向量空间模型得到的。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种文本情感倾向的获取方法,其特征在于,包括:
获取目标文本中的情感词;
根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象;
基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型;
根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向训练预置文本的向量空间模型得到的。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象之后,所述方法还包括:
基于文档主题生成模型LDA,聚合语义相近的评价对象;
为所述聚合的评价对象配置对应的聚合对象,所述聚合对象是根据所述语义相近的评价对象归纳得到的。
3.根据权利要求2所述的方法,其特征在于,所述基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型包括:
获取所述评价对象对应的聚合对象;
基于所述情感词与所述评价对象的对应关系,以及所述情感词与所述聚合对象的对应关系,建立目标文本的向量空间模型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象包括:
获取所述依存语法分析结果中的语法关系;
判断所述语法关系中是否包括所述情感词;
若所述语法关系中包括所述情感词,则将所述语法关系中与所述情感词对应的词语确定为评价对象。
5.根据权利要求1所述的方法,其特征在于,所述获取目标文本中的情感词包括:
对所述目标文本进行分词处理;
将所述目标文本中的词语与预置情感词典中的情感词语进行匹配,所述预置情感词典中包括多个情感词语;
将所述目标文本中与所述情感词语匹配成功的词语确定为情感词。
6.一种文本情感倾向的获取装置,其特征在于,包括:
获取单元,用于获取目标文本中的情感词;
所述获取单元,还用于根据所述目标文本的依存语法分析结果及所述目标文本中的情感词,获取与各个情感词分别对应的评价对象;
建立单元,用于基于所述情感词与所述评价对象的对应关系建立目标文本的向量空间模型;
预测单元,用于根据所述目标文本的向量空间模型和预置分类算法模型,预测所述目标文本的情感倾向,所述预置分类算法模型是基于预置文本的情感倾向训练预置文本的向量空间模型得到的。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
聚合单元,用于基于文档主题生成模型LDA,聚合语义相近的评价对象;
配置单元,用于为所述聚合的评价对象配置对应的聚合对象,所述聚合对象是根据所述语义相近的评价对象归纳得到的。
8.根据权利要求7所述的装置,其特征在于,所述建立单元包括:
获取模块,用于获取所述评价对象对应的聚合对象;
建立模块,用于基于所述情感词与所述评价对象的对应关系,以及所述情感词与所述聚合对象的对应关系,建立目标文本的向量空间模型。
9.根据权利要求6所述的装置,其特征在于,所述获取单元包括:
获取模块,用于获取所述依存语法分析结果中的语法关系;
判断模块,用于判断所述语法关系中是否包括所述情感词;
确定模块,用于若所述语法关系中包括所述情感词,则将所述语法关系中与所述情感词对应的词语确定为评价对象。
10.根据权利要求6所述的装置,其特征在于,所述获取单元还包括:
分词模块,用于对所述目标文本进行分词处理;
匹配模块,用于将所述目标文本中的词语与预置情感词典中的情感词语进行匹配,所述预置情感词典中包括多个情感词语;
所述确定模块,还用于将所述目标文本中与所述情感词语匹配成功的词语确定为情感词。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610721351.0A CN106339368A (zh) | 2016-08-24 | 2016-08-24 | 文本情感倾向的获取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610721351.0A CN106339368A (zh) | 2016-08-24 | 2016-08-24 | 文本情感倾向的获取方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106339368A true CN106339368A (zh) | 2017-01-18 |
Family
ID=57825357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610721351.0A Pending CN106339368A (zh) | 2016-08-24 | 2016-08-24 | 文本情感倾向的获取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106339368A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106951412A (zh) * | 2017-03-24 | 2017-07-14 | 苏州大学 | 一种中文情感表达组合抽取方法及装置 |
CN107133224A (zh) * | 2017-04-25 | 2017-09-05 | 中国人民大学 | 一种基于主题词的语言生成方法 |
CN108062304A (zh) * | 2017-12-19 | 2018-05-22 | 北京工业大学 | 一种基于机器学习的商品评论数据的情感分析方法 |
CN109726384A (zh) * | 2017-10-31 | 2019-05-07 | 北京国双科技有限公司 | 评价关系的生成方法及相关装置 |
CN109783800A (zh) * | 2018-12-13 | 2019-05-21 | 北京百度网讯科技有限公司 | 情感关键词的获取方法、装置、设备及存储介质 |
CN109977392A (zh) * | 2017-12-28 | 2019-07-05 | 北京京东尚科信息技术有限公司 | 一种文本特征分析的方法和装置 |
CN110096694A (zh) * | 2018-01-30 | 2019-08-06 | 北京京东尚科信息技术有限公司 | 基于自然语言处理的信息生成方法和装置 |
CN111324810A (zh) * | 2020-02-17 | 2020-06-23 | 北京奇艺世纪科技有限公司 | 一种信息过滤方法、装置及电子设备 |
CN111339752A (zh) * | 2020-02-18 | 2020-06-26 | 哈尔滨工业大学 | 一种多任务联合学习的面向评价对象的情感分析方法 |
CN111427880A (zh) * | 2020-03-26 | 2020-07-17 | 中国工商银行股份有限公司 | 数据处理的方法、装置、计算设备以及介质 |
CN113836939A (zh) * | 2021-09-24 | 2021-12-24 | 北京百度网讯科技有限公司 | 基于文本的数据分析方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101634983A (zh) * | 2008-07-21 | 2010-01-27 | 华为技术有限公司 | 一种文本分类方法和装置 |
CN103544242A (zh) * | 2013-09-29 | 2014-01-29 | 广东工业大学 | 面向微博的情感实体搜索系统 |
CN103631961A (zh) * | 2013-12-17 | 2014-03-12 | 苏州大学张家港工业技术研究院 | 一种情感词与评价对象的关系识别方法 |
CN104794208A (zh) * | 2015-04-24 | 2015-07-22 | 清华大学 | 基于微博文本上下文信息的情绪分类方法及系统 |
-
2016
- 2016-08-24 CN CN201610721351.0A patent/CN106339368A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101634983A (zh) * | 2008-07-21 | 2010-01-27 | 华为技术有限公司 | 一种文本分类方法和装置 |
CN103544242A (zh) * | 2013-09-29 | 2014-01-29 | 广东工业大学 | 面向微博的情感实体搜索系统 |
CN103631961A (zh) * | 2013-12-17 | 2014-03-12 | 苏州大学张家港工业技术研究院 | 一种情感词与评价对象的关系识别方法 |
CN104794208A (zh) * | 2015-04-24 | 2015-07-22 | 清华大学 | 基于微博文本上下文信息的情绪分类方法及系统 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106951412A (zh) * | 2017-03-24 | 2017-07-14 | 苏州大学 | 一种中文情感表达组合抽取方法及装置 |
CN106951412B (zh) * | 2017-03-24 | 2020-07-24 | 苏州大学 | 一种中文情感表达组合抽取方法及装置 |
CN107133224A (zh) * | 2017-04-25 | 2017-09-05 | 中国人民大学 | 一种基于主题词的语言生成方法 |
CN107133224B (zh) * | 2017-04-25 | 2020-11-03 | 中国人民大学 | 一种基于主题词的语言生成方法 |
CN109726384A (zh) * | 2017-10-31 | 2019-05-07 | 北京国双科技有限公司 | 评价关系的生成方法及相关装置 |
CN108062304A (zh) * | 2017-12-19 | 2018-05-22 | 北京工业大学 | 一种基于机器学习的商品评论数据的情感分析方法 |
CN109977392B (zh) * | 2017-12-28 | 2024-02-09 | 北京京东尚科信息技术有限公司 | 一种文本特征分析的方法和装置 |
CN109977392A (zh) * | 2017-12-28 | 2019-07-05 | 北京京东尚科信息技术有限公司 | 一种文本特征分析的方法和装置 |
CN110096694A (zh) * | 2018-01-30 | 2019-08-06 | 北京京东尚科信息技术有限公司 | 基于自然语言处理的信息生成方法和装置 |
CN109783800A (zh) * | 2018-12-13 | 2019-05-21 | 北京百度网讯科技有限公司 | 情感关键词的获取方法、装置、设备及存储介质 |
CN109783800B (zh) * | 2018-12-13 | 2024-04-12 | 北京百度网讯科技有限公司 | 情感关键词的获取方法、装置、设备及存储介质 |
CN111324810A (zh) * | 2020-02-17 | 2020-06-23 | 北京奇艺世纪科技有限公司 | 一种信息过滤方法、装置及电子设备 |
CN111339752A (zh) * | 2020-02-18 | 2020-06-26 | 哈尔滨工业大学 | 一种多任务联合学习的面向评价对象的情感分析方法 |
CN111427880B (zh) * | 2020-03-26 | 2023-09-05 | 中国工商银行股份有限公司 | 数据处理的方法、装置、计算设备以及介质 |
CN111427880A (zh) * | 2020-03-26 | 2020-07-17 | 中国工商银行股份有限公司 | 数据处理的方法、装置、计算设备以及介质 |
CN113836939B (zh) * | 2021-09-24 | 2023-07-21 | 北京百度网讯科技有限公司 | 基于文本的数据分析方法和装置 |
CN113836939A (zh) * | 2021-09-24 | 2021-12-24 | 北京百度网讯科技有限公司 | 基于文本的数据分析方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106339368A (zh) | 文本情感倾向的获取方法及装置 | |
CN110717339B (zh) | 语义表示模型的处理方法、装置、电子设备及存储介质 | |
CN109657054B (zh) | 摘要生成方法、装置、服务器及存储介质 | |
CN111177569B (zh) | 基于人工智能的推荐处理方法、装置及设备 | |
KR102170199B1 (ko) | 비교 세트를 사용한 입력 예시들 분류 | |
CN106649603B (zh) | 一种基于网页文本数据情感分类的指定信息推送方法 | |
CN109271493A (zh) | 一种语言文本处理方法、装置和存储介质 | |
CN111783468B (zh) | 文本处理方法、装置、设备和介质 | |
US20220405481A1 (en) | Content generation using target content derived modeling and unsupervised language modeling | |
CN110427610A (zh) | 文本分析方法、装置、计算机装置及计算机存储介质 | |
CN111309910A (zh) | 文本信息挖掘方法及装置 | |
CN108108468A (zh) | 一种基于概念和文本情感的短文本情感分析方法和装置 | |
CN109766557A (zh) | 一种情感分析方法、装置、存储介质及终端设备 | |
CN108304373A (zh) | 语义词典的构建方法、装置、存储介质和电子装置 | |
CN102609424B (zh) | 评价信息抽取方法和设备 | |
US20220301579A1 (en) | Automatic video tagging | |
CN109961041A (zh) | 一种视频识别方法、装置及存储介质 | |
CN112131345B (zh) | 文本质量的识别方法、装置、设备及存储介质 | |
CN113761868B (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
JP7178394B2 (ja) | 音声信号を処理するための方法、装置、機器、および媒体 | |
CN103631874A (zh) | 社交平台的ugc标签类别确定方法和装置 | |
CN112836487A (zh) | 一种自动评论方法、装置、计算机设备及存储介质 | |
CN112800292A (zh) | 一种基于模态特定和共享特征学习的跨模态检索方法 | |
CN111159358A (zh) | 多意图识别训练和使用方法及装置 | |
CN111563158A (zh) | 文本排序方法、排序装置、服务器和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170118 |