CN101127042A - 一种基于语言模型的情感分类方法 - Google Patents
一种基于语言模型的情感分类方法 Download PDFInfo
- Publication number
- CN101127042A CN101127042A CNA2007100713704A CN200710071370A CN101127042A CN 101127042 A CN101127042 A CN 101127042A CN A2007100713704 A CNA2007100713704 A CN A2007100713704A CN 200710071370 A CN200710071370 A CN 200710071370A CN 101127042 A CN101127042 A CN 101127042A
- Authority
- CN
- China
- Prior art keywords
- text
- language model
- speech
- emotion
- corpus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于语言模型的情感分类方法。借助搜索引擎,从互联网上收集博客文章,并基于投票的办法对文章进行情感极性的标注,形成情感语料库;以语言模型为基础,从标注好的语料库中学习得到情感语言模型;对待分类的文本同样学习得到对应的语言模型,从而通过语言模型间的距离计算对文本进行情感分类。与现有的情感分类方法相比,可利用语言模型通过统计方式准确把握自然语言内在的结构规律,能摆脱对情感词典的依赖性,提高已有机器学习类情感分类方法的精度。
Description
技术领域
本发明涉及数据挖掘、机器学习、中文信息处理,特别是涉及一种基于语言模型的情感分类方法。
背景技术
随着互联网应用的繁荣,特别是Web2.0革命的到来,越来越多的用户参与到了网络活动中,如撰写博客,在论坛上发表评论,等等。这些由个体用户产生的数据与传统权威媒体产生的数据相比,具有其鲜明的特点,如带个人情感,更有真实性,语言比较口语化等等。
用户产生数据的积累也给一些传统问题的解决和新应用的产生提供了可能性。如在传统的企业产品质量跟踪中,需要通过用户问卷调查等费时费力的手段进行,而且所获得的反馈数据的时效性和数量都不能得到保证;而借助互联网论坛上大量用户针对产品所发表的评论,我们通过分析其中的正面和负面评价,可以方便快速地获得终端消费者对于产品的意见,从而可以在减少人工劳动、保证反馈数量的同时,也有效地解决了时效性的问题。
在针对用户产生数据的处理和应用中,其中最关键的一个问题是情感分类问题。情感分类的任务是指判别一段文本的情感极性,确定所表达的观点是正面,负面还是中性的。传统的情感分类方法主要分为两类:基于词典和基于机器学习。基于词典的方法中,需要事先定义一个标注了词的情感极性的词典,句子或者文章的情感极性通过在其中出现的正面或者负面情感词汇的多少,以一定的计算方法进行衡量;基于机器学习的方法则把情感分类的问题归类为文本分类的问题,采用了在文本分类中常用的如朴素贝叶斯模型,支持向量机等分类方法,通过对标注好情感极性的文本的训练学习,得到分类器,对新的文本进行情感分类。但是基于词典的方法易受词典大小的影响,不够灵活;借助文本分类思想的机器学习方法将文本视为由一系列相互间独立的词组成的集合,纯粹基于概率的思想,没有从语言的内在结构出发。
语言模型是自然语言的数学模型,描述了自然语言的统计和结构方面的内在规律,最早被用于语音识别和自然语言处理领域。从1998年开始,开始被应用到信息检索领域,具体方法为:为每一篇文本,包括查询条件,估计一个语言模型,然后根据文本的语言模型和查询条件的语言模型之间的相似度,对文本进行排序。语言模型由于其成熟的概率理论和简单的使用方式,在很多的实验中都有着优异的表现。
发明内容
正是由于语言模型在理论上的成熟和实际应用中的简单有效,以及其对自然语言本质的描述能力,本发明的目的在于提供一种基于语言模型的情感分类方法,将该模型应用到情感分类中,以弥补原有方法的不足。
本发明解决其技术问题采用的技术方案是:
1)情感语料库收集:通过收集互联网上的博客文章作为原始语料库,再对文本情感极性进行人工标注,判断是正面,负面还是中性评价;
2)词空间定义:对所收集的语料库文本进行分词处理,将其中的词取出,组成词空间V;
3)情感语言模型建立:基于以上对标注的情感语料库中的文本进行分词处理后,计算词空间V中的每个词在正面和负面语料库中出现的概率,分别得出正面情感语言模型LMP和负面情感语言模型LMN;
4)文本语言模型建立:对待分类的文本进行分词处理,计算词空间V中的每个词在文本中出现的概率,得到该文本的语言模型LMT;
5)文本情感判断:计算文本语言模型LMT与正面情感语言模型LMP、负面情感语言模型LMN之间的距离,分别记为DistP和DistN;当DistP>DistN时,判别文本的情感为负面,当DistP<DistN时,则判别文本的情感为正面,当DistP=DistN时,则判别文本的情感为中性。
所述的步骤1)中的博客文章是利用百度提供的博客搜索服务得到的。
为了得到搜索结果,提供给百度博客搜索服务的查询条件为电影名称、数码产品的名称。
每个查询所取的结果数目可根据应用环境的要求进行设置。
所述的步骤2)中的词为去掉停用词之后的集合。
所述的步骤3),4)中的词w在语料库C中或文本D中出现的概率的计算方法为:
其中,
X代表语料库C或文本D;
C(w,X)为词w在语料库C或文本D中出现的次数;
所述的步骤3),4)中所得到的情感语言模型和文本语言模型实际表示为词空间V中所有词的概率分布情况;正面情感模型LMP,负面情感模型LMN和文本情感模型LMT可分别表示为:P(w|LMP),P(w|LMN)和P(w|LMT),其中w为词空间V中的词。
所述的步骤5)中,两个语言模型LMA和LMB之间的距离的计算公式为:
两个语言模型之间的距离越大,他们之间的相似度越小。
本发明与背景技术相比,具有有益的效果是:
与现有基于情感词典的情感分类方法不同,无需借助事先定义的情感词典,不受词典词汇量大小的影响,应用灵活;与现有采用文本分类思想基于机器学习的情感分类方法不同,不再把文本看成是由独立的词组成的一个集合,而从语言的更本质属性、结构出发,对文本进行建模,更好地捕捉了自然语言在统计和结构方面的内在规律,从而提高已有机器学习类情感分类方法的精度。
附图说明
图1为本发明的流程图。
具体实施方式
本发明的处理流程如图1所示。首先确定提供给百度博客搜索的查询条件,为电影名称,数码产品名称,如“十面埋伏”,“诺基亚N72”,“IBM T60”等;百度博客搜索返回的结果可能会有很多,根据实际应用中的需求,仅选择其中的一部分,如要求准确率高则选择全部的搜索结果,如要求较少的训练时间则选择前100个或200个结果,然后利用提取的博客文章建立原始情感语料库。对这些原始语料库中的文本进行人工标注,确定其情感极性,即为正面,负面还是中性的;标注的方式采用投票的方式进行,对一篇文本根据所获得的正面,负面和中性的票数决定;由于中文文本中的词之间没有明显的间隔符隔开,对语料库中的文本进行中文分词处理(如哈尔滨工业大学信息检索实验室提供的中文分词程序),并去除其中的没有意义的停用词(如“的”,“是”,“这”,“我们”等),将剩余的词组成词空间V。根据词频,分别计算词空间中的词在正面情感语料库和负面情感语料库中出现的概率,得到对应的正面情感语言模型和负面情感语言模型。对新的文本同样计算词空间中的词在其中出现的概率,得到文本语言模型。最后根据文本语言模型和两类情感语言模型间的距离计算,判断文本的情感极性,即距离越小,两个模型的相似度越大,文本就归类为对应的情感极性。
本发明实施的关键主要包括:博客文章的获取,博客文章极性的人工标注,语言模型间距离的计算。
1.博客文章的获取
博客文章的获取通过百度提供的博客搜索服务获得,获取的办法为:首先提供查询条件,包括了电影名称,手机、电脑等数码产品名称,之所以选择此类名称作为查询条件是因为包含这些名称的博客文章往往是有可能包含一些带有情感评论因素的语句。在返回的结果页面中,通过分析网页源码,抽取出每个查询结果对应的URL,通过网络爬虫将URL对应的文章爬取下来。
在百度博客搜索的结果页面中抽取博客文章URL的方法如下:查找网页HTML源码中的<a style=″color:#008000″href=字符串,其后″″内的即为某个结果对应原文的URL地址。
2.博客文章极性的人工标注
博客文章感情极性的标注由十名标注者完成。由于不同的人背景不同,对于同样的文本可能会有不同的情感极性判断,因此,文章最终极性采用投票的方式确定:
对某篇文章D,假设标注为正面极性的票数为a,负面极性的票数为b,认为是中性的票数为c,D的极性判断方式如下:
当a≠b时,
若max(a,b,c)=a,那么确定D的感情极性为正面;
若max(a,b,c)=b,那么确定D的感情极性为负面;
若max(a,b,c)=c,那么确定D的感情极性为中性;
若max(a,b,c)=a,c或b,c,则舍弃该文章;
当a=b时,
确定D的感情极性为中性。
3.语言模型间距离的计算
由于词空间中词的个数较多,得到的语言模型的表示维数就很大,在计算这样两个大维数的模型间的距离时,需要采用一定的策略减少计算量,提高计算的效率。
假设两个语言模型LMA和LMB分别表示为P(w|LMA),P(w|LMB),w为词空间中的词,其实际的距离计算公式可以转化为:
其中,
wi′为满足P(wi′|LMA)≠0,且P(wi′|LMB)≠0,并出现在词空间中的词。
Claims (9)
1.一种基于语言模型的情感分类方法,其特征在于:
1)情感语料库收集:通过收集互联网上的博客文章作为原始语料库,再对文本情感极性进行人工标注,判断是正面,负面还是中性评价;
2)词空间定义:对所收集的语料库文本进行分词处理,将其中的词取出,组成词空间V;
3)情感语言模型建立:基于以上对标注的情感语料库中的文本进行分词处理后,计算词空间V中的每个词在正面和负面语料库中出现的概率,分别得出正面情感语言模型LMP和负面情感语言模型LMN;
4)文本语言模型建立:对待分类的文本进行分词处理,计算词空间V中的每个词在文本中出现的概率,得到该文本的语言模型LMT;
5)文本情感判断:计算文本语言模型LMT与正面情感语言模型LMP、负面情感语言模型LMN之间的距离,分别记为DistP和DistN;当DistP>DistN时,判别文本的情感为负面,当DistP<DistN时,则判别文本的情感为正面,当DistP=DistN时,则判别文本的情感为中性。
2.根据权利要求1所述的一种基于语言模型的情感分类方法,其特征在于:所述的步骤1)中的博客文章是利用百度提供的博客搜索服务得到的。
3.根据权利要求2所述的一种基于语言模型的情感分类方法,其特征在于:为了得到搜索结果,提供给百度博客搜索服务的查询条件为电影名称、数码产品的名称。
4.根据权利要求2所述的一种基于语言模型的情感分类方法,其特征在于,每个查询所取的结果数目可根据应用环境的要求进行设置。
5.根据权利要求1所述的一种基于语言模型的情感分类方法,其特征在于,所述的步骤2)中的词为去掉停用词之后的集合。
6.根据权利要求1所述的一种基于语言模型的情感分类方法,其特征在于,所述的步骤3),4)中的词w在语料库C中或文本D中出现的概率的计算方法为:
其中,
X代表语料库C或文本D;
C(w,X)为词w在语料库C或文本D中出现的次数;
7.根据权利要求1所述的一种基于语言模型的情感分类方法,其特征在于,步骤3),4)中所得到的情感语言模型和文本语言模型实际表示为词空间V中所有词的概率分布情况;正面情感模型LMP,负面情感模型LMN和文本情感模型LMT可分别表示为:P(w|LMP),P(w|LMN)和P(w|LMT),其中w为词空间V中的词。
8.根据权利要求1所述的一种基于语言模型的情感分类方法,其特征在于,步骤5)中,两个语言模型LMA和LMB之间的距离的计算公式为:
9.根据权利要求8所述的一种基于语言模型的情感分类方法,其特征在于,两个语言模型之间的距离越大,他们之间的相似度越小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007100713704A CN101127042A (zh) | 2007-09-21 | 2007-09-21 | 一种基于语言模型的情感分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007100713704A CN101127042A (zh) | 2007-09-21 | 2007-09-21 | 一种基于语言模型的情感分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101127042A true CN101127042A (zh) | 2008-02-20 |
Family
ID=39095074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007100713704A Pending CN101127042A (zh) | 2007-09-21 | 2007-09-21 | 一种基于语言模型的情感分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101127042A (zh) |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101876974A (zh) * | 2009-04-30 | 2010-11-03 | 日电(中国)有限公司 | 文本情感极性分类系统和方法 |
CN101887414A (zh) * | 2009-02-04 | 2010-11-17 | Kddi株式会社 | 对包含图像符号的文本消息传达的评价自动打分的服务器 |
CN102004560A (zh) * | 2010-12-01 | 2011-04-06 | 哈尔滨工业大学 | 语句级汉字输入方法中的用户词识别方法与在线一次性学习方法及机器学习系统 |
CN102279890A (zh) * | 2011-09-02 | 2011-12-14 | 苏州大学 | 基于微博的情感词提取收集方法 |
CN102708164A (zh) * | 2012-04-26 | 2012-10-03 | 苏州大学 | 电影期望值的计算方法及系统 |
CN102760153A (zh) * | 2011-04-21 | 2012-10-31 | 帕洛阿尔托研究中心公司 | 将词典知识合并入svm学习以改进情感分类 |
CN102789498A (zh) * | 2012-07-16 | 2012-11-21 | 钱钢 | 基于集成学习的中文评论文本的情感分类方法与系统 |
CN103106211A (zh) * | 2011-11-11 | 2013-05-15 | 中国移动通信集团广东有限公司 | 客户咨询文本的情感识别方法及装置 |
CN103324662A (zh) * | 2013-04-18 | 2013-09-25 | 中国科学院计算技术研究所 | 社会媒体事件的动态观点演变的可视化方法及设备 |
CN103324758A (zh) * | 2013-07-10 | 2013-09-25 | 苏州大学 | 一种新闻分类方法和系统 |
CN103425755A (zh) * | 2013-07-31 | 2013-12-04 | 王永恒 | 一种基于微博分析电视节目收视情况的方法 |
CN103488623A (zh) * | 2013-09-04 | 2014-01-01 | 中国科学院计算技术研究所 | 多种语言文本数据分类处理方法 |
CN103593334A (zh) * | 2012-08-15 | 2014-02-19 | 中国电信股份有限公司 | 一种用于判断文本情感程度的方法和系统 |
CN103593431A (zh) * | 2013-11-11 | 2014-02-19 | 北京锐安科技有限公司 | 网络舆情分析方法和装置 |
CN103678720A (zh) * | 2014-01-02 | 2014-03-26 | 中国标准化研究院 | 用户反馈数据处理方法和装置 |
CN103729459A (zh) * | 2014-01-10 | 2014-04-16 | 北京邮电大学 | 一种构建情感分类模型的方法 |
CN103793503A (zh) * | 2014-01-24 | 2014-05-14 | 北京理工大学 | 一种基于web文本的观点挖掘与分类的方法 |
CN103970864A (zh) * | 2014-05-08 | 2014-08-06 | 清华大学 | 基于微博文本的情绪分类和情绪成分分析方法及系统 |
CN104268197A (zh) * | 2013-09-22 | 2015-01-07 | 中科嘉速(北京)并行软件有限公司 | 一种行业评论数据细粒度情感分析方法 |
CN104794241A (zh) * | 2015-05-11 | 2015-07-22 | 苏州大学 | 一种基于情绪倾向性的新闻分类方法及系统 |
CN101739430B (zh) * | 2008-11-21 | 2015-11-25 | 中国科学院计算技术研究所 | 一种基于关键词的文本情感分类器的训练方法和分类方法 |
CN105740349A (zh) * | 2016-01-25 | 2016-07-06 | 重庆邮电大学 | 一种结合Doc2vec和卷积神经网络的情感分类方法 |
CN105955959A (zh) * | 2016-05-06 | 2016-09-21 | 深圳大学 | 一种情感分类方法及系统 |
CN106294507A (zh) * | 2015-06-10 | 2017-01-04 | 华中师范大学 | 跨语言的观点数据分类方法和装置 |
CN106372236A (zh) * | 2016-09-13 | 2017-02-01 | 东软集团股份有限公司 | 评论数据的处理方法和装置 |
CN106844750A (zh) * | 2017-02-16 | 2017-06-13 | 深圳追科技有限公司 | 一种基于客服机器人中情感安抚的人机交互方法及系统 |
CN107220293A (zh) * | 2017-04-26 | 2017-09-29 | 天津大学 | 基于情绪的文本分类方法 |
CN107688576A (zh) * | 2016-08-04 | 2018-02-13 | 中国科学院声学研究所 | 一种cnn‑svm模型的构建及倾向性分类方法 |
CN107943790A (zh) * | 2017-11-23 | 2018-04-20 | 中译语通科技股份有限公司 | 一种基于最大熵模型和tf‑idf特征的情感分析方法 |
CN107943299A (zh) * | 2017-12-07 | 2018-04-20 | 上海智臻智能网络科技股份有限公司 | 情感呈现方法和装置、计算机设备及计算机可读存储介质 |
CN108139580A (zh) * | 2015-10-02 | 2018-06-08 | 卡尔蔡司显微镜有限责任公司 | 显微镜控制方法和显微镜 |
CN110069602A (zh) * | 2019-04-15 | 2019-07-30 | 网宿科技股份有限公司 | 语料标注方法、装置、服务器及存储介质 |
CN111090753A (zh) * | 2018-10-24 | 2020-05-01 | 马上消费金融股份有限公司 | 分类模型的训练方法、分类方法、装置、计算机存储介质 |
CN112101033A (zh) * | 2020-09-01 | 2020-12-18 | 广州威尔森信息科技有限公司 | 一种汽车口碑的情感分析方法和装置 |
CN112966071A (zh) * | 2021-02-03 | 2021-06-15 | 北京奥鹏远程教育中心有限公司 | 一种用户反馈信息分析方法、装置、设备及可读存储介质 |
-
2007
- 2007-09-21 CN CNA2007100713704A patent/CN101127042A/zh active Pending
Cited By (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101739430B (zh) * | 2008-11-21 | 2015-11-25 | 中国科学院计算技术研究所 | 一种基于关键词的文本情感分类器的训练方法和分类方法 |
CN101887414B (zh) * | 2009-02-04 | 2014-07-16 | Kddi株式会社 | 对包含图像符号的文本消息传达的评价自动打分的服务器 |
CN101887414A (zh) * | 2009-02-04 | 2010-11-17 | Kddi株式会社 | 对包含图像符号的文本消息传达的评价自动打分的服务器 |
CN101876974A (zh) * | 2009-04-30 | 2010-11-03 | 日电(中国)有限公司 | 文本情感极性分类系统和方法 |
CN101876974B (zh) * | 2009-04-30 | 2014-07-02 | 日电(中国)有限公司 | 文本情感极性分类系统和方法 |
CN102004560A (zh) * | 2010-12-01 | 2011-04-06 | 哈尔滨工业大学 | 语句级汉字输入方法中的用户词识别方法与在线一次性学习方法及机器学习系统 |
CN102004560B (zh) * | 2010-12-01 | 2013-07-24 | 哈尔滨工业大学 | 语句级汉字输入方法中的用户词识别方法与机器学习系统 |
CN102760153B (zh) * | 2011-04-21 | 2017-12-05 | 帕洛阿尔托研究中心公司 | 将词典知识合并入svm学习以改进情感分类 |
CN102760153A (zh) * | 2011-04-21 | 2012-10-31 | 帕洛阿尔托研究中心公司 | 将词典知识合并入svm学习以改进情感分类 |
CN102279890A (zh) * | 2011-09-02 | 2011-12-14 | 苏州大学 | 基于微博的情感词提取收集方法 |
CN103106211B (zh) * | 2011-11-11 | 2017-05-03 | 中国移动通信集团广东有限公司 | 客户咨询文本的情感识别方法及装置 |
CN103106211A (zh) * | 2011-11-11 | 2013-05-15 | 中国移动通信集团广东有限公司 | 客户咨询文本的情感识别方法及装置 |
CN102708164B (zh) * | 2012-04-26 | 2014-11-05 | 苏州大学 | 电影期望值的计算方法及系统 |
CN102708164A (zh) * | 2012-04-26 | 2012-10-03 | 苏州大学 | 电影期望值的计算方法及系统 |
CN102789498A (zh) * | 2012-07-16 | 2012-11-21 | 钱钢 | 基于集成学习的中文评论文本的情感分类方法与系统 |
CN102789498B (zh) * | 2012-07-16 | 2014-08-06 | 钱钢 | 基于集成学习的中文评论文本的情感分类方法与系统 |
CN103593334A (zh) * | 2012-08-15 | 2014-02-19 | 中国电信股份有限公司 | 一种用于判断文本情感程度的方法和系统 |
CN103593334B (zh) * | 2012-08-15 | 2017-07-28 | 中国电信股份有限公司 | 一种用于判断文本情感程度的方法和系统 |
CN103324662A (zh) * | 2013-04-18 | 2013-09-25 | 中国科学院计算技术研究所 | 社会媒体事件的动态观点演变的可视化方法及设备 |
CN103324662B (zh) * | 2013-04-18 | 2016-12-28 | 中国科学院计算技术研究所 | 社会媒体事件的动态观点演变的可视化方法及设备 |
CN103324758B (zh) * | 2013-07-10 | 2017-07-14 | 苏州大学 | 一种新闻分类方法和系统 |
CN103324758A (zh) * | 2013-07-10 | 2013-09-25 | 苏州大学 | 一种新闻分类方法和系统 |
CN103425755A (zh) * | 2013-07-31 | 2013-12-04 | 王永恒 | 一种基于微博分析电视节目收视情况的方法 |
CN103425755B (zh) * | 2013-07-31 | 2016-09-28 | 王永恒 | 一种基于微博分析电视节目收视情况的方法 |
CN103488623A (zh) * | 2013-09-04 | 2014-01-01 | 中国科学院计算技术研究所 | 多种语言文本数据分类处理方法 |
CN104268197B (zh) * | 2013-09-22 | 2017-11-07 | 中科嘉速(北京)并行软件有限公司 | 一种行业评论数据细粒度情感分析方法 |
CN104268197A (zh) * | 2013-09-22 | 2015-01-07 | 中科嘉速(北京)并行软件有限公司 | 一种行业评论数据细粒度情感分析方法 |
CN103593431A (zh) * | 2013-11-11 | 2014-02-19 | 北京锐安科技有限公司 | 网络舆情分析方法和装置 |
CN103678720B (zh) * | 2014-01-02 | 2017-02-22 | 中国标准化研究院 | 用户反馈数据处理方法和装置 |
CN103678720A (zh) * | 2014-01-02 | 2014-03-26 | 中国标准化研究院 | 用户反馈数据处理方法和装置 |
CN103729459A (zh) * | 2014-01-10 | 2014-04-16 | 北京邮电大学 | 一种构建情感分类模型的方法 |
CN103793503B (zh) * | 2014-01-24 | 2017-02-08 | 北京理工大学 | 一种基于web文本的观点挖掘与分类的方法 |
CN103793503A (zh) * | 2014-01-24 | 2014-05-14 | 北京理工大学 | 一种基于web文本的观点挖掘与分类的方法 |
CN103970864B (zh) * | 2014-05-08 | 2017-09-22 | 清华大学 | 基于微博文本的情绪分类和情绪成分分析方法及系统 |
CN103970864A (zh) * | 2014-05-08 | 2014-08-06 | 清华大学 | 基于微博文本的情绪分类和情绪成分分析方法及系统 |
CN104794241A (zh) * | 2015-05-11 | 2015-07-22 | 苏州大学 | 一种基于情绪倾向性的新闻分类方法及系统 |
CN106294507A (zh) * | 2015-06-10 | 2017-01-04 | 华中师范大学 | 跨语言的观点数据分类方法和装置 |
CN108139580A (zh) * | 2015-10-02 | 2018-06-08 | 卡尔蔡司显微镜有限责任公司 | 显微镜控制方法和显微镜 |
CN105740349A (zh) * | 2016-01-25 | 2016-07-06 | 重庆邮电大学 | 一种结合Doc2vec和卷积神经网络的情感分类方法 |
CN105740349B (zh) * | 2016-01-25 | 2019-03-08 | 重庆邮电大学 | 一种结合Doc2vec和卷积神经网络的情感分类方法 |
CN105955959A (zh) * | 2016-05-06 | 2016-09-21 | 深圳大学 | 一种情感分类方法及系统 |
CN105955959B (zh) * | 2016-05-06 | 2019-04-26 | 深圳大学 | 一种情感分类方法及系统 |
CN107688576B (zh) * | 2016-08-04 | 2020-06-16 | 中国科学院声学研究所 | 一种cnn-svm模型的构建及倾向性分类方法 |
CN107688576A (zh) * | 2016-08-04 | 2018-02-13 | 中国科学院声学研究所 | 一种cnn‑svm模型的构建及倾向性分类方法 |
CN106372236A (zh) * | 2016-09-13 | 2017-02-01 | 东软集团股份有限公司 | 评论数据的处理方法和装置 |
CN106844750A (zh) * | 2017-02-16 | 2017-06-13 | 深圳追科技有限公司 | 一种基于客服机器人中情感安抚的人机交互方法及系统 |
CN107220293A (zh) * | 2017-04-26 | 2017-09-29 | 天津大学 | 基于情绪的文本分类方法 |
CN107220293B (zh) * | 2017-04-26 | 2020-08-18 | 天津大学 | 基于情绪的文本分类方法 |
CN107943790A (zh) * | 2017-11-23 | 2018-04-20 | 中译语通科技股份有限公司 | 一种基于最大熵模型和tf‑idf特征的情感分析方法 |
CN107943299A (zh) * | 2017-12-07 | 2018-04-20 | 上海智臻智能网络科技股份有限公司 | 情感呈现方法和装置、计算机设备及计算机可读存储介质 |
CN111090753A (zh) * | 2018-10-24 | 2020-05-01 | 马上消费金融股份有限公司 | 分类模型的训练方法、分类方法、装置、计算机存储介质 |
CN110069602A (zh) * | 2019-04-15 | 2019-07-30 | 网宿科技股份有限公司 | 语料标注方法、装置、服务器及存储介质 |
CN110069602B (zh) * | 2019-04-15 | 2021-11-19 | 网宿科技股份有限公司 | 语料标注方法、装置、服务器及存储介质 |
CN112101033A (zh) * | 2020-09-01 | 2020-12-18 | 广州威尔森信息科技有限公司 | 一种汽车口碑的情感分析方法和装置 |
CN112101033B (zh) * | 2020-09-01 | 2021-06-15 | 广州威尔森信息科技有限公司 | 一种汽车口碑的情感分析方法和装置 |
CN112966071A (zh) * | 2021-02-03 | 2021-06-15 | 北京奥鹏远程教育中心有限公司 | 一种用户反馈信息分析方法、装置、设备及可读存储介质 |
CN112966071B (zh) * | 2021-02-03 | 2023-09-08 | 北京奥鹏远程教育中心有限公司 | 一种用户反馈信息分析方法、装置、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101127042A (zh) | 一种基于语言模型的情感分类方法 | |
CN103678564B (zh) | 一种基于数据挖掘的互联网产品调研系统 | |
WO2018218705A1 (zh) | 一种基于神经网络概率消歧的网络文本命名实体识别方法 | |
CN104391942B (zh) | 基于语义图谱的短文本特征扩展方法 | |
CN103678670B (zh) | 一种微博热词与热点话题挖掘系统及方法 | |
CN101751455B (zh) | 采用人工智能技术自动产生标题的方法 | |
CN111767725B (zh) | 一种基于情感极性分析模型的数据处理方法及装置 | |
CN104199972A (zh) | 一种基于深度学习的命名实体关系抽取与构建方法 | |
CN103605658B (zh) | 一种基于文本情感分析的搜索引擎系统 | |
CN104268200A (zh) | 一种基于深度学习的非监督命名实体语义消歧方法 | |
CN105512687A (zh) | 训练情感分类模型和文本情感极性分析的方法及系统 | |
CN103544255A (zh) | 基于文本语义相关的网络舆情信息分析方法 | |
CN104268197A (zh) | 一种行业评论数据细粒度情感分析方法 | |
CN107153658A (zh) | 一种基于关键字加权算法的舆情热词发现方法 | |
CN104834747A (zh) | 基于卷积神经网络的短文本分类方法 | |
CN104778209A (zh) | 一种针对千万级规模新闻评论的观点挖掘方法 | |
CN104484380A (zh) | 个性化搜索方法及装置 | |
CN103207913A (zh) | 商品细粒度语义关系的获取方法和系统 | |
CN106126502A (zh) | 一种基于支持向量机的情感分类系统及方法 | |
CN110362678A (zh) | 一种自动提取中文文本关键词的方法与装置 | |
CN103049470A (zh) | 基于情感相关度的观点检索方法 | |
CN105843796A (zh) | 一种微博情感倾向分析方法及装置 | |
CN103324700A (zh) | 一种基于Web信息的本体概念属性学习方法 | |
CN111309910A (zh) | 文本信息挖掘方法及装置 | |
CN101719129A (zh) | 一种采用人工智能技术自动提取关键字的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |