CN108009297A - 基于自然语言处理的文本情感分析方法与系统 - Google Patents

基于自然语言处理的文本情感分析方法与系统 Download PDF

Info

Publication number
CN108009297A
CN108009297A CN201711450898.2A CN201711450898A CN108009297A CN 108009297 A CN108009297 A CN 108009297A CN 201711450898 A CN201711450898 A CN 201711450898A CN 108009297 A CN108009297 A CN 108009297A
Authority
CN
China
Prior art keywords
text
emotion
identified
main body
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711450898.2A
Other languages
English (en)
Other versions
CN108009297B (zh
Inventor
晋彤
张中弦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Yun Run Great Data Services Co Ltd
Original Assignee
Guangzhou Yun Run Great Data Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Yun Run Great Data Services Co Ltd filed Critical Guangzhou Yun Run Great Data Services Co Ltd
Priority to CN201711450898.2A priority Critical patent/CN108009297B/zh
Publication of CN108009297A publication Critical patent/CN108009297A/zh
Application granted granted Critical
Publication of CN108009297B publication Critical patent/CN108009297B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种基于自然语言处理的文本情感分析方法与系统,所述基于自然语言处理的文本情感分析方法包括采集待识别的文本;对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题;根据预设的情感词汇对照表,分别判断所述待识别的文本的情感主体和主题的情感倾向;根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向。通过所述基于自然语言处理的文本情感分析方法能够有效避免文本情感误判的问题,提高复杂文本情感判断的准确性。

Description

基于自然语言处理的文本情感分析方法与系统
技术领域
本发明涉及自然语言处理领域,具体涉及一种基于自然语言处理的文本情感分析方法。
背景技术
随着互联网的发展,各种网络应用油然而生。网民在互联网上可以发表各种言论,因此产生了海量的文本信息。这些信息的数据来源可以是博客、论坛、微博等,这些评论信息表达了用户的各种情感色彩和情感倾向性,这不仅为商家提供了一个信息展示的平台,也为消费者(即用户)提供了产品使用体验交流的平台。如何从这些海量文本中提取这一类带有情感的文本,并对其进行文本情感的分析和研究,具有很强的应用价值,例如,用户可以根据商品的评论了解商品的信息,选择合适产品;商家根据用户的评论改进商品的品质,争取更大的市场等。
所谓文本情感分析,就是借助计算机帮助用户快速获取、整理和分析相关评价信息,对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,例如,“我很喜欢这个产品”,通过情感分类,这句话将被分为正面文本,而“这本书实在太差了”,将被分类为负面文本。
现有的文本情感分类方法是采用SVM、决策树、词频匹配或相结合的方法,文本情感分类模型相对固定,针对复杂的文本(无情绪词,口语化,正话反说),会出现情绪判断错误的问题。例如“我喜欢这个产品”这句话中,包括一个正面情感词“喜欢”,应用现有的文本分类方法,很可能将这句话分为正面文本,但是这句话有可能是正话反说,表达的是负面情感。因此,通过现有的文本情感分析方法得到的文本情感分析结果容易出现情绪判断错误的问题,分类效果差、准确率低。
发明内容
本发明的目的是提供一种基于自然语言处理的文本情感分析方法与系统,能够有效避免文本情感误判的问题,提高复杂文本情感判断的准确性。
为避免以上技术问题,本发明实施例提供一种基于自然语言处理的文本情感分析方法,包括:
采集待识别的文本;
对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题;
根据预设的情感词汇对照表,分别判断所述待识别的文本的情感主体和主题的情感倾向;
根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向。
优选地,所述对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题,具体包括:
对所述待识别的文本进行上下文关联分析,获取所述待识别文本的情感主体;
对所述待识别的文本进行时间延续分析,获取所述待识别文本的情感主体;
对所述待识别的文本进行主题分析,获取所述待识别文本的主题。
优选地,所述对所述待识别的文本进行上下文关联分析,获取所述待识别文本的情感主体,具体包括:
对所述待识别的文本进行文本分割处理,获得多个句子;
根据预设的情感词表,在所述多个句子中查找情感词;
获取所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子;
对所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子进行CRF句法分析,获得所述情感词所在的句子的情感主体。
优选地,所述对所述待识别的文本进行时间延续分析,获取所述待识别文本的情感主体,具体包括:
采集所述待识别的文本的关联文本;
对所述待识别的文本和所述关联文本按照文本发布时间的顺序进行整合处理,获得整合文本;
对所述整合文本进行上下文关联分析,获取所述整合文本的情感主体。
优选地,所述对所述待识别的文本进行主题分析,获取所述待识别文本的主题,具体包括:
通过LDA主题分析模型提取所述待识别的文本的主题。
优选地,所述对所述整合文本进行上下文关联分析,获取所述整合文本的情感主体,具体包括:
对所述整合文本进行文本分割处理,获得多个句子;
根据预设的情感词表,在所述多个句子中查找情感词;
获取所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子;
对所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子进行CRF句法分析,获得所述情感词所在的句子的情感主体。
优选地,所述采集所述待识别的文本的关联文本包括:
采集与所述待识别的文本具有转发和/回复关系的转发回复文本;
从所述转发回复文本中提取与所述待识别的文本的作者相同的文本作为所述关联文本。
优选地,所述根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向,具体包括:
情感倾向包括正面情感、中立情感、负面情感三种类型;
综合统计所述待识别的文本的情感主体和主题的情感倾向,得出所述待识别的文本在正面情感、中立情感、负面情感中的最大值;
确认所述最大值对应的情感倾向为所述待识别的文本的情感倾向。
本发明实施例还包括一种基于自然语言处理的文本情感分析系统,包括:
文本采集模块,用于采集待识别的文本;
语义场景分析模块,用于对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题;
第一情感判断模块,用于根据预设的情感词汇对照表,分别判断所述待识别的文本的情感主体和主题的情感倾向;
第二情感判断模块,用于根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向。
优选地,所述语义场景分析模块包括:
上下文关联分析模块,用于对所述待识别的文本进行上下文关联分析,获取所述待识别文本的情感主体;
时间延续分析模块,用于对所述待识别的文本进行时间延续分析,获取所述待识别文本的情感主体;
主题分析模块,用于对所述待识别的文本进行主题分析,获取所述待识别文本的主题。
相对于现有技术,本发明实施例提供的一种基于自然语言处理的文本情感分析方法的有益效果在于:所述基于自然语言处理的文本情感分析方法包括采集待识别的文本;对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题;根据预设的情感词汇对照表,分别判断所述待识别的文本的情感主体和主题的情感倾向;根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向。通过所述基于自然语言处理的文本情感分析方法能够有效避免文本情感误判的问题,提高复杂文本情感判断的准确性。本发明实施例还提供一种基于自然语言处理的文本情感分析系统。
附图说明
图1是本发明实施例提供的一种基于自然语言处理的文本情感分析方法的流程图;
图2是本发明实施例提供的一种基于自然语言处理的文本情感分析系统的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其是本发明一种基于自然语言处理的文本情感分析方法的流程图,所述基于自然语言处理的文本情感分析方法包括:
S1:采集待识别的文本;
S2:对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题;
S3:根据预设的情感词汇对照表,分别判断所述待识别的文本的情感主体和主题的情感倾向;
S4:根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向。
通过所述方法,利用语义场景的进行多点定位,包括单点(单篇长、短文本)、多点(多篇长、短文本,上下文),从情感主体和主题两个方面对文本进行情感倾向判断,能够有效避免文本情感误判的问题,提高复杂文本情感判断的准确性。例如文本“今天踩到了狗屎,哈哈哈”,作者想表达的是生气和无奈,但如果只分析“哈哈哈”会判断文本为正面情感,所述方法对“今天踩到了狗屎,哈哈哈”进行语义场景分析,识别文本的情感主体和主题为“踩、狗屎”判断作者表达的重点在于“踩到狗屎”,从而判断文本为负面情感。
在一种可选的实施例中,S2:对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题,具体包括:
对所述待识别的文本进行上下文关联分析,获取所述待识别文本的情感主体;
对所述待识别的文本进行时间延续分析,获取所述待识别文本的情感主体;
对所述待识别的文本进行主题分析,获取所述待识别文本的主题。
本实施例通过上下文关联、时间延续性、事件话题三方面进行的文本情感分析,能够有效避免文本情感误判的问题,提高复杂文本情感判断的准确性。
在一种可选的实施例中,所述对所述待识别的文本进行上下文关联分析,获取所述待识别文本的情感主体,具体包括:
对所述待识别的文本进行文本分割处理,获得多个句子;
根据预设的情感词表,在所述多个句子中查找情感词;
获取所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子;
对所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子进行CRF句法分析,获得所述情感词所在的句子的情感主体。
例如,对文本“今天踩到了狗屎,哈哈哈”进行上下文关联分析,先查找情感词(“哈哈哈”),情感词所在的句子及前一个句子即为上文,后一个句子为下文,该文本只有上文“今天踩到了狗屎”。然后根据基于CRF句法分析方法,识别该句子的情感主体是“踩,狗屎”,根据预设的情感词表判断情感主体为负面情感,从而判断文本“今天踩到了狗屎,哈哈哈”为负面情感。
在一种可选的实施例中,所述对所述待识别的文本进行时间延续分析,获取所述待识别文本的情感主体,具体包括:
采集所述待识别的文本的关联文本;
对所述待识别的文本和所述关联文本按照文本发布时间的顺序进行整合处理,获得整合文本;
对所述整合文本进行上下文关联分析,获取所述整合文本的情感主体。
在一种可选的实施例中,所述对所述待识别的文本进行主题分析,获取所述待识别文本的主题,具体包括:
通过LDA主题分析模型提取所述待识别的文本的主题。
在本实施例中,事件所属的话题,会直接影响到文本的情感,例如作者的文本在讨论反日事件,那么在使用了积极词汇的情况下,如为砸车举动叫好,应该判断为负面情感。
在一种可选的实施例中,所述对所述整合文本进行上下文关联分析,获取所述整合文本的情感主体,具体包括:
对所述整合文本进行文本分割处理,获得多个句子;
根据预设的情感词表,在所述多个句子中查找情感词;
获取所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子;
对所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子进行CRF句法分析,获得所述情感词所在的句子的情感主体。
在一种可选的实施例中,所述采集所述待识别的文本的关联文本还包括:
采集与所述待识别的文本具有转发和/回复关系的转发回复文本;
从所述转发回复文本中提取与所述待识别的文本的作者相同的文本作为所述关联文本。
本实施例中,通过事件的发展过程推断情绪,例如作者转发了自己的一条微博“刚刚碰到一个极品”,并发文“真真笑死我”,若是仅根据发表的文本“真真笑死我”,判断该文本为正面情感,明显出现文本情感误判的问题,所述方法根据上下文的关联分析,将“刚刚碰到一个极品”和“真真笑死我”整合为一个整合文本,对该整合主体进行上下文关联分析识别出该整合文本的情感主体为“碰到,极品”,根据预设的情感词表判断情感主体为负面情绪,从而判断文本“真真笑死我”为负面情感。
在一种可选的实施例中,所述根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向,具体包括:
情感倾向包括正面情感、中立情感、负面情感三种类型;
综合统计所述待识别的文本的情感主体和主题的情感倾向,得出所述待识别的文本在正面情感、中立情感、负面情感中的最大值;
确认所述最大值对应的情感倾向为所述待识别的文本的情感倾向。
请参阅图2,其实本发明实施例提供的一种基于自然语言处理的文本情感分析系统的示意图,所述基于自然语言处理的文本情感分析系统包括:
文本采集模块1,用于采集待识别的文本;
语义场景分析模块2,用于对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题;
第一情感判断模块3,用于根据预设的情感词汇对照表,分别判断所述待识别的文本的情感主体和主题的情感倾向;
第二情感判断模块4,用于根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向。
通过所述方法,利用语义场景的进行多点定位,包括单点(单篇长、短文本)、多点(多篇长、短文本,上下文),从情感主体和主题两个方面对文本进行情感倾向判断,能够有效避免文本情感误判的问题,提高复杂文本情感判断的准确性。例如文本“今天踩到了狗屎,哈哈哈”,作者想表达的是生气和无奈,但如果只分析“哈哈哈”会判断文本为正面情感,所述方法对“今天踩到了狗屎,哈哈哈”进行语义场景分析,识别文本的情感主体和主题为“踩、狗屎”判断作者表达的重点在于“踩到狗屎”,从而判断文本为负面情感。
在一种可选的实施例中,所述语义场景分析模块包括:
上下文关联分析模块21,用于对所述待识别的文本进行上下文关联分析,获取所述待识别文本的情感主体;
时间延续分析模块22,用于对所述待识别的文本进行时间延续分析,获取所述待识别文本的情感主体;
主题分析模块23,用于对所述待识别的文本进行主题分析,获取所述待识别文本的主题。
在一种可选的实施例中,所述上下文关联分析模块包括:
文本分割模块,用于对所述待识别的文本进行文本分割处理,获得多个句子;
情感词查找模块,用于根据预设的情感词表,在所述多个句子中查找情感词;
上下文采集模块,用于获取所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子;
情感主体获取模块,用于对所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子进行CRF句法分析,获得所述情感词所在的句子的情感主体。
例如,对文本“今天踩到了狗屎,哈哈哈”进行上下文关联分析,先查找情感词(“哈哈哈”),情感词所在的句子及前一个句子即为上文,后一个句子为下文,该文本只有上文“今天踩到了狗屎”。然后根据基于CRF句法分析方法,识别该句子的情感主体是“踩,狗屎”,根据预设的情感词表判断情感主体为负面情感,从而判断文本“今天踩到了狗屎,哈哈哈”为负面情感。
在一种可选的实施例中,所述时间延续分析模块包括:
关联文本采集模块,用于采集所述待识别的文本的关联文本;
文本整合模块,用于对所述待识别的文本和所述关联文本按照文本发布时间的顺序进行整合处理,获得整合文本;
整合文本关联分析模块,用于对所述整合文本进行上下文关联分析,获取所述整合文本的情感主体。
在一种可选的实施例中,所述主题分析模块包括:
LDA主题分析模块,用于通过LDA主题分析模型提取所述待识别的文本的主题。
在本实施例中,事件所属的话题,会直接影响到文本的情感,例如作者的文本在讨论反日事件,那么在使用了积极词汇的情况下,如为砸车举动叫好,应该判断为负面情感。
在一种可选的实施例中,所述上下文关联分析子模块包括:
整合文本分割模块,用于对所述整合文本进行文本分割处理,获得多个句子;
整合文本情感词查找模块,用于根据预设的情感词表,在所述多个句子中查找情感词;
整合文本上下文采集模块,用于获取所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子;
整合文本情感主体获取模块,用于对所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子进行CRF句法分析,获得所述情感词所在的句子的情感主体。
在一种可选的实施例中,所述关联文本采集模块包括:
转发回复文本采集模块,用于采集与所述待识别的文本具有转发和/回复关系的转发回复文本;
文本作者识别模块,用于从所述转发回复文本中提取与所述待识别的文本的作者相同的文本作为所述关联文本。
本实施例中,通过事件的发展过程推断情绪,例如作者转发了自己的一条微博“刚刚碰到一个极品”,并发文“真真笑死我”,若是仅根据发表的文本“真真笑死我”,判断该文本为正面情感,明显出现文本情感误判的问题,所述方法根据上下文的关联分析,将“刚刚碰到一个极品”和“真真笑死我”整合为一个整合文本,对该整合主体进行上下文关联分析识别出该整合文本的情感主体为“碰到,极品”,根据预设的情感词表判断情感主体为负面情绪,从而判断文本“真真笑死我”为负面情感。
在一种可选的实施例中,所述第二情感判断模块包括:
情感倾向包括正面情感、中立情感、负面情感三种类型;
情感统计模块,用于综合统计所述待识别的文本的情感主体和主题的情感倾向,得出所述待识别的文本在正面情感、中立情感、负面情感中的最大值;
文本情感确认模块,用于确认所述最大值对应的情感倾向为所述待识别的文本的情感倾向。
相对于现有技术,本发明实施例提供的一种基于自然语言处理的文本情感分析方法的有益效果在于:所述基于自然语言处理的文本情感分析方法包括采集待识别的文本;对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题;根据预设的情感词汇对照表,分别判断所述待识别的文本的情感主体和主题的情感倾向;根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向。通过所述基于自然语言处理的文本情感分析方法能够有效避免文本情感误判的问题,提高复杂文本情感判断的准确性。本发明实施例还提供一种基于自然语言处理的文本情感分析系统。
以上是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种基于自然语言处理的文本情感分析方法,其特征在于,包括:
采集待识别的文本;
对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题;
根据预设的情感词汇对照表,分别判断所述待识别的文本的情感主体和主题的情感倾向;
根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向。
2.如权利要求1所述的基于自然语言处理的文本情感分析方法,其特征在于,所述对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题,具体包括:
对所述待识别的文本进行上下文关联分析,获取所述待识别文本的情感主体;
对所述待识别的文本进行时间延续分析,获取所述待识别文本的情感主体;
对所述待识别的文本进行主题分析,获取所述待识别文本的主题。
3.如权利要求2所述的基于自然语言处理的文本情感分析方法,其特征在于,所述对所述待识别的文本进行上下文关联分析,获取所述待识别文本的情感主体,具体包括:
对所述待识别的文本进行文本分割处理,获得多个句子;
根据预设的情感词表,在所述多个句子中查找情感词;
获取所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子;
对所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子进行CRF句法分析,获得所述情感词所在的句子的情感主体。
4.如权利要求2所述的基于自然语言处理的文本情感分析方法,其特征在于,所述对所述待识别的文本进行时间延续分析,获取所述待识别文本的情感主体,具体包括:
采集所述待识别的文本的关联文本;
对所述待识别的文本和所述关联文本按照文本发布时间的顺序进行整合处理,获得整合文本;
对所述整合文本进行上下文关联分析,获取所述整合文本的情感主体。
5.如权利要求2所述的基于自然语言处理的文本情感分析方法,其特征在于,所述对所述待识别的文本进行主题分析,获取所述待识别文本的主题,具体包括:
通过LDA主题分析模型提取所述待识别的文本的主题。
6.如权利要求4所述的基于自然语言处理的文本情感分析方法,其特征在于,所述对所述整合文本进行上下文关联分析,获取所述整合文本的情感主体,具体包括:
对所述整合文本进行文本分割处理,获得多个句子;
根据预设的情感词表,在所述多个句子中查找情感词;
获取所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子;
对所述情感词所在的句子、所述情感词所在的句子的上一个句子以及下一个句子进行CRF句法分析,获得所述情感词所在的句子的情感主体。
7.如权利要求4所述的基于自然语言处理的文本情感分析方法,所述采集所述待识别的文本的关联文本,具体包括:
采集与所述待识别的文本具有转发和/回复关系的转发回复文本;
从所述转发回复文本中提取与所述待识别的文本的作者相同的文本作为所述关联文本。
8.如权利要求1所述的基于自然语言处理的文本情感分析方法,其特征在于,所述根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向,具体包括:
情感倾向包括正面情感、中立情感、负面情感三种类型;
综合统计所述待识别的文本的情感主体和主题的情感倾向,得出所述待识别的文本在正面情感、中立情感、负面情感中的最大值;
确认所述最大值对应的情感倾向为所述待识别的文本的情感倾向。
9.一种基于自然语言处理的文本情感分析系统,其特征在于,包括:
文本采集模块,用于采集待识别的文本;
语义场景分析模块,用于对所述待识别的文本进行语义场景分析,获取所述待识别的文本的情感主体和主题;
第一情感判断模块,用于根据预设的情感词汇对照表,分别判断所述待识别的文本的情感主体和主题的情感倾向;
第二情感判断模块,用于根据所述待识别的文本的情感主体和主题的情感倾向,判断所述待识别的文本的情感倾向。
10.如权利要求9所述的基于自然语言处理的文本情感分析系统,其特征在于,所述语义场景分析模块包括:
上下文关联分析模块,用于对所述待识别的文本进行上下文关联分析,获取所述待识别文本的情感主体;
时间延续分析模块,用于对所述待识别的文本进行时间延续分析,获取所述待识别文本的情感主体;
主题分析模块,用于对所述待识别的文本进行主题分析,获取所述待识别文本的主题。
CN201711450898.2A 2017-12-27 2017-12-27 基于自然语言处理的文本情感分析方法与系统 Active CN108009297B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711450898.2A CN108009297B (zh) 2017-12-27 2017-12-27 基于自然语言处理的文本情感分析方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711450898.2A CN108009297B (zh) 2017-12-27 2017-12-27 基于自然语言处理的文本情感分析方法与系统

Publications (2)

Publication Number Publication Date
CN108009297A true CN108009297A (zh) 2018-05-08
CN108009297B CN108009297B (zh) 2020-09-04

Family

ID=62061988

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711450898.2A Active CN108009297B (zh) 2017-12-27 2017-12-27 基于自然语言处理的文本情感分析方法与系统

Country Status (1)

Country Link
CN (1) CN108009297B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108922564A (zh) * 2018-06-29 2018-11-30 北京百度网讯科技有限公司 情绪识别方法、装置、计算机设备及存储介质
CN109522928A (zh) * 2018-10-15 2019-03-26 北京邮电大学 文本的主题情感分析方法、装置、电子设备及存储介质
CN110555204A (zh) * 2018-05-31 2019-12-10 北京京东尚科信息技术有限公司 情绪判断的方法和装置
WO2021217769A1 (zh) * 2020-04-27 2021-11-04 平安科技(深圳)有限公司 基于情绪识别的答复方法、装置、计算机设备及存储介质
US11386273B2 (en) 2019-11-18 2022-07-12 International Business Machines Corporation System and method for negation aware sentiment detection

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008066675A2 (en) * 2006-11-22 2008-06-05 Nagaraju Bandaru Method and system for analyzing user-generated content
CN101894102A (zh) * 2010-07-16 2010-11-24 浙江工商大学 一种主观性文本情感倾向性分析方法和装置
CN104268197A (zh) * 2013-09-22 2015-01-07 中科嘉速(北京)并行软件有限公司 一种行业评论数据细粒度情感分析方法
CN105701210A (zh) * 2016-01-13 2016-06-22 福建师范大学 一种基于混杂特征计算的微博主题情感分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008066675A2 (en) * 2006-11-22 2008-06-05 Nagaraju Bandaru Method and system for analyzing user-generated content
CN101894102A (zh) * 2010-07-16 2010-11-24 浙江工商大学 一种主观性文本情感倾向性分析方法和装置
CN104268197A (zh) * 2013-09-22 2015-01-07 中科嘉速(北京)并行软件有限公司 一种行业评论数据细粒度情感分析方法
CN105701210A (zh) * 2016-01-13 2016-06-22 福建师范大学 一种基于混杂特征计算的微博主题情感分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周胜臣 等: "中文微博情感分析研究综述", 《计算机应用与软件》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555204A (zh) * 2018-05-31 2019-12-10 北京京东尚科信息技术有限公司 情绪判断的方法和装置
CN108922564A (zh) * 2018-06-29 2018-11-30 北京百度网讯科技有限公司 情绪识别方法、装置、计算机设备及存储介质
CN109522928A (zh) * 2018-10-15 2019-03-26 北京邮电大学 文本的主题情感分析方法、装置、电子设备及存储介质
US11386273B2 (en) 2019-11-18 2022-07-12 International Business Machines Corporation System and method for negation aware sentiment detection
WO2021217769A1 (zh) * 2020-04-27 2021-11-04 平安科技(深圳)有限公司 基于情绪识别的答复方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN108009297B (zh) 2020-09-04

Similar Documents

Publication Publication Date Title
Emon et al. A deep learning approach to detect abusive bengali text
CN108009297A (zh) 基于自然语言处理的文本情感分析方法与系统
Gaind et al. Emotion detection and analysis on social media
González-Ibánez et al. Identifying sarcasm in twitter: a closer look
CN104268160B (zh) 一种基于领域词典和语义角色的评价对象抽取方法
Davidov et al. Enhanced sentiment learning using twitter hashtags and smileys
CN103150367B (zh) 一种中文微博的情感倾向分析方法
CN105893582B (zh) 一种社交网络用户情绪判别方法
Liew et al. EmoTweet-28: A fine-grained emotion corpus for sentiment analysis
CN108363725B (zh) 一种用户评论观点提取和观点标签生成的方法
CN106547866B (zh) 一种基于情感词随机共现网络的细粒度情感分类方法
CN104484336B (zh) 一种中文评论分析方法及其系统
CN110263319A (zh) 一种基于网页文本的学者观点抽取方法
KR20140101906A (ko) 소셜 데이터 분석 장치 및 방법
CN105183717A (zh) 一种基于随机森林和用户关系的osn用户情感分析方法
CN104573030A (zh) 一种文本情绪预测方法及装置
CN106055633A (zh) 一种中文微博主客观句分类方法
CN110297986A (zh) 一种微博热点话题的情感倾向分析方法
CN106569996A (zh) 一种面向中文微博的情感倾向分析方法
WO2024169278A1 (zh) 一种基于情感-主题-讽刺混合模型的讽刺检测方法
CN105302859B (zh) 一种基于互联网的智能交互系统
Morales-Ramirez et al. Discovering Speech Acts in Online Discussions: A Tool-supported method.
CN105243095A (zh) 一种基于微博文本的情绪分类方法及系统
CN104199981A (zh) 一种基于微博文本的个人和机构用户分类方法及系统
Walha et al. A Lexicon approach to multidimensional analysis of tweets opinion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 510000 room 7, Tong Dong Road, Tianhe District, Guangzhou, Guangdong C305-308

Applicant after: Yunrun Da Data Service Co.,Ltd.

Address before: 510000 room 7, Tong Dong Road, Tianhe District, Guangzhou, Guangdong C305-308

Applicant before: GUANGZHOU URUN BIG DATA SERVICE Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Text sentiment analysis method and system based on natural language processing

Effective date of registration: 20210325

Granted publication date: 20200904

Pledgee: Qianjin sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: Yunrun Da Data Service Co.,Ltd.

Registration number: Y2021440000102

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20220822

Granted publication date: 20200904

Pledgee: Qianjin sub branch of Bank of Guangzhou Co.,Ltd.

Pledgor: Yunrun Da Data Service Co.,Ltd.

Registration number: Y2021440000102

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Text sentiment analysis method and system based on natural language processing

Effective date of registration: 20220824

Granted publication date: 20200904

Pledgee: Chepi Road Branch of Guangzhou Bank Co.,Ltd.

Pledgor: Yunrun Da Data Service Co.,Ltd.

Registration number: Y2022980013458

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230206

Granted publication date: 20200904

Pledgee: Chepi Road Branch of Guangzhou Bank Co.,Ltd.

Pledgor: Yunrun Da Data Service Co.,Ltd.

Registration number: Y2022980013458