CN111027328B - 通过语料训练判断评论情绪正负及感情色彩的方法 - Google Patents

通过语料训练判断评论情绪正负及感情色彩的方法 Download PDF

Info

Publication number
CN111027328B
CN111027328B CN201911089294.9A CN201911089294A CN111027328B CN 111027328 B CN111027328 B CN 111027328B CN 201911089294 A CN201911089294 A CN 201911089294A CN 111027328 B CN111027328 B CN 111027328B
Authority
CN
China
Prior art keywords
negative
positive
event
comments
events
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911089294.9A
Other languages
English (en)
Other versions
CN111027328A (zh
Inventor
李森和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGZHOU JIANHE NETWORK TECHNOLOGY CO LTD
Original Assignee
GUANGZHOU JIANHE NETWORK TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGZHOU JIANHE NETWORK TECHNOLOGY CO LTD filed Critical GUANGZHOU JIANHE NETWORK TECHNOLOGY CO LTD
Priority to CN201911089294.9A priority Critical patent/CN111027328B/zh
Publication of CN111027328A publication Critical patent/CN111027328A/zh
Application granted granted Critical
Publication of CN111027328B publication Critical patent/CN111027328B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明属信息收集领域,尤其是一种通过语料训练判断评论情绪正负及感情色彩的方法,针对现有的面对无论正面事件或者反面事件都会存在正面或者负面的评价,所以无法判别人们在对事件的正确的态度的问题,现提出如下方案,其包括S1:在网上收集语料数据;S2:收集社会主流事件,其中包括正面事件和负面事件;S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号,本发明通过利用词库分别对正面评论和负面评论进行对比和判别,以此可以方便得出人们在正面事件或者负面事件态度,进一步可以有效的体现社会价值观的走向。

Description

通过语料训练判断评论情绪正负及感情色彩的方法
技术领域
本发明信息收集涉及技术领域,尤其涉及一种通过语料训练判断评论情绪正负及感情色彩的方法。
背景技术
随着用户参与互联网新闻事件机会越来越多,用户更愿意通过文章的评论来表达用户自己的观点及感悟色彩,通过用户的评论表达的观点来获取用户对某事件,机构或者人物的主要口碑评价。
现有的在对某一事件进行评论时,往往会有正面态度或者反面态度进行评价,但目前很多情况下,面对无论正面事件或者反面事件都会存在正面或者负面的评价,所以无法判别人们在对事件的正确的态度,所以我们提出通过语料训练判断评论情绪正负及感情色彩的方法,用于解决上述所提出的问题。
发明内容
基于背景技术存在面对无论正面事件或者反面事件都会存在正面或者负面的评价,所以无法判别人们在对事件的正确的态度的技术问题,本发明提出了通过语料训练判断评论情绪正负及感情色彩的方法。
本发明提出的通过语料训练判断评论情绪正负及感情色彩的方法,包括以下步骤:
S1:在网上收集语料数据;
S2:收集社会主流事件,其中包括正面事件和负面事件;
S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号;
S4:依据社会主流事件内的文字,与词库内的词语进行比对,以此可以判别此社会主流事件为正面事件和负面事件;
S5:监测和收集网上对主流事件评论的语句;
S6:分别统计在正面事件中整理正面评论和负面评论和在负面事件中整理正面评论和负面评论;
S7:将正面事件或负面事件作为依据,分别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度;
S8:将正面评论和负面评论形成对比,以此可以得出人们对此事件的积极态度或者消极态度。
优选地,所述S1中,语料数据量要及时性,时间范围为近一年的,覆盖事件的评论量够大,范围为100万以上。
优选地,所述S2中,社会主流事件为为传播范围广,并以网络传播度、电视台、电台和报纸为评判标准。
优选地,所述S3中,以网络评论词汇为主,并且经过各个文字输入软件作为收集载体,以此方便词库的更新速度。
优选地,所述S4中,对主流事件进行中的文字与词库中的文字、词语进行一一对比,若是积极的文字出现频率高,则可判定为正面事件,若是消极的文字出现的评率高,则判定为负面事件。
优选地,所述S6中,将收集后的评论后与词库内的词语进行比对,以此可以得出正面评论和负面评论。
优选地,所述S7中,将正面事件和负面事件分别作为评判的基准,通过正面评论和负面评论可以对此事件的态度。
优选地,所述S8中,正面评论和负面评论以图表的形式进行呈现,方便进行观看。
本发明的有益效果:
首先经过制作词库、收集事件等操作,并将事件与词库进行比对,以此可以将事件划分为正面事件和负面事件,接着收集对事件的评论语句,并且与词库进行对比,以此得出对事件的正面评论和负面评论;
以正面事件或者负面事件作为依据,分别收集正面事件别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度,之后将正面事件内的正面评论和负面评论进行对比或者负面事件内的正面评论和负面评论进行对比,并以图表的形式进行呈现,以此方便得出人们分别在正面事件或者负面事件的态度,并且可以根据态度的本身体现出社会价值观的走向。
本发明通过利用词库分别对正面评论和负面评论进行对比和判别,以此可以方便得出人们在正面事件或者负面事件态度,进一步可以有效的体现社会价值观的走向。
具体实施方式
下面结合具体实施例对本发明作进一步解说。
通过语料训练判断评论情绪正负及感情色彩的方法,包括以下步骤:
S1:在网上收集语料数据;
S2:收集社会主流事件,其中包括正面事件和负面事件;
S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号;
S4:依据社会主流事件内的文字,与词库内的词语进行比对,以此可以判别此社会主流事件为正面事件和负面事件;
S5:监测和收集网上对主流事件评论的语句;
S6:分别统计在正面事件中整理正面评论和负面评论和在负面事件中整理正面评论和负面评论;
S7:将正面事件或负面事件作为依据,分别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度;
S8:将正面评论和负面评论形成对比,以此可以得出人们对此事件的积极态度或者消极态度。
本实施例中,S1中,语料数据量要及时性,时间范围为近一年的,覆盖事件的评论量够大,范围为100万以上。
本实施例中,S2中,社会主流事件为为传播范围广,并以网络传播度、电视台、电台和报纸为评判标准。
本实施例中,S3中,以网络评论词汇为主,并且经过各个文字输入软件作为收集载体,以此方便词库的更新速度。
本实施例中,S4中,对主流事件进行中的文字与词库中的文字、词语进行一一对比,若是积极的文字出现频率高,则可判定为正面事件,若是消极的文字出现的评率高,则判定为负面事件。
本实施例中,S6中,将收集后的评论后与词库内的词语进行比对,以此可以得出正面评论和负面评论。
本实施例中,S7中,将正面事件和负面事件分别作为评判的基准,通过正面评论和负面评论可以对此事件的态度。
本实施例中,S8中,正面评论和负面评论以图表的形式进行呈现,方便进行观看。
首先经过制作词库、收集事件等操作,并将事件与词库进行比对,以此可以将事件划分为正面事件和负面事件,接着收集对事件的评论语句,并且与词库进行对比,以此得出对事件的正面评论和负面评论,以正面事件或者负面事件作为依据,分别收集正面事件别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度,之后将正面事件内的正面评论和负面评论进行对比或者负面事件内的正面评论和负面评论进行对比,并以图表的形式进行呈现,以此方便得出人们分别在正面事件或者负面事件的态度,并且可以根据态度的本身体现出社会价值观的走向,本发明通过利用词库分别对正面评论和负面评论进行对比和判别,以此可以方便得出人们在正面事件或者负面事件态度,进一步可以有效的体现社会价值观的走向。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (5)

1.通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,包括以下步骤:
S1:在网上收集语料数据;
S2:收集社会主流事件,其中包括正面事件和负面事件;
S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号;
S4:依据社会主流事件内的文字,与词库内的词语进行比对,以此可以判别此社会主流事件为正面事件和负面事件;
S5:监测和收集网上对主流事件评论的语句;
S6:分别在正面事件中整理正面评论和负面评论,在负面事件中整理正面评论和负面评论;
S7:将正面事件或负面事件作为依据,分别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度;
S8:将正面评论和负面评论形成对比,以此可以得出人们对此事件的积极态度或者消极态度,所述S1中,语料数据量要及时性,时间范围为近一年的,覆盖事件的评论量够大,范围为100万以上,所述S2中,社会主流事件为传播范围广,并以网络传播度、电视台、电台和报纸为评判标准,所述S3中,以网络评论词汇为主,并且经过各个文字输入软件作为收集载体,以此方便词库的更新速度。
2.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S4中,对主流事件进行中的文字与词库中的文字、词语进行一一对比,若是积极的文字出现频率高,则可判定为正面事件,若是消极的文字出现的频率高,则判定为负面事件。
3.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S6中,将收集后的评论与词库内的词语进行比对,以此可以得出正面评论和负面评论。
4.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S7中,将正面事件和负面事件分别作为评判的基准,通过正面评论和负面评论得到评论者对此事件的态度。
5.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S8中,正面评论和负面评论以图表的形式进行呈现,方便进行观看。
CN201911089294.9A 2019-11-08 2019-11-08 通过语料训练判断评论情绪正负及感情色彩的方法 Active CN111027328B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911089294.9A CN111027328B (zh) 2019-11-08 2019-11-08 通过语料训练判断评论情绪正负及感情色彩的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911089294.9A CN111027328B (zh) 2019-11-08 2019-11-08 通过语料训练判断评论情绪正负及感情色彩的方法

Publications (2)

Publication Number Publication Date
CN111027328A CN111027328A (zh) 2020-04-17
CN111027328B true CN111027328B (zh) 2024-03-26

Family

ID=70205081

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911089294.9A Active CN111027328B (zh) 2019-11-08 2019-11-08 通过语料训练判断评论情绪正负及感情色彩的方法

Country Status (1)

Country Link
CN (1) CN111027328B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008234431A (ja) * 2007-03-22 2008-10-02 Toshiba Corp コメント蓄積装置、コメント作成閲覧装置、コメント閲覧システムおよびプログラム
CN107305545A (zh) * 2016-04-18 2017-10-31 南京理工大学 一种基于文本倾向性分析的网络意见领袖的识别方法
CN108665339A (zh) * 2018-03-27 2018-10-16 北京航空航天大学 一种基于主观情感测度的电商产品可靠性指标及其实现方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8296168B2 (en) * 2006-09-13 2012-10-23 University Of Maryland System and method for analysis of an opinion expressed in documents with regard to a particular topic
US20080215571A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Product review search
CN103679462B (zh) * 2012-08-31 2019-01-15 阿里巴巴集团控股有限公司 一种评论数据处理方法和装置、一种搜索方法和系统
CN104090864B (zh) * 2014-06-09 2018-02-06 合肥工业大学 一种情感词典建立与情感计算方法
CN104933130A (zh) * 2015-06-12 2015-09-23 百度在线网络技术(北京)有限公司 评论信息的标注方法及装置
CN106649519B (zh) * 2016-10-17 2020-11-27 北京邮电大学 一种产品特征的挖掘与评价方法
CN107315778A (zh) * 2017-05-31 2017-11-03 温州市鹿城区中津先进科技研究院 一种基于大数据情感分析的自然语言舆情分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008234431A (ja) * 2007-03-22 2008-10-02 Toshiba Corp コメント蓄積装置、コメント作成閲覧装置、コメント閲覧システムおよびプログラム
CN107305545A (zh) * 2016-04-18 2017-10-31 南京理工大学 一种基于文本倾向性分析的网络意见领袖的识别方法
CN108665339A (zh) * 2018-03-27 2018-10-16 北京航空航天大学 一种基于主观情感测度的电商产品可靠性指标及其实现方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
网络舆论事件中微博评论情感倾向及程度研究――以"于欢案"为例;杨帆;;传媒观察;20181110(第11期);全文 *
面向互联网评论情感分析的中文主观性自动判别方法研究;叶强;张紫琼;罗振雄;;信息系统学报;20071115(第01期);全文 *

Also Published As

Publication number Publication date
CN111027328A (zh) 2020-04-17

Similar Documents

Publication Publication Date Title
CN103699626B (zh) 一种微博用户个性化情感倾向分析方法及系统
CN107644089B (zh) 一种基于网络媒体的热门事件提取方法
Qian et al. Changing patterns of interracial marriage in a multiracial society
Buchstaller Diagnostics of age‐graded linguistic behaviour: The case of the quotative system 1
CN106503049A (zh) 一种基于svm融合多种情感资源的微博情感分类方法
CN102945268A (zh) 产品特征评论挖掘方法及系统
Davis Hashtag politics: the polyphonic revolution of# Twitter
CN106250513A (zh) 一种基于事件建模的事件个性化分类方法及系统
Kwon et al. The influence of smartphone addiction on depression and communication competence among college students
CN106354845A (zh) 基于传播结构的微博谣言识别方法和系统
CN104636425A (zh) 一种网络个体或群体情绪认知能力预测与可视化方法
CN104331394A (zh) 一种基于观点的文本分类方法
CN112001184B (zh) 面向视频弹幕的用户情感差异区域检测方法和系统
Clancy Complementary perspectives on hedging behaviour in family discourse: The analytical synergy of variational pragmatics and corpus linguistics
CN104899335A (zh) 一种对网络舆情信息进行情感分类的方法
CN106202200B (zh) 一种基于固定主题的文本情感倾向性分类方法
CN109766452A (zh) 一种基于社交数据的人物性格分析方法
Sonalitha et al. Combined text mining: Fuzzy clustering for opinion mining on the traditional culture arts work
CN107480136A (zh) 一种应用于电影剧本中情感曲线分析的方法
CN108388624A (zh) 多媒体信息推荐方法及装置
US10296530B2 (en) Identifying entity representatives for topics reflected in content items using natural language processing
CN104572915A (zh) 一种基于内容环境增强的用户事件相关度计算方法
CN111027328B (zh) 通过语料训练判断评论情绪正负及感情色彩的方法
CN103116651A (zh) 一种舆情热点动态检测方法
CN105718444A (zh) 基于新闻语料的金融概念对应股票关联方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant