CN111027328A - 通过语料训练判断评论情绪正负及感情色彩的方法 - Google Patents
通过语料训练判断评论情绪正负及感情色彩的方法 Download PDFInfo
- Publication number
- CN111027328A CN111027328A CN201911089294.9A CN201911089294A CN111027328A CN 111027328 A CN111027328 A CN 111027328A CN 201911089294 A CN201911089294 A CN 201911089294A CN 111027328 A CN111027328 A CN 111027328A
- Authority
- CN
- China
- Prior art keywords
- negative
- positive
- events
- comments
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 230000008451 emotion Effects 0.000 title claims abstract description 16
- 230000002996 emotional effect Effects 0.000 title claims abstract description 16
- 238000012544 monitoring process Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 12
- 238000007796 conventional method Methods 0.000 abstract 1
- 239000003086 colorant Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明属信息收集领域,尤其是一种通过语料训练判断评论情绪正负及感情色彩的方法,针对现有的面对无论正面事件或者反面事件都会存在正面或者负面的评价,所以无法判别人们在对事件的正确的态度的问题,现提出如下方案,其包括S1:在网上收集语料数据;S2:收集社会主流事件,其中包括正面事件和负面事件;S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号,本发明通过利用词库分别对正面评论和负面评论进行对比和判别,以此可以方便得出人们在正面事件或者负面事件态度,进一步可以有效的体现社会价值观的走向。
Description
技术领域
本发明信息收集涉及技术领域,尤其涉及一种通过语料训练判断评论情绪正负及感情色彩的方法。
背景技术
随着用户参与互联网新闻事件机会越来越多,用户更愿意通过文章的评论来表达用户自己的观点及感悟色彩,通过用户的评论表达的观点来获取用户对某事件,机构或者人物的主要口碑评价。
现有的在对某一事件进行评论时,往往会有正面态度或者反面态度进行评价,但目前很多情况下,面对无论正面事件或者反面事件都会存在正面或者负面的评价,所以无法判别人们在对事件的正确的态度,所以我们提出通过语料训练判断评论情绪正负及感情色彩的方法,用于解决上述所提出的问题。
发明内容
基于背景技术存在面对无论正面事件或者反面事件都会存在正面或者负面的评价,所以无法判别人们在对事件的正确的态度的技术问题,本发明提出了通过语料训练判断评论情绪正负及感情色彩的方法。
本发明提出的通过语料训练判断评论情绪正负及感情色彩的方法,包括以下步骤:
S1:在网上收集语料数据;
S2:收集社会主流事件,其中包括正面事件和负面事件;
S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号;
S4:依据社会主流事件内的文字,与词库内的词语进行比对,以此可以判别此社会主流事件为正面事件和负面事件;
S5:监测和收集网上对主流事件评论的语句;
S6:分别统计在正面事件中整理正面评论和负面评论和在负面事件中整理正面评论和负面评论;
S7:将正面事件或负面事件作为依据,分别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度;
S8:将正面评论和负面评论形成对比,以此可以得出人们对此事件的积极态度或者消极态度。
优选地,所述S1中,语料数据量要及时性,时间范围为近一年的,覆盖事件的评论量够大,范围为100万以上。
优选地,所述S2中,社会主流事件为为传播范围广,并以网络传播度、电视台、电台和报纸为评判标准。
优选地,所述S3中,以网络评论词汇为主,并且经过各个文字输入软件作为收集载体,以此方便词库的更新速度。
优选地,所述S4中,对主流事件进行中的文字与词库中的文字、词语进行一一对比,若是积极的文字出现频率高,则可判定为正面事件,若是消极的文字出现的评率高,则判定为负面事件。
优选地,所述S6中,将收集后的评论后与词库内的词语进行比对,以此可以得出正面评论和负面评论。
优选地,所述S7中,将正面事件和负面事件分别作为评判的基准,通过正面评论和负面评论可以对此事件的态度。
优选地,所述S8中,正面评论和负面评论以图表的形式进行呈现,方便进行观看。
本发明的有益效果:
首先经过制作词库、收集事件等操作,并将事件与词库进行比对,以此可以将事件划分为正面事件和负面事件,接着收集对事件的评论语句,并且与词库进行对比,以此得出对事件的正面评论和负面评论;
以正面事件或者负面事件作为依据,分别收集正面事件别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度,之后将正面事件内的正面评论和负面评论进行对比或者负面事件内的正面评论和负面评论进行对比,并以图表的形式进行呈现,以此方便得出人们分别在正面事件或者负面事件的态度,并且可以根据态度的本身体现出社会价值观的走向。
本发明通过利用词库分别对正面评论和负面评论进行对比和判别,以此可以方便得出人们在正面事件或者负面事件态度,进一步可以有效的体现社会价值观的走向。
具体实施方式
下面结合具体实施例对本发明作进一步解说。
通过语料训练判断评论情绪正负及感情色彩的方法,包括以下步骤:
S1:在网上收集语料数据;
S2:收集社会主流事件,其中包括正面事件和负面事件;
S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号;
S4:依据社会主流事件内的文字,与词库内的词语进行比对,以此可以判别此社会主流事件为正面事件和负面事件;
S5:监测和收集网上对主流事件评论的语句;
S6:分别统计在正面事件中整理正面评论和负面评论和在负面事件中整理正面评论和负面评论;
S7:将正面事件或负面事件作为依据,分别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度;
S8:将正面评论和负面评论形成对比,以此可以得出人们对此事件的积极态度或者消极态度。
本实施例中,S1中,语料数据量要及时性,时间范围为近一年的,覆盖事件的评论量够大,范围为100万以上。
本实施例中,S2中,社会主流事件为为传播范围广,并以网络传播度、电视台、电台和报纸为评判标准。
本实施例中,S3中,以网络评论词汇为主,并且经过各个文字输入软件作为收集载体,以此方便词库的更新速度。
本实施例中,S4中,对主流事件进行中的文字与词库中的文字、词语进行一一对比,若是积极的文字出现频率高,则可判定为正面事件,若是消极的文字出现的评率高,则判定为负面事件。
本实施例中,S6中,将收集后的评论后与词库内的词语进行比对,以此可以得出正面评论和负面评论。
本实施例中,S7中,将正面事件和负面事件分别作为评判的基准,通过正面评论和负面评论可以对此事件的态度。
本实施例中,S8中,正面评论和负面评论以图表的形式进行呈现,方便进行观看。
首先经过制作词库、收集事件等操作,并将事件与词库进行比对,以此可以将事件划分为正面事件和负面事件,接着收集对事件的评论语句,并且与词库进行对比,以此得出对事件的正面评论和负面评论,以正面事件或者负面事件作为依据,分别收集正面事件别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度,之后将正面事件内的正面评论和负面评论进行对比或者负面事件内的正面评论和负面评论进行对比,并以图表的形式进行呈现,以此方便得出人们分别在正面事件或者负面事件的态度,并且可以根据态度的本身体现出社会价值观的走向,本发明通过利用词库分别对正面评论和负面评论进行对比和判别,以此可以方便得出人们在正面事件或者负面事件态度,进一步可以有效的体现社会价值观的走向。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (8)
1.通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,包括以下步骤:
S1:在网上收集语料数据;
S2:收集社会主流事件,其中包括正面事件和负面事件;
S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号;
S4:依据社会主流事件内的文字,与词库内的词语进行比对,以此可以判别此社会主流事件为正面事件和负面事件;
S5:监测和收集网上对主流事件评论的语句;
S6:分别统计在正面事件中整理正面评论和负面评论和在负面事件中整理正面评论和负面评论;
S7:将正面事件或负面事件作为依据,分别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度;
S8:将正面评论和负面评论形成对比,以此可以得出人们对此事件的积极态度或者消极态度。
2.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S1中,语料数据量要及时性,时间范围为近一年的,覆盖事件的评论量够大,范围为100万以上。
3.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S2中,社会主流事件为为传播范围广,并以网络传播度、电视台、电台和报纸为评判标准。
4.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S3中,以网络评论词汇为主,并且经过各个文字输入软件作为收集载体,以此方便词库的更新速度。
5.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S4中,对主流事件进行中的文字与词库中的文字、词语进行一一对比,若是积极的文字出现频率高,则可判定为正面事件,若是消极的文字出现的评率高,则判定为负面事件。
6.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S6中,将收集后的评论后与词库内的词语进行比对,以此可以得出正面评论和负面评论。
7.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S7中,将正面事件和负面事件分别作为评判的基准,通过正面评论和负面评论可以对此事件的态度。
8.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S8中,正面评论和负面评论以图表的形式进行呈现,方便进行观看。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911089294.9A CN111027328B (zh) | 2019-11-08 | 2019-11-08 | 通过语料训练判断评论情绪正负及感情色彩的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911089294.9A CN111027328B (zh) | 2019-11-08 | 2019-11-08 | 通过语料训练判断评论情绪正负及感情色彩的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111027328A true CN111027328A (zh) | 2020-04-17 |
CN111027328B CN111027328B (zh) | 2024-03-26 |
Family
ID=70205081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911089294.9A Active CN111027328B (zh) | 2019-11-08 | 2019-11-08 | 通过语料训练判断评论情绪正负及感情色彩的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111027328B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080215571A1 (en) * | 2007-03-01 | 2008-09-04 | Microsoft Corporation | Product review search |
JP2008234431A (ja) * | 2007-03-22 | 2008-10-02 | Toshiba Corp | コメント蓄積装置、コメント作成閲覧装置、コメント閲覧システムおよびプログラム |
US20100023311A1 (en) * | 2006-09-13 | 2010-01-28 | Venkatramanan Siva Subrahmanian | System and method for analysis of an opinion expressed in documents with regard to a particular topic |
CN103679462A (zh) * | 2012-08-31 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 一种评论数据处理方法和装置、一种搜索方法和系统 |
CN104090864A (zh) * | 2014-06-09 | 2014-10-08 | 合肥工业大学 | 一种情感词典建立与情感计算方法 |
CN104933130A (zh) * | 2015-06-12 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 评论信息的标注方法及装置 |
CN106649519A (zh) * | 2016-10-17 | 2017-05-10 | 北京邮电大学 | 一种产品特征的挖掘与评价方法 |
CN107305545A (zh) * | 2016-04-18 | 2017-10-31 | 南京理工大学 | 一种基于文本倾向性分析的网络意见领袖的识别方法 |
CN107315778A (zh) * | 2017-05-31 | 2017-11-03 | 温州市鹿城区中津先进科技研究院 | 一种基于大数据情感分析的自然语言舆情分析方法 |
CN108665339A (zh) * | 2018-03-27 | 2018-10-16 | 北京航空航天大学 | 一种基于主观情感测度的电商产品可靠性指标及其实现方法 |
-
2019
- 2019-11-08 CN CN201911089294.9A patent/CN111027328B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100023311A1 (en) * | 2006-09-13 | 2010-01-28 | Venkatramanan Siva Subrahmanian | System and method for analysis of an opinion expressed in documents with regard to a particular topic |
US20080215571A1 (en) * | 2007-03-01 | 2008-09-04 | Microsoft Corporation | Product review search |
JP2008234431A (ja) * | 2007-03-22 | 2008-10-02 | Toshiba Corp | コメント蓄積装置、コメント作成閲覧装置、コメント閲覧システムおよびプログラム |
CN103679462A (zh) * | 2012-08-31 | 2014-03-26 | 阿里巴巴集团控股有限公司 | 一种评论数据处理方法和装置、一种搜索方法和系统 |
CN104090864A (zh) * | 2014-06-09 | 2014-10-08 | 合肥工业大学 | 一种情感词典建立与情感计算方法 |
CN104933130A (zh) * | 2015-06-12 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 评论信息的标注方法及装置 |
CN107305545A (zh) * | 2016-04-18 | 2017-10-31 | 南京理工大学 | 一种基于文本倾向性分析的网络意见领袖的识别方法 |
CN106649519A (zh) * | 2016-10-17 | 2017-05-10 | 北京邮电大学 | 一种产品特征的挖掘与评价方法 |
CN107315778A (zh) * | 2017-05-31 | 2017-11-03 | 温州市鹿城区中津先进科技研究院 | 一种基于大数据情感分析的自然语言舆情分析方法 |
CN108665339A (zh) * | 2018-03-27 | 2018-10-16 | 北京航空航天大学 | 一种基于主观情感测度的电商产品可靠性指标及其实现方法 |
Non-Patent Citations (2)
Title |
---|
叶强;张紫琼;罗振雄;: "面向互联网评论情感分析的中文主观性自动判别方法研究", 信息系统学报, no. 01, 15 November 2007 (2007-11-15) * |
杨帆;: "网络舆论事件中微博评论情感倾向及程度研究――以"于欢案"为例", 传媒观察, no. 11, 10 November 2018 (2018-11-10) * |
Also Published As
Publication number | Publication date |
---|---|
CN111027328B (zh) | 2024-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103699626B (zh) | 一种微博用户个性化情感倾向分析方法及系统 | |
CN106953887B (zh) | 一种细粒度电台音频内容个性化组织推荐方法 | |
CN108733816B (zh) | 一种微博突发事件检测方法 | |
CN108664615A (zh) | 一种面向学科教育资源的知识图谱构建方法 | |
CN106503049A (zh) | 一种基于svm融合多种情感资源的微博情感分类方法 | |
CN109829166B (zh) | 基于字符级卷积神经网络的民宿顾客意见挖掘方法 | |
Van Hee et al. | We usually don’t like going to the dentist: Using common sense to detect irony on twitter | |
CN102945268A (zh) | 产品特征评论挖掘方法及系统 | |
CN107124653A (zh) | 电视用户画像的构建方法 | |
US20110231448A1 (en) | Device and method for generating opinion pairs having sentiment orientation based impact relations | |
CN106909618A (zh) | 一种健康类自媒体上的文章传播综合影响力的计算方法 | |
CN112001184B (zh) | 面向视频弹幕的用户情感差异区域检测方法和系统 | |
CN108776940A (zh) | 一种基于文本评论挖掘的智能餐饮推荐算法 | |
Gupta et al. | Automatic text summarization system for Punjabi language | |
Long et al. | Turbulent flow: A computational model of world literature | |
CN102929860A (zh) | 一种基于上下文语境的中文分句情感极性判别方法 | |
CN105488098A (zh) | 一种基于领域差异性的新词提取方法 | |
CN107480136A (zh) | 一种应用于电影剧本中情感曲线分析的方法 | |
Abecassis | The Representation of Parisian Speech in the Cinema of the 1930s | |
US20140013223A1 (en) | System and method for contextual visualization of content | |
WO2014060567A1 (en) | A user-profiling method for providing advertisement data and/or online content to a user and a computer program | |
CN111027328A (zh) | 通过语料训练判断评论情绪正负及感情色彩的方法 | |
Parveen et al. | Opinion Mining in Twitter–Sarcasm Detection | |
CN108763349B (zh) | 基于社交媒体数据的城市土地利用混合度测算方法及系统 | |
US11134045B2 (en) | Message sorting system, message sorting method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |