CN113157858A - 一种基于情感词匹配与频度结合的情感程度检测方法 - Google Patents

一种基于情感词匹配与频度结合的情感程度检测方法 Download PDF

Info

Publication number
CN113157858A
CN113157858A CN202110319710.0A CN202110319710A CN113157858A CN 113157858 A CN113157858 A CN 113157858A CN 202110319710 A CN202110319710 A CN 202110319710A CN 113157858 A CN113157858 A CN 113157858A
Authority
CN
China
Prior art keywords
emotion
frequency
occurrence
word
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110319710.0A
Other languages
English (en)
Inventor
郭伟薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Biguan Data Technology Co ltd
Original Assignee
Shanghai Biguan Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Biguan Data Technology Co ltd filed Critical Shanghai Biguan Data Technology Co ltd
Priority to CN202110319710.0A priority Critical patent/CN113157858A/zh
Publication of CN113157858A publication Critical patent/CN113157858A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于情感词匹配与频度结合的情感程度检测方法,具体包括以下步骤:S1、获取待评价人才的主题需求信息,根据主题需求信息构建相应的情感语料库;S2、采集待评价人才在社交网络平台上存在操作记录的文本内容,从文本内容中提取情感关键词;S3、将提取出的情感关键词与情感语料库中的情感标准词进行匹配,对情感关键词中情感标准词的出现频次进行统计;S4、对出现频次的统计结果进行对比分析,确定待评价人才的情感倾向程度。与现有技术相比,本发明具有避免偶发因素对情感倾向的判断,提高了情感倾向程度判断结果的准确性和稳定性等优点。

Description

一种基于情感词匹配与频度结合的情感程度检测方法
技术领域
本发明涉及人才评价领域,尤其是涉及一种基于情感词匹配与频度结合的情感程度检测方法。
背景技术
情感倾向即是主体对某一客体主观存在的内心喜恶、内在评价的一种倾向,有程度和对象性;情感是态度中的一部分,它与态度中的内向感受、意向具有协调一致性,是态度在生理上一种复杂而稳定的生理评价和体验。情感包括道德感和价值感等方面。
目前词语情感倾向性识别较为成熟,针对文本内容获得有用的倾向性信息和知识已经成为自然语言处理的研究热点,情感词识别和情感词极性判别的方法和技术已经形成相应的体系。在目前的方法中,在对情感词与情感倾向的匹配方面已比较精确,但仅得出了情感词与情感倾向的匹配关系,不能对情感程度进行有效判断,不能确定被评价人才做出的是偶发的行为,还是常态的行为,因此仅凭情感词与情感倾向的匹配关系,就确定被评价人才的情感倾向,具有不确定性且容易产生误判。
发明内容
本发明的目的就是为了克服上述现有技术存在的仅凭情感词与情感倾向的匹配关系确定情感倾向具有不确定性且容易产生误判的缺陷而提供一种基于情感词匹配与频度结合的情感程度检测方法。
本发明的目的可以通过以下技术方案来实现:
一种基于情感词匹配与频度结合的情感程度检测方法,具体包括以下步骤:
S1、获取待评价人才的主题需求信息,根据所述主题需求信息构建相应的情感语料库;
S2、采集待评价人才在社交网络平台上存在操作记录的文本内容,从所述文本内容中提取情感关键词;
S3、将提取出的情感关键词与情感语料库中的情感标准词进行匹配,对情感关键词中情感标准词的出现频次进行统计;
S4、对出现频次的统计结果进行对比分析,确定待评价人才的情感倾向程度。
所述出现频次的类型包括单个情感标准词出现和多个情感标准词组合出现。
进一步地,所述情感标准词组合出现的形式包括情感标准词之间间隔两个字、一个字或没有字。
所述情感标准词组合出现的形式还包括情感标准词之间间隔一个标点符号,所述标点符号不包括句号。
进一步地,所述组合出现的情感标准词的来源包括多个情感语料库。
所述主题需求信息包括政治倾向信息和宗教倾向信息。
所述存在操作记录的文本内容具体为待评价人才公开发表的文本内容。
进一步地,所述公开发表的文本内容通过大数据技术检索得到。
所述出现频次的统计结果具体为根据总出现频次计算得到的情感标准词出现频次的百分数。
进一步地,所述情感标准词出现频次的百分数按照预设的百分数跨度进行分组,每组对应一个情感倾向程度,所述百分数跨度的取值范围为1%~50%。
进一步地,所述百分数跨度的取值优选为10%。
与现有技术相比,本发明具有以下有益效果:
本发明通过将待评价人才在社交网络平台上公开发表的文本内容进行关键词提取,并与不同主题需求信息对应的情感语料库中的情感关键词进行匹配,通过情感标准词的出现频次来确定待评价人才的情感倾向程度,与传统的仅根据情感关键词与情感倾向进行匹配的方案相比,本发明避免偶发因素对情感倾向的判断,提高了情感倾向程度判断结果的准确性和稳定性。
附图说明
图1为本发明的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例
如图1所示,一种基于情感词匹配与频度结合的情感程度检测方法,具体包括以下步骤:
S1、获取待评价人才的主题需求信息,根据主题需求信息构建相应的情感语料库;
S2、采集待评价人才在社交网络平台上存在操作记录的文本内容,从文本内容中提取情感关键词;
S3、将提取出的情感关键词与情感语料库中的情感标准词进行匹配,对情感关键词中情感标准词的出现频次进行统计;
S4、对出现频次的统计结果进行对比分析,确定待评价人才的情感倾向程度。
出现频次的类型包括单个情感标准词出现和多个情感标准词组合出现。
情感标准词组合出现的形式包括情感标准词之间间隔两个字、一个字或没有字。
情感标准词组合出现的形式还包括情感标准词之间间隔一个标点符号,标点符号不包括句号。
组合出现的情感标准词的来源包括多个情感语料库。
主题需求信息包括政治倾向信息和宗教倾向信息。
存在操作记录的文本内容具体为待评价人才公开发表的文本内容,通过大数据技术检索得到。
出现频次的统计结果具体为根据总出现频次计算得到的情感标准词出现频次的百分数。
情感标准词出现频次的百分数按照预设的百分数跨度进行分组,每组对应一个情感倾向程度,百分数跨度的取值范围为1%~50%。
本实施例中,百分数跨度的取值优选为10%。
本实施例中,情感倾向程度的类型包括非常严重倾向、严重倾向、非常倾向、十分倾向、倾向、比较倾向、有倾向、有一定倾向、可能倾向和可能涉及。
本实施例中,当出现频次的百分数大于90%为非常严重倾向,80%~90%为严重倾向,70%~80%为非常倾向,60%~70%为十分倾向;50%~60%为倾向,40%~50%为比较倾向,30%~40%为有倾向,20%~30%为有一定倾向,10%~20%为可能倾向,10%以下为可能涉及。
此外,需要说明的是,本说明书中所描述的具体实施例,所取名称可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所做的举例说明。凡依据本发明构思的构造、特征及原理所做的等效变化或者简单变化,均包括于本发明的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实例做各种各样的修改或补充或采用类似的方法,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (10)

1.一种基于情感词匹配与频度结合的情感程度检测方法,其特征在于,具体包括以下步骤:
S1、获取待评价人才的主题需求信息,根据所述主题需求信息构建相应的情感语料库;
S2、采集待评价人才在社交网络平台上存在操作记录的文本内容,从所述文本内容中提取情感关键词;
S3、将提取出的情感关键词与情感语料库中的情感标准词进行匹配,对情感关键词中情感标准词的出现频次进行统计;
S4、对出现频次的统计结果进行对比分析,确定待评价人才的情感倾向程度。
2.根据权利要求1所述的一种基于情感词匹配与频度结合的情感程度检测方法,其特征在于,所述出现频次的类型包括单个情感标准词出现和多个情感标准词组合出现。
3.根据权利要求2所述的一种基于情感词匹配与频度结合的情感程度检测方法,其特征在于,所述情感标准词组合出现的形式包括情感标准词之间间隔两个字、一个字或没有字。
4.根据权利要求3所述的一种基于情感词匹配与频度结合的情感程度检测方法,其特征在于,所述情感标准词组合出现的形式还包括情感标准词之间间隔一个标点符号。
5.根据权利要求2所述的一种基于情感词匹配与频度结合的情感程度检测方法,其特征在于,所述组合出现的情感标准词的来源包括多个情感语料库。
6.根据权利要求1所述的一种基于情感词匹配与频度结合的情感程度检测方法,其特征在于,所述主题需求信息包括政治倾向信息和宗教倾向信息。
7.根据权利要求1所述的一种基于情感词匹配与频度结合的情感程度检测方法,其特征在于,所述存在操作记录的文本内容具体为待评价人才公开发表的文本内容。
8.根据权利要求1所述的一种基于情感词匹配与频度结合的情感程度检测方法,其特征在于,所述出现频次的统计结果具体为根据总出现频次计算得到的情感标准词出现频次的百分数。
9.根据权利要求8所述的一种基于情感词匹配与频度结合的情感程度检测方法,其特征在于,所述情感标准词出现频次的百分数按照预设的百分数跨度进行分组,每组对应一个情感倾向程度,所述百分数跨度的取值范围为1%~50%。
10.根据权利要求9所述的一种基于情感词匹配与频度结合的情感程度检测方法,其特征在于,所述百分数跨度的取值优选为10%。
CN202110319710.0A 2021-03-25 2021-03-25 一种基于情感词匹配与频度结合的情感程度检测方法 Pending CN113157858A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110319710.0A CN113157858A (zh) 2021-03-25 2021-03-25 一种基于情感词匹配与频度结合的情感程度检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110319710.0A CN113157858A (zh) 2021-03-25 2021-03-25 一种基于情感词匹配与频度结合的情感程度检测方法

Publications (1)

Publication Number Publication Date
CN113157858A true CN113157858A (zh) 2021-07-23

Family

ID=76884998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110319710.0A Pending CN113157858A (zh) 2021-03-25 2021-03-25 一种基于情感词匹配与频度结合的情感程度检测方法

Country Status (1)

Country Link
CN (1) CN113157858A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408883A (zh) * 2008-11-24 2009-04-15 电子科技大学 一种网络舆情观点收集方法
KR20130047276A (ko) * 2011-10-31 2013-05-08 주식회사 아이리버 로봇 상호 간의 감정표현방법
CN103150432A (zh) * 2013-03-07 2013-06-12 宁波成电泰克电子信息技术发展有限公司 一种网络舆情分析方法
CN103235818A (zh) * 2013-04-27 2013-08-07 北京百度网讯科技有限公司 一种基于网页情感倾向性的信息推送方法和装置
CN106096664A (zh) * 2016-06-23 2016-11-09 广州云数信息科技有限公司 一种基于社交网络数据的情感分析方法
CN108121698A (zh) * 2017-11-29 2018-06-05 张宁 中文文字情绪识别方法及系统
CN112052995A (zh) * 2020-08-31 2020-12-08 杭州电子科技大学 基于融合情感倾向主题的社交网络用户影响力预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408883A (zh) * 2008-11-24 2009-04-15 电子科技大学 一种网络舆情观点收集方法
KR20130047276A (ko) * 2011-10-31 2013-05-08 주식회사 아이리버 로봇 상호 간의 감정표현방법
CN103150432A (zh) * 2013-03-07 2013-06-12 宁波成电泰克电子信息技术发展有限公司 一种网络舆情分析方法
CN103235818A (zh) * 2013-04-27 2013-08-07 北京百度网讯科技有限公司 一种基于网页情感倾向性的信息推送方法和装置
CN106096664A (zh) * 2016-06-23 2016-11-09 广州云数信息科技有限公司 一种基于社交网络数据的情感分析方法
CN108121698A (zh) * 2017-11-29 2018-06-05 张宁 中文文字情绪识别方法及系统
CN112052995A (zh) * 2020-08-31 2020-12-08 杭州电子科技大学 基于融合情感倾向主题的社交网络用户影响力预测方法

Similar Documents

Publication Publication Date Title
CN108829658B (zh) 新词发现的方法及装置
CN105786991B (zh) 结合用户情感表达方式的中文情感新词识别方法和系统
Liu et al. Author name disambiguation for p ub m ed
Mitra et al. An automatic approach to identify word sense changes in text media across timescales
US20120166414A1 (en) Systems and methods for relevance scoring
CN107992633A (zh) 基于关键词特征的电子文档自动分类方法及系统
US8122022B1 (en) Abbreviation detection for common synonym generation
KR20150036117A (ko) 쿼리 확장
CN106095778A (zh) 搜索引擎的中文搜索词自动纠错方法
CN101650742B (zh) 一种对英文检索的检索条件进行提示的系统及方法
CN104298714B (zh) 一种基于异常处理的海量文本自动标注方法
CN103186556A (zh) 得到和搜索结构化语义知识的方法及对应装置
CN105512333A (zh) 基于情感倾向的产品评论主题搜索方法
CN106844482B (zh) 一种基于搜索引擎的检索信息匹配方法及装置
CN112633012B (zh) 一种基于实体类型匹配的未登录词替换方法
CN113934941A (zh) 一种基于多维度信息的用户推荐系统及方法
CN101833579A (zh) 一种自动检测学术不端文献的方法及系统
CN110287493B (zh) 风险短语识别方法、装置、电子设备及存储介质
CN105989033A (zh) 一种基于资讯指纹的资讯去重方法
CN107391504A (zh) 新词识别方法与装置
CN108475265B (zh) 获取未登录词的方法与装置
JP6049201B2 (ja) 類義語を検出するための共起パターンを生成するプログラム、方法、装置及びサーバ
CN107330081A (zh) 一种信息特征提取方法
CN108427769B (zh) 一种基于社交网络的人物兴趣标签提取方法
CN113157858A (zh) 一种基于情感词匹配与频度结合的情感程度检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 200062 room 223a, 358 building, 3663 Zhongshan North Road, Putuo District, Shanghai

Applicant after: Boguan innovation (Shanghai) big data Technology Co.,Ltd.

Address before: 200062 room 223a, 358 building, 3663 Zhongshan North Road, Putuo District, Shanghai

Applicant before: Shanghai biguan Data Technology Co.,Ltd.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: 200433 room 403-3, No. 2 (Building B), Lane 2005, Huangxing Road, Yangpu District, Shanghai

Applicant after: Boguan innovation (Shanghai) big data Technology Co.,Ltd.

Address before: 200062 room 223a, 358 building, 3663 Zhongshan North Road, Putuo District, Shanghai

Applicant before: Boguan innovation (Shanghai) big data Technology Co.,Ltd.

CB02 Change of applicant information
CB03 Change of inventor or designer information

Inventor after: Gu Jun

Inventor after: Li Yongzhi

Inventor after: Jiang Ming

Inventor after: Guo Weiwei

Inventor before: Guo Weiwei

CB03 Change of inventor or designer information
RJ01 Rejection of invention patent application after publication

Application publication date: 20210723

RJ01 Rejection of invention patent application after publication