CN110069786A - 语文作文情感倾向的分析方法、装置和设备 - Google Patents
语文作文情感倾向的分析方法、装置和设备 Download PDFInfo
- Publication number
- CN110069786A CN110069786A CN201910371920.7A CN201910371920A CN110069786A CN 110069786 A CN110069786 A CN 110069786A CN 201910371920 A CN201910371920 A CN 201910371920A CN 110069786 A CN110069786 A CN 110069786A
- Authority
- CN
- China
- Prior art keywords
- emotion
- word
- dictionary
- score value
- basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 125
- 238000004458 analytical method Methods 0.000 title claims abstract description 27
- 230000008451 emotion Effects 0.000 claims abstract description 375
- 238000012545 processing Methods 0.000 claims abstract description 27
- 230000011218 segmentation Effects 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 9
- 230000004048 modification Effects 0.000 claims description 28
- 238000012986 modification Methods 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 18
- 230000003203 everyday effect Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 3
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 206010019233 Headaches Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及一种语文作文情感倾向的分析方法、装置和设备,应用于自然语言处理、文本分析技术领域,包括:获取待分析的语文作文,按照词性对待分析的语文作文进行分词处理,将待分析的语文作文拆分为不同词性的分词集合,精简语文作文的内容,对分词集合进行净噪处理,并将净噪处理后的分词集合与预先获取的情感词典进行对比,查找分词集合中与情感词典中相同的词语,得到各基础情感词及对应的情感分值、各修饰词及对应的情感程度值,从而计算语文作文所包含的认同感情感分值、安全感情感分值、关爱感情感分值和愉悦感情感分值,实现了通过这四种情感的情感分值来判断学生具体的心理活动,制定个性化教学方案,提升学生成绩,提高教学效率。
Description
技术领域
本申请涉及自然语言处理、文本分析技术领域,具体涉及一种语文作文情感倾向的分析方法、装置和设备。
背景技术
随着互联网的广泛普及,利用平板电脑、个人计算机等电子设备来批阅学生的语文作文已经越来越流行。
相关技术中,目前投入市场使用的诸多语文作文批改系统,主要还是聚焦在词汇、语法、修辞等方面,基于云计算在线批改学生的语文作文,从而判断学生的语文作文是否切合题干要求,并给出相应的得分以及评语意见,但并没有对学生的语文作文表现出的情感进行识别和评测,更无法通过语文作文准确的分析学生当时的情感倾向。
发明内容
为至少在一定程度上克服相关技术中存在的问题,本申请提供一种语文作文情感倾向的分析方法。
本申请的目的是通过如下技术方案实现的:
一种语文作文情感倾向的分析方法,包括:
获取待分析的语文作文;
按照词性对所述待分析的语文作文进行分词处理,得到分词集合;
对所述分词集合进行净噪处理;
获取情感词典;所述情感词典包括基础情感词典和修饰词典,所述基础情感词典包括多种情感的词典,所述多种情感的词典包括认同感词典、安全感词典、关爱感词典、愉悦感词典,各种情感的词典包括基础情感词及对应的情感分值,所述修饰词典包括修饰词及对应的情感程度值;
将净噪处理后的所述分词集合与所述情感词典进行对比,查找到所述分词集合与所述情感词典中相同的词语,得到各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值;
根据所述各种情感的基础情感词及对应的情感分值、所述各修饰词及对应的情感程度值,计算所述待分析的语文作文的各种情感的分值。
可选的,还包括:
获取所述基础情感词,确定获取的所述基础情感词按照词义所表达的情感,将获取的基础情感词添加到确定的情感对应的词典中,得到所述多种情感的词典,以及确定所述多种情感的词典中的每个基础情感词对应的情感分值,得到所述基础情感词典;
获取所述修饰词,以及确定获取的所述修饰词的情感程度值,得到所述修饰词典;
将所述基础情感词典和所述修饰词典作为所述情感词典。
可选的,所述基础情感词典包括:学生语料中具有情感倾向的常用词和具有情感倾向的诗句。
可选的,所述基础情感词词典还包括:通过word2vec深度学习方法寻找到的与所述具有情感倾向的常用词的词义直接相近的词语。
可选的,所述具有情感倾向的常用词包括本身具有情感倾向的常用词和本身具有多个义项且其中有一个义项具有情感倾向的常用词。
可选的,所述确定所述多种情感的词典中的每个基础情感词对应的情感分值,包括:
针对每种情感的词典执行如下操作步骤:
将各所述基础情感词输入搜索引擎,所述搜索引擎返回每个所述基础情感词各自对应的hits数,按照所述hits数对所述基础情感词进行降序排序,并选取hits数排序位于前至少15%的词语作为种子词,其余的词语作为非种子词;
确定所述种子词的类别;所述种子词的类别包括正向种子词和负向种子词,其中,所述正向种子词表示肯定褒义,所述负向种子词表示否定贬义;
将所述正向种子词的情感分值赋值为+1,将所述正向种子词的情感分值赋值为-1;
根据词语词义距离计算所述非种子词的情感分值的计算公式如下:
其中,S(C)表示的是所述非种子词的情感分值,K_Pi表示的是第i个所述正向种子词,所述正向种子词的数量为M,K_Nj表示的是第j个所述负向种子词,所述负向种子词的数量为N;C1,C2表示的是两个中文词语,C1和C2均有多个义项,C1的义项分别为Y11、Y12...Y1m,C2的义项分别为Y21、Y22...Y2n,max表示取C1和C2的义项相似度的最大值作为C1和C2的相似度;α为常数,取为1,d表示义项Y1i和Y2j的词义距离。
可选的,所述修饰词典包括程度副词词典和否定词词典;所述程度副词词典包括学生语料中修饰所述基础情感词的程度副词;所述否定词词典包括学生语料中修饰所述基础情感词的否定词;确定所述修饰词的情感程度值,包括:将所述程度副词的情感程度值赋值为开区间(0,1)中的一个数量值,将所述否定词的情感程度值赋值为-1。
可选的,所述根据所述各种情感的基础情感词及对应的情感分值、所述各修饰词及对应的情感程度值,计算所述待分析的语文作文的各种情感的分值,包括:
针对计算每种情感的分值执行如下操作步骤:
获取所述语文作文中程度副词所修饰的各基础情感词,并将各所述程度副词与对应所修饰的各所述基础情感词组合成词组,得到第一基础情感词集,并计算所述第一基础情感词集的总情感分值,计算公式如下:
其中O(C)表示的是所述第一基础情感词集的总情感分值,T(CI)表示的是所述语文作文中第I个有程度副词所修饰的所述基础情感词的情感分值,P(RI)表示的是所述语文作文中第I个程度副词的情感程度值;
获取所述语文作文中否定词所修饰的各基础情感词,并将各所述否定词与对应所修饰的各所述基础情感词组合成词组,得到第二基础情感词集,并计算所述第二基础情感词集的总情感分值,计算公式如下:
其中Q(C)表示的是所述第二基础情感词集的总情感分值,T(CJ)表示的是所述语文作文中第J个有否定词修饰的所述基础情感词的情感分值,P(NJ)表示的是所述语文作文中第J个否定词的情感程度值;
获取所述语文作文中程度副词和否定词所共同修饰的各基础情感词,并将所述程度副词和所述否定词与对应所共同修饰的各所述基础情感词组合成词组,得到第三基础情感词集,并计算所述第三基础情感词集的总情感分值,计算公式如下:
其中,U(C)表示的是所述第三基础情感词集的总情感分值,T(Ck)表示的是所述语文作文中第k个有程度副词和否定词共同修饰的所述基础情感词的情感分值,P(Rk)表示的是所述语文作文中第k个程度副词的情感程度值,P(Nk)表示的是所述语文作文中第k个否定词的情感程度值;
获取并计算所述语文作文中未经所述程度副词和所述否定词所修饰的各基础情感词的总情感分值,计算公式如下:
其中,V(C)表示的是所述语文作文中未经所述程度副词和所述否定词所修饰的各基础情感词的总情感分值,S(CL)表示的是所述语文作文中第L个未经所述程度副词和所述否定词所修饰基础情感词的情感分值;
计算所述待分析的语文作文的各种情感的分值,计算公式如下:
W(C)=O(C)+Q(C)+U(C)+V(C)
其中,W(C)表示的是所述待分析的语文作文的各种情感的分值。
一种语文作文情感倾向的分析装置,包括:
第一获取模块,用于获取待分析的语文作文;
第一处理模块,用于按照词性对所述待分析的语文作文进行分词处理,得到分词集合;
第二处理模块,用于对所述分词集合进行净噪处理;
第二获取模块,用于获取情感词典;所述情感词典包括基础情感词典和修饰词典,所述基础情感词典包括多种情感的词典,所述多种情感的词典包括认同感词典、安全感词典、关爱感词典、愉悦感词典,各种情感的词典包括基础情感词及对应的情感分值,所述修饰词典包括修饰词及对应的情感程度值;
对比模块,用于将净噪处理后的所述分词集合与所述情感词典进行对比,查找到所述分词集合与所述情感词典中相同的词语,得到各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值;
计算模块,用于根据所述各种情感的基础情感词及对应的情感分值、所述各修饰词及对应的情感程度值,计算所述待分析的语文作文的各种情感的分值。
一种语文作文情感倾向的分析设备,包括:
处理器,以及与所述处理器相连接的存储器;
所述存储器用于存储计算机程序;
所述处理器用于调用并执行所述存储器中的所述计算机程序,以执行如以上任一项所述的语文作文情感倾向的分析方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
本申请的实施例提供的方案中,获取待分析的语文作文后,按照词性对待分析的语文作文进行分词处理,将待分析的语文作文拆分为不同词性的分词集合,去掉语文作文中的标点符号,精简语文作文的内容,对分词集合进行净噪处理,去掉与基础情感词和修饰词无关的分词集合,并将净噪处理后的分词集合与预先获取的情感词典进行对比,查找分词集合与情感词典中相同的词语,得到各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值,从而使语文作文中的每一个基础情感词具有对应的情感分值,每一个修饰具有对应的情感程度值。根据语文作文中的各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值,从而计算语文作文中所包含的认同感情感分值、安全感情感分值、关爱感情感分值和愉悦感情感分值。相关技术中,只是针对学生的语文作文是否切合题干要求进行评测,而本申请实现了通过对学生的语文作文的分析来获取学生认同感、安全感、关爱感和愉悦感这四种情感的情感分值,并依据这四种情感的情感分值来判断学生具体的心理活动,制定个性化教学方案,提升学生成绩,提高教学效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请一个实施例提供的一种语文作文情感倾向的分析方法的流程图。
图2是本申请一个实施例提供的一种情感词典的结构示意图。
图3是本申请一个实施例提供的一种语文作文情感倾向的分析装置的结构示意图。
图4是本申请一个实施例提供的一种语文作文情感倾向的分析设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将对本申请的技术方案进行详细的描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本申请所保护的范围。
实施例
图1是本申请一个实施例提供的一种语文作文情感倾向的分析方法的流程图。
图2是本申请一个实施例提供的一种情感词典的结构示意图。
结合图1和图2所示,本实施例提供的语文作文情感倾向的分析方法至少包括如下步骤:
步骤11、获取待分析的语文作文;
步骤12、按照词性对待分析的语文作文进行分词处理,得到分词集合;
步骤13、对分词集合进行净噪处理;
步骤14、获取情感词典;情感词典2包括基础情感词典21和修饰词典22,基础情感词典21包括多种情感的词典,多种情感的词典包括认同感词典211、安全感词典212、关爱感词典213、愉悦感词典214,各种情感的词典包括基础情感词及对应的情感分值,修饰词典22包括修饰词及对应的情感程度值;
步骤15、将净噪处理后的分词集合与情感词典2进行对比,查找到分词集合与情感词典2中相同的词语,得到各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值;
步骤16、根据各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值,计算待分析的语文作文的各种情感的分值。
需要说明的是,上述步骤14与上述步骤11~步骤13的时序并非限定,上述步骤14也可以在上述步骤11~步骤13之前执行。
本申请的实施例提供的方案中,获取待分析的语文作文后,按照词性对待分析的语文作文进行分词处理,将待分析的语文作文拆分为不同词性的分词集合,去掉语文作文中的标点符号,精简语文作文的内容,对分词集合进行净噪处理,去掉与基础情感词和修饰词无关的分词集合,并将净噪处理后的分词集合与预先获取的情感词典2进行对比,查找分词集合与情感词典2中相同的词语,得到各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值,从而使语文作文中的每一个基础情感词具有对应的情感分值,每一个修饰具有对应的情感程度值。根据语文作文中的各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值,从而计算语文作文中所包含的认同感情感分值、安全感情感分值、关爱感情感分值和愉悦感情感分值。相关技术中,只是针对学生的语文作文是否切合题干要求进行评测,而本申请实现了通过对学生的语文作文的分析来获取学生认同感、安全感、关爱感和愉悦感这四种情感的情感分值,并依据这四种情感的情感分值来判断学生具体的心理活动,制定个性化教学方案,提升学生成绩,提高教学效率。
需要说明的是,步骤12中的按照词性对待分析的语文作文进行分词处理,可以选择哈工大语言云技术,从而去掉语文作文中的标点符号,得到分词集合,分词集合包括名词集合、形容词集合、动词集合、程度副词集合和否定词集合。
需要说明的是,步骤13中的对分词集合进行净噪处理,以去除掉名词集合和动词集合,只保留形容词集合、程度副词集合和否定词集合。具体的,可以采用TF-IDF等技术实现净噪处理,TF-IDF技术为一种成熟的技术,此处不再赘述。
上述情感词典是可以预先建立的,基于此,本申请实施例提供的方法还可以包括:
获取基础情感词,确定获取的基础情感词按照词义所表达的情感,将获取的基础情感词添加到确定的情感对应的词典中,得到多种情感的词典,以及确定多种情感的词典中的每个基础情感词对应的情感分值,得到基础情感词典21;
获取修饰词,以及确定获取的修饰词的情感程度值,得到修饰词典22;
将基础情感词典21和修饰词典22作为情感词典2。
需要说明的是,基础情感词包括认同感词、关爱感词、愉悦感词和愉悦感词,修饰词包括程度副词和否定词。
一些实施例中,基础情感词典21包括:学生语料中具有情感倾向的常用词和具有情感倾向的诗句。
具体实施时,学生语料包括K12语文教材、通用汉语词典和360近义词词林等。此外,学生语料必须满足以下条件,一是具有情感倾向的常用词和具有情感倾向的诗句必须为现代汉语,二是具有情感倾向的常用词和具有情感倾向的诗句使用频率要高,必须要满足被使用十次以上,以排除掉一些生僻词。
一些实施例中,基础情感词典21还包括:通过word2vec深度学习方法寻找到的与具有情感倾向的常用词的词义直接相近的词语。
与具有情感倾向的常用词的词义直接相近的词语是指,以认同感为例,比如,A是认同感词语,A与B词义相近,B与C词义相近,则A与B为直接相近,A与C为间接相近。通过分析,发现有些A与C词义并不相近,因此在构建认同感词典211时,为保证认同感词典211的准确率,只取与已纳入认同感词典211内的词语词义直接相近的词语,不取词义间接相近的词语。
一些实施例中,具有情感倾向的常用词包括本身具有情感倾向的常用词和本身具有多个义项且其中有一个义项具有情感倾向的常用词。
以具有认同感倾向的常用词为例,情感词本身具有认同感倾向,表示对人物、事物、事件的认同与不认同,比如“同意、赞同、认可、支持、鼓励”表示认同,“反对、拒绝、嫌弃、深恶痛绝”表示不认同;情感词中的某个义项具有认同感倾向,比如“龙”,其中一个义项表示动物图腾,另有义项表示具有认同感倾向的能力超群之义,“头疼”的一个义项表示身体不舒服,另有义项表示事情棘手难处理,表示不认同。
确定多种情感的词典中的每个基础情感词对应的情感分值时,具体实现方式有多种。一些实施例中,确定多种情感的词典中的每个基础情感词对应的情感分值,具体实现方式可以是:
将各基础情感词输入搜索引擎,搜索引擎返回每个基础情感词各自对应的hits数,按照hits数对基础情感词进行降序排序,并选取hits数排序位于前至少15%的词语作为种子词,其余的词语作为非种子;
确定种子词的类别;种子词的类别包括正向种子词和负向种子词,其中,正向种子词表示肯定褒义,负向种子词表示否定贬义;
将正向种子词的情感分值赋值为+1,将正向种子词的情感分值赋值为-1;
根据词语词义距离计算所述非种子词的情感分值的计算公式如下:
其中,S(C)表示的是所述非种子词的情感分值,K_Pi表示的是第i个所述正向种子词,所述正向种子词的数量为M,K_Nj表示的是第j个所述负向种子词,所述负向种子词的数量为N;C1,C2表示的是两个中文词语,C1和C2均有多个义项,C1的义项分别为Y11、Y12...Y1m,C2的义项分别为Y21、Y22...Y2n,max表示取C1和C2的义项相似度的最大值作为C1和C2的相似度;α为常数,取为1,d表示义项Y1i和Y2j的词义距离;M、N、m、n均取为正整数。
具体实施时,搜索引擎可以为但不局限于Google。
需要说明的是,hits数源自hits算法,hits算法为现有技术,hits算法的核心是建立在页面链接关系的基础上,在用户将基础情感词输入到搜索引擎后开始运行,并返回相应的hits数来表示具体的基础情感词的感情倾向及感情强度,hits数越大代表基础情感词的感情倾向越明显、感情强度越强烈。
如图2所示,本实施例中,修饰词典22包括程度副词词典221和否定词词典222;程度副词词典221包括学生语料中修饰基础情感词的程度副词,否定词词典222包括学生语料中修饰基础情感词的否定词;确定修饰词的情感程度值,包括:将程度副词的情感程度值赋值为开区间(0,1)中的一个数量值,将否定词的情感程度值赋值为-1。
具体实施时,程度副词可以为但不局限于以下所列举的词语:百分之百、非常、极度、绝对、完全、异常、最、尤其、特别、过度、强、极其、充分、甚为、更加、益发、越加、愈发、稍微、有些、轻度、相对、不怎么和略微。
具体实施时,否定词可以为但不局限于以下所列举的词语:不、否和没。
根据各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值,计算待分析的语文作文的各种情感的分值时,具体实现方式有多种。一些实施例中,根据各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值,计算待分析的语文作文的各种情感的分值,具体实现方式可以是:
针对计算每种情感的分值执行如下操作步骤:
获取语文作文中程度副词所修饰的各基础情感词,并将各程度副词与对应所修饰的各基础情感词组合成词组,得到第一基础情感词集,并计算第一基础情感词集的总情感分值,计算公式如下:
其中O(C)表示的是所述第一基础情感词集的总情感分值,T(CI)表示的是所述语文作文中第I个有程度副词所修饰的所述基础情感词的情感分值,P(RI)表示的是所述语文作文中第I个程度副词的情感程度值;m1取为正整数;
获取语文作文中否定词所修饰的各基础情感词,并将各否定词与对应所修饰的各基础情感词组合成词组,得到第二基础情感词集,并计算第二基础情感词集的总情感分值,计算公式如下:
其中Q(C)表示的是所述第二基础情感词集的总情感分值,T(CJ)表示的是所述语文作文中第J个有否定词修饰的所述基础情感词的情感分值,P(NJ)表示的是所述语文作文中第J个否定词的情感程度值;m2取为正整数;
获取语文作文中程度副词和否定词所共同修饰的各基础情感词,并将程度副词和否定词与对应所共同修饰的各基础情感词组合成词组,得到第三基础情感词集,并计算第三基础情感词集的总情感分值,计算公式如下:
其中,U(C)表示的是第三基础情感词集的总情感分值,T(Ck)表示的是语文作文中第k个有程度副词和否定词共同修饰的基础情感词的情感分值,P(Rk)表示的是语文作文中第k个程度副词的情感程度值,P(Nk)表示的是语文作文中第k个否定词的情感程度值;m3取为正整数;
获取并计算语文作文中未经程度副词和否定词所修饰的各基础情感词的总情感分值,计算公式如下:
其中,V(C)表示的是语文作文中未经程度副词和否定词所修饰的各基础情感词的总情感分值,S(CL)表示的是语文作文中第L个未经程度副词和否定词所修饰基础情感词的情感分值;m4取为正整数;
计算待分析的语文作文的各种情感的分值,计算公式如下:
W(C)=O(C)+Q(C)+U(C)+V(C)
其中,W(C)表示的是待分析的语文作文的各种情感的分值。
需要说明的是,执行以上操作步骤,可以分别得到语文作文所反映的认同感情感分值、安全感情感分值、关爱感情感分值和愉悦感情感分值。
图3是本申请一个实施例提供的一种语文作文情感倾向的分析装置的结构示意图。
如图3所示,本实施例提供的一种语文作文情感倾向的分析装置,包括:
第一获取模块31,用于获取待分析的语文作文;
第一处理模块32,用于按照词性对待分析的语文作文进行分词处理,得到分词集合;
第二处理模块32,用于对分词集合进行净噪处理;
第二获取模块33,用于获取情感词典;情感词典包括基础情感词典和修饰词典,基础情感词典包括多种情感的词典,多种情感的词典包括认同感词典、安全感词典、关爱感词典、愉悦感词典,各种情感的词典包括基础情感词及对应的情感分值,修饰词典包括修饰词及对应的情感程度值;
对比模块34,用于将净噪处理后的分词集合与情感词典进行对比,查找到分词集合与情感词典中相同的词语,得到各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值;
计算模块35,用于根据各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值,计算待分析的语文作文的各种情感的分值。
本实施例的具体实现方案可以参见前述实施例记载的语文作文情感倾向的分析方法实施例中的相关说明,此处不再赘述。
图4是本申请一个实施例提供的一种语文作文情感倾向的分析设备的结构示意图。
如图4所示,本实施例提供的一种语文作文情感倾向的分析设备,包括:
处理器41,以及与处理器相连接的存储器42;
存储器41用于存储计算机程序;
处理器42用于调用并执行存储器41中的计算机程序,以执行如以上任一项的语文作文情感倾向的分析方法。
本实施例的具体实现方案可以参见前述实施例记载的语文作文情感倾向的分析方法实施例中的相关说明,此处不再赘述。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种语文作文情感倾向的分析方法,其特征在于,包括:
获取待分析的语文作文;
按照词性对所述待分析的语文作文进行分词处理,得到分词集合;
对所述分词集合进行净噪处理;
获取情感词典;所述情感词典包括基础情感词典和修饰词典,所述基础情感词典包括多种情感的词典,所述多种情感的词典包括认同感词典、安全感词典、关爱感词典、愉悦感词典,各种情感的词典包括基础情感词及对应的情感分值,所述修饰词典包括修饰词及对应的情感程度值;
将净噪处理后的所述分词集合与所述情感词典进行对比,查找到所述分词集合与所述情感词典中相同的词语,得到各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值;
根据所述各种情感的基础情感词及对应的情感分值、所述各修饰词及对应的情感程度值,计算所述待分析的语文作文的各种情感的分值。
2.根据权利要求1所述的分析方法,其特征在于,还包括:
获取所述基础情感词,确定获取的所述基础情感词按照词义所表达的情感,将获取的基础情感词添加到确定的情感对应的词典中,得到所述多种情感的词典,以及确定所述多种情感的词典中的每个基础情感词对应的情感分值,得到所述基础情感词典;
获取所述修饰词,以及确定获取的所述修饰词的情感程度值,得到所述修饰词典;
将所述基础情感词典和所述修饰词典作为所述情感词典。
3.根据权利要求1所述的分析方法,其特征在于,所述基础情感词典包括:学生语料中具有情感倾向的常用词和具有情感倾向的诗句。
4.根据权利要求3所述的分析方法,其特征在于,所述基础情感词典还包括:通过word2vec深度学习方法寻找到的与所述具有情感倾向的常用词的词义直接相近的词语。
5.根据权利要求3或4所述的分析方法,其特征在于,所述具有情感倾向的常用词包括本身具有情感倾向的常用词和本身具有多个义项且其中有一个义项具有情感倾向的常用词。
6.根据权利要求2所述的分析方法,其特征在于,所述确定所述多种情感的词典中的每个基础情感词对应的情感分值,包括:
针对每种情感的词典执行如下操作步骤:
将各所述基础情感词输入搜索引擎,所述搜索引擎返回每个所述基础情感词各自对应的hits数,按照所述hits数对所述基础情感词进行降序排序,并选取hits数排序位于前至少15%的词语作为种子词,其余的词语作为非种子词;
确定所述种子词的类别;所述种子词的类别包括正向种子词和负向种子词,其中,所述正向种子词表示肯定褒义,所述负向种子词表示否定贬义;
将所述正向种子词的情感分值赋值为+1,将所述负向种子词的情感分值赋值为-1;
根据词语词义距离计算所述非种子词的情感分值的计算公式如下:
其中,S(C)表示的是所述非种子词的情感分值,K_Pi表示的是第i个所述正向种子词,所述正向种子词的数量为M,K_Nj表示的是第j个所述负向种子词,所述负向种子词的数量为N;C1,C2表示的是两个中文词语,C1和C2均有多个义项,C1的义项分别为Y11、Y12...Y1m,C2的义项分别为Y21、Y22...Y2n,max表示取C1和C2的义项相似度的最大值作为C1和C2的相似度;α为常数,取为1,d表示义项Y1i和义项Y2j的词义距离。
7.根据权利要求1所述的分析方法,其特征在于,所述修饰词典包括程度副词词典和否定词词典;所述程度副词词典包括学生语料中修饰所述基础情感词的程度副词,所述否定词词典包括学生语料中修饰所述基础情感词的否定词;确定所述修饰词的情感程度值,包括:将所述程度副词的情感程度值赋值为开区间(0,1)中的一个数量值,将所述否定词的情感程度值赋值为-1。
8.根据权利要求7所述的分析方法,其特征在于,所述根据所述各种情感的基础情感词及对应的情感分值、所述各修饰词及对应的情感程度值,计算所述待分析的语文作文的各种情感的分值,包括:
针对计算每种情感的分值执行如下操作步骤:
获取所述语文作文中程度副词所修饰的各基础情感词,并将各所述程度副词与对应所修饰的各所述基础情感词组合成词组,得到第一基础情感词集,并计算所述第一基础情感词集的总情感分值,计算公式如下:
其中O(C)表示的是所述第一基础情感词集的总情感分值,T(CI)表示的是所述语文作文中第I个有程度副词所修饰的所述基础情感词的情感分值,P(RI)表示的是所述语文作文中第I个程度副词的情感程度值;
获取所述语文作文中否定词所修饰的各基础情感词,并将各所述否定词与对应所修饰的各所述基础情感词组合成词组,得到第二基础情感词集,并计算所述第二基础情感词集的总情感分值,计算公式如下:
其中Q(C)表示的是所述第二基础情感词集的总情感分值,T(CJ)表示的是所述语文作文中第J个有否定词修饰的所述基础情感词的情感分值,P(NJ)表示的是所述语文作文中第J个否定词的情感程度值;
获取所述语文作文中程度副词和否定词所共同修饰的各基础情感词,并将所述程度副词和所述否定词与对应所共同修饰的各所述基础情感词组合成词组,得到第三基础情感词集,并计算所述第三基础情感词集的总情感分值,计算公式如下:
其中,U(C)表示的是所述第三基础情感词集的总情感分值,T(Ck)表示的是所述语文作文中第k个有程度副词和否定词共同修饰的所述基础情感词的情感分值,P(Rk)表示的是所述语文作文中第k个程度副词的情感程度值,P(Nk)表示的是所述语文作文中第k个否定词的情感程度值;
获取并计算所述语文作文中未经所述程度副词和所述否定词所修饰的各基础情感词的总情感分值,计算公式如下:
其中,V(C)表示的是所述语文作文中未经所述程度副词和所述否定词所修饰的各基础情感词的总情感分值,S(CL)表示的是所述语文作文中第L个未经所述程度副词和所述否定词所修饰基础情感词的情感分值;
计算所述待分析的语文作文的各种情感的分值,计算公式如下:
W(C)=O(C)+Q(C)+U(C)+V(C)
其中,W(C)表示的是所述待分析的语文作文的各种情感的分值。
9.一种语文作文情感倾向的分析装置,其特征在于,包括:
第一获取模块,用于获取待分析的语文作文;
第一处理模块,用于按照词性对所述待分析的语文作文进行分词处理,得到分词集合;
第二处理模块,用于对所述分词集合进行净噪处理;
第二获取模块,用于获取情感词典;所述情感词典包括基础情感词典和修饰词典,所述基础情感词典包括多种情感的词典,所述多种情感的词典包括认同感词典、安全感词典、关爱感词典、愉悦感词典,各种情感的词典包括基础情感词及对应的情感分值,所述修饰词典包括修饰词及对应的情感程度值;
对比模块,用于将净噪处理后的所述分词集合与所述情感词典进行对比,查找到所述分词集合与所述情感词典中相同的词语,得到各种情感的基础情感词及对应的情感分值、各修饰词及对应的情感程度值;
计算模块,用于根据所述各种情感的基础情感词及对应的情感分值、所述各修饰词及对应的情感程度值,计算所述待分析的语文作文的各种情感的分值。
10.一种语文作文情感倾向的分析设备,其特征在于,包括:
处理器,以及与所述处理器相连接的存储器;
所述存储器用于存储计算机程序;
所述处理器用于调用并执行所述存储器中的所述计算机程序,以执行如权利要求1~8任一项所述的语文作文情感倾向的分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910371920.7A CN110069786A (zh) | 2019-05-06 | 2019-05-06 | 语文作文情感倾向的分析方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910371920.7A CN110069786A (zh) | 2019-05-06 | 2019-05-06 | 语文作文情感倾向的分析方法、装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110069786A true CN110069786A (zh) | 2019-07-30 |
Family
ID=67370118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910371920.7A Pending CN110069786A (zh) | 2019-05-06 | 2019-05-06 | 语文作文情感倾向的分析方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110069786A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898377A (zh) * | 2020-07-07 | 2020-11-06 | 苏宁金融科技(南京)有限公司 | 一种情感识别方法、装置、计算机设备及存储介质 |
CN112818681A (zh) * | 2020-12-31 | 2021-05-18 | 北京知因智慧科技有限公司 | 文本情感分析方法、系统及电子设备 |
CN113505587A (zh) * | 2021-06-23 | 2021-10-15 | 科大讯飞华南人工智能研究院(广州)有限公司 | 实体抽取方法及相关装置、设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106598944A (zh) * | 2016-11-25 | 2017-04-26 | 中国民航大学 | 一种民航安保舆情情感分析方法 |
CN106776551A (zh) * | 2016-12-06 | 2017-05-31 | 桂林电子科技大学 | 一种英语作文情感观点的分析方法 |
US20170337180A1 (en) * | 2016-05-23 | 2017-11-23 | Lishan Wang | Recognition method and system of natural language for machine thinking |
CN107885785A (zh) * | 2017-10-17 | 2018-04-06 | 北京京东尚科信息技术有限公司 | 文本情感分析方法和装置 |
-
2019
- 2019-05-06 CN CN201910371920.7A patent/CN110069786A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170337180A1 (en) * | 2016-05-23 | 2017-11-23 | Lishan Wang | Recognition method and system of natural language for machine thinking |
CN106598944A (zh) * | 2016-11-25 | 2017-04-26 | 中国民航大学 | 一种民航安保舆情情感分析方法 |
CN106776551A (zh) * | 2016-12-06 | 2017-05-31 | 桂林电子科技大学 | 一种英语作文情感观点的分析方法 |
CN107885785A (zh) * | 2017-10-17 | 2018-04-06 | 北京京东尚科信息技术有限公司 | 文本情感分析方法和装置 |
Non-Patent Citations (3)
Title |
---|
何凤英: "基于语义理解的中文博文倾向性分析", 《计算机应用》 * |
王仁武 等: "基于Word2vec的情感分析在品牌认知中的应用研究", 《图书情报工作》 * |
郑颖: "基于模板匹配的文本倾向性研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898377A (zh) * | 2020-07-07 | 2020-11-06 | 苏宁金融科技(南京)有限公司 | 一种情感识别方法、装置、计算机设备及存储介质 |
CN112818681A (zh) * | 2020-12-31 | 2021-05-18 | 北京知因智慧科技有限公司 | 文本情感分析方法、系统及电子设备 |
CN112818681B (zh) * | 2020-12-31 | 2023-11-10 | 北京知因智慧科技有限公司 | 文本情感分析方法、系统及电子设备 |
CN113505587A (zh) * | 2021-06-23 | 2021-10-15 | 科大讯飞华南人工智能研究院(广州)有限公司 | 实体抽取方法及相关装置、设备和存储介质 |
CN113505587B (zh) * | 2021-06-23 | 2024-04-09 | 科大讯飞华南人工智能研究院(广州)有限公司 | 实体抽取方法及相关装置、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hanselowski et al. | Ukp-athene: Multi-sentence textual entailment for claim verification | |
CN106503192B (zh) | 基于人工智能的命名实体识别方法及装置 | |
Al-Hashemi | Text Summarization Extraction System (TSES) Using Extracted Keywords. | |
JP5825676B2 (ja) | ノン・ファクトイド型質問応答システム及びコンピュータプログラム | |
CN105528410B (zh) | 一种对医院的在线评论进行归纳和分类的方法 | |
Orosz et al. | PurePos 2.0: a hybrid tool for morphological disambiguation | |
Chen et al. | Jointly modeling inter-slot relations by random walk on knowledge graphs for unsupervised spoken language understanding | |
CN104881402A (zh) | 中文网络话题评论文本语义倾向分析的方法及装置 | |
CN107305539A (zh) | 一种基于Word2Vec网络情感新词发现的文本倾向性分析方法 | |
Nayel et al. | Machine learning-based model for sentiment and sarcasm detection | |
CN110069786A (zh) | 语文作文情感倾向的分析方法、装置和设备 | |
Chiru et al. | Comparison between LSA-LDA-lexical chains | |
Gupta et al. | Text summarization of Hindi documents using rule based approach | |
CN104899188A (zh) | 一种基于问题主题和焦点的问题相似度计算方法 | |
Kumar et al. | Analysis of users’ sentiments from kannada web documents | |
JP5718405B2 (ja) | 発話選択装置、方法、及びプログラム、対話装置及び方法 | |
Almagro et al. | Speech gestural interpretation by applying word representations in robotics | |
CN111737420A (zh) | 一种基于争议焦点的类案检索方法及系统及装置及介质 | |
Sanchez-Gomez et al. | Sentiment-oriented query-focused text summarization addressed with a multi-objective optimization approach | |
JP5823441B2 (ja) | 格解析モデルパラメータ学習装置、格解析装置、方法、及びプログラム | |
Ljajić et al. | Sentiment analysis of textual comments in field of sport | |
JP2016103156A (ja) | テキスト特徴量抽出装置、テキスト特徴量抽出方法、およびプログラム | |
Brun | Learning opinionated patterns for contextual opinion detection | |
Mayfield et al. | Recognizing rare social phenomena in conversation: Empowerment detection in support group chatrooms | |
JP5718406B2 (ja) | 発話文生成装置、対話装置、発話文生成方法、対話方法、発話文生成プログラム、及び対話プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190730 |
|
RJ01 | Rejection of invention patent application after publication |