CN116720509A

CN116720509A - 一种学生教学评价领域情感词典的构建方法

Info

Publication number: CN116720509A
Application number: CN202310542066.2A
Authority: CN
Inventors: 郭鸿杰; 黄显之; 张尧; 陈丽娜; 沈方瑶; 高宏
Original assignee: Zhejiang Normal University CJNU
Current assignee: Zhejiang Normal University CJNU
Priority date: 2023-05-12
Filing date: 2023-05-12
Publication date: 2023-09-08

Abstract

本发明属于情感分析领域，并公开了一种学生教学评价领域情感词典的构建方法，包括：获取通用情感词典，构建否定词表和程度副词表；基于否定词表和程度副词表对通用情感词典进行扩建；获取学生教学评价数据，对学生教学评价数据进行预处理，预处理完成后通过TextRank算法对学生教学评价数据进行分析筛选，得到情感种子词，并通过SO‑PMI算法生成教学领域情感词，并对教学领域情感词的情感倾向值进行归一化处理操作，归一化处理后并入到扩建后的通用情感词典中，得到学生教学评价领域情感词典。本发明技术方案能够提高情感识别的准确性，生成的学生教学评价领域情感词典在评教情感分析上具有更好的效果。

Description

一种学生教学评价领域情感词典的构建方法

技术领域

本发明属于情感分析领域，特别是涉及一种学生教学评价领域情感词典的构建方法。

背景技术

在国内教育数字化进程的推进过程中，学生评教成为教学改革之路上重要的一步，目前引起了广泛的关注。学生教学评价是一种收集学生对课程教学质量反馈信息的方法，能够很好地反映学生对课程的满意度，同时能帮助教师有针对性地改进教学。通过分析高校学生评教中存在的问题并找出相应的解决方案，对促进教师改进教学、保证学生的学习利益有着重要的现实意义。因此，从学生教学评价中分析其中蕴含的情感状态有重要的价值。

情感词典的构建方法通常包含三种：手工标注的方法、基于知识库的方法和基于语料库的方法。人工构建的情感词典虽然具有较好的通用性，但是难以覆盖不同领域的情感词，领域适应性差，需耗费大量人力物力；基于知识库的方法通常只能获得通用情感词典，存在领域适应性问题；基于语料库的情感词典构建方法可以从语料中学习得到情感词典，能够节省大量人力物力。基于语料库的方法假设：具有相同情感倾向性的情感词容易出现在同一句子中，通常需要事先手工标注一小部分情感种子词，然后通过情感词与情感种子词在语料中共现关系的强度来估算待判断情感词的情感极性。

学生教学评价数据是学生对该课程以及该任课老师的评价，与商品评论不同的是，学生教学评价所表达的情感更加隐晦，其情感特征的提取也会相对困难，例如在商品评论中表达的对某商品的消极情绪可能会特别直接，然而学生对教师的教学效果持有负面评论时的表述会相对委婉，这使得复杂的情感特征难以提取。

发明内容

本发明的目的是提供一种学生教学评价领域情感词典的构建方法，以解决上述现有技术存在的问题。

为实现上述目的，本发明提供了一种学生教学评价领域情感词典的构建方法，包括：

获取通用情感词典，基于所述通用情感词典的情感数据构建否定词表和程度副词表；

基于所述否定词表和所述程度副词表对所述通用情感词典进行扩建，得到扩建后的通用情感词典；

获取学生教学评价数据，对所述学生教学评价数据进行数据预处理，数据预处理完成后通过TextRank算法对所述学生教学评价数据进行分析筛选，得到情感种子词，通过SO-PMI算法对所述情感种子词进行分析，得到基于用户的教学领域情感词，对所述教学领域情感词的情感倾向值进行归一化处理，得到归一化处理后的教学领域情感词；

对所述归一化处理后的教学领域情感词与所述扩建后的通用情感词典进行合并，得到学生教学评价领域情感词典。

可选的，所述情感数据包括情感词以及所述情感词的情感强度数据和情感极性数据。

可选的，所述构建否定词表和程度副词表的过程包括：

获取通用情感词典的否定词数据和程度副词数据，对所述情感词和否定词进行分析判断，基于判断结果构建所述否定词表；

对所述程度副词数据进行分级，通过梯度下降公式对分级结果进行加权，得到程度副词数据的分级权重数据，基于所述分级权重数据构建所述程度副词表。

可选的，所述学生教学评价数据包括：评教文本数据和教学打分数据。

可选的，所述对所述学生教学评价数据进行数据预处理的过程包括：

获取中文分词库数据和停用词典数据，通过正则表达式对所述评教文本数据中的中英文符号以及其余无用信息进行数据清洗；

基于所述中文分词库数据对数据清洗完成后的评教文本数据进行分词，分词完成后通过调用所述停用词典数据对所述评教文本数据进行去停用词操作。

可选的，获取情感种子词的过程包括：

通过TextRank算法对所述学生教学评价数据中的情感词进行循环迭代计算，计算完成后按重要程度将计算结果从高到低进行排序，得到若干积极情感种子词和消极情感种子词。

可选的，通过SO-PMI算法获取情感倾向值的计算公式为：

其中，Pterm_i为第i个积极情感种子词，Nterm_i为第i个消极情感种子词。

可选的，获取学生教学评价领域情感词典的过程包括：

对所述情感倾向值归一化处理：

其中，y为情感种子词经过归一化处理后的情感倾向值，SP为情感种子词的情感倾向值，SPmax为候选情感种子词当中情感倾向值的最大值，SPmin为情感种子词当中情感倾向值的最小值；

将归一化处理后的教学领域情感词与扩建后的通用情感词典进行合并，完成学生教学评价领域情感词典的构建。

本发明的技术效果为：

本发明提供的一种学生教学评价领域情感词典的构建方法利用梯度下降公式赋予不同强度的程度副词不同的权重值构建了程度副词表，基于否定词判断构建了否定词表，增加了程度副词和否定词表的通用情感词典可以更为精准地分析教学评语中的情感变化；

其次挖掘了基于用户的领域情感词汇，通过TextRank算法选取情感种子词，并基于情感种子词利用SO-PMI算法生成基于用户的教学领域情感词汇，增强了模型的泛化性和情感分类的准确度；最后生成学生教学评价领域情感词典，将基于用户的领域情感词并入到扩建的通用情感词典中，生成的学生教学评价领域情感词典在评教情感分析上具有更好的效果，提高了情感识别的准确性，对评教领域具有现实意义。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

构成本申请的一部分的附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本发明实施例中的流程图。

具体实施方式

现详细说明本发明的多种示例性实施方式，该详细说明不应认为是对本发明的限制，而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

实施例一

如图1所示，本实施例中提供了一种学生教学评价领域情感词典的构建方法，包括：获取通用情感词典，基于所述通用情感词典的情感数据构建否定词表和程度副词表；基于所述否定词表和所述程度副词表对所述通用情感词典进行扩建，得到扩建后的通用情感词典；获取学生教学评价数据，对所述学生教学评价数据进行数据预处理，数据预处理完成后通过TextRank算法对所述学生教学评价数据进行分析筛选，得到情感种子词，通过SO-PMI算法对所述情感种子词进行分析，得到基于用户的教学领域情感词，对所述教学领域情感词的情感倾向值进行归一化处理，得到归一化处理后的教学领域情感词；

本实施例公开了学生教学评价领域情感词典的构建方法；该方法的具体步骤包括采集学生教学评价数据，对其进行数据预处理，数据预处理包含数据清洗、去停用词和分词操作。接着扩建通用情感词典，通用情感词典选用大连理工大学情感词汇本体库，利用梯度下降公式赋予不同强度的程度副词不同的权重值构建了程度副词表，基于否定词判断构建了否定词表，并将构建好的否定词表和程度副词表整理加入到通用情感词典中，挖掘了基于用户的领域情感词汇，通过TextRank算法筛选出情感种子词，并基于情感种子词利用SO-PMI算法生成基于用户的教学领域情感词汇，最后将基于用户的领域情感词并入到扩建的通用情感词典中，生成学生教学评价领域情感词典。通过对学生教学评价领域情感词的扩充，得到更好的情感分析效果，从而提高情感识别的准确性。该方法可以用于学生教学评价领域进行情感识别。

步骤1、通用情感词典扩建；

步骤1.1、构建否定词表和程度词典表，其中利用梯度下降公式赋予不同强度的程度副词不同的权重值构建了程度副词表，基于否定词判断构建了否定词表。

通用情感词典选取，选取大连理工大学情感词汇本体库(DU_TIR)作为通用情感词典。该词典从词性种类、情感强度、情感极性等不同角度描述中文词汇，情感强度设置为1、3、5、7、9五个档次，9代表情感强度最大，1代表情感强度最小，相比其他情感词典而言，其情感强度的划分更加细致，情感极性包括中性、褒义和贬义三类，分别对应值0、1、2。

为了便于计算机进行情感计算，将贬义的极性值2修改为-1，情感词t的情感值公式如公式(1)所示：

s(t)＝w(t)g(t) (1)

其中，s(t)表示情感词t的情感值，w(t)表示情感词t的情感强度，g(t)表示情感词t的情感极性。

步骤1.2、否定词表构建；

否定词的出现往往会使教学评语的情感极性发生反转。针对情感词前出现否定词的情况，在情感计算的算法设计时需要将情感词的情感强度乘以-1，构建的否定词表如表1所示：

表1

步骤1.3、程度副词表构建。程度副词的出现往往会使情感词的情感强度发生一定程度上的改变，例如在教学评语“讲解十分仔细”中，，程度副词“十分”在一定程度上增强了情感词“仔细”的情感强度。参考知网Hownet情感词典的程度级别词语，将程度副词分为6个等级，分别代表不同强弱的情感倾向，按照梯度下降公式分别对各级别的程度副词赋予相应的权重值，其中梯度下降公式如公式(2)所示：

其中，W₁表示程度副词表中第一级别“最”的权重值，常数是梯度下降率，W_i+1表示第i+1个等级程度副词的权重值,构建的程度副词表如表2所示，

表2

步骤2、基于用户的领域情感词生成；

有效用户数据生成；

从教务系统上收集学生教学评价数据，即学生对该课程以及该任课老师的评价，包含评教文本和教学打分，与商品评论不同的是，学生教学评价所表达的情感更加隐晦，情感特征的提取也会相对困难。为了更加细致地分析学生教学评价数据蕴含的情感信息，按照教学态度、教学内容和教学效果三个维度进行划分。并对收集得到的评价文本进行数据预处理操作，其中包含数据清洗、分词、去停用词三个操作。数据清洗操作中，通过正则表达式去除文本中的中英文符号等无用信息，接着调用jieba库进行中文分词操作，，并调用停用词典，通过遍历分词后的文本，将文本中出现的停用词删除。

为从实际的学生教学评价中挑选所需扩展的领域情感词，本实施例采用情感倾向点互信息(SO-PMI)算法。SO-PMI是用PMI来判断词语的情感倾向，两个词语之间的相似度由PMI来衡量，其定义如公式(3)所示：

其中，p(term1，term2)表示词语和词语共现的概率，p(term1)和p(term2)表示词语term1和词语term2单独出现的概率，当PMI(term1，term2)越大，则说明词语term1和term2词语的关联越紧密,情感倾向也就越一致。PMI(term1，term2)有以下三种情况，如公式(4)所示：

步骤2.1、情感种子词生成；

基于用户的领域情感词生成。通过TextRank算法选取情感种子词，并基于情感种子词利用SO-PMI算法生成基于用户的教学领域情感词汇。

学生教学评价领域情感词典生成。将基于用户的领域情感词并入到扩建的通用情感词典中，实现学生教学评价领域情感词典的生成。

SO-PMI算法需要用到含明显情感倾向的情感种子词，这里使用TextRank对评教语料中的情感词按重要程度从高到低进行排序，最终选取最重要的10个积极情感种子词和消极情感种子词。

TextRank是一种基于图的排序算法，常用于关键词抽取，通过把文本分割成若干组成节点(词语)，构建词语节点连接图，用词语之间的相似度作为边的权重，通过循环迭代计算词语的，选取TextRank值最大的前K个词语。

步骤2.2、教学评语中某个词语term的情感倾向值的计算公式如公式(5)所示：

其中，Pterm_i表示第i个积极情感种子词，Nterm_i表示第i个消极情感种子词，有SO-PMI(term)有以下三种情况，如公式(6)所示：

通过SO-PMI算法得到的148个积极情感词和79个消极情感词在归一化处理后将扩充至通用情感词典，生成新的领域情感词典。

步骤2.3、情感倾向值归一化处理。为了使候选情感词的情感强度与通用情感词典的情感强度相适应，需要对候选情感词的情感倾向值做归一化处理操作，归一化公式如公式(7)所示：

其中，y表示情感种子词经过归一化处理后的情感倾向值，SP表示情感种子词的情感倾向值，SPmax表示候选情感种子词当中情感倾向值的最大值，SPmin表示情感种子词当中情感倾向值的最小值，为了使候选情感词的情感强度与通用情感词典的情感强度相适应，将归一化处理操作后的值y的区间[0,0.2)、[0.2,0.4)、[0.4,0.6)、[0.6,0.8)、[0.8,1]分别赋予情感强度1、3、5、7、9，完成领域情感词的情感倾向值归一化处理。

步骤3、学生教学评价领域情感词典生成；

将归一化处理后的领域情感词和相应的情感强度、情感极性加入通用情感词典，完成学生教学评价领域情感词典的构建。与通用情感词典类似，情感词的情感极性包括中性、褒义和贬义三类，分别对应值0、1、2。

部分的学生教学评价领域情感词典如表3所示：

表3

步骤4、性能分析；

步骤4.1、情感分类性能对比。使用学生教学评价领域情感词典对教学评语进行情感分类，包括以下4个步骤：

输入有效的教学评语；

读取学生教学评价领域情感词典、否定词表和程度副词表；

遍历每条教学评语中情感词之间的否定词和程度副词，并对相应的权重值进行计算，则可以得到教学评语中每个情感词类的情感值计算公式如公式(8)所示:

y(t)＝n(t)a(t)p(t)s(t) (8)

其中，y(t)表示情感词类的情感值，s(t)表示情感词的情感值，n(t)表示否定词的权重值，a(t)表示情感词前所有程度副词权重值的累加和，p(t)表示情感词前程度副词和否定词的相对位置关系，如果程度副词前有否定词修饰时，p(t)＝0.5，如果否定词前有程度副词修饰时，p(t)＝1，n(t)、a(t)、p(t)的具体公式如公式(9)(10)(11)所示：

n(t)＝(-1)ⁿ (9)

式(9)中，n表示情感词前否定词的个数，式(10)中，m表示该情感词前程度副词的个数，a_i表示第i个程度副词的权重值；

由于每条教学评语中包含了多个情感词类，则可以得出该条教学评语的整体情感值如公式(12)所示：

其中，r表示该条教学评语中的情感词类集，Y(r)表示该条教学评语的整体情感值，

若Y(r)≥0，则表示该条教学评语的情感倾向为正向，若Y(r)＜0，则表示该条教学评语的情感倾向为负向。

步骤4.2、课程分数预测；

本校的教务系统不仅包含学生的评教文本数据，还包含学生对每门课程的综合评教分数。本实施例通过不同教师的4门课对比试验，，验证本模型在评教量化分数上的准确性，将三种情感词典通过打分机制计算得出的综合评教分数与该课程的评教实际得分进行对比。

步骤5、性能对比；

分为情感分类和课程得分预测两个部分。其中：情感分类采用情感分析模型中常用的实验评价指标：准确率、召回率和综合分类率(F1)，并用三种情感词典算出对应教师该课程的课程得分，并与实际课程得分进行对比，课程得分采用均方误差(MSE)和均方根误差(RMSE)作为实验的评价指标。

步骤5.1、情感分类性能对比；

对通用情感词典、扩建的通用情感词典、和学生教学评价领域情感词典在正向教学评语和负向教学评语上进行性能对比，如表4所示，其中，表4为三种情感词典在正向教学评语和负向教学评语上的性能对比结果；

表4

由表4可以看出，仅使用通用情感词典的情感分类性能较差，而在加入否定词表和程度副词表扩建后，负向教学评语的召回率大幅提升21.8％，从49.1％提升到了70.9％，F1也从53.1％提升到了63.7％，提升幅度为10.6％，准确率则小幅提升；扩建的通用情感词典在正向教学评语的准确率和F1均小幅提升，由此证明了通用情感词典扩建的有效性。

学生教学评价领域情感词典相比仅使用通用情感词典的方法，情感分类性能大幅提升。其中正向教学评语的准确率、召回率和F1分别从87.1％、90.5％和88.8％提升到95.2％、96.1％和95.7％，提升幅度分别为8.1％、5.6％和6.9％；在负向教学评语的准确率、召回率和F1三个指标均大幅提升，分别从57.7％、49.1％和53.1％提升到82.2％、78.7％和80.4％，分别提升了24.5％、29.6％和27.3％。

学生教学评价领域情感词典在扩建的通用情感词典基础上进行了教学领域情感词汇的扩充，其情感分类性能相比扩建的通用情感词典也有明显的提升。就正向教学评语而言，学生教学评价领域情感词典的情感分类效果良好,在准确率、召回率和F1三个指标上都有不同程度上的提升，其中准确率、召回率和F1分别从92.6％、87.6％和90％提升到95.2％、96.1％和95.7％，提升幅度为2.6％、8.5％和5.7％；在负向教学评语上，学生教学评价领域情感词典在准确率上有大幅提升，准确率由57.9％提升到82.2％，提升了24.3％，召回率和F1也提升明显，分别由70.9％和63.7％提升到78.7％和80.4％，提升幅度为7.8％和16.7％，由此证明了教学领域情感词汇扩充的有效性。

通过对比实验得出，构建学生教学评价领域情感词典在评教领域具有较好的情感分类性能，对评教领域情感分析具有一定的实际意义。

步骤5.2、课程得分预测性能对比；

本实施例通过不同教师的4门课对比试验，验证本模型在评教量化分数上的准确性，通过打分机制对三种情感词典进行计算，得到三种情感词典的综合评教分数与该课程的评教实际得分以及所述综合评教分数与该课程评教实际得分的均方误差和均方根误差，对得到的结果进行对比，如表5和表6所示，其中，表5为综合评教分数与该课程评教实际得分的对比结果，表6为均方误差和均方根误差的对比结果；

表5

表6

由表5和表6得出，由通用情感词典计算得出的课程综合评教分数与课程评教实际得分相差甚远，均方误差和均方根误差最大；扩建的通用情感词典计算得出的课程综合评教分数相比通用情感词典得出的评教分数误差小一些；由学生教学评价领域情感词典计算得出的课程综合评教分数与课程评教实际得分更接近，更加接近真实值，均方误差和均方根误差最小，分别为6.85和2.62；此外，由学生教学评价领域情感词典计算得出的课程综合评教分数的排序与课程评教实际得分的排序一致，课程评教实际得分最高的教师在学生教学评价领域情感词典计算得出的课程综合评教分数也是最高的，课程评教实际得分最低的教师在学生教学评价领域情感词典计算得出的课程综合评教分数也是最低的。

通过对比得出，构建学生教学评价领域情感词典在计算课程综合评教得分上均方误差和均方根误差最小，更加接近真实值，证明了学生教学评价领域情感词典在评教领域具有较好的情感分析性能。

综合对比情感分类性能和课程得分预测性能，可以得出：扩建通用情感词典的有效性以及构建学生教学评价领域情感词典的有效性，构建的学生教学评价领域情感词典具有较好的情感分析性能，对评教领域具有一定的现实意义。

以上所述，仅为本申请较佳的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

1.一种学生教学评价领域情感词典的构建方法，其特征在于，包括：

2.根据权利要求1所述的构建方法，其特征在于，

所述情感数据包括情感词以及所述情感词的情感强度数据和情感极性数据。

3.根据权利要求1或2所述的构建方法，其特征在于，

所述构建否定词表和程度副词表的过程包括：

4.根据权利要求1-3任一项所述的构建方法，其特征在于，

所述学生教学评价数据包括：评教文本数据和教学打分数据。

5.根据权利要求1-4任一项所述的构建方法，其特征在于，

所述对所述学生教学评价数据进行数据预处理的过程包括：

6.根据权利要求1-5任一项所述的构建方法，其特征在于，

获取情感种子词的过程包括：

7.根据权利要求1-6任一项所述的构建方法，其特征在于，

通过SO-PMI算法获取情感倾向值的计算公式为：

8.根据权利要求1-7任一项所述的构建方法，其特征在于，

获取学生教学评价领域情感词典的过程包括：

对所述情感倾向值归一化处理：