CN116362591A - 基于情感分析的多维度教师评价辅助方法和系统 - Google Patents
基于情感分析的多维度教师评价辅助方法和系统 Download PDFInfo
- Publication number
- CN116362591A CN116362591A CN202310161143.XA CN202310161143A CN116362591A CN 116362591 A CN116362591 A CN 116362591A CN 202310161143 A CN202310161143 A CN 202310161143A CN 116362591 A CN116362591 A CN 116362591A
- Authority
- CN
- China
- Prior art keywords
- comment
- teacher
- emotion
- evaluation
- teaching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 100
- 238000011156 evaluation Methods 0.000 title claims abstract description 91
- 238000004458 analytical method Methods 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000000605 extraction Methods 0.000 claims abstract description 23
- 239000013598 vector Substances 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 15
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 15
- 230000011218 segmentation Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 7
- 230000002996 emotional effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 241000195940 Bryophyta Species 0.000 description 1
- 241000989913 Gunnera petaloidea Species 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 235000011929 mousse Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06398—Performance of employee with respect to a job function
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Biomedical Technology (AREA)
- Tourism & Hospitality (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Entrepreneurship & Innovation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Educational Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
Abstract
本发明提供一种基于情感分析的多维度教师评价辅助方法和系统,涉及文本情感分析技术领域。本发明分别通过情感倾向分析模型和评论抽取模型对预处理后的课程评论文本进行处理,得到每个评论文本的情感倾向和观点句;使用Genism将观点句转换成词向量,并融合教师专业评教指标,进行主题聚类;将观点词按照聚类主题进行展示;基于评论文本的情感倾向和主题聚类,结合教师专业评教指标,计算教师的各主题总分和评教总分。本发明解决了现有的评教系统只能给出一个抽象单一的评价分数、教师无法直接从非结构评教文本获取有效的教学反馈的技术问题,通过情感分析来获取学生评论文本的情感和观点,帮助教师有针对性的把握学生对课程的真实感受。
Description
技术领域
本发明涉及文本情感分析技术领域,具体涉及一种基于情感分析的多维度教师评价辅助方法和系统。
背景技术
情感分析(又称为观点挖掘或感情AI)是指使用自然语言处理、文本分析、计算语言学和生物特征识别来系统地识别、提取、量化和研究情感状态和主观信息。目前,随着智能化技术的发展,情感分析已经广泛运用在各个领域,如个性化推荐、商品评价、教师评价等领域。
以教师评价为例,传统的评教系统只能给出一个抽象单一的评价分数,没有或者很少考虑到学生对教师教学过程中的评论信息。部分现有技术利用利用情感分析技术,但其将评论数据进行分析,提取属性值与权重等,最后得出一个评教总分。
从上述描述可知,现有的评教系统只能给出一个抽象单一的评价分数,有效消息少,教师无法直接从非结构评教文本获取有效的教学反馈,导致教师不能针对性的把握学生对课程的真实感受。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于情感分析的多维度教师评价辅助方法和系统,解决了现有的评教系统只能给出一个抽象单一的评价分数、教师无法直接从非结构评教文本获取有效的教学反馈的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
第一方面,本发明提供一种基于情感分析的多维度教师评价辅助方法,包括:
S1、获取在线课程平台上的课后评论,并对课后评论进行预处理;
S2、分别通过预先训练的情感倾向分析模型和预先训练的评论抽取模型对预处理后的课程评论文本进行处理,得到每个评论文本的情感倾向和观点句;
S3、使用Genism将观点句转换成词向量,并融合教师专业评教指标,进行主题聚类;
S4、将观点词按照聚类主题进行展示;
S5、基于评论文本的情感倾向和主题聚类,结合教师专业评教指标,计算教师的各主题总分和评教总分。
优选的,所述预先训练的情感倾向分析模型由ERNIE训练得到。
优选的,所述预先训练的评论抽取模型由ERNIE训练得到。
优选的,所述使用Genism将观点句转换成词向量
通过Genism中的word2Vec模块,使用CBOW词袋模型对评论观点词进行训练,生成词向量。
优选的,在S5中,在执行计算教师的各主题总分和评教总分之前,所述多维度教师评价辅助方法还包括:
为单条消极评论和积极评论赋予加权值,其中,单条消极评论的加权值为-a,积极评论加权值为b,其中-a<0,b>0。
优选的,在S5中,在执行计算教师的各主题总分和评教总分之前,所述多维度教师评价辅助方法还包括:
为各个主题赋予加权值,其中,各个主题加权值之和为1。
优选的,所述各主题总分的计算公式为:
各主题总分=[(消极评论条数×(-a+积极评论条数×(b))/总评论条数]×各主题加权值
第二方面,本发明提供一种基于情感分析的多维度教师评价辅助系统,包括:
数据获取模块,用于获取在线课程平台上的课后评论,并对课后评论进行预处理;
模型处理模块,用于分别通过预先训练的情感倾向分析模型和预先训练的评论抽取模型对预处理后的课程评论文本进行处理,得到每个评论文本的情感倾向和观点句;
聚类模块,用于使用Genism将观点句转换成词向量,并融合教师专业评教指标,进行主题聚类;
展示模块,用于将观点词按照聚类主题进行展示;
评分模块,用于基于评论文本的情感倾向和主题聚类,结合教师专业评教指标,计算教师的各主题总分和评教总分。
第三方面,本发明提供一种计算机可读存储介质,其存储用于基于情感分析的多维度教师评价辅助的计算机程序,其中,所述计算机程序使得计算机执行如上述所述的基于情感分析的多维度教师评价辅助方法。
第三方面,本发明提供一种电子设备,包括:
一个或多个处理器,存储器,以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上述所述的基于情感分析的多维度教师评价辅助方法。
(三)有益效果
本发明提供了一种基于情感分析的多维度教师评价辅助方法和系统。与现有技术相比,具备以下有益效果:
本发明首先获取在线课程平台上的课后评论,并对课后评论进行预处理;分别通过预先训练的情感倾向分析模型和预先训练的评论抽取模型对预处理后的课程评论文本进行处理,得到每个评论文本的情感倾向和观点句;使用Genism将观点句转换成词向量,并融合教师专业评教指标,进行主题聚类;将观点词按照聚类主题进行展示;基于评论文本的情感倾向和主题聚类,结合教师专业评教指标,计算教师的各主题总分和评教总分。本发明解决了现有的评教系统只能给出一个抽象单一的评价分数、教师无法直接从非结构评教文本获取有效的教学反馈的技术问题,通过情感分析来获取学生评论文本的情感和观点,帮助教师有针对性的把握学生对课程的真实感受。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种基于情感分析的多维度教师评价辅助方法的框图;
图2为本发明实施例中评论文本中的某个字符重复连续出现两次以上,进行压缩去重的情况示意图;
图3为本发明实施例评论文本中两个分句之间出现重复字符,但是重复字符前后的词不相同,进行压缩去重的情况示意图;
图4为本发明实施例中情感倾向分析模型的结构示意图;
图5为本发明实施例中评论抽取模型的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种基于情感分析的多维度教师评价辅助方法和系统,解决现有的评教系统只能给出一个抽象单一的评价分数的技术问题只能给出解决了现有的评教系统只能给出一个抽象单一的评价分数、教师无法直接从非结构评教文本获取有效的教学反馈的技术问题,实现教师能直接从非结构评教文本获取教学反馈的问题。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例以学生评教系统和学生课程评论作为研究对象,通过自然语言处理中的情感分析技术,为传统评教系统提供辅助评价,帮助评教系统更好的对教师教学水平进行评价。主要通过Python网络爬虫对网络在线课程平台如中国MOOC的课程课后评论数据进行爬取收集,在经过文本清洗、分词、去停用词等处理,以及对评论数据进行情感倾向性分析、评论观点词抽取和观点词聚类后,把情感分析的结果在教学辅助平台上进行可视化展示,让用户直观的查看聚类的每个主题下的评论以及评论倾向,方便学校教务处对教师的各个主题下的不同评价。
如图1所示,本发明实施例提供一种基于情感分析的多维度教师评价辅助方法,包括:
S1、获取在线课程平台上的课后评论,并对课后评论进行预处理;
S2、分别通过预先训练的情感倾向分析模型和预先训练的评论抽取模型对预处理后的课程评论文本进行处理,得到每个评论文本的情感倾向和观点句;
S3、使用Genism将观点句转换成词向量,并融合教师专业评教指标,进行主题聚类;
S4、将观点词按照聚类主题进行展示;
S5、基于评论文本的情感倾向和主题聚类,结合教师专业评教指标,计算教师的各主题总分和评教总分。
本发明实施例解决了现有的评教系统只能给出一个抽象单一的评价分数、教师无法直接从非结构评教文本获取有效的教学反馈的技术问题,通过情感分析来获取学生评论文本的情感和观点,帮助教师有针对性的把握学生对课程的真实感受。
下面对各个步骤进行详细说明:
在步骤S1中,获取在线课程平台上的课后评论,并对课后评论进行预处理。具体实施过程如下:
从在线课程平台(如慕课)获取相关教育课程的课后评论,而获取的原始数据中存在大量的不完整、有缺失值、无意义的字符等问题。如果不对这些数据进行处理,将会对后续情感倾向分析模型的构建,模型执行的效率产生较大的影响,所以需要对数据进一步进行清洗等预处理操作,主要的预处理操作是数据清洗、文本分词、去停用词和词性标注。
1.在数据清洗部分,利用机械压缩去词+去除规则的方式进行去词:
诸如“哈哈哈哈、非常好非常好非常好非常好”、“真不错真不错真不错真不错真不错真不错”等等连续重复的评论数据。给出这种评论数据的用户,大多数是为了达到评论最低的字数、省事而做出的评论。显然这些重复的评论数据并没有太大的价值,而且也会给后续情感倾向性分析带来重复的工作。因此需要删除这些评论中的重复部分,缩短评论字数。考虑到重复判定评论文本时的词法结构,以及中文表达特点,设定两项规则对评论数据进行压缩去词:
规则1:如果评论文本中的某个字符重复连续出现两次以上,进行压缩去重,留下最后一组词语。如图2所示:
规则2:若评论文本中两个分句之间出现重复字符,但是重复字符前后的词不相同,则应保留两处重复字符。如图3所示:
2.数据清洗完成后,需要对其进一步处理。对于中文文本而言,不同于以英文为代表的拉丁文文本是字词之间统一用空格等符号分隔开,分词较为容易;而中文文本字词之间是联系的字符串,分词比较困难。本发明实施例采用jieba中文分词技术对评论文本数据进行分词处理。其内部采用基于统计的分词方法,统计模型采用的是隐马尔可夫模型。以“课程很有价值,学到了很多”为例,jieba中文分词技术的分词结果为:
“课程|很|有|价值|,|学到|了|很多”
3.去停用词部分,在对评论文本数据进行分词后,所得到的分词结果集需要处理,比如一些对情感分析无意义的停用词,包括语气词、助词、标点符号和副词等。因为本发明实施例中只对评论文本进行情感极性分析,除了诸如“的”、“啊”、“呢”、“吗”等语气词,对“很多”、“非常”表示情感极性程度的词也进行筛除。使用的方式是通过停用词典的方式对照过滤停用词,若文本中存在停用词典中的词,则进行剔除。本发明实施例采用哈工大和四川大学机器智能实验室的停用词库相结合产生的停用词典进行停用词去除。过滤停用词效果如下,如句子“课程很有价值,学到了很多”,去除停用词后为“课程有价值学”。
4.词性标注是指为文本句子中的每个词打上词性标签,因为在对文本进行情感分析任务时,各个实词对文本所传递出的情感影响不同;其中以形容词对情感影响最大。如句子“课程很有价值,学到了很多”,经过分词和词性标注后为“课程/n很/d有/v价值/n,/x学到/v了/ul很多/m”。符号n是名词标记,v是动词标记,d是副词标记,x是标点符号标记,ul是助词标记,m是数量词标记。词性标注是后续对文本进行句法分析的基础,而其中的词性信息是文本的重要特征,对于情感整个文本的情感倾向分析具有重要的作用。词性标注和中文分词都是对字符串序列进行匹配处理,因此在大多数情况下,中文自动分词工具都将这两项任务集成在一起进行处理。比如jieba词性标注是在分词的基础上对词语进行词性标注,执行结果如表1所示:
表1词性标注结果
最后经过预处理后的评论文本如下表所示:
表2预处理后的评论文本
需要说明的是,本发明实施例中评论数据分成了三个阶段标注,第一个阶段是评论语句情感倾向性标注、第二个阶段是提取语句的观点词、第三个阶段是对观点词进行标注分类。
在步骤S2中,分别通过预先训练的情感倾向分析模型和评论抽取模型对预处理后的课程评论文本进行处理,得到每个评论文本的情感倾向和观点句。具体实施过程如下:
需要说明的是,情感倾向分析模型和评论抽取模型均是由基于持续学习的语义理解预训练框架ERNIE训练得到,不同于当前广泛使用的BERT模型通过大量语料预训练和mask机制的上下文预测方式,本发明实施例中的ERNIE将知识信息加入模型中,形成新的增强表征模型。而且,在处理情感倾向性分析任务中,在ERNIE后拼接一个全连接网络(FullConnected)进行分类,能够增强模型对于知识的记忆和推理能力。
情感倾向分析模型的训练过程如下:
S21a、获取4000条带有标注的评论语料,并将数据加载到服务器内存中;
S21b、将这些评论语料转换成适合情感倾向分析模型的特征形式,并对数据以分批输入的形式进行划分,情感倾向分析模型会将转换好的评论特征进行编码,产生词向量序列,并在CLS位置输出代表整个句子的向量。
S21c、接着对情感倾向性分析模型环境的参数进行配置,比如配置模型和训练参数,num_epoch初始值设置为1,最大学习率为3e-5,权重衰减值等设置。
S21d、对模型的训练次数和轮次在三次训练中进行调整,最终epoch由1设置为3,训练模型的每批输入数据大小batch_size由16设置为32。再对调整后的模型进行交叉验证,将模型的预测层中的损失函数由softmax函数转换成sigmoid函数,增加对评论文本相似倾向分析的概率。最终选取的情感倾向分析模型为评价结果指标最高的一组。本发明实施例中的情感倾向分析模型的结构如图4所示。
评论抽取模型的训练过程如下:
S22a、将情感分析后的4000条评论语料分成按1:3的数量测试集和训练集;
S22b、构造DataLoader,让训练集以batch的形式训练评论抽取模型;
S22c、将处理好的数据输入模型中,模型会对文本中的每个token进行编码,并产生对应向量序列,然后将基于该向量序列进行预测每个位置上的输出标签;
S23d、接下来定义评论抽取模型训练时的环境,配置相关的模型参数,如num_poach、learning_rate等值,并随着模型训练过程中,进行逐步调优。
本发明实施例中的评论抽取模型的结构如图5所示
通过训练好的情感倾向分析模型得到每个评论文本的情感倾向。
通过训练好的评论抽取模型对评论文本的情感观点抽取任务,得到观点词,以便更精确的把握学生评论的表达观点。因为单纯的情感倾向性只是一个粗略的情绪表现,从数据观察者的角度并不能看出具体的情绪表达,是什么原因影响学生的评论、学生评论的关注角度是什么。比如评论“课程内容安排很丰富”和“课程很方便,可以节约时间”虽然都是积极的情感倾向,但是前者观点集中在“课程内容”,后者着眼于“教学设备环境”。因此通过对评论数据的观点词进行抽取,可以更加具体的了解用户的情感倾向和评价角度。
在评论抽取任务中,评论抽取模型是基于语义的无监督算法,与传统基于文本统计特征算法比较,不是简单的对文本的实词进行统计,而是抽取评论中涉及的属性和属性对应观点,最终生成该句的评论观点。根据ERNIE训练的评论抽取模型抽取的是评论文本中的名词属性,一个句子中的主语观点往往是名词属性,因此最终生成的名词属性就可视作为句子的评论观点。
在步骤S3中,使用Genism将观点句转换成词向量,并融合教师专业评教指标,进行主题聚类。
通过Genism中的word2Vec模块,使用CBOW词袋模型对评论观点词进行训练,生成词向量。为了直观显示两个词向量的余弦距离值。设余弦距离值为L,两个词向量相似度为S,则S=1-L。因此若相似度S值越大,则两个词向量之间的距离越近,两向量之间相似度就越高。本发明中取相似度S=0.65为聚类临界点,S大于0.65则聚为一类。需要说明的是,在具体实施过程中,还可采用欧氏距离等其他聚类方式,进行主题聚类。
在步骤S4中,将观点词按照聚类主题进行展示。具体实施过程如下:
将评论观点词按照聚类主题突出展示在界面中,能够让系统用户直观的查看聚类的每个主题下的评论以及评论倾向,方便学校教务处对教师的各个主题下的不同评价。
而对于教师教学,教育部发布的《中学教师专业标准(试行)》从教师专业理念与师德、教师专业知识和专业能力三个方面对教师教学过程进行基本规范,但教师专业理论与师德作为评价指标不够具体,可以将教师教学作为评价指标,教师专业知识和专业能力可以具体为课堂教学中的教学目标、教学内容和教学方法。因此本文从教学目标、教学方法、教学条件、教学内容、课后评价和教师六个方面作为评价指标主题(即6个聚类主题)来综合评价教师教学。
在步骤S5中,基于评论文本的情感倾向和主题聚类,结合教师专业评教指标,计算教师的各主题总分和评教总分。具体实施过程如下:
(1)单条消极评论加权值为-a,积极评论加权值为b,本发明实施例中,-a=-1.5,b=1.0。
(2)按照教学侧重点和教育部制定的《中学教师专业标准(试行)》,制定六个评教指标加权值分别为教学条件(20%)、教学方法(20%)、教学评价(20%)、教师(20%)、教学内容(10%)以及学习体验(10%)。教学内容指标评论中与课程内容相关的较多;学习体验指标评论中,学生对自我感受表达相比对课程表达较多,因此降低这两个主题的占比。
(3)主题积分以及评教总分打分公式:
评教总分=各主题总分累计之和
各主题总分=[(消极评论条数×(-1.5)+积极评论条数×(1.0))/总评论条数]×各主题加权值
如表3、表4所示:
表3《现代教育技术》陕西师范大学教学综合打分
表4《现代教育技术》江苏师范大学教学综合打分
在具体实施例过程中,对评教总分和各主题总分进行展示。
本发明实施例还提供一种基于情感分析的多维度教师评价辅助系统,包括:
数据获取模块,用于获取在线课程平台上的课后评论,并对课后评论进行预处理;
模型处理模块,用于分别通过预先训练的情感倾向分析模型和预先训练的评论抽取模型对预处理后的课程评论文本进行处理,得到每个评论文本的情感倾向和观点句;
聚类模块,用于使用Genism将观点句转换成词向量,并融合教师专业评教指标,进行主题聚类;
展示模块,用于将观点词按照聚类主题进行展示;
评分模块,用于基于评论文本的情感倾向和主题聚类,结合教师专业评教指标,计算教师的各主题总分和评教总分。
可理解的是,本发明实施例提供的基于情感分析的多维度教师评价辅助系统与上述基于情感分析的多维度教师评价辅助方法相对应,其有关内容的解释、举例、有益效果等部分可以参考基于情感分析的多维度教师评价辅助方法中的相应内容,此处不再赘述。
本发明实施例还提供一种计算机可读存储介质,其存储用于基于情感分析的多维度教师评价辅助的计算机程序,其中,所述计算机程序使得计算机执行如上述所述的基于情感分析的多维度教师评价辅助方法。
本发明实施例还提供一种电子设备,包括:
一个或多个处理器,存储器;以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上述所述的基于情感分析的多维度教师评价辅助方法。
综上所述,与现有技术相比,具备以下有益效果:
1.本发明实施例解决了教师无法直接从非结构评教文本获取教学反馈的问题,也就是通过情感分析来获取学生评论文本的情感和观点,帮助教师有针对性的把握学生对课程的真实感受。
2.引入教师专业标准的评教指标。在课程评论观点聚类中引入评教主题,能够反映教师在不同教学评教指标下的教学能力,使得最终学生的评教反馈更加的全面和真实。
3.对结果进行加权打分,在课程评论分析处理的基础上,对观点聚类的不同指标主题进行加权打分,最终获得该课程教师教学效果的综合得分。从而为评教辅助系统的构建提供数据支撑。
4、形成一个可视化评教辅助系统。通过辅助评教系统能够直观反映学生评教过程中的情感观点,教师和教务工作人员可以直观看到不同教师在学生评价下不同维度的差异,最终达到客观评价教师教学能力的目的。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于情感分析的多维度教师评价辅助方法,其特征在于,包括:
S1、获取在线课程平台上的课后评论,并对课后评论进行预处理;
S2、分别通过预先训练的情感倾向分析模型和预先训练的评论抽取模型对预处理后的课程评论文本进行处理,得到每个评论文本的情感倾向和观点句;
S3、使用Genism将观点句转换成词向量,并融合教师专业评教指标,进行主题聚类;
S4、将观点词按照聚类主题进行展示;
S5、基于评论文本的情感倾向和主题聚类,结合教师专业评教指标,计算教师的各主题总分和评教总分。
2.如权利要求1所述的基于情感分析的多维度教师评价辅助方法,其特征在于,所述预先训练的情感倾向分析模型由ERNIE训练得到。
3.如权利要求1所述的基于情感分析的多维度教师评价辅助方法,其特征在于,所述预先训练的评论抽取模型由ERNIE训练得到。
4.如权利要求1所述的基于情感分析的多维度教师评价辅助方法,其特征在于,所述使用Genism将观点句转换成词向量
通过Genism中的word2Vec模块,使用CBOW词袋模型对评论观点词进行训练,生成词向量。
5.如权利要求1~4任一所述的于情感分析的多维度教师评价辅助方法,其特征在于,在S5中,在执行计算教师的各主题总分和评教总分之前,所述多维度教师评价辅助方法还包括:
为单条消极评论和积极评论赋予加权值,其中,单条消极评论的加权值为-a,积极评论加权值为b,其中-a<0,b>0。
6.如权利要求5所述的于情感分析的多维度教师评价辅助方法,其特征在于,在S5中,在执行计算教师的各主题总分和评教总分之前,所述多维度教师评价辅助方法还包括:
为各个主题赋予加权值,其中,各个主题加权值之和为1。
7.如权利要求6所述的于情感分析的多维度教师评价辅助方法,其特征在于,所述各主题总分的计算公式为:
各主题总分=[(消极评论条数×(-a+积极评论条数×(b))/总评论条数]×各主题加权值。
8.一种基于情感分析的多维度教师评价辅助系统,其特征在于,包括:
数据获取模块,用于获取在线课程平台上的课后评论,并对课后评论进行预处理;
模型处理模块,用于分别通过预先训练的情感倾向分析模型和预先训练的评论抽取模型对预处理后的课程评论文本进行处理,得到每个评论文本的情感倾向和观点句;
聚类模块,用于使用Genism将观点句转换成词向量,并融合教师专业评教指标,进行主题聚类;
展示模块,用于将观点词按照聚类主题进行展示;
评分模块,用于基于评论文本的情感倾向和主题聚类,结合教师专业评教指标,计算教师的各主题总分和评教总分。
9.一种计算机可读存储介质,其特征在于,其存储用于基于情感分析的多维度教师评价辅助的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1~7任一所述的基于情感分析的多维度教师评价辅助方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器,存储器,以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如权利要求1~7任一所述的基于情感分析的多维度教师评价辅助方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310161143.XA CN116362591A (zh) | 2023-02-24 | 2023-02-24 | 基于情感分析的多维度教师评价辅助方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310161143.XA CN116362591A (zh) | 2023-02-24 | 2023-02-24 | 基于情感分析的多维度教师评价辅助方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116362591A true CN116362591A (zh) | 2023-06-30 |
Family
ID=86910863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310161143.XA Pending CN116362591A (zh) | 2023-02-24 | 2023-02-24 | 基于情感分析的多维度教师评价辅助方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116362591A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117131152A (zh) * | 2023-10-26 | 2023-11-28 | 海易科技(北京)有限公司 | 信息存储方法、装置、电子设备和计算机可读介质 |
CN117973946A (zh) * | 2024-03-29 | 2024-05-03 | 云南与同加科技有限公司 | 一种面向教学的数据处理方法及系统 |
-
2023
- 2023-02-24 CN CN202310161143.XA patent/CN116362591A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117131152A (zh) * | 2023-10-26 | 2023-11-28 | 海易科技(北京)有限公司 | 信息存储方法、装置、电子设备和计算机可读介质 |
CN117131152B (zh) * | 2023-10-26 | 2024-02-02 | 海易科技(北京)有限公司 | 信息存储方法、装置、电子设备和计算机可读介质 |
CN117973946A (zh) * | 2024-03-29 | 2024-05-03 | 云南与同加科技有限公司 | 一种面向教学的数据处理方法及系统 |
CN117973946B (zh) * | 2024-03-29 | 2024-06-21 | 与同科技(北京)有限公司 | 一种面向教学的数据处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108363743B (zh) | 一种智能问题生成方法、装置和计算机可读存储介质 | |
CN111104789B (zh) | 文本评分方法、装置和系统 | |
CN116362591A (zh) | 基于情感分析的多维度教师评价辅助方法和系统 | |
CN109726745B (zh) | 一种融入描述知识的基于目标的情感分类方法 | |
CN106021288A (zh) | 一种基于自然语言分析的随堂测试答案快速自动分类方法 | |
Zhang et al. | n-BiLSTM: BiLSTM with n-gram Features for Text Classification | |
CN110222344B (zh) | 一种针对小学生作文辅导的作文要素分析算法 | |
CN106446147A (zh) | 一种基于结构化特征的情感分析方法 | |
CN110781681A (zh) | 一种基于翻译模型的初等数学应用题自动求解方法及系统 | |
Nerabie et al. | The impact of Arabic part of speech tagging on sentiment analysis: A new corpus and deep learning approach | |
CN116361472A (zh) | 社交网络评论热点事件舆情大数据分析系统 | |
CN111815426B (zh) | 一种涉及金融投研的数据处理方法及终端 | |
Zhu et al. | YUN111@ Dravidian-CodeMix-FIRE2020: Sentiment Analysis of Dravidian Code Mixed Text. | |
Gurin | Methods for Automatic Sentiment Detection | |
Aliyanto et al. | Supervised probabilistic latent semantic analysis (sPLSA) for estimating technology readiness level | |
Behzadi | Natural language processing and machine learning: A review | |
CN112347786A (zh) | 人工智能评分训练方法和装置 | |
Camenzind et al. | Applying German word vectors to assess flexibility performance in the associative fluency task. | |
Alotaibi et al. | Hybrid approach for automatic short answer marking | |
Khandait et al. | Automatic question generation through word vector synchronization using lamma | |
Sarkar et al. | Sentiment analysis in Bengali Text using NLP | |
CN117909506B (zh) | 一种基于细微特征的核心主题事件监测方法及设备 | |
Bharti et al. | Sarcasm as a contradiction between a tweet and its temporal facts: a pattern-based approach | |
CN113222772B (zh) | 本土人格词典构建方法、系统、存储介质以及电子设备 | |
CN109670184B (zh) | 一种英文文章质量评估方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |