CN117195892A

CN117195892A - 一种基于大数据的课堂教学评测方法及系统

Info

Publication number: CN117195892A
Application number: CN202311473713.5A
Authority: CN
Inventors: 王勋达
Original assignee: Shandong 12xue Education Technology Co ltd
Current assignee: Shandong 12xue Education Technology Co ltd
Priority date: 2023-11-08
Filing date: 2023-11-08
Publication date: 2023-12-08
Anticipated expiration: 2043-11-08
Also published as: CN117195892B

Abstract

本发明涉及数据处理技术领域，具体涉及一种基于大数据的课堂教学评测方法及系统，包括：采集教师网络授课音频和学生互动内容，将网络授课音频和学生互动内容分别转化为可视化数据；对可视化数据进行拆分获得第一拆分数据和第二拆分数据；根据第一拆分数据和第二拆分数据中数据的变化分别获得数据中所有时间点作为分割点的可能性，根据分割点的可能性获得拆分数据的分层数据；根据第一拆分数据的多段文本数据与第二拆分数据的多段文本数据在时间上文本内容的对应关系获得每一个分词的权重；根据每一个分词的权重获得每一段文本数据的海明距离；根据每一段文本数据的海明距离获得课堂质量评价值；根据课堂评价值对课堂教学作出评测。

Description

一种基于大数据的课堂教学评测方法及系统

技术领域

本发明涉及数据处理技术领域，具体涉及一种基于大数据的课堂教学评测方法及系统。

背景技术

网络课堂作为在线教育中连接师生的重要媒介，已经作为一种新兴的教育手段在教学领域上有了一定范围的普及。网络课堂的发展及其有效性建设对于教育学领域来说具有相当重要的影响，并且网络课堂教育的发展无论从规模上还是从水平上在近年来都呈现出逐步上升的趋势。在授课时，课堂的活跃程度都是影响一节课堂教学质量的重要因素，而在网络课堂，学生可以通过在特定聊天窗口以弹幕的形式进行讨论等操作，由于在输入弹幕时需要键入内容，无形中增加了成本，因此网络课堂讨论的活跃程度可以更加明显地反映学生在课堂上的积极性。

在现有技术中，simHash算法是一种用于文档相似度计算的近似近邻搜索算法，但是该算法在算法运行过程中对分词后的词语权重的量化是通过全局频率，而忽略了局部上下文信息对分词权重的影响，导致无法捕捉到不同词条之间的重要程度差异。在当前场景下即是学生的互动内容，即使与老师的授课内容有差异但仍会有可能被判断为与授课内容相似，以该相似结果作为判断课堂活跃程度的依据时，会导致判断结果不准确，也就无法完成对课堂的教学评测。

发明内容

为了解决上述问题，本发明一种基于大数据的课堂教学评测方法及系统。

本发明的一种基于大数据的课堂教学评测方法及系统采用如下技术方案：

本发明一个实施例提供了一种基于大数据的课堂教学评测方法，该方法包括以下步骤：

将教师授课音频数据和学生互动内容授课音频分别转化为第一文字数据序列和第二文字数据序列，所述第一文字数据序列和第二文字数据序列中包含若干时序标签；

根据第一文字数据序列和第二文字数据序列中时序标签的分词对第一文字数据序列和第二文字数据序列进行拆分，获得第一拆分数据和第二拆分数据；根据第一拆分数据和第二拆分数据中数据的变化分别获得第一拆分数据和第二拆分数据中每个时间间隔作为分割点的可能性，所述时间间隔是指相邻时间标签的时间间隔，根据分割点的可能性将第一拆分数据与第二拆分数据分别划分为多段文本数据；根据多段文本数据中不同分词的种类数与相邻文本数据中分词出现的次数分别获得第一拆分数据与第二拆分数据中每一个分词的权重，根据每一个分词的权重和第一拆分数据的多段文本数据与第二拆分数据的多段文本数据在文本内容上的关系获得每一个分词的总权重；根据每一个分词的权重获得每一段文本数据的海明距离；

根据每一段文本数据的海明距离获得课堂质量评价值；根据课堂评价值对课堂教学作出评测。

进一步的，所述将教师授课音频数据和学生互动内容分别转化为第一文字数据序列和第二文字数据序列，所述第一文字数据序列和第二文字数据序列中包含若干时序标签，包括的具体步骤如下：

利用HMM语音识别算法将老师的语音数据转换为对应文字数据，记为第一文字数据，所述学生互动内容包括学生发送弹幕互动的文字数据，将学生发送弹幕互动的文字数据记为第二文字数据；对提取到的文字加入时间标签，其记录方式如：，式中，/>表示时间戳，/>表示时间戳对应的授课内容文字，简记为时序标签；然后由所有的时序标签组成第一文字数据序列；获得学生发送弹幕互动的文字数据的时序标签，组成第二文字数据序列。

进一步的，所述对第一文字数据序列和第二文字数据序列进行拆分，获得第一拆分数据和第二拆分数据，包括的具体步骤如下：

使用语言模型的分词方法对第一文字数据序列中的每一个时序标签进行分词，时序标签的所有分词构成第一文字数据序列的拆分文字序列，记为第一拆分数据；获得第二文字数据序列的拆分文字序列，记为第二拆分数据。

进一步的，所述根据第一拆分数据和第二拆分数据中数据的变化分别获得第一拆分数据和第二拆分数据中每个时间间隔作为分割点的可能性，所述时间间隔是指相邻时序标签的时间间隔，根据分割点的可能性将第一拆分数据与第二拆分数据分别划分为多段文本数据，包括的具体步骤如下：

式中，表示第/>个时间间隔是时间分割点的可能性；/>表示在第一拆分数据中每一个拆分数据的时间长度，单位为秒；/>表示时间间隔总数。

获得第一拆分数据中所有可能的时间分割点，当时，表示该时间间隔作为分割点，/>为预设阈值；通过每个分割点将第一拆分数据的时序标签在时间层面进行拆分，获得第一拆分数据的多段文本数据获得第二拆分数据的多段文本数据。

进一步的，所述根据多段文本数据中不同分词的种类数与相邻文本数据中分词出现的次数分别获得第一拆分数据与第二拆分数据中每一个分词的权重，根据每一个分词的权重和第一拆分数据的多段文本数据与第二拆分数据的多段文本数据在文本内容上的关系获得每一个分词的总权重，包括的具体步骤如下：

式中，表示在第一拆分数据与第二拆分数据中第/>段文本数据中第/>个分词的总权重，获取第一拆分数据中第/>段文本数据的所有分词与第二拆分数据中第/>段文本数据的所有分词的交集，/>表示交际中的第/>个分词，/>表示第一拆分数据中第/>段文本数据中第/>个分词的权重，/>表示第二拆分数据中第/>段文本数据/>词的权重，/>表示线性归一化函数。

进一步的，所述第一拆分数据中第段文本数据中第/>个分词的权重，包括的具体步骤如下：

式中，表示第一拆分数据中第/>段段文本数据中不同的分词的种类数；/>表示第/>个分词在第一拆分数据的第/>段文本数据中出现的次数；/>表示第一拆分数据中第/>段文本数据的分词总数；/>表示第/>个分词在与第一拆分数据的第/>段文本相邻的上一段文本数据中出现的次数，/>表示第/>个分词在第一拆分数据的第/>段文本相邻下一段文本数据中出现的次数。特殊的，第一段文本与最后一段文本只求对应的下一段文本与上一段文本中出现的次数。

进一步的，所述第二拆分数据中第段文本数据中第/>个分词的权重，包括的具体步骤如下：

式中，示第二拆分数据中第/>段文本数据中第/>个分词出现的次数，/>表示第二拆分数据中第/>段文本数据的分词总数，/>表示第二拆分数据中第/>段文本数据中第/>个分词在与第/>段文本相邻的上一段文本数据中出现的次数，/>表示第二拆分数据中第段文本数据中第/>个分词在与第/>段文本相邻的下一段文本数据中出现的次数；/>表示第二拆分数据中第s段文本数据中第j个分词所出现的时间，/>表示第二拆分数据中第s段文本数据中第j个分词所出现的时间。

进一步的，所述根据每一段文本数据的海明距离获得课堂质量评价值，包括的具体步骤如下：

式中，表示课堂质量评价值，/>表示第一拆分数据的分段数据的分段数量；/>表示第/>段文本数据的海明距离；/>表示第/>段文本数据的时间长度；/>表示海明距离标准差。

进一步的，所述根据课堂评价值对课堂教学作出评测，包括的具体步骤如下：

当课堂评价值大于第一预设阈值时，说明课堂教学质量较好，将课堂教学质量评价为优；当课堂评价值大于第二预设阈值/>，小于第一预设阈值/>时，说明课堂教学质量一般，将课堂教学质量评价为良；当课堂评价值小于第二预设阈值/>时，说明课堂教学质量不好，将课堂教学质量评价为差。

本发明实施例提出一种基于大数据的课堂教学评测系统，所述系统包括存储器和处理器，所述处理器执行所述存储器存储的计算机程序，以实现上述所述的一种基于大数据的课堂教学评测方法。

本发明的技术方案的有益效果是：在对课堂教学质量进行评价时，因为网络课堂的活跃度主要体现在学生通过弹幕的形式与教师进行互动，因此本发明首先获得教师上课的教学视频与学生互动信息，然后将其转化为可视化数据，进而根据可视化数据来分析教师教授内容与学生互动内容之间的联系，从而获得上课的互动频率与活跃程度的评价指标，进而根据教学质量评价指标来对课堂教学的质量进行评测。

在对可视化数据进行处理时，首先对根据教学内容的关系，对获得的数据进行拆分，获得对应的拆分数据，然后根据拆分后的数据之间的对应关系，来获得分词的权重，进而根据分词的权重获得每一段分段数据海明距离，进而根据海明距离获得教学内容的评价指标。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明的一种基于大数据的课堂教学评测方法的步骤流程图；

图2为本发明中分词前与分词后的效果图；

图3为本发明通过每个时间分割点将第一拆分数据的文本数据在时间层面进行拆分，获得不同时间长度的分层数据；

图4为本发明中第一拆分数据与第二拆分数据的对应关系。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种基于大数据的课堂教学评测方法及系统，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的一种基于大数据的课堂教学评测方法及系统的具体方案。

请参阅图1，其示出了本发明一个实施例提供的一种基于大数据的课堂教学评测方法的步骤流程图，该方法包括以下步骤：

S001．获取课堂授课内容与学生互动内容，并对文字进行提取；

本实施例的主要目的是为了通过对网络课堂教学内容与学生互动内容对课堂教学质量做出评测，因此首先需要采集获得老师网络授课音频与学生发送弹幕互动的文字数据，本实施例通过网络授课系统的日志来获取老师网络授课音频数据与学生发送弹幕互动的文字数据。

因为课堂教学评测系统在评价教学质量时，需要讲老师的授课音频转化为文字数据，因此本实施例通过HMM语音识别算法，将老师口头论述的课上内容转换为对应文字数据，记为第一文字数据，将学生发送弹幕互动的文字数据记为第二文字数据。在进行转换时，由于老师讲课时每句话之间是有停顿的，因此在对授课内容转换为文字时，可以加上时序标签结合文字内容，以格式进行存储。

需要说明的是，对提取到的文字加入时间标签，是将老师讲述内容时每一句话对应的时间加入到提取出来的文字数据中，然后获得每一句话对应的时间标签，其记录方式如：，式中，/>表示时间戳，具体精确到秒，/>表示时间戳对应的授课内容文字，简记为时序标签。然后由所有的时序标签组成第一文字数据序列。

以相同的方法获得学生发送弹幕互动的文字数据的时序标签，组成第二文字数据序列。

S002．对提取与收集到的文字信息进行分词处理，对处理后的文本数据进行分析，定义不同文本段落中的分词权重并由此得到海明距离；

在获得第一文字数据序列时，第一文字数据序列中包含的时序标签是一段话对应的文字数据与时间，而在对文字中的有价值的信息进行提取时，需要将每一段话对应的文字进行拆分，也就是将第一文字数据序列中的每一个时序标签进行拆分。本实施例使用语言模型的分词方法对第一文字数据序列中的每一个时序标签进行分词，将时序标签输入到选择的分词算法模型中，算法会将时序标签切分成一个个词语，并形成一个时序标签序列；然后对每一个时序标签进行拆分，获得第一文字数据序列的拆分文字序列，记为第一拆分数据。然后通过相同的方法获得第二文字数据序列的第二拆分数据。如图2所示，为分词前与分词后的效果图。上述/>语言模型为现有公知技术，在此不再进行赘述。

进一步的，对处理后的第一拆分数据进行分析，定义不同文本段落中的分词权重并由此得到海明距离。具体实现方法如下：

在一节网络课堂中，老师对学生的授课内容可以看作是老师对学生的一对多输出，这个输出的过程如果对整堂完整的课来说是持续输出的过程，但是在中间一定是有明显停顿的，停顿间隔两侧的讲授内容，可能代表了不同的授课内容，而不同的授课内容，侧重点可能是不同的，也就是说内容中的关键部分会有所差别。因此根据拆分后的文字序列对其进行分段，也即是将文本数据在不同时间点进行多段式分割，通过相邻时间标签的时间间隔分布，确定多段式分割时的时间分割点。其计算公式如下：

式中，表示第/>个时间间隔是时间分割点的可能性；/>表示在第一拆分数据中每一个拆分数据的时间长度，单位为秒；/>表示时间间隔总数，本实施例中时间间隔是指相邻时间标签的时间间隔。

具体的，一个时间间隔与所有时间间隔均值的差值越大，该时间间隔作为时间分割点的可能性越大。因为在进行授课时，对于一个知识点的讲解总是连续的，这样才可以保证学生思路的通畅从而确保教学质量，而可以作为时间分割点的时间间隔相较于讲授时语句之间的时间点间隔一定是较大的，而一次授课中，讲授的时间占大多数，也就是说较短的时间间隔占大多数，因此当一个时间间隔与由大多数数据所得到的均值结果相差越大时，说明这个时间间隔可以作为时间分割点的可能性越大。

然后获得第一拆分数据中所有可能的时间分割点，当时，表示该点为分割点，取/>该值为经验值，实施者可根据不同的实施环境自行设定。如图3所示，通过每个时间分割点将第一拆分数据的文本数据在时间层面进行拆分，获得不同时间长度的分层数据，即是将第一拆分数据分成了多段文本数据第一拆分数据的多段文本数据。然后通过相同的方法获得第二拆分数据的多段文本数据。

进一步的，因为第一拆分数据表示的是老师在授课时所讲内容的文本数据，第二拆分数据表示的是学生互动内容的文本数据，因此二者在时间上是相辅相成的，即第一拆分数据的文本内容与第二拆分数据的文本内容具有一致性。但是因为在通过网络授课时，老师与学生的关系是多对一，并且因为网络有延迟，那么第一拆分数据与第二拆分数据在时间上会形成错位的情况，具体如下图4所示。

并且因为在授课内容与互动内容的对应关系上，主要是描述在相同的时间段上互动内容与授课内容的匹配关系上，也就是说第一拆分数据的多段文本数据与第二拆分数据的多段文本数据虽然存在时间段长度不匹配的情况，但是两部分的主要文本内容在对应时间段上是匹配的，因此，将第一拆分数据的多段文本数据与第二拆分数据的多段文本数据进行对应时间段匹配，即是将第一拆分数据的多段文本数据中第一个数据段与第二拆分数据的多段文本数据中第一个数据段进行匹配，然后以每段文本数据的内容，寻找该段文本内容中的关键词，并以此构建分词权重。其计算公式如下：

式中，/>表示在第一拆分数据与第二拆分数据中第/>段文本数据中第/>个分词的总权重，获取第一拆分数据中第/>段文本数据的所有分词与第二拆分数据中第/>段文本数据的所有分词的交集，/>表示交际中的第/>个分词，/>表示第一拆分数据中第/>段文本数据中第/>个分词的权重，/>表示第二拆分数据中第/>段文本数据/>词的权重，/>表示线性归一化函数。

式中，/>表示第一拆分数据中第/>段段文本数据中不同的分词的种类数；/>表示第/>个分词在第一拆分数据的第/>段文本数据中出现的次数；/>表示第一拆分数据中第/>段文本数据的分词总数；/>表示第/>个分词在与第一拆分数据的第/>段文本相邻的上一段文本数据中出现的次数，/>表示第/>个分词在第一拆分数据的第/>段文本相邻下一段文本数据中出现的次数。特殊的，第一段文本与最后一段文本只求对应的下一段文本与上一段文本中出现的次数。

式中，/>示第二拆分数据中第/>段文本数据中第/>个分词出现的次数，/>表示第二拆分数据中第/>段文本数据的分词总数，/>表示第二拆分数据中第/>段文本数据中第个分词在与第/>段文本相邻的上一段文本数据中出现的次数，/>表示第二拆分数据中第/>段文本数据中第/>个分词在与第/>段文本相邻的下一段文本数据中出现的次数；/>表示第二拆分数据中第/>段文本数据中第/>个分词所出现的时间，/>表示第二拆分数据中第/>段文本数据中第/>个分词所出现的时间。

需要说明的是，一个分词，在一段文本数据中出现的频率越高，说明该分词对于这段文本数据来说，是关键词的可能性越高，对应公式中、/>的值越大，则该分词的权重越大。此外，一节课堂老师的讲授内容之间一定是有联系的，特别是当讲授内容在时间点上是相邻时，这种联系性会更加明显，所以当一个分词在相邻的前后两段文本数据中也出现了，就更加提升了该分词是关键词的置信程度，因此在这里通过与第/>段文本相邻的上、下段文本数据中出现的次数来表示当前分词的权重，即公式中的/>、/>部分，该值越大，说明该分词在一定程度上体现了讲授内容之间是有联系的，越有可能是关键词。

进一步的，将每一个分词的权重结果值代入到/>算法中，得到每一段文本数据的海明距离/>，该距离值越小，说明对应时间段的学生互动内容的文本数据与老师授课内容的文本数据相似性越大，也即是老师在进行不同知识点的授课时，学生与老师针对当前知识点产生了互动，并且互动内容与所教授的知识点有很大的联系，并没有出现与课堂内容太多无关的内容，而且较小的距离值也体现了师生在授课时内容输出与输入的同步性，因为只有在保持一定同步性的基础上，才可以得到较小的距离值，频繁互动与同步性的体现，说明了本堂课的效果是较好的。

S003．根据海明距离，量化课堂教学评测指标；

根据上述计算获得的每一段文本数据的海明距离，然后对课堂的教学质量作出量化评价指标数，其计算公式如下：

需要说明的是，一堂课在前述中已经通过分割时间点分为不同长度的段落文本数据，分段数据的分段数量为，一段数据的时间长度/>越长，说明该段文本数据的内容是越多的，而在文本内容增多的情况下学生们与老师的互动内容也可以保持较高的同步性，也即拥有较低的海明距离/>，对于课堂教学评测的影响是积极的，这部分逻辑通过公式部分体现，/>越大时/>越小，对课堂评价值/>的影响是正向的，也即，使得到的/>趋于增大。

并且随着上课时间的增加，学生的注意力是会逐渐较少的，但是，如果在注意力减少的情况下依旧保持有较低的海明距离，说明在课堂的后期，师生之前也依旧有很积极的互动与同步性，这可以通过海明距离的标准差/>体现，标准差越小，对于课堂评价值/>的影响是正向的，这部分逻辑对应公式中/>部分，分母越小，构建出的分数整体越大，使得到的/>趋于增大。

S004．根据课堂评价值对课堂教学作出评测；

根据上述计算获得的课堂质量评价值，然后对课堂质量进行评价。该值越高，说明在课堂上师生之间的互动频繁并且保持了很好的同步性，因此教学评价较好。

当课堂评价值大于第一预设阈值时，说明课堂教学质量较好，将课堂教学质量评价为优；当课堂评价值大于第二预设阈值/>，小于第一预设阈值/>时，说明课堂教学质量一般，将课堂教学质量评价为良；当课堂评价值小于第二预设阈值/>时，说明课堂教学质量不好，将课堂教学质量评价为差。其中第一预设阈值/>，第二预设阈值/>，该阈值为经验阈值，实施者可根据不同的实施环境自行设定。

通过以上步骤，完成了一种基于大数据的课堂教学评测方法。

本发明还提出一种基于大数据的课堂教学评测系统，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述步骤S001至S004。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于大数据的课堂教学评测方法，其特征在于，该方法包括以下步骤：

将教师授课音频数据和学生互动内容分别转化为第一文字数据序列和第二文字数据序列，所述第一文字数据序列和第二文字数据序列中包含若干时序标签；

根据第一文字数据序列和第二文字数据序列中时序标签的分词对第一文字数据序列和第二文字数据序列进行拆分，获得第一拆分数据和第二拆分数据；根据第一拆分数据和第二拆分数据中数据的变化分别获得第一拆分数据和第二拆分数据中每个时间间隔作为分割点的可能性，所述时间间隔是指相邻时序标签的时间间隔，根据分割点的可能性将第一拆分数据与第二拆分数据分别划分为多段文本数据；根据多段文本数据中不同分词的种类数与相邻文本数据中分词出现的次数分别获得第一拆分数据与第二拆分数据中每一个分词的权重，根据每一个分词的权重和第一拆分数据的多段文本数据与第二拆分数据的多段文本数据在文本内容上的关系获得每一个分词的总权重；根据每一个分词的总权重获得每一段文本数据的海明距离；

2.根据权利要求1所述的一种基于大数据的课堂教学评测方法，其特征在于，所述将教师授课音频数据和学生互动内容分别转化为第一文字数据序列和第二文字数据序列，所述第一文字数据序列和第二文字数据序列中包含若干时序标签，包括的具体步骤如下：

3.根据权利要求1所述的一种基于大数据的课堂教学评测方法，其特征在于，所述对第一文字数据序列和第二文字数据序列进行拆分，获得第一拆分数据和第二拆分数据，包括的具体步骤如下：

4.根据权利要求1所述的一种基于大数据的课堂教学评测方法，其特征在于，所述根据第一拆分数据和第二拆分数据中数据的变化分别获得第一拆分数据和第二拆分数据中每个时间间隔作为分割点的可能性，所述时间间隔是指相邻时序标签的时间间隔，根据分割点的可能性将第一拆分数据与第二拆分数据分别划分为多段文本数据，包括的具体步骤如下：

式中，表示第/>个时间间隔是时间分割点的可能性；/>表示在第一拆分数据中每一个拆分数据的时间长度，单位为秒；/>表示时间间隔总数；

5.根据权利要求1所述的一种基于大数据的课堂教学评测方法，其特征在于，所述根据多段文本数据中不同分词的种类数与相邻文本数据中分词出现的次数分别获得第一拆分数据与第二拆分数据中每一个分词的权重，根据每一个分词的权重和第一拆分数据的多段文本数据与第二拆分数据的多段文本数据在文本内容上的关系获得每一个分词的总权重，包括的具体步骤如下：

获取第一拆分数据中第s段文本数据的所有分词与第二拆分数据中第s段文本数据的所有分词的交集；

式中，表示在第一拆分数据与第二拆分数据中第/>段文本数据中第/>个分词的总权重；

表示交集中的第/>个分词，/>表示第一拆分数据中第/>段文本数据中第/>个分词的权重，/>表示第二拆分数据中第/>段文本数据/>词的权重，/>表示线性归一化函数。

6.根据权利要求5所述的一种基于大数据的课堂教学评测方法，其特征在于，所述第一拆分数据中第段文本数据中第/>个分词的权重，包括的具体步骤如下：

式中，表示第一拆分数据中第/>段文本数据中不同的分词的种类数；/>表示第/>个分词在第一拆分数据的第/>段文本数据中出现的次数；/>表示第一拆分数据中第/>段文本数据的分词总数；/>表示第/>个分词在与第一拆分数据的第/>段文本相邻的上一段文本数据中出现的次数，/>表示第/>个分词在第一拆分数据的第/>段文本相邻下一段文本数据中出现的次数。

7.根据权利要求5所述的一种基于大数据的课堂教学评测方法，其特征在于，所述第二拆分数据中第段文本数据中第/>个分词的权重，包括的具体步骤如下：

式中，示第二拆分数据中第/>段文本数据中第/>个分词出现的次数，/>表示第二拆分数据中第/>段文本数据的分词总数，/>表示第/>个分词在与第/>段文本相邻的上一段文本数据中出现的次数，/>表示第/>个分词在与第/>段文本相邻的下一段文本数据中出现的次数；/>表示第二拆分数据中第s段文本数据中第j个分词所出现的时间，/>表示第二拆分数据中第s段文本数据中第j个分词所出现的时间。

8.根据权利要求1所述的一种基于大数据的课堂教学评测方法，其特征在于，所述根据每一段文本数据的海明距离获得课堂质量评价值，包括的具体步骤如下：

式中，表示课堂质量评价值，/>表示第一拆分数据的文本数据的数量；/>表示第/>段文本数据的海明距离；/>表示第/>段文本数据的时间长度；/>表示所有文本数据的海明距离标准差。

9.根据权利要求1所述的一种基于大数据的课堂教学评测方法，其特征在于，所述根据课堂评价值对课堂教学作出评测，包括的具体步骤如下：

当课堂评价值大于第一预设阈值时，将课堂教学质量评价为优；当课堂评价值大于第二预设阈值/>，小于第一预设阈值/>时，将课堂教学质量评价为良；当课堂评价值小于第二预设阈值/>时，将课堂教学质量评价为差。

10.一种基于大数据的课堂教学评测系统，所述系统包括存储器和处理器，其特征在于，所述处理器执行所述存储器存储的计算机程序，计算机程序以实现如权利要求1-9任一项所述的一种基于大数据的课堂教学评测方法。