CN113743250A

CN113743250A - 一种课堂教学行为事件描述模型的构建方法及系统

Info

Publication number: CN113743250A
Application number: CN202110939047.4A
Authority: CN
Inventors: 陈增照; 李佳文; 戴志诚; 何秀玲; 鲁圆圆; 孟秉恒; 朱胜虎
Original assignee: Central China Normal University
Current assignee: Central China Normal University
Priority date: 2021-08-16
Filing date: 2021-08-16
Publication date: 2021-12-03
Anticipated expiration: 2041-08-16
Also published as: US20230334862A1; CN113743250B; WO2023019652A1

Abstract

本发明公开了一种课堂教学行为事件描述模型的构建方法及系统。该构建方法包括如下步骤：获取待训练的课堂教学视频数据；利用语音活动检测技术，将待训练的课堂教学视频数据按照教师的话语划分成多个事件；利用多种人工智能技术对所有事件进行多模态识别，划分为多个维度下的子事件，根据子事件建立事件描述模型，对教师在课堂中的各项教学行为事件进行描述。本发明根据语音对课堂视频进行切割，能够最大程度上保证每一个事件中教师非言语行为的完整性；且通过提取不同事件之间的共性，建立统一描述所有事件的描述模型，不仅能完成对教师各项教学行为的描述，还能反映出事件与事件之间的关联性，使得事件不再是孤立的。

Description

一种课堂教学行为事件描述模型的构建方法及系统

技术领域

本发明属于教育系统技术领域，更具体地，涉及一种课堂教学行为事件描述模型的构建方法及系统。

背景技术

课堂教学行为事件主要是指教师在课堂中的教学行为组成的事件，对教师的课堂教学行为进行事件划分能够更好地对教师的教学行为进行分析。现在对教师的教学行为进行分析评价的主要方式为传统人工的方式，但是人工对课堂视频中地教学行为进行划分进而评价教师的课堂行为，受主观因素影响较大，对客观描述教学事件有负面的影响。

虽然也有极少数的课堂视频切割系统，但大多直接按照固定的时间对课堂进行划分，划分为时间上相等的不同事件。然而，规定每个事件的时间很可能会使得教师的一句话被拆分成了两个事件，会导致教师的教学行为在同一个事件里是支离破碎的，直接破坏了教师非言语行为的完整性。

发明内容

针对现有技术的缺陷，本发明的目的在于提供一种课堂教学行为事件描述模型的构建方法及系统，旨在解决采用传统人工的方式，对课堂视频中地教学行为进行划分进而评价教师的课堂行为，受主观因素影响大；以及现有的教学事件描述模型直接按照固定的时间间隔进行事件划分，导致教师的教学行为被切割，难以保证教师行为完整性的问题。

为实现上述目的，第一方面，本发明提供了一种课堂教学行为事件描述模型的构建方法，包括如下步骤：

获取待训练的课堂教学视频数据；

利用语音活动检测技术，将所述待训练的课堂教学视频数据按照教师的话语划分成多个事件；

利用多种人工智能技术对所有事件进行多模态识别，划分为多个维度下的子事件，根据所述子事件建立事件描述模型，对教师在课堂中的各项教学行为事件进行描述。

在其中一个实施例中，还包括：

提取各事件之间的共性，根据所述共性和所述子事件建立统一描述所有事件的事件描述模型，对教师在课堂中发生的所有教学行为事件进行统一描述。

在其中一个实施例中，在所述事件描述模型中，定义整个课堂教学事件序列(E)，E＝{e₁，e₂，...，e_n}，n表示有n个事件发生，e_i表示某个事件，e_i用六元组<id，t，d^t，w，a^w，R>表示，其中，

id为事件的唯一性标识；

t为该事件的开始时间；

d^t为开始时间为t的该事件对应的持续时间；

w为该事件的维度，w∈W，W＝{w₀，w₁，w₂，...，w_m}，所述维度包括教师的表情、语音情感、目光、手势和身体姿态；

a^w为事件w的属性，

R为与当前事件有关联的事件以及其之间的关联性，是一个二元组序列，定义为R＝{<e₁，r₁>，<e₂，r₂>，...，<e_n，r_n>}，其中，关系二元组<e，r>中的e表示与当前事件相关的事件，r表示两个事件之间的关联性的具体值。

在其中一个实施例中，所述两个事件之间的关联性包括维度关联性和时序关联性。

在其中一个实施例中，所述维度关联性通过模糊矩阵R＝(r_ij)_m×m确定，所述模糊矩阵R定义为：

其中，r_ij∈[0，1]，i＝1，2，...，m，j＝1，2，...，m，r_ij为第i个维度与第j个维度之间的关联度，若r_ij＝1则i＝j，表示同一个维度之间的关联度，即最高的关联性；若r_ij＝0则表示第i个维度与第j个维度毫不相关；若r_ij∈(0，1)，则越接近1表示关联性越高。

在其中一个实施例中，当两个事件所对应的持续时间相同时，通过皮尔逊系数进行所述时序关联性计算；当两个事件所对应的持续时间不相同时，采用动态时间规整进行所述时序关联性计算。

第二方面，本发明提供了一种课堂教学行为事件描述模型的构建系统，包括：

训练数据获取模块，用于获取待训练的课堂教学视频数据；

事件划分模块，用于利用语音活动检测技术，将所述待训练的课堂教学视频数据按照教师的话语、划分成多个事件；

事件描述模块，用于利用多种人工智能相关技术对所有事件进行多模态识别，划分为多个维度下的子事件，根据所述子事件建立事件描述模型，对教师在课堂中的各项教学行为事件进行描述。

第三方面，本发明提供了一种课堂教学行为事件描述方法，包括如下步骤：

获取目标课堂教学视频数据；

利用语音活动检测技术，将所述目标课堂教学视频数据按照教师的话语、划分成多个包含教师多种教学行为的教学事件；

将所有教学事件输入到预先通过上述的构建方法构建得到的事件描述模型，得到教师在课堂中的各项教学行为事件的描述结果。

第四方面，本发明提供了一种课堂教学行为事件描述系统，包括：

目标数据获取模型，用于获取目标课堂教学视频数据；

教学事件划分模块，用于利用语音活动检测技术，将所述目标课堂教学视频数据按照教师的话语、划分成多个包含教师多种教学行为的教学事件；

处理模块，用于将所有教学事件输入到预先通过上述的构建方法构建得到的事件描述模型，得到教师在课堂中的各项教学行为事件的描述结果。

第五方面，本发明提供了一种计算机设备，包括存储器和处理器，所述存储器内存储计算机程序；所述处理器用于当执行所述计算机程序时，实现上述的构建方法、或上述的课堂教学行为事件描述方法。

整体而言，通过本发明所构思的以上技术方案与现有技术相比，具有如下有益效果：

(1)本发明提供的课堂教学行为事件描述模型的构建方法及系统，突破了传统的人工评价分析教师行为的局限性，能够实现每一个事件的多模态识别，且摒除了人为因素的影响。

(2)本发明提供的课堂教学行为事件描述模型的构建方法及系统，根据语音对课堂视频进行切割，能够最大程度上保证每一个事件中教师非言语行为的完整性。

(3)本发明提供的课堂教学行为事件描述模型的构建方法及系统，通过提取不同事件之间的共性，建立统一描述所有事件的描述模型，不仅能完成对教师各项教学行为的描述，还能反映出事件与事件之间的关联性，使得事件不再是孤立的。

附图说明

图1和图2分别是一实施例中课堂教学行为事件描述模型的构建方法流程图和技术流程图；

图3是另一实施例中课堂教学行为事件描述模型的构建方法的技术流程图；

图4是一实施例中课堂教学行为事件描述模型的构建系统的架构图；

图5是一实施例中课堂教学行为事件描述方法的流程图；

图6是一实施例中课堂教学行为事件描述系统的架构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供了一种课堂教学行为事件描述模型的构建方法，以解决现有的教学事件描述模型直接按照固定的时间间隔进行事件划分，导致教师的教学行为被切割，难以保证教师行为完整性的问题。

图1和图2分别是本发明一实施例提供的课堂教学行为事件模型的构建方法流程图和技术流程图，如图1和图2所示，该构建方法包括步骤S10～S30，详述如下：

S10，获取待训练的课堂教学视频数据。

S20，利用语音活动检测技术(VAD技术)，将待训练的课堂教学视频数据按照教师的话语划分成多个事件。

在步骤S20中，将课堂视频按照教师的话语切割成多个事件，因为教师的行为往往都是伴随着语音的，所以根据语音对课堂事件进行划分，能够最大程度保证教师的教学行为不被拆分。

S30，利用多种人工智能技术对所有事件进行多模态识别，划分为多个维度下的子事件，根据子事件建立事件描述模型，对教师在课堂中的各项教学行为事件进行描述。

在步骤S30中，多种人工智能技术可以是语音情感识别、头部姿态估计、手势识别等技术，根据这些技术对事件进行多模态识别，对应地可划分为语音情感、头部姿态、手势等多维度下的子事件，然后根据这些子事件判断教师课堂的状态。例如语音情感维度的子事件，可以判断出整堂课的课堂氛围如何，是积极，中性还是消极；头部姿态维度下的子事件，可以判断出教师是否有点头、摇头等对学生进行反馈的行为；手势维度下的子事件，可以判断出教师的手势是指向性手势，节拍性手势还是象征性手势等。

在一个实施例中，参见图3，步骤S30还可包括如下步骤：

提取各事件之间的共性，根据共性和子事件建立统一描述所有事件的事件描述模型，对教师在课堂中发生的所有教学行为事件进行统一描述。

需要说明的是，目前还没有对教师的课堂教学事件进行统一描述的模型，但是有学者研究教师的教学行为，并使用量表对教学事件进行描述，然而这些量表普遍存在统一的问题，无法对所有发生的事件进行统一的智能化描述，导致所有的事件是分散开来的，事件与事件是孤立的点，无法找到它们之间的关联性。

本实施例分两步对课堂视频进行事件划分，首先利用VAD语音活动检测技术，将课堂按照教师的话语切割成多个事件，因为教师的行为往往都是伴随着语音的，所以根据语音对课堂事件进行划分，能够最大程度保证教师的教学行为不被拆分。然后再通过提取不同事件之间的共性，找到能够统一描述所有事件的描述模型，完成对教师各项教学行为的描述，并且找到事件与事件之间的关联性，使得事件不再是孤立的。

在一个具体的实施例中，实现上述目的的技术方案为：

(1)对课堂教学事件进行划分

建立描述模型的第一步就是对课堂进行事件划分，本发明中的事件划分可以分为两个部分。第一步，对课堂视频进行VAD语音活动检测，将课堂视频进行切割，划分为多个事件，将这些以语音为主要线索的事件称为主事件。第二步，对所有的主事件进行多模态识别，根据识别的维度的不同可以将每个主事件再划分为若干种维度的子事件，而对于一个主事件来说，其对应的某一个维度的子事件也会有若干个。因此，事件划分最后能够得到若干个主事件和每一个主事件对应的若干种维度的子事件以及若干个在同一个主事件的时间段内同一维度内发生的子事件。

事件划分以VAD技术为基础，对课堂视频进行切割，实现课堂主事件的划分，并为其他技术提供事件划分点。再使用多种人工智能相关技术，例如语音情感识别，头部姿态估计，手势识别等对主事件进行多模态识别，划分为多个维度下的子事件。

(2)建立课堂教学事件描述模型

定义整个课堂教学事件序列(E)，E＝{e₁，e₂，...，e_n}，n表示有n个事件发生，用e_i来表示某个事件，i＝1，2，...，n，则e_i可用五元组<id，t，d^t，w，a^w，R>表示。

其中：

id为事件的唯一性标识。

t为事件的开始时间(t∈Z)，单位为毫秒。

d^t为开始时间为t的该事件对应的持续时间。

w表示事件维度，即类型，其中w∈W,W＝{w₀，w₁，w₂，...，w_m}。

其中，w₀表示该事件为教师语音事件，并定义教师语音事件为主事件，即当某事件的w＝w₀时，表示该事件为主事件，而当w∈{w₁，w₂，...，w_m}时，表示该事件为子事件。

子事件表示使用人工智能相关技术能够完成识别的教师在课堂上的行为，其类型有许多种，例如教师的表情，身体姿态，目光，手势，语音情感等等。每一种类型对应了一个W。

a^w为事件W的属性，

每一个事件类型w都有对应的a^w属性集，例如w＝w₀时，其对应的属性集

假定当w＝w₁时，事件类型为教师目光事件，则其对应的属性集

因此，所有事件类型的属性集构成了一个不规则的矩阵：

R表达了与当前事件有关联的事件以及其之间的关联性，是一个二元组序列，R＝{<e₁，r₁>，<e₂，r₂>，...，<e_n，r_n>}，其中，关系二元组<e，r>中的e表示与当前事件相关的事件，r表示两个事件之间的关联性的具体值。

设课堂教学事件序列E＝[e₁，e₂，...，e_n]，其中n＞0且n∈Z，再对事件进行多模态识别，划分为e_ij(1≤i≤n，1≤j≤m)，其中n表示n个主事件，m表示m个模态，则主事件伴随的子事件可以表示为：

但由于存在同一主事件对应的同一个类型的子事件可能不止一个，例如在一个教师语音事件中，教师的目光可能不仅看向了学生，而且看向了仅自己可见的教学材料，那么在这个主事件对应的教师目光类型的子事件就有两个。则

对于每一个主事件对应的子事件矩阵来说，矩阵的一行代表一种类型的子事件，每一种类型的子事件中的所有事件，即一行中的所有时间元素，其在时间上是具有先后顺序的，而不同类型的子事件，也就是子事件矩阵中的每一行，在时序上都对应了主事件发生的时间段，其开始时间和结束时间是相同的，即该矩阵在时序上是一个并行时序矩阵。

则

(3)事件之间的关联性

进行划分后的事件与事件之间存在一定的关联性，比如教师在微笑的时候往往语音情感也是比较积极的，教师的目光在看向学生的时候其手势是指示性手势的可能性更大。那么以表情为微笑的事件为例，它与和其同属于一个主事件的语音情感为积极的事件的关联性就更强，即两个事件之间会存在维度以及时序上的关联性，且维度与维度之间关联性的强度是不同的。

从上述例子也不难看出，事件与事件之间同样存在着时序上的关联性，例如同时发生的事件其关联性会比发生时间相差较大的事件之间关联性更强等。

综上所述，两个事件的关联性可以通过维度关联性和时序关联性来表示。

(a)维度关联性

定义维度集合A＝{d_i|0≤i≤m且i∈Z}，设论域为A自身，则乘积空间A×A＝{(d_i，d_i)|d_i∈A，d_i∈A，0≤i≤m，0≤j≤m且i，j∈Z}，R为从A到A的模糊关系，其隶属函数为μ_R(d，d)，对任意的(d_i，d_i)∈A×A都有μ_R(d，d)＝r_ij∈[0，1]，则记不同维度之间的模糊矩阵R＝(r_ij)_m×m，即

其中，r_ij∈[0，1]，i＝1，2，...，m，j＝1，2，...，m，r_ij即为第i个维度与第j个维度之间的关联度，若r_ij＝1则i＝j，表示同一个维度之间的关联度，即最高的关联性；若r_ij＝0则表示第i个维度与第j个维度毫不相关；若r_ij∈(0，1)，则越接近1表示关联性越高。

(b)时序关联性

不同的事件有不同的事件序列表示，假设事件A与事件B对应的时间序列分别为X与Y，他们的长度分别是t₁和t₂。

如果t₁＝t₂，可以直接利用皮尔逊系数计算得到两个时间序列之间的相似性：

其中，x_t表示时间序列X在t时刻对应的值，y_t表示时间序列Y在t时刻对应的值；T表示两个事件的时间序列的总长度。

如果t₁≠t₂，则采用动态时间规整DTW进行相似度的计算。

首先将两个序列对齐，使得两个序列的距离最小。构建一个t₁×t₂的矩阵，其中矩阵元素(i,j)表示x_i与y_j之间的距离，这里一般采用欧式距离进行计算，那么同时(i,j)也表示了点x_i与点y_j的对齐，再利用动态规划算法寻找一条通过此网格若干点的路径P，P的第k个元素p_k＝(i，j)_k,定义了序列X和Y的映射

P＝p₁，p₂，...，p_k，...，p_K max(t₁，t₂)≤K≤t₁+t₂+1

则

则对于两个课堂事件

与

设其维度相关性为r_d

设其时序相关性r_t：

将时序相关性进行归一化之后与维度相关性进行权重求和即可得到两个事件之间的相关性。

则两个事件之间的相关性可以用维度相关性与时序相关性共同表示。

r＝w₁*r_d+w₂*r_t，其中w₁，w₂表示两个相关性的权重。

本发明提供的课堂教学行为事件模型的构建方法利用人工智能相关技术，分两步对课堂视频进行事件划分，从而将课堂划分为多个包含教师多种教学行为的教学事件。

(1)提出了一种教学事件描述模型，能对教师课堂中的教学行为教学智能化的统一描述。

(2)本发明提出的事件模式模型不仅能够对教学事件的属性教学描述，而且通过该模型能够表达事件与事件之间的关联性。

基于同样的发明构思，本发明还提供了一种课堂教学行为事件描述模型的构建系统，如图4所示，包括：

训练数据获取模块10，用于获取待训练的课堂教学视频数据。

事件划分模块20，用于利用语音活动检测技术，将待训练的课堂教学视频数据按照教师的话语划分成多个事件。

事件描述模块30，用于利用多种人工智能相关技术对所有事件进行多模态识别，划分为多个维度下的子事件，根据子事件建立事件描述模型，对教师在课堂中的各项教学行为事件进行描述。

具体地，图4中各模块的功能可参见上述构建方法实施例中的详细介绍，在此不再赘述。

参见图5，本发明还提供了一种课堂教学行为事件描述方法，包括步骤S100～S30，详述如下：

S100，获取目标课堂教学视频数据。

S200，利用语音活动检测技术，将目标课堂教学视频数据按照教师的话语、划分成多个包含教师多种教学行为的教学事件。

S300，将所有教学事件输入到预先通过上述的构建方法构建得到的事件描述模型，得到教师在课堂中的各项教学行为事件的描述结果。

本发明提供的课堂教学行为事件描述方法基于上述构建方法构建得到的事件描述模型，不仅能对目标课堂教学视频中教师的各项教学行为事件进行描述，还能表达事件与事件之间的关联性。

参见图6，本发明提供了一种课堂教学行为事件描述系统，包括：

目标数据获取模型100，用于获取目标课堂教学视频数据。

教学事件划分模块200，用于利用语音活动检测技术，将目标课堂教学视频数据按照教师的话语、划分成多个包含教师多种教学行为的教学事件。

处理模块300，用于将所有教学事件输入到预先通过上述的构建方法构建得到的事件描述模型，得到教师在课堂中的各项教学行为事件的描述结果。

具体地，图6中各模块的功能可参见上述课堂教学行为事件描述方法实施例中的详细介绍，在此不再赘述。

本发明还提供一种计算机设备，包括存储器和处理器，存储器内存储计算机程序；处理器用于当执行计算机程序时，实现上述的构建方法、或上述的课堂教学行为事件描述方法。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种课堂教学行为事件描述模型的构建方法，其特征在于，包括如下步骤：

(1)获取待训练的课堂教学视频数据；

(2)利用语音活动检测技术，将所述待训练的课堂教学视频数据按照教师的话语划分成多个事件；

(3)利用多种人工智能技术对所有事件进行多模态识别，划分为多个维度下的子事件，根据所述子事件建立事件描述模型，对教师在课堂中的各项教学行为事件进行描述。

2.根据权利要求1所述的课堂教学行为事件描述模型的构建方法，其特征在于，步骤(3)，还包括：

3.根据权利要求2所述的课堂教学行为事件描述模型的构建方法，其特征在于，在所述事件描述模型中，定义整个课堂教学事件序列(E)，E＝{e₁，e₂，...，e_n}，n表示有n个事件发生，e_i表示某个事件，e_i用六元组<id，t，d^t，w，a^w，R>表示，其中，

id为事件的唯一性标识；

t为该事件的开始时间；

d^t为开始时间为t的该事件对应的持续时间；

a^w为事件w的属性，

4.根据权利要求3所述的课堂教学行为事件描述模型的构建方法，其特征在于，所述两个事件之间的关联性包括维度关联性和时序关联性。

5.根据权利要求4所述的课堂教学行为事件描述模型的构建方法，其特征在于，所述维度关联性通过模糊矩阵R＝(r_ij)_m×m确定，所述模糊矩阵R定义为：

6.根据权利要求4或5所述的课堂教学行为事件描述模型的构建方法，其特征在于，当两个事件所对应的持续时间相同时，通过皮尔逊系数进行所述时序关联性计算；当两个事件所对应的持续时间不相同时，采用动态时间规整进行所述时序关联性计算。

7.一种课堂教学行为事件描述模型的构建系统，其特征在于，包括：

训练数据获取模块，用于获取待训练的课堂教学视频数据；

事件划分模块，用于利用语音活动检测技术，将所述待训练的课堂教学视频数据按照教师的话语划分成多个事件；

8.一种课堂教学行为事件描述方法，其特征在于，包括如下步骤：

获取目标课堂教学视频数据；

将所有教学事件输入到预先通过权利要求1～6任意一项所述的构建方法构建得到的事件描述模型，得到教师在课堂中的各项教学行为事件的描述结果。

9.一种课堂教学行为事件描述系统，其特征在于，包括：

目标数据获取模型，用于获取目标课堂教学视频数据；

处理模块，用于将所有教学事件输入到预先通过权利要求1～6任意一项所述的构建方法构建得到的事件描述模型，得到教师在课堂中的各项教学行为事件的描述结果。

10.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器内存储计算机程序；所述处理器用于当执行所述计算机程序时，实现如1～6任意一项所述的构建方法、或权利要求8所述的课堂教学行为事件描述方法。