CN114021580B - 基于序列模式挖掘的课堂对话处理方法、系统和存储介质 - Google Patents

基于序列模式挖掘的课堂对话处理方法、系统和存储介质 Download PDF

Info

Publication number
CN114021580B
CN114021580B CN202111195948.3A CN202111195948A CN114021580B CN 114021580 B CN114021580 B CN 114021580B CN 202111195948 A CN202111195948 A CN 202111195948A CN 114021580 B CN114021580 B CN 114021580B
Authority
CN
China
Prior art keywords
dialogue
class
classroom
sequences
long sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111195948.3A
Other languages
English (en)
Other versions
CN114021580A (zh
Inventor
宋宇
程博
朱佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202111195948.3A priority Critical patent/CN114021580B/zh
Publication of CN114021580A publication Critical patent/CN114021580A/zh
Application granted granted Critical
Publication of CN114021580B publication Critical patent/CN114021580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于序列模式挖掘的课堂对话处理方法、系统和存储介质,本发明可应用于教育信息处理技术领域。本发明方法包括以下步骤:获取课堂对话数据;将所述课堂对话数据进行转化后编码,得到若干个课堂对话序列;采用邻接矩阵分析所述若干个课堂对话序列之间的转换信息;根据所述转换信息挖掘所述若干个课堂对话序列中的长序列;对所述若干个课堂对话序列进行谱聚类,得到谱聚类结果;根据所述转换信息、所述长序列和所述谱聚类结果确定所述课堂对话的演进信息。本发明能够较好的体现课堂对话的建构性的特征,同时能够较多关注语言或行为背后体现的认知与思维特征,从而更好地对接教育教学目标。

Description

基于序列模式挖掘的课堂对话处理方法、系统和存储介质
技术领域
本发明涉及教育信息处理技术领域,尤其是一种基于序列模式挖掘的课堂对话处理方法、系统和存储介质。
背景技术
课堂对话是进行互动式教学的主要载体和实现方式,是培养学生高阶思维方式、创新能力以及提升综合素养的重要抓手。优质的课堂对话可以将思考过程外显化、可视化,因此关注师生、生生言语行为互动的表象背后所体现教学质量的行为数据,对行为数据隐含的认知和思维特征进行深入的挖掘和剖析具有突出的重要性。通过相互交流和沟通,帮助学生理清思路,调整分析策略,对培养学生思维具有重要作用,实现学生思维与智慧的碰撞,从而促进学生分析评估、协作交流、问题解决和创新能力的发展。目前课堂对话的处理方法存在以下问题:第一个问题、课堂对话的分析多采用描述性统计分析为主,具有静态和浅表性,难以展现课堂对话过程性规律和内在衍生机制,从而无法较好体现课堂对话的建构性的特征;第二问题、对话是思维的外现,对话链条某种程度上也反应了思维搭建和进阶的过程,在对课堂对话的序列研究中多注重表面的量化行为数据分析,大多关注对话频次、对话主体、对话时间等浅层次的行为数据,难以对接教育教学目标。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种基于序列模式挖掘的课堂对话处理方法、系统和存储介质,能够较好体现课堂对话的建构性的特征,并体现语言背后的思维指向和认知功能。
第一方面,本发明实施例提供了一种基于序列模式挖掘的课堂对话处理方法,包括以下步骤:
获取课堂对话数据;
将所述课堂对话数据进行转化后编码,得到若干个课堂对话序列;
采用邻接矩阵分析所述若干个课堂对话序列之间的转换信息;
根据所述转换信息挖掘所述若干个课堂对话序列中的长序列;
对所述若干个课堂对话序列进行谱聚类,得到谱聚类结果;
根据所述转换信息、所述长序列和所述谱聚类结果确定所述课堂对话的演进信息。
在一些实施例中,所述将所述课堂对话数据进行转化后编码,得到若干个课堂对话序列,包括:
确定所述课堂对话数据为音频数据,将所述音频数据转换为文本信息;
采用预设编码体系对所述文本信息进行编码,得到若干个课堂对话序列。
在一些实施例中,所述采用邻接矩阵分析所述若干个课堂对话序列之间的转换信息,包括:
根据所述邻接矩阵计算所述若干个课堂对话序列中一个对话类别到另一个对话类别的转换频次;
计算所述若干个课堂对话序列中对话转换的残差系数。
在一些实施例中,所述计算所述若干个课堂对话序列中对话转换的残差系数,包括:
获取所述若干个课堂对话序列中对话转换的残差计数与预期计数之间的差值;
根据所述差值与预设误差估计值的商值得到残差系数。
在一些实施例中,所述根据所述转换信息挖掘所述若干个课堂对话序列中的长序列,包括:
根据所述转换信息,采用单源最短路径算法确定所述若干个课堂对话序列中的长序列路径;
根据所述长序列路径确定所述若干个课堂对话序列中的长序列。
在一些实施例中,所述采用单源最短路径算法确定所述若干个课堂对话序列中的长序列路径,包括:
从所述若干个课堂对话序列中的起始点开始,从所有相邻类别中自动选择距离基本节点最远的类别作为下一个基本节点;
确定遍历完所有类别,结束节点选择过程,并得到所述若干个课堂对话序列中的长序列路径。
在一些实施例中,所述对所述若干个课堂对话序列进行谱聚类,包括:
采用连接性方式对所述若干个课堂对话序列进行谱聚类,并捕获相互连接或紧邻的节点社区。
第二方面,本发明实施例提供了一种基于序列模式挖掘的课堂对话处理系统,包括:
获取模块,用于获取课堂对话数据;
转化编码模块,用于将所述课堂对话数据进行转化后编码,得到若干个课堂对话序列;
分析模块,用于采用邻接矩阵分析所述若干个课堂对话序列之间的转换信息;
挖掘模块,用于根据所述转换信息挖掘所述若干个课堂对话序列中的长序列;
谱聚类模块,用于对所述若干个课堂对话序列进行谱聚类,得到谱聚类结果;
确定模块,用于根据所述转换信息、所述长序列和所述谱聚类结果确定所述课堂对话的演进信息。
第三方面,本发明实施例提供了一种基于序列模式挖掘的课堂对话处理系统,包括:
至少一个存储器,用于存储程序;
至少一个处理器,用于加载所述程序以执行所述的基于序列模式挖掘的课堂对话处理方法。
第四方面,本发明实施例提供了一种存储介质,其中存储有计算机可执行的程序,所述计算机可执行的程序被处理器执行时用于实现所述的基于序列模式挖掘的课堂对话处理方法。
本发明实施例提供的一种基于序列模式挖掘的课堂对话处理方法,具有如下有益效果:
本实施例通过将获取的课堂对话数据进行转化后编码后得到若干个课堂对话序列,然后采用邻接矩阵分析若干个课堂对话序列之间的转换信息,并根据转换信息挖掘若干个课堂对话序列中的长序列,以及对若干个课堂对话序列进行谱聚类后得到谱聚类结果,然后根据转换信息、长序列和谱聚类结果确定课堂对话的演进信息,从而能够较好的体现课堂对话的建构性的特征,同时能够较多关注语言或行为背后体现的认知与思维特征,从而更好地对接教育教学目标。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
下面结合附图和实施例对本发明做进一步的说明,其中:
图1为本发明实施例的一种基于序列模式挖掘的课堂对话处理方法的流程图;
图2为本发明实施例的矩阵显示的示意图;
图3为本发明实施例的课堂对话长序列挖掘算法的示意图;
图4为本发明实施例的堂对话谱聚类分析算法的示意图;
图5为本发明实施例的课堂对话的序列演进模式示意图;
图6为本发明实施例的课堂对话的集群化分布情况及其演进规律的示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
本发明的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
本实施例课堂呈现课堂对话的演进规律和模式,呈现语言背后的思维指向和认知功能,追踪知识链条的搭建过程,反映多声对话的思维进阶和知识建构过程。分析结果可有效展现课堂教学的过程,方便教师精准了解自己的教学水平,帮助教师改进教学方式提升教学质量,同时,能够广泛应用于教学评价、教师培训和教育治理中。
参照图1,本发明实施例提供了一种基于序列模式挖掘的课堂对话处理方法,本实施例可应用于教育教学平台的后台处理器。
在应用过程中,本实施例包括以下步骤,其中,下面步骤之间的顺序不限定前后关系,可以根据实际情况进行调整:
S11、获取课堂对话数据。
在本实施例中,课堂对话数据可以是实时的课堂对话数据,也可以是预先采集的课堂对话数据。在分析过程中,不同时段的课堂对话数据可用于评价相同或者相似类型课堂质量。
S12、将课堂对话数据进行转化后编码,得到若干个课堂对话序列。
在本实施例中,当课堂对话数据为音频数据时,将音频数据转换为文本信息后,然后采用预设编码体系对所述文本信息进行编码,得到若干个课堂对话序列。其中,预设编码体系为CI-PCD编码体系,该体系包含基础知识(标准化知识、常识性知识、复述前人知识)、个人信息(个人经历、个人想象、个人看法)、分析(评价、解释、阐明)、归纳(比较、联系、总结)、推理与预测、回应与拓展、认同、质疑、指导九大类,其中前六类对话还会进一步区分问题与回应两种形式。“基础知识”的知识建构功能为帮助学生获得信息、概念、基础知识、事实,学习基本方法和基本规则;“个人信息”类对话的功能为引导学生表达个人的思想、情感、观点和感受;“分析”类对话的功能为引导学生深入分析问题,提升演绎能力,加强深度理解;“归纳”类对话的功能为培养学生全面、综合看待问题的能力,提升全局性思维,通过比较、联系而发现事物运行规律;“推理与预测”类对话的功能为支持学生发展创新意识、提升创新能力;“回应与拓展”类对话旨在引导学生倾听他人发言、与人协作,提升自我反思能力;“认同”类表述能够起到衔接对话、鼓励倾听、促进交流的社会性作用;“质疑”类对话有助于批判性思维的培养,是积极参与课堂学习的体现,是激发探索创新的源头;“指导”类话语是课堂教学过程中教师依据学生的学习进度和认知水平所提供的有针对性的支持和指引。具体地,本实施例能够为课堂话语赋予教育教学意义,以体现语言背后的认知和思维特征。
S13、采用邻接矩阵分析若干个课堂对话序列之间的转换信息。
在本实施例中,根据邻接矩阵计算若干个课堂对话序列中一个对话类别到另一个对话类别的转换频次,以及计算若干个课堂对话序列中对话转换的残差系数。其中,残差系数可以通过获取若干个课堂对话序列中对话转换的残差计数与预期计数之间的差值后,根据差值与预设误差估计值的商值得到。具体地,本实施例采用邻接矩阵来显示课堂对话类别对是如何转换的。邻接矩阵也称为连接矩阵,是一个带有行和列的方形矩阵,用于指示有限的顶点或节点集是否相邻以及如何相邻。如图2所示的矩阵显示为一个方形数组,代表课堂对话的类别,第一列中的类别是源节点,即初步对话类型,第一行列出的类别是目标节点,即初步对话类型之后的对话类型,课堂对话的目标类别通常被视为对源类别的回应或反馈。首先,本实施例计算了从一个对话类别到另一个对话类别的转换频次,数字越大代表某种转换更容易发生。例如,行类别为“Ia”,列类别为“An”的矩阵数值为20,这可以解释为有20项课堂参与是从分析式问题转化为分析式回答。其次,计算对话转化的显著性,即残差值系数,通过将原始残差(或观察计数和预期计数之间的差异)除以标准误差估计值进而生成Z值作为残差值系数。如果Z值大于某个阈值(通常为1.96),则认为该关联显著,表明了该种转换在课堂教学互动中具有突出的重要性。这一分析是探索课堂对话长序列之前的先行步骤,并初步说明了两种对话之间的转换。
S14、根据转换信息挖掘若干个课堂对话序列中的长序列。
在本实施例中,通过根据转换信息并采用单源最短路径算法确定若干个课堂对话序列中的长序列路径,然后根据长序列路径确定若干个课堂对话序列中的长序列。其中,长序列路径的确定是从若干个课堂对话序列中的起始点开始,从所有相邻类别中自动选择距离基本节点最远的类别作为下一个基本节点,并确定遍历完所有类别后结束节点选择过程,然后得到若干个课堂对话序列中的长序列路径。本实施例通过长序列的挖掘方法,以发现课堂互动中最长的演进路径。
具体地,在教育领域普遍认为高质量的课堂对话应该是一个集体过程,在这个过程中,各方的贡献相互促进,从而产生长链的互动,长链条对话比短链条对话具有更高价值,因为它将在思维和知识建设方面体现出更多样化的功能。本实施例采用扩展的单源最短路径(Dijkstra)算法挖掘课堂对话的长序列路径,该分析有助于提取这些高质量课程中嵌入的有价值的长序列。Dijkstra算法可用于识别从源到有向图中其它顶点的最短路径,Dijkstra算法采用优先级队列的原理来搜索具有高优先级的节点。通过比较边缘连接节点的权重来确定节点的优先级。在实施例中,扩展的Dijkstra算法是从原始算法改编而来的,以便向前搜索距离基本节点最远的节点,从起始点开始从所有相邻类别中自动选择距离基本节点最远的类别作为下一个基本节点。最远距离由节点(节点N)和基本节点(节点a)之间的边的频次确定,即节点a的频次→节点N加上节点N的→节点A。该过程由算法自动迭代,直到遍历所有类别的对话,并且捕获的长路径指示对话贡献的集体过程。其中,检测长序列路径的详细算法过程如图3所示,进而采用图形分析将序列挖掘结果呈现出来。图是一组顶点和边,其中顶点是表示对话类别的节点,边(显示为有向路径)用于描述顶点之间的关系,有助于确定对象之间网络的强度和方向,并可产生复杂行为过程的结构特征。顶点大小通常用于表示节点数,线厚度用作边权重的指示。这些信息表明了序列的显著性。在本实施例中,networkX分析工具包用于可视化图形网络,这是一个Python包,用于创建、操作和研究复杂网络中的结构、动力学和功能。
S15、对若干个课堂对话序列进行谱聚类,得到谱聚类结果。
在本实施例中,谱聚类可以采用连接性方式对若干个课堂对话序列进行谱聚类,并捕获相互连接或紧邻的节点社区。具体地,本实施例针对课堂对话的谱聚类分析方法,能够呈现连接对话类别群组的特征路径,功能在于展现课堂对话的集群化连接方式和演进模式。其中,谱聚类是一种探索性技术,可以将复杂数据集其减少为少数组。该方法使用连接性方法进行聚类,并捕获相互连接或紧邻的节点社区。谱聚类分析基于相似性矩阵,其原理是识别具有高相似性的节点组,同时排除具有低相似性的节点组极性。两个节点(如a和b)之间的相似性由两个节点组成的边(a->b和b->a)的出现次数决定。因此,对话群组的内部距离定义如公式(1)、公式(2)、公式(3)所示:
dist(a,b)=1/sim(a,b) 公式(1)
sim(a,b)=N(a→b)+N(b→a) 公式(2)
其中,dist(a,b)表示节点a和b的距离;sim(a,b)表示节点a和b的相似度;a和b分别表示两个节点;N(a→b)和N(b→a)分别表示边a→b和b→a的出现次数。两个对话群组之间的间隔距离定义为属于两个不同簇的所有节点之间的平均距离。
Figure BDA0003302943430000071
D(C1,C2)表示两个群组间的距离;C1和C1分别表示两个不同的群组;N1和N2分别表示两个集群中的节点数;Xi和Xj分别表示两个群中的第i个和第j个节点。用于谱聚类的算法如图4所示。本实施例使用上面的相似度计算公式来构建相似度矩阵,然后根据公式(4)过滤对话类别组之间的显著路径:
E={eij|i,j∈V∧zij>λ∧i≠j} 公式(4)
E表示突边集,eij表示一条从顶点i→j的边,V是节点集,zij是边的残值(i→j),λ是超参数(即阈值)。当边缘的剩余值大于阈值λ时,该边缘将被视为突出。该分析显示了课堂对话社区之间的顺序,并可能产生潜在的有价值的见解,因为它是明显不同的行为社区之间的重要联系。
S16、根据转换信息、长序列和谱聚类结果确定课堂对话的演进信息。
在本实施例中,采用150节课进行实验,共形成23196条语料,依据编码体系对课堂对话进行了编码。在编码之后,采用了步骤S12-步骤S15进行分析挖掘,包括邻接矩阵、长序列挖掘和谱聚类分析方法,得到的结果如图5和图6所示。为了呈现结果方便,对课堂对话种类采用英文缩写标识,Ipk=提问基础知识,Pk=基础知识回应,Ipi=提问个人观点,Pi=回答个人观点,Ia=分析式提问,An=分析式回答,Ic=归纳式提问,Co=归纳式回答,Is=迁移创新式提问,Se=迁移创新式回答,Iu=回应建构式提问,Up=回应建构式回答,Ag=认同,Qu=质疑,Gu=指导。图2展示了课堂对话两两转换模式,第一列代表前序对话类型,第一行代表的是后续对话类型,行与列交叉的方框中的数字表示该种组合的转换频次以及是否显著,标灰的数字代表此种对话组合在课堂教学中较为普遍且具有突出的重要性。当教师提出涉及基础知识(Ipk)的问题后,学生最可能给出有关基础知识(Pk)的回答。此外,当教师抛出某种类型的问题时,也有较大可能引发有关该种类型话语的进一步追问,例如,在教师引导学生尝试对某一问题进行分析时(Ia),学生除了给出对问题的解析和阐释(An)之外,还有可能进行追问,探究该问题的深层次原因(Ia)。针对不同类型的回应,一般会引发相同类型的反馈或者相同类型的提问以发起新一轮的对话。
其中,图5展示了课堂对话的序列演进模式,序列挖掘方法能够更直观地展示课堂互动的演进过程。图中的圆点代表的是互动类型,箭头方向代表互动类别出现的顺序,线条的粗细代表两类互动出现的相关程度,也即当一类互动出现之后出现另一类互动的可能性。提问基础知识多为一轮对话的起点,分析式对话、涉及基本信息的对话是序列演进图的核心,多数涉及到高阶认知的对话路径都需要经过“分析”类对话这一环。关联度较高的长对话序列为:提出有关基础知识的问题(Ipk)→给出有关基础知识的回答(Pk)→认同(Ag)→指导(Gu),提出有关基础知识的问题(Ipk)→给出有关基础知识的回答(Pk)→提出分析式问题(Ia)→给出分析式答案(An)→认同(Ag)→指导(Gu),提出有关基础知识的问题(Ipk)→给出有关基础知识的回答(Pk)→提出分析式问(Ia)→给出分析式回答(An)→提出归纳式问题(Ic)→给出归纳式回答(Co)→推理与预测式问题的提出(Is)→有关推理与预测式的回答(Se)。
图6显示了课堂对话的集群化分布情况及其演进规律,有关基础知识、个人观点和指导类对话聚集为一类,并且作为课堂教学和互动的前序,这一结果具有可解释性,此集群中的对话类别体现了较低层次的认知水平。分析类对话和质疑类对话聚集为一类,作为低阶认知与高阶认知对话的桥梁。归纳总结和迁移创新类对话聚集为一类,体现了较高层次的认知水平,属于课堂教学和互动演进的终端。
综上,实验结果证明本实施例的基于序列模式挖掘的系列方法与课堂对话领域具有较高的适切性,能够有效反映课堂对话演进过程,并能够较好体现思维进阶模式和知识建构过程,是课堂教学质量和水平的直接反映。
本发明实施例提供了一种基于序列模式挖掘的课堂对话处理系统,包括:
获取模块,用于获取课堂对话数据;
转化编码模块,用于将课堂对话数据进行转化后编码,得到若干个课堂对话序列;
分析模块,用于采用邻接矩阵分析若干个课堂对话序列之间的转换信息;
挖掘模块,用于根据转换信息挖掘若干个课堂对话序列中的长序列;
谱聚类模块,用于对若干个课堂对话序列进行谱聚类,得到谱聚类结果;
确定模块,用于根据转换信息、长序列和谱聚类结果确定课堂对话的演进信息。
本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
本发明实施例提供了一种基于序列模式挖掘的课堂对话处理系统,包括:
至少一个存储器,用于存储程序;
至少一个处理器,用于加载所述程序以执行图1所示的基于序列模式挖掘的课堂对话处理方法。
本发明方法实施例的内容均适用于本系统实施例,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法达到的有益效果也相同。
本发明实施例提供了一种存储介质,其中存储有计算机可执行的程序,所述计算机可执行的程序被处理器执行时用于实现图1所示的基于序列模式挖掘的课堂对话处理方法。
本发明实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的基于序列模式挖掘的课堂对话处理方法。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。此外,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。

Claims (6)

1.一种基于序列模式挖掘的课堂对话处理方法,其特征在于,包括以下步骤:
获取课堂对话数据;
将所述课堂对话数据进行转化后编码,得到若干个课堂对话序列;
采用邻接矩阵分析所述若干个课堂对话序列之间的转换信息;
根据所述转换信息,采用单源最短路径算法确定所述若干个课堂对话序列中的长序列路径;
根据所述长序列路径确定所述若干个课堂对话序列中的长序列;
对所述若干个课堂对话序列进行谱聚类,得到谱聚类结果;
根据所述转换信息、所述长序列和所述谱聚类结果确定所述课堂对话的演进信息;
其中,所述采用邻接矩阵分析所述若干个课堂对话序列之间的转换信息,包括:
根据所述邻接矩阵计算所述若干个课堂对话序列中一个对话类别到另一个对话类别的转换频次;
获取所述若干个课堂对话序列中对话转换的残差计数与预期计数之间的差值;
根据所述差值与预设误差估计值的商值得到残差系数;
所述采用单源最短路径算法确定所述若干个课堂对话序列中的长序列路径,包括:
从所述若干个课堂对话序列中的起始点开始,从所有相邻类别中自动选择距离基本节点最远的类别作为下一个基本节点;
确定遍历完所有类别,结束节点选择过程,并得到所述若干个课堂对话序列中的长序列路径。
2.根据权利要求1所述的一种基于序列模式挖掘的课堂对话处理方法,其特征在于,所述将所述课堂对话数据进行转化后编码,得到若干个课堂对话序列,包括:
确定所述课堂对话数据为音频数据,将所述音频数据转换为文本信息;
采用CI-PCD编码体系对所述文本信息进行编码,得到若干个课堂对话序列。
3.根据权利要求1所述的一种基于序列模式挖掘的课堂对话处理方法,其特征在于,所述对所述若干个课堂对话序列进行谱聚类,包括:
采用连接性方式对所述若干个课堂对话序列进行谱聚类,并捕获相互连接或紧邻的节点社区。
4.一种基于序列模式挖掘的课堂对话处理系统,其特征在于,包括:
获取模块,用于获取课堂对话数据;
转化编码模块,用于将所述课堂对话数据进行转化后编码,得到若干个课堂对话序列;
分析模块,用于采用邻接矩阵分析所述若干个课堂对话序列之间的转换信息;
挖掘模块,用于根据所述转换信息,采用单源最短路径算法确定所述若干个课堂对话序列中的长序列路径;根据所述长序列路径确定所述若干个课堂对话序列中的长序列;
谱聚类模块,用于对所述若干个课堂对话序列进行谱聚类,得到谱聚类结果;
确定模块,用于根据所述转换信息、所述长序列和所述谱聚类结果确定所述课堂对话的演进信息;
其中,所述采用邻接矩阵分析所述若干个课堂对话序列之间的转换信息,包括:
根据所述邻接矩阵计算所述若干个课堂对话序列中一个对话类别到另一个对话类别的转换频次;
获取所述若干个课堂对话序列中对话转换的残差计数与预期计数之间的差值;
根据所述差值与预设误差估计值的商值得到残差系数;
所述采用单源最短路径算法确定所述若干个课堂对话序列中的长序列路径,包括:
从所述若干个课堂对话序列中的起始点开始,从所有相邻类别中自动选择距离基本节点最远的类别作为下一个基本节点;
确定遍历完所有类别,结束节点选择过程,并得到所述若干个课堂对话序列中的长序列路径。
5.一种基于序列模式挖掘的课堂对话处理系统,其特征在于,包括:
至少一个存储器,用于存储程序;
至少一个处理器,用于加载所述程序以执行如权利要求1-3任一项所述的基于序列模式挖掘的课堂对话处理方法。
6.一种存储介质,其特征在于,其中存储有计算机可执行的程序,所述计算机可执行的程序被处理器执行时用于实现如权利要求1-3任一项所述的基于序列模式挖掘的课堂对话处理方法。
CN202111195948.3A 2021-10-14 2021-10-14 基于序列模式挖掘的课堂对话处理方法、系统和存储介质 Active CN114021580B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111195948.3A CN114021580B (zh) 2021-10-14 2021-10-14 基于序列模式挖掘的课堂对话处理方法、系统和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111195948.3A CN114021580B (zh) 2021-10-14 2021-10-14 基于序列模式挖掘的课堂对话处理方法、系统和存储介质

Publications (2)

Publication Number Publication Date
CN114021580A CN114021580A (zh) 2022-02-08
CN114021580B true CN114021580B (zh) 2023-06-27

Family

ID=80056168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111195948.3A Active CN114021580B (zh) 2021-10-14 2021-10-14 基于序列模式挖掘的课堂对话处理方法、系统和存储介质

Country Status (1)

Country Link
CN (1) CN114021580B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027584A (zh) * 2019-10-23 2020-04-17 宋飞 一种课堂行为识别方法及设备
CN112070865A (zh) * 2020-08-25 2020-12-11 北京大米科技有限公司 课堂互动方法、装置、存储介质及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110603501B (zh) * 2017-05-12 2022-02-22 三菱电机株式会社 时间序列数据处理装置、时间序列数据处理系统以及时间序列数据处理方法
CN109284390A (zh) * 2018-11-29 2019-01-29 北京师范大学 一种基于课堂日志的教学场景编码方法
CN110610142B (zh) * 2019-08-27 2023-04-28 南京航空航天大学 基于趋势距离和谱聚类的机场航班波形相似性度量方法
CN111816159B (zh) * 2020-07-24 2022-03-01 腾讯科技(深圳)有限公司 一种语种识别方法以及相关装置
CN114613124B (zh) * 2020-12-03 2023-02-10 中国科学院深圳先进技术研究院 交通信息处理方法、装置、终端及计算机可读存储介质
CN115730244A (zh) * 2022-11-15 2023-03-03 上海师范大学 联合文本分类和序列标注的课堂行为分类方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027584A (zh) * 2019-10-23 2020-04-17 宋飞 一种课堂行为识别方法及设备
CN112070865A (zh) * 2020-08-25 2020-12-11 北京大米科技有限公司 课堂互动方法、装置、存储介质及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
大单元教学视角下基于LSA的同步课堂师生交互行为研究;王觅;文欣远;李宁宁;陈焕东;;电化教育研究(第08期);全文 *

Also Published As

Publication number Publication date
CN114021580A (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
US20220398486A1 (en) Learning content recommendation system based on artificial intelligence learning and operating method thereof
CN111966800B (zh) 情感对话生成方法、装置及情感对话模型训练方法、装置
CN110991645A (zh) 一种基于知识模型的自适应学习方法、系统及存储介质
Udagawa et al. A natural language corpus of common grounding under continuous and partially-observable context
Polyak et al. Computational psychometrics for the measurement of collaborative problem solving skills
CN107562863A (zh) 聊天机器人回复自动生成方法及系统
CN106875940B (zh) 一种基于神经网络的机器自学习构建知识图谱训练方法
CN111783474A (zh) 一种评论文本观点信息处理方法、装置及存储介质
Zou et al. Improving multimodal fusion with Main Modal Transformer for emotion recognition in conversation
CN110427625A (zh) 语句补全方法、装置、介质及对话处理系统
CN111709244A (zh) 一种用于矛盾纠纷事件因果关系识别的深度学习方法
CN113344053A (zh) 一种基于试题异构图表征与学习者嵌入的知识追踪方法
CN107451230A (zh) 一种问答方法以及问答系统
Graesser et al. Building intelligent conversational tutors and mentors for team collaborative problem solving: Guidance from the 2015 Program for International Student Assessment
CN117390409A (zh) 大规模语言模型生成答案可靠性检测方法
KR20110018109A (ko) 능력 평가에 따른 개인별 학습 방법 및 시스템
CN108364066A (zh) 基于n-gram和wfst模型的人工神经网络芯片及其应用方法
CN114021580B (zh) 基于序列模式挖掘的课堂对话处理方法、系统和存储介质
Huang et al. McXai: local model-agnostic explanation as two games
CN115809438A (zh) 多模态情感分析方法、系统、设备及存储介质
CN114117033B (zh) 知识追踪方法及系统
CN113743495B (zh) 一种基于注意力机制的学习风格识别方法及系统
CN115345591A (zh) 智能面试方法、智能面试装置及智能面试系统
CN114510617A (zh) 在线课程学习行为确定方法及装置
Andrews-Todd et al. Comparing Collaborative Problem Solving Profiles Derived from Human and Semi-Automated Annotation.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant