CN110232343B - 基于潜变量模型的儿童个性化行为统计分析系统及方法 - Google Patents
基于潜变量模型的儿童个性化行为统计分析系统及方法 Download PDFInfo
- Publication number
- CN110232343B CN110232343B CN201910480497.4A CN201910480497A CN110232343B CN 110232343 B CN110232343 B CN 110232343B CN 201910480497 A CN201910480497 A CN 201910480497A CN 110232343 B CN110232343 B CN 110232343B
- Authority
- CN
- China
- Prior art keywords
- children
- latent variable
- data
- personalized
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于儿童个性化行为分析技术领域,公开了一种基于潜变量模型的儿童个性化行为统计分析系统及方法;依据建立潜变量模型,通过数学模型将潜变量应用于分析个性化行为问题中;制作潜变量测度的主要工具—量表,量表包括评定量表和态度量表两类,量表从问卷题目选项的角度可分为三点量表、五点量表和七点量表;分析影响儿童个性化行为差异与潜变量因素之间的内在联系,从儿童行为表现中发现其潜在能力,为儿童个性化发展提出科学的建议。本发明有利于发现某些未达到标准的儿童的特殊能力,或者发掘个性化儿童的潜在能力,以此给出适合儿童个性化发展的科学建议和指导方向;与企业合作,依据预测出的儿童个性化行为偏好结果,开发教育产品。
Description
技术领域
本发明属于儿童个性化行为分析技术领域,尤其涉及一种基于潜变量模型的儿童个性化行为统计分析系统及方法。
背景技术
目前,最接近的现有技术:近几年,我国学前教育和初等教育研究成果颇显,儿童的个性教育研究作为教育学、心理学、行为学的一个重要交叉研究领域,相关研究一直受到学者们的关注和深入探讨。应用艾森克个性问卷探讨父母教育方式和学生个性对小学生学习成绩的影响。个性发展、个性教育、个性培养。构建个性课堂的新思路。武法提,牟智佳提出教育大数据背景下基于个性化学习模式构建数字化学习环境下个性化行为分析模型。基于儿童个性化行为大数据,构建在线学习分析模型,基于大数据技术挖掘形成性过程中教育大数据,架构学习分析系统。俄罗斯学者列昂捷夫、包若维奇等人先后探讨了个性教育理论,Xavier Ochoa等研究者强调教育数据挖掘和统计分析工具应注重对行为数据的分析和挖掘,George Siemens则认为个性化行为分析是应用智能数据、学习者产生的数据和分析模型来发现学习者内在的信息和社交联系,以预测和改善学习方式。目前,基于教育大数据,针对学习者行为分析,渐强型研究前沿是潜变量统计分析模型应用。
目前对儿童个性化行为的实证研究多以制作量表的方式采集原始数据,而此类量表多以相关分析和回归分析为主要的研究手段。正是因为这样的数据采集技术和数据分析手段,出现两大问题。
问题一,样本数量少,数据缺乏客观性。研究者设置指标体系,制作量表,组织被试者通过回答问卷的形式完成测试。采集到的样本数据属于小样本,并且采集到的数据本身带有被试者的主观性,甚至会因被试者的主观臆断判断选项的分值,从未隐藏自身潜在的个性或动机。通常量表收集的数据需要做一致性信度分析,往往信度达到80%,我们就认为此次数据采集可靠,进入下一步数据分析环节。而事实上,被试者的潜在个性化表现受主观作答行为就已经被掩盖,数据真实性、客观性仍是目前潜变量研究一个争议的话题。
问题二,传统研究手段导致数据拟合准确性不高。相关分析和回归分析是量表采集数据后的通用研究手段。研究者为了更为全面地掌握被试者的信息,往往会增加量表中的解释变量,即增加问题数量或者以层层深入的方式递进式提出问题供被试者作答。此时采集到的解释变量列数据之间的相关性很有可能因为解释变量的增加而增加彼此之间的共线性。一般情况,我们会认定解释变量之间的相关系数小于20%,则认为它们之间是弱相关,不太影响后面的回归分析,但事实上,解释变量之间微小的共线性也会对被解释变量发生影响,从而导致回归拟合准确度不高,预测不精准。用准确度不高的回归方程作为研究结果,以此提出的建议其社会参考价值不大。
针对这两大问题,本方案在数据收集环节侧重用视频录制技术手段(视频监控技术、智能录播技术、情感识别技术)采集儿童行为数据,包括表情数据、情绪数据、动作数据,将视频技术采集到的视频转化为图片,利用图像识别技术之表情识别技术分析儿童个性化感知性潜变量。用学习管理采集技术(课内学习在线管理技术、课外移动学习APP技术)采集儿童能力表现数据,包括基本能力数据、学习能力数据、拓展能力数据,利用机器学习之分类技术分析儿童能力潜变量,从而分析研究能力因素对学习效果的影响。
任子朝等人应用潜变量路径分析研究高考数学能力层次和考查效度。李振兴等人运用潜变量增长模型分析流动初中生学业自我概念的发展轨迹。石雷山等人构建潜变量增长模型分析初中留守儿童的学业自我效能与学校适应。霸雨辰等人研究影响农民工随迁子女学业成绩的潜变量因素。但潜变量模型在0-12岁儿童的个性化行为研究上的应用却还是空白。
有学者用潜变量研究过学生的学习行为,如留守儿童的学业、初中生的学业、大学生网络学习行为、农民工子女的学业,但从未有学者用潜变量来细致研究0-12岁儿童个性化行为的研究,潜变量模型在0-12岁儿童的个性化行为研究上的应用还是空白。
现目前视频技术、表情识别技术、机器学习是目前的热门研究技术和手段,将这些技术与教育数据结合,研究儿童个性化行为也是一个零的突破。
综上所述,现有技术存在的问题是:
潜变量模型在0-12岁儿童的个性化行为研究上的应用却还是空白。
解决上述技术问题的难度:
解决上述技术问题的难点一:数据存储和管理。视频录制技术得到的过程性数据量大,数据存储是难点一。
解决上述技术问题的难点二:视频转化为图片后,多人的表情识别得到的多维数据给后期数据分析带来了难度。现目前的表情识别技术能处理单一面容的表情识别,此数据可以和对应被试者的被解释变量形成一一对应关系,但多人面容的表情识别得到的数据要和匹配的被解释变量建立一一对应关系是本方案的难点二。
解决上述技术问题的难度在于表情识别与解决上述技术问题的意义:
解决上述技术问题的意义在于采集的数据更具有客观性真实性时效性,并且利用机器学习分析数据能很大程度提高准确度,提高拟合程度,利用数据分析结果提出的建议更具有社会参考价值。
发明内容
针对现有技术存在的问题,本发明提供了一种基于潜变量模型的儿童个性化行为统计分析系统及方法。
本发明是这样实现的,一种基于潜变量模型的儿童个性化行为统计分析方法,所述基于潜变量模型的儿童个性化行为统计分析方法包括:
步骤一,依据建立潜变量模型,通过数学模型将潜变量应用于分析个性化行为问题中;
步骤二,制作潜变量测度的主要工具—量表,
步骤三,分析影响儿童个性化行为差异与潜变量因素之间的内在联系,从儿童行为表现中发现其潜在能力,为儿童个性化发展提出科学的建议。
进一步,所述潜变量模型建立方法具体包括:
(1)建立三类潜变量指标体系,分别是个人感知性潜变量指标体系、能力潜变量指标体系、环境感知性潜变量指标体系。
(2)基于机器学习的人脸识别方法获取儿童不同行为表现的数据列,并对儿童的个性行为做分类,例如学习过程中的情绪分类:开心、愤怒、悲伤、恐惧等,以此分析个人感知性潜变量之学习体验与学习收获之间的关联。
(3)利用在线学习管理系统,基于回归模型分析能力潜变量(基本能力、学习能力、拓展能力)与学习效果的关联。
进一步,步骤一中,所述依据建立潜变量模型,通过数学模型将潜变量应用于分析个性化行为问题中具体包括:
明确潜变量所代表因素的具体含义,潜变量与其他变量的定量因果关系;模型中X为外生显变量,Y为内生显变量,若ξ为外生潜变量,η为内生潜变量。用于描述显变量X,Y分别与潜变量ξ、η之间的关系设定为测量模型,用于描述潜变量ξ、η之间的关系设定为结构方程式模型;在此基础上考虑儿童年龄的时间序列,修正为动态混合模型。
进一步,步骤二中,所述量表具体包括:
量表包括评定量表和态度量表两类,量表从问卷题目选项的角度可分为三点量表、五点量表和七点量表通过其他外显变量表示该潜变量变化程度;利用更精确的路径分析工具对模型进行参数估计和相关检验。
进一步,步骤三中,所述分析影响儿童个性化行为差异与潜变量因素之间的内在联系的方法具体包括:
(1)在一对一教学形式下,针对一个学生录制其学习过程的视频,然后用matlab对视频取帧得到按时间排列的一张张图片;
(2)用python对学生表情图片进行识别并对表情进行分类,对每一张图片基于SVM模型得到一个表情分类结果,从而得到一个具有时间序列的一组表情结果数据;
(3)用描述性统计的方法得到这个学生在一段时间内的表情分类饼图,然后将表情分类饼图与同时间段学生学习的做题质量,即做题分数做相关分析,研究学习过程的情感体验与学习收获有无关联。
进一步,所述基于潜变量模型的儿童个性化行为统计分析系统具体包括:
登录模块、在线学习模块,摄像模块,图像处理模块、人脸识别模块、在线测验模块、数据分类存储模块、数据统计分析模块、建议模块;
登录模块:用于用户通过账号或人脸识别进入在线学习模块;
在线学习模块:用于以微课形式开展教学活动,教学手段分别有视频教学、板书教学、试听教学、示范教学等;
摄像模块:用于利用摄像头实时记录用户学习状态以及用户在线测验状态;
图像处理模块:用于利用OpenCV+Dlib技术对摄像模块获取的用户学习状态视频进行自动分帧,并对分帧得到的图像进行灰度处理;
人脸识别处理模块:用于对灰度处理后的图像进行人脸的检测与定位,并统计能刻画儿童学学专注度的抬头次数数据;同时利用人脸68特征点定位技术识别、记录用户表情属性数据;
在线测验模块:用于学习结束后基于不同难度的测试题和量表形式的主观答题对用户进行在线测验,所述不同难度的测试题包括但不限于图的识别、数的识别、文字的识别、计算的识别、规律的识别;
数据分类存储模块:用于将统计出的能刻画儿童学学专注度的抬头次数数据标记为数据集1,将用户表情属性数据标记为数据集2,将摄像头记录的用户测验状态的视频数据标记为数据集3,将测验结果数据标记为数据集4,将量表结果数据标记为数据集5,将完成在线测验的时间标记为数据集6;并利用存储器分别存储各个数据集的数据;
数据统计分析模块:用于利用统计软件对6个数据集的数据进行统计分析,分析个人感知性潜变量指标、能力潜变量指标、环境感知性潜变量指标与教学手段、教学内容、测试难易程度的相关性;
建议模块:用于基于分析结果,从儿童学习行为表现中发现其潜在能力,为儿童个性化发展提出科学的建议。
综上所述,本发明的优点及积极效果为:本发明潜变量模型的构建,在儿童教育大数据中挖掘其个性化行为数据,统计分析不能被直接精确观测的教育指标内在联系,发掘个性化儿童的潜在能力,为儿童个性化发展提出科学的建议。0-12岁儿童教育包括学前教育和初等教育,是国民教育体系的重要组成部分,关系着亿万儿童的健康成长和千家万户的切身利益,更关系着国家和民族的未来。在0-12岁儿童教育研究过程中,发现教育实践环节有很多无法直接测量到的变量,包括比较抽象的概念和由于种种原因不能准确测量的变量。例如,在对儿童学业成就进行测量时获得的测试分数往往是外显变量,而儿童在学习时获得的情感体验、自我调节能力、模仿迁移技能以及心理上的成长是无法直观测量的。这种概念或建构就是潜变量,当该连续型潜变量的取值超过一定量时,结果就会表现为外显变量,如儿童学业成就达到标准。对这些无法直观测量的差异,又如儿童的社会情绪、个性化行为选择等需要多维度线性评估,这就需要建立潜变量模型来进行统计测量,其中潜变量统计生长模型就是考察儿童各种心理与行为特点最常用的模型之一。在0-12岁儿童个性化行为的测量研究上,研究潜变量统计模型是儿童多维度测量的发展趋势。
本发明依托重庆市儿童大数据工程实验室平台,挖掘0-12岁儿童教育成长的海量数据,建立潜变量统计模型,更好地探索以儿童个性化行为数据为基础的能力测量创新研究,潜变量测量极大利于发现某些未达到标准的儿童的特殊能力,或者发掘个性化儿童的潜在能力,以此给出适合儿童个性化发展的科学建议和指导方向。
本发明以0-12岁儿童个性化行为数据为基础做潜在能力测量研究,极大有利于发现某些未达到标准的儿童的特殊能力,或者发掘个性化儿童的潜在能力,以此给出适合儿童个性化发展的科学建议和指导方向。同时,与企业合作,依据预测出的儿童个性化行为偏好结果,开发教育产品。
附图说明
图1是本发明实施例提供的基于潜变量模型的儿童个性化行为统计分析方法流程图。
图2是本发明实施例提供的基于潜变量模型的儿童个性化行为统计分析方法原理图。
图3是本发明实施例提供的基于潜变量模型的儿童个性化行为统计分析系统结构示意图;
图中:1登录模块;2、在线学习模块;3、摄像模块;4、图像处理模块;5、人脸识别模块;6、在线测验模块;7、数据分类存储模块;8、数据统计分析模块;9、建议模块。
图4是本发明实施例提供的年龄-行为-能力三维关联图。
图5是本发明实施例提供的0-12岁儿童个性化行为研究中的潜变量逻辑图。
图6是本发明实施例提供的人脸识别原理图。
图7是本发明实施例提供的人脸识别效果图;
图中:(a)表情——高兴;(b)表情——惊讶;(c)表情——生气;(d)表情——自然。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明针对0-12岁儿童个性化行为的潜变量因素及潜变量模型应用,其中包括时间-行为-能力三维关联结构研究、过程性数据采集挖掘、潜变量模型构建、潜变量测量及预测分析。
下面结合附图对本发明的应用原理作详细的描述。
如图1-图2所示,本发明实施例提供的基于潜变量模型的儿童个性化行为统计分析方法包括:
S101,依据建立潜变量模型,通过数学模型将潜变量应用于分析个性化行为问题中;
S102,制作潜变量测度的主要工具—量表,
S103,分析影响儿童个性化行为差异与潜变量因素之间的内在联系,从儿童行为表现中发现其潜在能力,为儿童个性化发展提出科学的建议。
本发明实施例提供的潜变量模型建立方法具体包括:
(1)建立三类潜变量指标体系,分别是个人感知性潜变量指标体系、能力潜变量指标体系、环境感知性潜变量指标体系。
(2)基于机器学习的人脸识别方法获取儿童不同行为表现的数据列,并对儿童的个性行为做分类,例如学习过程中的情绪分类:开心、愤怒、悲伤、恐惧等,以此分析个人感知性潜变量之学习体验与学习收获之间的关联。
(3)利用在线学习管理系统,基于回归模型分析能力潜变量(基本能力、学习能力、拓展能力)与学习效果的关联。
步骤S101中,本发明实施例提供的依据建立潜变量模型,通过数学模型将潜变量应用于分析个性化行为问题中具体包括:
明确潜变量所代表因素的具体含义,潜变量与其他变量的定量因果关系;模型中X为外生显变量,Y为内生显变量,若ξ为外生潜变量,η为内生潜变量。用于描述显变量X,Y分别与潜变量ξ、η之间的关系设定为测量模型,用于描述潜变量ξ、η之间的关系设定为结构方程式模型;在此基础上考虑儿童年龄的时间序列,修正为动态混合模型。
步骤S101中,本发明实施例提供的量表具体包括:
量表包括评定量表和态度量表两类,量表从问卷题目选项的角度可分为三点量表、五点量表和七点量表通过其他外显变量表示该潜变量变化程度;利用更精确的路径分析工具对模型进行参数估计和相关检验。
步骤S103中,本发明实施例提供的分析影响儿童个性化行为差异与潜变量因素之间的内在联系的方法具体包括:
(1)在一对一教学形式下,针对一个学生录制其学习过程的视频,然后用matlab对视频取帧得到按时间排列的一张张图片;
(2)用python对学生表情图片进行识别并对表情进行分类,对每一张图片基于SVM模型得到一个表情分类结果,从而得到一个具有时间序列的一组表情结果数据;
(3)用描述性统计的方法得到这个学生在一段时间内的表情分类饼图,然后将表情分类饼图与同时间段学生学习的做题质量,即做题分数做相关分析,研究学习过程的情感体验与学习收获有无关联。
如图3所示,本发明实施例提供的基于潜变量模型的儿童个性化行为统计分析系统具体包括:
登录模块1、在线学习模块2,摄像模块3,图像处理模块4、人脸识别模块5、在线测验模块6、数据分类存储模块7、数据统计分析模块8、建议模块9;
登录模块1:用于用户通过账号或人脸识别进入在线学习模块2;
在线学习模块2:用于以微课形式开展教学活动,教学手段分别有视频教学、板书教学、试听教学、示范教学等;
摄像模块3:用于利用摄像头实时记录用户学习状态以及用户在线测验状态;
图像处理模块4:用于利用OpenCV+Dlib技术对摄像模块获取的用户学习状态视频进行自动分帧,并对分帧得到的图像进行灰度处理;
人脸识别处理模块5:用于对灰度处理后的图像进行人脸的检测与定位,并统计能刻画儿童学学专注度的抬头次数数据;同时利用人脸68特征点定位技术识别、记录用户表情属性数据;
在线测验模6块:用于学习结束后基于不同难度的测试题和量表形式的主观答题对用户进行在线测验,所述不同难度的测试题包括但不限于图的识别、数的识别、文字的识别、计算的识别、规律的识别;
数据分类存储模块7:用于将统计出的能刻画儿童学学专注度的抬头次数数据标记为数据集1,将用户表情属性数据标记为数据集2,将摄像头记录的用户测验状态的视频数据标记为数据集3,将测验结果数据标记为数据集4,将量表结果数据标记为数据集5,将完成在线测验的时间标记为数据集6;并利用存储器分别存储各个数据集的数据;
数据统计分析模块8:用于利用统计软件对6个数据集的数据进行统计分析,分析个人感知性潜变量指标、能力潜变量指标、环境感知性潜变量指标与教学手段、教学内容、测试难易程度的相关性;
建议模块9:用于基于分析结果,从儿童学习行为表现中发现其潜在能力,为儿童个性化发展提出科学的建议。
本发明的工作原理如下:
儿童通过登录模块1利用账号或人脸识别进入在线学习模块,此时摄像模块3摄像头开启,在线学习模块2以微课形式开展教学活动,教学手段分别有视频教学、板书教学、试听教学、示范教学等,测试者在学习的过程中,摄像模块3摄像头录入儿童学习状态的视频,图像处理模块4通过OpenCV+Dlib技术自动分帧,再进行图像的灰度处理,然后人脸识别模块5进行人脸的检测与定位,统计出能刻画儿童学习专注度的抬头次数,数据分类存储模块7将抬头次数存储为数据集1,同时人脸识别模块5运用人脸68特征点定位技术实现对儿童表情属性的识别与记录,数据分类存储模块7将表情特征数据存储为数据集2。
学习结束时,在线测验模块6立刻开启在线测验端口,计算机终端发送不同难度的测验题(如图的识别、数的识别、文字的识别、计算的识别、规律的识别等)和量表形式的主观答题,同时摄像模块3利用摄像头录入儿童测验状态的视频数据,数据分类存储模块7将测验状态数据存储为数据集3,测验结果数据存储为数据集4,量表结果数据存储为数据集5,完成在线测验的时间存储为数据集6,数据统计分析模块8利用统计软件将六个数据集进行统计分析,分析个人感知性潜变量指标、能力潜变量指标、环境感知性潜变量指标与教学手段、教学内容、测试难易程度的相关性,建议模块9从儿童学习行为表现中发现其潜在能力,为儿童个性化发展提出科学的建议。
下面结合具体实施例对本发明的应用原理作进一步的描述。
实施例1:
1、构建0-12岁儿童个性化行为-能力理论模型要构建儿童个性化行为分析模型首先需要架构年龄、行为、能力三维结构图,如图4。其次随着年龄增长儿童个性行为和能力的渐强型类别。
2、0-12岁儿童个性化行为的潜变量在年龄-行为-能力三维关联结构基础上,随着年龄增长个性化行为的潜变量,以及潜变量之间的逻辑性。潜变量是指不能被直接测量的变量。在儿童教育成长过程中,根据潜变量描述对象的差异将个性化行为中常用或可能会用到的潜变量分为能力潜变量、个人感知性潜变量、环境感知性潜变量三大类。能力潜变量主要用于描述儿童潜在的能力包含观察、记忆、模仿、社交、协同、创造等子潜变量;个人感知性潜变量涵盖儿童态度、意识、体验、调节等子潜变量,环境感知性潜变量指学校、家庭、社区等子潜变量,具体如图5所示。
3、挖掘0-12岁儿童个性化大数据儿童个性化成长数据的特点之一就是数量庞大、维度丰富,因此需要利用数据仓库、数据挖掘技术对儿童行为数据进行系统地储存和管理,收集儿童个性表现、兴趣、习惯等数据,并且用数据可视化的分析技术加以呈现。具体采集数据研究思路如表1。
表1儿童个性化大数据采集技术列表
4、潜变量模型在0-12岁儿童个性化行为中的实证分析
首先,依据内容(1)(2)建立潜变量模型,其核心目标是通过数学模型将潜变量应用于分析个性化行为问题中,潜变量建模的关键是明确潜变量所代表因素的具体含义,潜变量与其他变量(潜变量和显变量)的定量因果关系。假设模型中X为外生显变量,Y为内生显变量,若ξ为外生潜变量,η为内生潜变量。用于描述显变量X,Y分别与潜变量ξ、η之间的关系设定为测量模型,用于描述潜变量ξ、η之间的关系设定为结构方程式模型。在此基础上考虑儿童年龄的时间序列,修正为动态混合模型。
其次,制作潜变量测度的主要工具—量表。量表包括评定量表和态度量表两类,量表从问卷题目选项的角度可分为三点量表、五点量表和七点量表。
又由于潜变量无法直接进行测量,必须通过其他外显变量表示该潜变量变化程度。而为解释一组潜变量之间的因果关系,可能涉及到很多外显变量,因此需要变量之间的层次关系结构,利用更精确的路径分析工具对模型进行参数估计和相关检验。
最后,分析影响儿童个性化行为差异与潜变量因素之间的内在联系,从儿童行为表现中发现其潜在能力,为儿童个性化发展提出科学的建议。
本发明前期进行了一个“基于有序Logistic回归分析的环境感知性潜变量研究”。首先针对环境三大因素家庭、学校、社区设置了指标体系,包括家庭户口状况、父母关系、父母亲受教育层次、父母亲月总收入状况、父母鼓励程度、父母陪伴时长、父母与子女交流程度、被试者对学校\老师\同学的认同度、邻居相处和睦度、居家环境认同度、学业成绩自我评价等。利用数据挖掘技术手段收集到93个原始有效样本数据。
利用有序Logistic回归模型得到结论:
(1)父母关系对学生学业成绩的影响
表1模拟拟合信息表
表2参数估计值表
βX(1)=3.488x31+2.643x32+1.505x33
logit(p1)(1)=-0.091+βX(1)
logit(p1+p2)(1)=-1.669+βX(1)
logit(p1+p2+p3)(1)=-3.269+βX(1)
从表1,表2可以得出,sig均小于0.05,说明父母关系对学生成绩有显著影响,其中父母离异、关系平淡都对学生有着显著的负面影响。βX(1)中x31系数绝对值最大,当x31越大时βX(1)越大,选择因变量C(70分以下)的概率越大,即说明父母离异对学生成绩的负面影响最大。
(2)父母鼓励程度对学生学业成绩的影响
表3模拟拟合信息表
表4参数估计值表
βX(2)=-3.871x61-2.525x62
logit(p1)(2)=3.881+βX(2)
logit(p1+p2)(2)=2.332+βX(2)
logit(p1+p2+p3)(2)=0.56+βX(2)
从表3,表4可以看出,sig均小于0.05,因此父母是否经常鼓励自己对学生成绩有着显著的影响。βX(2)中x61系数绝对值最大,当x61越大时βX(2)越小,选择因变量A(90分以上)的概率越大,表明父母鼓励学生次数越多,学生成绩越好。
(3)父母与子女交流程度对学生学业成绩的影响
表5模拟拟合信息表
表6参数估计值表
βX(3)=-4.938x81-3.53x82
logit(p1)(3)=4.864+βX(3)
logit(p1+p2)(3)=3.288+βX(3)
logit(p1+p2+p3)(3)=1.147+βX(3)
由表5,6可以看出sig均小于0.05,因此父母是否与子女交流对学生学业成绩有着显著影响,βX(3)中x81系数绝对值最大,当x81越大时βX(2)越小,选择因变量A(90分以上)的概率越大,表明父母与学生交流越频繁,学生成绩越好。
(4)邻居相处和睦程度对学生学业成绩的影响
表7模拟拟合信息表
表8参数估计值表
βX(4)=-3.305x121-0.996x122
logit(p1)(4)=3.044+βX(4)
logit(p1+p2)(4)=1.399+βX(4)
logit(p1+p2+p3)(4)=-0.08+βX(4)
由表7,8可以看出sig均小于0.05,因此与邻居相处是否和睦对学生成绩有显著影响,与邻居相处和睦对学生有正面影响。βX(4)中x121系数绝对值最大,当x121越大时βX(4)越小,选择因变量A(90分以上)的概率越大,表明与邻居相处关系越和睦,学生成绩越好。
本发明难点在于儿童个性化行为数据的采集和管理。这些数据种类繁多,且数据量大。通过视频录制技术得到的过程性数据(比如图片、视频)难以直接量化。因此,这些行为表现数据能力表现数据的采集、整理、统计成为了项目的难点。
本发明的潜变量理论与模型在儿童个性化行为中的应用。学前教育和初等教育的研究成果颇显,潜变量理论也日趋完整成熟,但两者结合,利用潜变量统计模型来研究0-12岁儿童个性化行为进行多维度测量,是本发明创新之一。
本发明考虑时间参数,构建动态数据的统计模型。潜变量模型添加时间序列,时间、潜变量与因变量构成三维结构研究其相关性是本发明创新之二。
本发明儿童个性化行为大数据的挖掘。传统的儿童个性教育研究多采用显变量数据(比如学业成绩)作相关分析和回归分析。利用视频录制技术、学习管理采集技术收集挖掘过程性数据是本发明创新之三。
本发明校企合作,产教融合。本发明的顺利开展必须和学前教育、初等教育单位深入合作,采集过程性数据和结果性数据,共同建立0-12岁儿童教育数据库。依托重庆市儿童大数据工程实验室,与中科曙光、中兴通信合作,为数据挖掘提供信息技术支持。产教融合的深入合作推进是本发明创新之四。
实施例2:
1、儿童人脸识别实例
本实施例使用python第三方库sk-learn机器学习+主成分分析(PCA)+支持向量机(SVM)实现人脸识别。
首先准备好待训练儿童的照片,并对图像做灰度处理。使用Image函数读入数据集,对数据集进行划分,一部分用于训练集train,另一部分用于测试集test。运用主成分分析思想,选取保留主成分n_components的个数,选择“randomized”SVD方法,在数据预处理上使用“whiten”方法,得到训练集和测试集的投影系数。利用训练集训练出一个SVM分类器,用于测试集的识别。最后用训练好的SVM分类器做测试集的人脸识别。
如果是班级内学生,则显示学生的学号和姓名,如果是班级外学生,则显示unknown。
最后用四项指标:查准率/查全率/F1值/测试样本数来检验本次实例的准确度。
2、儿童个性化行为的数据采集
在上述1完成的基础上,抓取儿童学习关注度数据和学习情绪多维数据,这些数据再与在线测试数据做相关分析,探究儿童学习关注度、情感收获与学习效果之间的关联程度。
本实例利用人脸68特征点定位技术,人脸特征技术的实现步骤如图6所示。
运用python语言,获取儿童在学习过程中的抬头率x1和四种表情(高兴x2,惊讶x3,生气x4,自然x5)的频数。表情识别效果如图7所示:同时获取在线测试数据y,综合数据如表9所示
表9指标数据采集表
3、儿童个性化行为与学习效果的相关分析
利用相关分析和回归分析,得到如下结论,见表10、表11、表12、表13:
表10抬头次数与成绩相关分析表
表11抬头率与在线测试成绩拟合效果分析表
表12方差分析表
表13抬头率与在线测试成绩系数表
由表11看出抬头率与在线测试成绩正相关,表11中R=0.876和表4的sig<0.05均说明回归方程拟合理想,且由表13得到一元线性回归方程为y=0.876x1+1.013×10-13,该方程说明学生在学习过程中抬头率与在线测试成绩具有显著的关联性,随着抬头率的增加,学生的学习质量会随之增加。
4、儿童个性化表情特征与学习效果的回归分析
利用前面获取的思维表情数据,结合在线测试成绩,做儿童个性化表情特征与学习效果的回归分析,分析结果如表14、表15
表14四种表情与成绩拟合效果分析表
表15方差分析表
表16四种表情与成绩拟合效果分析表
最终得到多元线性回归方程为y=0.534x2+0.13x3-0.061x4+0.481x5+1.015×10-13,由方程看出高兴、自然这两种表情和在线测试成绩呈正相关性,惊讶对学生关联性较弱,而生气的表情则与之呈负相关。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.一种基于潜变量模型的儿童个性化行为统计分析方法,其特征在于,所述基于潜变量模型的儿童个性化行为统计分析方法包括:
步骤一,建立潜变量模型,将潜变量模型中的潜变量与个性化行为各个变量联系起来,分析个性化行为对潜变量的影响;
所述潜变量模型建立方法具体包括:
(1)建立三类潜变量指标体系,分别是个人感知性潜变量指标体系、能力潜变量指标体系、环境感知性潜变量指标体系;
(2)基于机器学习的人脸识别方法获取儿童不同行为表现的数据列,并对儿童的个性行为做分类,所述分类包括学习过程中的情绪分类,所述情绪分类包括开心、愤怒、悲伤、恐惧,以此分析个人感知性潜变量之学习体验与学习收获之间的关联;
(3)利用在线学习管理系统,基于回归模型分析能力潜变量与学习效果的关联,所述能力潜变量包括:基本能力、学习能力、拓展能力;
所述建立潜变量模型,通过数学模型将潜变量应用于分析个性化行为问题中具体包括:
明确潜变量所代表因素的具体含义,潜变量与其他变量的定量因果关系;模型中X为外生显变量,Y为内生显变量,ξ为外生潜变量,η为内生潜变量;用于描述显变量X,Y分别与潜变量ξ、η之间的关系设定为测量模型,用于描述潜变量ξ、η之间的关系设定为结构方程式模型;在此基础上考虑儿童年龄的时间序列,修正为动态混合模型;
步骤二,制作潜变量测度的主要工具—量表,所述量表具体包括:
量表包括评定量表和态度量表两类,量表从问卷题目选项的角度可分为三点量表、五点量表和七点量表,通过其他外显变量表示该潜变量变化程度;利用路径分析工具对模型进行参数估计和相关检验;
步骤三,分析影响儿童个性化行为差异与潜变量因素之间的内在联系,从儿童行为表现中发现其潜在能力,为儿童个性化发展提出科学的建议;
所述分析影响儿童个性化行为差异与潜变量因素之间的内在联系的方法具体包括:
(1)在一对一教学形式下,针对一个学生录制其学习过程的视频,然后用matlab对视频取帧得到按时间排列的一张张图片;
(2)用python对学生表情图片进行识别并对表情进行分类,对每一张图片基于SVM模型得到一个表情分类结果,从而得到一个具有时间序列的一组表情结果数据;
(3)用描述性统计的方法得到这个学生在一段时间内的表情分类饼图,然后将表情分类饼图与同时间段学生学习的做题质量,即做题分数做相关分析,研究学习过程的情感体验与学习收获有无关联。
2.一种基于权利要求1所述基于潜变量模型的儿童个性化行为统计分析方法的儿童个性化行为统计分析系统,其特征在于,所述儿童个性化行为统计分析系统具体包括:
登录模块、在线学习模块,摄像模块,图像处理模块、人脸识别模块、在线测验模块、数据分类存储模块、数据统计分析模块、建议模块;
登录模块:用于用户通过账号或人脸识别进入在线学习模块;
在线学习模块:用于以微课形式开展教学活动,教学手段分别有视频教学、板书教学、试听教学、示范教学;
摄像模块:用于利用摄像头实时记录用户学习状态以及用户在线测验状态;
图像处理模块:用于利用OpenCV+Dlib技术对摄像模块获取的用户学习状态视频进行自动分帧,并对分帧得到的图像进行灰度处理;
人脸识别处理模块:用于对灰度处理后的图像进行人脸的检测与定位,并统计能刻画儿童学专注度的抬头次数数据;同时利用人脸68特征点定位技术识别、记录用户表情属性数据;
在线测验模块:用于学习结束后基于不同难度的测试题和量表形式的主观答题对用户进行在线测验,所述不同难度的测试题包括但不限于图的识别、数的识别、文字的识别、计算的识别、规律的识别;
数据分类存储模块:用于将统计出的能刻画儿童学专注度的抬头次数数据标记为数据集1,将用户表情属性数据标记为数据集2,将摄像头记录的用户测验状态的视频数据标记为数据集3,将测验结果数据标记为数据集4,将量表结果数据标记为数据集5,将完成在线测验的时间标记为数据集6;并利用存储器分别存储各个数据集的数据;
数据统计分析模块:用于利用统计软件对6个数据集的数据进行统计分析,分析个人感知性潜变量指标、能力潜变量指标、环境感知性潜变量指标与教学手段、教学内容、测试难易程度的相关性;
建议模块:用于基于分析结果,从儿童学习行为表现中发现其潜在能力,为儿童个性化发展提出科学的建议。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910480497.4A CN110232343B (zh) | 2019-06-04 | 2019-06-04 | 基于潜变量模型的儿童个性化行为统计分析系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910480497.4A CN110232343B (zh) | 2019-06-04 | 2019-06-04 | 基于潜变量模型的儿童个性化行为统计分析系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110232343A CN110232343A (zh) | 2019-09-13 |
CN110232343B true CN110232343B (zh) | 2021-09-28 |
Family
ID=67859150
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910480497.4A Active CN110232343B (zh) | 2019-06-04 | 2019-06-04 | 基于潜变量模型的儿童个性化行为统计分析系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110232343B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110852062B (zh) * | 2019-10-17 | 2023-03-14 | 天津大学 | 利用言论信息自动化测量群体外显态度和内隐态度的方法 |
CN110766580A (zh) * | 2019-10-25 | 2020-02-07 | 重庆第二师范学院 | 一种基于人脸特征的课堂质量监控系统 |
CN112651433B (zh) * | 2020-12-17 | 2021-12-14 | 广州锦行网络科技有限公司 | 一种特权账号异常行为分析方法 |
CN113782188B (zh) * | 2021-09-16 | 2023-11-28 | 深圳大学 | Sjt情境式儿童心理测评系统的多维度测验数据处理方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102792327A (zh) * | 2010-02-04 | 2012-11-21 | 宝洁公司 | 用于进行消费者调查的方法 |
CN103218628A (zh) * | 2013-03-22 | 2013-07-24 | 中国科学技术大学 | 一种基于团块与轨迹特征的异常行为描述方法 |
CN103345623A (zh) * | 2013-07-11 | 2013-10-09 | 中国科学院自动化研究所 | 一种基于鲁棒相对属性的行为识别方法 |
CN107609736A (zh) * | 2017-08-09 | 2018-01-19 | 广州思涵信息科技有限公司 | 一种综合应用人工智能技术的教学诊断分析系统及方法 |
CN109241834A (zh) * | 2018-07-27 | 2019-01-18 | 中山大学 | 一种基于隐变量的嵌入的群体行为识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7236615B2 (en) * | 2004-04-21 | 2007-06-26 | Nec Laboratories America, Inc. | Synergistic face detection and pose estimation with energy-based models |
-
2019
- 2019-06-04 CN CN201910480497.4A patent/CN110232343B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102792327A (zh) * | 2010-02-04 | 2012-11-21 | 宝洁公司 | 用于进行消费者调查的方法 |
CN103218628A (zh) * | 2013-03-22 | 2013-07-24 | 中国科学技术大学 | 一种基于团块与轨迹特征的异常行为描述方法 |
CN103345623A (zh) * | 2013-07-11 | 2013-10-09 | 中国科学院自动化研究所 | 一种基于鲁棒相对属性的行为识别方法 |
CN107609736A (zh) * | 2017-08-09 | 2018-01-19 | 广州思涵信息科技有限公司 | 一种综合应用人工智能技术的教学诊断分析系统及方法 |
CN109241834A (zh) * | 2018-07-27 | 2019-01-18 | 中山大学 | 一种基于隐变量的嵌入的群体行为识别方法 |
Non-Patent Citations (3)
Title |
---|
A Latent Variable Approach to Determining the Structure of Executive Function in Preschool Children;Michael R.Miller et al.;《Journal of Cognition and Development》;20120701;395-423 * |
小语料库重庆话语音识别的研究;张策 等;《计算机测量与控制》;20181125;第26卷(第11期);252-260 * |
考虑心理潜变量的专车出行选择行为分析;李军 等;《科学技术与工程》;20170430;第17卷(第11期);322-327 * |
Also Published As
Publication number | Publication date |
---|---|
CN110232343A (zh) | 2019-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110232343B (zh) | 基于潜变量模型的儿童个性化行为统计分析系统及方法 | |
CN109255998B (zh) | 一种学生成绩诊断提升系统 | |
CN109919810B (zh) | 在线学习系统中的学生建模与个性化课程推荐方法 | |
Chen | The relations between perceived parenting styles and academic achievement in Hong Kong: The mediating role of students' goal orientations | |
Li et al. | Review and prospect of modern education using big data | |
Rockhill | Researching participation in adult education: The potential of the qualitative perspective | |
CN112184500A (zh) | 基于深度学习和知识图谱的课外学习辅导系统及实现方法 | |
Liu et al. | Collaborative learning team formation: a cognitive modeling perspective | |
CN113627779A (zh) | 一种基于大数据和ai技术的教学管理、质量评估系统 | |
CN111275239A (zh) | 一种基于多模态的网络化教学数据分析方法及系统 | |
Rauber et al. | Assessing the learning of machine learning in K-12: A ten-year systematic mapping | |
CN113744101A (zh) | 新高考模式下考生志愿智能填报方法、装置及计算机设备 | |
CN108763459B (zh) | 基于心理测试及dnn算法的专业倾向分析方法及系统 | |
CN116226410B (zh) | 一种知识元联结学习者状态的教学评估与反馈方法及系统 | |
CN112685470B (zh) | 基于学分银行和大数据分析的终身学习资源智能推送方法 | |
ToSa et al. | Impact of a professional development program using data-loggers on science teachers’ attitudes towards inquiry-based teaching | |
Lee et al. | Utilizing natural language processing (NLP) to evaluate engagement in project-based learning | |
Wu | Study on the differences in behaviour characteristics of distance online autonomous learning in different network virtual environments | |
Prasetya et al. | Analysis and Quality Measurement of SITEDI Sub-System Against User Satisfaction Using WebQual 4.0 and End-User Computing Satisfaction (EUCS) Methods | |
Tsukanova et al. | The transformation of the training of preschool educators in the digital age | |
CN117455126B (zh) | 一种泛在实训教学和考评管理系统及方法 | |
Liu et al. | An empirical study on the effect of academic engagement on academic achievement of engineering students in colleges and universities | |
Anke et al. | Examining an extended technology acceptance model for competence-based assessment | |
Yuana et al. | Development of a Scientific Thinking Assessment Tool for Sixth Graders Based on Chinese 2022 Edition of the New Academic Standards | |
Dumnil | Competency Development System for the Pre-service Teachers Using a Machine Learning Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |