CN111950708A - 一种发现大学生日常生活习惯的神经网络结构与方法 - Google Patents

一种发现大学生日常生活习惯的神经网络结构与方法 Download PDF

Info

Publication number
CN111950708A
CN111950708A CN202010798992.2A CN202010798992A CN111950708A CN 111950708 A CN111950708 A CN 111950708A CN 202010798992 A CN202010798992 A CN 202010798992A CN 111950708 A CN111950708 A CN 111950708A
Authority
CN
China
Prior art keywords
data
habit
module
habits
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010798992.2A
Other languages
English (en)
Other versions
CN111950708B (zh
Inventor
周东波
喻宏伟
余雅滢
王小梅
涂悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central China Normal University
Original Assignee
Central China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central China Normal University filed Critical Central China Normal University
Priority to CN202010798992.2A priority Critical patent/CN111950708B/zh
Publication of CN111950708A publication Critical patent/CN111950708A/zh
Application granted granted Critical
Publication of CN111950708B publication Critical patent/CN111950708B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Educational Administration (AREA)
  • Fuzzy Systems (AREA)
  • Educational Technology (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种发现大学生日常行为习惯的神经网络结构与方法,包括:获取大学生校园生活基本数据并存入数据库;对生活基本数据预处理工作,将数据分为不同数据集;针对所采集数据,构建基于特征的行为分类,获取数据分类结果;根据数据分类结果,先利用空间化图卷积网络分类模型,再引入基于注意力机制的图卷积神经网络结构与方法,建立学生行为习惯基于外显行为数据的发现机理与表示计算;针对习惯定性化描述中内容混杂的问题,利用神经网络模型输出的结果,构建习惯基于其外显行为的集合化表达与形式化描述。最终构建出行为习惯可发现模型,根据不同学生行为数据进行分析,可以解决教育数据深层次挖掘的问题,实现教育数据利用和分析。

Description

一种发现大学生日常生活习惯的神经网络结构与方法
技术领域
本发明属于教育学\教育技术学与计算机科学、地理信息科学等多学科交叉领域,具体涉及一种发现大学生日常生活习惯的神经网络结构与方法。
背景技术
教育大数据的发展十分迅速,围绕教育大数据的数据处理、信息挖掘与应用服务等研究成为一系列研究热点。同样,应用校园大数据分析学生的成才过程,构建有效保障,也已经成为教育大数据新的研究方向。
我国教育家叶圣陶先生说过:“教育就是培养习惯。”抛开对习惯与教育目标的关系争议,自古以来,不论是国内还是国外,教育家们对于习惯的重要性有着统一的认识,习惯对人极为重要。所谓习惯,是在长久过程中经反复练习,并发展成个体自动化的行为方式。习惯是变化的,若不注意养成过程中的不当行为影响,好习惯会变成坏习惯。然而良好的习惯不能在无意识状态下自发形成,一般自发形成的习惯大多是不良习惯,坏习惯一旦形成,其改良的过程将变得漫长而苦难。
大学生是当代社会的重要组成部分,也是最生动最具有活力的群体,其综合素质的高低,直接关系国家与社会的长远发展。大学教育应当在学生进入大学初期就有目的地帮助学生培养或维护良好的学习生活习惯。然而当代大学生,特别是刚刚进入大学的低年级学生,从高中进入大学后,由高中的强监督学习变成大学的弱监督学习,由于对自身学习行为缺乏控制与约束,一些不良的日常行为导致学习习惯发生变化,导致辍学甚至最终影响到学生成才。对习惯的研究刻不容缓,良好的习惯来自于对行为的正确认识,而良好的行为习惯的建立除了需要靠自身努力外,还要靠同学、朋友、老师和家长等多方监督与指导,是内因外因共同作用的结果。因而,研究大学生的日常校园活动数据,从日常的行为与活动中,去判断、分辨生活中习以为常的行为,及时干预不良行为活动,是帮助大学生培养良好习惯的重要途径。
大数据技术的发展,智慧校园的建设,基于物联网感知类技术、视频录制类技术、图像识别类技术等,进行校园范围内教育、学习、活动等数据的全面、自然、动态、持续采集,构建教育大数据已经成为常态。进入数字化生活时代,日常生活与学习各类活动已被各类设备默默记录,应用校园大数据分析学生的成才过程,构建有效保障,已经成为大数据应用的重要方向。
因此,应用大数据技术,从校园大学生日常学习生活行为数据出发,通过发现其习惯,判断其行为活动对习惯变化的影响,并及时进行精准的干预是确保大学生养成良好习惯,顺利成才的重要保障。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种发现大学生日常生活习惯的神经网络结构与方法。本发明技术方案的方法,针对大学生校园日常生活数据的多样性、多维度、多类型特性,构建学生数据的图结构化表示,引入图神经网络实现大学生日常生活习惯可发现的方法。对教育数据的深层次挖掘,实现了教育数据的利用和分析。
为实现上述目的,本发明提供了如下方案:本发明提供一种发现大学生日常生活习惯的神经网络结构,其特征在于,包括依次相连的数据获取模块、数据预处理模块、校园生活数据分类模块、习惯数据发现模块以及习惯数据描述模块;
所述数据获取模块,用于获取大学生日常生活数据,并存入数据库;
所述数据预处理模块,用于对大学生日常生活数据进行过滤、清洗和离散化数据预处理;
所述校园生活数据分类模块,用于构建基于特征的行为分类,获取日常生活数据分类结果;
所述习惯数据发现模块,用于对日常生活数据分类结果得到的同类数据进行关联分析,并根据邻域聚合特征信息得到习惯描述的数据输出结果;
所述习惯数据描述模块,用于根据习惯描述的数据输出结果,利用习惯基于外显行为的集合化表达与形式化描述,得到大学生日常生活习惯的具体准确描述。
优选地,所述数据预处理模块包括依次相连的数据选取模块、数据清洗模块及数据划分模块;
所述数据选取模块,用于选取智慧校园采集的数据库中与学生日常生活习惯相关联的数据;
所述数据清洗模块,用于对数据库中的数据进行过滤、清洗和离散化,以消除不完整、存在缺失或重复的数据,并进行数据集成;
所述数据划分模块,用于将集成的数据划分成训练集、验证集和测试集。
优选地,所述校园生活数据分类模块包括依次连接的数据图结构化模块、图节点状态更新模块以及图结构数据分类模块;
所述数据图结构化模块,用于将学生生活习惯数据描述成属性图,并建立节点表示校园时空序列中的行为活动,建立边表示节点之间的关系;
所述图节点状态更新模块,用于更新节点数据,并通过消息函数和更新函数进行消息传播机制迭代的方法计算节点表示向量,形成图数据结构形式化表达;
所述图结构数据分类模块,用于获取数据的广泛分类结果,并利用监督分类的方法,建立对学生行为习惯外显活动的时空图卷积网络分类,实现图结构数据的分类。
优选地,所述习惯数据发现模块包括依次连接的领域特征聚合模块及习惯发现模块;
所述邻域特征聚合模块,用于对分类的学生日常行为建立邻域特征关系的聚合过程,并利用空间化图卷积网络分类模型,得到行为习惯分类结果;
所述习惯发现模块,用于对学生数据进行分析和形式化表达习惯特性,获得完整、系统的习惯数据。
优选地,所述习惯数据描述模块包括依次连接的习惯定义模块和数据描述模块
所述习惯定义模块,用于构建习惯进行外显行为要素化和形式化表达结构;
所述数据描述模块,用于对大学生日常生活习惯的网络结构模型输出数据进行描述,将输出数据结合习惯的表达与定义,获得习惯的准确描述。
一种发现大学生日常生活习惯的神经网络方法,其特征在于,包括以下步骤:
S1获取大学生日常生活数据并对其进行分类整理,并存入数据库,得到大学生日常生活原始数据集;
S2对所述原始数据集进行数据预处理工作,并分为训练集、验证集和测试集,得到预处理后的数据集;
S3构建时空图卷积自动分类网络,并对所述预处理后的数据集进行分类,获得外显行为数据分类结果;
S4建立空间化图卷积网络分类模型,并将所述外显行为数据分类结果输入到所述空间化图卷积网络分类模型对所述外显行为数据分类进行优化,得到优化后的外显行为数据分类,根据基于注意力机制的图卷积神经网络结构对所述优化后的外显行为数据进行分析,得到习惯描述的数据输出结果;
S5根据所述习惯描述的数据输出结果,利用习惯基于外显行为的集合化表达与形式化描述,得到大学生日常生活习惯的描述结果。
优选地,所述步骤S2包括:
S21将数据库中的原始数据集进行有效数据的筛选,将具有完整信息的学生作为有效研究对象;
S22对包括有效研究对象的数据进行清洗和预处理,在学年维度上进行聚合处理和行为指标计算,构建成规范化的数据集;
S23将数据集的60%的数据划分为训练集,20%的数据划分为验证集,20%的数据划分为训练集。
优选地,所述步骤S3包括:
S31根据数据预处理之后的数据集,获得聚类个数,根据聚类个数将学生日常生活数据按照不同类别划分;
S32根据校园活动行为序列的时间、空间属性关联,建立图结构化数据模型,建立节点表示校园时空序列中的行为活动,建立边表示节点之间的关系;
S33根据不同观测周期的层次图结构化数据,建立时空图卷积自动分类网络,实现习惯外显行为的数据分类;
优选地,所述步骤S4包括:
S41根据大学生日常生活数据分类结果,得到并提取同类数据;
S42对同类数据之间的属性进行关联分析,并建立图结构化表示;
S43根据图结构化数据相应的时空序列关系,利用空间化卷积网络分类模型并结合邻域聚合特征信息,得到聚类分类结果;
S44根据聚类完成的行为时空序列分类结果,建立基于注意力机制的图卷积神经网络结构,将所述分类结果作为图卷积神经网络结构的输入参数,输出习惯预测结果。
优选地,所述步骤S5包括:
S51基于学生日常习惯外显行为的集合化表达与形式化描述对不同类别的习惯进行定义,获得习惯定义和描述方法;
S52根据图卷积神经网络结构的习惯预测结果,对比不同层面习惯的要素化表达,构建所述习惯预测结果与所述习惯定义和描述方法的对应关系,得到大学生日常生活习惯的描述结果。
本发明公开了以下有益效果:
1)本发明技术方案的方法,从多学科融合出发,以机器学习中数据分析的基础理论为指导,探索一种新的大数据教育经验与规律发现的新方法,为教育大数据的处理、分析与应用提了供新思路;
2)本发明技术方案的方法,将神经网络数据分析方法,引入到大学生日常生活数据中,进行日常行为分析,扩展了教育大数据的应用模式与分析方法,使得针对教育大数据进行精准分析和利用成为可能;
3)本发明技术方案的方法,提出了大学生日常行为习惯的外显表达,构建了习惯可描述模型,充分考虑了多维度数据类型,在数据层面运用图结构化数据表达,提高了不同数据之间的关联性,有效的提高教育大数据的应用价值;
4)本发明技术方案的方法,从多维度数据出发,构建了“数据分类聚合成外显行为,外显行为演化养成习惯”的“数据-行为-习惯”的数据出发、自动信息提取与习惯知识回归生成的研究思路,更加注重个性化的数据区别,提高了教育大数据分析的准确性,充分发挥了教育大数据的作用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明技术方案实施例的发现大学生日常生活习惯与教育服务方法流程图;
图2是本发明神经网络结构示意图;
图3是本发明技术方案实施例的习惯外显行为的数据聚类分类流程图;
图4是本发明技术方案实施例的图表示学习习惯可发现方法流程图;
图5是本发明技术方案实施例的习惯数据外显行为的描述与教育精准服务流程图;
图6是本发明技术方案实施例的习惯外显行为数据自动分类中时空图卷积自动分类网络结构图;
图7是本发明技术方案实施例的基于图卷积神经网络的习惯可发现网络结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明实施例的基于机器学习方法的大学生日常生活习惯可发现模型与教育服务方法包括如下步骤:
(1)获取大学生校园生活数据。通过与现有的学校学生信息管理部门、教育单位与在线学习平台对接,获取与大学生校园生活相关的数据。目前校园大数据中所采集的数据包括学生日常的学习行为,即进入校园中各学习区的学习活动、生活活动、文体娱乐活动、休息活动等,以及课堂评价结果数据、社团活动数据、校园学习管理数据、身体健康数据、心理健康数据、互联网访问数据以及学习行为习惯与校园其它活动所采集数据建立关联关系。
具体地,学生校园大数据的获取与整理包括对既有的电子版本数据的管理,其中包括文本格式数据,如excel格式的报表数据,对这些数据进行规划整理,形成数据库形式的教育管理数据。
在本实施例中,构建学生校园大数据的智慧校园数据采集包括:课堂数据采集、学业数据采集、学习设施应用数据采集、教务综合数据采集、校园生活数据采集、课外活动数据采集、校园安全数据采集、健康状态数据采集、综合网络应用数据采集等数据采集的方式。在明确大学生学习行为活动的基础上,重点汇聚、管理、清洗与转存各类数据,构建标准数据库。以不同的建设阶段,在保护隐私的前提下,得到用于构建全面的大学生校园生活数据。
本实施例中,优选针对不同来源的数据,进行不同的预处理,处理后的数据按照一定结构存储到数据库中。如针对学生校园生活数据与学生校园学习数据分别处理,本实施例中,数据库存储结构优选使用PostgreSQL数据库与MongoDB组织的方式来构建存储系统,其中PostgreSQL用于存储空间数据以及关系型数据,而MongoDB则用于存储非关系型数据,即NO-SQL数据,通过全面的数据库中的数据关联,合理的构建大学生日常校园生活数据。
(2)数据清洗与预处理,将数据库中的原始数据进行有效数据的筛选,选取出具有完整信息的学生的数据,并将具有完整信息的学生作为有效研究对象;对有效研究对象的数据进行清洗和预处理,在学年维度上进行聚合处理和行为指标计算;对不同数据源的数据进行整合,把保存在多个数据库或几个文件里的数据进行归一处理,构建成规范化的数据集;将数据集的60%的数据划分为训练集,20%的数据划分为验证集,其余20%的数据划分为训练集。
本实施例主要围绕大学生的校园生活中的学习行为习惯,即考虑应用既有数据及其内容来描述并表达学习行为习惯的几个方面,并对活动内容构建数值化要素表达。在既有数据的基础上,研究大学生学习行为习惯的关联要素组成,并明确不同要素的数据来源及其归一化表达。目前校园大数据中所采集的数据包括学生日常的学习行为,即进入校园中各学习区的学习活动、生活活动、文体娱乐活动、休息活动等,以及课堂评价结果数据、社团活动数据、校园学习管理数据、身体健康数据、心理健康数据、互联网访问数据以及学习行为习惯与校园其它活动所采集数据建立关联关系。
通过对校园活动进行分类,明确校园活动的要素分类,构建校园活动要素与学习行为习惯之间的多元关联关系,应用多元关联模型建模,习惯模型建立如下:
y=a1x1+a2x2+a3x3+…+anxn
其中:y表达为某一个学习行为习惯;而xi则表达为与习惯关联的要素,共有n个要素;ai表示各习惯关联要素的线性相关系数,共有n个系数。
需要指出的是xi是校园活动某一类活动的归一化要素数据,而并非其具体的原始采样数据。而xi本身需要根据其所属具体活动分类,具体构建基于其活动数据归一化后无量纲化参数。
例如,设定xi描述校园活动中生活活动,根据既有校园数字化建设中,与大学生生活活动相关的监测与采集数据,构建其表达归一化模型。其形式化表达如下述公式所示:
Figure BDA0002626662800000121
其中:x1i表达为生活活动不同记录内容数据;而norm(x1i)则为每一个观测采集数据归一化后的值;αi则为生活活动中不同的观测数据的占比影响。
针对不同的校园活动,本实施例不设定其占比影响,而通过使用大量数据学习来获取其参考值。
(3)针对本实施例的习惯外显行为的数据聚类过程,根据数据预处理之后的数据集,确定聚类个数,将学生日常生活数据按照不同类别划分;根据校园活动行为序列的时间、空间等属性关联,建立图结构化数据模型。定义节点表示校园时空序列中的行为活动,定义边表示节点之间的关系;根据不同观测周期的层次图结构化数据,建立时空图卷积自动分类网络,实现习惯外显行为的数据分类。
如图2所示,步骤(3)进一步包括如下步骤:
(3-1)图结构化数据构建,由本实施例的界定可知,学习行为习惯表达为学习行为的序列,或者说集合。而学习行为活动具有一定的时空特征与其它属性特征。行为序列中的行为之间既有时空相关,同时也有空间相关及其它属性相关性。由此可见,大学生的学习行为习惯能够表达复杂的网络结构,而行为能够定义为节点,通过图数据结构表示学习的方法来描述校园中的学习行为习惯。具体如下:
定义节点为校园活动中的某一个行为v1,节点的属性表达为该行为在数字校园活动中所采集的数据。因而节点的特征集合,描述了该节点所对应的采集或监测数据,使用特征向量
Figure BDA0002626662800000131
来表达,简单记录为Li,表达该节点的向量化表达。
而行为的集合,使用节点集来表示,记为V:
V=(v1,v2,v3,…,vn)
节点与节点之间的关系边,即E,表达节点间的关系,在本实施例中,边能够描述不同行为之间的关系,如时空序列关系等。记边为E={(i,j)|vi与vj相连}。
因此,对代表所有行为的节点向量集合Lv可定义为:
Lv={L1,L2,…,Ln}
定义所有边集合LE为:
LE={L(i,j)|(i,j)∈E}
因而,某一个大学生其学习行为习惯可以使用图数据结构进行形式化表达,记为G:
G=(V,E,Lv,LE)
行为是不断发生的,或者实际中,反应行为的节点是不断的监测其表达的内容,不同的时刻,其节点的特征向量是存在一定的区别。因而需要引入时刻变量t来标定不同的变化过程,即:
t=1,2,3…T
其中:T表达时刻数,代表整个网络模型中,节点的状态与变化过程。引入
Figure BDA0002626662800000132
来表达节点(行为)vi在t时刻的状态。
(3-2)针对校园生活行为的自动学习分类模型,在对学习行为习惯及其行为构建基于图的表达结构后,应用图神经网络的方法,对校园活动数据进行自动学习,应用监督分类的方法得到广泛的分类,在此基础上,再对分类得到的相应行为构建序列,即生成学习行为习惯,实现习惯的发现,根据校园生活活动所采集数据的多样性、多维度、多类型等情况,建立对学习行为习惯的外显活动的时空图卷积网络分类方法。
图网络模型的输入数据为校园活动的观测数据,根据每一时刻或每一个周期所采集数据构建一个层次的图网络模型。主要需要进行两个步骤操作,进行时空图卷积网络进行分类计算时,其卷积核可使用函数fout确定:
Figure BDA0002626662800000141
其中:x表示输入的校园活动数据;s表示卷积核计算中校园活动的第一个参数;t表示卷积核计算中校园活动的第二个参数;w函数表示权重函数;K表示相应参数的数量;p函数表达为采样函数,其计算方式为:p(x,s,t)=x+p′(s,t),表示为采样函数在特征采样过程中的更新过程;fin表示在图上相应节点的输入函数。
另一方面,根据行为的内容,设置不同节点权值,即行为的权重函数w用行为节点向量和边表达的具体方式为:
w(vti,vtj)=w′(lti(vtj))
其中:w表达为权重函数,lti表示行为的节点向量;vti和vtj表示相邻节点之间的边,描述同一时刻两个行为的边的权重。
应用中,由于时空图卷积网络在不同节点上共享权重,因此要保持输入数据的规模在不同关节上的一致性。
(4)针对外显行为聚类的习惯自动发现网络模型,根据大学生日常生活数据分类结果得到的同类数据,按照指定数据结构进行提取;根据同类但不同数据之间的属性进行关联分析,对提取的同类数据建立图结构化表示;根据图结构化数据相应的时空序列关系,利用空间化卷积网络分类模型结合邻域聚合特征信息,得到更加细致的聚类分类结果;根据聚类完成的行为时空序列分类结果,建立基于注意力机制的图卷积神经网络结构,输出完整的习惯预测结果。
如图3所示,步骤(4)进一步包括如下步骤:
(4-1)针对图结构化数据中节点状态动态更新的过程,节点的表示向量是通过消息函数M和更新函数U进行K轮消息传播机制的迭代后得到的,消息传播的过程表示如下:
Figure BDA0002626662800000151
Figure BDA0002626662800000152
其中:
Figure BDA0002626662800000153
分别表示k+1轮消息函数和更新函数在各个节点的迭代结果;vi、vj表示相应的节点;eij表示相应节点对应的边。
用三元组RDF表达消息函数的输入,准确的描述节点数据。在图神经网络聚类方法的不断作用下,所有的三元组数据表示的节点向外广播信息,之后沿着边的方向传播到其他节点两层进行聚合。
在更新节点数据之后,利用基于对比损失的方法,建立正负相关的样本,最大化正相关样本相似度,最小化负相关样本相似度,实现图结构数据的聚类,得到实现学生行为习惯的分类。最后将节点向量降维到二维空间中,并进行可视化表达。从而展现不同类别的学生行为习惯数据的聚类,为下一步的行为习惯可发现模型中习惯的准确描述做好铺垫。
(4-2)在对校园活动数据进行了自动分类后,得到更多更细的行为分类,其结果更一般化的描述了学习行为习惯的外显表达。然而,更细致的行为分类,需要进行相应的时空序列关系分析,得到基于时空序列过程的学习行为习惯的表达。因此这一阶段所使用的输入数据为上一层次的分类结果,即结果为图网络表达。
基于空间化方法将图卷积表示为从邻域聚合特征信息,当图卷积网络的算法在节点层次运行时,图池化模块可以与图卷积层交错,将图粗化为高级子结构。这种架构设计可用于提取图的各级表示和执行图分类任务。对于节点使用分类公式hv,表达为:
hv=f(lv,lco[v],hne[v],lne[v])
其中:lv、lco[v]表示v节点和与v节点相关联的节点;hne[v]表示相邻节点的图结构;lne[v]表示相邻边关联关系。
而分类输出函数fout则表达为:
fout=g(hv,lv)
其中:hv、lv分别代表节点和边的更新结果。
在一般表达下,采用领域均值聚类方法,每个节点由其邻域的聚合,实现对每一个节点的嵌入学习,最终得到相应的聚类分类结果。
(4-3)将学生校园的不同维度数据合理的整合起来,用图数据关联起来,更加全面的进行学生数据分析。用习惯特性形式化表达学生的行为分析,更加合理的分析大学生日常行为情况。
对于习惯的外显行为表达,直接利用节点代表某个行为。节点是由具体行为泛化得来,代表学生图结构的一个数据。在习惯发现可学习表示方法中,结合行为数据节点间的关系,利用图神经网络不断地更新迭代每个节点数据,构建每个节点所有相邻关系的集合,最终表达为图结构的数据模型。对这一系列聚类完成的图结构化数据,进行习惯化的描述。最终得到习惯的分类表达,完整系统的展现出学生行为习惯。
在图卷积神经网络中,作为端到端的表示学习方法,摒弃了传统数据工程的特征提取的弊端,直接实现自动特征提取。习惯行为表示为学习任务的映射:f:X→Rd,X表示输入的学生数据,Rd表示低维向量空间,即将输入的学生行为数据映射到一个稠密的低维向量空间中。
(5)建立习惯数据外显行为的描述与教育精准服务,根据学生日常习惯外显行为的集合化表达与形式化描述对不同类别的习惯进行定义;根据图神经网络结构的数据分析结果,对比习惯的表达与描述方法中习惯的表达与描述,构建数据分析结果与习惯的表达描述之间的对应关系,最终得到大学生日常生活习惯的准确描述;根据教育管理服务需求,运用机器学习习惯描述模型解决教育中的问题,更好的促进学生成长成才。
如图4所示,步骤(5)中进一步包括如下步骤:
(5-1)针对习惯外显行为所发生时间、空间及其重复变化过程所影响校园生活活动的复杂性,具体分析不同行为活动与校园生活要素的相关性,构建习惯与校园生活活动结果要素间的关联关系,分析习惯演变过程中的习惯行为与相关要素中的数理关系,通过周期性、阶段性与后验性结果来推算其关联影响的数理关系,得到习惯演化过程的控制参数。建立学生日常习惯外显行为的集合化表达与形式化描述方法,针对不同层面数据对学生校园活动中不同类别的习惯进行定义,如学习习惯、作息习惯、阅读习惯等。
(5-2)针对本实施例中的神经网络结构数据输出结果,对比不同层面习惯的要素化表达,通过细分行为活动发生的时间、空间、周期、重复性等特征与指标,构建数据输出结果与习惯的表达描述之间的对应关系,最终得到大学生日常生活习惯的准确描述。
(5-3)运用机器学习方法获取大学生日常生活习惯,为教育管理提供精准服务。针对大学生行为习惯养成,即由稳定的时间空间关联所触发的重复性行为,根据时间地理学从时间和空间两个维度对个体以及群体的习惯进行量化分析。获得行为习惯具体描述之后,通过干预的方法对学生学习生活进行合理的指导,进而为学习者提供各种学术类支持、管理类支持与情感类支持的服务。
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (10)

1.一种发现大学生日常生活习惯的神经网络结构,其特征在于,包括依次相连的数据获取模块、数据预处理模块、校园生活数据分类模块、习惯数据发现模块以及习惯数据描述模块;
所述数据获取模块,用于获取大学生日常生活数据,并存入数据库;
所述数据预处理模块,用于对大学生日常生活数据进行过滤、清洗和离散化数据预处理;
所述校园生活数据分类模块,用于构建基于特征的行为分类,获取日常生活数据分类结果;
所述习惯数据发现模块,用于对日常生活数据分类结果得到的同类数据进行关联分析,并根据邻域聚合特征信息得到习惯描述的数据输出结果;
所述习惯数据描述模块,用于根据习惯描述的数据输出结果,利用习惯基于外显行为的集合化表达与形式化描述,得到大学生日常生活习惯的具体准确描述。
2.根据权利要求1所述的发现大学生日常生活习惯的神经网络结构,其特征在于,所述数据预处理模块包括依次相连的数据选取模块、数据清洗模块及数据划分模块;
所述数据选取模块,用于选取智慧校园采集的数据库中与学生日常生活习惯相关联的数据;
所述数据清洗模块,用于对数据库中的数据进行过滤、清洗和离散化,以消除不完整、存在缺失或重复的数据,并进行数据集成;
所述数据划分模块,用于将集成的数据划分成训练集、验证集和测试集。
3.根据权利要求1所述的发现大学生日常生活习惯的神经网络结构,其特征在于,所述校园生活数据分类模块包括依次连接的数据图结构化模块、图节点状态更新模块以及图结构数据分类模块;
所述数据图结构化模块,用于将学生生活习惯数据描述成属性图,并建立节点表示校园时空序列中的行为活动,建立边表示节点之间的关系;
所述图节点状态更新模块,用于更新节点数据,并通过消息函数和更新函数进行消息传播机制迭代的方法计算节点表示向量,形成图数据结构形式化表达;
所述图结构数据分类模块,用于获取数据的广泛分类结果,并利用监督分类的方法,建立对学生行为习惯外显活动的时空图卷积网络分类,实现图结构数据的分类。
4.根据权利要求1所述的发现大学生日常生活习惯的神经网络结构,其特征在于,所述习惯数据发现模块包括依次连接的领域特征聚合模块及习惯发现模块;
所述邻域特征聚合模块,用于对分类的学生日常行为建立邻域特征关系的聚合过程,并利用空间化图卷积网络分类模型,得到行为习惯分类结果;
所述习惯发现模块,用于对学生数据进行分析和形式化表达习惯特性,获得完整、系统的习惯数据。
5.根据权利要求1所述的发现大学生日常生活习惯的神经网络结构,其特征在于,所述习惯数据描述模块包括依次连接的习惯定义模块和数据描述模块
所述习惯定义模块,用于构建习惯进行外显行为要素化和形式化表达结构;
所述数据描述模块,用于对大学生日常生活习惯的网络结构模型输出数据进行描述,将输出数据结合习惯的表达与定义,获得习惯的准确描述。
6.一种发现大学生日常生活习惯的神经网络方法,其特征在于,包括以下步骤:
S1获取大学生日常生活数据并对其进行分类整理,并存入数据库,得到大学生日常生活原始数据集;
S2对所述原始数据集进行数据预处理工作,并分为训练集、验证集和测试集,得到预处理后的数据集;
S3构建时空图卷积自动分类网络,并对所述预处理后的数据集进行分类,获得外显行为数据分类结果;
S4建立空间化图卷积网络分类模型,并将所述外显行为数据分类结果输入到所述空间化图卷积网络分类模型对所述外显行为数据分类进行优化,得到优化后的外显行为数据分类,根据基于注意力机制的图卷积神经网络结构对所述优化后的外显行为数据进行分析,得到习惯描述的数据输出结果;
S5根据所述习惯描述的数据输出结果,利用习惯基于外显行为的集合化表达与形式化描述,得到大学生日常生活习惯的描述结果。
7.根据权利要求6所述的发现大学生日常生活习惯的神经网络方法,其特征在于,所述步骤S2包括:
S21将数据库中的原始数据集进行有效数据的筛选,将具有完整信息的学生作为有效研究对象;
S22对包括有效研究对象的数据进行清洗和预处理,在学年维度上进行聚合处理和行为指标计算,构建成规范化的数据集;
S23将数据集的60%的数据划分为训练集,20%的数据划分为验证集,20%的数据划分为训练集。
8.根据权利要求6所述的发现大学生日常生活习惯的神经网络方法,其特征在于,所述步骤S3包括:
S31根据数据预处理之后的数据集,获得聚类个数,根据聚类个数将学生日常生活数据按照不同类别划分;
S32根据校园活动行为序列的时间、空间属性关联,建立图结构化数据模型,建立节点表示校园时空序列中的行为活动,建立边表示节点之间的关系;
S33根据不同观测周期的层次图结构化数据,建立时空图卷积自动分类网络,实现习惯外显行为的数据分类。
9.根据权利要求6所述的发现大学生日常生活习惯的神经网络方法,其特征在于,所述步骤S4包括:
S41根据大学生日常生活数据分类结果,得到并提取同类数据;
S42对同类数据之间的属性进行关联分析,并建立图结构化表示;
S43根据图结构化数据相应的时空序列关系,利用空间化卷积网络分类模型并结合邻域聚合特征信息,得到聚类分类结果;
S44根据聚类完成的行为时空序列分类结果,建立基于注意力机制的图卷积神经网络结构,将所述分类结果作为图卷积神经网络结构的输入参数,输出习惯预测结果。
10.根据权利要求6所述的发现大学生日常生活习惯的神经网络方法,其特征在于,所述步骤S5包括:
S51基于学生日常习惯外显行为的集合化表达与形式化描述对不同类别的习惯进行定义,获得习惯定义和描述方法;
S52根据图卷积神经网络结构的习惯预测结果,对比不同层面习惯的要素化表达,构建所述习惯预测结果与所述习惯定义和描述方法的对应关系,得到大学生日常生活习惯的描述结果。
CN202010798992.2A 2020-08-11 2020-08-11 一种发现大学生日常生活习惯的神经网络结构与方法 Active CN111950708B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010798992.2A CN111950708B (zh) 2020-08-11 2020-08-11 一种发现大学生日常生活习惯的神经网络结构与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010798992.2A CN111950708B (zh) 2020-08-11 2020-08-11 一种发现大学生日常生活习惯的神经网络结构与方法

Publications (2)

Publication Number Publication Date
CN111950708A true CN111950708A (zh) 2020-11-17
CN111950708B CN111950708B (zh) 2023-10-03

Family

ID=73332016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010798992.2A Active CN111950708B (zh) 2020-08-11 2020-08-11 一种发现大学生日常生活习惯的神经网络结构与方法

Country Status (1)

Country Link
CN (1) CN111950708B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579565A (zh) * 2020-11-30 2021-03-30 贵州力创科技发展有限公司 一种数据分析引擎的数据模型管理方法及系统
CN113688170A (zh) * 2021-08-20 2021-11-23 中国联合网络通信集团有限公司 一种校园管理方法、装置、设备及存储介质
CN113705530A (zh) * 2021-09-09 2021-11-26 湖南强智科技发展有限公司 一种基于云计算的智慧校园大数据采集管理系统
CN114638234A (zh) * 2022-03-31 2022-06-17 房宏伟 应用于线上业务办理的大数据挖掘方法及系统
CN116192510A (zh) * 2023-02-16 2023-05-30 湖南强智科技发展有限公司 一种基于大数据的校园网络公共安全管理方法及系统
CN116956130A (zh) * 2023-07-25 2023-10-27 北京安联通科技有限公司 一种基于关联特征梳理模型的智能化数据处理方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015158198A1 (zh) * 2014-04-17 2015-10-22 北京泰乐德信息技术有限公司 一种基于神经网络自学习的故障识别方法及系统
CN108629362A (zh) * 2018-05-30 2018-10-09 华南师范大学 一种面向移动环境的学习行为习惯发现量化系统及方法
CN108664614A (zh) * 2017-05-12 2018-10-16 华中师范大学 基于教育大数据的学习者模型动态构建方法
CN109325888A (zh) * 2018-09-04 2019-02-12 四川文轩教育科技有限公司 一种基于人工神经网络的学生行为预测方法
WO2019028592A1 (zh) * 2017-08-07 2019-02-14 中国科学院深圳先进技术研究院 一种教学辅助方法及采用该方法的教学辅助系统
CN109636062A (zh) * 2018-12-25 2019-04-16 湖北工业大学 一种基于大数据分析的学生行为分析方法及系统
CN110084296A (zh) * 2019-04-22 2019-08-02 中山大学 一种基于特定语义的图表示学习框架及其多标签分类方法
WO2020034750A1 (zh) * 2018-08-14 2020-02-20 阿里巴巴集团控股有限公司 一种分类模型生成方法及装置、一种数据识别方法及装置
CN110993102A (zh) * 2019-11-18 2020-04-10 温州医科大学 一种基于校园大数据的学生行为与心理检测结果的精准分析方法及系统
CN111160277A (zh) * 2019-12-31 2020-05-15 深圳中兴网信科技有限公司 行为识别分析方法和系统、计算机可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015158198A1 (zh) * 2014-04-17 2015-10-22 北京泰乐德信息技术有限公司 一种基于神经网络自学习的故障识别方法及系统
CN108664614A (zh) * 2017-05-12 2018-10-16 华中师范大学 基于教育大数据的学习者模型动态构建方法
WO2019028592A1 (zh) * 2017-08-07 2019-02-14 中国科学院深圳先进技术研究院 一种教学辅助方法及采用该方法的教学辅助系统
CN108629362A (zh) * 2018-05-30 2018-10-09 华南师范大学 一种面向移动环境的学习行为习惯发现量化系统及方法
WO2020034750A1 (zh) * 2018-08-14 2020-02-20 阿里巴巴集团控股有限公司 一种分类模型生成方法及装置、一种数据识别方法及装置
CN109325888A (zh) * 2018-09-04 2019-02-12 四川文轩教育科技有限公司 一种基于人工神经网络的学生行为预测方法
CN109636062A (zh) * 2018-12-25 2019-04-16 湖北工业大学 一种基于大数据分析的学生行为分析方法及系统
CN110084296A (zh) * 2019-04-22 2019-08-02 中山大学 一种基于特定语义的图表示学习框架及其多标签分类方法
CN110993102A (zh) * 2019-11-18 2020-04-10 温州医科大学 一种基于校园大数据的学生行为与心理检测结果的精准分析方法及系统
CN111160277A (zh) * 2019-12-31 2020-05-15 深圳中兴网信科技有限公司 行为识别分析方法和系统、计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
任小华;种兰祥;杨建锋;: "基于FT_BP神经网络的学业预警模型", 计算机应用研究, no. 1 *
殷宝媛;武法提;: "智能学习系统中学习习惯建模的方法研究", 电化教育研究, no. 04 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579565A (zh) * 2020-11-30 2021-03-30 贵州力创科技发展有限公司 一种数据分析引擎的数据模型管理方法及系统
CN113688170A (zh) * 2021-08-20 2021-11-23 中国联合网络通信集团有限公司 一种校园管理方法、装置、设备及存储介质
CN113705530A (zh) * 2021-09-09 2021-11-26 湖南强智科技发展有限公司 一种基于云计算的智慧校园大数据采集管理系统
CN114638234A (zh) * 2022-03-31 2022-06-17 房宏伟 应用于线上业务办理的大数据挖掘方法及系统
CN114638234B (zh) * 2022-03-31 2022-11-15 逑美科技(上海)有限公司 应用于线上业务办理的大数据挖掘方法及系统
CN116192510A (zh) * 2023-02-16 2023-05-30 湖南强智科技发展有限公司 一种基于大数据的校园网络公共安全管理方法及系统
CN116192510B (zh) * 2023-02-16 2023-09-26 湖南强智科技发展有限公司 一种基于大数据的校园网络公共安全管理方法及系统
CN116956130A (zh) * 2023-07-25 2023-10-27 北京安联通科技有限公司 一种基于关联特征梳理模型的智能化数据处理方法及系统

Also Published As

Publication number Publication date
CN111950708B (zh) 2023-10-03

Similar Documents

Publication Publication Date Title
CN111950708B (zh) 一种发现大学生日常生活习惯的神经网络结构与方法
Yu Academic Performance Prediction Method of Online Education using Random Forest Algorithm and Artificial Intelligence Methods.
Fischer et al. Recent developments in spatial analysis: spatial statistics, behavioural modelling, and computational intelligence
Matsebula et al. A big data architecture for learning analytics in higher education
Long et al. Comparing spatial patterns
Asanbe et al. Teachers’ performance evaluation in higher educational institution using data mining technique
CN111709575A (zh) 基于c-lstm的学业成绩预测方法
Mehdipoor et al. Developing a workflow to identify inconsistencies in volunteered geographic information: a phenological case study
Shingari et al. A review of applications of data mining techniques for prediction of students’ performance in higher education
CN112256755A (zh) 一种基于深度学习的学生异常行为分析方法
Nelyub et al. Machine learning to identify key success indicators
CN111275239A (zh) 一种基于多模态的网络化教学数据分析方法及系统
Parvinnezhad et al. A modified spatial entropy for urban sprawl assessment
Wu et al. Research themes of geographical information science during 1991–2020: a retrospective bibliometric analysis
Babu et al. Air quality prediction based on supervised machine learning methods
CN117314006A (zh) 一种智能化数据分析方法及系统
Al-Rawahnaa et al. Data mining for Education Sector, a proposed concept
Abazeed et al. A Classification and Prediction Model for Student's Performance in University Level.
Luo Identifying Factors Influencing China Junior High Students' Cognitive Ability through Educational Data Mining: Utilizing LASSO, Random Forest, and XGBoost
Scoular et al. A generalized scoring process to measure collaborative problem solving in online environments
Sandhya et al. Investigating Student Learning Process and Predicting Student Performance Using Machine Learning Approaches.
Becheru et al. Design of a conceptual knowledge extraction framework for a social learning environment based on Social Network Analysis methods
Boughouas et al. Towards a Big Educational Data Analytics
Knüsel Epistemological issues in data-driven modeling in climate research
Bin Cognitive Web Service-Based Learning Analytics in Education Systems Using Big Data Analytics.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant