CN114662748A - 一种基于图结构学习的多行为融合图神经网络学生成绩预测方法 - Google Patents

一种基于图结构学习的多行为融合图神经网络学生成绩预测方法 Download PDF

Info

Publication number
CN114662748A
CN114662748A CN202210250344.2A CN202210250344A CN114662748A CN 114662748 A CN114662748 A CN 114662748A CN 202210250344 A CN202210250344 A CN 202210250344A CN 114662748 A CN114662748 A CN 114662748A
Authority
CN
China
Prior art keywords
data
node
student
graph
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210250344.2A
Other languages
English (en)
Other versions
CN114662748B (zh
Inventor
张勇
周菲菲
李小勇
张鹏宇
李孟燃
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202210250344.2A priority Critical patent/CN114662748B/zh
Publication of CN114662748A publication Critical patent/CN114662748A/zh
Application granted granted Critical
Publication of CN114662748B publication Critical patent/CN114662748B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种基于图结构学习的多行为融合神经网络分类预测方法,涉及模式识别与机器学习,尤其是面向基于多源异构校园大数据的学生成绩预测任务。该方法利用多源异构的校园大数据集进行学生行为特征提取,引入K邻近算法构建多行为融合特征图,在此基础上,提出了优化的图结构学习模块学习。相比于单行为节点特征在特征图上进行传播,多行为特征图能够为学习节点嵌入提供更加全面的特征信息。同时,优化的图结构学习模块能够为节点特征图的学习提供共享的信息表示。相比于现有的分类预测模型,本发明方法显著提升了分类预测准确率。

Description

一种基于图结构学习的多行为融合图神经网络学生成绩预测 方法
技术领域
本发明涉及模式识别和机器学习等领域,尤其是面向基于多源异构校园大数据的学生成绩预测任务。
背景技术
教育大数据挖掘是数据挖掘领域的研究热点之一,教育大数据挖掘应用主要集中于学生学习风格识别以及学生成绩预测方面。高校学生在校园内生活学习,大部分行为数据记录在学生的信息管理系统,这些行为数据包含的学生一卡通消费信息、门禁信息、图书馆借阅数据、利用校园网浏览网页的上网信息以及学籍系统中学业相关信息,共同构成了多源异构的校园大数据集。相比于单一行为数据,多源异构行为数据具有关联关系复杂、时空分布不连续等问题,如何更好的利用多源异构校园大数据集进行学生行规律挖掘并预测学生成绩有赖于提出新的方法。
在学生成绩预测任务中,提取学生行为特征是整个研究的基础,利用单一行为对学生成绩进行分类预测时并不能准确描述学生的行为特征。真实世界中实体关系复杂,仅考虑学生的单一行为关系对学生成绩进行预测,会忽略其他行为给学生成绩带来的影响。节点特征表示通常的方法是使用K邻近算法生成节点的特征矩阵,但是使用单一行为上网节点特征矩阵很难完全捕捉到节点的特征信息。
发明内容
为解决传统方法预测学生成绩时准确率较低的问题,本发明公开了一种基于图结构学习的多行为融合图神经网络学生成绩预测方法。该方法在基于多源异构校园大数据集的基础上,将学生多行为特征视图融合成新的行为特征视图,并利用特征空间学习模块与拓扑空间优化的图结构学习模块学习节点嵌入,最终完成学生成绩预测任务。
本发明提供一种基于图结构学习的多行为融合图神经网络学生成绩预测方法,包括以下步骤:
步骤1)构建多源异构的校园大数据集,
本发明采集的多源异构校园大数据如下:
学生基础信息数据,包括学生的人口统计信息和学籍信息,采用
Figure BDA0003534737320000012
表示第i个学生的基础信息,其中DI表示基础信息的数据属性个数;
一卡通数据,高校学生一卡通数据包括学生的消费数据,采用
Figure BDA0003534737320000011
表示第i个学生的一卡通数据,其中DC表示一卡通数据的属性个数,
Figure BDA0003534737320000021
表示第i个学生的消费记录数;
图书馆门禁数据,采用
Figure BDA0003534737320000022
表示第i个学生的图书馆门禁数据,其中DL表示图书馆门禁数据的属性个数,
Figure BDA0003534737320000023
表示第i个学生图书馆门禁的记录数;
学生上网数据,上网数据分为两部分:网关登陆数据和上网日志数据;采用
Figure BDA0003534737320000024
Figure BDA0003534737320000025
表示第i个学生的上网数据,其中DW表示上网数据的属性个数,
Figure BDA0003534737320000026
表示第i个学生的上网记录数;
基于上述描述,包含N个学生样本的多源异构校园大数据集D表示为 {(I1,C1,L1,W1),…,(Ii,Ci,Li,Wi),…,(IN,CN,LN,WN)};
步骤2)对多源异构数据进行预处理与特征提取;
步骤3)构建学生成绩预测模型进行成绩预测,具体过程如下:
步骤3.1)将学生作为节点利用提取的行为特征构建学生多行为融合特征矩阵X,1)将学生行为特征按其数据来源分为四类,每类行为特征单独构成一个单行为特征矩阵,用XI,XC,XL,XW表示,其中
Figure BDA0003534737320000027
表示学生基本信息特征矩阵,dI表示学生基本信息行为特征个数,
Figure BDA0003534737320000028
表示学生一卡通行为特征矩阵,dC表示一卡通行为特征个数,
Figure BDA0003534737320000029
表示学生图书馆行为特征矩阵,dL表示图书馆行为特征个数,
Figure BDA00035347373200000210
表示学生上网行为特征矩阵,dW表示上网行为特征个数; 2)将单行为特征矩阵XI,XC,XL,XW按行合并为多行为融合节点特征矩阵,用
Figure BDA00035347373200000211
Figure BDA00035347373200000212
表示,其中n是学生的个数,d是节点特征的维数,且d=dI+dC+dL+dW,公式表达如下:
X=XI∥XC∥XL∥XW (4);
步骤3.2)利用单行为节点特征矩阵XI,XC,XL,XW的节点特征相似度分别构建单行为节点特征KNN图
Figure BDA00035347373200000213
将所有单行为节点特征KNN图合并融合为一个多行为融合节点特征KNN图Af,其中
Figure BDA00035347373200000214
是具有n个节点的KNN图邻接矩阵;
步骤3.3)基于多行为融合节点特征矩阵X,利用K-means聚类算法将学生行为特征进行聚类分析,将学生作为节点,将节点的聚类结果是否一致作为边构建节点关系图,用
Figure BDA00035347373200000215
表示,其中At是具有n个节点的邻接矩阵,At={Aij},公式如下:
Figure BDA0003534737320000031
其中,Li和Lj分别是节点i和节点j的聚类结果;
步骤3.4)将得到的多行为融合节点特征KNN图Af作为特征空间学习模块的输入,学习到节点嵌入ZF
步骤3.5)将得到的节点关系图At输入优化的图结构学习模块,学习到节点嵌入ZT
步骤3.6)将节点嵌入ZF和ZT求平均值,得到最终的节点表示Z;
步骤3.7)将节点嵌入Z通过线性变换和softmax函数进行半监督分类任务,输出每个学生的成绩预测值。
有益效果
本发明所述的一种基于图结构学习的多行为融合图神经网络学生成绩预测方法,与现有的学生成绩预测方法相比,具有如下有益效果:
1)在预测学生成绩时考虑了多行为特征之间复杂的关联关系,引入了多行为融合的KNN特征视图构建节点特征空间,与现有方法相比可以有效提高学生行为特征的利用效率;
2)所述方法利用Kmeans聚类分析节点特征,将聚类结果作为节点标签细化拓扑图结构,实现图结构学习模块的优化,使其更好的学习节点嵌入表示;
3)为了更好的融合特征空间与拓扑空间的共享信息,特征空间学习模块与优化的拓扑空间图结构学习模块具有共享的参数矩阵,与现有方法相比能够有效提高共享信息的学习效果。
附图说明
图1、本发明方法流程图
具体实施方式
本发明实验使用的数据集是从北京工业大学学生信息系统中采集的真实数据,主要包括学生学籍及课程数据、一卡通数据以及学生上网数据。
首先对数据进行预处理。具体操作包括:
1)为了保护学生隐私,学生基本数据中的学号将进行编码处理,然后将重复数据删除;
2)对于学生所在院系、专业等基本信息以及行为数据集中的地点属性,本文将其全部转化为数字代码表示;
3)对于学生成绩预测,选取学生学期平均绩点(Grade Point Average,GPA)作为标签,按照绩点数值平均分为差、中、好三类,分别用0,1,2表示。GPA的计算公式如下:
Figure BDA0003534737320000041
其中C表示课程学分,A表示课程成绩。由于成绩预测本质上是分类任务,故选取三个评价指标来评价成绩预测效果:查准率(Precision)用P表示,查全率(Recall) 用R表示,F1系数(F1-score)用F1表示。其计算公式为:
Figure BDA0003534737320000042
Figure BDA0003534737320000043
Figure BDA0003534737320000044
其中,真正例(TP):将正类预测为正类数,假正例(FP):将负类预测为正类数,假反例(FN):将正类预测为负类数;
4)针对学生的行为数据,利用重合或合并操作将重复数据去除。首先统一学生行为时间,起始时间为0:00,不同类型行为按不同的时间间隔K划分,并将时段从1 开始标号给每个时段赋索引值,以k=15为例,将一天24小时划分为96个时间段,每个时间段为15分钟,则时间8:10内包含32个15分钟,每个时段从1开始赋值索引,则8:10应转换为33。其次对就餐数据、购物数据、上网数据以及图书馆门禁数据中具有相同时间段及相同地点的数据进行就餐金额、购物消费金额、上网流量以及图书馆访问次数的合并。K值具体取值如下表1所示:
Figure BDA0003534737320000045
表1:不同类型行为下K的取值
对预处理后的数据进行学生行为特征提取与选择。具体操作包括:
1)对具有数的性质的定量属性,如消费金额,使用平均值、范围、众数表达其分布的集中趋势;采用最小值、最大值以及中位数表达分布的分散情况;
2)对具有定性属性的数据利用香农熵来表达学生行为的规律性;
3)为了提高特征质量,通过计算方差和皮尔逊相关系数的方法选择特征。
本发明最终提取了240个学生行为特征。
利用最终提取的学生行为特征构建多行为融合节点特征矩阵并作为学生成绩预测模型的输入。模型内具体过程为:
1)利用节点特征矩阵构建多行为融合节点特征KNN图,具体地,在KNN算法中本发明为每个节点选择前2个相似节点,即K=2。
2)利用Kmeans聚类算法构建节点关系图,具体地,聚类个数为8。
3)特征空间学习模块内与拓扑空间优化的图结构学习模块是具有两层的图卷积神经网络,本发明将最后一层的输出嵌入表示ZT和ZF的平均值作为最终的节点嵌入进行下游的学生成绩预测任务。
4)模型采用Adam作为优化器,采用交叉熵作为损失函数,采用Dropout机制避免过拟合问题,将最终节点嵌入通过线性层和softmax函数得到学生的成绩预测结果,
其中Dropout=0.5。
为了验证所提方法聚类效果的优越性,将本发明DMVGCN与逻辑回归,决策树,贝叶斯、随机森林、支持向量机、AdaBoost、K邻近、GCN几种方法进行比较。
表2显示了在相同数据集上,DMVGCN与其他成绩预测方法的实验效果。显然,在大多数情况下,我们提出的方法性能明显优于许多现有的最先进的方法。
表3列出了本发明方法的变体,DMVGCN-unsadj为去除图结构学习模块,只保留特征空间学习模块,DMVGCN-XX是基于图结构学习的单一行为图神经网络,-jc表示就餐行为特征网络,-url表示上网行为特征网络,-lib表示图书馆相关行为特征网络,- shopping表示购物行为特征网络。
表4为其他成绩预测方法与本发明变体的预测效果对比。无论与其他方法相比还是与我们所提出方法的变体相比,我们提出的方法都比其他比较方法实现了更高的学生成绩预测能力,这预示着未来在实际应用中的良好前景。
Figure BDA0003534737320000051
表2:不同方法效果对比
Figure BDA0003534737320000061
表3:本发明方法与其变体效果对比
Figure BDA0003534737320000062
表4:所有成绩预测方法效果对比。

Claims (8)

1.一种基于图结构学习的多行为融合图神经网络学生成绩预测方法,其特征在于包括以下步骤:
步骤1)构建多源异构的校园大数据集,
本发明采集的多源异构校园大数据如下:
学生基础信息数据,包括学生的人口统计信息和学籍信息,采用
Figure FDA0003534737310000011
表示第i个学生的基础信息,其中DI表示基础信息的数据属性个数;
一卡通数据,高校学生一卡通数据包括学生的消费数据,采用
Figure FDA0003534737310000012
表示第i个学生的一卡通数据,其中DC表示一卡通数据的属性个数,
Figure FDA0003534737310000013
表示第i个学生的消费记录数;
图书馆门禁数据,采用
Figure FDA0003534737310000014
表示第i个学生的图书馆门禁数据,其中DL表示图书馆门禁数据的属性个数,
Figure FDA0003534737310000015
表示第i个学生图书馆门禁的记录数;
学生上网数据,上网数据分为两部分:网关登陆数据和上网日志数据;采用
Figure FDA0003534737310000016
表示第i个学生的上网数据,其中DW表示上网数据的属性个数,
Figure FDA0003534737310000017
表示第i个学生的上网记录数;
基于上述描述,包含N个学生样本的多源异构校园大数据集D表示为{(I1,C1,L1,W1),…,(Ii,Ci,Li,Wi),…,(IN,CN,LN,WN)};
步骤2)对多源异构数据进行预处理与特征提取;
步骤3)构建学生成绩预测模型进行成绩预测,具体过程如下:
步骤3.1)将学生作为节点利用提取的行为特征构建学生多行为融合特征矩阵X,
1)将学生行为特征按其数据来源分为四类,每类行为特征单独构成一个单行为特征矩阵,用XI,XC,XL,XW表示,其中
Figure FDA0003534737310000018
表示学生基本信息特征矩阵,dI表示学生基本信息行为特征个数,
Figure FDA0003534737310000019
表示学生一卡通行为特征矩阵,dC表示一卡通行为特征个数,
Figure FDA00035347373100000110
表示学生图书馆行为特征矩阵,dL表示图书馆行为特征个数,
Figure FDA00035347373100000111
表示学生上网行为特征矩阵,dW表示上网行为特征个数;
2)将单行为特征矩阵XI,XC,XL,XW按行合并为多行为融合节点特征矩阵,用
Figure FDA00035347373100000112
表示,其中n是学生的个数,d是节点特征的维数,且d=dI+dC+dL+dW,公式表达如下:
X=XI||XC||XL||XW (4);
步骤3.2)利用单行为节点特征矩阵XI,XC,XL,XW的节点特征相似度分别构建单行为节点特征KNN图
Figure FDA0003534737310000021
将所有单行为节点特征KNN图合并融合为一个多行为融合节点特征KNN图Af,其中
Figure FDA0003534737310000022
是具有n个节点的KNN图邻接矩阵;
步骤3.3)基于多行为融合节点特征矩阵X,利用K-means聚类算法将学生行为特征进行聚类分析,将学生作为节点,将节点的聚类结果是否一致作为边构建节点关系图,用
Figure FDA0003534737310000023
表示,其中At是具有n个节点的邻接矩阵,At={Aij},公式如下:
Figure FDA0003534737310000024
其中,Li和Lj分别是节点i和节点j的聚类结果;
步骤3.4)将得到的多行为融合节点特征KNN图Af作为特征空间学习模块的输入,学习到节点嵌入ZF
步骤3.5)将得到的节点关系图At输入优化的图结构学习模块,学习到节点嵌入ZT
步骤3.6)将节点嵌入ZF和ZT求平均值,得到最终的节点表示Z;
步骤3.7)将节点嵌入Z通过线性变换和softmax函数进行半监督分类任务,输出每个学生的成绩预测值。
2.根据权利要求1所述的一种基于图结构学习的多行为融合图神经网络学生成绩预测方法,其特征在于:
学生基础信息数据包括性别、政治面貌、民族、是否城镇户口、所在年级、所在院系、专业、课程数量、重修课程数量、学生成绩、毕业中学;
学生的消费数据包括在校园餐厅、超市、洗浴中心的消费数据;
图书馆门禁数据包括学生进入图书馆的日期及时间;
网关登陆数据包括学生的IP地址、登录时间、下线时间、登陆时长、使用的总流量、国内及国际上下行流量;上网日志数据包括学生访问的网址、访问网址的时间以及上网本机的IP地址。
3.根据权利要求2所述的一种基于图结构学习的多行为融合图神经网络学生成绩预测方法,其特征在于:
预处理具体如下:
(1)对于学生的基础信息数据,将所有属性都相同的数据进行去重处理,只保留第一条数据,并将名词属性利用ONE-HOT编码方法进行编码处理,对于学生平均成绩,将其分段并赋予等级;
(2)对于一卡通数据、图书馆门禁数据以及上网数据的时间属性,将一天24小时按k值划分为多个时段,每个时间用该时间包含的时段个数表示,不能整除的凑整表示;
(3)对于一卡通数据、图书馆门禁数据以及上网数据的去重处理,基于时间转化后的数据进行操作:先将不同类别的行为时间属性取不同k值进行转化,然后将相同时间、日期、和地点的记录合并为一条,并将相应的消费金额和上网流量求和,只保留一条上网数据以及图书馆门禁记录;
(4)将所有处理后的数据属性进行标准化处理,具体公式如下:
Figure FDA0003534737310000031
其中,x(i)是第i个样本的属性数据,
Figure FDA0003534737310000032
是第i个样本的标准化属性数据,μx是属性数据值的样本均值,σx是属性数据值的标准方差。
4.根据权利要求3所述的一种基于图结构学习的多行为融合图神经网络学生成绩预测方法,其特征在于:
特征提取方法为:多源异构校园大数据集的数据属性分为定性和定量两类;定量属性使用计算平均值、范围、众数、最小值、最大值以及中位数的方法提取相关行为特征;
定性属性表示行为的某个非数值属性,计算定性属性数据的香农熵提取相关行为特征。
5.根据权利要求1所述的一种基于图结构学习的多行为融合图神经网络学生成绩预测方法,其特征在于:构建学生多行为融合节点特征KNN图Af的具体步骤为:
(1)将学生作为节点,节点个数等于学生个数,在n个节点间计算相似度矩阵
Figure FDA0003534737310000033
S={Sij},其中,第i个节点与第j个节点的相似度Sij相似度的计算公式如下:
Figure FDA0003534737310000041
其中,Xi和Xj分别是节点i和节点j的特征向量;
(2)为每个节点选择前k个相似节点,其中,第i个节点的邻接节点为按照相似度Sik大小排序后的前k个相似度所对的节点,最终得到的节点特征图
Figure FDA0003534737310000042
是具有n个节点的KNN图邻接矩阵;根据不同类别行为特征分别单独构建单行为节点特征KNN图
Figure FDA0003534737310000043
后,将所有单行为节点特征KNN图合并融合为多行为节点特征KNN图,公式如下:
Figure FDA0003534737310000044
其中,||表示将单行为节点特征KNN图按行合并,即行不变,列增多。
6.根据权利要求1所述的一种基于图结构学习的多行为融合图神经网络学生成绩预测方法,其特征在于:利用特征空间学习模块学习得到节点嵌入ZF得具体步骤为:
将多行为融合节点特征KNN图Af输入特征空间学习模块获得节点嵌入ZF,其中,第l层输出
Figure FDA0003534737310000045
用如下公式表示:
Figure FDA0003534737310000046
其中,
Figure FDA0003534737310000047
是图卷积神经网络中第l层的权重矩阵,ReLU是ReLU激活函数,并且初始化为
Figure FDA0003534737310000048
其中X是多行为融合节点特征矩阵,
Figure FDA0003534737310000049
是具有n个节点的单位矩阵,
Figure FDA00035347373100000410
Figure FDA00035347373100000411
的对角矩阵,将最后一层输出嵌入表示为ZF
7.根据权利要求1所述的一种基于图结构学习的多行为融合图神经网络学生成绩预测方法,其特征在于:
节点嵌入ZT的计算步骤如下:
将节点特征图At输入拓扑空间优化的图结构学习模块获得节点嵌入ZT,由于特征空间学习模块与拓扑空间优化的图结构学习模块具有共享参数,则第l层输出
Figure FDA00035347373100000412
用如下公式表示:
Figure FDA0003534737310000051
其中,Wt (l)是图卷积神经网络中第l层的权重矩阵,为了更好的融合特征空间与拓扑空间的共享信息,Wt (l)
Figure FDA0003534737310000052
共享参数,ReLU是ReLU激活函数,并且初始化为
Figure FDA0003534737310000053
其中X是多行为融合节点特征矩阵,
Figure FDA0003534737310000054
是具有n个节点的单位矩阵,
Figure FDA0003534737310000055
Figure FDA0003534737310000056
的对角矩阵,将最后一层输出嵌入表示为ZT
8.根据权利要求1所述的一种基于图结构学习的多行为融合图神经网络学生成绩预测方法,其特征在于:
将基于图结构学习的多行为融合图神经网络学到的节点嵌入进行融合,得到最终的节点嵌入Z,Z的计算公式如下所示:
Z=(ZF+ZT)/2 (8)。
CN202210250344.2A 2022-03-07 2022-03-07 一种基于图结构学习的多行为融合图神经网络学生成绩预测方法 Active CN114662748B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210250344.2A CN114662748B (zh) 2022-03-07 2022-03-07 一种基于图结构学习的多行为融合图神经网络学生成绩预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210250344.2A CN114662748B (zh) 2022-03-07 2022-03-07 一种基于图结构学习的多行为融合图神经网络学生成绩预测方法

Publications (2)

Publication Number Publication Date
CN114662748A true CN114662748A (zh) 2022-06-24
CN114662748B CN114662748B (zh) 2024-06-25

Family

ID=82028526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210250344.2A Active CN114662748B (zh) 2022-03-07 2022-03-07 一种基于图结构学习的多行为融合图神经网络学生成绩预测方法

Country Status (1)

Country Link
CN (1) CN114662748B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111260514A (zh) * 2020-01-14 2020-06-09 华中师范大学 一种基于校园大数据的学生成绩预测方法
CN111709575A (zh) * 2020-06-16 2020-09-25 北京工业大学 基于c-lstm的学业成绩预测方法
CN111860942A (zh) * 2020-06-08 2020-10-30 桂林电子科技大学 融合自注意力机制和深度矩阵分解的学生成绩预测方法
CN112215837A (zh) * 2020-10-26 2021-01-12 北京邮电大学 多属性图像语义分析方法和装置
CN113378913A (zh) * 2021-06-08 2021-09-10 电子科技大学 一种基于自监督学习的半监督节点分类方法
CN113486934A (zh) * 2021-06-22 2021-10-08 河北工业大学 基于注意力机制的层次化图卷积网络的属性图深度聚类方法
US20210374499A1 (en) * 2020-05-26 2021-12-02 International Business Machines Corporation Iterative deep graph learning for graph neural networks
CN113780470A (zh) * 2021-09-28 2021-12-10 广西师范大学 一种基于自适应多通道交叉图卷积网络的图分类方法
CN114038062A (zh) * 2021-11-11 2022-02-11 中南大学 一种基于联合关键点表征的考生异常行为分析方法及系统
CN114077927A (zh) * 2021-11-19 2022-02-22 国网辽宁省电力有限公司鞍山供电公司 一种行业gdp-用电量分析方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111260514A (zh) * 2020-01-14 2020-06-09 华中师范大学 一种基于校园大数据的学生成绩预测方法
US20210374499A1 (en) * 2020-05-26 2021-12-02 International Business Machines Corporation Iterative deep graph learning for graph neural networks
CN111860942A (zh) * 2020-06-08 2020-10-30 桂林电子科技大学 融合自注意力机制和深度矩阵分解的学生成绩预测方法
CN111709575A (zh) * 2020-06-16 2020-09-25 北京工业大学 基于c-lstm的学业成绩预测方法
CN112215837A (zh) * 2020-10-26 2021-01-12 北京邮电大学 多属性图像语义分析方法和装置
CN113378913A (zh) * 2021-06-08 2021-09-10 电子科技大学 一种基于自监督学习的半监督节点分类方法
CN113486934A (zh) * 2021-06-22 2021-10-08 河北工业大学 基于注意力机制的层次化图卷积网络的属性图深度聚类方法
CN113780470A (zh) * 2021-09-28 2021-12-10 广西师范大学 一种基于自适应多通道交叉图卷积网络的图分类方法
CN114038062A (zh) * 2021-11-11 2022-02-11 中南大学 一种基于联合关键点表征的考生异常行为分析方法及系统
CN114077927A (zh) * 2021-11-19 2022-02-22 国网辽宁省电力有限公司鞍山供电公司 一种行业gdp-用电量分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XIAOWANG等: "AM-GCN: Adaptive Multi-channel Graph Convolutional Networks", 《PROCEEDINGS OF THE 26TH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY & DATA MINING》, 27 August 2020 (2020-08-27), pages 1243 - 1253 *

Also Published As

Publication number Publication date
CN114662748B (zh) 2024-06-25

Similar Documents

Publication Publication Date Title
Goldani et al. Convolutional neural network with margin loss for fake news detection
CN111177575B (zh) 一种内容推荐方法、装置、电子设备和存储介质
Chen et al. Call attention to rumors: Deep attention based recurrent neural networks for early rumor detection
Tang et al. Scalable learning of collective behavior based on sparse social dimensions
CN109376237B (zh) 客户稳定性的预测方法、装置、计算机设备和存储介质
Suresh An unsupervised fuzzy clustering method for twitter sentiment analysis
Shindarev et al. Approach to identifying of employees profiles in websites of social networks aimed to analyze social engineering vulnerabilities
CN113297936B (zh) 一种基于局部图卷积网络的排球群体行为识别方法
Nawrocka et al. Application of machine learning in recommendation systems
CN112100372B (zh) 头版新闻预测分类方法
CN113190670A (zh) 一种基于大数据平台的信息展示方法及系统
CN116127190B (zh) 一种数字地球资源推荐系统及方法
Kovalchuk et al. A Scoring Model for Support Decision Making in Criminal Justice
Rijal et al. Integrating Information Gain methods for Feature Selection in Distance Education Sentiment Analysis during Covid-19.
CN113010705A (zh) 标签预测方法、装置、设备及存储介质
Tundis et al. Limits in the data for detecting criminals on social media
Vedavathi et al. Unsupervised learning algorithm for time series using bivariate AR (1) model
CN114662748B (zh) 一种基于图结构学习的多行为融合图神经网络学生成绩预测方法
Benzyane et al. Convolutional long short-term memory network model for dynamic texture classification: a case study
CN114860903A (zh) 一种面向网络安全领域的事件抽取、分类和融合方法
CN114297498A (zh) 一种基于关键传播结构感知的意见领袖识别方法和装置
Mungekar et al. Crime analysis using dbscan algorithm
Arshad et al. A Hybrid System for Customer Churn Prediction and Retention Analysis via Supervised Learning
Bhalekar et al. Machine learning: Survey, types and challenges
Liu et al. Topic detection based on similar networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant