CN109992592B - 基于校园消费卡流水数据的高校贫困生识别方法 - Google Patents

基于校园消费卡流水数据的高校贫困生识别方法 Download PDF

Info

Publication number
CN109992592B
CN109992592B CN201910285784.XA CN201910285784A CN109992592B CN 109992592 B CN109992592 B CN 109992592B CN 201910285784 A CN201910285784 A CN 201910285784A CN 109992592 B CN109992592 B CN 109992592B
Authority
CN
China
Prior art keywords
poverty
data
consumption
classification
college
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910285784.XA
Other languages
English (en)
Other versions
CN109992592A (zh
Inventor
鄂鹏
刘雅茜
万杰
王家辉
刘浩
王晶
宋厚昆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201910285784.XA priority Critical patent/CN109992592B/zh
Publication of CN109992592A publication Critical patent/CN109992592A/zh
Application granted granted Critical
Publication of CN109992592B publication Critical patent/CN109992592B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes

Abstract

本发明一种基于校园消费卡流水数据的高校贫困生识别方法,属于高校贫困生识别方法领域。包括如下步骤:步骤一、获取学生校园消费卡流水数据,建立SQL Server数据库;步骤二、利用核主成分分析方法选取多个分类特征;步骤三、基于步骤二选取的分类特征,建立RandomForest分类器,并利用训练数据进行训练;步骤四、基于步骤三获得的RandomForest分类器,建立用于高校贫困生识别的预测模型。本发明用于高校贫困生识别,利用核主成分分析方法实现了关键特征提取,并建立了基于RandomForest的分类预测模型,提高了高校贫困生识别的精准度。

Description

基于校园消费卡流水数据的高校贫困生识别方法
技术领域
本发明属于高校贫困生识别领域,更具体的说,涉及一种基于校园消费卡流水数据的高校贫困生识别方法。
背景技术
贫困生资助工作是高校人才培养工作的重要组成部分,关乎学生的成长成才、学校的稳定与发展、社会的和谐与进步。然而,传统的高校贫困生资助工作在取得巨大成就的同时,也存在着一系列弊端。随着时代的进步,新时期对高等学校贫困生扶助工作提出了更高的要求:提高国家资助政策的精准度,依托国家教育管理信息系统建设平台,确保国家学生资助、奖补等优惠政策真正落实到每一个需要帮扶的学生身上。如何做到精准认定是实现高校精准扶贫的重要基础。高校贫困生资助精准化的核心:精准识别贫困生、按不同贫困等级进行分级资助并实现动态监管以及精准评估。很多高校都利用信息化平台建立起了自己的校级信息化建设标准,实现了数据共享,但缺乏对海量数据的有效利用。大数据作为计算技术的最新形态,为我们开展高校贫困生精准资助研究提供了新的视角和方法。
如何利用高校已经建设完毕的各种管理系统所产生的基础数据,从中充分挖掘出有价值的信息,来帮助精准识别或验证贫困生,成为高校学生管理工作亟需迫切解决的重要课题之一。罗华群在对校园卡相关数据的采集、预处理的基础上,建立起原始数据库分析相关数据可行性,说明了数据挖掘用于校园一卡通数据分析对高校学生工作管理的合理、高效、客观性。曾秋凤使用Microsoft Analysis Service建立了数据仓库,并尝试使用K-means聚类方法研究学生消费行为规律,结果显示与事实大致吻合。董新科等人提出四个指标作为分析的依据,利用weka中多种常用聚类算法对一卡通数据进行了实验,提出k-means算法最适合做校园一卡通数据的数据聚类挖掘。陈晓通过对某高校多个部门管理系统数据进行分析处理并结合已有的贫困生认定办法,确定了贫困生认定的三大指标(经济情况、家庭情况、学生情况)及7个小指标,运用加权约束的决策树方法建立起了贫困生认定决策树。邵为爽选取了14个关键指标,并使用Excel建立起经济困难学生数据库。在应用基于粗糙集的Rosetta软件对决策表进行属性约简的基础上,建立了粗糙集-BP神经网络相结合模型。饶亮给出了一种改进关联规则Apriori算法,应用于基于校园一卡通数据建立起的综合数据库,对贫困生进行认定。周红等人选取了学生半年校园一卡通每月消费次数和人均消费金额2个主要分类特征,采用SVM对学生校园一卡通的消费数据进行分析,将学生按贫困与非贫困分类。然而,虽然已有基于校园消费卡流水数据的高校贫困生识别方法的研究,但是缺乏分类特征提取的方法,无法进一步提高识别的精准度。
发明内容
本发明主要解决的技术问题是提供基于校园消费卡流水数据的高校贫困生识别方法,独创分类特征提取,进一步提高识别的精准度。
为解决上述技术问题,本发明基于校园消费卡流水数据的高校贫困生识别方法包括如下步骤:
步骤一、获取学生校园消费卡流水数据,建立SQL Server数据库;
步骤二、利用核主成分分析方法选取多个分类特征;
步骤三、基于步骤二选取的分类特征,建立RandomForest分类器,并利用训练数据进行训练;
步骤四、基于步骤三获得的RandomForest分类器,建立用于高校贫困生识别的预测模型。
作为本技术方案的进一步优化,本发明基于校园消费卡流水数据的高校贫困生识别方法所述的多个分类特征包括至少如下8个:月消费总额、月最大消费额、在线消费额、水费、输入密码次数、在线消费次数、月充值额和月最大充值额。
作为本技术方案的进一步优化,本发明基于校园消费卡流水数据的高校贫困生识别方法中利用核主成分分析方法选取多个分类特征的具体步骤为:
S1、将所获得的学生校园消费卡流水数据的n个指标,每一指标有m个样本,写成一个m×n维的输入矩阵Xm×n
Figure GDA0002696385970000031
其中,xmn为学生消费数据中指标n的第m个样本,m和n均为大于1的自然数;
S2、选定高斯径向核函数,计算m行m列核矩阵K,其中,
Figure GDA0002696385970000032
u为xmn的最大值,“×”表示两个矩阵叉乘,xmn为学生消费数据中指标n的第m个样本,
Figure GDA0002696385970000033
S3、修正核矩阵得到K′,
Figure GDA0002696385970000034
其中,A为m行m列的单位矩阵;
S4、计算K′的特征值λ1,...,λm:通过K′的转置矩阵,将对称矩阵转换为近似对角矩阵,主对角线元素为λ1,...,λm,其余元素为0,近似对角矩阵中主对角元素即为特征值;
S5、计算特征值的累积贡献率Bm
Bm=λm/(λ1+...+λm);
S6、给定提取效率p,选取Bm≥p对应的关键指标。
作为本技术方案的进一步优化,本发明基于校园消费卡流水数据的高校贫困生识别方法中选取p为30%来确定关键指标用来建立和训练分类器。
作为本技术方案的进一步优化,本发明基于校园消费卡流水数据的高校贫困生识别方法中通过雅克比迭代方法计算对称矩阵的特征值。
一种基于校园消费卡流水数据的高校贫困生识别方法的有益效果为:
1)建立SQL Server数据库,便于数据处理;2)利用核主成分分析方法实现了贫困生的关键特征提取;3)建立了基于RandomForest的分类预测模型,进一步提高识别的精准度。
具体实施方式
本发明属于高校贫困生识别领域,更具体的说,涉及一种基于校园消费卡流水数据的高校贫困生识别方法,独创分类特征提取,进一步提高识别的精准度。
所述基于校园消费卡流水数据的高校贫困生识别方法包括如下步骤:
步骤一、获取学生校园消费卡流水数据,建立SQL Server数据库;
步骤二、利用核主成分分析方法选取多个分类特征;
步骤三、基于步骤二选取的分类特征,建立RandomForest分类器,并利用训练数据进行训练;
步骤四、基于步骤三获得的RandomForest分类器,建立用于高校贫困生识别的预测模型。
其中,SQL Server数据库是一种应用广泛的数据库管理系统,具有许多显著的优点:易用性、适合分布式组织的可伸缩性、用于决策支持的数据仓库功能、与许多其他服务器软件紧密关联的集成性、良好的性价比、便于数据处理等。
利用核主成分分析方法选取多个分类特征的具体步骤为:
S1、将所获得的学生校园消费卡流水数据的n个指标,每一指标有m个样本,写成一个m×n维的输入矩阵Xm×n
Figure GDA0002696385970000051
其中,xmn为学生消费数据中指标n的第m个样本,m和n均为大于1的自然数;
S2、选定高斯径向核函数,计算m行m列核矩阵K,其中,
Figure GDA0002696385970000052
u为xmn的最大值,“×”表示两个矩阵叉乘,xmn为学生消费数据中指标n的第m个样本,
Figure GDA0002696385970000053
S3、修正核矩阵得到K′,
Figure GDA0002696385970000054
其中,A为m行m列的单位矩阵;
S4、计算K′的特征值λ1,...,λm:通过K′的转置矩阵,将对称矩阵转换为近似对角矩阵,主对角线元素为λ1,...,λm,其余元素为0,近似对角矩阵中主对角元素即为特征值;通过雅克比迭代方法计算对称矩阵的特征值。
S5、计算特征值的累积贡献率Bm
Bm=λm/(λ1+...+λm);
S6、给定提取效率p,选取Bm≥p对应的关键指标。选取p为30%来确定关键指标用来建立和训练分类器。
多个分类特征包括至少如下8个:月消费总额、月最大消费额、在线消费额、水费、输入密码次数、在线消费次数、月充值额和月最大充值额。
为了验证上述方法选取的分类特征以及分类器对于高校贫困生识别的精准度,本发明中采用如下指标进行评价。
召回率(recall)越高,表明分类器在该类别上漏掉的文本越少,分类器性能越好;准确率(precision)越高,表示分类器在该类别上正确分得的文本数越多。假设现有一类别,对该类别中的文本进行分类:
表1-1分类系统分类情况
实际属于该类别数量 实际不属于该类别数量
判断属于该类的数量 a b
判断不属于该类的数量 c d
则,准确率
Figure GDA0002696385970000061
召回率
Figure GDA0002696385970000062
一般来说,准确率反映分类器的准确性,召回率反映了分类器的完备性,评价标准釆用哪个取决于用户侧重的目标,这两个目标通常情况下是互补的,单纯提高其中一个标准会导致另一个标准的下降,因此大多数分类器需要在二者之间做些折衷,以免其中某个标准过低。F-Measure将两者结合起来进行性能评价F-measure的数学公式为:
Figure GDA0002696385970000063
FP Rate为原本错的预测为对的比例:
Figure GDA0002696385970000064
TP Rate为原本对的预测为对的比例:
Figure GDA0002696385970000065
ROC曲线为(FP-Rate,TP-Rate)的曲线。ROC曲线越接近左上方,说明算法的分类效果越好。本文中WEKA的结果同时会提供ROC的值,即可以替代AUC(AreaUnder Curve),为ROC曲线下的面积,面积的数值区间为(0,1],越接近1说明分类器的效果越好,等于0.5说明分类器和随机分类的效果一致。
PRC曲线为precision和recall的曲线,其意义和ROC曲线一样。本发明也利用WEKA软件计算结果给出的PRC的值。
马修相关系数如下,
Figure GDA0002696385970000071
为进一步阐述上述方法,下面结合具体实例说明本发明的设计思想。
本发明以某高校6个月的学生饮食、用水等在线消费记录作为数据集,建立起包含32个属性的原始SQL Server数据库。其中,数据中已经过人工鉴定的贫困生为197人。
通过核主成分分析方法,提取出8个较为重要的分类特征:月消费总额、月最大消费、在线消费额、水费、输入密码次数、在线消费次数、月充值额、月最大充值额,然后在SQLServer数据库中对数据进行了相应的预处理。
选用weka软件利用训练数据对RandomForest进行训练,基于6个月数据设计了多组分类测试实验。最后,建立了基于RandomForest分类器的预测模型,并基于新建数据集进行了预测分析,得到了较高准确率的预测结果,从而验证了分类模型以及所选取的分类特征的有效性。
1)数据源的选择
本发明中所用的数据来源于哈尔滨某高校的2016年1月至6月所有本科学生饮食、用水、在线消费的刷卡记录,总计近700,0000条。其中,每月的刷卡记录数如下表所示:
201601 201602 201603 201604 201605 201606
582,408 147,431 1,048,575 1,048,575 1,048,575 1,048,575
原始数据包含32个属性,即32个字段。其中,已经过人工鉴定的贫困生为197人。
2)属性集分析与构建
通过对收集的32个字段进行核主成分分析分析,可以从以下几个属性对贫困生进行识别:月消费、月最大消费、在线消费及次数、水费、输入密码次数、月充值额和月最大充值额。并且,找出能对贫困生分类产生影响的属性,为以下6列:
No FROMACCOUNT CARDBALANCE TRANAMT RESUME NAME
序号 账号 余额 交易额 说明 姓名
其中,月消费和月最大消费可以从交易额里负值加总以及最小值获得,在线消费、在线消费次数、水费以及输入密码次数需要详细区分RESUME里的文本信息,而月充值额和月最大充值额则从交易额里的正值加总以及正值最大值得到。
最终确定8个分类特征,分别为:月消费总额、月最大消费额、在线消费额、水费、输入密码次数、在线消费次数、月充值额和月最大充值额。
3)数据预处理
为了统计与计算需要,首先将Excel表格导入SQL Server数据库中,建立贫困生姓名表NM,然后导入201601-201606月份的数据,并将其命名为S1-S6。
接着,利用以下SQL查询语句,得到F1-F8个特征值。
%%姓名,消费总额,月最大消费额,在线消费,水费,输入密码次数,在线消费次数
useHIT
select S1.Name,-sum(S1.Trans)As Total,-min(S1.Trans)AS Max,
-sum(case when S1.Trans<0 and S1.Resume='EPOS Online consume'thenS1.Trans end)As Con,
-sum(case when S1.Trans<0 and S1.Resume is Not NULL and S1.Resume!='EPOS Online consume'then S1.Trans end)As Water,
sum(case when S1.Resume='持卡人输了消费密码!'then 1 else 0 end)AsCode,
sum(case when S1.Resume='EPOS Online consume'then 1 else 0 end)AsOnline
From S1,NM
where Trans<0and S1.Name=NM.Name
Group by S1.Name
Order by S1.Name
%%充值总额,最大充值额
use HIT
select S1.Name,sum(S1.Trans)As Total,Max(S1.Trans)AS Max
From S1,NM
where Trans>0 and S1.Name=NM.Name
Group by S1.Name
Order by S1.Name
最后,在每个月份的数据空间上添加label,贫困生为1类,正常为0类。
为了避免类不平衡造成的分类结果不具有解释性或掩盖1类数据量小的特点,在0类数据选择上,本文选取剩余学生中Top 200的数据量作为正常类。
查询语句如下:
%%姓名,消费总额,月最大消费额,在线消费,水费,输入密码次数,在线消费次数
useHIT
select top(200)S1.Name,-sum(S1.Trans)As Total,-min(S1.Trans)AS Max,
-sum(case when S1.Trans<0 and S1.Resume='EPOS Online consume'thenS1.Trans end)As Con,
-sum(case when S1.Trans<0 and S1.Resume is Not NULL and S1.Resume!='EPOS Online consume'then S1.Trans end)As Water,
sum(case when S1.Resume='持卡人输了消费密码!'then 1else0end)AsCode,
sum(case when S1.Resume='EPOS Online consume'then 1 else 0 end)AsOnline
From S1,NM
where Trans<0 and S1.Name!=NM.Name
Group by S1.Name
Order by S1.Name
%%充值总额,最大充值额
useHIT
select top(200)S1.Name,sum(S1.Trans)As Total,Max(S1.Trans)AS Max
From S1,NM
where Trans>0 and S1.Name=NM.Name
Group byS1.Name
Order byS1.Name
由于,后面的充值总额和最大充值额单独查询,其学生姓名结果与前6个特征不能保证一直,因此,要将二者查询结果的姓名一一对应,才能得到正确的正常类数据。
4)实验结果及分析
(1)分类
经过上述处理,得到的8个分类特征如下:
Figure GDA0002696385970000101
其中,1类为贫困生,0类为普通生。
在贫困生分类系统中,对数据进行如下分类:
表3分类系统中的贫困生分类情况
实际为贫困生 实际为非贫困生
判断是贫困生(P) TP FP
判断是非贫困生(N) FN TN
(2)分类结果
利用weka软件对数据进行训练。基于6个月数据,依次利用分类器NaiveBayes、LibLINEAR、KNN(K=1、2、3)、决策树J48、RandomForest进行分类,得到的各个分类器的分类结果准确性如下:
1)201601组数据处理结果
Figure GDA0002696385970000102
weka.classifiers.trees.RandomForest
===Detailed Accuracy By Class===
指标 TP-Rate FP-Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.990 0.011 0.990 0.990 0.990 0.979 1.000 1.000 0
0.989 0.010 0.989 0.989 0.989 0.979 1.000 1.000 1
Weighted Avg 0.990 0.010 0.990 0.990 0.990 0.979 1.000 1.000
2)201602组数据处理结果
Figure GDA0002696385970000103
weka.classifiers.trees.RandomTree
==Detailed Accuracy By Class===
指标 TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.990 0.005 0.995 0.990 0.992 0.984 1.000 1.000 0
0.995 0.010 0.989 0.995 0.992 0.984 1.000 1.000 1
Weighted Avg 0.992 0.008 0.992 0.992 0.992 0.984 1.000 1.000
3)201603组数据处理结果
Figure GDA0002696385970000111
weka.classifiers.trees.RandomForest
===Detailed Accuracy By Class===
指标 TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.985 0.000 1.000 0.985 0.992 0.985 1.000 1.000 0
1.000 0.015 0.985 1.000 0.992 0.985 1.000 1.000 1
Weighted Avg 0.992 0.007 0.992 0.992 0.992 0.985 1.000 1.000
4)201604组数据处理结果
Figure GDA0002696385970000112
weka.classifiers.trees.RandomForest
==Detailed Accuracy By Class===
指标 TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.995 0.011 0.990 0.995 0.993 0.985 1.000 1.000 0
0.989 0.005 0.995 0.989 0.992 0.985 1.000 1.000 1
Weighted Avg 0.992 0.008 0.992 0.992 0.992 0.985 1.000 1.000
5)201605组数据处理结果
Figure GDA0002696385970000113
weka.classifiers.trees.RandomForest
===Detailed Accuracy By Class===
指标 TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.990 0.000 1.000 0.990 0.995 0.990 1.000 1.000 0
1.000 0.010 0.990 1.000 0.995 0.990 1.000 1.000 1
Weighted Avg 0.995 0.005 0.995 0.995 0.995 0.990 1.000 1.000
6)201606组数据处理结果
Figure GDA0002696385970000114
weka.classifiers.trees.RandomForest
===Detailed Accuracy By Class===
指标 TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.995 0.005 0.995 0.995 0.995 0.990 1.000 1.000 0
0.995 0.005 0.995 0.995 0.995 0.990 1.000 1.000 1
Weighted Avg 0.995 0.005 0.995 0.995 0.995 0.990 1.000 1.000
RandomForest在6组数据集中均表现为最佳,普遍预测的准确率均在99%以上最高达99.5%。
对于ROC指标,RandomForest表现基本趋近于1,比其他所有分类算法分类效果好。
选取RandomForest建立的分类模型作为贫困生识别的分类模型,对新数据进行预测。
(3)预测与结果
上文中已经得到,分类器RandomForest在数据集上的综合分类效果最好,RandomForest可作为最终的分类模型。为了验证此分类模型的和8个分类特征的有效性,以及正确预测新数据的类别属性的能力,以保证该分类算法对于其他贫困生数据也具有一定的鉴别功能和可拓展性,继续对其预测效果进行了评估。
以第六组数据为模型,从前5个月的数据选择一些组成新的数据为test set,进行预测。给出新的一组数据如下:
Figure GDA0002696385970000121
利用Random forest预测结果如下表所示。其中,Label列是真实值,default-Label列是为了预测所需,随意定义的,可以全部为1或者全部为0,predicted Label是利用分类模型给出的预测结果。
Label default-Label PredictedLabel
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
1 1 1
0 1 0
0 1 0
0 1 0
0 1 0
0 1 0
0 1 0
0 1 0
0 1 0
0 1 0
0 1 0
预测值与真实值相等的比例就是预测结果的准确率,从预测总结果中可得,针对新的预测数据,所建立的分类模型及选取的分类特征准确率为100%,判断真实贫困生的精准度为100%,判断非贫困生的精准度为100%,10个虚假和10个真实数据全部判断正确。结果说明,分类器Random forest以及选取的8个分类特征对于新的数据具有较高的适应性和有效性。从而验证了本发明方法是可行的。
当然,上述说明并非对本发明的限制,本发明也不仅限于上述举例,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也属于本发明的保护范围。

Claims (3)

1.基于校园消费卡流水数据的高校贫困生识别方法,其特征在于:所述基于校园消费卡流水数据的高校贫困生识别方法包括如下步骤:
步骤一、获取学生校园消费卡流水数据,建立SQL Server数据库;
步骤二、利用核主成分分析方法选取多个分类特征;
步骤三、基于步骤二选取的分类特征,建立RandomForest分类器,并利用训练数据进行训练;
步骤四、基于步骤三获得的RandomForest分类器,建立用于高校贫困生识别的预测模型;
所述多个分类特征包括至少如下8个:月消费总额、月最大消费额、在线消费额、水费、输入密码次数、在线消费次数、月充值额和月最大充值额;
利用核主成分分析方法选取多个分类特征的具体步骤为:
S1、将所获得的学生校园消费卡流水数据的n个指标,每一指标有m个样本,写成一个m×n维的输入矩阵Xm×n
Figure FDA0002696385960000011
其中,xmn为学生消费数据中指标n的第m个样本,m和n均为大于1的自然数;
S2、选定高斯径向核函数,计算m行m列核矩阵K,其中,
Figure FDA0002696385960000012
u为xmn的最大值,“×”表示两个矩阵叉乘,xmn为学生消费数据中指标n的第m个样本,
Figure FDA0002696385960000013
S3、修正核矩阵得到K′,
Figure FDA0002696385960000021
其中,A为m行m列的单位矩阵;
S4、计算K′的特征值λ1,...,λm:通过K′的转置矩阵,将对称矩阵转换为近似对角矩阵,主对角线元素为λ1,...,λm,其余元素为0,近似对角矩阵中主对角元素即为特征值;
S5、计算特征值的累积贡献率Bm
Bm=λm/(λ1+...+λm);
S6、给定提取效率p,选取Bm≥p对应的关键指标。
2.根据权利要求1所述的基于校园消费卡流水数据的高校贫困生识别方法,其特征在于:选取p为30%来确定关键指标用来建立和训练分类器。
3.根据权利要求1所述的基于校园消费卡流水数据的高校贫困生识别方法,其特征在于:通过雅克比迭代方法计算对称矩阵的特征值。
CN201910285784.XA 2019-04-10 2019-04-10 基于校园消费卡流水数据的高校贫困生识别方法 Expired - Fee Related CN109992592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910285784.XA CN109992592B (zh) 2019-04-10 2019-04-10 基于校园消费卡流水数据的高校贫困生识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910285784.XA CN109992592B (zh) 2019-04-10 2019-04-10 基于校园消费卡流水数据的高校贫困生识别方法

Publications (2)

Publication Number Publication Date
CN109992592A CN109992592A (zh) 2019-07-09
CN109992592B true CN109992592B (zh) 2020-12-08

Family

ID=67133027

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910285784.XA Expired - Fee Related CN109992592B (zh) 2019-04-10 2019-04-10 基于校园消费卡流水数据的高校贫困生识别方法

Country Status (1)

Country Link
CN (1) CN109992592B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111415099A (zh) * 2020-03-30 2020-07-14 西北大学 一种基于多分类BP-Adaboost的贫困生认定方法
CN116664014A (zh) * 2023-07-25 2023-08-29 临沂大学 一种高校学生管理用综合测评系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777131A (zh) * 2010-02-05 2010-07-14 西安电子科技大学 双模人脸识别方法及装置
CN108197657A (zh) * 2018-01-04 2018-06-22 成都寻道科技有限公司 一种基于校园数据的学生经济状况预测方法
CN109145113A (zh) * 2018-08-24 2019-01-04 北京桃花岛信息技术有限公司 一种基于机器学习的学生贫困程度预测方法
CN109472299A (zh) * 2018-10-19 2019-03-15 浙江正元智慧科技股份有限公司 一种基于智能卡大数据的贫困大学生识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8799150B2 (en) * 2009-09-30 2014-08-05 Scorelogix Llc System and method for predicting consumer credit risk using income risk based credit score

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777131A (zh) * 2010-02-05 2010-07-14 西安电子科技大学 双模人脸识别方法及装置
CN108197657A (zh) * 2018-01-04 2018-06-22 成都寻道科技有限公司 一种基于校园数据的学生经济状况预测方法
CN109145113A (zh) * 2018-08-24 2019-01-04 北京桃花岛信息技术有限公司 一种基于机器学习的学生贫困程度预测方法
CN109472299A (zh) * 2018-10-19 2019-03-15 浙江正元智慧科技股份有限公司 一种基于智能卡大数据的贫困大学生识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于贝叶斯网络模型的高校贫困生预测实证分析;李斌 等;《计算机系统应用》;20190115;第28卷(第1期);第262-268页 *

Also Published As

Publication number Publication date
CN109992592A (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
Yeh A problem‐based selection of multi‐attribute decision‐making methods
Coccia New models for measuring the R&D performance and identifying the productivity of public research institutes
Kao et al. A Bayesian latent variable model with classification and regression tree approach for behavior and credit scoring
CN110956273A (zh) 融合多种机器学习模型的征信评分方法及系统
CN112561598A (zh) 基于客户画像的客户流失预测及挽回方法和系统
CN103150333A (zh) 微博媒体中的意见领袖识别方法
CN109918674B (zh) 一种基于案件要素相似性建模的案件串并方法
CN112989070B (zh) 基于计算机系统的核心期刊量化评价系统和方法
CN115309998B (zh) 一种基于大数据的就业推荐方法及系统
CN109992592B (zh) 基于校园消费卡流水数据的高校贫困生识别方法
CN114595850A (zh) 基于机器学习的政务预约服务推荐方法
Ruyu et al. A comparison of credit rating classification models based on spark-evidence from lending-club
Appadoo et al. Job recommendation system, machine learning, regression, classification, natural language processing
Peng et al. The health care fraud detection using the pharmacopoeia spectrum tree and neural network analytic contribution hierarchy process
CN114519508A (zh) 基于时序深度学习和法律文书信息的信用风险评估方法
CN112836750A (zh) 一种系统资源分配方法、装置及设备
Renigier-Biłozor et al. Residential market ratings using fuzzy logic decision-making procedures
CN115115483B (zh) 一种融合隐私保护的学生综合能力评测方法
CN111861056A (zh) 一种技术创新水平的评价方法
CN115147091A (zh) 智能薪酬查询方法及系统
CN115829683A (zh) 一种基于逆奖赏学习优化的电力积分商品推荐方法及系统
CN109241146A (zh) 集群环境下的学生智助方法和系统
CN109308565B (zh) 人群绩效等级识别方法、装置、存储介质及计算机设备
CN114493849A (zh) 基于人工智能的目标推荐方法、系统、设备及介质
Orozova et al. How to follow modern trends in courses in “databases”-introduction of data mining techniques by example

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201208

Termination date: 20210410