CN112101678A - 一种基于gbdt的学生人格倾向预测方法 - Google Patents

一种基于gbdt的学生人格倾向预测方法 Download PDF

Info

Publication number
CN112101678A
CN112101678A CN202011011783.5A CN202011011783A CN112101678A CN 112101678 A CN112101678 A CN 112101678A CN 202011011783 A CN202011011783 A CN 202011011783A CN 112101678 A CN112101678 A CN 112101678A
Authority
CN
China
Prior art keywords
gbdt
data
data information
training
student
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011011783.5A
Other languages
English (en)
Inventor
张晗
秦勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan University of Technology
Original Assignee
Dongguan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan University of Technology filed Critical Dongguan University of Technology
Priority to CN202011011783.5A priority Critical patent/CN112101678A/zh
Publication of CN112101678A publication Critical patent/CN112101678A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Development Economics (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Medical Informatics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明公开了一种基于GBDT的学生人格倾向预测方法,涉及学生人格倾向预测技术领域,包括以下步骤:预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息;将采集的心理状态信息和网络访问日志数据信息进行数据建模,将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据,基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测。本发明实现能对学生心理状态进行预测,不仅适应性广,而且减少了创建量表和分发量表以及收集量表的时间,预测成本低且效率高。

Description

一种基于GBDT的学生人格倾向预测方法
技术领域
本发明涉及学生人格倾向预测技术领域,具体来说,涉及一种基于GBDT的学生人格倾向预测方法。
背景技术
现阶段国内结合数据挖掘模型的方法对学生心理状态进行研究工作主要有两个方面:一是基于社交网络数据的心理分析研究,其中比较主流的研究是通过新浪微博数据对用户的人格进行预测;另一方面是通过影响心理状态的因素入手,例如青少年感恩量表(AGS)和自评抑郁量表(SDS)等。
对人格心理方面的研究集中于抑郁焦虑等心理状态与个体性格之间的关联性上。总的来说现阶段的研究主要局限于某类特定群体的行为分析以及就影响因素方面的心理学分析与阐释,而大数据时代的到来,高效信息化平台的建设越来越完善,获取学生全天24小时的在校上网行为数据更是极大量的数据,研究价值也更高,此前却很少或者几乎没有使用高校计算方法来研究这种数据。故基于这种数据,运用数据处理技术以及机器学习中的算法与模型,胃实现对学生心理状态的预测带来了可能。
因此亟需一种基于GBDT的学生人格倾向预测方法,尽可能不造成学生心理负担的情况下,去分析出学生心理状态信息,从而辅助心理学工作者能够更好地开展工作。
检索中国发明专利CN109549644A公开了基于脑电采集的人格特征匹配系统,涉及特殊岗位性格匹配技术领域,包括:脑电采集模块、人格特征问卷模块和机器学习算法模块;所述脑电采集模块与人格特征问卷模块分别用于采集脑电信号与人格特征信号;所述机器学习算法模块用于接收脑电信号与人格特征信号并建立特定人群的人格特征与脑电生理特征模型;通过结合人格倾向测评结果、答题反应时和静息态脑电测量结果,通过人工智能机器学习算法,对于优秀的候选人和严重的人格障碍患者的主观和客观测量指标进行数学建模,从而提高优秀岗位胜任者的选拔命中率。但其不能对人格倾向进行预测,且数据信息不具备参考性。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种基于GBDT的学生人格倾向预测方法,以克服现有相关技术所存在的上述技术问题。
本发明的技术方案是这样实现的:
一种基于GBDT的学生人格倾向预测方法,包括以下步骤:
步骤S1,预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息;
步骤S2,将采集的心理状态信息和网络访问日志数据信息进行数据建模,其中包括获取特征数据信息和采集的标签数据信息合并;
步骤S3,将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据;
步骤S4,基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测。
进一步的,步骤所述将采集的心理状态信息和网络访问日志数据信息进行数据建模,包括以下步骤:
预先按照访问网址统计每个学生的访问次数,其中包括标定学生ID;
将访问网址进行分类,确定不同分类标签的学生访问次数;
对同分类标签的学生访问次数进行筛选,包括分别标定没有心理问题的学生IDY和有问题的学生记为IDN。
进一步的,步骤所述获取的特征数据信息进行降维处理,包括对特征数据信息基于主成分分析法进行降维处理。
进一步的,步骤所述分成训练数据和测试数据,包括基于十折交叉验证分成训练数据和测试数据。
进一步的,步骤所述GBDT回归算法训练GBDT模型,包括以下步骤:
初始学习器,包括首先构造初始学习器,取训练样本标签值的均值;
训练决策树,包括先构建第1颗决策树,首先确定每个样本的残差,残差=标签值-预测值;
根据二叉树的递归特性,对子节点继续添加分支条件,每个叶子节点的预测值=包含样本的标签值的均值,其训练好的决策树包含分支条件、叶子节点的预测值和关联的样本索引;
更新学习器,训练好一颗决策树后,可以在上个学习器的基础上获取新学习器,得到新的学习器后,再次确定每个样本的残差,创建第2颗决策树对残差进行拟合,反复训练N颗决策树后,训练结束。
进一步的,所述更新学习器,包括以下步骤:
遍历当前决策树的所有叶子节点;
获取每个叶子节点的预测值、关联的样本索引;
对每个关联的样本更新学习器。
本发明的有益效果:
本发明基于GBDT的学生人格倾向预测方法,通过预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息,将采集的心理状态信息和网络访问日志数据信息进行数据建模,将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据,基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测,实现能对学生心理状态进行预测,不仅适应性广,而且减少了创建量表和分发量表以及收集量表的时间,预测成本低且效率高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种基于GBDT的学生人格倾向预测方法的流程示意图;
图2是根据本发明实施例的一种基于GBDT的学生人格倾向预测方法的测试示意图;
图3是根据本发明实施例的一种基于GBDT的学生人格倾向预测方法的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
根据本发明的实施例,提供了一种基于GBDT的学生人格倾向预测方法。
如图1-图2所示,根据本发明实施例的基于GBDT的学生人格倾向预测方法,包括以下步骤:
步骤S1,预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息;
步骤S2,将采集的心理状态信息和网络访问日志数据信息进行数据建模,其中包括获取特征数据信息和采集的标签数据信息合并;
步骤S3,将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据;
步骤S4,基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测。
其中,步骤所述将采集的心理状态信息和网络访问日志数据信息进行数据建模,包括以下步骤:
预先按照访问网址统计每个学生的访问次数,其中包括标定学生ID;
将访问网址进行分类,确定不同分类标签的学生访问次数;
对同分类标签的学生访问次数进行筛选,包括分别标定没有心理问题的学生IDY和有问题的学生记为IDN。
其中,步骤所述获取的特征数据信息进行降维处理,包括对特征数据信息基于主成分分析法进行降维处理。
其中,步骤所述分成训练数据和测试数据,包括基于十折交叉验证分成训练数据和测试数据。
其中,步骤所述GBDT回归算法训练GBDT模型,包括以下步骤:
初始学习器,包括首先构造初始学习器,取训练样本标签值的均值;
训练决策树,包括先构建第1颗决策树,首先确定每个样本的残差,
残差=标签值-预测值;
根据二叉树的递归特性,对子节点继续添加分支条件,每个叶子节点的预测值=包含样本的标签值的均值,其训练好的决策树包含分支条件、叶子节点的预测值和关联的样本索引;
更新学习器,训练好一颗决策树后,可以在上个学习器的基础上获取新学习器,得到新的学习器后,再次确定每个样本的残差,创建第2颗决策树对残差进行拟合,反复训练N颗决策树后,训练结束。
其中,所述更新学习器,包括以下步骤:
遍历当前决策树的所有叶子节点;
获取每个叶子节点的预测值、关联的样本索引;
对每个关联的样本更新学习器。
借助于上述方案,通过预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息,将采集的心理状态信息和网络访问日志数据信息进行数据建模,将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据,基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测,实现能对学生心理状态进行预测,不仅适应性广,而且减少了创建量表和分发量表以及收集量表的时间,预测成本低且效率高。
另外,具体的,其MBTI为迈尔斯布里格斯类型指标(MBTI)表中人的性格,形成四个维度,表示为:注意力方向(精力来源)、外倾(外向)、E(Extrovert)、内倾(内向)、I(Introvert)和认知方式(如何搜集信息)、实感(感觉)、S(Sensing)、直觉(直觉)、N(iNtuition)和判断方式(如何做决定)、思维(理性)、T(Thinking)、情感(感性)、F(Feeling)和生活方式(如何应对外部世界)、判断(主观)、J(Judgement)、知觉(客观)、P(Perceiving),其四个维度如同四把标尺,每个人的性格都会落在标尺的某个点上,这个点靠近那个端点,就意味着个体就有哪方面的偏好。如在第一维度上,个体的性格靠近外倾这一端,就偏外倾,而且越接近端点,偏好越强。
另外,对于上述主成分分析法来说,主成分分析(Principal ComponentAnalysis,PCA),是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。主成分分析,是考察多个变量间相关性一种多元统计方法,研究如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关.通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
具体的,其Fp=a1i*ZX1+a2i*ZX2+……+api*ZXp,
其a1i,a2i,……,api(i=1,……,m)为X的协方差阵Σ的特征值所对应的特征向量,ZX1,ZX2,……,ZXp是原始变量经过标准化处理的值,在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,表示为:
A=(aij)p×m=(a1,a2,…am),Rai=λiai,
其中,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0。
此外,对于上述十折交叉来说,如图3所示,十折交叉验证(10-fold cross-validation),用来测试算法准确性。是常用的测试方法。将数据集分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验。
每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证(例如10次10折交叉验证),再求其均值,作为对算法准确性的估计。
综上所述,借助于本发明的上述技术方案,通过预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息,将采集的心理状态信息和网络访问日志数据信息进行数据建模,将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据,基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测,实现能对学生心理状态进行预测,不仅适应性广,而且减少了创建量表和分发量表以及收集量表的时间,预测成本低且效率高。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于GBDT的学生人格倾向预测方法,其特征在于,包括以下步骤:
预先基于MBTI评估模型,采集学生心理状态信息作为标签数据信息,并基于日志服务器数据库,采集学生网络访问日志数据信息;
将采集的心理状态信息和网络访问日志数据信息进行数据建模,其中包括获取特征数据信息和采集的标签数据信息合并;
将获取的特征数据信息进行降维处理,并进行分成训练数据和测试数据;
基于训练数据使用GBDT回归算法训练GBDT模型,并将训练好的GBDT模型作为预测模型,对学生进行性格倾向进行预测。
2.根据权利要求1所述的基于GBDT的学生人格倾向预测方法,其特征在于,步骤所述将采集的心理状态信息和网络访问日志数据信息进行数据建模,包括以下步骤:
预先按照访问网址统计每个学生的访问次数,其中包括标定学生ID;
将访问网址进行分类,确定不同分类标签的学生访问次数;
对同分类标签的学生访问次数进行筛选,包括分别标定没有心理问题的学生IDY和有问题的学生记为IDN。
3.根据权利要求1所述的基于GBDT的学生人格倾向预测方法,其特征在于,步骤所述获取的特征数据信息进行降维处理,包括对特征数据信息基于主成分分析法进行降维处理。
4.根据权利要求3所述的基于GBDT的学生人格倾向预测方法,其特征在于,步骤所述分成训练数据和测试数据,包括基于十折交叉验证分成训练数据和测试数据。
5.根据权利要求1所述的基于GBDT的学生人格倾向预测方法,其特征在于,步骤所述GBDT回归算法训练GBDT模型,包括以下步骤:
初始学习器,包括首先构造初始学习器,取训练样本标签值的均值;
训练决策树,包括先构建第1颗决策树,首先确定每个样本的残差,残差=标签值-预测值;
根据二叉树的递归特性,对子节点继续添加分支条件,每个叶子节点的预测值=包含样本的标签值的均值,其训练好的决策树包含分支条件、叶子节点的预测值和关联的样本索引;
更新学习器,训练好一颗决策树后,可以在上个学习器的基础上获取新学习器,得到新的学习器后,再次确定每个样本的残差,创建第2颗决策树对残差进行拟合,反复训练N颗决策树后,训练结束。
6.根据权利要求5所述的基于GBDT的学生人格倾向预测方法,其特征在于,所述更新学习器,包括以下步骤:
遍历当前决策树的所有叶子节点;
获取每个叶子节点的预测值、关联的样本索引;
对每个关联的样本更新学习器。
CN202011011783.5A 2020-09-23 2020-09-23 一种基于gbdt的学生人格倾向预测方法 Pending CN112101678A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011011783.5A CN112101678A (zh) 2020-09-23 2020-09-23 一种基于gbdt的学生人格倾向预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011011783.5A CN112101678A (zh) 2020-09-23 2020-09-23 一种基于gbdt的学生人格倾向预测方法

Publications (1)

Publication Number Publication Date
CN112101678A true CN112101678A (zh) 2020-12-18

Family

ID=73755996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011011783.5A Pending CN112101678A (zh) 2020-09-23 2020-09-23 一种基于gbdt的学生人格倾向预测方法

Country Status (1)

Country Link
CN (1) CN112101678A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113488164A (zh) * 2021-07-14 2021-10-08 中国科学院自动化研究所 基于数据的知识库心理沙盘分析方法、系统和设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447383A (zh) * 2016-08-30 2017-02-22 杭州启冠网络技术有限公司 跨时间、多维度异常数据监测的方法和系统
CN108109063A (zh) * 2017-12-07 2018-06-01 上海点融信息科技有限责任公司 用于预测标签预测值的方法、装置和计算机可读存储介质
CN108121795A (zh) * 2017-12-20 2018-06-05 北京奇虎科技有限公司 用户行为预测方法及装置
CN108717867A (zh) * 2018-05-02 2018-10-30 中国科学技术大学苏州研究院 基于梯度迭代树的疾病预测模型建立方法及装置
CN110069545A (zh) * 2019-03-07 2019-07-30 阿里巴巴集团控股有限公司 一种行为数据评估方法及装置
CN110348580A (zh) * 2019-06-18 2019-10-18 第四范式(北京)技术有限公司 构建gbdt模型的方法、装置及预测方法、装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447383A (zh) * 2016-08-30 2017-02-22 杭州启冠网络技术有限公司 跨时间、多维度异常数据监测的方法和系统
CN108109063A (zh) * 2017-12-07 2018-06-01 上海点融信息科技有限责任公司 用于预测标签预测值的方法、装置和计算机可读存储介质
CN108121795A (zh) * 2017-12-20 2018-06-05 北京奇虎科技有限公司 用户行为预测方法及装置
CN108717867A (zh) * 2018-05-02 2018-10-30 中国科学技术大学苏州研究院 基于梯度迭代树的疾病预测模型建立方法及装置
CN110069545A (zh) * 2019-03-07 2019-07-30 阿里巴巴集团控股有限公司 一种行为数据评估方法及装置
CN110348580A (zh) * 2019-06-18 2019-10-18 第四范式(北京)技术有限公司 构建gbdt模型的方法、装置及预测方法、装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
古勇成等: "基于GA和网络日志的人格倾向分析", 《现代计算机》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113488164A (zh) * 2021-07-14 2021-10-08 中国科学院自动化研究所 基于数据的知识库心理沙盘分析方法、系统和设备
CN113488164B (zh) * 2021-07-14 2022-01-28 中国科学院自动化研究所 基于数据的知识库心理沙盘分析方法、系统和设备

Similar Documents

Publication Publication Date Title
CN109255031B (zh) 基于知识图谱的数据处理方法
de Bello et al. Decoupling phylogenetic and functional diversity to reveal hidden signals in community assembly
Adhatrao et al. Predicting students' performance using ID3 and C4. 5 classification algorithms
Blüthgen Why network analysis is often disconnected from community ecology: a critique and an ecologist's guide
Chuang et al. TopicCheck: Interactive alignment for assessing topic model stability
Price et al. Combining family history and machine learning to link historical records: The Census Tree data set
Euzenat et al. Results of the ontology alignment evaluation initiative 2007
CN111967495B (zh) 一种分类识别模型构建方法
US20040181526A1 (en) Robust system for interactively learning a record similarity measurement
Vaccario et al. Quantifying and suppressing ranking bias in a large citation network
CN110337645A (zh) 可适配的处理组件
Shingari et al. A review of applications of data mining techniques for prediction of students’ performance in higher education
Agrawal et al. Using data mining classifier for predicting student’s performance in UG level
Millroth et al. Preference or ability: Exploring the relations between risk preference, personality, and cognitive abilities
CN110993102A (zh) 一种基于校园大数据的学生行为与心理检测结果的精准分析方法及系统
Deepika et al. Relief-F and Budget Tree Random Forest Based Feature Selection for Student Academic Performance Prediction.
Baranowski et al. Social welfare in the light of topic modelling
Mahalle et al. Data collection and preparation
CN112101678A (zh) 一种基于gbdt的学生人格倾向预测方法
CN114220542A (zh) 一种体检信息管理方法、装置、存储介质及计算设备
Lasso et al. Towards an alert system for coffee diseases and pests in a smart farming approach based on semi-supervised learning and graph similarity
Shankar et al. Analyzing attrition and performance of an employee using machine learning techniques
Edris Abadi et al. A clustering approach for data quality results of research information systems
Alsultanny Selecting a suitable method of data mining for successful forecasting
Salonen et al. Using trajectory analysis to test and illustrate microsimulation outcomes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201218