CN109241146A - 集群环境下的学生智助方法和系统 - Google Patents
集群环境下的学生智助方法和系统 Download PDFInfo
- Publication number
- CN109241146A CN109241146A CN201811109429.9A CN201811109429A CN109241146A CN 109241146 A CN109241146 A CN 109241146A CN 201811109429 A CN201811109429 A CN 201811109429A CN 109241146 A CN109241146 A CN 109241146A
- Authority
- CN
- China
- Prior art keywords
- student
- attribute
- data
- weight
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000010606 normalization Methods 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000013480 data collection Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 241001269238 Data Species 0.000 claims description 3
- 239000012141 concentrate Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 3
- 238000005094 computer simulation Methods 0.000 description 2
- 208000012260 Accidental injury Diseases 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Computing Systems (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Educational Technology (AREA)
- General Business, Economics & Management (AREA)
- Algebra (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了集群环境下的学生智助方法和系统,从贫困生的信息挖掘出发,根据贫困生信息特征如生源地,家庭成员数,餐均消费额,消费总额,刷卡次数,学生成绩相对排名,图书馆进出次数,首先将数据集中贫困生和非贫困生有效分离,运用信息熵获取属性权值,消除了人为主观性因素,在此基础上,并行化计算每个候选对象的距离和,排序,输出前Top‑N个数据对象,定义为贫困生。该系统包括:属性归一化模块,属性权值自动获取模块和并行计算模块。该智助方法和系统,准确性较高、性能优越,避免在学生贫困评定中出现的主观性和随机性,具有受人为因素小、伸缩性强和精度高等优点,进而使学校能够更加科学、公平、方便、高效地评判贫困生。
Description
技术领域
本发明集群环境下的学生智助方法和系统,属于大数据应用技术领域。
背景技术
贫困大学生一直以来都是我国民生关注的重点,帮扶是高校和相关部门的一项人文关怀政策,如何落地最考验这份人文关怀的诚意与智慧。虽说目前各高校的认定标准已充分细化,可以体现认定的严格,但现有的贫困生判别方法较少考虑属性重要性对判别的影响,准确性较低,由此带来的“误伤”却不容忽视。
如今既有学生的家庭信息档案,又有校园卡的消费记录,如何通过学生在校的客观数据和表现对学生的贫困状态进行综合考量,避免在学生贫困状态评定中出现的主观性和随机性,提供一种结构简单、准确性较高、性能优越的智助系统是值得研究和探索的新的应用领域。
发明内容
为解决现有技术存在的不足,本发明公开了集群环境下的学生智助方法和系统,该智助方法和系统结构简单、准确性较高、性能优越,避免在学生贫困评定中出现的主观性和随机性,具有受人为因素小、伸缩性强和精度高等优点,进而使学校能够更加科学、公平、方便、高效地评判贫困生。
本发明通过以下技术方案实现:
集群环境下的学生智助方法,包括以下步骤:
a)以学校为单位,根据学生自愿申请原则,将学生数据集分为贫困生候选集DSC和非贫困生数据集DSN;
b)利用学校确定的贫困生名额与非贫困生名额比例,计算TOP-N的值;
c)数据特征量的提取,根据数据库包含的字段名称,抽取数据特征量及特征个数,提取待分析学生行为数据的维度特征,并将每维特征归一化;
d)采用信息熵自动获取每维特征的属性权值wl;
e)集群环境下,引入属性权值wl,针对候选集DSC中的每个对象,利用map-reduce框架并行计算候选集DSC中每个对象与数据集DSN中每个对象间的权值欧式距离dij,形成距离矩阵D;
f)通过对距离矩阵D进行累加和分析并排序,得出前Top-N名学生数据,定义为贫困生。
所述特征归一化的计算公式为:
式中,xil表示第i个对象xi在第l维属性上的取值,min(xil)表示数据集中xil的最小值,max(xil)表示数据集中xil的最大值,x′il表示标准化后的结果,该方法实现对原始数据的等比例缩放。该方法实现对原始数据的等比例缩放。
所述特征量为学号,生源地,家庭成员数,餐均消费额,消费总额,刷卡次数,学生成绩相对排名,图书馆进出次数。
所述信息熵自动获取每维特征的属性权值的方法,包括以下步骤:
设属性集xi={xi1,xi2,xi1,…,xiL}
假设xil是第i个对象xi的第l维属性上的取值,wl是第l维属性的权值,且0≤wl≤1,
1)首先对数据集中每维属性取均值,低于均值的就视为没有发生,高于均值的视为发生,根据样本发生个数与样本总数的频度比值依次计算属性集xi中各属性的概率值p(xil);
2)设U是论域,X1,X2…,XL是论域U的一个划分,其上有概率分布:
则称为信息源X的信息熵,其中对数取2为底,而某个pi为零时,则理解为0·log0=0;
3)在步骤2)的基础上,计算H(X)并且归一化,从而得到各维属性权值wl,归一化计算方法为:
其中,H(Xl)表示某对象X在第l维的信息熵;wl为属性的权值。
权值欧式距离计算函数采用计算方法为:
式中,xil,xjl分别是对象i和j在第l维属性上的取值,wl是第l维属性的权值,且0≤wl≤1。
所述距离矩阵D为:
令
式中,Dk是矩阵D中第k行的和。
所述利用map-reduce框架并行计算候选集DSC中每个对象与数据集DSN中每个对象间的权值欧式距离dij,形成距离矩阵D的方法包括以下步骤:
Map阶段:
1)首先通过sqoop将学生数据集导入HDFS;
2)读取HDFS中的文件,每一行解析成一个<k,v>,k为行号,v为对象,每一个键值对调用一次map函数,所覆写map函数调用权重距离计算函数;
3)对不同分区中的数据进行排序、分组。分组指的是相同key的value放到一个集合中;
4)对分组后的数据进行按照value中的学号进行归约;
Reduce阶段:
1)接收的是分组后的数据,然后计算Dk,处理后,产生新的<k,v>输出;
2)对新的<k,v>按照Dk排序,按照Dk排序后的前Top-N个对象,定义为贫困生,并写入HDFS中。
所述Top-N的个数动态可调。
集群环境下的学生智助系统,包括:
属性归一化模块,抽取学生数据特征并归一化;
属性权值自动获取模块,运用信息熵获取每维特征的属性权值;
并行计算模块,利用map-reduce框架并行化计算每个候选对象的距离,排序后输出前Top-N个数据对象,定义为贫困生。
本发明与现有技术相比具有以下有益效果:
本方法充分利用现有的大数据分析技术,从贫困生的信息挖掘出发,根据贫困生信息特征包括生源地,家庭成员数,餐均消费额,消费总额,刷卡次数,学生成绩相对排名,图书馆进出次数,首先将数据集中贫困生和非贫困生有效分离,运用信息熵获取属性权值,消除了人为主观性因素,在此基础上,并行化计算每个候选对象的距离和,排序,输出前Top-N个数据对象,定义为贫困生。从而避免在学生贫困评定中出现的主观性和随机性,具有受人为因素小、伸缩性强和精度高等优点,进而使学校能够更加真实、公平、方便、高效地评判贫困生。
本系统重新定义了贫困生,引入Dk,Dk越大,判定为贫困生的可能性越大;本系统在计算对象之间距离的时候,又引入属性权值,在缺乏先验知识时,运用信息熵自动获取属性权值,消除了人为主观性因素的影响;在计算量较大的距离矩阵D的过程中,采用基于map-reduce计算框架并行处理,极大的提高运算效率;根据学校确定的贫困生名额与非贫困生名额比例,Top-N个数动态可调,人为因素影响小、伸缩性强。
附图说明
下面结合附图对本发明做进一步的说明。
图1为本发明方法流程图。
图2为基于map-reduce的并行计算模型图。
具体实施方式
下面结合具体实施例对本发明做进一步的详细说明,但是本发明的保护范围并不限于这些实施例,凡是不背离本发明构思的改变或等同替代均包括在本发明的保护范围之内。
实施例
图1所示为本发明方法流程图,在本实施例中,如图1所述,本发明集群环境下的学生智助方法,包括以下步骤:
1.以学校为单位,按照学生自愿申请原则,将学生数据集分为贫困生候选集DSC和非贫困生数据集DSN;
2.利用学校确定的贫困生名额与非贫困生名额比例,计算TOP-N的值;
3.数据特征量的提取,根据数据库包含的字段名称,抽取数据特征量及特征个数,数据特征量包括但不限于:学号,生源地,家庭成员数,餐均消费额,消费总额,刷卡次数,学生成绩相对排名,图书馆进出次数;
提取待分析学生行为数据的维度特征,并将每维特征归一化,
所述特征归一化的计算公式为:
式中,xil表示第i个对象xi在第l维属性上的取值,min(xil)表示数据集中xil的最小值,max(xil)表示数据集中xil的最大值,x′il表示标准化后的结果,该方法实现对原始数据的等比例缩放。
4.在缺乏先验知识时,采用信息熵自动获取每维特征的属性权值wl;
包括以下步骤:
设属性集xi={xi1,xi2,xi1,…,xiL}
假设xil是第i个对象xi的第l维属性上的取值,wl是第l维属性的权值,且0≤wl≤1,
1)首先对数据集中每维属性取均值,低于均值的就视为没有发生,高于均值的视为发生,根据样本发生个数与样本总数的频度比值依次计算属性集xi中各属性的概率值p(xil);
2)设U是论域,X1,X2…,XL是论域U的一个划分,其上有概率分布:
则称为信息源X的信息熵,其中对数取2为底,而某个pi为零时,则理解为0·log0=0;
3)在步骤2)的基础上,计算H(X)并且归一化,从而得到各维属性权值wl,归一化计算方法为:
其中,H(Xl)表示某对象X在第l维的信息熵;wl为属性的权值。
5.集群环境下,引入属性权值wl,针对候选集DSC中的每个对象,利用map-reduce框架并行计算候选集DSC中每个对象与数据集DSN中每个对象间权值欧式距离dij,形成距离矩阵D;采用基于map-reduce计算框架并行处理,极大的提高了运算效率。
所述权值欧式距离计算函数采用计算方法为:
式中,xil,xjl分别是对象i和j在第l维属性上的取值,wl是第l维属性的权值,且0≤wl≤1。
所述距离矩阵D为:
令
式中,Dk是矩阵D中第k行的和,Dk越大说明对象i与DSN数据集中其他对象距离越远,贫困程度越高。
如图2所示,为基于map-reduce的并行计算模型图,所述利用map-reduce框架并行计算候选集DSC中每个对象与数据集DSN中每个对象间的权值欧式距离dij,形成距离矩阵D的方法包括以下步骤:
Map阶段:
1)首先通过sqoop将学生数据集导入HDFS;
2)读取HDFS中的文件,每一行解析成一个<k,v>,k为行号,v为对象,每一个键值对调用一次map函数,所覆写map函数调用权重距离计算函数;
3)对不同分区中的数据进行排序、分组,分组指的是相同key的value放到一个集合中;
4)对分组后的数据进行按照value中的学号进行归约;
Reduce阶段:
1)接收的是分组后的数据,然后计算Dk,处理后,产生新的<k,v>输出;
2)对新的<k,v>按照Dk排序,按照Dk排序后的前Top-N个对象,定义为贫困生,并写入HDFS中。
6.通过对距离矩阵进行计算分析排序,得出前Top-N名学生数据,定义为贫困生。
集群环境下的学生智助系统,包括:
属性归一化模块,抽取学生数据特征并归一化;
属性权值自动获取模块,运用信息熵获取属性权值;
并行计算模块,利用map-reduce框架并行化计算每个候选对象的距离,排序后输出前Top-N个数据对象,定义为贫困生。
本发明从贫困生的信息挖掘出发,根据贫困生信息特征(生源地,家庭成员数,餐均消费额,消费总额,刷卡次数,学生成绩相对排名,图书馆进出次数),首先将数据集中贫困生和非贫困生有效分离,运用信息熵获取属性权值,消除了人为主观性因素,在此基础上,并行化计算每个候选对象的距离和,排序后输出前Top-N个数据对象,定义为贫困生。从而避免在学生贫困评定中出现的主观性和随机性,具有受人为因素小、伸缩性强和精度高等优点,进而使学校能够更加科学、公平、方便、高效地评判贫困生。
应用示例:
假设学校拥有学生31000人,1000人提出申请,学校今年的政策名额为0.25%,则{DSN数据集}=30000,{DSC数据集}=1000,Top-N=78,矩阵D的大小为:1000*30000,DSN数据集的情况如表1所示,DSC数据集的情况如表2所示。
表1 DSN数据集
表2 DSC数据集
按照说明书中属性权值自动获取的方法,计算得到表3数据,通过和数据集对比分析,数据集在Test-1维度上偏离很小,可视作没有发生偏离,而仅仅是在其他维属性有偏离,这表明表3中计算所得的权值数据符合客观实际,能准确体现出属性的重要程度,在计算对象之间的距离的时候,较小的权值可减弱这两维属性对分析目标的影响,具有合理性,因此在指导挖掘时更为精确。
表3属性权值自动获取方法
X | P(X) | H(X) | 归一化H(X) | W |
餐均消费额 | 0.58 | 0.456 | 0.251 | 0.25 |
月消费总额 | 0.5 | 0.5 | 0.275 | 0.28 |
刷卡次数 | 0.58 | 0.456 | 0.251 | 0.25 |
成绩相对排名 | 0.08 | 0.292 | 0.160 | 0.16 |
… | ||||
Test-1 | 0.92 | 0.111 | 0.061 | 0.06 |
更进一步,设N={DSN},M={DSC},L={属性维度},则总的时间复杂度为O(M×N×L)通常此计算规模很大,单机很难一次性处理全部数据,为此,本方法采用集群并行处理,集群环境为:3个计算节点,每个计算节点为双路Intel E5 8核处理器,64GB内存,150G固态硬盘,480G固态硬盘*2,4T SATA 7200RPM企业盘*2,1+1冗余电源。软件平台选用hadoop2.x,通过map-reduce计算模型,输出Top-N个学生,定义为贫困生。
本发明不会限制于本文所示的实施例,而是要符合与本文所公开的原理和新颖性特点相一致的最宽范围。
Claims (9)
1.集群环境下的学生智助方法,其特征在于,包括以下步骤:
a)以学校为单位,根据学生自愿申请原则,将学生数据集分为贫困生候选集DSC和非贫困生数据集DSN;
b)利用学校确定的贫困生名额与非贫困生名额比例,计算TOP-N的值;
c)数据特征量的提取,根据数据库包含的字段名称,抽取数据特征量及特征个数,提取待分析学生行为数据的维度特征,并将每维特征归一化;
d)采用信息熵自动获取每维特征的属性权值wl;
e)集群环境下,引入属性权值wl,针对候选集DSC中的每个对象,利用map-reduce框架并行计算候选集DSC中每个对象与数据集DSN中每个对象间的权值欧式距离dij,形成距离矩阵D;
f)通过对距离矩阵D进行累加和分析并排序,得出前Top-N名学生数据,定义为贫困生。
2.根据权利要求1所述的集群环境下的学生智助方法,其特征在于,所述特征归一化的计算公式为:
式中,xil表示第i个对象xi在第l维属性上的取值,min(xil)表示数据集中xil的最小值,max(xil)表示数据集中xil的最大值,xi′l表示标准化后的结果,该方法实现对原始数据的等比例缩放。
3.根据权利要求1所述的集群环境下的学生智助方法,其特征在于,所述特征量为学号,生源地,家庭成员数,餐均消费额,消费总额,刷卡次数,学生成绩相对排名,图书馆进出次数。
4.根据权利要求1所述的集群环境下的学生智助方法,其特征在于,所述信息熵自动获取每维特征的属性权值的方法,包括以下步骤:
设属性集xi={xi1,xi2,xi1,…,xiL}
假设xil是第i个对象xi的第l维属性上的取值,wl是第l维属性的权值,且0≤wl≤1,
1)首先对数据集中每维属性取均值,低于均值的就视为没有发生,高于均值的视为发生,根据样本发生个数与样本总数的频度比值依次计算属性集xi中各属性的概率值p(xil);
2)设U是论域,X1,X2…,XL是论域U的一个划分,其上有概率分布:
则称为信息源X的信息熵,其中对数取2为底,而某个pi为零时,则理解为0·log0=0;
3)在步骤2)的基础上,计算H(X)并且归一化,从而得到各维属性权值wl,归一化计算方法为:
式中,H(Xl)表示某对象X在第l维的信息熵;wl为属性的权值。
5.根据权利要求1所述的集群环境下的学生智助方法,其特征在于,所述权值欧式距离计算函数采用计算方法为:
式中,xil,xjl分别是对象i和j在第l维属性上的取值,wl是第l维属性的权值,且0≤wl≤1。
6.根据权利要求1所述的集群环境下的学生智助方法,其特征在于,所述距离矩阵D为:
令
式中,Dk是矩阵D中第k行的和。
7.根据权利要求1所述的集群环境下的学生智助方法,其特征在于,所述利用map-reduce框架并行计算候选集DSC中每个对象与数据集DSN中每个对象间的权值欧式距离dij,形成距离矩阵D的方法包括以下步骤:
Map阶段:
1)首先通过sqoop将学生数据集导入HDFS;
2)读取HDFS中的文件,每一行解析成一个<k,v>,k为行号,v为对象,每一个键值对调用一次map函数,所覆写map函数调用权重距离计算函数;
3)对不同分区中的数据进行排序、分组,分组指的是相同key的value放到一个集合中;
4)对分组后的数据进行按照value中的学号进行归约;
Reduce阶段:
1)接收的是分组后的数据,然后计算Dk,处理后,产生新的<k,v>输出;
2)对新的<k,v>按照Dk排序,按照Dk排序后的前Top-N个对象,定义为贫困生,并写入HDFS中。
8.根据权利要求1所述的集群环境下的学生智助方法,其特征在于,所述Top-N的个数动态可调。
9.集群环境下的学生智助系统,其特征在于,包括:
属性归一化模块,抽取学生数据特征并归一化;
属性权值自动获取模块,运用信息熵获取每维特征的属性权值;
并行计算模块,利用map-reduce框架并行化计算每个候选对象的距离,排序后输出前Top-N个数据对象,定义为贫困生。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811109429.9A CN109241146B (zh) | 2018-09-21 | 2018-09-21 | 集群环境下的学生智助方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811109429.9A CN109241146B (zh) | 2018-09-21 | 2018-09-21 | 集群环境下的学生智助方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109241146A true CN109241146A (zh) | 2019-01-18 |
CN109241146B CN109241146B (zh) | 2021-09-17 |
Family
ID=65057318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811109429.9A Active CN109241146B (zh) | 2018-09-21 | 2018-09-21 | 集群环境下的学生智助方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109241146B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110247975A (zh) * | 2019-06-19 | 2019-09-17 | 公安部第一研究所 | 基于改进d-s证据的物联网多设备协同服务构建方法 |
CN111611293A (zh) * | 2020-04-24 | 2020-09-01 | 太原太工天宇教育科技有限公司 | 一种基于特征加权与MapReduce的离群数据挖掘方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120294540A1 (en) * | 2011-05-17 | 2012-11-22 | Microsoft Corporation | Rank order-based image clustering |
CN104715024A (zh) * | 2015-03-03 | 2015-06-17 | 湖北光谷天下传媒股份有限公司 | 一种多媒体热点分析方法 |
CN104899248A (zh) * | 2015-04-24 | 2015-09-09 | 济南大学 | 一种通用的运动捕获数据检索方法 |
CN106779999A (zh) * | 2016-12-23 | 2017-05-31 | 重庆工程职业技术学院 | 财务状况认定方法和装置 |
CN106951568A (zh) * | 2017-04-07 | 2017-07-14 | 中南大学 | 基于数据挖掘的学生贫困状态预测方法 |
CN108133240A (zh) * | 2018-01-31 | 2018-06-08 | 湖北工业大学 | 一种基于烟花算法的多标签分类方法及系统 |
-
2018
- 2018-09-21 CN CN201811109429.9A patent/CN109241146B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120294540A1 (en) * | 2011-05-17 | 2012-11-22 | Microsoft Corporation | Rank order-based image clustering |
CN104715024A (zh) * | 2015-03-03 | 2015-06-17 | 湖北光谷天下传媒股份有限公司 | 一种多媒体热点分析方法 |
CN104899248A (zh) * | 2015-04-24 | 2015-09-09 | 济南大学 | 一种通用的运动捕获数据检索方法 |
CN106779999A (zh) * | 2016-12-23 | 2017-05-31 | 重庆工程职业技术学院 | 财务状况认定方法和装置 |
CN106951568A (zh) * | 2017-04-07 | 2017-07-14 | 中南大学 | 基于数据挖掘的学生贫困状态预测方法 |
CN108133240A (zh) * | 2018-01-31 | 2018-06-08 | 湖北工业大学 | 一种基于烟花算法的多标签分类方法及系统 |
Non-Patent Citations (1)
Title |
---|
史甜: "数据挖掘在高校贫困生认定系统中的应用研究", 《中国优秀硕士学位论文全文数据库社会科学Ⅱ辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110247975A (zh) * | 2019-06-19 | 2019-09-17 | 公安部第一研究所 | 基于改进d-s证据的物联网多设备协同服务构建方法 |
CN110247975B (zh) * | 2019-06-19 | 2022-01-07 | 公安部第一研究所 | 基于改进d-s证据的物联网多设备协同服务构建方法 |
CN111611293A (zh) * | 2020-04-24 | 2020-09-01 | 太原太工天宇教育科技有限公司 | 一种基于特征加权与MapReduce的离群数据挖掘方法 |
CN111611293B (zh) * | 2020-04-24 | 2023-09-29 | 太原太工天宇教育科技有限公司 | 一种基于特征加权与MapReduce的离群数据挖掘方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109241146B (zh) | 2021-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109885768A (zh) | 工单处理方法、装置及系统 | |
CN107861951A (zh) | 智能客服中的会话主题识别方法 | |
CN104573130B (zh) | 基于群体计算的实体解析方法及装置 | |
CN107609147B (zh) | 一种从日志流中自动提取特征的方法和系统 | |
CN103646070A (zh) | 搜索引擎的数据处理方法及装置 | |
CN103150333A (zh) | 微博媒体中的意见领袖识别方法 | |
CN113722438B (zh) | 基于句向量模型的句向量生成方法、装置及计算机设备 | |
CN109978339A (zh) | Ai面试模型训练方法、装置、计算机设备及存储介质 | |
CN110728313B (zh) | 一种用于意图分类识别的分类模型训练方法及装置 | |
CN112329460B (zh) | 文本的主题聚类方法、装置、设备及存储介质 | |
CN110674636B (zh) | 一种用电行为分析方法 | |
CN111898703B (zh) | 多标签视频分类方法、模型训练方法、装置及介质 | |
CN105320764A (zh) | 一种基于增量慢特征的3d模型检索方法及其检索装置 | |
CN109376261A (zh) | 基于中级文本语义增强空间的模态独立检索方法和系统 | |
Jiang et al. | A hierarchal BoW for image retrieval by enhancing feature salience | |
CN111178533A (zh) | 实现自动半监督机器学习的方法及装置 | |
CN109241146A (zh) | 集群环境下的学生智助方法和系统 | |
Saravanan et al. | Prediction of Insufficient Accuracy for Human Activity Recognition using Convolutional Neural Network in Compared with Support Vector Machine | |
CN116402166B (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN109992592B (zh) | 基于校园消费卡流水数据的高校贫困生识别方法 | |
Wang et al. | An improved K_means algorithm for document clustering based on knowledge graphs | |
CN108073567A (zh) | 一种特征词提取处理方法、系统及服务器 | |
CN116739649A (zh) | 一种用户响应潜力评估方法和装置 | |
CN115081515A (zh) | 能效评价模型构建方法、装置、终端及存储介质 | |
CN114169731A (zh) | 一种科研机构评级系统、方法、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |