CN111223016A - 一种学生在校情况判别方法及其系统 - Google Patents
一种学生在校情况判别方法及其系统 Download PDFInfo
- Publication number
- CN111223016A CN111223016A CN201911394727.1A CN201911394727A CN111223016A CN 111223016 A CN111223016 A CN 111223016A CN 201911394727 A CN201911394727 A CN 201911394727A CN 111223016 A CN111223016 A CN 111223016A
- Authority
- CN
- China
- Prior art keywords
- student
- data
- school
- activity
- screening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000000694 effects Effects 0.000 claims abstract description 119
- 238000012216 screening Methods 0.000 claims abstract description 63
- 238000013500 data storage Methods 0.000 claims abstract description 19
- 238000004140 cleaning Methods 0.000 claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000005516 engineering process Methods 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims abstract description 4
- 230000010354 integration Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000013075 data extraction Methods 0.000 claims description 3
- 238000012850 discrimination method Methods 0.000 claims 3
- 238000001914 filtration Methods 0.000 claims 1
- 238000012937 correction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Educational Technology (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Educational Administration (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出了一种学校在校情况判别方法及其系统,所述方法步骤如下:S1、通过校园网络采集各个校园业务系统的数据;S2、基于异构数据清洗技术处理采集的数据,获取学生在校活动记录表;S3、根据预设置的参数从学生在校活动记录表中筛选每个学生的活动记录表;S4、根据步骤S3的筛选结果判断学生在校情况。所述系统包括数据采集模块、数据清洗模块、数据筛选模块、在校情况分析模块和数据存储模块。本发明方法和系统可以自动化判断学生在校情况,具有数据质量需求低、容错率高的特点。
Description
技术领域
本发明涉及一种学生在校情况判别方法及其系统,属于高校教育教学技术领域。
背景技术
在高校的教育工作中,经常需要判断和了解学生在校情况,从而选择实施相应的教育教学工作,传统判断学生在校情况的做法往往是通过人工统计或利用考勤打卡装置配合命令的方式,但这种做法存在人力管理成本高、灵活性差、学生配合积极性不高等问题,近些年随着高校信息化建设水平的提升,部分高校出现了利用学生在校数据推算和预测学生在校情况的方法,比如基于一卡通消费数据判断学生在校情况,或者通过监控识别系统判断学生在校情况,但是一方面学校的数据质量参差不齐,消费模型随机性比较大,另一方面每个学生的行为习惯不同,单一的数据很难说明问题,所以现有的学生在校情况判断方法精确度有限,而且软硬件配合的系统成本较高。
发明内容
为了解决现有技术难以准确判断学生在校情况的问题,本发明提出了一种学生在校情况判别方法及其系统,利用多维度的异构数据进行耦合分析,判断学生在校情况,具有数据质量需求低、容错率高的特点。
为解决上述技术问题,本发明采用了如下技术手段:
一种学校在校情况判别方法,具体包括以下步骤:
S1、通过校园网络采集各个校园业务系统的数据;
S2、基于异构数据清洗技术处理采集的数据,获取学生在校活动记录表,并存入大数据存储库;
S3、根据预设置的参数从学生在校活动记录表中筛选每个学生的活动记录表;
S4、根据步骤S3的筛选结果判断学生在校情况。
进一步的,所述校园业务系统包括一卡通系统、图书馆系统、考勤系统和校园网系统。
进一步的,步骤S2的具体操作为:
将一卡通系统中的消费记录、图书馆系统中的借阅记录、考勤系统中的考勤记录和校园网系统中的网络接入记录分别抽取到临时中间层,然后对抽取的数据进行清洗、转换和集成,获得格式统一的学生在校活动记录,将学生在校活动记录录入表格并加载到大数据存储库中。
进一步的,步骤S3的具体操作为:
预先设置参数,所述参数包括学生学号和筛选时段,从学生在校活动记录表中筛选出所有在筛选时段内的学生在校活动记录,构成综合记录表,再根据学生学号从综合记录表中筛选出每个学生的活动记录表,所述活动记录表包含多条数据链,每条数据链包括学生学号和活动时间。
进一步的,步骤S4的具体操作如下:
S41、设共有n个学生,选取第i个学生的活动记录表Xi,i=1,2,…,n,利用计数函数统计该学生在筛选时段内的活动次数Ci;
S42、按照活动时间大小从小到大的为活动记录表中的数据链进行排序,利用最大数据链中的活动时间减去最小数据链中的活动时间,获得该学生在筛选时段内的活动时间长度Ti;
S44、当第i个学生的活动次数Ci大于0,则判断该学生在筛选时段内在校,否则判断该学生在筛选时段内不在校;
S56、将S44的判断结果和S45的活跃度按照学生学号对应的存储在大数据存储库中。
进一步的,所述阈值A的取值范围是筛选时段长度的60%~80%。
一种学生在校情况判别系统,包括数据采集模块、数据清洗模块、数据筛选模块、在校情况分析模块和数据存储模块;所述数据采集模块,用于通过校园网络采集各个校园业务系统的数据;所述数据清洗模块,用于对数据采集模块采集到的数据进行数据抽取、数据转换和数据集成,获得学生在校活动记录表;所述数据筛选模块,用于根据参数从学生在校活动记录表筛选每个学生的活动记录表;所述在校情况分析模块,用于根据数据筛选模块筛选的活动记录表分析判断学生在校情况,所述学生在校情况包括学生是否在校、学生在校时段和学生活跃度;所述数据存储模块,用于存储数据采集模块采集的数据、学生在校活动记录表、活动记录表和学生在校情况。
进一步的,所述校园业务系统包括一卡通系统、图书馆系统、考勤系统和校园网系统。
进一步的,所述数据清洗模块采用Pentaho Data Integration、Oracle DataIntegrator或CloverDX工具平台。
进一步的,所述数据筛选模块、在校情况分析模块和数据存储模块集成在ElasticStack/或Apache Spark计算引擎中。
采用以上技术手段后可以获得以下优势:
本发明提出了一种学生在校情况判别方法及其系统,基于日渐丰富的校园生活,本发明方法和系统从多个校园业务网络中采集所需数据,并通过异构数据清洗技术处理采集的数据,将数据转换成统一格式,生成学生在校活动记录表,构建筛选参数和判别逻辑,通过筛选的数据逐步分析学生在校情况,判断学生是否在校、学生在校时段和学生活跃度。由于本发明方法和系统关联的校园业务系统较多,数据来源广,覆盖了学生在校的大部分活动,所以对采集的数据质量需求较低,容错率高。本发明方法和系统的操作简单、计算量较小,对硬件的需求较低,随着数据增多,对学生在校情况的判断的准确度会不断提升,有效减少随机性和数据质量造成的误差。
附图说明
图1为本发明一种学生在校情况判别方法的步骤流程图。
图2为一种学生在校情况判别系统的结构示意图。
图中,1是数据采集模块,2是数据清洗模块,3是数据筛选模块,4是在校情况分析模块,5是数据存储模块。
具体实施方式
下面结合附图对本发明的技术方案作进一步说明:
一种学校在校情况判别方法,如图1所示,具体包括以下步骤:
S1、通过校园网络采集各个校园业务系统的数据,本发明方法中的校园业务系统主要包括一卡通系统、图书馆系统、考勤系统和校园网系统,涵盖了学习、消费、娱乐在内的多个系统。通过网络从一卡通系统获取消费记录,刷卡消费记录中包括学生姓名、学号、卡号、消费金额和消费时间等信息,从图书馆系统中饭获取图书借阅记录,借阅记录包括学生姓名、学号、借阅书名、借阅时间等信息,借阅记录又可以分为借书记录和还书记录,从考勤系统中获取考勤记录,考勤记录包括学生姓名、学号、考勤时间、考勤地点等信息,从校园网系统获取网络接入记录,网络接入记录包括学生姓名、学号、网络接入号码、网络接入时间和网络接入地点,网络接入记录又可以分为上线记录和下线记录。
S2、基于异构数据清洗技术处理采集的数据,获取学生在校活动记录表,并存入大数据存储库,具体操作为:
将一卡通系统中的消费记录、图书馆系统中的借阅记录、考勤系统中的考勤记录和校园网系统中的网络接入记录分别抽取到临时中间层,然后对抽取的数据进行清洗、转换和集成,获得格式统一的学生在校活动记录,将学生在校活动记录录入表格,学生在校活动记录表中主要包括学生姓名、学号、活动时间,为了便于计算,活动时间是由年、月、日、时、分、秒组成的14位数字,前四位为年份,第五、第六位是月份,第七、第八位是日期,第九、第十位是小时,第十一、十二位是分钟,第十三、十四位是秒数,比如20191025130755。将学生在校活动记录表加载到大数据存储库中,便于后续查找和操作。
S3、根据预设置的参数从学生在校活动记录表中筛选每个学生的活动记录表,具体操作为:
预先设置参数,参数主要包括学生学号和筛选时段,此处的筛选时段是按照年、月、日、时、分、秒设置的,筛选时段也可以转换成14位数字根据具体的需求,从学生在校活动记录表中筛选出所有在筛选时段内的学生在校活动记录,构成综合记录表,再根据学生学号从综合记录表中筛选出每个学生的活动记录表,活动记录表包含多条数据链,每条数据链至少包括学生学号和活动时间这两个信息。
S4、根据步骤S3的筛选结果判断学生在校情况,具体操作如下:
S41、设共有n个学生,选取第i个学生的活动记录表Xi,i=1,2,…,n,利用计数函数COUNTA函数统计活动记录表Xi中该学生在筛选时段内的活动次数Ci,即统计改表格中有多少条数据链。
S42、按照活动时间大小从小到大的为活动记录表中的数据链进行排序,利用最大数据链中的活动时间减去最小数据链中的活动时间,获得该学生在筛选时段内的活动时间长度Ti。
S44、当第i个学生的活动次数Ci大于0,则判断该学生在筛选时段内在校,此处的在校只能说明该学生在筛选时段内在学校待过,并不能说明该学生在筛选时段内一直在学校,否则判断该学生在筛选时段内不在校。
当该学生的活动时间长度Ti大于等于阈值A,且单次活动时间长度Di小于等于单次活动时间长度平均值则判断该学生在筛选时段内全时段在校,其中,阈值A的取值范围是筛选时段长度的60%~80%,筛选时段长度就是筛选的开始时间和结束时间的差值。
S56、将S44的判断结果和S45的活跃度按照学生学号对应的存储在大数据存储库中,方便相关人员查看。
一种学生在校情况判别系统,如图2所示,包括数据采集模块1、数据清洗模块2、数据筛选模块3、在校情况分析模块4和数据存储模块5。
数据采集模块主要用于通过校园网络采集各个校园业务系统的数据,校园业务系统包括一卡通系统、图书馆系统、考勤系统和校园网系统。
数据清洗模块主要用于对数据采集模块采集到的数据进行数据抽取、数据转换和数据集成,获得学生在校活动记录表,数据清洗模块可以采用Pentaho Data Integration、Oracle Data Integrator或CloverDX工具平台。
数据筛选模块主要用于根据参数从学生在校活动记录表筛选每个学生的活动记录表,参数包括学生学号和筛选时段,活动记录表包含多条数据链,每条数据链至少包括学生学号和活动时间这两个信息。
在校情况分析模块用于根据数据筛选模块筛选的活动记录表分析判断学生在校情况,学生在校情况包括学生是否在校、学生在校时段和学生活跃度。
数据存储模块主要用于存储数据采集模块采集的数据、学生在校活动记录表、活动记录表和学生在校情况。
本发明系统可以安装在计算机系统中,数据筛选模块、在校情况分析模块和数据存储模块可以集成在ElasticStack/或Apache Spark计算引擎中。
本发明方法和系统可以自动化的判断、识别学生的在校情况,生成相关报表,供相关人员查看,如果需要,本发明方法和系统还可以统计学生在校地点、生活轨迹等信息。由于本发明方法和系统关联的校园业务系统较多,数据来源广,覆盖了学生在校的大部分活动,所以对采集的数据质量需求较低,容错率高。本发明方法和系统的操作简单、计算量较小,对硬件的需求较低,随着数据增多,对学生在校情况的判断的准确度会不断提升,有效减少随机性和数据质量造成的误差。
上面结合附图对本发明的实施方式作了详细地说明,但是本发明并不局限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。
Claims (10)
1.一种学校在校情况判别方法,其特征在于,包括以下步骤:
S1、通过校园网络采集各个校园业务系统的数据;
S2、基于异构数据清洗技术处理采集的数据,获取学生在校活动记录表,并存入大数据存储库;
S3、根据预设置的参数从学生在校活动记录表中筛选每个学生的活动记录表;
S4、根据步骤S3的筛选结果判断学生在校情况。
2.根据权利要求1所述的一种学校在校情况判别方法,其特征在于,所述校园业务系统包括一卡通系统、图书馆系统、考勤系统和校园网系统。
3.根据权利要求2所述的一种学校在校情况判别方法,其特征在于,步骤S2的具体操作为:
将一卡通系统中的消费记录、图书馆系统中的借阅记录、考勤系统中的考勤记录和校园网系统中的网络接入记录分别抽取到临时中间层,然后对抽取的数据进行清洗、转换和集成,获得格式统一的学生在校活动记录,将学生在校活动记录录入表格并加载到大数据存储库中。
4.根据权利要求3所述的一种学校在校情况判别方法,其特征在于,步骤S3的具体操作为:
预先设置参数,所述参数包括学生学号和筛选时段,从学生在校活动记录表中筛选出所有在筛选时段内的学生在校活动记录,构成综合记录表,再根据学生学号从综合记录表中筛选出每个学生的活动记录表,所述活动记录表包含多条数据链,每条数据链包括学生学号和活动时间。
5.根据权利要求4所述的一种学校在校情况判别方法,其特征在于,步骤S4的具体操作如下:
S41、设共有n个学生,选取第i个学生的活动记录表Xi,i=1,2,…,n,利用计数函数统计该学生在筛选时段内的活动次数Ci;
S42、按照活动时间大小从小到大的为活动记录表中的数据链进行排序,利用最大数据链中的活动时间减去最小数据链中的活动时间,获得该学生在筛选时段内的活动时间长度Ti;
S44、当第i个学生的活动次数Ci大于0,则判断该学生在筛选时段内在校,否则判断该学生在筛选时段内不在校;
S56、将S44的判断结果和S45的活跃度按照学生学号对应的存储在大数据存储库中。
6.根据权利要求5所述的一种学校在校情况判别方法,其特征在于,所述阈值A的取值范围是筛选时段长度的60%~80%。
7.一种学生在校情况判别系统,其特征在于,包括数据采集模块、数据清洗模块、数据筛选模块、在校情况分析模块和数据存储模块;
所述数据采集模块,用于通过校园网络采集各个校园业务系统的数据;
所述数据清洗模块,用于对数据采集模块采集到的数据进行数据抽取、数据转换和数据集成,获得学生在校活动记录表;
所述数据筛选模块,用于根据参数从学生在校活动记录表筛选每个学生的活动记录表;
所述在校情况分析模块,用于根据数据筛选模块筛选的活动记录表分析判断学生在校情况,所述学生在校情况包括学生是否在校、学生在校时段和学生活跃度;
所述数据存储模块,用于存储数据采集模块采集的数据、学生在校活动记录表、活动记录表和学生在校情况。
8.根据权利要求7所述的一种学生在校情况判别系统,其特征在于,所述校园业务系统包括一卡通系统、图书馆系统、考勤系统和校园网系统。
9.根据权利要求7所述的一种学生在校情况判别系统,其特征在于,所述数据清洗模块采用Pentaho Data Integration、Oracle Data Integrator或CloverDX工具平台。
10.根据权利要求7所述的一种学生在校情况判别系统,其特征在于,所述数据筛选模块、在校情况分析模块和数据存储模块集成在ElasticStack/或Apache Spark计算引擎中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911394727.1A CN111223016A (zh) | 2019-12-30 | 2019-12-30 | 一种学生在校情况判别方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911394727.1A CN111223016A (zh) | 2019-12-30 | 2019-12-30 | 一种学生在校情况判别方法及其系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111223016A true CN111223016A (zh) | 2020-06-02 |
Family
ID=70830921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911394727.1A Pending CN111223016A (zh) | 2019-12-30 | 2019-12-30 | 一种学生在校情况判别方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111223016A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102043816A (zh) * | 2009-10-12 | 2011-05-04 | 腾讯科技(深圳)有限公司 | 呈现人物关系的方法及装置 |
CN105160470A (zh) * | 2015-08-28 | 2015-12-16 | 苏州市享乐惠信息科技有限公司 | 一种校园一卡通管理系统 |
CN108242035A (zh) * | 2018-01-10 | 2018-07-03 | 重庆跃途科技有限公司 | 一种基于大数据的校园安全监测方法及系统 |
CN109636688A (zh) * | 2018-12-11 | 2019-04-16 | 武汉文都创新教育研究院(有限合伙) | 一种基于大数据的学生行为分析系统 |
-
2019
- 2019-12-30 CN CN201911394727.1A patent/CN111223016A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102043816A (zh) * | 2009-10-12 | 2011-05-04 | 腾讯科技(深圳)有限公司 | 呈现人物关系的方法及装置 |
CN105160470A (zh) * | 2015-08-28 | 2015-12-16 | 苏州市享乐惠信息科技有限公司 | 一种校园一卡通管理系统 |
CN108242035A (zh) * | 2018-01-10 | 2018-07-03 | 重庆跃途科技有限公司 | 一种基于大数据的校园安全监测方法及系统 |
CN109636688A (zh) * | 2018-12-11 | 2019-04-16 | 武汉文都创新教育研究院(有限合伙) | 一种基于大数据的学生行为分析系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109784721B (zh) | 一种就业数据分析与数据挖掘分析的平台系统 | |
CN110502999B (zh) | 校园管理系统及方法 | |
CN110336838B (zh) | 账号异常检测方法、装置、终端及存储介质 | |
CN110634081A (zh) | 一种水电站异常数据的处理方法及装置 | |
AU2012204061B2 (en) | Methods and systems for object based data management | |
CN107844914B (zh) | 基于集团管理的风险管控系统和实现方法 | |
CN112598184B (zh) | 一种戒毒人员复吸风险预测的方法和装置 | |
CN112101786A (zh) | 基于大数据的学生数据分析方法、装置及计算机设备 | |
CN106528850A (zh) | 基于机器学习聚类算法的门禁数据异常检测方法 | |
CN117290180A (zh) | 基于时序数据分析设备运行状态的监测方法、设备及介质 | |
CN106897743B (zh) | 基于贝叶斯模型的移动考勤防作弊大数据检测方法 | |
CN110958222A (zh) | 基于孤立森林算法的服务器日志异常检测方法及系统 | |
CN114971710A (zh) | 基于事件日志的多维度流程变体差异分析方法与系统 | |
CN114662963A (zh) | 一种专家智能评审管理方法 | |
CN113793693A (zh) | 传染病流行趋势预测方法及装置 | |
CN106055875A (zh) | 一种基于大数据的皮纹分析处理装置 | |
CN113869569A (zh) | 一种基于决策树的学习成绩预测及个性化干预的方法 | |
CN111223016A (zh) | 一种学生在校情况判别方法及其系统 | |
CN111815487A (zh) | 基于深度学习的健康教育评估方法、装置及介质 | |
CN109523442A (zh) | 一种基于校园教育系统的大数据分析方法 | |
Külcü | Records management practices in universities: A comparative study of examples in Canada and Turkey. | |
CN113918588A (zh) | 一种基于知识点的错题动态智能管理系统 | |
Hug et al. | Party pressure in roll call votes | |
CN111401776A (zh) | 一种公共卫生服务质控方法及系统 | |
Pallis et al. | Financial effectiveness of Greek Municipalities: An empirical investigation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |