CN115115483B - 一种融合隐私保护的学生综合能力评测方法 - Google Patents
一种融合隐私保护的学生综合能力评测方法 Download PDFInfo
- Publication number
- CN115115483B CN115115483B CN202211050231.4A CN202211050231A CN115115483B CN 115115483 B CN115115483 B CN 115115483B CN 202211050231 A CN202211050231 A CN 202211050231A CN 115115483 B CN115115483 B CN 115115483B
- Authority
- CN
- China
- Prior art keywords
- subject
- student
- ability
- score
- privacy protection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 11
- 238000005457 optimization Methods 0.000 claims abstract description 31
- 230000000750 progressive effect Effects 0.000 claims description 43
- 230000008451 emotion Effects 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 19
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 238000005516 engineering process Methods 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 11
- 230000006872 improvement Effects 0.000 claims description 11
- 230000007935 neutral effect Effects 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 8
- 230000000384 rearing effect Effects 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 7
- 238000012935 Averaging Methods 0.000 claims description 6
- 230000002996 emotional effect Effects 0.000 claims description 6
- 230000037081 physical activity Effects 0.000 claims description 6
- 238000003064 k means clustering Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000003796 beauty Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241001391944 Commicarpus scandens Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/604—Tools and structures for managing or administering access control systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Educational Technology (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Automation & Control Theory (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
Abstract
本申请提供一种融合隐私保护的学生综合能力评测方法,包括:获取学生各科目的成绩,判断优势科目与劣势科目及其稳定性;识别倒退科目及所属能力项,计算倒退幅度;判断能力项的稳定性和总成绩稳定性;识别倒退科目属于优势还是劣势科目,判断是否进行隐私保护;对学生成绩进行隐私保护;针对需要进行隐私保护的不同能力项进行学生跟踪;根据隐私保护能力项的跟踪结果,对学习能力进行优化干预;根据隐私保护范围,分配成绩查看管理系统权限。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种融合隐私保护的学生综合能力评测方法。
背景技术
学生综合能力的评测应该是长时间的,不是一次性完成的工作。他会随着学生的兴趣转移,能力的不足的变化以及学习的努力程度等因素,不断变化。但是大部分的人,都不喜欢自己的失败或者短处被同伴看到,在评测过程中,人们更倾向让别人看到自己的成长,而不喜欢被看到自己的倒退。因为学生的性格没有完全形成,有时候,差的成绩,反而容易让学生破罐子破摔。当前,对学生综合能力的隐私保护工作不够细致,未考虑对不同水平能力项进行不同隐私保护,且单纯的隐私保护对学生学习能力提升的促进力度不够。所以,识别学生的倒退能力项和优势能力项,判断学生是否真正倒退并利用差分隐私保护技术保护学生弱势科目的成绩,突出自身优势科目,避开劣势,是当前教育方面的重要课题。此外,赋予不同级别的老师不同的成绩查看权限,并跟踪学生能力提升进度督促学生进步,也是教育隐私保护的重要目标。
发明内容
本发明提供了一种融合隐私保护的学生综合能力评测方法,主要包括:
获取学生各科目的成绩,判断优势科目与劣势科目及其稳定性;识别倒退科目及所属能力项,计算倒退幅度,具体包括:基于k-means识别科目代表的能力项;判断能力项的稳定性和总成绩稳定性;识别倒退科目属于优势还是劣势科目,判断是否进行隐私保护,具体包括:根据学生画像预测倒退科目的成绩,并计算倒退可信度;对学生成绩进行隐私保护,所述对学生成绩进行隐私保护,具体包括:基于差分隐私的学生成绩隐私保护技术,基于用户认证的隐私保护技术;针对需要进行隐私保护的不同能力项进行学生跟踪,所述针对需要进行隐私保护的不同能力项进行学生跟踪,具体包括:基于网络舆情跟踪学生德育能力,基于BP神经网络预测智育、美育能力完成时间;根据隐私保护能力项的跟踪结果,对学习能力进行优化干预,具体包括:根据预测完成时间,对学习能力进行优化干预;根据隐私保护范围,分配成绩查看管理系统权限。
进一步可选地,所述获取学生各科目的成绩,判断优势科目与劣势科目及其稳定性包括:
获取目标学生各个科目的成绩,包括本次考试成绩和历次考试成绩;首先判断学生的优势科目和劣势科目;用递进系数反应每次考试成绩的变化趋势:
Di=((Yi-X(i-1))/X(i-1))*100
其中Di为递进系数,Yi为本次考试成绩,X(i-1)为上次考试成绩;逐次计算目标学生各科目的递进系数,记录科目名称和递进系数Di,对各个科目的递进系数求平均;对全班学生目标科目的递进系数求平均,并作为第一阈值;若平均递进系数大于所述第一阈值,说明考试成绩高于平均水平,属于优势科目;若递进系数的平均值小于或等于第一阈值,说明考试成绩低于平均水平,属于劣势科目;然后计算目标学生各科目的稳定性指数;对所述目标学生的各科目的递进系数求标准差,作为目标学生各科目的稳定性指数,将全班学生对应科目的递进系数标准差作为第二阈值;若所述稳定性指数小于第二阈值,则说明目标学生的目标科目成绩稳定性高;若所述稳定性指数大于等于第二阈值,则说明目标学生的目标科目成绩稳定性低。
进一步可选地,所述识别倒退科目及所属能力项,计算倒退幅度包括:
首先识别倒退科目及倒退幅度;获取学生本次目标科目成绩和上次目标科目成绩数据,计算目标科目成绩环比;其中,目标科目成绩环比=本次目标科目成绩/上次目标科目成绩;比较目标科目成绩环比与1的大小,若目标科目成绩环比大于1,则说明目标科目为进步科目;若目标科目成绩环比等于1,则说明目标科目不进不退;若目标科目成绩环比小于1,则说明目标科目为倒退科目,用倒退科目的递进系数的绝对值表示其倒退幅度;然后根据倒退科目名称和科目的描述文本获取所属能力项,将最终结果记为倒退科目名称、倒退幅度、能力项;
所述基于k-means识别科目代表的能力项,具体包括:
获取所有科目名称以及各科目的描述文本。首先将各科目的描述文本按句拆分,对拆分后的每句话分词并去除其中的停用词,最后得到各个科目的词项。然后计算各个科目的词项的TF-IDF值,词频TF=词项出现的次数/描述文本所有词项总数,逆向文件频率:
TF-IDF=TF*IDF。通过预设第四阈值提取各科目的描述关键词,TF-IDF值大于第四阈值的词项为描述关键词,记为科目名称、描述关键词。计算所有科目的描述文本中的所有词项的TF-IDF值,并转化成TF-IDF矩阵进行k-means聚类。随机选取五个类中心点,遍历所有词项并计算各词项聚类中心的距离d=|x1-x2|^2,距离越近说明该词项和类中心属于同一类,然后取各类均值作为新的类中心重新进行分类,直到类中心不再发生变化。统计聚类结果并分别命名为德智体美劳五个能力项。获取待识别科目名称及描述文本,计算描述文本中所有词项的TF-IDF值,提取描述关键词,计算关键词到五个类中心的距离,取最小距离作为分类标准,即关键词到类中心距离最小的类为待识别科目所属科目。
进一步可选地,所述判断能力项的稳定性和总成绩稳定性包括:
首先计算各能力项的稳定性指数;获取同一能力项的所有科目的稳定性指数,计算所述稳定性指数的平均值作为能力项的稳定性指数;最后,将能力项的稳定性指数的平均值作为总成绩的稳定性指数;输出最后结果为能力项:能力项的稳定性指数,总成绩的稳定性指数。
进一步可选地,所述识别倒退科目属于优势还是劣势科目,判断是否进行隐私保护包括:
获取学生学号、倒退科目的名称、本次考试成绩和历次考试成绩,通过平均递进系数判断倒退科目属于优势科目还是劣势科目;若属于劣势科目,则需要进行隐私保护,否则进行下一步;获取倒退可信度acc,并预设第三阈值;当倒退可信度acc大于或等于第三阈值,则说明倒退科目成绩体现了学生的真实能力,即表示学生不是波动性倒退,而是能力不足,需要进行隐私保护;当倒退可信度acc小于第三阈值,则说明学生此次考试是波动性倒退,不用进行隐私保护;根据倒退科目的名称获取所属能力项,对能力项标注是否进行隐私保护,即输出结果为能力项:是否进行隐私保护;
所述根据学生画像预测倒退科目的成绩,并计算倒退可信度,具体包括:
获取倒退科目的名称、学生个人倒退科目的分数、学生个人倒退科目的及格率、倒退科目的平均分、倒退科目的班级及格率、本次考试倒退科目的班级平均分、本次考试难度系数七个属性作为学生画像的特征训练集。将所述特征训练集输入BP神经网络中训练,训练完成后需输入倒退科目的名称、学生个人倒退科目的及格率、倒退科目的平均分、倒退科目的班级及格率、本次考试倒退科目的班级平均分、本次考试难度系数六个属性,来实现对学生个人倒退科目的分数的预测。即获取倒退科目的名称、学生个人倒退科目的及格率、倒退科目的平均分、倒退科目的班级及格率、本次考试倒退科目的班级平均分、本次考试难度系数六个属性,输入已训练好的BP神经网络,得到学生个人倒退科目的预测分数。获取学生上次考试中倒退科目的分数,计算预测倒退幅度=学生个人倒退科目的预测分数/上次考试中倒退科目的成绩,记为F。获取学生个人倒退科目的实际倒退幅度,记为A。计算倒退可信度acc,acc=1-|F-A|/A,acc越大说明预测值越精确,倒退科目成绩越能反应学生的真实能力,即表示学生不是波动性倒退,而是能力不足。
进一步可选地,所述对学生成绩进行隐私保护包括:
首先获取目标学生各个科目的成绩,识别并筛选出优势科目输出至学生端,输出内容为学号,科目名称,分数,科目稳定性;获取目标学生需要进行隐私保护的能力项,基于差分隐私的学生成绩隐私保护技术对学生需要进行隐私保护的能力项的数据进行处理,并重新计算各能力项的稳定性指数和总成绩的稳定性指数后输出至学生端;对于各能力项下的详细科目成绩,采用用户认证的方法进行隐私保护;通过用户认证后将学号,科目名称、分数、优势/劣势,科目稳定性,倒退幅度输出至学生端;
所述基于差分隐私的学生成绩隐私保护技术,具体包括:
获取目标学生各个科目的成绩,记为数据集A。将A按照德智体美劳五个能力项分为拉普拉斯五组:A1,A2,A3,A4,A5,即A=A1+A2+A3+A4+A5,A1,A2,A3,A4,A5分别为德、智、体、美、劳五个能力项包含的科目成绩数据集。获取需要进行隐私保护的能力项数据,并注入拉普拉斯噪声,M=f+Y,其中M为加噪后的数据,f为原数据,Y为噪声。生成加噪数据集A'=A1'+A2'+A3'+A4'+A5',A1'、A2'、A3'、A4'、A5'分别为加噪后的德、智、体、美、劳五个能力项包含的科目成绩数据集。分别计算数据集A1'、A2'、A3'、A4'、A5'的稳定性指数的平均值作为能力项的稳定性指数,将所述能力项的稳定性指数的平均值作为总成绩的稳定性指数。
所述基于用户认证的隐私保护技术,具体包括:
建立个人身份信息数据库,包括账号和密码。进行用户认证时,需要获取输入的账号和密码。通过字符串匹配账号、密码是否对应,若对应,则输出学号,科目名称、分数、优势/劣势,科目稳定性,倒退幅度。其中,若科目不是对应学生的倒退科目,则倒退幅度输出为0。若字符串匹配失败,则无法查看详细科目分数。
进一步可选地,所述针对需要进行隐私保护的不同能力项进行学生跟踪包括:
获取目标学生需要进行隐私保护的能力项,对不同能力项采用不同跟踪方式;对于德育能力项,基于网络舆情跟踪学生德育能力,即通过分析学生在社交网络发表的文本情感态度,跟踪学生德育观念的水平并将学生德育水平输入后台数据库;对于智育和美育,获取学生学习时间和学习次数,基于BP神经网络预测学生完成能力提升所需要的时间并输入后台数据库,以此跟踪学生的学习进度;对于体育和劳育,获取学生体育活动时间与参与劳育活动次数并输入后台数据库,跟踪学生的体劳水平;
所述基于网络舆情跟踪学生德育能力,具体包括:
通过公开的接口获取目标学生的社交网络中的文本数据,包括评论文本和博文文本。基于jieba分词对所有文本进行分词并去除停用词,通过TD-IDF值提取出每条文本中的关键词项。然后对关键词进行情感特征提取,即参照波森情感词典对词项赋权值。对于否定词以外的词项采用累加方式赋权值,一个积极情感词项权值为1,一个消极情感词项权值为-1,中性词项权值为0。对于否定词采用(-1)^n计算权值,n表示否定词出现的次数。统计学生每条文本的情感分值S=Σdi*si,其中di表示否定词权值,si表示否定词以外的词项的权值。根据S为学生每条文本建立标签,若S>0,标记为积极情感,S=0标记为中性情感,S<0标记为消极情感。其中,积极情感表示学生德育水平高,中性情感表示学生德育水平中等,消极情感表示学生德育水平低。
所述基于BP神经网络预测智育、美育能力完成时间,具体包括:
以本次需要进行隐私保护的能力项作为目标能力项。加载目标能力项的历次稳定性指数和总成绩的稳定性指数,获取需要进行隐私保护的学生的学号、学习时长、学习次数以及数据采集日期,作为训练集,输入BP神经网络中训练。其中,所述目标能力项的稳定性指数和总成绩的稳定性指数为历次考试的数据。然后制作输入集,每隔3天获取一次学生学习时长、学习次数以及数据采集的日期,预测目标能力项的稳定性指数和总成绩的稳定性指数。预设第四阈值和第五阈值,当预测的目标能力项的稳定性指数小于第四阈值并且总成绩的稳定性指数小于第五阈值时,输出此时的数据采集日期。计算此时的数据采集日期距离制作输入集第一次进行数据采集的日期的天数,以此作为预测完成时间。
进一步可选地,所述根据隐私保护能力项的跟踪结果,对学习能力进行优化干预包括:
获取隐私保护能力项的跟踪结果,对学习能力进行优化干预;若隐私保护能力项包括德育,则加载德育能力项跟踪结果,判断结果是否为“德育水平高”,若不是,则向学生端输出提示“请尽快完成德育能力优化”,否则不进行操作;若隐私保护能力项包括智育或美育,则加载智育或美育能力项跟踪结果,根据预测完成时间,对学习能力进行优化干预;若隐私保护能力项包括体育,设定第六阈值,当体育活动时间小于第六阈值则说明学生能力提升缓慢,需向学生端输出提示“请尽快完成体育能力优化”,否则不进行操作;若隐私保护能力项包括劳育,设定第七阈值,当劳育活动次数小于第七阈值则说明学生劳育实践不足,需向学生端输出提示“请尽快完成劳育能力优化”,否则不进行操作;
所述根据预测完成时间,对学习能力进行优化干预,具体包括:
获取学生需要进行隐私保护的能力项改善方案的预测完成时间,以及获取数据当天距离下一次考试的天数。比较所述预测完成时间和获取数据当天距离下一次考试的天数的大小。若预测完成时间大于获取数据当天距离下一次考试的天数,则向学生端输出提示“请尽快完成能力优化”。若预测完成时间小于获取数据当天距离下一次考试的天数,则不进行操作。
进一步可选地,所述根据隐私保护范围,分配成绩查看管理系统权限,包括:
根据隐私保护范围分配成绩查看的权限,将权限分为一级、二级权限和三级权限,分别用1、2、3标识;其中一级权限为最高权限,二级权限和三级权限依次递减;一级权限显示所有详细科目分数,包括需要进行隐私保护的科目,二级权限显示进行差分隐私后的数据,包括优势科目分数、德智体美劳的稳定性及总成绩的稳定性,三级权限只显示所有科目的分数段;当权限状态为关闭时,则权限失效,无法查看隐私保护内容;获取用户认证结果,并根据用户账号识别用户身份,若认证成功且为学生账号,则将赋予一级权限,若为班主任老师账号,则赋予二级权限,若为其他老师,则赋予三级权限。
本发明实施例提供的技术方案可以包括以下有益效果:
本发明通过评估学生的综合能力,并根据综合能力的优势项目与劣势项目,协助学生查漏补缺,并对倒退项目根据是否是真正倒退进行隐私保护,如果是波动性能力倒退,则不进行隐私保护,而是让其有波动性前景的荣誉感,达到激励学生进取的目标。
附图说明
图1为本发明的一种融合隐私保护的学生综合能力评测方法的流程图。
图2为本发明的一种融合隐私保护的学生综合能力评测方法的示意图。
图3为本发明的一种融合隐私保护的学生综合能力评测方法的又一示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的一种融合隐私保护的学生综合能力评测方法流程图。如图1所示,本实施例一种融合隐私保护的学生综合能力评测方法具体可以包括:
步骤101,获取学生各科目的成绩,判断优势科目与劣势科目及其稳定性。
获取目标学生各个科目的成绩,包括本次考试成绩和历次考试成绩。首先判断学生的优势科目和劣势科目。用递进系数反应每次考试成绩的变化趋势:
Di=((Yi-X(i-1))/X(i-1))*100
其中Di为递进系数,Yi为本次考试成绩,X(i-1)为上次考试成绩。逐次计算目标学生各科目的递进系数,记录科目名称和递进系数Di,对各个科目的递进系数求平均。对全班学生目标科目的递进系数求平均,并作为第一阈值。若平均递进系数大于所述第一阈值,说明考试成绩高于平均水平,属于优势科目。若递进系数的平均值小于或等于第一阈值,说明考试成绩低于平均水平,属于劣势科目。然后计算目标学生各科目的稳定性指数。对所述目标学生的各科目的递进系数求标准差,作为目标学生各科目的稳定性指数,将全班学生对应科目的递进系数标准差作为第二阈值。若所述稳定性指数小于第二阈值,则说明目标学生的目标科目成绩稳定性高。若所述稳定性指数大于等于第二阈值,则说明目标学生的目标科目成绩稳定性低。例如,获取学生A的四次数学成绩,第一次85分,第二次90分,第三次89分,第四次91分。四次政治成绩,第一次76分,第二次80分,第三次70分,第四次90分。则数学的递进系数为D2=((90-85)/85)*100=5.882,D3=((89-90)/90)*100=-1.11,D4=((91-89)/89)*100=2.247,则数学的平均递进系数为2.34,标准差为2.855。政治的递进系数为D2=((80-76)/76)*100=5.263,D3=((70-80)/80)*100=-12.5,D4=((90-70)/70)*100=28.571,则政治的平均递进系数为7.111,标准差为16.818。若全班的数学平均递进系数即第一阈值为2,全班的数学递进系数标准差即第二阈值为3,那么数学科目是A同学的优势科目,且成绩稳定性高。若全班的政治平均递进系数为8,全班的数学递进系数标准差为5,那么政治科目是A同学的劣势科目,且成绩稳定性低。
步骤102,识别倒退科目及所属能力项,计算倒退幅度。
首先识别倒退科目及倒退幅度。获取学生本次目标科目成绩和上次目标科目成绩数据,计算目标科目成绩环比。其中,目标科目成绩环比=本次目标科目成绩/上次目标科目成绩。比较目标科目成绩环比与1的大小,若目标科目成绩环比大于1,则说明目标科目为进步科目。若目标科目成绩环比等于1,则说明目标科目不进不退。若目标科目成绩环比小于1,则说明目标科目为倒退科目,用倒退科目的递进系数的绝对值表示其倒退幅度。然后根据倒退科目名称和科目的描述文本获取所属能力项,将最终结果记为倒退科目名称、倒退幅度、能力项。例如,学生A本次数学成绩为80分,上次数学成绩为90分,则英语成绩环比=80/90=0.89<1,属于倒退科目。递进系数=|((80-90)/90)*100|=11.111,记为{倒退科目:数学,倒退幅度:11.111}。获取数学所属能力项为智,则最终结果记为{数学,11.111,智}。
基于k-means识别科目代表的能力项。
获取所有科目名称以及各科目的描述文本。首先将各科目的描述文本按句拆分,对拆分后的每句话分词并去除其中的停用词,最后得到各个科目的词项。然后计算各个科目的词项的TF-IDF值,词频TF=词项出现的次数/描述文本所有词项总数,逆向文件频率:
TF-IDF=TF*IDF。通过预设第四阈值提取各科目的描述关键词,TF-IDF值大于第四阈值的词项为描述关键词,记为科目名称、描述关键词。计算所有科目的描述文本中的所有词项的TF-IDF值,并转化成TF-IDF矩阵进行k-means聚类。随机选取五个类中心点,遍历所有词项并计算各词项聚类中心的距离d=|x1-x2|^2,距离越近说明该词项和类中心属于同一类,然后取各类均值作为新的类中心重新进行分类,直到类中心不再发生变化。统计聚类结果并分别命名为德智体美劳五个能力项。获取待识别科目名称及描述文本,计算描述文本中所有词项的TF-IDF值,提取描述关键词,计算关键词到五个类中心的距离,取最小距离作为分类标准,即关键词到类中心距离最小的类为待识别科目所属科目。例如,获取科目名称为高等数学,科目的描述文本为“高等数学是数学的对象和方法较为复杂的模块,是由微积分、代数、几何及其交叉内容构成的基础学科”。去除停用词后得到高等数学的词项为:高等、数学、数学、对象、方法、复杂、模块、微积分、代数、几何、交叉、内容、基础、学科。计算“数学”的TF-IDF值,TF=2/14=0.14,假设各科目的描述文本总数为1000,包含“数学”的描述文本有19个,则IDF=lg1000/20=1.7,TF-IDF=0.14*1.7=0.238。TF-IDF是一种统计方法,如果一个词项在一个描述文本中出现的频率高,在其他的描述文本中出现的频率低,则认为这个词项具有显著的区分能力,适合用于分类。预设第四阈值为0.1,则“数学”应为高等数学科目的关键词之一。计算所有科目的描述文本中的所有词项的TF-IDF值,并转化成TF-IDF矩阵进行k-means聚类。假设共有数据:0,0.05,0.2,0.25,0.4,0.45,0.6,0.65,0.8,0.85,五个类中心的TF-IDF值分别为0、0.2、0.4、0.6、0.8。计算距离之后的分类结果为(0,0.05)(0.2,0.25)(0.4,0.45)(0.6,0.65)(0.8,0.85),则新的类中心为0.025、0.225、0.425、0.625、0.825,若此时类中心不再变化五个类中心为0.025、0.225、0.425、0.625、0.825。计算高等数学所有关键词到所属五个类中心的距离,结果显示“数学”的TF-IDF值到第二类0.225最小,即通过k-means聚类得到高等数学属于智类,即高等数学成绩的高低代表学生智方面的能力。其他学科也可以以此类推判断能力项。
步骤103,判断能力项的稳定性和总成绩稳定性。
首先计算各能力项的稳定性指数。获取同一能力项的所有科目的稳定性指数,计算所述稳定性指数的平均值作为能力项的稳定性指数。最后,将能力项的稳定性指数的平均值作为总成绩的稳定性指数。输出最后结果为能力项:能力项的稳定性指数,总成绩的稳定性指数。例如,获取智方面的能力项包含的所有科目的稳定性指数为2.855和16.818,则智方面的能力项的稳定性指数为(2.855+16.818)/2=9.8365。若德智体美劳五个能力项的稳定性指数分别为1、9.8365、2、3、4则总成绩的稳定性指数为(1+9.8365+2+3+4)/5=3.9673。输出最后的结果为{德:1,智:9.8365,体:2,美:3,劳:4,总成绩稳定性指数:3.9673}。
步骤104,识别倒退科目属于优势还是劣势科目,判断是否进行隐私保护。
获取学生学号、倒退科目的名称、本次考试成绩和历次考试成绩,通过平均递进系数判断倒退科目属于优势科目还是劣势科目。若属于劣势科目,则需要进行隐私保护,否则进行下一步。获取倒退可信度acc,并预设第三阈值。当倒退可信度acc大于或等于第三阈值,则说明倒退科目成绩体现了学生的真实能力,即表示学生不是波动性倒退,而是能力不足,需要进行隐私保护。当倒退可信度acc小于第三阈值,则说明学生此次考试是波动性倒退,不用进行隐私保护。根据倒退科目的名称获取所属能力项,对能力项标注是否进行隐私保护,即输出结果为能力项:是否进行隐私保护。例如,获取学号为111111的学生的数学科目本次考试成绩和历次考试成绩,通过平均递进系数判断数学属于学生A的优势科目,且倒退可信度acc=0.9888。若预设第三阈值为0.8,则说明本次考试体现了学生A的真实数学能力,不是波动性倒退,而是能力不足,需要进行隐私保护。获取数学科目所属的能力项为智,则输出{智:是}。若预设第三阈值为0.99,则说明学生此次考试是波动性倒退,不用进行隐私保护,输出{智:否}。
根据学生画像预测倒退科目的成绩,并计算倒退可信度。
请参阅图2,获取倒退科目的名称、学生个人倒退科目的分数、学生个人倒退科目的及格率、倒退科目的平均分、倒退科目的班级及格率、本次考试倒退科目的班级平均分、本次考试难度系数七个属性作为学生画像的特征训练集。将所述特征训练集输入BP神经网络中训练,训练完成后需输入倒退科目的名称、学生个人倒退科目的及格率、倒退科目的平均分、倒退科目的班级及格率、本次考试倒退科目的班级平均分、本次考试难度系数六个属性,来实现对学生个人倒退科目的分数的预测。即获取倒退科目的名称、学生个人倒退科目的及格率、倒退科目的平均分、倒退科目的班级及格率、本次考试倒退科目的班级平均分、本次考试难度系数六个属性,输入已训练好的BP神经网络,得到学生个人倒退科目的预测分数。获取学生上次考试中倒退科目的分数,计算预测倒退幅度=学生个人倒退科目的预测分数/上次考试中倒退科目的成绩,记为F。获取学生个人倒退科目的实际倒退幅度,记为A。计算倒退可信度acc,acc=1-|F-A|/A,acc越大说明预测值越精确,倒退科目成绩越能反应学生的真实能力,即表示学生不是波动性倒退,而是能力不足。例如,将倒退科目的名称、学生个人倒退科目的及格率、倒退科目的平均分、倒退科目的班级及格率、本次考试倒退科目的班级平均分、本次考试难度系数:{英语,98%,75,60%,85,4}输入已训练好的BP神经网络,得到学生个人倒退科目的预测分数为81分。获取学生上次考试中英语的分数为90,计算F=81/90=0.9。获取学生个人倒退科目的实际分数为80分,计算A=80/90=0.89。计算倒退可信度acc=1-|0.9-0.89|/0.89=0.9888,表示该学生不是波动性倒退,而是能力不足。当学生某一门科目成绩倒退时,通过倒退可信度可以判断学生是真的能力倒退,还是因为其他原因造成的波动性倒退,即发挥失常。若学生是真的能力倒退则需要进行隐私保护,否则应当予以公布激励学生继续努力。
步骤105,对学生成绩进行隐私保护。
首先获取目标学生各个科目的成绩,识别并筛选出优势科目输出至学生端,输出内容为学号,科目名称,分数,科目稳定性。获取目标学生需要进行隐私保护的能力项,基于差分隐私的学生成绩隐私保护技术对学生需要进行隐私保护的能力项的数据进行处理,并重新计算各能力项的稳定性指数和总成绩的稳定性指数后输出至学生端。对于各能力项下的详细科目成绩,采用用户认证的方法进行隐私保护。通过用户认证后将学号,科目名称、分数、优势/劣势,科目稳定性,倒退幅度输出至学生端。例如,学生A的数学、语文为优势科目,需要进行隐私保护的能力项为智,则未进行用户认证时可在学生端收到如下成绩数据:{111111,数学,99,1}{111111,语文,98,1}以及{德:1,智:2.56,体:3,美:4,劳:5,总成绩稳定性指数:3.112}。通过用户认证后则可以查看所有科目的数据。对学生成绩的隐私保护融合了差分隐私和用户认证两种隐私保护技术。未进行用户认证时公布学生优势科目的详细分数,以便学生再次提升,而各能力项的稳定性指数和总成绩的稳定性指数是评估学生综合能力的指标,对其进行差分隐私既可以起到保护学生隐私的作用,又可以让学生清除自身能力长处与短处。
基于差分隐私的学生成绩隐私保护技术。
获取目标学生各个科目的成绩,记为数据集A。将A按照德智体美劳五个能力项分为拉普拉斯五组:A1,A2,A3,A4,A5,即A=A1+A2+A3+A4+A5,A1,A2,A3,A4,A5分别为德、智、体、美、劳五个能力项包含的科目成绩数据集。获取需要进行隐私保护的能力项数据,并注入拉普拉斯噪声,M=f+Y,其中M为加噪后的数据,f为原数据,Y为噪声。生成加噪数据集A'=A1'+A2'+A3'+A4'+A5',A1'、A2'、A3'、A4'、A5'分别为加噪后的德、智、体、美、劳五个能力项包含的科目成绩数据集。分别计算数据集A1'、A2'、A3'、A4'、A5'的稳定性指数的平均值作为能力项的稳定性指数,将所述能力项的稳定性指数的平均值作为总成绩的稳定性指数。例如,获取学生A的各个科目的成绩,得到数据集A=A1+A2+A3+A4+A5。其中A1为思想品德和马克思主义基本原理概论的成绩数据集,A2为数学和英语的成绩数据集,A3为羽毛球和排球的成绩数据集,A4为摄影和绘画的成绩数据集,A5为志愿活动课的成绩数据集。获取需要进行隐私保护的能力项为智,即对A2数据集进行差分隐私,假设注入拉普拉斯噪声之前,学生A的数学和英语成绩分别为为90和80,注入噪声后学生A的数学和英语成绩分别为90.13和80.98。添加完噪声之后原能力项稳定性指数将会发生改变,假设学生A德智体美劳五个能力项的稳定性分别为1、2、3、4、5,注入噪声后德智体美劳五个能力项的稳定性分别为1、2.56、3、4、4,总成绩的稳定性指数为(1+2.56+3+4+5)/5=3.112。拉普拉斯噪声指随机选取数据利用M=f+Y实现数据变化,其中M为加噪后的数据,f为原数据,Y为噪声,如上述例子中选取了第二项和第五项分别加了0.56和1。
基于用户认证的隐私保护技术。
建立个人身份信息数据库,包括账号和密码。进行用户认证时,需要获取输入的账号和密码。通过字符串匹配账号、密码是否对应,若对应,则输出学号,科目名称、分数、优势/劣势,科目稳定性,倒退幅度。其中,若科目不是对应学生的倒退科目,则倒退幅度输出为0。若字符串匹配失败,则无法查看详细科目分数。例如,学生A学号111111,密码000000。进行用户认证时,后台加载学生个人身份信息与用户输入的字符进行匹配,若匹配一致则通过检验。输出{111111,英语,80,优势科目,1.2,0.9},{111111,数学,90,优势科目,3.7,6.8},{111111,物理,75,劣势科目,0.1,0}。其中,英语和数学是不需要进行隐私保护的科目。当用户用户认证失败或未进行用户认证时,则无法查看学生详细科目分数。
步骤106,针对需要进行隐私保护的不同能力项进行学生跟踪。
获取目标学生需要进行隐私保护的能力项,对不同能力项采用不同跟踪方式。对于德育能力项,基于网络舆情跟踪学生德育能力,即通过分析学生在社交网络发表的文本情感态度,跟踪学生德育观念的水平并将学生德育水平输入后台数据库。对于智育和美育,获取学生学习时间和学习次数,基于BP神经网络预测学生完成能力提升所需要的时间并输入后台数据库,以此跟踪学生的学习进度。对于体育和劳育,获取学生体育活动时间与参与劳育活动次数并输入后台数据库,跟踪学生的体劳水平。例如,目标学生需要进行隐私保护的能力项为德育,则应基于网络舆情跟踪学生德育能力,若目标学生在社交网络发表的文本情感识别为积极情感,则该生德育观念的水平为:德育水平高,将结果输入后台数据库。若目标学生需要进行隐私保护的能力项为智育或美育,则预测学生完成能力提升所需要的时间,若预测完成时间为12天,则将12天输入后台数据库。若目标学生需要进行隐私保护的能力项为体育或劳育,且学生体育活动时间为12h与参与劳育活动次数6次,则将{体育:12h,劳育:6次}输入后台数据库。
基于网络舆情跟踪学生德育能力。
请参阅图3,通过公开的接口获取目标学生的社交网络中的文本数据,包括评论文本和博文文本。基于jieba分词对所有文本进行分词并去除停用词,通过TD-IDF值提取出每条文本中的关键词项。然后对关键词进行情感特征提取,即参照波森情感词典对词项赋权值。对于否定词以外的词项采用累加方式赋权值,一个积极情感词项权值为1,一个消极情感词项权值为-1,中性词项权值为0。对于否定词采用(-1)^n计算权值,n表示否定词出现的次数。统计学生每条文本的情感分值S=Σdi*si,其中di表示否定词权值,si表示否定词以外的词项的权值。根据S为学生每条文本建立标签,若S>0,标记为积极情感,S=0标记为中性情感,S<0标记为消极情感。其中,积极情感表示学生德育水平高,中性情感表示学生德育水平中等,消极情感表示学生德育水平低。例如,学生的一条文本为:“正义,维护世界和平就是你了”,利用jieba分词对所有文本进行分词并去除停用词后得到“正义、维护、世界、和平、你”。根据波森情感词典,“正义、和平、维护”为积极情感词项,“世界、你”为中性情感词项,则该条文本的情感分值S=1*3=3>0。因此该条文本应标记为积极情感,即该学生德育水平高。
基于BP神经网络预测智育、美育能力完成时间。
以本次需要进行隐私保护的能力项作为目标能力项。加载目标能力项的历次稳定性指数和总成绩的稳定性指数,获取需要进行隐私保护的学生的学号、学习时长、学习次数以及数据采集日期,作为训练集,输入BP神经网络中训练。其中,所述目标能力项的稳定性指数和总成绩的稳定性指数为历次考试的数据。然后制作输入集,每隔3天获取一次学生学习时长、学习次数以及数据采集的日期,预测目标能力项的稳定性指数和总成绩的稳定性指数。预设第四阈值和第五阈值,当预测的目标能力项的稳定性指数小于第四阈值并且总成绩的稳定性指数小于第五阈值时,输出此时的数据采集日期。计算此时的数据采集日期距离制作输入集第一次进行数据采集的日期的天数,以此作为预测完成时间。例如,一共获取了学生9天内的数据:{15h,3次,2022.7.3}{18h,12次,2022.7.6}{21h,12次,2022.7.9}。预测目标能力项的稳定性指数和总成绩的稳定性指数为2和3,预设的四阈值和第五阈值分别为1和2,因此还未满足要求。继续采集信息{21h,4次,2022.7.12},预测目标能力项的稳定性指数和总成绩的稳定性指数为0.5和1,则记录时间2022.7.12。第一次进行数据采集的日期为2022.7.3,因此预测完成时间为12天。
步骤107,根据隐私保护能力项的跟踪结果,对学习能力进行优化干预。
获取隐私保护能力项的跟踪结果,对学习能力进行优化干预。若隐私保护能力项包括德育,则加载德育能力项跟踪结果,判断结果是否为“德育水平高”,若不是,则向学生端输出提示“请尽快完成德育能力优化”,否则不进行操作。若隐私保护能力项包括智育或美育,则加载智育或美育能力项跟踪结果,根据预测完成时间,对学习能力进行优化干预。若隐私保护能力项包括体育,设定第六阈值,当体育活动时间小于第六阈值则说明学生能力提升缓慢,需向学生端输出提示“请尽快完成体育能力优化”,否则不进行操作。若隐私保护能力项包括劳育,设定第七阈值,当劳育活动次数小于第七阈值则说明学生劳育实践不足,需向学生端输出提示“请尽快完成劳育能力优化”,否则不进行操作。例如,若学生德育结果为德育水平中等,则向学生端输出提示“请尽快完成德育能力优化”;若学生智育或美育的预测完成时间为12天,且大于距离下一次考试的天数,则向学生端输出提示“请尽快完成能力优化”;若学生体育活动时间为12h,第六阈值为20h,则向学生端输出提示“请尽快完成体育能力优化”;若学生劳育活动次数为6次,第七阈值为10次,则向学生端输出提示“请尽快完成劳育能力优化”。若学生需要进行隐私保护能力项包括德育和体育,则获取德育能力项跟踪结果及体育活动时间,分别按照德育和体育的优化干预方式对学生进行优化干预。
根据预测完成时间,对学习能力进行优化干预。
获取学生需要进行隐私保护的能力项改善方案的预测完成时间,以及获取数据当天距离下一次考试的天数。比较所述预测完成时间和获取数据当天距离下一次考试的天数的大小。若预测完成时间大于获取数据当天距离下一次考试的天数,则向学生端输出提示“请尽快完成能力优化”。若预测完成时间小于获取数据当天距离下一次考试的天数,则不进行操作。例如,学生A要进行隐私保护的能力项为智,改善方案的预测完成时间为12天,若获取数据当天距离下一次考试的天数为30天,则不进行操作。若获取数据当天距离下一次考试的天数为10天,则向学生端输出提示“请尽快完成能力优化”,一次达到催促学生学习,对学习能力提升改善进行优化干预的目的。
步骤108,根据隐私保护范围,分配成绩查看管理系统权限。
根据隐私保护范围分配成绩查看的权限,将权限分为一级、二级权限和三级权限,分别用1、2、3标识。其中一级权限为最高权限,二级权限和三级权限依次递减。一级权限显示所有详细科目分数,包括需要进行隐私保护的科目,二级权限显示进行差分隐私后的数据,包括优势科目分数、德智体美劳的稳定性及总成绩的稳定性,三级权限只显示所有科目的分数段。当权限状态为关闭时,则权限失效,无法查看隐私保护内容。获取用户认证结果,并根据用户账号识别用户身份,若认证成功且为学生账号,则将赋予一级权限,若为班主任老师账号,则赋予二级权限,若为其他老师,则赋予三级权限。例如,学生A认证成功后,获得一级权限,可查看各科详细分数。根据学生A的学号识别出该学生需要进行隐私保护,则班主任认证成功后,查看进行差分隐私后的数据为优势科目分数:{111111,数学,99}{111111,语文,98}以及德智体美劳的稳定性及总成绩的稳定性:{德:1,智:2.56,体:3,美:4,劳:5,总成绩稳定性指数:3.112}。若其他老师认证成功后,只能查看该生各科目的分数段,如数学、语文。
以上所述,仅为本说明书的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本说明书的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本说明书揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本说明书的保护范围之内。
Claims (9)
1.一种融合隐私保护的学生综合能力评测方法,其特征在于,所述方法包括:
获取学生各科目的成绩,判断优势科目与劣势科目及其稳定性;
识别倒退科目及所属能力项,计算倒退幅度,并基于k-means识别科目代表的能力项;
判断能力项的稳定性和总成绩稳定性;
识别倒退科目属于优势还是劣势科目,判断是否进行隐私保护,根据学生画像预测倒退科目的成绩,并计算倒退可信度;
对学生成绩进行隐私保护,基于差分隐私的学生成绩隐私保护技术与基于用户认证的隐私保护技术对所述学生成绩进行保护;
针对需要进行隐私保护的不同能力项进行学生跟踪,其中,基于网络舆情跟踪学生德育能力,并基于BP神经网络预测智育与美育能力完成时间;
根据隐私保护能力项的跟踪结果,以及根据学生需要进行隐私保护的能力项改善方案的预测完成时间,对学习能力进行优化干预;
根据隐私保护范围,分配成绩查看管理系统权限。
2.根据权利要求1所述的方法,其中,所述获取学生各科目的成绩,判断优势科目与劣势科目及其稳定性,包括:
获取目标学生各个科目的成绩,包括本次考试成绩和历次考试成绩;首先判断学生的优势科目和劣势科目;用递进系数反应每次考试成绩的变化趋势:
Di=((Yi-X(i-1))/X(i-1))*100 ;
其中Di为递进系数,Yi为本次考试成绩,X(i-1)为上次考试成绩;逐次计算目标学生各科目的递进系数,记录科目名称和递进系数Di,对各个科目的递进系数求平均;对全班学生目标科目的递进系数求平均,并作为第一阈值;若平均递进系数大于所述第一阈值,说明考试成绩高于平均水平,属于优势科目;若递进系数的平均值小于或等于第一阈值,说明考试成绩低于平均水平,属于劣势科目;然后计算目标学生各科目的稳定性指数;对所述目标学生的各科目的递进系数求标准差,作为目标学生各科目的稳定性指数,将全班学生对应科目的递进系数标准差作为第二阈值;若所述稳定性指数小于第二阈值,则说明目标学生的目标科目成绩稳定性高;若所述稳定性指数大于等于第二阈值,则说明目标学生的目标科目成绩稳定性低。
3.根据权利要求1所述的方法,其中,所述识别倒退科目及所属能力项,计算倒退幅度,包括:
首先识别倒退科目及倒退幅度;获取学生本次目标科目成绩和上次目标科目成绩数据,计算目标科目成绩环比;其中,目标科目成绩环比=本次目标科目成绩/上次目标科目成绩;比较目标科目成绩环比与1的大小,若目标科目成绩环比大于1,则说明目标科目为进步科目;若目标科目成绩环比等于1,则说明目标科目不进不退;若目标科目成绩环比小于1,则说明目标科目为倒退科目,用倒退科目的递进系数的绝对值表示其倒退幅度;然后根据倒退科目名称和科目的描述文本获取所属能力项,将最终结果记为倒退科目名称、倒退幅度、能力项;
所述基于k-means识别科目代表的能力项,具体包括:
获取所有科目名称以及各科目的描述文本;首先将各科目的描述文本按句拆分,对拆
分后的每句话分词并去除其中的停用词,最后得到各个科目的词项;然后计算各个科目的
词项的TF-IDF值,词频TF=,逆向文件频率:
TF-IDF=TF*IDF;通过预设第四阈值提取各科目的描述关键词,TF-IDF值大于第四阈值
的词项为描述关键词,记为科目名称、描述关键词;计算所有科目的描述文本中的所有词项
的TF-IDF值,并转化成TF-IDF矩阵进行k-means聚类;随机选取五个类中心点,遍历所有词
项并计算各词项聚类中心的距离,其中,x1是第一个词的TF-IDF值,x2是第
二个词的TF-IDF值,距离越近说明该词项和类中心属于同一类,然后取各类均值作为新的
类中心重新进行分类,直到类中心不再发生变化;统计聚类结果并分别命名为德智体美劳
五个能力项;获取待识别科目名称及描述文本,计算描述文本中所有词项的TF-IDF值,提取
描述关键词,计算关键词到五个类中心的距离,取最小距离作为分类标准,即关键词到类中
心距离最小的类为待识别科目所属科目。
4.根据权利要求1所述的方法,其中,所述判断能力项的稳定性和总成绩稳定性,包括:
首先计算各能力项的稳定性指数;获取同一能力项的所有科目的稳定性指数,计算所述稳定性指数的平均值作为能力项的稳定性指数;最后,将能力项的稳定性指数的平均值作为总成绩的稳定性指数;输出最后结果为能力项:能力项的稳定性指数,总成绩的稳定性指数。
5.根据权利要求1所述的方法,其中,所述识别倒退科目属于优势还是劣势科目,判断是否进行隐私保护,包括:
获取学生学号、倒退科目的名称、本次考试成绩和历次考试成绩,通过平均递进系数判断倒退科目属于优势科目还是劣势科目;若属于劣势科目,则需要进行隐私保护,否则进行下一步;获取倒退可信度acc,并预设第三阈值;当倒退可信度acc大于或等于第三阈值,则说明倒退科目成绩体现了学生的真实能力,即表示学生不是波动性倒退,而是能力不足,需要进行隐私保护;当倒退可信度acc小于第三阈值,则说明学生此次考试是波动性倒退,不用进行隐私保护;根据倒退科目的名称获取所属能力项,对能力项标注是否进行隐私保护,即输出结果为:是否进行隐私保护;
所述根据学生画像预测倒退科目的成绩,并计算倒退可信度,具体包括:
获取倒退科目的名称、学生个人倒退科目的分数、学生个人倒退科目的及格率、倒退科
目的平均分、倒退科目的班级及格率、本次考试倒退科目的班级平均分、本次考试难度系数
七个属性作为学生画像的特征训练集;将所述特征训练集输入BP神经网络中训练,训练完
成后需输入倒退科目的名称、学生个人倒退科目的及格率、倒退科目的平均分、倒退科目的
班级及格率、本次考试倒退科目的班级平均分、本次考试难度系数六个属性,来实现对学生
个人倒退科目的分数的预测;即获取倒退科目的名称、学生个人倒退科目的及格率、倒退科
目的平均分、倒退科目的班级及格率、本次考试倒退科目的班级平均分、本次考试难度系数
六个属性,输入已训练好的BP神经网络,得到学生个人倒退科目的预测分数;获取学生上次
考试中倒退科目的分数,计算预测倒退幅度=学生个人倒退科目的预测分数/上次考试中倒
退科目的成绩,记为F;获取学生个人倒退科目的实际倒退幅度,记为A;计算倒退可信度
acc,,acc越大说明预测值越精确,倒退科目成绩越能反应学生的真实能
力,即表示学生不是波动性倒退,而是能力不足。
6.根据权利要求1所述的方法,其中,所述对学生成绩进行隐私保护,包括:
首先获取目标学生各个科目的成绩,识别并筛选出优势科目输出至学生端,输出内容为学号,科目名称,分数,科目稳定性;获取目标学生需要进行隐私保护的能力项,基于差分隐私的学生成绩隐私保护技术对学生需要进行隐私保护的能力项的数据进行处理,并重新计算各能力项的稳定性指数和总成绩的稳定性指数后输出至学生端;对于各能力项下的详细科目成绩,采用用户认证的方法进行隐私保护;通过用户认证后将学号,科目名称、分数、优势/劣势,科目稳定性,倒退幅度输出至学生端;
所述基于差分隐私的学生成绩隐私保护技术,具体包括:
获取目标学生各个科目的成绩,记为数据集A;将A按照德智体美劳五个能力项分为拉普拉斯五组:A1,A2,A3,A4,A5,即A=A1+A2+A3+A4+A5,A1,A2,A3,A4,A5分别为德、智、体、美、劳五个能力项包含的科目成绩数据集;获取需要进行隐私保护的能力项数据,并注入拉普拉斯噪声,M=f+Y,其中M为加噪后的数据,f为原数据,Y为噪声;生成加噪数据集A'=A1'+A2'+A3'+A4'+A5',A1'、A2'、A3'、A4'、A5'分别为加噪后的德、智、体、美、劳五个能力项包含的科目成绩数据集;分别计算数据集A1'、A2'、A3'、A4'、A5'的稳定性指数的平均值作为能力项的稳定性指数,将所述能力项的稳定性指数的平均值作为总成绩的稳定性指数;
所述基于用户认证的隐私保护技术,具体包括:
建立个人身份信息数据库,包括账号和密码;进行用户认证时,需要获取输入的账号和密码;通过字符串匹配账号、密码是否对应,若对应,则输出学号,科目名称、分数、优势、劣势,科目稳定性,倒退幅度;其中,若科目不是对应学生的倒退科目,则倒退幅度输出为0;若字符串匹配失败,则无法查看详细科目分数。
7.根据权利要求1所述的方法,其中,所述针对需要进行隐私保护的不同能力项进行学生跟踪,包括:
获取目标学生需要进行隐私保护的能力项,对不同能力项采用不同跟踪方式;对于德育能力项,基于网络舆情跟踪学生德育能力,即通过分析学生在社交网络发表的文本情感态度,跟踪学生德育观念的水平并将学生德育水平输入后台数据库;对于智育和美育,获取学生学习时间和学习次数,基于BP神经网络预测学生完成能力提升所需要的时间并输入后台数据库,以此跟踪学生的学习进度;对于体育和劳育,获取学生体育活动时间与参与劳育活动次数并输入后台数据库,跟踪学生的体劳水平;
所述基于网络舆情跟踪学生德育能力,具体包括:
通过公开的接口获取目标学生的社交网络中的文本数据,包括评论文本和博文文本;
基于jieba分词对所有文本进行分词并去除停用词,通过TD-IDF值提取出每条文本中的关
键词项;然后对关键词进行情感特征提取,即参照波森情感词典对词项赋权值;对于否定词
以外的词项采用累加方式赋权值,一个积极情感词项权值为1,一个消极情感词项权值为-
1,中性词项权值为0;对于否定词采用计算权值,n表示否定词出现的次数;统计学
生每条文本的情感分值,其中di表示否定词权值,si表示否定词以外的词
项的权值;根据S为学生每条文本建立标签,若S>0,标记为积极情感,S=0标记为中性情感,S
<0标记为消极情感;其中,积极情感表示学生德育水平高,中性情感表示学生德育水平中
等,消极情感表示学生德育水平低;
所述基于BP神经网络预测智育、美育能力完成时间,具体包括:
以本次需要进行隐私保护的能力项作为目标能力项;加载目标能力项的历次稳定性指数和总成绩的稳定性指数,获取需要进行隐私保护的学生的学号、学习时长、学习次数以及数据采集日期,作为训练集,输入BP神经网络中训练;其中,所述目标能力项的稳定性指数和总成绩的稳定性指数为历次考试的数据;然后制作输入集,每隔3天获取一次学生学习时长、学习次数以及数据采集的日期,预测目标能力项的稳定性指数和总成绩的稳定性指数;预设第四阈值和第五阈值,当预测的目标能力项的稳定性指数小于第四阈值并且总成绩的稳定性指数小于第五阈值时,输出此时的数据采集日期;计算此时的数据采集日期距离制作输入集第一次进行数据采集的日期的天数,以此作为预测完成时间。
8.根据权利要求1所述的方法,其中,所述对学习能力进行优化干预,包括:
获取隐私保护能力项的跟踪结果,对学习能力进行优化干预;若隐私保护能力项包括德育,则加载德育能力项跟踪结果,判断结果是否为“德育水平高”,若不是,则向学生端输出提示“请尽快完成德育能力优化”,否则不进行操作;若隐私保护能力项包括智育或美育,则加载智育或美育能力项跟踪结果,根据预测完成时间,对学习能力进行优化干预;若隐私保护能力项包括体育,设定第六阈值,当体育活动时间小于第六阈值则说明学生能力提升缓慢,需向学生端输出提示“请尽快完成体育能力优化”,否则不进行操作;若隐私保护能力项包括劳育,设定第七阈值,当劳育活动次数小于第七阈值则说明学生劳育实践不足,需向学生端输出提示“请尽快完成劳育能力优化”,否则不进行操作;
所述根据预测完成时间,对学习能力进行优化干预,具体包括:
获取学生需要进行隐私保护的能力项改善方案的预测完成时间,以及获取数据当天距离下一次考试的天数;比较所述预测完成时间和获取数据当天距离下一次考试的天数的大小;若预测完成时间大于获取数据当天距离下一次考试的天数,则向学生端输出提示“请尽快完成能力优化”;若预测完成时间小于获取数据当天距离下一次考试的天数,则不进行操作。
9.根据权利要求1所述的方法,其中,所述根据隐私保护范围,分配成绩查看管理系统权限,包括:
根据隐私保护范围分配成绩查看的权限,将权限分为一级、二级权限和三级权限,分别用1、2、3标识;其中一级权限为最高权限,二级权限和三级权限依次递减;一级权限显示所有详细科目分数,包括需要进行隐私保护的科目,二级权限显示进行差分隐私后的数据,包括优势科目分数、德智体美劳的稳定性及总成绩的稳定性,三级权限只显示所有科目的分数段;当权限状态为关闭时,则权限失效,无法查看隐私保护内容;获取用户认证结果,并根据用户账号识别用户身份,若认证成功且为学生账号,则将赋予一级权限,若为班主任老师账号,则赋予二级权限,若为其他老师,则赋予三级权限。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211050231.4A CN115115483B (zh) | 2022-08-31 | 2022-08-31 | 一种融合隐私保护的学生综合能力评测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211050231.4A CN115115483B (zh) | 2022-08-31 | 2022-08-31 | 一种融合隐私保护的学生综合能力评测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115115483A CN115115483A (zh) | 2022-09-27 |
CN115115483B true CN115115483B (zh) | 2022-11-25 |
Family
ID=83335582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211050231.4A Active CN115115483B (zh) | 2022-08-31 | 2022-08-31 | 一种融合隐私保护的学生综合能力评测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115115483B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115578226A (zh) * | 2022-11-04 | 2023-01-06 | 广州宏途数字科技有限公司 | 一种基于大数据的学情分析方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10861116B1 (en) * | 2014-03-13 | 2020-12-08 | James Onstad | System and methods to facilitate student data privacy compliance and management for schools |
CN112561305A (zh) * | 2020-12-10 | 2021-03-26 | 上海对外经贸大学 | 基于层次模型的企业数据隐私保护评估方法 |
CN113656749A (zh) * | 2021-08-26 | 2021-11-16 | 北京通建泰利特智能系统工程技术有限公司 | 基于大数据的智慧教育管理方法、系统和可读存储介质 |
CN114862636A (zh) * | 2022-05-01 | 2022-08-05 | 深圳季连科技有限公司 | 一种金融智能授课与隐私保护方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109166067A (zh) * | 2018-10-16 | 2019-01-08 | 温州洪启信息科技有限公司 | 基于云平台的智慧校园学生信息管理系统 |
CN113300839A (zh) * | 2021-05-18 | 2021-08-24 | 上海市格致中学 | 一种用于学生成绩表的身份认证系统及方法 |
-
2022
- 2022-08-31 CN CN202211050231.4A patent/CN115115483B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10861116B1 (en) * | 2014-03-13 | 2020-12-08 | James Onstad | System and methods to facilitate student data privacy compliance and management for schools |
CN112561305A (zh) * | 2020-12-10 | 2021-03-26 | 上海对外经贸大学 | 基于层次模型的企业数据隐私保护评估方法 |
CN113656749A (zh) * | 2021-08-26 | 2021-11-16 | 北京通建泰利特智能系统工程技术有限公司 | 基于大数据的智慧教育管理方法、系统和可读存储介质 |
CN114862636A (zh) * | 2022-05-01 | 2022-08-05 | 深圳季连科技有限公司 | 一种金融智能授课与隐私保护方法 |
Non-Patent Citations (2)
Title |
---|
基于差分隐私的学生成绩隐私保护系统;朱晓燕等;《江汉大学学报(自然科学版)》;20171028(第05期);429-433 * |
面向教务发布的隐私保护研究;王亚男等;《河北软件职业技术学院学报》;20171218(第04期);17-18、29 * |
Also Published As
Publication number | Publication date |
---|---|
CN115115483A (zh) | 2022-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | The efficacy of common fit indices for enumerating classes in growth mixture models when nested data structure is ignored: A Monte Carlo study | |
Jupp | The Sage dictionary of social research methods | |
Wang et al. | Classification of proactive personality: Text mining based on weibo text and short-answer questions text | |
Shu | Knowledge discovery in the social sciences: A data mining approach | |
CN109409433A (zh) | 一种社交网络用户的人格识别系统和方法 | |
Taylor et al. | Artificial intelligence from colonial india: Race, statistics, and facial recognition in the global south | |
CN112287197A (zh) | 动态记忆案件描述的涉案微博评论讽刺句检测方法 | |
Chung et al. | Text-mining open-ended survey responses using structural topic modeling: A practical demonstration to understand parents’ coping methods during the COVID-19 pandemic in Singapore | |
CN115115483B (zh) | 一种融合隐私保护的学生综合能力评测方法 | |
Leman et al. | Rabin karp and Winnowing algorithm for Statistics of text document plagiarism detection | |
da Rocha et al. | A text as unique as a fingerprint: Text analysis and authorship recognition in a Virtual Learning Environment of the Unified Health System in Brazil | |
CN115617960A (zh) | 一种岗位推荐方法及装置 | |
Culpepper et al. | Bayesian estimation of multivariate latent regression models: Gauss versus Laplace | |
Wibowo et al. | A K-Nearest Algorithm Based Application To Predict Snmptn Acceptance For High School Students In Indonesia | |
Galiani et al. | Unveiling specialization trends in economics research: A large-scale study using natural language processing and citation Analysis | |
Ghadekar et al. | A Semantic Approach for Automated Hiring using Artificial Intelligence & Computer Vision | |
Liu et al. | Suggestion mining from online reviews usingrandom multimodel deep learning | |
Ma et al. | ACLSTM: A Novel Method for CQA Answer Quality Prediction Based on Question-Answer Joint Learning. | |
Asor et al. | RESEARCH++: An academic social networking research community portal for profiling and expertise classification | |
Sadeghi et al. | Predicting quality of life based on mental health state: A machine learning approach using Urban-HEART 2 | |
Theus | Striving for Affirmative Algorithmic Futures: How the Social Sciences can Promote more Equitable and Just Algorithmic System Design | |
Zhong et al. | A general personality prediction framework based on facebook profiles | |
Collier et al. | Finite mixture modeling for program evaluation: Resampling and pre-processing approaches | |
Tabaza et al. | An adaptive intelligent framework for assessment & selection process in staffing task | |
Utami et al. | Systematic Literature Review of Profiling Analysis Personality from Social Media |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |