CN113240323A - 基于机器学习的水平评测方法、装置及相关设备 - Google Patents
基于机器学习的水平评测方法、装置及相关设备 Download PDFInfo
- Publication number
- CN113240323A CN113240323A CN202110611203.4A CN202110611203A CN113240323A CN 113240323 A CN113240323 A CN 113240323A CN 202110611203 A CN202110611203 A CN 202110611203A CN 113240323 A CN113240323 A CN 113240323A
- Authority
- CN
- China
- Prior art keywords
- level
- answer
- information
- current level
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 33
- 238000011156 evaluation Methods 0.000 title description 11
- 230000004044 response Effects 0.000 claims abstract description 81
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000012706 support-vector machine Methods 0.000 claims abstract description 26
- 238000007477 logistic regression Methods 0.000 claims abstract description 22
- 238000003860 storage Methods 0.000 claims abstract description 12
- 238000009826 distribution Methods 0.000 claims description 49
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000012360 testing method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Educational Technology (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及人工智能技术领域,公开了一种基于机器学习的水平评测方法、装置、计算机设备及存储介质,该方法包括:获取所有用户的历史数据,并基于历史数据,确定当前用户的初始级别,作为当前级别,基于每个应答信息和历史数据,采用支持向量机模型确定当前用户新的级别,作为更新后的当前级别,并采用逻辑回归模型,确定更新后的当前级别对应的考核题目的数量,根据更新后的当前级别和更新后的当前级别对应的考核题目的数量,对考核信息进行更新,根据当前级别和更新后的当前级别的答题准确率确定当前用户的目标级别,根据用户的实时答题状态,动态调整当前级别及当前级别对应的出题数量,采用本发明可以更加精准地了解每个用户的真实能力水平。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于机器学习的水平评测方法、装置、计算机设备及存储介质。
背景技术
在互联网的普及下,传统的教学方式发生了变化,在线教育应运而生。为了给用户提供更好的教育服务,在进行在线教育之前,在线教育平台上对每个用户的知识水平进行评估,再根据评估结果为每个用户推荐相应的学习课程。
目前,对用户进行知识水平的评估方式,主要是采用一套具有固定测试题的试卷让用户进行作答,并根据得到的测试结果对用户的知识水平进行评估,最后根据评估结果为用户推荐相应的学习课程,如此仅通过采用一套具有固定测试题的试卷对用户进行测评,对于水平较高的用户来说,可能会得到相同的测评结果,进而导致无法对水平较高的用户的知识水平作出准确的判断,使得在线教育平台无法准确的为用户推荐与用户知识水平相应的学习课程。
发明内容
本发明实施例提供一种基于机器学习的水平评测方法、装置、计算机设备和存储介质,以提高评估每个用户的真实能力水平的准确性。
为了解决上述技术问题,本申请实施例提供一种基于机器学习的水平评测方法,包括:
获取所有用户的历史数据,并基于所述历史数据,确定当前用户的初始级别,作为当前级别;
向所述当前用户推送所述当前级别对应的考核信息,所述考核信息包括至少一个考核题目;
接收所述当前用户针对所述考核信息反馈的答复信息,作为应答信息,所述应答信息包括当前级别、答题数目、答题准确率和答题时长;
基于每个所述应答信息和所述历史数据,采用支持向量机模型确定所述当前用户新的级别,作为更新后的当前级别,并采用逻辑回归模型,确定所述更新后的当前级别对应的考核题目的数量;
根据所述更新后的当前级别和所述更新后的当前级别对应的考核题目的数量,对所述考核信息进行更新;
向所述当前用户推送更新后的考核信息,并返回所述接收所述当前用户针对所述考核信息反馈的答复信息,作为应答信息的步骤继续执行,直到更新后的当前级别超过预设等级阈值为止,或者,直到更新前后的答题准确率符合预设终止条件为止;
根据所述当前级别的答题准确率和所述更新后的当前级别的答题准确率确定所述当前用户的目标级别。
为了解决上述技术问题,本申请实施例还提供一种基于机器学习的水平评测装置,包括:
获取模块,用于获取所有用户的历史数据,并基于所述历史数据,确定当前用户的初始级别,作为当前级别;
第一推送模块,用于向所述当前用户推送所述当前级别对应的考核信息,所述考核信息包括至少一个考核题目;
接收模块,用于接收所述当前用户针对所述考核信息反馈的答复信息,作为应答信息,所述应答信息包括当前级别、答题数目、答题准确率和答题时长;
第一确定模块,用于基于每个所述应答信息和所述历史数据,采用支持向量机模型确定所述当前用户新的级别,作为更新后的当前级别,并采用逻辑回归模型,确定所述更新后的当前级别对应的考核题目的数量;
更新模块,用于根据所述更新后的当前级别和所述更新后的当前级别对应的考核题目的数量,对所述考核信息进行更新;
第二推送模块,用于向所述当前用户推送更新后的考核信息,并返回所述接收所述当前用户针对所述考核信息反馈的答复信息,作为应答信息的步骤继续执行,直到更新后的当前级别超过预设等级阈值为止,或者,直到更新前后的答题准确率符合预设终止条件为止;
第二确定模块,用于根据所述当前级别的答题准确率和所述更新后的当前级别的答题准确率确定所述当前用户的目标级别。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于机器学习的水平评测方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于机器学习的水平评测方法的步骤。
本发明实施例提供的基于机器学习的水平评测方法、装置、计算机设备及存储介质,通过获取所有用户的历史数据,并基于历史数据,确定当前用户的当前级别;向当前用户推送当前级别对应的考核信息,考核信息包括至少一个考核题目;接收当前用户针对考核信息反馈的答复信息,作为应答信息,应答信息包括当前级别、答题数目、答题准确率和答题时长;基于每个应答信息和历史数据,采用支持向量机模型确定当前用户新的级别,作为更新后的当前级别,并采用逻辑回归模型,确定更新后的当前级别对应的考核题目的数量;根据更新后的当前级别和更新后的当前级别对应的考核题目的数量,对考核信息进行更新;向当前用户推送更新后的考核信息,并返回接收当前用户针对考核信息反馈的答复信息,作为应答信息的步骤继续执行,直到更新后的当前级别超过预设等级阈值为止,或者,直到更新前后的答题准确率符合预设终止条件为止;根据当前级别的答题准确率和更新后的当前级别的答题准确率确定当前用户的目标级别,可根据用户的实时答题情况,并结合历史数据中的先验概率分布,动态调整当前用户的当前级别级别及当前级别对应的出题数量,提高评估每个用户的真实能力水平的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是本申请的基于机器学习的水平评测方法的一个实施例的流程图;
图3是根据本申请的基于机器学习的水平评测装置的一个实施例的结构示意图;
图4是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture EpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureEperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于机器学习的水平评测方法由服务器执行,相应地,基于机器学习的水平评测装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。
请参阅图2,图2示出本发明实施例提供的基于机器学习的水平评测方法,以该方法应用在图1中的服务端为例进行说明,详述如下:
S201:获取所有用户的历史数据,并基于历史数据,确定当前用户的初始级别,作为当前级别。
具体的,所有用户的历史数据包括但不限于所有用户的等级信息、答题时长信息、各等级答题数量信息。例如,对所有用户的等级信息进行先验概率计算得到的等级先验概率分布数据,假设等级先验概率分布数据中等级4的用户占比最高,则将等级4确定为当前用户的初始级别,作为当前级别。
S202:向当前用户推送当前级别对应的考核信息,考核信息包括至少一个考核题目。
具体的,题库中包括包括若干等级分类,每个等级分类下对应的有若干考核题目,从题库中抽取至少一个与当前级别对应等级分类对应的考核题目发送给当前用户进行考核。
S203:接收当前用户针对考核信息反馈的答复信息,作为应答信息,应答信息包括当前级别、答题数目、答题准确率和答题时长。
具体的,当前用户在进行作答后,通过网络传输协议,将针对考核题目的答案发送给服务端,服务端将当前用户的答案,与题库中的题目内容、题目领域和参考答案进行关联,生成应答信息。
S204:基于每个应答信息和历史数据,采用支持向量机模型确定当前用户新的级别,作为更新后的当前级别,并采用逻辑回归模型,确定更新后的当前级别对应的考核题目的数量。
具体的,通过对所有用户的答题时长信息、各等级答题数量信息分别进行先验概率分布计算,得到先验概率时长分布信息、先验概率答题数量分布信息,其中,先验概率时长分布信息包括所有用户完成所有考核题目时长的概率分布数据和所有用户完成各等级考核题目时长的概率分布数据,先验概率答题数量分布信息包括所有用户在各难度等级平均答题数量的概率分布数据,将应答信息中的组成要素,即当前级别、答题数目、答题准确率和答题时长与先验概率时长分布信息、先验概率答题数量分布信息进行拼接,得到拼接序列,将该拼接序列分别输入支持向量机模型和逻辑回归模型确定当前用户新的级别和更新后的当前级别对应的考核题目的数量。
S205:根据更新后的当前级别和更新后的当前级别对应的考核题目的数量,对考核信息进行更新。
具体的,从题库中抽取更新后的当前级别和更新后的当前级别对应的考核题目的数量在考核信息对应的数据表中进行添加,实现对考核信息进行更新。
S206:向当前用户推送更新后的考核信息,并返回接收当前用户针对考核信息反馈的答复信息,作为应答信息的步骤继续执行,直到更新后的当前级别超过预设等级阈值为止,或者,直到更新前后的答题准确率符合预设终止条件为止。
具体的,预设等级阈值为根据历史经验数据分析得到,预设的终止条件为更新前的答题准确率达到100%时且更新后的答题准确率低于100%。
S207:根据当前级别的答题准确率和更新后的当前级别的答题准确率确定当前用户的目标级别。
具体的,当前级别的答题准确率等于100%且更新后的当前级别的答题准确率等于0时,则将当前级别作为用户的目标级别,若当前级别的答题准确率等于100%且更新后的当前级别的答题准确率大于0时,则将更新后的当前级别作为用户的目标级别。
在本实施例中,获取所有用户的历史数据,并基于历史数据,确定当前用户的初始级别,作为当前级别,基于每个应答信息和历史数据,采用支持向量机模型确定当前用户新的级别,作为更新后的当前级别,并采用逻辑回归模型,确定更新后的当前级别对应的考核题目的数量,根据更新后的当前级别和更新后的当前级别对应的考核题目的数量,对考核信息进行更新,根据用户的实时答题状态,动态调整当前级别及当前级别对应的出题数量,可以更加精准地了解每个用户的真实能力水平。
在本实施例的一些可选的实现方式中,步骤S201中,历史数据为所有用户的等级信息,基于历史数据,确定当前用户的初始级别,作为当前级别的步骤包括步骤S2010至S2013:
S2010、对所有用户的等级信息进行先验概率分布计算,得到等级概率分布信息。
S2011、从等级概率分布信息中获取先验概率等级波峰值。
具体的,先验概率等级波峰值为等级概率分布信息中等级占比最多的等级。
S2012、获取当前用户的基础影响值。
具体的,基础影响值根据对所有用户的基础资料信息和历史数据分析得到,其中,基础资料信息包括学历、职业、年龄等,需要特别的说明的是基础影响值会根据数据动态配置调整。
例如,学历包括:硕士及以上、本科、专科、高中、初中、小学及学前,对应的基础影响值分别为3,2,1,0,-1,-2;
职业包括:学生、蓝领、上班族、自由派,对应的基础影响值分别为2,1,-1,-2;
年龄包括:20岁以下、20~30岁、30-40岁、40-50岁、50岁以上,对应的基础影响值分别为0,2,1,-1,-2。
S2013、根据基础影响值和先验概率等级波峰值,确定当前用户的初始级别,作为当前级别。
在本实施例中,通过从先验等级概率分布信息获取先验概率等级波峰值,并根据先验概率等级波峰值和基础影响值确定用户的初始级别,避免用户从最低级别开始测试,节省测试时间,提高了对用户水平进行评估的评估效率。
在本实施例的一些可选的实现方式中,在步骤S2013中,根据基础影响值和先验概率等级波峰值,确定当前用户的初始级别,作为当前级别包括:
根据如下公式确定当前级别L:
其中,μ为先验概率等级波峰值,Yi为第i个基础资料信息的基础影响值。
在本实施例中,通过从先验等级概率分布信息获取先验概率等级波峰值,并根据先验概率等级波峰值和基础影响值确定用户的初始级别,避免用户从最低级别开始测试,节省测试时间,提高了对用户水平进行评估的评估效率。
在本实施例的一些可选的实现方式中,在步骤S204中,历史数据为所有用户的答题时长信息、各等级答题数量信息,基于每个应答信息和历史数据,采用支持向量机模型确定当前用户新的级别,作为更新后的当前级别的步骤包括:
对所有用户的答题时长信息、各等级答题数量信息分别进行先验概率分布计算,得到先验概率时长波峰值、先验概率答题数量波峰值。
具体的,对所有用户的答题时长信息、各等级答题数量信息分别进行先验概率分布计算,得到先验概率时长分布信息和先验概率答题数量分布信息,先验概率时长分布信息包括所有用户完成所有考核题目时长的概率分布数据和所有用户完成各等级考核题目时长的概率分布数据,从所有用户完成所有考核题目时长的概率分布数据和所有用户完成各等级考核题目时长的概率分布数据获取先验概率时长波峰值,其中,先验概率时长波峰值包括先验概率各等级时长波峰值和先验概率所有等级时长波峰值,从先验概率答题数量分布信息中获取先验概率答题数量波峰值。
将应答信息、先验概率时长波峰值和先验概率答题数量波峰值进行拼接,得到应答信息拼接序列,并将应答信息拼接序列输入到支持向量机模型中。
具体的,应答信息拼接序列可以表示为[当前级别、当前答题数目、当前答题准确率、当前答题时长、先验概率各等级时长波峰值、先验概率所有等级时长波峰值、先验概率答题数量波峰值]。
采用支持向量机模型对应答信息拼接序列进行分类处理,得到等级跳跃方向。
具体的,支持向量机模型是一类按监督学习方式对数据进行二元分类的广义线性分类器模型,在本实施例中通过支持向量机模型根据输入的应答信息拼接序列构成特征空间,若应答信息拼接序列所在的特征空间存在作为决策边界的超平面将等级跳跃方向按正类和负类分开,其中,正类便将当前等级升一级,负类便降当前等级降一级,并使任意样本的点到平面距离大于等于1,则构造了2个平行的超平面作为间隔边界以判别拼接序列的分类,即判别当前用户的等级跳跃方向。
根据等级跳跃方向确定当前用户新的级别,作为更新后的当前级别。
具体的,假设当支持向量机输出的数值为+1时,将当前级别增加一级,并将增加一级的当前级别作为更新后的当前级别,当支持向量机输出的数值为-1时,将当前级别降低一级,并将降低一级的当前级别作为更新后的当前级别。
在本实施例中,基于支持向量机模型,将应答信息、先验概率时长波峰值和先验概率答题数量波峰值进行拼接,得到应答信息拼接序列,并将应答信息拼接序列输入到支持向量机模型中进行分类处理,根据分类处理结果判别当前用户的等级跳跃方向,能够根据用户的实时答题情况,动态调整用户的当前级别,有利于根据用户的当前级别调整向用户推送与当前级别对应的考核题目,能够更准确的对用户的水平进行评估。
在本实施例的一些可选的实现方式中,在步骤S204中,基于每个应答信息和历史数据,采用逻辑回归模型,确定更新后的当前级别对应的考核题目的数量的步骤包括:
对所有用户的答题时长信息、各等级答题数量信息分别进行先验概率分布计算,得到先验概率时长波峰值、先验概率答题数量波峰值。
具体的,对所有用户的答题时长信息、各等级答题数量信息分别进行先验概率分布计算,得到先验概率时长分布信息和先验概率答题数量分布信息,先验概率时长分布信息包括所有用户完成所有考核题目时长的概率分布数据和所有用户完成各等级考核题目时长的概率分布数据,从所有用户完成所有考核题目时长的概率分布数据和所有用户完成各等级考核题目时长的概率分布数据获取先验概率时长波峰值,其中,先验概率时长波峰值包括先验概率各等级时长波峰值和先验概率所有等级时长波峰值,从先验概率答题数量分布信息中获取先验概率答题数量波峰值。
将应答信息、先验概率时长波峰值和先验概率答题数量波峰值进行拼接,得到应答信息拼接序列,并将应答信息拼接向量输入到多项逻辑斯蒂回归模型中。
具体的,应答信息拼接序列可以表示为[当前级别、当前答题数目、当前答题准确率、当前答题时长、先验概率各等级时长波峰值、先验概率所有等级时长波峰值、先验概率答题数量波峰值]。
采用多项逻辑斯蒂回归模型对应答信息拼接序列进行计算,得到更新后的当前级别对应的考核题目的数量。
具体的,逻辑回归模型是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域,在本实施例中,用于对更新后的当前级别对应的考核题目的数量,即将应答信息拼接序列输入到逻辑回归模型中,采用逻辑回归模型对应答信息拼接序列中的数据信息进行分析并计算得到更新后的当前级别对应的考核题目的数量,其中,逻辑回归模型可以表示为:
式中,x为应答信息拼接序列,J为每个等级预设的最多考核题目数量,Wk为应答信息拼接序列的权重矩阵,k为更新后的当前级别对应的考核题目的数量,其中,k为1,2,3,4,...,J-1。
在本实施例中,基于支持向量机模型,将应答信息、先验概率时长波峰值和先验概率答题数量波峰值进行拼接,得到应答信息拼接序列,并将应答信息拼接序列输入到支持向量机模型中进行计算,根据计算结果确定更新后的当前级别对应的考核题目的数量,能够根据用户的实时答题情况和更新后的当前级别,动态调整考核题目的数量,能够提高对用户的水平进行评估的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图3示出与上述实施例基于机器学习的水平评测方法一一对应的基于机器学习的水平评测装置的原理框图。如图3所示,该基于机器学习的水平评测装置包括获取模块30、第一推送模块31、接收模块32、第一确定模块33、更新模块34、第二推送模块35和第一确定模块36。各功能模块详细说明如下:
获取模块30,用于获取所有用户的历史数据,并基于历史数据,确定当前用户的初始级别,作为当前级别。
第一推送模块31,用于向当前用户推送当前级别对应的考核信息,考核信息包括至少一个考核题目。
接收模块32,用于接收当前用户针对考核信息反馈的答复信息,作为应答信息,应答信息包括当前级别、答题数目、答题准确率和答题时长。
第一确定模块33,用于基于每个应答信息和历史数据,采用支持向量机模型确定当前用户新的级别,作为更新后的当前级别,并采用逻辑回归模型,确定更新后的当前级别对应的考核题目的数量。
更新模块34,用于根据更新后的当前级别和更新后的当前级别对应的考核题目的数量,对考核信息进行更新。
第二推送模块35,用于向当前用户推送更新后的考核信息,并返回接收当前用户针对考核信息反馈的答复信息,作为应答信息的步骤继续执行,直到更新后的当前级别超过预设等级阈值为止,或者,直到更新前后的答题准确率符合预设终止条件为止。
第二确定模块36,用于根据当前级别的答题准确率和更新后的当前级别的答题准确率确定当前用户的目标级别。
可选的,获取模块30包括:
等级概率计算单元,用于对所有用户的等级信息进行先验概率分布计算,得到等级概率分布信息。
等级波峰值获取单元,用于从等级概率分布信息中获取先验概率等级波峰值。
影响值获取单元,用于获取当前用户的基础影响值;
初始级别确定单元,用于根据基础影响值和先验概率等级波峰值,确定当前用户的初始级别,作为当前级别。
可选的,初始界别确定单元包括:
根据如下公式确定当前级别L:
其中,μ为先验概率等级波峰值,Yi为第i个基础资料信息的基础影响值。
可选的,第一确定模块33包括:
第一计算单元,用于对所有用户的答题时长信息、各等级答题数量信息分别进行先验概率分布计算,得到先验概率时长波峰值、先验概率答题数量波峰值。
第一拼接单元,用于将应答信息、先验概率时长波峰值和先验概率答题数量波峰值进行拼接,得到应答信息拼接序列,并将应答信息拼接序列输入到支持向量机模型中。
分类处理单元,用于采用支持向量机模型对应答信息拼接序列进行分类处理,得到等级跳跃方向。
等级跳跃方向确定单元,用于根据等级跳跃方向确定当前用户新的级别,作为更新后的当前级别。
可选的,第一确定模块33包括:
第二计算单元,用于对所有用户的答题时长信息、各等级答题数量信息分别进行先验概率分布计算,得到先验概率时长波峰值、先验概率答题数量波峰值。
第二拼接单元,用于将应答信息、先验概率时长波峰值和先验概率答题数量波峰值进行拼接,得到应答信息拼接序列,并将应答信息拼接向量输入到多项逻辑斯蒂回归模型中。
第三计算单元,用于采用多项逻辑斯蒂回归模型对应答信息拼接序列进行计算,得到更新后的当前级别对应的考核题目的数量。
可选的,第二推送模块35包括:
第一判断单元,用于判断更新前后的答题准确率是否符合更新前的答题准确率达到100%时且更新后的答题准确率低于100%。
可选的,第二确定模块36包括:
第二判断单元,用于若当前级别的答题准确率等于100%且更新后的当前级别的答题准确率等于0时,则将当前级别作为用户的目标级别。
第三判断单元,用于若当前级别的答题准确率等于100%且更新后的当前级别的答题准确率大于0时,则将更新后的当前级别作为用户的目标级别。
关于基于机器学习的水平评测装置的具体限定可以参见上文中对于基于机器学习的水平评测方法的限定,在此不再赘述。上述基于机器学习的水平评测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图4,图4为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或D界面显示存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行电子文件的控制的程序代码。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于机器学习的水平评测方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种基于机器学习的水平评测方法,所述方法包括:
获取所有用户的历史数据,并基于所述历史数据,确定当前用户的初始级别,作为当前级别;
向所述当前用户推送所述当前级别对应的考核信息,所述考核信息包括至少一个考核题目;
接收所述当前用户针对所述考核信息反馈的答复信息,作为应答信息,所述应答信息包括当前级别、答题数目、答题准确率和答题时长;
基于每个所述应答信息和所述历史数据,采用支持向量机模型确定所述当前用户新的级别,作为更新后的当前级别,并采用逻辑回归模型,确定所述更新后的当前级别对应的考核题目的数量;
根据所述更新后的当前级别和所述更新后的当前级别对应的考核题目的数量,对所述考核信息进行更新;
向所述当前用户推送更新后的考核信息,并返回所述接收所述当前用户针对所述考核信息反馈的答复信息,作为应答信息的步骤继续执行,直到更新后的当前级别超过预设等级阈值为止,或者,直到更新前后的答题准确率符合预设终止条件为止;
根据所述当前级别的答题准确率和所述更新后的当前级别的答题准确率确定所述当前用户的目标级别。
2.如权利要求1所述的基于机器学习的水平评测方法,其特征在于,所述历史数据为所有用户的等级信息,所述基于所述历史数据,确定所述当前用户的初始级别,作为当前级别的步骤还包括:
对所述所有用户的等级信息进行先验概率分布计算,得到等级概率分布信息;
从所述等级概率分布信息中获取先验概率等级波峰值;
获取所述当前用户的基础影响值;
根据所述基础影响值和所述先验概率等级波峰值,确定所述当前用户的初始级别,作为当前级别。
4.如权利要求1所述的基于机器学习的水平评测方法,其特征在于,所述历史数据为所有用户的答题时长信息、各等级答题数量信息,所述基于每个所述应答信息和所述历史数据,采用支持向量机模型确定所述当前用户新的级别,作为更新后的当前级别的步骤包括:
对所述所有用户的答题时长信息、所述各等级答题数量信息分别进行先验概率分布计算,得到先验概率时长波峰值、先验概率答题数量波峰值;
将所述应答信息、所述先验概率时长波峰值和所述先验概率答题数量波峰值进行拼接,得到应答信息拼接序列,并将所述应答信息拼接序列输入到支持向量机模型中;
采用支持向量机模型对所述应答信息拼接序列进行分类处理,得到等级跳跃方向;
根据所述等级跳跃方向确定所述当前用户新的级别,作为更新后的当前级别。
5.如权利要求1所述的基于机器学习的水平评测方法,其特征在于,所述基于每个所述应答信息和所述历史数据,采用逻辑回归模型,确定所述更新后的当前级别对应的考核题目的数量的步骤包括:
对所述所有用户的答题时长信息、所述各等级答题数量信息分别进行先验概率分布计算,得到先验概率时长波峰值、先验概率答题数量波峰值;
将所述应答信息、所述先验概率时长波峰值和所述先验概率答题数量波峰值进行拼接,得到应答信息拼接序列,并将所述应答信息拼接向量输入到多项逻辑斯蒂回归模型中;
采用多项逻辑斯蒂回归模型对所述应答信息拼接序列进行计算,得到所述更新后的当前级别对应的考核题目的数量。
6.如权利要求1所述的基于机器学习的水平评测方法,其特征在于,所述根据所述当前级别的答题准确率和所述更新后的当前级别的答题准确率确定所述当前用户的目标级别的步骤包括:
若所述当前级别的答题准确率等于100%且更新后的当前级别的答题准确率等于0时,则将所述当前级别作为所述用户的目标级别;
若所述当前级别的答题准确率等于100%且所述更新后的当前级别的答题准确率大于0时,则将所述更新后的当前级别作为所述用户的目标级别。
7.如权利要求1所述的基于机器学习的水平评测方法,其特征在于,所述预设终止条件为更新前的答题准确率达到100%时且更新后的答题准确率低于100%。
8.基于机器学习的水平评测装置,其特征在于,所述基于机器学习的水平评测装置包括:
获取模块,用于获取所有用户的历史数据,并基于所述历史数据,确定当前用户的初始级别,作为当前级别;
第一推送模块,用于向所述当前用户推送所述当前级别对应的考核信息,所述考核信息包括至少一个考核题目;
接收模块,用于接收所述当前用户针对所述考核信息反馈的答复信息,作为应答信息,所述应答信息包括当前级别、答题数目、答题准确率和答题时长;
第一确定模块,用于基于每个所述应答信息和所述历史数据,采用支持向量机模型确定所述当前用户新的级别,作为更新后的当前级别,并采用逻辑回归模型,确定所述更新后的当前级别对应的考核题目的数量;
更新模块,用于根据所述更新后的当前级别和所述更新后的当前级别对应的考核题目的数量,对所述考核信息进行更新;
第二推送模块,用于向所述当前用户推送更新后的考核信息,并返回所述接收所述当前用户针对所述考核信息反馈的答复信息,作为应答信息的步骤继续执行,直到更新后的当前级别超过预设等级阈值为止,或者,直到更新前后的答题准确率符合预设终止条件为止;
第二确定模块,用于根据所述当前级别的答题准确率和所述更新后的当前级别的答题准确率确定所述当前用户的目标级别。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于机器学习的水平评测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于机器学习的水平评测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110611203.4A CN113240323B (zh) | 2021-06-01 | 2021-06-01 | 基于机器学习的水平评测方法、装置及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110611203.4A CN113240323B (zh) | 2021-06-01 | 2021-06-01 | 基于机器学习的水平评测方法、装置及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113240323A true CN113240323A (zh) | 2021-08-10 |
CN113240323B CN113240323B (zh) | 2023-08-29 |
Family
ID=77136327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110611203.4A Active CN113240323B (zh) | 2021-06-01 | 2021-06-01 | 基于机器学习的水平评测方法、装置及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113240323B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779396A (zh) * | 2021-09-10 | 2021-12-10 | 平安科技(深圳)有限公司 | 题目推荐方法和装置、电子设备、存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018098732A1 (zh) * | 2016-11-30 | 2018-06-07 | 深圳益强信息科技有限公司 | 一种用于教育系统的数据处理方法及装置 |
CN110765254A (zh) * | 2019-10-21 | 2020-02-07 | 北京理工大学 | 一种融合多视角答案重排序的多文档问答系统模型 |
CN111507573A (zh) * | 2020-03-18 | 2020-08-07 | 威比网络科技(上海)有限公司 | 业务员考核方法、系统、设备及存储介质 |
-
2021
- 2021-06-01 CN CN202110611203.4A patent/CN113240323B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018098732A1 (zh) * | 2016-11-30 | 2018-06-07 | 深圳益强信息科技有限公司 | 一种用于教育系统的数据处理方法及装置 |
CN110765254A (zh) * | 2019-10-21 | 2020-02-07 | 北京理工大学 | 一种融合多视角答案重排序的多文档问答系统模型 |
CN111507573A (zh) * | 2020-03-18 | 2020-08-07 | 威比网络科技(上海)有限公司 | 业务员考核方法、系统、设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113779396A (zh) * | 2021-09-10 | 2021-12-10 | 平安科技(深圳)有限公司 | 题目推荐方法和装置、电子设备、存储介质 |
CN113779396B (zh) * | 2021-09-10 | 2023-09-01 | 平安科技(深圳)有限公司 | 题目推荐方法和装置、电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113240323B (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112632385A (zh) | 课程推荐方法、装置、计算机设备及介质 | |
CN109388674B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN112508118B (zh) | 针对数据偏移的目标对象行为预测方法及其相关设备 | |
CN111210335B (zh) | 用户风险识别方法、装置及电子设备 | |
CN112785005B (zh) | 多目标任务的辅助决策方法、装置、计算机设备及介质 | |
CN110348471B (zh) | 异常对象识别方法、装置、介质及电子设备 | |
CN112181835B (zh) | 自动化测试方法、装置、计算机设备及存储介质 | |
CN111061948B (zh) | 一种用户标签推荐方法、装置、计算机设备及存储介质 | |
CN111835561A (zh) | 基于用户行为数据的异常用户群体检测方法、装置、设备 | |
CN112529477A (zh) | 信用评估变量筛选方法、装置、计算机设备及存储介质 | |
CN116684330A (zh) | 基于人工智能的流量预测方法、装置、设备及存储介质 | |
CN113886721B (zh) | 个性化兴趣点推荐方法、装置、计算机设备及存储介质 | |
CN113220847B (zh) | 基于神经网络的知识掌握程度测评方法、装置及相关设备 | |
CN113298360B (zh) | 一种用于资源分配的风险控制方法、装置和系统 | |
CN112887371B (zh) | 边缘计算方法、装置、计算机设备及存储介质 | |
CN114817478A (zh) | 基于文本的问答方法、装置、计算机设备及存储介质 | |
CN113378067B (zh) | 基于用户挖掘的消息推荐方法、设备、介质 | |
CN111177500A (zh) | 数据对象分类方法、装置、计算机设备和存储介质 | |
CN113240323B (zh) | 基于机器学习的水平评测方法、装置及相关设备 | |
CN112801145A (zh) | 安全监测方法、装置、计算机设备及存储介质 | |
CN111062449A (zh) | 预测模型的训练方法、兴趣度预测方法、装置和存储介质 | |
CN116796140A (zh) | 基于人工智能的异常分析方法、装置、设备及存储介质 | |
CN111597299A (zh) | 知识点监测方法、装置、计算机设备和存储介质 | |
CN111046156A (zh) | 奖励数据的确定方法、装置和服务器 | |
CN112329943A (zh) | 组合指标的甄选方法、装置、计算机设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |