CN117540108B - 基于考点数据分布式总结的智能推荐答题系统 - Google Patents
基于考点数据分布式总结的智能推荐答题系统 Download PDFInfo
- Publication number
- CN117540108B CN117540108B CN202410033657.1A CN202410033657A CN117540108B CN 117540108 B CN117540108 B CN 117540108B CN 202410033657 A CN202410033657 A CN 202410033657A CN 117540108 B CN117540108 B CN 117540108B
- Authority
- CN
- China
- Prior art keywords
- learning
- user
- data
- examination point
- examination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 50
- 238000012360 testing method Methods 0.000 claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 19
- 238000007637 random forest analysis Methods 0.000 claims abstract description 18
- 230000002452 interceptive effect Effects 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 19
- 238000003066 decision tree Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 18
- 239000000463 material Substances 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 230000000694 effects Effects 0.000 claims description 9
- 235000014510 cooky Nutrition 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 claims description 7
- 230000003993 interaction Effects 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000003058 natural language processing Methods 0.000 claims description 6
- 238000013480 data collection Methods 0.000 claims description 5
- 238000007726 management method Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000006399 behavior Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000000877 morphologic effect Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000012552 review Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000006872 improvement Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000004148 unit process Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 208000013409 limited attention Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Probability & Statistics with Applications (AREA)
- Electrically Operated Instructional Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及智能推荐答题技术领域,具体为基于考点数据分布式总结的智能推荐答题系统,包括个性考点分析模块和智能推荐模块,其中:个性考点分析模块收集用户在交互界面学习的学习数据,学习数据包括不同的数据特征,利用随机森林算法模型对收集的学习数据进行各个考点的掌握程度的预测,智能推荐模块根据各个考点的掌握程度确定对应的学习策略,并根据学习策略中的关键字来匹配对应的学习资源,并以列表的形式展示给用户,用户根据对应的学习资源进行学习后,个性考点分析模块再次收集用户在交互界面学习的学习数据,并进行再次的学习数据的分析预测和学习资源的推荐,形成一个循环,用于不断贴近用户的个性化需求。
Description
技术领域
本发明涉及智能推荐答题技术领域,具体为基于考点数据分布式总结的智能推荐答题系统。
背景技术
传统的教学方法通常遵循着统一的教育模式,所有学生无论其个别的兴趣、能力或学习进度都会接受相同的教学内容。在传统教室设置中,教师依靠教科书、标准化的课程大纲和集体授课来传授知识,学生们需要适应这一固定流程,课堂互动通常受限于大班授课的格式,个别学生得到的关注有限,很少有机会根据个人需要来调整学习路径。这种模式缺乏有效的个性化学习支持,学习效果很大程度上取决于学生自身的适应能力和学习动机。
由于资源和注意力的有限,教师很难即时了解每个学生对每个考点的掌握程度,因此无法为每个学生都提供定制化的指导和学习材料。反馈循环通常是缓慢而且间接的,教师可能只能通过定期的考试和测试来评估学生的学习状况,而这些评估通常发生在学期中或学期末,对于需要即时帮助或调整的学生来说,干预措施可能为时已晚。
此外,在传统的学习模式中,学习资源通常比较固定,缺乏根据学生实际掌握情况进行动态优化的能力。学生的弱点可能得不到及时的补强,而强项也难以得到适时的挑战和深化,在响应学生多样化需求以及促进学生潜力充分发挥方面存在明显短板,这对学生的学习体验和最终的学习成果均可能产生负面影响。
发明内容
本发明的目的在于提供基于考点数据分布式总结的智能推荐答题系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:基于考点数据分布式总结的智能推荐答题系统,其包括个性考点分析模块和智能推荐模块,其中:
所述个性考点分析模块收集用户在交互界面学习的学习数据,学习数据包括不同的数据特征,利用随机森林算法模型对收集的学习数据进行各个考点的掌握程度的预测;
所述智能推荐模块根据各个考点的掌握程度确定对应的学习策略,并根据学习策略中的关键字来匹配对应的学习资源,并以列表的形式展示给用户,用户根据对应的学习资源进行学习后,所述个性考点分析模块再次收集用户在交互界面学习的学习数据,并进行再次的学习数据的分析预测和学习资源的推荐,形成一个循环,用于不断贴近用户的个性化需求。
作为本技术方案的进一步改进,所述个性考点分析模块包括数据采集与处理单元和个性考点分析单元,所述数据采集与处理单元通过用户交互界面收集用户的学习数据,学习数据包括不同的数据特征,并将学习数据发送给个性考点分析单元;所述个性考点分析单元利用随机森林算法根据接收到的学习数据进行各个考点的掌握程度的预测,并将预测结果发送给智能推荐模块。
作为本技术方案的进一步改进,所述智能推荐模块包括结果分析单元和匹配学习资源单元,所述结果分析单元接收个性考点分析单元发送的预测结果,预测结果包括各个考点的掌握程度得分,根据各个考点的掌握程度确定对应的学习策略;所述匹配学习资源单元根据学习策略中的考点和对应难度的关键字来确定对应的学习资源。
作为本技术方案的进一步改进,所述个性考点分析单元利用随机森林算法根据接收到的学习数据进行各个考点的掌握程度的预测,具体包括:
利用日志记录收集用户的历史数据,包括数据采集与处理单元收集的数据和用户对考点的掌握程度的数据,并将用户对考点的掌握程度作为目标变量,其余数据作为模型的输入特征,将目标变量和输入特征作为数据集,并划分数据集为训练集和测试集,在训练集上训练随机森林模型,算法将在训练过程中建立多棵决策树,每棵树使用数据集中的不同子样本和特征进行训练;
从给定的训练集中随机选择部分样本,针对每个子样本集,随机选择部分特征用于建立决策树;针对每个子样本集和随机选择的特征,建立一个决策树模型,在构建决策树的过程中,采用信息增益指标确定节点的划分方式,直到达到节点中的样本属于同一类别,训练完成;
所有的决策树都建立完成后,对数据采集与处理单元发送的数据进行预测,对每棵决策树的预测结果进行求和平均,最终得到随机森林的整体预测结果。
作为本技术方案的进一步改进,所述结果分析单元接收个性考点分析单元发送的预测结果,预测结果包括各个考点的掌握程度得分,根据不同掌握程度的得分大小确定掌握程度等级并确定对应的学习策略,具体包括:
对于低掌握程度的考点,推荐单元回顾和基础概念解释;
对于中掌握程度的考点,推荐中级难度的练习题和案例分析;
对于高掌握程度的考点,引入高级和创新的概念,触发批判性思维和应用知识的挑战题目。
作为本技术方案的进一步改进,所述匹配学习资源单元根据学习策略中的考点和对应难度的关键字来确定对应的学习资源,通过自然语言处理技术中的BETR模型处理文本输入,抽取出考点关键词,并根据用户掌握程度匹配相应的难度标签,形成搜索查询的参数,搜索查询利用数据库管理系统;根据查询参数,利用协同过滤在数据库中寻找匹配的学习资源;对学习资源进行排序,形成推荐列表;生成的推荐列表通过应用程序接口返回前端应用,并动态渲染至用户界面。
作为本技术方案的进一步改进,所述匹配学习资源单元通过自然语言处理技术中的BETR模型处理文本输入,抽取出考点关键词,具体包括:
对输入的学习材料文本进行预处理,包括但不限于文本的分词、去除停用词、词性标注、以及词干提取和词形还原,用于将文本归一化和简化;
利用BERT模型对文本进行语义分析,理解单词在不同上下文中的含义,在关键词抽取的上下文中,BERT模型利用语义相似度量,区分关键词和其他语言噪声,确定词汇对于学习材料的重要程度;
BERT模型的输出生成候选关键词列表,在此步骤中识别出那些携带文本主要信息的词汇,并生成一个由潜在关键词组成的列表,利用算法词频-逆文档频率算法结合BERT模型的上下文感知特征为每个候选关键词分配一个重要性得分,并根据重要性得分决定最终的关键词。
作为本技术方案的进一步改进,所述数据采集与处理单元通过用户交互界面收集用户的学习数据,具体包括:
用户登录系统时,建立一个会话,并通过cookies跟踪每个用户的学习活动,用于对用户的身份进行验证,其中cookies指的是一种存储在用户计算机上的文本文件,由网站发送给用户浏览器;
为用户界面中的各种元素绑定事件监听器,从而当用户与这些元素交互时能够记录相应的数据,在用户与界面交互时,前端编程代码捕获这些行为;
捕获的数据通过HTTP请求被发送到后端服务器,请求包含有关用户所做选择的信息和用户在平台上的导航路径,在答题期间,后端监控并记录用户的学习数据。
与现有技术相比,本发明的有益效果是:
1、该基于考点数据分布式总结的智能推荐答题系统收集用户在交互界面学习的学习数据,学习数据包括不同的数据特征,利用随机森林算法模型对收集的学习数据进行各个考点的掌握程度的预测,个性化学习体验能够根据学生的实际学习情况进行智能化的预测。通过收集学生在交互界面学习的学习数据,例如答题正确性、答题时间、答题模式等指标,该系统利用随机森林算法模型进行各个考点的掌握程度的预测,这种预测能够基于数据精准地分析学生在每个考点上的强弱,并量化出个体学生在掌握各个知识点方面的水平,精准预测学生各个考点的掌握程度,为每位用户提供定制化的学习资源,从而提高学生学习效率。
2、该基于考点数据分布式总结的智能推荐答题系统根据各个考点的掌握程度确定对应的学习策略,并根据学习策略中的关键字来匹配对应的学习资源,并以列表的形式展示给用户,用户根据对应的学习资源进行学习后,再次收集用户在交互界面学习的学习数据,并进行再次的学习数据的分析预测和学习资源的推荐,形成一个循环,通过持续收集学习数据,并基于最新数据更新模型预测和资源推荐,这构成了一个正反馈循环。传统教育方法中,快速准确的反馈可能难以实现,而这种系统的实时更新可以及时纠正学生的学习轨迹,防止其在错误路径上越走越远。
附图说明
图1为本发明的整体模块示意图;
图2为本发明的个性考点分析模块单元示意图;
图3为本发明的智能推荐模块单元示意图。
图中:100、个性考点分析模块;101、数据采集与处理单元;102、个性考点分析单元;200、智能推荐模块;201、结果分析单元;202、匹配学习资源单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图3,本发明提供一种技术方案:基于考点数据分布式总结的智能推荐答题系统,包括个性考点分析模块100和智能推荐模块200。
个性考点分析模块100中的数据采集与处理单元101设置用户交互界面,数据采集与处理单元101通过用户交互界面收集用户的学习数据,收集过程包括:
用户登录系统时,建立一个会话,并通过cookies跟踪每个用户的学习活动,用于对用户的身份进行验证,其中cookies指的是一种存储在用户计算机上的文本文件,由网站发送给用户浏览器的,文件包含着一些用户的数据,比如用户的会话信息、偏好设置等,当用户访问同一个网站时,网站可以读取这些cookies,以便在多个页面之间保持用户的特定状态和信息;
为用户界面中的各种元素(如按钮、表单、链接等)绑定事件监听器,从而当用户与这些元素交互时能够记录相应的数据,在用户与界面交互时,例如点击、答题、页面访问、材料阅读时间等,前端编程代码捕获这些行为;
捕获的数据通过HTTP请求(如AJAX调用)被发送到后端服务器,请求包含有关用户所做选择的信息和用户在平台上的导航路径,在答题期间,后端监控并记录用户的学习数据。
学习数据具体包括:
答题正确性:正确答案的数量与错误答案的数量;特定考点和知识点的对错情况;随时间答题正确率的变化趋势;用于显示用户的知识掌握程度,帮助确定用户掌握哪些具体知识点良好哪些需要改进,反映学习效果是否提高,是否掌握了以前的错误概念,例如,如果用户在代数题目上的正确率为90%,而在几何题目上的正确率仅为60%,用户在几何方面需要更多的辅导和练习的结论;
答题时间:完成整个测试所需的总时间;解答每个问题所花费的时间;用于评估用户的作答效率和时间管理能力,了解用户在不同类型的问题上花费的时间,揭示对某个问题领域的掌握程度,例如,用户在计算题上花费比平均用户花费更长的时间,表明用户需要提高数学计算技巧或掌握更高效的解题方法;
答题模式:用户选择题目的顺序(是否按照顺序作答,是否跳跃作答);在不同类型题目(选择题、问答题和计算题等)上的表现;用于体现用户的作答策略,反映出对某些题型或主题的自信程度,分析用户在不同题型上的表现,诊断用户的优劣势和偏好;例如,用户在开始答题后经常回到先前的题目修改答案,表明用户在自信度或答题策略上的不确定性;
学习进度:用户完成的学习单元和章节;学习材料的阅读时间;章节测试和单元测试的分数;用于显示用户在课程中的进度,判断用户是否跟上课程节奏,反映出用户投入学习的时间和参与度,和学习效果之间的相关性,整体评估用户在课程不同阶段的掌握程度;
历史表现:用户过去的考试和测验分数;学习平台上历史答题数据的累积分析;用于通过用户过去的表现来预测未来的表现,指导教师如何帮助用户提高;了解用户的长期学习模式和进步曲线;
习题难度与表现:用户在不同难度级别的习题上的表现;错误题目的难度级别;用于估用户的能力水平,根据难度匹配合适的学习资源,帮助定位用户在哪个难度级别开始遇到问题,从而为其设计合适难度的学习计划;
答题频率与习惯:用户登录学习系统并进行答题的频率;学习活动的时间分布(早晨、下午、晚上等);用于体现用户的学习活跃度及持续性,揭示用户的学习习惯,比如他们更倾向于何时学习。
数据采集与处理单元101对收集到的数据进行预处理,包括数据清洗:移除无效或异常的数据,例如不完整的答题记录;数据转换:将某些非数值数据(如答题模式)转换为数值型数据,以使其能够被随机森林算法处理;缺失值处理:填补或删除含有缺失值的数据点;特征工程:创建新的特征,如从答题时间和正确性数据中计算的平均答题时间和正确率。
个性考点分析单元102将利用随机森林算法对收集的数据进行各个考点的掌握程度的预测,具体包括:
历史数据收集和处理:利用日志记录收集用户的历史数据,包括数据采集与处理单元101收集的数据和用户对考点的掌握程度的数据,并将用户对考点的掌握程度作为目标变量,其余数据作为模型的输入特征,将目标变量和输入特征作为数据集,并划分数据集为训练集和测试集,在训练集上训练随机森林模型,算法将在训练过程中建立多棵决策树,每棵树使用数据集中的不同子样本和特征进行训练;
随机森林模型构建:从给定的训练集中随机选择部分样本,针对每个子样本集,随机选择部分特征用于建立决策树,有助于增加模型的多样性,降低模型之间的相关性,从而提高整体性能;针对每个子样本集和随机选择的特征,建立一个决策树模型,在构建决策树的过程中,采用信息增益指标确定节点的划分方式,直到达到节点中的样本属于同一类别,训练完成;
随机森林模型预测:当所有的决策树都建立完成后,对数据采集与处理单元101发送的数据进行预测,对每棵决策树的预测结果进行求和平均,最终得到随机森林的整体预测结果。
个性考点分析单元102将预测结果发送给智能推荐模块200中的结果分析单元201。
智能推荐模块200中的结果分析单元201接收个性考点分析单元102发送的预测结果,预测结果包括各个考点的掌握程度得分,其中0到60分为低掌握程度、60到80分为中掌握程度、80到100分为高掌握程度。
结果分析单元201根据各个考点的掌握程度确定对应的学习策略,具体包括:
对于低掌握程度的考点,提供基础知识的详细复习材料;推荐简单易懂的教学视频来加深理解基本概念;分发基础级别的练习题,逐步增加难度,以巩固知识点;提供一对一的导师辅导或同伴互助学习的机会;开展互动式学习活动,例如游戏或模拟,以提高参与度和理解水平;
对于中掌握程度的考点,提供中级难度的练习题和案例分析,帮助用户理解知识的实际应用;推荐讲解具有分析性和问题解决技巧的教材或工具;利用小组讨论和项目工作来促进深入理解和同伴学习;引导用户通过项目或案例学习,将知识与现实世界的情境相联系;
对于高掌握程度的考点,鼓励探究学习,引入高级和创新的概念,扩展知识边界;推荐高难度的实战和综合性问题,挑战和提升用户的分析能力;启用领导力和教学项目,鼓励用户指导较低掌握程度的同伴;推荐参加竞赛、研讨会或其他相关的外部活动以获取更多学习机会。
结果分析单元201将对应的学习策略发送给匹配学习资源单元202,根据学习策略中的考点和对应难度的关键字来确定对应的学习资源,通过自然语言处理技术中的BETR模型处理文本输入,抽取出考点关键词,并根据用户掌握程度匹配相应的难度标签,形成搜索查询的参数,搜索查询利用数据库管理系统;根据查询参数,利用协同过滤在数据库中寻找匹配的学习资源;对学习资源进行排序,形成推荐列表;生成的推荐列表通过应用程序接口返回前端应用,并动态渲染至用户界面。
例如,用户在“三角形内角和”这个考点的掌握程度是中等水平,智能推荐系统的匹配学习资源单元202会接收到这个请求,分析用户的掌握程度得分,并为该考点分配适当的难度级别标签;基于接收到的关键字和掌握程度,系统会构建查询参数,比如"三角形内角和"和"中等"难度;
随后,推荐系统会连接到教育资源数据库,执行查询操作,例如使用SQL语句:SELECTFROMresources_tableWHERETopicLIKE‘%三角形内角和%’ANDDifficulty=‘中等’。
数据库将返回符合这一查询条件的学习资源,例如教学视频、练习题、模拟实验等,将整理后的推荐资源列表以清单形式返回给用户界面,用户可以直接点击资源链接开始学习。
另外,匹配学习资源单元通过自然语言处理技术中的BETR模型处理文本输入,抽取出考点关键词,具体包括:
对输入的学习材料文本进行预处理,包括但不限于文本的分词、去除停用词、词性标注、以及词干提取和词形还原,用于将文本归一化和简化;
利用BERT模型对文本进行语义分析,理解单词在不同上下文中的含义,在关键词抽取的上下文中,BERT模型利用语义相似度量,区分关键词和其他语言噪声,确定词汇对于学习材料的重要程度;
BERT模型的输出生成候选关键词列表,在此步骤中识别出那些携带文本主要信息的词汇,并生成一个由潜在关键词组成的列表,利用算法词频-逆文档频率算法结合BERT模型的上下文感知特征为每个候选关键词分配一个重要性得分,并根据重要性得分决定最终的关键词。
用户根据匹配学习资源单元202推荐的学习资源进行学习之后,数据采集与处理单元101将再次采集用户对学习资源进行学习的学习数据,并进行再次的学习数据分析和学习资源的推荐,形成一个循环,以此不断贴近用户的个性化需求,提高用户学习效率。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (2)
1.基于考点数据分布式总结的智能推荐答题系统,其特征在于:包括个性考点分析模块(100)和智能推荐模块(200),其中:
所述个性考点分析模块(100)收集用户在交互界面学习的学习数据,学习数据包括不同的数据特征,利用随机森林算法模型对收集的学习数据进行各个考点的掌握程度的预测;
所述智能推荐模块(200)根据各个考点的掌握程度确定对应的学习策略,并根据学习策略中的关键字来匹配对应的学习资源,并以列表的形式展示给用户,用户根据对应的学习资源进行学习后,所述个性考点分析模块(100)再次收集用户在交互界面学习的学习数据,并进行再次的学习数据的分析预测和学习资源的推荐,形成一个循环,用于不断贴近用户的个性化需求;
所述个性考点分析模块(100)包括数据采集与处理单元(101)和个性考点分析单元(102),所述数据采集与处理单元(101)通过用户交互界面收集用户的学习数据,学习数据包括不同的数据特征,并将学习数据发送给个性考点分析单元(102);所述个性考点分析单元(102)利用随机森林算法根据接收到的学习数据进行各个考点的掌握程度的预测,并将预测结果发送给智能推荐模块(200);
所述智能推荐模块(200)包括结果分析单元(201)和匹配学习资源单元(202),所述结果分析单元(201)接收个性考点分析单元(102)发送的预测结果,预测结果包括各个考点的掌握程度得分,根据各个考点的掌握程度确定对应的学习策略;所述匹配学习资源单元(202)根据学习策略中的考点和对应难度的关键字来确定对应的学习资源;
所述个性考点分析单元(102)利用随机森林算法根据接收到的学习数据进行各个考点的掌握程度的预测,具体包括:
利用日志记录收集用户的历史数据,包括数据采集与处理单元(101)收集的数据和用户对考点的掌握程度的数据,并将用户对考点的掌握程度作为目标变量,其余数据作为模型的输入特征,将目标变量和输入特征作为数据集,并划分数据集为训练集和测试集,在训练集上训练随机森林模型,算法将在训练过程中建立多棵决策树,每棵树使用数据集中的不同子样本和特征进行训练;
从给定的训练集中随机选择部分样本,针对每个子样本集,随机选择部分特征用于建立决策树;针对每个子样本集和随机选择的特征,建立一个决策树模型,在构建决策树的过程中,采用信息增益指标确定节点的划分方式,直到达到节点中的样本属于同一类别,训练完成;
所有的决策树都建立完成后,对数据采集与处理单元(101)发送的数据进行预测,对每棵决策树的预测结果进行求和平均,最终得到随机森林的整体预测结果;
所述结果分析单元(201)接收个性考点分析单元(102)发送的预测结果,预测结果包括各个考点的掌握程度得分,根据不同掌握程度的得分大小确定掌握程度等级并确定对应的学习策略,具体包括:
对于低掌握程度的考点,推荐单元回顾和基础概念解释;
对于中掌握程度的考点,推荐中级难度的练习题和案例分析;
对于高掌握程度的考点,引入高级和创新的概念,触发批判性思维和应用知识的挑战题目;
所述匹配学习资源单元(202)根据学习策略中的考点和对应难度的关键字来确定对应的学习资源,通过自然语言处理技术中的BETR模型处理文本输入,抽取出考点关键词,并根据用户掌握程度匹配相应的难度标签,形成搜索查询的参数,搜索查询利用数据库管理系统;根据查询参数,利用协同过滤在数据库中寻找匹配的学习资源;对学习资源进行排序,形成推荐列表;生成的推荐列表通过应用程序接口返回前端应用,并动态渲染至用户界面;
所述匹配学习资源单元(202)通过自然语言处理技术中的BETR模型处理文本输入,抽取出考点关键词,具体包括:
对输入的学习材料文本进行预处理,包括但不限于文本的分词、去除停用词、词性标注、以及词干提取和词形还原,用于将文本归一化和简化;
利用BERT模型对文本进行语义分析,理解单词在不同上下文中的含义,在关键词抽取的上下文中,BERT模型利用语义相似度量,区分关键词和其他语言噪声,确定词汇对于学习材料的重要程度;
BERT模型的输出生成候选关键词列表,在此步骤中识别出那些携带文本主要信息的词汇,并生成一个由潜在关键词组成的列表,利用算法词频-逆文档频率算法结合BERT模型的上下文感知特征为每个候选关键词分配一个重要性得分,并根据重要性得分决定最终的关键词。
2.根据权利要求1所述的基于考点数据分布式总结的智能推荐答题系统,其特征在于:所述数据采集与处理单元(101)通过用户交互界面收集用户的学习数据,具体包括:
用户登录系统时,建立一个会话,并通过cookies跟踪每个用户的学习活动,用于对用户的身份进行验证,其中cookies指的是一种存储在用户计算机上的文本文件,由网站发送给用户浏览器;
为用户界面中的各种元素绑定事件监听器,从而当用户与这些元素交互时能够记录相应的数据,在用户与界面交互时,前端编程代码捕获这些行为;
捕获的数据通过HTTP请求被发送到后端服务器,请求包含有关用户所做选择的信息和用户在平台上的导航路径,在答题期间,后端监控并记录用户的学习数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410033657.1A CN117540108B (zh) | 2024-01-10 | 2024-01-10 | 基于考点数据分布式总结的智能推荐答题系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410033657.1A CN117540108B (zh) | 2024-01-10 | 2024-01-10 | 基于考点数据分布式总结的智能推荐答题系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117540108A CN117540108A (zh) | 2024-02-09 |
CN117540108B true CN117540108B (zh) | 2024-04-02 |
Family
ID=89790443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410033657.1A Active CN117540108B (zh) | 2024-01-10 | 2024-01-10 | 基于考点数据分布式总结的智能推荐答题系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117540108B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779166A (zh) * | 2016-11-23 | 2017-05-31 | 北京师范大学 | 一种基于数据驱动的知识点掌握状态的预测系统及方法 |
CN112071137A (zh) * | 2020-09-08 | 2020-12-11 | 中教云教育科技集团有限公司 | 一种在线教学系统及方法 |
CN113516574A (zh) * | 2021-07-27 | 2021-10-19 | 北京爱学习博乐教育科技有限公司 | 基于大数据与深度学习的自适应学习系统及其构建方法 |
CN114020929A (zh) * | 2021-11-03 | 2022-02-08 | 北京航空航天大学 | 一种基于课程知识图谱的智慧教育系统平台设计方法 |
WO2023079370A1 (en) * | 2021-11-03 | 2023-05-11 | Bharani Kumar D | System and method for enhancing quality of a teaching-learning experience |
CN117198099A (zh) * | 2023-09-06 | 2023-12-08 | 山东水利职业学院 | 一种视讯教学系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10249207B2 (en) * | 2016-01-19 | 2019-04-02 | TheBeamer, LLC | Educational teaching system and method utilizing interactive avatars with learning manager and authoring manager functions |
-
2024
- 2024-01-10 CN CN202410033657.1A patent/CN117540108B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779166A (zh) * | 2016-11-23 | 2017-05-31 | 北京师范大学 | 一种基于数据驱动的知识点掌握状态的预测系统及方法 |
CN112071137A (zh) * | 2020-09-08 | 2020-12-11 | 中教云教育科技集团有限公司 | 一种在线教学系统及方法 |
CN113516574A (zh) * | 2021-07-27 | 2021-10-19 | 北京爱学习博乐教育科技有限公司 | 基于大数据与深度学习的自适应学习系统及其构建方法 |
CN114020929A (zh) * | 2021-11-03 | 2022-02-08 | 北京航空航天大学 | 一种基于课程知识图谱的智慧教育系统平台设计方法 |
WO2023079370A1 (en) * | 2021-11-03 | 2023-05-11 | Bharani Kumar D | System and method for enhancing quality of a teaching-learning experience |
CN117198099A (zh) * | 2023-09-06 | 2023-12-08 | 山东水利职业学院 | 一种视讯教学系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117540108A (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107230174B (zh) | 一种基于网络的在线互动学习系统和方法 | |
CN111274411A (zh) | 课程推荐方法、装置、电子设备及可读存储介质 | |
Wijnia et al. | The effects of problem-based, project-based, and case-based learning on students’ motivation: A meta-analysis | |
US20130216995A1 (en) | Method, apparatus and system for learning plan analysis | |
CN112016767A (zh) | 学习路线的动态规划方法及装置 | |
ANDRADE et al. | Active Methodology, Educational Data Mining and Learning Analytics: A Systematic Mapping Study. | |
KR102708856B1 (ko) | 학습자 성장 추적 및 사정을 위한 시스템 및 방법 | |
CN113851020A (zh) | 一种基于知识图谱的自适应学习平台 | |
Yan et al. | Predicting abandonment in online coding tutorials | |
Ilić et al. | Intelligent techniques in e-learning: a literature review | |
CN113196318A (zh) | 一种理科教学系统及其使用方法、计算机可读存储介质 | |
Carannante et al. | Modelling students’ performance in MOOCs: a multivariate approach | |
Chaudhary et al. | Student future prediction using machine learning | |
CN117726485A (zh) | 一种基于大数据的智适应教育学习方法及系统 | |
CN116362426B (zh) | 基于人工智能和深度学习的学习行为预测管理系统和方法 | |
CN117540108B (zh) | 基于考点数据分布式总结的智能推荐答题系统 | |
CN114896975A (zh) | 一种面向在线教育智能助教的自主进化方法及系统 | |
Ogunkunle et al. | A data mining based optimization of selecting learning material in an intelligent tutoring system for advancing STEM education | |
Carmen | Data analysis of short-term and long-term online activities in LMS | |
Bendjebar et al. | An improvement of a data mining technique for early detection of at-risk learners in distance learning environments | |
Laksitowening et al. | Temporal Learning Type Analysis Based on Triple-Factor Approach | |
CN117743699B (zh) | 一种基于dkt与汤普森采样算法的习题推荐方法及系统 | |
Zhang et al. | Research on Big Data Analysis of Online Learning Behavior and Predictive of Learning Effectiveness | |
王丹志 et al. | KG-based memory recommendation algorithm for learning path | |
CN116433428A (zh) | 一种针对薄弱知识点的智能推题方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |