CN105894091A - 一种基于协同决策机制的试题难易度因子知识发现方法 - Google Patents

一种基于协同决策机制的试题难易度因子知识发现方法 Download PDF

Info

Publication number
CN105894091A
CN105894091A CN201610194029.7A CN201610194029A CN105894091A CN 105894091 A CN105894091 A CN 105894091A CN 201610194029 A CN201610194029 A CN 201610194029A CN 105894091 A CN105894091 A CN 105894091A
Authority
CN
China
Prior art keywords
decision
data
degree
reaching
difficulty factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610194029.7A
Other languages
English (en)
Inventor
段斌
冯玉洁
章兢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiangtan University
Original Assignee
Xiangtan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiangtan University filed Critical Xiangtan University
Priority to CN201610194029.7A priority Critical patent/CN105894091A/zh
Publication of CN105894091A publication Critical patent/CN105894091A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于协同决策机制的试题难易度因子知识发现方法,属于知识自动化领域,其包括:提取教学相关数据;对数据进行预处理,进行课程达成度决策;用户利用协同决策机制,根据第三方评分“改写/通过”课程达成度决策服务提议的决策;通过机器学习,获取与课程达成度相关的试题难易度因子;将难易度因子形成的分析模型和专家知识封装到同一知识库,供课程达成度决策服务调用;采用决策管理循环架构,利用试题难易因子重新循环对课程达成度进行决策。本发明具有自主分析决策能力,能解决由于教学试卷难易度主观性和不一致性,较为客观地分析试卷难易度因子并提供课程达成度决策服务。

Description

一种基于协同决策机制的试题难易度因子知识发现方法
技术领域
本发明涉及知识自动化领域,尤其设计一种基于协同决策机制的试题难易因子知识发现方法。背景技术
2015年3月,教育部推出国际实质等效的《工程教育专业认证标准》,其实际意义表现在:密切工程教育与工业界的联系,提高工程教育人才培养的产业适应性;建立与注册工程师制度相衔接的工程教育专业认证体系;促进工程教育的国际交流,实现国际互认。
近年来,教育教学过程中产生大量的数据,不仅数量大,内容丰富且较为完整,同时具有相对统一的数据格式,十分适合利用数据挖掘展开专业认证工作。数据挖掘不断发展,为从教育活动获取的数据中分析提出有价值的知识提供了有效的理论和工具支持。运用数据挖掘技术进行教学行为综合分析,能够进行高效、客观、精确的业务数据处理,较于传统常规统计方法更为公正且灵活实用。
专业认证需要构建毕业能力指标点与课程的多对多映射,需要由多门课程和其他教学活动协同体现工程性和复杂性。指标体系中各因素的相互影响、相互制约、相互驱动的定性和定量关系,建立知识模型,形成专业认证知识体系模型。试题难易度存在主观性,在衡量课程达成度时需要综合考虑试题难易度因子。
因此,综合分析第三方评价,获取试题难易度因子,协同解决课程达成度评价成为亟待解决的问题。
发明内容
鉴于此,本发明实施例提供了一种基于协同决策机制的试题难易因子知识发现方法,解决现有考试难易度因子客观计算的问题,保证评价结论的客观性、可信性。一种基于协同决策机制的试题难易因子知识发现方法,属于知识自动化领域,具体包括如下步骤:
步骤S1提取相关教学数据;
步骤S2对数据进行预处理,进行课程达成度决策;
步骤S3用户利用协同决策机制,根据第三方评分“改写/通过”课程达成度决策服务提议的决策;
步骤S4通过机器学习,获取与课程达成度相关的试题难易度因子;
步骤S5将难易度因子形成的分析模型和专家知识封装到同一知识库,供课程达成度决策服务调用;
步骤S6采用决策管理循环架构,利用试题难易因子重新循环对课程达成度进行决策。
所述步骤S1教学行为相关数据进一步包括:试题成绩、达成度评价方案、课程群支撑度评分和问卷调查评分。
所述步骤S2对所述数据需进行预处理进一步包括:去除缺陷、冗余数据,统一转换数据的名称和定义,估计遗失数据的缺省值;利用处理之后的数据,输入与指标点达成度相关的每一门课程考试相关考试以及指标点信息,具体为每一门考试抽取样本的考试平均成绩,进行课程达成度决策。
所述步骤S3进一步包括:所述第三方评分包括:课程群支撑度评分和问卷调查评分;用户根据课程群支撑度评分和问卷调查评分的输出,协同课程达成度决策,改写或通过课程指标达成度决策服务提议的决策。
根据权利要求4所述的基于协同决策机制的试题难易度因子知识发现方法,其特征在于,所述步骤S4进一步包括:难易度等级按照正太概率分布思想划分,不同难易度等级的值分别为:-2σ,-σ,σ,0,σ,2σ,分别取各块所占面积的近似值,分别以百分制为例,系统为这5个等级分配一组不同的估计系数,其系数估计公式为:
其中,Yn表示第n等级的估计系数,Xk表示第k等级在概率分布图中所占的比重。
所述步骤S4机器学习进一步包括:基于结合教育专业认证指标,着眼于大量的历史数据,对比分析输入数据与其最终输出结果之间的关系,获取新的能够通过用户的试题难易度因子,找出可最优预测输出结果的修正难易度等级,将其表示于一个难易度调整决策树中,建立随机森林模型的步骤具体包括:
读入训练数据集作为初始训练集;
基于所述初始集采用预设bootstrap随机抽样方法获取新的训练集来作为随机森林的训练集;
建立随机森林训练集的决策树模型;
利用遍历法逐个访问所述决策树模型中决策树的分裂节点;
删除小于预设阈值的决策树,统计各个节点所包含的样本数量,利用多数投票机制作确定最优的决策树子集作为最终难易度因子。
所述步骤S5进一步包括:专家知识可根据专家的需求可做出具体调整,决策针对案例所用的预测分析模型判定的数据项必须是建模时所用的相同数据;
将所述难易度因子表示在一个决策树中与专家知识封装在知识库中,可被课程达成度决策服务调用。
所述步骤S6进一步包括:所有业务知识必须都是经过使用真实数据的决策进行测试,保证其有效性;基于最终难易度因子的课程达成度决策服务产生的数据,存入历史数据库中,作为下次机器学习的样本库。
本发明从知识自动化的视角出发提出了一种协同决策试题难易度因子知识发现方法。本发明通过分析指标体系中各因素的相互影响、相互制约、相互驱动的定性和定量关系,在此基础上,形成机器表达机制,获取考试难易度因子。从现有人工经验和专业认证数据中获取知识,探索专业认证各类知识适用的知识表示方法。该方法通过知识与数据挖掘的继承和人类智慧与数据之间的无缝连接,可实现独立、自动、高效专业认证知识自动化。人机交互方式嵌入人工评价过程,服务于专业认证课程达成度评价,保证评价结论的客观性,可信性。
附图说明
图1为基于协同决策机制的试题难易度因子知识发现方法流程图;
图2为考试难易度评价协同决策机制系统框图;
图3为获取试题难易度因子决策树模型流程图;
图4为决策服务循环架构图。
具体实施方式
为使本发明的技术方案和优点更加清楚,下面结合实施方式并参照附图,对发明技术方案进行清楚描述。应该指出的是下面说明仅仅是示例性的,而不是为了限制本发明的范围以及其应用。此外,在一下说明中,省略了对公知知识和技术的描述,以避免不必要地混淆本发明的概念。
实施例
图1示出了本发明的流程图,基于协同决策机制的试题难易度因子知识发现方法,具体实施步骤如下:
步骤S1提取相关教学数据,形成数据集合。
本实施例中所述课程为大学物理,相关数据包括:试题考试成绩、达成度评价方案、课程群支撑度评分和问卷调查评分。
步骤S2对数据进行预处理,进行课程达成度决策;去除缺陷、冗余数据,统一转换数据的名称和定义,估计遗失数据的缺省值;利用处理之后的数据,输入与指标点达成度相关的每一门课程考试相关考试以及指标点信息,具体为大学物理考试抽取样本获取考试平均成绩,进行课程达成度决策。
本实施例中,预设达成度阈值取经验值为0.7,采取随机抽样获取30分试题样本,进行课程达成度计算,对应计算出课程达成度为0.75。
图2是考试难易度评价协同决策机制系统框图。
步骤S3用户利用协同决策机制,根据第三方评分“改写/通过”课程达成度决策服务提议的决策;本实施例中第三方评分包括:课程群支撑度评分和问卷调查评分;用户根据课程群支撑度评分和问卷调查评分的输出,协同课程达成度决策,改写或通过课程指标达成度决策服务提议的决策。
本实施例中预设课程群支撑度为0.65,问卷调查评分为0.67,用户结合第三方评分输出,协同课程达成度决策,改写课程指标度成为不通过。
步骤S4通过机器学习,获取与课程达成度相关的试题难易度因子;难易度等级按照正太概率分布思想划分,不同难易度等级的值分别为:-2σ,-σ,σ,0,σ,2σ,分别取各块所占面积的近似值,分别以百分制为例,系统为这5个等级分配一组不同的估计系数,其系数估计公式为:
其中,Yn表示第n等级的估计系数,Xk表示第k等级在概率分布图中所占的比重,本实施例中,从左到右5个等级的估计系数分别为0.9875,0.917,0.51,0.0925,0.0125。
基于结合教育专业认证指标,着眼于大量的历史数据,对比分析输入数据与其最终输出结果之间的关系,获取新的能够通过用户的试题难易度因子,找出可最优预测输出结果的修正难易度等级,将其表示于一个难易度调整决策树中。
图3为本发明实施例提供的获取试题难易度因子决策树模型流程图。参照图2所示。
本实施例中,建立随机森林模型的步骤具体包括:
步骤S101读入训练数据集作为初始训练集;
步骤S103基于所述初始集采用预设bootstrap随机抽样方法获取新的训练集来作为随机森林的训练集;假设样本数据预处理之后为S,随机有放回地抽取k次,每次抽取样本S的三分之二,抽样样本集合为
步骤S103建立随机森林训练集的决策树模型;
每一份抽样样本训练生成一个决策树模型,一共生成k个决策树模型。
步骤S104利用遍历法逐个访问所述决策树模型中决策树的分裂节点;
步骤S105删除小于预设阈值的决策树,统计各个节点所包含的样本数量。
每一个样本数据通过随机森林的分类结果,即多个决策树的投票结果RF为:
其中,n为决策树模型数量,基于每个决策树模型的投票权重qi,相应输出为yi。利用多数投票机制作确定最优的决策树子集作为最终难易度因子为σ。
步骤S5将难易度因子形成的分析模型和专家知识封装到同一知识库,供课程达成度决策服务调用;专家知识可根据专家的需求可做出具体调整,决策针对案例所用的预测分析模型判定的数据项必须是建模时所用的相同数据;
将所述难易度因子表示在一个决策树中与专家知识封装在知识库中,可被课程达成度决策服务调用。
步骤S6采用决策管理循环架构,利用试题难易因子重新循环对课程达成度进行决策。
图4是决策管理循环架构,经过计算,大学物理课程达成度为0.73,
所有业务知识必须都是经过使用真实数据的决策进行测试,保证其有效性;基于最终难易度因子的课程达成度决策服务产生的数据,存入历史数据库中,作为下次机器学习的样本库。
综上,本发明从知识自动化的视角出发提出了一种协同决策试题难易度因子知识发现方法。本发明通过分析指标体系中各因素的相互影响、相互制约、相互驱动的定性和定量关系,在此基础上,形成机器表达机制,获取考试难易度因子。从现有人工经验和专业认证数据中获取知识,探索专业认证各类知识适用的知识表示方法。该方法通过知识与数据挖掘的继承和人类智慧与数据之间的无缝连接,可实现独立、自动、高效专业认证知识自动化。人机交互方式嵌入人工评价过程,服务于专业认证课程达成度评价,保证评价结论的客观性,可信性。

Claims (8)

1.一种基于协同决策机制的试题难易因子知识发现方法,属于知识自动化领域,具体包括如下步骤:
步骤S1提取相关教学数据;
步骤S2对数据进行预处理,进行课程达成度决策;
步骤S3用户利用协同决策机制,根据第三方评分“改写/通过”课程达成度决策服务提议的决策;
步骤S4通过机器学习,获取与课程达成度相关的试题难易度因子;
步骤S5将难易度因子形成的分析模型和专家知识封装到同一知识库,供课程达成度决策服务调用;
步骤S6采用决策管理循环架构,利用试题难易因子重新循环对课程达成度进行决策。
2.根据权利要求1所述的基于协同决策机制的试题难易度因子知识发现方法,提取教学相关数据,其特征在于,所述步骤S1教学行为相关数据进一步包括:试题成绩、达成度评价方案、课程群支撑度评分和问卷调查评分。
3.根据权利要求2所述的基于协同决策机制的试题难易度因子知识发现方法,其特征在于,所述步骤S2对所述数据需进行预处理进一步包括:去除缺陷、冗余数据,统一转换数据的名称和定义,估计遗失数据的缺省值;利用处理之后的数据,输入与指标点达成度相关的每一门课程考试相关考试以及指标点信息,具体为每一门考试抽取样本的考试平均成绩,进行课程达成度决策。
4.根据权利要求3所述的基于协同决策机制的试题难易度因子知识发现方法,其特征在于,所述步骤S3进一步包括:所述第三方评分包括:课程群支撑度评分和问卷调查评分;用户根据课程群支撑度评分和问卷调查评分的输出,协同课程达成度决策,改写或通过课程指标达成度决策服务提议的决策。
5.根据权利要求4所述的基于协同决策机制的试题难易度因子知识发现方法,其特征在于,所述步骤S4进一步包括:难易度等级按照正太概率分布思想划分,不同难易度等级的值分别为:-2σ,-σ,σ,0,σ,2σ,分别取各块所占面积的近似值,分别以百分制为例,系统为这5个等级分配一组不同的估计系数,其系数估计公式为:
其中,Yn表示第n等级的估计系数,Xk表示第k等级在概率分布图中所占的比重。
6.根据权利要求4所述的基于协同决策机制的试题难易度因子知识发现方法,其特征在于,所述步骤S4机器学习进一步包括:基于结合教育专业认证指标,着眼于大量的历史数据,对比分析输入数据与其最终输出结果之间的关系,获取新的能够通过用户的试题难易度因子,找出可最优预测输出结果的修正难易度等级,将其表示于一个难易度调整决策树中,建立随机森林模型的步骤具体包括:
读入训练数据集作为初始训练集;
基于所述初始集采用预设bootstrap随机抽样方法获取新的训练集来作为随机森林的训练集;
建立随机森林训练集的决策树模型;
利用遍历法逐个访问所述决策树模型中决策树的分裂节点;
删除小于预设阈值的决策树,统计各个节点所包含的样本数量,利用多数投票机制作确定最优的决策树子集作为最终难易度因子。
7.根据权利要求6所述的基于协同决策机制的试题难易度因子知识发现方法,其特征在于,所述步骤S5进一步包括:专家知识可根据专家的需求可做出具体调整,决策针对案例所用的预测分析模型判定的数据项必须是建模时所用的相同数据;
将所述难易度因子表示在一个决策树中与专家知识封装在知识库中,可被课程达成度决策服务调用。
8.根据权利要求6所述的基于协同决策机制的试题难易度因子知识发现方法,其特征在于,所述步骤S6进一步包括:所有业务知识必须都是经过使用真实数据的决策进行测试,保证其有效性;基于最终难易度因子的课程达成度决策服务产生的数据,存入历史数据库中,作为下次机器学习的样本库。
CN201610194029.7A 2016-03-31 2016-03-31 一种基于协同决策机制的试题难易度因子知识发现方法 Pending CN105894091A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610194029.7A CN105894091A (zh) 2016-03-31 2016-03-31 一种基于协同决策机制的试题难易度因子知识发现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610194029.7A CN105894091A (zh) 2016-03-31 2016-03-31 一种基于协同决策机制的试题难易度因子知识发现方法

Publications (1)

Publication Number Publication Date
CN105894091A true CN105894091A (zh) 2016-08-24

Family

ID=57014104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610194029.7A Pending CN105894091A (zh) 2016-03-31 2016-03-31 一种基于协同决策机制的试题难易度因子知识发现方法

Country Status (1)

Country Link
CN (1) CN105894091A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484754A (zh) * 2016-07-28 2017-03-08 西安交通大学 基于层次数据与图数据可视化技术的知识森林布局方法
CN108269215A (zh) * 2018-01-16 2018-07-10 深圳市龙岗远望软件技术有限公司 一种基于移动互联网技术的应急桌面推演方法和系统
CN111708968A (zh) * 2020-06-11 2020-09-25 湖北美和易思教育科技有限公司 一种教学管理平台中消息提醒自主发送方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886054A (zh) * 2014-03-13 2014-06-25 中国科学院自动化研究所 一种网络教学资源的个性化推荐系统和推荐方法
US20140278339A1 (en) * 2013-03-15 2014-09-18 Konstantinos (Constantin) F. Aliferis Computer System and Method That Determines Sample Size and Power Required For Complex Predictive and Causal Data Analysis
CN104657567A (zh) * 2013-11-15 2015-05-27 镇江润欣科技信息有限公司 一种网络学习能力评测方法及系统
CN105260964A (zh) * 2015-11-13 2016-01-20 苏州中科知图信息科技有限公司 基于在线学习的学情分析系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140278339A1 (en) * 2013-03-15 2014-09-18 Konstantinos (Constantin) F. Aliferis Computer System and Method That Determines Sample Size and Power Required For Complex Predictive and Causal Data Analysis
CN104657567A (zh) * 2013-11-15 2015-05-27 镇江润欣科技信息有限公司 一种网络学习能力评测方法及系统
CN103886054A (zh) * 2014-03-13 2014-06-25 中国科学院自动化研究所 一种网络教学资源的个性化推荐系统和推荐方法
CN105260964A (zh) * 2015-11-13 2016-01-20 苏州中科知图信息科技有限公司 基于在线学习的学情分析系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李红松等: "试题难易程度的判断及其集对分析测定方法研究", 《武汉科技大学学报(自然科学版)》 *
袁燕: "决策树算法在高校教学评价系统中的应用", 《浙江海洋学院(自然科学版)》 *
郝荣霞: "决策树算法在计算机基础课程成绩分析", 《中国教育技术装备》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106484754A (zh) * 2016-07-28 2017-03-08 西安交通大学 基于层次数据与图数据可视化技术的知识森林布局方法
CN106484754B (zh) * 2016-07-28 2019-08-23 西安交通大学 基于层次数据与图数据可视化技术的知识森林布局方法
CN108269215A (zh) * 2018-01-16 2018-07-10 深圳市龙岗远望软件技术有限公司 一种基于移动互联网技术的应急桌面推演方法和系统
CN111708968A (zh) * 2020-06-11 2020-09-25 湖北美和易思教育科技有限公司 一种教学管理平台中消息提醒自主发送方法及系统
CN111708968B (zh) * 2020-06-11 2023-04-21 武汉美和易思数字科技有限公司 一种教学管理平台中消息提醒自主发送方法及系统

Similar Documents

Publication Publication Date Title
Gray et al. Country-specific effects of climate variability on human migration
Webber et al. Modelling horses for novel climate courses: insights from projecting potential distributions of native and alien Australian acacias with correlative and mechanistic models
Pontius Jr et al. Accuracy assessment for a simulation model of Amazonian deforestation
Shams et al. Air carbon monoxide forecasting using an artificial neural network in comparison with multiple regression
Minku et al. How to make best use of cross-company data for web effort estimation?
Roman et al. Urban tree mortality: a primer on demographic approaches
Mehdipoor et al. Developing a workflow to identify inconsistencies in volunteered geographic information: a phenological case study
CN111950708A (zh) 一种发现大学生日常生活习惯的神经网络结构与方法
Rosenberg et al. Scenario methodology for modelling of future landscape developments as basis for assessing ecosystem services
CN105894091A (zh) 一种基于协同决策机制的试题难易度因子知识发现方法
Godsoe et al. Divergence in an obligate mutualism is not explained by divergent climatic factors
Cao et al. Monitoring changes in the impervious surfaces of urban functional zones using multisource remote sensing data: A case study of Tianjin, China
CN103559585A (zh) 图书馆综合绩效评价的实现方法及系统
Corona et al. Modelling natural forest expansion on a landscape level by multinomial logistic regression
Karmshahi et al. Application of an integrated CA-Markov model in simulating spatiotemporal changes in forest cover: a case study of Malekshahi county forests, Ilam province
Bellmann et al. Regional and firm-specific effects on innovations using multi-level methods
Javaid et al. Spatio-temporal analysis of land use land cover change and its impact on land surface temperature of Sialkot City, Pakistan
Alinezhad et al. Designing a Pattern for achieving knowledge-based agriculture with a grounded theory approach in Kermanshah province
Arabov et al. DIRECTIONS OF DEVELOPMENT OF REGIONAL INFORMATION SYSTEM IN THE LABOR MARKET.
Navratil Andrew U. Frank’s impact on research in land administration
Parsons et al. Making multilevel data ideas more accessible
Wang et al. Analysis of influencing factors on graduate students' achievements in scientific research
Yuhui Innovative social governance mode of information sharing platform in the era of big data
Salazar The Effects of Climate on Output per Worker: Evidence from the Manufacturing Industry in Colombia
Parsons et al. Aiming for the optimum: examining complex relationships among sampling regime, sampling density and landscape complexity to accurately model resource availability

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160824