一种基于IRT的信息处理方法及装置
技术领域
本发明实施例涉及信息处理技术领域,尤其涉及一种基于IRT的信息处理方法及装置。
背景技术
随着计算机技术在教育领域的广泛应用,自适应测试及自适应学习等日益得到人们的关注。自适应学习系统旨在提供一种学生自主学习平台,其对学生的解题信息进行收录,并通过技术手段对学生的做题能力进行实时评估,分析最适合学生掌握所学科目的学习路径,并与此同时对题库数据进行整合更新。自适应学习系统有合理优化学生学习日程、调动学生的学习积极性、辅助教师提高教学效率及解决教育资源分配不均等功能。
自适应学习的核心在于如何通过计算机有效的评估学生的解题信息并安排相应的学习路径。关于学生测试评估问题的研究,可追溯到二十世纪30年代提出的经典测试理论(Classical test Theory,CTT),该理论将学生解题结果看成是学生能力加随机噪声的某种线性拟合,其对心理与教育测量的理论和实践都有巨大的贡献。然而,随着时代发展,学生所学知识内容逐渐丰富和多样化,而CCT理论对测试题组的标准化要求以及随机化技术难以重复性实施等因素限制了CCT理论的应用与发展,该理论已不能满足日益多样化的教学方式和日常学习评估。因此,新的理论脱颖而出,例如贝叶斯知识跟踪(Bayesianknowledge tracing,BKT)模型及项目反映理论(Item response theory,IRT)等。
IRT模型由于其易操作性和灵活嵌入等特点,成为目前主流自适应学习平台(例如Knewton等公司)所采用的评估学生解题信息的分析引擎。IRT采用非线性函数表述学生学习能力和测试题目之间的关系。相对于经典测试理论,项目反映理论能够较好的处理一定规模的数据集,并且给出学生能力与所解题目之间的对应关系。在应用IRT模型时,一般需要对题目信息进行估计,现有的基于IRT进行题目信息估计的方案包括联合极大似然(Joint Maximum likelihood,JML)估计方法,边际极大似然(Marginal Maximumlikelihood,MML)估计方法以及马尔科夫蒙特卡洛(Markov Chain Monte Carlo,MCMC)方法等。发明人发现,MML估计方法较其他方法而言效率较高,但该方法的应用存在一定的限制条件,当每个答题者所做的题目以及做题的先后顺序一致(例如在考试等场景下)的情况下,才能够得到较高的效率以及较准确的估计结果,而自适应学习系统中包含的题目是海量的,不同答题者所做题目也是千差万别的,因此MML估计方法在应用于考试及测验场景外的自适应学习系统时的效率及准确度难以满足需求。
发明内容
本发明实施例的目的是提供一种基于IRT的信息处理方法及装置,以解决现有的基于IRT的题目信息估计方案在处理大量题目时效率低及准确度低的问题。
一方面,本发明实施例提供了一种基于IRT的信息处理方法,包括:
获取预设数量的答题者关于目标题库的答题信息样本;
基于每个答题者所做题目的答题情况为独立事件的假设,确定所述目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重;
将所述频率权重代入预设估计模型中,得到目标估计模型,其中,所述预设估计模型为基于IRT模型及边际极大似然MML估计方法的最大后验概率估计模型;
根据所述答题样本信息利用MML估计方法对所述目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计,其中,所述题目信息包括区分度和难度。
另一方面,本发明实施例提供了一种基于IRT的信息处理装置,包括:
答题样本获取模块,用于获取预设数量的答题者关于目标题库的答题信息样本;
频率权重确定模块,用于基于每个答题者所做题目的答题情况为独立事件的假设,确定所述目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重;
频率权重代入模块,用于将所述频率权重代入预设估计模型中,得到目标估计模型,其中,所述预设估计模型为基于IRT模型及边际极大似然MML估计方法的最大后验概率估计模型;
信息估计模块,用于根据所述答题样本信息利用MML估计方法对所述目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计,其中,所述题目信息包括区分度和难度。
本发明实施例中提供的基于IRT的信息处理方案,将基于IRT模型及MML估计方法的最大后验概率估计模型作为预设估计模型,在此基础上,摒弃了传统的分析题目各种答题情况出现频次时基于固定题组的各种答题情况出现频次反推单个题目的答题情况出现频次的思路,而基于每个答题者所做题目的答题情况为独立事件的假设,确定目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重,并将该频率权重代入预设估计模型中,得到目标估计模型,最后根据所获取的预设数量的答题者关于目标题库的答题信息样本利用MML估计方法对目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计。通过采用上述技术方案,解决了因题组中包含大量题目时基于IRT模型的MML估计方法效率及准确度急剧降低甚至不可行的问题,使基于IRT模型的MML估计方法能够更好地应用于自适应学习环境,并有效提升模型效率及估计准确度。
附图说明
图1为本发明实施例一提供的一种基于IRT的信息处理方法的流程示意图;
图2为本发明实施例二提供的一种基于IRT的信息处理方法的流程示意图;
图3为本发明实施例三提供的一种基于IRT的信息处理装置的结构框图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前,应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
为了方便理解本发明实施例的具体方案,下面先对IRT进行简单的介绍。项目反应理论IRT又称潜在特质理论或项目特征曲线理论,它是对答题者能力的一种估计,并将考生对单个测验项目(题目)的某种反应概率(如答对概率或答错概率)与该试题的一定特质(如题目区分度及题目难度等)联系起来。特征曲线包含了对试题的特征进行描述的试题参数和对答题者的特征进行描述的潜在特质或能力参数。目前应用最广的IRT模型是以伯恩鲍姆提出的逻辑斯蒂模型为代表的模型,根据参数数量的不同,特征函数可分为单参数IRT模型、双参数IRT模型和三参数IRT模型,本发明实施例将以最具代表性的双参数IRT模型为例进行后续的说明,但值得说明的是,本发明实施例的方案同样适用于单参数IRT模型和三参数IRT模型,本领域技术人员通过阅读下述关于双参数IRT模型的相关说明可在不付出创造性劳动的情况下得到应用于单参数IRT模型和三参数IRT模型的具体方案,因此本发明实施例中不再赘述。
实施例一
图1为本发明实施例一提供的一种基于IRT的信息处理方法的流程示意图,该方法可以由基于IRT的信息处理装置执行,其中该装置可由软件和/或硬件实现,一般可集成在自适应学习系统内的终端中,该终端可以是个人电脑或服务器等终端,也可以是平板电脑或智能手机等移动终端,本发明实施例不作具体限定。如图1所示,该方法包括:
步骤110、获取预设数量的答题者关于目标题库的答题信息样本。
本实施例中,可根据实际需求选取目标题库以及答题者的预设数量。例如,可以获取一个班级的学生关于初中一年级英语科目题库的答题信息样本;也可以获取A市12-15岁年龄段的学生关于奥林匹克数学题库的答题信息样本;当然,答题者并不限于学生,还可应用于其他领域中,如可获取B地区驾照考取人员关于科目一的答题信息样本等。示例性的,答题信息样本可包括答题数量、作答题目及答题情况(如做对或做错)等信息。
步骤120、基于每个答题者所做题目的答题情况为独立事件的假设,确定目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重。
在本发明实施例中,以经典的双参数IRT模型为例,设θ是答题者的学习能力,α、β分别是待选题目的区分度和难度(系数),则该道题目被答题者做对的概率是:
需要说明的是,在单参数IRT模型里面,一般用固定的D(D取值1.7)来代替α。
为了对目标题库中题目的题目信息进行估计,需要根据做过这些题目的答题者的答题信息(即步骤110中获取的答题信息样本)来估计题库中每道题目的区分度和难度。
具体的,给定答题者i和题库题目j,需要最大化如下的最大后验概率估计:
其中,i表示答题者,j表示题目,Xi,j表示答题者i关于题目j的做题对错情况,αj表示题目j的区分度,βj表示题目j的难度系数,θi表示答题者i的学习能力,P(Xi,j|αj,βj,θi)表示做题人员i做对/错题目j的概率,表示θi满足均值为方差为的正态分布,表示βj满足均值为方差为的正态分布,表示lnαj满足均值为方差为的正态分布。将上述公式记为基于IRT模型的最大后验概率估计模型。
常用的解决上述优化问题的方法有上文提到的JML估计方法,MML估计方法以及MCMC方法等,本发明实施例采用了其中应用较广泛的MML估计方法。该方法中,可假设学习能力θ满足一定的先验分布,得到步骤130中所述的预设估计模型,即基于IRT模型及MML估计方法的最大后验概率估计模型。例如,θi满足均值为方差为的预设先验正态分布。为了便于说明,这里假设θi满足均值为0方差为1的先验正态分布,即θi满足基于该假设,可将上述基于IRT模型的最大后验概率估计模型转化成:
其中,表示题目j被所有学习能力为θi的答题者做对或做错的频率,其中,Itemj=1时表示做对,Itemj=0时表示做错。
进一步的,引入高斯-厄米特(Gauss–Hermite)积分公式来模拟学生的能力采样,假设学生的学习能力满足正态分布,则学生能力θ取值为x的频次为
其中,Hn-1(x)是n-1次Hermite多项式,学习能力采样点x取多项式Hn-1(x)所有可能的零点。
为了得到即得到题目j被所有学习能力为θi的答题者做对的频率,传统的分析题目各种答题情况出现频次的思路是通过提供给答题者固定题组,基于固定题组的各种答题情况出现的频次反推单个题目的答题情况出现的频次,假设答题者的答题情况及传统方式分析结果如下表所示:
其中,答题者做了两道题目A和B,(1,1)表示第一道做对,第二道做对;(2,1)表示第一道做错,第二道做对;(1,2)表示第一道做对,第二道做错;(2,2)表示第一道做错,第二道做错。E(patternk)表示每种情况(模式)出现的概率。item-A/1表示题目A被做对的概率;item-A/2表示题目A被做错的概率;item-B/1表示题目B被做对的概率;item-B/2表示题目B被做错的概率。由E(patternk)反推出item-A/1等的取值,最后得到每道题被做对或做错的概率总计结果(total)。可以想见,当线上自适应平台为答题者提供题目组合方案时,系统给每个答题者推荐的题目可能是各不相同的,同时单个答题者做题数又远远小于所有答题者做题总数,如果将所有答题者的做题总数(往往数以几十万计)整合成一个固定题组(即Pattern),需要知道题组的所有模式,然后依据下式进行更新:
可想而知,在题目数量较大时,题组可能出现的模式总数呈指数增长,则上述方式的效率及准确度将极度下降,且对硬件设备性能要求极高,甚至很难符合要求,使MML方法应用于自适应答题环境变得不可行。
因此,本发明实施例摒弃了上述传统的分析题目各种答题情况出现频次时基于固定题组的各种答题情况出现频次反推单个题目的答题情况出现频次的思路,创新地提出假设每个答题者所做题目的各种答题情况出现的可能性存在一定的独立性,即每个答题者所做题目的答题情况可近似视为独立事件,采用直接从单个题目各答题情况出现的频次入手的处理方式,即基于每个答题者所做题目的答题情况为独立事件的假设,确定目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重。其中,本实施例中的“确定目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重”具体可指:对于目标题库中的每一道题目,分别确定当前题目被所有具备预设学习能力的答题者做对的频率权重。
具体的,所述频率权重的计算方法如下:
其中,表示题目j被所有学习能力为θi的答题者做对的频率,表示题目Itemj做对的统计频率,P(Itemj=1|θi)表示题目j被做对的情况中学习能力为θi的学生出现的后验概率,P(θi)代表所有答题者学习能力的先验假设。
步骤130、将频率权重代入预设估计模型中,得到目标估计模型。
其中,预设估计模型为基于IRT模型及MML估计方法的最大后验概率估计模型。
将步骤120中得到的频率权重代入到基于IRT模型及MML估计方法的最大后验概率估计模型中,代入过程本领域技术人员可在不付出创造性劳动的情况下完成,本发明实施例在此不做展开。
步骤140、根据答题样本信息利用MML估计方法对目标估计模型进行训练,以对目标题库中的各题目的题目信息进行估计。
其中,所述题目信息包括区分度和难度。
示例性的,将答题样本信息输入目标估计模型中,利用MML估计方法通过最大化目标估计模型的方式对目标估计模型进行训练,以对目标题库中的各题目的题目信息进行估计。具体的估计过程可参照已有的基于IRT的MML估计方法,本发明实施例此处不再赘述。
本发明实施例一提供的基于IRT的信息处理方法,将基于IRT模型及MML估计方法的最大后验概率估计模型作为预设估计模型,在此基础上,摒弃了传统的分析题目答题情况频次是基于固定题组答题情况频次反推单个题目答题情况频次的思路,而基于每个答题者所做题目的答题情况为独立事件的假设,确定目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重,并将该频率权重代入预设估计模型中,得到目标估计模型,最后根据所获取的预设数量的答题者关于目标题库的答题信息样本利用MML估计方法对目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计。通过采用上述技术方案,解决了因题组中包含大量题目时基于IRT模型的MML估计方法效率及准确度急剧降低甚至不可行的问题,使基于IRT模型的MML估计方法能够更好的应用于考试及测验场景外的自适应学习环境,并有效提升效率及准确度。
实施例二
图2为本发明实施例二提供的一种基于IRT的信息处理方法的流程示意图,本实施例以上述实施例为基础进行优化,在本实施例中,在对目标题库中的各题目的题目信息进行估计后,还增加了向答题者推送题目的相关步骤。
具体的,本实施例的方法包括如下步骤:
步骤210、获取预设数量的答题者关于目标题库的答题信息样本。
步骤220、基于每个答题者所做题目的答题情况为独立事件的假设,确定目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重。
步骤230、将频率权重代入预设估计模型中,得到目标估计模型。
其中,所述预设估计模型为基于IRT模型及MML估计方法的最大后验概率估计模型。
步骤240、将答题样本信息输入目标估计模型中。
步骤250、利用MML估计方法通过最大化目标估计模型的方式对目标估计模型进行训练,以对目标题库中的各题目的题目信息进行估计。
步骤260、根据训练完成的目标估计模型建立预测模型。
步骤270、获取当前答题者的当前学习能力。
具体的,本步骤可包括:假设答题者的学习能力的演进满足维纳过程,并更新预测模型,获取当前答题者的历史答题数据,根据历史答题数据及更新后的预测模型确定当前答题者的当前学习能力。
进一步的,答题者的学习能力的变化是一个随着时间演进的过程,因此,在对答题者的答题预测环节本发明实施例考虑这一因素。所述假设答题者的学习能力的演进满足维纳过程,并更新所述预测模型,包括:
假设答题者的学习能力的演进满足维纳过程如下:
其中,γ是维纳过程的平滑先验假设参数,θt′+τ为答题者的当前学习能力,θt′为答题者上一次做题时刻t′的学习能力,τ=t-t′表示两次做题的时间间隔。
将上述假设加入到预测模型中,即在任意t时刻,对于任意t之前的时间点t′,更新所述预测模型得到更新后的预测模型如下:
其中,
表示题目j在t′时刻的修正区分度,θi,t表示答题者i的当前学习能力,Xi,j,t′表示答题者i关于题目j在t′时刻的做题对错情况,Xi,j,t′=1表示答题者i在t′时刻做题对题目j。
随后获取当前答题者的历史答题数据,根据历史答题数据及更新后的预测模型确定当前答题者的当前学习能力。具体的,可采用极大后验概率估计方式利用更新后的预测模型来估计出当前答题者当前时刻的学习能力,利用该方法可对答题者的学习能力进行平滑处理,提高预测精度。
步骤280、对于目标题库中的候选题目,根据当前学习能力、候选题目的题目信息及预测模型确定当前答题者答对候选题目的概率。
步骤290、当所确定的概率满足预设条件时,向当前答题者推送候选题目。
示例性的,预设条件可以根据自适应学习系统的默认设置来确定,也可由答题者根据自身情况自行设置。例如,预设条件可以是所确定的概率处于预设数值范围内,假设该范围0.5-0.8,如对于候选题目C,当所确定的概率为0.6时,则向当前答题者推送该题目C。
优选的,本步骤可具体包括:
定义候选题目的熵值为:
H=-PFinallogPFinal-(1-PFinal)log(1-PFinal)
其中,PFinal为当所确定的概率,H为候选题目的熵值。
当PFinal满足使得H的值大于预设数值时,向当前答题者推送候选题目。
可以理解的是,根据最大熵原理,候选题目的熵值越大,则答题者练习该题所能获取的信息量越多,所以当H值大于一定的数值时,向当前答题者推送候选题目。
本发明实施例提供的基于IRT的信息处理方法,在对目标题库中题目的题目信息进行估计后,建立预测模型,并基于该预测模型和当前答题者的当前学习能力来快速准确地选择合适的题目推送给答题者进行作答,使自适应学习系统更具备针对性和个性化,最大化答题者的学习效果,避免了答题者重复做太多简单题或直接做难题导致不会做或没有收获等低效的情况。
实施例三
图3为本发明实施例三提供的一种基于IRT的信息处理装置的结构框图,该装置可由软件和/或硬件实现,一般可集成在自适应学习系统内的终端中,该终端可以是个人电脑或服务器等终端,也可以是平板电脑或智能手机等移动终端,本发明实施例不作具体限定。如图3所示,该装置包括答题样本获取模块31、频率权重确定模块32、频率权重代入模块33和信息估计模块34。
其中,答题样本获取模块31,用于获取预设数量的答题者关于目标题库的答题信息样本;频率权重确定模块32,用于基于每个答题者所做题目的答题情况为独立事件的假设,确定所述目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重;频率权重代入模块33,用于将所述频率权重代入预设估计模型中,得到目标估计模型,其中,所述预设估计模型为基于IRT模型及边际极大似然MML估计方法的最大后验概率估计模型;信息估计模块34,用于根据所述答题样本信息利用MML估计方法对所述目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计,其中,所述题目信息包括区分度和难度。
本发明实施例提供的基于IRT的信息处理装置,解决了因题组中包含大量题目时基于IRT的MML估计方法效率及准确度急剧降低甚至不可行的问题,使基于IRT模型的MML估计方法能够更好的应用于自适应学习环境,并有效提升模型运行效率及估计准确度。
在上述实施例的基础上,基于每个答题者所做题目的答题情况为独立事件的假设,确定所述目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重,包括:
基于每个答题者所做题目的答题情况为独立事件的假设,确定所述目标题库中的对应题目被所有具备预设学习能力的答题者做对的频率权重,所述频率权重的计算方法如下:
其中,表示题目j被所有学习能力为θi的答题者做对的频率,表示题目Itemj做对的统计频率,P(Itemj=1|θi)表示题目j被做对的情况中学习能力为θi的学生出现的后验概率,P(θi)代表所有答题者学习能力的先验假设。
在上述实施例的基础上,所述预设估计模型为:
其中,i表示答题者,j表示题目,Xi,j表示答题者i关于题目j的做题对错情况,αj表示题目j的区分度,βj表示题目j的难度系数,θi表示答题者i的学习能力,P(Xi,j|αj,βj,θi)表示做题人员i做对/错题目j的概率,表示θi满足均值为方差为的预设先验正态分布,表示βj满足均值为方差为的正态分布,表示lnαj满足均值为方差为的正态分布。
在上述实施例的基础上,所述频率权重代入模块具体用于:
将预设估计模型转化为:
其中,θi满足均值为0方差为1的先验正态分布,且θi是基于高斯-厄米特积分公式的采样点;
将所述频率表达式代入上述模型中,得到目标估计模型。
在上述实施例的基础上,所述信息估计模块具体用于:
将所述答题样本信息输入所述目标估计模型中;
利用MML估计方法通过最大化所述目标估计模型的方式对所述目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计。
在上述实施例的基础上,该装置还包括:
预测模型建立模块,用于在利用MML估计方法通过最大化所述目标估计模型的方式对所述目标估计模型进行训练,以对所述目标题库中的各题目的题目信息进行估计之后,根据训练完成的目标估计模型建立预测模型;
学习能力获取模块,用于获取当前答题者的当前学习能力;
概率确定模块,用于对于所述目标题库中的候选题目,根据所述当前学习能力、所述候选题目的题目信息及所述预测模型确定所述当前答题者答对所述候选题目的概率;
题目推送模块,用于在所确定的概率满足预设条件时,向所述当前答题者推送所述候选题目。
在上述实施例的基础上,所述学习能力获取模块包括:
预测模型更新单元,用于假设答题者的学习能力的演进满足维纳过程,并更新所述预测模型;
答题数据获取单元,用于获取当前答题者的历史答题数据;
学习能力确定单元,用于根据所述历史答题数据及更新后的预测模型确定所述当前答题者的当前学习能力。
在上述实施例的基础上,所述预测模型更新单元具体用于:
假设答题者的学习能力的演进满足维纳过程如下:
其中,γ是维纳过程的平滑先验假设参数,θt′+τ为答题者的当前学习能力,θt′为答题者上一次做题时刻t′的学习能力,τ=t-t′表示两次做题的时间间隔;
更新所述预测模型得到更新后的预测模型如下:
其中,
表示题目j在t′时刻的修正区分度,θi,t表示答题者i的当前学习能力,Xi,j,t′表示答题者i关于题目j在t′时刻的做题对错情况,Xi,j,t′=1表示答题者i在t′时刻做题对题目j。
上述实施例中提供的基于IRT的信息处理装置可执行本发明任意实施例所提供的基于IRT的信息处理方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于IRT的信息处理方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。