CN108647788B

CN108647788B - 一种联想式知识库的自动改进方法

Info

Publication number: CN108647788B
Application number: CN201810456838.XA
Authority: CN
Inventors: 汤胤; 黄书强; 杨瑾瑜
Original assignee: Jinan University
Current assignee: Jinan University
Priority date: 2018-05-14
Filing date: 2018-05-14
Publication date: 2021-03-19
Anticipated expiration: 2038-05-14
Also published as: CN108647788A

Abstract

本发明公开了一种联想式知识库的自动改进方法，步骤为：通过对训练者在训练过程中的行为数据建模，使用统计方法找出知识点之间的拓扑结构以及关联强度，并将结果以添加、更新、删除三种操作作用于联想式知识库网络，实现知识点之间的“联想”。并且类似人类记忆，通过不断持续获得的增量数据，持续以上述操作改进知识库网络，从而实现知识库的不断进化。本发明的联想式知识库在符合学习者学习路线的前提下，还可以根据学习者学习过程中的数据动态调节知识库自身的结构，提高学习效率。

Description

一种联想式知识库的自动改进方法

技术领域

本发明涉及用于教育的知识库研究领域，特别涉及一种联想式知识库的自动改进方法。

背景技术

书籍的物理性质决定了知识先后线性地呈现在读者面前。同样，用来做训练的习题，也沿袭了这种线性结构。线性结构的训练缺少知识体系的框架，让学习者训练的模块都是零散、独立的，题目前后的连贯性不强，难以融会贯通。而根据国内外专家学者的研究，人类学习知识的过程并非只能串行地学习，这一过程可以并行实现，即在学习某一知识时，通过发散、联想地得到与之相关的知识亦是能够被学习、记忆的，并且有研究表明这种并行的学习方式不仅提高了效率，还能取得不错的效果。基于以上背景，使用联想题库结构来存储巩固所学知识的训练习题，并运用于受训者能够大大提高学习效果。这种联想式知识库或题库的建立以及知识点网状结构的呈现是传统书籍无法实现的。

发明内容

本发明的目的在于克服现有线性知识点的组织方式的缺点与不足，提供一种联想式知识库的自动改进方法。该方法可以改进现有各种基于计算机的教育的知识库的结构，将知识点之间的非线性关系表现出来，运用于实际训练，并且智能调整节点之间的连接及权重。

本发明的目的通过以下的技术方案实现：一种联想式知识库的自动改进方法，步骤为：

(1)对训练者在训练过程中的行为数据建模，找出知识点之间的拓扑结构以及关联强度；

(2)将模型输出结果以添加、更新、删除三种操作作用于联想式知识库网络，实现知识点之间的“联想”；

(3)使用增量数据重复上述过程进行训练，实现题库的不断进化。

本发明联想式知识点的组织方式，在符合学习者学习路线的前提下，还可以根据学习者行为数据，调节知识库自身的结构，大大提高学习效率。

具体的，所述联想式知识点的自动改进方法包括以下步骤：

(1)知识库以题库、多媒体内容库等为具体形式；

(2)知识库采用贝叶斯网络表示，初始阶段，针对网络中的节点，设置概率参数，记录知识点掌握的概率值，同时对连接节点的有向边设置条件概率参数，以条件概率值描述前后知识点解答情况的关系；定义有向边的关联程度，用数值表示，描述前后知识点之间关系的亲疏程度；

(3)使用弧定向方法确定连接节点的弧的方向；

(4)定义网络合理度，检查更新后的网络是否合理；如果合理，则结束训练，如果不合理，执行下述步骤；

(5)根据用户行为增量数据重新建模，对有向边的关联程度进行修改；

(6)删除关联程度低于阈值的有向边，得到更新后的贝叶斯网络，然后再通过上述步骤验证当前网络是否合理，不断训练直到更新后的网络符合合理度标准。

优选的，所述步骤(2)中，针对初始知识库使用一段时间，积累用户行为数据，用户行为数据包括作答结果、作答题目的序列数据，根据上述数据预设题节点的概率参数，该题被答对的概率值由如下公式计算获得：

有向边的条件概率值表示为：

上述概率值用来描述某道题的性质，而条件概率用于后续步骤(4)中合理度、步骤(5)中的关联程度的二次计算。

优选的，所述步骤(2)中，有向边关联程度设置为一个有限区间的数值，根据步骤(2)计算所得的条件概率值来确定关联程度的取值。

优选的，所述步骤(3)中，使用弧定向方法确定连接节点的弧的方向，步骤是：

(3-1)假设有两个节点a、b；

(3-2)分别计算a→b和b→a的互信息指标I(a→b)和I(b→a)，具体计算如下：

和

(3-3)选择该指标大的指向作为弧的方向。

优选的，所述步骤(3)中，采用贝叶斯网络结构学习评价函数，用来度量行为数据和网络结构的拟合程度，该拟合程度即为网络合理度。

优选的，在删除关联程度低于阈值的有向边后，判断网络中是否存在节点之间存在路径但并未直接相连的节点，如果有，则增加节点之间直接相连的有向边。从而提高知识库在使用过程的效率，在此类题目间新建有向边，建立联系。

本发明与现有技术相比，具有如下优点和有益效果：

1、本发明根据知识点之间的关联程度实现联想式知识库，具体体现为题库或多媒体内容库。用解答情况的条件概率将抽象的“联想”具象化，并且作用于知识库，使得知识点间的连接改变以往的线性结构，寻找出知识点之间的相互关系。

2、本发明基于用户行为数据对知识库网络进行更新进化。更新进化体现在：使得前人的有效学习经验，即快捷、高效的学习路径，记录并应用于网络的更新；经过网络的一段时间使用，结合数据分析结果，删除网络中存在的冗余边，调整节点之间的关联程度，发现潜在的连接并创建新的边。

3、本发明使用贝叶斯网络将知识点之间的关联表现出来，将线性的知识结构变更为网状结构，使知识点之间能够通过“联想”，并且将这种联想式知识库运用于训练者的训练过程，让训练者按照知识点的关联进行训练，潜移默化地构建训练者的知识体系，增强学习的趣味性，提高学习效率。

附图说明

图1是本实施例方法的原理示意图。

图2是本实施例方法中数据、操作之间的关系图。

图3是本实施例方法的流程图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例1

如图1-3所示，本实施例一种联想式知识库的自动改进方法，其目的是基于训练使用者的行为数据，提取行为数据中反映节点之间的关联，并将该关联用于调整节点之间的连接，从使用者的解答行为中推演出最合理的贝叶斯网络参数，使网络在使用过程中不断完善自身的结构。从而节省使用者的时间，提高学习效率。下面结合附图，对本实施例的具体步骤说明如下。

(1)知识库采用贝叶斯网络表示，从知识库中抽取知识点(或题目)给答题者作答，搜集答题者的答题数据，包括作答题目信息，题目作答对错，作答题目次序信息。将上述数据输入用户行为模型中，得到答题者作答情况的分析结果，结果主要包括某道题的被答对的概率，以及题目出现次序对作答结果对错的影响，即得到连接题节点的有向边的条件概率参数。

有向边关联程度设置为一个有限区间的数值，根据步骤(1)计算所得的条件概率值来确定关联程度的取值，用来描述前后题目之间关系的亲疏程度。

(2)使用弧定向方法，确定题节点之间边的方向，步骤是：

①假设有两个节点a、b，分别计算a→b和b→a的互信息指标I(a→b)和I(b→a)，具体计算如下：

和

②选择该指标值大的指向作为弧的方向。

(3)采用贝叶斯网络结构学习评价函数，用来度量行为数据和网络结构的拟合程度，该拟合程度即为网络合理度。根据检查根据行为数据修改的网络是否合理，如果合理，则结束训练，不再进行后面步骤，如果不合理，则执行下面的步骤。

(4)修改边的关联程度值(R)：边的关联程度值R取值范围设定为[0，1]，表示有向边所连接的两节点之间的相关性，该值由有向边两端节点之间存在的条件概率关系约束。假设任取两题节点a和b，且ab之间的有向边为a→b，则a,b之间有向边上的R值由如下函数式获得：

R＝α₁·p(b＝1|a＝1)+α₂·p(b＝1|a＝0)+α₃·p(b＝0|a＝1)+α₄·p(b＝0|a＝1)其中，α₁,α₂,α₃,α₄的取值视模型具体实施场景而定。

(5)删除节点间不合理的边：根据步骤(4)获得的关联程度值对原始网络中的有向边进行数值化考核。不合理边存在以下两种情况：

a.原始网络结构中存在的冗余的边，即该有向边连接的两节点之间并没有关联或者关联极弱，设置关联程度阈值下限，低于规定阈值下限，结合实际条件概率值，考虑删除这些边；

b.有向边连接的两节点无明确的拓扑关系，或二者可以相互替代对方，设置关联程度阈值上限，高于规定阈值上限，结合实际条件概率值，考虑删除这些边。

(6)建立新边：借用节点重要度等相关指标，这里以介数中心性为例。将网络中的重要节点找出，并试图建立节点之间可能存在的有向边，即在初始网络结构中没有有向边表示它们之间的关系，但它们之间存在可达路径，现缩短路径长度。这里对节点的重要度进行等级划分，有向边的建立应遵循节点等级的跨度范围要求。

重复执行第(3)-(6)步操作，直至整个题库网络结构达到最优。

本发明方法的工作原理是：初始知识库网络使用一段时间，积累用户行为数据，主要包括用户作答题目id、作答结果、作答题目的时序数据，根据这些基本数据，对题节点、节点间的边增加参数，并借助这些参数确定网络中边的指向，获得题节点之间的关联程度。并根据用户行为的增量数据调整网络，其中包括边的关联程度参数更新，删除冗余的边，新建可行边，完成题库网络的更新进化。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种联想式知识库的自动改进方法，其特征在于，包括以下步骤：

(1)知识库以题库、多媒体内容库为具体形式；

(2)知识库采用贝叶斯网络表示，初始阶段，针对网络中的节点，设置概率参数，记录知识点掌握的概率值，同时对连接节点的有向边设置条件概率参数，用条件概率值描述前后知识点解答情况的关系；定义有向边的关联程度，用数值表示，描述前后知识点之间关系的亲疏程度；

(3)使用弧定向方法确定连接节点的弧的方向；步骤是：

和

②选择该指标值大的指向作为弧的方向；

(5)根据用户行为增量数据重新建模，对有向边的关联程度进行修改；边的关联程度值R取值范围设定为[0，1]，表示有向边所连接的两节点之间的相关性，边的关联程度值R由有向边两端节点之间存在的条件概率关系约束；假设任取两题节点a和b，且ab之间的有向边为a→b，则a,b之间有向边上的R值由如下函数式获得：

R＝α₁·p(b＝1|a＝1)+α₂·p(b＝1|a＝0)+α₃·p(b＝0|a＝1)+α₄·p(b＝0|a＝1)

其中，α₁,α₂,α₃,α₄的取值视模型具体实施场景而定；

(6)删除关联程度低于阈值的有向边，得到更新后的贝叶斯网络，然后再通过步骤(4)和步骤(5)验证当前网络是否合理，不断训练直到更新后的网络符合合理度标准。

2.根据权利要求1所述的联想式知识库的自动改进方法，其特征在于，针对初始知识库使用一段时间，积累用户行为数据，用户行为数据包括作答结果、作答题目的序列数据，根据上述数据预设题节点的概率参数，作答题目被答对的概率值由统计模型获得。

3.根据权利要求1所述的联想式知识库的自动改进方法，其特征在于，有向边关联程度设置为有限区间的数值，根据步骤(2)计算所得的条件概率值来确定关联程度的取值。

4.根据权利要求1所述的联想式知识库的自动改进方法，其特征在于，采用贝叶斯网络结构学习评价函数，用来度量行为数据和网络结构的拟合程度，作为网络合理度。

5.根据权利要求1所述的联想式知识库的自动改进方法，其特征在于，在删除关联程度低于阈值的有向边后，判断网络中是否存在节点之间存在路径但并未直接相连的节点，如果有，则增加节点之间直接相连的有向边。