CN108647788B - 一种联想式知识库的自动改进方法 - Google Patents

一种联想式知识库的自动改进方法 Download PDF

Info

Publication number
CN108647788B
CN108647788B CN201810456838.XA CN201810456838A CN108647788B CN 108647788 B CN108647788 B CN 108647788B CN 201810456838 A CN201810456838 A CN 201810456838A CN 108647788 B CN108647788 B CN 108647788B
Authority
CN
China
Prior art keywords
nodes
network
knowledge base
value
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810456838.XA
Other languages
English (en)
Other versions
CN108647788A (zh
Inventor
汤胤
黄书强
杨瑾瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan University
Original Assignee
Jinan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan University filed Critical Jinan University
Priority to CN201810456838.XA priority Critical patent/CN108647788B/zh
Publication of CN108647788A publication Critical patent/CN108647788A/zh
Application granted granted Critical
Publication of CN108647788B publication Critical patent/CN108647788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/027Frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Technology (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种联想式知识库的自动改进方法,步骤为:通过对训练者在训练过程中的行为数据建模,使用统计方法找出知识点之间的拓扑结构以及关联强度,并将结果以添加、更新、删除三种操作作用于联想式知识库网络,实现知识点之间的“联想”。并且类似人类记忆,通过不断持续获得的增量数据,持续以上述操作改进知识库网络,从而实现知识库的不断进化。本发明的联想式知识库在符合学习者学习路线的前提下,还可以根据学习者学习过程中的数据动态调节知识库自身的结构,提高学习效率。

Description

一种联想式知识库的自动改进方法
技术领域
本发明涉及用于教育的知识库研究领域,特别涉及一种联想式知识库的自动改进方法。
背景技术
书籍的物理性质决定了知识先后线性地呈现在读者面前。同样,用来做训练的习题,也沿袭了这种线性结构。线性结构的训练缺少知识体系的框架,让学习者训练的模块都是零散、独立的,题目前后的连贯性不强,难以融会贯通。而根据国内外专家学者的研究,人类学习知识的过程并非只能串行地学习,这一过程可以并行实现,即在学习某一知识时,通过发散、联想地得到与之相关的知识亦是能够被学习、记忆的,并且有研究表明这种并行的学习方式不仅提高了效率,还能取得不错的效果。基于以上背景,使用联想题库结构来存储巩固所学知识的训练习题,并运用于受训者能够大大提高学习效果。这种联想式知识库或题库的建立以及知识点网状结构的呈现是传统书籍无法实现的。
发明内容
本发明的目的在于克服现有线性知识点的组织方式的缺点与不足,提供一种联想式知识库的自动改进方法。该方法可以改进现有各种基于计算机的教育的知识库的结构,将知识点之间的非线性关系表现出来,运用于实际训练,并且智能调整节点之间的连接及权重。
本发明的目的通过以下的技术方案实现:一种联想式知识库的自动改进方法,步骤为:
(1)对训练者在训练过程中的行为数据建模,找出知识点之间的拓扑结构以及关联强度;
(2)将模型输出结果以添加、更新、删除三种操作作用于联想式知识库网络,实现知识点之间的“联想”;
(3)使用增量数据重复上述过程进行训练,实现题库的不断进化。
本发明联想式知识点的组织方式,在符合学习者学习路线的前提下,还可以根据学习者行为数据,调节知识库自身的结构,大大提高学习效率。
具体的,所述联想式知识点的自动改进方法包括以下步骤:
(1)知识库以题库、多媒体内容库等为具体形式;
(2)知识库采用贝叶斯网络表示,初始阶段,针对网络中的节点,设置概率参数,记录知识点掌握的概率值,同时对连接节点的有向边设置条件概率参数,以条件概率值描述前后知识点解答情况的关系;定义有向边的关联程度,用数值表示,描述前后知识点之间关系的亲疏程度;
(3)使用弧定向方法确定连接节点的弧的方向;
(4)定义网络合理度,检查更新后的网络是否合理;如果合理,则结束训练,如果不合理,执行下述步骤;
(5)根据用户行为增量数据重新建模,对有向边的关联程度进行修改;
(6)删除关联程度低于阈值的有向边,得到更新后的贝叶斯网络,然后再通过上述步骤验证当前网络是否合理,不断训练直到更新后的网络符合合理度标准。
优选的,所述步骤(2)中,针对初始知识库使用一段时间,积累用户行为数据,用户行为数据包括作答结果、作答题目的序列数据,根据上述数据预设题节点的概率参数,该题被答对的概率值由如下公式计算获得:
Figure BDA0001659894460000021
有向边的条件概率值表示为:
Figure BDA0001659894460000022
上述概率值用来描述某道题的性质,而条件概率用于后续步骤(4)中合理度、步骤(5)中的关联程度的二次计算。
优选的,所述步骤(2)中,有向边关联程度设置为一个有限区间的数值,根据步骤(2)计算所得的条件概率值来确定关联程度的取值。
优选的,所述步骤(3)中,使用弧定向方法确定连接节点的弧的方向,步骤是:
(3-1)假设有两个节点a、b;
(3-2)分别计算a→b和b→a的互信息指标I(a→b)和I(b→a),具体计算如下:
Figure BDA0001659894460000023
Figure BDA0001659894460000031
(3-3)选择该指标大的指向作为弧的方向。
优选的,所述步骤(3)中,采用贝叶斯网络结构学习评价函数,用来度量行为数据和网络结构的拟合程度,该拟合程度即为网络合理度。
优选的,在删除关联程度低于阈值的有向边后,判断网络中是否存在节点之间存在路径但并未直接相连的节点,如果有,则增加节点之间直接相连的有向边。从而提高知识库在使用过程的效率,在此类题目间新建有向边,建立联系。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明根据知识点之间的关联程度实现联想式知识库,具体体现为题库或多媒体内容库。用解答情况的条件概率将抽象的“联想”具象化,并且作用于知识库,使得知识点间的连接改变以往的线性结构,寻找出知识点之间的相互关系。
2、本发明基于用户行为数据对知识库网络进行更新进化。更新进化体现在:使得前人的有效学习经验,即快捷、高效的学习路径,记录并应用于网络的更新;经过网络的一段时间使用,结合数据分析结果,删除网络中存在的冗余边,调整节点之间的关联程度,发现潜在的连接并创建新的边。
3、本发明使用贝叶斯网络将知识点之间的关联表现出来,将线性的知识结构变更为网状结构,使知识点之间能够通过“联想”,并且将这种联想式知识库运用于训练者的训练过程,让训练者按照知识点的关联进行训练,潜移默化地构建训练者的知识体系,增强学习的趣味性,提高学习效率。
附图说明
图1是本实施例方法的原理示意图。
图2是本实施例方法中数据、操作之间的关系图。
图3是本实施例方法的流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
如图1-3所示,本实施例一种联想式知识库的自动改进方法,其目的是基于训练使用者的行为数据,提取行为数据中反映节点之间的关联,并将该关联用于调整节点之间的连接,从使用者的解答行为中推演出最合理的贝叶斯网络参数,使网络在使用过程中不断完善自身的结构。从而节省使用者的时间,提高学习效率。下面结合附图,对本实施例的具体步骤说明如下。
(1)知识库采用贝叶斯网络表示,从知识库中抽取知识点(或题目)给答题者作答,搜集答题者的答题数据,包括作答题目信息,题目作答对错,作答题目次序信息。将上述数据输入用户行为模型中,得到答题者作答情况的分析结果,结果主要包括某道题的被答对的概率,以及题目出现次序对作答结果对错的影响,即得到连接题节点的有向边的条件概率参数。
有向边关联程度设置为一个有限区间的数值,根据步骤(1)计算所得的条件概率值来确定关联程度的取值,用来描述前后题目之间关系的亲疏程度。
(2)使用弧定向方法,确定题节点之间边的方向,步骤是:
①假设有两个节点a、b,分别计算a→b和b→a的互信息指标I(a→b)和I(b→a),具体计算如下:
Figure BDA0001659894460000041
Figure BDA0001659894460000042
②选择该指标值大的指向作为弧的方向。
(3)采用贝叶斯网络结构学习评价函数,用来度量行为数据和网络结构的拟合程度,该拟合程度即为网络合理度。根据检查根据行为数据修改的网络是否合理,如果合理,则结束训练,不再进行后面步骤,如果不合理,则执行下面的步骤。
(4)修改边的关联程度值(R):边的关联程度值R取值范围设定为[0,1],表示有向边所连接的两节点之间的相关性,该值由有向边两端节点之间存在的条件概率关系约束。假设任取两题节点a和b,且ab之间的有向边为a→b,则a,b之间有向边上的R值由如下函数式获得:
R=α1·p(b=1|a=1)+α2·p(b=1|a=0)+α3·p(b=0|a=1)+α4·p(b=0|a=1)其中,α1234的取值视模型具体实施场景而定。
(5)删除节点间不合理的边:根据步骤(4)获得的关联程度值对原始网络中的有向边进行数值化考核。不合理边存在以下两种情况:
a.原始网络结构中存在的冗余的边,即该有向边连接的两节点之间并没有关联或者关联极弱,设置关联程度阈值下限,低于规定阈值下限,结合实际条件概率值,考虑删除这些边;
b.有向边连接的两节点无明确的拓扑关系,或二者可以相互替代对方,设置关联程度阈值上限,高于规定阈值上限,结合实际条件概率值,考虑删除这些边。
(6)建立新边:借用节点重要度等相关指标,这里以介数中心性为例。将网络中的重要节点找出,并试图建立节点之间可能存在的有向边,即在初始网络结构中没有有向边表示它们之间的关系,但它们之间存在可达路径,现缩短路径长度。这里对节点的重要度进行等级划分,有向边的建立应遵循节点等级的跨度范围要求。
重复执行第(3)-(6)步操作,直至整个题库网络结构达到最优。
本发明方法的工作原理是:初始知识库网络使用一段时间,积累用户行为数据,主要包括用户作答题目id、作答结果、作答题目的时序数据,根据这些基本数据,对题节点、节点间的边增加参数,并借助这些参数确定网络中边的指向,获得题节点之间的关联程度。并根据用户行为的增量数据调整网络,其中包括边的关联程度参数更新,删除冗余的边,新建可行边,完成题库网络的更新进化。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种联想式知识库的自动改进方法,其特征在于,包括以下步骤:
(1)知识库以题库、多媒体内容库为具体形式;
(2)知识库采用贝叶斯网络表示,初始阶段,针对网络中的节点,设置概率参数,记录知识点掌握的概率值,同时对连接节点的有向边设置条件概率参数,用条件概率值描述前后知识点解答情况的关系;定义有向边的关联程度,用数值表示,描述前后知识点之间关系的亲疏程度;
(3)使用弧定向方法确定连接节点的弧的方向;步骤是:
①假设有两个节点a、b,分别计算a→b和b→a的互信息指标I(a→b)和I(b→a),具体计算如下:
Figure FDA0002897293030000011
Figure FDA0002897293030000012
②选择该指标值大的指向作为弧的方向;
(4)定义网络合理度,检查更新后的网络是否合理;如果合理,则结束训练,如果不合理,执行下述步骤;
(5)根据用户行为增量数据重新建模,对有向边的关联程度进行修改;边的关联程度值R取值范围设定为[0,1],表示有向边所连接的两节点之间的相关性,边的关联程度值R由有向边两端节点之间存在的条件概率关系约束;假设任取两题节点a和b,且ab之间的有向边为a→b,则a,b之间有向边上的R值由如下函数式获得:
R=α1·p(b=1|a=1)+α2·p(b=1|a=0)+α3·p(b=0|a=1)+α4·p(b=0|a=1)
其中,α1234的取值视模型具体实施场景而定;
(6)删除关联程度低于阈值的有向边,得到更新后的贝叶斯网络,然后再通过步骤(4)和步骤(5)验证当前网络是否合理,不断训练直到更新后的网络符合合理度标准。
2.根据权利要求1所述的联想式知识库的自动改进方法,其特征在于,针对初始知识库使用一段时间,积累用户行为数据,用户行为数据包括作答结果、作答题目的序列数据,根据上述数据预设题节点的概率参数,作答题目被答对的概率值由统计模型获得。
3.根据权利要求1所述的联想式知识库的自动改进方法,其特征在于,有向边关联程度设置为有限区间的数值,根据步骤(2)计算所得的条件概率值来确定关联程度的取值。
4.根据权利要求1所述的联想式知识库的自动改进方法,其特征在于,采用贝叶斯网络结构学习评价函数,用来度量行为数据和网络结构的拟合程度,作为网络合理度。
5.根据权利要求1所述的联想式知识库的自动改进方法,其特征在于,在删除关联程度低于阈值的有向边后,判断网络中是否存在节点之间存在路径但并未直接相连的节点,如果有,则增加节点之间直接相连的有向边。
CN201810456838.XA 2018-05-14 2018-05-14 一种联想式知识库的自动改进方法 Active CN108647788B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810456838.XA CN108647788B (zh) 2018-05-14 2018-05-14 一种联想式知识库的自动改进方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810456838.XA CN108647788B (zh) 2018-05-14 2018-05-14 一种联想式知识库的自动改进方法

Publications (2)

Publication Number Publication Date
CN108647788A CN108647788A (zh) 2018-10-12
CN108647788B true CN108647788B (zh) 2021-03-19

Family

ID=63755300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810456838.XA Active CN108647788B (zh) 2018-05-14 2018-05-14 一种联想式知识库的自动改进方法

Country Status (1)

Country Link
CN (1) CN108647788B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110377746A (zh) * 2019-05-22 2019-10-25 上海乂学教育科技有限公司 检测知识点关联性的教学系统
CN111444352A (zh) * 2020-03-26 2020-07-24 深圳壹账通智能科技有限公司 基于知识节点所属度的知识图谱构建方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151574A (en) * 1997-12-05 2000-11-21 Lucent Technologies Inc. Technique for adaptation of hidden markov models for speech recognition
CN107590229A (zh) * 2017-09-06 2018-01-16 安徽教育网络出版有限公司 一种构建学习资源多标签标注模型的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151574A (en) * 1997-12-05 2000-11-21 Lucent Technologies Inc. Technique for adaptation of hidden markov models for speech recognition
CN107590229A (zh) * 2017-09-06 2018-01-16 安徽教育网络出版有限公司 一种构建学习资源多标签标注模型的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
贝叶斯网络在知识地图中的研究与应用;刘继鹏;《中国优秀硕士学位论文全文数据库信息科技辑》;20170215(第02期);摘要,第35-72页 *

Also Published As

Publication number Publication date
CN108647788A (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
Price et al. Evaluation of a Data-Driven Feedback Algorithm for Open-Ended Programming.
CN104765842B (zh) 一种最佳学习方案推送方法及系统
Chang et al. A Bayes net toolkit for student modeling in intelligent tutoring systems
CN108614865B (zh) 基于深度强化学习的个性化学习推荐方法
CN105931116A (zh) 基于深度学习机制的自动化信用评分系统及方法
CN108806341A (zh) 一种最优个性化学习路径规划方法
CN105488103A (zh) 一种知识要点推送方法及系统
WO2016184192A1 (zh) 数据处理方法及装置
CN104732352A (zh) 一种用于试题库质量评估的方法
CN107544973A (zh) 一种对数据进行处理的方法和装置
CN108647788B (zh) 一种联想式知识库的自动改进方法
CN105574708A (zh) 一种行程规划的方法及装置
Jugo et al. Increasing the adaptivity of an intelligent tutoring system with educational data mining: a system overview
CN107544960A (zh) 一种基于变量绑定和关系激活的推理方法
Schaffernicht Detecting and monitoring change in models
CN113239209A (zh) 基于RankNet-transformer的知识图谱个性化学习路径推荐方法
CN111242267A (zh) 在线考试的组卷方法和组卷装置
CN115544158A (zh) 应用于智能教育系统的多知识点动态知识追踪方法
CN111861825A (zh) 一种轨道交通行业职业培训体系模型构建方法及系统
Martin et al. AgentX: Using reinforcement learning to improve the effectiveness of intelligent tutoring systems
CN110688480A (zh) 一种基于消息的实时教学评估方法及系统
Mamcenko et al. On using learning analytics to personalise learning in virtual learning environments
CN109635869A (zh) 在线学习干预系统
Bogarín et al. Discovering Students' Navigation Paths in Moodle.
CN110990662A (zh) 一种基于引文网络与科研合作网络的领域专家遴选方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant