CN109002499B - 学科相关性知识点库构建方法及其系统 - Google Patents
学科相关性知识点库构建方法及其系统 Download PDFInfo
- Publication number
- CN109002499B CN109002499B CN201810694266.9A CN201810694266A CN109002499B CN 109002499 B CN109002499 B CN 109002499B CN 201810694266 A CN201810694266 A CN 201810694266A CN 109002499 B CN109002499 B CN 109002499B
- Authority
- CN
- China
- Prior art keywords
- knowledge point
- knowledge
- points
- correlation
- subject
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000009411 base construction Methods 0.000 title description 5
- 238000010276 construction Methods 0.000 claims abstract description 25
- 230000002123 temporal effect Effects 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000012163 sequencing technique Methods 0.000 claims description 15
- 230000001174 ascending effect Effects 0.000 claims description 8
- 230000010365 information processing Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 8
- 230000009471 action Effects 0.000 description 7
- 239000000463 material Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及计算机信息处理领域,公开了一种学科相关性知识点库构建方法及其系统,能够根据一个知识点迅速而准确地找到与该知识点相关的所有知识点,而且能够知道这些知识点的相关程度。该方法包括:对于多个知识点,计算每个知识点的属性相关知识点集合;计算每个知识点的语义相关知识点集合;根据属性相关知识点集合和语义相关性知识点集合,计算每个知识点的相关性知识点集合。
Description
技术领域
本申请涉及计算机信息处理领域,特别涉及以计算机自动化构建学科相关性知识点库的技术。
背景技术
现有教育信息化技术中,对大、中、小学等教材的知识点选取和访问方式,既没有统一标准,也没有统一的知识点库,无法为教育信息化领域提供标准化、数字化的知识点库基础。同时教学资料的快速、准确搜索越来越重要,尤其是在老师备课搜索相关资源,因为无法根据知识点的相关性进行搜索,经常会出现很多无用资源,无法达到有效知识点准确、全面的检索效果。
如何构建一个数据库,从而能够根据一个知识点迅速而准确地找到与该知识点相关的所有知识点,并且能够知道这些知识点的相关程度,就成为本领域急需解决的技术问题。该技术问题的解决,可以为基于知识点相关性的各种应用打下坚实的技术基础。
发明内容
本申请的目的在于提供一种学科相关性知识点库构建方法及其系统,能够根据一个知识点迅速而准确地找到与该知识点相关的所有知识点,并且能够知道这些知识点的相关程度。
为了解决上述问题,本申请公开了一种学科相关性知识点库构建方法,包括:
对于多个知识点,计算每个知识点的属性相关知识点集合;
计算该每个知识点的语义相关知识点集合;
根据该属性相关知识点集合和该语义相关性知识点集合,计算该每个知识点的相关性知识点集合。
在一优选例中,该计算每个知识点的属性相关知识点集合之前,还包括:
为该多个知识点中的每个知识点分别设置一个编码。
在一优选例中,每个知识点的编码中包括:学科编码,子学科编码,专题编码,主题编码,和时间性编码。
在一优选例中,该为该多个知识点中的每个知识点分别设置一个编码,进一步包括:
根据知识点的学科名称,获取对应的学科编码;
根据该知识点的学科编码和子学科名称,获取对应的子学科编码;
根据该知识点的学科编码、子学科编码和专题名称,获取对应的专题编码;
根据该知识点的学科编码、子学科编码、专题编码和主题名称,获取对应的主题编码;
如果该知识点为专题知识点,则该知识点的主题编码和时间性编码均设置为0;
如果该知识点为主题知识点,则该知识点的时间性编码设置为0;
如果该知识点为普通知识点,则根据该知识点的知识点名称和主题,生成该知识点的时间性编码。
在一优选例中,该计算每个知识点的属性相关知识点集合,进一步包括:
将要计算属性相关知识点集合的知识点作为目标知识点,计算该目标知识点的直系和旁系知识点,该直系和旁系知识点构成该属性相关知识点集合;
对得到的直系和旁系知识点按与该目标知识点的亲疏度进行排序;
根据该排序的结果计算该属性相关知识点集合中各知识点与目标知识点的属性相关度。
在一优选例中,该计算该目标知识点的直系和旁系知识点,进一步包括:
将该目标知识点分别与其他知识点进行第一逻辑运算,如果逻辑运算结果各位均为0,则判定为直系;若逻辑运算结果有1位不为0,则判定为旁系;
其中,该第一逻辑运算的运算规则为:对于两个知识点编码对应的每一位分别进行比较,若两个知识点编码在该位相同或有一位为0,则该位的运算结果为0;若两个知识点编码在该位不同且不为0,则该位的运算结果为1。
在一优选例中,该对得到的直系和旁系知识点按与该目标知识点的亲疏度进行排序中,该直系、旁系知识点与该目标知识点的亲疏度根据以下方式确定:
直系、旁系知识点分别与该知识点的属性编码段依次进行第二逻辑运算,若该段编码相同,则该段的运算结果为1,若该段编码不同,则该段的运算结果为0;
目标知识点与直系知识点的亲疏度大于旁系知识点;
根据逻辑运算的结果,分别对直系、旁系知识点进行升序排列;
对逻辑运算结果相同的知识点,根据知识点编码进行升序排列;
对以上知识点进行排序整合,越相近的知识点之间亲疏度越高。
在一优选例中,该根据该排序的结果计算该属性相关知识点集合中各知识点与目标知识点的属性相关度,进一步包括:
计算该直系和旁系知识点总数N;
按亲疏度排列该直系和旁系知识点,计算各直系和旁系知识点到该目标知识点的距离M;
各直系和旁系知识点与该目标知识点的属性相关度为1-M/N。
在一优选例中,该计算该每个知识点的语义相关知识点集合,进一步包括:
基于多个知识点语义资料,获取每个语义资料中的知识点;
根据该每个语义资料中的知识点,计算该每个知识点与其他知识点的语义相关度;
对于该每个知识点,将与该知识点的语义相关度高于预定门限的其他知识点加入该知识点的语义相关知识点集合。
在一优选例中,该计算该每个知识点与其他知识点的语义相关度的步骤中,通过以下方式计算第一知识点和第二知识点的语义相关度:
获取知识点语义资料中包含的知识点集合并将知识点以编码方式保存,其中该第一知识点的语义资料中包含M个知识点,该第二知识点的语义资料中包含N个知识点;
计算该第一知识点与该第二知识点的语义资料中相同的知识点编码,获得P个相同的知识点编码;
该第二知识点相对于该第一知识点的语义相关度为P/M。
在一优选例中,该计算该每个知识点的相关性知识点集合,进一步包括:
对于每一个知识点,计算该知识点的属性相关知识点集合和语义相关知识点集合的并集,保存为该知识点的相关性知识点集合;
对该相关性知识点集合中的知识点按照相关度大小进行排序,如果该相关性知识点集合中的一个知识点存在两个相关度,则以这两个相关度中的较大值作为该知识点的相关度。
在一优选例中,该属性相关知识点集合、该语义相关性知识点集合、和该相关性知识点集合均为知识点的编码集合。
本申请还公开了一种学科相关性知识点库构建系统,包括:
属性相关计算单元,用于对于多个知识点,计算每个知识点的属性相关知识点集合;
语义相关计算单元,用于计算该每个知识点的语义相关知识点集合;
相关性计算单元,用于根据该属性相关知识点集合和该语义相关性知识点集合,计算该每个知识点的相关性知识点集合。
本申请还公开了一种学科相关性知识点库构建系统,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行该计算机可执行指令时实现如前文描述的学科相关性知识点库构建方法的步骤。
本申请还公开了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现如前文描述的学科相关性知识点库构建方法的步骤。
本申请实施方式中,可以计算得到每一个知识点的相关性知识点集合,也就是说可以知道每一个知识点与哪些其他的知识点相关,相关的程度有多少,从而为学习、考试出题等各种进一步的应用场景提供有力的支持。学科相关性知识点库中包括了每一个知识点的相关性知识点集合,有了这样一个相关性知识点库后,可以快速查询到与每一个知识点相关的其他知识点,大大节约了相关性知识点的查询时间,节约了查询所占用的计算机资源。
进一步地,根据本申请提出的特定的编码方案和特定的属性相关度计算方法,可以基于编码以很少的计算量计算得到两个知识点是否属于直系或旁系知识点,而且可以快速算出两个知识点的属性相关度。
进一步地,在各种集合中以知识点的编码来代表知识点,可以减少对存储空间的占用,而且可以直接根据编码来进行相关性的运算。
本申请的说明书中记载了大量的技术特征,分布在各个技术方案中,如果要罗列出本申请所有可能的技术特征的组合(即技术方案)的话,会使得说明书过于冗长。为了避免这个问题,本申请上述发明内容中公开的各个技术特征、在下文各个实施方式和例子中公开的各技术特征、以及附图中公开的各个技术特征,都可以自由地互相组合,从而构成各种新的技术方案(这些技术方案均因视为在本说明书中已经记载),除非这种技术特征的组合在技术上是不可行的。例如,在一个例子中公开了特征A+B+C,在另一个例子中公开了特征A+B+D+E,而特征C和D是起到相同作用的等同技术手段,技术上只要择一使用即可,不可能同时采用,特征E技术上可以与特征C相组合,则,A+B+C+D的方案因技术不可行而应当不被视为已经记载,而A+B+C+E的方案应当视为已经被记载。
附图说明
图1是本申请第一实施方式中一种学科相关性知识点库构建方法的流程示意图
图2是本申请一个实施例中知识点的编码方式示意图
图3是本申请一个实施例中自主规划知识点的学习路径
具体实施方式
在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
部分概念的说明:
知识点:知识点是构成学科知识体系的基本单位。
专题、主题、普通知识点的分类从大到小的三个级别,是基于教学大纲和教材章、节中所包含的学习内容进行分类的,其中:
专题知识点:一个较大的语义范畴,其可以统领多个同类的知识点;
主题知识点:相对于专题知识点来说的,比专题小,但概念相同;
普通知识点:就是主题下的具体知识点。
属性相关:指基于学科分类的相关;
语义相关:指基于语义的相关;
属性相关知识点集合:就是与一个指定的知识点存在属性相关关系的各知识点的集合。
语义相关知识点集合:就是与一个指定的知识点存在语义相关关系的各知识点的集合。
相关性知识点集合:就是与一个指定的知识点相关的各知识点的集合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请的实施方式作进一步地详细描述。
本发明第一实施方式涉及一种学科相关性知识点库构建方法。图1是该学科相关性知识点库构建方法的流程示意图。对于多个知识点中的每一个知识点,执行以下步骤:
在步骤101中,计算每个知识点的属性相关知识点集合。在一个实施例中,步骤101进一步包括:
子步骤A1:将要计算属性相关知识点集合的知识点作为目标知识点,计算该目标知识点的直系和旁系知识点,该直系和旁系知识点构成属性相关知识点集合。其中,子步骤A1进一步包括:
将目标知识点的属性编码分别与其他知识点的属性编码进行第一逻辑运算,如果逻辑运算结果各位均为0,则判定为直系;若逻辑运算结果中,有1位不为0,则判定为旁系。其中,第一逻辑运算的运算规则为:对于两个知识点编码对应的每一位分别进行比较,若两个知识点编码在该位相同或有一位为0,则该位的运算结果为0;若两个知识点编码在该位不同且不为0,则该位的运算结果为1。本申请个实施方式中的0和1只是一个具体的例子,并不一定要是0或者1,也可以是其他的指定值。例如,可以将本申请的所有的0和1互换,也可以实现本申请的技术方案。在一个实施例中,知识点的属性编码由若干段组成(例如学科段,子学科段,主题段等等),每一段包括至少1位,每1位是一个数字。
子步骤A2:对得到的直系和旁系知识点按与目标知识点的亲疏度进行排序。其中,
直系、旁系知识点分别与该知识点的属性编码段依次进行第二逻辑运算,该第二逻辑运算类似于按段进行的“异或”运算,即,若该段编码相同,则输出“1”,若该段编码不同,则输出“0”;
可以理解,直系知识点均比旁系知识点亲疏度更高,或者说直系知识点比所有的旁系知识点更接近目标知识点(直系知识点与目标知识点的距离比旁系知识点与目标知识点的距离更近);
根据逻辑运算的结果,分别对直系、旁系知识点进行升序排列;
对逻辑运算结果相同的知识点,根据知识点编码进行升序排列;
对以上知识点进行排序整合,越相近的知识点之间亲疏度越高。
子步骤A3:根据排序的结果计算属性相关知识点集合中各知识点与目标知识点的属性相关度。子步骤A3进一步包括:
A31:计算直系和旁系知识点总数N。
A32:按亲疏度排列直系和旁系知识点,计算各直系和旁系知识点到目标知识点的距离M。
A33:各直系和旁系知识点与目标知识点的属性相关度为1-M/N。
根据本申请中公开的特定的编码方案和特定的属性相关度计算方法,可以基于编码以很少的计算量计算得到两个知识点是否属于直系或旁系知识点,而且可以快速算出两个知识点的属性相关度。
此后进入步骤102,计算每个知识点的语义相关知识点集合。在一个实施例中,步骤102包括以下子步骤:
子步骤B1:基于多个知识点语义资料,获取每个语义资料中的知识点。
子步骤B2:根据每个语义资料中的知识点,计算每个知识点与其他知识点的语义相关度。可选地,通过以下子步骤计算任意两个知识点(不失一般性,这里将要计算语义相关性的知识点称为第一知识点和第二知识点)的语义相关度。
B21:获取知识点语义资料中包含的知识点集合并将知识点以编码方式保存,其中第一知识点的语义资料中包含M个知识点,第二知识点的语义资料中包含N个知识点。
B22:计算第一知识点与第二知识点的语义资料中相同的知识点编码,获得P个相同的知识点编码。
B23:第二知识点相对于第一知识点的语义相关度为P/M。
子步骤B3:对于每个知识点,将与该知识点的语义相关度高于预定门限的其他知识点加入该知识点的语义相关知识点集合。
此后进入步骤103,根据属性相关知识点集合和语义相关性知识点集合,计算每个知识点的相关性知识点集合。在一个实施例中,该步骤包括以下子步骤:
子步骤C1:对于每一个知识点,计算该知识点的属性相关知识点集合和语义相关知识点集合的并集,保存为该知识点的相关性知识点集合。
子步骤C2:对相关性知识点集合中的知识点按照相关度大小进行排序,如果相关性知识点集合中的一个知识点存在两个相关度(既有属性相关度又有语义相关度),则以这两个相关度中的较大值作为该知识点的相关度。
通过上述技术方案,可以计算得到每一个知识点的相关性知识点集合,也就是说可以知道每一个知识点与哪些其他的知识点相关,相关的程度有多少,从而为学习、考试出题等各种进一步的应用场景提供有力的支持。学科相关性知识点库中包括了每一个知识点的相关性知识点集合,有了这样一个相关性知识点库后,可以快速查询到与每一个知识点相关的其他知识点,大大节约了相关性知识点的查询时间,节约了查询所占用的计算机资源。
在一个实施例中,在步骤101执行之前,还需要预先为多个知识点中的每个知识点分别设置一个编码。
在一个实施例中,每个知识点的编码中包括:学科编码,子学科编码,专题编码,主题编码,和时间性编码。在其他实施例中,编码的项目可以根据学科的分类方式进行增减,和每个编码项目的长度也可以根据实际需要变化。
在一个实施例中,为每个知识点设置编码的方式如下:
根据知识点的学科名称,获取对应的学科编码。
根据该知识点的学科编码和子学科名称,获取对应的子学科编码。
根据该知识点的学科编码、子学科编码和专题名称,获取对应的专题编码。
根据该知识点的学科编码、子学科编码、专题编码和主题名称,获取对应的主题编码。
其中,如果该知识点为专题知识点,则该知识点的主题编码和时间性编码均设置为0。如果该知识点为主题知识点,则该知识点的时间性编码设置为0。如果该知识点为普通知识点,则根据该知识点的知识点名称、主题,生成该知识点的时间性编码。
在本申请的一个优选例中,属性相关知识点集合、语义相关性知识点集合、和相关性知识点集合均为知识点的编码集合。在各种集合中以知识点的编码来代表知识点,可以减少对存储空间的占用,而且可以直接根据编码来进行相关性的运算。当然,在其他某些实施例中,也可以以其他方式来标识各种集合中的知识点,例如使用流水号、唯一的名称等等,但会丧失直接进行属性相关性运算的便利。
下面说明本申请的一个具体例子,该例子用于更好的理解本申请的内容,并不构成对于本申请保护范围的限制。
预先准备:构建数据表及数据整理,包括以下步骤
(1)整理知识点信息,构建数据表:
构建知识点基础属性信息表,包括学科编码表、子学科编码表、专题编码表、主题编码表、学习阶段编码表、基础知识点表(基础知识点表按学科、学习阶段建表,即学科下每个学习阶段建立一张表,如语文学科下有小学、初中、高中三个学习阶段,则语文学科每个学习阶段建一张表,共3张基础知识点表)、相关性知识点表(与基础知识点表一样,按学科、学习阶段建表,学科下有几个学习阶段就有几张相关性知识点表);其中:
学科相关性知识点库构建基础表
(2)数据表之间建立关系:
学科编码表通过学科编码与子学科编码表、专题编码表、主题编码表建立关联;这里的编码就是属性编码;
子学科编码表通过子学科编码与专题编码表、主题编码表建立关联;
专题编码表通过专题编码与主题编码表建立关联;
基础知识点表、相关性知识点表同知识点编码与学科编码表、子学科编码表、专题编码表、主题编码表建立关联;
注:知识点编码中包括学科编码、子学科编码、专题编码、主题编码等,详细参考知识点编码生成流程
知识点的编码方式,如图2所示,知识点编码由9位构成,分为5段(分别为学科编码段、子学科编码段、专题编码段、主题编码段和时间性编码段),每段为1位或多位。
知识点各属性编码表示及编码方式详见下表:
(3)数据整理及录入
按照“学科->子学科->专题->主题->知识点”的树形目录结构整理学科名称、学科编码、子学科名称、子学科编码、专题名称、专题编码、主题名称、主题编码、知识点名称、知识点对应的语义资料、学习阶段名称、学习阶段编码数据;
将学科名称、学科编码、子学科名称、子学科编码、专题名称、专题编码、主题名称、主题编码、学习阶段名称、学习阶段编码作为记录分别录入相应的数据表。
下面说明学科相关性知识点库的构建例子
学科相关性知识点库构建包括两个流程:(1)构建学科基础知识点库;(2)构建学科相关性知识点库
(1)构建学科基础知识点库
对整理的所有知识点名称,按照知识点编码生成流程,计算机自动对每个知识点进行编码,并将知识点名称、知识点编码、知识点对应的语义资料录入到相应的基础知识点表,完成学科基础知识点库的构建。
知识点编码生成流程如下:
基于基础信息表,根据整理的知识点信息,按照知识点编码生成规则生成知识点各属性编码;
1、根据知识点信息,从基础信息表中获取学科、子学科、专题、主题、学习阶段各属性对应的编码;
学科编码:根据学科名称,查询“学科编码表”,获取对应学科编码;子学科编码:根据学科编码、子学科名称,查询“子学科编码表”,获取子学科编码;
专题编码:根据学科编码、子学科编码、专题名称,查询“专题编码表”,获取专题编码;
主题编码:根据学科编码、子学科编码、专题编码、主题名称,查询“主题编码表”,获取主题编码;
学习阶段编码:根据学习阶段名称,查询“学习阶段编码表”,获取学习阶段编码;
1)若该知识点为专题知识点,主题、时间性编码均赋值0;
2)若该知识点为主题知识点,时间性编码赋值0;
3)若该知识点为普通知识点,获取属性编码后,继续进行下一步时间性编码;
基于知识点基础表,根据知识点名称、主题,生成时间性编码,具体流程如下:
查询该学科及学习阶段下的“基础知识点表”,获取表中该主题下时间性编码最大值RCodeMax,若该主题下没有知识点(即RCodeMax没获取到),该知识点时间性编码赋值“01”;反之赋值“RCodeMax+1”
2、按编码规则顺序组合编码,生成9位知识点编码,排列顺序如下:
知识点编码(9位)=学科编码(1位)+子学科编码(1位)+专题编码(2位)+主题编码(3位)+时间性编码(2位)
(2)构建学科相关性知识点库
在“基础知识点表”的基础上,计算机自动对每个知识点进行属性相关性计算、语义相关性计算,分别获取属性相关知识点编码集合、语义相关性知识点编码集合,并将知识点名称、知识点编码、属性相关性知识点集合、语义相关性知识点集合录入到相应的相关性知识点表,最终完成学科相关性知识点库的构建。具体步骤如下:
第一步:计算属性相关知识点集合
基于学科基础知识点库,对各知识点与其对应的“基础知识点表”内其他知识点进行属性相关性计算,获取各知识点的属性相关知识点集合(即直系和旁系知识点,各知识点以编码方式存储,其编码按知识点的亲疏度从大到小依次排序)。知识点属性关系计算流程如下:
下面举一个例子:已知以下7个知识点编码,分别为:
知识点A(FG01 000 00)
知识点B(FG01 001 00)
知识点C(FG01 002 00)
知识点D(FG01 003 00)
知识点E(FG01 001 01)
知识点F(FG01 001 02)
知识点G(FG01 001 03)
求:
(1)求知识点E的直系知识点、旁系知识点?
(2)求E与各知识点间的亲疏关系?
(3)求各知识点与E的相关度?
解:
(1)求直系、旁系关系
E与B=0000 000 00(直系关系)
E与A=0000 000 00(直系关系)
E与C=0000 001 00(旁系关系)
E与F=0000 000 01(旁系关系)
E与D=0000 001 00(旁系关系)
E与G=0000 000 01(旁系关系)
(2)求E与各知识点间的亲疏关系
第2步:根据目标知识点与直系知识点的亲疏度大于旁系知识点进行排序,排序结果为:E>(A、B)>(C、D、F、G)
第3步:根据“异或”运算的结果,分别对直系、旁系知识点进行升序排列:
直系知识点排序结果:B>A
旁系知识点排序结果:(F,G)>(C,D)
第4步:对逻辑运算结果相同的知识点,根据知识点编码进行升序排列:F>G,C>D;
第5步:对E与所有知识点根据亲疏度进行排序整合,则最终排序结果为:E B A FG C D;
(3)求E与各知识点的相关度
第1步:相关知识点的总数N=7
第2步:按亲疏度排序,计算相关知识点到E的距离
排序:E B A F G C D
各知识点到E的距离M为:M(B)=1;M(A)=2;M(F)=3;M(G)=4;M(C)=5;M(D)=6
第3步:计算各知识点与E的相关度
各知识点与E的相关度:
X(B)=1-1/7=6/7;
X(A)=1-2/7=5/7;
X(F)=1-3/7=4/7;
X(G)=1-4/7=3/7;
X(C)=1-5/7=2/7;
X(D)=1-6/7=1/7;
第二步:计算语义相关知识点集合
基于知识点语义资料,进行语义相关度计算,获取语义相关知识点集合。
1)基于知识点语义资料,获取语义资料中的知识点,并以编码方式保存;
2)对各知识点,与其对应的基础知识点表(C+学科编码+学习阶段编码)中其他知识点进行语义相关计算,获取语义相关知识点编码集合(按语义相关度排序)。
语义相关计算原理如下:
第1步:获取知识点语义资料中包含的知识点集合;
例如:知识点A的语义资料中包含M个知识点,知识点B的语义资料中包含N个知识点,并将知识点以编码方式保存;
第2步:计算A与B的语义资料中相同的知识点编码,即取A与B的交集;
例如:A的语义知识点编码集合与B语义知识点编码集合的交集包含P个相同的知识点编码;
第3步:计算B与A的语义相关度X=P/M,若X≥0.5,则判定B为A的语义相关知识点,且X值越大,两个知识点的语义相关度越高。
第三步:计算相关性知识点编码集合
根据该知识点的属性相关知识点编码集合、语义相关知识点编码集合,计算该知识点的相关性知识点编码集合,具体流程如下:
1)获取属性相关知识点编码集合与语义相关知识点编码集合的并集,保存为该知识点的“相关性知识点集合”;
2)对相关性知识点集合进行排序,按知识点相关度值的大小,“降序”排列集合中的所有相关知识点编码,若知识点存在两个相关度(即属性相关度和语义相关度),则取较大值的相关度统一作为该知识点的相关度。第四步:构建学科相关性知识点库
根据知识点当前所处的学科、学习阶段,将“知识点信息(知识点名称、知识点编码)”及相关性知识点信息(属性相关知识点集合、语义相关知识点集合、相关知识点集合)存储到对应学科、学习阶段的相关性知识点表,所有知识点均以编码方式存储,完成学科相关性知识点库的构建。
下面说明学科相关性知识点库应用的例子
在学生自学过程中,根据学生当前掌握的知识水平,以相关性知识点库为基础,帮助学生制定当前阶段的学习路线,确定本阶段知识点的学习顺序,使学生完全掌握大纲内所有知识点。
第一步:结合学生当前学习水平,确定需要初步学习的知识点,即当前学习阶段的第一个知识点。
第二步:根据已经明确的第一个知识点,查询相关性知识点表(R+学科编码+学习阶段编码),获取该知识点的属性相关性知识点集合,并以该集合中的知识点的排列顺序为用户规划学习路线,完成教学大纲内主要知识点学习顺序的制定;
第三步:基于第二步中已经确定的教学大纲内主要知识点,查询相关性知识点表(R+学科编码+学习阶段编码),分别获取学习路线中主要知识点的语义相关知识点,对主要知识点进行拓展学习推荐,丰富学生的知识体系。
学习路线详细规划如图3所示,以“知识点A、B、C、……N”为主要路线,并以各主要知识点的语义相关知识点(如A1、A2、……An)对主要知识点进行拓展学习。
除了上面的应用例子之外,学科相关性知识点库还有很多其他的应用的方式。例如,在进行测试时,如果发现学生的一个题目做错了,可以从这个题目所涉及的知识点,根据学科相关性知识点库找到最相关的其他知识点,在这些知识点中出题,以便能够使得试题更有针对性,提高测试的效率。又如,在教师准备课件时,可以针对一个特定的知识点,查询学科相关性知识点库找到相关的其他知识点,进一步查询到这些相关知识点的素材,这样可以大大提高课件制作的效率。
本发明第二实施方式涉及一种学科相关性知识点库构建系统。该学科相关性知识点库构建系统包括:
属性相关计算单元,用于对于多个知识点,计算每个知识点的属性相关知识点集合。
语义相关计算单元,用于计算每个知识点的语义相关知识点集合。
相关性计算单元,用于根据属性相关知识点集合和语义相关性知识点集合,计算每个知识点的相关性知识点集合。
第一实施方式是与本实施方式相对应的方法实施方式,本实施方式可与第一实施方式互相配合实施。第一实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式中。
需要说明的是,本领域技术人员应当理解,上述学科相关性知识点库构建系统的实施方式中所示的各模块的实现功能可参照前述学科相关性知识点库构建方法的相关描述而理解。上述学科相关性知识点库构建系统的实施方式中所示的各模块的功能可通过运行于处理器上的程序(可执行指令)而实现,也可通过具体的逻辑电路而实现。本发明实施方式上述学科相关性知识点库构建系统如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施方式的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施方式所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本发明实施方式不限制于任何特定的硬件和软件结合。
相应地,本发明实施方式还提供一种计算机存储介质,其中存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现本发明的各方法实施方式。
此外,本发明实施方式还提供一种学科相关性知识点库构建系统,其中包括用于存储计算机可执行指令的存储器,以及,处理器;该处理器用于在执行该存储器中的计算机可执行指令时实现上述各方法实施方式中的步骤。
需要说明的是,在本专利的申请文件中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本专利的申请文件中,如果提到根据某要素执行某行为,则是指至少根据该要素执行该行为的意思,其中包括了两种情况:仅根据该要素执行该行为、和根据该要素和其它要素执行该行为。多个、多次、多种等表达包括2个、2次、2种以及2个以上、2次以上、2种以上。
在本申请提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本申请的上述讲授内容之后,本领域技术人员可以对本申请作各种改动或修改,这些等价形式同样落于本申请所要求保护的范围。
Claims (12)
1.一种学科相关性知识点库构建方法,其特征在于,包括:
为多个知识点中的每个知识点分别设置一个编码,其中,每个知识点的编码中包括:学科编码,子学科编码,专题编码,主题编码,和时间性编码,并且,根据知识点的学科名称,获取对应的学科编码;根据该知识点的学科编码和子学科名称,获取对应的子学科编码;根据该知识点的学科编码、子学科编码和专题名称,获取对应的专题编码;根据该知识点的学科编码、子学科编码、专题编码和主题名称,获取对应的主题编码;如果该知识点为专题知识点,则该知识点的主题编码和时间性编码均设置为0;如果该知识点为主题知识点,则该知识点的时间性编码设置为0;如果该知识点为普通知识点,则根据该知识点的知识点名称和主题,生成该知识点的时间性编码;
对于多个知识点,利用基于所述知识点的编码所确定的所述知识点的直系和旁系知识点的亲疏度排序,来计算属性相关知识点集合中各知识点与目标知识点的属性相关度,从而计算每个知识点的属性相关知识点集合;
计算所述每个知识点的语义相关知识点集合;
根据所述属性相关知识点集合和所述语义相关性知识点集合,计算所述每个知识点的相关性知识点集合。
2.根据权利要求1所述的学科相关性知识点库构建方法,其特征在于,所述对于多个知识点,利用基于所述知识点的编码所确定的所述知识点的直系和旁系知识点的亲疏度排序,来计算属性相关知识点集合中各知识点与目标知识点的属性相关度,从而计算每个知识点的属性相关知识点集合,进一步包括:
将要计算属性相关知识点集合的知识点作为目标知识点,计算该目标知识点的直系和旁系知识点,该直系和旁系知识点构成所述属性相关知识点集合;
对得到的直系和旁系知识点按与所述目标知识点的亲疏度进行排序;
根据所述排序的结果计算所述属性相关知识点集合中各知识点与目标知识点的属性相关度。
3.根据权利要求2所述的学科相关性知识点库构建方法,其特征在于,所述计算该目标知识点的直系和旁系知识点,进一步包括:
将所述目标知识点分别与其他知识点进行第一逻辑运算,若逻辑运算结果各位均为0,则判定为直系;若逻辑运算结果有1位不为0,则判定为旁系;
其中,所述第一逻辑运算的运算规则为:对于两个知识点编码对应的每一位分别进行比较,若两个知识点编码在该位相同或有一位为0,则该位的运算结果为0;若两个知识点编码在该位不同且不为0,则该位的运算结果为1。
4.根据权利要求3所述的学科相关性知识点库构建方法,其特征在于,所述对得到的直系和旁系知识点按与所述目标知识点的亲疏度进行排序中,所述直系、旁系知识点与所述目标知识点的亲疏度根据以下方式确定:
直系、旁系知识点分别与该知识点的属性编码段依次进行第二逻辑运算,若该段编码相同,则该段的运算结果为1,若该段编码不同,则该段的运算结果为0;
目标知识点与直系知识点的亲疏度大于旁系知识点;
根据逻辑运算的结果,分别对直系、旁系知识点进行升序排列;
对逻辑运算结果相同的知识点,根据知识点编码进行升序排列;
对以上知识点进行排序整合,越相近的知识点之间亲疏度越高。
5.根据权利要求2所述的学科相关性知识点库构建方法,其特征在于,所述根据所述排序的结果计算所述属性相关知识点集合中各知识点与目标知识点的属性相关度,进一步包括:
计算所述直系和旁系知识点总数N;
按亲疏度排列所述直系和旁系知识点,计算各直系和旁系知识点到所述目标知识点的距离M;
各直系和旁系知识点与所述目标知识点的属性相关度为1-M/N。
6.根据权利要求1所述的学科相关性知识点库构建方法,其特征在于,所述计算所述每个知识点的语义相关知识点集合,进一步包括:
基于多个知识点语义资料,获取每个语义资料中的知识点;
根据所述每个语义资料中的知识点,计算所述每个知识点与其他知识点的语义相关度;
对于所述每个知识点,将与该知识点的语义相关度高于预定门限的其他知识点加入该知识点的语义相关知识点集合。
7.根据权利要求6所述的学科相关性知识点库构建方法,其特征在于,所述计算所述每个知识点与其他知识点的语义相关度的步骤中,通过以下方式计算第一知识点和第二知识点的语义相关度:
获取知识点语义资料中包含的知识点集合并将知识点以编码方式保存,其中所述第一知识点的语义资料中包含M个知识点,所述第二知识点的语义资料中包含N个知识点;
计算所述第一知识点与所述第二知识点的语义资料中相同的知识点编码,获得P个相同的知识点编码;
所述第二知识点相对于所述第一知识点的语义相关度为P/M。
8.根据权利要求1所述的学科相关性知识点库构建方法,其特征在于,所述计算所述每个知识点的相关性知识点集合,进一步包括:
对于每一个知识点,计算该知识点的属性相关知识点集合和语义相关知识点集合的并集,保存为该知识点的相关性知识点集合;
对所述相关性知识点集合中的知识点按照相关度大小进行排序,如果所述相关性知识点集合中的一个知识点存在两个相关度,则以这两个相关度中的较大值作为该知识点的相关度。
9.根据权利要求1至8中任一项所述的学科相关性知识点库构建方法,其特征在于,所述属性相关知识点集合、所述语义相关性知识点集合、和所述相关性知识点集合均为知识点的编码集合。
10.一种学科相关性知识点库构建系统,其特征在于,包括:
编码单元,用于为多个知识点中的每个知识点分别设置一个编码,其中,每个知识点的编码中包括:学科编码,子学科编码,专题编码,主题编码,和时间性编码,并且,根据知识点的学科名称,获取对应的学科编码;根据该知识点的学科编码和子学科名称,获取对应的子学科编码;根据该知识点的学科编码、子学科编码和专题名称,获取对应的专题编码;根据该知识点的学科编码、子学科编码、专题编码和主题名称,获取对应的主题编码;如果该知识点为专题知识点,则该知识点的主题编码和时间性编码均设置为0;如果该知识点为主题知识点,则该知识点的时间性编码设置为0;如果该知识点为普通知识点,则根据该知识点的知识点名称和主题,生成该知识点的时间性编码;
属性相关计算单元,用于对于多个知识点,利用基于所述知识点的编码所确定的所述知识点的直系和旁系知识点的亲疏度排序,来计算属性相关知识点集合中各知识点与目标知识点的属性相关度,从而计算每个知识点的属性相关知识点集合;
语义相关计算单元,用于计算所述每个知识点的语义相关知识点集合;
相关性计算单元,用于根据所述属性相关知识点集合和所述语义相关性知识点集合,计算所述每个知识点的相关性知识点集合。
11.一种学科相关性知识点库构建系统,其特征在于,包括:
存储器,用于存储计算机可执行指令;以及,
处理器,用于在执行所述计算机可执行指令时实现如权利要求1至9中任意一项所述的学科相关性知识点库构建方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如权利要求1至9中任意一项所述的学科相关性知识点库构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810694266.9A CN109002499B (zh) | 2018-06-29 | 2018-06-29 | 学科相关性知识点库构建方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810694266.9A CN109002499B (zh) | 2018-06-29 | 2018-06-29 | 学科相关性知识点库构建方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109002499A CN109002499A (zh) | 2018-12-14 |
CN109002499B true CN109002499B (zh) | 2022-04-12 |
Family
ID=64600969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810694266.9A Active CN109002499B (zh) | 2018-06-29 | 2018-06-29 | 学科相关性知识点库构建方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109002499B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109803022B (zh) * | 2019-01-30 | 2022-02-18 | 浙江蓝鸽科技有限公司 | 一种数字化资源共享系统及其服务方法 |
CN110096686B (zh) * | 2019-05-06 | 2023-02-28 | 广州蓝鸽软件有限公司 | 基于人工智能的多媒体教材编辑方法及其系统 |
CN110909533B (zh) * | 2019-11-19 | 2023-07-18 | 浙江蓝鸽科技有限公司 | 资源主题判定方法和系统 |
CN111078710B (zh) * | 2019-12-30 | 2023-10-20 | 凌祺云 | 一种基于知识交叉关联的教学辅助系统构建方法 |
CN113254622B (zh) * | 2021-06-23 | 2024-02-20 | 中国银行股份有限公司 | 知识点查询方法、装置及服务器 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105373546A (zh) * | 2014-08-25 | 2016-03-02 | 北大方正集团有限公司 | 一种用于知识服务的信息处理方法及系统 |
CN105608075A (zh) * | 2014-09-26 | 2016-05-25 | 北大方正集团有限公司 | 一种相关知识点的获取方法及系统 |
CN105893363A (zh) * | 2014-09-26 | 2016-08-24 | 北大方正集团有限公司 | 一种获取知识点的相关知识点的方法及系统 |
CN105956144A (zh) * | 2016-05-13 | 2016-09-21 | 安徽教育网络出版有限公司 | 一种多标签学习资源关联度定量计算方法 |
CN107085596A (zh) * | 2017-03-24 | 2017-08-22 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种知识网络构建及可视化方法和系统 |
CN107784088A (zh) * | 2017-09-30 | 2018-03-09 | 杭州博世数据网络有限公司 | 基于知识点连接关系的知识图谱构建方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101630314B (zh) * | 2008-07-16 | 2011-12-07 | 中国科学院自动化研究所 | 一种基于领域知识的语义查询扩展方法 |
CN103092828B (zh) * | 2013-02-06 | 2015-08-12 | 杭州电子科技大学 | 基于语义分析和语义关系网络的文本相似度度量方法 |
US20150242974A1 (en) * | 2014-02-24 | 2015-08-27 | Mindojo Ltd. | Adaptive e-learning engine with embedded datagraph structure |
CN105335374A (zh) * | 2014-06-19 | 2016-02-17 | 北大方正集团有限公司 | 知识点关联方法及装置、及包含该装置的服务器和客户端 |
-
2018
- 2018-06-29 CN CN201810694266.9A patent/CN109002499B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105373546A (zh) * | 2014-08-25 | 2016-03-02 | 北大方正集团有限公司 | 一种用于知识服务的信息处理方法及系统 |
CN105608075A (zh) * | 2014-09-26 | 2016-05-25 | 北大方正集团有限公司 | 一种相关知识点的获取方法及系统 |
CN105893363A (zh) * | 2014-09-26 | 2016-08-24 | 北大方正集团有限公司 | 一种获取知识点的相关知识点的方法及系统 |
CN105956144A (zh) * | 2016-05-13 | 2016-09-21 | 安徽教育网络出版有限公司 | 一种多标签学习资源关联度定量计算方法 |
CN107085596A (zh) * | 2017-03-24 | 2017-08-22 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种知识网络构建及可视化方法和系统 |
CN107784088A (zh) * | 2017-09-30 | 2018-03-09 | 杭州博世数据网络有限公司 | 基于知识点连接关系的知识图谱构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109002499A (zh) | 2018-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109002499B (zh) | 学科相关性知识点库构建方法及其系统 | |
CN106156082B (zh) | 一种本体对齐方法及装置 | |
CN109325040B (zh) | 一种faq问答库泛化方法、装置及设备 | |
KR20180041200A (ko) | 정보 처리 방법 및 장치 | |
US20150363405A1 (en) | Method and apparatus for generating ordered user expert lists for a shared digital document | |
CN113505204B (zh) | 召回模型训练方法、搜索召回方法、装置和计算机设备 | |
CN111368048A (zh) | 信息获取方法、装置、电子设备及计算机可读存储介质 | |
CN111078837A (zh) | 智能问答信息处理方法、电子设备及计算机可读存储介质 | |
CN111797222A (zh) | 课程知识图谱构建方法、装置、终端及存储介质 | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
US9390166B2 (en) | Specific online resource identification and extraction | |
CN113656561A (zh) | 实体词识别方法、装置、设备、存储介质及程序产品 | |
CN112667821A (zh) | 基于百科数据的军事知识图谱构建和问答方法 | |
CN112330510A (zh) | 一种志愿推荐方法、装置、服务器及计算机可读存储介质 | |
CN105653547A (zh) | 一种提取文本关键词的方法和装置 | |
CN114297351A (zh) | 语句问答方法、装置、设备、存储介质及计算机程序产品 | |
CN113901783B (zh) | 面向领域的文档查重方法及系统 | |
CN110737779A (zh) | 知识图谱的构建方法、装置、存储介质和电子设备 | |
CN113190692B (zh) | 一种知识图谱的自适应检索方法、系统及装置 | |
KR20200117542A (ko) | 링크 생성 장치 및 방법 | |
CN117708282A (zh) | 一种基于大语言模型的知识问答方法及系统 | |
CN116956818A (zh) | 文本素材的处理方法、装置、电子设备以及存储介质 | |
CN113836296A (zh) | 一种佛学问答摘要的生成方法、装置、设备及存储介质 | |
Hanna et al. | Comparing quantitative and comment-based ratings for recommending open educational resources | |
CN117435746B (zh) | 基于自然语言处理的知识点标注方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |