一种知识点关系强度的度量方法及其系统
技术领域
本发明涉及一种知识点关系强度的度量方法及其系统,属于电数字数据处理技术领域。
背景技术
随着知识经济时代的到来,数字出版已成为出版业发展的必然趋势,人们已从纸质阅读大量地转向电子阅读。电子图书、期刊、数字报刊等多样化的出版资源蕴含大量权威知识,具有很高的应用价值。这些数字出版资源大量地采用书籍或期刊等文档篇章的形式组织和传播知识和信息,人们希望获取的并非文档本身,而是直接获得文档里的相关知识点,即将所有本领域的相关知识点能够精确搜索、采集,以便研究学习。
同领域的知识点之间存在着关联,通过同一文本中知识点及其解释可以直接发现的关系,我们称之为“显性关系”,也可以通过不同文本中知识点及其解释间接发现的关系,我们称之为“隐性关系”。百科全书作为一种数字出版资源,是对领域知识点概要信息的简单总结。百科全书中的知识点(也称为词条)描述了知识点名称和知识点解释,解释文本中通常会提及部分其他相关知识点。例如,在《中国大百科全书——中国历史》中,对于知识点“秦始皇”的解释为“中国统一秦王朝的开国皇帝...免除吕不韦的相职,令其徙处蜀郡...始皇三十四年,又采纳丞相李斯的建议...”(省略了部分内容,已经使用...注明)。从解释中可以看到,知识点“秦始皇”与知识点“吕不韦”有关联关系。同理,知识点“秦始皇”与知识点“李斯”也有关联关系,这些关系是存在于知识点及其解释之间的显性关系。但是,在两个知识点之间,除了显性关系,还可能存在多个间接地隐性关系,并且隐性关系可能比显性关系更具代表性。因此基于知识点的显性关系,需要进一步挖掘知识点间的隐性关系,综合考虑知识点的显性关系和隐性关系,才能对知识点关系强度做出更好的度量。
现有技术采用的知识点关系强度的度量方法为:计算知识点与知识点之间的显性关系强度;计算知识点与知识点之间的关系强度比例;根据知识点与知识点之间的显性关系强度和关系强度比例计算知识点与知识点之间的隐性关系强度;再计算知识点关系强度。上述方法所述的知识点关系强度是通过知识点在各自相关的文本中出现的次数来衡量知识点强度的大小,这种衡量方式不能确定关系强度最大可以取到的值,导致关系强度的判断缺乏一个绝对的可衡量值;同时,隐性关系是根据间接知识点之间的关系强度及关系强度的比例获得的关系强度,关系强度的比例指该知识点显性关系强度与所有相关知识点强度总和的比值,这种获取隐性关系强度的方法只是相对性获取了知识点的隐性关系,并未从全局考虑整个知识体系,将整个知识体系中的所有隐性关系进行分析处理,关系强度的度量不够准确;另外,如果两知识点的关系是通过另一个间接知识点产生了更强的关系,如果仅通过考虑两知识点在各自相关文本中的出现次数的方式来衡量,则会导致这种更强的关系不能被发现。因此,需要从全局空间衡量知识点的关系强度。
发明内容
本发明所要解决的技术问题是现有技术中知识点关系强度的判断缺乏一个绝对的可衡量值、关系强度的度量不够准确以及部分更强的关系强度不能被发现的问题,从全局空间衡量知识点的关系强度,采用对知识点关系强度绝对可衡量值,提供一种知识点关系强度的度量方法及其系统。
为解决上述技术问题,本发明是通过以下技术方案实现的:
一种知识点关系强度的度量方法,包括如下步骤:
计算所有知识点显性关系强度,并生成知识点关系强度矩阵M;
根据所有知识点所述关系强度矩阵构造带权有向图G;
根据所述带权有向图计算知识点隐性关系强度,并生成知识点隐性关系强度矩阵I;
遍历所述隐性关系强度矩阵I,更新所述知识点关系强度矩阵M。
所述计算所有知识点显性关系强度,并生成知识点关系强度矩阵M的处理包括如下步骤:
计算知识点正向显性关系强度;
计算知识点反向显性关系强度;
根据知识点所述正向显性关系强度和所述反向显性关系强度计算知识点显性关系强度;
根据所有知识点的显性关系强度,生成所述知识点关系强度矩阵M。
所述知识点正向显性关系强度的计算方法为:
其中,fp(i,j)为从知识点oi到知识点oj的正向显性关系强度,μ为知识点oj在知识点oi的相关文本中出现的次数,β为控制因子,0.5≤β≤2,i、j为非负整数,i,j=1,2,…n,n为知识点的个数。
知识点反向显性关系强度的计算方法为:
其中,fN(i,j)为从知识点oi到知识点oj的反向显性关系强度,α为关联因子,1≤α≤5,α为正整数,fP(j,i)是从知识点oj到知识点oi的正向显性关系强度。
所述步骤S13知识点显性关系强度的计算方法为:
其中,fE(i,j)为从知识点oi到知识点oj的显性关系强度,fp(i,j)为从知识点oi到知识点oj的正向显性关系强度,fN(i,j)为从知识点oi到知识点oj的反向显性关系强度,α为关联因子,1≤α≤5,α为正整数。
所述带权有向图G包括边、权重和顶点,
其中,边和权重的设置方法为:
当Mij>0时,G中从知识点oi到知识点oj的边的权重设置为-ln(Mij);当Mij=0时,G中不存在从知识点oi到知识点oj的边,其中,Mij表示知识点oi到知识点oj的显性关系强度;
所述带权有向图G的顶点与M的顶点相同。
所述带权有向图G用矩阵表示。
所述知识点隐性关系强度的计算方法为:
fI(i,j)=exp(-Cij)
其中,fI(i,j)表示知识点oi到知识点oj的隐性关系强度,Cij表示在所述带权有向图G中知识点oi到知识点oj的最短简单路径长度,;
如果知识点oi到知识点oj不存在简单路径,则fI(i,j)等于零;知识点到自身的隐性关系强度设置为零;
将隐性关系强度fI(i,j)保存为矩阵形式,则生成了知识点隐性关系强度矩阵I。
所述遍历所述隐性关系强度矩阵I,更新所述知识点关系强度矩阵M的处理包括如下步骤:
遍历所述隐性关系强度矩阵I中的每一项;
判断Iij与Mij的大小;
如果Iij>Mij,对Mij重新赋值,Mij=Iij,更新所述知识点关系强度矩阵M后,处理所述隐性关系强度矩阵I中的下一项;如果Iij≤Mij,则直接处理所述隐性关系强度矩阵I中的下一项,直到遍历完所述隐性关系强度矩阵I。
所述最短简单路径长度Cij计算方法为Dijkstra算法、SPFA算法、
Floyd-Warshall算法或Bellman-Ford算法。
所述控制因子β=1。
关联因子α=2。
一种知识点关系强度的度量系统,包括:
知识点关系强度矩阵生成模块,用于计算所有知识点显性关系强度,并生成知识点关系强度矩阵M;
带权有向图构造模块,用于根据所有知识点所述关系强度矩阵构造带权有向图G;
知识点隐性关系强度矩阵生成模块,用于根据所述带权有向图计算知识点隐性关系强度,并生成知识点隐性关系强度矩阵I;
更新模块,用于遍历所述隐性关系强度矩阵I,更新所述知识点关系强度矩阵M。
所述知识点关系强度矩阵生成模块包括:
正向显性关系强度计算单元,用于计算知识点正向显性关系强度;
反向显性关系强度计算单元,用于计算知识点反向显性关系强度;
显性关系强度计算单元,用于根据知识点所述正向显性关系强度和所述反向显性关系强度计算知识点显性关系强度;
关系强度矩阵生成单元,用于根据所有知识点的显性关系强度,生成所述知识点关系强度矩阵M。
所述知识点正向显性关系强度的计算方法为:
其中,fp(i,j)为从知识点oi到知识点oj的正向显性关系强度,μ为知识点oj在知识点oi的相关文本中出现的次数,β为控制因子,0.5≤β≤2,i、j为非负整数,i,j=1,2,…n,n为知识点的个数。
所述知识点反向显性关系强度的计算方法为:
其中,fN(i,j)为从知识点oi到知识点oj的反向显性关系强度,α为关联因子,1≤α≤5,α为正整数,fP(j,i)是从知识点oj到知识点oi的正向显性关系强度。
所述知识点显性关系强度的计算方法为:
其中,fE(i,j)为从知识点oi到知识点oj的显性关系强度,fp(i,j)为从知识点oi到知识点oj的正向显性关系强度,fN(i,j)为从知识点oi到知识点oj的反向显性关系强度,α为关联因子,1≤α≤5,α为正整数。
所述带权有向图G包括边、权重和顶点,
其中,边和权重的设置方法为:
当Mij>0时,G中从知识点oi到知识点oj的边的权重设置为-ln(Mij);当Mij=0时,G中不存在从知识点oi到知识点oj的边,其中,Mij表示知识点oi到知识点oj的显性关系强度;
所述带权有向图G的顶点与M的顶点相同。
所述带权有向图G用矩阵表示。
所述知识点隐性关系强度的计算方法为:
fI(i,j)=exp(-Cij)
其中,fI(i,j)表示知识点oi到知识点oj的隐性关系强度,Cij表示在所述带权有向图G中知识点oi到知识点oj的最短简单路径长度;
如果知识点oi到知识点oj不存在简单路径,则fI(i,j)等于零;知识点到自身的隐性关系强度设置为零;
将隐性关系强度fI(i,j)保存为矩阵形式,则生成了知识点隐性关系强度矩阵I。
所述更新模块包括:
查找单元,用于遍历所述隐性关系强度矩阵I中的每一项;
判断单元,用于判断Iij与Mij的大小;
更新单元,用于如果Iij>Mij,对Mij重新赋值,Mij=Iij,更新所述知识点关系强度矩阵M后,处理所述隐性关系强度矩阵I中的下一项;如果Iij≤Mij,则直接处理所述隐性关系强度矩阵I中的下一项,直到遍历完所述隐性关系强度矩阵I。
所述最短简单路径长度Cij计算方法为Dijkstra算法、SPFA算法、Floyd-Warshall算法或Bellman-Ford算法。
所述控制因子β=1。
所述关联因子α=2。
本发明的上述技术方案相比现有技术具有以下优点:
(1)本发明所述的知识点关系强度的度量方法,步骤包括:计算所有知识点显性关系强度,并生成知识点关系强度矩阵M;根据所有知识点所述关系强度矩阵构造带权有向图G;根据所述带权有向图计算知识点隐性关系强度,并生成知识点隐性关系强度矩阵I;遍历所述隐性关系强度矩阵I,更新所述知识点关系强度矩阵M。上述知识点关系强度的度量方法有效避免了现有技术中知识点关系强度的判断缺乏一个绝对的可衡量值、关系强度的度量不够准确以及部分更强的关系强度不能被发现的问题。
(2)本发明所述的知识点关系强度的度量方法,有效地评估了知识点关系强度,从全局空间度量知识点的关系强度,并将知识点的关系强度值映射到[0,1)区间,在这个区间内,更容易识别知识点关系强度的强弱。
(3)本发明所述的知识点关系强度的度量方法,所述知识点显性关系强度是通过计算正向显性关系强度和反向显性关系强度获得,双向的关系强度评估方法更进一步的提高了显性关系强度的准确性。
(4)本发明所述的知识点关系强度的度量方法,通过将显性关系矩阵转化为带权有向图,便于知识点间最短路径的计算,也便于算法的实现,提高了运算效率。
(5)本发明所述的知识点关系强度的度量方法,所述显性关系强度和隐性关系强度的计算方法分别通过指数函数和对数函数获得,利用指数函数和对数函数特性以及二者之间的关系建立数学模型,构思巧妙,算法简单,易于实现。
(6)本发明所述的知识点关系强度的度量方法,分别将显性关系强度和隐性关系强度分别保存在显性关系强度矩阵和隐性关系强度矩阵中,在进行运算时便于取值,进一步提高了运算速度。
(7)本发明所述的知识点关系强度的度量方法,所述最短简单路径长度计算方法采用Dijkstra算法,运算速率快,实现了快速搜索,提高了响应速度。
(8)本发明所述的知识点关系强度的度量方法,所述最短简单路径长度计算方法采用SPFA算法,该算法维护一个队列,初始时将源知识点加入队列。每次从队列中取出一个知识点,并对所有与它相邻的点进行松弛,若某个相邻的点松弛成功,则将其入队。直到队列为空时算法结束。该算法实现简单,运算速率快,提高了响应速度。
(9)本发明所述的知识点关系强度的度量方法,所述最短简单路径长度计算方法采用Floyd-Warshall算法,可计算任意两点间的最短路径,通常可以在任何图中使用,包括有向图、带负权边的图,通过考虑最短子路径来得到最短路径。算法容易实现,运算速率快,提高了响应速度。
(10)本发明所述的知识点关系强度的度量方法,所述最短简单路径长度计算方法采用Bellman-Ford算法,适用于单源最短路径计算,编程容易,易于实现。
(11)本发明所述的知识点关系强度的度量方法,在计算正向显性关系强度时设置了控制因子β,通过设置所述控制因子β有效控制了所述μ的大小对显性关系强度的变化,根据领域知识点的特性选择所述控制因子β的大小,并根据领域知识点的特性进行所述控制因子β寻优,一般情况下所述控制因子β设置为1便获得很佳效果。
(12)本发明所述的知识点关系强度的度量方法,在计算反向显性关系强度时设置了关联因子α,通过设置所述关联因子α有效控制了所述正向显性关系对所述反向显性关系的影响,1≤α≤5,根据领域知识点的特性选择不同的值,一般情况下所述关联因子α设置为2便获得较佳效果。
(13)本发明所述的知识点关系强度的度量系统,利用知识点关系强度的度量方法,有效避免了现有技术中知识点关系强度的判断缺乏一个绝对的可衡量值、关系强度的度量不够准确以及部分更强的关系强度不能被发现的问题。
附图说明
为了使本发明的内容更容易被清楚的理解,下面结合附图,对本发明作进一步详细的说明,其中,
图1是本发明所述知识点关系强度的度量方法流程图;
图2是本发明所述带权有向图的示意图。
具体实施方式
实施例1:
本实施例提供一种知识点关系强度的度量方法流程图如图1所示,本实施例所述的知识点是一种知识交互单元,表示一种概念或一个实体,例如秦始皇、唐朝、戊戌变法。在本实施例中,知识点名及知识点的相关文本见表1,一共有三个知识点,为了便于描述,名称分别记为A、B和C。N是一段文本,该文本中不包含知识点名A、B或C。
表1.知识点名及知识点的相关文本
知识点名 |
相关文本 |
A |
NANBNBN |
B |
NANCN |
C |
NNN |
所述知识点关系强度的度量方法包括如下步骤:
S1:计算所有知识点显性关系强度,并生成知识点关系强度矩阵M。
所述步骤S1包括如下步骤:
S11:计算知识点正向显性关系强度,所述知识点正向显性关系强度的计算方法为:
其中,fp(i,j)为从知识点oi到知识点oj的正向显性关系强度,μ为知识点oj在知识点oi的相关文本中出现的次数,β为控制因子,0.5≤β≤2,i、j为非负整数,i,j=1,2,…n,n为知识点的个数。
在本实施例中,所述控制因子β设置为1,在其它实施例中,所述控制因子β可设置为0.5、0.7、1.2、1.5等不同的值,所述控制因子β控制所述μ的大小对显性关系强度的变化,用户根据领域知识点的特性选择所述控制因子β的大小,并根据领域知识点的特性进行所述控制因子β寻优。
如表1所示,知识点B在知识点A的相关文本中出现的次数为2,则从知识点A到知识点B的正向显性关系强度fP(A,B)为
S12:计算知识点反向显性关系强度,所述知识点反向显性关系强度的计算方法为:
其中,fN(i,j)为从知识点oi到知识点oj的反向显性关系强度,α为关联因子,1≤α≤5,α为正整数,fP(j,i)是从知识点oj到知识点oi的正向显性关系强度。
在本实施例中,所述关联因子α设置为2,在其它实施例中,所述关联因子α可以设置为1、1.5、3、4、5等不同的值。所述关联因子α控制所述正向显性关系对所述反向显性关系的影响,α的值越小,正向关系对反向关系的影响越大,α的值越大,正向关系对反向关系的影响越小。
则表1中知识点A到知识点B的反向显性关系强度fN(A,B)为:
S13:根据知识点所述正向显性关系强度和所述反向显性关系强度计算知识点显性关系强度,知识点显性关系强度的计算方法为:
其中,fE(i,j)为从知识点oi到知识点oj的显性关系强度,fp(i,j)为从知识点oi到知识点oj的正向显性关系强度,fN(i,j)为从知识点oi到知识点oj的反向显性关系强度,α为关联因子,1≤α≤5,α为正整数。
如果知识点oi到知识点oj没有显性关系,则Eij等于零。在本实施例中,知识点到自身的显性关系强度设置为0。在其它实施例中,知识点到自身的显性关系强度可设置为1,但不具有实际的意义。
则表1中知识点A到知识点B的显性关系强度f(A,B)为:
根据步骤S11至步骤S13依次计算知识点A、知识点B与知识点C之间的显性关系强度。
本实施例所述的知识点关系强度的度量方法,所述知识点显性关系强度是通过计算正向显性关系强度和反向显性关系强度获得,双向的关系强度评估方法更进一步的提高了显性关系强度的准确性。
S14:根据所有知识点的显性关系强度,生成所述知识点关系强度矩阵M。
根据表1中的知识点A、B、C之间的显性关系强度生成知识点关系强度矩阵M(目前保存显性关系强度),如表2所示:
表2.关系强度矩阵M(保存显性关系强度)
|
A |
B |
C |
A |
0 |
0.6617684897238464 |
0 |
B |
0.5619428234919281 |
0 |
0.30807810484000653 |
C |
0 |
0.15403905242000326 |
0 |
S2:根据所有知识点所述关系强度矩阵构造带权有向图G。
所述带权有向图G包括边、权重和顶点,
其中,边和权重的设置方法为:
当Mij>0时,G中从知识点oi到知识点oj的边的权重设置为-ln(Mij);当Mij=0时,G中不存在从知识点oi到知识点oj的边,其中,Mij表示知识点oi到知识点oj的显性关系强度;
所述带权有向图G的顶点与M的顶点相同。本实施例通过将显性关系矩阵转化为带权有向图,便于知识点间最短路径的计算,也便于算法的实现,提高了运算效率。本实施例中所述带权有向图G用矩阵表示。则根据表2所示的知识点关系强度矩阵构造的带权有向图G如表3所示:
表3.带权有向图G
|
A |
B |
C |
A |
null |
0.4128394976172101 |
null |
B |
0.5763551718229092 |
null |
1.177401941013469 |
C |
null |
1.8705491215734142 |
null |
表3中null表示不存在边。
作为其他可以替换的实施方式,所述带权有向图G还可以用图2来表示,如图2所示,知识点间的显性关系可以形象的表示为所示带权有向图G的边,知识点即为带权有向图G的顶点。
S3:根据所述带权有向图计算知识点隐性关系强度,并生成知识点隐性关系强度矩阵I。
所述知识点隐性关系强度的计算方法为:
fI(i,j)=exp(-Cij)
其中,fI(i,j)表示知识点oi到知识点oj的隐性关系,Cij表示在所述带权有向图G中知识点oi到知识点oj的最短简单路径长度;如果知识点oi到知识点oj不存在简单路径,则fI(i,j)等于零;知识点到自身的隐性关系强度设置为零;将隐性关系强度fI(i,j)保存为矩阵形式,则生成了知识点隐性关系强度矩阵I。
所述最短简单路径长度Cij计算方法为Dijkstra算法。运算速率快,实现了快速搜索,提高了响应速度。
本实施例所述的知识点关系强度的度量方法,所述显性关系强度和隐性关系强度的计算方法分别通过指数函数和对数函数获得,利用指数函数和对数函数特性以及二者之间的关系建立数学模型,构思巧妙,算法简单,易于实现。
则根据表1中的知识点A、B、C之间的隐性关系强度生成知识点隐性关系强度矩阵I,如表4所示:
表4.隐性关系强度矩阵
|
A |
B |
C |
A |
0 |
0.6617684897238464 |
0.20387638215695592 |
B |
0.5619428234919281 |
0 |
0.30807810484000653 |
C |
0.08656114004491779 |
0.1540390524200033 |
0 |
S4:遍历所述隐性关系强度矩阵I,更新所述知识点关系强度矩阵M。
所述步骤S4包括如下步骤:
S41:遍历所述隐性关系强度矩阵I中的每一项;
S42:判断Iij与Mij的大小;
S43:如果Iij>Mij,对Mij重新赋值,Mij=Iij,更新所述知识点关系强度矩阵M,返回步骤S41;如果Iij≤Mij,返回步骤S41,直到遍历完所述隐性关系强度矩阵I中的每一项。
则表1中的知识点A、B、C之间的关系强度更新后如表5所示:
表5.关系强度矩阵
|
A |
B |
C |
A |
0 |
0.6617684897238464 |
0.20387638215695592 |
B |
0.5619428234919281 |
0 |
0.30807810484000653 |
C |
0.08656114004491779 |
0.1540390524200033 |
0 |
由表5可以看出,其中表2中的多个值被隐性关系强度更新,所有的关系强度值都在[0,1)区间。
实施例2:
本实施例中除步骤S3与实施例1不同,其他步骤与实施例1相同,所述S3:根据所述带权有向图G计算领域知识点隐性关系强度,并生成领域知识点隐性关系强度矩阵I。
所述领域知识点隐性关系强度的计算方法为:
fI(i,j)=exp(-Cij)
其中,fI(i,j)表示知识点oi到知识点oj的隐性关系,Cij表示在所述带权有向图G中知识点oi到知识点oj的最短简单路径长度;如果知识点oi到知识点oj不存在简单路径,则fI(i,j)等于零;知识点到自身的隐性关系强度设置为零;将隐性关系强度fI(i,j)保存为矩阵形式,则生成了知识点隐性关系强度矩阵I。
所述最短简单路径长度计算方法采用SPFA算法,该算法维护一个队列,初始时将源知识点加入队列。每次从队列中取出一个知识点,并对所有与它相邻的点进行松弛,若某个相邻的点松弛成功,则将其入队。直到队列为空时算法结束。该算法实现简单,运算速率快,提高了响应速度。
实施例3:
本实施例中除步骤S3与实施例1不同,其他步骤与实施例1相同,所述S3:根据所述带权有向图G计算领域知识点隐性关系强度,并生成领域知识点隐性关系强度矩阵I。
所述领域知识点隐性关系强度的计算方法为:
fI(i,j)=exp(-Cij)
其中,fI(i,j)表示知识点oi到知识点oj的隐性关系,Cij表示在所述带权有向图G中知识点oi到知识点oj的最短简单路径长度;如果知识点oi到知识点oj不存在简单路径,则fI(i,j)等于零;知识点到自身的隐性关系强度设置为零;将隐性关系强度fI(i,j)保存为矩阵形式,则生成了知识点隐性关系强度矩阵I。
所述最短简单路径长度计算方法采用Floyd-Warshall算法,可计算任意两点间的最短路径,通常可以在任何图中使用,包括有向图、带负权边的图,通过考虑最短子路径来得到最短路径。算法容易实现,运算速率快,提高了响应速度。
实施例4:
本实施例中除步骤S3与实施例1不同,其他步骤与实施例1相同,所述S3:根据所述带权有向图G计算领域知识点隐性关系强度,并生成领域知识点隐性关系强度矩阵I。
所述领域知识点隐性关系强度的计算方法为:
fI(i,j)=exp(-Cij)
其中,fI(i,j)表示知识点oi到知识点oj的隐性关系,Cij表示在所述带权有向图G中知识点oi到知识点oj的最短简单路径长度;如果知识点oi到知识点oj不存在简单路径,则fI(i,j)等于零;知识点到自身的隐性关系强度设置为零;将隐性关系强度fI(i,j)保存为矩阵形式,则生成了知识点隐性关系强度矩阵I。
所述最短简单路径长度计算方法采用Bellman-Ford算法,适用于单源最短路径计算,编程容易,易于实现。
本实施例所述的知识点关系强度的度量方法,所述显性关系强度和隐性关系强度的计算方法分别通过指数函数和对数函数获得,利用指数函数和对数函数特性以及二者之间的关系建立数学模型,构思巧妙,算法简单,易于实现。
本实施例所述的知识点关系强度的度量方法,分别将显性关系强度和隐性关系强度分别保存在显性关系强度矩阵和隐性关系强度矩阵中,在进行运算时便于取值,进一步提高了运算速度。
本实施例所述的知识点关系强度的度量方法,步骤包括:计算所有知识点显性关系强度,并生成知识点关系强度矩阵M;根据所有知识点所述关系强度矩阵构造带权有向图G;根据所述带权有向图计算知识点隐性关系强度,并生成知识点隐性关系强度矩阵I;遍历所述隐性关系强度矩阵I,更新所述知识点关系强度矩阵M。上述知识点关系强度的度量方法有效避免了现有技术中知识点关系强度的判断缺乏一个绝对的可衡量值、关系强度的度量不够准确以及部分更强的关系强度不能被发现的问题。
实施例5:
一种知识点关系强度的度量系统,包括:
第一、知识点关系强度矩阵生成模块,用于计算所有知识点显性关系强度,并生成知识点关系强度矩阵M。
具体包括:
正向显性关系强度计算单元,用于计算知识点正向显性关系强度。所述知识点正向显性关系强度的计算方法为:
其中,fp(i,j)为从知识点oi到知识点oj的正向显性关系强度,μ为知识点oj点oi的相关文本中出现的次数,β为控制因子,0.5≤β≤2,i、j为非负整数,i,j=1,2,…n,n为知识点的个数。
反向显性关系强度计算单元,用于计算知识点反向显性关系强度。所
述知识点反向显性关系强度的计算方法为:
其中,fN(i,j)为从知识点oi到知识点oj的反向显性关系强度,α为关联因子,1≤α≤5,α为正整数,fP(j,i)是从知识点oj到知识点oi的正向显性关系强度。
显性关系强度计算单元,用于根据知识点所述正向显性关系强度和所述反向显性关系强度计算知识点显性关系强度。所述知识点显性关系强度的计算方法为:
其中,fE(i,j)为从知识点oi到知识点oj的显性关系强度,fp(i,j)为从知识点oi到知识点oj的正向显性关系强度,fN(i,j)为从知识点oi到知识点oj的反向显性关系强度,α为关联因子,1≤α≤5,α为正整数。
关系强度矩阵生成单元,用于根据所有知识点的显性关系强度,生成所述知识点关系强度矩阵M。具体包括:
查找单元,用于遍历所述隐性关系强度矩阵I中的每一项;
判断单元,用于判断Iij与Mij的大小;
更新单元,用于如果Iij>Mij,对Mij重新赋值,Mij=Iij,更新所述知识点关系强度矩阵M后,处理所述隐性关系强度矩阵I中的下一项;如果Iij≤Mij,则直接处理所述隐性关系强度矩阵I中的下一项,直到遍历完所述隐性关系强度矩阵I。
第二、带权有向图构造模块,用于根据所有知识点所述关系强度矩阵构造带权有向图G。
所述带权有向图G包括边、权重和顶点,其中,边和权重的设置方法为:当Mij>0时,G中从知识点oi到知识点oj的边的权重设置为-ln(Mij);当Mij=0时,G中不存在从知识点oi到知识点oj的边,其中,Mij表示知识点oi到知识点oj的显性关系强度;所述带权有向图G的顶点与M的顶点相同。所述带权有向图G用矩阵表示。
第三、知识点隐性关系强度矩阵生成模块,用于根据所述带权有向图计算知识点隐性关系强度,并生成知识点隐性关系强度矩阵I。
所述知识点隐性关系强度的计算方法为:
fI(i,j)=exp(-Cij)
其中,fI(i,j)表示知识点oi到知识点oj的隐性关系强度,Cij表示在所述带权有向图G中知识点oi到知识点oj的最短简单路径长度;如果知识点oi到知识点oj不存在简单路径,则fI(i,j)等于零;知识点到自身的隐性关系强度设置为零;将隐性关系强度fI(i,j)保存为矩阵形式,则生成了知识点隐性关系强度矩阵I。
所述最短简单路径长度Cij计算方法为Dijkstra算法,或SPFA算法,或Floyd-Warshall算法,或Bellman-Ford算法。
第四、更新模块,用于遍历所述隐性关系强度矩阵I,更新所述知识点关系强度矩阵M。具体包括:
查找单元,用于遍历所述隐性关系强度矩阵I中的每一项;
判断单元,用于判断Iij与Mij的大小;
更新单元,用于如果Iij>Mij,对Mij重新赋值,Mij=Iij,更新所述知识点关系强度矩阵M,遍历所述隐性关系强度矩阵I中的下一项;如果Iij≤Mij,遍历所述隐性关系强度矩阵I中的下一项,直到遍历完所述隐性关系强度矩阵I。
本实施例所述的知识点关系强度的度量系统,利用知识点关系强度的度量方法,有效避免了现有技术中知识点关系强度的判断缺乏一个绝对的可衡量值、关系强度的度量不够准确以及部分更强的关系强度不能被发现的问题。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。