CN105373547A - 一种知识点重要度计算方法及装置 - Google Patents

一种知识点重要度计算方法及装置 Download PDF

Info

Publication number
CN105373547A
CN105373547A CN201410421888.6A CN201410421888A CN105373547A CN 105373547 A CN105373547 A CN 105373547A CN 201410421888 A CN201410421888 A CN 201410421888A CN 105373547 A CN105373547 A CN 105373547A
Authority
CN
China
Prior art keywords
knowledge point
matrix
degree
value
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410421888.6A
Other languages
English (en)
Inventor
叶茂
汤帜
徐剑波
金立峰
马佳乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd, Beijing Founder Apabi Technology Co Ltd filed Critical Peking University
Priority to CN201410421888.6A priority Critical patent/CN105373547A/zh
Publication of CN105373547A publication Critical patent/CN105373547A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种知识点的重要度计算方法,首先,获取所有或部分知识点,作为知识点集合;然后,确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;最后,利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。该方案中考虑了该知识点到其他知识点的有向关系强度,以及其他知识点到该知识点的有向关系强度,通过这两种关系可以客观的表征该知识点和其他知识点之间的关系,客观的体现出该知识点的重要程度,为领域内知识点确定了一种客观的重要度评估标准。

Description

一种知识点重要度计算方法及装置
技术领域
本发明涉及一种电数字数据的分析方法,具体地说是一种领域知识点的重要度计算方法和系统。
背景技术
数字出版已成为出版业的发展趋势。人们已从纸质阅读大量地转向电子阅读。数字出版资源中的百科全书作为一种工具书,是对领域中知识点的简单总结。百科全书中的知识点(也称为词条或实体)通常比字典更加详细,描述了领域概念的相关内容。通过领域百科全书和其他数字出版资源,可以通过知识点方式组织知识,提供基于知识点的知识服务系统。
在现代社会,随着电子信息技术的发展,数字信息量日益增加,如何在目前庞大的信息数据中寻找有价值的信息显得尤其重要。针对某个领域,其中的各个知识点的重要程度不尽相同,因此如果能够获得各个知识点的重要程度,将重要的知识点优先推荐给用户,让用户对重要的知识点有针对性的进行学习,则可以大大提高信息的利用率。在此情况下,则需要衡量知识点的重要程度,用于阅读推荐或者基于知识点重要度的学习。
然而,目前对于知识的重要度,没有一种客观的度量标准。如果使用人工方式标注重要度,不仅耗费大量人力,同时由于不同的人知识背景不同,所标注的重要度的值也会不同,无法对数据信息的进行标准化的处理,也不利于对电子信息数据的统一管理。
发明内容
为此,本发明所要解决的技术问题在于现有技术中的知识点重要度需要人工标注、标准不统一、耗费较多人力的问题,从而提出一种无需人工标注、客观地度量知识点的重要度的方法和系统。
为解决上述技术问题,本发明提供一种知识点的重要度计算方法和系统。
一种知识点的重要度计算方法,包括如下步骤:
获取所有或部分知识点,作为知识点集合;
确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;
利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。
一种知识点的重要度计算装置,包括:
获取单元:获取所有或部分知识点,作为知识点集合;
关联度计算单元:确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;
重要度计算单元:利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。
本发明的上述技术方案相比现有技术具有以下优点,
(1)本发明提供一种知识点的重要度计算方法,首先,获取所有或部分知识点,作为知识点集合;然后,确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;最后,利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。该方案中考虑了该知识点到其他知识点的有向关系强度,以及其他知识点到该知识点的有向关系强度,通过这两种关系可以客观的表征该知识点和其他知识点之间的关系,客观的体现出该知识点的重要程度,为领域内知识点确定了一种客观的重要度评估标准。
(2)本发明所述的知识点的重要度计算方法,设置导航度的初始值;将所述关联度信息与所述导航度的值进行迭代,确定权威度信息和所述导航度的最终值;根据所述权威度信息和所述导航度的最终值,确定所述知识点集合中每个知识点的重要度信息。该方案中,通过权威度信息和导航度值进行迭代,来逐次逼近,不仅计算简单方便,而且充分考虑了该知识点与其他知识点的关系,客观的表征了该知识点在该领域内的重要程度。
(3)本发明所述的知识点的重要度计算方法,待测知识点的重要度为T=A×H,或T=A×H×r+e,T为知识点集合中每个知识点的重要度组成的重要度矩阵,H为导航度矩阵;A为权威度矩阵,r为比例系数,e为偏差校正系数,在上述基础上引入了比例系数r和偏差e,便于根据不同的情况来调整知识点的重要度,使得该知识点的重要度可以更加合理、客观的表达出。
(4)本发明所述的知识点的重要度计算方法,计算知识点间的关系强度时,根据各个知识点的名称和各个知识点对应的解释进行计算,名称是对该知识点含义的概括表达,而解释则是该知识点的具体内容和分析,通过名称和解释相结合,可以反应出该知识点所代表的意思,因此利用该知识点名称和解释进行关系强度的计算,可以客观、合理的体现出各个知识点之间的关系强度,为后续计算提供客观依据。
(5)本发明所述的知识点的重要度计算方法,抽取知识点的名称和解释的过程中,还包括对名称和解释中的数据进行预处理的过程,通过预处理删除特殊符号信息如书名号等,方便后续计算。
(6)本发明提供一种知识点的重要度计算装置,包括获取单元、关联度计算单元和重要度计算单元,获取单元来获取所有或部分知识点,作为知识点集合;关联度计算单元用于确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;重要度计算单元利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。该方案中考虑了该知识点到其他知识点的有向关系强度,以及其他知识点到该知识点的有向关系强度,通过这两种关系可以客观的表征该知识点和其他知识点之间的关系,客观的体现出该知识点的重要程度。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
图1是本发明实施例中所述的知识点的重要度计算方法的流程图
图2、图3、图4是本发明所述的知识点的重要度计算方法的应用实例图;
图5是本发明其他实施例中知识点的重要度计算方法的流程示意图;
图6是本发明所述的知识点的重要度计算装置的结构图。
具体实施方式
实施例1:
本实施例中提供一种知识点的重要度计算方法,包括如下步骤:
(1)首先,获取所有知识点,作为知识点集合。
(2)然后,确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息。在计算任意两个知识点之间的有向关系强度时,可以采用现有技术中计算关系强度的方式,如专利CN102622363A中公开的关系强度的计算方法。这样就获得了关系强度矩阵M,其中Mij表示第i个知识点到第j个知识点的关系强度,该关系强度矩阵M则表示出了知识点间的关联度信息。
(3)最后,利用上述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。该过程主要包括以下步骤:
第一,设置导航度的初始值。首先,设置导航度矩阵为H,该矩阵H为n行1列的矩阵,n为知识点集合中知识点的个数。导航度矩阵的初始值为单位矩阵1.
第二,将所述关联度信息与所述导航度的值进行迭代,确定权威度信息和所述导航度的最终值。该过程包括:
首先,计算A=MTH,M为知识点集合中任意两个知识点之间的有向关系强度,MT为M的转置矩阵,H为导航度矩阵,A为权威度矩阵;
然后,根据上式计算出的权威度矩阵A重新计算导航度矩阵H,H=MA;
重复上述迭代过程,即重新根据A=MTH计算新的矩阵A,然后根据H=MA计算新的矩阵H,并在迭代的过程中,完成每次迭代后计算一下是否满足收敛条件,此处的收敛条件为将A和H合并为2n行1列的矩阵C,计算迭代前后C矩阵的相似度,若小于指定的阈值,则计算完成,否则循环上述过程,直到迭代前后C矩阵的相似度小于指定阈值,得到导航度矩阵H和权威度矩阵A。本实施例中通过判断迭代前后的矩阵C的相似度是否小于指定阈值作为收敛条件,从而通过迭代的方式得到最终的导航度矩阵H和权威度矩阵A。
在上述过程中,为了保证矩阵A和矩阵H最终收敛,在每次计算出矩阵A和H后都会进行归一化处理,使用归一化后的值进行后续迭代计算。
在其他可以替换的实施方案中,收敛条件还可以设置为计算迭代前后矩阵A的相似度,直到小于指定阈值;或者计算迭代前后矩阵H的相似度,直到小于指定阈值。
上述相似度的计算公式如下,其中的矩阵X、Y分别为需要进行相似度比较的两个具有相同行列数的矩阵,如本实施例中为迭代前的矩阵C和迭代后的矩阵C,采用如下公式将这两个矩阵进行比较,得到相似度的值。
f ( X , Y ) = X · Y | | X | | | | Y | | = Σ i = 1 m X i × Y i Σ i = 1 m ( X i ) 2 × Σ i = 1 m ( Y i ) 2
此处指定的阈值可以设置为如0.0001一个比较小的值。
通过该过程则获得了权威度矩阵和导航度矩阵的最终结果。
第三,根据所述权威度信息和所述导航度的最终值,确定所述知识点集合中每个知识点的重要度信息。
在上述步骤中获得了权威度矩阵A和导航度矩阵H,然后通过这两个值来计算每个知识点的重要度信息,计算过程如下:
Ti=Ai×Hi,i=1,…,n。
其中,知识点集合中每个知识点的重要度组成的重要度矩阵为T,H为导航度矩阵;A为权威度矩,这三个矩阵都是n行1列矩阵,n为知识点集合中知识点的数目;Ti为重要度矩阵T中的第i行元素的值,Ai为权威度矩阵A中的第i行元素的值,Hi为导航度矩阵H中的第i行元素的值,i=1,…,n;通过公式Ti=Ai×Hi的计算表示矩阵A中的第i行的值乘以矩阵H中第i行的值,得到矩阵T中第i行的值。这样就得到了重要度矩阵为T,其中每个元素Ti表示知识点集合中第i个知识点的重要度的值。
上述方式不仅计算简单方便,而且充分考虑了该知识点与其他知识点的关系,客观的表征了该知识点在该领域内的重要程度。该方案中考虑了该知识点到其他知识点的有向关系强度,以及其他知识点到该知识点的有向关系强度,通过这两种关系可以客观的表征该知识点和其他知识点之间的关系,客观的体现出该知识点的重要程度,为领域内知识点确定了一种客观的重要度评估标准。
实施例2:
本实施例中提供另外一种知识点的重要度的计算方法,具体过程如下:
(1)首先,获取部分知识点,作为知识点集合O={o1,o2,…,on},该知识点的数量为n个,oi为其中一个知识点,知识点的名称集合为X={xi,i=1,…,n},知识点的解释集合为Y={yi,i=1,…,n},其中xi和yi分别为知识点oi的名称和解释。对知识点的名称集合X={xi|i=1,...,n}和知识点的解释集合Y={yi|i=1,...,n}中的数据做预处理,删除特殊符号信息,例如书名号等。令预处理后的知识点的名称集合为X'={x′i|i=1,...,n},预处理后的知识点的解释集合为Y'={y′i|i=1,...,n}。
(2)然后,确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息。
创建一个n行n列的关系强度矩阵M,Mij表示从知识点oi到知识点oj的关系强度。初始设置Mij=0,其中i=1,...,n,j=1,...,n。
接着,计算知识点间的关系强度。根据集合X'={x′i|i=1,...,n}和集合Y'={y′i|i=1,...,n}计算 f E ( i , j ) = α ( f P ( i , j ) + f N ( i , j ) ) 1 + α , 其中 f P ( i , j ) = 2 1 + exp ( - μ ) - 1 , 是反向关联因子,α越大表明反向关联越弱,μ≥0是x′j在y′i中的出现次数,i≠j,设置Mij=fE(i,j),得到矩阵M为知识点的关系强度矩阵。
(3)最后,利用上述关联度信息进行迭代,确定所述知识点集合中每10个知识点的重要度信息。该过程主要包括以下步骤:
第一,设置导航度的初始值。首先,设置导航度矩阵为H,该矩阵H为n行1列的矩阵,n为知识点集合中知识点的个数。导航度矩阵的初始值为单位列矩阵1,也就是导航度矩阵的初始值为Hi1=1,i=1,…,n,n为知识点集合中知识点的个数,即矩阵H的行数。第二,将所述关联度信息与所述导航度的值进行迭代,确定权威度信息和所述导航度的最终值。该过程包括:
首先,计算A=MTH,M为知识点集合中任意两个知识点之间的有向关系强度,MT为M的转置矩阵,H为导航度矩阵,A为权威度矩阵;
然后,根据上式计算出的权威度矩阵A重新计算导航度矩阵H,H=MA;
重复上述迭代过程,即重新根据A=MTH计算新的矩阵A,然后根据H=MA计算新的矩阵H,并在迭代的过程中,完成每次迭代后计算一下是否满足收敛条件,此处的收敛条件为比较迭代前后矩阵A的相似度,如X为迭代前的矩阵A,Y为迭代后的矩阵A,n为矩阵X和Y的行数,则X和Y的相似度为:
f ( X , Y ) = 2 Σ i = 1 n X i × Y i Σ i = 1 n ( X i ) 2 + Σ i = 1 n ( Y i ) 2
计算出上述相似度f(X,Y)后,若其值小于指定阈值,则完成迭代,将此时的矩阵A和矩阵H分别作为权威度矩阵A和导航度矩阵H的最终值。若不小于指定阈值,则继续进行迭代,直到满足上述收敛条件为止。
在其他可替换的实施方式中,此处也可以选择比较迭代前后的矩阵H的相似度是否小于指定阈值作为收敛条件。
上述过程中,为了使得矩阵A和H收敛,每次计算完矩阵A和H后,都会进行归一化处理,后续使用归一化后的矩阵A和H进行迭代计算。
上述计算过程中,通过循环计算的方式,可以使得A和H不断迭代收敛矩阵M中保存了知识点之间的有向关系强度,A=MTH表明一个知识点的权威度由其他知识点的导航度及知识点间的有向关系强度决定,其他知识点的导航度越大,或者知识点间的有向关系强度越大,则得到的本知识点的权威度越大;H=MA表明一个知识点的导航度由其他知识点的权威度及知识点间的有向关系强度决定,其他知识点的权威度越大,或者知识点间的有向关系强度越大,则得到的本知识点的导航度越大。
通过该过程则获得了权威度矩阵A和导航度矩阵H的最终结果。
第三,根据所述权威度信息和所述导航度的最终值,确定所述知识点集合中每个知识点的重要度信息。
在上述步骤中获得了权威度矩阵A和导航度矩阵H,然后通过这两个值来计算每个知识点的重要度信息,计算过程如下:
Ti=Ai×Hi×r+e,i=1,…,n;
其中,知识点集合中每个知识点的重要度组成的重要度矩阵为T,H为导航度矩阵;A为权威度矩,这三个矩阵都是n行1列矩阵,n为知识点集合中知识点的数目;Ti为重要度矩阵T中的第i行元素的值,Ai为权威度矩阵A中的第i行元素的值,Hi为导航度矩阵H中的第i行元素的值,r为比例系数,e为偏差校正系数。
矩阵T中的各个值则表示各个知识点的重要度,第i个值表示第i个知识点的重要度。
该方案中引入了比例系数r和偏差e,便于根据不同的情况来调整知识点的重要度,使得该知识点的重要度可以更加合理、客观的表达出。
实施例3:
本实施例中提供一种知识点的重要度计算方法,在实施例1或2的基础上,给出一种对矩阵A和矩阵H进行归一化处理的具体方式。在每次计算矩阵A和矩阵H后,都进行一次归一化,归一化方法为取矩阵中的最大值,将矩阵中的每个单元的值都除以该最大值,通过归一化的方式,使得获得的数据能直观的表达出其相对大小。
实施例4:
下面给出一种计算知识点的重要度的具体的方式。令某个领域内的知识点集合为O={o1,o2,…,on},其中oi为其中一个知识点,知识点的名称集合为X={xi,i=1,…,n},知识点的解释集合为Y={yi,i=1,…,n},其中xi和yi分别为知识点oi的名称和解释。
对于知识点oi,令hi为从知识点oi到知识点集合O′i={oj|1≤j≤n,j≠i}的有向关系强度,令ai为从知识点集合O′i={oj|1≤j≤n,j≠i}到知识点oi的有向关系强度,则知识点oi的重要度为ti=hi×ai
在该知识点的重要度的计算方法中,考虑了两方面的因素,一方面是该知识点到其他知识点的有向关系强度,另一方面是其他知识点到该知识点的有向关系强度。通过定义知识点重要度,可以为领域内知识点确定一种客观的重要度评估标准。
本发明中计算领域知识点重要度的方法具体地包含以下步骤。
第一步,人工选择目标领域的百科全书,该百科全书包含了该领域的重要知识点,从领域百科全书中抽取知识点的名称集合X={xi|i=1,...,n}和知识点的解释集合Y={yi|i=1,...,n},n为知识点的个数。
第二步,对知识点的名称集合X={xi|i=1,...,n}和知识点的解释集合Y={yi|i=1,...,n}中的数据做预处理,删除特殊符号信息,例如书名号等。令预处理后的知识点的名称集合为X'={x′i|i=1,...,n},预处理后的知识点的解释集合为Y'={y′i|i=1,...,n}。
第三步,创建一个n行n列的关系强度矩阵M,Mij表示从知识点oi到知识点oj的关系强度。初始设置Mij=0,其中i=1,...,n,j=1,...,n。
第四步,计算知识点间的关系强度。根据集合X'={x′i|i=1,...,n}和集合Y'={y′i|i=1,...,n}计算 f E ( i , j ) = α ( f P ( i , j ) + f N ( i , j ) ) 1 + α , 其中 f P ( i , j ) = 2 1 + exp ( - μ ) - 1 , 是反向关联因子,α越大表明反向关联越弱,μ≥0是x′j在y′i中的出现次数,i≠j。设置Mij=fE(i,j),其中Mii设置为0,即知识点到自身的有向关系强度设置为0。
第五步,辅助矩阵初始化。创建两个n行1列的矩阵H和矩阵A,矩阵H为导航度矩阵,矩阵A为权威度矩阵,初始设置Hi1=1,其中i=1,...,n。A的初始值不做要求。
第六步,计算得到A=MTH,其中MT是M的转置矩阵。
第七步,归一化矩阵A。归一化方法为:取得矩阵中的最大值,将矩阵中的每个单元的值都除以该最大值。
第八步,计算得到H=MA。
第九步,归一化矩阵H。归一化方法同第七步。
第十步,将A和H合并为2n行1列的矩阵C;
第十一步,重复第六步至第十步,
直到前后两次获得A和H的矩阵C即C前和C后的相似度f(C,C)小于等于指定的阈值δ。相似度通过余弦相似度计算,公式如下:。
当满足该收敛条件后,此时得到的矩阵A和矩阵H作为权威度矩阵A和导航度矩阵H的最终值。如果不满足条件,则一直重复第六步至第十步,直到满足条件为止。
第十一步,计算知识点重要度。对于每一个知识点oi,i=1,…,n,其重要度Ti=Ai×Hi,其中,知识点集合中每个知识点的重要度组成的重要度矩阵为T,H为导航度矩阵;A为权威度矩,这三个矩阵都是n行1列矩阵,n为知识点集合中知识点的数目;Ti为重要度矩阵T中的第i行元素的值,Ai为权威度矩阵A中的第i行元素的值,Hi为导航度矩阵H中的第i行元素的值,i=1,…n;Ti=Ai×Hi表示矩阵A中的第i行的值乘以矩阵H中第i行的值,得到矩阵T中第i行的值。
这样就得到了重要度矩阵为T,其中每个元素Ti表示知识点集合中第i个知识点的重要度的值。
本实施例中的知识点的重要度计算方法,使用人工方式标注重要度,不仅耗费大量人力,同时由于不同的人知识背景不同,所标注的重要度值也会不同。本发明的关键创新点是定义了知识点重要度指标,再利用知识点关系强度矩阵通过迭代方法计算知识点的重要度。
实施例5:
本实施例中给出一个知识点重要度计算方法的具体的应用实例。
第一步,对于历史领域,人工选择《中国大百科全书.中国历史》共3册,这3册百科全书包含了历史领域的重要知识点,通过程序从百科全书中抽取知识点的名称集合和知识点的解释集合。选取的知识点数目为2680个,部分知识点的信息如下,其中第一列为知识点的名称,第二列为知识点的部分解释。如图2所示。
第二步,对知识点的名称集合和知识点的解释集合中的数据做预处理,删除符号信息,例如书名号等。
第三步,创建一个2680行2680列的矩阵M。
第四步,根据2680条解释Y'={y′i|i=1,...n},和2680个名称X'={x′i|i=1,...,n}计算 f E ( i , j ) = α ( f P ( i , j ) + f N ( i , j ) ) 1 + α , 其中 f P ( i , j ) = 2 1 + exp ( - μ ) - 1 , α取100,μ≥0是x′j在y′i中的出现次数,i≠j。设置Mij=fE(i,j),其中Mii设置为0,即知识点到自身的有向关系强度设置为0。
第五步,创建两个2680行1列的矩阵导航度H和权威度矩阵A,初始设置Hi1=1,其中i=1,...,2680。A的初始值不做要求。
第六步,计算得到A=MTH,其中MT是M的转置矩阵。
第七步,归一化矩阵A。归一化方法为:取得矩阵中的最大值,将矩阵中的每个单元的值都除以该最大值。
第八步,计算得到H=MA。
第九步,归一化矩阵H。归一化方法同第七步。
第十步,重复第六步至第九步进行迭代,
直到迭代前后的矩阵A的相似度f(A,A)小于等于指定的阈值0.000001。f(A,A)的计算公式如下:(下方的公式中分母内Aii应为Ai)
计算出上述相似度f(A,A)后,若其值小于指定阈值0.000001,则完成迭代,将此时的矩阵A和矩阵H分别作为权威度矩阵A和导航度矩阵H的最终值。若不小于指定阈值,则继续重复重复第六步至第九步进行迭代,直到满足上述收敛条件为止。
第十一步,对于每一个知识点oi,i=1,…,n,其重要度Ti=Ai×Hi,即。矩阵A中的第i行的值乘以矩阵H中第i行的值,得到矩阵T中第i行的值。这样就得到了重要度矩阵T,重要度矩阵T由知识点集合中每个知识点的重要度组成,其中每个元素Ti表示知识点集合中第i个知识点的重要度的值。
上述计算过程如图5所示。这样,通过计算得到历史领域2680个知识点的重要度值,部分知识点的名称及其重要度值如图3、图4所述。四个字段的含义分别为“重要度次序”、“知识点名称”,“计算得到的权重”,“知识点的部分解释内容”。从结果数据中取了排序最前的20个知识点和排序较后的21个知识点,分别见图3和图4,可见,图3中排序靠前的知识点的重要度明显高于排序在后的知识点的重要度,该知识点的重要度计算方法是一种客观的、合理的计算方法,可以通过量化的方式将知识点的重要度进行直观的、客观的表示,为知识点推荐以及学习提供依据。
实施例6
本实施例中提供一种知识点的重要度计算装置,结构框图如图5所示,一种知识点的重要度计算装置,其特征在于,包括:
获取单元:获取所有或部分知识点,作为知识点集合;
关联度计算单元:确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;
重要度计算单元:利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。
其中,所述重要度计算单元包括
初始子单元:设置导航度的初始值;
迭代子单元:将所述关联度信息与所述导航度的值进行迭代,确定权威度信息和所述导航度的最终值;
计算子单元:根据所述权威度信息和所述导航度的最终值,确定所述知识点集合中每个知识点的重要度信息。
其中,所述计算子单元包括:
第一公式计算模块:存储有公式Ti=Ai×Hi,并进行计算;
其中,知识点集合中每个知识点的重要度组成的重要度矩阵为T,H为导航度矩阵;A为权威度矩,这三个矩阵都是n行1列矩阵,n为知识点集合中知识点的数目;Ti为重要度矩阵T中的第i行元素的值,Ai为权威度矩阵A中的第i行元素的值,Hi为导航度矩阵H中的第i行元素的值,i=1,…n;Ti=Ai×Hi表示矩阵A中的第i行的值乘以矩阵H中第i行的值,得到矩阵T中第i行的值。
在其他可替换的实施方式中,所述计算子单元还可以为包括:
第二公式计算模块:存储有公式Ti=Ai×Hi×r+e,i=1,…,n,并进行计算;
其中,知识点集合中每个知识点的重要度组成的重要度矩阵为T,H为导航度矩阵;A为权威度矩阵,这三个矩阵都是n行1列矩阵,n为知识点集合中知识点的数目;Ti为重要度矩阵T中的第i行元素的值,Ai为权威度矩阵A中的第i行元素的值,Hi为导航度矩阵H中的第i行元素的值,r为比例系数,e为偏差校正系数。
本实施例中,所述迭代子单元包括:
第一计算模块:计算A=MTH,M为知识点集合中任意两个知识点之间的有向关系强度,H为导航度矩阵,A为权威度矩阵;
第二计算模块:根据上式计算出的权威度矩阵A重新计算导航度矩阵H,H=MA;
重复模块:重复上述迭代过程,直到达到收敛条件,得到导航度矩阵H和权威度矩阵A的最终值。
在其他可以替换的实施方式中,所述迭代子单元包括:
一次计算模块:计算A=MTMTH,M为知识点集合中任意两个知识点之间的有向关系强度,H为导航度矩阵,A为权威度矩阵;
二次计算模块:根据上式计算出的新的权威度矩阵A重新计算导航度矩阵H,H=MMA;
迭代模块:重复上述迭代过程,直到达到收敛条件,得到导航度矩阵H和权威度矩阵A的最终值。
进一步地,所述迭代子单元中还包括收敛判断单元,其中存储有收敛条件,所述收敛条件为:
迭代前后的矩阵C的相似度小于指定阈值,其中矩阵C为将矩阵A和矩阵H合并后的2n行1列的矩阵,n为所述矩阵A和矩阵H的行数
作为其他可以替换的实施方式,所述收敛条件还可以为:
迭代前后的导航度矩阵H的相似度小于指定阈值或迭代前后的权威度矩阵A的相似度小于指定阈值。
在上述收敛条件中,所述相似度的计算方法为:
f ( X , Y ) = X · Y | | X | | | | Y | | = Σ i = 1 m X i × Y i Σ i = 1 m ( X i ) 2 × Σ i = 1 m ( Y i ) 2
其中,X、Y为需要比较相似度的两个m行1列的列矩阵。
进一步地,本实施例中的关联度计算单元包括:
抽取子单元:抽取知识点的名称和解释;
关系强度计算子单元:计算知识点间的关系强度,其中:
f E ( i , j ) = α ( f P ( i , j ) + f N ( i , j ) ) 1 + α , 其中 f P ( i , j ) = 2 1 + exp ( - μ ) - 1 , f N ( i , j ) = f P ( j , i ) α , α > 0 是反向关联因子,α越大表明反向关联越弱,μ≥0是x′j在y′i中的出现次数,i≠j,x′j为知识点oj的名称,y′i为知识点oi的解释;
计算知识点的关联度信息,即计算知识点间关系强度矩阵M为:
Mij=fE(i,j),Mij为矩阵M中第i行第j列的数值,其中Mii设置为0,即知识点到自身的有向关系强度设置为0。
所述迭代子单元中还包括归一化单元:对所述权威度矩阵A和导航度矩阵H进行归一化的过程。所述归一化单元中的归一化方法为取矩阵中的最大值,将矩阵中的每个单元的值都除以该最大值。
所述迭代子单元中的所述初始子单元包括:设置导航度矩阵为H,所述H的行数为所述知识点集合中知识点的个数,列数为1列,所述导航度矩阵的初始值为Hi1=1,i=1,…,n,n为知识点集合中知识点的个数。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

Claims (14)

1.一种知识点的重要度计算方法,其特征在于,包括如下步骤:
获取所有或部分知识点,作为知识点集合;
确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;
利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。
2.根据权利要求1所述的知识点的重要度计算方法,其特征在于,所述利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息的处理,包括
设置导航度的初始值;
将所述关联度信息与所述导航度的值进行迭代,确定权威度信息和所述导航度的最终值;
根据所述权威度信息和所述导航度的最终值,确定所述知识点集合中每个知识点的重要度信息。
3.根据权利要求2所述的知识点的重要度计算方法,其特征在于,所述根据所述权威度信息和所述导航度的最终值,确定所述知识点集合中每个知识点的重要度信息的处理,包括:
Ti=Ai×Hi
其中,知识点集合中每个知识点的重要度组成的重要度矩阵为T,H为导航度矩阵;A为权威度矩,这三个矩阵都是n行1列矩阵,n为知识点集合中知识点的数目;Ti为重要度矩阵T中的第i行元素的值,Ai为权威度矩阵A中的第i行元素的值,Hi为导航度矩阵H中的第i行元素的值,i=1,…n;Ti=Ai×Hi表示矩阵A中的第i行的值乘以矩阵H中第i行的值,得到矩阵T中第i行的值。
4.根据权利要求2所述的知识点的重要度计算方法,其特征在于,根据所述权威度信息和所述导航度的最终值,确定所述知识点集合中每个知识点的重要度信息的处理,包括
Ti=Ai×Hi×r+e,i=1,…,n;
其中,知识点集合中每个知识点的重要度组成的重要度矩阵为T,H为导航度矩阵;A为权威度矩阵,这三个矩阵都是n行1列矩阵,n为知识点集合中知识点的数目;Ti为重要度矩阵T中的第i行元素的值,Ai为权威度矩阵A中的第i行元素的值,Hi为导航度矩阵H中的第i行元素的值,r为比例系数,e为偏差校正系数。
5.根据权利要求2或3或4所述的知识点的重要度计算方法,其特征在于,将所述关联度信息与所述导航度的值进行迭代,确定权威度信息和所述导航度的最终值的处理,包括:
计算A=MTH,M为知识点集合中任意两个知识点之间的有向关系强度,H为导航度矩阵,A为权威度矩阵;
根据上式计算出的权威度矩阵A重新计算导航度矩阵H,H=MA;
重复上述迭代过程,直到达到收敛条件,得到导航度矩阵H和权威度矩阵A的最终值。
6.根据权利要求2或3或4所述的知识点的重要度计算方法,其特征在于,将所述关联度信息与所述导航度的值进行迭代,确定权威度信息和所述导航度的最终值的处理,包括:
计算A=MTMTH,M为知识点集合中任意两个知识点之间的有向关系强度,H为导航度矩阵,A为权威度矩阵;
根据上式计算出的新的权威度矩阵A重新计算导航度矩阵H,H=MMA;
重复上述迭代过程,直到达到收敛条件,得到导航度矩阵H和权威度矩阵A的最终值。
7.根据权利要求5或6所述的知识点的重要度计算方法,其特征在于,所述收敛条件为:
迭代前后的矩阵C的相似度小于指定阈值,其中矩阵C为将矩阵A和矩阵H合并后的2n行1列的矩阵,n为所述矩阵A和矩阵H的行数
8.根据权利要求5或6所述的知识点的重要度计算方法,其特征在于,所述收敛条件为:
迭代前后的导航度矩阵H的相似度小于指定阈值或迭代前后的权威度矩阵A的相似度小于指定阈值。
9.根据权利要求7或8所述的知识点的重要度计算方法,其特征在于,所述相似度的计算方法为:
f ( X , Y ) = X · Y | | X | | | | Y | | = Σ i = 1 m X i × Y i Σ i = 1 m ( X i ) 2 × Σ i = 1 m ( Y i ) 2
其中,X、Y为需要比较相似度的两个m行1列的列矩阵。
10.根据权利要求1-9任一所述的知识点的重要度计算方法,其特征在于,确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息的处理,包括:
抽取知识点的名称和解释;
计算知识点间的关系强度,其中:
f E ( i , j ) = α ( f P ( i , j ) + f N ( i , j ) ) 1 + α , 其中 f P ( i , j ) = 2 1 + exp ( - μ ) - 1 , f N ( i , j ) = f P ( j , i ) α , α > 0 是反向关联因子,α越大表明反向关联越弱,μ≥0是x′j在y′i中的出现次数,i≠j,x′j为知识点oj的名称,y′i为知识点oi的解释;
计算知识点的关联度信息,即计算知识点间关系强度矩阵M为:Mij=fE(i,j),Mij为矩阵M中第i行第j列的数值,其中Mii设置为0,即知识点到自身的有向关系强度设置为0。
11.根据权利要求5或6任一所述的知识点的重要度计算方法,其特征在于,还包括对所述权威度矩阵A和导航度矩阵H进行归一化的过程。
12.根据权利要求11所述的知识点的重要度计算方法,其特征在于,所述归一化方法为取矩阵中的最大值,将矩阵中的每个单元的值都除以该最大值。
13.根据权利要求2所述的知识点的重要度计算方法,其特征在于,设置导航度的初始值的处理,包括:设置导航度矩阵为H,所述H的行数为所述知识点集合中知识点的个数,列数为1列,所述导航度矩阵的初始值为Hi1=1,i=1,…,n,n为知识点集合中知识点的个数。
14.一种知识点的重要度计算装置,其特征在于,包括:
获取单元:获取所有或部分知识点,作为知识点集合;
关联度计算单元:确定所述知识点集合中任意两个知识点之间的有向关系强度,得到知识点的关联度信息;
重要度计算单元:利用所述关联度信息进行迭代,确定所述知识点集合中每个知识点的重要度信息。
CN201410421888.6A 2014-08-25 2014-08-25 一种知识点重要度计算方法及装置 Pending CN105373547A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410421888.6A CN105373547A (zh) 2014-08-25 2014-08-25 一种知识点重要度计算方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410421888.6A CN105373547A (zh) 2014-08-25 2014-08-25 一种知识点重要度计算方法及装置

Publications (1)

Publication Number Publication Date
CN105373547A true CN105373547A (zh) 2016-03-02

Family

ID=55375754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410421888.6A Pending CN105373547A (zh) 2014-08-25 2014-08-25 一种知识点重要度计算方法及装置

Country Status (1)

Country Link
CN (1) CN105373547A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344405A (zh) * 2018-09-25 2019-02-15 艾凯克斯(嘉兴)信息科技有限公司 一种基于tf-idf思想及神经网络的相似性处理方法
CN110489602A (zh) * 2019-07-25 2019-11-22 上海乂学教育科技有限公司 知识点能力值预估方法、系统、设备及介质
CN117271622A (zh) * 2023-11-21 2023-12-22 中铁建设集团有限公司 一种建筑施工方案的审核知识要点挖掘方法与装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344405A (zh) * 2018-09-25 2019-02-15 艾凯克斯(嘉兴)信息科技有限公司 一种基于tf-idf思想及神经网络的相似性处理方法
CN109344405B (zh) * 2018-09-25 2023-04-14 艾凯克斯(嘉兴)信息科技有限公司 一种基于tf-idf思想及神经网络的相似性处理方法
CN110489602A (zh) * 2019-07-25 2019-11-22 上海乂学教育科技有限公司 知识点能力值预估方法、系统、设备及介质
CN117271622A (zh) * 2023-11-21 2023-12-22 中铁建设集团有限公司 一种建筑施工方案的审核知识要点挖掘方法与装置

Similar Documents

Publication Publication Date Title
CN108959328B (zh) 知识图谱的处理方法、装置及电子设备
CN103324620B (zh) 一种对标注结果进行纠偏的方法和装置
Wheeldon et al. Power law distributions in class relationships
Al Qady et al. Concept relation extraction from construction documents using natural language processing
CN103207899B (zh) 文本文件推荐方法及系统
CN107423214A (zh) 软件回归测试用例获取方法、装置及存储介质和电子设备
Jiang et al. Towards an effective and unbiased ranking of scientific literature through mutual reinforcement
CN107844425A (zh) 一种数据库语句检查方法和装置
CN105913323A (zh) 一种GitHub开源社区的PullRequest评审者推荐方法
CN107967256A (zh) 词语权重预测模型生成方法、职位推荐方法及计算设备
CN116680162B (zh) 一种测试用例复用方法、装置、介质、设备及产品
CN105373547A (zh) 一种知识点重要度计算方法及装置
Li et al. Siphon extraction for deadlock control in flexible manufacturing systems by using Petri nets
Gil et al. Mint: Model integration through knowledge-powered data and process composition
CN104699595A (zh) 一种面向软件升级的软件测试方法
CN110516164A (zh) 一种信息推荐方法、装置、设备及存储介质
CN102375937A (zh) 一种定量评估仿真模型可信度的方法
Kusuma et al. The Implementation of the Black Box Method for Testing Smart Hajj Application Ministry of Religion
Byrd et al. An active-set algorithm for nonlinear programming using parametric linear programming
CN104216933A (zh) 一种知识点隐性关系获取方法及其系统
CN105894193A (zh) 一种指标配置方法和装置
CN105184170B (zh) 一种基于形式化程度的领域软件可信性评估方法
CN104133680A (zh) 一种erp窗体模块的快速构建方法
Hingorani et al. Reinforcing Database Concepts By Using Entity Relationships Diagrams (Erd) and Normalization Together for Designing Robust Databases
CN109582802A (zh) 一种实体嵌入方法、装置、介质及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160302