CN107656975B - 一种主题地图的评估方法、系统和装置 - Google Patents

一种主题地图的评估方法、系统和装置 Download PDF

Info

Publication number
CN107656975B
CN107656975B CN201710792596.7A CN201710792596A CN107656975B CN 107656975 B CN107656975 B CN 107656975B CN 201710792596 A CN201710792596 A CN 201710792596A CN 107656975 B CN107656975 B CN 107656975B
Authority
CN
China
Prior art keywords
map
theme
verifying
subject
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710792596.7A
Other languages
English (en)
Other versions
CN107656975A (zh
Inventor
聂瑞华
李卓越
赵淦森
王欣明
席云
杨晋吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201710792596.7A priority Critical patent/CN107656975B/zh
Publication of CN107656975A publication Critical patent/CN107656975A/zh
Application granted granted Critical
Publication of CN107656975B publication Critical patent/CN107656975B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种主题地图的评估方法、系统和装置,本发明的方法包括以下步骤:用小世界特性对主题地图的文档分类进行验证;用无标度特性对主题地图的重要文档进行验证;对主题地图中主题之间的相关性进行专家验证;系统包括文档分类验证模块、重要文档验证模块和相关性验证模块;装置包括处理器和存储器。本发明的方法利用了小世界特性对文档的分类进行验证以及利用了无标度特性对主题地图的重要文档进行验证,使得进行主题地图的文档分类验证和重要文档验证时,无需人工参与,节省了人力开销。本发明可以广泛应用于数据挖掘领域。

Description

一种主题地图的评估方法、系统和装置
技术领域
本发明涉及数据挖掘领域,尤其是一种主题地图的评估方法、系统和装置。
背景技术
名词解释:
主题地图:是一种语义网络的知识表示模式,一个主题地图包含一系列的topic,每个topic代表一类概念,topic之间使用associations表示关联关系,而topic与资源之间的关联关系使用occurrence表示。
小世界特性:相对于同等规模的随机网络,符合小世界特性的网络具有较高的聚集系数和较短的最短路径长度。
无标度特性:无标度网络拥有很强的异质性,该网络中各节点的度数,即连接状况的分布严重不均匀:网络中少数的节点拥有极大的度(即与其他节点拥有极多的连接),这类节点称为Hub点;其余大多数节点只拥有很少量的连接。无标度网络中为数不多的Hub点对网络的运行有主导作用。广义上讲,无标度网络节点的度分布服从幂律分布。自然界中许多网络都具有无标度的特征,只是幂律指数不同。符合无标度特性的主题地图中,只有很少一部分领域知识与其他领域知识具有较多的语义关联,这部分领域知识可以作为该领域中重要知识的判断依据。
度:顶点所具有的边的数目称为该顶点的度。
网络效率:网络效率描述了从一个节点到另一个节点所需要的平均步数,一个效率低的网络,需要更多的步数才能从一个节点到另一个节点。全局网络效率越高,则说明任意两个节点间的平均最短路径长度就越短。
节点的重要程度:表示该节点被删除后对网络的破坏性,即节点在删除前后的网络效率变化情况。在网络中,如果某个节点被删除,则表示同时删除了与该节点相连的所有连接,对网络造成破坏,从而可能使得网络的效率变差。节点被删去后网络效率变得越差,则表明该节点越重要。
主题地图作为一种重要的指示组织工具,在决策支持和信息导航等方面具有重要作用。一个主题地图是否有效,需要对其进行验证,目前对主题地图的验证方法,主要以人工验证为主,虽然目前采用人工验证的方法可以直接判断主题地图的准确性,但是目前的方法需要对主题地图中的文档的关系进行逐一验证,对于数量庞大的文档,这是一个巨大的工作量,需要耗费大量的人力。
发明内容
为解决上述技术问题,本发明的第一目的在于:提供一种节省人力的主题地图的评估方法。
本发明的第二目的在于:提供一种节省人力的主题地图的评估系统。
本发明的第三目的在于:提供一种节省人力的主题地图的评估装置。
本发明所采用的第一种技术方案是:
一种主题地图的评估方法,包括以下步骤:
用小世界特性对主题地图的文档分类进行验证;
用无标度特性对主题地图的重要文档进行验证;
对主题地图中主题之间的相关性进行专家验证。
进一步,所述用小世界特性对主题地图的文档分类进行验证的步骤包括:通过主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性,从而验证主题地图文档分类的有效性。
进一步,所述通过主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性,从而验证主题地图文档分类的有效性,这一步骤包括:
计算主题地图的平均聚集系数;所述平均聚集系数的表达式为:
Figure BDA0001399607200000021
其中,n表示主题地图中节点的个数,C表示主题地图的平均聚集系数,Ci表示主题地图中节点i的局部聚集系数,Ci的表达式为:
Figure BDA0001399607200000022
其中,ei表示主题地图中节点i的相邻节点之间的连接数量,ki表示主题地图中节点i的度;
计算主题地图的平均最短路径;所述平均最短路径的表达式为:
Figure BDA0001399607200000023
其中,l-1表示主题地图的平均最短路径,dij表示在主题地图中从节点i到节点j的最短距离;
根据主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性:若主题地图的平均聚集系数大于平均聚集系数的设定阈值,且主题地图的平均最短路径小于等于平均最短路径的设定阈值,则判定主题地图符合小世界特性;反之,判定主题地图不符合小世界特性。
进一步,所述用小世界特性对主题地图的文档分类进行验证的步骤还包括:通过主题地图的准确率、召回率和F值来验证文档分类的准确性。
进一步,所述准确率的表达式为:
Figure BDA0001399607200000031
其中,P表示准确率,TP表示把实际的正类预测为正类的样本个数,FP表示把实际的负类预测为正类的样本个数;
所述召回率的表达式为:
Figure BDA0001399607200000032
其中,R表示召回率,FN表示把实际的正类预测为负类的样本个数;
所述F值的表达式为:
Figure BDA0001399607200000033
进一步,所述用无标度特性对主题地图的重要文档进行验证的步骤包括:
验证主题地图的无标度特性,从而验证重要文档的存在性;
用网络效率对主题地图的重要文档进行有效性验证。
进一步,所述验证主题地图的无标度特性,从而验证重要文档的存在性的步骤具体为:根据主题地图中度的节点个数分布是否符合幂函数P(k)=α*k来验证主题地图是否具有无标度特性,从而验证重要文档的存在性;
其中,k表示主题地图中节点的度,P(k)表示主题地图中度为k的节点的个数,α和β为常数。
进一步,所述用网络效率对主题地图的重要文档进行有效性验证的步骤包括:通过对比主题地图的重要文档删除前后的网络效率来判断该重要文档的有效性,所述网络效率的表达式为:
Figure BDA0001399607200000034
其中,E表示主题地图的网络效率,N表示主题地图中节点的总数,dij表示主题地图中节点i和节点j之间的最短路径。
本发明所采用的第二种技术方案是:
一种主题地图的评估系统,包括:
文档分类验证模块,用于用小世界特性对主题地图的文档分类进行验证;
重要文档验证模块,用于用无标度特性对主题地图的重要文档进行验证;
相关性验证模块,用于对主题地图中主题之间的相关性进行专家验证。
本发明所采用的第三种技术方案是:
一种主题地图的评估装置,包括:
存储器,用于存放程序;
处理器,用于执行所述程序,以用于:
用小世界特性对主题地图的文档分类进行验证;
用无标度特性对主题地图的重要文档进行验证;
对主题地图中主题之间的相关性进行专家验证。
本发明方法的有益效果是:包括用小世界特性对主题地图的文档分类进行验证和用无标度特性对主题地图的重要文档进行验证的步骤,利用了小世界特性对文档的分类进行验证以及利用了无标度特性对主题地图的重要文档进行验证,使得进行主题地图的文档分类验证和重要文档验证时,无需人工参与,节省了人力开销。
本发明系统的有益效果是:包括文档分类验证模块和重要文档验证模块,通过文档分类模块利用小世界特性对文档的分类进行验证,和重要文档验证模块利用无标度特性对主题地图的重要文档进行验证,使得进行主题地图的文档分类验证和重要文档验证时,无需人工参与,节省了人力开销。
本发明装置的有益效果是:包括存储器和处理器,处理器执行的程序利用了小世界特性对文档的分类进行验证和利用了无标度特性对主题地图的重要文档进行验证,使得进行主题地图的文档分类验证和重要文档验证时,无需人工参与,节省了人力开销。
附图说明
图1是本发明一种主题地图的评估方法的流程图;
图2是本发明实施例1的方法流程图;
图3是本发明实施例1的平均聚集系数统计图;
图4是本发明实施例1的平均最短路径统计图;
图5是本发明实施例1的节点个数和节点的度的关系图;
图6是本发明实施例1的删除节点数量与网络效率的关系图。
具体实施方式
参照图1,一种主题地图的评估方法,包括以下步骤:
用小世界特性对主题地图的文档分类进行验证;
用无标度特性对主题地图的重要文档进行验证;
对主题地图中主题之间的相关性进行专家验证。
参照图2,进一步作为优选的实施方式,所述用小世界特性对主题地图的文档分类进行验证的步骤包括:通过主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性,从而验证主题地图文档分类的有效性。
进一步作为优选的实施方式,所述通过主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性,从而验证主题地图文档分类的有效性,这一步骤包括:
计算主题地图的平均聚集系数;所述平均聚集系数的表达式为:
Figure BDA0001399607200000051
其中,n表示主题地图中节点的个数,C表示主题地图的平均聚集系数,Ci表示主题地图中节点i的局部聚集系数,Ci的表达式为:
Figure BDA0001399607200000052
其中,ei表示主题地图中节点i的相邻节点之间的连接数量,ki表示主题地图中节点i的度;
计算主题地图的平均最短路径;所述平均最短路径的表达式为:
Figure BDA0001399607200000053
其中,l-1表示主题地图的平均最短路径,dij表示在主题地图中从节点i到节点j的最短距离;
根据主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性:若主题地图的平均聚集系数大于平均聚集系数的设定阈值,且主题地图的平均最短路径小于等于平均最短路径的设定阈值,则判定主题地图符合小世界特性;反之,判定主题地图不符合小世界特性。
进一步作为优选的实施方式,所述用小世界特性对主题地图的文档分类进行验证的步骤还包括:通过主题地图的准确率、召回率和F值来验证文档分类的准确性。
进一步作为优选的实施方式,所述准确率的表达式为:
Figure BDA0001399607200000061
其中,P表示准确率,TP表示把实际的正类预测为正类的样本个数,FP表示把实际的负类预测为正类的样本个数;
所述召回率的表达式为:
Figure BDA0001399607200000062
其中,R表示召回率,FN表示把实际的正类预测为负类的样本个数;
所述F值的表达式为:
Figure BDA0001399607200000063
进一步作为优选的实施方式,所述用无标度特性对主题地图的重要文档进行验证的步骤包括:
验证主题地图的无标度特性,从而验证重要文档的存在性;
用网络效率对主题地图的重要文档进行有效性验证。
进一步作为优选的实施方式,所述验证主题地图的无标度特性,从而验证重要文档的存在性的步骤具体为:根据主题地图中度的节点个数分布是否符合幂函数P(k)=α*k来验证主题地图是否具有无标度特性,从而验证重要文档的存在性;
其中,k表示主题地图中节点的度,P(k)表示主题地图中度为k的节点的个数,α和β为常数。
进一步作为优选的实施方式,所述用网络效率对主题地图的重要文档进行有效性验证的步骤包括:通过对比主题地图的重要文档删除前后的网络效率来判断该重要文档的有效性,所述网络效率的表达式为:
Figure BDA0001399607200000064
其中,E表示主题地图的网络效率,N表示主题地图中节点的总数,dij表示主题地图中节点i和节点j之间的最短路径。
一种主题地图的评估系统,包括:
文档分类验证模块,用于用小世界特性对主题地图的文档分类进行验证;
重要文档验证模块,用于用无标度特性对主题地图的重要文档进行验证;
相关性验证模块,用于对主题地图中主题之间的相关性进行专家验证。
一种主题地图的评估装置,包括:
存储器,用于存放程序;
处理器,用于执行所述程序,以用于:
用小世界特性对主题地图的文档分类进行验证;
用无标度特性对主题地图的重要文档进行验证;
对主题地图中主题之间的相关性进行专家验证。
实施例1
参照图1,为了解决传统的主题地图评估方法需要耗费大量人力物力的问题,本发明提出了一种主题地图的评估方法,该方法主要包括以下步骤:
S1、用小世界特性对主题地图的文档分类进行验证;
S2、用无标度特性对主题地图的重要文档进行验证;
S3、对主题地图中主题之间的相关性进行专家验证。
参照图2,以评估博客数据构造的主题地图为例,对步骤S1-S3进行详细的说明。
所述步骤S1包括:
S11、通过主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性,从而验证主题地图文档分类的有效性,若主题地图的平均聚集系数大于平均聚集系数的设定阈值,且主题地图的平均最短路径小于等于平均最短路径的设定阈值,则判定主题地图符合小世界特性。所述平均最短路径的设定阈值是与主题地图同等规模的随机网络的平均最短路径,所述平均聚集系数的设定阈值是与主题地图同等规模的随机网络的平均聚集系数。所述同等规模,指网络中节点的数量相同。
所述平均聚集系数的表达式为:
Figure BDA0001399607200000071
其中,C表示主题地图的平均聚集系数,Ci表示主题地图中节点i的局部聚集系数,Ci的表达式为:
Figure BDA0001399607200000072
其中,ei表示主题地图中i节点的相邻节点之间的连接数量,ki表示主题地图中i节点的度;
所述平均最短路径的表达式为:
Figure BDA0001399607200000081
其中,l-1表示主题地图的平均最短路径,dij表示在主题地图中从节点i到节点j的最短距离,n表示主题地图中节点的个数。
从图3和图4可以看出,所述以博客数据建立的主题地图的平均聚集系数远大于同等规模随机网络的平均聚集系数,而且以博客数据建立的主题地图的平均最短路径与同等规模随机网络的平均最短路径相当,符合小世界特性,说明该主题地图对文档的分类有效。
S12、通过主题地图的准确率(precision)、召回率(recall)和F值来验证分类文档的准确性。
所述准确率的表达式为:
Figure BDA0001399607200000082
其中,P表示准确率,TP表示把实际的正类预测为正类的样本个数,FP表示把实际的负类预测为正类的样本个数;
所述召回率的表达式为:
Figure BDA0001399607200000083
其中,R表示召回率,FN表示把实际的正类预测为负类的样本个数;
将准确率和召回率调和平均,得到F值(即准确率和召回率的调和平均值),其表达式为:
Figure BDA0001399607200000084
用求得的准确率(precision)、召回率(recall)和F值与现有的主题地图的相应数据进行比较,验证分类文档的准确性。
所述步骤S2包括:
S21、验证主题地图的无标度特性,从而验证重要文档的存在性;
根据主题地图中度的节点个数分布是否符合幂函数P(k)=α*k来验证主题地图的无标度特性,从而验证重要文档的存在性,所述度的节点个数分布指节点的度和拥有该度数的节点个数的分布关系;
其中,k表示主题地图中节点的度,P(k)表示主题地图中度为k的节点的个数,α和β为常数。
从图5可以看出,所述以博客数据建立的主题地图中节点的度和拥有该度数节点的个数分布属于幂律分布,即所述以博客数据建立的主题地图中存在重要文档节点。
S22、用网络效率对主题地图的重要文档进行有效性验证。
通过对比主题地图的重要文档节点删除前后的网络效率来判断该重要文档的有效性,若删除某个重要文档节点后,网络效率变差,则说明该重要文档有效,所述网络效率的表达式为:
Figure BDA0001399607200000091
其中,E表示主题地图的网络效率,N表示主题地图中节点的总数,dij表示主题地图中节点i和节点j之间的最短路径。
按重要文档节点度数的大小,从大小删除重要文档节点,并和随机删除节点进行对比,得到图6,从图6中可以看出,按重要性删除节点网络效率明显下降,说明主题地图中的重要文档有效。
所述步骤S3具体是:
S3、对主题地图主题层(Topic Level)中主题之间的相关性进行专家验证。
由于主题间是否存在关系具有一定的客观因素,所以步骤S3采用人工的方式验证,但是由于主题数量相对文档数量来说,数量是很少的,所以步骤S3只需耗费少量人力。从总体上来看,本发明主题地图的评估方法无需对文档间的关系进行人工验证,节省了大量人力。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (7)

1.一种主题地图的评估方法,其特征在于,包括以下步骤:
通过主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性,从而验证主题地图文档分类的有效性;
通过主题地图的准确率、召回率和F值来验证文档分类的准确性,所述F值的表达式为:
Figure FDA0002958613700000011
其中,所述P表示准确率,R表示召回率;
验证主题地图的无标度特性,从而验证重要文档的存在性;
用网络效率对主题地图的重要文档进行有效性验证,所述网络效率的表达式为:
Figure FDA0002958613700000012
其中,E表示主题地图的网络效率,N表示主题地图中节点的总数,dij表示主题地图中节点i和节点j之间的最短路径;
对主题地图中主题之间的相关性进行专家验证。
2.根据权利要求1所述的一种主题地图的评估方法,其特征在于:所述通过主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性,从而验证主题地图文档分类的有效性,这一步骤包括:
计算主题地图的平均聚集系数;所述平均聚集系数的表达式为:
Figure FDA0002958613700000013
其中,n表示主题地图中节点的个数,C表示主题地图的平均聚集系数,Ci表示主题地图中节点i的局部聚集系数,Ci的表达式为:
Figure FDA0002958613700000014
其中,ei表示主题地图中节点i的相邻节点之间的连接数量,ki表示主题地图中节点i的度;
计算主题地图的平均最短路径;所述平均最短路径的表达式为:
Figure FDA0002958613700000015
其中,l-1表示主题地图的平均最短路径,dij表示在主题地图中从节点i到节点j的最短距离;
根据主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性:若主题地图的平均聚集系数大于平均聚集系数的设定阈值,且主题地图的平均最短路径小于等于平均最短路径的设定阈值,则判定主题地图符合小世界特性;反之,判定主题地图不符合小世界特性。
3.根据权利要求2所述的一种主题地图的评估方法,其特征在于:所述准确率的表达式为:
Figure FDA0002958613700000021
其中,P表示准确率,TP表示把实际的正类预测为正类的样本个数,FP表示把实际的负类预测为正类的样本个数;
所述召回率的表达式为:
Figure FDA0002958613700000022
其中,R表示召回率,FN表示把实际的正类预测为负类的样本个数。
4.根据权利要求1所述的一种主题地图的评估方法,其特征在于:所述验证主题地图的无标度特性,从而验证重要文档的存在性的步骤具体为:根据主题地图中度的节点个数分布是否符合幂函数P(k)=α*k来验证主题地图是否具有无标度特性,从而验证重要文档的存在性;
其中,k表示主题地图中节点的度,P(k)表示主题地图中度为k的节点的个数,α和β为常数。
5.根据权利要求4所述的一种主题地图的评估方法,其特征在于:所述用网络效率对主题地图的重要文档进行有效性验证的步骤包括:通过对比主题地图的重要文档删除前后的网络效率来判断该重要文档的有效性。
6.一种主题地图的评估系统,其特征在于:包括:
文档分类验证模块,用于通过主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性,从而验证主题地图文档分类的有效性;通过主题地图的准确率、召回率和F值来验证文档分类的准确性,所述F值的表达式为:
Figure FDA0002958613700000023
其中,所述P表示准确率,R表示召回率;
重要文档验证模块,用于验证主题地图的无标度特性,从而验证重要文档的存在性;以及用网络效率对主题地图的重要文档进行有效性验证,所述网络效率的表达式为:
Figure FDA0002958613700000031
其中,E表示主题地图的网络效率,N表示主题地图中节点的总数,dij表示主题地图中节点i和节点j之间的最短路径;
相关性验证模块,用于对主题地图中主题之间的相关性进行专家验证。
7.一种主题地图的评估装置,其特征在于:包括:
存储器,用于存放程序;
处理器,用于执行所述程序,以用于:
通过主题地图的平均聚集系数和平均最短路径判断主题地图是否符合小世界特性,从而验证主题地图文档分类的有效性;
通过主题地图的准确率、召回率和F值来验证文档分类的准确性,所述F值的表达式为:
Figure FDA0002958613700000032
其中,所述P表示准确率,R表示召回率;
验证主题地图的无标度特性,从而验证重要文档的存在性;
用网络效率对主题地图的重要文档进行有效性验证,所述网络效率的表达式为:
Figure FDA0002958613700000033
其中,E表示主题地图的网络效率,N表示主题地图中节点的总数,dij表示主题地图中节点i和节点j之间的最短路径;
对主题地图中主题之间的相关性进行专家验证。
CN201710792596.7A 2017-09-05 2017-09-05 一种主题地图的评估方法、系统和装置 Active CN107656975B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710792596.7A CN107656975B (zh) 2017-09-05 2017-09-05 一种主题地图的评估方法、系统和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710792596.7A CN107656975B (zh) 2017-09-05 2017-09-05 一种主题地图的评估方法、系统和装置

Publications (2)

Publication Number Publication Date
CN107656975A CN107656975A (zh) 2018-02-02
CN107656975B true CN107656975B (zh) 2021-05-11

Family

ID=61128137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710792596.7A Active CN107656975B (zh) 2017-09-05 2017-09-05 一种主题地图的评估方法、系统和装置

Country Status (1)

Country Link
CN (1) CN107656975B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207913A (zh) * 2013-04-15 2013-07-17 武汉理工大学 商品细粒度语义关系的获取方法和系统
CN105740381A (zh) * 2016-01-27 2016-07-06 北京工业大学 一种基于复杂网络特性及神经网络聚类挖掘用户兴趣的方法
CN105760589A (zh) * 2016-02-03 2016-07-13 北京交通大学 一种基于高速列车系统作用关系网络的可靠性分析方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130318075A1 (en) * 2012-05-25 2013-11-28 International Business Machines Corporation Dictionary refinement for information extraction

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207913A (zh) * 2013-04-15 2013-07-17 武汉理工大学 商品细粒度语义关系的获取方法和系统
CN105740381A (zh) * 2016-01-27 2016-07-06 北京工业大学 一种基于复杂网络特性及神经网络聚类挖掘用户兴趣的方法
CN105760589A (zh) * 2016-02-03 2016-07-13 北京交通大学 一种基于高速列车系统作用关系网络的可靠性分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于复杂网络的数字信息资源配置研究;陈明红;《图书情报工作》;20100531;第54卷(第10期);49-53 *
陈明红.基于复杂网络的数字信息资源配置研究.《图书情报工作》.2010,第54卷(第10期),第49-53页. *

Also Published As

Publication number Publication date
CN107656975A (zh) 2018-02-02

Similar Documents

Publication Publication Date Title
CN104185840A (zh) 持续部署流水线测试的优先化
US8103599B2 (en) Calculating web page importance based on web behavior model
CN110689368B (zh) 一种移动应用内广告点击率预测系统设计方法
KR101850993B1 (ko) 클러스터 기반 키워드 산출 방법 및 장치
CN110706015B (zh) 一种面向广告点击率预测的特征选取方法
US10628433B2 (en) Low memory sampling-based estimation of distinct elements and deduplication
CN105099729A (zh) 一种识别用户身份标识的方法和装置
JP2023534696A (ja) ネットワークトポロジーにおけるアノマリー検知
CN104834736A (zh) 构建索引库的方法、装置及检索的方法、装置和系统
CN106326082A (zh) 网络系统中记录日志的方法和装置
WO2015165230A1 (zh) 一种社交消息的监测方法及装置
CN106445788A (zh) 一种信息系统运行状态预测方法和装置
CN107656975B (zh) 一种主题地图的评估方法、系统和装置
CN108415971B (zh) 采用知识图谱推荐供求信息的方法和装置
CN113656354A (zh) 日志分类方法、系统、计算机设备和可读存储介质
CN110019193B (zh) 相似帐号识别方法、装置、设备、系统及可读介质
CN107133321B (zh) 页面的搜索特性的分析方法和分析装置
WO2013191807A1 (en) Efficient evaluation of network robustness with a graph
CN107870913B (zh) 有效时间的高期望权重项集挖掘方法、装置及处理设备
CN110851709B (zh) 资讯推送方法、装置、计算机设备和存储介质
CN111625720A (zh) 数据决策项目执行策略的确定方法、装置、设备和介质
US11783088B2 (en) Processing electronic documents
CN115879819A (zh) 企业信用评估方法及装置
CN116340883A (zh) 配电网数据资源融合方法、装置、设备及存储介质
CN117540729A (zh) 地址检测方法、装置、计算机设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant