CN106354728A - 利用语义图生成对象之间的关联强度的方法和设备 - Google Patents

利用语义图生成对象之间的关联强度的方法和设备 Download PDF

Info

Publication number
CN106354728A
CN106354728A CN201510419244.8A CN201510419244A CN106354728A CN 106354728 A CN106354728 A CN 106354728A CN 201510419244 A CN201510419244 A CN 201510419244A CN 106354728 A CN106354728 A CN 106354728A
Authority
CN
China
Prior art keywords
node
semantic
association
path
strength
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510419244.8A
Other languages
English (en)
Inventor
缪庆亮
孟遥
方瑞玉
房璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN201510419244.8A priority Critical patent/CN106354728A/zh
Publication of CN106354728A publication Critical patent/CN106354728A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种利用语义图生成对象之间的关联强度的方法和设备。该方法包括:按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。

Description

利用语义图生成对象之间的关联强度的方法和设备
技术领域
本发明一般地涉及信息处理领域。具体而言,本发明涉及一种能够利用语义图生成对象之间的关联强度的方法和设备。
背景技术
近年来,随着信息技术的发展,各行各业都进行着信息化的变革。信息化促进了各行业的发展,便利了人们的生活。信息的基础是数据,如何利用数据是关键。现实世界中的对象之间存在关联,抽象的数据之间也存在关联。基于关联数据可以针对现实世界中的对象进行各种处理,例如推荐。
本发明着眼于如何利用语义图来挖掘对象之间的关联关系,分析对象之间的关联强度,进而可以进行对象之间的推荐。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本发明的目的是提出了一种能够生成对象之间的关联强度的方法和设备。
为了实现上述目的,根据本发明的一个方面,提供了一种利用语义图生成对象之间的关联强度的方法,该方法包括:按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。
根据本发明的另一个方面,提供了一种利用语义图生成对象之间的关联强度的设备,该设备包括:语义图构建装置,被配置为:按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;语义路径搜索装置,被配置为:在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;语义路径关联强度计算装置,被配置为:根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及节点间关联强度计算装置,被配置为:根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。
另外,根据本发明的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本发明的上述方法。
此外,根据本发明的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本发明的上述方法。
附图说明
参照下面结合附图对本发明的实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。附图中:
图1示出了根据本发明的实施例的利用语义图生成对象之间的关联强度的方法的流程图;
图2示出了表1对应的语义图的示例;
图3示出了根据本发明的实施例的利用语义图生成对象之间的关联强度的设备的结构方框图;以及
图4示出了可用于实施根据本发明的实施例的方法和设备的计算机的示意性框图。
具体实施方式
在下文中将结合附图对本发明的示范性实施例进行详细描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施方式的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其他细节。另外,还需要指出的是,在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。
为了便于理解,下文中将以向研究者推荐学术事件为例进行描述,学术事件例如是学术会议、学术期刊、研讨会等。然而,应理解的是也可以向学术事件推荐研究者,因此,无论是研究者还是学术事件都是本文中的概念“对象”的下位概念,并且推荐的基础是对象之间,即研究者和学术事件之间的关联强度。其它的例子包括向学术会议推荐会议地点等。可见,根据本发明的方法和设备能够深入挖掘对象(如研究者和学术事件)之间的关系(关联)并加以量化(关联强度),并可基于关联强度进行推荐。
下面将参照图1描述根据本发明的实施例的利用语义图生成对象之间的关联强度的方法的流程。
图1示出了根据本发明的实施例的利用语义图生成对象之间的关联强度的方法的流程图。如图1所示,根据本发明的实施例的关联强度生成方法包括如下步骤:按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱(步骤S1);在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径(步骤S2);根据每个语义路径包括的边的权重,计算每个语义路径的关联强度(步骤S3);以及根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度(步骤S4)。
在步骤S1中,按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱。
具体地说,根据本发明,已经预先确定了针对对象的语义图结构。例如,针对研究者和学术事件的语义图结构中包括如下节点:研究者节点、学术事件节点(也可以细分为学术会议节点、学术期刊节点、研讨会节点)、研究领域关键词节点、学术事件发生地点节点、学术事件发生时间节点等。其中,在生成研究者和学术事件之间的关联强度的应用中,研究者节点、学术事件节点是对象节点,语义图结构中的其它节点,如研究领域关键词节点、学术事件发生地点节点、学术事件发生时间节点等,是与对象相关联的关联数据节点。在生成学术会议与学术事件发生地点之间的关联强度的应用中,学术会议节点、学术事件发生地点节点是对象节点,语义图结构中的其它节点是与对象相关联的关联数据节点。可见,上述语义图结构同时也是针对学术会议与学术事件发生地点的语义图结构。本领域技术人员能够理解,可以根据语义关系、逻辑关系等预先确定针对各种对象的各种语义图结构。另外,与对象相关联的数据集必须包括对象的数据,但不必须包括针对对象的语义图结构中所预定义的所有节点的数据。
语义图结构中的两节点之间的边表明两节点之间存在语义关系。例如,研究者U的论文发表在学术事件E上,那么节点U和E之间存在一条边,研究者U使用过关键词K,那么节点U和K之间存在一条边,学术事件E包括一个研究领域D,那么节点U和D之间存在一条边。
表1列出了针对研究者和学术事件的语义图结构可能包含的节点间关系。事实上,这些关系也可能出现在针对观众和电影/读者和图书的语义图结构中,或者需要重新定义。因此,此处的研究者和学术事件的相关关系仅为示例。
关系ID 关系名 说明
1 <U publishIn E> 研究者U在学术事件E中发表过论文
2 <U participated E> 研究者U参加过学术事件E
3 <U used K> 研究者U使用过关键词K
4 <U majorIn D> 研究者U的研究领域为D
5 <U1 coauthor U2> 研究者U1和U2有合作关系
6 <E includes D> 学术事件E包括研究领域D
7 <E location L> 学术事件发生地点在L
8 <E date T> 学术事件发生时间是T
9 <E1sameDomain E2> 学术事件E1和E2的领域相关或相同
10 <D includes K> 领域D包括关键词K
11 <K1 synonyms K2> 关键词K1和关键词K2是同义词
12 <K1 hyponymy K2> 关键词K1是关键词K2的上位词
表1.研究者和学术事件的相关关系列表
在表1中,U:研究者;E:学术事件;D:研究领域;K:关键字;L:学术事件发生地点;T:学术事件发生时间。
图2示出了表1对应的语义图的示例,其中未示出边的权重。
边的权重表明语义关系的强弱。例如,研究者U参加一次学术事件E和参加多次学术事件E的情况下,研究者U与学术事件E的节点间边的权重应该不同。
例如,表1中的关系1对应的权重可以通过研究者U在学术事件E中发表的论文数确定,关系5对应的权重可以通过研究者U1和U2的共同署名次数确定。关系1-6的权重可以是实数,关系7-12的权重可以是布尔值0或1。为便于计算,权重应归一化到(0,1]区间。上述提及的论文数、共同署名次数是与对象相关联的数据集中包括的数据的示例。
应注意,语义图的结构,包括节点和节点间的关系的定义、权重的确定方法都是事先确定的。但是一个语义图的构建是基于语义图的结构,从与对象相关联的数据集构建得到的。针对相同对象的语义图结构,在从不同数据集中构建语义图时,语义图可能相同也可能不同。
假定利用语义图要生成其间关联强度的对象是第一对象和第二对象。在步骤S1中构建了第一对象(如研究者)和第二对象(如学术事件)的语义图之后,在步骤S2中,在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径。
这里的搜索为穷尽性搜索,即搜索语义图中所有满足条件的语义路径。
条件包括:语义路径的两端点为第一对象节点和第二对象节点;语义路径不包括循环。在优选的实施例中,条件还包括:语义路径包含的节点个数小于特定阈值。语义路径包含的节点个数小于特定阈值目的是排除过长的语义路径,因为过长的语义路径的价值较低,计算量较大。
例如,针对图2所示的语义图,能够找到的U2和E1的语义路径如表2中所示。
表2
在步骤S3中,根据每个语义路径包括的边的权重,计算每个语义路径的关联强度。
也就是说,基于从与对象相关联的数据集得到的边的权重,从语义路径本身得到单个语义路径的关联强度信息。单个语义路径的关联强度信息源自与对象相关联的数据集,仅与此相关。
举例来说,计算每个语义路径包括的所有边的权重的乘积,作为该语义路径的关联强度。
由于步骤S2中得到的第一对象节点与第二对象节点之间满足条件的语义路径可能不止一条,所以在步骤S3中,计算每条语义路径的关联强度。
获得多条语义路径的关联强度之后,存在如何对多条语义路径的信息进行整合的问题。
发明人意识到:可以利用语义路径本身的结构特征来衡量语义路径的可靠性、重要性,进而用于整合各个语义路径的关联强度。
在步骤S4中,根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。
具体的计算方式可以是基于每个语义路径的权重,对所有语义路径的关联强度进行加权求和,也可以是基于每个语义路径的权重,对所有语义路径的关联强度进行加权求平均。优选加权求平均的方法,因为加权求和容易使得第一对象节点和第二对象节点之间的语义路径个数更多的第二对象节点获得更高的节点间的关联强度。
根据语义路径的结构不同,语义路径可以属于不同的语义路径类。每个语义路径类具有预定的权重。这样,语义路径的权重取决于语义路径所属于的语义路径类,等于语义路径所属于的语义路径类的权重。
语义路径的结构依语义路径包含的节点个数、节点种类、节点顺序而不同。相应地,语义路径类根据该类语义路径包含的节点个数、节点种类、节点顺序而划分。属于同一语义路径类的语义路径具有相同的权重,即该语义路径类的权重。语义路径的最短长度为1,即第一对象节点和第二对象节点直接相连的情况。
因此,可以认为语义路径类的权重根据该类语义路径包含的节点个数、节点种类、节点顺序的至少之一确定。
语义路径类的权重的具体取值可以通过本领域技术人员人为指定,也可以通过训练的方法获得。
一般来说,语义路径包含的节点个数越少,权重越大;语义路径包含的节点种类越少,权重越大。
通过训练数据得到语义路径类的权重时,在一个实施例中,训练数据包括:第一对象节点和第二对象节点之间的关联强度、第一对象节点和第二对象节点之间的多个语义路径的关联强度。在另一个实施例中,训练数据包括:针对同一第一对象节点的多个第二对象节点的排序、与第一对象和多个第二对象相关联的数据集。
下面的表3示例了语义路径类的划分,其中假设允许的最长语义路径的长度为5。
表3
经过步骤S1-S4,即可得到第一对象节点和第二对象节点之间的关联强度。这样的关联强度反映了第一对象节点和第二对象节点之间的语义关系的强弱。
因此,可以针对同一第一对象节点,根据该第一对象节点与多个第二对象节点之间的关联强度,对所述多个第二对象节点进行排序。
例如,关联强度越强,相应的第二对象节点排名越靠前。
将排序的结果提供给用户,即可为用户针对第一对象,推荐第二对象。
下面,将参照图3描述根据本发明的实施例的利用语义图生成对象之间的关联强度的设备。
图3示出了根据本发明的实施例的利用语义图生成对象之间的关联强度的设备的结构方框图。如图3所示,根据本发明的关联强度生成设备300包括:语义图构建装置31,被配置为:按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;语义路径搜索装置32,被配置为:在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;语义路径关联强度计算装置33,被配置为:根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及节点间关联强度计算装置34,被配置为:根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。
在一个实施例中,所述条件包括:语义路径的两端点为第一对象节点和第二对象节点;语义路径不包括循环。
在一个实施例中,语义路径包含的节点个数小于特定阈值。
在一个实施例中,所述语义路径关联强度计算装置33被进一步配置为:计算每个语义路径包括的所有边的权重的乘积,作为该语义路径的关联强度。
在一个实施例中,所述语义路径的权重取决于语义路径所属于的语义路径类,每个语义路径类具有预定的权重。
在一个实施例中,所述语义路径类的权重根据该类语义路径包含的节点个数、节点种类、节点顺序的至少之一确定。
在一个实施例中,所述语义路径类的权重通过训练数据确定,所述训练数据包括:第一对象节点和第二对象节点之间的关联强度、第一对象节点和第二对象节点之间的多个语义路径的关联强度。
在一个实施例中,所述语义路径类的权重通过训练数据确定,所述训练数据包括:针对同一第一对象节点的多个第二对象节点的排序、与第一对象和多个第二对象相关联的数据集。
在一个实施例中,关联强度生成设备300还包括:排序装置,被配置为:针对同一第一对象节点,根据该第一对象节点与多个第二对象节点之间的关联强度,对所述多个第二对象节点进行排序。
由于在根据本发明的关联强度生成设备300中所包括的各个装置和单元中的处理分别与上面描述的关联强度生成方法中所包括的各个步骤中的处理类似,因此为了简洁起见,在此省略这些装置和单元的详细描述。
此外,这里尚需指出的是,上述设备中各个组成装置、单元可以通过软件、固件、硬件或其组合的方式进行配置。配置可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。在通过软件或固件实现的情况下,从存储介质或网络向具有专用硬件结构的计算机(例如图4所示的通用计算机400)安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
图4示出了可用于实施根据本发明的实施例的方法和设备的计算机的示意性框图。
在图4中,中央处理单元(CPU)401根据只读存储器(ROM)402中存储的程序或从存储部分408加载到随机存取存储器(RAM)403的程序执行各种处理。在RAM 403中,还根据需要存储当CPU 401执行各种处理等等时所需的数据。CPU 401、ROM 402和RAM 403经由总线404彼此连接。输入/输出接口405也连接到总线404。
下述部件连接到输入/输出接口405:输入部分406(包括键盘、鼠标等等)、输出部分407(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分408(包括硬盘等)、通信部分409(包括网络接口卡比如LAN卡、调制解调器等)。通信部分409经由网络比如因特网执行通信处理。根据需要,驱动器410也可连接到输入/输出接口405。可拆卸介质411比如磁盘、光盘、磁光盘、半导体存储器等等可以根据需要被安装在驱动器410上,使得从中读出的计算机程序根据需要被安装到存储部分408中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质411安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图4所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质411。可拆卸介质411的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 402、存储部分408中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明还提出一种存储有机器可读取的指令代码的程序产品。所述指令代码由机器读取并执行时,可执行上述根据本发明的实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。
在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露,但是,应该理解,上述的所有实施例和示例均是示例性的,而非限制性的。本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本发明的保护范围内。
附记
1.一种利用语义图生成对象之间的关联强度的方法,包括:
按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;
在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;
根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及
根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。
2.如附记1所述的方法,其中,所述条件包括:语义路径的两端点为第一对象节点和第二对象节点;语义路径不包括循环。
3.如附记2所述的方法,其中,所述条件还包括:语义路径包含的节点个数小于特定阈值。
4.如附记1所述的方法,其中,所述根据每个语义路径包括的边的权重,计算每个语义路径的关联强度包括:计算每个语义路径包括的所有边的权重的乘积,作为该语义路径的关联强度。
5.如附记1所述的方法,其中,所述语义路径的权重取决于语义路径所属于的语义路径类,每个语义路径类具有预定的权重。
6.如附记5所述的方法,其中,所述语义路径类的权重根据该类语义路径包含的节点个数、节点种类、节点顺序的至少之一确定。
7.如附记5所述的方法,其中,所述语义路径类的权重通过训练数据确定,所述训练数据包括:第一对象节点和第二对象节点之间的关联强度、第一对象节点和第二对象节点之间的多个语义路径的关联强度。
8.如附记5所述的方法,其中,所述语义路径类的权重通过训练数据确定,所述训练数据包括:针对同一第一对象节点的多个第二对象节点的排序、与第一对象和多个第二对象相关联的数据集。
9.如附记1所述的方法,还包括:针对同一第一对象节点,根据该第一对象节点与多个第二对象节点之间的关联强度,对所述多个第二对象节点进行排序。
10.一种利用语义图生成对象之间的关联强度的设备,包括:
语义图构建装置,被配置为:按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;
语义路径搜索装置,被配置为:在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;
语义路径关联强度计算装置,被配置为:根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及
节点间关联强度计算装置,被配置为:根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。
11.如附记10所述的设备,其中,所述条件包括:语义路径的两端点为第一对象节点和第二对象节点;语义路径不包括循环。
12.如附记11所述的方法,其中,所述条件还包括:语义路径包含的节点个数小于特定阈值。
13.如附记10所述的设备,其中,所述语义路径关联强度计算装置被进一步配置为:计算每个语义路径包括的所有边的权重的乘积,作为该语义路径的关联强度。
14.如附记10所述的设备,其中,所述语义路径的权重取决于语义路径所属于的语义路径类,每个语义路径类具有预定的权重。
15.如附记14所述的设备,其中,所述语义路径类的权重根据该类语义路径包含的节点个数、节点种类、节点顺序的至少之一确定。
16.如附记14所述的设备,其中,所述语义路径类的权重通过训练数据确定,所述训练数据包括:第一对象节点和第二对象节点之间的关联强度、第一对象节点和第二对象节点之间的多个语义路径的关联强度。
17.如附记14所述的设备,其中,所述语义路径类的权重通过训练数据确定,所述训练数据包括:针对同一第一对象节点的多个第二对象节点的排序、与第一对象和多个第二对象相关联的数据集。
18.如附记10所述的设备,还包括:排序装置,被配置为:针对同一第一对象节点,根据该第一对象节点与多个第二对象节点之间的关联强度,对所述多个第二对象节点进行排序。

Claims (10)

1.一种利用语义图生成对象之间的关联强度的方法,包括:
按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;
在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;
根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及
根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。
2.如权利要求1所述的方法,其中,所述条件包括:语义路径的两端点为第一对象节点和第二对象节点;语义路径不包括循环。
3.如权利要求2所述的方法,其中,所述条件还包括:语义路径包含的节点个数小于特定阈值。
4.如权利要求1所述的方法,其中,所述根据每个语义路径包括的边的权重,计算每个语义路径的关联强度包括:计算每个语义路径包括的所有边的权重的乘积,作为该语义路径的关联强度。
5.如权利要求1所述的方法,其中,所述语义路径的权重取决于语义路径所属于的语义路径类,每个语义路径类具有预定的权重。
6.如权利要求5所述的方法,其中,所述语义路径类的权重根据该类语义路径包含的节点个数、节点种类、节点顺序的至少之一确定。
7.如权利要求5所述的方法,其中,所述语义路径类的权重通过训练数据确定,所述训练数据包括:第一对象节点和第二对象节点之间的关联强度、第一对象节点和第二对象节点之间的多个语义路径的关联强度。
8.如权利要求5所述的方法,其中,所述语义路径类的权重通过训练数据确定,所述训练数据包括:针对同一第一对象节点的多个第二对象节点的排序、与第一对象和多个第二对象相关联的数据集。
9.如权利要求1所述的方法,还包括:针对同一第一对象节点,根据该第一对象节点与多个第二对象节点之间的关联强度,对所述多个第二对象节点进行排序。
10.一种利用语义图生成对象之间的关联强度的设备,包括:
语义图构建装置,被配置为:按照预先确定的针对对象的语义图结构,从与对象相关联的数据集构建语义图,其中,语义图的节点包括对象节点和与对象相关联的关联数据节点,两节点之间的边表明两节点之间存在语义关系,边的权重表明语义关系的强弱;
语义路径搜索装置,被配置为:在语义图中搜索第一对象节点与第二对象节点之间满足条件的语义路径;
语义路径关联强度计算装置,被配置为:根据每个语义路径包括的边的权重,计算每个语义路径的关联强度;以及
节点间关联强度计算装置,被配置为:根据每个语义路径的关联强度和每个语义路径的权重,计算第一对象节点和第二对象节点之间的关联强度。
CN201510419244.8A 2015-07-16 2015-07-16 利用语义图生成对象之间的关联强度的方法和设备 Pending CN106354728A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510419244.8A CN106354728A (zh) 2015-07-16 2015-07-16 利用语义图生成对象之间的关联强度的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510419244.8A CN106354728A (zh) 2015-07-16 2015-07-16 利用语义图生成对象之间的关联强度的方法和设备

Publications (1)

Publication Number Publication Date
CN106354728A true CN106354728A (zh) 2017-01-25

Family

ID=57843203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510419244.8A Pending CN106354728A (zh) 2015-07-16 2015-07-16 利用语义图生成对象之间的关联强度的方法和设备

Country Status (1)

Country Link
CN (1) CN106354728A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516254A (zh) * 2019-08-30 2019-11-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN111274495A (zh) * 2020-01-20 2020-06-12 平安科技(深圳)有限公司 用户关系强度的数据处理方法、装置、计算机设备及存储介质
WO2021190091A1 (zh) * 2020-03-26 2021-09-30 深圳壹账通智能科技有限公司 基于知识节点所属度的知识图谱构建方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630314A (zh) * 2008-07-16 2010-01-20 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN102160079A (zh) * 2008-09-19 2011-08-17 摩托罗拉移动公司 用于内容项目的关联内容的选择
US20110202526A1 (en) * 2010-02-12 2011-08-18 Korea Advanced Institute Of Science And Technology Semantic search system using semantic ranking scheme
CN102508828A (zh) * 2011-09-16 2012-06-20 浙江大学 一种基于多代理路由的图路径关系发现方法
CN103646099A (zh) * 2013-12-19 2014-03-19 南京大学 一种基于多层图的论文推荐方法
CN104166670A (zh) * 2014-06-17 2014-11-26 青岛农业大学 一种基于语义网的信息查询方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630314A (zh) * 2008-07-16 2010-01-20 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN102160079A (zh) * 2008-09-19 2011-08-17 摩托罗拉移动公司 用于内容项目的关联内容的选择
US20110202526A1 (en) * 2010-02-12 2011-08-18 Korea Advanced Institute Of Science And Technology Semantic search system using semantic ranking scheme
CN102508828A (zh) * 2011-09-16 2012-06-20 浙江大学 一种基于多代理路由的图路径关系发现方法
CN103646099A (zh) * 2013-12-19 2014-03-19 南京大学 一种基于多层图的论文推荐方法
CN104166670A (zh) * 2014-06-17 2014-11-26 青岛农业大学 一种基于语义网的信息查询方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516254A (zh) * 2019-08-30 2019-11-29 联想(北京)有限公司 一种信息处理方法及电子设备
CN110516254B (zh) * 2019-08-30 2021-07-16 联想(北京)有限公司 一种信息处理方法及电子设备
CN111274495A (zh) * 2020-01-20 2020-06-12 平安科技(深圳)有限公司 用户关系强度的数据处理方法、装置、计算机设备及存储介质
CN111274495B (zh) * 2020-01-20 2023-08-25 平安科技(深圳)有限公司 用户关系强度的数据处理方法、装置、计算机设备及存储介质
WO2021190091A1 (zh) * 2020-03-26 2021-09-30 深圳壹账通智能科技有限公司 基于知识节点所属度的知识图谱构建方法和装置

Similar Documents

Publication Publication Date Title
Gates et al. A Monte Carlo evaluation of weighted community detection algorithms
Tisdell et al. Basic qualitative and quantitative results for solutions to nonlinear, dynamic equations on time scales with an application to economic modelling
Klarner et al. PyBoolNet: a python package for the generation, analysis and visualization of boolean networks
Huntley et al. A method for increasing expressivity of Gene Ontology annotations using a compositional approach
Ding et al. Complex network theory applied to the growth of Kuala Lumpur’s public urban rail transit network
US20110161055A1 (en) Space solution search
Jackson et al. Theory of minimum spanning trees. I. Mean-field theory and strongly disordered spin-glass model
Xia et al. Effectively identifying the influential spreaders in large-scale social networks
Wu An algorithm for constructing parsimonious hybridization networks with multiple phylogenetic trees
CN106354728A (zh) 利用语义图生成对象之间的关联强度的方法和设备
Xu TRAVELING WAVES FOR A DIFFUSIVE SEIR EPIDEMIC MODEL.
CN111680498B (zh) 实体消歧方法、装置、存储介质及计算机设备
CN106445685A (zh) 一种高效的分布式大规模动态图k核维护方法
Utama et al. Multi-Aspect Sentiment Analysis Hotel Review Using RF, SVM, and Naïve Bayes based Hybrid Classifier
Menezes et al. Complex Networks
CN113742604A (zh) 一种谣言检测方法、装置、电子设备和存储介质
CN104572613A (zh) 数据处理装置、数据处理方法和程序
Song et al. Accurate and fast path computation on large urban road networks: A general approach
Bradford et al. Short laws for finite groups and residual finiteness growth
Bowman et al. Collecting entailment data for pretraining: New protocols and negative results
Rivera et al. Handling of synergy into an algorithm for project portfolio selection
Liu et al. An algorithm for the mixed transportation network design problem
Yudantara et al. Determinants of Implementation SIAPIK for Small Medium Enterprise
Costa A polynomial expression for the Owen value in the maintenance cost game
CN109472023A (zh) 一种基于实体及文本联合嵌入的实体关联度衡量方法、系统及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170125

WD01 Invention patent application deemed withdrawn after publication