CN111386520A

CN111386520A - 通过在基本知识图上叠加来构造不连贯节点

Info

Publication number: CN111386520A
Application number: CN201880076481.0A
Authority: CN
Inventors: T·U·沙伊德勒; S·勒维扎; A·乔万尼尼; A·哈克斯哈杰; S·斯特雷特; F·格拉夫
Original assignee: International Business Machines Corp
Current assignee: Qindarui Co.
Priority date: 2017-11-27
Filing date: 2018-11-23
Publication date: 2020-07-07
Also published as: WO2019102411A1; US10740398B2; GB2581761A; US20190163835A1; JP2021504818A; GB202009501D0; DE112018005244T5

Abstract

一种用于构建知识图的计算机程序产品、系统和方法可以包括：接收多个新节点；接收具有通过现有边选择性地连接的现有节点的基本知识图；以及将新节点叠加到基本知识图的现有节点中的所选节点上。该方法还可以包括：如果下面的基本知识图中的对应现有节点具有经由零或预定最大数目的现有边的连接，则通过在新节点中的至少两个新节点之间创建具有新权重的新边来连接新节点，其中基于对应现有节点之间的连接的现有边的现有权重来确定新权重；以及从基本知识图分离具有新边的新节点。

Description

通过在基本知识图上叠加来构造不连贯节点

技术领域

本发明总体上涉及用于构建知识图的系统、计算机程序产品和方法，并且更具体地，涉及从非结构化信息实体自动构建知识图。

背景技术

信息的管理代表知识社会/知识产业中的关键活动。信息可以是结构化的或所谓的非结构化信息，并且可以在电子存储系统中管理，由相应的交易或协作系统可访问，或者信息可以以非电子形式新生成，例如手写或口头。

非结构化信息实体可以在不同的各种上下文中生成；例如在参与者使用设想在头脑中的头脑风暴和围绕所有不同方面写便笺的工作室中，特别是在设计思维工作室中。非结构化实体的另一个来源可以是灵活的项目管理方法，特别是使用SCRUM方法的软件项目，该SCRUM方法具有称为迭代(sprint)的四周周期以及每日15分钟的站立会议和迭代回顾会议，其中所有参与者可以写参与者对于“什么顺利”、“什么已经改进”和任何其它动作项的想法的便笺。非结构化实体的其他来源可以是社交媒体工具、博客、来自电话会议和相关消息交换的笔记等。

然而，在没有组织框架的情况下，这些便签和其他手写消息是单个不相关的信息实体，其在输入的预处理(即，针对上述示例中的第一个示例的便签、扫描和文本识别，针对最后一个示例的文本识别)之后不改变。然而，用户被留下了一组不相关的信息，每个信息包含内容(例如参与者的文本贡献)和元数据(例如参与者、时间戳)。

共同问题是以这样的方式组织和呈现信息实体，即，可以自动生成摘要和/或可以得出结论，这对于团队将是极其有帮助的，使得整个团队可以更好地理解主题并关注有形结果。

现在，采用了手动方法，这具有自然的缺点。首先，将所有信息实体分组是乏味且耗时的，特别是昂贵的。其次，用于分组的类别的选择可以取决于(多个)人员的个人视图，并且因此在某种程度上是任意的。一旦已经为实体的子集选择了类别，当对于另一子集的实体，类别是不匹配的时，可能不愿意全部重新开始。

当前的方法或多或少是“独立的”，这意味着为了使不协调的信息实体相关，可能不使用一般知识。因此，可能需要一种克服这种限制的方法和系统，特别是以更容易理解的方式将不相关的信息(即，“便签”)进行相关。

因此，在本领域中需要解决上述问题。

发明内容

从第一方面来看，本发明提供了一种用于构建知识图的计算机实现的方法，该方法包括：首先由计算系统的处理器接收多个新节点；其次由处理器接收包括通过现有边选择性地连接的现有节点的基本知识图，现有边的每条边具有现有权重；由处理器将多个新节点叠加到基本知识图的现有节点的所选择的节点上，构建新节点和对应现有节点的对；如果下面的基本知识图中的对应现有节点具有经由零或预定最大数目的现有边的连接，则由处理器通过在多个新节点中的至少两个节点之间创建具有新权重的新边来连接多个新节点，其中新权重基于对应现有节点之间的连接的现有边的现有权重来确定；以及由处理器从基本知识图分离具有新边的多个新节点作为结果知识图。

从第一方面来看，本发明提供了一种系统，该系统包括处理器；耦合到处理器的存储器设备；以及耦合到处理器的计算机可读存储设备，其中存储设备包含由处理器经由存储器设备可执行以实现用于构建知识图的方法的程序代码，该方法包括：首先由计算系统的处理器接收多个新节点；其次由处理器接收包括通过现有边选择性地连接的现有节点的基本知识图，现有边的每条边具有现有权重；由处理器将多个新节点叠加到基本知识图的现有节点的所选择的节点上，构建新节点和对应现有节点的对；如果下面的基本知识图中的对应现有节点具有经由零或预定最大数目的现有边的连接，则由处理器通过在多个新节点中的至少两个节点之间创建具有新权重的新边来连接多个新节点，其中新权重基于对应现有节点之间的连接的现有边的现有权重来确定；以及由处理器从基本知识图分离具有新边的多个新节点作为结果知识图。

从另一方面来看，本发明提供了一种用于构建知识图的计算机程序产品，计算机程序产品包括计算机可读存储介质，计算机可读存储介质由处理电路可读取并且存储由处理电路执行以便执行用于执行本发明的步骤的方法的指令。

从另一方面来看，本发明提供了一种存储在计算机可读介质上并且可加载到数字计算机的内部存储器中的计算机程序，包括软件代码部分，当程序在计算机上运行时，用于执行本发明的步骤。

提供了一种用于构建知识图的方法、系统、计算机程序产品和计算机程序。计算系统的处理器接收多个新节点和包括通过现有边选择性地连接的现有节点的基本知识图，现有边的每条边具有现有权重。多个新节点被叠加到基本知识图的现有节点的所选择的节点上，构建新节点和对应现有节点的对。如果下面的基本知识图中的对应现有节点具有经由零或预定最大数目的现有边的连接，则通过在多个新节点中的至少两个节点之间创建具有新权重的新边来连接多个新节点，其中新权重基于对应现有节点之间的连接的现有边的现有权重来确定。利用新边从基本知识图分离多个新节点作为结果知识图。

附图说明

现在将参考附图仅通过示例的方式描述本发明的实施例，在附图中：

图1描述了根据本发明的实施例的用于构建知识图的方法的流程图。

图2描述了根据本发明的实施例的图1的方法的替代方法的流程图。图3是根据本发明的实施例的基本知识图和相关的不连贯节点的图形表示。

图4是根据本发明的实施例的具有相关的不连贯节点的基本知识图的图形表示，其中添加了结果知识图的链接/边。

图5是根据本发明的实施例的基本知识图和结果知识图的图形表示，还示出了边的权重。

图6示出了根据本发明的实施例的结果知识图的进一步图形表示。

图7示出了根据本发明的实施例的具有节点分数的结果知识图的图形表示。

图8a示出了根据本发明的实施例的集群中心的潜在候选的第一图形表示。

图8b示出了根据本发明的实施例的集群中心的潜在候选的第二图形表示。

图9示出了根据本发明的实施例的用于构建结果知识图的系统的组件模型的框图。

图10示出了根据本发明的实施例的计算系统的框图。

具体实施方式

根据本发明的一个方面，可以提供一种用于构建知识图的方法。该方法可以包括接收多个新节点，接收包括通过现有边选择性地连接的现有节点的基本知识图，这些边的每条边具有现有权重，以及将新节点叠加在基本知识图的现有节点中的所选择的节点上，以构建新节点和对应现有节点的对。

该方法还可以包括：如果下面的基本知识图中的对应现有节点具有经由零或预定最大数目的现有边的连接，则通过在新节点中的至少两个新节点之间创建具有新权重的新边来连接新节点，其中基于对应现有节点之间的连接的现有边的现有权重来确定新权重；以及将具有新边的新节点从基本知识图分离作为结果知识图。

根据本发明的另一方面，可以提供一种用于构建知识图的系统。该系统可以包括：第一接收单元，适于接收多个新节点；第二接收单元，适于接收包括通过现有边选择性地连接的现有节点的基本知识图，这些边中的每条边具有现有权重；以及叠加模块，适于将新节点叠加到基本知识图的现有节点中的所选择的节点上，以构建新节点和对应现有节点的对。

另外，该系统可以包括链接引擎，其适于如果下面的基本知识图中的对应现有节点具有经由零或预定最大数目的现有边的连接，则通过在新节点中的两个新节点之间创建具有新权重的新边来连接新节点，其中基于对应现有节点之间的连接的现有边的现有权重来确定新权重，以及分离单元，其适于从基本知识图分离具有新边的新节点作为结果知识图。

所提出的用于构建知识图的方法可以提供多个优点和技术效果：

本发明的示例性实施例可以利用现有知识图的结构来构造新的信息实体。新实体可以被称为节点，其可能尚未被分配到知识图中的位置。这些所谓的不连贯节点可以使用内容匹配方法与现有知识图的节点相关，以便使用边(即，相互关系或链接)将先前不连贯的节点相关。

然而，通过并非集成不连贯节点而是基于现有知识图中的知识叠加不连贯节点并且在随后的不连贯节点之间添加边，现有知识图保持不变(即，不连贯节点没有被集成到现有知识图中)，并且可以沿着现有知识图的结构创建新的知识图。因此，新知识图的排序、结构化和组织可以与现有知识图具有强相关性，但是最终可以是在新知识图的存在中完全独立于现有知识图。然而，已经被提炼到现有知识图中的知识和经验也可以被反映在新创建的知识图中。

因此，来自各种源的新的信息实体，特别是头脑风暴会议、开发会议、项目会议、个人笔记、对街区和社交媒体工具的贡献等，可以利用由现有知识图表示的固有知识来组织，而不依赖于现有知识图。新的知识图可以仅反映信息实体，特别是先前不连贯的节点和关系(即，在那些节点之间已经创建了边)。新的结果知识图也可以没有主观偏差。

下面将描述本发明的另外的实施例。

根据该方法的一个示例性实施例，节点的叠加可以使用认知计算方法，用于将新节点的内容映射到基本知识图的现有节点的内容上。因此，以最佳方式将内容方面或备选地意图方面与现有节点相关的新节点可以用于构建对。这样，还可以确保不是两个不同的新节点可以被映射到相同的现有节点。还应当注意，将新节点匹配到现有节点的最简单方式可以是基于关键字的。

根据该方法的一个示例性实施例，多个新节点中的每一个可以包括至少部分地为文本形式的内容，这可以通过扫描键入或手写笔记、手写识别和转换、语音到文本转换或类似技术来实现，以便使得信息实体的部分构建可用于由认知引擎处理的新节点的源。

根据该方法的一个示例性实施例，可以通过对形成现有知识图的两个对应节点之间的最短连接的边进行计数来确定两个新节点之间的新边的权重。因此，要创建的知识图的新构建的边也可具有权重。可以存在用于向新创建的边分配权重的不同选项，这也可以反映基本知识图的组织。

因此，根据该方法的另一示例性实施例，两个新节点之间的新边的权重可以由形成现有知识图的两个对应节点之间的最短连接的边的计数的倒数值来确定。

此外，根据该方法的另一示例性实施例，可以通过形成现有知识图的两个对应节点之间的最短连接的边的权重之和的倒数值来确定两个新节点之间的新边的权重。技术人员能够定义用于构建权重因子的附加技术(例如，通过将所选择的数学函数应用于现有节点的现有权重来使用上述权重分配技术的组合，以便导出用于新边的新的权重因子)。

根据另一示例性实施例，该方法还可以包括向新节点分配分数，特别是分数值。这样，可以将不同的重要性值分配给结果知识图中的新节点。分数值可以用于新节点的集群目的。

分配值，特别是权重、分数等，可以注意到，为了简单起见，表述“分配权重”可以表示具有权重因子的含义的数值可以被分配给边等。同样的情况可以应用于分数和相关的数字分数值。

根据该方法的一个示例性实施例，分数，特别是分数值，可以被确定为连接到新节点的边的权重之和。因此，新节点具有的边越多，新节点的核心值可能越高。根据该方法的另一示例性实施例，可以将分数确定为连接到新节点的边的计数。因此，可能存在用于新节点的构建分数值的若干不同版本。

根据一个附加的示例性实施例，该方法还可以包括在结果知识图中构建集群，特别是至少一个集群。这样，可以将同一主题的不同方面的集合体分组，以便更容易和更快速访问。可以获取用于寻找集群的中心的不同备选方案。

根据该方法的另一示例性实施例，集群的中心可以是具有到其他新节点的最高直接边计数的新节点，或者根据该方法的另一示例性实施例，集群的中心可以是具有高于预定义阈值的节点分数的新节点。预定阈值可以用作限幅级别的同义词。还可以注意到，可以使用进一步的技术来定义新节点作为群集中心。

因此，根据该方法的另外的示例性实施例，集群的名称可以与集群的中心的名称相同，这可以是定义集群的名称的直接方法。可以使用更全面的方法。

此外，实施例可以采取相关计算机程序产品的形式，可以从提供程序代码的计算机可用或计算机可读介质获取，以由计算机或任何指令执行系统使用或与计算机或任何指令执行系统结合使用。为了本说明书的目的，计算机可用或计算机可读介质可以是任何装置，其可以包含用于存储、传送、传播或传输程序的装置，以由指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合使用。

在本说明书的上下文中，可以使用以下惯例、术语和/或表达：术语“知识图”可以表示一组信息实体内的结构。知识图的核心构建块可以是包括信息的节点和构建所选择的不同节点之间的链接的边。边可以具有定义两个节点之间的关系的强度值的权重或权重因子。另外，节点还可以具有分数或分数值，以描述节点内容的某种重要性。

术语“新节点”在本文档的上下文中可以表示被表示为实体的信息，该实体被假设为新知识图的构建块之一。新节点可以至少部分地包括某种文本形式的信息。最初，新节点可能不经由边来链接。新的边可以作为方法的过程的一部分来构建。在本文档的上下文中，新节点也可被表示为不连贯节点。

术语“基本知识图”可以表示包括现有节点和现有边的现有知识图，其中现有边具有分配给现有边的现有权重。基本知识图的大小，特别是现有节点和现有边的数目，可以比将要新创建的知识图大得多。例如，该因子可以是100、10,000或甚至1,000,000或更高。

术语“边”可以表示知识图的节点之间的连接或链接。如果节点通常可以被呈现为在内部包括内容的框、圆和/或椭圆，则边通常可以被呈现为节点之间的线。可以将权重因子分配给表示相关节点的内容之间的相互关系的强度的边。

术语“权重”或权重因子可以表示描述知识图的两个节点之间的例如关系、链接或边的相对强度的数值。

术语“叠加”可以表示在逻辑上将新节点放置在现有知识图的现有节点的顶部。因此，可以创建多对新节点和现有节点。叠加可以基于笔记的信息的含义(即，基于内容、意图或词元)。词元或中心词、关键词或有时词目可以是一组相关词典或百科全书条目可能出现的词。

术语“集群”可以表示一组相互关联的项目，在这种情况下，是新节点。可以假设新节点之间的相关边的特定强度或权重，以便将新节点与给定集群相关。集群可以具有中心。可以存在不同的方法来定义集群的中心。

图1描述了根据本发明的实施例的用于构建知识图的方法100的流程图。该方法可以包括步骤102，其接收多个新节点。步骤104接收包括通过现有边选择性地连接的现有节点的基本知识图，每一条边具有现有权重和叠加。步骤106将新节点叠加到从基本知识图中选择的现有节点上，以构建新节点和对应现有节点的对。

另外，方法100可以包括步骤108，如果下面的基本知识图中的对应现有节点具有经由零或预定最大数目的现有边的连接，则该步骤通过在至少两个新节点之间创建具有新权重、特别是新权重值的新边来连接新节点，其中基于对应现有节点之间的连接的现有边的现有权重来确定新权重。步骤110从基本知识图分离具有新边的新节点作为结果知识图。

图2描述了根据本发明的实施例的图1的方法的替代方法200的流程图。首先，步骤202预处理实体，如执行扫描和/或文本识别，以便以可比较的格式创建不连贯节点。这些方法可以在工作室的手写输出上执行。语音到文本转换和语音识别也可以用来处理讨论和创建信息实体。接下来，步骤204确定每个不连贯节点的内容或意图。为此，用于内容解释的认知计算算法可以与一个或多个现有知识图、分类法和/或词典结合使用，这可以通过已知技术来执行。

为此，该方法可以使用两种备选方法：首先，步骤206确定基本知识图的节点的全部或子集的内容/意图，并且步骤208确定每个不连贯节点的意图与基本知识图的节点的所确定的意图的最佳匹配(例如，模糊匹配)。由于基本知识图中的节点数量比不连贯节点的集合大得多，因此如果与该方法的其他步骤相比，则该处理需要相对更大量的计算时间和计算能力。

备选地，步骤210使用基本知识图的节点的名称，特别是现有名称，来确定每个不连贯节点的内容/意图的最佳匹配(例如，模糊匹配)。

步骤212根据所选择的最佳匹配将不连贯节点叠加到基本知识图上。然后，步骤214通过使用基本知识图的现有链接并且还使用不连贯节点的元数据(例如，创建者名称、时间)来创建不连贯节点之间的边。此外，步骤216标识集群，特别是至少一个集群，以及新创建的知识图中的集群的命名。步骤218将结果知识图转换成用于将其呈现给用户的形式(即，转换成可图形显示的形式)。

图3是根据本发明的实施例的基本知识图和相关的不连贯节点304、306、308的图形表示300。图中的圆圈和圆圈之间的线表示基本知识图302的节点和边。大于基本知识图的节点的圆圈可以表示不连贯或新节点304、306、308和310。在现有基本知识图302的圆圈上覆盖六边形的图形可以表示迄今为止未链接的不连贯节点304、306、308和310与基本知识图302的现有节点的叠加。

图4是根据本发明的实施例的具有相关的不连贯节点的基本知识图302的图形表示400，其中添加了结果知识图的链接/边。对于每个不连贯节点(即，如图4中的A、B、C、D所示)，跟随下面的基本知识图302的边，直到到达相邻的不连贯节点。由穿过另一不连贯节点的路径连接的两个不连贯节点可以不被链接。同样，可以应用预定的限幅级别(即阈值)，例如，可以在路径的特定长度(例如，边的数目)之后或者在已经达到特定的累积倒数权重(例如，路径的链接的倒数权重中的一些)之后存储对链接的搜索。叠加的六边形的不连贯节点之间的边被示为粗双线。可以将限幅级别设置为基本知识图的四个边。

另外，在结果知识图中的边的权重被示出为在基本知识图中找到的路径强度的倒数，或者在该示例中，等效地由倒数权重之和的倒数给出。

如图4所示，由于路径长度是5，A不与D链接。B不与D链接，因为在B和D之间不存在路径不穿过另一个不连贯节点，而与路径长度限幅级别无关。

在多于一个路径连接到不连贯节点的情况下，采用最短路径或具有最大结果权重的路径。在另一示例性实施例中，可以取权重之和，并且之后所有权重可选地被归一化为“1”。在另一示例性实施例中，可以取平方权重之和的根以强调具有最高权重的路径，并且之后所有权重潜在地被归一化为“1”。

在另一示例性实施例中，结果知识图的边的权重受连贯节点的元数据的影响。例如，如果两个节点来自相同的作者或者同时在工作室期间创建，则两个节点之间的链接的权重增加。

在另一示例性实施例中，可以添加具有预定权重的附加边以指示相同的作者。

在该方法的下一步骤中，可以标识不连贯节点的集群以将不连贯节点分类成类别并且为每个类别命名主题或题目。为此，所有节点获得边的权重之和作为分数。在另一示例性实施例中，节点获得边的数目作为分数。

在一个示例性实施例中，集群的数目可以被限制为例如数目n(即，仅具有n个最高分数的n个节点被进一步考虑)。在另一示例性实施例中，忽略低于预定最小分数的所有节点。在又一示例性实施例中，可能需要集群核心之间的最小距离(即，忽略在特定半径内具有比相邻节点更小分数的所有节点)。在另一示例性实施例中，可以使用刚刚提到的标准的组合。在另一示例性实施例中，可以应用所描述的方法的若干循环。

为了更仔细地查看刚刚描述的方法，可以考虑接来下的附图。

图5是根据本发明的实施例的基本知识图和结果知识图的图形表示500，还示出了边的权重。为了简单起见，基本知识图被示为规则网格，并且所有链接具有权重“1”。在任何情况下，权重应当被归一化为“0”和“1”之间的范围，使得路径的权重可以被表达为权重的乘积(即，较长路径具有比较短路径低的权重)。

叠加九个不连贯节点，显示为比现有知识图的节点更大的圆圈。

作为结果知识图的边权重，采用基本知识图的路径的边。权重的数字显示在每个边的旁边。结果知识图的节点之间的边被示为粗虚线。

图6示出了根据本发明的实施例的结果知识图的另一图形表示600。图6可以仅仅是对链接具有相同权重的图5的结果知识图的提取。

图7示出了根据本发明的实施例的具有节点分数的结果知识图的图形表示700。在第一次迭代中，每个节点接收节点的边之和作为分数。在该示例中，节点的链接的权重被设置为2.5，这留下了三个可能的候选以及它们之间的两个连接。一个是直接链接(即，边权重1)，并且一个是包括两个边的路径，其具有0.25＝0.5×0.5的总权重，这可以被验证。一个示例：最顶部的节点具有3个链接，其具有0.5、1、0.3333333…的单独权重，可以对其进行针对结果知识图的剩余节点的计算。

这种方法留下了三个可能的候选和它们之间的两个边。一个是直接边(即权重1)，一个是包括两个链接的路径，其具有的总权重为0.25＝0.5×0.5，如在接下来的附图中所讨论的。

图8a示出了根据本发明的实施例的集群中心的潜在候选的第一图形表示800。图8b示出了根据本发明的实施例的集群中心的潜在候选的第二图形表示800。图8a和8b示出了用于集群中心的潜在候选的实施例800，因为候选在结果知识图中的所有节点中具有最高分数。

在第二次迭代中，将连接剩余节点的边的权重加到第一次迭代的节点的分数上。在该示例中，第二持续时间的最小所需分数被设置为4，仅留下一个节点作为集群核心(即，具有4.25的分数的一个节点)。备选地，群集核心之间的最小距离可被设置为2，然而，可以选择任何其它数目，从而产生两个群集核心，即，具有4.25和2.75的分数的节点。

可以选择类别名称和/或集群核心的意图。

在一个示例性实施例中，通过将节点分配给最接近的集群核心来形成集群。在另一示例性实施例中，将集群核的分数作为因素，例如，重力模型：分数除以距离的平方(例如，以节点之间的边或跳的数目来测量)。

作为非迭代方法，在另一示例性实施例中，围绕每个节点放置预定半径的圆圈(即，沿着从节点开始直到预定限幅级别的路径，达到倒数权重之和的预定阈值)。集群核心可以是具有位于给定圆圈中的最高数量的节点的节点。

在该方法的下一步骤中，然后可以将结果知识图转换成可图形显示的形式，并且呈现给用户。将先前的不连贯节点排列并且分组为命名的集群。可以使用颜色编码来增强可理解性。

通过改变用于确定集群的功率度量(例如，集群的数目、集群核心所需的最小分数、集群之间的最小距离、迭代次数)，用户可以生成不同的分类。然后，为了相关的表示目的，挑选特定的分类。

图9示出了根据本发明的实施例的用于构建结果知识图的系统的组件模型900的框图。信息实体902被传递到数据预处理器904，其以标准化格式生成不连贯节点906，如上文所解释。为此，并且取决于实体的格式，预处理器904可以使用扫描、光学字符识别、语音到文本或类似技术。被称为意图映射器908的组件捕获每个不连贯节点的意图。在一个示例性实施例中，意图映射器908还捕获基本知识图910的所有节点或节点的子集的意图，使得匹配引擎914将不连贯节点906的意图与基本知识图910的节点的意图进行匹配。在另一实施例中，匹配引擎914将不连贯节点906的意图与基本知识图910的节点的名称和/或描述和/或内容进行匹配，如以上在相关方法的上下文中所讨论的。

链接引擎916关注基本知识图910从一个叠加的不连贯节点到另一个叠加的不连贯节点的链接。链接引擎916将结果知识图912与基本知识图910分开存储。这样，结果知识图912变成独立于基本知识图910的结构。

集群引擎918标识集群的分数，从节点名称中挑选名称串，并且将集群的周围节点分配给集群。

呈现模块920然后绘制描绘结果知识图912的集群、节点和链接的一个或多个图形。用户界面922允许用户改变集群算法的功率度量以生成结果知识图912的不同视图。用户可以使用用户计算设备与结果知识图912交互，以改变结果图或改变结果图912的显示

本发明的实施例实际上可以与任何类型的计算机一起实现，而不管平台是否适于存储和/或执行程序代码。图10示出了根据本发明的实施例的计算系统的框图。例如，图10示出了计算系统1000，其适于执行与所提出的方法相关的程序代码，和/或充当根据图9的组件模型的一个或多个组件。

计算系统1000仅是合适的计算机系统的一个示例，并且不旨在对本文所述的本发明的实施例的使用范围或功能提出任何限制。无论如何，计算机系统1000能够被实现和/或执行上文所阐述的任何功能。在计算机系统1000中，存在可与许多其它通用或专用计算系统环境或配置一起操作的组件。适合与计算机系统/服务器1000一起使用的公知的计算系统、环境和/或配置的示例包括但不限于个人计算机系统、服务器计算机系统、瘦客户端、胖客户端、手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品、网络PC、小型计算机系统、大型计算机系统、以及包括任何上述系统或设备的分布式云计算环境等。计算机系统/服务器1000可以在计算机系统可执行指令的一般上下文中描述，诸如由计算机系统1000执行的程序模块。通常，程序模块可以包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、逻辑、数据结构等。计算机系统/服务器1000可以在分布式云计算环境中实践，其中任务由通过通信网络链接的远程处理设备执行。在分布式云计算环境中，程序模块可以位于包括存储器存储设备的本地和远程计算机系统存储介质中。

如图所示，计算机系统/服务器1000以通用计算设备的形式示出。计算机系统/服务器1000的组件可以包括但不限于一个或多个处理器或处理单元1002、系统存储器1004和将包括系统存储器1004的各种系统组件耦合到处理器1002的总线1006。总线1006表示若干类型的总线结构中的任何一种的一个或多个，包括存储器总线或存储器控制器、外围总线、加速图形端口、以及使用各种总线体系结构中的任何一种的处理器或局部总线。作为示例而非限制，这些体系结构包括工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、增强型ISA(EISA)总线、视频电子技术标准协会(VESA)局部总线和外围部件互连(PCI)总线。计算机系统/服务器1000通常包括各种计算机系统可读介质。这样的介质可以是可通过计算机系统/服务器1000访问的任何可用介质，

并且它包括易失性和非易失性介质、可移动和不可移动介质。

系统存储器1004可以包括易失性存储器形式的计算机系统可读介质，诸如随机存取存储器(RAM)1008和/或高速缓存1010。计算机系统/服务器1000还可以包括其他可移动/不可移动、易失性/非易失性计算机系统存储介质。仅作为示例，存储系统1012可以被提供用于从不可移动、非易失性磁介质(未示出，并且通常被称为“硬盘驱动器”)读取和向其写入。尽管未示出，但是可以提供用于从可移动、非易失性磁盘(例如，“软盘”)读取和向其写入的磁盘驱动器，以及用于从诸如CD-ROM、DVD-ROM或其它光学介质的可移动、非易失性光盘读取或向其写入的光盘驱动器。在这种情况下，每个可以通过一个或多个数据介质接口连接到总线1006。如下面将进一步描绘和描述的，存储器1004可以包括至少一个程序产品，该程序产品具有一组(例如，至少一个)程序模块，该程序模块被配置成执行本发明的实施例的功能。

具有一组(例如至少一个)程序模块1016的程序/实用程序，以及操作系统、一个或多个应用程序、其它程序模块和程序数据，可以存储在存储器1004中，作为示例而非限制。操作系统、一个或多个应用程序、其它程序模块和程序数据或其某种组合中的每一个可以包括联网环境的实现。程序模块1016一般执行如本文所述的本发明的实施例的功能和/或方法。

计算机系统/服务器1000还可以与一个或多个外部设备1018通信，诸如键盘、指示设备、显示器1020等；一个或多个设备，其使得用户能够与计算机系统/服务器1000交互；和/或使计算机系统/服务器1000能够与一个或多个其他计算设备通信的任何设备(例如，网卡、调制解调器等)。这种通信可以经由输入/输出(I/O)接口1014发生。此外，计算机系统/服务器1000可以经由网络适配器1022与一个或多个网络通信，网络诸如局域网(LAN)、通用广域网(WAN)和/或公共网络(例如，因特网)。如所描绘的，网络适配器1022可以经由总线1006与计算机系统/服务器1000的其他组件通信。应当理解，尽管未示出，但是可以结合计算机系统/服务器1000使用其他硬件和/或软件组件。示例包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动器阵列、RAID系统、磁带驱动器和数据档案存储系统等。

已经出于说明的目的给出了本发明的各种实施例的描述，但是其不旨在是穷尽的或限于所公开的实施例。在不背离所描述的实施例的范围的情况下，许多修改和变化对于本领域的普通技术人员将是显而易见的。选择本文所使用的术语以最好地解释实施例的原理、实际应用或对市场上存在的技术的技术改进，或使本领域的其他普通技术人员能够理解本文所公开的实施例。

本发明可以被实现为系统、方法和/或计算机程序产品。计算机程序产品可以包括其上具有计算机可读程序指令的计算机可读存储介质(或多个介质)，计算机可读程序指令用于使处理器执行本发明的各方面。

该介质可以是用于传播介质的电子、磁、光、电磁、红外或半导体系统。计算机可读介质的示例可以包括半导体或固态存储器、磁带、可移动计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。光盘的当前示例包括光盘只读存储器(CD-ROM)、光盘读/写(CD-R/W)、DVD和蓝光盘。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本发明的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器相关指令、微代码、固件指令、状态设置数据，或者以一种或多种编程语言的任意组合编写的源代码或目标代码，编程语言包括面向对象的编程语言(例如Smalltalk、C++等)以及常规的过程式编程语言(例如“C”编程语言或类似的编程语言)。计算机可读程序指令可以完全在用户的计算机上执行，部分地在用户的计算机上作为独立软件包执行，部分地在用户的计算机上并且部分地在远程计算机上执行，或者完全在远程计算机或服务器上执行。在后一种情况下，远程计算机可以通过任何类型的网络连接到用户的计算机，包括局域网(LAN)或广域网(WAN)，或者可以连接到外部计算机(例如，使用因特网服务提供商通过因特网)。在一些实施例中，为了执行本发明的各方面，包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以使电子电路个性化。

这里参照根据本发明的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

在一个实施例中，本发明的系统可以是或包括硬件设备，诸如计算机、便携式设备等。在一个实施例中，硬件设备是或包括专用设备(例如，计算机、机器、便携式设备)，该专用设备包括专门的、非通用的硬件和电路(即，专门的离散的非通用模拟、数字和基于逻辑的电路)，用于(独立地或组合地)专门用于仅执行本发明的方法。专门的离散的非通用模拟、数字和基于逻辑的电路可以包括专用的专门设计的组件(例如，专用集成电路，诸如例如专用集成电路(ASIC)，其被设计用于仅实现本发明的方法)。

在另一实施例中，所提出的发明解决了必然根植于计算机技术中的技术问题，因为结果图可以改进搜索引擎技术，这通过在允许用户避免导航到附加网站或执行对信息的附加搜索的位置中提供相关信息来节省计算机资源。

本发明的计算机程序产品可以包括一个或多个计算机可读硬件存储设备，其中存储有计算机可读程序代码，所述程序代码包含由计算系统(或计算机系统)的一个或多个处理器可执行以实现本发明的方法的指令。

本发明的计算机系统可以包括一个或多个处理器、一个或多个存储器以及一个或多个计算机可读硬件存储设备，所述一个或多个硬件存储设备包含由一个或多个处理器经由一个或多个存储器可执行以实现本发明的方法的程序代码。

已经出于说明的目的给出了本发明的各种实施例的描述，但是其不旨在是穷尽的或限于所公开的实施例。在不背离所描述的实施例的范围的情况下，许多修改和变化对于本领域的普通技术人员将是显而易见的。选择本文所使用的术语以最好地解释实施例的原理、实际应用或对市场上存在的技术的技术改进，或使本领域的其他或普通技术人员能够理解本文所公开的实施例。

Claims

1.一种用于构建知识图的计算机实现的方法，所述方法包括：

首先由计算系统的处理器接收多个新节点；

其次由所述处理器接收包括通过现有边选择性地连接的现有节点的基本知识图，所述现有边的每条边具有现有权重；

由所述处理器将所述多个新节点叠加到所述基本知识图的所述现有节点的所选择的节点上，构建新节点和对应现有节点的对；

如果下面的所述基本知识图中的对应现有节点具有经由零或预定最大数目的现有边的连接，则由所述处理器通过在所述多个新节点中的至少两个节点之间创建具有新权重的新边来连接所述多个新节点，其中所述新权重基于所述对应现有节点之间的连接的所述现有边的所述现有权重而被确定；以及

由所述处理器从所述基本知识图分离具有所述新边的所述多个新节点作为结果知识图。

2.根据权利要求1所述的方法，其中叠加使用认知计算方法，以用于将新节点的内容映射到所述基本知识图的现有节点的内容上。

3.根据前述权利要求中任一项所述的方法，其中所述多个新节点中的每个节点包括至少部分地为文本形式的内容。

4.根据前述权利要求中任一项所述的方法，其中所述多个新节点中的两个节点之间的所述新边的权重由形成所述现有知识图的所述两个对应节点之间的最短连接的边的计数来确定。

5.根据权利要求1至3中任一项所述的方法，其中所述多个新节点中的两个节点之间的所述新边的权重由形成所述现有知识图的所述两个对应节点之间的最短连接的边的计数的倒数值来确定。

6.根据权利要求1至3中任一项所述的方法，其中所述多个新节点中的两个节点之间的所述新边的权重由形成所述现有知识图的所述两个对应节点之间的最短连接的边的权重的和的倒数值来确定。

7.根据前述权利要求中任一项所述的方法，还包括向所述新节点分配分数。

8.根据权利要求7所述的方法，其中所述分数被确定为连接到所述新节点的所述边的所述权重的和。

9.根据权利要求7所述的方法，其中所述分数被确定为连接到所述新节点的所述边的计数。

10.根据前述权利要求中任一项所述的方法，还包括在所述结果知识图中构建集群。

11.根据权利要求10所述的方法，其中所述集群的中心是具有到其他新节点的最高直接边计数的所述新节点。

12.根据权利要求10所述的方法，其中所述集群的中心是具有高于预定义阈值的节点分数的所述新节点。

13.根据权利要求10至12中任一项所述的方法，其中所述集群的名称与所述集群的中心的名称相同。

14.一种系统，包括

处理器；

耦合到所述处理器的存储器设备；以及

耦合到所述处理器的计算机可读存储设备，其中所述存储设备包含由所述处理器经由所述存储器设备可执行以实现用于构建知识图的方法的程序代码，所述方法包括：

首先由计算系统的处理器接收多个新节点；

如果所述下面的基本知识图中的对应现有节点具有经由零或预定最大数目的现有边的连接，则由所述处理器通过在所述多个新节点中的至少两个节点之间创建具有新权重的新边来连接所述多个新节点，其中所述新权重基于所述对应现有节点之间的连接的所述现有边的所述现有权重而被确定；以及

15.根据权利要求14所述的系统，其中所述叠加使用认知计算系统，以用于将所述多个新节点的内容映射到所述基本知识图的内容节点上。

16.根据权利要求14或15所述的系统，其中所述多个新节点中的每个新节点包括至少部分地为文本形式的内容。

17.根据权利要求14至16中任一项所述的系统，其中所述多个新节点中的两个节点之间的新边的权重由形成所述现有知识图的所述两个对应节点之间的最短连接的边的计数来确定，或者其中所述多个新节点中的两个节点之间的所述新边的权重由形成所述现有知识图的所述两个对应节点之间的最短连接的边的计数的倒数值来确定，或者其中所述多个新节点中的两个节点之间的所述新边的权重由形成所述现有知识图的所述两个对应节点之间的最短连接的边的加权数目的和的倒数值来确定。

18.根据权利要求14至17中任一项所述的系统，还包括向所述新节点分配分数。

19.根据权利要求18所述的系统，其中所述分数被确定为连接到所述新节点的所述边的所述权重的和。

20.根据权利要求18所述的系统，其中所述分数被确定为连接到所述新节点的所述边的和。

21.根据权利要求14至20中任一项所述的系统，还包括在所述结果知识图中构建集群。

22.根据权利要求21所述的系统，其中所述集群的中心是具有到其他新节点的最高直接边数目的所述新节点。

23.根据权利要求21所述的系统，其中所述集群的中心是具有高于预定义阈值的节点分数的所述新节点。

24.根据权利要求21至23中任一项所述的系统，其中所述集群的名称与所述集群的中心的名称相同。

25.一种用于构建知识图的计算机程序产品，所述计算机程序产品包括：

计算机可读存储介质，所述计算机可读存储介质由处理电路可读取并且存储用于由所述处理电路执行以用于执行根据权利要求1至13中任一项所述的方法的指令。

26.一种存储在计算机可读介质上并且可加载到数字计算机的内部存储器中的计算机程序，包括软件代码部分，当所述程序在计算机上运行时，用于执行根据权利要求1至13中任一项所述的方法。