CN108885626A

CN108885626A - 优化图形遍历

Info

Publication number: CN108885626A
Application number: CN201780000618.XA
Authority: CN
Inventors: 克里斯托弗·雅各布·迪尔; 赫克托·毛里西奥·阿亚拉; 马扬克·贾殷
Original assignee: Google LLC
Current assignee: Google LLC
Priority date: 2017-02-22
Filing date: 2017-05-16
Publication date: 2018-11-23
Also published as: US20190155899A1; US11551003B2; US20180239751A1; US10140286B2; CN114020924A; US20200387671A1; US12001799B1; US10789428B2; WO2018156184A1

Abstract

公开了用于优化图形遍历的方法、系统和设备，其包括编码在计算机存储介质上的计算机程序。在一个方面中，方法包括接收由数字组件提供者通过用户界面输入的短语的动作。所述动作进一步包括：确定所述给定短语所提到的实体。所述动作进一步包括：识别所述实体的属性。所述动作进一步包括：选择针对所述实体而识别到的所述属性的子集。所述动作进一步包括：识别附加短语。所述动作进一步包括：更新用户界面以向附加短语中的至少一些呈现可编程控件，响应于可编程控件的激活，可编程控件将附加短语中的一个或者多个分配为数字组件提供者的数字组件的分发准则。

Description

优化图形遍历

技术领域

本申请涉及数据存取和数据处理。

背景技术

数据库是经过组织的数据的集合。用户可以访问数据库以识别与一条给定的数据有关的信息。例如，用户可以访问数据库以识别不同类型的水果或者不同品牌的汽车。

发明内容

为了识别语义上与给定短语有关的附加短语(例如，一个或者多个词)，用户(例如，数字组件提供者)可以将该给定短语提交给被配置为遍历知识图的系统。知识图提供关于各种实体(例如，特定的人、地方、东西或者主题)的结构化且详细的信息。知识图通过使用节点和分配给该节点的唯一实体标识符来唯一地识别每个不同的实体。知识图通过使用指定节点之间的特定关系的关系链接将节点链接在一起。例如，假设标题为“电影A”的电影由“导演1”导演。在该示例中，知识图中被分配给“电影A”的节点将会被链接至被分配给“导演1”的节点，并且这些节点之间的链接(或者多个链接)将会具有一个或者多个标签，该一个或者多个标签指定“电影A”到“导演1”具有“由其导演”的关系，并且“导演1”到“电影A”具有“导演了”的关系。通过遍历知识图的链接和/或节点，知识图中的节点和链接的集合实现了对相关概念的识别，这并非是显而易见的。

知识图是庞大的，并且偏离主题一个以上等级的遍历在计算上是昂贵的。为了减少遍历知识图时的系统负载，系统可以识别给定短语与其它短语之间的关系，并且仅仅选择对与给定短语的、可能会引导至更相关的或者具有更高短语动作分数(例如，交互率、或者贴文交互活动率)的短语的这些关系进行评估。通过仅仅选择对与给定短语的、可能会揭露具有高短语动作分数的短语的这些关系进行评估，系统减少了系统所要遍历的知识图路径的数量，因此更快地识别与高短语动作分数有关和/或具有高短语动作分数的短语，并且采用的计算资源比遍历给定短语与其它短语之间的链接所指定的所有关系所用的计算资源更少。同样，优化(例如，改善)对知识图的遍历，以便知识图可以用在实时交互环境中，以响应于用户输入而提供实时信息，从而改善知识图的可用性/功能性。

根据本申请所描述的主题的创新方面，用于保持流应用的状态的方法包括以下动作：接收由数字组件提供者通过用户界面输入的给定短语；通过访问包括每个唯一地识别不同实体的节点的知识图并且识别唯一地识别给定短语所提到的实体的特定节点，来确定给定短语所提到的实体，其中，知识图的节点通过表示所连接的节点之间的关系的边缘连接在一起；通过访问连接特定节点的实体的其它节点来识别实体的属性；选择针对实体而识别到的所述属性的子集；通过使用针对实体而识别到的属性子集访问知识图来识别附加短语；以及更新用户界面以向附加短语中的至少一些呈现可编程控件，响应于可编程控件的激活，可编程控件将附加短语中的一个或者多个分配为数字组件提供者的数字组件的分发准则。

这些和其它实施方式可以每个可选地包括以下特征中的一个或者多个。动作进一步包括：当识别到附加短语时，减少知识图遍历器访问知识图的数目。动作进一步包括：通过访问识别到的附加短语的短语动作分数、将短语动作分数彼此进行比较、基于比较识别具有最高值的短语动作分数中的一个或者多个、并且选择具有拥有最高值的短语动作分数的一个或者多个附加短语，来从附加短语中识别性能特性比附加短语中的其它短语高的一个或者多个短语。动作进一步包括：通过使用由采用机器学习连续训练的选择模型来选择与实体相关联的属性的子集。动作进一步包括：初始时通过使用选择模型训练数据来训练选择模型，该选择模型训练数据包括：与用户提交的先前搜索查询相关联的短语、与先前搜索查询相关联的数字组件选择数据、与短语相关联的实体、以及与实体相关联的属性。识别到的附加短语包括实体中的最小生成树。

该实施方式的其它实施例包括对应的系统、设备、以及编码在计算机存储装置上的计算机程序，上述系统、设备以及计算机程序每个被配置为执行方法的操作。

本说明书所描述的主题可以具有以下优点中的一个或者多个。用户可以通过访问知识图来识别与给定短语有关的短语。系统可以限制对知识图的遍历以减少计算机处理要求。

下面的附图和说明阐述了本说明书中描述的本主题的一个或者多个实施例的细节。本主题的其它特征、方面和优点将通过说明书、附图和权利要求书变得显而易见。

附图说明

图1图示了通过使用知识图来进行短语识别的示例系统。

图2图示了示例知识图。

图3图示了通过使用知识图来进行短语识别的示例过程。

图4图示了计算装置和移动计算装置的示例。

具体实施方式

图1图示了通过使用知识图105进行短语评估的示例系统100。简而言之，如下面更详细地描述的，用户110(例如，数字组件提供者)通过计算装置120提交给定短语115。计算装置120将给定短语115传输至服务器125。服务器125使用给定短语115访问知识图105，并且遍历知识图的、连接至给定短语的节点/链接。对知识图的节点/链接的遍历揭露了扩展短语130(例如，通过特定关系链接连接至给定短语而与该特定短语有关和/或具有满足预先指定的阈值的短语动作分数的其它短语)。服务器125然后将扩展短语130的列表提供至计算装置120。用户110可以与以下的一种或者多种交互：扩展短语、扩展短语组、或者与扩展短语对应的用于将扩展短语分配为一个或者多个数字组件(例如，视频文件、音频文件、图像、文本或者包括广告形式的内容的其它内容)的分发准则的选择控件。

在图1所示的更详细的和下面的示例中，假设用户110将短语115“youthful andfidgety”输入到在服务器125上运行的短语扩展工具(例如，操作以识别扩展短语的脚本和硬件组件)中。短语扩展工具通过用户界面生成器132生成用户界面。用户界面生成器132提供显示在计算装置120上的用户界面并且接收来自用户110的输入。短语扩展工具被配置为识别通过知识图中的链接而与给定短语115有关和/或至少具有特定短语动作分数的扩展短语。至少具有特定短语动作分数的扩展短语是本应导致了与使用短语来分发的数字组件的、至少最低等级的最终用户交互的那些短语。在一些实施方式中，可以通过使用阈值短语动作分数来指定最低等级的最终用户交互。

服务器125通过用户界面132接收给定短语115并且将给定短语115提供至知识图遍历器135。知识图遍历器135被配置为访问并且/或者遍历知识图105。知识图105和服务器125的其它组件可以定位在服务器125上或者可以被分配到包括服务器125的多个服务器中。可以通过网络145来访问多个服务器和服务器125。换言之，多个服务器和服务器125可以定位在云中。在对知识图105的初始访问期间，可能尚未为给定短语115配置知识图过滤器140。相反，知识图遍历器135可以直接访问知识图。

简略参照图2，图2图示了知识图200的示例。知识图200可以与图1中的知识图105相似。一般而言，知识图200是表示实体以及在实体(例如，由节点表示)之间的关系(例如，被标记的链接)的数据(例如，节点)的集合。该数据在逻辑上被描述并且被图示为图，在该图中，每个不同的实体由相应的节点表示，并且实体对之间的各种关系由节点之间的边缘(链接)表示。每个边缘指定关系(例如，以标签的形式)，并且边缘的存在表示通过边缘而连接在一起的节点之间存在指定关系。例如，如果节点202表示人Christine Wilson，节点204表示电视节目Admiral Clinic，并且边缘206指定关系“是……中的女演员”，那么，在图中使边缘206在从节点202到节点204的方向上(例如，单向的)将节点202和204连接在一起表示Christine Wilson是Admiral Clinic中的女演员这一事实。在知识图200中可以存在与是女演员无关的对于节点202的其它连接。例如，节点202可以连接至表示Jack Wilson的节点。节点202和表示Jack Wilson的节点可以通过具有关系“与……结婚”的边缘连接在一起。在该示例中，具有关系“与……结婚”的边缘可以是双向边缘，因为Jack Wilson与Christine Wilson结婚并且Christine Wilson与Jack Wilson结婚。

可以由各种物理数据结构中的任何一种表示知识图200。例如，可以由三元组表示知识图，该三元组分别按顺序表示两个实体和从第一实体到第二实体的关系；例如，[Christine Wilson，Admiral Clinic，是……中的女演员]或者[Christine Wilson，是……中的女演员，Admiral Clinic]是表示相同事实的替代方式。每个实体和每种关系可以包括在多个三元组中并且通常包括在多个三元组中。如上所述，即使相同的短语描述了两个不同的实体，知识图中的每个实体相对于其它实体也具有唯一地识别该实体的对应实体标识符。例如，假设两个实体是通过使用短语“jaguar”以文本的方式来识别的。在该示例中，知识图中表示具有名称Jaguar的汽车的实体节点可以具有实体标识符“12345”，而表示动物jaguar的实体节点可以具有实体标识符“54321”，从而区分具有相同名称的这两个实体。在一些实施方式中，不是实体名称或者除了实体名称之外，实体标识符也可以包括在上面所讨论的三元组(或者表示知识图的其它数据结构)中。

在一些实施方式中，每个实体可以一旦被存储为节点，例如，存储为记录或者对象，则该实体通过链接列表数据结构被链接至该实体所具有的所有关系和与该实体有关的所有其它实体。更具体地，知识图200可以被存储为邻接列表，在该邻接列表中，邻接信息包括关系信息。用唯一标识符表示每个不同的实体和每种不同的关系通常是有利的。

知识图200所表示的实体不需要是有形的东西或者具体的人。实体可以包括特定的人、地方、东西、艺术品、概念、事件、或者其它类型的实体。因此，知识图可以包括：限定人之间的关系的数据，例如，电影中的联合主演；限定人与东西之间的关系的数据，例如，特定歌手录制了特定歌曲；限定地方与东西之间的关系的数据，特定类型的红酒来自特定地理位置；限定人与地方之间的关系的数据，例如，特定人出生在特定城市；以及实体之间的其它种类的关系。作为知识图200中的另一示例，表示电视制作方American Studios的节点208连接至表示电视节目“Youthful and Fidgety”的节点210。节点208和210通过与关系“是……的制作方”对应的边缘212连接在一起。基于使用边缘212将节点208连接至节点210，American Studios是Youthful and Fidgety的制作方。

在一些实施方式中，每个节点具有基于该节点所表示的实体的种类的类型；并且类型可以分别具有架构，该架构指定所维护的关于这种类型的节点所表示的实体的数据的种类和应该如何存储数据。因此，例如，用于表示人的这类节点可以具有限定用于诸如出生日期、出生地方等的信息的字段的架构。这种信息可以由类型特定的数据结构中的字段表示，或者由看起来像节点-关系-节点——例如，[人标识符，出生在……，日期]的三元组的三元组表示，或者以任何其它方便的预定义方式表示。可替代地，类型架构所指定的信息中的一些或者全部可以由与知识图中的节点的链接表示，例如，[一个人标识符，……的孩子，另一人标识符]，其中，该其它人标识符是图中的节点。

作为知识图200中的示例，表示Elizabeth Anderson的节点214可以包括指示她于1970年出生在Springfield的数据。可替代地，节点214可以连接至表示1970年的节点和表示位置Springfield的节点。节点214可以通过与“出生在……”对应的边缘连接至表示1970年的节点。节点214还可以通过也与“出生在……”对应的边缘连接至表示位置Springfield的节点。同样，当服务器125通过使用关系“出生在……”从节点214遍历知识图时，服务器125到达节点215a(表示Springfield,OH)和215b(表示1970年)两者。服务器125可以聚合来自通过关系“出生在……”链接至节点214的节点中的每一个的信息，以生成ElizabethAnderson于1970年出生在Springfield,OH的事实。随着与特定节点(或者节点的类集)具有相同关系的节点的数量增加，遍历知识图以识别信息的计算复杂性增加，这可以导致响应缓慢并且限制在实时交互环境中使用知识图的能力。进一步地，当所评估的不同关系的数量(或者类型)增加时，这将进一步使从知识图中检索信息复杂化。由于知识图中包括的大量信息和对访问/处理该信息以提供实时交互在线应用的时间限制，需要使用计算装置来有效地利用知识图。

基于上述描述，显而易见的是，当知识图200仅仅表示目前存在的较大知识图中的一小部分时，遍历知识图200是一种复杂的且在计算上昂贵的操作。虽然表示电视节目“Youthful and Fidgety”的节点210在示例知识图200中仅仅有约11个连接，但是事实上，节点210可以具有数以百计、数以千计、或者数以百万计的连接。同样，响应于对信息的请求(例如，提交给定短语)需要智能地识别为了识别信息(例如，扩展短语)应该遍历知识图的哪一部分并且/或者应该评估知识图的哪一部分的技术。知识图过滤器140的目的是减少知识图遍历器135必须遍历以识别返回至提交给定短语115的用户110的扩展短语130的节点和边缘的数量。这样做将减少所花的时间、所使用的功率和所使用的存储，并且将降低知识图遍历器135用来识别与短语115有关的扩展短语130的处理能力。反过来，知识图过滤器140使知识图能够在实时交互环境的背景下选择和返回扩展短语，这使用户110能够识别和选择用于分发用户110所提供的数字组件的多种新的/不同的短语。

返回知识图遍历器135直接访问知识图105或者200，知识图遍历器135在与短语“youthful and fidgety”对应的节点210处访问知识图105。如知识图200所图示的，节点210通过边缘218连接至节点216，通过边缘222连接至节点220，通过边缘226连接至节点224，连接至节点228，通过边缘230连接至节点214，通过边缘212连接至节点208、通过边缘234连接至节点232，通过边缘238连接至节点236，通过边缘240连接至节点202，通过边缘244连接至节点242，以及连接至节点246。这些边缘中的每一个表示与短语“youthful andfidgety”对应的节点210的潜在属性。

知识图遍历器135将连接至节点210的节点和边缘提供至属性选择器150。属性选择器150被配置为识别与属性对应的这些连接的节点并且选择最可能引导至具有更高性能特性的短语的这些属性的子集。为此，属性选择器150可以应用一个或者多个选择模型。属性选择器可以基于短语115或者用户110或者两者来选取选择模型。例如，如果用户110是媒体公司并且短语115是“youthful and fidgety”，则属性选择器可以选择男演员和作家的属性。属性选择器150可以通过检查连接至节点210的边缘来选择男演员和作家。例如，节点210的属性包括来自边缘244、240、238和234的“是……中的男演员/女演员”、来自边缘212的“是……的制作方”、和来自边缘214的“是……的作家”。属性选择器150也可以分别基于节点224、220和216来确定节点“youthful and fidgety”是获奖电视、电视节目和肥皂剧。知识图200还可以具有表示其它电视节目的连接至节点224、220和216的附加节点。这些电视节目节点中的每一个可以具有作家、导演、制作方、男演员/女演员等(例如，通过连接节点的关系边缘所确定的)。属性选择器150可以选择男演员/女演员和作家的属性，因为它们可能会引导至具有最高性能属性的短语。这是因为输入搜索查询的最终用户或许更有可能输入男演员/女演员和作家的姓名，而非制作方或者导演。

为了帮助属性选择器150进行识别，属性选择器150可以访问一个或者多个选择模型155。在处理短语之前，属性选择器150可以访问选择模型训练数据160。选择模型训练数据160可以包括与先前搜索查询、这些先前搜索查询的内容项选择数据、具有短语的实体、和实体的属性有关并且具有短语的数据。属性选择器150可以使用神经网络和机器学习来生成模型155。随着多个最终用户输入搜索查询，属性选择器150可以接收附加训练数据。服务器125可以将训练数据存储在选择模型训练数据160中并且属性选择器150可以更新选择模型155。可以针对短语和数字组件提供者的类型生成每个选择模型。例如，与电视节目有关的短语和与食物有关的短语相比可以具有不同的模型。

通过使用属性“是……中的男演员/女演员”和“是……的作家”，知识图遍历器125然后可以访问知识图以沿知识图105的这些属性识别附加短语。如图2所示，知识图遍历器135访问节点242、202、236、232和214。知识图过滤器140过滤掉节点208、228、224、220、216和246。这将访问知识图200的计算成本减少了一半以上，因为知识图遍历器135不会向下遍历节点208、228、224、220、216和246。知识图遍历器135识别与节点242、202、236、232和214具有关系的节点，这些关系与这些节点与初始短语节点210的关系相类似。具体地，知识图遍历器135识别节点248、250、252、254、256、258、260、262、264、266、268、270和272。这些节点中的每一个与连接至节点210的节点具有关系“是……中的男演员/女演员”或者“是……中的作家”。为了避免知识图200的大小对于页面太大，以缩写的形式表示诸如节点248、250、246、228、260、262、264和266的一些节点，其中，“---”表示一些值，并且连接边缘包括关系。已经从知识图200的表示中去除了实际值。

知识图遍历器135将来自节点248、250、252、254、256、258、260、262、264、266、268、270和272的数据提供至短语选择器165。这些节点中的数据是由知识图遍历器135识别的相关短语。短语选择器165可以被配置为返回具有最高短语动作分数(其可以由远程服务器预先计算并且/或者仅仅从数据存储器访问，该数据存储器存储了在短语与其对应短语动作分数之间的索引)的特定数量的短语。例如，短语选择器165可以返回从知识图遍历器135接收到的短语中具有最高性能特性的7个短语。短语选择器165也可以被配置为返回特定百分比的具有最高性能特性的短语。在一些实施方式中，短语选择器165可以被配置为返回性能特性比短语115的性能特性高的短语。

为了识别具有最高性能特性的短语，短语选择器165访问短语性能历史170。短语性能历史170可以包括与搜索查询和所显示的数字组件的所有短语的短语动作分数有关的数据。在该示例中，具有最高性能特性的短语是Running Alive、Eastplanet、AdmiralClinic、Familiar Objects、Older、Bug Man、以及Blue is the New White。因此，服务器125返回扩展短语130。用户110可以选择在这些短语上竞标，以便在最终用户输入与这些短语中的一个有关的搜索查询时，可以显示用户110的数字组件。

在一些实施方式中，知识图过滤器140可以访问选择模型155中的不同模型。在图1所示的示例中，与节点242、202、236、232和214对应的男演员和作家从男演员和作家中的一些可能比其他人更受欢迎的意义上来说可能不相等。就此而言，根据多个搜索查询，以更受欢迎的节点为支持，模型或许能够过滤掉具有与其它节点相同或者相似的属性的节点。例如，知识图过滤器140可以过滤掉节点242、236和232，因为这些节点具有与更受欢迎的节点202相同的属性。例如，Bob Johnson、Alice Smith、David Brown和Christine Wilson是Youthful and Fidgety中的所有男演员或者女演员。Christine Wilson可能是四人中最受欢迎的，所以知识图过滤器140过滤掉Bob Johnson、Alice Smith和David Brown。知识图过滤器140可以不过滤掉节点214，因为节点214与节点210的唯一作家对应并且作家先前被识别为是受欢迎的。知识图过滤器140有效地将连接至节点210的节点减少了仅为节点202和节点214，因此减少了遍历知识图105直下一个等级所需的处理器和存储器上的负载。

在一些实施方式中，服务器125可以使用知识图105通过仅仅识别与短语115对应的不同实体来识别可能与短语115相似的短语。在示例知识图200中，服务器可以识别节点210与节点216处的肥皂剧、节点220处的电视节目和节点224处的电视获奖者的实体对应。这些节点216、220和224中的每一个可以连接至也作为肥皂剧、电视节目、电视获奖者、或者这三种的任何组合的其他节点。虽然未示出，但是知识图节点256与肥皂剧和电视节目两者对应，因此节点256包括到节点216和220的连接。知识图遍历器135识别连接至节点216、220和224的实体中的每一个实体的节点，并且识别连接至实体节点的这些节点。短语选择器165然后识别连接至节点216、220和224的节点的短语中的每一个短语的性能特性。短语选择器165然后可以识别与性能特性对应的短语和/或实体。例如，短语选择器165可以识别与肥皂剧实体对应的实体的短语比电视节目实体和电视获奖者实体的短语表现得更好。

在一些实施方式中，短语选择器165可以利用最小生成树来识别短语。短语选择器165识别相关实体内具有最高性能因子的这些短语。例如，短语选择器可以识别跨越三个节点216、220和224的最少数量的节点。可能存在连接至所有节点216、220和224的节点。可以将性能因子与连接至216、220和224的其它的节点组进行比较以针对每个节点识别具有最高性能因子的最小的短语组。

在一些实施方式中，用户110可以将多个短语提供至系统125并且请求系统将短语分成不同的组。系统访问知识图以识别各个短语所属的不同实体，并且因此对短语进行分组。在一些情况下，系统125可以识别太多组。在这种情况下，用户110可以请求系统125将短语分为更少的组。系统可能必须遍历知识图的附加等级以识别可以用于对接收到的短语进行分类的附加组。

一旦系统125识别到用户110所请求的扩展短语130，就可以将附加资源分配给这些扩展短语130。因为已经将扩展短语130识别为高等级，所以用户110可以将更多资源朝这些短语转移，以向将相关搜索查询输入到搜索引擎中的最终用户呈现数字组件。

图3图示了通过使用知识图来进行短语识别的示例过程300。一般而言，过程300访问知识图以识别与接收到的短语有关的短语。过程300过滤知识图，使得过程300不必遍历与接收到的短语有关的所有路径。该过程选择可能具有高性能特性的短语，使得可以忽略(例如，不评估)其它潜在的扩展短语(以及，潜在对应的关系)。过程300将被描述为由包括一个或者多个计算机的计算机系统执行，例如，图1所示的系统100。

系统接收由数字组件提供者通过用户界面输入的给定短语(310)。在一些实施方式中，系统接收识别与短语相关联的用户的数据。例如，系统可以接收短语“swordfighter”和用户“Videogame Company”。在这种情况下，系统可以识别可能与用户“Videogame Company”特别有关的短语。

系统通过访问包括每个唯一地识别不同实体的节点的知识图并且通过识别唯一地识别给定短语所提到的实体的特定节点来确定给定短语所提到的实体，其中，知识图的节点通过表示所连接的节点之间的关系的边缘而连接在一起(320)。实体可以被认为是表示短语的类型或者类别。遵循上述示例，系统访问与短语“sword fighter”相关联的节点。系统访问连接至sword fighter节点的节点。节点和边缘中的一些可以指示“发行于2010年”、“是动作游戏”、“在游戏系统上玩”和“由Gamer Game创建”。系统可以将“swordfighter”的实体选择为“游戏系统”，因为该实体可能会引导至在用户“VideogameCompany”的背景下与“sword fighter”更密切相关的其它短语。

通过访问连接了特定节点的实体的其它节点来识别实体的属性(330)。在一些实施方式中，系统可以访问与实体相隔两个等级的节点。例如，与实体“游戏系统”相隔一个等级的节点可以包括该游戏系统的其它视频游戏，诸如“Football Bowl”、“Guitar Player”和“Gun Shooter”。每一种游戏可以包括其它关系，诸如“属于……类型”。游戏FootballBowl属于体育游戏类型。游戏Guitar Player属于音乐游戏类型。游戏Gun Shooter属于动作游戏类型。在这种情况下，这三种属性可以是体育游戏、音乐游戏和动作游戏。

系统选择针对实体而识别到的属性的子集(340)。在一些实施方式中，系统通过应用模型来减少短语的数量。模型可以特定于用户的类型。在这种情况下，用户是视频游戏发行商。基于先前的数据，视频游戏发行商可能会对学习其制作游戏所用的控制台的相似游戏感兴趣。当动作游戏的类型与初始短语sword fighter有关时，系统可以识别动作游戏的类型。通过减少属性的数量，系统减少了系统访问知识图的数目。减少访问数目改善了搜索语音并且允许在系统上运行的其它进程访问数量更多的处理功率和存储，这是因为系统使用更少的资源来遍历知识图。

在一些实施例中，系统通过使用训练数据和机器学习来训练模型。训练数据可以与对于不同类型的用户来说通常较重要的属性和实体有关。游戏控制台制作商可能对为其控制台制作的游戏感兴趣。电视节目制作方可能对具有与其受欢迎的节目中的一些的男演员和作者相同的男演员和作者并且在电视网络上的其它电视节目感兴趣。当更多用户选择系统输出的短语时，可以更新训练数据。利用更新的训练数据，系统可以使用机器学习来更新模型。

系统通过使用针对实体而识别到的属性的子集访问知识图，来识别附加短语(350)。继续动作游戏类型的示例，系统识别具有与动作游戏的属性相同属性的短语。系统可以将“Space Explorer”、“Jungle Fighter”和“Water Shooter”识别为属于动作游戏类型的其它短语。系统也可以确定这些游戏可用于视频游戏控制台“游戏系统”。因为用户正在访问系统以识别用于进行竞拍以显示数字组件的短语，所以控制台制作商可能不想竞拍其它游戏系统的游戏。系统也可以从识别到的短语中进行选择，以将具有更高性能特性的这些短语识别为其它短语。系统可以将识别到的短语的性能特性与初始短语进行比较，并且选择性能特性比初始短语更高的短语。性能特征的一些示例包括短语动作分数。系统用户界面利用可编程控件呈现附加短语中的至少一些，响应于可编程控件的激活，可编程控件将附加短语中的一个或者多个分配为数字组件提供者的数字组件的分发准则(360)。

图4示出了可以用于实施本文所描述的技术的计算装置400和移动计算装置450的示例。计算装置400旨在表示各种形式的数字计算机，诸如，笔记本电脑、台式电脑、工作站、个人数字助理、服务器、刀片服务器、主机和其它合适的计算机。移动计算装置450旨在表示各种形式的移动装置，诸如，个人数字助理、蜂窝电话、智能电话和其它相似的计算装置。此处所示的组件、它们的连接和关系以及它们的功能仅仅意为示例性的，而并不意为限制性的。

计算装置400包括处理器402、存储器404、存储装置406、连接至存储器408和多个高速扩展端口410的高速接口404、以及连接至低速扩展端口412和存储装置406的低速接口414。处理器402、存储器404、存储装置406、高速接口408、高速扩展端口410和低速接口412中的每一个通过使用各种总线而互相连接，并且如有需要，可以安装在公共主板上或者以其它方式被安装。处理器402可以处理在计算装置400内执行的指令，包括：存储在存储器404中或者存储装置406上的用于显示针对在外部输入/输出装置上的GUI的图形信息的指令，外部输入/输出装置诸如为耦合至高速接口408的显示器416。在其它实施方式中，如果需要，可以使用多个处理器和/或多个总线、以及多个存储器和多种类型的存储器。同样，多个计算装置可以与提供部分必要操作的每个装置(例如，服务器阵列、刀片服务器组或者多处理器系统)连接。

存储器404将信息存储在计算装置400内。在一些实施方式中，存储器404是(多个)易失性存储单元。在一些实施方式中，存储器404是非易失性存储单元。存储器404也可以是另一种形式的计算机可读介质，诸如，磁盘或者光盘。

存储装置406能够为计算装置400提供海量存储。在一些实施方式中，存储装置406可以是或者包含计算机可读介质，诸如，软盘装置、硬盘装置、光盘装置或者磁带装置、闪存或者其它相似的固态存储装置、或者装置阵列，包括在存储区域网络或者其它配置中的装置。指令可以存储在信息载体中。指令在由一个或者多个处理装置(例如，处理器402)执行时执行一种或者多种方法，诸如，上述方法。指令也可以由诸如计算机可读介质或者机器可读介质的一个或者多个存储装置(例如，存储器404、存储装置406、或者在处理器402上的存储器)来存储。

高速接口408管理计算装置400的带宽密集型操作，然而低速接口412管理较低带宽密集型操作。这种功能分配仅仅是示例性的。在一些实施方式中，高速接口408耦合至存储器404和显示器416(例如，通过图形处理器或者加速器)，并且耦合至可以接受各种扩展卡的高速扩展端口410。在该实施方式中，低速接口412耦合至存储装置406和低速扩展端口414。可以包括各种通信端口(例如，USB、蓝牙、以太网、无线以太网)的低速扩展端口414可以例如通过网络适配器耦合至一个或者多个输入/输出装置，诸如，键盘、指向装置、扫描器或者诸如为交换机或者路由器的组网装置。

可以按照多种不同形式来实施计算装置400，如图所示。例如，计算装置可以被实施为标准服务器420，或者可以多次被实施为这样的服务器组。另外，计算装置可以被实施在诸如膝上型计算机422的个人计算机中。计算装置也可以被实施为机架式服务器系统424的部分。可替代地，可以将计算装置400的组件与在诸如移动计算装置450的移动装置中的其它组件结合在一起。这种装置中的每一个可以包含计算装置400和移动计算装置450中的一个或者多个，并且整个系统可以由彼此通信的多个计算装置构成。

移动计算装置450包括处理器452、存储器464、诸如显示器454的输入/输出装置、通信接口466、收发器468等。移动计算装置450也可以提供有提供附加存储的存储装置，诸如，微驱动器或者其它装置。处理器452、存储器464、显示器454、通信接口466和收发器468中的每一个通过使用各种总线来互相连接，并且如果需要，组件中的几个可以被安装在公共主板上或者以其它方式被安装。

处理器452可以执行在移动计算装置450内的指令，包括存储在存储器464中的指令。处理器452可以被实施为包括独立的和多个模数处理器的芯片的芯片集。处理器452可以例如针对诸如用户界面的控制的移动计算装置450的其它组件的协调提供由移动计算装置450运行的应用和由移动计算装置450进行的无线通信。

处理器452可以通过耦合至显示器454的控制接口458和显示接口456与用户通信。显示器454可以例如是，TFT(薄膜晶体管液晶显示器)显示器或者OLED(有机电致发光二极管)显示器，或者其它适当的显示技术。显示接口456可以包括用于驱动显示器454向用户呈现图形和其它信息的适当的电路系统。控制接口458可以接收来自用户的命令并且对它们进行转换以提交给处理器452。另外，外部接口462可以提供与处理器452的通信，以使移动计算装置450能够与其它装置进行近场通信。外部接口462可以在一些实施方式中提供有，例如，有线通信，或者在其它实施方式中提供有无线通信，并且也可以使用多个接口。

存储器464将信息存储在计算装置450内。存储器464可以被实施为计算机可读介质或者媒体、(多个)易失性存储单元、或者(多个)非易失性存储单元中的一个或者多个。也可以提供扩展存储器474，并且扩展存储器474可以通过扩展接口472被连接至移动计算装置450，该扩展接口472可以包括，例如，SIMM(单列直插存储器模块)卡接口。扩展存储器474可以为移动计算装置450提供额外存储空间，或者也可以存储移动计算装置450的应用或者其它信息。具体地，扩展存储器474可以包括执行或者补充上述过程的指令，并且也可以包括安全信息。由此，例如，扩展存储器474也可以被提供为移动计算装置450的安全模块，并且可以利用允许安全使用移动计算装置450的指令来对扩展存储器474进行编程。另外，可以经由SIMM卡提供安全应用连同附加信息，诸如，以非可控制方式将识别信息放置在SIMM卡上。

存储器可以包括，例如，闪存和/或NVRAM存储器(非易失性随机存取存储器)，如下面所讨论的。在一些实施方式中，指令存储在信息载体中。指令在由一个或者多个处理装置(例如，处理器452)执行时执行一种或者多种方法，诸如，上述方法。指令也可以由一个或者多个存储装置来存储，诸如计算机可读介质或者机器可读介质(例如，存储器464、扩展存储器474、或者在处理器452上的存储器)。在一些实施方式中，可以在传播信号中接收指令，例如，通过收发器468或者外部接口462。

移动计算装置450可以通过通信接口466进行无线通信，必要时，该通信接口466可以包括数字信号处理电路系统。通信接口466可以提供在各种模式或者协议下的通信，诸如，GSM语音呼叫(移动通信的全球系统)、SMS(短消息服务)、EMS(增强消息服务)、或者MMS消息(多媒体消息服务)、CDMA(码分多址)、TDMA(时分多址)、PDC(个人数字蜂窝系统)、WCDMA(宽带码分多址)、CDMA 2000或者GPRS(通用分组无线业务)等。这种通信可以例如通过使用射频的收发器468发生。另外，短程通信可以发生，诸如，通过使用蓝牙、WiFi、或者其它这种收发器。另外，GPS(全球定位系统)接收器模块470可以将附加导航和位置相关的无线数据发送至移动计算装置450，如果需要，可以由在移动计算装置450上运行的应用使用该数据。

移动计算装置450也可以通过使用音频编解码器460来进行可听通信，该音频编解码器560可以接收来自用户的口头信息，并且将其转换为可用数字信息。音频编解码器460同样可以，诸如通过例如在移动计算装置450的耳机中的扬声器，生成用户可听见的声音。这种声音可以包括来自语音电话呼叫的声音，可以包括录制声音(例如，语音信息、音乐文件等)，并且还可以包括由在移动计算装置450上运行的应用生成的声音。

可以按照多种不同的形式来实施移动计算装置450，如图所示。例如，移动计算装置可以被实施为蜂窝电话480。移动计算装置也可以被实施为智能电话482、个人数字助理、或者其它相似的移动装置的部分。

本文所描述的系统和技术的各种实施方式可以实现在数字电子电路系统、集成电路系统、专门设计的ASIC(专用集成电路)、计算机硬件、固件、软件和/或其组合中。这些各种实施方式可以包括在一个或者多个计算机程序中的实施方式，该一个或者多个计算机程序在可编程系统上是可执行和/或可解释的，该可编程系统包括至少一个可编程处理器，该至少一个可编程处理器可以是专用的或者通用的，该至少一个可编程处理器耦合以接收来自存储系统、至少一个输入装置和至少一个输出装置的数据和指令，并且将指令和数据发送至存储系统、至少一个输入装置和至少一个输出装置。

这些计算机程序(也称为程序、软件、软件应用或者代码)包括针对可编程处理器的机器指令，并且可以用高阶面向过程和/或面向对象的编程语言并且/或者用汇编/机器语言来实施。如本文所使用的，术语“机器可读介质”和“计算机可读介质”指用于将机器指令和/或数据提供至可编程处理器的任何计算机程序产品、设备和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括接收机器指令作为机器可读信号的机器可读介质。术语“机器可读信号”指用于将机器指令和/或数据提供至可编程处理器的任何信号。

为了提供与用户的交互，本文所描述的系统和技术可以被实施在计算机上，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置将输入提供至计算机。其它种类的装置也可以用于提供与用户的交互；例如，向用户提供的反馈可以是任何形式的感官反馈(例如，视觉反馈、听觉反馈或者触觉反馈)；并且可以以任何形式接收来自用户的输入，包括声音、言语或者触觉输入。

本文所描述的系统和技术可以被实施在计算系统中，该计算系统包括后台组件(例如，数据服务器)，或者包括中间件组件(例如，应用服务器)；或者包括前端组件(例如，具有图形用户界面或者网络浏览器的客户端计算机，通过该图形用户界面或者该网络浏览器，用户可以与本文所描述的系统和技术的实施方式交互)；或者包括这种后台组件、中间件组件或者前端组件的任何组合。系统的组件可以通过任何形式或者介质的数字数据通信(例如，通信网络)而相互连接。通信网络的示例包括局域网(LAN)、广域网(WAN)和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般彼此远离，并且通常通过通信网络进行交互。客户端和服务器的关系通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序而产生。

尽管上面已经详细描述了几种实施方式，但是其它实施方式也是可能的。例如，虽然将客户端应用描述为访问(多个)代表，但是，在其它实施方式中，由一个或者多个处理器实施的其它应用——诸如在一个或者多个服务器上执行的应用可以采用(多个)代表。另外，为了获得预期的效果，图中描绘的逻辑流程不要求所显示的特定顺序、或者相继顺序。另外，可以提供其它动作，或者可以从所描述的流程中去除动作，并且可以将其它组件添加到所描述的系统或者从所描述的系统去除。因此，其它实施方式在以下权利要求书的范围内。

Claims

1.一种系统，包括：

前端服务器，所述前端服务器被配置为接收由数字组件提供者通过用户界面输入的给定短语；

知识图遍历器，所述知识图遍历器被配置为确定所述给定短语所提到的实体，其中，所述知识图遍历器通过访问包括节点的知识图并且通过识别特定节点来执行所述确定，所述节点每个唯一地识别不同的实体，所述特定节点唯一地识别所述给定短语所提到的所述实体，其中，所述知识图的所述节点通过表示所连接的节点之间的关系的边缘而连接在一起；以及

属性选择器，所述属性选择器与所述图形遍历器交互并且被配置为：

通过访问连接所述特定节点的所述实体的其它节点来识别所述实体的属性；以及

选择针对所述实体而识别到的所述属性的子集，

其中，所述知识图遍历器进一步被配置为通过使用针对所述实体而识别到的所述属性的子集访问所述知识图来识别附加短语，以及

其中，所述前端服务器更新所述用户界面，以利用可编程控件来呈现所述附加短语中的至少一些，响应于所述可编程控件的激活，所述可编程控件将所述附加短语中的一个或者多个分配为所述数字组件提供者的数字组件的分发准则。

2.根据权利要求1所述的系统，包括：

知识图过滤器，所述知识图过滤器被配置为：当识别到所述附加短语时，减少所述知识图遍历器访问所述知识图的数目。

3.根据权利要求1所述的系统，包括：

短语选择器，所述短语选择器被配置为从所述附加短语中识别具有比所述附加短语中的其它短语更高的性能特性的一个或者多个短语，其中，所述短语选择器通过以下方式来执行所述识别：访问识别到的附加短语的短语动作分数；将所述短语动作分数彼此进行比较；基于所述比较识别具有最高值的所述短语动作分数中的一个或者多个；以及，选择具有拥有最高值的所述短语动作分数的所述附加短语中的一个或者多个。

4.根据权利要求1所述的系统，其中，所述属性选择器进一步被配置为：

通过使用采用机器学习而被连续训练的选择模型来选择与所述实体相关联的所述属性的子集。

5.根据权利要求4所述的系统，其中，所述属性选择器进一步被配置为：

初始时通过使用选择模型训练数据来训练所述选择模型，所述选择模型训练数据包括：与用户提交的先前搜索查询相关联的短语、与所述先前搜索查询相关联的数字组件选择数据、与所述短语相关联的实体、以及与所述实体相关联的属性。

6.根据权利要求1所述的系统，其中，由所述知识图遍历器识别到的附加短语包括所述实体中的最小生成树。

7.一种计算机实现的方法，包括：

接收由数字组件提供者通过用户界面输入的给定短语；

通过访问包括节点的知识图并且通过识别特定节点来确定所述给定短语所提到的实体，所述节点每个唯一地识别不同实体，所述特定节点唯一地识别所述给定短语所提到的所述实体，其中，所述知识图的所述节点通过表示所连接的节点之间的关系的边缘而连接在一起；

通过访问连接所述特定节点的所述实体的其它节点来识别所述实体的属性；

选择针对所述实体而识别到的所述属性的子集，

通过使用针对所述实体而识别到的所述属性的子集访问所述知识图来识别附加短语；以及

更新所述用户界面以利用可编程控件来呈现所述附加短语中的至少一些，响应于所述可编程控件的激活，所述可编程控件将所述附加短语中的一个或者多个分配为所述数字组件提供者的数字组件的分发准则。

8.根据权利要求7所述的方法，包括：

当识别到所述附加短语时，减少所述知识图遍历器访问所述知识图的数目。

9.根据权利要求7所述的方法，其包括：

通过以下方式来从所述附加短语中识别具有比所述附加短语中的其它短语更高的性能特性的一个或者多个短语：访问识别到的附加短语的短语动作分数；将所述短语动作分数彼此进行比较；基于所述比较识别具有最高值的所述短语动作分数中的一个或者多个；以及，选择具有拥有最高值的所述短语动作分数的所述附加短语中的一个或者多个。

10.根据权利要求7所述的方法，包括：

11.根据权利要求10所述的方法，其包括：

12.根据权利要求7所述的方法，其中，识别到的附加短语包括所述实体中的最小生成树。

13.一种存储有软件的非暂时性计算机可读介质，所述软件包括可由一个或者多个计算机执行的指令，所述指令在执行期间使所述一个或者多个计算机执行操作，所述操作包括：

接收由数字组件提供者通过用户界面输入的给定短语；

选择针对所述实体而识别到的所述属性的子集，

14.根据权利要求13所述的介质，其中，所述操作进一步包括：

15.根据权利要求13所述的介质，其中，所述操作进一步包括：

16.根据权利要求13所述的介质，其中，所述操作进一步包括：

17.根据权利要求16所述的介质，其中，所述操作进一步包括：

18.根据权利要求13所述的介质，其中，识别到的附加短语包括所述实体中的最小生成树。