CN107609888B

CN107609888B - 用于查询和投标词之间的点击率预测的系统和方法

Info

Publication number: CN107609888B
Application number: CN201710193252.4A
Authority: CN
Inventors: 杜楠; 李雅亮; 范伟
Original assignee: Baidu USA LLC
Current assignee: Baidu USA LLC
Priority date: 2016-07-11
Filing date: 2017-03-28
Publication date: 2021-08-27
Anticipated expiration: 2037-03-28
Also published as: CN107609888A; US20180012251A1

Abstract

本发明一般涉及用于搜索查询和投标词之间的点击率(CTR)预测的系统和方法。本发明的方面包括使用搜索查询和投标词的向量表示。在实施例中，基于注意的模型用于预测搜索‑投标词对的CTR。在实施例中，给定查询的具有最高CTR预测的投标词用于投放广告。因此，甚至在不与搜索查询精确匹配的情况下也可以使用投标词。

Description

用于查询和投标词之间的点击率预测的系统和方法

技术领域

本发明一般涉及在线广告，并且具体地涉及将用户查询映射到最相关的投标词。

背景技术

在线广告中，目标之一是使广告商将其广告呈现在潜在客户前。换句话说，在线广告商愿意将其广告或网页投放在感兴趣用户将看得见并且有机会响应和购买所广告的产品或服务的地方。

广告商尝试用许多方式实现其目标。一种方式是使用搜索查询来猜测用户的兴趣并且随后将适当的广告或网页呈现在该用户前。一种广告商可以投放其广告的方式是通过投标词的使用。

在在线广告中，投标词被广告商用来推销其产品或服务。投标词是广告商可以投标并购买的术语、短语、问题或句子，例如，“玩具”或“什么是最好的玩具”。在现有技术系统中，当用户例如在搜索引擎中生成查询并且使用投标词时，则响应于用户查询，拥有该精确的投标词的广告商则可以将其广告投放在用户前。

例如，玩具公司可能拥有投标词“玩具”和“什么是最好的玩具”。则该玩具公司可以在用户确实搜索“玩具”或“什么是最好的玩具”时将其广告投放在用户前。然而，如果用户搜索“最好的儿童教育产品”，则该广告商将不会投放其广告，除非其也拥有该投标词。

现有技术解决方案必须具有投标词和查询术语之间的精确匹配，以便触发广告或网页投放。如果搜索查询接近但不精确匹配一个或多个投标词，则广告将不被投放。

因此，需要以使点击率最大化的方式来执行搜索查询术语与投标词之间的映射的系统和方法。

发明内容

根据本发明的第一方面，提供了一种用于训练将查询与一组相关的投标词关联的模型的方法，所述方法包括：接收一组相应的查询、投标词和点击率，每个查询包括一个或多个词；将查询的每个词表示为向量表示；将每个投标词表示为向量表示，每个投标词包括一个或多个词；训练基于注意的模型以向一个或多个查询词的所述向量表示分配权重，并且将一个或多个查询词的加权向量表示与相应的投标词向量表示组合；以及使用相应的点击率的组合以形成用于预测所述查询的所述点击率的回归。

根据本发明的第二方面，提供了一种用于获得用户查询的相关投标词的方法，所述方法包括：接收包括一个或多个查询词的用户查询；以及将所述一个或多个查询词输入到基于注意的模型中，所述基于注意的模型包括：将每个查询词转换成向量表示；将所述查询的所述向量表示的加权组合与一组投标词表示中的每个投标词的投标词向量组合，以便形成一组基于注意的查询-投标词组合向量；将每个基于注意的查询-投标词组合向量输入到用于预测点击率值的回归中；以及输出与所述基于注意的查询-投标词组合相对应的一组投标词，所述基于注意的查询-投标词组合根据所述回归产生高于阈值的点击率值。

根据本发明的第三方面，提供了一种包括一个或多个指令序列的非暂时性计算机可读介质或媒体的系统，所述指令序列在由所述一个或多个处理器执行时，使得执行用于获得用户查询的相关的投标词的步骤，包括：接收包括一个或多个查询词的用户查询；以及将所述一个或多个查询词输入到基于注意的模型中，所述基于注意的模型包括：将每个查询词转换成向量表示；将所述查询的所述向量表示的加权组合与一组投标词表示中的每个投标词的投标词向量组合，以便形成一组基于注意的查询-投标词组合向量；所述向量表示与一组投标词表示组合，以便形成一组基于注意的查询-投标词组合向量；所述向量表示与一组投标词表示组合，以便形成一组基于注意的查询-投标词组合向量；将每个基于注意的查询-投标词组合向量输入到用于预测点击率值的回归中；以及输出与所述基于注意的查询-投标词组合相对应的一组投标词，所述基于注意的查询-投标词组合根据所述回归产生高于阈值的点击率值。

附图说明

将参考本发明的实施例，可以在附图中说明实施例的示例，在附图中，相似部分可以由相同或相似标号来表示。这些附图旨在是说明性而不是限制性的。尽管本发明通常是在这些实施例的上下文中描述，但是应当理解的是，本发明的精神和范围并不旨在限制于这些特定实施例。这些附图绝不限制本领域技术人员在不脱离本发明的精神和范围的情况下对本发明做出形式和细节的任何改变。

图1为描绘了根据本专利文档中的实施例的用于点击率预测的基于注意的模型的训练阶段的框图。

图2为描绘了根据本专利文档中的实施例的用于点击率预测的基于注意的模型的训练阶段的流程图。

图3为描绘了根据本专利文档中的实施例的关联查询和投标词的点击率预测系统的框图。

图4为描绘了根据本专利文档中的实施例的用于点击率预测的基于注意的模型的框图。

图5为描绘了根据本专利文档中的实施例的基于注意的模型的框图。

图6为描绘了根据本专利文档中的实施例的用于点击率预测的基于注意的模型的流程图。

图7为描绘了根据本专利文档中的实施例的计算机系统的框图。

具体实施方式

在下文描述中，出于解释的目的，阐述了具体细节以便提供对本发明的理解。但是，本领域的技术人员将显而易见的是，在没有这些具体细节的情况下，也可以实施本发明。此外，本领域技术人员将认识到的是，下文描述的本发明的实施例可以以诸如过程、装置、系统、设备或方法的多种方式实现在有形性计算机可读介质上。

图中示出的组件或模块是本发明的示例性实施例的说明并且意在避免模糊本发明。还应当理解的是，遍及本论述，组件可以被描述为单独的功能单元，其可以包括子单元，但是本领域技术人员还将认识到的是，各个组件或其部分可以被划分成单独的组件或者可以被集成在一起，包括被集成在单个系统或组件内。应当注意的是，本文论述的功能或操作可以被实现为组件/模块。组件可以用软件、硬件或其组合实现。

此外，附图内的组件或系统之间的连接并不旨在受限于直接连接。此外，这些组件之间的数据可以被修改、重新格式化或其它方式被中间组件改变。此外，可以使用额外的或更少的连接。应当注意的是，术语“耦合”、“连接”或“通信地耦合”应当被理解为包括直接连接、通过一个或多个中间设备的间接连接以及无线连接。

在说明书中对“一个实施例”、“优选实施例”“一实施例”或“实施例”的引用意指结合实施例描述的特定特征、结构、特性或功能被包括在本发明的至少一个实施例中并且可以在一个以上的实施例中。此外，上述短语在说明书各个地方的出现不必都指代相同的一个实施例或多个实施例。

某些术语在说明书各处的使用是为了说明而不应当被解释为进行限制。服务、功能或资源不受限于单个服务、功能或资源；这些术语的使用可以指代有关服务、功能或资源(其可以被分布或聚集)的分组。此外，存储器、数据库、信息库、数据存储、表格、硬件等的使用可以在本文中用于指代可以将信息输入或以其它方式记录在其中的系统组件。此外，某些术语在说明书各处的使用是为了说明而不应当被解释为进行限制。本文使用的任何标题仅是出于组织的目的并且不应当用于限制本描述或权利要求书的范围。本专利文件中提及的每个引用的全部内容通过引用的方式并入本文。

应当注意到的是：(1)可以有选择地执行某些步骤；(2)步骤可以不受限于本文阐述的特定次序；(3)可以以不同的次序来执行某些步骤；以及(4)可以并发地完成某些步骤。

在各个实施例中，本发明与涉及基于注意的模型的、存储在一个或多个非暂时性计算机可读介质上的设备、系统、方法和指令有关。这种存储在一个或多个非暂时性计算机可读介质上的设备、系统、方法和指令，除了其它优点外，可以产生将查询关联到投标词的点击率的预测。

还应当注意的是，尽管本文描述的实施例可以在将查询与投标词关联的环境下，但是当前专利文档的发明元素并不受限于此。因此，本发明元素可以应用或适用于其它环境。

在在线广告中，目标之一是使广告商将其广告或网页呈现在潜在客户前。换句话说，在线广告商愿意将其广告或网页投放在感兴趣用户将看得见并且有机会响应和购买所广告的产品或服务的地方。

广告商尝试用许多方式实现其目标。一种方式是使用搜索查询来猜测用户的兴趣并且随后将适当的广告呈现在该用户前。一种广告商可以投放其广告的方式是通过投标词的使用。投标词是广告商可以投标并购买的术语、短语、问题或句子，例如，“玩具”或“什么是最好的玩具”。

在实施例中，不与搜索查询精确匹配的投标词可以触发与该投标词相关联的广告投放。在实施例中，本文描述的系统和方法可以根据特定的搜索查询，基于预测的点击率(CTR，Click Through Rate)来对投标词进行排名并且使用最高排名的投标词来返回广告或网页。CTR是点击特定链接的用户与浏览某个网页的总用户数的比率。向相应的查询建议适当的投标词可以显著地提高网页的点击能力和转换率。

在实施例中，本文描述的系统和方法向用户查询建议相关的投标词。在实施例中，基于注意的模型使揭示搜索查询中的哪些词对最终提供投标词贡献最大成为可能。该预测可以有助于广告商更好地理解其用户的注意。

图1为描绘了根据本专利文档中的实施例的用于点击率预测的基于注意的模型的训练阶段的框图。图1示出了使用深度学习技术的基于注意的模型的训练阶段。

本文描述的实施例的系统通过提供将查询映射到投标词并且确定查询中的哪些关键字对最终提供投标词贡献最大(这将有助于广告商更好地理解其用户的注意)的系统和方法，来改善现有技术的广告系统。将高质量的投标词链接到用户查询带来提高的广告点击能力和增加的转换率。市场规模达数千万美元。

在实施例中，为了使用基于注意的模型来预测每个查询-投标词对的CTR，可以训练模型来学习用户行为。在图1中示出了学习系统架构。图1示出了将一组查询词输入到向量表示生成器115中。图1还示出了将一组投标词输入到向量表示生成器115中。

在实施例中，向量表示生成器115将词(查询词或投标词)转换成向量表示。向量表示生成器115可以使用用于实现向量表示的任何方法。用于向量表示的各种方法包括但不限于：跳-克模型或连续词袋(Word2Vec)、GloVe、一热表示或其它词嵌入表示。

向量表示生成器115将词作为输入并且输出1维向量表示。在实施例中，投标词由单个1维向量表示。

向量表示生成器115在连续向量空间中表示词，其中，在语义上类似的词被映射到附近点。在实施例中，向量表示使用关于出现在相同上下文中的词共享语义含义的概念。

Word2Vec方法使用模型组来产生词嵌入。这些模型可以是浅层的，被训练用于重构词的语言上下文的两层神经网络。

GloVe是用于获取词的向量表示的无监督学习算法。

一热表示向词汇中的每个词分配号码并且通过使用全零和一个“1”来表示号码，以便指示与关联于词的号码相关联的位置。

图1示出了被用作基于注意的模型130的输入的查询词向量表示120、投标词向量表示125和相应的CTR值140。在实施例中，投标词向量表示是单个投标词向量表示。在实施例中，可以通过使用投标词中的每个词的向量表示并且取这些向量表示的平均来计算单个投标词向量表示。在实施例中，可以使用递归神经网络(RNN)来实现单个投标词表示。

基于注意的模型130向每个词分配概率并且将概率组合成加权概率。

在实施例中，使用了查询词q1，q2，q3，…qN，它们是在根据查询的词分段之后获得的。每个表示是1维向量。在实施例中，使用投标词的一词嵌入表示b，其是1维向量。在实施例中，还使用针对相应查询和投标词的CTR值c。

实施例可以使用如下函数：

其中pi＝Wp*(qi+b)是分配给每个查询词的概率；W是D乘1维矩阵，其将所组合的表示

从D维投影到1维；Wp是用于测量每个查询词与投标词之间的关系的矩阵。因此，如公式所示，模型学习与投标词相对应的每个查询词的概率pi(这是根据qi和b来计算pi的原因)。可以对该表示进行加权和组合以经由归一化对CTR值c进行回归。在实施例中，可以通过以上公式经由梯度下降来实现用于学习pi、W和Wp的所有参数。

在实施例中，加权概率是CTR预测。使用图1的架构，基于注意的模型130可以学习各种查询术语和投标词对的CTR。

图2为描绘了根据本专利文档中的实施例的用于点击率预测的基于注意的模型的训练阶段的流程图。图2示出了与图1的系统架构相关联的流程。图2示出了接收一组相应的查询、投标词和点击率，查询中的每个查询包括一个或多个词205。图2还示出了将每个查询词表示为向量表示210。如图1中，向量表示可以使用任何向量表示来实现，包括但不限于：跳-克模型或连续词袋(Word2Vec)、GloVe、一热表示或其它词嵌入表示。在实施例中，可以将投标词表示为单个向量。

图2示出了将每个投标词表示为向量表示，每个投标词包括一个或多个词215。在实施例中，投标词向量表示是单个投标词向量表示。在实施例中，可以通过使用投标词中的每个词的向量表示并且取这些向量表示的平均来计算单个投标词向量表示。在实施例中，可以使用递归神经网络(RNN)来实现单个投标词表示。

图2示出了使用基于注意的模型来获得每个投标词和相应查询的加权计算表示并且生成点击率的回归模型220。在实施例中，基于注意的模型分配与每个词相关联的概率并且随后计算组合加权概率。在实施例中，可以使用参照图1描述的公式(1)来获得加权概率和CTR。

图3为描绘了根据本专利文档中的实施例的关联查询和投标词的点击率预测系统的框图。图3示出了高级的CTR预测的系统架构。一旦基于注意的模型已经学习了CTR和查询，其就可以用于预测任何查询的CTR。

查询可以是单个词或短语。在一些语言中，查询输入A/B/C/D 305可以被输入到分段模块310中。分段模块310将查询分段成其部分A、B、C和D 315。映射320用于将查询与投标词列表325进行比较并且预测CTR 330。映射320可以使用如关于图4描述的基于注意的模型。

在现有技术系统和方法中，映射仅能够进行直接比较。因此，如果查询词315恰好是投标词列表325上的投标词，则将返回该投标词。然而，在实施例中，即使当查询词315不与投标词列表325上的投标词精确匹配时，也可以基于预测的CTR来返回投标词。

例如，搜索查询可以是短语“给我的儿子的一个玩具”。该搜索查询可以被分段成词“一个”、“玩具”、“给”、“我的”和“儿子”。每个词将被映射到投标词，即使不存在与投标词的精确匹配。在实施例中，可以基于CTR预测来对投标词进行打分。

图4为描绘了根据本专利文档中的实施例的用于点击率预测的基于注意的模型的框图。图4示出了作为向量表示生成器425的输入的查询词：词1405、词2420至词N 415。在实施例中，向量表示生成器425将词(查询词或投标词)转换成向量表示。向量表示生成器425可以使用用于实现向量表示的任何方法。用于向量表示的各种方法包括但不限于：跳-克模型或连续词袋(Word2Vec)、GloVe、一热表示或其它词嵌入表示。

向量表示生成器425将词作为输入。向量表示生成器425输出向量表示。向量表示生成器425在连续向量空间中表示词，其中，在语义上类似的词被映射到附近点。在实施例中，向量表示使用关于出现在相同上下文中的词共享语义含义的概念。

Word2Vec方法使用模型组来产生词嵌入。这些模型可以是被训练用于重构词的语言上下文的浅的两层神经网络。

GloVe是用于获取词的向量表示的无监督学习算法。

在实施例中，投标词向量表示是单个投标词向量表示。在实施例中，可以通过使用投标词中的每个词的向量表示并且取这些向量表示的平均来计算单个投标词向量表示。在实施例中，可以使用递归神经网络(RNN)来实现单个投标词表示。

在实施例中，图4示出了用作基于注意的模型450的查询词向量表示：词1表示q1430、词2表示q2435、词N表示qN 440。每个向量表示是1维向量。在实施例中，投标词可以被表示为单个1维向量。

一旦已经对模型进行很好地训练，输入就可以是查询词并且就可以使用下面的公式来预测投标词和相应CTR值：

在实施例中，基于注意的模型450向每个词分配概率并且将概率组合成加权概率。在实施例中，加权概率是CTR预测。

使用图4的架构，基于注意的模型可以预测各种查询术语和投标词对的CTR。基于注意的模型输出CTR预测455。下文将关于图5描述基于注意的模型450。

将上文参照图3的其中查询是“给我的儿子的一个玩具”示例应用于图4中示出的实施例，查询被划分成词。词1405将是一个。词2410将是“玩具”。词3将是“给”。词4将是“我的”。词6将是“儿子”。在实施例中，可以使用向量表示425将每个词和投标词表示为向量。

词1405、词2410、词3、词4、词5、词6的向量表示和投标词表示445可以用作基于注意的模型450的输入。在实施例中，基于注意的模型450还将概率组合成分数，其是针对查询-投标词对的CTR预测。

在实施例中，CTR预测由投标选择器460用来选择最高得分投标词。在实施例中，最高得分投标词可以被页面返回器465用于基于最高得分投标词来确定响应于查询要返回给用户的广告或网页。由于CTR已经被预测，因此使用最高得分投标词来返回广告或网页将增大搜索结果的CTR。

可以对其它投标词迭代地运行基于注意的模型以利用该特定查询来预测其它投标词的分数。本领域技术人员将理解，上文示例旨在仅是示例性的而不是限制性的。

图5为描绘了根据本专利文档中的实施例的基于注意的模型的框图。图5更加详细地示出了基于注意的模型450。图5示出了基于注意的模型450将词1-n 505、510和515的向量表示作为输入。向量表示输入505、510和515被输入到概率预测器520。投标词或投标词组合550的向量表示也被输入到概率预测器520中。投标词组合550可以是投标词向量表示的平均或可以使用递归神经网络(RNN)来实现组合投标词。投标词组合550可以是单个投标词或投标词组合的向量表示。概率预测器520和组合器540实现参照图4描述的公式(2)中的公式。

概率预测器520向每个词分配与特定投标词相关联的概率。概率预测器示出与每个词525、530和535相关联的概率。每个概率525、530和535被输入到组合器540。组合器540取概率的加权组合以输出单个概率或CTR。单个概率表示特定投标词或投标词组合的查询的点击率(基于注意的模型的一组词输入)。可以关于多个投标词或投标词组合来运行基于注意的模型以确定最高排名的投标词。

组合器540可以执行概率的任何组合。在实施例中，使用加权平均。在实施例中，使用递归神经网络(RNN)来组合概率。

在实施例中，组合器的输出是CTR预测。CTR预测可以用于响应搜索查询来投放广告或网页。可以基于CTR预测来识别一组最高得分投标词。最高得分投标词可以用于投放广告或网页。例如，在上文示例中，投标词可以是“男孩玩具”。投标词“男孩玩具”的所有者具有可以被投放以响应于查询“给我的儿子的玩具”的相应广告或网页。

图6为描绘了根据本专利文档中的实施例的用于点击率预测的基于注意的模型的流程图。图6显示接收用户查询605。图6示出了将用户查询的词表示为向量表示610。图6还显示将投标词表示为向量表示615。在实施例中，词向量表示和投标词表示被输入到基于注意的模型以预测CTR 620。基于CTR预测，可以选择最高投标词的选择。这些最高投标词可以用于向搜索页返回结果630。

再次，返回到上文示例，在实施例中，可以基于可能的投标词“男孩玩具”、“玩具”、“儿童玩具”(如果其在CTR预测中得分最高)来返回网页。

本领域技术人员将理解，作为本发明的结果的各种益处是可用的。

本领域技术人员将理解，作为本发明的结果的一个益处是用于如下操作的能力：根据特定搜索查询，基于预测的CTR来对投标词进行排名并且使用最高排名的投标词来返回广告或网页。

本专利文档的方面涉及计算系统。为了本公开内容的目的，计算系统可以包括可操作用于计算、运算、确定、分类、处理、发送、接受、取回、产生、路由、切换、存储、显示、通信、表明、检测、记录、重新产生、处置或利用任意形式的信息、智能或用于商业、科学、控制或其它目的。例如，计算系统可以是个人计算机(例如，桌上型计算机或膝上型计算机)、平板计算机、移动设备(例如，个人数字助理(PDA)或智能电话)、服务器(例如，刀片服务器或机架服务器)、网络设备、或任何其它适当的设备并且大小、形状、性能、功能和价格可以变化。计算系统可以包括随机存取存储器(RAM)、一个或多个处理资源(诸如中央处理单元(CPU))或硬件或软件控制逻辑、ROM、和/或其它类型的存储器。计算系统的额外组件可以包括一个或多个磁盘驱动、用于与外部设备进行通信的一个或多个网络端口以及各种输入输出(I/O)设备，诸如键盘、鼠标、触摸屏和/或视频显示器。计算系统还可以包括可操作用于在各个硬件组件之间发送通信的一个或多个总线。

图7为描绘了根据本发明的实施例的计算系统700的框图。将理解的是，系统700示出的功能可操作用于支持计算系统的各个实施例-尽管应当理解的是，计算系统可以以不同的方式被配置并且包括不同的组件。如图7所示，系统700包括提供计算资源和控制计算机的一个或多个中央处理单元(CPU)701。CPU 701可以利用微处理器等来实现，并且还可以包括一个或多个图形处理单元(CPU)717和/或用于数学计算的浮点型协处理器。系统700还可以系统存储器702，其可以是以随机存取存储器(RAM)、只读存储器(ROM)或两者的形式。

还可以提供多个控制器和外围设备，如图7所示。输入控制器703表示到各个输入设备的接口704，诸如键盘、鼠标或手写笔。还可以有扫描仪控制器705，其与扫描仪706进行通信。系统700还可以包括用于与一个或多个存储设备708进行对接的存储控制器707，存储设备708中的每一个可以包括用于记录用于操作系统、效用和应用的指令的程序的存储介质，诸如磁带或磁盘、或光学介质，这可以包括实现本发明的各个方面的程序的实施例。存储设备708还可以用于存储处理的数据或要根据本发明进行处理的数据。系统700还可以包括用于提供到显示设备711的接口的显示控制器709，显示设备711可以是阴极射线管(CTR)、薄膜晶体管(TFT)显示器或其它类型的显示器。计算系统700还可以包括用于与打印机713进行通信的打印机控制器712。通信控制器714可以与一个或多个通信设备715对接，这使系统700能够通过包括互联网、以太网云、基于以太网的光纤信道(FCoE)/数据中心桥(DCB)云、局域网(LAN)、广域网(WAN)、存储域网(SAN)的多种网络中的任何网络或者包括红外信号的任何适当的电磁载波信号连接到远程设备。

在所示出的系统中，所有主要组件可以连接到总线716，其可以表示一个以上的物理总线。然而，各个系统组件可以在或可以不在彼此的物理接近域中。例如，可以将输入数据和/或输出数据从一个物理位置远程地发送到另一个物理位置。另外，可以通过网络从远程位置(例如，服务器)接入实现本发明的各个方面的程序。这样的数据和/或程序可以通过多种机器可读介质中的任何一种来传送，机器可读介质包括但不限于：磁介质，诸如硬盘、软盘和磁带；光介质，诸如CD-ROM和全息设备；磁光介质；和专门配置为存储或存储并执行程序代码的硬件设备，诸如专用集成电路(ASIC)、可编程逻辑设备(PLD)、闪存设备、以及ROM和RAM设备。

本发明的实施例可以被编码在具有一个或多个非暂时性计算机可读介质上，其具有针对一个或多个处理器或处理单元的指令使得多个步骤被执行。应当注意的是，一个或多个非暂时性计算机可读介质应当包括易失性和非易失性存储器。应当注意的是，替代的实现方式是可能的，包括硬件实现方式或软件/硬件实现方式。硬件实现的功能可以使用ASIC、可编程阵列、数字信号处理电路等来实现。因此，任何权利要求中的“单元”术语旨在覆盖软件和硬件实现方式两者。类似地，如本文所使用的，术语“计算机可读介质或介质”包括具有体现在其上的指令的程序的软件和/或硬件、或其组合。记住了这些替代的实现方式，要理解的是，附图和所附描述提供本领域技术人员编写程序代码(即，软件)和/或制造电路(即，硬件)所要求的功能信息以执行所要求的处理。

应当注意的是，本发明的实施例还可以涉及具有非暂时性、有形计算机可读介质的计算机产品，非暂时性、有形计算机可读介质其上具有用于执行各种计算机实现的操作的计算机代码。介质和计算机代码可以是出于本发明的目的专门设计和构建的那些介质和计算机代码，或者它们可以是对于相关领域技术人员已知或可用的类型。有形计算机可读介质的示例包括但不限于：磁介质，诸如硬盘、软盘和磁带；光介质，诸如CD-ROM和全息设备；磁光介质；和专门配置为存储或存储并执行程序代码的硬件设备，诸如专用集成电路(ASIC)、可编程逻辑设备(PLD)、闪存设备、以及ROM和RAM设备。计算机代码的示例包括机器代码，诸如有编译器产生的，以及由计算机使用解释器执行的包含较高级代码的文件。本发明的实施例可以全部或部分地作为可以在处理设备所执行的程序模块中的机器可执行指令来实现。程序模块的示例包括库、程序、例程、对象、组件和数据结构。在分布式计算环境中，程序模块可以物理地位于是本地、远程或两者的设置中。

本领域技术人员将认识到，没有计算系统或编程语言对于本发明的实践是关键的。本领域技术人员还将认识到，上文描述的多个元素可以被物理地和/或功能地分离成子模块或组合在一起。

本科领技术人员将理解，先前示例和实施例是示例性的并且不限制本发明的范围。期望的是，在阅读本说明书和学习附图之后对于本领域技术人员显而易见的所有排列、增强、等效物、组合和其改进被包括在本发明的精神和范围内。

应当注意的是，可以以不同的方式配置下文权利要求的元素，包括具有多个从属性、配置和组合。例如，在实施例中，各个权利要求的主题可以与其它权利要求组合。

Claims

1.一种用于训练对投标词进行预测的模型的方法，所述方法包括：

接收一组查询、投标词和点击率，每个查询包括一个或多个查询词；

将查询的每个查询词表示为查询词向量表示；

将每个投标词表示为投标词向量表示，每个投标词包括一个或多个词；

训练基于注意的模型以获取所述一组查询、投标词和点击率中查询-投标词的组合表示，对于每个查询，查询-投标词的所述组合表示包括以下a）和b）的组合，其中：

a）是所述查询的所有查询词的查询词向量表示的加权组合，其中，查询词向量表示的加权组合通过向所述查询的每个查询词分配所述每个查询词与对应于所述查询的投标词相关联的概率以对所述每个查询词的查询词向量表示进行加权并且然后将加权后的所述查询词向量表示进行组合而获得，以及

b）是对应于所述查询的投标词的投标词向量表示，所述投标词向量表示为单个向量表示；以及

使用所述组合表示和对应于每个投标词的点击率以形成用于预测查询的点击率值的回归模型。

2.根据权利要求1所述的方法，还包括将查询分段成多个部分。

3.根据权利要求1所述的方法，其中，每个投标词和对应的查询的加权计算表示被输入到输出所述点击率的所述回归模型。

4.根据权利要求1所述的方法，其中，通过对投标词中每个词的向量表示进行平均来实现每个投标词的单个向量表示。

5.根据权利要求1所述的方法，其中，所述单个向量表示使用递归神经网络来实现。

6.根据权利要求1所述的方法，其中，所述查询词向量表示使用查找表来获得。

7.根据权利要求1所述的方法，其中，将所述查询与对应的投标词关联的所述回归模型用于获得查询的一组对应的投标词。

8.一种用于获得与用户查询对应的投标词的方法，所述方法包括：

接收包括一个或多个查询词的用户查询；以及

将所述一个或多个查询词输入到基于注意的模型中，所述基于注意的模型包括：

将每个查询词转换成查询词向量表示；

将所述用户查询的所述查询词向量表示的加权组合与一组投标词中的每个投标词的投标词向量表示组合，以便形成一组基于注意的查询-投标词组合表示，其中，对于每个投标词，查询-投标词的所述组合表示包括以下a）和b）的组合，其中：

a）是所述用户查询的所有查询词的查询词向量表示的加权组合，其中，查询词向量表示的加权组合通过向所述用户查询的每个查询词分配所述每个查询词与所述投标词相关联的概率以对所述每个查询词的查询词向量表示进行加权并且然后将加权后的所述查询词向量表示进行组合而获得，以及

b）是所述投标词的投标词向量表示，所述投标词向量表示为单个向量表示；

将每个基于注意的查询-投标词组合表示输入到用于预测点击率值的回归模型中；以及

输出与所述基于注意的查询-投标词组合表示对应的一组投标词，所述基于注意的查询-投标词组合表示根据所述回归模型产生高于阈值的点击率值。

9.根据权利要求8所述的方法，还包括将所述用户查询分段成多个部分。

10.根据权利要求8所述的方法，其中，所述将每个查询词转换成查询词向量表示使用查找表以将所述查询词转换成查询词向量表示。

11.根据权利要求8所述的方法，其中，所述单个向量表示使用递归神经网络来实现。

12.根据权利要求8所述的方法，其中，所述单个向量表示使用投标词中的每个词的向量表示的平均向量表示来实现。

13.根据权利要求8所述的方法，其中，还包括基于输出的一组投标词来返回搜索页。

14.一种非暂时性计算机可读介质，所述非暂时性计算机可读介质上存储有一个或多个指令序列，所述指令序列在由一个或多个处理器执行时，使得执行用于获得与用户查询对应的投标词的步骤，包括：

接收包括一个或多个查询词的用户查询；以及

将每个查询词转换成查询词向量表示；

将所述用户查询的所述查询词向量表示的加权组合与一组投标词中的每个投标词的向量表示组合，以便形成一组基于注意的查询-投标词组合表示，其中，对于每个投标词，查询-投标词的所述组合表示包括以下a）和b）的组合，其中：

输出与所述基于注意的查询-投标词组合对应的一组投标词，所述基于注意的查询-投标词组合表示根据所述回归模型产生高于阈值的点击率值。

15.根据权利要求14所述的非暂时性计算机可读介质，其中，所述步骤还包括将用户查询分段成多个部分。

16.根据权利要求14所述的非暂时性计算机可读介质，其中，所述步骤还包括基于输出的一组投标词来返回搜索页。