CN111738805A

CN111738805A - 基于行为日志的搜索推荐模型生成方法、设备和存储介质

Info

Publication number: CN111738805A
Application number: CN202010700787.8A
Authority: CN
Inventors: 王江伟
Original assignee: Beijing Missfresh Ecommerce Co Ltd
Current assignee: Shenzhen Shunneng Energy Co.,Ltd.
Priority date: 2020-07-20
Filing date: 2020-07-20
Publication date: 2020-10-02
Anticipated expiration: 2040-07-20
Also published as: CN111738805B

Abstract

本公开提供了基于行为日志的搜索推荐模型生成方法、设备和存储介质。所述方法包括：获取预设时间段内的用户行为日志；将所述商品信息中点击率高于预设阈值的商品信息作为训练正样本；将所述商品信息中点击率低于预设阈值的商品信息作为第一子训练负样本；按照预设条件从所述训练正样本所属品类和上级品类中选取商品信息作为第二子训练负样本；将所述第一子训练负样本和所述第二子训练负样本进行融合，生成训练负样本；利用所述训练正样本和所述训练负样本对神经网络模型进行训练，生成搜索推荐模型。以此方式，能够提高搜索推荐模型推荐结果的准确率，进而提高用户体验。

Description

基于行为日志的搜索推荐模型生成方法、设备和存储介质

技术领域

本公开的实施例一般涉及互联网技术领域，并且更具体地，涉及基于行为日志的搜索推荐模型生成方法、设备和存储介质。

背景技术

电子商务是在全球各地广泛的商业贸易活动中，在因特网开放的网络环境下，基于浏览器/服务器应用方式，买卖双方不谋面地进行各种商贸活动，实现消费者的网上购物的一种商业运营模式。由于通过网络贩卖商品，不受地理位置的限制，并且能够较好地控制运营成本，如无需实体店面、人员需求也较少等，因此以较低的售价吸引着越来越多的用户。

随着电子商务的发展和成熟，网络购物平台也不断的推出各种人性化服务，例如：为了使用户能够更快捷的找到想要的商品，网络购物平台会根据用户的搜索请求信息与商品的相关性为用户推荐相关商品链接，使用户通过窗口链接，直观的获取商品信息。

但是，现有技术中的搜索结果并非完全取决于相关性，原因在于现有技术采用的负样本策略无法采集到足够的有效的负样本，使得现有的搜索推荐模型生成的推荐结果不准确，影响用户体验。

发明内容

有鉴于此，根据本公开的实施例，提供了一种满足提高搜索推荐模型推荐结果准确率，进而提高用户体验的基于行为日志的搜索推荐模型生成方案。

在本公开的第一方面，提供了一种基于行为日志的搜索推荐模型生成方法，包括：

获取预设时间段内的用户行为日志，所述行为日志包括用户的搜索请求和用户对根据搜索请求返回的商品信息的响应动作；

将所述商品信息中点击率高于预设阈值的商品信息作为训练正样本；

将所述商品信息中点击率低于预设阈值的商品信息作为第一子训练负样本；

按照预设条件从所述训练正样本所属品类和上级品类中选取商品信息作为第二子训练负样本；

将所述第一子训练负样本和所述第二子训练负样本进行融合，生成训练负样本；

利用所述训练正样本和所述训练负样本对神经网络模型进行训练，生成搜索推荐模型。

如上所述的方面和任一可能的实现方式，在所述将所述商品信息中点击率高于预设阈值的商品信息作为训练正样本之前，还包括：

根据所述搜索请求对所述响应动作进行分组，将所述响应动作划分为多个响应动作组，每个响应动作组关联一个搜索请求。

如上所述的方面和任一可能的实现方式，所述根据所述搜索请求对所述响应动作进行分组，将所述响应动作划分为多个响应动作组，每个响应动作组关联一个搜索请求，具体包括：

根据搜索请求的关键词之间的相关性对所述响应动作进行分组，将相关性高于预设阈值的关键词对应的搜索请求合并为同一个搜索请求，从而将所述响应动作划分为多个响应动作组，每个响应动作组关联一个搜索请求。

如上所述的方面和任一可能的实现方式，所述响应动作分为未点击响应动作和点击响应动作，其中，所述点击响应动作又可以进一步划分为点击浏览、点击加车和点击购买；

所述将所述商品信息中点击率高于预设阈值的商品信息作为训练正样本，包括：

将所述商品信息中点击浏览率和/或点击加车率和/或点击购买率高于预设阈值的商品信息作为训练正样本。

如上所述的方面和任一可能的实现方式，所述将所述商品信息中点击浏览率和/或点击加车率和/或点击购买率高于预设阈值的商品信息作为训练正样本，包括：

按照预设比例将所述商品信息中点击浏览率和/或点击加车率和/或点击购买率高于预设阈值的商品信息作为训练正样本。

如上所述的方面和任一可能的实现方式，所述将所述第一子训练负样本和所述第二子训练负样本进行融合，生成训练负样本，包括：

按照预设比例将所述第一子训练负样本和所述第二子训练负样本进行融合。

如上所述的方面和任一可能的实现方式，还包括：

从所述训练正样本所属的不同品类下选取预设比例的商品信息作为第三子训练负样本；

所述将所述第一子训练负样本和所述第二子训练负样本进行融合，生成训练负样本，包括：

将所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本进行融合，生成训练负样本。

如上所述的方面和任一可能的实现方式，所述将所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本进行融合，生成训练负样本包括：

按照预设比例将所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本进行融合，生成训练负样本。

如上所述的方面和任一可能的实现方式，还包括：

按照预设时间间隔根据用户针对每组训练负样本对应的搜索推荐模型推荐的商品的响应动作对预设比例进行优化调整。

如上所述的方面和任一可能的实现方式，还包括：

响应于接收到当前用户的当前搜索请求，将所述当前搜索请求输入所述搜索推荐模型，输出推荐信息；

根据所述推荐信息和所述当前搜索请求的关键词的相关性对所述推荐信息进行排序，并将排序后的推荐信息推送给当前用户。

在本公开的第二方面，提供了一种电子设备，包括存储器和处理器，所述存储器上存储有计算机程序，所述处理器执行所述程序时实现如以上所述的方法。

在本公开的第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如以上所述的方法。

应当理解，发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征，亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。

通过本公开的实施例的基于行为日志的搜索推荐模型生成方案，能够采集到足够的有效的负样本，使得现有的搜索推荐模型生成的推荐结果更加准确，从而提高用户体验。

附图说明

结合附图并参考以下详细说明，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中，相同或相似的附图标记表示相同或相似的元素，其中：

图1示出了本公开实施例一的基于行为日志的搜索推荐模型生成方法的流程图；

图2示出了本公开实施例二的基于行为日志的搜索推荐模型生成方法的流程图；

图3示出了本公开实施例三的基于行为日志的搜索推荐模型生成设备的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的全部其他实施例，都属于本公开保护的范围。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

如图1所示，为本公开实施例一的基于行为日志的搜索推荐模型生成方法的流程图。从图1中可以看出，本实施的基于行为日志的搜索推荐模型生成方法，可以包括以下步骤：

S101：获取预设时间段内的用户行为日志，所述行为日志包括用户的搜索请求和用户对根据搜索请求返回的商品信息的响应动作。

当前采用的负样本策略生成模型的过程中，一般会将一次搜索会话中曝光但未被点击/加车/购买的商品作为负样本，被点击/加车/购买的商品作为正样本。在搜索结果中，大部分结果都是相关的，用户是否点击/加车/购买商品还受价格、喜好等多种因素影响，并非完全取决于相关性。未被点击/加车/购买的商品只有少数是确实不相关的。负样本策略无法采集到足够有效的不相关样本，部分相关的商品会出现在负样本中，形成噪音数据影响相关性模型的效果。

本实施例的基于行为日志的搜索推荐模型生成方法，用于根据用户的历史行为日志中的搜索请求以及用户对根据搜索请求返回的商品信息的响应动作来采集模型训练样本，进而对搜索推荐模型进行训练，生成搜索推荐模型，并利用生成的搜索推荐模型根据用户的搜索请求为用户推荐商品，使得推荐结果更加准确。本实施例中的用户行为日志通常是指多个用户的行为日志，

此外，在本公开实施例的一些其他具体实施方式中，上述用户行为日志也可以是对用户进行聚类后，每一类的用户的行为日志，或者也可以是针对单一用户的行为日志。

具体地，以电子商务APP为例对本申请的技术方案进行说明。APP中可以设置有搜索框，用户可以通过在搜索框内输入商品的相关信息，并点击搜索按钮，即可发送搜索请求。后端服务器接收到搜索请求后，根据搜索请求中的商品的相关信息中的关键词，从商品文档库中进行匹配，确定与该关键词相关的商品文档，进而确定与该关键词相关的商品，并将商品的信息反馈给用户。例如，用户输入的搜索请求为“蔬菜”，则反馈的商品信息可以是“菠菜苗250g”、“平价芹菜200g”或“新鲜生菜500克”等商品的信息。用户针对反馈的商品信息可以进行点击浏览，可以进一步地加入购物车，或者也可以再进一步地支付购买。用户针对反馈信息的操作即为响应动作。并且，用户的搜索请求和用户对根据搜索请求返回的商品信息的响应动作会通过APP以行为日志的方式进行数据存储。当利用本实施例的方法生成搜索推荐模型时，可以获取预设时间段内的用户的行为日志。

在一些实施例中，该预设时间段可以为两周，或者也可以根据实际需要确定预设时间段的具体时长，例如一个月、一季度、半年等。

S102：将所述商品信息中点击率高于预设阈值的商品信息作为训练正样本。

在本实施中，用户针对反馈的商品信息可以进行点击浏览，可以进一步地加入购物车，或者也可以再进一步地支付购买，当然，如果反馈的商品信息不是用户预期得到的商品信息，则用户可以对反馈的商品信息不进行任何操作，例如可以在搜索框中重新输入新的商品信息，例如将“蔬菜”换为“水果”进行重新搜索。并且，针对相似的搜索信息反馈的商品信息也可能是相同的。但是，针对相同的反馈信息，不同用户的响应动作可能是不同的。本实施例中，所述响应动作分为未点击响应动作和点击响应动作，其中，所述点击响应动作又可以进一步划分为点击浏览、点击加车（点击加入购物车）和点击购买。通过对预设时间段内的用户的行为日志统计，将所述商品信息中点击率高于预设阈值的商品信息作为训练正样本。

在一些具体实施例中，将所述商品信息中点击率高于预设阈值的商品信息作为训练正样本，可以是将所述商品信息中点击浏览率高于预设阈值的商品信息作为训练正样本，或者，也可以是将所述商品信息中点击加车率高于预设阈值的商品信息作为训练正样本，再或者是将所述商品信息中点击购买率高于预设阈值的商品信息作为训练正样本。

此外，在一些实施例中，将所述商品信息中点击率高于预设阈值的商品信息作为训练正样本，可以是将商品信息中点击浏览率高于预设阈值的商品信息、点击加车率高于预设阈值的商品信息和点击购买率高于预设阈值的商品信息中的两种作为训练正样本。

或者，可以从商品信息中点击浏览率高于预设阈值的商品信息、点击加车率高于预设阈值的商品信息和点击购买率高于预设阈值的商品信息中按比例选取商品信息，作为训练正样本。例如，可以从点击浏览率高于预设阈值的商品信息中选取20%的商品信息，从点击加车率高于预设阈值的商品信息中选取30%的商品信息，从点击购买率高于预设阈值的商品信息中选取40%的商品信息。通过提高点击购买率高于预设阈值的商品信息在训练样本中的占比来提高模型识别的准确率。

或者，可以按照预设比例分别从商品信息中点击浏览率高于预设阈值的商品信息、点击加车率高于预设阈值的商品信息和点击购买率高于预设阈值的商品信息中选取商品信息，例如，可以按照6:3:1的比例从商品信息中点击浏览率高于预设阈值的商品信息、点击加车率高于预设阈值的商品信息和点击购买率高于预设阈值的商品信息中选取商品信息作为训练正样本，即点击购买率高于预设阈值的商品信息量、点击加车率高于预设阈值的商品信息量和点击浏览率高于预设阈值的商品信息量的整体比值为6:3:1。

通过提高点击购买率高于预设阈值的商品信息在训练样本中的占比来提高模型识别的准确率。

本实施例中对应点击浏览率、点击加车率和点击购买率各自对应有预设阈值，并且各自对应的预设阈值可以相同，也可以不同。

S103：将所述商品信息中点击率低于预设阈值的商品信息作为第一子训练负样本。

同样的，通过统计，将所述商品信息中点击率低于预设阈值的商品信息作为第一子训练负样本。

S104：按照预设条件从所述训练正样本所属品类和上级品类中选取商品信息作为第二子训练负样本。

由于现有技术中的负样本策略无法采集到足够的有效的负样本，使得现有的搜索推荐模型生成的推荐结果不准确，因此，本公开的实施例对负样本进行扩充，可以从所述训练正样本所属品类和上级品类中选取商品信息作为第二子训练负样本。例如，选取的正样品是“菠菜”，其所属的品类为“蔬菜”，上级品类为“生鲜”，则可以从“蔬菜”和“生鲜”中选取其他商品信息作为第二子训练负样本。通过从行为日志中低点击率的商品中抽样作为负样本，可以抽取出真实的不相关商品。仅仅一次搜索会话中未被点击/加车/购买，并不能证明搜索词和该商品是不相关的。剔除这一部分数据，可以有效降低负样本数据中的噪音。同时，正样本商品所属的同品类/上级品类下的商品跟正样本具有一定的联系，但却包含大量不相关商品，这些不相关商品可以作为细粒度的负样本。

S105：将所述第一子训练负样本和所述第二子训练负样本进行融合，生成训练负样本。

在一些实施例中，可以将第一子训练负样本和所述第二子训练负样本直接融合，生成训练负样本。

在一些实施例中，可以将第一子训练负样本和所述第二子训练负样本按比例融合，生成训练负样本。

具体地，可以根据直接融合生成的训练负样本和按比例融合生成的训练负样本分别生成应的对应的搜索推荐模型，并在实际应用过程中，当接收到用户输入的搜索请求时，从两个搜索推荐模型中随机选取一个，利用选取的搜索推荐模型根据接收到的搜索请求为用户推荐商品，并记录用户针对推荐商品的响应动作。在预设时间段内，根据用户针对不同搜索推荐模型推荐的商品的响应动作，确定哪个搜索推荐模型的推荐结果更加准确，若直接融合生成训练负样本的搜索推荐模型的推荐结果更加准确，则再重新确定按比例融合生成训练负样本的比例，然后重复上述过程，对搜索推荐模型的训练负样本进行优化。若按比例融合生成训练负样本搜索推荐模型的推荐结果更加准确，则以当前比例对将第一子训练负样本和所述第二子训练负样本进行融合，生成训练负样本，并将该训练负样本对应的搜索推荐模型作为应用的搜索推荐模型。此外，在上述实施例中，还可以定期根据第一子训练负样本和所述第二子训练负样本的样本量的比例对上述融合比例进行调整，并按照上述方法对搜索推荐模型的训练负样本进行优化。

S106：利用所述训练正样本和所述训练负样本对神经网络模型进行训练，生成搜索推荐模型。

在确定训练正样本和训练负样本后，可以将搜索请求作为输入，将训练正样本和训练负样本作为输出，对神经网络模型进行训练，并根据训练正样本和训练负样本对神经网络模型的参数进行修改，直到模型的输出与所述训练正样本和训练负样本的差异度小于预设阈值，生成搜索推荐模型。

本实施例的基于行为日志的搜索推荐模型生成方法，基于商品的品类体系，抽取出不同粒度的负样本，能够采集到足够的有效的负样本，有效降低了噪音数据，提高了数据质量，使得现有的搜索推荐模型生成的推荐结果更加准确，从而提高用户体验。

此外，在一些实施例中，还可以从所述训练正样本所属的不同品类下选取预设比例的商品信息作为第三子训练负样本，并将所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本进行融合，生成训练负样本。

正样本之外的品类下，大部分商品与正样本差异较大，该部分商品可以作为粗粒度负样本。这样的负样本抽取策略有效降低了噪音数据，提高了数据质量。

在一些实施例中，可以利用新的历史记录不断更新样本及模型，使得生成的搜索推荐模型生适应商品的迭代和更新。

在一些实施例中，还可利用上述训练正样本和训练负样本分别对神经网络模型进行训练，生成对应的正搜索推荐模型和负搜索推荐模型，其中，正搜索推荐模型用于对点击率高的商品信息进行预测，负搜索推荐模型用于对点击率低的商品信息进行预测。

如图2所示，为本公开实施例二的基于行为日志的搜索推荐模型生成方法的流程图。本实施例的方法，包括以下步骤：

S201：获取预设时间段内的用户行为日志，所述行为日志包括用户的搜索请求和用户对根据搜索请求返回的商品信息的响应动作。

S202：根据所述搜索请求对所述响应动作进行分组，将所述响应动作划分为多个响应动作组，每个响应动作组关联一个搜索请求。

在本实施例中，可以根据搜索请求的关键词之间的相关性对所述响应动作进行分组，将相关性高于预设阈值的关键词对应的搜索请求合并为同一个搜索请求，从而将所述响应动作划分为多个响应动作组，每个响应动作组关联一个搜索请求。

在一些其他实施例中，所述根据搜索请求的关键词之间的相关性对所述响应动作进行分组，具体包括：

根据搜索请求的关键词的语义向量确定搜索请求的关键词之间的相关性，然后根据搜索请求的关键词之间的相关性对所述响应动作进行分组。

S203：将所述商品信息中点击率高于预设阈值的商品信息作为训练正样本。

S204：将所述商品信息中点击率低于预设阈值的商品信息作为第一子训练负样本。

S205：按照预设条件从所述训练正样本所属品类和上级品类中选取商品信息作为第二子训练负样本。

S206：将所述第一子训练负样本和所述第二子训练负样本进行融合，生成训练负样本。

S207：利用所述训练正样本和所述训练负样本对神经网络模型进行训练，生成搜索推荐模型。

S208：响应于接收到当前用户的当前搜索请求，将所述当前搜索请求输入所述搜索推荐模型，输出推荐信息。

在本实施例中，在生成搜索推荐模型，可以利用生成的搜索推荐模型，为用户推荐商品。

S209：根据所述推荐信息和所述当前搜索请求的关键词的相关性对所述推荐信息进行排序，并将排序后的推荐信息推送给当前用户。

在本实施例中，在利用所述搜索推荐模型为用户推荐商品时，根据当前用户的当前搜索请求，可以匹配到多个推荐信息，因此，可以根据所述推荐信息和所述当前搜索请求的关键词的相关性对所述推荐信息进行排序，并将排序后的推荐信息推送给当前用户。其中，所述推荐信息和所述当前搜索请求的关键词的相关性为关键词的语义向量的相关性，该语义向量可以通过词向量工具生成，这里不做详细说明。

作为本公开的一个可选实施例，上述实施例还可以进一步包括：从所述训练正样本所属的不同品类下选取预设比例的商品信息作为第三子训练负样本，并将所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本进行融合，生成训练负样本。

在生成训练负样本时，可以直接融合生成的训练负样本，也可以按比例融合生成的训练负样本，根据直接融合生成的训练负样本和按比例融合生成的训练负样本分别生成应的对应的搜索推荐模型，并在实际应用过程中，当接收到用户输入的搜索请求时，从两个搜索推荐模型中随机选取一个，利用选取的搜索推荐模型根据接收到的搜索请求为用户推荐商品，并记录用户针对推荐商品的响应动作。在预设时间段内，根据用户针对不同搜索推荐模型推荐的商品的响应动作，确定哪个搜索推荐模型的推荐结果更加准确，若直接融合生成训练负样本的搜索推荐模型的推荐结果更加准确，则再重新确定按比例融合生成训练负样本的比例，然后重复上述过程，对搜索推荐模型的训练负样本进行优化。若按比例融合生成训练负样本搜索推荐模型的推荐结果更加准确，则选取以当前比例对将第一子训练负样本、所述第二子训练负样本和所述第三子训练样本进行融合，生成训练负样本对应的搜索推荐模型作为应用的搜索推荐模型。

作为本公开的一个可选实施例，上述实施例中的按比例融合生成的训练负样本，可以是按照两个不同的比例值对所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本进行融合，生成训练负样本，并分别生成对应的搜索推荐模型，在实际应用过程中，当接收到用户输入的搜索请求时，从两个搜索推荐模型中随机选取一个，利用选取的搜索推荐模型根据接收到的搜索请求为用户推荐商品，并记录用户针对推荐商品的响应动作。在预设时间段内，根据用户针对不同搜索推荐模型推荐的商品的响应动作，确定哪个搜索推荐模型的推荐结果更加准确，并根据两个比例值的变化趋势对融合比例值进行调整。例如，所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本的两个不同的比例值分别为1：3：5和1：4：7，且比例值为1：4：7的搜索推荐模型的推荐结果更加准确，则可以继续增大所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本的比例值，例如可以改为1：5：9，反之，则可以缩小所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本的比例值，例如可以改为1：2：3。通过重复上述过程，可以对所述搜索推荐模型进行动态优化，使得推荐结果更加准确。本实施例的方法，能够取得与上述实施例相类似的技术效果，这里不再重复赘述。

为了使本公开的技术方案更容易被理解，下面以具体的应用实例来对本公开的技术方案进行进一步说明。用户的历史行为日志可以是利用大数据技术获取的多个用户的搜索请求和每个用户对根据搜索请求返回的商品信息的响应动作。所述搜索请求可以包括搜索关键词，基于搜索关键词，可以将与该搜索词相关联的且在用户对根据搜索请求返回的商品信息的响应动作中点击购买的商品作为搜索结果推荐给用户，这种情形主要是针对同一物品的不同品牌或者不同规格而言的，例如大米的品牌或者大米的规格（例如几斤装）等。

此外，作为本公开的一个实施例，用户的历史行为日志还可以是针对同一用户而言的，即当前用户的购物历史记录。在本实施例中，用户的历史行为日志包括用户输入的搜索关键词和搜索时间。例如，用户输入的是牛奶，并且是在早上，则推荐的商品可以是早餐奶；用户输入的是牛奶并且是在中午，则推荐的商品可以是奶制品饮料；用户输入的是牛奶并且是在下午，则推荐的商品可以是奶制甜点等。此外，还可以根据季节等时间信息动态调整推荐的商品，例如在冬季，用户输入的是牛奶，则推荐的商品是热牛奶，例如在夏季，用户输入的是牛奶，则推荐的商品是牛制冷饮等。

在一些实施例中，还可利用上述训练正样本和训练负样本分别对神经网络模型进行训练，生成对应的正搜索推荐模型和负搜索推荐模型，其中，正搜索推荐模型用于对点击率高的商品信息进行预测，负搜索推荐模型用于对点击率低的商品信息进行预测。当接收到当前用户输入的搜索关键词后，将所述搜索关键词分别输入生成的正搜索推荐模型和负搜索推荐模型中，分别输出正搜索结果和负搜索结果，然后确定正搜索结果和负搜索结果中的交集，并从正搜索结果中剔除该交集中包含的商品，然后将正搜索结果中其他搜索结果推荐给用户。此外，还可以将当前用户针对该搜索推荐结果中的商品的响应动作添加到行为日志中，并且在后续的模型训练过程中，可以将搜索推荐结果中用户未点击的商品作为负训练样本，对模型进行更新训练。

本公开还提供了一种电子设备，包括存储器和处理器，所述存储器上存储有计算机程序，所述处理器执行所述程序时实现如以上所述的方法。

此外，本公开还提供了一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如以上所述的方法。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开并不受所描述的动作顺序的限制，因为依据本公开，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本公开所必须的。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，所述描述的模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

图3示出了本公开实施例三的基于行为日志的搜索推荐模型生成设备的结构示意图。图3示出的终端设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图3所示，计算机系统包括中央处理单元（CPU）301，其可以基于存储在只读存储器（ROM）302中的程序或者从存储部分308加载到随机访问存储器（RAM）303中的程序而执行各种适当的动作和处理。在RAM303中，还存储有系统操作所需的各种程序和数据。CPU 301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出（I/O）接口305也连接至总线304。

以下部件连接至I/O接口305：包括键盘、鼠标等的输入部分306；包括诸如阴极射线管（CRT）、液晶显示器（LCD）等以及扬声器等的输出部分307；包括硬盘等的存储部分308；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也基于需要连接至I/O接口305。可拆卸介质311，诸如磁盘、光盘、磁光盘、半导体存储器等等，基于需要安装在驱动器310上，以便于从其上读出的计算机程序基于需要被安装入存储部分308。

特别地，基于本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分309从网络上被下载和安装，和/或从可拆卸介质311被安装。在该计算机程序被中央处理单元（CPU）301执行时，执行本申请的方法中限定的上述功能。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：场可编程门阵列（FPGA）、专用集成电路（ASIC）、专用标准产品（ASSP）、芯片上系统的系统（SOC）、负载可编程逻辑设备（CPLD）等等。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器（RAM）、只读存储器（ROM）、可擦除可编程只读存储器（EPROM或快闪存储器）、光纤、便捷式紧凑盘只读存储器（CD-ROM）、光学储存设备、磁储存设备、或上述内容的任何合适组合。

此外，虽然采用特定次序描绘了各操作，但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行，或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地，在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

1.一种基于行为日志的搜索推荐模型生成方法，其特征在于，包括：

2.根据权利要求1所述的基于行为日志的搜索推荐模型生成方法，其特征在于，在所述将所述商品信息中点击率高于预设阈值的商品信息作为训练正样本之前，还包括：

3.根据权利要求2所述的基于行为日志的搜索推荐模型生成方法，其特征在于，所述根据所述搜索请求对所述响应动作进行分组，将所述响应动作划分为多个响应动作组，每个响应动作组关联一个搜索请求，具体包括：

4.根据权利要求3所述的基于行为日志的搜索推荐模型生成方法，其特征在于，所述响应动作分为未点击响应动作和点击响应动作，其中，所述点击响应动作又可以进一步划分为点击浏览、点击加车和点击购买；

5.根据权利要求4所述的基于行为日志的搜索推荐模型生成方法，其特征在于，所述将所述商品信息中点击浏览率和/或点击加车率和/或点击购买率高于预设阈值的商品信息作为训练正样本，包括：

6.根据权利要求5所述的基于行为日志的搜索推荐模型生成方法，其特征在于，所述将所述第一子训练负样本和所述第二子训练负样本进行融合，生成训练负样本，包括：

7.根据权利要求6所述的基于行为日志的搜索推荐模型生成方法，其特征在于，还包括：

将所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本进行融合，生成训练负样本；

所述将所述第一子训练负样本、所述第二子训练负样本和所述第三训练负样本进行融合，生成训练负样本，包括：

8.根据权利要求7所述的基于行为日志的搜索推荐模型生成方法，其特征在于，还包括：

按照预设时间间隔根据用户针对每组训练负样本对应的搜索推荐模型推荐的商品的响应动作对预设比例进行优化调整；响应于接收到当前用户的当前搜索请求，将所述当前搜索请求输入所述搜索推荐模型，输出推荐信息；

9.一种电子设备，包括存储器和处理器，所述存储器上存储有计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1~8中任一项所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1~8中任一项所述的方法。