CN114491283A - 对象推荐方法、装置及电子设备 - Google Patents

对象推荐方法、装置及电子设备 Download PDF

Info

Publication number
CN114491283A
CN114491283A CN202210345984.1A CN202210345984A CN114491283A CN 114491283 A CN114491283 A CN 114491283A CN 202210345984 A CN202210345984 A CN 202210345984A CN 114491283 A CN114491283 A CN 114491283A
Authority
CN
China
Prior art keywords
recommendation
sample
object sample
user
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210345984.1A
Other languages
English (en)
Other versions
CN114491283B (zh
Inventor
林少川
杨凯帆
高理强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Koubei Network Technology Co Ltd
Original Assignee
Zhejiang Koubei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Koubei Network Technology Co Ltd filed Critical Zhejiang Koubei Network Technology Co Ltd
Priority to CN202210345984.1A priority Critical patent/CN114491283B/zh
Publication of CN114491283A publication Critical patent/CN114491283A/zh
Application granted granted Critical
Publication of CN114491283B publication Critical patent/CN114491283B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书一个或多个实施例提供一种对象推荐方法、装置及电子设备,该方法包括:接收用户发起的对象推荐请求;召回与对象推荐请求中的对象推荐策略匹配的对象,并将召回的对象确定为推荐对象;将推荐对象的对象信息输入至训练完成的推荐模型,以使推荐模型基于对象信息预测推荐对象针对用户的推荐评分;其中,推荐模型基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本进行有监督的训练得到;第一对象样本被标注了用于指示其是否被用户查看过的第一标签;第二对象样本被标注了基于第一对象样本和第一标签,对第二对象样本进行标签挖掘得到的第二标签;基于推荐评分对推荐对象进行排序,并将排序后的推荐对象向用户进行输出。

Description

对象推荐方法、装置及电子设备
技术领域
本说明书一个或多个实施例涉及计算机应用技术领域,尤其涉及一种对象推荐方法、装置及电子设备。
背景技术
现如今,越来越多的用户会通过APP(Application,应用程序)搜索自己需要的对象。例如,用户在需要购买商品时,可以通过购物APP输入商品类型(例如:长袖外套、短裤等),以搜索属于该商品类型的商品;或者,用户在需要挑选餐厅时,可以通过美食APP对自己进行定位,以搜索附近的餐厅。而在APP的用户界面中向用户展示搜索到的对象时,通常希望优先向用户展示其可能感兴趣的对象,以提高用户点击查看这些对象的概率。这就需要进一步地从搜索到的对象中确定出用户可能感兴趣的对象,并将这些对象推荐给用户。
除此之外,在用户打开APP时,通常也会在APP的用户界面中展示一些用户可能感兴趣的对象。例如,在视频APP的主界面中展示一些用户可能感兴趣的电影和电视剧的相关信息;或者,在音乐APP的主界面中展示一些用户可能感兴趣的歌单的相关信息。这也需要从对象库中确定出用户可能感兴趣的对象,并将这些对象推荐给用户。
发明内容
本说明书提出一种对象推荐方法,所述方法包括:
接收用户发起的对象推荐请求;其中,所述对象推荐请求包括对象推荐策略;
响应于所述对象推荐请求,召回与所述对象推荐策略匹配的对象,并将召回的对象确定为推荐对象;
将所述推荐对象的对象信息输入至训练完成的推荐模型,以使所述推荐模型基于所述对象信息预测所述推荐对象针对所述用户的推荐评分;其中,所述推荐模型基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本进行有监督的训练得到;所述第一对象样本被标注了用于指示其是否被用户查看过的第一标签;所述第二对象样本被标注了基于所述第一对象样本和所述第一标签,对所述第二对象样本进行标签挖掘得到的第二标签;
基于所述推荐评分对所述推荐对象进行排序,并将排序后的所述推荐对象向所述用户进行输出。
可选地,所述对象推荐策略包括对象与用户之间的距离阈值;
所述召回与所述对象推荐策略匹配的对象,包括:
召回所在位置与所述用户的定位位置之间的距离不超过所述距离阈值的对象。
可选地,所述方法还包括:
迭代执行以下步骤,以对所述推荐模型进行有监督的训练,直至与所述推荐模型对应的损失函数收敛:
将所述第一对象样本的对象信息和所述第二对象样本的对象信息输入至所述推荐模型;
获取所述推荐模型基于所述第一对象样本的对象信息预测出的所述第一对象样本针对用户的第一评分,以及基于所述第二对象样本的对象信息预测出的所述第二对象样本针对用户的第二评分;
基于所述第一对象样本和所述第一标签,以及所述第二评分,对所述第二对象样本进行标签挖掘,得到所述第二标签;
基于所述第一标签和所述第一评分,以及所述第二标签和所述第二评分,确定与所述推荐模型对应的损失函数是否收敛。
可选地,所述基于所述第一对象样本和所述第一标签,以及所述第二评分,对所述第二对象样本进行标签挖掘,得到所述第二标签,包括:
确定所述第一对象样本和所述第二对象样本之间的相似度;
基于所述相似度、所述第一标签和所述第二评分,对所述第一标签进行标签传播,得到所述第二标签。
可选地,所述确定所述第一对象样本和所述第二对象样本之间的相似度,包括:
获取所述推荐模型针对所述第一对象样本提取出的第一特征数据,以及针对所述第二对象样本提取出的第二特征数据;
基于所述第一特征数据和所述第二特征数据,计算所述第一对象样本和所述第二对象样本之间的相似度。
可选地,所述损失函数包括第一损失子函数和第二损失子函数的加权和;
所述第一损失子函数包括:
Figure 250304DEST_PATH_IMAGE002
其中,
Figure 158217DEST_PATH_IMAGE003
为与第i个第一对象样本对应的第一评分,
Figure 637740DEST_PATH_IMAGE004
为与第i个第一对象样本 对应的第一标签,
Figure 340117DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量;
所述第二损失子函数包括:
Figure 905091DEST_PATH_IMAGE007
其中,
Figure 334804DEST_PATH_IMAGE008
为与第j个第一对象样本对应的第一评分,
Figure 199992DEST_PATH_IMAGE009
为与第j个第一对象样本 对应的第一标签,
Figure 807691DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量。
可选地,所述基于所述第一对象样本和所述第一标签,以及所述第二评分,对所述第二对象样本进行标签挖掘,得到所述第二标签,包括:
基于所述第一对象样本和所述第一标签,确定评分阈值;
按照所述第二评分与所述评分阈值之间的大小关系,确定所述第二标签。
可选地,所述损失函数包括第一损失子函数和第二损失子函数的加权和;
所述第一损失子函数包括:
Figure 125539DEST_PATH_IMAGE010
其中,
Figure 109676DEST_PATH_IMAGE003
为与第i个第一对象样本对应的第一评分,
Figure 563791DEST_PATH_IMAGE011
为与第i个第一对象样本 对应的第一标签,
Figure 358703DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量;
所述第二损失子函数包括:
Figure 163848DEST_PATH_IMAGE012
其中,
Figure 686096DEST_PATH_IMAGE008
为与第j个第一对象样本对应的第一评分,
Figure 260297DEST_PATH_IMAGE009
为与第j个第一对象样本 对应的第一标签,
Figure 209798DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量。
可选地,所述推荐模型为Wide&Deep模型。
本说明书还提出一种对象推荐装置,所述装置包括:
接受模块,用于接收用户发起的对象推荐请求;其中,所述对象推荐请求包括对象推荐策略;
召回模块,用于响应于所述对象推荐请求,召回与所述对象推荐策略匹配的对象,并将召回的对象确定为推荐对象;
评分模块,用于将所述推荐对象的对象信息输入至训练完成的推荐模型,以使所述推荐模型基于所述对象信息预测所述推荐对象针对所述用户的推荐评分;其中,所述推荐模型基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本进行有监督的训练得到;所述第一对象样本被标注了用于指示其是否被用户查看过的第一标签;所述第二对象样本被标注了基于所述第一对象样本和所述第一标签,对所述第二对象样本进行标签挖掘得到的第二标签;
输出模块,用于基于所述推荐评分对所述推荐对象进行排序,并将排序后的所述推荐对象向所述用户进行输出。
可选地,所述对象推荐策略包括对象与用户之间的距离阈值;
所述召回模块具体用于:
召回所在位置与所述用户的定位位置之间的距离不超过所述距离阈值的对象。
可选地,所述装置还包括:
训练模块,用于迭代执行以下步骤,以对所述推荐模型进行有监督的训练,直至与所述推荐模型对应的损失函数收敛:
将所述第一对象样本的对象信息和所述第二对象样本的对象信息输入至所述推荐模型;
获取所述推荐模型基于所述第一对象样本的对象信息预测出的所述第一对象样本针对用户的第一评分,以及基于所述第二对象样本的对象信息预测出的所述第二对象样本针对用户的第二评分;
基于所述第一对象样本和所述第一标签,以及所述第二评分,对所述第二对象样本进行标签挖掘,得到所述第二标签;
基于所述第一标签和所述第一评分,以及所述第二标签和所述第二评分,确定与所述推荐模型对应的损失函数是否收敛。
可选地,所述训练模块具体用于:
确定所述第一对象样本和所述第二对象样本之间的相似度;
基于所述相似度、所述第一标签和所述第二评分,对所述第一标签进行标签传播,得到所述第二标签。
可选地,所述训练模块具体用于:
获取所述推荐模型针对所述第一对象样本提取出的第一特征数据,以及针对所述第二对象样本提取出的第二特征数据;
基于所述第一特征数据和所述第二特征数据,计算所述第一对象样本和所述第二对象样本之间的相似度。
可选地,所述损失函数包括第一损失子函数和第二损失子函数的加权和;
所述第一损失子函数包括:
Figure 236660DEST_PATH_IMAGE010
其中,
Figure 811867DEST_PATH_IMAGE003
为与第i个第一对象样本对应的第一评分,
Figure 240574DEST_PATH_IMAGE011
为与第i个第一对象样本 对应的第一标签,
Figure 626556DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量;
所述第二损失子函数包括:
Figure 140714DEST_PATH_IMAGE013
其中,
Figure 270344DEST_PATH_IMAGE008
为与第j个第一对象样本对应的第一评分,
Figure 38711DEST_PATH_IMAGE009
为与第j个第一对象样本 对应的第一标签,
Figure 861174DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量。
可选地,所述训练模块具体用于:
基于所述第一对象样本和所述第一标签,确定评分阈值;
按照所述第二评分与所述评分阈值之间的大小关系,确定所述第二标签。
可选地,所述损失函数包括第一损失子函数和第二损失子函数的加权和;
所述第一损失子函数包括:
Figure 597048DEST_PATH_IMAGE010
其中,
Figure 264790DEST_PATH_IMAGE003
为与第i个第一对象样本对应的第一评分,
Figure 402510DEST_PATH_IMAGE011
为与第i个第一对象样本 对应的第一标签,
Figure 395874DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量;
所述第二损失子函数包括:
Figure 868313DEST_PATH_IMAGE012
其中,
Figure 339745DEST_PATH_IMAGE008
为与第j个第一对象样本对应的第一评分,
Figure 597551DEST_PATH_IMAGE009
为与第j个第一对象样本 对应的第一标签,
Figure 230658DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量。
可选地,所述推荐模型为Wide&Deep模型。
本说明书还提出一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如上述任一项所述方法的步骤。
本说明书还提出一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如上述任一项所述方法的步骤。
在上述技术方案中,可以在根据对象推荐策略召回了推荐对象的情况下,将各推荐对象的对象信息输入至训练完成的推荐模型,以使该推荐模型基于该推荐对象的对象信息预测该推荐对象针对用户的推荐评分,从而可以基于与各推荐对象对应的推荐评分对这些推荐对象进行排序,并将排序后的推荐对象输出给用户。采用这样的方式,可以实现优先向用户输出其可能感兴趣的对象,提高用户查看这些对象的概率。
除此之外,针对上述推荐模型的模型训练,可以是基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本完成的;其中,各第一对象样本可以被标注用于指示其是否被用户查看过的第一标签;而各第二对象样本则可以被标注基于各第一对象样本和与该第一对象样本对应的第一标签,对该第二对象样本进行标签挖掘得到的第二标签。采用这样的方式,可以增加模型训练时的数据量,从而提高模型训练和模型使用时的数据的一致性,避免出现曝光偏差的问题。
附图说明
图1是本说明书一示例性实施例示出的一种对象推荐系统的示意图;
图2是本说明书一示例性实施例示出的一种对象推荐方法的流程图;
图3是本说明书一示例性实施例示出的一种Wide&Deep模型的示意图;
图4是本说明书一示例性实施例示出的一种对象推荐装置所在电子设备的硬件结构图;
图5是本说明书一示例性实施例示出的一种对象推荐装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
请参考图1,图1是本说明书一示例性实施例示出的一种对象推荐系统的示意图。
如图1所示,在上述对象推荐系统中,与APP对应的客户端可以被安装在用户使用的电子设备上,该客户端可以与服务端之间进行通信。
在向用户进行对象推荐时,上述服务端可以确定用户可能感兴趣的对象,并将这些对象(具体可以是对象的相关信息,例如:商品的名称、价格、照片;餐厅的名称、地址、照片;电影的名称、海报、演员姓名等)发送给上述客户端。上述客户端则可以将这些对象通过用户界面输出给用户,以完成对象推荐。
在实际应用中,通常会借助推荐模型来实现对象推荐。其中,推荐模型可以是机器学习模型。具体地,可以将对象的相关信息和/或用户的相关信息等输入至该推荐模型,由该推荐模型预测该对象针对该用户的推荐评分。通常,该推荐评分越高,则认为该用户对该对象的感兴趣度越高;该推荐评分越低,则认为该用户对该对象的感兴趣度越低。
在将推荐评分较高的对象推荐给用户之后,用户可以在上述用户界面中,点击查看自己真实感兴趣的对象,但通常不会查看不是自己真实感兴趣的对象。然而,对于任一对象而言,不管用户是否查看过该对象,只要该对象被通过该用户界面输出给了用户,则认为该对象已经向用户曝光过,即该对象是已向用户曝光的对象;如果该对象没有被通过该用户界面输出给用户,则认为该对象尚未向用户曝光过,即该对象是未向用户曝光的对象。
在相关技术中,在对上述推荐模型进行模型训练时,通常仅采用已向用户曝光的对象作为训练样本。具体地,对于任一已向用户曝光的对象而言,可以将用户查看过的对象作为正样本,将用户未查看过的对象作为负样本,从而可以基于这些正样本和负样本对该推荐模型进行模型训练。然而,该推荐模型在向用户进行对象推荐时,则需要预测对象库中的所有对象针对该用户的推荐评分。
机器学习本质上是在学习数据的分布,其有效性的假设是机器学习模型在训练(training)和使用(serving)时的数据是独立同分布(Independent and IdenticallyDistributed,IID)的。然而,在实际应用中,由于具体场景、采样有偏等的约束,模型训练和模型使用时的数据并不是独立同分布的。
对于上述推荐模型而言,在相关技术中,模型训练和模型使用时的数据显然存在不一致的问题,这就会导致该推荐模型的输出结果有偏,从而影响对象推荐的准确度。这种情况通常被称为曝光偏差(exposure bias)或样本选择偏差(sample selection bias)。
本说明书提出了一种对象推荐的技术方案,以解决上述曝光偏差的问题。
在具体实现时,用户可以通过上述客户端发起对象推荐请求。其中,该对象推荐请求可以包括对象推荐策略。该客户端可以将该用户通过该客户端发起的该对象推荐请求,发送给上述服务端。
上述服务端在接收到上述对象推荐请求的情况下,可以响应于该对象推荐请求,召回与其中的对象推荐策略匹配的对象。其中,被召回的对象即可作为针对上述用户的推荐对象,即后续可以将这些对象中的全部或部分推荐给该用户。
在召回了上述推荐对象的情况下,可以将各推荐对象的对象信息输入至训练完成的推荐模型。相应地,该推荐模型可以基于该推荐对象的对象信息,预测该推荐对象针对上述用户的推荐评分。其中,该推荐模型可以基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本进行有监督的训练得到;各第一对象样本可以被标注用于指示其是否被用户查看过的第一标签;而各第二对象样本则可以被标注基于各第一对象样本和与该第一对象样本对应的第一标签,对该第二对象样本进行标签挖掘得到的第二标签。
在得到各推荐对象针对上述用户的推荐评分的情况下,可以按照与各推荐对象对应的推荐评分,对这些推荐对象进行排序,并将排序后的这些推荐对象向该用户进行输出。
在上述技术方案中,可以在根据对象推荐策略召回了推荐对象的情况下,将各推荐对象的对象信息输入至训练完成的推荐模型,以使该推荐模型基于该推荐对象的对象信息预测该推荐对象针对用户的推荐评分,从而可以基于与各推荐对象对应的推荐评分对这些推荐对象进行排序,并将排序后的推荐对象输出给用户。采用这样的方式,可以实现优先向用户输出其可能感兴趣的对象,提高用户查看这些对象的概率。
除此之外,针对上述推荐模型的模型训练,可以是基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本完成的;其中,各第一对象样本可以被标注用于指示其是否被用户查看过的第一标签;而各第二对象样本则可以被标注基于各第一对象样本和与该第一对象样本对应的第一标签,对该第二对象样本进行标签挖掘得到的第二标签。采用这样的方式,可以增加模型训练时的数据量,从而提高模型训练和模型使用时的数据的一致性,避免出现曝光偏差的问题。
请参考图2,图2是本说明书一示例性实施例示出的一种对象推荐方法的流程图。
结合如图1所示的对象推荐系统,该对象推荐方法可以应用于该对象推荐系统中的服务端,包括以下步骤:
步骤201:接收用户发起的对象推荐请求;其中,所述对象推荐请求包括对象推荐策略。
在本实施例中,用户可以通过上述客户端发起对象推荐请求。其中,该对象推荐请求可以包括对象推荐策略。
以购物APP为例,用户可以在上述客户端输出的用于搜索的用户界面中输入需要购买的商品的商品类型(例如:长袖外套、短裤等),并在输入完成后通过该用户界面发起商品搜索请求;该商品搜索请求可以包括该用户输入的商品类型。在这种情况下,该商品搜索请求即可作为上述对象推荐请求,该商品搜索请求中的商品类型即可作为上述对象推荐策略。
以美食APP为例,用户可以在上述客户端输出的用于搜索的用户界面中对自己进行定位,并在定位完成后通过该用户界面发起餐厅搜索请求,该餐厅搜索请求可以包括该用户的定位位置。在这种情况下,该餐厅搜索请求即可作为上述对象推荐请求,该餐厅搜索请求中的定位位置即可作为上述对象推荐策略。
以视频APP为例,上述客户端可以在启动之后,自动发起对象推荐请求;该对象推荐请求可以包括用户关注的演员、视频类型等信息。在这种情况下,该对象推荐请求中的这些信息即可作为上述对象推荐策略。
在本实施例中,上述客户端可以将上述用户通过该客户端发起的上述对象推荐请求,发送给上述服务端,以由该服务端对该对象推荐请求进行响应。
步骤202:响应于所述对象推荐请求,召回与所述对象推荐策略匹配的对象,并将召回的对象确定为推荐对象。
在本实施例中,上述服务端在接收到上述对象推荐请求的情况下,可以响应于该对象推荐请求,召回与其中的对象推荐策略匹配的对象。其中,被召回的对象即可作为针对上述用户的推荐对象,即后续可以将这些对象中的全部或部分推荐给该用户。
在示出的一种实施方式中,上述对象推荐策略可以包括对象与用户之间的距离阈值。在这种情况下,在召回与该对象推荐策略匹配的对象时,具体可以召回所在位置与上述用户的定位位置之间的距离不超过该距离阈值的对象。例如,假设该距离阈值为1km,则可以召回所在位置与该用户的定位位置之间的距离不超过1km的所有对象。
在实际应用中,如果上述对象为商家,则对象所在位置可以是商家的地址或定位位置;如果上述对象为商品,则对象所在位置可以是商品所属的商家的地址或定位位置;以此类推。
步骤203:将所述推荐对象的对象信息输入至训练完成的推荐模型,以使所述推荐模型基于所述对象信息预测所述推荐对象针对所述用户的推荐评分;其中,所述推荐模型基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本进行有监督的训练得到;所述第一对象样本被标注了用于指示其是否被用户查看过的第一标签;所述第二对象样本被标注了基于所述第一对象样本和所述第一标签,对所述第二对象样本进行标签挖掘得到的第二标签。
在本实施例中,在召回了上述推荐对象的情况下,可以将各推荐对象的对象信息(例如:对象的名称、类型、好评度等相关信息)输入至训练完成的推荐模型。相应地,该推荐模型可以基于该推荐对象的对象信息,预测该推荐对象针对上述用户的推荐评分。
在实际应用中,在将上述推荐对象的对象信息输入至上述推荐模型,进行推荐评分的预测时,具体可以将该推荐对象的对象信息和/或上述用户的相关信息等输入至该推荐模型,即该推荐模型可以基于该推荐对象的对象信息和/或该用户的相关信息等,预测该推荐对象针对该用户的推荐评分。
在本实施例中,在预先对上述推荐模型进行模型训练时,具体可以基于已向用户曝光的对象样本(可称为第一对象样本)和未向用户曝光的对象样本(可称为第二对象样本),对该推荐模型进行模型训练。
由于上述第一对象样本已经向用户曝光过,因此,可以直接为各第一对象样本标注用于指示其是否被用户查看过的标签(可称为第一标签)。
由于上述第二对象样本尚未向用户曝光过,因此,无法直接为各第二对象样本标注用于指示其是否被用户查看过的标签。但是,各第二对象样本可以被标注基于各第一对象样本和与该第一对象样本对应的第一标签,对该第二对象样本进行标签挖掘得到的标签(可称为第二标签)。
由于所有对象样本均被标注了对应的标签,因此,针对该推荐模型的模型训练属于有监督的训练。
步骤204:基于所述推荐评分对所述推荐对象进行排序,并将排序后的所述推荐对象向所述用户进行输出。
在本实施例中,在得到各推荐对象针对上述用户的推荐评分的情况下,可以按照与各推荐对象对应的推荐评分,对这些推荐对象进行排序,并将排序后的这些推荐对象向该用户进行输出。
在实际应用中,如果所有推荐对象的数量较少,则上述服务端可以将排序后的所有推荐对象返回至上述客户端,以由该客户端将排序后的所有推荐对象通过用户界面输出给用户。
与之相应地,如果所有推荐对象的数量较少,则上述服务端可以根据排序,将所有推荐对象中排在前面的部分推荐对象返回至上述客户端,以由该客户端将排序后的这部分推荐对象通过用户界面输出给用户。
在本实施例中,由于输出给用户的推荐对象是基于推荐评分排序后的推荐对象,因此,可以认为优先向用户输出了其可能感兴趣的对象。
在上述技术方案中,可以在根据对象推荐策略召回了推荐对象的情况下,将各推荐对象的对象信息输入至训练完成的推荐模型,以使该推荐模型基于该推荐对象的对象信息预测该推荐对象针对用户的推荐评分,从而可以基于与各推荐对象对应的推荐评分对这些推荐对象进行排序,并将排序后的推荐对象输出给用户。采用这样的方式,可以实现优先向用户输出其可能感兴趣的对象,提高用户查看这些对象的概率。
除此之外,针对上述推荐模型的模型训练,可以是基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本完成的;其中,各第一对象样本可以被标注用于指示其是否被用户查看过的第一标签;而各第二对象样本则可以被标注基于各第一对象样本和与该第一对象样本对应的第一标签,对该第二对象样本进行标签挖掘得到的第二标签。采用这样的方式,可以增加模型训练时的数据量,从而提高模型训练和模型使用时的数据的一致性,避免出现曝光偏差的问题。
下面对上述推荐模型的模型结构进行说明。
在示出的一种实施方式中,上述推荐模型可以采用Wide&Deep模型。如图3所示,在Wide&Deep模型中,Wide部分通常是线性模型,例如:LR(Logistic Regression,逻辑回归)模型或FM(Factorization Machine,因式分解机)模型等;Deep部分通常是DNN(DeepNeural Networks,深度神经网络)。也即,Wide&Deep模型是将线性模型与DNN结合起来得到的模型。
在实际应用中,将模型从数据中学习到高频共现的特征组合的能力称为记忆能力(Memorization),将模型利用数据相关性的传递性去探索数据中从未出现过的特征组合的能力称为泛化能力(Generalization)。
广义的线性模型具有较强的记忆能力,但泛化能力不足;而DNN则具有较强的泛化能力,但对于长尾数据的处理能力较弱,容易出现过度泛化的情况。因此,通过结合线性模型和DNN得到的Wide&Deep模型,可以兼顾记忆能力和泛化能力。
需要说明的是,上述DNN可以是一个基于Embedding的全连接神经网络。
下面对上述推荐模型的模型训练过程进行说明。
在示出的一种实施方式中,为了实现针对上述推荐模型的模型训练,上述服务端可以获取若干已向用户曝光的上述第一对象样本,以及若干未向用户曝光的上述第二对象样本。其中,各第一对象样本被标注了用于指示其是否被用户查看过的上述第一标签。
在对上述推荐模型进行模型训练时,具体可以先将各第一对象样本的对象信息输入至上述推荐模型,以由该推荐模型基于该第一对象样本的对象信息,预测该第一对象样本针对用户的推荐评分(可称为第一评分),并将各第二对象样本的对象信息输入至上述推荐模型,以由该推荐模型基于该第二对象样本的对象信息,预测该第二对象样本针对用户的推荐评分(可称为第二评分)。后续,可以基于与各第一对象样本对应的第一标签和与各第二对象样本对应的第二评分,对各第二对象样本进行标签挖掘,得到与各第二对象样本对应的第二标签。
而在确定了与各第二对象样本对应的第二标签的情况下,可以基于与各第一对象样本对应的第一标签和第一评分,以及与各第二对象样本对应的第二标签和第二评分,确定与上述推荐模型对应的损失函数是否收敛。
如果收敛,则可以认为对该推荐模型的模型训练完成。如果不收敛,则可以由技术人员根据实际情况对该推荐模型的模型参数进行调整,并重新将各第一对象样本的对象信息和各第二对象样本的对象信息输入至该推荐模型,以重复上述标签挖掘和损失函数计算的过程,继续对该推荐模型进行训练,直至该损失函数收敛。
需要说明的是,可以预先设置两个孪生的推荐子模型,即这两个推荐子模型的模型参数始终保持一致,由这两个推荐子模型共同组成上述推荐模型。在这种情况下,可以将各第一对象样本的对象信息输入至其中一个推荐子模型,并将各第二对象样本的对象信息输入至其中另一个推荐子模型。由于这两个推荐子模型的计算过程可以是并行的,因此,可以提高计算效率。但是,后续在将上述推荐对象的对象信息输入至该推荐模型,进行推荐评分的预测时,只需要将该推荐对象的对象信息输入至其中任意一个推荐子模型即可。
进一步地,在示出的一种实施方式中,可以采用标签传播的方式实现上述标签挖掘的过程。
具体地,可以先确定上述第一对象样本和上述第二对象样本之间的相似度。后续,可以基于上述相似度,以及与各第一对象样本对应的第一标签和与各第二对象样本对应的第二评分,对这些第一标签进行标签传播,得到上述第二标签。
在确定上述第一对象样本和上述第二对象样本之间的相似度时,具体可以先获取上述推荐模型针对各第一对象样本提取出的特征数据(可称为第一特征数据),并获取该推荐模型针对各第二对象样本提取出的特征数据(可称为第二特征数据)。后续,可以基于与各第一对象样本对应的第一特征数据和与各第二对象样本对应的第二特征数据,计算各第一对象样本和各第二对象样本之间的相似度。
以采用Wide&Deep模型的推荐模型为例,对于任一第一对象样本而言,可以将该推荐模型中的最后一层全连接层基于该第一对象样本的对象信息输出的数据(即该推荐模型基于该第一对象样本的对象信息最终输出的数据),作为与该第一对象样本对应的第一评分,将该推荐模型中的倒数第二层全连接层基于该第一对象样本的对象信息输出的数据,作为与该第一对象样本对应的第一特征数据。同理,对于任一第二对象样本而言,可以将该推荐模型中的最后一层全连接层基于该第二对象样本的对象信息输出的数据(即该推荐模型基于该第二对象样本的对象信息最终输出的数据),作为与该第二对象样本对应的第二评分,将该推荐模型中的倒数第二层全连接层基于该第二对象样本的对象信息输出的数据,作为与该第二对象样本对应的第二特征数据。
由于倒数第二层全连接层输出的数据通常是向量形式的数据,因此,上述第一特征数据和上述第二特征数据具体可以是向量形式的数据;此时,该第一特征数据和该第二特征数据的维度即为上述推荐模型中的倒数第二层全连接层的输出维度。在这种情况下,在基于该第一特征数据和该第二特征数据,计算这两者分别对应的第一对象样本和第二对象样本之间的相似度时,具体可以计算该第一特征数据和该第二特征数据的余弦相似度,并将该余弦相似度作为该第一对象样本和该第二对象样本之间的相似度。
举例来说,假设一共有N个上述第一对象样本和N个上述第二对象样本,并假设上 述推荐模型的倒数第二层全连接层的输出维度为F,则与这N个第一对象样本分别对应的第 一特征数据可以组成一个大小为B×F的矩阵
Figure 206704DEST_PATH_IMAGE014
;此时,矩阵
Figure 966981DEST_PATH_IMAGE015
中的一行数据 即为与一个第一对象样本对应的第一特征数据。同理,与这N个第二对象样本分别对应的第 二特征数据可以组成一个大小为B×F的矩阵
Figure 79293DEST_PATH_IMAGE016
;此时,矩阵
Figure 414460DEST_PATH_IMAGE017
中的一行数据 即为与一个第二对象样本对应的第二特征数据。
在计算上述N个第一对象样本和上述N个第二对象样本之间的相似度时,首先,可 以将矩阵
Figure 346644DEST_PATH_IMAGE014
与矩阵
Figure 425458DEST_PATH_IMAGE017
拼接起来,得到矩阵
Figure 392277DEST_PATH_IMAGE018
;此时,矩阵
Figure 991622DEST_PATH_IMAGE019
的大小为2B×F。
然后,可以计算矩阵
Figure 411102DEST_PATH_IMAGE020
和其转置矩阵
Figure 746137DEST_PATH_IMAGE021
的乘积
Figure 545292DEST_PATH_IMAGE022
;此时,矩阵S的大小为2B×2B。对于矩阵S而言,其中第i行第j列的 元素
Figure 691102DEST_PATH_IMAGE023
表示在由上述N个第一对象样本和上述N个第二对象样本拼接成的2N个对象样本 中,与第i个对象样本对应的特征数据和与第j个对象样本对应的特征数据的向量内积。
最后,可以对矩阵S中的各元素进行归一化处理,得到矩阵M。以矩阵S中的元素
Figure 83031DEST_PATH_IMAGE023
为例,对元素
Figure 457643DEST_PATH_IMAGE023
进行归一化处理,具体可以是将
Figure 133475DEST_PATH_IMAGE023
除以与第i个对象样本对应的特征数 据的向量长度,并除以与第j个对象样本对应的特征数据的向量长度。
需要说明的是,对于矩阵M而言,其中第i行第j列的元素
Figure 965034DEST_PATH_IMAGE024
表示在由上述N个第 一对象样本和上述N个第二对象样本拼接成的2N个对象样本中,第i个对象样本和第j个对 象样本之间的相似度。因此,可以将矩阵M分解为
Figure 31210DEST_PATH_IMAGE025
。其中,矩阵
Figure 209513DEST_PATH_IMAGE026
Figure 5430DEST_PATH_IMAGE027
Figure 758623DEST_PATH_IMAGE028
Figure 295783DEST_PATH_IMAGE029
的大小均为B×B。
矩阵
Figure 792624DEST_PATH_IMAGE030
中第i行第j列的元素表示在上述N个第一对象样本中,第i个第一对象样 本和第j个第一对象样本之间的相似度。矩阵
Figure 928201DEST_PATH_IMAGE027
中第i行第j列的元素表示在上述N个第一 对象样本和上述N个第二对象样本中,第i个第一对象样本和第j个第二对象样本之间的相 似度。矩阵
Figure 852295DEST_PATH_IMAGE031
中第i行第j列的元素表示在上述N个第一对象样本和上述N个第二对象样本 中,第i个第二对象样本和第j个第一对象样本之间的相似度。矩阵
Figure 220959DEST_PATH_IMAGE029
中第i行第j列的元 素表示在上述N个第二对象样本中,第i个第二对象样本和第j个第二对象样本之间的相似 度。
为了实现标签传播,首先,可以将与上述N个第一对象样本分别对应的第一标签组 成一个大小为B×1的矩阵
Figure 505179DEST_PATH_IMAGE032
,并将与上述N个第二对象样本分别对应的第二评分组成一个 大小为B×1的矩阵
Figure 10110DEST_PATH_IMAGE033
,从而可以将矩阵
Figure 105105DEST_PATH_IMAGE032
与矩阵
Figure 926779DEST_PATH_IMAGE033
拼接起来,得到矩阵
Figure 765422DEST_PATH_IMAGE034
;此时, 矩阵T的大小为2B×1。
需要说明的是,矩阵
Figure 656017DEST_PATH_IMAGE014
中的第i行数据为与上述N个第一对象样本中的第i 个第一对象样本对应的第一特征数据,则矩阵
Figure 390755DEST_PATH_IMAGE032
中的第i行数据为与这第i个第一对象样 本对应的第一标签;矩阵
Figure 452121DEST_PATH_IMAGE035
中的第i行数据为与上述N个第二对象样本中的第i个第 二对象样本对应的第二特征数据,则矩阵
Figure 828876DEST_PATH_IMAGE033
中的第i行数据为与这第i个第二对象样本对 应的第二评分。
然后,可以进行矩阵相乘,以执行标签传播:
Figure 42819DEST_PATH_IMAGE036
由于最终目标是挖掘出最终的
Figure 230349DEST_PATH_IMAGE033
,所以可以将
Figure 60902DEST_PATH_IMAGE033
单独列出:
Figure 241348DEST_PATH_IMAGE037
可以按照上述公式进行无穷次迭代,即进行无限次标签传播,最终可以得到:
Figure 840956DEST_PATH_IMAGE038
对于最终得到的
Figure 714234DEST_PATH_IMAGE033
而言,其中第i行的数据即为与上述N个第二对象样本中的第i 个第二对象样本对应的第二标签。
在标签传播的方式下,与上述推荐模型对应的损失函数可以包括第一损失子函数和第二损失子函数的加权和。
上述第一损失子函数可以包括:
Figure 750192DEST_PATH_IMAGE001
其中,
Figure 999908DEST_PATH_IMAGE003
为与第i个第一对象样本对应的第一评分,
Figure 454023DEST_PATH_IMAGE011
为与第i个第一对象样本 对应的第一标签,
Figure 186618DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量;
上述第二损失子函数可以包括:
Figure 460604DEST_PATH_IMAGE006
其中,
Figure 982853DEST_PATH_IMAGE008
为与第j个第一对象样本对应的第一评分,
Figure 291474DEST_PATH_IMAGE009
为与第j个第一对象样本 对应的第一标签,
Figure 224664DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量。
在示出的另一种实施方式中,可以通过设定评分阈值,基于该评分阈值确定与上述第二对象样本对应的上述第二标签。
具体地,可以通过对上述第一对象样本,以及与各第一对象样本对应的第一标签进行统计、分析,确定评分阈值。或者,也可以由技术人员根据实际情况,预先设置评分阈值。后续,可以按照与各第二对象样本对应的第二评分与该评分阈值之间的大小关系,确定上述第二标签。
举例来说,假设设置了两个评分阈值
Figure 251526DEST_PATH_IMAGE039
Figure 311886DEST_PATH_IMAGE040
,其中
Figure 6172DEST_PATH_IMAGE041
,则可以将对应的第 二评分小于
Figure 408466DEST_PATH_IMAGE039
的第二对象样本视为负样本,为其标注的第二标签即为与负样本对应的标 签,将对应的评分大于
Figure 142198DEST_PATH_IMAGE040
的第二对象样本视为正样本,为其标注的第二标签即为与正样本 对应的标签。
在基于上述评分阈值确定上述第二标签的方式下,与上述推荐模型对应的损失函数可以包括第一损失子函数和第二损失子函数的加权和。
上述第一损失子函数可以包括:
Figure 740669DEST_PATH_IMAGE002
其中,
Figure 7572DEST_PATH_IMAGE003
为与第i个第一对象样本对应的第一评分,
Figure 33296DEST_PATH_IMAGE011
为与第i个第一对象样本 对应的第一标签,
Figure 769171DEST_PATH_IMAGE042
为所述第一对象样本和所述第二对象样本的数量;
上述第二损失子函数可以包括:
Figure 436913DEST_PATH_IMAGE043
其中,
Figure 590945DEST_PATH_IMAGE008
为与第j个第一对象样本对应的第一评分,
Figure 787571DEST_PATH_IMAGE044
为与第j个第一对象样本 对应的第一标签,
Figure 10742DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量。
与前述对象推荐方法的实施例相对应,本说明书还提供了对象推荐装置的实施例。
本说明书对象推荐装置的实施例可以应用在电子设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在电子设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图4所示,为本说明书对象推荐装置所在电子设备的一种硬件结构图,除了图4所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常根据该对象推荐的实际功能,还可以包括其他硬件,对此不再赘述。
请参考图5,图5是本说明书一示例性实施例示出的一种对象推荐装置的框图。
上述对象推荐装置可以应用于图4所示的电子设备;该对象推荐装置可以包括:
接受模块501,用于接收用户发起的对象推荐请求;其中,所述对象推荐请求包括对象推荐策略;
召回模块502,用于响应于所述对象推荐请求,召回与所述对象推荐策略匹配的对象,并将召回的对象确定为推荐对象;
评分模块503,用于将所述推荐对象的对象信息输入至训练完成的推荐模型,以使所述推荐模型基于所述对象信息预测所述推荐对象针对所述用户的推荐评分;其中,所述推荐模型基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本进行有监督的训练得到;所述第一对象样本被标注了用于指示其是否被用户查看过的第一标签;所述第二对象样本被标注了基于所述第一对象样本和所述第一标签,对所述第二对象样本进行标签挖掘得到的第二标签;
输出模块504,用于基于所述推荐评分对所述推荐对象进行排序,并将排序后的所述推荐对象向所述用户进行输出。
可选地,所述对象推荐策略包括对象与用户之间的距离阈值;
所述召回模块502具体用于:
召回所在位置与所述用户的定位位置之间的距离不超过所述距离阈值的对象。
可选地,所述装置还包括:
训练模块505,用于迭代执行以下步骤,以对所述推荐模型进行有监督的训练,直至与所述推荐模型对应的损失函数收敛:
将所述第一对象样本的对象信息和所述第二对象样本的对象信息输入至所述推荐模型;
获取所述推荐模型基于所述第一对象样本的对象信息预测出的所述第一对象样本针对用户的第一评分,以及基于所述第二对象样本的对象信息预测出的所述第二对象样本针对用户的第二评分;
基于所述第一对象样本和所述第一标签,以及所述第二评分,对所述第二对象样本进行标签挖掘,得到所述第二标签;
基于所述第一标签和所述第一评分,以及所述第二标签和所述第二评分,确定与所述推荐模型对应的损失函数是否收敛。
可选地,所述训练模块505具体用于:
确定所述第一对象样本和所述第二对象样本之间的相似度;
基于所述相似度、所述第一标签和所述第二评分,对所述第一标签进行标签传播,得到所述第二标签。
可选地,所述训练模块505具体用于:
获取所述推荐模型针对所述第一对象样本提取出的第一特征数据,以及针对所述第二对象样本提取出的第二特征数据;
基于所述第一特征数据和所述第二特征数据,计算所述第一对象样本和所述第二对象样本之间的相似度。
可选地,所述损失函数包括第一损失子函数和第二损失子函数的加权和;
所述第一损失子函数包括:
Figure 747754DEST_PATH_IMAGE002
其中,
Figure 989248DEST_PATH_IMAGE003
为与第i个第一对象样本对应的第一评分,
Figure 622355DEST_PATH_IMAGE011
为与第i个第一对象样本 对应的第一标签,
Figure 332822DEST_PATH_IMAGE042
为所述第一对象样本和所述第二对象样本的数量;
所述第二损失子函数包括:
Figure 342366DEST_PATH_IMAGE045
其中,
Figure 939832DEST_PATH_IMAGE008
为与第j个第一对象样本对应的第一评分,
Figure 743840DEST_PATH_IMAGE009
为与第j个第一对象样本 对应的第一标签,
Figure 941603DEST_PATH_IMAGE042
为所述第一对象样本和所述第二对象样本的数量。
可选地,所述训练模块505具体用于:
基于所述第一对象样本和所述第一标签,确定评分阈值;
按照所述第二评分与所述评分阈值之间的大小关系,确定所述第二标签。
可选地,所述损失函数包括第一损失子函数和第二损失子函数的加权和;
所述第一损失子函数包括:
Figure 754838DEST_PATH_IMAGE010
其中,
Figure 705346DEST_PATH_IMAGE003
为与第i个第一对象样本对应的第一评分,
Figure 45367DEST_PATH_IMAGE011
为与第i个第一对象样本 对应的第一标签,
Figure 199268DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量;
所述第二损失子函数包括:
Figure 268724DEST_PATH_IMAGE012
其中,
Figure 90049DEST_PATH_IMAGE008
为与第j个第一对象样本对应的第一评分,
Figure 501439DEST_PATH_IMAGE009
为与第j个第一对象样本 对应的第一标签,
Figure 893369DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量。
可选地,所述推荐模型为Wide&Deep模型。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
在一个典型的配置中,计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。

Claims (12)

1.一种对象推荐方法,所述方法包括:
接收用户发起的对象推荐请求;其中,所述对象推荐请求包括对象推荐策略;
响应于所述对象推荐请求,召回与所述对象推荐策略匹配的对象,并将召回的对象确定为推荐对象;
将所述推荐对象的对象信息输入至训练完成的推荐模型,以使所述推荐模型基于所述对象信息预测所述推荐对象针对所述用户的推荐评分;其中,所述推荐模型基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本进行有监督的训练得到;所述第一对象样本被标注了用于指示其是否被用户查看过的第一标签;所述第二对象样本被标注了基于所述第一对象样本和所述第一标签,对所述第二对象样本进行标签挖掘得到的第二标签;
基于所述推荐评分对所述推荐对象进行排序,并将排序后的所述推荐对象向所述用户进行输出。
2.根据权利要求1所述的方法,所述对象推荐策略包括对象与用户之间的距离阈值;
所述召回与所述对象推荐策略匹配的对象,包括:
召回所在位置与所述用户的定位位置之间的距离不超过所述距离阈值的对象。
3.根据权利要求1所述的方法,所述方法还包括:
迭代执行以下步骤,以对所述推荐模型进行有监督的训练,直至与所述推荐模型对应的损失函数收敛:
将所述第一对象样本的对象信息和所述第二对象样本的对象信息输入至所述推荐模型;
获取所述推荐模型基于所述第一对象样本的对象信息预测出的所述第一对象样本针对用户的第一评分,以及基于所述第二对象样本的对象信息预测出的所述第二对象样本针对用户的第二评分;
基于所述第一对象样本和所述第一标签,以及所述第二评分,对所述第二对象样本进行标签挖掘,得到所述第二标签;
基于所述第一标签和所述第一评分,以及所述第二标签和所述第二评分,确定与所述推荐模型对应的损失函数是否收敛。
4.根据权利要求3所述的方法,所述基于所述第一对象样本和所述第一标签,以及所述第二评分,对所述第二对象样本进行标签挖掘,得到所述第二标签,包括:
确定所述第一对象样本和所述第二对象样本之间的相似度;
基于所述相似度、所述第一标签和所述第二评分,对所述第一标签进行标签传播,得到所述第二标签。
5.根据权利要求4所述的方法,所述确定所述第一对象样本和所述第二对象样本之间的相似度,包括:
获取所述推荐模型针对所述第一对象样本提取出的第一特征数据,以及针对所述第二对象样本提取出的第二特征数据;
基于所述第一特征数据和所述第二特征数据,计算所述第一对象样本和所述第二对象样本之间的相似度。
6.根据权利要求4所述的方法,所述损失函数包括第一损失子函数和第二损失子函数的加权和;
所述第一损失子函数包括:
Figure 886480DEST_PATH_IMAGE002
其中,
Figure 811580DEST_PATH_IMAGE003
为与第i个第一对象样本对应的第一评分,
Figure 393871DEST_PATH_IMAGE004
为与第i个第一对象样本对应 的第一标签,
Figure 787943DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量;
所述第二损失子函数包括:
Figure 481092DEST_PATH_IMAGE007
其中,
Figure 27743DEST_PATH_IMAGE008
为与第j个第一对象样本对应的第一评分,
Figure 515356DEST_PATH_IMAGE009
为与第j个第一对象样本对应 的第一标签,
Figure 396724DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量。
7.根据权利要求3所述的方法,所述基于所述第一对象样本和所述第一标签,以及所述第二评分,对所述第二对象样本进行标签挖掘,得到所述第二标签,包括:
基于所述第一对象样本和所述第一标签,确定评分阈值;
按照所述第二评分与所述评分阈值之间的大小关系,确定所述第二标签。
8.根据权利要求7所述的方法,所述损失函数包括第一损失子函数和第二损失子函数的加权和;
所述第一损失子函数包括:
Figure 893564DEST_PATH_IMAGE010
其中,
Figure 793256DEST_PATH_IMAGE003
为与第i个第一对象样本对应的第一评分,
Figure 717350DEST_PATH_IMAGE004
为与第i个第一对象样本对应 的第一标签,
Figure 820435DEST_PATH_IMAGE011
为所述第一对象样本和所述第二对象样本的数量;
所述第二损失子函数包括:
Figure 855387DEST_PATH_IMAGE012
其中,
Figure 376630DEST_PATH_IMAGE008
为与第j个第一对象样本对应的第一评分,
Figure 471624DEST_PATH_IMAGE013
为与第j个第一对象样本对应 的第一标签,
Figure 248957DEST_PATH_IMAGE005
为所述第一对象样本和所述第二对象样本的数量。
9.根据权利要求1所述的方法,所述推荐模型为Wide&Deep模型。
10.一种对象推荐装置,所述装置包括:
接受模块,用于接收用户发起的对象推荐请求;其中,所述对象推荐请求包括对象推荐策略;
召回模块,用于响应于所述对象推荐请求,召回与所述对象推荐策略匹配的对象,并将召回的对象确定为推荐对象;
评分模块,用于将所述推荐对象的对象信息输入至训练完成的推荐模型,以使所述推荐模型基于所述对象信息预测所述推荐对象针对所述用户的推荐评分;其中,所述推荐模型基于已向用户曝光的第一对象样本和未向用户曝光的第二对象样本进行有监督的训练得到;所述第一对象样本被标注了用于指示其是否被用户查看过的第一标签;所述第二对象样本被标注了基于所述第一对象样本和所述第一标签,对所述第二对象样本进行标签挖掘得到的第二标签;
输出模块,用于基于所述推荐评分对所述推荐对象进行排序,并将排序后的所述推荐对象向所述用户进行输出。
11.一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1至9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如权利要求1至9中任一项所述的方法。
CN202210345984.1A 2022-04-02 2022-04-02 对象推荐方法、装置及电子设备 Active CN114491283B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210345984.1A CN114491283B (zh) 2022-04-02 2022-04-02 对象推荐方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210345984.1A CN114491283B (zh) 2022-04-02 2022-04-02 对象推荐方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN114491283A true CN114491283A (zh) 2022-05-13
CN114491283B CN114491283B (zh) 2022-07-22

Family

ID=81488821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210345984.1A Active CN114491283B (zh) 2022-04-02 2022-04-02 对象推荐方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114491283B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109388760A (zh) * 2017-08-03 2019-02-26 腾讯科技(北京)有限公司 推荐标签获取方法、媒体内容推荐方法、装置及存储介质
CN109408731A (zh) * 2018-12-27 2019-03-01 网易(杭州)网络有限公司 一种多目标推荐方法、多目标推荐模型生成方法以及装置
CN110889747A (zh) * 2019-12-02 2020-03-17 腾讯科技(深圳)有限公司 商品推荐方法、装置、系统、计算机设备及存储介质
CN111291266A (zh) * 2020-02-13 2020-06-16 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质
CN111611488A (zh) * 2020-05-21 2020-09-01 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、电子设备
CN111680217A (zh) * 2020-05-27 2020-09-18 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及存储介质
CN111738780A (zh) * 2020-07-31 2020-10-02 支付宝(杭州)信息技术有限公司 一种推荐对象的方法及系统
CN112464647A (zh) * 2020-11-23 2021-03-09 北京智源人工智能研究院 一种面向推荐系统的负采样方法、装置和电子设备
CN112785397A (zh) * 2021-03-09 2021-05-11 中国工商银行股份有限公司 一种产品推荐方法、装置及存储介质
CN112925977A (zh) * 2021-02-26 2021-06-08 中国科学技术大学 一种基于自监督图表征学习的推荐方法
US20210248651A1 (en) * 2019-10-31 2021-08-12 Huawei Technologies Co., Ltd. Recommendation model training method, recommendation method, apparatus, and computer-readable medium
CN113539457A (zh) * 2021-07-16 2021-10-22 挂号网(杭州)科技有限公司 医疗资源的推荐方法及装置、电子设备、存储介质
CN113705629A (zh) * 2021-08-09 2021-11-26 北京三快在线科技有限公司 一种训练样本生成方法、装置、存储介质及电子设备
CN113850649A (zh) * 2021-09-29 2021-12-28 中国科学院空天信息创新研究院 一种基于多平台用户数据的定制化推荐方法及推荐系统
WO2022016522A1 (zh) * 2020-07-24 2022-01-27 华为技术有限公司 推荐模型的训练方法、推荐方法、装置及计算机可读介质
CN114117213A (zh) * 2021-11-12 2022-03-01 杭州网易云音乐科技有限公司 一种推荐模型训练、推荐方法、装置、介质和设备

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109388760A (zh) * 2017-08-03 2019-02-26 腾讯科技(北京)有限公司 推荐标签获取方法、媒体内容推荐方法、装置及存储介质
CN109408731A (zh) * 2018-12-27 2019-03-01 网易(杭州)网络有限公司 一种多目标推荐方法、多目标推荐模型生成方法以及装置
US20210248651A1 (en) * 2019-10-31 2021-08-12 Huawei Technologies Co., Ltd. Recommendation model training method, recommendation method, apparatus, and computer-readable medium
CN113508378A (zh) * 2019-10-31 2021-10-15 华为技术有限公司 推荐模型的训练方法、推荐方法、装置及计算机可读介质
CN110889747A (zh) * 2019-12-02 2020-03-17 腾讯科技(深圳)有限公司 商品推荐方法、装置、系统、计算机设备及存储介质
CN111291266A (zh) * 2020-02-13 2020-06-16 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质
CN111611488A (zh) * 2020-05-21 2020-09-01 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、电子设备
CN111680217A (zh) * 2020-05-27 2020-09-18 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及存储介质
WO2022016522A1 (zh) * 2020-07-24 2022-01-27 华为技术有限公司 推荐模型的训练方法、推荐方法、装置及计算机可读介质
CN111738780A (zh) * 2020-07-31 2020-10-02 支付宝(杭州)信息技术有限公司 一种推荐对象的方法及系统
CN112464647A (zh) * 2020-11-23 2021-03-09 北京智源人工智能研究院 一种面向推荐系统的负采样方法、装置和电子设备
CN112925977A (zh) * 2021-02-26 2021-06-08 中国科学技术大学 一种基于自监督图表征学习的推荐方法
CN112785397A (zh) * 2021-03-09 2021-05-11 中国工商银行股份有限公司 一种产品推荐方法、装置及存储介质
CN113539457A (zh) * 2021-07-16 2021-10-22 挂号网(杭州)科技有限公司 医疗资源的推荐方法及装置、电子设备、存储介质
CN113705629A (zh) * 2021-08-09 2021-11-26 北京三快在线科技有限公司 一种训练样本生成方法、装置、存储介质及电子设备
CN113850649A (zh) * 2021-09-29 2021-12-28 中国科学院空天信息创新研究院 一种基于多平台用户数据的定制化推荐方法及推荐系统
CN114117213A (zh) * 2021-11-12 2022-03-01 杭州网易云音乐科技有限公司 一种推荐模型训练、推荐方法、装置、介质和设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DING J T: ""Reinforced negative sampling for recommendation with exposure data"", 《28TH INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE》 *
SAITO Y: ""Unbiased recommender learning from missing-not-at-random implicit feedback"", 《PROCEEDINGS OF THE 13TH INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING》 *
严非凡: ""一种改善推荐模型长尾性能的框架"", 《武汉大学学报(理学版)》 *
黄勃: ""推荐系统研究进展与应用"", 《武汉大学学报(理学版)》 *

Also Published As

Publication number Publication date
CN114491283B (zh) 2022-07-22

Similar Documents

Publication Publication Date Title
CN110413877B (zh) 一种资源推荐方法、装置及电子设备
US20230134742A1 (en) Deep neural network system for similarity-based graph representations
US11222055B2 (en) System, computer-implemented method and computer program product for information retrieval
CN112487278A (zh) 推荐模型的训练方法、预测选择概率的方法及装置
US10438133B2 (en) Spend data enrichment and classification
CN112364204B (zh) 视频搜索方法、装置、计算机设备及存储介质
CN110163376B (zh) 样本检测方法、媒体对象的识别方法、装置、终端及介质
CN111291765A (zh) 用于确定相似图片的方法和装置
CN113191838B (zh) 一种基于异质图神经网络的购物推荐方法及系统
CN110647683B (zh) 一种信息推荐方法、装置
US11599927B1 (en) Artificial intelligence system using deep neural networks for pairwise character-level text analysis and recommendations
CN111898904B (zh) 一种数据处理方法及装置
JP2013058192A (ja) 区画を評価するシステム、方法、及びコンピュータプログラム製品
CN109308332B (zh) 一种目标用户获取方法、装置和服务器
CN111597321A (zh) 问题答案的预测方法、装置、存储介质及电子设备
CN113269232B (zh) 模型训练方法、向量化召回方法、相关设备及存储介质
Latha et al. Product recommendation using enhanced convolutional neural network for e-commerce platform
US20180157744A1 (en) Comparison table automatic generation method, device and computer program product of the same
CN114491283B (zh) 对象推荐方法、装置及电子设备
US20190385089A1 (en) Social network navigation based on content relationships
Narayanan et al. Improving prediction with enhanced distributed memory-based resilient dataset filter
Meng et al. Variational Bayesian representation learning for grocery recommendation
CN114969253A (zh) 市场主体与政策的匹配方法、装置、计算设备及介质
CN114328844A (zh) 一种文本数据集管理方法、装置、设备及存储介质
CN114840762A (zh) 推荐内容确定方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant