CN117216361A - 推荐方法、装置、电子设备及计算机可读存储介质 - Google Patents

推荐方法、装置、电子设备及计算机可读存储介质 Download PDF

Info

Publication number
CN117216361A
CN117216361A CN202211408294.2A CN202211408294A CN117216361A CN 117216361 A CN117216361 A CN 117216361A CN 202211408294 A CN202211408294 A CN 202211408294A CN 117216361 A CN117216361 A CN 117216361A
Authority
CN
China
Prior art keywords
recommended
information
user
determining
response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211408294.2A
Other languages
English (en)
Inventor
骆顺昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202211408294.2A priority Critical patent/CN117216361A/zh
Publication of CN117216361A publication Critical patent/CN117216361A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种推荐方法、装置、电子设备及计算机可读存储介质,涉及人工智能、云技术及计算机技术领域。该方法包括:响应于针对待推荐用户的推荐请求,基于待推荐对象对应的对象信息和待推荐场景对应的场景信息确定待推荐信息;确定表征被待推荐用户响应的第一对象的对象相关信息的历史正样本行为信息;基于待推荐信息和历史正样本行为信息,确定表征待推荐用户对待推荐对象进行响应的概率的响应信息;基于该响应信息,确定是否对待推荐对象进行推荐,在确定对待推荐对象进行推荐的情况下,在待推荐场景中将待推荐对象推荐给待推荐用户。采用本申请实施例,可以在待推荐场景中,为待推荐用户推荐可能会关注的待推荐对象,可适用性高。

Description

推荐方法、装置、电子设备及计算机可读存储介质
技术领域
本申请涉及人工智能、云技术及计算机技术领域,尤其涉及一种推荐方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网技术的发展,出现了越来越多的信息获取途径,例如,用户可以基于在不同的内容客户端(例如,应用程序(application,简称APP)、网页等)推荐的内容获取信息,所获取到的信息可以包括文章、视频、资讯等。通常情况下,在用户对内容客户端推荐的内容感兴趣时,通常会对所推荐的内容进行响应(例如,对所推荐的内容进行点击、分享、评论等操作)以获取所响应的内容对应的信息。
然而,内容客户端所展示的内容并不都是用户所感兴趣的,在该情况下,会导致用户无法直接获取到感兴趣的信息,导致用户需要通过其他方式(例如,联网搜索等)获取感兴趣的信息,即需要耗费较多时间才能获取到感兴趣的信息。有鉴于此,如何推荐与用户兴趣相匹配的内容成为了该领域亟待解决的技术问题。
发明内容
本申请实施例提供了一种推荐方法,以解决相关技术中,无法为用户推荐与用户兴趣相匹配的内容的问题。
相应的,本申请实施例还提供了一种装置、一种电子设备以及一种计算机可读存储介质,用以保证上述方法的实现及应用。
一方面,本申请实施例提供一种推荐方法,该方法包括:
响应于针对待推荐用户的推荐请求,基于待推荐对象对应的对象信息和待推荐场景对应的场景信息,确定待推荐信息;
确定待推荐用户的历史正样本行为信息;其中,历史正样本行为信息表征历史已推荐对象中被待推荐用户响应的第一对象的对象相关信息;
基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息;第一响应信息表征待推荐用户对待推荐对象进行响应的概率;
基于待推荐信息和第一响应信息,确定是否对待推荐对象进行推荐,并在确定对待推荐对象进行推荐的情况下,在待推荐场景中将待推荐对象推荐给待推荐用户。
另一方面,本申请实施例提供了一种推荐装置,该装置包括:
待推荐信息确定模块,用于响应于针对待推荐用户的推荐请求,基于待推荐对象对应的对象信息和待推荐场景对应的场景信息,确定待推荐信息;
历史行为信息确定模块,用于确定待推荐用户的历史正样本行为信息;其中,历史正样本行为信息表征历史已推荐对象中被待推荐用户响应的第一对象的对象相关信息;
响应信息确定模块,用于基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息;第一响应信息表征待推荐用户对待推荐对象进行响应的概率;
对象推荐模块,用于基于待推荐信息和第一响应信息,确定是否对待推荐对象进行推荐,并在确定对待推荐对象进行推荐的情况下,在待推荐场景中将待推荐对象推荐给待推荐用户。
可选地,上述对象推荐模块在用于基于待推荐信息和第一响应信息,确定是否对待推荐对象进行推荐时,可以具体用于:
通过历史行为信息确定模块确定待推荐用户的历史负样本行为信息;其中,历史负样本行为信息表征上述历史已推荐对象中未被待推荐用户响应的第二对象的对象相关信息;
基于待推荐信息和历史负样本行为信息,确定待推荐用户对待推荐对象的第二响应信息;第二响应信息表征待推荐用户不对待推荐对象进行响应的概率;
基于待推荐信息、第一响应信息和第二响应信息,确定是否对待推荐对象进行推荐。
可选地,上述第一对象的对象相关信息是通过以下方式确定的:
基于待推荐用户对第一对象进行响应的时间点,确定待推荐对象对第一对象的偏好信息;
基于第一对象对应的对象信息、场景信息以及偏好信息,确定第一对象的对象相关信息;
上述响应信息确定模块在用于基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息时,可以具体用于:
对待推荐信息和历史正样本行为信息对应的各个第一对象的对象相关信息进行信息融合,确定第一响应信息。
可选地,上述响应信息确定模块在用于基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息时,可以具体用于:
对历史正样本行为信息对应的各个第一对象的对象相关信息进行信息融合,确定待推荐用户的全局偏好信息;其中,对于每个第一对象,待推荐用户对该第一对象进行响应的时间点与对推荐请求进行响应的时间点之间的第一时间间隔越短,该第一对象的偏好信息在全局偏好信息中的权重值越高;
基于全局偏好信息与待推荐信息,确定第一响应信息。
可选地,上述响应信息确定模块在用于基于全局偏好信息与待推荐信息,确定第一响应信息时,可以具体用于:
对全局偏好信息与待推荐信息进行信息融合,预测待推荐用户对待推荐对象进行响应的第一响应信息。
可选地,上述第二对象的对象相关信息是通过以下方式确定的:
基于对第二对象进行推荐的时间点,确定第二对象对待推荐用户的负反馈信息;
基于第二对象对应的对象信息、场景信息以及负反馈信息,确定第二对象的对象相关信息;
上述响应信息确定模块在用于基于待推荐信息和历史负样本行为信息,确定待推荐用户对待推荐对象的第二响应信息时,可以具体用于:
对待推荐信息和历史负样本行为信息对应的各个第二对象的对象相关信息进行信息融合,确定第二响应信息。
可选地,上述响应信息确定模块在用于基于待推荐信息和历史负样本行为信息,确定待推荐用户对待推荐对象的第二响应信息时,可以具体用于:
对历史负样本行为信息对应的各个第二对象的对象相关信息进行信息融合,确定待推荐用户的全局负反馈信息;其中,对于每个第二对象,对该第二对象进行推荐的时间点与对推荐请求进行响应的时间点之间的第二时间间隔越短,该第二对象对待推荐用户的负反馈信息在全局负反馈信息中的权重值越高;
基于全局负反馈信息与待推荐信息,确定第二响应信息。
可选地,上述响应信息确定模块在用于基于全局负反馈信息与待推荐信息,确定第二响应信息时,可以具体用于:
对全局负反馈信息与待推荐信息进行信息融合,预测待推荐用户不对待推荐对象进行响应的第二响应信息。
另一方面,本申请实施例提供了一种电子设备,包括处理器和存储器,该处理器和存储器相互连接;
上述存储器用于存储计算机程序;
上述处理器被配置用于在调用上述计算机程序时,执行本申请实施例提供的推荐方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行以实现本申请实施例提供的推荐方法。
另一方面,本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机程序,上述计算机程序被处理器执行时实现本申请实施例提供的推荐方法。
在本申请实施例中,在对针对待推荐用户的推荐请求进行响应时,基于待推荐对象对应的对象信息和待推荐场景对应的场景信息,确定待推荐信息以及表征历史已推荐对象中被待推荐用户响应的第一对象的对象相关信息的历史正样本行为信息。基于该待推荐信息和历史正样本行为信息,确定表征待推荐用户对待推荐对象进行相应的概率的第一响应信息,进一步基于该第一响应信息,确定是否对待推荐对象进行推荐,并在确定对待推荐对象进行推荐的情况下,在待推荐场景中将待推荐对象推荐给待推荐用户。可以更好地结合待推荐场景对应的场景信息以及历史正样本行为信息所反映的用户的偏好信息,确定待推荐用户是否会对待推荐对象进行关注,从而在待推荐场景中,为待推荐用户推荐可能会关注的待推荐对象,节省用户获取感兴趣的信息所需的时间,更好地满足用户需求。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例提供的实现推荐系统的架构示意图;
图2示出了本申请实施例提供的一种推荐方法的流程示意图;
图3示出了本申请实施例提供的一种推荐方法的应用场景示意图;
图4示出了本申请实施例提供的一种推荐方法的另一应用场景示意图;
图5示出了本申请实施例提供的一种推荐方法的另一应用场景示意图;
图6示出了本申请实施例提供的一种推荐方法的另一应用场景示意图;
图7示出了本申请实施例提供的一种推荐系统的流程示意图;
图8示出了本申请实施例提供的一种推荐方法的另一流程示意图;
图9示出了本申请实施例提供的一种推荐模型的示意图;
图10示出了本申请实施例提供的一种推荐装置的结构示意图;
图11示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如前文所描述的,相关技术中,无法为用户推荐与用户兴趣相匹配的内容。基于此,本申请实施例提供了一种推荐方法、装置、电子设备即计算机可读存储介质。在该推荐方法中,可以更好地结合待推荐场景对应的场景信息以及历史正样本行为信息所反映的用户可能会发生响应的对象相关信息(即用户的关注点),确定待推荐用户是否会对待推荐对象进行关注,从而在待推荐场景中,为待推荐用户推荐可能会关注的待推荐对象,节省用户获取感兴趣的信息所需的时间,更好地满足用户需求。
相关技术中,在进行对象推荐时,也会采用对历史被响应的对象进行向量化,基于对各向量进行平均池化(mean pooling)的结果,确定是否对待推荐对象进行推荐,但该方式会造成用户的近期偏好信息形成的向量被其他时期的向量平均,导致所推荐的对象可能与待推荐用户的近期偏好兴趣不符等问题。
并且,虽然在一些技术中,也会基于RNN(Recurrent Neural Network,即循环神经网络)实现的神经网络模型或基于CNN(Convolutional Neural Network,即卷积神经网络)实现的神经网络模型获取近期被待推荐用户响应的待推荐对象的序列信息,但基于RNN实现的神经网络模型通常是串行运行的,耗时长,不利于上线,同时有长距离依赖弱的问题,基于CNN实现的神经网络模型也有长距离依赖弱的问题,均无法满足实际需求。
有鉴于此,本申请实施例提供了一种推荐方法、装置、电子设备及计算机可读存储介质,以解决上述存在的至少一种技术问题。
本申请实施例提供的推荐方法,可以基于人工智能(Artificial Intelligence,AI)技术实现。比如,基于人工智能技术构建初始神经网络模型,并对该初始神经网络模型进行训练得到训练好的推荐模型,并通过该训练好的推荐模型,基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息,并进而基于该待推荐信息和第一响应信息,确定是否对待推荐对象进行推荐。AI是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
本申请实施例提供的推荐方法可以基于云技术(Cloud technology)实现,比如,在对推荐模型进行训练的过程中,所涉及的数据计算可以采用云计算(Cloud computing)方式。其中,云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
本申请实施例提供的推荐方法还可以在智能交通领域实现,应用于自动驾驶或交通应用中,例如,在保障行驶安全的情况下,根据该推荐方法向用户播报推荐内容。
可以理解的是,在本申请的实施例运用到具体产品或技术中时,所涉及到的用户数据(例如,用户昵称、用户的响应信息等),需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
下面通过对几个示例性实施方式的描述,对本申请实施例的技术方案以及本申请的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
本申请实施例提供了一种推荐方法。该推荐方法可以应用于各种不同的应用场景中,该应用场景可以为任一需要进行待推荐对象进行推荐的场景。其中,待推荐对象可以为APP、资讯、音视频(例如,电影、音乐等)、新闻、书籍、学术论文、搜索查询、分众分类等等。具体的应用场景可以为:通过该推荐方法在应用下载APP中为用户推荐用户感兴趣的APP,也可以在网页中为用户推荐用户感兴趣的资讯,也可以在视频APP中的不同页面为用户推荐用户感兴趣的视频等。当然该应用场景也可以为一些进行终端管理的APP中(例如,手机管家等),在用户对终端进行管理的过程中,为用户推荐相关的资讯。在以下实施例中,以待推荐对象为资讯为例,对该推荐方法进行说明。
该推荐方法的执行主体可以是推荐装置。该推荐装置可以是任一计算机设备,包括但不限于终端或服务器。该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。该终端(也可以称为用户终端或用户设备(User Equipment,UE))可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备(例如智能音箱)、可穿戴电子设备(例如智能手表)、车载终端、智能家电(例如智能电视)、AR(Augmented Reality,增强现实)/VR(Virtual Reality,虚拟现实)设备等,但并不局限于此。该推荐方法还可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
其中,如图1所示,在该推荐装置101为服务器时,针对待推荐用户的推荐请求可以是该服务器从待推荐用户对应的终端102接收到的,并在响应于该推荐请求,确定对待推荐对象进行推荐的情况下,在待推荐用户对应的终端102内的待推荐场景中将待推荐对象推荐给待推荐用户。在该情况下,推荐装置与待推荐用户对应的终端可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
如图2所示,该方法包括:
步骤S201:响应于针对待推荐用户的推荐请求,基于待推荐对象对应的对象信息和待推荐场景对应的场景信息,确定待推荐信息。
待推荐用户可以为任一需要获取信息的用户,包括但不限于真实的人或者虚拟的人(例如机器人)等。
该推荐请求可以是基于待推荐用户的触发操作实现的。例如,如图3所示,在待推荐对象为资讯APP内的资讯时,该推荐请求可以是基于用户对该资讯APP的打开操作或者对该资讯APP的当前资讯展示页面(即图3示出的推荐资讯页面)的刷新操作生成的。
当然,该推荐请求也可以是基于预设的更新时间间隔生成的。例如,以图3示出的资讯展示页面为例,可以设置预设的更新时间间隔为5分钟,即每5分钟生成一次推荐请求,以在通过该推荐方法确定对待推荐对象进行推荐的情况下,更新资讯展示页面所展示的资讯。
待推荐对象对应的对象信息可以是对待推荐对象的对象内容进行融合得到的信息。其中,待推荐对象的对象内容包括该待推荐对象本身的多模态信息。其中,多模态信息可以包括但不限于图片信息、文字信息、视频信息等多个模态的信息。
在具体实施过程中,可以分别对该待推荐对象的各个模态的信息进行数据格式转换,转换为相同的数据格式的数据信息(例如,相同模态的、计算机可以执行的向量),并对转换后的数据信息进行拼接得到该待推荐对象的多模态信息。并将该待推荐对象的多模态信息作为该待推荐对象对应的对象信息。
当然,该待推荐对象的对象内容还可以包括该待推荐对象的关联信息。其中,待推荐对象的关联信息可以包括该待推荐对象的生成事件、该待推荐对象的类型信息(例如,在该待推荐对象为资讯时,该待推荐对象的类型信息可以包括但不限于娱乐资讯、社会资讯、情感资讯和历史资讯等)、该待推荐对象的作者信息等多项关联的信息。
在具体实施过程中,可以分别对该待推荐对象的每项关联信息进行数据格式转换,转换为相同的数据格式的数据信息,并将转换后的数据信息进行拼接得到该待推荐对象的关联信息。并对待推荐对象的多模态信息和关联信息进行拼接,得到该待推荐对象对应的对象信息。
待推荐场景可以为该方法的具体的应用场景,包括但不限于待推荐对象对应的内容客户端、待推荐对象对应的内容客户端中的具体页面。以图3示出的资讯APP为例,待推荐场景包括但不限于该资讯APP、该资讯APP内的不同页面(例如,推荐资讯页面、娱乐资讯页面、社会资讯页面、情感资讯页面和历史资讯页面等)、该资讯APP内不同页面中的具体位置(例如,资讯位置1、资讯位置2、资讯位置3等)等,本申请实施例对此不做限制。
待推荐场景对应的场景信息可以为对待推荐场景进行编码之后的得到的数据信息,例如,可以是对待推荐场景进行数据格式转换后的数据信息。例如,可以设置推荐资讯页面对应的场景标识(即场景ID(identification))为A,娱乐资讯页面对应的场景标识为B,社会资讯页面对应的场景标识为C,情感资讯页面对应的场景标识为D,历史资讯页面对应的场景标识为E。在待推荐场景为资讯APP内推荐资讯页面中的资讯位置1时,对应的场景信息可以为A-1。
在具体实施过程中,可以对待推荐对象对应的对象信息和待推荐场景对应的场景信息进行拼接得到待推荐信息。
步骤S202:确定待推荐用户的历史正样本行为信息;其中,历史正样本行为信息表征历史已推荐对象中被待推荐用户响应的第一对象的对象相关信息。
如前文所记载的,通常情况下,待推荐用户会通过对已推荐对象中进行点击、分享、评论等响应操作,以获取响应的信息。历史正样本行为信息即通过确定历史已推荐对象中被待推荐用户响应的第一对象,基于待推荐用户对各第一对象进行响应的响应信息以及各第一对象本身的信息等生成的序列信息,例如,可以表示为[第一对象1,第一对象2,第一对象3,……]。
由于实际处理过程中,历史已推荐对象中被待推荐用户响应的第一对象的数量较少,在获取到各第一对象的对象相关信息后,可以对各第一对象的对象相关信息进行上采样处理,得到数量较丰富的第一对象的对象相关信息。
其中,每个第一对象的对象相关信息可以反映待推荐用户对该第一对象的偏好信息。其中,偏好信息可以具体包括感兴趣程度和不感兴趣程度。由于第一对象为历史已推荐对象中被待推荐用户响应的对象,以下以第一对象的对象相关信息反映的是待推荐用户对该第一对象的感兴趣程度为例进行说明。
第一对象的对象相关信息可以包括但不限于第一对象的多模态信息、第一对象对应的推荐场景的场景信息以及待推荐用户对该第一对象进行响应的响应信息。其中,响应信息可以包括但不限于响应时间点、响应操作和响应次数等,本申请实施例对此不做限制。其中,响应操作可以包括但不限于点击操作、分享操作和评论操作等。具体地:
对第一对象进行响应的时间点(即点击时间戳)与对推荐请求的进行响应的时间点之间的第一时间间隔越短,该第一对象的对象相关信息所反映的待推荐用户对该第一对象的感兴趣程度越强;反之,感兴趣程度越弱。
待推荐用户对第一对象进行响应的响应操作不同,对应的响应信息所反映的待推荐用户的感兴趣程度也不同。例如,可以设置点击操作对应的响应信息所反映的待推荐用户的兴趣程度<分享操作对应的响应信息所反映的待推荐用户的兴趣程度<评论操作对应的响应信息所反映的待推荐用户的兴趣程度等,本申请实施例对此不做限制。
对第一对象进行响应的响应次数越长,该第一对象的对象相关信息所反映的待推荐用户对该第一对象的感兴趣程度越强;反之,感兴趣程度越弱。
在具体实施过程中,可以分别对第一对象的多模态信息、第一对象对应的推荐场景的场景信息以及待推荐用户对该第一对象进行响应的响应信息进行数据格式转换,转换为相同的数据格式的数据信息,并对转换后的数据信息进行拼接得到该第一对象的对象相关信息。并基于各第一对象的对象相关信息生成历史正样本行为信息。
通过确定表征历史已推荐对象中被待推荐用户响应的第一对象的对象相关信息的历史正样本行为信息,可以便于进一步分析待推荐用户的所关注的已推荐对象,获取待推荐用户的偏好信息。
步骤S203:基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息;第一响应信息表征待推荐用户对待推荐对象进行响应的概率。
在具体实施过程中,可以通过确定待推荐信息与历史正样本行为信息之间的相似度,基于二者之间的相似度,确定待推荐用户对待推荐对象进行响应的概率。也可以仅基于交叉注意力学习机制,学习待推荐信息中对历史正样本行为信息感兴趣的信息,并抑制待推荐信息中对历史正样本行为信息不感兴趣的信息,并基于交叉注意力学习机制的学习结果,确定待推荐用户对待推荐对象进行响应的概率,并将待推荐用户对待推荐对象进行响应的概率作为第一响应信息。
具体地,还可以基于不同的响应操作生成不同的历史正样本行为信息。并分别基于待推荐信息和任一历史正样本行为信息,确定待推荐用户对待推荐对象进行该历史正样本行为信息对应的响应操作的概率。从而基于待推荐用户对待推荐对象进行每种响应操作的概率,联合确定第一响应信息。当然,也可以将待推荐用户对待推荐对象进行每种响应操作的概率中的最高概率值以及该最高概率值对应的响应操作,确定为第一响应信息。
可以理解的是,为了为待推荐用户推荐更符合用户需求的待推荐对象,可以设置预设历史时间段,基于该预设历史时间段内被待推荐用户响应的第一对象的对象相关信息进行分析,得到历史正样本行为信息,以进一步确定待推荐用户的近期偏好信息。例如,该预设历史时间段可以为在当前时间点的前30天。
步骤S204:基于待推荐信息和第一响应信息,确定是否对待推荐对象进行推荐,并在确定对待推荐对象进行推荐的情况下,在待推荐场景中将待推荐对象推荐给待推荐用户。
在该实现方式中,可以通过设置第一概率阈值,基于该第一概率阈值,对第一响应信息进行二值化处理,从而确定是否对待推荐对象进行推荐。
例如,可以设置第一概率阈值为70%,从而在第一响应信息对应的概率大于或等于70%时,确定对待推荐对象进行推荐。在第一响应信息对应的概率小于70%时,确定不对待推荐对象进行推荐。
在实际应用过程中,可以基于待推荐信息和第一响应信息,通过排序模型(例如,wide&deep或DeepFM(Factorization Machines,因子分解机)等)对二者进行信息融合,具体地,以DeepFM为例,可以通过DeepFM中的deep部分的2层全连接层对待推荐信息和第一响应信息中的低级维度特征进行特征提取。通过DeepFM中的FM部分对待推荐信息和第一响应信息进行交叉特征提取,得到时间层级上的更高维度的特征。通过DeepFM中的全连接层对deep部分输出的信息和FM部分输出的信息进行全连接特征提取,得到信息融合结果。并通过sigmoid模型,对该信息融合结果进行二值化处理,确定是否对待推荐对象进行推荐。
在具体实施过程中,还可以进一步获取待推荐用户的用户相关信息,通过对用户相关信息进行数据格式转换,转换为相同的数据格式的数据信息,并基于转换后的数据信息、待推荐信息和第一响应信息,共同确定是否对待推荐对象进行推荐。
其中,用户相关信息可以包括但不限于用户昵称、年龄、性别、用户的长期偏好信息等。其中,用户的长期偏好信息可以对较长的历史时间段内(即除了上述预设历史时间段之外的时间段)被待推荐用户响应的第一对象的对象相关信息进行分析得到的。
通过本申请实施例提供的推荐方法,可以更好地结合待推荐场景对应的场景信息以及历史正样本行为信息所反映的用户的偏好信息,确定待推荐用户是否会对待推荐对象进行关注,从而在待推荐场景中,为待推荐用户推荐可能会关注的待推荐对象,节省用户获取感兴趣的信息所需的时间,更好地满足用户需求。
可选地,上述第一对象的对象相关信息是通过以下方式确定的:
基于待推荐用户对第一对象进行响应的时间点,确定待推荐对象对第一对象的偏好信息;
基于第一对象对应的对象信息、场景信息以及偏好信息,确定第一对象的对象相关信息;
上述基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息,可以包括:
对待推荐信息和历史正样本行为信息对应的各个第一对象的对象相关信息进行信息融合,确定第一响应信息。
如前文所记载的,可以基于第一对象对应的第一时间间隔,确定待推荐对象对第一对象的偏好信息。具体地,该第一时间间隔越短,该第一对象的对象相关信息所反映的待推荐用户对该第一对象的感兴趣程度越强;反之,感兴趣程度越弱。
第一对象对应的对象信息,即对第一对象的对象内容进行融合得到的信息。
可以参照上述确定待推荐信息的方式,确定第一对象的对象相关信息。即,可以分别对第一对象对应的对象信息、场景信息以及偏好信息进行数据格式转换,转换为相同的数据格式的数据信息,并将转换后的数据信息进行拼接得到该第一对象的对象相关信息。
需要说明的是,为了提高所确定的推荐结果的准确性,在待推荐对象对应的对象信息中仅包括多模态信息时,第一对象对应的对象信息也应仅包括多模态信息。
在对待推荐信息和历史正样本行为信息对应的各个第一对象的对象相关信息进行信息融合时,可以基于交叉注意力学习机制,学习待推荐信息中对各个第一对象的对象相关信息感兴趣的信息,抑制待推荐信息中对各个第一对象的对象相关信息不感兴趣的信息,并基于交叉注意力学习机制的学习结果,确定待推荐用户对待推荐对象进行响应的概率,并将待推荐用户对待推荐对象进行响应的概率作为第一响应信息。
其中,待推荐信息中对一个第一对象的对象相关信息中感兴趣的信息越多,对该第一对象的响应信息在第一响应信息中的权重值越高。例如,在待推荐信息对响应操作为点击操作的第一对象的对象相关信息中感兴趣的信息越多,第一响应信息对应的响应操作为点击操作的可能性更高。
通过基于待推荐用户对第一对象进行响应的时间点,确定待推荐对象对第一对象的偏好信息,可以更好地采集待推荐用户的近期偏好信息中对被推荐对象的感兴趣程度,避免将用户的近期偏好信息平均至长期偏好信息中。通过进一步通过待推荐信息与各个第一对象的对象相关信息进行信息融合,可以更好地结合待推荐用户的近期偏好信息,预测待推荐用户对待推荐对象的第一响应信息,进而为确定出更符合待推荐用户的近期偏好信息的待推荐对象做铺垫。
为了更好的捕捉待推荐用户的近期偏好信息,本申请实施例还提供了以下可选的实施方式:
上述基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息,可以包括:
对历史正样本行为信息对应的各个第一对象的对象相关信息进行信息融合,确定待推荐用户的全局偏好信息;其中,对于每个第一对象,待推荐用户对该第一对象进行响应的时间点与对推荐请求进行响应的时间点之间的第一时间间隔越短,该第一对象的偏好信息在全局偏好信息中的权重值越高;
基于全局偏好信息与待推荐信息,确定第一响应信息。
在该实现方式中,可以基于自注意力学习机制,对各个第一对象的对象相关信息进行互相学习,确定待推荐用户对各个第一对象的全局偏好信息。
在具体实施过程中,如图4所示,可以基于待推荐用户对各第一对象进行响应的时间点与对推荐请求进行响应时间点之间的第一时间间隔,对各个第一对象进行分类,并基于分类方式确定各个第一对象对应的位置ID。例如,对于第一时间间隔≤30的第一对象,可以放入第一分桶(即按天分桶),其中,每天第一对象对应一个位置ID。例如,第一时间间隔为0的第一对象的位置ID为0;第一时间间隔为3的第一对象的位置ID为3;第一时间间隔为4的第一对象的位置ID为4。对于30<第一时间间隔≤90的第一对象,可以放入第二分桶(即按月分桶),其中,可以将第二分桶内各第一对象的位置id统一设置为60。对于第一时间间隔>90的第一对象,可以放入第三分桶(即长期分桶),其中,即可以将第三分桶内各第一对象的位置id统一设置为120。
在确定出各个第一对象的位置ID后,可以采用随机数生成方式,生成各位置ID对应的位置向量,并基于得到的基于各位置ID以及每个位置ID对应的位置向量之间的映射关系,生成位置向量表。
同样地,也可以采用随机数生成方式,基于各个第一对象的场景ID,生成各场景ID对应的场景向量,并进一步生成场景向量表。
在仅考虑第一对象的多模态信息时,基于第一对象的多模态信息生成相应的多模态向量,将基于以下方式确定第一对象的对象向量(即对象相关信息):
对象向量=多模态向量+场景向量+位置向量。
如图5所示,在得到可以将各个第一对象的对象向量后,将各个第一对象的对象向量形成的正样本序列向量输入至基于transformer(一种基于encoder-decoder和attention机制实现的、可以进行序列问题处理的神经网络模型)的模型中,通过以下方式学习正样本序列向量中各个第一对象的对象向量之间的向量全局信息,并加权平均后得到全局偏好信息:
MultiHead(Q,K,V)=Concat(head1,…,headi,…,headh)WO
其中,headi=Attention(QWi Q,KWi K,VWi V),W表征正样本序列向量,i表征正样本序列向量中各第一对象的对象向量的位置ID,h表征正样本序列向量中第一对象向量的总数量,Q(query)、K(key)、V(value)分别为对W进行线性变化后的对应于不同空间的权重信息,headi用来表征第一对象的对象向量与其他第一对象的对象向量之间的上下文关系。
通过将各个第一对象的反映的偏好信息作为位置向量,可以基于各个第一对象对应的位置向量所反映的时间上的序列性,获取到待推荐用户对各个第一对象的兴趣衰减程度,更好地获取到待推荐用户的全局偏好信息,便于进一步结合待推荐用户的全局偏好信息,预测待推荐用户对待推荐对象的第一响应信息,进而为确定出更符合待推荐用户的近期偏好信息的待推荐对象做铺垫。
可选地,上述基于全局偏好信息与待推荐信息,确定第一响应信息,可以包括:
对全局偏好信息与待推荐信息进行信息融合,预测待推荐用户对待推荐对象进行响应的第一响应信息。
在该实现方式中,如图6所示,可以通过基于attention的模型,采用以下方式对全局偏好信息与待推荐信息进行交叉注意力特征提取。
其中,Q’表征对待推荐信息进行线性变换后的矩阵,K’和V’分别表征对全局偏好信息进行线性变化后的矩阵,用来表征不同的权重。通过确定Q’和K’的相似度,并通过softmax对相似度结果进行归一化,可以得到相似度权重,进而与V’进行加权求和,可以得到强化表征Z,即第一响应信息。
通过对全局偏好信息与待推荐信息进行交叉注意力特征提取,可以实现对全局偏好信息和待推荐信息的信息融合,从而学习待推荐信息中对全局偏好信息感兴趣的信息,并抑制待推荐信息中对全局偏好信息不感兴趣的信息,并基于交叉注意力学习机制的学习结果,确定待推荐用户对待推荐对象进行响应的概率,并将待推荐用户对待推荐对象进行响应的概率作为第一响应信息。
通过该方式,可以更好地提取到待推荐信息中对全局偏好信息感兴趣的信息,为进一步预测待推荐用户对待推荐对象的第一响应信息,进而为确定出更符合待推荐用户的近期偏好信息的待推荐对象做铺垫。
为了更好的确定是否对待推荐对象进行推荐,在实际实施过程中,还可以采集待推荐用户没有进行响应的相关信息,作为负反馈信息,以确定不对待推荐对象进行相应的响应信息,具体地:
上述基于待推荐信息和第一响应信息,确定是否对待推荐对象进行推荐,可以包括:
确定待推荐用户的历史负样本行为信息;其中,历史负样本行为信息表征上述历史已推荐对象中未被待推荐用户响应的第二对象的对象相关信息;
基于待推荐信息和历史负样本行为信息,确定待推荐用户对待推荐对象的第二响应信息;第二响应信息表征待推荐用户不对待推荐对象进行响应的概率;
基于待推荐信息、第一响应信息和第二响应信息,确定是否对待推荐对象进行推荐。
历史负样本行为信息即通过确定历史已推荐对象中未被待推荐用户响应的第二对象,基于各第二对象本身的信息以及对各第二对象的推荐时间信息等生成的序列信息,例如,可以表示为[第二对象1,第二对象2,第二对象3,……]。
其中,对于每个第二对象,对该第二对象的推荐时间信息可以基于对该第二对象进行推荐的时间点(即推荐时间戳)与对推荐请求进行响应的时间点之间的第二时间间隔确定。
由于第二对象为历史已推荐对象中没有被待推荐用户响应的对象,第二对象的对象相关信息可以反映待推荐用户对第二对象的不感兴趣程度。
由于实际处理过程中,历史已推荐对象中不被待推荐用户响应的第二对象的数量较少,在获取到各第二对象的对象相关信息后,可以对各第二对象的对象相关信息进行降采样处理,得到数量较少的第二对象的对象相关信息。
需要说明的是,在实际处理过程中,还可以设置第一对象和第二对象的数量比例,例如,1:9,以更好地获取待推荐用户的偏好信息。
第二对象的相关信息可以包括但不限于第二对象的多模态信息、第二对象对应的推荐场景的场景信息以及对该第二对象进行推荐的推荐信息。其中,推荐信息可以包括但不限于对该第二对象进行推荐的时间点和推荐次数等,本申请实施例对此不做限制。
其中,可以参见上述对第一对象的多模态信息的描述,确定第二对象的多模态信息。
第二对象对应的第二时间间隔越短,该第二对象的对象相关信息所反映的待推荐用户对该第二对象的不感兴趣程度越强;反之,不感兴趣程度越弱。
对第二对象进行推荐的推荐次数越长,该第一对象的对象相关信息所反映的待推荐用户对该第二对象的不感兴趣程度越强;反之,不感兴趣程度越弱。
在具体实施过程中,可以分别对第二对象的多模态信息、第二对象对应的推荐场景的场景信息以及对该第二对象进行推荐的推荐信息进行数据格式转换,转换为相同的数据格式的数据信息,并对转换后的数据信息进行拼接得到该第二对象的对象相关信息。并基于各第二对象的对象相关信息生成历史负样本行为信息。
在确定出历史负样本行为信息之后,可以参照上述基于待推荐信息和历史正样本信息确定第一响应信息的方式,基于待推荐信息和历史负样本行为信息,确定第二响应信息。
在该实现方式中,可以通过设置第二概率阈值,基于该第二概率阈值,对第二响应信息进行二值化处理,从而确定是否对待推荐对象进行推荐。
例如,可以设置第二概率阈值为80%,从而在第二响应信息对应的概率大于或等于80%时,确定不对待推荐对象进行推荐。在第二响应信息对应的概率于80%时,确定对待推荐对象进行推荐。
在基于待推荐信息、第一响应信息和第二响应信息,确定是否对待推荐信息进行推荐时,可以基于第一响应信息对应的概率值和第二响应信息对应的概率值,共同确定是否对待推荐对象进行推荐。例如,可以确定第一响应信息对应的概率值和第二响应信息对应的概率值中的较大概率值,将较大概率值对应的推荐结果作为是否对待推荐对象进行推荐的结果。
通过基于第一响应信息和第二响应信息,确定是否对待推荐信息进行推荐,可以将待推荐用户的对历史推荐对象的不感兴趣程度作为历史负反馈信息,充分考虑待推荐用户的对历史推荐对象的感兴趣程度和不感兴趣程度,确定出更符合待推荐用户偏好信息的待推荐对象,并在确定对待推荐对象进行推荐时,将在待推荐场景中,将待推荐对象推荐给待推荐用户。
需要说明的是,在待推荐对象较多时,通过上述方法,可以赋予各待推荐对象中与历史正样本行为信息中各第一对象的相关指数较高的待推荐对象较高的权重,忽略各待推荐对象中与历史负样本行为信息中各第二对象的相关指数较高的待推荐对象较低的权重,从而对各待推荐对象进行评分,以更好地将评分在前的待推荐对象推荐给待推荐用户。
可选地,上述第二对象的对象相关信息是通过以下方式确定的:
基于对第二对象进行推荐的时间点,确定第二对象对待推荐用户的负反馈信息;
基于第二对象对应的对象信息、场景信息以及负反馈信息,确定第二对象的对象相关信息;
上述基于待推荐信息和历史负样本行为信息,确定待推荐用户对待推荐对象的第二响应信息,可以包括:
对待推荐信息和历史负样本行为信息对应的各个第二对象的对象相关信息进行信息融合,确定第二响应信息。
在该实现方式中,可以参见上述基于待推荐用户对第一对象进行响应的时间点,确定待推荐对象对第一对象的偏好信息的方式,基于对第二对象进行推荐的时间点,确定第二对象对待推荐用户的负反馈信息,本申请实施例在此不做赘述。
参见上述基于第一对象对应的对象信息、场景信息以及偏好信息,确定第一对象的对象相关信息的方式,基于第二对象对应的对象信息、场景信息以及负反馈信息,确定第二对象的对象相关信息,本申请实施例在此不做赘述。
基于对待推荐信息和历史正样本行为信息对应的各个第一对象的对象相关信息进行信息融合,确定第一响应信息的方式,对待推荐信息和历史负样本行为信息对应的各个第二对象的对象相关信息进行信息融合,以确定第二响应信息,本申请实施例在此不做赘述。
通过基于对第二对象进行推荐的时间点,确定第二对象对待推荐用户的负反馈信息,可以更好地采集待推荐用户的近期偏好信息中的不对待推荐用户感兴趣的程度,更好地补充待推荐用户的近期偏好信息。通过进一步通过待推荐信息与各个第二对象的对象相关信息进行信息融合,可以更好地结合基于待推荐用户不感兴趣的已推荐对象所反映的负反馈信息,预测待推荐用户对待推荐对象的第二响应信息,进而为确定出更符合待推荐用户的近期偏好信息的待推荐对象做铺垫。
可选地,上述基于待推荐信息和历史负样本行为信息,确定待推荐用户对待推荐对象的第二响应信息,可以包括:
对历史负样本行为信息对应的各个第二对象的对象相关信息进行信息融合,确定待推荐用户的全局负反馈信息;其中,对于每个第二对象,对该第二对象进行推荐的时间点与对推荐请求进行响应的时间点之间的第二时间间隔越短,该第二对象对待推荐用户的负反馈信息在全局负反馈信息中的权重值越高;
基于全局负反馈信息与待推荐信息,确定第二响应信息。
在该实现方式中,可以参见上述对历史正样本行为信息对应的各个第一对象的对象相关信息进行信息融合,确定待推荐用户的全局偏好信息的方式,对历史负样本行为信息对应的各个第二对象的对象相关信息进行信息融合,确定待推荐用户的全局负反馈信息,本申请实施例在此不做赘述。
通过将各个第二对象反映的负反馈信息作为位置向量,可以基于各个第二对象对应的位置向量所反映的时间上的序列性,获取到待推荐用户对各个第二对象的兴趣衰减程度,更好地获取到待推荐用户的全局负反馈信息,便于进一步结合待推荐用户的全局负反馈信息,预测待推荐用户对待推荐对象的第二响应信息,进而为确定出更符合待推荐用户的近期偏好信息的待推荐对象做铺垫。
可选地,上述基于全局负反馈信息与待推荐信息,确定第二响应信息,可以包括:
对全局负反馈信息与待推荐信息进行信息融合,预测待推荐用户不对待推荐对象进行响应的第二响应信息。
在该实现方式中,可以基于上述对全局偏好信息与待推荐信息进行信息融合,预测待推荐用户对待推荐对象进行响应的第一响应信息的方式,对全局负反馈信息与待推荐信息进行信息融合,预测待推荐用户不对待推荐对象进行响应的第二响应信息,本申请实施例在此不做赘述。
需要说明的是,K’在确定第一响应信息和第二响应信息时是不同的。同样地,V’在确定第一响应信息和第二响应信息时也是不同的。
通过该方式,可以更好地提取到待推荐用户的全局负反馈信息,为进一步预测待推荐用户对待推荐对象的第二响应信息,进而为确定出更符合待推荐用户的近期偏好信息的待推荐对象做铺垫。
为了更好地说明本申请实施例提供的推荐方法,以下以待推荐对象为资讯,在图3示出的推荐资讯页面进行资讯推荐为例,对该推荐方法进行说明。
如图7所示,在进行待推荐资讯时,通常会包括召回、排序、后排和终端展示几个阶段。
其中,在召回阶段,通常会基于待推荐用户的相关信息和推荐资讯页面的场景信息,从物品库中进行初筛,获取到待推荐资讯。
在排序阶段,通常会结合进一步根据用户的偏好信息、推荐资讯页面的场景信息和待推荐资讯的资讯信息等,计算每个待推荐资讯的评分,并基于每个待推荐资讯的评分,确定对各待推荐资讯进行推荐的顺序。
在后排阶段,通常会结合排序过程生成的对各待推荐资讯进行推荐的顺序,对各待推荐资讯进行过滤、截断等操作,最后确定出需要推荐的待推荐资讯,并将需要推荐的待推荐资讯发送至终端。
在终端展示阶段,通常终端会基于接收到的待推荐资讯,对各接收到的待推荐资讯进行展示。
以下结合图8和图9,以通过基于transformer与attention实现的行为序列特征提取排序模型,以对第一对象的响应操作为点击操作,实现本申请实施例提供的推荐方法(即上述排序阶段和后排阶段)进行具体说明:
步骤1:获取待推荐用户的曝光点击操作日志,构建样本数据集。
基于待推荐用户的曝光点击操作日志形成的数据集,设置曝光并点击的记录(即第一对象对应的数据信息)表示为<用户、物品、1>,曝光未点击的纪录(即第二对象对应的数据信息)表示为<待推荐用户、资讯、0>。并进一步对第一对象对应的数据信息进行上采样处理,对第二对象对应的数据信息进行降采样处理,构建曝光并点击的样本(即历史正样本)与曝光未点击的样本(即历史负样本)的比值为1:9,总数量为100万的样本数据集,即所构建100万条样本中,历史负样本的数量为90万,历史正样本的数量为10万。
步骤2:数据集切分。
将样本数据集切分为训练集、验证集和测试集。其中,训练集用来训练行为序列特征提取模型,验证集用来模型训练过程中验证模型的效果,测试集用于在模型训练结束后验证模型的效果。
在实际应用中,可以基于实际需求设置训练集、验证集和测试集中的样本数量,例如,可以设置训练集、验证集和测试集中的样本数量的比值为8:1:1。
步骤3:构建特征向量。
采用hive等大数据技术对每个样本进行特征向量,得到各样本对应的特征向量。还可以基于根据初始神经网络模型适配的数据格式,将特征样本转换为对应的格式。
在该实现方式中,初始神经网络模型为基于TensorFlow格式实现的行为序列特征提取排序模型为例,可以采用hive技术,对数据集中的每条资讯的各项向量进行特征拼接,再转存为TFrecord格式(一种适配于TensorFlow深度学习框架的文件格式)。
其中,对于每条资讯来讲,其所对应的对象信息可以包括场景信息、资讯信息和用户信息。其中,场景信息包括上述场景ID。资讯信息可以包括但不限于资讯类型、标题向量、文章向量、图片数据、发布时长、作者、地域等。用户信息可以包括但不限于年龄、性别、近期兴趣、长期兴趣等。
步骤4:模型训练。
基于所构建的特征样本,对初始神经网络模型进行训练。在训练过程中,可以设置epochs=10,即,训练数据集中的所有样本被循环使用10次。每个batch的数量为128。
需要说明的是,在训练过程中,可以基于各场景ID或位置ID,通过随机数生成算法,持续更新场景向量表中各场景ID对应的场景向量或位置向量表中各位置ID对应的位置向量,以学习到最佳的场景向量与位置向量。
步骤5:获取模型文件。
保存输出训练好的行为序列特征提取排序模型,并将保存好的模型发布到离线服务器以及线上服务器中。
步骤6:离线计算特征向量。
基于上述更新时间间隔,基于新增的被推荐资讯的资讯信息、各被推荐资讯对应的用户信息、各被推荐资讯对应的场景信息等,通过离线服务器基于训练好的行为序列特征提取排序模型,输出用户向量、资讯对应的多模态向量、场景向量、位置向量等。
步骤7:数据统计过程。
通过离线服务器将离线计算得到的特征向量定期写入向量查询系统。该向量查询系统可以为基于key-value形式的数据库,例如redis。
步骤8:线上预测过程。
参见图9,基于用户终端发送的推荐请求,通过线上服务器获取召回阶段生成的各待推荐资讯对应的资讯信息和待推荐场景对应的场景信息,并从向量查询系统中获取各待推荐资讯对应的多模态向量和场景向量、推荐请求中的当前待推荐用户对应的用户向量、该待推荐用户对应的历史正样本行为信息(即历史点击序列)和历史负样本行为信息(即曝光未点击序列),将这些向量同时输入到训练好的行为序列特征提取排序模型中,并执行以下操作:
(1)分别基于各待推荐资讯对应的多模态向量和场景向量相加,生成各待推荐资讯对应的query。
(2)分别基于历史正样本行为信息生成历史点击序列向量以及基于历史负样本行为信息生成曝光未点击序列向量。
其中,无论是历史点击序列向量中的各正样本资讯还是曝光未点击序列中的各负样本资讯,各资讯向量=多模态向量+场景向量+位置向量。
(3)将历史点击序列向量输入到其对应的transformer层中,通过transformer层对历史点击序列向量进行学习,并加权求和,得到待推荐用户的全局偏好信息。
将曝光未点击序列向量输入到其对应的transformer层中,通过transformer层对曝光未点击序列向量进行学习,并加权平均,得到待推荐用户的全局负反馈信息。
(4)通过历史点击序列向量对应的attention层对各待推荐资讯对应的query和待推荐用户的全局偏好信息做交叉注意力计算,赋予各待推荐资讯中与历史点击物品序列中各物品的相关指数较高的待推荐资讯较高的权重,忽略各待推荐资讯中与历史点击物品序列中各物品的相关指数较低的待推荐资讯,突出各待推荐资讯与历史点击物品序列中各物品的相关性。
通过曝光未点击序列向量对应的attention层对各待推荐资讯对应的query和待推荐用户的全局负反馈信息做交叉注意力计算,赋予各待推荐资讯中与曝光未点击物品序列中各物品的相关指数较高的待推荐资讯较低的权重,忽略各待推荐资讯中与曝光未点击物品序列中各物品的相关指数较高的待推荐资讯,隐藏各待推荐资讯与曝光未点击物品序列中各物品的相关性。
(5)通过DeepFM层中deep部分的2层全连接层对待推荐资讯对应的query、历史点击序列向量对应的attention层输出的向量、曝光未点击序列向量对应的attention层输出的向量以及对待推荐用户的用户向量的低级维度特征进行特征提取。FM部分用来对待推荐资讯对应的query、历史点击序列向量对应的attention层输出的向量、曝光未点击序列向量对应的attention层输出的向量以及对待推荐用户的用户向量进行交叉特征提取,得到时间层级上的更高维度的特征。通过DeepFM层中全连接层用于对deep部分输出的向量和FM部分输出的向量进行全连接特征提取,并输出提取得到的特征。
(6)通过Sigmoid层设置的sigmoid函数,对DeepFM层提取得到的特征作进一步特征提取,预测各待推荐资讯对应的点击概率,并对各待推荐资讯对应的点击概率进行二值化处理,输出各待推荐资讯是否被点击的预测结果。
(7)基于各待推荐资讯是否被点击的预测结果,得到各待推荐资讯对应的推荐列表。
通过实验数据证明,如下表所示,基于本申请实施例提供的方法,在离线计算特征向量的阶段,相比于基于deepFM实现的基准排序模型,本申请实施例提供的基于行为序列特征提取的排序模型的准确率(accuracy,简称AUC)从0.740提升至0.772,即提升了4.3%。在模型训练的阶段,本申请实施例提供的基于行为序列特征提取的排序模型的损失指数(logloss,即对损失值取log值),从0.319下降至0.306,即下降了4.0%。
并且,在线上预测阶段,相比于基于deepFM实现的基准排序模型进行推荐的资讯,基于本申请实施例提供的基于行为序列特征提取的排序模型的推荐的资讯的点击率提升了5.3%。
基于与本申请实施例提供的推荐方法相同的原理,本申请实施例中还提供了一种推荐装置。如图10所示,该装置10包括:
待推荐信息确定模块110,用于响应于针对待推荐用户的推荐请求,基于待推荐对象对应的对象信息和待推荐场景对应的场景信息,确定待推荐信息;
历史行为信息确定模块120,用于确定待推荐用户的历史正样本行为信息;其中,历史正样本行为信息表征历史已推荐对象中被待推荐用户响应的第一对象的对象相关信息;
响应信息确定模块130,用于基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息;第一响应信息表征待推荐用户对待推荐对象进行响应的概率;
对象推荐模块140,用于基于待推荐信息和第一响应信息,确定是否对待推荐对象进行推荐,并在确定对待推荐对象进行推荐的情况下,在待推荐场景中将待推荐对象推荐给待推荐用户。
可选地,上述对象推荐模块140在用于基于待推荐信息和第一响应信息,确定是否对待推荐对象进行推荐时,可以具体用于:
通过历史行为信息确定模块120确定待推荐用户的历史负样本行为信息;其中,历史负样本行为信息表征上述历史已推荐对象中未被待推荐用户响应的第二对象的对象相关信息;
基于待推荐信息和历史负样本行为信息,确定待推荐用户对待推荐对象的第二响应信息;第二响应信息表征待推荐用户不对待推荐对象进行响应的概率;
基于待推荐信息、第一响应信息和第二响应信息,确定是否对待推荐对象进行推荐。
可选地,上述第一对象的对象相关信息是通过以下方式确定的:
基于待推荐用户对第一对象进行响应的时间点,确定待推荐对象对第一对象的偏好信息;
基于第一对象对应的对象信息、场景信息以及偏好信息,确定第一对象的对象相关信息;
上述响应信息确定模块130在用于基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息时,可以具体用于:
对待推荐信息和历史正样本行为信息对应的各个第一对象的对象相关信息进行信息融合,确定第一响应信息。
可选地,上述响应信息确定模块130在用于基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息时,可以具体用于:
对历史正样本行为信息对应的各个第一对象的对象相关信息进行信息融合,确定待推荐用户的全局偏好信息;其中,对于每个第一对象,待推荐用户对该第一对象进行响应的时间点与对推荐请求进行响应的时间点之间的第一时间间隔越短,该第一对象的偏好信息在全局偏好信息中的权重值越高;
基于全局偏好信息与待推荐信息,确定第一响应信息。
可选地,上述响应信息确定模块130在用于基于全局偏好信息与待推荐信息,确定第一响应信息时,可以具体用于:
对全局偏好信息与待推荐信息进行信息融合,预测待推荐用户对待推荐对象进行响应的第一响应信息。
可选地,上述第二对象的对象相关信息是通过以下方式确定的:
基于对第二对象进行推荐的时间点,确定第二对象对待推荐用户的负反馈信息;
基于第二对象对应的对象信息、场景信息以及负反馈信息,确定第二对象的对象相关信息;
上述响应信息确定模块130在用于基于待推荐信息和历史负样本行为信息,确定待推荐用户对待推荐对象的第二响应信息时,可以具体用于:
对待推荐信息和历史负样本行为信息对应的各个第二对象的对象相关信息进行信息融合,确定第二响应信息。
可选地,上述响应信息确定模块130在用于基于待推荐信息和历史负样本行为信息,确定待推荐用户对待推荐对象的第二响应信息时,可以具体用于:
对历史负样本行为信息对应的各个第二对象的对象相关信息进行信息融合,确定待推荐用户的全局负反馈信息;其中,对于每个第二对象,对该第二对象进行推荐的时间点与对推荐请求进行响应的时间点之间的第二时间间隔越短,该第二对象对待推荐用户的负反馈信息在全局负反馈信息中的权重值越高;
基于全局负反馈信息与待推荐信息,确定第二响应信息。
可选地,上述响应信息确定模块130在用于基于全局负反馈信息与待推荐信息,确定第二响应信息时,可以具体用于:
对全局负反馈信息与待推荐信息进行信息融合,预测待推荐用户不对待推荐对象进行响应的第二响应信息。
本申请实施例提供的推荐装置,可以更好地结合待推荐场景对应的场景信息以及历史正样本行为信息所反映的用户的偏好信息,确定待推荐用户是否会对待推荐对象进行关注,从而在待推荐场景中,为待推荐用户推荐可能会关注的待推荐对象,节省用户获取感兴趣的信息所需的时间,更好地满足用户需求。
本申请实施例的装置可执行本申请实施例所提供的方法,其实现原理相类似,本申请各实施例的装置中的各模块所执行的动作是与本申请各实施例的方法中的步骤相对应的,对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述,此处不再赘述。
基于与本申请实施例提供的推荐方法及装置相同的原理,本申请实施例中还提供了一种电子设备(如服务器),该电子设备可以包括存储器、处理器及存储在存储器上的计算机程序,该处理器执行上述计算机程序以实现本申请:
响应于针对待推荐用户的推荐请求,基于待推荐对象对应的对象信息和待推荐场景对应的场景信息,确定待推荐信息;
确定待推荐用户的历史正样本行为信息;其中,历史正样本行为信息表征历史已推荐对象中被待推荐用户响应的第一对象的对象相关信息;
基于待推荐信息和历史正样本行为信息,确定待推荐用户对待推荐对象的第一响应信息;第一响应信息表征待推荐用户对待推荐对象进行响应的概率;
基于待推荐信息和第一响应信息,确定是否对待推荐对象进行推荐,并在确定对待推荐对象进行推荐的情况下,在待推荐场景中将待推荐对象推荐给待推荐用户。
通过该电子设备,可以更好地结合待推荐场景对应的场景信息以及历史正样本行为信息所反映的用户的偏好信息,确定待推荐用户是否会对待推荐对象进行关注,从而在待推荐场景中,为待推荐用户推荐可能会关注的待推荐对象,节省用户获取感兴趣的信息所需的时间,更好地满足用户需求。
参见图6,图6示出了本申请实施例提供的一种电子设备的结构示意图。如图6所示,本实施例中的电子设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述电子设备1000还可以包括:对象接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,对象接口1003可以包括显示屏(Display)、键盘(Keyboard),可选对象接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非易失性存储器(non-volatile memory,NVM),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图6所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、对象接口模块以及设备控制应用程序。
在图6所示的电子设备1000中,网络接口1004可提供网络通讯功能;而对象接口1003主要用于为对象提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
在一些可行的实施方式中,上述处理器1001用于:
应当理解,在一些可行的实施方式中,上述处理器1001可以是中央处理单元(central processing unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integratedcircuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储器还可以存储设备类型的信息。
具体实现中,上述电子设备1000可通过其内置的各个功能模块执行如上述图2中各个步骤所提供的实现方式,具体可参见上述各个步骤所提供的实现方式,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,被处理器执行以实现图2中各个步骤所提供的方法,具体可参见上述各个步骤所提供的实现方式,在此不再赘述。
上述计算机可读存储介质可以是前述任一实施例提供的推荐装置或电子设备的内部存储单元,例如电子设备的硬盘或内存。该计算机可读存储介质也可以是该电子设备的外部存储设备,例如该电子设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。上述计算机可读存储介质还可以包括磁碟、光盘、只读存储记忆体(read-only memory,ROM)或随机存储记忆体(random access memory,RAM)等。进一步地,该计算机可读存储介质还可以既包括该电子设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该电子设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机程序,上述计算机程序被处理器执行图2中各个步骤所提供的方法。
本申请的权利要求书和说明书及附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
此外,本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或电子设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或电子设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上所揭露的仅为本申请较佳实施例而已,不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (12)

1.一种推荐方法,其特征在于,所述方法包括:
响应于针对待推荐用户的推荐请求,基于待推荐对象对应的对象信息和待推荐场景对应的场景信息,确定待推荐信息;
确定所述待推荐用户的历史正样本行为信息;其中,所述历史正样本行为信息表征历史已推荐对象中被所述待推荐用户响应的第一对象的对象相关信息;
基于所述待推荐信息和所述历史正样本行为信息,确定所述待推荐用户对所述待推荐对象的第一响应信息;所述第一响应信息表征所述待推荐用户对所述待推荐对象进行响应的概率;
基于所述待推荐信息和所述第一响应信息,确定是否对所述待推荐对象进行推荐,并在确定对所述待推荐对象进行推荐的情况下,在所述待推荐场景中将所述待推荐对象推荐给所述待推荐用户。
2.根据权利要求1所述的方法,其特征在于,所述基于所述待推荐信息和所述第一响应信息,确定是否对所述待推荐对象进行推荐,包括:
确定所述待推荐用户的历史负样本行为信息;其中,所述历史负样本行为信息表征所述历史已推荐对象中未被所述待推荐用户响应的第二对象的对象相关信息;
基于所述待推荐信息和所述历史负样本行为信息,确定所述待推荐用户对所述待推荐对象的第二响应信息;所述第二响应信息表征所述待推荐用户不对所述待推荐对象进行响应的概率;
基于所述待推荐信息、所述第一响应信息和所述第二响应信息,确定是否对所述待推荐对象进行推荐。
3.根据权利要求1或2所述的方法,其特征在于,所述第一对象的对象相关信息是通过以下方式确定的:
基于所述待推荐用户对所述第一对象进行响应的时间点,确定所述待推荐用户对所述第一对象的偏好信息;
基于所述第一对象对应的对象信息、场景信息以及偏好信息,确定所述第一对象的对象相关信息;
所述基于所述待推荐信息和所述历史正样本行为信息,确定所述待推荐用户对所述待推荐对象的第一响应信息,包括:
对所述待推荐信息和所述历史正样本行为信息对应的各个所述第一对象的对象相关信息进行信息融合,确定所述第一响应信息。
4.根据权利要求1或3所述的方法,其特征在于,所述基于所述待推荐信息和所述历史正样本行为信息,确定所述待推荐用户对所述待推荐对象的第一响应信息,包括:
对所述历史正样本行为信息对应的各个所述第一对象的对象相关信息进行信息融合,确定所述待推荐用户的全局偏好信息;其中,对于每个所述第一对象,所述待推荐用户对所述第一对象进行响应的时间点与对所述推荐请求进行响应的时间点之间的第一时间间隔越短,所述第一对象的偏好信息在所述全局偏好信息中的权重值越高;
基于所述全局偏好信息与所述待推荐信息,确定所述第一响应信息。
5.根据权利要求3或4所述的方法,其特征在于,所述基于所述全局偏好信息与所述待推荐信息,确定所述第一响应信息,包括:
对所述全局偏好信息与所述待推荐信息进行信息融合,预测所述待推荐用户对所述待推荐对象进行响应的第一响应信息。
6.根据权利要求2所述的方法,其特征在于,所述第二对象的对象相关信息是通过以下方式确定的:
基于对所述第二对象进行推荐的时间点,确定所述第二对象对所述待推荐用户的负反馈信息;
基于所述第二对象对应的对象信息、场景信息以及负反馈信息,确定所述第二对象的对象相关信息;
所述基于所述待推荐信息和所述历史负样本行为信息,确定所述待推荐用户对所述待推荐对象的第二响应信息,包括:
对所述待推荐信息和所述历史负样本行为信息对应的各个所述第二对象的对象相关信息进行信息融合,确定所述第二响应信息。
7.根据权利要求2或6所述的方法,其特征在于,所述基于所述待推荐信息和所述历史负样本行为信息,确定所述待推荐用户对所述待推荐对象的第二响应信息,包括:
对所述历史负样本行为信息对应的各个所述第二对象的对象相关信息进行信息融合,确定所述待推荐用户的全局负反馈信息;其中,对于每个所述第二对象,对所述第二对象进行推荐的时间点与对所述推荐请求进行响应的时间点之间的第二时间间隔越短,所述第二对象对所述待推荐用户的负反馈信息在所述全局负反馈信息中的权重值越高;
基于所述全局负反馈信息与所述待推荐信息,确定所述第二响应信息。
8.根据权利要求7所述的方法,其特征在于,所述基于所述全局负反馈信息与所述待推荐信息,确定所述第二响应信息,包括:
对所述全局负反馈信息与所述待推荐信息进行信息融合,预测所述待推荐用户不对所述待推荐对象进行响应的第二响应信息。
9.一种推荐装置,其特征在于,所述装置包括:
待推荐信息确定模块,用于响应于针对待推荐用户的推荐请求,基于待推荐对象对应的对象信息和待推荐场景对应的场景信息,确定待推荐信息;
历史行为信息确定模块,用于确定所述待推荐用户的历史正样本行为信息;其中,所述历史正样本行为信息表征历史已推荐对象中被所述待推荐用户响应的第一对象的对象相关信息;
响应信息确定模块,用于基于所述待推荐信息和所述历史正样本行为信息,确定所述待推荐用户对所述待推荐对象的第一响应信息;所述第一响应信息表征所述待推荐用户对所述待推荐对象进行响应的概率;
对象推荐模块,用于基于所述待推荐信息和所述第一响应信息,确定是否对所述待推荐对象进行推荐,并在确定对所述待推荐对象进行推荐的情况下,在所述待推荐场景中将所述待推荐对象推荐给所述待推荐用户。
10.一种电子设备,其特征在于,包括处理器和存储器,所述处理器和存储器相互连接;
所述存储器用于存储计算机程序;
所述处理器被配置用于在调用所述计算机程序时,执行权利要求1至8中任一项所述的方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法。
12.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法。
CN202211408294.2A 2022-11-10 2022-11-10 推荐方法、装置、电子设备及计算机可读存储介质 Pending CN117216361A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211408294.2A CN117216361A (zh) 2022-11-10 2022-11-10 推荐方法、装置、电子设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211408294.2A CN117216361A (zh) 2022-11-10 2022-11-10 推荐方法、装置、电子设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN117216361A true CN117216361A (zh) 2023-12-12

Family

ID=89043139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211408294.2A Pending CN117216361A (zh) 2022-11-10 2022-11-10 推荐方法、装置、电子设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN117216361A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118657591A (zh) * 2024-08-20 2024-09-17 聊城莱柯智能机器人有限公司 一种基于个性化推荐系统的负样本采样方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118657591A (zh) * 2024-08-20 2024-09-17 聊城莱柯智能机器人有限公司 一种基于个性化推荐系统的负样本采样方法

Similar Documents

Publication Publication Date Title
CN111444428B (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
CN111966914B (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN111353091A (zh) 信息处理方法、装置、电子设备及可读存储介质
CN115917535A (zh) 推荐模型的训练方法、推荐方法、装置及计算机可读介质
CN112989212B (zh) 媒体内容推荐方法、装置和设备及计算机存储介质
CN116977701A (zh) 视频分类模型训练的方法、视频分类的方法和装置
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
CN117216362A (zh) 内容推荐方法、装置、设备、介质和程序产品
CN115618024A (zh) 多媒体推荐方法、装置及电子设备
CN113641916B (zh) 一种内容推荐方法、装置、电子设备和存储介质
CN118503539A (zh) 数据处理方法、装置、电子设备及存储介质
CN116775815A (zh) 对话数据的处理方法、装置、电子设备及存储介质
CN113836390B (zh) 资源推荐方法、装置、计算机设备及存储介质
CN114817692A (zh) 确定推荐对象的方法、装置和设备及计算机存储介质
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
CN116628345A (zh) 一种内容推荐方法、装置、电子设备和存储介质
CN114357301B (zh) 数据处理方法、设备及可读存储介质
CN112035740B (zh) 项目使用时长预测方法、装置、设备及存储介质
CN115878839A (zh) 一种视频推荐方法、装置、计算机设备和计算机程序产品
CN117216361A (zh) 推荐方法、装置、电子设备及计算机可读存储介质
CN112749332A (zh) 数据处理方法、装置以及计算机可读介质
CN116628236B (zh) 多媒体信息的投放方法、装置、电子设备及存储介质
CN114417875B (zh) 数据处理方法、装置、设备、可读存储介质及程序产品
CN116628179B (zh) 一种用户操作数据的可视化与人机交互推荐方法
CN114417944B (zh) 识别模型训练方法及装置、用户异常行为识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication