CN117033799B

CN117033799B - 资源推荐方法、装置、计算机设备及存储介质

Info

Publication number: CN117033799B
Application number: CN202311221164.2A
Authority: CN
Inventors: 谢舒翼; 周东霖; 郎添娇; 胡智超
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2023-09-21
Filing date: 2023-09-21
Publication date: 2023-12-26
Anticipated expiration: 2043-09-21
Also published as: CN117033799A

Abstract

本申请提供了一种资源推荐方法、装置、计算机设备及存储介质，属于计算机技术领域。所述方法包括：基于目标对象针对资源的正向行为信息，构造资源提示信息；通过大语言模型，对所述资源提示信息进行处理，得到资源文本；对于资源库中的任一待推荐资源，确定所述待推荐资源与所述资源文本之间的相关度；基于所述资源库中多个待推荐资源对应的相关度，向所述目标对象推荐资源。上述技术方案能够使得推荐的资源符合目标对象的资源偏好，提高了资源推荐的准确性。

Description

资源推荐方法、装置、计算机设备及存储介质

技术领域

本申请涉及计算机技术领域，特别涉及一种资源推荐方法、装置、计算机设备及存储介质。

背景技术

随着互联网技术的发展，资源推荐场景已屡见不鲜。例如，外卖平台的饭菜推荐场景、多媒体平台的视频推荐场景或者购物平台的衣物推荐场景。如何向用户精准地推荐资源是本领域研究的重点。

目前，通常采用的是方式是借助于机器学习技术，基于对海量的用户行为的挖掘，洞察用户的兴趣偏好，进而基于用户的兴趣偏好，自动化地为用户生成个性化的内容推荐。

但是，在许多中小客户（例如小程序里的店铺，可推荐资源只有几千，用户量也只有10万左右）的推荐场景里，资源信息少，用户行为稀疏，传统的资源推荐模型无法进行充分学习，导致推荐结果不准确。

发明内容

本申请实施例提供了一种资源推荐方法、装置、计算机设备及存储介质，能够精准地为目标对象推荐资源。所述技术方案如下。

一方面，提供了一种资源推荐方法，所述方法包括：基于目标对象针对资源的正向行为信息，构造资源提示信息，所述正向行为信息用于表示所述目标对象对资源偏好的正向行为，所述资源提示信息用于表示所述目标对象所偏好的资源；通过大语言模型，对所述资源提示信息进行处理，得到资源文本，所述资源文本用于以自然语言的形式描述所述目标对象的资源偏好；对于资源库中的任一待推荐资源，确定所述待推荐资源与所述资源文本之间的相关度，所述相关度用于表示所述目标对象的资源偏好与所述待推荐资源之间的相关性；基于所述资源库中多个待推荐资源对应的相关度，向所述目标对象推荐资源。

另一方面，提供了一种资源推荐装置，所述装置包括：构造模块，用于基于目标对象针对资源的正向行为信息，构造资源提示信息，所述正向行为信息用于表示所述目标对象对资源偏好的正向行为，所述资源提示信息用于表示所述目标对象所偏好的资源；第一处理模块，用于通过大语言模型，对所述资源提示信息进行处理，得到资源文本，所述资源文本用于以自然语言的形式描述所述目标对象的资源偏好；确定模块，用于对于资源库中的任一待推荐资源，确定所述待推荐资源与所述资源文本之间的相关度，所述相关度用于表示所述目标对象的资源偏好与所述待推荐资源之间的相关性；推荐模块，用于基于所述资源库中多个待推荐资源对应的相关度，向所述目标对象推荐资源。

在一些实施例中，所述构造模块，用于基于所述目标对象针对资源的所述正向行为信息，确定至少一个参考资源，所述至少一个参考资源为所述目标对象触发正向行为的资源；基于所述至少一个参考资源和推荐需求，构造所述资源提示信息，所述推荐需求用于引导所述大语言模型基于当前推荐场景理解所述目标对象的资源偏好。

在一些实施例中，所述第一处理模块，包括：分析单元，用于通过所述大语言模型，对所述资源提示信息进行分析，确定所述目标对象所偏好的目标资源类型；获取单元，用于获取与所述目标资源类型相关的至少一种资源类型；生成单元，用于基于所述目标资源类型和所述至少一种资源类型，生成所述资源文本。

在一些实施例中，所述获取单元，用于基于资源类型之间的相关关系，从当前推荐场景中，获取与所述目标资源类型相关的至少一种资源类型；所述获取单元，还用于基于与当前推荐场景相关的其他推荐场景，确定其他推荐场景中所述目标对象的资源偏好；基于所述其他推荐场景中所述目标对象的资源偏好，从当前推荐场景中，获取与所述目标资源类型相关的至少一种资源类型。

在一些实施例中，所述确定模块，包括：第一处理单元，用于对于资源库中的任一待推荐资源，基于所述大语言模型，对所述待推荐资源进行特征提取，得到所述待推荐资源的资源特征，所述资源特征用于表示所述待推荐资源的详情信息；第二处理单元，用于基于所述大语言模型，对所述资源文本进行特征提取，得到资源文本特征；确定单元，用于确定所述待推荐资源的资源特征与所述资源文本特征之间的相似度，所述相似度指的是所述目标对象的资源偏好与所述待推荐资源之间的相关度。

在一些实施例中，所述第一处理单元，用于对于资源库中的任一待推荐资源，获取所述待推荐资源的文本信息，所述文本信息为所述待推荐资源的详情信息；基于所述大语言模型，对所述文本信息进行特征提取，得到所述待推荐资源的资源特征。

在一些实施例中，所述推荐模块，用于按照相关度由高到低的顺序，对所述资源库中的多个待推荐资源进行排序；向所述目标对象推荐排序靠前的预设数量的待推荐资源。

在一些实施例中，构造模块，还用于基于样本对象针对资源的正向行为信息，构造样本提示信息，所述正向行为信息用于表示所述样本对象对资源偏好的正向行为，所述样本提示信息用于表示所述样本对象所偏好的资源；第一处理模块，还用于通过所述大语言模型，对所述样本提示信息进行处理，得到样本资源文本，所述样本资源文本用于以自然语言的形式描述所述样本对象的资源偏好；推荐模块，还用于基于所述样本资源文本，确定预测推荐结果，所述预测推荐结果用于表示所述大语言模型预测出的向所述样本对象推荐的资源；所述装置还包括：训练模块，用于基于所述预测推荐结果和参考推荐结果，对所述大语言模型进行训练，所述参考推荐结果用于表示真实情况下向所述样本对象推荐的资源。

在一些实施例中，所述装置还包括：获取模块，用于获取基于语言文本训练后的所述大语言模型；第二处理模块，用于保持所述大语言模型的参数不变，为所述大语言模型添加可调参数；所述训练模块，用于以最小化所述预测推荐结果和所述参考推荐结果之间的差异为目标，调整所述大语言模型的可调参数。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行以实现本申请实施例中的资源推荐方法。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一段计算机程序，所述至少一段计算机程序由处理器加载并执行以实现如本申请实施例中资源推荐方法。

另一方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该计算机程序，处理器执行该计算机程序，使得该计算机设备执行上述各个方面或者各个方面的各种可选实现方式中提供的资源推荐方法。

本申请实施例提供了一种资源推荐方法，由于目标对象针对资源的正向行为信息能够反映目标对象所偏好的资源，通过正向行为信息，构造资源提示信息，使得资源提示信息能够准确表示目标对象的资源偏好；然后，通过大语言模型，对资源提示信息进行处理，由于大语言模型具备丰富的语料知识，使得通过大语言模型得到的资源文本能够更加准确描述目标对象的资源偏好；然后，计算资源文本与资源库中待推荐资源之间的相关度，根据待推荐资源与目标对象的资源偏好之间的相关性，向目标对象推荐资源，使得推荐的资源符合目标对象的资源偏好，提高了资源推荐的准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本申请实施例提供的一种资源推荐方法的实施环境示意图。

图2是根据本申请实施例提供的一种资源推荐方法的流程图。

图3是根据本申请实施例提供的另一种资源推荐方法的流程图。

图4是根据本申请实施例提供的一种资源推荐装置的框图。

图5是根据本申请实施例提供的另一种资源推荐装置的框图。

图6是根据本申请实施例提供的一种终端的结构框图。

图7是根据本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。

本申请中术语“至少一个”是指一个或多个，“多个”的含义是指两个或两个以上。

需要说明的是，本申请所涉及的信息（包括但不限于用户设备信息、用户个人信息等）、数据（包括但不限于用于分析的数据、存储的数据、展示的数据等）以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本申请中涉及到的资源和正向行为信息都是在充分授权的情况下获取的。

人工智能（Artificial Intelligence，AI）是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中，预训练模型又称大模型、基础模型，经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

自然语言处理（Nature Language Processing，NLP）是计算机科学领域与人工智能领域中的重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理涉及自然语言，即人们日常使用的语言，与语言学研究密切；同时涉及计算机科学和数学等人工智能领域模型训练的重要技术，预训练模型（Pre-trainedModels，PTM），即是从NLP领域的大语言模型（Large Language Model）发展而来。预训练模型，也称基石模型、大模型，指具有大参量的深度神经网络（Deep Neural Network，DNN），在海量未标记的数据上对其进行训练，利用大参量DNN的函数近似能力使PTM在数据上提取共性特征，经微调（Fine Tune）、参数高效微调（PEFT）、Prompt-Tuning（提示调优）等技术，适用于下游任务。因此，预训练模型能够在小样本（Few-shot）或零样本（Zero-shot）场景下达到理想效果。PTM按照处理的数据模态分为语言模型、视觉模型、语音模型、多模态模型等。例如，语言模型为ELMO（Embeddings from Language Model，一种语言模型），BERT（Bidirectional Encoder Representations from Transformers，一个双向预训练语言模型），GPT（Generative Pre-trained Transformer，预训练生成式模型）等。其中，多模态模型指建立两种或以上数据模态特征表示的模型。预训练模型是输出人工智能生成内容（Artificial Intelligence Generated Content，AIGC）重要工具，也可以作为连接多个具体任务模型的通用接口。经过微调，大语言模型能够广泛应用于下游任务。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

机器学习（Machine Learning，ML）是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。预训练模型是深度学习的最新发展成果，融合了以上技术。

本申请实施例提供的方案，基于人工智能的机器学习技术，能够训练大语言模型，进而利用训练后的大语言模型，实现了资源推荐方法。

本申请实施例提供的资源推荐方法，能够由计算机设备执行。在一些实施例中，该计算机设备为终端或服务器。下面首先以计算机设备为服务器为例，介绍一下本申请实施例提供的资源推荐方法的实施环境，图1是根据本申请实施例提供的一种资源推荐方法的实施环境示意图。参见图1，该实施环境包括终端101和服务器102。终端101和服务器102能够通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

在一些实施例中，终端101是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电、车载终端等，但并不局限于此。终端101安装和运行有支持资源展示的应用程序。该应用程序可以是购物类应用程序、多媒体类应用程序、即时通信类应用程序或者新闻资讯类应用程序等，本申请实施例对此不进行限制。示意性的，终端101是目标对象使用的终端。目标对象可以使用终端101购买食品、衣物以及生活用品等资源，也可以使用终端101观看视频、图片等多媒体资源，本申请实施例对此不进行限制。

本领域技术人员可以知晓，上述终端的数量可以更多或更少。比如上述终端可以仅为一个，或者上述终端为几十个或几百个，或者更多数量。本申请实施例对终端的数量和设备类型不加以限定。

在一些实施例中，服务器102是独立的物理服务器，也能够是多个物理服务器构成的服务器集群或者分布式系统，还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN（Content Delivery Network，内容分发网络）、大数据和人工智能平台等基础云计算服务的云服务器。服务器102用于为支持资源展示的应用程序提供后台服务。服务器102可以根据目标对象的资源偏好，向目标对象推荐资源。也即是，服务器102可以根据目标对象的资源偏好，向终端101发送所推荐的资源的信息，以使目标对象通过终端101能够获取自身感兴趣的资源。在一些实施例中，服务器102承担主要计算工作，终端101承担次要计算工作；或者，服务器102承担次要计算工作，终端101承担主要计算工作；或者，服务器102和终端101二者之间采用分布式计算架构进行协同计算。

图2是根据本申请实施例提供的一种资源推荐方法的流程图，参见图2，在本申请实施例中以由服务器执行为例进行说明。该资源推荐方法包括以下步骤。

201、服务器基于目标对象针对资源的正向行为信息，构造资源提示信息，正向行为信息用于表示目标对象对资源偏好的正向行为，资源提示信息用于表示目标对象所偏好的资源。

在本申请实施例中，目标对象指的是用户。资源可以是食品、衣物以及生活用品等商品资源，也可以是视频、文章、图片或者音频等多媒体资源，本申请实施例对此进行限制。资源也可以称为物料。目标对象对资源偏好指的是目标对象对该资源感兴趣。相应地，正向行为指的是能够反映目标对象对资源感兴趣的行为。服务器获取目标对象针对资源的正向行为信息。正向行为信息包括至少一个正向行为。然后，服务器根据正向行为信息，构造资源提示信息。资源提示信息用于引导大语言模型理解目标对象的资源偏好。其中，目标对象针对资源的正向行为信息可以由目标对象提供，也可以由该资源的供给方提供，本申请实施例对此不进行限制。

202、服务器通过大语言模型，对资源提示信息进行处理，得到资源文本，资源文本用于以自然语言的形式描述目标对象的资源偏好。

在本申请实施例中，大语言模型可以是ChatGLM（Chat General Language Model，聊天通用语言模型）或者LLaMa（Large Language Model Meta Artificial Intelligence，大语言模型元人工智能），本申请实施例对此不进行限制。服务器将资源提示信息输入到大语言模型中，通过大语言模型，对资源提示信息进行处理，得到资源文本。也即是，服务器通过大语言模型理解目标对象的资源偏好，并以自然语言的形式进行描述。

203、对于资源库中的任一待推荐资源，服务器确定待推荐资源与资源文本之间的相关度，相关度用于表示目标对象的资源偏好与待推荐资源之间的相关性。

在本申请实施例中，资源库包括多个待推荐资源。该资源库可以部署在当前的服务器中，也可以部署在其他服务器中，本申请实施例对此不进行限制。服务器通过大语言模型，计算资源库中每一个待推荐资源与资源文本之间的相关度。也即是，服务器将资源库中的每一个待推荐资源与目标对象的资源偏好进行对比，以确定待推荐资源是否符合目标对象的资源偏好。

204、服务器基于资源库中多个待推荐资源对应的相关度，向目标对象推荐资源。

在本申请实施例中，服务器可以将资源库中对应的相关度较大的多个待推荐资源，推荐给目标对象。其中，“相关度较大”指的是相关度达到某一阈值，或者由高到低的排序中靠前的预设数量的相关度，本申请实施例对此不进行限制。

本申请实施例提供了一种资源推荐方法，由于目标对象针对资源的正向行为信息能够反映目标对象所偏好的资源，通过正向行为信息，构造资源提示信息，使得资源提示信息能够准确目标对象的资源偏好；然后，通过大语言模型，对资源提示信息进行处理，由于大语言模型具备丰富的语料知识，使得通过大语言模型得到的资源文本能够更加准确描述目标对象的资源偏好；然后，计算资源文本与资源库中待推荐资源之间的相关度，根据待推荐资源与目标对象的资源偏好之间的相关性，向目标对象推荐资源，使得推荐的资源符合目标对象的资源偏好，提高了资源推荐的准确性。

图3是根据本申请实施例提供的另一种资源推荐方法的流程图，参见图3，在本申请实施例中以由服务器执行为例进行说明。该资源推荐方法包括以下步骤。

301、服务器基于目标对象针对资源的正向行为信息，确定至少一个参考资源，至少一个参考资源为目标对象触发正向行为的资源，正向行为信息用于表示目标对象对资源偏好的正向行为。

在本申请实施例中，目标对象针对资源的正向行为用于表示目标对象对该资源感兴趣。该资源符合目标对象的资源偏好。资源可以是食品、衣物以及生活用品等商品资源。相应地，正向行为可以是点击行为、购买行为、收藏行为或者分享行为等。资源也可以是视频、文章、图片或者音频等多媒体资源。相应地，正向行为可以是点击行为、点赞行为、收藏行为、正面评论行为或者分享行为等，本申请实施例对此不进行限制。服务器获取目标对象针对资源的正向行为信息。正向行为信息包括目标对象的至少一个正向行为。正向行为信息中的正向行为可以是目标对象在预设时间段内触发的，本申请实施例对此不进行限制。

例如，资源是食品。最近一周内，目标对象针对资源的正向行为信息包括两次购买行为和一次点击行为（未购买）等正向行为。其中，目标对象分别购买了潮汕牛肉粿条和鲜虾肠粉，仅点击查看了鸡蛋牛肉面。然后，服务器根据上述正向行为信息，确定三个参考资源分别是潮汕牛肉粿条、鲜虾肠粉以及鸡蛋牛肉面。

或者，资源是视频。最近一周内，目标对象针对资源的正向行为信息包括100次点击行为（仅点击）和25次点赞行为（点击+点赞）。然后，服务器可以根据上述正向行为信息，确定发生点击行为的100个资源为参考资源，或者，确定发生点赞行为的25个资源为参考资源，本申请实施例对此不进行限制。

其中，服务器可以根据资源的推荐指标来确定参考资源。推荐指标用于指示用于推荐的参考资源所要达到的标准。本申请实施例对推荐指标不进行限制。比如，推荐指标包括一级指标、二级指标以及三级指标。一级指标为存在点击行为，二级指标为存在收藏行为（点击+收藏），或者存在点赞行为（点击+点赞）；三级指标为存在购买行为（点击+收藏+购买）。

302、服务器基于至少一个参考资源和推荐需求，构造资源提示信息，推荐需求用于引导大语言模型基于当前推荐场景目理解标对象的资源偏好，资源提示信息用于表示目标对象所偏好的资源。

在本申请实施例中，服务器获取推荐需求。推荐需求指的是当前推荐场景中推荐资源所要满足的需求。推荐需求可以包括资源推荐的场景、资源推荐所需的资源数量或者资源推荐所需的资源类型等，本申请实施例对此不进行限制。服务器根据基于至少一个参考资源和推荐需求，构建资源提示信息。其中，至少一个参考资源可以视为用户行为信息注入；推荐需求可以视为角色注入。推荐需求是指让大语言模型理解推荐任务描述，并按照当前推荐场景生成对应的文本信息。本申请实施例提供的方案，由于目标对象针对参考资源的正向行为能够反映目标对象资源的资源偏好，推荐需求能够反映当前推荐场景中推荐资源所要满足的需求，通过参考资源和推荐需求构造资源提示信息，使得资源提示信息不仅能够准确表示目标对象的资源偏好，还能够在后续过程中引导大语言模型准确理解目标对象的资源偏好，从而利于更准确地为目标对象推荐资源。

例如，资源提示信息为“你是一个面向中小场景的推荐系统，我将告诉你目标对象的消费行为信息，请你挖掘目标对象的潜在偏好并生成语言描述。请注重推荐结果的准确性和多样性。这个目标对象近期点击的资源序列是潮汕牛肉粿条、鲜虾肠粉和鸡蛋牛肉面。请生成下一时刻的目标对象的偏好描述。”其中，“你是一个面向中小场景的推荐系统，我将告诉你目标对象的消费行为信息，请你挖掘目标对象的潜在偏好并生成语言描述”指的是推荐需求，后续能够引导大语言模型理解推荐任务，并按照需求生成文本信息。“这个目标对象近期点击的资源序列是潮汕牛肉粿条、鲜虾肠粉和鸡蛋牛肉面。请生成下一时刻的目标对象的偏好描述”指的是至少一个参考资源，后续能够引导大语言模型总结和挖掘目标对象的资源偏好，并生成对资源偏好描述的自然语言。“中小场景”指的是规模小、资源信息少、用户行为稀疏的推荐场景。比如，小程序里的店铺，可推荐资源只有几千，用户量也只有10万左右。

303、服务器通过大语言模型，对资源提示信息进行处理，得到资源文本，资源文本用于以自然语言的形式描述目标对象的资源偏好。

在本申请实施例中，服务器将资源提示信息输入到大语言模型中。然后，服务器通过大语言模型，对资源提示信息进行分析，得到资源文本。也即是，服务器通过大语言模型理解目标对象的资源偏好，并以自然语言的形式进行描述。

在一些实施例中，服务器根据资源提示信息，分析出目标对象所偏好的资源类型，以便于后续根据目标对象所偏好的资源类型来推荐资源。相应地，服务器通过大语言模型，对资源提示信息进行处理，得到资源文本的过程包括：服务器通过大语言模型，对资源提示信息进行分析，确定目标对象所偏好的目标资源类型。然后，服务器获取与目标资源类型相关的至少一种资源类型。然后，服务器基于目标资源类型和至少一种资源类型，生成资源文本。本申请实施例提供的方案，由于大语言模型具备丰富的语料知识，通过大语言模型对资源提示信息进行分析，使得能够准确地确定目标对象所偏好的资源类型，以便后续推荐的资源符合目标对象的资源偏好，提高了资源推荐的准确性；并且，通过与目标资源类型相关的至少一种资源类型来生成资源文本，在保障了推荐的准确性的基础上，利于为目标对象推荐多种类型的资源，提高了资源推荐的多样性。

在获取与目标资源类型相关的至少一种资源类型的过程中，服务器可以才赢下述至少一项的方式，来获取与目标资源类型相关的资源类型。

第一项方式，服务器基于资源类型之间的相关关系，从当前推荐场景中，获取与目标资源类型相关的至少一种资源类型。当前推荐场景可以是食品推荐场景、衣物推荐场景或者多媒体资源的推荐场景，本申请实施例对此不进行限制。该方法相当于根据目标对象当前资源平台中的资源偏好，在当前资源平台中，为目标对象推荐资源。本申请实施例提供的方案，能够向目标对象推荐当前推荐场景中多种资源类型的资源，在保障了推荐的准确性的基础上，提高了当前推荐场景中资源推荐的多样性。

其中，本申请实施例对资源类型之间的相关关系不进行限制。资源类型之间的相关关系可以基于资源确定。下面以不同的资源为例，示例性地介绍资源类型之间的相关关系，但绝不限于此。

第一，资源为食品。资源类型可以为川菜、湘菜或者面食。相应地，资源类型之间的相关关系可以是口味关系或者地域关系，本申请实施例对此不进行限制。若目标对象所偏好的目标资源类型为川菜，服务器可以通过大语言模型分析出目标对象所偏好的食品为普遍偏辣，则服务器根据资源类型之间的口味关系，获取食品普遍偏辣的湘菜，作为与目标资源类型相关的资源类型。若目标对象所偏好的目标资源类型为粤菜，服务器可以通过大语言模型分析出目标对象所偏好的食品所属的地理位置，则服务器根据资源类型之间的位置关系，获取所属的地理位置相近的闽菜，作为与目标资源类型相关的资源类型。

例如，服务器输入到大语言模型的资源提示信息为“你是一个面向中小场景的推荐系统，我将告诉你目标对象的消费行为信息，请你挖掘目标对象的潜在偏好并生成语言描述。请注重推荐结果的准确性和多样性。这个目标对象近期点击的资源序列是潮汕牛肉粿条、鲜虾肠粉和鸡蛋牛肉面。请生成下一时刻的目标对象的偏好描述。”服务器通过大语言模型对该资源提示信息进行分析，得到的资源文本为“根据目标对象最近的点击行为，可以看出目标对象对粤菜和面食比较感兴趣。也即是，目标对象可能喜欢粤菜中的潮汕菜系和面食，例如广东特色小吃、粤菜美食、各种面食等。此外，目标对象可能还会对其他地方的美食感兴趣，例如川菜、湘菜、东北菜等。”其中，“潮汕菜系和面食”指的是目标对象所偏好的目标资源类型。“川菜、湘菜、东北菜”指的是与目标资源类型相关的资源类型。

第二，资源为衣物。资源类型可以是上衣、裤子、裙子或者帽子等。相应地，资源类型之间的相关关系可以是颜色关系、季节关系或者材料关系，等本申请实施例对此不进行限制。若目标对象所偏好的目标资源类型为上衣，服务器可以通过大语言模型分析出目标对象所偏好的颜色，则服务器根据资源类型之间的颜色关系，获取与上衣的颜色相配的裤子或者帽子，作为与目标资源类型相关的资源类型。若目标对象所偏好的目标资源类型为短裤，服务器可以通过大语言模型分析出目标对象所偏好的衣物属于夏季，则服务器根据资源类型之间的季节关系，获取与短裤对应的季节相配的短袖等上衣，作为与目标资源类型相关的资源类型。

例如，服务器输入到大语言模型的资源提示信息为“你是一个面向中小场景的推荐系统，我将告诉你目标对象的消费行为信息，请你挖掘目标对象的潜在偏好并生成语言描述。请注重推荐结果的准确性和多样性。这个目标对象近期购买的资源序列是短袖、防晒衣和衬衫。请生成下一时刻的目标对象的偏好描述。”服务器通过大语言模型对该资源提示信息进行分析，得到的资源文本为“根据目标对象最近的点击行为，可以看出目标对象对上衣比较感兴趣。也即是，目标对象可能喜欢适合夏季穿的上衣。此外，目标对象可能还会对其他适合夏季穿的衣物感兴趣，例如短裤或者短裙等。”其中，“上衣”指的是目标对象所偏好的目标资源类型。“短裤或者短裙”指的是与目标资源类型相关的资源类型。

第三，资源是视频等多媒体资源。资源类型可以是讲解类、搞笑类或者纪实类等多种风格类型，本申请实施例对此不进行限制。若目标对象所偏好的目标资源类型为讲解类，服务器可以通过大语言模型分析出目标对象所偏好的讲解内容；则服务器根据资源类型之间的内容关系，获取具有相同讲解内容的纪实类，作为与目标资源类型相关的资源类型。

例如，服务器输入到大语言模型的资源提示信息为“你是一个面向中小场景的推荐系统，我将告诉你目标对象的点击行为信息，请你挖掘目标对象的潜在偏好并生成语言描述。请注重推荐结果的准确性和多样性。这个目标对象近期点击的资源序列是电影1的讲解视频、电影2的讲解视频以及电影3的讲解视频。请生成下一时刻的目标对象的偏好描述。”服务器通过大语言模型对该资源提示信息进行分析，得到的资源文本为“根据目标对象最近的点击行为，可以看出目标对象对讲解类比较感兴趣。也即是，目标对象可能喜欢讲解电影的视频。此外，目标对象可能还会对其他与电影相关的视频感兴趣，例如电影的纪实类视频等。”其中，“讲解类”指的是目标对象所偏好的目标资源类型。“电影的纪实类视频”指的是与目标资源类型相关的资源类型。

第二项方式，服务器基于与当前推荐场景相关的其他推荐场景，确定其他推荐场景中目标对象的资源偏好。然后，服务器基于其他推荐场景中目标对象的资源偏好，从当前推荐场景中，获取与目标资源类型相关的至少一种资源类型。其中，其他推荐场景和当前推荐场景所推荐的资源的类型可以相同，也可以不同，本申请实施例对此不进行限制。其他推荐场景中资源的供给方和当前推荐场景中资源的供给方可以相同，也可以不同。本申请实施例提供的方案，使得多个推荐场景共用一个大语言模型来实现资源推荐，极大地节省了资源推荐的成本；并且，能够在跨场景的情况下向目标对象推荐多种资源类型的资源，在保障了推荐的准确性的基础上，同样也提高了资源推荐的多样性。

例如，其他推荐场景和当前推荐场景所推荐的资源的类型相同。其他推荐场景和当前推荐场景均用于推荐食品。相应地，服务器基于其他推荐场景中目标对象所偏好的食品类型，从当前推荐场景中，获取与该食品类型相关的至少一种食品类型，以便后续向目标对象推荐该食品类型的食品和与该食品类型相关的至少一种食品类型的食品。该方法相当于根据目标对象在同类型的其他资源平台中的资源偏好，在当前资源平台中，为目标对象推荐资源。

或者，其他推荐场景和当前推荐场景所推荐的资源的类型不同。其他推荐场景用于推荐生活用品，当前推荐场景用于推荐食品。相应地，服务器基于其他推荐场景中目标对象所偏好的生活用品的类型，从当前推荐场景中，获取与该生活用品的类型相关的至少一种食品类型，以便后续向目标对象推荐与该生活用品的类型相关的至少一种食品类型的视频。比如，其他推荐场景中目标对象所偏好的生活用品的类型为婴儿用品。相应地，服务器从当前推荐场景中，获取适用于婴儿的至少一种食品类型，以便后续向目标对象推荐婴儿适用的食品。该方法相当于根据目标对象在不同类型的其他资源平台中的资源偏好，在当前资源平台中，为目标对象推荐资源。

304、对于资源库中的任一待推荐资源，服务器确定待推荐资源与资源文本之间的相关度，相关度用于表示目标对象的资源偏好与待推荐资源之间的相关性。

在本申请实施例中，大语言模型中包括推荐任务层。服务器通过大语言模型中的推荐任务层，将资源库中的每一个待推荐资源与目标对象的资源偏好进行对比，以确定待推荐资源是否符合目标对象的资源偏好。也即是，服务器通过大语言模型计算资源库中每一个待推荐资源与资源文本之间的相关度，来确定待推荐资源是否符合目标对象的资源偏好。

在一些实施例中，待推荐资源与资源文本之间的相关度指的是待推荐资源和资源文本之间的相似度。相应地，服务器确定待推荐资源与资源文本之间的相关度的过程包括：对于资源库中的任一待推荐资源，服务器基于大语言模型，对待推荐资源进行特征提取，得到待推荐资源的资源特征。资源特征用于表示待推荐资源的详情信息。然后，服务器基于大语言模型，对资源文本进行特征提取，得到资源文本特征。然后，服务器确定待推荐资源的资源特征与资源文本特征之间的相似度。相似度指的是目标对象的资源偏好与待推荐资源之间的相关度。相似度越高，对应的待推荐资源越符合目标对象的资源偏好。本申请实施例提供的方案，通过计算待推荐资源的资源特征与资源文本的特征之间的相似度，能够更加准确地确定待推荐资源是否符合目标对象的资源偏好，便于后续进行更准确的资源推荐。

在一些实施例中，服务器可以通过下述公式一，来计算待推荐资源的资源特征与资源文本特征之间的相似度。

公式一：。

其中，用于表示资源库中待推荐资源的编号；/>用于表示第/>个待推荐资源的资源特征，/>，/>用于表示特征的维度；/>用于表示转置；/>用于表示资源文本特征，，/>用于表示特征的维度；/>用于表示第/>个待推荐资源的资源特征与资源文本特征之间的相似度，用于在第/>个时刻（下一时刻）向目标对象推荐第/>个待推荐资源，以促使目标对象针对第/>个待推荐资源触发正向行为。

在获取待推荐资源的资源特征的过程中，对于资源库中的任一待推荐资源，服务器获取待推荐资源的文本信息。然后，服务器基于大语言模型，对文本信息进行特征提取，得到待推荐资源的资源特征。也即是，服务器基于大语言模型，对待推荐资源的文本信息进行编码，得到待推荐资源的资源特征。其中，文本信息为待推荐资源的详情信息。文本信息可以包括资源名称、资源类型、资源内容以及资源标签等至少一种信息。资源标签可以用于指示资源所携带的消费方式或者资源类型等，本申请实施例对此不进行限制。本申请实施例提供的方案，利用大语言模型具备的丰富的语料知识，对待推荐资源的文本信息进行特征处理，能够提高资源文本的准确性，也即是能够准确地描述目标对象的资源偏好，利于后续更准确地为目标对象推荐资源。

服务器可以将待推荐资源的资源特征存储在资源库中。该资源库可以是Faiss，本申请实施例对此不进行限制。然后，服务器还可以在资源库中建立待推荐资源的索引，以便后续可以根据索引从资源库中查找资源。

305、服务器基于资源库中多个待推荐资源对应的相关度，向目标对象推荐资源。

在本申请实施例中，服务器可以将资源库中对应的相关度较大的多个待推荐资源，推荐给目标对象。也即是，服务器可以将相关度达到预设值的多个待推荐资源，推荐给目标对象。或者，服务器也可以将相关度由高到低的排序中靠前的预设数量的待推荐资源，推荐给目标对象。换而言之，服务器可以将目标对象的资源文本特征，作为查询信息，在资源库（例如Faiss）中，检索与资源文本特征最相似的预设数量的资源特征。然后，服务器通过大语言模型输出预设数量的资源特征对应的索引和相关度。然后，服务器向目标对象推荐索引指示的待推荐资源。本申请实施例对此不进行限制。相比于传统的推荐系统，本方案基于大语言模型实现端到端推荐，在大语言模型输入上只需要目标对象的正向行为信息，就可以实现准确的资源推荐，而不需要复杂的埋点设计，优化了模型的设计流程，节省了资源推荐的部署成本。

在一些实施例中，服务器将相关度由高到低的排序中靠前的预设数量的待推荐资源，推荐给目标对象。相应地，服务器基于资源库中多个待推荐资源对应的相关度，向目标对象推荐资源的过程包括：服务器按照相关度由高到低的顺序，对资源库中的多个待推荐资源进行排序。然后，服务器向目标对象推荐排序靠前的预设数量的待推荐资源。本申请实施例提供的方案，通过向目标对象推荐相关度较大的多个待推荐资源，保障了推荐的资源符合目标对象的资源偏好，提高了资源推荐的准确性。

由于大语言模型的训练任务和推荐任务存在差距，且大语言模型没有采用推荐任务的数据集进行专门训练。因此直接采用大语言模型做推荐可能会限制大语言模型的推荐性能。其中，“训练任务”指的是基于大量通用的语言文本对大语言模型进行训练，以使大语言模型具备理解文本的语义的性能。“推荐任务”指的是基于资源的信息和对象的行为信息对大语言模型进行训练，以是大语言模型具备向对象推荐资源的性能。在一些实施例中，在进行资源推荐之前，服务器可以根据推荐任务，对大语言模型进行训练。相应地，大语言模型的训练过程，包括：服务器基于样本对象针对资源的正向行为信息，构造样本提示信息。正向行为信息用于表示样本对象对资源偏好的正向行为。样本提示信息用于表示样本对象所偏好的资源。然后，服务器通过大语言模型，对样本提示信息进行处理，得到样本资源文本。样本资源文本用于以自然语言的形式描述样本对象的资源偏好。然后，服务器基于样本资源文本，确定预测推荐结果。预测推荐结果用于表示大语言模型预测出的向样本对象推荐的资源。然后，服务器基于预测推荐结果和参考推荐结果，对大语言模型进行训练，参考推荐结果用于表示真实情况下向样本对象推荐的资源。本申请实施例提供的方案，通过真实情况下向样本对象推荐的资源与大语言模型预测的资源，对大语言模型进行训练，能够有效提高大语言模型在推荐任务上的泛化能力，利于提高大语言模型推荐资源的准确性。

其中，服务器可以先获取基于语言文本训练后的大语言模型。基于语言文本训练后的大语言模型具有丰富的语料知识。然后，服务器保持大语言模型的参数不变，为大语言模型添加可调参数。然后，服务器以最小化预测推荐结果和参考推荐结果之间的差异为目标，调整大语言模型的可调参数。

在一些实施例中，服务器可以通过下述公式二，来确定大语言模型的参数。

公式二：。

其中，、/>和/>用于表示维度，且/>，/>用于表示大语言模型的原始参数，也即是基于语言文本训练后的模型参数；/>用于表示大语言模型的可调参数，；/>和/>用于表示参数矩阵；在模型训练过程中，服务器保持大语言模型的原始参数/>冻结，不需进行更新，只需要训练参数矩阵/>和/>。在模型训练前，服务器可以采用随机高斯分布初始化参数矩阵/>，将参数矩阵/>设置为全0矩阵，以保证矩阵/>在训练前为全0矩阵。初始情况下，大语言模型的输出为/>。/>用于表示模型输入。当更新参数以后，则模型的输出/>。

上述训练方式可视为一种LoRA（Low-Rank Adaptation，低阶自适应）的微调方式。LoRA微调方式指的是冻结预训练模型中的原始参数，并在Transformer架构中的每一层中引入可训练的低秩分解矩阵（又称为旁路矩阵），微调时仅仅需要更新旁路矩阵（）即可。该方式通过优化低秩分解矩阵，可以在冻结原始模型结构参数的情况下有效地将下游推荐任务的信息补充到大语言模型中，其训练过程中所更新的模型参数仅仅是原有大语言模型参数的千分之一左右，相比于更新大语言模型原始的全部模型参数而言，上述训练方式调整的参数少，是一种轻量化微调的训练方式，能够提高训练效率。通过LoRA微调，能够有效提高大语言模型在推荐任务上的泛化能力。在本方案中，多个中小客户可以共用同一个大规模语言模型，能够有效节省成本。随着接入客户增多，大语言模型的物料知识能够有效复用，模型微调的效果则越好，模型的推荐能力也随之提高。

在一些实施例中，在进行上述模型微调之前，服务器将样本提示信息输入到大语言模型中，得到样本资源文本。然后，服务器对样本资源文本进行校正。然后，服务器将样本提示信息和校正后的样本资源文本，作为一个训练样本。也即是，服务器将样本提示信息和校正后的样本资源文本，看作是与大语言模型的一轮对话。然后，服务器通过多个训练样本进行训练，以使大语言模型能够准确地描述样本对象的资源偏好。也即是，服务器通过多个带有提示信息的训练数据，对大语言模型进行训练。本申请中的提示信息也可以称为提示词。

本申请实施例提供了一种资源推荐方法，由于目标对象针对资源的正向行为信息能够反映目标对象所偏好的资源，通过正向行为信息，构造资源提示信息，使得资源提示信息能够准确目标对象的资源偏好；然后，通过大语言模型，对资源提示信息进行处理，由于大语言模型具备丰富的语料知识，使得通过大语言模型得到的资源文本能够更加准确描述目标对象的资源偏好；然后，计算资源文本与资源库中待推荐资源之间的相关度，根据待推荐资源与目标对象的资源偏好之间的相关性，向目标对象推荐资源，使得推荐的资源符合目标对象的资源偏好，提高了资源推荐的准确性；并且，相比于传统推荐系统设计中“召回-粗排-精排-重排”的模型链路，本方案采用目标对象的正向行为信息即可实现推荐，能够有效缩短推荐链路，提高了资源推荐的效率。

图4是根据本申请实施例提供的一种资源推荐装置的框图。该资源推荐装置用于执行上述资源推荐方法执行时的步骤，参见图4，该资源推荐装置包括：构造模块401、第一处理模块402、确定模块403以及推荐模块404。

构造模块401，用于基于目标对象针对资源的正向行为信息，构造资源提示信息，正向行为信息用于表示目标对象对资源偏好的正向行为，资源提示信息用于表示目标对象所偏好的资源。

第一处理模块402，用于通过大语言模型，对资源提示信息进行处理，得到资源文本，资源文本用于以自然语言的形式描述目标对象的资源偏好。

确定模块403，用于对于资源库中的任一待推荐资源，确定待推荐资源与资源文本之间的相关度，相关度用于表示目标对象的资源偏好与待推荐资源之间的相关性。

推荐模块404，用于基于资源库中多个待推荐资源对应的相关度，向目标对象推荐资源。

在一些实施例中，图5是根据本申请实施例提供的另一种资源推荐装置的框图。参见图5，构造模块401，用于基于目标对象针对资源的正向行为信息，确定至少一个参考资源，至少一个参考资源为目标对象触发正向行为的资源；基于至少一个参考资源和推荐需求，构造资源提示信息，推荐需求用于引导大语言模型基于当前推荐场景理解目标对象的资源偏好。

在一些实施例中，继续参见图5，第一处理模块402，包括：分析单元4021、获取单元4022和生成单元4023。

分析单元4021，用于通过大语言模型，对资源提示信息进行分析，确定目标对象所偏好的目标资源类型。

获取单元4022，用于获取与目标资源类型相关的至少一种资源类型。

生成单元4023，用于基于目标资源类型和至少一种资源类型，生成资源文本。

在一些实施例中，继续参见图5，获取单元4022，用于基于资源类型之间的相关关系，从当前推荐场景中，获取与目标资源类型相关的至少一种资源类型。

获取单元4022，还用于基于与当前推荐场景相关的其他推荐场景，确定其他推荐场景中目标对象的资源偏好；基于其他推荐场景中目标对象的资源偏好，从当前推荐场景中，获取与目标资源类型相关的至少一种资源类型。

在一些实施例中，继续参见图5，确定模块403，包括：第一处理单元4031、第二处理单元4032和确定单元4033。

第一处理单元4031，用于对于资源库中的任一待推荐资源，基于大语言模型，对待推荐资源进行特征提取，得到待推荐资源的资源特征，资源特征用于表示待推荐资源的详情信息。

第二处理单元4032，用于基于大语言模型，对资源文本进行特征提取，得到资源文本特征。

确定单元4033，用于确定待推荐资源的资源特征与资源文本特征之间的相似度，相似度指的是目标对象的资源偏好与待推荐资源之间的相关度。

在一些实施例中，继续参见图5，第一处理单元4031，用于对于资源库中的任一待推荐资源，获取待推荐资源的文本信息，文本信息为待推荐资源的详情信息；基于大语言模型，对文本信息进行特征提取，得到待推荐资源的资源特征。

在一些实施例中，继续参见图5，推荐模块404，用于按照相关度由高到低的顺序，对资源库中的多个待推荐资源进行排序；向目标对象推荐排序靠前的预设数量的待推荐资源。

在一些实施例中，继续参见图5，构造模块401，还用于基于样本对象针对资源的正向行为信息，构造样本提示信息，正向行为信息用于表示样本对象对资源偏好的正向行为，样本提示信息用于表示样本对象所偏好的资源。

第一处理模块402，还用于通过大语言模型，对样本提示信息进行处理，得到样本资源文本，样本资源文本用于以自然语言的形式描述样本对象的资源偏好。

推荐模块404，还用于基于样本资源文本，确定预测推荐结果，预测推荐结果用于表示大语言模型预测出的向样本对象推荐的资源。

装置还包括：训练模块405，用于基于预测推荐结果和参考推荐结果，对大语言模型进行训练，参考推荐结果用于表示真实情况下向样本对象推荐的资源。

在一些实施例中，继续参见图5，装置还包括：获取模块406和第二处理模块407。

获取模块406，用于获取基于语言文本训练后的大语言模型。

第二处理模块407，用于保持大语言模型的参数不变，为大语言模型添加可调参数。

训练模块405，用于以最小化预测推荐结果和参考推荐结果之间的差异为目标，调整大语言模型的可调参数。

本申请实施例提供了一种资源推荐装置，由于目标对象针对资源的正向行为信息能够反映目标对象所偏好的资源，通过正向行为信息，构造资源提示信息，使得资源提示信息能够准确目标对象的资源偏好；然后，通过大语言模型，对资源提示信息进行处理，由于大语言模型具备丰富的语料知识，使得通过大语言模型得到的资源文本能够更加准确描述目标对象的资源偏好；然后，计算资源文本与资源库中待推荐资源之间的相关度，根据待推荐资源与目标对象的资源偏好之间的相关性，向目标对象推荐资源，使得推荐的资源符合目标对象的资源偏好，提高了资源推荐的准确性。

需要说明的是，上述实施例提供的资源推荐装置在运行应用程序时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的资源推荐装置与资源推荐方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

在本申请实施例中，计算机设备能够被配置为终端或者服务器，当计算机设备被配置为终端时，可以由终端作为执行主体来实施本申请实施例提供的技术方案，当计算机设备被配置为服务器时，可以由服务器作为执行主体来实施本申请实施例提供的技术方案，也可以通过终端和服务器之间的交互来实施本申请提供的技术方案，本申请实施例对此不作限定。

图6示出了本申请一个示例性实施例提供的终端600的结构框图。终端600包括有：处理器601和存储器602。

处理器601可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器601可以采用DSP（Digital Signal Processing，数字信号处理）、FPGA（Field-Programmable Gate Array，现场可编程门阵列）、PLA（Programmable Logic Array，可编程逻辑阵列）中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU（Central ProcessingUnit，中央处理器）；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器601可以集成有GPU（Graphics Processing Unit，图像处理器），GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器601还可以包括AI（Artificial Intelligence，人工智能）处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器602可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器602中的非暂态的计算机可读存储介质用于存储至少一个计算机程序，该至少一个计算机程序用于被处理器601所执行以实现本申请中方法实施例提供的资源筛选方法。

在一些实施例中，终端600还可选包括有：外围设备接口603和至少一个外围设备。处理器601、存储器602和外围设备接口603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口603相连。具体地，外围设备包括：射频电路604、显示屏605、摄像头组件606、音频电路607和电源608中的至少一种。

外围设备接口603可被用于将I/O（Input /Output，输入/输出）相关的至少一个外围设备连接到处理器601和存储器602。在一些实施例中，处理器601、存储器602和外围设备接口603被集成在同一芯片或电路板上；在一些其他实施例中，处理器601、存储器602和外围设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路604用于接收和发射RF（Radio Frequency，射频）信号，也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路604包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络（2G、3G、4G及5G）、无线局域网和/或WiFi（Wireless Fidelity，无线保真）网络。在一些实施例中，射频电路604还可以包括NFC（Near Field Communication，近距离无线通信）有关的电路，本申请对此不加以限定。

显示屏605用于显示UI（User Interface，用户界面）。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏605是触摸显示屏时，显示屏605还具有采集在显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。此时，显示屏605还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏605可以为一个，设置在终端600的前面板；在另一些实施例中，显示屏605可以为至少两个，分别设置在终端600的不同表面或呈折叠设计；在另一些实施例中，显示屏605可以是柔性显示屏，设置在终端600的弯曲表面上或折叠面上。甚至，显示屏605还可以设置成非矩形的不规则图形，也即异形屏。显示屏605可以采用LCD（Liquid Crystal Display，液晶显示屏）、OLED（Organic Light-Emitting Diode，有机发光二极管）等材质制备。

摄像头组件606用于采集图像或视频。可选地，摄像头组件606包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR（Virtual Reality，虚拟现实）拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器601进行处理，或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路607还可以包括耳机插孔。

电源608用于为终端600中的各个组件进行供电。电源608可以是交流电、直流电、一次性电池或可充电电池。当电源608包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

本领域技术人员可以理解，图6中示出的结构并不构成对终端600的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

图7是根据本申请实施例提供的一种服务器的结构示意图，该服务器700可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器（CentralProcessingUnits，CPU）701和一个或一个以上的存储器702，其中，该存储器702中存储有至少一条计算机程序，该至少一条计算机程序由该处理器701加载并执行以实现上述各个方法实施例提供的资源推荐方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一段计算机程序，该至少一段计算机程序由计算机设备的处理器加载并执行以实现上述实施例的资源推荐方法中计算机设备所执行的操作。例如，所述计算机可读存储介质可以是只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random Access Memory，RAM）、光盘只读存储器（Compact Disc Read-Only Memory，CD-ROM）、磁带、软盘和光数据存储设备等。

本申请实施例还提供了一种计算机程序产品，包括计算机程序，该计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序，处理器执行该计算机程序，使得该计算机设备执行上述各种可选实现方式中提供的资源推荐方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种资源推荐方法，其特征在于，所述方法包括：

基于目标对象针对资源的正向行为信息和资源的推荐指标，确定至少一个参考资源，所述正向行为信息用于表示所述目标对象对资源偏好的正向行为，所述至少一个参考资源为所述目标对象触发正向行为的资源，所述推荐指标用于指示用于推荐的参考资源所要达到的标准；

基于所述至少一个参考资源和推荐需求，构造资源提示信息，所述推荐需求用于引导大语言模型基于当前推荐场景理解所述目标对象的资源偏好，所述资源提示信息用于表示所述目标对象所偏好的资源；

通过所述大语言模型，对所述资源提示信息进行分析，确定所述目标对象所偏好的目标资源类型；

基于与当前推荐场景相关的其他推荐场景，确定其他推荐场景中所述目标对象的资源偏好，所述其他推荐场景和所述当前推荐场景所推荐的资源的类型不同，所述其他推荐场景中资源的供给方和所述当前推荐场景中资源的供给方不同；

基于所述其他推荐场景中所述目标对象的资源偏好，从当前推荐场景中，获取与所述目标资源类型相关的至少一种资源类型，所述至少一种资源类型与所述目标资源类型之间的相关关系为口味关系、地域关系、颜色关系、季节关系、材料关系和内容关系中的一种；

基于所述目标资源类型和所述至少一种资源类型，生成资源文本，所述资源文本用于以自然语言的形式描述所述目标对象的资源偏好；

对于资源库中的任一待推荐资源，确定所述待推荐资源与所述资源文本之间的相关度，所述相关度用于表示所述目标对象的资源偏好与所述待推荐资源之间的相关性；

基于所述资源库中多个待推荐资源对应的相关度，向所述目标对象推荐资源。

2.根据权利要求1所述的方法，其特征在于，所述对于资源库中的任一待推荐资源，确定所述待推荐资源与所述资源文本之间的相关度，包括：

对于资源库中的任一待推荐资源，基于所述大语言模型，对所述待推荐资源进行特征提取，得到所述待推荐资源的资源特征，所述资源特征用于表示所述待推荐资源的详情信息；

基于所述大语言模型，对所述资源文本进行特征提取，得到资源文本特征；

确定所述待推荐资源的资源特征与所述资源文本特征之间的相似度，所述相似度指的是所述目标对象的资源偏好与所述待推荐资源之间的相关度。

3.根据权利要求2所述的方法，其特征在于，所述对于资源库中的任一待推荐资源，基于所述大语言模型，对所述待推荐资源进行特征提取，得到所述待推荐资源的资源特征，包括：

对于资源库中的任一待推荐资源，获取所述待推荐资源的文本信息，所述文本信息为所述待推荐资源的详情信息；

基于所述大语言模型，对所述文本信息进行特征提取，得到所述待推荐资源的资源特征。

4.根据权利要求1所述的方法，其特征在于，所述基于所述资源库中多个待推荐资源对应的相关度，向所述目标对象推荐资源，包括：

按照相关度由高到低的顺序，对所述资源库中的多个待推荐资源进行排序；

向所述目标对象推荐排序靠前的预设数量的待推荐资源。

5.根据权利要求1所述的方法，其特征在于，所述大语言模型的训练过程，包括：

基于样本对象针对资源的正向行为信息，构造样本提示信息，所述正向行为信息用于表示所述样本对象对资源偏好的正向行为，所述样本提示信息用于表示所述样本对象所偏好的资源；

通过所述大语言模型，对所述样本提示信息进行处理，得到样本资源文本，所述样本资源文本用于以自然语言的形式描述所述样本对象的资源偏好；

基于所述样本资源文本，确定预测推荐结果，所述预测推荐结果用于表示所述大语言模型预测出的向所述样本对象推荐的资源；

基于所述预测推荐结果和参考推荐结果，对所述大语言模型进行训练，所述参考推荐结果用于表示真实情况下向所述样本对象推荐的资源。

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

获取基于语言文本训练后的所述大语言模型；

保持所述大语言模型的参数不变，为所述大语言模型添加可调参数；

所述基于所述预测推荐结果和参考推荐结果，对所述大语言模型进行训练，包括：

以最小化所述预测推荐结果和所述参考推荐结果之间的差异为目标，调整所述大语言模型的可调参数。

7.一种资源推荐装置，其特征在于，所述装置包括：

构造模块，用于基于目标对象针对资源的正向行为信息和资源的推荐指标，确定至少一个参考资源，所述正向行为信息用于表示所述目标对象对资源偏好的正向行为，所述至少一个参考资源为所述目标对象触发正向行为的资源，所述推荐指标用于指示用于推荐的参考资源所要达到的标准；基于所述至少一个参考资源和推荐需求，构造资源提示信息，所述推荐需求用于引导大语言模型基于当前推荐场景理解所述目标对象的资源偏好，所述资源提示信息用于表示所述目标对象所偏好的资源；

第一处理模块，用于通过所述大语言模型，对所述资源提示信息进行分析，确定所述目标对象所偏好的目标资源类型；基于与当前推荐场景相关的其他推荐场景，确定其他推荐场景中所述目标对象的资源偏好，所述其他推荐场景和所述当前推荐场景所推荐的资源的类型不同，所述其他推荐场景中资源的供给方和所述当前推荐场景中资源的供给方不同；基于所述其他推荐场景中所述目标对象的资源偏好，从当前推荐场景中，获取与所述目标资源类型相关的至少一种资源类型，所述至少一种资源类型与所述目标资源类型之间的相关关系为口味关系、地域关系、颜色关系、季节关系、材料关系和内容关系中的一种；基于所述目标资源类型和所述至少一种资源类型，生成资源文本，所述资源文本用于以自然语言的形式描述所述目标对象的资源偏好；

确定模块，用于对于资源库中的任一待推荐资源，确定所述待推荐资源与所述资源文本之间的相关度，所述相关度用于表示所述目标对象的资源偏好与所述待推荐资源之间的相关性；

推荐模块，用于基于所述资源库中多个待推荐资源对应的相关度，向所述目标对象推荐资源。

8.根据权利要求7所述的装置，其特征在于，所述确定模块，包括：

第一处理单元，用于对于资源库中的任一待推荐资源，基于所述大语言模型，对所述待推荐资源进行特征提取，得到所述待推荐资源的资源特征，所述资源特征用于表示所述待推荐资源的详情信息；

第二处理单元，用于基于所述大语言模型，对所述资源文本进行特征提取，得到资源文本特征；

确定单元，用于确定所述待推荐资源的资源特征与所述资源文本特征之间的相似度，所述相似度指的是所述目标对象的资源偏好与所述待推荐资源之间的相关度。

9.根据权利要求8所述的装置，其特征在于，所述第一处理单元，用于对于资源库中的任一待推荐资源，获取所述待推荐资源的文本信息，所述文本信息为所述待推荐资源的详情信息；基于所述大语言模型，对所述文本信息进行特征提取，得到所述待推荐资源的资源特征。

10.根据权利要求7所述的装置，其特征在于，所述推荐模块，用于按照相关度由高到低的顺序，对所述资源库中的多个待推荐资源进行排序；向所述目标对象推荐排序靠前的预设数量的待推荐资源。

11.根据权利要求7所述的装置，其特征在于，构造模块，还用于基于样本对象针对资源的正向行为信息，构造样本提示信息，所述正向行为信息用于表示所述样本对象对资源偏好的正向行为，所述样本提示信息用于表示所述样本对象所偏好的资源；

第一处理模块，还用于通过所述大语言模型，对所述样本提示信息进行处理，得到样本资源文本，所述样本资源文本用于以自然语言的形式描述所述样本对象的资源偏好；

推荐模块，还用于基于所述样本资源文本，确定预测推荐结果，所述预测推荐结果用于表示所述大语言模型预测出的向所述样本对象推荐的资源；

所述装置还包括：训练模块，用于基于所述预测推荐结果和参考推荐结果，对所述大语言模型进行训练，所述参考推荐结果用于表示真实情况下向所述样本对象推荐的资源。

12.根据权利要求11所述的装置，其特征在于，所述装置还包括：

获取模块，用于获取基于语言文本训练后的所述大语言模型；

第二处理模块，用于保持所述大语言模型的参数不变，为所述大语言模型添加可调参数；

所述训练模块，用于以最小化所述预测推荐结果和所述参考推荐结果之间的差异为目标，调整所述大语言模型的可调参数。

13.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行权利要求1至6任一项权利要求所述的资源推荐方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储至少一段计算机程序，所述至少一段计算机程序用于执行权利要求1至6任一项权利要求所述的资源推荐方法。