CN118094016A - 推荐方法、装置、设备、计算机可读存储介质及程序产品 - Google Patents
推荐方法、装置、设备、计算机可读存储介质及程序产品 Download PDFInfo
- Publication number
- CN118094016A CN118094016A CN202410484576.3A CN202410484576A CN118094016A CN 118094016 A CN118094016 A CN 118094016A CN 202410484576 A CN202410484576 A CN 202410484576A CN 118094016 A CN118094016 A CN 118094016A
- Authority
- CN
- China
- Prior art keywords
- content
- text
- recommended
- target object
- enhanced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 239000013598 vector Substances 0.000 claims abstract description 256
- 238000012545 processing Methods 0.000 claims abstract description 133
- 239000011159 matrix material Substances 0.000 claims description 86
- 238000004590 computer program Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 10
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 14
- 238000005516 engineering process Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000036651 mood Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013480 data collection Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例提供了推荐方法、装置、设备、计算机可读存储介质及程序产品,涉及人工智能、地图等领域,应用场景包括但不限于视频推荐场景。该方法包括:基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本;基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量;基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分;基于各预测评分,确定向目标对象进行推荐的目标内容。
Description
技术领域
本公开涉及计算机技术领域,具体而言,本公开涉及一种推荐方法、装置、设备、计算机可读存储介质及程序产品。
背景技术
现有技术中,推荐系统用于自动计算用户偏好,并提供高质量的推荐服务,推荐系统在各种内容推荐当中被广泛应用,推荐系统例如网络购物平台、音乐推荐系统、电影推荐系统、视频点播系统等,各种内容例如图文、图片、视频等。但是,现有技术中推荐系统能够收集的数据有限,例如,视频点播系统能够收集到用户的视频播放行为数据,用户的视频播放行为数据为视频点播系统对应的视频点播业务数据,但是推荐系统难以收集到视频点播业务数据之外的数据;因此,导致推荐系统进行内容推荐的准确度较低。
发明内容
本公开针对现有的方式的缺点,提出一种推荐方法、装置、设备、计算机可读存储介质及计算机程序产品,用于解决如何提高内容推荐的准确度的问题。
第一方面,本公开提供了一种推荐方法,包括:
获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本;
基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本;
基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量;
基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分;
基于各预测评分,确定向目标对象进行推荐的目标内容,待推荐内容集合包括目标内容。
在一个实施例中,基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本,包括:
基于目标对象的文本和预设的第一提示词,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本;
基于每个待推荐内容的文本和预设的第二提示词,通过第一大语言模型进行文本扩展处理,确定每个待推荐内容的增强文本。
在一个实施例中,基于目标对象的文本和预设的第一提示词,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本,包括:
将目标对象的文本写入到预设的第一提示词中,得到更新后的第一提示词;
将更新后的第一提示词输入至预设的第一大语言模型,通过上下文学习,确定目标对象的增强文本;
预设的第一提示词包括对象的偏好、对象的观看历史和针对第一大语言模型的第一任务指示中至少一项,第一任务指示包括任务描述,任务描述用于指示第一大语言模型输出与任务描述对应的目标对象的增强文本。
在一个实施例中,基于每个待推荐内容的文本和预设的第二提示词,通过第一大语言模型进行文本扩展处理,确定每个待推荐内容的增强文本,包括:
将每个待推荐内容的文本写入到预设的第二提示词中,得到更新后的第二提示词;
将更新后的第二提示词输入至第一大语言模型,通过上下文学习,确定每个待推荐内容的增强文本;
预设的第二提示词包括针对第一大语言模型的第二任务指示,第二任务指示包括任务描述,任务描述用于指示第一大语言模型输出与任务描述对应的每个待推荐内容的增强文本。
在一个实施例中,基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,包括:
基于目标对象的增强文本和每个待推荐内容的增强文本,通过预处理,确定目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵;
基于目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵,通过预设的第二大语言模型进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量。
在一个实施例中,基于目标对象的增强文本和每个待推荐内容的增强文本,通过预处理,确定目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵,包括:
基于目标对象的增强文本和预设的文本单元集合,确定目标对象的增强文本中每个字对应的文本单元,并基于目标对象的增强文本中各字对应的文本单元,确定目标对象的初始向量矩阵,文本单元集合中文本单元通过独热编码表示;
基于每个待推荐内容的增强文本和预设的文本单元集合,确定每个待推荐内容的增强文本中每个字对应的文本单元,并基于每个待推荐内容的增强文本中各字对应的文本单元,确定每个待推荐内容的初始向量矩阵。
在一个实施例中,基于目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵,通过预设的第二大语言模型进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,包括:
将目标对象的初始向量矩阵输入至预设的第二大语言模型,通过特征嵌入处理,确定目标对象的初始向量矩阵对应的多个特征嵌入向量;
基于目标对象的初始向量矩阵对应的多个特征嵌入向量,通过拼接处理,确定目标对象的增强文本对应的向量;
将每个待推荐内容的初始向量矩阵输入至第二大语言模型,通过特征嵌入处理,确定每个待推荐内容的初始向量矩阵对应的多个特征嵌入向量;
基于每个待推荐内容的初始向量矩阵对应的多个特征嵌入向量,通过拼接处理,确定每个待推荐内容的增强文本对应的向量。
在一个实施例中,基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分,包括:
将目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量输入至预设的预测模型,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分,针对每个待推荐内容的预测评分通过评分字符串来表征,评分字符串包括多种评分。
在一个实施例中,基于各预测评分,确定向目标对象进行推荐的目标内容,包括:
基于各预测评分中每个预测评分对应的评分字符串和每个预测评分对应的评分字符串中多种评分的预设权重,确定每个预测评分对应的预测总分;
将各预测总分按照从大到小进行排序,确定排序在前的N个预测总分,N为正整数;
将排序在前的N个预测总分对应的待推荐内容,确定为向目标对象进行推荐的目标内容。
在一个实施例中,在获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本之前,还包括:
获取对象样本的增强文本对应的向量和内容样本集合中每个内容样本的增强文本对应的向量;
将对象样本的增强文本对应的向量和每个内容样本的增强文本对应的向量输入至待训练的预测模型,通过匹配处理,确定对象样本针对每个内容样本的预测评分;
基于针对各内容样本的预测评分和预设的实际评分,确定分类损失函数的值;
基于分类损失函数的值,对待训练的预测模型进行更新,直至基于分类损失函数的值满足预定条件,对待训练的预测模型进行更新,得到预设的预测模型。
在一个实施例中,在获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本之前,还包括:
获取对象样本的增强文本和内容样本集合中各内容样本的增强文本;
基于对象样本的增强文本和各内容样本的增强文本,对待训练的第二大语言模型和待训练的预测模型进行训练,得到预设的第二大语言模型和预设的预测模型。
第二方面,本公开提供了一种推荐装置,包括:
第一处理模块,用于获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本;
第二处理模块,用于基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本;
第三处理模块,用于基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量;
第四处理模块,用于基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分;
第五处理模块,用于基于各预测评分,确定向目标对象进行推荐的目标内容,待推荐内容集合包括目标内容。
第三方面,本公开提供了一种电子设备,包括:处理器、存储器和总线;
总线,用于连接处理器和存储器;
存储器,用于存储操作指令;
处理器,用于通过调用操作指令,执行本公开第一方面的推荐方法。
第四方面,本公开提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被用于执行本公开第一方面的推荐方法。
第五方面,本公开提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现本公开第一方面中推荐方法的步骤。
本公开实施例提供的技术方案,至少具有如下有益效果:
获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本;基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本;基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量;基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分;基于各预测评分,确定向目标对象进行推荐的目标内容,待推荐内容集合包括目标内容;如此,由于第一大语言模型获取了大量的开放世界知识,即第一大语言模型中包括了大量的开放世界知识,第一大语言模型具备提供开放世界知识的能力,从而通过第一大语言模型进行文本扩展处理,确定目标对象(例如用户)的增强文本(目标对象的开放世界知识)和每个待推荐内容(例如电影)的增强文本(每个待推荐内容的开放世界知识),即通过第一大语言模型提取推荐系统对应的业务之外的数据(目标对象的增强文本和每个待推荐内容的增强文本),基于目标对象的增强文本和每个待推荐内容的增强文本,即基于针对目标对象的文本进行扩展的推理知识和针对待推荐内容的文本进行扩展的事实知识,确定向目标对象进行推荐的目标内容,从而提供更准确、更符合目标对象需求的内容推荐,提高了内容推荐的准确度。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍。
图1为本公开实施例提供的推荐系统的架构示意图;
图2为本公开实施例提供的一种推荐方法的流程示意图;
图3为本公开实施例提供的推荐的示意图;
图4为本公开实施例提供的推荐的示意图;
图5为本公开实施例提供的一种推荐方法的流程示意图;
图6为本公开实施例提供的一种推荐装置的结构示意图;
图7为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面结合本公开中的附图描述本公开的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本公开实施例的技术方案的示例性描述,对本公开实施例的技术方案不构成限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本公开实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件,但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解,当我们称一个元件被“连接”或“耦接”到另一元件时,该一个元件可以直接连接或耦接到另一元件,也可以指该一个元件和另一元件通过中间元件建立连接关系。此外,这里使用的“连接”或 “耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个,例如“A和/或B”指示实现为“A”,或者实现为“B”,或者实现为“A和B”。
可以理解的是,在本公开的具体实施方式中,涉及到推荐相关的数据,当本公开以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
本公开实施例是推荐系统提供的一种推荐方法,该推荐方法涉及人工智能、地图等领域。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
智能交通系统(Intelligent Traffic System,ITS)又称智能运输系统(Intelligent Transportation System),是将先进的科学技术(信息技术、计算机技术、数据通信技术、传感器技术、电子控制技术、自动控制理论、运筹学、人工智能等)有效地综合运用于交通运输、服务控制和车辆制造,加强车辆、道路、使用者三者之间的联系,从而形成一种保障安全、提高效率、改善环境、节约能源的综合运输系统。
为了更好的理解及说明本公开实施例的方案,下面对本公开实施例中所涉及到的一些技术用语进行简单说明。
LLM:LLM(Large Language Model,大语言模型)也称为大型语言模型,是一种人工智能模型,旨在理解和生成人类语言;LLM可以在大量的文本数据上进行训练,LLM可以执行广泛的任务,例如文本总结、翻译、情感分析等;LLM改变了各个研究领域的学习范式,并在弥合经典推荐器和开放世界知识之间的差距方面显示出巨大潜力;LLM凭借巨大的模型规模和语料库规模,表现出了卓越的能力,例如问题解决、逻辑推理、创意写作等;LLM从大量的互联网文本中学习,编码了大量的开放世界知识,即从基本的事实信息到复杂的社会规范和逻辑结构,因此,LLM可以执行与已知事实和关系相一致的基本逻辑推理。
Transformer:Transformer是一种进行特征提取和时序建模的深度学习模型。
Prompt:Prompt(提示词)是用户与大语言模型之间交互时输入的一段描述任务的文本。
特征工程:特征工程是将在线收集的原始数据转换为结构化数据的过程,这涉及到选择、操作、转换和增强数据,以便下一阶段的神经网络可以更好地处理和理解这些数据;在特征工程中,可能需要将原始数据转换为一种可以用于神经网络输入的形式,这可能涉及到将文本数据转换为数值数据,将数值数据标准化或归一化;特征工程还可能涉及到处理缺失值、异常值、重复值等问题。
特征编码:特征编码是将结构化数据转换为神经嵌入的过程,嵌入表示内容的特征,内容的特征可以用于下一阶段的评分/排名。
评分/排名:评分/排名功能是推荐系统的核心部分,评分/排名可以使用神经网络来选择最相关的内容来满足用户的需求;评分/排名可能涉及使用深度学习模型来预测用户对内容的评分或排名。
One-hot编码:One-hot编码是一种将分类特征转换为二进制向量的方法,在这种方式下,每个类别或标签都有自己的向量位,并且只有一个位是1,其他都是0。
本公开实施例提供的方案涉及推荐技术,下面以具体的实施例对本公开的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
为了更好的理解本公开实施例提供的方案,下面结合具体的一个应用场景对该方案进行说明。
在一个实施例中,图1中示出了本公开实施例所适用的一种推荐系统的架构示意图,可以理解的是,本公开实施例所提供的推荐方法可以适用于但不限于应用于如图1所示的应用场景中。
本示例中,如图1所示,该示例中的推荐系统的架构可以包括但不限于服务器10、终端20和数据库30。服务器10、终端20和数据库30之间可以通过网络40进行交互。
服务器10获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本;服务器10基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本;服务器10基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量;服务器10基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分;服务器10基于各预测评分,确定向目标对象进行推荐的目标内容,待推荐内容集合包括目标内容。服务器10将目标内容发送给终端20,终端20向目标对象展示目标内容;服务器10将目标内容存储到数据库30中。
可理解,上述仅为一种示例,本实施例在此不作限定。
其中,终端包括但不限于智能手机(如Android手机、iOS手机等)、手机模拟器、平板电脑、笔记本电脑、数字广播接收器、MID(Mobile Internet Devices,移动互联网设备)、PDA(个人数字助理)、智能语音交互设备、智能家电、车载终端等。
服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器或服务器集群。
云计算(cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。
作为云计算的基础能力提供商,会建立云计算资源池(简称云平台,一般称为IaaS(Infrastructure as a Service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作系统)、存储设备、网络设备。
按照逻辑功能划分,在IaaS(Infrastructure as a Service,基础设施即服务)层上可以部署PaaS(Platform as a Service,平台即服务)层,PaaS层之上再部署SaaS(Software as a Service,软件即服务)层,也可以直接将SaaS部署在IaaS上。PaaS为软件运行的平台,如数据库、web容器等。SaaS为各式各样的业务软件,如web门户网站、短信群发器等。一般来说,SaaS和PaaS相对于IaaS是上层。
所谓人工智能云服务,一般也被称作是AIaaS(AI as a Service,中文为“AI即服务”)。这是目前主流的一种人工智能平台的服务方式,具体来说AIaaS平台会把几类常见的AI服务进行拆分,并在云端提供独立或者打包的服务。这种服务模式类似于开了一个AI主题商城:所有的开发者都可以通过API接口的方式来接入使用平台提供的一种或者是多种人工智能服务,部分资深的开发者还可以使用平台提供的AI框架和AI基础设施来部署和运维自已专属的云人工智能服务。
上述网络可以包括但不限于:有线网络,无线网络,其中,该有线网络包括:局域网、城域网和广域网,该无线网络包括:蓝牙、Wi-Fi及其他实现无线通信的网络。具体也可基于实际应用场景需求确定,在此不作限定。
参见图2,图2示出了本公开实施例提供的一种推荐方法的流程示意图,其中,该方法可以由任一电子设备执行,如可以是服务器等;作为一可选实施方式,该方法可以由推荐系统中服务器执行,为了描述方便,在下文的一些可选实施例的描述中,将以服务器作为该方法执行主体为例进行说明。如图2所示,本公开实施例提供的推荐方法包括如下步骤:
S201,获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本。
具体地,目标对象例如用户,目标对象的文本例如推荐系统对应的业务的数据;例如,推荐系统为视频点播系统,目标对象的文本为视频点播系统对应的视频点播业务数据,视频点播业务数据例如目标对象的视频播放行为数据,即用户的视频播放行为数据。
待推荐内容集合包括多个待推荐内容,待推荐内容例如图文、图片、视频等,待推荐内容的文本例如推荐系统对应的业务的数据;例如,推荐系统为视频点播系统,待推荐内容的文本为视频点播系统对应的视频点播业务数据,视频点播业务数据例如某电影的名称。
S202,基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本。
具体地,目标对象的增强文本可以是针对目标对象的文本进行扩展的推理知识;目标对象例如用户,目标对象的增强文本例如用户偏好的推理知识,用户偏好的推理知识例如用户可能喜欢喜剧电影。
待推荐内容的增强文本可以是针对待推荐内容的文本进行扩展的事实知识;例如,待推荐内容为某电影,待推荐内容的文本为该电影的名称,待推荐内容的增强文本为该电影的剧情、该电影的相关报道、该电影的奖项、该电影的评论家评论等。
S203,基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量。
具体地,目标对象的增强文本对应的向量用于表征针对目标对象的文本进行扩展的推理知识的文本特征,目标对象的增强文本对应的向量可以是隐藏特征向量(hiddenfeature);待推荐内容的增强文本对应的向量用于表征针对待推荐内容的文本进行扩展的事实知识的文本特征,待推荐内容的增强文本对应的向量可以是隐藏特征向量。
S204,基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分。
具体地,目标对象针对每个待推荐内容的预测评分可以通过评分字符串来表征,评分字符串包括多种评分。评分字符串例如“喜欢_推荐_购买_评价”,“喜欢_推荐_购买_评价”包括四种评分,“喜欢_推荐_购买_评价”中第一个字段“喜欢”表示喜爱程度,以0~9表示喜欢程度,第二个字段“推荐”表示推荐程度,以0~9表示推荐程度,第三个字段“购买”表示是否会购买某电影的电影票,以0~9表示购买意愿,第四个字段“评价”表示对该电影的评价级别,以0~5表示评价星级,“喜欢_推荐_购买_评价”例如“9_5_1_5”,“9_5_1_5”可以表示用户对某电影的喜欢程度为9,推荐程度为5,购买意愿为1(用户喜欢,但最近未必会去电影院),评价星级为5星,即“9_5_1_5”包括四种评分,这四种评分是9、5、1和5。
S205,基于各预测评分,确定向目标对象进行推荐的目标内容,待推荐内容集合包括目标内容。
具体地,基于各预测评分中每个预测评分对应的评分字符串和每个预测评分对应的评分字符串中多种评分的预设权重,确定向目标对象进行推荐的目标内容。
本公开实施例中,获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本;基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本;基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量;基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分;基于各预测评分,确定向目标对象进行推荐的目标内容,待推荐内容集合包括目标内容;如此,由于第一大语言模型获取了大量的开放世界知识,即第一大语言模型中包括了大量的开放世界知识,第一大语言模型具备提供开放世界知识的能力,从而通过第一大语言模型进行文本扩展处理,确定目标对象(例如用户)的增强文本(目标对象的开放世界知识)和每个待推荐内容(例如电影)的增强文本(每个待推荐内容的开放世界知识),即通过第一大语言模型提取推荐系统对应的业务之外的数据(目标对象的增强文本和每个待推荐内容的增强文本),基于目标对象的增强文本和每个待推荐内容的增强文本,即基于针对目标对象的文本进行扩展的推理知识和针对待推荐内容的文本进行扩展的事实知识,确定向目标对象进行推荐的目标内容,从而提供更准确、更符合目标对象需求的内容推荐,提高了内容推荐的准确度。
在一个实施例中,基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本,包括:
基于目标对象的文本和预设的第一提示词,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本;
基于每个待推荐内容的文本和预设的第二提示词,通过第一大语言模型进行文本扩展处理,确定每个待推荐内容的增强文本。
具体地,例如,如图3所示,推荐系统的整体处理流程包括数据收集、特征工程、特征编码、评分/排名等;推荐系统可以通过在线服务中用户的反馈来收集数据,用户的反馈可以是显式反馈,显式反馈例如用户对内容的评分或评论,用户的反馈可以是隐式反馈,隐式反馈例如用户的点击信号或浏览时间;针对显式反馈,推荐系统向用户展示推荐的内容,并请求用户对推荐的内容进行评分或评论;针对隐式反馈,推荐系统通过分析用户的浏览行为和点击历史来收集数据。目标对象的文本和每个待推荐内容的文本可以是推荐系统在数据收集过程中收集的数据。
例如,目标对象的文本、预设的第一提示词、待推荐内容的文本、预设的第二提示词、目标对象的增强文本和待推荐内容的增强文本如表1所示:
表1:目标对象的文本、预设的第一提示词、待推荐内容的文本、预设的第二提示词、目标对象的增强文本和待推荐内容的增强文本
在一个实施例中,基于目标对象的文本和预设的第一提示词,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本,包括步骤A1-A2:
步骤A1,将目标对象的文本写入到预设的第一提示词中,得到更新后的第一提示词。
具体地,例如,如表1所示,预设的第一提示词包括对象描述模板、对象历史模板、第一特定场景因素模板和针对第一大语言模型的第一任务指示;其中,对象描述模板为{{user description}},对象历史模板为{{user History}},第一特定场景因素模板为{{scenario-specific factors}},针对第一大语言模型的第一任务指示包括任务描述,任务描述为:“分析用户的偏好,根据用户观看历史记录和其他相关因素的详细信息提供清晰的解释”。
目标对象的文本中目标对象描述例如表1中所示的用户描述,目标对象的文本中目标对象历史例如表1中所示的用户历史,目标对象的文本中特定场景因素例如表1中所示的特定于场景的因素。
例如,将目标对象的文本中目标对象描述、目标对象的文本中目标对象历史、目标对象的文本中特定场景因素分别写入到预设的第一提示词中对象描述模板、对象历史模板、第一特定场景因素模板,得到更新后的第一提示词。例如,将用户描述、用户历史、特定于场景的因素分别写入到对象描述模板{{user description}}、对象历史模板{{userHistory}}、第一特定场景因素模板{{scenario-specific factors}}中,得到更新后的第一提示词。用户描述用于描述用户的个人特点,用户的个人特点例如用户的性别、用户的年龄、用户的职业等;用户历史用于描述用户的观看历史,用户的观看历史例如用户已经观看了电影A;特定于场景的因素用于描述用户观看的特定内容涉及的因素,例如,用户观看的电影B涉及的类型、导演、演员、时间段、国家/地区、角色、情节/主题、情绪/基调、评论界好评/奖项等。
例如,如图4所示,在推荐系统的特征工程中,将目标对象的文本写入到预设的第一提示词中,得到更新后的第一提示词。
步骤A2,将更新后的第一提示词输入至预设的第一大语言模型,通过上下文学习,确定目标对象的增强文本;
预设的第一提示词包括对象的偏好、对象的观看历史和针对第一大语言模型的第一任务指示中至少一项,第一任务指示包括任务描述,任务描述用于指示第一大语言模型输出与任务描述对应的目标对象的增强文本。
具体地,预设的第一提示词包括对象描述模板、对象历史模板、第一特定场景因素模板、对象的偏好、对象的观看历史和针对第一大语言模型的第一任务指示中至少一项,对象描述模板用于将目标对象的文本中目标对象描述填写到对象描述模板中,对象历史模板用于将目标对象的文本中目标对象历史填写到对象历史模板中,第一特定场景因素模板用于将目标对象的文本中特定场景因素填写到第一特定场景因素模板中,第一任务指示包括任务描述,任务描述用于指示第一大语言模型输出与任务描述对应的目标对象的增强文本。
目标对象的增强文本例如表1所示,表1中所示的目标对象的增强文本是针对目标对象的文本进行扩展的推理知识。
例如,如表1所示,预设的第一提示词包括对象描述模板、对象历史模板、第一特定场景因素模板和针对第一大语言模型的第一任务指示;其中,对象描述模板为{{userdescription}},对象历史模板为{{user History}},第一特定场景因素模板为{{scenario-specific factors}},针对第一大语言模型的第一任务指示包括任务描述,任务描述为:“分析用户的偏好,根据用户观看历史记录和其他相关因素的详细信息提供清晰的解释”。
目标对象的文本中目标对象描述例如表1中所示的用户描述,目标对象的文本中目标对象历史例如表1中所示的用户历史,目标对象的文本中特定场景因素例如表1中所示的特定于场景的因素。
例如,将目标对象的文本中目标对象描述、目标对象的文本中目标对象历史、目标对象的文本中特定场景因素分别写入到预设的第一提示词中对象描述模板、对象历史模板、第一特定场景因素模板,得到更新后的第一提示词。
例如,如图4所示,在推荐系统的特征工程中,将更新后的第一提示词输入至第一大语言模型,通过上下文学习,确定目标对象的增强文本。
需要说明的是,推荐系统的特征工程为知识推理和知识生成阶段,知识推理和知识生成阶段生成开放世界知识(目标对象的增强文本和每个待推荐内容的增强文本)。
在一个实施例中,基于每个待推荐内容的文本和预设的第二提示词,通过第一大语言模型进行文本扩展处理,确定每个待推荐内容的增强文本,包括步骤B1-B2:
步骤B1,将每个待推荐内容的文本写入到预设的第二提示词中,得到更新后的第二提示词。
具体地,例如,如表1所示,预设的第二提示词包括内容描述模板、第二特定场景因素模板和针对第一大语言模型的第二任务指示;其中,内容描述模板为{{itemdescription}},第二特定场景因素模板为{{scenario-specific factors}},针对第一大语言模型的第二任务指示包括任务描述,任务描述为:“介绍电影并准确描述其属性”。
待推荐内容的文本中内容描述例如表1中所示的内容描述,待推荐内容的文本中特定场景因素例如表1中所示的特定于场景的因素。
例如,将待推荐内容的文本中内容描述、待推荐内容的文本中特定场景因素分别写入到预设的第二提示词中内容描述模板、第二特定场景因素模板,得到更新后的第二提示词。例如,将内容描述、特定于场景的因素分别写入到内容描述模板、第二特定场景因素模板中,得到更新后的第二提示词。内容描述用于描述待推荐内容的关键信息,待推荐内容的关键信息例如罗马假日;特定于场景的因素用于描述待推荐内容涉及的因素,例如待推荐内容电影C涉及的类型、导演、演员、时间段、国家/地区、角色、情节/主题、情绪/基调、好评/奖项等。
例如,如图4所示,在推荐系统的特征工程中,将待推荐内容的文本写入到预设的第二提示词中,得到更新后的第二提示词。
步骤B2,将更新后的第二提示词输入至第一大语言模型,通过上下文学习,确定每个待推荐内容的增强文本;
预设的第二提示词包括针对第一大语言模型的第二任务指示,第二任务指示包括任务描述,任务描述用于指示第一大语言模型输出与任务描述对应的每个待推荐内容的增强文本。
具体地,预设的第二提示词包括内容描述模板、第二特定场景因素模板和针对第一大语言模型的第二任务指示中至少一项,内容描述模板用于将每个待推荐内容的文本中内容描述填写到内容描述模板中,第二特定场景因素模板用于将每个待推荐内容的文本中特定场景因素填写到第二特定场景因素模板中,第二任务指示包括任务描述,任务描述用于指示第一大语言模型输出与任务描述对应的每个待推荐内容的增强文本。
待推荐内容的增强文本例如表1所示,表1中所示的待推荐内容的增强文本是针对待推荐内容的文本进行扩展的事实知识。
例如,如表1所示,预设的第二提示词包括内容描述模板、第二特定场景因素模板和针对第一大语言模型的第二任务指示;其中,内容描述模板为{{item description}},第二特定场景因素模板为{{scenario-specific factors}},针对第一大语言模型的第二任务指示包括任务描述,任务描述为:“介绍电影并准确描述其属性”。
待推荐内容的文本中内容描述例如表1中所示的内容描述,待推荐内容的文本中特定场景因素例如表1中所示的特定于场景的因素。
例如,将待推荐内容的文本中内容描述、待推荐内容的文本中特定场景因素分别写入到预设的第二提示词中内容描述模板、第二特定场景因素模板,得到更新后的第二提示词。
例如,如图4所示,在推荐系统的特征工程中,将更新后的第二提示词输入至第一大语言模型,通过上下文学习,确定待推荐内容的增强文本。
需要说明的是,推荐系统的特征工程为知识推理和知识生成阶段,知识推理和知识生成阶段生成开放世界知识(目标对象的增强文本和每个待推荐内容的增强文本)。
在一个实施例中,基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,包括步骤C1-C2:
步骤C1,基于目标对象的增强文本和每个待推荐内容的增强文本,通过预处理,确定目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵。
具体地,例如,如图4所示,在推荐系统的特征编码过程中,基于目标对象的增强文本,通过预处理,确定目标对象的初始向量矩阵。
例如,如图4所示,在推荐系统的特征编码过程中,基于每个待推荐内容的增强文本,通过预处理,确定每个待推荐内容的初始向量矩阵。
步骤C2,基于目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵,通过预设的第二大语言模型进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量。
具体地,例如,如图4所示,在推荐系统的特征编码过程中,基于目标对象的初始向量矩阵,通过第二大语言模型中embedding层和transformer层进行编码处理,确定目标对象的增强文本对应的向量。
例如,如图4所示,在推荐系统的特征编码过程中,基于待推荐内容的初始向量矩阵,通过第二大语言模型中embedding层和transformer层进行编码处理,确定待推荐内容的增强文本对应的向量。
需要说的是,推荐系统的特征编码是知识适应阶段,知识适应阶段将开放世界知识(目标对象的增强文本和每个待推荐内容的增强文本)转换为适合推荐的低维度、紧凑且相关的表示形式(目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量),从而弥合了LLM(第二大语言模型)和预测模型(如图4所示,推荐系统的评分/排名过程中的预测模型)之间的差距。
在一个实施例中,基于目标对象的增强文本和每个待推荐内容的增强文本,通过预处理,确定目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵,包括步骤D1-D2:
步骤D1,基于目标对象的增强文本和预设的文本单元集合,确定目标对象的增强文本中每个字对应的文本单元,并基于目标对象的增强文本中各字对应的文本单元,确定目标对象的初始向量矩阵,文本单元集合中文本单元通过独热编码表示。
具体地,预设的文本单元集合例如Token表,文本单元例如Token,Token通过独热编码表示,即Token通过One-hot编码表示,例如,Token表中一个Token表示为(1,0,…,0),Token表中另一个Token表示为(0,1,…,0)。
目标对象的增强文本中每个字对应至少一个Token,例如,目标对象的增强文本中包括100个字,这100个字中每个字对应2个Token,通过参照Token表,得到这100个字对应的200个Token,这200个Token中每个Token都是用one-hot编码表示,这200个Token构成一个向量矩阵,即目标对象的初始向量矩阵。
步骤D2,基于每个待推荐内容的增强文本和预设的文本单元集合,确定每个待推荐内容的增强文本中每个字对应的文本单元,并基于每个待推荐内容的增强文本中各字对应的文本单元,确定每个待推荐内容的初始向量矩阵。
具体地,每个待推荐内容的增强文本中每个字对应至少一个Token,例如,某个待推荐内容的增强文本中包括50个字,这50个字中每个字对应2个Token,通过参照Token表,得到这50个字对应的100个Token,这100个Token中每个Token都是用one-hot编码表示,这100个Token构成一个向量矩阵,即该待推荐内容的初始向量矩阵。
在一个实施例中,基于目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵,通过预设的第二大语言模型进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,包括:
将目标对象的初始向量矩阵输入至预设的第二大语言模型,通过特征嵌入处理,确定目标对象的初始向量矩阵对应的多个特征嵌入向量;
基于目标对象的初始向量矩阵对应的多个特征嵌入向量,通过拼接处理,确定目标对象的增强文本对应的向量;
将每个待推荐内容的初始向量矩阵输入至第二大语言模型,通过特征嵌入处理,确定每个待推荐内容的初始向量矩阵对应的多个特征嵌入向量;
基于每个待推荐内容的初始向量矩阵对应的多个特征嵌入向量,通过拼接处理,确定每个待推荐内容的增强文本对应的向量。
具体地,例如,如图4所示,在推荐系统的特征编码过程中,将目标对象的初始向量矩阵输入至第二大语言模型中embedding层,通过特征嵌入处理,确定目标对象的初始向量矩阵对应的多个特征嵌入向量,多个特征嵌入向量例如8个56维的特征嵌入向量;基于目标对象的初始向量矩阵对应的多个特征嵌入向量,通过第二大语言模型中transformer层的encoder(编码器)进行拼接处理,得到目标对象的增强文本对应的向量。
例如,如图4所示,在推荐系统的特征编码过程中,将某个待推荐内容的初始向量矩阵输入至第二大语言模型中embedding层,通过特征嵌入处理,确定该待推荐内容的初始向量矩阵对应的多个特征嵌入向量,多个特征嵌入向量例如8个56维的特征嵌入向量;基于该待推荐内容的初始向量矩阵对应的多个特征嵌入向量,通过第二大语言模型中transformer层的encoder(编码器)进行拼接处理,得到该待推荐内容的增强文本对应的向量。
在一个实施例中,基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分,包括:
将目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量输入至预设的预测模型,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分,针对每个待推荐内容的预测评分通过评分字符串来表征,评分字符串包括多种评分。
具体地,例如,如图4所示,在推荐系统的评分/排名过程中,将目标对象的增强文本对应的向量和某个待推荐内容的增强文本对应的向量输入至预测模型,通过匹配处理,确定目标对象针对该待推荐内容的预测评分。
预设的预测模型例如多分类网络,多分类网络例如全连接层。目标对象针对每个待推荐内容的预测评分可以通过评分字符串来表征,评分字符串包括多种评分。评分字符串例如“喜欢_推荐_购买_评价”,“喜欢_推荐_购买_评价”包括四种评分,“喜欢_推荐_购买_评价”中第一个字段“喜欢”表示喜爱程度,以0~9表示喜欢程度,第二个字段“推荐”表示推荐程度,以0~9表示推荐程度,第三个字段“购买”表示是否会购买某电影的电影票,以0~9表示购买意愿,第四个字段“评价”表示对该电影的评价级别,以0~5表示评价星级,“喜欢_推荐_购买_评价”例如“9_5_1_5”,“9_5_1_5”可以表示用户对某电影的喜欢程度为9,推荐程度为5,购买意愿为1(用户喜欢,但最近未必会去电影院),评价星级为5星,即“9_5_1_5”包括四种评分,这四种评分是9、5、1和5。
在一个实施例中,基于各预测评分,确定向目标对象进行推荐的目标内容,包括:
基于各预测评分中每个预测评分对应的评分字符串和每个预测评分对应的评分字符串中多种评分的预设权重,确定每个预测评分对应的预测总分;
将各预测总分按照从大到小进行排序,确定排序在前的N个预测总分,N为正整数;
将排序在前的N个预测总分对应的待推荐内容,确定为向目标对象进行推荐的目标内容。
具体地,目标对象例如用户,待推荐内容例如电影;例如,将用户的增强文本对应的向量和10个电影中每个电影的增强文本对应的向量分别输入至预设的预测模型,通过匹配处理,确定用户针对每个电影的预测评分;基于各预测评分中每个预测评分对应的评分字符串和每个预测评分对应的评分字符串中多种评分的预设权重,确定每个预测评分对应的预测总分,即得到10个电影对应的10个预测总分;将10个预测总分按照从大到小进行排序,确定排序在前的3个预测总分,即N=3;将排序在前的3个预测总分对应的3个电影,向用户进行推荐。
需要说明的是,推荐系统的评分/排名为知识利用阶段,在知识利用阶段,将目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量集成到预测模型中,使预测模型能够在预测推荐过程中利用业务领域知识和开放世界知识(目标对象的增强文本和每个待推荐内容的增强文本)。
在一个实施例中,在获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本之前,还包括:
获取对象样本的增强文本对应的向量和内容样本集合中每个内容样本的增强文本对应的向量;
将对象样本的增强文本对应的向量和每个内容样本的增强文本对应的向量输入至待训练的预测模型,通过匹配处理,确定对象样本针对每个内容样本的预测评分;
基于针对各内容样本的预测评分和预设的实际评分,确定分类损失函数的值;
基于分类损失函数的值,对待训练的预测模型进行更新,直至基于分类损失函数的值满足预定条件,对待训练的预测模型进行更新,得到预设的预测模型。
具体地,获取对象样本的增强文本对应的向量和内容样本集合中每个内容样本的增强文本对应的向量,包括:
获取对象样本的文本和内容样本集合中每个内容样本的文本;基于对象样本的文本,通过预设的第一大语言模型进行文本扩展处理,确定对象样本的增强文本;基于每个内容样本的文本,通过预设的第一大语言模型进行文本扩展处理,确定每个内容样本的增强文本;基于对象样本的增强文本,进行编码处理,确定对象样本的增强文本对应的向量;基于每个内容样本的增强文本,进行编码处理,确定每个内容样本的增强文本对应的向量。
例如,将对象样本的增强文本对应的向量和内容样本集合中每个内容样本的增强文本对应的向量存储在推荐系统中的数据库,在后续对待训练的预测模型进行训练时,可以调用数据库中对象样本的增强文本对应的向量和内容样本集合中每个内容样本的增强文本对应的向量。
需要说明的是,可以固定LLM(例如第二大语言模型)中transformer层的encoder的网络参数不变,单独对预测模型进行参数微调,预测模型例如多分类网络,多分类网络例如全连接层。
在一个实施例中,在获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本之前,还包括:
获取对象样本的增强文本和内容样本集合中各内容样本的增强文本;
基于对象样本的增强文本和各内容样本的增强文本,对待训练的第二大语言模型和待训练的预测模型进行训练,得到预设的第二大语言模型和预设的预测模型。
具体地,获取对象样本的增强文本和内容样本集合中各内容样本的增强文本,包括:
获取对象样本的文本和内容样本集合中每个内容样本的文本;基于对象样本的文本,通过预设的第一大语言模型进行文本扩展处理,确定对象样本的增强文本;基于每个内容样本的文本,通过预设的第一大语言模型进行文本扩展处理,确定每个内容样本的增强文本。
例如,将对象样本的增强文本和内容样本集合中各内容样本的增强文本存储在推荐系统中的数据库,在后续对待训练的第二大语言模型和待训练的预测模型进行训练时,可以调用数据库中对象样本的增强文本和内容样本集合中各内容样本的增强文本。
基于对象样本的增强文本和各内容样本的增强文本,对待训练的第二大语言模型和待训练的预测模型联合进行训练,得到预设的第二大语言模型和预设的预测模型。例如,基于对象样本的增强文本和各内容样本的增强文本,对待训练的第二大语言模型中transformer层的encoder和待训练的预测模型联合进行训练,得到预设的第二大语言模型和预设的预测模型。
需要说明的是,将待训练的第二大语言模型和待训练的预测模型联合进行训练,得到预设的第二大语言模型和预设的预测模型,从而实现了推荐效率和模型性能之间的平衡。
应用本公开实施例,至少具有如下有益效果:
由于第一大语言模型获取了大量的开放世界知识,即第一大语言模型中包括了大量的开放世界知识,第一大语言模型具备提供开放世界知识的能力,从而通过第一大语言模型进行文本扩展处理,确定目标对象(例如用户)的增强文本(目标对象的开放世界知识)和每个待推荐内容(例如电影)的增强文本(每个待推荐内容的开放世界知识),即通过第一大语言模型提取推荐系统对应的业务之外的数据(目标对象的增强文本和每个待推荐内容的增强文本),基于目标对象的增强文本和每个待推荐内容的增强文本,即基于针对目标对象的文本进行扩展的推理知识和针对待推荐内容的文本进行扩展的事实知识,确定向目标对象进行推荐的目标内容,从而提供更准确、更符合目标对象需求的内容推荐,提高了内容推荐的准确度。
为了更好的理解本公开实施例所提供的方法,下面结合具体应用场景的示例对本公开实施例的方案进行进一步说明。
在一个实施例中,例如,推荐系统包括数据采集模块、特征提取模块、模型训练模块和推荐输出模块,其中:
数据采集模块:数据采集模块负责采集content(封闭的数据集中的数据),content例如目标对象的文本、待推荐内容集合中每个待推荐内容的文本等;数据采集模块获取各种类型的数据,各种类型的数据包括用户的行为、用户的偏好、市场趋势、文化背景等;各种类型的数据可以通过爬虫技术、API(Application Programming Interface,应用程序编程接口)接口、社交媒体检测等方式获取。
特征提取模块:特征提取模块负责对采集到的数据(content)进行特征工程和特征编码,以使模型训练模块能够更好地利用这些数据进行训练。
模型训练模块:模型训练模块通过特征提取模块提取的特征,对用户的行为和用户的偏好进行建模,即生成预测模型;预测模型可以采用深度学习、机器学习等算法进行训练。
推荐输出模块:推荐输出模块通过模型训练模块生成的预测模型,对用户进行个性化的内容推荐;推荐内容可以通过网站、APP(Application,应用程序)等渠道向用户进行展示。
在一个具体应用场景实施例中,例如视频推荐场景,参见图5,示出了一种推荐方法的处理流程,如图5所示,本公开实施例提供的推荐方法的处理流程包括如下步骤:
S501,服务器获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本。
具体地,目标对象例如用户,待推荐内容例如视频。
S502,服务器基于目标对象的文本和预设的第一提示词,通过第一大语言模型进行文本扩展处理,确定目标对象的增强文本;服务器基于每个待推荐内容的文本和预设的第二提示词,通过第一大语言模型进行文本扩展处理,确定每个待推荐内容的增强文本。
具体地,将目标对象的文本写入到预设的第一提示词中,得到更新后的第一提示词;将更新后的第一提示词输入至预设的第一大语言模型,通过上下文学习,确定目标对象的增强文本。将每个待推荐内容的文本写入到预设的第二提示词中,得到更新后的第二提示词;将更新后的第二提示词输入至预设的第一大语言模型,通过上下文学习,确定每个待推荐内容的增强文本。
S503,服务器基于目标对象的增强文本和每个待推荐内容的增强文本,通过预处理,确定目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵。
具体地,例如,如图4所示,在推荐系统的特征编码过程中,基于目标对象的增强文本,通过预处理,确定目标对象的初始向量矩阵。例如,如图4所示,在推荐系统的特征编码过程中,基于每个待推荐内容的增强文本,通过预处理,确定每个待推荐内容的初始向量矩阵。
S504,服务器基于目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵,通过预设的第二大语言模型进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量。
具体地,例如,如图4所示,在推荐系统的特征编码过程中,将目标对象的初始向量矩阵输入至第二大语言模型中embedding层,通过特征嵌入处理,确定目标对象的初始向量矩阵对应的多个特征嵌入向量,多个特征嵌入向量例如8个56维的特征嵌入向量;基于目标对象的初始向量矩阵对应的多个特征嵌入向量,通过第二大语言模型中transformer层的encoder(编码器)进行拼接处理,得到目标对象的增强文本对应的向量。
例如,如图4所示,在推荐系统的特征编码过程中,将某个待推荐内容的初始向量矩阵输入至第二大语言模型中embedding层,通过特征嵌入处理,确定该待推荐内容的初始向量矩阵对应的多个特征嵌入向量,多个特征嵌入向量例如8个56维的特征嵌入向量;基于该待推荐内容的初始向量矩阵对应的多个特征嵌入向量,通过第二大语言模型中transformer层的encoder(编码器)进行拼接处理,得到该待推荐内容的增强文本对应的向量。
S505,服务器基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过预设的预测模型进行匹配处理,确定目标对象针对每个待推荐内容的预测评分。
具体地,例如,如图4所示,在推荐系统的评分/排名过程中,将目标对象的增强文本对应的向量和某个待推荐内容的增强文本对应的向量输入至预测模型,通过匹配处理,确定目标对象针对该待推荐内容的预测评分。
S506,服务器基于各预测评分中每个预测评分对应的评分字符串和每个预测评分对应的评分字符串中多种评分的预设权重,确定向目标对象进行推荐的至少一个目标内容。
具体地,基于各预测评分中每个预测评分对应的评分字符串和每个预测评分对应的评分字符串中多种评分的预设权重,确定每个预测评分对应的预测总分;将各预测总分按照从大到小进行排序,确定排序在前的N个预测总分,N为正整数;将排序在前的N个预测总分对应的待推荐内容,确定为向目标对象进行推荐的目标内容。
S507,服务器将至少一个目标内容中每个目标内容发送给终端。
具体地,一个目标内容例如某个电影。
S508,终端向目标对象展示每个目标内容。
具体地,终端可以通过网站、APP等渠道向目标对象展示每个目标内容。
应用本公开实施例,至少具有如下有益效果:
由于第一大语言模型获取了大量的开放世界知识,即第一大语言模型中包括了大量的开放世界知识,第一大语言模型具备提供开放世界知识的能力,从而通过第一大语言模型进行文本扩展处理,确定目标对象(例如用户)的增强文本(目标对象的开放世界知识)和每个待推荐内容(例如电影)的增强文本(每个待推荐内容的开放世界知识),即通过第一大语言模型提取推荐系统对应的业务之外的数据(目标对象的增强文本和每个待推荐内容的增强文本),基于目标对象的增强文本和每个待推荐内容的增强文本,即基于针对目标对象的文本进行扩展的推理知识和针对待推荐内容的文本进行扩展的事实知识,确定向目标对象进行推荐的目标内容,从而提供更准确、更符合目标对象需求的内容推荐,提高了内容推荐的准确度。
本公开实施例还提供了一种推荐装置,该推荐装置的结构示意图如图6所示,推荐装置60,包括第一处理模块601、第二处理模块602、第三处理模块603、第四处理模块604和第五处理模块605。
第一处理模块601,用于获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本;
第二处理模块602,用于基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本;
第三处理模块603,用于基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量;
第四处理模块604,用于基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分;
第五处理模块605,用于基于各预测评分,确定向目标对象进行推荐的目标内容,待推荐内容集合包括目标内容。
在一个实施例中,第二处理模块602,具体用于:
基于目标对象的文本和预设的第一提示词,进行通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本;
基于每个待推荐内容的文本和预设的第二提示词,通过第一大语言模型进行文本扩展处理,确定每个待推荐内容的增强文本。
在一个实施例中,第二处理模块602,具体用于:
将目标对象的文本写入到预设的第一提示词中,得到更新后的第一提示词;
将更新后的第一提示词输入至预设的第一大语言模型,通过上下文学习,确定目标对象的增强文本;
预设的第一提示词包括对象的偏好、对象的观看历史和针对第一大语言模型的第一任务指示中至少一项,第一任务指示包括任务描述,任务描述用于指示第一大语言模型输出与任务描述对应的目标对象的增强文本。
在一个实施例中,第二处理模块602,具体用于:
将每个待推荐内容的文本写入到预设的第二提示词中,得到更新后的第二提示词;
将更新后的第二提示词输入至第一大语言模型,通过上下文学习,确定每个待推荐内容的增强文本;
预设的第二提示词包括针对第一大语言模型的第二任务指示,第二任务指示包括任务描述,任务描述用于指示第一大语言模型输出与任务描述对应的每个待推荐内容的增强文本。
在一个实施例中,第三处理模块603,具体用于:
基于目标对象的增强文本和每个待推荐内容的增强文本,通过预处理,确定目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵;
基于目标对象的初始向量矩阵和每个待推荐内容的初始向量矩阵,通过预设的第二大语言模型进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量。
在一个实施例中,第三处理模块603,具体用于:
基于目标对象的增强文本和预设的文本单元集合,确定目标对象的增强文本中每个字对应的文本单元,并基于目标对象的增强文本中各字对应的文本单元,确定目标对象的初始向量矩阵,文本单元集合中文本单元通过独热编码表示;
基于每个待推荐内容的增强文本和预设的文本单元集合,确定每个待推荐内容的增强文本中每个字对应的文本单元,并基于每个待推荐内容的增强文本中各字对应的文本单元,确定每个待推荐内容的初始向量矩阵。
在一个实施例中,第三处理模块603,具体用于:
将目标对象的初始向量矩阵输入至预设的第二大语言模型,通过特征嵌入处理,确定目标对象的初始向量矩阵对应的多个特征嵌入向量;
基于目标对象的初始向量矩阵对应的多个特征嵌入向量,通过拼接处理,确定目标对象的增强文本对应的向量;
将每个待推荐内容的初始向量矩阵输入至第二大语言模型,通过特征嵌入处理,确定每个待推荐内容的初始向量矩阵对应的多个特征嵌入向量;
基于每个待推荐内容的初始向量矩阵对应的多个特征嵌入向量,通过拼接处理,确定每个待推荐内容的增强文本对应的向量。
在一个实施例中,第四处理模块604,具体用于:
将目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量输入至预设的预测模型,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分,针对每个待推荐内容的预测评分通过评分字符串来表征,评分字符串包括多种评分。
在一个实施例中,第五处理模块605,具体用于:
基于各预测评分中每个预测评分对应的评分字符串和每个预测评分对应的评分字符串中多种评分的预设权重,确定每个预测评分对应的预测总分;
将各预测总分按照从大到小进行排序,确定排序在前的N个预测总分,N为正整数;
将排序在前的N个预测总分对应的待推荐内容,确定为向目标对象进行推荐的目标内容。
在一个实施例中,第一处理模块601,还用于:
获取对象样本的增强文本对应的向量和内容样本集合中每个内容样本的增强文本对应的向量;
将对象样本的增强文本对应的向量和每个内容样本的增强文本对应的向量输入至待训练的预测模型,通过匹配处理,确定对象样本针对每个内容样本的预测评分;
基于针对各内容样本的预测评分和预设的实际评分,确定分类损失函数的值;
基于分类损失函数的值,对待训练的预测模型进行更新,直至基于分类损失函数的值满足预定条件,对待训练的预测模型进行更新,得到预设的预测模型。
在一个实施例中,第一处理模块601,还用于:
获取对象样本的增强文本和内容样本集合中各内容样本的增强文本;
基于对象样本的增强文本和各内容样本的增强文本,对待训练的第二大语言模型和待训练的预测模型进行训练,得到预设的第二大语言模型和预设的预测模型。
应用本公开实施例,至少具有如下有益效果:
获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本;基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本;基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量;基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分;基于各预测评分,确定向目标对象进行推荐的目标内容,待推荐内容集合包括目标内容;如此,由于第一大语言模型获取了大量的开放世界知识,即第一大语言模型中包括了大量的开放世界知识,第一大语言模型具备提供开放世界知识的能力,从而通过第一大语言模型进行文本扩展处理,确定目标对象(例如用户)的增强文本(目标对象的开放世界知识)和每个待推荐内容(例如电影)的增强文本(每个待推荐内容的开放世界知识),即通过第一大语言模型提取推荐系统对应的业务之外的数据(目标对象的增强文本和每个待推荐内容的增强文本),基于目标对象的增强文本和每个待推荐内容的增强文本,即基于针对目标对象的文本进行扩展的推理知识和针对待推荐内容的文本进行扩展的事实知识,确定向目标对象进行推荐的目标内容,从而提供更准确、更符合目标对象需求的内容推荐,提高了内容推荐的准确度。
本公开实施例还提供了一种电子设备,该电子设备的结构示意图如图7所示,图7所示的电子设备4000包括:处理器4001和存储器4003。其中,处理器4001和存储器4003相连,如通过总线4002相连。可选地,电子设备4000还可以包括收发器4004,收发器4004可以用于该电子设备与其他电子设备之间的数据交互,如数据的发送和/或数据的接收等。需要说明的是,实际应用中收发器4004不限于一个,该电子设备4000的结构并不构成对本公开实施例的限定。
处理器4001可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本公开公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器4001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线4002可包括一通路,在上述组件之间传送信息。总线4002可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器4003可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质,在此不做限定。
存储器4003用于存储执行本公开实施例的计算机程序,并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的计算机程序,以实现前述方法实施例所示的步骤。
其中,电子设备包括但不限于:服务器等。
应用本公开实施例,至少具有如下有益效果:
获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本;基于目标对象的文本和每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定目标对象的增强文本和每个待推荐内容的增强文本;基于目标对象的增强文本和每个待推荐内容的增强文本,进行编码处理,确定目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量;基于目标对象的增强文本对应的向量和每个待推荐内容的增强文本对应的向量,通过匹配处理,确定目标对象针对每个待推荐内容的预测评分;基于各预测评分,确定向目标对象进行推荐的目标内容,待推荐内容集合包括目标内容;如此,由于第一大语言模型获取了大量的开放世界知识,即第一大语言模型中包括了大量的开放世界知识,第一大语言模型具备提供开放世界知识的能力,从而通过第一大语言模型进行文本扩展处理,确定目标对象(例如用户)的增强文本(目标对象的开放世界知识)和每个待推荐内容(例如电影)的增强文本(每个待推荐内容的开放世界知识),即通过第一大语言模型提取推荐系统对应的业务之外的数据(目标对象的增强文本和每个待推荐内容的增强文本),基于目标对象的增强文本和每个待推荐内容的增强文本,即基于针对目标对象的文本进行扩展的推理知识和针对待推荐内容的文本进行扩展的事实知识,确定向目标对象进行推荐的目标内容,从而提供更准确、更符合目标对象需求的内容推荐,提高了内容推荐的准确度。
本公开实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
本公开实施例还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。
应该理解的是,虽然本公开实施例的流程图中通过箭头指示各个操作步骤,但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明,否则在本公开实施例的一些实施场景中,各流程图中的实施步骤可以按照需求以其他的顺序执行。此外,各流程图中的部分或全部步骤基于实际的实施场景,可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行,这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下,这些子步骤或者阶段的执行顺序可以根据需求灵活配置,本公开实施例对此不限制。
以上所述仅是本公开部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本公开的方案技术构思的前提下,采用基于本公开技术思想的其他类似实施手段,同样属于本公开实施例的保护范畴。
Claims (15)
1.一种推荐方法,其特征在于,包括:
获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本;
基于所述目标对象的文本和所述每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定所述目标对象的增强文本和所述每个待推荐内容的增强文本;
基于所述目标对象的增强文本和所述每个待推荐内容的增强文本,进行编码处理,确定所述目标对象的增强文本对应的向量和所述每个待推荐内容的增强文本对应的向量;
基于所述目标对象的增强文本对应的向量和所述每个待推荐内容的增强文本对应的向量,通过匹配处理,确定所述目标对象针对所述每个待推荐内容的预测评分;
基于各预测评分,确定向所述目标对象进行推荐的目标内容,所述待推荐内容集合包括所述目标内容。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标对象的文本和所述每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定所述目标对象的增强文本和所述每个待推荐内容的增强文本,包括:
基于所述目标对象的文本和预设的第一提示词,通过预设的第一大语言模型进行文本扩展处理,确定所述目标对象的增强文本;
基于所述每个待推荐内容的文本和预设的第二提示词,通过所述第一大语言模型进行文本扩展处理,确定所述每个待推荐内容的增强文本。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标对象的文本和预设的第一提示词,通过预设的第一大语言模型进行文本扩展处理,确定所述目标对象的增强文本,包括:
将所述目标对象的文本写入到预设的第一提示词中,得到更新后的第一提示词;
将所述更新后的第一提示词输入至预设的第一大语言模型,通过上下文学习,确定所述目标对象的增强文本;
所述预设的第一提示词包括对象的偏好、对象的观看历史和针对所述第一大语言模型的第一任务指示中至少一项,所述第一任务指示包括任务描述,所述任务描述用于指示所述第一大语言模型输出与所述任务描述对应的所述目标对象的增强文本。
4.根据权利要求2所述的方法,其特征在于,所述基于所述每个待推荐内容的文本和预设的第二提示词,通过所述第一大语言模型进行文本扩展处理,确定所述每个待推荐内容的增强文本,包括:
将所述每个待推荐内容的文本写入到预设的第二提示词中,得到更新后的第二提示词;
将所述更新后的第二提示词输入至所述第一大语言模型,通过上下文学习,确定所述每个待推荐内容的增强文本;
所述预设的第二提示词包括针对所述第一大语言模型的第二任务指示,所述第二任务指示包括任务描述,所述任务描述用于指示所述第一大语言模型输出与所述任务描述对应的所述每个待推荐内容的增强文本。
5.根据权利要求1所述的方法,其特征在于,所述基于所述目标对象的增强文本和所述每个待推荐内容的增强文本,进行编码处理,确定所述目标对象的增强文本对应的向量和所述每个待推荐内容的增强文本对应的向量,包括:
基于所述目标对象的增强文本和所述每个待推荐内容的增强文本,通过预处理,确定所述目标对象的初始向量矩阵和所述每个待推荐内容的初始向量矩阵;
基于所述目标对象的初始向量矩阵和所述每个待推荐内容的初始向量矩阵,通过预设的第二大语言模型进行编码处理,确定所述目标对象的增强文本对应的向量和所述每个待推荐内容的增强文本对应的向量。
6.根据权利要求5所述的方法,其特征在于,所述基于所述目标对象的增强文本和所述每个待推荐内容的增强文本,通过预处理,确定所述目标对象的初始向量矩阵和所述每个待推荐内容的初始向量矩阵,包括:
基于所述目标对象的增强文本和预设的文本单元集合,确定所述目标对象的增强文本中每个字对应的文本单元,并基于所述目标对象的增强文本中各字对应的文本单元,确定所述目标对象的初始向量矩阵,所述文本单元集合中文本单元通过独热编码表示;
基于所述每个待推荐内容的增强文本和预设的文本单元集合,确定所述每个待推荐内容的增强文本中每个字对应的文本单元,并基于所述每个待推荐内容的增强文本中各字对应的文本单元,确定所述每个待推荐内容的初始向量矩阵。
7.根据权利要求5所述的方法,其特征在于,所述基于所述目标对象的初始向量矩阵和所述每个待推荐内容的初始向量矩阵,通过预设的第二大语言模型进行编码处理,确定所述目标对象的增强文本对应的向量和所述每个待推荐内容的增强文本对应的向量,包括:
将所述目标对象的初始向量矩阵输入至预设的第二大语言模型,通过特征嵌入处理,确定所述目标对象的初始向量矩阵对应的多个特征嵌入向量;
基于所述目标对象的初始向量矩阵对应的多个特征嵌入向量,通过拼接处理,确定所述目标对象的增强文本对应的向量;
将所述每个待推荐内容的初始向量矩阵输入至所述第二大语言模型,通过特征嵌入处理,确定所述每个待推荐内容的初始向量矩阵对应的多个特征嵌入向量;
基于所述每个待推荐内容的初始向量矩阵对应的多个特征嵌入向量,通过拼接处理,确定所述每个待推荐内容的增强文本对应的向量。
8.根据权利要求1所述的方法,其特征在于,所述基于所述目标对象的增强文本对应的向量和所述每个待推荐内容的增强文本对应的向量,通过匹配处理,确定所述目标对象针对所述每个待推荐内容的预测评分,包括:
将所述目标对象的增强文本对应的向量和所述每个待推荐内容的增强文本对应的向量输入至预设的预测模型,通过匹配处理,确定所述目标对象针对所述每个待推荐内容的预测评分,所述针对所述每个待推荐内容的预测评分通过评分字符串来表征,所述评分字符串包括多种评分。
9.根据权利要求8所述的方法,其特征在于,所述基于各预测评分,确定向所述目标对象进行推荐的目标内容,包括:
基于各预测评分中每个预测评分对应的评分字符串和所述每个预测评分对应的评分字符串中多种评分的预设权重,确定所述每个预测评分对应的预测总分;
将各预测总分按照从大到小进行排序,确定排序在前的N个预测总分,所述N为正整数;
将所述排序在前的N个预测总分对应的待推荐内容,确定为向所述目标对象进行推荐的目标内容。
10.根据权利要求1所述的方法,其特征在于,在所述获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本之前,还包括:
获取对象样本的增强文本对应的向量和内容样本集合中每个内容样本的增强文本对应的向量;
将所述对象样本的增强文本对应的向量和所述每个内容样本的增强文本对应的向量输入至待训练的预测模型,通过匹配处理,确定所述对象样本针对所述每个内容样本的预测评分;
基于针对各内容样本的预测评分和预设的实际评分,确定分类损失函数的值;
基于所述分类损失函数的值,对所述待训练的预测模型进行更新,直至基于分类损失函数的值满足预定条件,对所述待训练的预测模型进行更新,得到预设的预测模型。
11.根据权利要求1所述的方法,其特征在于,在所述获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本之前,还包括:
获取对象样本的增强文本和内容样本集合中各内容样本的增强文本;
基于所述对象样本的增强文本和所述各内容样本的增强文本,对待训练的第二大语言模型和待训练的预测模型进行训练,得到预设的第二大语言模型和预设的预测模型。
12.一种推荐装置,其特征在于,包括:
第一处理模块,用于获取目标对象的文本和待推荐内容集合中每个待推荐内容的文本;
第二处理模块,用于基于所述目标对象的文本和所述每个待推荐内容的文本,通过预设的第一大语言模型进行文本扩展处理,确定所述目标对象的增强文本和所述每个待推荐内容的增强文本;
第三处理模块,用于基于所述目标对象的增强文本和所述每个待推荐内容的增强文本,进行编码处理,确定所述目标对象的增强文本对应的向量和所述每个待推荐内容的增强文本对应的向量;
第四处理模块,用于基于所述目标对象的增强文本对应的向量和所述每个待推荐内容的增强文本对应的向量,通过匹配处理,确定所述目标对象针对所述每个待推荐内容的预测评分;
第五处理模块,用于基于各预测评分,确定向所述目标对象进行推荐的目标内容,所述待推荐内容集合包括所述目标内容。
13.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-11中任一项所述方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-11中任一项所述方法的步骤。
15.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-11中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410484576.3A CN118094016A (zh) | 2024-04-22 | 2024-04-22 | 推荐方法、装置、设备、计算机可读存储介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410484576.3A CN118094016A (zh) | 2024-04-22 | 2024-04-22 | 推荐方法、装置、设备、计算机可读存储介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118094016A true CN118094016A (zh) | 2024-05-28 |
Family
ID=91142332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410484576.3A Pending CN118094016A (zh) | 2024-04-22 | 2024-04-22 | 推荐方法、装置、设备、计算机可读存储介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118094016A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116108162A (zh) * | 2023-03-02 | 2023-05-12 | 广东工业大学 | 一种基于语义增强的复杂文本推荐方法及系统 |
CN117033799A (zh) * | 2023-09-21 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 资源推荐方法、装置、计算机设备及存储介质 |
CN117390290A (zh) * | 2023-12-08 | 2024-01-12 | 安徽省立医院(中国科学技术大学附属第一医院) | 一种基于内容增强的语言模型学习动态用户兴趣的方法 |
CN117764669A (zh) * | 2023-12-12 | 2024-03-26 | 中国银联股份有限公司 | 物品推荐方法、装置、设备、介质及产品 |
-
2024
- 2024-04-22 CN CN202410484576.3A patent/CN118094016A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116108162A (zh) * | 2023-03-02 | 2023-05-12 | 广东工业大学 | 一种基于语义增强的复杂文本推荐方法及系统 |
CN117033799A (zh) * | 2023-09-21 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 资源推荐方法、装置、计算机设备及存储介质 |
CN117390290A (zh) * | 2023-12-08 | 2024-01-12 | 安徽省立医院(中国科学技术大学附属第一医院) | 一种基于内容增强的语言模型学习动态用户兴趣的方法 |
CN117764669A (zh) * | 2023-12-12 | 2024-03-26 | 中国银联股份有限公司 | 物品推荐方法、装置、设备、介质及产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111708950B (zh) | 内容推荐方法、装置及电子设备 | |
CN111966914B (zh) | 基于人工智能的内容推荐方法、装置和计算机设备 | |
CN110727868B (zh) | 对象推荐方法、装置和计算机可读存储介质 | |
CN112035743B (zh) | 数据推荐方法、装置、计算机设备以及存储介质 | |
CN111737582B (zh) | 一种内容推荐方法及装置 | |
CN113254785B (zh) | 推荐模型训练方法、推荐方法和相关设备 | |
CN113688313A (zh) | 一种预测模型的训练方法、信息推送的方法及装置 | |
CN113569129A (zh) | 点击率预测模型处理方法、内容推荐方法、装置及设备 | |
CN112102015B (zh) | 物品推荐方法、元网络处理方法、装置、存储介质和设备 | |
CN113836390B (zh) | 资源推荐方法、装置、计算机设备及存储介质 | |
CN116756281A (zh) | 知识问答方法、装置、设备和介质 | |
CN116956183A (zh) | 多媒体资源推荐方法、模型训练方法、装置及存储介质 | |
CN118094016A (zh) | 推荐方法、装置、设备、计算机可读存储介质及程序产品 | |
CN115329183A (zh) | 数据处理方法、装置、存储介质及设备 | |
CN113076453A (zh) | 域名分类方法、设备及计算机可读存储介质 | |
Yepes et al. | Listen to this: Music recommendation based on one-class support vector machine | |
CN117786234B (zh) | 一种基于两阶段对比学习的多模态资源推荐方法 | |
CN110442767A (zh) | 一种确定内容互动平台标签的方法、装置及可读存储介质 | |
CN116628236B (zh) | 多媒体信息的投放方法、装置、电子设备及存储介质 | |
CN116028617B (zh) | 资讯推荐方法、装置、设备、可读存储介质及程序产品 | |
CN114417944B (zh) | 识别模型训练方法及装置、用户异常行为识别方法及装置 | |
CN117332759A (zh) | 网页处理方法、装置、设备、存储介质及程序产品 | |
CN115858931A (zh) | 内容推荐方法、模型的训练方法及电子设备 | |
Rajarajeswari et al. | Multimodal Recommendation Engine for Advertising Using Object Detection and Natural Language Processing | |
CN116977759A (zh) | 一种模型训练方法、装置、设备、介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |