CN116955835B - 资源筛选方法、装置、计算机设备及存储介质 - Google Patents
资源筛选方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN116955835B CN116955835B CN202311220326.0A CN202311220326A CN116955835B CN 116955835 B CN116955835 B CN 116955835B CN 202311220326 A CN202311220326 A CN 202311220326A CN 116955835 B CN116955835 B CN 116955835B
- Authority
- CN
- China
- Prior art keywords
- information
- resource
- resources
- interest
- description information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012216 screening Methods 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000006399 behavior Effects 0.000 claims abstract description 189
- 230000002452 interceptive effect Effects 0.000 claims abstract description 42
- 230000003993 interaction Effects 0.000 claims description 28
- 230000015654 memory Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 17
- 230000003321 amplification Effects 0.000 claims description 10
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 11
- 230000002093 peripheral effect Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 7
- 239000000516 sunscreening agent Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 210000003127 knee Anatomy 0.000 description 3
- 230000001681 protective effect Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000000475 sunscreen effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 241000282842 Lama glama Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000037072 sun protection Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种资源筛选方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取对象的历史行为信息及模型指示信息,基于历史行为信息,生成提示信息,提示信息指示对象执行过交互行为的资源;通过大语言模型,基于模型指示信息及提示信息,生成兴趣描述信息;基于兴趣描述信息及多个资源的信息,从多个资源中筛选出第一资源,第一资源的信息与兴趣描述信息之间的相似度大于第二资源的信息与兴趣描述信息之间的相似度,第二资源为多个资源中除第一资源以外的资源。本申请实现了一种基于大语言模型的资源筛选方式,保证筛选出的资源与对象的兴趣相匹配,保证了筛选出的资源的准确性。
Description
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种资源筛选方法、装置、计算机设备及存储介质。
背景技术
随着互联网技术的发展,花联网中的资源越来越丰富多样。为了使得用户能够对感兴趣的资源执行交互行为,通常会为用户推荐用户感兴趣的资源。但是,在为用户推荐资源之前,需要筛选出用户感兴趣的资源,目前的资源筛选方法的准确性差。
发明内容
本申请实施例提供了一种资源筛选方法、装置、计算机设备及存储介质,能够提高筛选出的资源的准确性。所述技术方案包括如下方面。
一方面,提供了一种资源筛选方法,所述方法包括:
获取对象的历史行为信息及模型指示信息,所述历史行为信息指示所述对象对资源执行过交互行为,所述模型指示信息指示大语言模型基于输入信息生成用于描述对象兴趣的信息;
基于所述历史行为信息,生成提示信息,所述提示信息指示所述对象执行过交互行为的资源;
通过所述大语言模型,基于所述模型指示信息及所述提示信息,生成兴趣描述信息,所述兴趣描述信息用于描述所述对象感兴趣的资源;
基于所述兴趣描述信息及多个资源的信息,从所述多个资源中筛选出第一资源,所述第一资源的信息与所述兴趣描述信息之间的相似度大于第二资源的信息与所述兴趣描述信息之间的相似度,所述第二资源为所述多个资源中除所述第一资源以外的资源。
另一方面,提供了一种资源筛选装置,所述装置包括:
获取模块,用于获取对象的历史行为信息及模型指示信息,所述历史行为信息指示所述对象对资源执行过交互行为,所述模型指示信息指示大语言模型基于输入信息生成用于描述对象兴趣的信息;
生成模块,用于基于所述历史行为信息,生成提示信息,所述提示信息指示所述对象执行过交互行为的资源;
所述生成模块,还用于通过所述大语言模型,基于所述模型指示信息及所述提示信息,生成兴趣描述信息,所述兴趣描述信息用于描述所述对象感兴趣的资源;
筛选模块,用于基于所述兴趣描述信息及多个资源的信息,从所述多个资源中筛选出第一资源,所述第一资源的信息与所述兴趣描述信息之间的相似度大于第二资源的信息与所述兴趣描述信息之间的相似度,所述第二资源为所述多个资源中除所述第一资源以外的资源。
在一种可能实现方式中,所述筛选模块,用于确定每个资源的信息与所述兴趣描述信息之间的相似度;基于放大系数,对第三资源对应的相似度进行放大,所述第三资源为所述多个资源中推荐次数小于次数阈值的资源;基于所述第三资源放大后的相似度及第四资源对应的相似度,从所述多个资源中筛选出所述第一资源,所述第四资源为所述多个资源中除所述第三资源以外的资源。
在另一种可能实现方式中,所述筛选模块,用于通过所述大语言模型,分别对所述每个资源的信息及所述兴趣描述信息进行特征提取,得到所述每个资源的特征及兴趣特征;基于所述每个资源的特征及所述兴趣特征,确定所述每个资源的信息与所述兴趣描述信息之间的相似度。
在另一种可能实现方式中,所述装置还包括:
确定模块,用于在第三资源的信息与所述兴趣描述信息之间的相似度大于相似度阈值的情况下,将所述第三资源确定为所述第一资源,所述第三资源为所述多个资源中推荐次数小于次数阈值的资源。
在另一种可能实现方式中,所述模型指示信息还指示所述兴趣描述信息的格式;所述生成模块,用于通过所述大语言模型,基于所述模型指示信息及所述提示信息,生成属于所述格式的兴趣描述信息。
在另一种可能实现方式中,所述生成模块,用于基于所述对象的多条历史行为信息的生成时间,从所述多条历史行为信息中确定第一行为信息,所述第一行为信息的生成时间晚于第二行为信息的生成时间,所述第二行为信息为所述多条历史行为信息中除所述第一行为信息以外的历史行为信息;从所述第一行为信息中,提取所述对象执行过交互行为的资源;基于提取到的资源生成所述提示信息。
在另一种可能实现方式中,所述生成模块,用于获取提示信息模板,所述提示信息模板包括资源填充位置及关系描述信息,所述关系描述信息用于描述所述资源填充位置中的资源与所述对象之间的关系;将所述提取到的资源添加在所述资源填充位置中,得到所述提示信息。
在另一种可能实现方式中,所述兴趣描述信息用于描述所述对象感兴趣的资源类型及在所述资源类型下感兴趣的资源;或者,所述兴趣描述信息用于描述所述对象下一次可能执行交互行为的资源及所述资源所属的类型。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如上述方面所述的资源筛选方法所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如上述方面所述的资源筛选方法所执行的操作。
再一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述方面所述的资源筛选方法所执行的操作。
在本申请实施例中,由于对象的历史行为信息指示对象执行过交互行为的资源,能够反映出对象的兴趣,且大语言模型自身的泛化能力和推理能力,因此,基于模型指示信息,以指示大语言模型结合历史行为信息,生成用于描述对象的喜好的自然语言描述,以此作为对象的兴趣表示,结合资源的信息,筛选出对象感兴趣的资源,实现了一种基于大语言模型的资源筛选方式,保证筛选出的资源与对象的兴趣相匹配,保证了筛选出的资源的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的结构示意图;
图2是本申请实施例提供的一种资源筛选方法的流程图;
图3是本申请实施例提供的另一种资源筛选方法的流程图;
图4是本申请实施例提供的一种资源筛选装置的结构示意图;
图5是本申请实施例提供的另一种资源筛选装置的结构示意图;
图6是本申请实施例提供的一种终端的结构示意图;
图7是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请所使用的术语“第一”、“第二”、“第三”、“第四”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,可以将第一资源称为第二资源,且类似地,可将第二资源称为第一资源。
本申请所使用的术语“至少一个”、“多个”、“每个”、“任一”,至少一个包括一个、两个或两个以上,多个包括两个或两个以上,而每个是指对应的多个中的每一个,任一是指多个中的任意一个。举例来说,多个资源包括3个资源,而每个是指这3个资源中的每一个资源,任一是指这3个资源中的任意一个,能够是第一个资源,或者,是第二个资源,或者,是第三个资源。
需要说明的是,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本申请中涉及到的对象的历史行为信息及模型指示信息都是在充分授权的情况下获取的。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理涉及自然语言,即人们日常使用的语言,与语言学研究密切;同时涉及计算机科学和数学等人工智能领域模型训练的重要技术,预训练模型(Pre-trainedModels,PTM),即是从NLP领域的大语言模型(Large Language Model)发展而来。预训练模型,也称基石模型、大模型,指具有大参量的深度神经网络(Deep neural network,DNN),在海量未标记的数据上对其进行训练,利用大参量DNN的函数近似能力使PTM在数据上提取共性特征,经微调(Fine Tune)、参数高效微调(PEFT)、Prompt-Tuning(提示调优)等技术,适用于下游任务。因此,预训练模型能够在小样本(Few-shot)或零样本(Zero-shot)场景下达到理想效果。PTM按照处理的数据模态分为语言模型、视觉模型、语音模型、多模态模型等。例如,语言模型为ELMO(Embeddings from Language Model,一种语言模型),BERT(Bidirectional Encoder Representations from Transformers,一个双向预训练语言模型),GPT(Generative Pre-trained Transformer,预训练生成式模型)等。其中,多模态模型指建立两种或以上数据模态特征表示的模型。预训练模型是输出人工智能生成内容(Artificial Intelligence Generated Content,AIGC)重要工具,也可以作为连接多个具体任务模型的通用接口。经过微调,大语言模型能够广泛应用于下游任务。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。预训练模型是深度学习的最新发展成果,融合了以上技术。
本申请实施例提供的方案,基于人工智能的机器学习技术,能够训练大语言模型,进而利用训练后的大语言模型,实现了资源筛选方法。
本申请实施例提供的资源筛选方法,能够由计算机设备执行。可选地,该计算机设备为终端或服务器。可选地,该服务器是独立的物理服务器,或者,是多个物理服务器构成的服务器集群或者分布式系统,或者,是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,该终端是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电及车载终端等,但并不局限于此。
在一些实施例中,本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备能够组成区块链系统。
在一些实施例中,计算机设备提供为服务器。图1是本申请实施例提供的一种实施环境的示意图。参见图1,该实施环境包括终端101和服务器102。终端101和服务器102之间通过无线或者有线网络连接。终端101用于展示资源,服务器102用于提供资源推荐服务,能够通过大语言模型,为终端101推荐资源,以使终端101所属的对象能够查看推荐的资源。
在一种可能实现方式中,终端101上安装由服务器102提供服务的应用,终端101能够通过该应用实现例如资源查看、资源分享等功能。可选地,应用为终端101操作系统中的应用,或者为第三方提供的应用。例如,应用为内容分享应用,该内容分享应用具有内容分享的功能,当然,该内容分享应用还能够具有其他功能,例如,点评功能、购物功能、导航功能、游戏功能等。
终端101用于基于对象标识登录应用,通过应用查看应用中的资源,服务器102用于通过大语言模型,为终端101推荐对象标识指代的对象感兴趣的资源,由终端101展示推荐的资源供对象查看。
图2是本申请实施例提供的一种资源筛选方法的流程图,由计算机设备执行,如图2所示,该方法包括以下步骤。
201、计算机设备获取对象的历史行为信息及模型指示信息,历史行为信息指示对象对资源执行过交互行为,模型指示信息指示大语言模型基于输入信息生成用于描述对象兴趣的信息。
在本申请实施例中,由于对象的历史行为信息指示了对象执行过交互行为的资源,进而能够反映出对象的兴趣,通过大语言模型自身的泛化能力和推理能力,能够结合历史行为信息,生成用于描述对象喜好的自然语言描述,以此作为对象的兴趣表示,结合资源的信息,能够筛选出对象感兴趣的资源。
其中,大语言模型(Large Language Models,LLM)本身蕴含了丰富的知识信息,具有泛化能力和推理能力。例如,大语言模型为LLaMA(Large Language Model Meta AI,一种开源的大模型)、ChatGLM(Chat General Language Model,聊天通用语言模型)等开源的大模型。通过大语言模型,能够以输入信息为依据,生成一个与输入信息相关的信息。例如,大语言模型的输入信息“生成一个关于风景推荐的描述”,则通过大语言模型,以该输入信息为依据,生成一个关于风景推荐的文本信息。对象为任意的对象,例如,对象为用户。历史行为信息指示了对象在对哪个资源执行过交互行为,历史行为信息指示的交互行为能够是任意类型的行为,例如,历史行为信息指示的交互行为正向行为,如点击、点赞、收藏、分享等行为。资源为任意的资源,例如,资源为物品链接、多媒体资源或其他资源等。
模型指示信息相当于大语言模型的任务指示信息,以指示大语言模型执行怎样的任务,也即是,指示大语言模型基于输入信息执行怎样的处理,生成一个怎样的信息。例如,模型指示信息为“你是一个个性化的推荐系统,我将告诉你用户之前点击过的物品列表。你从用户之前的历史行为中挖掘他的兴趣偏好,并写一段语言描述用户偏好”。历史行为信息、模型指示信息及兴趣描述信息均能够以任意的形式表示,例如,历史行为信息、模型指示信息及兴趣描述信息均以文本的形式表示,则模型指示信息指示大语言模型生成一个用于描述对象的兴趣的文本信息。
202、计算机设备基于历史行为信息,生成提示信息,提示信息指示对象执行过交互行为的资源。
在本申请实施例中,由于历史行为信息指示了对象在对哪个资源执行过交互行为,因此,基于对象的历史行为信息,能够获取对象在历史期间对哪些资源执行过交互行为,进而生成一个提示信息,以指示出对象执行过交互行为的资源。
例如,提示信息为“以下是对象近期的点击过的商品:羽毛球拍、运动裤、户外防晒霜”。
203、计算机设备通过大语言模型,基于模型指示信息及提示信息,生成兴趣描述信息,兴趣描述信息用于描述对象感兴趣的资源。
在本申请实施例中,大语言模型具有泛化能力和推理能力,通过大语言模型,按照模型指示信息所指示的处理方式,结合提示信息中对象执行过交互行为的资源,推测出对象感兴趣的资源,得到该兴趣描述信息。
其中,兴趣描述信息能够是任意形式的信息,例如,兴趣描述信息是以自然语言描述表示的文本信息。例如,兴趣描述信息为“根据对象最近点击的商品,对象的购物兴趣偏好可能是与运动、户外活动、个人护理和保护身体相关的商品,例如健身器材、运动服装、户外装备、防晒霜、护肤品、防护手套、护膝、护肘等。此外,对象可能还会对其他运动项目和运动装备感兴趣,例如篮球、足球、网球等”。
204、计算机设备基于兴趣描述信息及多个资源的信息,从多个资源中筛选出第一资源,第一资源的信息与兴趣描述信息之间的相似度大于第二资源的信息与兴趣描述信息之间的相似度,第二资源为多个资源中除第一资源以外的资源。
在本申请实施例中,兴趣描述信息用于描述对象感兴趣的资源,能够表示对象的兴趣爱好,而资源的信息用于表征资源,因此,通过对比兴趣描述信息及资源的信息,能够确定出兴趣描述信息与每个资源的信息之间的相似度,相似度能够体现出对象对资源是否感兴趣,进而从多个资源中筛选出相似度较大的第一资源,也即是,筛选出对象感兴趣的资源,以保证筛选出的资源的准确性。
其中,资源的信息能够是任意形式的信息,例如,资源的信息是文本信息或其他类型的信息。例如,资源的信息包括资源的标题、类别、资源的简介信息等。
在本申请实施例中,由于对象的历史行为信息指示对象执行过交互行为的资源,能够反映出对象的兴趣,且大语言模型自身的泛化能力和推理能力,因此,基于模型指示信息,以指示大语言模型结合历史行为信息,生成用于描述对象的喜好的自然语言描述,以此作为对象的兴趣表示,结合资源的信息,筛选出对象感兴趣的资源,实现了一种基于大语言模型的资源筛选方式,保证筛选出的资源与对象的兴趣相匹配,保证了筛选出的资源的准确性。
在图2所示实施例的基础上,本申请实施例还能够结合多条历史行为信息来生成提示信息,并采取相似度计算的方式筛选出第一资源,并向对象推荐第一资源,具体过程详见下述实施例。
图3是本申请实施例提供的另一种资源筛选方法的流程图,由计算机设备执行,如图3所示,该方法包括以下步骤。
301、计算机设备获取对象的多条历史行为信息及模型指示信息,历史行为信息指示对象对资源执行过交互行为,模型指示信息指示大语言模型基于输入信息生成用于描述对象兴趣的信息。
在本申请实施例中,不同的历史行为信息的生成时间不同,生成时间相当于对象对资源执行交互行为的时间。
在一种可能实现方式中,历史行为信息包括对象标识、资源标识及生成时间,对象标识指示执行交互行为的对象。
其中,对象标识指示对象,资源标识指示对象已执行过交互行为的资源。资源标识是用于表示资源的唯一标识,具备唯一性和稳定性。资源标识是由一个数字或者字符串进行表示。基于资源标识能够确定所指示的资源,也能够在资源库中查询资源标识指示的资源。可选地,历史行为信息还包括操作标识,该操作标识指示对象对资源执行的交互行为。
在一种可能实现方式中,模型指示信息还指示了输入信息的类型。
在本申请实施例中,输入信息的类型能够反映出输入信息是怎样的信息,在模型指示信息中指示输入信息的类型,以便大语言模型能够按照与模型指示信息所指示的类型匹配的处理方式,对输入信息进行处理,进而生成用于描述对象兴趣的信息,以保证后续生成的信息的准确性。
在一种可能实现方式中,获取的模型指示信息与推荐领域匹配。
其中,推荐领域是指资源的类别,不同推荐领域下的资源不同。例如,推荐领域包括电影领域、音乐领域、图书领域、新闻领域等。
在本申请实施例中,大语言模型能够应用于多种推荐领域,每种推荐领域对应有一种模型指示信息,在任一推荐领域下,获取与推荐领域匹配的模型指示信息,以保证后续大语言模型能够输出与该推荐领域相关的信息,这样,能够保证大语言模型能够适用于多种推荐场景,无需再为每种推荐领域部署一种大语言模型,保证了大语言模型的适用性,且节省部署大语言模型的成本。
可选地,获取模型指示信息的方式,包括:响应于资源推荐指令,获取与当前的推荐领域匹配的模型指示信息。
其中,资源推荐指令指示向对象推荐资源,该资源推荐指令是由对象主动触发或者,响应于对象的资源获取指令触发。
302、计算机设备基于对象的多条历史行为信息的生成时间,从多条历史行为信息中确定第一行为信息,第一行为信息的生成时间晚于第二行为信息的生成时间,第二行为信息为多条历史行为信息中除第一行为信息以外的历史行为信息。
在本申请实施例中,历史行为信息具有生成时间,生成时间相当于对象对资源执行交互行为的时间,生成时间越晚,则对应的历史行为信息越能够体现出对象的兴趣喜好,因此,从对象的多条历史行为信息中,选取生成时间较晚的历史行为信息,以便后续能够基于生成时间较晚的历史行为信息来确定出用户的兴趣描述。
在一种可能实现方式中,该步骤302包括:基于对象的多条历史行为信息的生成时间,从多条历史行为信息中确定第一数量的第一行为信息;或者,将生成时间与当前时间之间的间隔时长小于目标时长的历史行为信息确定为第一行为信息。
其中,第一数量为任意的数量,目标时长为任意的时长。
303、计算机设备从第一行为信息中,提取对象执行过交互行为的资源。
在本申请实施例中,每条历史行为信息记录了对象执行过互动行为的资源,因此,在从多条历史行为信息中确定出第一行为信息的情况下,能够从每条第一行为信息中提取对象执行过交互行为的资源。
在一种可能实现方式中,历史行为信息还包括操作标识,则该步骤303包括:在确定出多条第一行为信息的情况下,基于第一行为信息包含的操作标识,从多条第一行为信息中筛选包含目标操作标识的第一行为信息,从包含目标操作标识的第一行为信息中,提取对象执行过交互行为的资源。
其中,目标操作标识指示正向交互行为,正向交互行为是指对资源具有积极作用的交互行为,例如,正向交互行为包括点击、点赞、收藏、分享等交互行为。
304、计算机设备基于提取到的资源生成提示信息,提示信息指示对象执行过交互行为的资源。
在本申请实施例中,在提取到对象在历史期间执行过交互行为的资源的情况下,将这些资源汇总成提示信息,以指示出对象在历史期间执行过交互行为的资源。在本申请实施例中,由于对象的历史行为信息相对稀疏,因此,通过对象的历史行为信息,构造出提示信息,以便后续大语言模型能够基于提示信息生成兴趣描述信息。在本申请实施例中,历史行为信息的生成时间越晚,则历史行为信息越能够反映出对象的兴趣,因此,按照历史行为信息的生成时间,利用生成时间较晚的历史行为信息来生成提示信息,以保证提示信息能够反映出对象近期执行过交互行为的资源,以保证提示信息的准确性,以便后续大语言模型基于提示信息生成兴趣描述信息时,能够考虑到对象近期的兴趣变化,保证生成的兴趣描述信息的准确性。
在一种可能实现方式中,该步骤304包括:获取提示信息模板,提示信息模板包括资源填充位置及关系描述信息,关系描述信息用于描述资源填充位置中的资源与对象之间的关系;将提取到的资源添加在资源填充位置中,得到提示信息。
在本申请实施例中,提示信息模板用于生成提示信息,为了便于生成提示信息,预置了提示信息模板,仅在提示信息模板包含的资源填充位置中填充资源,即可生成提示信息,以保证生成提示信息的便捷性,且能够保证生成的提示信息能够使得大语言模型容易理解,保证提示信息的准确性。
例如,关系描述信息为“以下是用户近期点击过的商品”,或者,“以下是用户近期购买过的商品”。
在一种可能实现方式中,提示信息模板包括第一信息模板或第二信息模板,第一信息模板包括资源填充位置及第一关系描述信息,第一关系描述信息用于描述资源填充位置中的资源与对象之间的关系;第二信息模板包括第一填充位置、第二填充位置、第一关系描述信息及第二关系描述信息,第一填充位置用于填充对象执行过交互行为的资源,第二填充位置用于填充对象最近一次执行过交互行为的资源,第一关系描述信息用于描述第一填充位置中的资源与对象之间的关系,第二关系描述信息用于描述第二填充位置中的资源与对象之间的关系。
其中,对象最近一次执行过交互行为的资源,也即是,对象的多条历史行为信息中,生成时间与当前时间最近的历史行为信息中的资源。
可选地,生成提示信息的过程包括:在提示信息模板为第一信息模板的情况下,将提取到的资源添加在资源填充位置中,得到提示信息;在提示信息模板为第二信息模板的情况下,将提取到的资源添加在第一填充位置中,将提取到的资源中对象最近一次执行过交互行为的资源,添加在第二填充位置中,得到提示信息。
在本申请实施例中,基于第一信息模板生成的提示信息,仅能够反映出对象在历史期间执行过交互行为的资源。而基于第二信息模板生成的提示信息,不仅能反映出对象在历史期间执行过交互行为的资源,也能够突出对象近期执行过交互行为的资源,以便后续大语言模型基于提示信息生成兴趣描述信息时,能够考虑到对象近期的兴趣变化,保证生成的兴趣描述信息的准确性。
例如,在提示信息模板为第一信息模板的情况下,第一关系描述信息为“以下是用户近期的点击过的商品”,则生成的提示信息为“以下是用户近期的点击过的商品:羽毛球拍、运动裤、户外防晒霜”。
例如,在提示信息模板为第二信息模板的情况下,第一关系描述信息为“以下是用户近期的点击过的商品”,第二关系描述信息为“用户最近一个时刻点击的商品是”,则生成的提示信息为“以下是用户近期的点击过的商品:羽毛球拍,运动裤,户外防晒霜。用户最近一个时刻点击的商品是户外防晒霜”。
需要说明的是,本申请实施例是基于从多条历史行为信息中筛选出的第一行为信息,生成提示信息,而在另一实施例中,无需执行上述步骤302-步骤304,而是采取其他方式,基于历史行为信息,生成提示信息。
305、计算机设备通过大语言模型,基于模型指示信息及提示信息,生成兴趣描述信息,兴趣描述信息用于描述对象感兴趣的资源。
在一种可能实现方式中,兴趣描述信息用于描述对象感兴趣的资源类型及在资源类型下感兴趣的资源;或者,兴趣描述信息用于描述对象下一次可能执行交互行为的资源及资源所属的类型。
其中,资源类型能够为任意的资源类型,例如,资源类型为运动类型、户外类型、运动装备类型等。
在本申请实施例中,由于资源类型下具有多种资源,兴趣描述信息不仅描述出对象对哪个资源类型感兴趣,也描述出对象对资源类型下哪个资源感兴趣,以保证兴趣描述信息的准确性。在兴趣描述信息描述对象下一次可能执行交互行为的资源及资源所属的类型的情况下,反映出基于对象的历史行为信息,预测出对象之后可能会对哪个资源执行操作,以反映出对象之后会对哪个资源感兴趣,以保证兴趣描述信息的准确性。
在一种可能实现方式中,模型指示信息还指示兴趣描述信息的格式;该步骤305包括:通过大语言模型,基于模型指示信息及提示信息,生成属于格式的兴趣描述信息。
在本申请实施例中,模型指示信息指示了生成的兴趣描述信息的格式,以便通过大语言模型生成属于该格式的兴趣描述信息,以保证生成的兴趣描述信息能够准确描述对象的兴趣,进而保证兴趣描述信息的准确性。
例如,模型指示信息指示兴趣描述信息为文本信息,且兴趣描述信息包含的字数;则通过大语言模型生成的兴趣描述信息为包含该字数的文本信息。
在一种可能实现方式中,提示信息基于第一信息模板或第二信息模板生成,在提示信息基于第一信息模板或第二信息模板生成的情况下,生成的兴趣描述信息不同。在本申请实施例中,在提示信息基于第一信息模板生成的情况下,大语言模型推理得到的兴趣描述信息中,没有对对象的兴趣进行特意区分,该兴趣描述信息关注于对象稳定的长期兴趣。在提示信息基于第二信息模板生成的情况下,大语言模型推理得到的兴趣描述信息中,更加明显地关注对象短期兴趣偏好,同时也能够兼顾到对象稳定的长期兴趣。
例如,在提示信息基于第一信息模板生成的情况下,大语言模型推理得到的兴趣描述信息为“根据用户最近点击的商品,可以预测下一时刻用户的购物兴趣偏好可能是与运动、户外活动、个人护理和保护身体相关的商品,例如健身器材、运动服装、户外装备、防晒霜、护肤品、防护手套、护膝、护肘等。此外,用户可能还会对其他运动项目和运动装备感兴趣,例如篮球、足球、网球等”。
例如,在提示信息基于第二信息模板生成的情况下,大语言模型推理得到的兴趣描述信息为“根据用户之前的行为,可以看出他对运动和户外活动比较感兴趣,同时也注重个人护理和保护身体。根据用户最近一个时刻点击的商品是户外防晒霜,可以推断出下一时刻用户的购物兴趣可能会延续到个人护理和保护身体的领域。用户可能会对其他与个人护理和保护身体相关的商品感兴趣,例如护肤品、防晒喷雾、防晒帽、防晒衣等。此外,由于他之前点击了羽毛球拍和运动裤,他可能还会对其他运动项目和运动装备感兴趣,例如其他运动器材、运动鞋、运动配件等”。
基于上述两个举例中的兴趣描述信息,兴趣描述信息中蕴含“健身器材、运动服装、户外装备、防晒霜、护肤品、防护手套、护膝、护肘、篮球、足球、网球”等商品名称的词汇以及“运动、户外活动、个人护理”等商品类别的词汇,可见,基于大语言模块生成的兴趣描述信息能够表征出对象的偏好,兴趣描述信息已经包含了丰富的对象兴趣特征以及潜在的资源相关信息,因此,兴趣描述信息能够表征对象的兴趣。
在一种可能实现方式中,该步骤305包括:通过大语言模型,对模型指示信息及提示信息进行特征提取,得到模型指示信息的特征及提示信息的特征,基于模型指示信息的特征及提示信息的特征,生成兴趣描述信息。
在本申请实施例中,大语言模型采取特征提取的方式,分别提取模型指示信息及提示信息的特征,以便利用模型指示信息的特征及提示信息的特征,生成准确的兴趣描述信息。
可选地,生成兴趣描述信息的过程包括:对模型指示信息的特征及提示信息的特征进行拼接,基于拼接得到的特征,生成兴趣描述信息。
在本申请实施例中,通过将模型指示信息的特征及提示信息的特征进行拼接,以保证模型指示信息的特征及提示信息的特征能够充分融合,以便大语言模型基于拼接得到的特征,能够获知结合提示信息应该去怎样处理,进而生成兴趣描述信息,以保证兴趣描述信息的准确性。
306、计算机设备确定每个资源的信息与兴趣描述信息之间的相似度。
在本申请实施例中,资源的信息与兴趣描述信息之间的相似度,表示资源与对象具有更高的相关度,也能够反映出对象对该资源感兴趣的程度,相似度越大,表示对象对资源越感兴趣,相似度越小,表示对象对资源越不感兴趣。
在一种可能实现方式中,该步骤306包括:通过大语言模型,分别对每个资源的信息及兴趣描述信息进行特征提取,得到每个资源的特征及兴趣特征;基于每个资源的特征及兴趣特征,确定每个资源的信息与兴趣描述信息之间的相似度。
在本申请实施例中,由于大语言模型本身蕴含丰富知识信息,具有泛化能力和推理能力,因此,通过大语言模型来提取资源的信息及兴趣描述信息的特征,能够保证提取到的特征的质量,以保证提取到的特征的准确性,进而保证确定出的相似度的准确性。
其中,兴趣特征即为兴趣描述信息对应的特征。基于特征确定资源的信息与兴趣描述信息之间的相似度,能够采取余弦相似度或其他方式确定。
例如,通过大语言模型,对每个资源的信息进行编码,得到每个资源的特征,特征用于语义表示向量来表示,每个资源的特征表示为向量,向量/>,其中,/>用于表示特征空间,/>用于表示资源的序号,/>用于表示向量/>的维度,即每个资源的特征是一个/>的向量。
可选地,基于每个资源的特征及兴趣特征确定相似度的方式,满足以下关系:
其中表示第/>个资源语义表示向量/>的转置,/>用于表示兴趣特征,/>用于表示第/>个资源的信息与兴趣描述信息之间的相似度。
需要说明的是,本申请实施例是在确定资源的信息与兴趣描述信息之间的相似度的过程中,获取资源的特征,而在另一实施例中,还能够在步骤301之前,通过大语言模型,对每个资源的信息进行特征提取,得到每个资源的特征。
在一种可能实现方式中,在得到每个资源的特征的情况下,在特征库中存储多个资源的特征。在本申请实施例中,通过预先生成多个资源的特征,并将多个资源的特征存储在特征库中,以便后续为对象推荐资源时,能够利用特征库中资源的特征,结合兴趣描述信息,从多个资源中筛选出对象感兴趣的资源,进而为对象推荐感兴趣的资源。
其中,特征库为任意形式的数据库,例如,特征库为Faiss(一款开源的高性能相似度搜索库),Faiss具备大规模的向量检索和聚类的功能,用于解决高维向量的相似度搜索问题,能够应用在多种领域,例如,应用在图像、音频、文本等领域。
可选地,将资源的特征与资源标识对应存储在特征库中。在本申请实施例中,将资源的特征与资源标识对应存储在特征库中,也即是建立了资源的特征与资源标识之间的索引,后续基于特征库中的索引,能够确定出每个资源的特征所表征的资源。
可选地,在多个资源的特征存储在特征库中的情况下,从特种库中提取对多个资源的特征,结合兴趣特征,确定出每个资源的信息与兴趣信息之间的相似度,以便后续能基于相似度筛选资源。
307、计算机设备基于每个资源的信息与兴趣描述信息之间的相似度,从多个资源中筛选出第一资源,第一资源的信息与兴趣描述信息之间的相似度大于第二资源的信息与兴趣描述信息之间的相似度,第二资源为多个资源中除第一资源以外的资源。
在本申请实施例中,基于每个资源的信息与兴趣描述信息之间的相似度,能够从多个资源中选择相似度足够大的资源作为第一资源,第一资源相当于对象感兴趣的资源。
在一种可能实现方式中,该步骤307包括:基于每个资源的信息与兴趣描述信息之间的相似度,对多个资源进行排序,从排序后的多个资源中选择前n个资源作为第一资源。
其中,n为正整数。多个资源是按照相似度由大到小的顺序。在本申请实施例中,采取按照相似度由大到小的顺序排序,进而筛选第一资源,以保证筛选出的第一资源对应的相似度大于未被筛选的资源对应的相似度,以保证筛选出的第一资源为对象感兴趣的资源,保证筛选出的资源的准确性。
308、计算机设备在第三资源的信息与兴趣描述信息之间的相似度大于相似度阈值的情况下,将第三资源确定为第一资源,第三资源为多个资源中推荐次数小于次数阈值的资源。
在本申请实施例中,对于多个资源中推荐次数小于次数阈值的资源,该资源为新资源,也即是,第三资源为多个资源的新资源。在新资源的信息与兴趣描述信息之间的相似度足够大时,表示新资源满足筛选条件,也表示用户对该新资源感兴趣。其中,相似度阈值为任意的数值,相似度阈值由开发人员在推荐系统中设定。在本申请实施例中,在新资源的信息与兴趣描述信息之间的相似度足够大的情况下,将新资源作为对象感兴趣的资源,实现新资源的冷启动,以保证后续能够实现新资源的准确推荐,进而保证推荐的准确性。
在本申请实施例中,仅对推荐次数小于次数阈值的资源采取上述方式进行筛选,而一旦某个资源的推荐次数达到次数阈值,则对于该资源按照上述步骤307进行筛选,不再按照上述步骤308进行筛选。
在一种可能实现方式中,本次仅从多个资源中筛选出第二数量的资源,因此,筛选过程包括:在第三资源的信息与兴趣描述信息之间的相似度大于相似度阈值的情况下,将第三资源确定为第一资源,确定第三数量,第三数量为当前确定的第一资源的数量,确定第二数量与第三数量的差值,按照上述步骤307,基于每个资源的信息与兴趣描述信息之间的相似度,从其余的资源中筛选出该差值的第一资源。
其中,第二数量为任意的数量,第三数量为任意的数量。
在本申请实施例中,在每次仅筛选一定数量的资源的情况下,只要任一新资源满足筛选条件,则将满足筛选条件的新资源作为筛选出的第一资源,并按照相似度大小,从其余的资源中筛选出相似度最大的资源作为第一资源,保证筛选出第一数量的第一资源,这样,不仅保证筛选出的第一资源的数量等于第一数量,保证筛选出的第一资源为对象感兴趣的资源,并且,也能够保证筛选出的第一资源包含新资源,后续为对象推荐第一资源时,能够实现新资源的冷启动。
309、计算机设备向对象推荐第一资源。
在本申请实施例中,筛选出的第一资源均为对象感兴趣的资源,因此,向对象推荐第一资源,以保证资源推荐的准确性。
在本申请实施例中,向对象推荐的第一资源的信息与兴趣描述信息之间的相似度足够大,不仅能够保证为对象推荐的资源符合对象的兴趣,而且,对于新资源,由于缺乏足够的历史数据和用户反馈,无法进行准确的推荐,而本申请实施例提供的方法,在新资源的信息与兴趣描述信息之间的相似度足够大的情况下,能够将新资源作为对象感兴趣的资源,能够实现新资源的准确推荐,实现新资源的冷启动,保证推荐的准确性。
在本申请实施例中,由于对象的历史行为信息指示对象执行过交互行为的资源,能够反映出对象的兴趣,且大语言模型自身的泛化能力和推理能力,因此,基于模型指示信息,以指示大语言模型结合历史行为信息,生成用于描述对象的喜好的自然语言描述,以此作为对象的兴趣表示,结合资源的信息,筛选出对象感兴趣的资源,实现了一种基于大语言模型的资源筛选方式,这种筛选方式能够适用于多种场景,保证筛选出的资源与对象的兴趣相匹配,保证了筛选出的资源的准确性。
并且,向对象推荐的第一资源的信息与兴趣描述信息之间的相似度足够大,不仅能够保证为对象推荐的资源符合对象的兴趣,对于新资源,由于缺乏足够的历史数据和用户反馈,无法进行准确的推荐,而本申请实施例提供的方法,能够实现新资源的准确推荐,实现新资源的冷启动,保证推荐的准确性。
本申请实施例提供的方案,能够应用于多种中小场景下,由于中小场景下对象的历史行为数据少,无法利用对象的历史行为数据训练出针对中小场景的推荐模型,但是大语言模型本身蕴含丰富知识信息,大语言模型具有泛化能力和推理能力,因此,基于大语言模型搭建具有普适性的推荐系统,利用大语言模型在小数据集上的泛化能力和丰富的语义知识信息,减少了对行为序列的交互信息的依赖,使得其能够实现在中小场景下资源少、对象的历史行为数据稀疏的资源冷启动,有效提高在冷启动场景中的用户体验效果。
在上述图3所示的实施例的基础上,通过大语言模型,预先获取每个资源的特征,预先在特征库中存储多个资源的特征及对应的资源标识,以预先建立资源的特征与资源标识之间的索引。若有新资源添加在推荐系统中,按照上述步骤306,基于大语言模型,对新资源的信息进行特征提取,得到新资源的特征,将新资源的特征及新资源的资源标识对应存储至特征库中,以更新索引。为对象推荐资源时,先按照上述步骤301-步骤305,生成兴趣描述信息;再按照上述步骤306,基于大语言模型,对兴趣描述信息进行特征提取,得到兴趣特征;进而按照上述步骤307,确定特征库中资源的特征与兴趣特征之间的相似度,筛选出相似度最大的前n个资源的特征,基于特征库中的索引,确定筛选出的特征对应的资源标识,将筛选出的资源标识所指示的资源,确定为第一资源;对于新资源,按照上述步骤308,从新资源中筛选出第一资源,进而按照上述步骤309,为对象推荐第一资源,以实现新资源的冷启动。另外,一旦某个新资源的推荐次数达到次数阈值,则对于此新资源按照上述步骤307进行筛选,不再按照上述步骤308进行筛选。
需要说明的是,上述图3所示的实施例是利用相似度阈值从第二资源中筛选第一资源,而在另一实施例中,无需执行上述步骤306-步骤308,而是采取其他方式,基于兴趣描述信息及多个资源的信息,从多个资源中筛选出第一资源。在一种可能实现方式中,筛选第一资源的过程包括以下步骤1-步骤3。
步骤1、确定每个资源的信息与兴趣描述信息之间的相似度。
步骤2、基于放大系数,对第三资源对应的相似度进行放大,第三资源为多个资源中推荐次数小于次数阈值的资源。
其中,放大系数用于放大第三资源的相似度,放大系数为任意的系数,例如,放大系数为大于1的数值。第三资源对应的相似度即为第三资源的信息与兴趣描述信息之间的相似度。
在一种可能实现方式中,对第三资源对应的相似度进行放大的过程包括:将第三资源对应的相似度与放大系数的乘积,作为第三资源放大后的相似度。
步骤3、基于第三资源放大后的相似度及第四资源对应的相似度,从多个资源中筛选出第一资源,第四资源为多个资源中除第三资源以外的资源,第一资源的信息与兴趣描述信息之间的相似度大于第二资源的信息与兴趣描述信息之间的相似度,第二资源为多个资源中除第一资源以外的资源。
在本申请实施例中,在确定每个资源的信息与兴趣描述信息之间的相似度的情况下,对新资源对应的相似度进行放大,进而基于新资源放大后的相似度即其他资源对应的相似度,按照相似度的大小,从多个资源中筛选出对象感兴趣的资源,实现了一种资源的冷启动方式,在按照用户感兴趣程度进行资源推荐的基础上,优先将新资源的相似度进行放大,以尽可能实现资源的冷启动的同时,也保证筛选出的资源为对象感兴趣的资源,以保证后续推荐的准确性。
图4是本申请实施例提供的一种资源筛选装置的结构示意图,如图4所示,该装置包括:
获取模块401,用于获取对象的历史行为信息及模型指示信息,历史行为信息指示对象对资源执行过交互行为,模型指示信息指示大语言模型基于输入信息生成用于描述对象兴趣的信息;
生成模块402,用于基于历史行为信息,生成提示信息,提示信息指示对象执行过交互行为的资源;
生成模块402,还用于通过大语言模型,基于模型指示信息及提示信息,生成兴趣描述信息,兴趣描述信息用于描述对象感兴趣的资源;
筛选模块403,用于基于兴趣描述信息及多个资源的信息,从多个资源中筛选出第一资源,第一资源的信息与兴趣描述信息之间的相似度大于第二资源的信息与兴趣描述信息之间的相似度,第二资源为多个资源中除第一资源以外的资源。
在一种可能实现方式中,筛选模块403,用于确定每个资源的信息与兴趣描述信息之间的相似度;基于放大系数,对第三资源对应的相似度进行放大,第三资源为多个资源中推荐次数小于次数阈值的资源;基于第三资源放大后的相似度及第四资源对应的相似度,从多个资源中筛选出第一资源,第四资源为多个资源中除第三资源以外的资源。
在另一种可能实现方式中,筛选模块403,用于通过大语言模型,分别对每个资源的信息及兴趣描述信息进行特征提取,得到每个资源的特征及兴趣特征;基于每个资源的特征及兴趣特征,确定每个资源的信息与兴趣描述信息之间的相似度。
在另一种可能实现方式中,如图5所示,装置还包括:
确定模块404,用于在第三资源的信息与兴趣描述信息之间的相似度大于相似度阈值的情况下,将第三资源确定为第一资源,第三资源为多个资源中推荐次数小于次数阈值的资源。
在另一种可能实现方式中,模型指示信息还指示兴趣描述信息的格式;生成模块402,用于通过大语言模型,基于模型指示信息及提示信息,生成属于格式的兴趣描述信息。
在另一种可能实现方式中,生成模块402,用于基于对象的多条历史行为信息的生成时间,从多条历史行为信息中确定第一行为信息,第一行为信息的生成时间晚于第二行为信息的生成时间,第二行为信息为多条历史行为信息中除第一行为信息以外的历史行为信息;从第一行为信息中,提取对象执行过交互行为的资源;基于提取到的资源生成提示信息。
在另一种可能实现方式中,生成模块402,用于获取提示信息模板,提示信息模板包括资源填充位置及关系描述信息,关系描述信息用于描述资源填充位置中的资源与对象之间的关系;将提取到的资源添加在资源填充位置中,得到提示信息。
在另一种可能实现方式中,兴趣描述信息用于描述对象感兴趣的资源类型及在资源类型下感兴趣的资源;或者,兴趣描述信息用于描述对象下一次可能执行交互行为的资源及资源所属的类型。
需要说明的是:上述实施例提供的资源筛选装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的资源筛选装置与资源筛选方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述实施例的资源筛选方法所执行的操作。
可选地,计算机设备提供为终端。图6示出了本申请一个示例性实施例提供的终端600的结构框图。终端600包括有:处理器601和存储器602。
处理器601可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器601可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器601可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器601还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器602可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器602中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器601所执行以实现本申请中方法实施例提供的资源筛选方法。
在一些实施例中,终端600还可选包括有:外围设备接口603和至少一个外围设备。处理器601、存储器602和外围设备接口603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口603相连。具体地,外围设备包括:射频电路604、显示屏605、摄像头组件606、音频电路607和电源608中的至少一种。
外围设备接口603可被用于将I/O(Input /Output,输入/输出)相关的至少一个外围设备连接到处理器601和存储器602。在一些实施例中,处理器601、存储器602和外围设备接口603被集成在同一芯片或电路板上;在一些其他实施例中,处理器601、存储器602和外围设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路604用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路604包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路604还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏605用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏605是触摸显示屏时,显示屏605还具有采集在显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。此时,显示屏605还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏605可以为一个,设置在终端600的前面板;在另一些实施例中,显示屏605可以为至少两个,分别设置在终端600的不同表面或呈折叠设计;在另一些实施例中,显示屏605可以是柔性显示屏,设置在终端600的弯曲表面上或折叠面上。甚至,显示屏605还可以设置成非矩形的不规则图形,也即异形屏。显示屏605可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件606用于采集图像或视频。可选地,摄像头组件606包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器601进行处理,或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路607还可以包括耳机插孔。
电源608用于为终端600中的各个组件进行供电。电源608可以是交流电、直流电、一次性电池或可充电电池。当电源608包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
本领域技术人员可以理解,图6中示出的结构并不构成对终端600的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
可选地,计算机设备提供为服务器。图7是本申请实施例提供的一种服务器的结构示意图,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central Processing Units,CPU)701和一个或一个以上的存储器702,其中,存储器702中存储有至少一条计算机程序,至少一条计算机程序由处理器701加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述实施例的资源筛选方法所执行的操作。
本申请实施例还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述实施例的资源筛选方法所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请实施例的可选实施例,并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (14)
1.一种资源筛选方法,其特征在于,所述方法包括:
获取对象的多条历史行为信息及模型指示信息,所述历史行为信息指示所述对象对资源执行过交互行为,所述模型指示信息指示大语言模型基于输入信息生成用于描述所述对象兴趣的信息;
基于所述对象的多条历史行为信息的生成时间,从所述多条历史行为信息中确定第一行为信息,所述第一行为信息的生成时间晚于第二行为信息的生成时间,所述第二行为信息为所述多条历史行为信息中除所述第一行为信息以外的历史行为信息;
在确定出多条第一行为信息的情况下,基于所述第一行为信息包含的操作标识,从所多条第一行为信息中筛选包含目标操作标识的第一行为信息,从包含所述目标操作标识的第一行为信息中,提取所述对象执行过交互行为的资源,所述目标操作标识指示正向交互行为;
获取第二信息模板,所述第二信息模板包括第一填充位置、第二填充位置、第一关系描述信息及第二关系描述信息,所述第一填充位置用于填充对象执行过交互行为的资源,所述第二填充位置用于填充对象最近一次执行过交互行为的资源,所述第一关系描述信息用于描述所述第一填充位置中的资源与对象之间的关系,所述第二关系描述信息用于描述所述第二填充位置中的资源与对象之间的关系;
将所述提取到的资源添加在所述第一填充位置中,将提取到的资源中所述对象最近一次执行过交互行为的资源,添加在所述第二填充位置中,得到提示信息;
通过所述大语言模型,基于所述模型指示信息及所述提示信息,生成兴趣描述信息,所述兴趣描述信息用于描述所述对象下一次可能执行交互行为的资源及所述资源所属的类型;
基于所述兴趣描述信息及多个资源的信息,从所述多个资源中筛选出第一资源,所述第一资源的信息与所述兴趣描述信息之间的相似度大于第二资源的信息与所述兴趣描述信息之间的相似度,所述第二资源为所述多个资源中除所述第一资源以外的资源。
2.根据权利要求1所述的方法,其特征在于,所述基于所述兴趣描述信息及多个资源的信息,从所述多个资源中筛选出第一资源,包括:
确定每个资源的信息与所述兴趣描述信息之间的相似度;
基于放大系数,对第三资源对应的相似度进行放大,所述第三资源为所述多个资源中推荐次数小于次数阈值的资源;
基于所述第三资源放大后的相似度及第四资源对应的相似度,从所述多个资源中筛选出所述第一资源,所述第四资源为所述多个资源中除所述第三资源以外的资源。
3.根据权利要求2所述的方法,其特征在于,所述确定每个资源的信息与所述兴趣描述信息之间的相似度,包括:
通过所述大语言模型,分别对所述每个资源的信息及所述兴趣描述信息进行特征提取,得到所述每个资源的特征及兴趣特征;
基于所述每个资源的特征及所述兴趣特征,确定所述每个资源的信息与所述兴趣描述信息之间的相似度。
4.根据权利要求1所述的方法,其特征在于,所述基于所述兴趣描述信息及多个资源的信息,从所述多个资源中筛选出第一资源之后,所述方法还包括:
在第三资源的信息与所述兴趣描述信息之间的相似度大于相似度阈值的情况下,将所述第三资源确定为所述第一资源,所述第三资源为所述多个资源中推荐次数小于次数阈值的资源。
5.根据权利要求1所述的方法,其特征在于,所述模型指示信息还指示所述兴趣描述信息的格式;所述通过所述大语言模型,基于所述模型指示信息及所述提示信息,生成兴趣描述信息,包括:
通过所述大语言模型,基于所述模型指示信息及所述提示信息,生成属于所述格式的兴趣描述信息。
6.根据权利要求1所述的方法,其特征在于,所述兴趣描述信息用于描述所述对象感兴趣的资源类型及在所述资源类型下感兴趣的资源。
7.一种资源筛选装置,其特征在于,所述装置包括:
获取模块,用于获取对象的多条历史行为信息及模型指示信息,所述历史行为信息指示所述对象对资源执行过交互行为,所述模型指示信息指示大语言模型基于输入信息生成用于描述所述对象兴趣的信息;
生成模块,用于基于所述对象的多条历史行为信息的生成时间,从所述多条历史行为信息中确定第一行为信息,所述第一行为信息的生成时间晚于第二行为信息的生成时间,所述第二行为信息为所述多条历史行为信息中除所述第一行为信息以外的历史行为信息;在确定出多条第一行为信息的情况下,基于所述第一行为信息包含的操作标识,从所多条第一行为信息中筛选包含目标操作标识的第一行为信息,从包含所述目标操作标识的第一行为信息中,提取所述对象执行过交互行为的资源,所述目标操作标识指示正向交互行为;获取第二信息模板,所述第二信息模板包括第一填充位置、第二填充位置、第一关系描述信息及第二关系描述信息,所述第一填充位置用于填充对象执行过交互行为的资源,所述第二填充位置用于填充对象最近一次执行过交互行为的资源,所述第一关系描述信息用于描述所述第一填充位置中的资源与对象之间的关系,所述第二关系描述信息用于描述所述第二填充位置中的资源与对象之间的关系;将所述提取到的资源添加在所述第一填充位置中,将提取到的资源中所述对象最近一次执行过交互行为的资源,添加在所述第二填充位置中,得到提示信息;
所述生成模块,还用于通过所述大语言模型,基于所述模型指示信息及所述提示信息,生成兴趣描述信息,所述兴趣描述信息用于描述所述对象下一次可能执行交互行为的资源及所述资源所属的类型;
筛选模块,用于基于所述兴趣描述信息及多个资源的信息,从所述多个资源中筛选出第一资源,所述第一资源的信息与所述兴趣描述信息之间的相似度大于第二资源的信息与所述兴趣描述信息之间的相似度,所述第二资源为所述多个资源中除所述第一资源以外的资源。
8.根据权利要求7所述的装置,其特征在于,所述筛选模块,用于确定每个资源的信息与所述兴趣描述信息之间的相似度;基于放大系数,对第三资源对应的相似度进行放大,所述第三资源为所述多个资源中推荐次数小于次数阈值的资源;基于所述第三资源放大后的相似度及第四资源对应的相似度,从所述多个资源中筛选出所述第一资源,所述第四资源为所述多个资源中除所述第三资源以外的资源。
9.根据权利要求8所述的装置,其特征在于,所述筛选模块,用于通过所述大语言模型,分别对所述每个资源的信息及所述兴趣描述信息进行特征提取,得到所述每个资源的特征及兴趣特征;基于所述每个资源的特征及所述兴趣特征,确定所述每个资源的信息与所述兴趣描述信息之间的相似度。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
确定模块,用于在第三资源的信息与所述兴趣描述信息之间的相似度大于相似度阈值的情况下,将所述第三资源确定为所述第一资源,所述第三资源为所述多个资源中推荐次数小于次数阈值的资源。
11.根据权利要求7所述的装置,其特征在于,所述模型指示信息还指示所述兴趣描述信息的格式;所述生成模块,用于通过所述大语言模型,基于所述模型指示信息及所述提示信息,生成属于所述格式的兴趣描述信息。
12.根据权利要求7所述的装置,其特征在于,所述兴趣描述信息用于描述所述对象感兴趣的资源类型及在所述资源类型下感兴趣的资源。
13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如权利要求1至6任一权利要求所述的资源筛选方法所执行的操作。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至6任一权利要求所述的资源筛选方法所执行的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311220326.0A CN116955835B (zh) | 2023-09-21 | 2023-09-21 | 资源筛选方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311220326.0A CN116955835B (zh) | 2023-09-21 | 2023-09-21 | 资源筛选方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116955835A CN116955835A (zh) | 2023-10-27 |
CN116955835B true CN116955835B (zh) | 2023-12-22 |
Family
ID=88458739
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311220326.0A Active CN116955835B (zh) | 2023-09-21 | 2023-09-21 | 资源筛选方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116955835B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108269307A (zh) * | 2018-01-15 | 2018-07-10 | 歌尔科技有限公司 | 一种增强现实交互方法及设备 |
CN113157951A (zh) * | 2021-03-26 | 2021-07-23 | 北京达佳互联信息技术有限公司 | 一种多媒体资源的处理方法、装置、服务器及存储介质 |
WO2023065859A1 (zh) * | 2021-10-20 | 2023-04-27 | 华为技术有限公司 | 物品推荐方法、装置及存储介质 |
CN116483980A (zh) * | 2023-05-30 | 2023-07-25 | 科大讯飞股份有限公司 | 人机交互方法、装置及系统 |
CN116484085A (zh) * | 2022-01-12 | 2023-07-25 | 腾讯科技(深圳)有限公司 | 一种信息投放方法、装置、设备及存储介质、程序产品 |
CN116738060A (zh) * | 2023-07-03 | 2023-09-12 | 陈利人 | 内容生成方法、装置及电子设备 |
-
2023
- 2023-09-21 CN CN202311220326.0A patent/CN116955835B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108269307A (zh) * | 2018-01-15 | 2018-07-10 | 歌尔科技有限公司 | 一种增强现实交互方法及设备 |
CN113157951A (zh) * | 2021-03-26 | 2021-07-23 | 北京达佳互联信息技术有限公司 | 一种多媒体资源的处理方法、装置、服务器及存储介质 |
WO2023065859A1 (zh) * | 2021-10-20 | 2023-04-27 | 华为技术有限公司 | 物品推荐方法、装置及存储介质 |
CN116484085A (zh) * | 2022-01-12 | 2023-07-25 | 腾讯科技(深圳)有限公司 | 一种信息投放方法、装置、设备及存储介质、程序产品 |
CN116483980A (zh) * | 2023-05-30 | 2023-07-25 | 科大讯飞股份有限公司 | 人机交互方法、装置及系统 |
CN116738060A (zh) * | 2023-07-03 | 2023-09-12 | 陈利人 | 内容生成方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116955835A (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108874967B (zh) | 对话状态确定方法及装置、对话系统、终端、存储介质 | |
CN109918669B (zh) | 实体确定方法、装置及存储介质 | |
CN108304441A (zh) | 网络资源推荐方法、装置、电子设备、服务器及存储介质 | |
CN113515942A (zh) | 文本处理方法、装置、计算机设备及存储介质 | |
CN115858826A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN111611490A (zh) | 资源搜索方法、装置、设备及存储介质 | |
CN117033799B (zh) | 资源推荐方法、装置、计算机设备及存储介质 | |
CN111428522B (zh) | 翻译语料生成方法、装置、计算机设备及存储介质 | |
CN113254684A (zh) | 一种内容时效的确定方法、相关装置、设备以及存储介质 | |
CN110555102A (zh) | 媒体标题识别方法、装置及存储介质 | |
CN111314771B (zh) | 一种视频播放方法及相关设备 | |
CN118035945B (zh) | 一种标签识别模型的处理方法和相关装置 | |
CN111553163A (zh) | 文本相关度的确定方法、装置、存储介质及电子设备 | |
WO2024183434A1 (zh) | 基于文本生成图片的方法及模型训练方法、装置、设备及存储介质 | |
CN110929137B (zh) | 文章推荐方法、装置、设备及存储介质 | |
CN114328815A (zh) | 文本映射模型的处理方法、装置、计算机设备及存储介质 | |
CN113822084A (zh) | 语句翻译方法、装置、计算机设备及存储介质 | |
CN117273019A (zh) | 对话模型的训练方法、对话生成方法、装置和设备 | |
CN115168568B (zh) | 一种数据内容的识别方法、装置以及存储介质 | |
CN116955835B (zh) | 资源筛选方法、装置、计算机设备及存储介质 | |
CN113486260B (zh) | 互动信息的生成方法、装置、计算机设备及存储介质 | |
CN112988984B (zh) | 特征获取方法、装置、计算机设备及存储介质 | |
CN112070586B (zh) | 基于语义识别的物品推荐方法、装置、计算机设备及介质 | |
CN111597823B (zh) | 中心词提取方法、装置、设备及存储介质 | |
CN111428523B (zh) | 翻译语料生成方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40098993 Country of ref document: HK |