CN116150502A - 信息推荐方法、装置、设备及介质 - Google Patents
信息推荐方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116150502A CN116150502A CN202310267433.2A CN202310267433A CN116150502A CN 116150502 A CN116150502 A CN 116150502A CN 202310267433 A CN202310267433 A CN 202310267433A CN 116150502 A CN116150502 A CN 116150502A
- Authority
- CN
- China
- Prior art keywords
- queue
- target
- recommended
- information
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开公开了信息推荐方法、装置、设备及介质,涉及人工智能领域和机器学习领域。解决了在相关技术中,没有充分考虑不同位置间得分的复杂非线性关系,且基于单一广告位得分预估,无法充分捕捉不同广告位间的复杂非线性关系的技术问题,具体实现方案为:响应于针对目标对象的信息推荐请求,得到多个待推荐信息;基于所述多个待推荐信息,生成多个待推荐队列,其中每个所述待推荐队列至少包含两个所述待推荐信息;利用队列价值预估模型,从多个所述待推荐队列中确定目标推荐队列,所述队列价值预估模型用于确定价值最高的待推荐队列;在所述目标对象对应的页面展示所述目标推荐队列。
Description
技术领域
本公开涉及人工智能领域和机器学习领域,具体涉及一种信息推荐方法、装置、设备及介质。
背景技术
在线的信息检索系统广泛应用于互联网广告位分配,比如搜索信息、信息流广告等。该系统的核心功能是,从海量广告库中,选取合适的信息,然后填充到信息位资源中,从而连接信息服务和用户需求,创造社会价值。
然而在相关技术中,没有充分考虑不同位置间得分的复杂非线性关系,且基于单一广告位得分预估,无法充分捕捉不同广告位间的复杂非线性关系。
发明内容
本公开提供了一种信息推荐方法、装置、设备及介质。
根据本公开的第一方面,提供了一种信息推荐方法,包括:
响应于针对目标对象的信息推荐请求,得到多个待推荐信息;
基于多个待推荐信息,生成多个待推荐队列,其中每个待推荐队列至少包含两个待推荐信息;
利用队列价值预估模型,从多个待推荐队列中确定目标推荐队列,队列价值预估模型用于确定价值最高的待推荐队列;
在目标对象对应的页面展示目标推荐队列。
在一种可能的实施方式中,本公开提供的方法中,利用队列价值预估模型,从多个待推荐队列中确定目标推荐队列,包括:
解析多个待推荐队列,得到每个待推荐队列对应的输入特征;
将每个待推荐队列对应的输入特征输入到队列价值预估模型,确定输出价值最高的待推荐队列为目标推荐队列。
在一种可能的实施方式中,本公开提供的方法中,队列价值预估模型通过如下方法进行训练:
获取用于训练的多个目标队列,其中每个目标队列至少包含两个带标注信息的待推荐信息;
将多个目标队列输入到初始队列价值预估模型中,得到每个目标队列对应的结果;
基于每个目标队列中待推荐信息的标注信息和每个目标队列对应结果的差异训练生成队列价值预估模型。
在一种可能的实施方式中,本公开提供的方法中,将多个目标队列输入到初始队列价值预估模型中,得到每个目标队列对应的结果,包括:
解析多个目标队列,得到每个目标队列对应的输入特征;
将每个目标队列对应的输入特征输入到初始队列价值预估模型中,得到每个目标队列对应的结果。
在一种可能的实施方式中,本公开提供的方法中,每个目标队列对应的输入特征包括每个目标队列对应的用户侧特征、信息侧特征和出价特征;则将每个目标队列对应的输入特征输入到初始队列价值预估模型中,得到每个目标队列对应的结果,包括:
将每个目标队列对应的用户侧特征和信息侧特征输入到初始队列价值预估模型的隐藏层,得到第一结果;
将每个目标队列对应的出价特征输入到初始队列价值预估模型的约束网络层,得到第二结果;
基于第一结果和第二结果,得到每个目标队列对应的结果。
在一种可能的实施方式中,本公开提供的方法中,基于第一结果和第二结果,得到每个目标队列对应的结果,包括:
将第一结果和第二结果输入到缩放网络中,得到每个目标队列对应的结果。
根据本公开的第二方面,提供了一种信息推荐装置,包括:
获取单元,用于响应于针对目标对象的信息推荐请求,得到多个待推荐信息;
生成单元,用于基于多个待推荐信息,生成多个待推荐队列,其中每个待推荐队列至少包含两个待推荐信息;
处理单元,用于利用队列价值预估模型,从多个待推荐队列中确定目标推荐队列,队列价值预估模型用于确定价值最高的待推荐队列;
展示单元,用于在目标对象对应的页面展示目标推荐队列。
在一种可能的实施方式中,本公开提供的装置中,处理单元具体用于:
解析多个待推荐队列,得到每个待推荐队列对应的输入特征;
将每个待推荐队列对应的输入特征输入到队列价值预估模型,确定输出价值最高的待推荐队列为目标推荐队列。
在一种可能的实施方式中,本公开提供的装置中,处理单元通过如下方法进行训练队列价值预估模型:
获取用于训练的多个目标队列,其中每个目标队列至少包含两个带标注信息的待推荐信息;
将多个目标队列输入到初始队列价值预估模型中,得到每个目标队列对应的结果;
基于每个目标队列中待推荐信息的标注信息和每个目标队列对应结果的差异训练生成队列价值预估模型。
在一种可能的实施方式中,本公开提供的装置中,处理单元具体用于:
解析多个目标队列,得到每个目标队列对应的输入特征;
将每个目标队列对应的输入特征输入到初始队列价值预估模型中,得到每个目标队列对应的结果。
在一种可能的实施方式中,本公开提供的装置中,处理单元具体用于:
将每个目标队列对应的用户侧特征和信息侧特征输入到初始队列价值预估模型的隐藏层,得到第一结果;
将每个目标队列对应的出价特征输入到初始队列价值预估模型的约束网络层,得到第二结果;
基于第一结果和第二结果,得到每个目标队列对应的结果。
在一种可能的实施方式中,本公开提供的装置中,处理单元具体用于:
将第一结果和第二结果输入到缩放网络中,得到每个目标队列对应的结果。
根据本公开的第三方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面中任一项所述的方法。
根据本公开的第四方面,提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令在被处理器执行时实现第一方面中任一项所述的方法中的步骤。
在本公开的实施例中,响应于针对目标对象的信息推荐请求,得到多个待推荐信息,再基于多个待推荐信息,生成多个待推荐队列,然后利用队列价值预估模型,从多个待推荐队列中确定目标推荐队列,队列价值预估模型用于确定价值最高的待推荐队列,最后在目标对象对应的页面展示目标推荐队列,通过使用本公开的方案,能够在信息推荐时兼顾不同位置间的复杂非线性关系,同时对输入特征进行扩充,从而获得更优的页面分配效率,使得信息推荐效率更高,提升用户体验。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例提供的一种信息推荐方法的流程示意图;
图2是根据本公开实施例提供的相关技术与信息推荐方法的对比示意图;
图3是根据本公开实施例提供的一种队列价值预估模型的训练流程示意图;
图4是根据本公开实施例提供的一种队列价值预估模型的结构示意图;
图5是根据本公开实施例提供的一种队列价值预估模型的min-max网络部分的结构示意图;
图6是根据本公开实施例提供的一种信息推荐装置的框图;
图7是用来实现本公开实施例的信息推荐方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
本公开的技术方案中,所涉及的用户个人信息的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
在线的信息检索系统广泛应用于互联网广告位分配,比如搜索信息、信息流广告等。该系统的核心功能是,从海量广告库中,选取合适的信息,然后填充到信息位资源中,从而连接信息服务和用户需求,创造社会价值。
然而在相关技术中,没有充分考虑不同位置间得分的复杂非线性关系,且基于单广告位得分预估,无法充分捕捉不同广告位间的复杂非线性关系。
下面结合附图,说明本公开各实施例提供的技术方案。
图1是本公开实施例提供的一种信息推荐方法的流程示意图,如图1所示,该方法包括:
S110,响应于针对目标对象的信息推荐请求,得到多个待推荐信息。
在本公开实施例中,响应于用户的针对目标对象的信息推荐请求,从数据库中得到多个待推荐给用户的待推荐信息。
S120,基于多个待推荐信息,生成多个待推荐队列。
在本公开实施例中,利用S110中得到的多个待推荐信息,生成多个待推荐队列,每个待推荐队列至少包含两个待推荐信息。具体生成时,可以根据每个待推荐信息间的关联性进行组合,也可以直接对所有待推荐信息进行排列组合,得到多个待推荐队列。
S130,利用队列价值预估模型,从多个待推荐队列中确定目标推荐队列。
在本公开实施例中,将S120中得到的多个待推荐队列输入至队列价值预估模型,确定价值最高的待推荐队列为目标推荐队列,具体过程为:首先解析多个待推荐队列,得到每个待推荐队列对应的输入特征,输入特征包括用户侧特征、信息侧特征和出价特征,再将每个待推荐队列对应的输入特征输入到队列价值预估模型,确定输出价值最高的目标推荐队列,利用队列价值预估模型,以更丰富的特征关系来寻找最合适的待推荐信息,提高搜索精确度的同时提升用户体验。
S140,在目标对象对应的页面展示目标推荐队列。
在本公开实施例中,将目标推荐队列中的多个待推荐信息,展示在搜索目标对象所对应的结果显示位置。
传统的信息(也即广告)分配算法如图2所示,首先计算每个广告的排序得分(adscore),然后根据排序得分对所有候选广告进行排序,排序得分高的,获得靠前广告位,依次分配。然而这种分配方法,没有充分考虑不同位置间得分的复杂非线性关系,得到的广告队列并非页面整体效率最大。
在本公开实施例采用端到端的思路,首先将候选广告进行排列,生成可能的分配组合,然后通过队列价值预估模型,预估每个可能的组合的队列得分(page score),队列得分高的队列,作为最终展示。应用本公开的实施例提供的方法,响应于针对目标对象的信息推荐请求,得到多个待推荐信息,再基于多个待推荐信息,生成多个待推荐队列,然后利用队列价值预估模型,从多个待推荐队列中确定目标推荐队列,队列价值预估模型用于确定价值最高的待推荐队列,最后在目标对象对应的页面展示目标推荐队列,通过使用本公开的方案,能够在信息推荐时兼顾不同位置间的复杂非线性关系,同时对输入特征进行扩充,从而获得更优的页面分配效率,使得信息推荐效率更高,提升用户体验。
在本公开的一些实施例中,如图3所示,队列价值预估模型是根据如下方法训练的:
S310,获取用于训练的多个目标队列。
具体实施时,获取用于训练价值预估模型的多个目标队列,每个目标队列至少包含两个带标注信息的待推荐信息。
S320,将多个目标队列输入到初始队列价值预估模型中,得到每个目标队列对应的结果。
具体实施时,首先解析多个目标队列,得到每个目标队列对应的输入特征,然后将每个目标队列对应的输入特征输入到初始队列价值预估模型中,得到每个目标队列对应的结果,使用带标注信息的样本对模型进行训练,提高模型精确度。
具体来说,队列价值预估模型的架构如图4所示,每个目标队列对应的输入特征包括每个目标队列对应的用户侧特征、信息侧特征和出价特征,上述输入过程具体为,先将每个目标队列对应的用户侧特征和信息侧特征输入到初始队列价值预估模型的隐藏层,得到第一结果,然后将每个目标队列对应的出价特征输入到初始队列价值预估模型的约束网络层,得到第二结果,最后基于第一结果和第二结果,得到每个目标队列对应的结果。将第一结果和第二结果输入到缩放网络中,得到每个目标队列对应的结果。模型的输入特征包括设备号、性别、年龄、地域等用户侧特征,广告标题、描述、组件等信息侧特征,ctr、cvr等连续值特征以及出价特征,使得输入特征更加多元化,训练出的模型能够更精准的确定出价值最高的待推荐队列。
S330,基于每个目标队列中待推荐信息的标注信息和每个目标队列对应结果的差异训练生成队列价值预估模型。
具体实施时,用标注信息与对应结果的差异来训练生成队列价值预估模型,完成队列价值预估模型的训练,该模型结构如图5所示,需要保证出价输入和page score间的单调性。为此,在网络的最上面一层,使用min-max网络,并且通过constraint network,将出价特征的权重限制为正值,通过该网络保证bid和输出值之间的单调性,从而实现分配激励兼容,以此实现整个网络的部分单调性,使得分配方式满足激励兼容经济学特性。
基于相同的发明构思,本公开还提供了一种信息推荐装置,如图6所示,信息推荐装置600,可以包括:
获取单元601,用于响应于针对目标对象的信息推荐请求,得到多个待推荐信息;
生成单元602,用于基于多个待推荐信息,生成多个待推荐队列,其中每个待推荐队列至少包含两个待推荐信息;
处理单元603,用于利用队列价值预估模型,从多个待推荐队列中确定目标推荐队列,队列价值预估模型用于确定价值最高的待推荐队列;
展示单元604,用于在目标对象对应的页面展示目标推荐队列。
在一种可能的实施方式中,本公开提供的装置中,处理单元603具体用于:
解析多个待推荐队列,得到每个待推荐队列对应的输入特征;
将每个待推荐队列对应的输入特征输入到队列价值预估模型,确定输出价值最高的待推荐队列为目标推荐队列。
在一种可能的实施方式中,本公开提供的装置中,处理单元603通过如下方法进行训练队列价值预估模型:
获取用于训练的多个目标队列,其中每个目标队列至少包含两个带标注信息的待推荐信息;
将多个目标队列输入到初始队列价值预估模型中,得到每个目标队列对应的结果;
基于每个目标队列中待推荐信息的标注信息和每个目标队列对应结果的差异训练生成队列价值预估模型。
在一种可能的实施方式中,本公开提供的装置中,处理单元603具体用于:
解析多个目标队列,得到每个目标队列对应的输入特征;
将每个目标队列对应的输入特征输入到初始队列价值预估模型中,得到每个目标队列对应的结果。
在一种可能的实施方式中,本公开提供的装置中,处理单元603具体用于:
将每个目标队列对应的用户侧特征和信息侧特征输入到初始队列价值预估模型的隐藏层,得到第一结果;
将每个目标队列对应的出价特征输入到初始队列价值预估模型的约束网络层,得到第二结果;
基于第一结果和第二结果,得到每个目标队列对应的结果。
在一种可能的实施方式中,本公开提供的装置中,处理单元603具体用于:
将第一结果和第二结果输入到缩放网络中,得到每个目标队列对应的结果。
根据本公开的实施例,本公开还提供了一种电子设备、一种非瞬时计算机可读存储介质和一种计算机程序产品。
图7示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM802以及RAM803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
电子设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如信息推荐方法。例如,在一些实施例中,信息推荐方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM803并由计算单元801执行时,可以执行上文描述的深度学习编译器的运行方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行信息推荐方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual PrivateServer",或简称"VPS")中,存在的管理难度大,任务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (15)
1.一种信息推荐方法,其特征在于,包括:
响应于针对目标对象的信息推荐请求,得到多个待推荐信息;
基于所述多个待推荐信息,生成多个待推荐队列,其中每个所述待推荐队列至少包含两个所述待推荐信息;
利用队列价值预估模型,从多个所述待推荐队列中确定目标推荐队列,所述队列价值预估模型用于确定价值最高的待推荐队列;
在所述目标对象对应的页面展示所述目标推荐队列。
2.根据权利要求1所述的方法,其特征在于,所述利用队列价值预估模型,从多个所述待推荐队列中确定目标推荐队列,包括:
解析多个所述待推荐队列,得到每个所述待推荐队列对应的输入特征;
将每个所述待推荐队列对应的输入特征输入到所述队列价值预估模型,确定输出价值最高的待推荐队列为目标推荐队列。
3.根据权利要求2所述的方法,其特征在于,所述队列价值预估模型通过如下方法进行训练:
获取用于训练的多个目标队列,其中每个所述目标队列至少包含两个带标注信息的待推荐信息;
将多个所述目标队列输入到初始队列价值预估模型中,得到每个所述目标队列对应的结果;
基于每个所述目标队列中待推荐信息的标注信息和每个所述目标队列对应结果的差异训练生成所述队列价值预估模型。
4.根据权利要求3所述的方法,其特征在于,所述将多个所述目标队列输入到初始队列价值预估模型中,得到每个所述目标队列对应的结果,包括:
解析多个所述目标队列,得到每个所述目标队列对应的输入特征;
将每个所述目标队列对应的输入特征输入到初始队列价值预估模型中,得到每个所述目标队列对应的结果。
5.根据权利要求4所述的方法,其特征在于,所述每个所述目标队列对应的输入特征包括每个所述目标队列对应的用户侧特征、信息侧特征和出价特征;则所述将每个所述目标队列对应的输入特征输入到初始队列价值预估模型中,得到每个所述目标队列对应的结果,包括:
将每个所述目标队列对应的所述用户侧特征和所述信息侧特征输入到所述初始队列价值预估模型的隐藏层,得到第一结果;
将每个所述目标队列对应的出价特征输入到所述初始队列价值预估模型的约束网络层,得到第二结果;
基于所述第一结果和所述第二结果,得到每个所述目标队列对应的结果。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一结果和所述第二结果,得到每个所述目标队列对应的结果,包括:
将所述第一结果和所述第二结果输入到缩放网络中,得到每个所述目标队列对应的结果。
7.一种信息推荐装置,其特征在于,包括:
获取单元,用于响应于针对目标对象的信息推荐请求,得到多个待推荐信息;
生成单元,用于基于所述多个待推荐信息,生成多个待推荐队列,其中每个所述待推荐队列至少包含两个所述待推荐信息;
处理单元,用于利用队列价值预估模型,从多个所述待推荐队列中确定目标推荐队列,所述队列价值预估模型用于确定价值最高的待推荐队列;
展示单元,用于在所述目标对象对应的页面展示所述目标推荐队列。
8.根据权利要求7所述的装置,其特征在于,处理单元具体用于:
解析多个所述待推荐队列,得到每个所述待推荐队列对应的输入特征;
将每个所述待推荐队列对应的输入特征输入到所述队列价值预估模型,确定输出价值最高的待推荐队列为目标推荐队列。
9.根据权利要求8所述的装置,其特征在于,所述处理单元通过如下方法进行训练所述队列价值预估模型:
获取用于训练的多个目标队列,其中每个所述目标队列至少包含两个带标注信息的待推荐信息;
将多个所述目标队列输入到初始队列价值预估模型中,得到每个所述目标队列对应的结果;
基于每个所述目标队列中待推荐信息的标注信息和每个所述目标队列对应结果的差异训练生成所述队列价值预估模型。
10.根据权利要求9所述的装置,其特征在于,所述处理单元具体用于:
解析多个所述目标队列,得到每个所述目标队列对应的输入特征;
将每个所述目标队列对应的输入特征输入到初始队列价值预估模型中,得到每个所述目标队列对应的结果。
11.根据权利要求10所述的装置,其特征在于,所述处理单元具体用于:
将每个所述目标队列对应的所述用户侧特征和所述信息侧特征输入到所述初始队列价值预估模型的隐藏层,得到第一结果;
将每个所述目标队列对应的出价特征输入到所述初始队列价值预估模型的约束网络层,得到第二结果;
基于所述第一结果和所述第二结果,得到每个所述目标队列对应的结果。
12.根据权利要求11所述的装置,其特征在于,所述处理单元具体用于:
将所述第一结果和所述第二结果输入到缩放网络中,得到每个所述目标队列对应的结果。
13.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的信息推荐方法。
14.一种计算机存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至6中任一项所述的信息推荐方法。
15.一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令在被处理器执行时实现根据权利要求1至6中任一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310267433.2A CN116150502A (zh) | 2023-03-15 | 2023-03-15 | 信息推荐方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310267433.2A CN116150502A (zh) | 2023-03-15 | 2023-03-15 | 信息推荐方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116150502A true CN116150502A (zh) | 2023-05-23 |
Family
ID=86356781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310267433.2A Pending CN116150502A (zh) | 2023-03-15 | 2023-03-15 | 信息推荐方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116150502A (zh) |
-
2023
- 2023-03-15 CN CN202310267433.2A patent/CN116150502A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112561077B (zh) | 多任务模型的训练方法、装置及电子设备 | |
CN112560479B (zh) | 摘要抽取模型训练方法、摘要抽取方法、装置和电子设备 | |
CN112541122A (zh) | 推荐模型的训练方法、装置、电子设备及存储介质 | |
CN112487173B (zh) | 人机对话方法、设备和存储介质 | |
CN112560496A (zh) | 语义分析模型的训练方法、装置、电子设备及存储介质 | |
KR20210144622A (ko) | 융합 정렬 모델의 훈련방법, 검색 정렬 방법, 장치, 기기 및 컴퓨터 프로그램 | |
EP4134900A2 (en) | Method and apparatus for recommending content, method and apparatus for training ranking model, device, and storage medium | |
US11809505B2 (en) | Method for pushing information, electronic device | |
CN112560461A (zh) | 新闻线索的生成方法、装置、电子设备及存储介质 | |
CN117688946A (zh) | 基于大模型的意图识别方法、装置、电子设备和存储介质 | |
CN115248890A (zh) | 用户兴趣画像的生成方法、装置、电子设备以及存储介质 | |
CN117235371A (zh) | 视频推荐方法、模型训练方法及装置 | |
CN117271884A (zh) | 确定推荐内容的方法、装置、电子设备及存储介质 | |
CN115293291B (zh) | 排序模型的训练方法、排序方法、装置、电子设备及介质 | |
CN114817476A (zh) | 语言模型的训练方法、装置、电子设备和存储介质 | |
CN116150502A (zh) | 信息推荐方法、装置、设备及介质 | |
CN114328855A (zh) | 文档查询方法、装置、电子设备和可读存储介质 | |
CN114357242A (zh) | 基于召回模型的训练评估方法及装置、设备、存储介质 | |
CN112988976A (zh) | 搜索方法、搜索装置、电子设备、存储介质和程序产品 | |
CN112925913A (zh) | 用于匹配数据的方法、装置、设备和计算机可读存储介质 | |
CN114547417B (zh) | 一种媒体资源排序方法及电子设备 | |
CN115131709B (zh) | 视频类别预测方法、视频类别预测模型的训练方法及装置 | |
CN114547448B (zh) | 数据处理、模型训练方法、装置、设备、存储介质及程序 | |
CN113642495B (zh) | 用于评价时序提名的模型的训练方法、设备、程序产品 | |
CN116416500B (zh) | 图像识别模型训练方法、图像识别方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |