CN114925108A - 排序模型的确定方法、装置、设备以及存储介质 - Google Patents

排序模型的确定方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN114925108A
CN114925108A CN202210642649.8A CN202210642649A CN114925108A CN 114925108 A CN114925108 A CN 114925108A CN 202210642649 A CN202210642649 A CN 202210642649A CN 114925108 A CN114925108 A CN 114925108A
Authority
CN
China
Prior art keywords
target
model
candidate
product
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210642649.8A
Other languages
English (en)
Inventor
胡良田
邰利龙
吴学超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202210642649.8A priority Critical patent/CN114925108A/zh
Publication of CN114925108A publication Critical patent/CN114925108A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种排序模型的确定方法、装置、设备以及存储介质。涉及计算机技术领域,尤其涉及数据处理、机器学习、智能搜索、智能推荐等领域。具体实现方案为:获取目标产品的样本集和特征集;从模型库中为目标产品确定出候选排序模型;基于特征集为目标产品确定目标特征集,目标特征集是模型调参所使用的特征的集合;基于样本集和目标特征集,调整候选排序模型的参数,得到目标产品的目标排序模型,该目标排序模型用于预测目标产品的资源的点击率。根据本公开的技术方案,能为每个产品提供与其相适应的目标排序模型,进而提高每个产品的推荐性能。

Description

排序模型的确定方法、装置、设备以及存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及数据处理、机器学习、智能搜索、智能推荐等领域。
背景技术
随着业务的高速发展,出现大量业务需要提供推荐服务的场景。为了节省机器资源,一个推荐中台可能需要负责多种产品的推荐服务。相关技术中,推荐中台采用排序模型为各种产品进行资源排序,根据资源排序情况为用户推荐各种产品的相关资源。然而,由于各种产品的特点不同,采用同一排序模型进行排序,导致推荐效果不佳。
发明内容
本公开提供了一种排序模型的确定方法、装置、设备以及存储介质。
根据本公开的第一方面,提供了一种排序模型的确定方法,包括:
获取目标产品的样本集和特征集;
从模型库中为目标产品确定出候选排序模型;
基于特征集为目标产品确定目标特征集;
基于样本集和目标特征集,调整候选排序模型的参数,得到目标产品的目标排序模型,该目标排序模型用于预测目标产品的资源的点击率。
根据本公开的第二方面,提供了一种排序模型的确定装置,包括:
获取单元,用于获取目标产品的样本集和特征集;
第一确定单元,用于从模型库中为目标产品确定出候选排序模型;
第二确定单元,用于基于特征集为目标产品确定目标特征集;
第三确定单元,用于基于样本集和目标特征集,调整候选排序模型的参数,得到目标产品的目标排序模型,该目标排序模型用于预测目标产品的资源的点击率。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行上述第一方面所提供的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行上述第一方面所提供的方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现上述第一方面所提供的方法。
根据本公开的技术方案,能为每个产品提供与其相适应的目标排序模型,进而提高每个产品的推荐性能。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例的排序模型的确定方法的流程示意图;
图2是根据本公开实施例的用于确定排序模型的架构示意图;
图3是根据本公开实施例的推荐系统的架构示意图;
图4是根据本公开实施例的资源推荐的流程示意图;
图5是根据本公开实施例的排序模型的确定装置的结构示意图;
图6是根据本公开实施例的定制排序模型的场景示意图;
图7是用来实现本公开实施例的排序模型的确定方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开的说明书实施例和权利要求书及上述附图中的术语"第一"、"第二"和"第三"等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语"包括"和"具有"以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在对本公开实施例的技术方案进行介绍之前,先对本公开可能使用到的技术术语做进一步说明:
神经网络智能(Neural Network Intelligence,NNI)是一个轻量但强大的工具包,帮助用户自动地进行特征选择,神经网络架构搜索,超参数调优以及模型压缩。Tree-structured Parzen Estimator Approach(简称TPE)是机器学习模型调节超参数的一种方法。
机器学习模型中一般有两类参数,一类是可以从数据中学习估计得到,称为参数(Parameter)。还有一类参数时无法从数据中估计,只能依据经验进行设计指定,称为超参数(Hyper parameter)。超参数可在开始学习过程之前设置。相反,其他参数的值通过训练得出。
如以上在背景技术中所描述的,为了节省机器资源,一个推荐中台(也称推荐系统)需要负责多种产品的推荐服务。相关技术中,主要有以下三种推荐方式。第一种方式是将各类产品的召回资源汇聚融合后输出,具体是将不同召回通道召回的资源通过汇聚模块(Global Recommend,GR)融合、过滤,多样性控制后直接输出。可见,这种推荐方式没有运用到任何排序模型,完全依赖召回通道召回资源的顺序,没有合理排序,推荐准确性差。第二种方式是使用一个粗排模型给所有产品提供预估服务。第二种方式在一定程度上解决了召回资源没有排序的问题,但粗排结果准确性不高,在各产品相关性不高的情况下使用相同的粗排模型会带来严重的推荐效果不佳问题,影响推荐性能。第三种方式是使用一个精排模型给所有产品提供预估服务。第三种方式将各个产品线通过精排模型排序,可以获取相对准确的排序分值,但使用相同的精排模型仍会带来推荐效果不佳问题,影响推荐性能。
本公开为了至少部分地解决上述问题以及其他潜在问题中的一个或者多个问题,发明人将NNI的技术和思想应用到机器学习的排序模型中,使得排序模型在获取到样本数据后,可以根据样本数据特点,自动进行模型选择、特征选择和超参数选择,进而通过排序模型预估资源的点击率(Click Through Rate,CTR),以达到为不同产品定制化排序模型来提高推荐性能的效果。
本公开实施例提供了一种排序模型的确定方法,图1是根据本公开实施例的排序模型的确定方法的流程示意图,该排序模型的确定方法可以应用于排序模型的确定装置。该排序模型的确定装置位于电子设备,该电子设备可以是推荐系统的一部分,也可以独立于推荐系统但能与推荐系统通信连接。该电子设备包括但不限于固定设备和/或移动设备。例如,固定设备包括但不限于服务器,服务器可以是云服务器或普通服务器。例如,移动设备包括但不限于:手机、平板电脑、车载终端中的一项或是多项终端。在一些可能的实现方式中,该方法还可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。如图1所示,该排序模型的确定方法包括:
S101:获取目标产品的样本集和特征集;
S102:从模型库中为目标产品确定出候选排序模型;
S103:基于特征集为目标产品确定目标特征集;
S104:基于样本集和目标特征集,调整候选排序模型的参数,得到目标产品的目标排序模型,该目标排序模型用于预测目标产品的资源的点击率。
本公开实施例中,目标产品是待确定目标排序模型的产品。通常来说,目标产品是能为用户提供信息的应用程序(Application,简称APP)产品。示例性的,目标产品是能够为用户提供资讯类信息服务的应用程序。这里,目标产品包括但不限于网页APP,原生(Native)APP,混合(Hybrid)APP。比如,手机百度APP属于网页类APP。比如,百度研发的一刻相册,柠檬爱美等,都属于原生APP。比如,百度地图、百度百科等属于混合类APP。以上仅为示例性说明,不作为对目标产品全部可能的类型的限定,只是这里不做穷举。
本公开实施例中,样本集是目标产品的训练样本或历史真实样本的集合。进一步地,样本集可包括训练集、验证集和测试集。以上仅为示例性说明,不作为对样本集全部可能的样本类型的限定,只是这里不做穷举。
本公开实施例中,特征集是由目标产品的特征组成的集合。示例性的,特征集中包括产品面向的对象的特征。比如,特征可以是受众群体特征,具体可进一步细分为用户性别、用户年龄段、用户地理位置信息、用户年收入等特征。再示例性的,特征集中包括产品自身所支持的资源类型特征。比如,特征包括支持文字和图片。再比如,特征包括支持图片不支持视频。以上仅为示例性说明,不作为对特征集中全部可能的特征类型的限定,只是这里不做穷举。
本公开实施例中,目标特征集是从特征集中选出的有效的特征的集合,用于模型调参。在一些实施方式中,可根据目标产品的特点来选择。比如,目标产品的受众群体为全民用户,则可将特征集中的用户年龄段这一特征剔除,该用户年龄段这一特征不属于有效特征。在另一些实施方式中,可根据排序模型的特点来选择。比如,排序模型A无法区分用户性别这一特征,可将特征集中的用户性别这一特征剔除,该用户性别这一特征不属于有效特征。以上仅为示例性说明,不作为对目标特征集中全部可能的选择方式进行限定,只是这里不做穷举。
本公开实施例中,模型库中包括多个排序模型。排序模型用于预测用户对产品所包括的资源的点击率,排序模型还可进一步用于对预测出的各资源的点击率进行排序。比如,预置模型可以是区域卷积神经网络(Region Convolutional Neural Network,RCNN)模型。又比如,预置模型可以是全卷积网络(Fully Convolutional Network,FCN)模型。本公开实施例不对排序模型的架构进行限定。
本公开实施例中,目标产品的样本集和特征集可根据用户在终端输入的信息确定的。在一些实施方式中,电子设备直接接收终端发送的目标产品的样本集和特征集。在另一些实施方式中,电子设备接收其他设备转发的目标产品的样本集和特征集。本公开不对终端与电子设备之间的通信方式进行限定。
本公开实施例中,调整候选排序模型的参数,至少包括调整排序模型的普通参数,即神经网络参数。
本公开实施例中,目标排序模型是用于专门为目标产品提供预测服务的排序模型。
本公开实施例的技术方案,获取目标产品的样本集和特征集;从模型库中为目标产品确定出候选排序模型;基于特征集为目标产品确定目标特征集;基于样本集和目标特征集,调整候选排序模型的参数,得到目标产品的目标排序模型;如此,能够为目标产品确定与目标产品相适应的目标排序模型,实现了排序模型的定制化。采用与目标产品相适应的目标排序模型,对目标产品的资源进行点击率预测,能够提高对资源点击率的预测准确率,进而有助于提高目标产品的推荐性能。
在一些实施例中,上述排序模型的确定方法,还可包括:基于候选排序模型的属性,确定候选排序模型的待调整的超参数;基于样本集和目标特征集,调整候选排序模型的待调整的超参数。
这里,候选排序模型的属性,包括候选排序模型所包括的超参数种类这一属性。不同候选排序模型包括的超参数的种类数可能不同。
举例来说,候选排序模型1包括deepfm超参数和fm超参数。候选排序模型2包括deepfm超参数和ffm超参数。候选排序模型3包括fm超参数和ffm超参数。候选排序模型4包括deepfm超参数、fm超参数和ffm超参数。
在一些实施方式中,基于候选排序模型的属性,确定候选排序模型的待调整的超参数,包括:基于候选排序模型包括的超参数的种类数,确定候选排序模型的待调整的超参数。比如,候选排序模型包括N种超参数,则将候选排序模型所包括的N种超参数,确定为待调整的超参数。
在另一些实施方式中,基于候选排序模型的属性,确定候选排序模型的待调整的超参数,包括:基于候选排序模型包括的超参数的种类数,以及超参数的影响因子,确定候选排序模型的待调整的超参数。比如,候选排序模型包括超参数1和超参数2,且超参数1的影响因子为0.99,超参数2的影响因子为0.01;那么,为了提高目标排序模型的生成速度,可只将超参数1确定为待调整的超参数。为了提高目标排序模型的生成精度,将超参数1和超参数2确定为待调整的超参数。
实际应用中,可基于TPE调整候选排序模型的超参数。
需要说明的是,调整候选排序模型的超参数,可与调整候选排序模型的参数同时进行。或者,调整候选排序模型的超参数,在调整候选排序模型的参数之后进行。或者,调整候选排序模型的超参数,在调整候选排序模型的参数之前进行。
如此,在调整候选排序模型的参数时,也调整候选排序模型的超参数,有助于提高确定出的目标排序模型的预测精度,从而有助于提高目标排序模型的推荐效果。
在一些实施例中,从模型库中为目标产品确定出候选排序模型,包括:获取模型库中各排序模型的模型特点;获取目标产品的产品特点;将模型库中的模型特点与目标产品的产品特点相匹配的排序模型,确定为目标产品的候选排序模型。
本公开实施例中,模型特点包括模型所适用的场景特点。比如,排序模型a适合分析图像。排序模型b适合分析视频。排序模型c适合分析网页。
本公开实施例中,产品特点包括产品资源的类型特点。比如,产品A为用户提供图像推荐服务。产品B为用户提供视频推荐服务。产品C为用户提供小说推荐服务。
这里,相匹配至少是指模型特点能够满足产品特点的部分需求。根据上述例子,排序模型a与产品A相匹配;排序模型b与产品B相匹配;排序模型c与产品C相匹配。
在一些实施方式中,将模型库中的模型特点与目标产品的产品特点相匹配的排序模型,确定为目标产品的候选排序模型,包括:在模型特点能够完全覆盖产品特点的情况下,将具有更多模型特点的排序模型确定为候选排序模型。举例来说,产品D的特点是能为用户提供视频、图像和文字服务;若排序模型d能识别视频、图像、文字和音乐,则将排序模型d作为产品D的候选排序模型。
在一些实施方式中,将模型库中的模型特点与目标产品的产品特点相匹配的排序模型,确定为目标产品的候选排序模型,包括:在模型特点不能够完全覆盖产品特点的情况下,将模型特点覆盖产品特点最多的排序模型确定为候选排序模型。举例来说,产品E的特点是能为用户提供视频、图像和文字服务;若排序模型e能识别视频和文字,排序模型f能识别图像,排序模型g能识别视频,则将排序模型e作为产品E的候选排序模型。
如此,能够使确定出的候选排序模型与目标产品的特点相适应,有助于提高确定出的目标排序模型与目标产品的匹配程度,从而有助于提高目标排序模型的预测准确率。
在一些实施例中,从模型库中为目标产品确定出候选排序模型,包括:根据接收到的目标产品的配置信息,获取排序模型的目标标识;将模型库中标识为目标标识的排序模型,确定为目标产品的候选排序模型。
这里,配置信息包括指定的排序模型的标识信息。
本公开实施例中,目标产品的配置信息可由用户通过用户界面接口输入。该用户界面接口是推荐系统为用户提供的接口。
举例来说,若目标产品的配置信息中包括指定的排序模型的标识h,则将模型库中标识为h的排序模型,确定为候选排序模型。
需要说明的是,配置信息中可携带多个排序模型的标识。
实际应用中,该配置信息还可包括目标产品的样本集和特征集。
如此,能够根据指定的排序模型的标识信息确定候选排序模型,提高为产品确定目标排序模型的定制化程度,进而更好地满足产品的需求。
在一些实施例中,在候选排序模型的数量为多个的情况下,基于样本集和目标特征集,调整候选排序模型的参数,得到目标产品的目标排序模型,包括:基于样本集和目标特征集,调整多个候选排序模型分别对应的参数,得到多个目标候选模型;对多个目标候选模型进行验证,得到多个目标候选模型的第一准确率;将第一准确率最高的目标候选模型确定为目标产品的目标排序模型。
在一些实施方式中,对多个目标候选模型进行验证,得到多个目标候选模型的第一准确率,包括:采用样本集中的部分样本,对多个目标候选模型进行验证,得到多个目标候选模型的第一准确率。这里,在样本集中包括训练集、测试集和验证集的情况下,部分样本可以是验证集中的样本,还可以是测试集中的样本。
在一些实施方式中,对多个目标候选模型进行验证,得到多个目标候选模型的第一准确率,包括:采用非当前样本集中的样本,对多个目标候选模型进行验证,得到多个目标候选模型的第一准确率。这里,非当前样本集,可以是历史样本集,或是专门设置的用于验证目标排序模型的预测准确率的样本集。
这里,以模型M1为例,第一准确率r1=模型M1准确识别出验证集的样本数量/验证集总样本数。第一准确率的值,能反应目标排序模型的性能。
举例来说,将样本集中的一些样本组成验证集,分别对m个目标候选模型进行验证,得到模型M1的第一准确率r1、模型M2的第一准确率r2、…、模型Mm的第一准确率rm;若r1>r2>…>rm,则将模型M1确定为目标排序模型。
如此,在候选排序模型的数量为多个的情况下,能够为目标产品选择出最优的目标排序模型,有助于提高确定出的目标排序模型的预测精度,从而有助于提高目标排序模型的预测准确率。
在一些实施例中,上述排序模型的确定方法还可包括:响应于检测到样本集发生改变,基于变更后的样本集测试目标排序模型,得到目标排序模型的第二准确率;在第二准确率大于预设阈值的情况下,不执行对目标排序模型的更新操作;在第二准确率小于或等于预设阈值的情况下,基于变更后的样本集更新目标排序模型的参数。
这里,预设阈值可根据设计需求如速度需求或精度需求进行设定或调整。
在一些实施方式中,采用变更后的样本集测试目标排序模型,得到目标排序模型的第二准确率,包括:获取变更后的样本相对于变更前发生改变的目标样本;根据目标样本,测试目标排序模型,得到目标排序模型的第二准确率。
这里,目标样本包括在变更后的样本集中存在,但不在变更前的样本集中存在的样本。
如此,能够节省测试目标排序模型所需时间,从而有助于快速确定是否需要对目标排序模型进行更新操作。
在一些实施方式中,采用变更后的样本集测试目标排序模型,得到目标排序模型的第二准确率,包括:根据变更后的样本集中所有样本,测试目标排序模型,得到目标排序模型的第二准确率。如此,能够更好地确定目标排序模型的准确度。
如此,通过先测试再根据测试结果确定是否调整目标排序模型,能够提高为目标产品确定目标排序模型的速度,进而有助于为目标产品提供服务的速度;同时,能根据样本集的改变及时完成目标排序模型的变更,完成目标排序模型的优化,从而有助于提升目标产品的推荐效果。
在一些实施例中,上述排序模型的确定方法还可包括:响应于检测到特征集发生改变,基于更新后的特征集调整目标特征集,得到更新后的目标特征集。基于样本集和目标特征集,调整候选排序模型的参数,得到目标产品的目标排序模型,包括:基于样本集和更新后的目标特征集,调整候选排序模型的参数,得到目标产品的目标排序模型。
举例来说,若检测到由特征集P变更为特征集Q,则特征集Q为变更后的特征集。
在一些实施方式中,基于更新后的特征集调整目标特征集,得到更新后的目标特征集,包括:获取更新后的特征集相对于更新前的特征集发生改变的目标特征;根据目标特征,得到更新后的目标特征集。
这里,目标特征包括:在更新后的特征集中存在,但不在更新前的特征集中存在的特征。
如此,能够使确定出的目标特征集更有针对性。
在一些实施方式中,基于更新后的特征集调整目标特征集,得到更新后的目标特征集,包括:根据更新后的特征集中所有特征,确定更新后的目标特征集。如此,能够提高确定出的目标特征集的准确度。
如此,能根据特征集的改变及时完成目标排序模型的变更,完成目标排序模型的优化,从而有助于提升目标产品的推荐效果。
图2示出了用于确定排序模型的架构示意图,如图2所示,模型库中包括多个排序模型,特征集包括用户画像特征(user feature)、资源特征(doc feature)、请求特征(request feature)、序列化特征(session feature)。用户画像特征包括但不限于性别、年龄、学历等。资源特征包括但不限于资源分辨率、资源大小、资源的作者。请求特征包括但不限于设备类型、设备地址。序列化特征包括但不限于历史点击记录。超参数包括但不限于:deepfm超参数、fm超参数和ffm超参数。基于NNI技术,从模型库中为目标产品选择候选排序模型、选择特征集和选择超参数,根据样本集和特征集调节排序模型中的参数,最终得到最优的目标排序模型。
应理解,图2所示的架构示意图仅仅是示例性而不是限制性的,并且其是可扩展的,本领域技术人员可以基于图2的例子进行各种显而易见的变化和/或替换,得到的技术方案仍属于本公开实施例的公开范围。
图3示出了推荐系统的架构示意图,如图3所示,推荐系统为S个产品提供推荐服务,每个产品对应有一个排序模型,每个产品都能通过专属的排序模型确定出资源的预估点击率,进而由每个产品对应的聚合模块对每个产品的资源进行聚合,生成最终的推荐资源列表,返回给客端。
当客户端检测到用户发出的更新接收信息的刷新操作时,客户端先向推荐系统的汇聚模块发出请求,汇聚模块再向下游的各个召回通道发送请求。各个召回通道根据资源属性不同,采用不同的策略召回资源,经过排序阶段的粗排、精排以及重排等阶段,为资源评分,将资源以及评分返回给汇聚模块。汇聚模块将各召回通道召回的资源进行去重、融合、过滤、排序等操作后,生成最终的推荐资源列表,返回给客端。客户端根据推荐资源列表将符合用户兴趣的资源内容呈现给用户。其中,推荐系统的汇聚模块和召回通道基本都是针对单一的产品进行设计和策略优化,只有排序阶段使用机器学习、深度学习等具有较强泛化性技术,能够较好地结合不同产品线的特点来提高排序的精准度;同时,自动化选择各产品线的特征和超参数,并共享机器,能够很好地节省人力资源和机器成本。
应理解,图3所示的架构示意图仅仅是示例性而不是限制性的,并且其是可扩展的,本领域技术人员可以基于图3的例子进行各种显而易见的变化和/或替换,得到的技术方案仍属于本公开实施例的公开范围。
基于为目标产品确定好的目标排序模型,推荐系统可进行资源推荐,如图4所示,推荐流程可包括:
S401:获取客户端发送的针对目标产品的资源推荐请求;
S402:通过目标产品的召回通道,召回目标产品的资源;
S403:通过目标产品的目标排序模型,预测召回通道召回的各个资源的点击率,并对各个资源进行排序;
S404:根据各个资源的排序情况进行聚合,得到推荐资源列表,该推荐资源列表是待展示的资源的列表;
S405:向该客户端返回该推荐资源列表。
这里,目标产品可对应多个召回通道,不同召回通道可用于召回目标产品的不同类型的资源。
如此,采用与目标产品相适应的目标排序模型,对目标产品的资源进行点击率预测,能够提高目标产品资源被访问的概率。
本公开提供的排序模型的确定方法,可应用于信息流(Feed)推荐中,推荐系统选择最合适的排序模型接入不同的产品服务,使各产品线共享机器资源上线排序模型的问题,从而能够提高资源预估点击准确率,节省大量的机器资源,减少开发成本,提高效率。
本公开实施例提供了一种排序模型的确定装置,如图5所示,该视频处理装置可以包括:获取单元501,用于获取目标产品的样本集和特征集;第一确定单元502,用于从模型库中为目标产品确定出候选排序模型;第二确定单元503,用于基于特征集为目标产品确定目标特征集;第三确定单元504,用于基于样本集和目标特征集,调整候选排序模型的参数,得到目标产品的目标排序模型,目标排序模型用于预测目标产品的资源的点击率。
在一些实施例中,该排序模型的确定装置,还可包括:第四确定单元505(图中未示出),用于基于候选排序模型的属性,确定候选排序模型的待调整的超参数;第五确定单元506(图中未示出),用于基于样本集和目标特征集,调整候选排序模型的待调整的超参数。
在一些实施例中,该第一确定单元502,包括:第一获取子单元,用于获取模型库中各排序模型的模型特点;第二获取子单元,用于获取目标产品的产品特点;第一确定子单元,用于将模型库中的模型特点与目标产品的产品特点相匹配的排序模型,确定为目标产品的候选排序模型。
在一些实施例中,该第一确定单元502,包括:第三获取子单元,用于根据接收到的目标产品的配置信息,获取排序模型的目标标识;第二确定子单元,用于将模型库中标识为目标标识的排序模型,确定为目标产品的候选排序模型。
在一些实施例中,该第二确定单元503,包括:调整子单元,用于在候选排序模型的数量为多个的情况下,基于样本集和目标特征集,调整多个候选排序模型分别对应的参数,得到多个目标候选模型;第三确定子单元,用于对多个目标候选模型进行验证,得到多个目标候选模型的第一准确率;第四确定子单元,用于将第一准确率最高的目标候选模型确定为目标产品的目标排序模型。
在一些实施例中,该排序模型的确定装置,还可包括:验证单元507(图中未示出),用于响应于检测到样本集发生改变,采用变更后的样本集测试目标排序模型,得到目标排序模型的第二准确率;控制单元508(图中未示出),用于在第二准确率大于预设阈值的情况下,不执行对目标排序模型的更新操作;在第二准确率小于或等于预设阈值的情况下,基于变更后的样本集更新目标排序模型的参数。
在一些实施例中,该第二确定单元503,还用于响应于检测到特征集发生改变,基于更新后的特征集调整目标特征集,得到更新后的目标特征集;该第三确定单元504,还用于基于样本集和更新后的目标特征集,调整候选排序模型的参数,得到目标产品的目标排序模型。
本领域技术人员应当理解,本公开实施例的排序模型的确定装置中各处理模块的功能,可参照前述的排序模型的确定方法的相关描述而理解,本公开实施例的排序模型的确定装置中各处理模块,可通过实现本公开实施例所述的功能的模拟电路而实现,也可以通过执行本公开实施例所述的功能的软件在电子设备上的运行而实现。
本公开实施例的排序模型的确定装置,能够为目标产品确定与目标产品相适应的目标排序模型,实现了排序模型的定制化。采用与目标产品相适应的目标排序模型,对目标产品的资源进行点击率预测,能够提高资源点击率的预测准确率,进而有助于提高目标产品的推荐性能。
图6示出了确定目标排序模型的场景示意图,从图6可以看出,电子设备如云服务器接收来自各终端发送的为产品定制目标排序模型的请求;根据请求为产品确定出样本集和特征集,从模型库中为各产品选择候选排序模型,为各产品确定目标特征集,并自动对候选排序模型进行参数调节,包括普通参数和超参数,最后为每个产品确定出目标排序模型。进一步地,可向终端返回目标排序模型定制成功消息。进一步地,还可建立产品与目标排序模型的对应关系,在检测到产品的样本集或特征集发生变化的情况下,更新目标排序模型。如此,能够为产品定制化排序模型。采用与产品相适应的目标排序模型,对产品的资源进行点击率预测,能够提高资源点击率的预测准确率,进而有助于提高目标产品的推荐性能。
下面列举几个场景。比如,产品R被研发出后,将产品R的相关信息,如样本集和特征集发送至电子设备,以由电子设备为产品R确定出与产品R相适应的排序模型。又比如,电子设备已经为产品K确定出与产品K相适应的排序模型,在产品K增加新的功能后,将新增加的功能所对应的特征集和样本集发送至电子设备,以由电子设备在原目标排序模型的基础上进行更新操作,使更新后的目标排序模型更适合新增功能后的产品K。
应理解,图6所示的场景图仅仅是示意性而非限制性的,本领域技术人员可以基于图6的例子进行各种显而易见的变化和/或替换,得到的技术方案仍属于本公开实施例的公开范围。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(Read-OnlyMemory,ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RandomAccess Memory,RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(Input/Output,I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(Central Processing Unit,CPU)、图形处理单元(Graphics Processing Unit,GPU)、各种专用的人工智能(ArtificialIntelligence,AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(Digital Signal Processor,DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如排序模型的确定方法。例如,在一些实施例中,排序模型的确定方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的排序模型的确定方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行排序模型的确定方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(Field Programmable Gate Array,FPGA)、专用集成电路(Application Specific Integrated Circuit,ASIC)、专用标准产品(Application-Specific Standard Products,ASSP)、芯片上系统的系统(System on Chip,SOC)、负载可编程逻辑设备(Complex Programmable Logic Device,CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器、只读存储器、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、快闪存储器、光纤、便捷式紧凑盘只读存储器(Compact Disk Read Only Memory,CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,阴极射线管(Cathode Ray Tube,CRT)或者液晶显示器(Liquid Crystal Display,LCD)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端和服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (17)

1.一种排序模型的确定方法,包括:
获取目标产品的样本集和特征集;
从模型库中为所述目标产品确定出候选排序模型;
基于所述特征集为所述目标产品确定目标特征集;
基于所述样本集和所述目标特征集,调整所述候选排序模型的参数,得到所述目标产品的目标排序模型,所述目标排序模型用于预测所述目标产品的资源的点击率。
2.根据权利要求1所述的方法,还包括:
基于所述候选排序模型的属性,确定所述候选排序模型的待调整的超参数;
基于所述样本集和所述目标特征集,调整所述候选排序模型的所述待调整的超参数。
3.根据权利要求1或2所述的方法,其中,所述从模型库中为所述目标产品确定出候选排序模型,包括:
获取所述模型库中各排序模型的模型特点;
获取所述目标产品的产品特点;
将所述模型库中的模型特点与所述目标产品的产品特点相匹配的排序模型,确定为所述目标产品的候选排序模型。
4.根据权利要求1或2所述的方法,其中,所述从模型库中为所述目标产品确定出候选排序模型,包括:
根据接收到的目标产品的配置信息,获取排序模型的目标标识;
将所述模型库中标识为所述目标标识的排序模型,确定为所述目标产品的候选排序模型。
5.根据权利要求1或2所述的方法,其中,在所述候选排序模型的数量为多个的情况下,所述基于所述样本集和所述目标特征集,调整所述候选排序模型的参数,得到所述目标产品的目标排序模型,包括:
基于所述样本集和所述目标特征集,调整多个所述候选排序模型分别对应的参数,得到多个目标候选模型;
对所述多个目标候选模型进行验证,得到所述多个目标候选模型的第一准确率;
将第一准确率最高的目标候选模型确定为所述目标产品的目标排序模型。
6.根据权利要求1或2所述的方法,还包括:
响应于检测到所述样本集发生改变,采用变更后的样本集测试所述目标排序模型,得到所述目标排序模型的第二准确率;
在所述第二准确率大于预设阈值的情况下,不执行对所述目标排序模型的更新操作;
在所述第二准确率小于或等于所述预设阈值的情况下,基于所述变更后的样本集更新所述目标排序模型的参数。
7.根据权利要求1或2所述的方法,还包括:
响应于检测到所述特征集发生改变,基于更新后的特征集调整所述目标特征集,得到更新后的目标特征集;
所述基于所述样本集和所述目标特征集,调整所述候选排序模型的参数,得到所述目标产品的目标排序模型,包括:
基于所述样本集和所述更新后的目标特征集,调整所述候选排序模型的参数,得到所述目标产品的目标排序模型。
8.一种排序模型的确定装置,包括:
获取单元,用于获取目标产品的样本集和特征集;
第一确定单元,用于从模型库中为所述目标产品确定出候选排序模型;
第二确定单元,用于基于所述特征集为所述目标产品确定目标特征集;
第三确定单元,用于基于所述样本集和所述目标特征集,调整所述候选排序模型的参数,得到所述目标产品的目标排序模型,所述目标排序模型用于预测所述目标产品的资源的点击率。
9.根据权利要求8所述的装置,还包括:
第四确定单元,用于基于所述候选排序模型的属性,确定所述候选排序模型的待调整的超参数;
第五确定单元,用于基于所述样本集和所述目标特征集,调整所述候选排序模型的所述待调整的超参数。
10.根据权利要求8或9所述的装置,其中,所述第一确定单元,包括:
第一获取子单元,用于获取所述模型库中各排序模型的模型特点;
第二获取子单元,用于获取所述目标产品的产品特点;
第一确定子单元,用于将所述模型库中的模型特点与所述目标产品的产品特点相匹配的排序模型,确定为所述目标产品的候选排序模型。
11.根据权利要求8或9所述的装置,其中,所述第一确定单元,包括:
第三获取子单元,用于根据接收到的目标产品的配置信息,获取排序模型的目标标识;
第二确定子单元,用于将所述模型库中标识为所述目标标识的排序模型,确定为所述目标产品的候选排序模型。
12.根据权利要求8或9所述的装置,其中,所述第二确定单元,包括:
调整子单元,用于在所述候选排序模型的数量为多个的情况下,基于所述样本集和所述目标特征集,调整多个所述候选排序模型分别对应的参数,得到多个目标候选模型;
第三确定子单元,用于对所述多个目标候选模型进行验证,得到所述多个目标候选模型的第一准确率;
第四确定子单元,用于将第一准确率最高的目标候选模型确定为所述目标产品的目标排序模型。
13.根据权利要求8或9所述的装置,还包括:
验证单元,用于响应于检测到所述样本集发生改变,采用变更后的样本集测试所述目标排序模型,得到所述目标排序模型的第二准确率;
控制单元,用于在所述第二准确率大于预设阈值的情况下,不执行对所述目标排序模型的更新操作;在所述第二准确率小于或等于所述预设阈值的情况下,基于所述变更后的样本集更新所述目标排序模型的参数。
14.根据权利要求8或9所述的装置,其中,
所述第二确定单元,还用于响应于检测到所述特征集发生改变,基于更新后的特征集调整所述目标特征集,得到更新后的目标特征集;
所述第三确定单元,还用于基于所述样本集和所述更新后的目标特征集,调整所述候选排序模型的参数,得到所述目标产品的目标排序模型。
15.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。
CN202210642649.8A 2022-06-08 2022-06-08 排序模型的确定方法、装置、设备以及存储介质 Pending CN114925108A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210642649.8A CN114925108A (zh) 2022-06-08 2022-06-08 排序模型的确定方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210642649.8A CN114925108A (zh) 2022-06-08 2022-06-08 排序模型的确定方法、装置、设备以及存储介质

Publications (1)

Publication Number Publication Date
CN114925108A true CN114925108A (zh) 2022-08-19

Family

ID=82811901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210642649.8A Pending CN114925108A (zh) 2022-06-08 2022-06-08 排序模型的确定方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN114925108A (zh)

Similar Documents

Publication Publication Date Title
JP6708717B2 (ja) ニュース推薦方法及び装置
US11397772B2 (en) Information search method, apparatus, and system
CN110164415B (zh) 一种基于语音识别的推荐方法、装置及介质
CN112241327B (zh) 分享信息处理方法、装置、存储介质与电子设备
CN103699530A (zh) 根据语音输入信息在目标应用中输入文本的方法与设备
CN111984749B (zh) 一种兴趣点排序方法和装置
CN110020022B (zh) 数据处理方法、装置、设备及可读存储介质
CN111191133B (zh) 业务搜索处理方法、装置及设备
CN110909222A (zh) 基于聚类的用户画像建立方法、装置、介质及电子设备
KR102601545B1 (ko) 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법 및 대응하는 장치
CN111105294A (zh) 一种vr导览方法、系统、客户端、服务器及其存储介质
CN112579891A (zh) 一种云资源的推荐方法、装置、电子终端及存储介质
CN112836128A (zh) 信息推荐方法、装置、设备和存储介质
CN112381236A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
CN115712657A (zh) 基于元宇宙的用户需求挖掘方法及系统
CN110855487B (zh) 网络用户相似度管理方法、装置及存储介质
US20210389154A1 (en) Method and apparatus for recommending map area, device and storage medium
CN111241225A (zh) 常驻区域变更的判断方法、装置、设备及存储介质
CN111831892A (zh) 信息推荐方法、信息推荐装置、服务器及存储介质
CN112418442A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
JP2018529149A (ja) 情報をプッシュ配信する方法及び装置
CN115910062A (zh) 音频识别方法、装置、设备及存储介质
CN112906994B (zh) 订单出餐时间预测方法、装置、电子设备及存储介质
CN114925108A (zh) 排序模型的确定方法、装置、设备以及存储介质
CN115456691A (zh) 线下广告位的推荐方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination