CN113780548A - 用于训练模型的方法、装置、设备以及存储介质 - Google Patents

用于训练模型的方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN113780548A
CN113780548A CN202110083297.2A CN202110083297A CN113780548A CN 113780548 A CN113780548 A CN 113780548A CN 202110083297 A CN202110083297 A CN 202110083297A CN 113780548 A CN113780548 A CN 113780548A
Authority
CN
China
Prior art keywords
data
data set
loss function
model
click rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110083297.2A
Other languages
English (en)
Inventor
徐晓晓
李勇
彭长平
包勇军
颜伟鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Wodong Tianjun Information Technology Co Ltd
Priority to CN202110083297.2A priority Critical patent/CN113780548A/zh
Publication of CN113780548A publication Critical patent/CN113780548A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Abstract

本申请公开了用于训练模型的方法和装置,具体实现方案为:获取训练样本集,其中,训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、各个对象的点击率和点击率排序;利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和点击率排序作为期望输出数据,训练得到点击率预测模型,其中,点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,第一损失函数用于对各个对象的点击率的准确度进行计算,第二损失函数用于对点击率排序的排序能力进行计算。该方案解决了现有的点击率预测模型无法在训练过程中感知模型实际排序能力的问题。

Description

用于训练模型的方法、装置、设备以及存储介质
技术领域
本申请的实施例涉及计算机技术领域,具体涉及信息处理技术领域,尤其涉及用于训练模型的方法和装置。
背景技术
电商系统通过融入个性化推荐系统来解决信息过载问题,帮助用户快速找到其所感兴趣的商品,提高包括用户和平台等在内的各方效率。点击率(Click-Through-Rate,CTR)预测模型是个性化推荐系统中非常关键的一环,CTR预测模型在线上服务时,针对每一个具体的请求,对所有候选商品进行点击率预测和排序,推荐系统根据点击率预测值进行排序,选出点击率排在前面的若干个商品展现给用户。学术界和业界通常使用AUC(AreaUnder Curve)指标来衡量CTR预测模型的排序能力,但是,模型在训练过程中以交叉熵损失函数或者合页损失函数为监督指标,并没有直接引入AUC(area under the curve)作为监督指标,因此,现有的点击率预测模型在保证训练日志数量和预测值准确度的前提下,导致训练监督指标和模型训练结束后的实际效果衡量指标之间存在差异,无法在训练过程中感知模型实际排序能力。
发明内容
本申请提供了一种用于训练模型的方法、装置、设备以及存储介质和一种用于生成信息的方法、装置、设备以及存储介质。
根据本申请的第一方面,提供了一种用于训练模型的方法,该方法包括:获取训练样本集,其中,训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,数据集用于表征接收到用户的访问请求后,收集的用户针对各个对象内容的行为数据,数据集的各个子数据基于对行为数据对应的各条日志进行解析而生成;利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,其中,点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,第一损失函数用于对输出数据中数据集对应的各个对象的点击率的准确度进行计算,第二损失函数用于对输出数据中数据集对应的点击率排序的排序能力进行计算,点击率预测模型的损失函数用于表征对数据集的第一损失函数的损失结果和相应数据集的第二损失函数的损失结果进行整合。
在一些实施例中,在获取训练样本集之后,包括:对训练样本集中的训练样本包括的所有数据集中每个数据集进行聚合,得到聚合后的所有数据集中每个数据集的各个子数据,其中,聚合用于表征根据每个数据集中与各个对象相关的数据特征,对该数据集的各个子数据进行组合。
在一些实施例中,点击率预测模型的损失函数基于每个数据集中各个子数据的聚合个数,对每个数据集的损失值进行加权平均。
在一些实施例中,第一损失函数为交叉熵损失函数或合页损失函数,第二损失函数为AUC代理损失函数。
在一些实施例中,点击率预测模型包括第一预测子模型、第二预测子模型和结果整合子模型;利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,包括:利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第一预测子模型的输入数据,将与输入的数据集对应的各个对象的点击率作为第一预测子模型的期望输出数据,得到训练完成的第一预测子模型,其中,第一预测子模型用于表征以第一损失函数为目标函数;利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第二预测子模型的输入数据,将与输入的数据集对应的点击率排序作为第二预测子模型的期望输出数据,得到训练完成的第二预测子模型,其中,第二预测子模型用于表征以第二损失函数为目标函数;基于第一预测子模型、第二预测子模型和预设的结果整合子模型,确定点击率预测模型,其中,结果整合子模型用于表征对数据集的第一预测子模型的模型参数和相应数据集的第二预测子模型的模型参数进行整合。
在一些实施例中,AUC代理损失函数用于表征以AUC数值的最大化为目标,基于铰链损失函数而构建,AUC代理损失利用训练样本集中所有数据集的个数和每个数据集中子数据的个数计算得到。
在一些实施例中,点击率预测模型、第一预测子模型和第二预测子模型的模型构建方式包括以数据集的每个子数据为单位而构建、以数据集的两两子数据为单位而构建和以数据集对应的数据列表为单位而构建。
根据本申请的第二方面,提供了一种用于生成信息的方法,方法包括:响应于接收到用户的访问请求,获取与访问请求对应的用户的行为数据;对行为数据对应的各条日志进行解析,得到与各条日志对应的各个子数据,并生成包括各个子数据的数据集;将数据集中的各个子数据输入至训练得到的点击率预测模型,生成与数据集中的各个子数据相对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,其中,点击率预测模型通过如上述用于训练模型的方法中任一实施例的方法训练得到。
在一些实施例中,方法还包括:基于点击率排序,选取得到目标对象,并将目标对象展示于用户。
根据本申请的第三方面,提供了一种用于训练模型的装置,装置包括:获取单元,被配置成获取训练样本集,其中,训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,数据集用于表征接收到用户的访问请求后,收集的用户针对各个对象内容的行为数据,数据集的各个子数据基于对行为数据对应的各条日志进行解析而生成;训练单元,被配置成利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,其中,点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,第一损失函数用于对输出数据中数据集对应的各个对象的点击率的准确度进行计算,第二损失函数用于对输出数据中数据集对应的点击率排序的排序能力进行计算,点击率预测模型的损失函数用于表征对数据集的第一损失函数的损失结果和相应数据集的第二损失函数的损失结果进行整合。
在一些实施例中,装置还包括:聚合单元,被配置成对训练样本集中的训练样本包括的所有数据集中每个数据集进行聚合,得到聚合后的所有数据集中每个数据集的各个子数据,其中,聚合用于表征根据每个数据集中与各个对象相关的数据特征,对该数据集的各个子数据进行组合。
在一些实施例中,训练单元中的点击率预测模型的损失函数基于每个数据集中各个子数据的聚合个数,对每个数据集的损失值进行加权平均。
在一些实施例中,训练单元中的第一损失函数为交叉熵损失函数或合页损失函数,第二损失函数为AUC代理损失函数。
在一些实施例中,训练单元中的点击率预测模型包括第一预测子模型、第二预测子模型和结果整合子模型;训练单元,包括:第一训练模块,被配置成利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第一预测子模型的输入数据,将与输入的数据集对应的各个对象的点击率作为第一预测子模型的期望输出数据,得到训练完成的第一预测子模型,其中,第一预测子模型用于表征以第一损失函数为目标函数;第二训练模块,被配置成利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第二预测子模型的输入数据,将与输入的数据集对应的点击率排序作为第二预测子模型的期望输出数据,得到训练完成的第二预测子模型,其中,第二预测子模型用于表征以第二损失函数为目标函数;确定模块,被配置成基于第一预测子模型、第二预测子模型和预设的结果整合子模型,确定点击率预测模型,其中,结果整合子模型用于表征对数据集的第一预测子模型的模型参数和相应数据集的第二预测子模型的模型参数进行整合。
在一些实施例中,训练单元中的AUC代理损失函数用于表征以AUC数值的最大化为目标,基于铰链损失函数而构建,AUC代理损失利用训练样本集中所有数据集的个数和每个数据集中子数据的个数计算得到。
在一些实施例中,训练单元中的点击率预测模型、第一预测子模型和第二预测子模型的模型构建方式包括以数据集的每个子数据为单位而构建、以数据集的两两子数据为单位而构建和以数据集对应的数据列表为单位而构建。
根据本申请的第四方面,提供了一种用于生成信息的装置,装置包括:获取单元,被配置成响应于接收到用户的访问请求,获取与访问请求对应的用户的行为数据;解析单元,被配置成对行为数据对应的各条日志进行解析,得到与各条日志对应的各个子数据,并生成包括各个子数据的数据集;生成单元,被配置成将数据集中的各个子数据输入至训练得到的点击率预测模型,生成与数据集中的各个子数据相对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,其中,点击率预测模型是通过如上述用于训练模型的方法中任一实施例的方法训练得到。
在一些实施例中,装置还包括:展示单元,被配置成基于点击率排序,选取得到目标对象,并将目标对象展示于用户。
根据本申请的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或第二方面中任一实现方式描述的方法。
根据本申请的第六方面,本申请提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,计算机指令用于使计算机执行如第一方面或第二方面中任一实现方式描述的方法。
根据本申请的技术采用获取训练样本集,其中,训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,其中,点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,第一损失函数用于对输出数据中数据集对应的各个对象的点击率的准确度进行计算,第二损失函数用于对输出数据中数据集对应的点击率排序的排序能力进行计算,解决了现有的点击率预测模型无法在训练过程中感知模型实际排序能力的问题。通过第一损失函数保证点击率的拟合准确率,并且通过第二损失函数保证模型具有较好的排序能力,完成基于CTR模型的多目标优化,在现有CTR模型的基础上,实现模型训练过程中能够同时感知到模型准确率和模型实际排序能力,并且沿着准确率提升和排序能力提高的方向进行学习。模型基于数据集进行预测,一个数据集对应一个用户请求,从而实现针对单次请求的模型准确率和模型排序能力的感知,更加符合实际场景,进一步帮助用户快速找到其所感兴趣的商品,提高包括用户和平台等在内的各方效率。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。
图1是根据本申请的用于训练模型的方法的第一实施例的示意图;
图2是可以实现本申请实施例的用于训练模型的方法的场景图;
图3是根据本申请的用于训练模型的方法的第二实施例的示意图;
图4是根据本申请的用于生成信息的方法的第一实施例的示意图;
图5是根据本申请的用于训练模型的装置的一个实施例的结构示意图;
图6是根据本申请的用于生成信息的装置的一个实施例的结构示意图;
图7是用来实现本申请实施例的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了根据本申请的用于训练模型的方法的第一实施例的示意图100。该用于训练模型的方法,包括以下步骤:
步骤101,获取训练样本集。
在本实施例中,执行主体(例如服务器或终端设备)可以通过有线连接或无线连接的方式从其他电子设备或者本地获取训练样本集。训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,数据集用于表征接收到用户的访问请求后,收集的用户针对各个对象内容的行为数据,数据集的各个子数据基于对行为数据对应的各条日志进行解析而生成。例如,一个批次一般为64个数据集,即64个用户请求,每个请求有4~10条日志。
在本实施例的一些可选的实现方式中,各个对象基于现有的点击率预测模型的预测结果选取得到。
在这里,上述行为数据可以是用户在展示的各个对象(预估得到的可能感兴趣的若干商品)上的各种操作行为的数据,操作行为可以包括:访问、下单等。上述行为数据的数量可以是一个,也可以是多个。对此,技术人员可以自行设定,本申请实施例不作限定。
需要说明的是,上述无线连接方式可以包括但不限于3G、4G、5G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
在本实施例的一些可选的实现方式中,在获取训练样本集之后,包括:对训练样本集中的训练样本包括的所有数据集中每个数据集进行聚合,得到聚合后的所有数据集中每个数据集的各个子数据,其中,聚合用于表征根据每个数据集中与各个对象相关的数据特征,对该数据集的各个子数据进行组合。与对象相关的数据特征可以包括:对象内容、用户信息、对象的上下文信息等。这里,上述数据特征的数量可以是一个,也可以是多个,对此,技术人员可以自行设定,本申请实施例不作限定。通过将训练数据按照请求粒度进行聚合,使模型训练更加精确,更加符合推荐场景。
步骤102,利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型。
在本实施例中,执行主体可以利用机器学习算法,将步骤101中得到的所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型。其中,点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,第一损失函数以准确度最大化为优化目标对输出数据中数据集对应的各个对象的点击率的准确度进行计算,第二损失函数以排序数量最大化为优化目标对输出数据中数据集对应的点击率排序的排序能力进行计算,点击率预测模型的损失函数用于表征对数据集的第一损失函数的损失结果和相应数据集的第二损失函数的损失结果进行整合。整合方式可以为自适应组合的方式,即通过超参数对第一损失函数的损失结果和第二损失函数的损失结果进行控制,超参数即可以人工调节,也可以通过网格搜索grid search找到一个表现最优的值。
需要说明的是,上述点击率预测模型可以基于Factorization Machines、DeepCross Network或xDeepFM等目前广泛研究和应用的公知技术而构建,技术人员可以根据实际需求,自行设定点击率预测模型的模型结构,本公开的实施例对此不做限定。
在本实施例的一些可选的实现方式中,点击率预测模型的模型构建方式包括以数据集的每个子数据为单位而构建,即Point-wise Model、以数据集的两两子数据为单位而构建,即Pair-wise Model和以数据集对应的数据列表为单位而构建,即List-wise Model。实现了灵活多样的模型训练,从而实现富于针对性的模型训练,提升了模型训练的精准度。
在本实施例的一些可选的实现方式中,第一损失函数可以为交叉熵损失函数或合页损失函数,第二损失函数可以为AUC代理损失函数。解决了现有技术中在利用AUC代理损失函数时无法在单次请求时对该次请求的所有对象(即候选商品集)的排序能力进行预测,导致不符合实际场景,预测不够准确的问题,实现了对现有AUC代理损失函数更加适合推荐场景的创新性改造。
在本实施例的一些可选的实现方式中,点击率预测模型的损失函数基于每个数据集中各个子数据的聚合个数,对每个数据集的损失值进行加权平均,实现了基于聚合后的训练样本的模型训练方法,提升了模型训练的精准度。
继续参见图2,本实施例的用于训练模型的方法200运行于服务器201中。服务器201首先获取训练样本集202,其中,训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,然后服务器201利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型203,其中,点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,第一损失函数用于对输出数据中数据集对应的各个对象的点击率的准确度进行计算,第二损失函数用于对输出数据中数据集对应的点击率排序的排序能力进行计算,点击率预测模型的损失函数用于表征对数据集的第一损失函数的损失结果和相应数据集的第二损失函数的损失结果进行整合。
本申请的上述实施例提供的用于训练模型的方法采用获取训练样本集,其中,训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,其中,点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,第一损失函数用于对输出数据中数据集对应的各个对象的点击率的准确度进行计算,第二损失函数用于对输出数据中数据集对应的点击率排序的排序能力进行计算,解决了现有的点击率预测模型无法在训练过程中感知模型实际排序能力的问题。通过第一损失函数保证点击率的拟合准确率,并且通过第二损失函数保证模型具有较好的排序能力,完成基于CTR模型的多目标优化,在现有CTR模型的基础上,实现模型训练过程中能够同时感知到模型准确率和模型实际排序能力,并且沿着准确率提升和排序能力提高的方向进行学习。模型基于数据集进行预测,一个数据集对应一个用户请求,从而实现针对单次请求的模型准确率和模型排序能力的感知,更加符合实际场景,进一步帮助用户快速找到其所感兴趣的商品,提高包括用户和平台等在内的各方效率。
进一步参考图3,其示出了用于训练模型的方法的第二实施例的示意图300。该方法的流程包括以下步骤:
步骤301,获取训练样本集。
步骤302,利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第一预测子模型的输入数据,将与输入的数据集对应的各个对象的点击率作为第一预测子模型的期望输出数据,得到训练完成的第一预测子模型。
在本实施例中,执行主体预先存储有点击率预测模型,点击率预测模型包括第一预测子模型、第二预测子模型和结果整合子模型。执行主体可以利用机器学习算法,将步骤301中获取到的所有数据集中每个数据集的各个子数据作为第一预测子模型的输入数据,将与输入的数据集对应的各个对象的点击率作为第一预测子模型的期望输出数据,调整第一预测子模型的模型参数,得到训练完成的第一预测子模型。第一预测子模型用于表征以第一损失函数为目标函数。第一损失函数以准确度最大化为优化目标对输出数据中数据集对应的各个对象的点击率的准确度进行计算,第一损失函数可以为交叉熵损失函数或合页损失函数。
步骤303,利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第二预测子模型的输入数据,将与输入的数据集对应的点击率排序作为第二预测子模型的期望输出数据,得到训练完成的第二预测子模型。
在本实施例中,执行主体可以将步骤301中获取到的所有数据集中每个数据集的各个子数据作为第二预测子模型的输入数据,将与输入的数据集对应的点击率排序作为第二预测子模型的期望输出数据,调整第二预测子模型的模型参数,得到训练完成的第二预测子模型。第二预测子模型用于表征以第二损失函数为目标函数。第二损失函数以排序数量最大化为优化目标对输出数据中数据集对应的点击率排序的排序能力进行计算,第二损失函数可以为AUC代理损失函数。
在本实施例的一些可选的实现方式中,AUC代理损失函数用于表征以AUC数值的最大化为目标,基于铰链损失函数而构建,AUC代理损失利用训练样本集中所有数据集的个数和每个数据集中子数据的个数计算得到。在引入AUC代理损失函数作为监督指标的同时,实现了对现有AUC代理损失函数更加适合推荐场景的创新性改造。
步骤304,基于第一预测子模型、第二预测子模型和预设的结果整合子模型,确定点击率预测模型。
在本实施例中,执行主体可以基于第一预测子模型、第二预测子模型和预设的结果整合子模型,确定点击率预测模型的模型参数,生成点击率预测模型。结果整合子模型用于表征对数据集的第一预测子模型的模型参数和相应数据集的第二预测子模型的模型参数进行整合。
在本实施例的一些可选的实现方式中,第一预测子模型和第二预测子模型的模型构建方式包括以数据集的每个子数据为单位而构建、以数据集的两两子数据为单位而构建和以数据集对应的数据列表为单位而构建。实现了灵活多样的模型训练,从而实现富于针对性的模型训练,提升了模型训练的精准度。
从图3中可以看出,与图1对应的实施例相比,本实施例中的用于训练模型的方法的示意图300采用获取训练样本集,利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第一预测子模型的输入数据,将与输入的数据集对应的各个对象的点击率作为第一预测子模型的期望输出数据,得到训练完成的第一预测子模型,利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第二预测子模型的输入数据,将与输入的数据集对应的点击率排序作为第二预测子模型的期望输出数据,得到训练完成的第二预测子模型,基于第一预测子模型、第二预测子模型和预设的结果整合子模型,确定点击率预测模型,在现有CTR模型的基础上,实现模型训练过程中能够同时感知到模型准确率和模型实际排序能力,并且沿着准确率提升和排序能力提高的方向进行学习。
进一步参考图4,其出了根据本申请的用于生成信息的方法的第一实施例的示意图400。该用于生成信息的方法,包括以下步骤:
步骤401,响应于接收到用户的访问请求,获取与访问请求对应的用户的行为数据。
在本实施例中,执行主体(例如服务器或终端设备)可以通过有线连接或无线连接的方式从其他电子设备或者本地获取与访问请求对应的用户的行为数据。
步骤402,对行为数据对应的各条日志进行解析,得到与各条日志对应的各个子数据,并生成包括各个子数据的数据集。
在本实施例中,执行主体可以对步骤401中获取到的行为数据对应的各条日志进行解析,得到与各条日志对应的各个子数据,并生成包括各个子数据的数据集。
步骤403,将数据集中的各个子数据输入至训练得到的点击率预测模型,生成与数据集中的各个子数据相对应的各个对象的点击率和与各个对象的点击率对应的点击率排序。
在本实施例中,执行主体可以将步骤402生成的数据集中的各个子数据输入至训练得到的点击率预测模型,生成与数据集中的各个子数据相对应的各个对象的点击率和与各个对象的点击率对应的点击率排序。点击率预测模型通过如上述用于训练模型的方法中任一实施例的方法训练得到。
在本实施例的一些可选的实现方式中,方法还包括:基于点击率排序,选取得到目标对象,并将目标对象展示于用户。帮助用户快速找到其所感兴趣的商品。
从图4中可以看出,与图1对应的实施例相比,本实施例中的用于生成信息的方法的流程400突出了采用训练得到的点击率预测模型,来生成与数据集中的各个子数据相对应的各个对象的点击率和与各个对象的点击率对应的点击率排序的步骤。由此,本实施例描述的方案可以生成更加精确的各个对象的点击率和点击率排序。
进一步参考图5,作为对上述图1~3所示方法的实现,本申请提供了一种用于训练模型的装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,除下面所记载的特征外,该装置实施例还可以包括与图1所示的方法实施例相同或相应的特征,以及产生与图1所示的方法实施例相同或相应的效果,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于训练模型的装置500包括:获取单元501和训练单元502,其中,获取单元,被配置成获取训练样本集,其中,训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,数据集用于表征接收到用户的访问请求后,收集的用户针对各个对象内容的行为数据,数据集的各个子数据基于对行为数据对应的各条日志进行解析而生成;训练单元,被配置成利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,其中,点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,第一损失函数用于对输出数据中数据集对应的各个对象的点击率的准确度进行计算,第二损失函数用于对输出数据中数据集对应的点击率排序的排序能力进行计算,点击率预测模型的损失函数用于表征对数据集的第一损失函数的损失结果和相应数据集的第二损失函数的损失结果进行整合。
在本实施例中,用于训练模型的装置500的获取单元501和训练单元502的具体处理及其所带来的技术效果可分别参考图1对应的实施例中的步骤101到步骤102的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,装置还包括:聚合单元,被配置成对训练样本集中的训练样本包括的所有数据集中每个数据集进行聚合,得到聚合后的所有数据集中每个数据集的各个子数据,其中,聚合用于表征根据每个数据集中与各个对象相关的数据特征,对该数据集的各个子数据进行组合。
在本实施例的一些可选的实现方式中,训练单元中的点击率预测模型的损失函数基于每个数据集中各个子数据的聚合个数,对每个数据集的损失值进行加权平均。
在本实施例的一些可选的实现方式中,训练单元中的第一损失函数为交叉熵损失函数或合页损失函数,第二损失函数为AUC代理损失函数。
在本实施例的一些可选的实现方式中,训练单元中的点击率预测模型包括第一预测子模型、第二预测子模型和结果整合子模型;训练单元,包括:第一训练模块,被配置成利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第一预测子模型的输入数据,将与输入的数据集对应的各个对象的点击率作为第一预测子模型的期望输出数据,得到训练完成的第一预测子模型,其中,第一预测子模型用于表征以第一损失函数为目标函数;第二训练模块,被配置成利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第二预测子模型的输入数据,将与输入的数据集对应的点击率排序作为第二预测子模型的期望输出数据,得到训练完成的第二预测子模型,其中,第二预测子模型用于表征以第二损失函数为目标函数;确定模块,被配置成基于第一预测子模型、第二预测子模型和预设的结果整合子模型,确定点击率预测模型,其中,结果整合子模型用于表征对数据集的第一预测子模型的模型参数和相应数据集的第二预测子模型的模型参数进行整合。
在本实施例的一些可选的实现方式中,训练单元中的AUC代理损失函数用于表征以AUC数值的最大化为目标,基于铰链损失函数而构建,AUC代理损失利用训练样本集中所有数据集的个数和每个数据集中子数据的个数计算得到。
在本实施例的一些可选的实现方式中,训练单元中的点击率预测模型、第一预测子模型和第二预测子模型的模型构建方式包括以数据集的每个子数据为单位而构建、以数据集的两两子数据为单位而构建和以数据集对应的数据列表为单位而构建。
本公开的上述实施例提供用于训练模型的装置,通过获取单元获取训练样本集,其中,训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,训练单元利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,其中,点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,第一损失函数用于对输出数据中数据集对应的各个对象的点击率的准确度进行计算,第二损失函数用于对输出数据中数据集对应的点击率排序的排序能力进行计算,丰富了模型的训练方式,有助于基于训练得到的模型生成更加精确的点击率和点击率排序。
继续参考参考图6,作为对上述图4所示方法的实现,本申请提供了一种用于生成信息的装置的一个实施例,该装置实施例与图4所示的方法实施例相对应,除下面所记载的特征外,该装置实施例还可以包括与图4所示的方法实施例相同或相应的特征,以及产生与图4所示的方法实施例相同或相应的效果,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的用于生成信息的装置600包括:获取单元601解析单元602和生成单元603,其中,获取单元,被配置成响应于接收到用户的访问请求,获取与访问请求对应的用户的行为数据;解析单元,被配置成对行为数据对应的各条日志进行解析,得到与各条日志对应的各个子数据,并生成包括各个子数据的数据集;生成单元,被配置成将数据集中的各个子数据输入至训练得到的点击率预测模型,生成与数据集中的各个子数据相对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,其中,点击率预测模型是通过如上述用于训练模型的方法中任一实施例的方法训练得到。
在本实施例中,用于生成信息的装置600的获取单元601、解析单元602和生成单元603的具体处理及其所带来的技术效果可分别参考图4对应的实施例中的步骤401到步骤403的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,装置还包括:展示单元,被配置成基于点击率排序,选取得到目标对象,并将目标对象展示于用户。
本公开的上述实施例提供用于训练模型的装置,通过获取单元获取与访问请求对应的用户的行为数据,解析单元对行为数据对应的各条日志进行解析,得到与各条日志对应的各个子数据,并生成包括各个子数据的数据集,生成单元将数据集中的各个子数据输入至训练得到的点击率预测模型,生成与数据集中的各个子数据相对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,其中,点击率预测模型是通过如上述用于训练模型的方法中任一实施例的方法训练得到,使生成的点击率和点击率排序更加精确。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的用于训练模型的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的用于训练模型的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的用于训练模型的方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的用于训练模型的方法对应的程序指令/模块(例如,附图5所示的获取单元501和训练单元502)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的用于训练模型的方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于训练模型的电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至用于训练模型的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用于训练模型的方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与用于训练模型的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案采用获取训练样本集,其中,训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序,利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,其中,点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,第一损失函数用于对输出数据中数据集对应的各个对象的点击率的准确度进行计算,第二损失函数用于对输出数据中数据集对应的点击率排序的排序能力进行计算,解决了现有的点击率预测模型无法在训练过程中感知模型实际排序能力的问题。通过第一损失函数保证点击率的拟合准确率,并且通过第二损失函数保证模型具有较好的排序能力,完成基于CTR模型的多目标优化,在现有CTR模型的基础上,实现模型训练过程中能够同时感知到模型准确率和模型实际排序能力,并且沿着准确率提升和排序能力提高的方向进行学习。模型基于数据集进行预测,一个数据集对应一个用户请求,从而实现针对单次请求的模型准确率和模型排序能力的感知,更加符合实际场景,进一步帮助用户快速找到其所感兴趣的商品,提高包括用户和平台等在内的各方效率。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (20)

1.一种用于训练模型的方法,所述方法包括:
获取训练样本集,其中,所述训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与所述数据集对应的各个对象的点击率和与所述各个对象的点击率对应的点击率排序,所述数据集用于表征接收到用户的访问请求后,收集的所述用户针对各个对象内容的行为数据,所述数据集的各个子数据基于对所述行为数据对应的各条日志进行解析而生成;
利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的所述数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,其中,所述点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,所述第一损失函数用于对所述输出数据中所述数据集对应的各个对象的点击率的准确度进行计算,所述第二损失函数用于对所述输出数据中所述数据集对应的点击率排序的排序能力进行计算,所述点击率预测模型的损失函数用于表征对所述数据集的所述第一损失函数的损失结果和相应数据集的所述第二损失函数的损失结果进行整合。
2.根据权利要求1所述的方法,其中,在所述获取训练样本集之后,包括:
对所述训练样本集中的训练样本包括的所有数据集中每个数据集进行聚合,得到聚合后的所有数据集中每个数据集的各个子数据,其中,所述聚合用于表征根据每个所述数据集中与各个对象相关的数据特征,对该数据集的各个子数据进行组合。
3.根据权利要求2所述的方法,其中,所述点击率预测模型的损失函数基于每个数据集中各个子数据的聚合个数,对每个所述数据集的损失值进行加权平均。
4.根据权利要求1所述的方法,其中,所述第一损失函数为交叉熵损失函数或合页损失函数,所述第二损失函数为AUC代理损失函数。
5.根据权利要求4所述的方法,其中,所述点击率预测模型包括第一预测子模型、第二预测子模型和结果整合子模型;
所述利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的所述数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,包括:
利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第一预测子模型的输入数据,将与输入的所述数据集对应的各个对象的点击率作为第一预测子模型的期望输出数据,得到训练完成的所述第一预测子模型,其中,所述第一预测子模型用于表征以所述第一损失函数为目标函数;
利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第二预测子模型的输入数据,将与输入的所述数据集对应的点击率排序作为第二预测子模型的期望输出数据,得到训练完成的所述第二预测子模型,其中,所述第二预测子模型用于表征以所述第二损失函数为目标函数;
基于所述第一预测子模型、所述第二预测子模型和预设的所述结果整合子模型,确定所述点击率预测模型,其中,所述结果整合子模型用于表征对所述数据集的所述第一预测子模型的模型参数和相应数据集的所述第二预测子模型的模型参数进行整合。
6.根据权利要求4所述的方法,其中,所述AUC代理损失函数用于表征以AUC数值的最大化为目标,基于铰链损失函数而构建,所述AUC代理损失利用所述训练样本集中所有数据集的个数和每个所述数据集中子数据的个数计算得到。
7.根据权利要求5所述的方法,其中,所述点击率预测模型、所述第一预测子模型和所述第二预测子模型的模型构建方式包括以所述数据集的每个子数据为单位而构建、以所述数据集的两两子数据为单位而构建和以所述数据集对应的数据列表为单位而构建。
8.一种用于生成信息的方法,所述方法包括:
响应于接收到用户的访问请求,获取与所述访问请求对应的所述用户的行为数据;
对所述行为数据对应的各条日志进行解析,得到与所述各条日志对应的各个子数据,并生成包括所述各个子数据的数据集;
将所述数据集中的各个子数据输入至训练得到的点击率预测模型,生成与所述数据集中的各个子数据相对应的各个对象的点击率和与所述各个对象的点击率对应的点击率排序,其中,所述点击率预测模型是通过如权利要求1-7之一所述的方法训练得到的。
9.根据权利要求8所述的方法,还包括:
基于所述点击率排序,选取得到目标对象,并将所述目标对象展示于所述用户。
10.一种用于训练模型的装置,所述装置包括:
获取单元,被配置成获取训练样本集,其中,所述训练样本集中的训练样本包括一个批次的所有数据集中每个数据集的各个子数据、与所述数据集对应的各个对象的点击率和与所述各个对象的点击率对应的点击率排序,所述数据集用于表征接收到用户的访问请求后,收集的所述用户针对各个对象内容的行为数据,所述数据集的各个子数据基于对所述行为数据对应的各条日志进行解析而生成;
训练单元,被配置成利用机器学习算法,将所有数据集中每个数据集的各个子数据作为输入数据,将与输入的所述数据集对应的各个对象的点击率和与各个对象的点击率对应的点击率排序作为期望输出数据,训练得到点击率预测模型,其中,所述点击率预测模型的损失函数利用第一损失函数和第二损失函数而构建,所述第一损失函数用于对所述输出数据中所述数据集对应的各个对象的点击率的准确度进行计算,所述第二损失函数用于对所述输出数据中所述数据集对应的点击率排序的排序能力进行计算,所述点击率预测模型的损失函数用于表征对所述数据集的所述第一损失函数的损失结果和相应数据集的所述第二损失函数的损失结果进行整合。
11.根据权利要求10所述的装置,还包括:
聚合单元,被配置成对所述训练样本集中的训练样本包括的所有数据集中每个数据集进行聚合,得到聚合后的所有数据集中每个数据集的各个子数据,其中,所述聚合用于表征根据每个所述数据集中与各个对象相关的数据特征,对该数据集的各个子数据进行组合。
12.根据权利要求11所述的装置,其中,所述训练单元中的所述点击率预测模型的损失函数基于每个数据集中各个子数据的聚合个数,对每个所述数据集的损失值进行加权平均。
13.根据权利要求10所述的装置,其中,所述训练单元中的所述第一损失函数为交叉熵损失函数或合页损失函数,所述第二损失函数为AUC代理损失函数。
14.根据权利要求13所述的装置,其中,所述训练单元中的所述点击率预测模型包括第一预测子模型、第二预测子模型和结果整合子模型;
所述训练单元,包括:
第一训练模块,被配置成利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第一预测子模型的输入数据,将与输入的所述数据集对应的各个对象的点击率作为第一预测子模型的期望输出数据,得到训练完成的所述第一预测子模型,其中,所述第一预测子模型用于表征以所述第一损失函数为目标函数;
第二训练模块,被配置成利用机器学习算法,将所有数据集中每个数据集的各个子数据作为第二预测子模型的输入数据,将与输入的所述数据集对应的点击率排序作为第二预测子模型的期望输出数据,得到训练完成的所述第二预测子模型,其中,所述第二预测子模型用于表征以所述第二损失函数为目标函数;
确定模块,被配置成基于所述第一预测子模型、所述第二预测子模型和预设的所述结果整合子模型,确定所述点击率预测模型,其中,所述结果整合子模型用于表征对所述数据集的所述第一预测子模型的模型参数和相应数据集的所述第二预测子模型的模型参数进行整合。
15.根据权利要求13所述的装置,其中,所述训练单元中的所述AUC代理损失函数用于表征以AUC数值的最大化为目标,基于铰链损失函数而构建,所述AUC代理损失利用所述训练样本集中所有数据集的个数和每个所述数据集中子数据的个数计算得到。
16.根据权利要求14所述的装置,其中,所述训练单元中的所述点击率预测模型、所述第一预测子模型和所述第二预测子模型的模型构建方式包括以所述数据集的每个子数据为单位而构建、以所述数据集的两两子数据为单位而构建和以所述数据集对应的数据列表为单位而构建。
17.一种用于生成信息的装置,所述装置包括:
获取单元,被配置成响应于接收到用户的访问请求,获取与所述访问请求对应的所述用户的行为数据;
解析单元,被配置成对所述行为数据对应的各条日志进行解析,得到与所述各条日志对应的各个子数据,并生成包括所述各个子数据的数据集;
生成单元,被配置成将所述数据集中的各个子数据输入至训练得到的点击率预测模型,生成与所述数据集中的各个子数据相对应的各个对象的点击率和与所述各个对象的点击率对应的点击率排序,其中,所述点击率预测模型是通过如权利要求1-7之一所述的方法训练得到的。
18.根据权利要求17所述的装置,还包括:
展示单元,被配置成基于所述点击率排序,选取得到目标对象,并将所述目标对象展示于所述用户。
19.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法或权利要求8-9中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法或权利要求8-9中任一项所述的方法。
CN202110083297.2A 2021-01-21 2021-01-21 用于训练模型的方法、装置、设备以及存储介质 Pending CN113780548A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110083297.2A CN113780548A (zh) 2021-01-21 2021-01-21 用于训练模型的方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110083297.2A CN113780548A (zh) 2021-01-21 2021-01-21 用于训练模型的方法、装置、设备以及存储介质

Publications (1)

Publication Number Publication Date
CN113780548A true CN113780548A (zh) 2021-12-10

Family

ID=78835543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110083297.2A Pending CN113780548A (zh) 2021-01-21 2021-01-21 用于训练模型的方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN113780548A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115913413A (zh) * 2023-02-22 2023-04-04 西安电子科技大学 一种智能化空间毫米波传播特征分析方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115913413A (zh) * 2023-02-22 2023-04-04 西安电子科技大学 一种智能化空间毫米波传播特征分析方法
CN115913413B (zh) * 2023-02-22 2023-07-14 西安电子科技大学 一种智能化空间毫米波传播特征分析方法

Similar Documents

Publication Publication Date Title
US10515400B2 (en) Learning vector-space representations of items for recommendations using word embedding models
CN111259222B (zh) 物品推荐方法、系统、电子设备及存储介质
CN111695695B (zh) 用户决策行为量化分析方法及装置
CN111311321B (zh) 用户消费行为预测模型训练方法、装置、设备及存储介质
CN111460384B (zh) 策略的评估方法、装置和设备
CN110851706B (zh) 用户点击模型的训练方法、装置、电子设备及存储介质
US20190171775A1 (en) System and methods for faster processor comparisons of visual graph features
CN111598247B (zh) 量子吉布斯态生成方法、装置及电子设备
CN110704509A (zh) 数据分类方法、装置、设备及存储介质
CN112579909A (zh) 对象推荐方法及装置、计算机设备和介质
CN110706147B (zh) 图像处理的环境确定方法、装置、电子设备和存储介质
CN111582479A (zh) 神经网络模型的蒸馏方法和装置
CN112288483A (zh) 用于训练模型的方法和装置、用于生成信息的方法和装置
CN111563592A (zh) 基于超网络的神经网络模型生成方法和装置
CN112380104A (zh) 用户属性识别方法、装置、电子设备及存储介质
CN112000893A (zh) 常驻区域预测方法、装置、设备及存储介质
CN114791982A (zh) 对象推荐方法和装置
CN111461306B (zh) 特征评估的方法及装置
US20210374778A1 (en) User experience management system
CN113780548A (zh) 用于训练模型的方法、装置、设备以及存储介质
CN112819497B (zh) 转化率预测方法、装置、设备和存储介质
CN111177479A (zh) 获取关系网络图中节点的特征向量的方法以及装置
CN113656689B (zh) 模型生成方法和网络信息的推送方法
CN112699302B (zh) 一种基于测地距离的实时推荐方法
CN115203564A (zh) 信息流推荐方法、装置及计算机程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination