CN112818291B - 转化率预测方法、装置、设备和介质 - Google Patents

转化率预测方法、装置、设备和介质 Download PDF

Info

Publication number
CN112818291B
CN112818291B CN201911130006.XA CN201911130006A CN112818291B CN 112818291 B CN112818291 B CN 112818291B CN 201911130006 A CN201911130006 A CN 201911130006A CN 112818291 B CN112818291 B CN 112818291B
Authority
CN
China
Prior art keywords
model
candidate object
sub
convergence time
conversion rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911130006.XA
Other languages
English (en)
Other versions
CN112818291A (zh
Inventor
丁娇
杨雷
李沛龙
曹旭磊
刘琦凯
曾云峰
李晨瑞
黄旺
曹金营
朱威
胡均毅
秦首科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201911130006.XA priority Critical patent/CN112818291B/zh
Publication of CN112818291A publication Critical patent/CN112818291A/zh
Application granted granted Critical
Publication of CN112818291B publication Critical patent/CN112818291B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Strategic Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Biomedical Technology (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)

Abstract

本申请实施例公开了一种转化率预测方法、装置、设备和介质,涉及大数据技术领域。具体实现方案为:若检测到新增候选对象,则基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长;根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型;基于所述目标区间子模型,对所述新增候选对象进行转化率预测。因为采用了由通用子模型过度至区间子模型进行转化率预测的技术手段,新增候选对象可以自动从粗粒度通用预测过度到区间子模型的精确预测,促进了模型的适用范围自动化推广,提高了转化率预测的准确率。

Description

转化率预测方法、装置、设备和介质
技术领域
本申请实施例涉及计算机技术领域,尤其涉及大数据技术领域,具体涉及一种转化率预测方法、装置、设备和介质。
背景技术
在互联网搜索中,可以采用多任务学习(Multi Task Learning,MTL)方式建模来预测例如广告主等对象的用户转化率,从而提高为对象带来的效益。目前基于多任务学习的转化率模型中,适用对象范围较为固定,预测维度单一,无法进行大范围的推广,转化率的预测准确率较低。
发明内容
本申请实施例提供了一种转化率预测方法、装置、设备和介质,能够促进了模型的适用范围自动化推广,提高转化率预测的准确率。
第一方面,本申请实施例提供了一种转化率预测方法,包括:
若检测到新增候选对象,则基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长;
根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型;
基于所述目标区间子模型,对所述新增候选对象进行转化率预测。
上述申请中的一个实施例具有如下优点或有益效果:由通用子模型过度至区间子模型进行转化率预测,新增候选对象可以自动从粗粒度通用预测过度到区间子模型的精确预测,促进了模型的适用范围自动化推广,提高了转化率预测的准确率。
可选的,所述基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长,包括:
将所述新增候选对象的转化数据,加入到所述通用子模型的周期性训练中,以更新所述通用子模型;
根据更新后的通用子模型,确定所述新增候选对象的模型收敛时长。
上述申请中的一个实施例具有如下优点或有益效果:通过将新增候选对象的转化数据加入到通用子模型的周期性训练中,得到更新后的通用子模型,以使通用子模型能够学习到新增候选对象的数据特征,提高通用子模型对于新增候选对象预测的准确率,以及新增候选对象模型收敛时长确定的准确率。
可选的,所述根据更新后的通用子模型,确定所述新增候选对象的模型收敛时长,包括:
基于更新后的通用子模型,根据所述新增候选对象当前周期内的转化数据,确定所述新增候选对象当前周期的转化率;
根据所述新增候选对象当前周期的转化率,确定所述新增候选对象当前周期的模型收敛指标;
若所述新增候选对象当前周期的模型收敛指标达到预设指标阈值,则将所述新增候选对象的训练时长,确定为所述新增候选对象的模型收敛时长。
上述申请中的一个实施例具有如下优点或有益效果:通过采用通用子模型学习新增候选对象的数据特征,并用通用子模型对新增候选对象进行转化率预测,确定新增候选对象的模型收敛指标,以此评估新增候选对象的模型收敛时长,为新增候选对象数据特征的精确学习提供条件。
可选的,在所述基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长之前,还包括:
基于所述通用子模型,根据所述新增候选对象的转化数据,对所述新增候选对象进行转化率预测。
上述申请中的一个实施例具有如下优点或有益效果:可以通过通用子模型对新增候选对象进行粗粒度的转化率预测,避免传统多任务学习中在无学习的情况下不能对新增候选对象进行转化率预测。
可选的,所述根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型,包括:
将所述新增候选对象的模型收敛时长,与所述多任务模型中的区间子模型关联的模型收敛时长区间进行比较;
根据模型收敛时长的比较结果,将模型收敛时长区间与所述新增候选对象的模型收敛时长相符的区间子模型,确定为目标区间子模型。
上述申请中的一个实施例具有如下优点或有益效果:通过模型收敛时长来组织对象进行多任务模型训练,以使各个区间子模型都能够对模型收敛时长指标在区间之内的对象进行精准预测,提高转化率预测的准确率。
可选的,在所述根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型之后,还包括:
将所述新增候选对象的转化数据,加入到所述目标区间子模型的周期性训练中,以更新所述目标区间子模型。
上述申请中的一个实施例具有如下优点或有益效果:通过子模型周期性的基于全部候选对象的转化数据进行模型训练和更新,区间子模型周期性的基于指标区间相符的候选对象的转化数据进行模型训练和更新,保障各候选对象转化数据的精确学习,以及保障各个子模型的实时适用性。
可选的,所述区间子模型是基于与所述区间子模型关联的模型收敛时长区间相符的候选对象的转化数据训练得到,所述通用子模型是基于至少两个模型收敛时长区间的候选对象的转化数据训练得到。
上述申请中的一个实施例具有如下优点或有益效果:区间子模型基于指标区间相符的候选对象的转化数据训练得到,以使区间子模型对于指标区间相符的候选对象进行精确的转化率预测;通用子模型基于覆盖至少两个指标区间的候选对象的转化数据训练得到,以使多任务模型具有普遍适用性,且通过通用子模型向区间子模型的过度,实现新增候选对象的精确预测。
第二方面,本申请实施例提供了一种转化率预测装置,包括:
模型收敛时长确定模块,用于若检测到新增候选对象,则基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长;
模型确定模块,用于根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型;
转化率预测模块,用于基于所述目标区间子模型,对所述新增候选对象进行转化率预测。
第三方面,本申请实施例提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任意实施例所述的转化率预测方法。
第四方面,本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请任意实施例所述的转化率预测方法。
上述申请中的一个实施例具有如下优点或有益效果:在多任务模型进行转化率预测的过程中,通过多任务模型中的通用子模型可以确定新增候选对象的模型收敛时长,从而为新增候选对象选择模型收敛时长相符的目标区间子模型,基于目标区间子模型实现对新增候选对象转化率的精确预测。因为采用了由通用子模型过度至区间子模型进行转化率预测的技术手段,新增候选对象可以自动从粗粒度通用预测过度到区间子模型的精确预测,促进了模型的适用范围自动化推广,提高了转化率预测的准确率。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的一种转化率预测方法的流程图;
图2是根据本申请第二实施例的一种转化率预测方法的流程图;
图3是根据本申请第三实施例的多任务模型创建的流程图;
图4是根据本申请第四实施例的转化率预测装置的结构示意图;
图5是用来实现本申请实施例的转化率预测方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
第一实施例
图1是根据本申请第一实施例的一种转化率预测方法的流程图,本实施例可适用于基于对象的转化数据进行转化率预测的情况,该方法可由一种转化率预测装置来执行,该装置采用软件和/或硬件的方式实现,优选是配置于电子设备中,例如手机、电脑或服务器等。如图1所示,该方法具体包括如下:
S110、若检测到新增候选对象,则基于多任务模型中的通用子模型,确定新增候选对象的模型收敛时长。
在本申请具体实施例中,多任务模型用于转化率的预测,多任务模型中包括至少两个子模型,每个子模型都是转化率预测模型。例如以特征数据为输入,以转化率为输出,以交叉熵损失函数作为训练目标,采用Adam优化算法训练整个神经网络,得到转化率预测模型。本实施例不对转化率预测模型的训练算法进行限定,任何能够实现转化率预测的算法都可以应用于本实施例中。
本实施例中,候选对象是指多任务模型训练和转化率预测时所针对的具体对象,例如广告主等。在搜索广告中,广告主通过付费,希望提高广告的转化率(ConversionRate,CVR),获取尽可能多的转化,例如在线咨询、订单提交等,以通过高转化率获得高的投资回报率。为了保障转化率预测的准确率,优选采用基于候选对象每个生成周期内的转化数据训练得到的多任务模型,对候选对象当前周期内的转化数据进行预测。相应的,新增候选对象是指并没有参与多任务模型训练的对象。
本实施例中,采用能够反映模型训练效果的模型收敛指标作为多任务模型训练时样本的组织依据,由于模型收敛指标是所有维度信息影响下的综合效果,因此基于模型收敛指标来组织样本并训练多任务模型,可以考虑到各维度的异质性,提高转化率模型的预测准确率。具体的,本实施例采用模型收敛时长来表示模型收敛指标的收敛程度。本实施例不对模型收敛指标进行限定,任何能够反映模型训练效果的模型收敛指标都可以应用于本实施例中。
示例性的,模型收敛指标可以为ROC(Receiver Operating Characteristic,接收者操作特征)曲线下面积(Area Under Curve,AUC)、MAE(Mean Absolute Error,平均绝对误差)、MSE(Mean Square Error,均方误差)或COPC(Click Over Predicted Click,点击预测点击)等。以AUC为例,AUC是用来衡量广告排序好坏的指标,通常介于x=y直线的上方,介于0.5到1之间,AUC的数值越接近1越好。相应的,基于广告主的转化数据是以天为周期逐天生成的,因此模型是逐天训练更新的。在任一样本参与模型训练的过程中,预先设定一个AUC阈值,如基于实际样本情况确定AUC阈值为0.7。进而自该样本参与训练之日起,逐天评估模型对于该样本的AUC值,将AUC值第一次达到AUC阈值时的天数作为AUC增长速度,即模型收敛时长。样本的模型收敛时长通常是恒定不变的,可直接拿来使用。
本实施例中,基于多任务学习所构建的多任务模型中包括通用子模型和至少一个区间子模型。可选的,区间子模型是基于与区间子模型关联的模型收敛时长区间相符的候选对象的转化数据训练得到,通用子模型是基于覆盖至少两个模型收敛时长区间的候选对象的转化数据训练得到,例如通用子模型可以是基于全部模型收敛时长区间的候选对象的转化数据训练得到。其中,多任务模型的创建过程将在后续实施例中进行解释说明。
本实施例中,基于预测准确率的考虑,由于多任务模型已对作为训练样本的候选对象的数据特征进行了学习,因此优选对作为训练样本的候选对象,基于其当前的转化数据进行转化率预测。此外,若检测到新增候选对象,即该新增候选对象没有参与多任务模型的训练,则可以采用多任务模型中的通用子模型对新增候选对象进行粗粒度的转化率预测。其次,可以将新增候选对象加入到多任务模型的周期性训练中,以对新增候选对象的数据特征进行学习,便于后续可以对该新增候选对象进行越来越精确的转化率预测。
具体的,可以为每个候选对象添加全局唯一标识,在基于多任务模型进行预测时,首先根据待预测对象的标识进行识别,判断待预测对象是否为新增的对象。若检测到新增候选对象,基于多任务模型中的通用子模型进行粗粒度的转化率预测。其次从当前周期起将新增候选对象加入到通用子模型的周期性训练中,并基于训练更新后的通用子模型,对新增候选对象的新一周期内的转化数据进行转化率预测,根据转化率预测结果评估新增候选对象的模型收敛指标。将新增候选对象当前周期的模型收敛指标与预设指标阈值进行比较,以得到新增候选对象的模型收敛时长。
S120、根据新增候选对象的模型收敛时长,从多任务模型中确定目标区间子模型。
在本申请具体实施例中,由于多任务模型中各区间子模型都关联有一定的模型收敛时长区间,因此可以将新增候选对象的模型收敛时长,与多任务模型中的区间子模型关联的模型收敛时长区间进行比较,将模型收敛时长区间与新增候选对象的模型收敛时长相符的区间子模型,确定为目标区间子模型。由于各区间子模型是专门用于对落入到关联模型收敛时长区间内的对象进行转化率预测的,因此基于目标区间子模型,可以相对于通用子模型来说提高预测准确率。
此外,鉴于后续可以继续对新增候选对象进行转化率预测,为了提高对新增候选对象预测的准确率,可以从当前周期起将新增候选对象的转化数据,加入到目标区间子模型的周期性训练中,以更新目标区间子模型。进而多任务模型中的通用子模型和目标区间子模型都能够从当前周期起,对新增候选对象的数据特征进行学习,使得已构建的多任务模型的适用范围得到了自动化推广,提高了多任务模型对于新增候选对象预测的准确率。此外,无需新增候选对象的历史转化数据,避免多任务模型的重新训练,降低模型维护成本。
S130、基于目标区间子模型,对新增候选对象进行转化率预测。
在本申请具体实施例中,多任务模型将新增候选对象的转化数据输入至目标区间子模型中,通过目标区间子模型实现对新增候选对象的精确预测。
本实施例的技术方案,在多任务模型进行转化率预测的过程中,通过多任务模型中的通用子模型可以确定新增候选对象的模型收敛时长,从而为新增候选对象选择模型收敛时长相符的目标区间子模型,基于目标区间子模型实现对新增候选对象转化率的精确预测。因为采用了由通用子模型过度至区间子模型进行转化率预测的技术手段,新增候选对象可以自动从粗粒度通用预测过度到区间子模型的精确预测,促进了模型的适用范围自动化推广,提高了转化率预测的准确率。
第二实施例
图2是根据本申请第二实施例的一种转化率预测方法的流程图,本实施例在上述第一实施例的基础上,进一步对基于通用子模型对新增候选对象的模型收敛时长的确定方式进行解释说明,能够在得到新增候选对象参与模型训练得到的通用子模型的基础上,根据更新后的通用子模型对于新增候选对象的预测结果,评估新增候选对象的模型收敛指标和模型收敛时长。如图2所示,该方法具体包括如下:
S210、若检测到新增候选对象,则基于多任务模型中的通用子模型,根据新增候选对象的转化数据,对新增候选对象进行转化率预测。
在本申请具体实施例中,新增候选对象是指历史上并没有参与多任务模型训练的对象。例如,可以为每个候选对象添加全局唯一标识,在基于多任务模型进行预测时,首先根据待预测对象的标识进行识别,判断待预测对象是否为新增的对象。
本实施例中,当新增候选对象的转化数据输入至多任务模型时,若检测到新增候选对象,为了得到新增候选对象的转化率,可以将新增候选对象的转化数据输入至多任务模型中的通用子模型中,通过通用子模型对新增候选对象进行转化率预测。
S220、将新增候选对象的转化数据,加入到通用子模型的周期性训练中,以更新通用子模型。
在本申请具体实施例中,为了提高新增候选对象后期预测的准确率,可以在新增候选对象接触多任务模型起,无需考虑新增候选对象的历史转化数据。鉴于对象的转化数据是周期性生成的,例如逐天生成,相应的多任务模型也是在周期性训练更新中。因此在当前未知新增候选对象的模型收敛时长的情况下,从新增候选对象当前周期的转化数据开始,加入到通用子模型的周期性训练中,以使通用子模型逐渐学习到新增候选对象的数据特征,逐步提高通用子模型对于新增候选对象的预测准确率。
S230、根据更新后的通用子模型,确定新增候选对象的模型收敛时长。
在本申请具体实施例中,通用子模型在每个周期内更新训练之前,首先对新增候选对象当前周期内的转化数据进行转化率预测,其次依据包括新增候选对象的全部候选对象当前周期内的转化数据,对通用子模型进行训练更新。其中,根据新增候选对象的转化率预测结果,来评估新增候选对象的模型收敛指标,并根据模型收敛指标与预设指标阈值的比较结果,确定当前是否可以得到新增候选对象的模型收敛时长及其具体取值。
可选的,基于更新后的通用子模型,根据新增候选对象当前周期内的转化数据,确定新增候选对象当前周期的转化率;根据新增候选对象当前周期的转化率,确定新增候选对象当前周期的模型收敛指标;若新增候选对象当前周期的模型收敛指标达到预设指标阈值,则将新增候选对象的训练时长,确定为新增候选对象的模型收敛时长。
示例性的,假设以天为周期,新增候选对象在日期d1时通过多任务模型进行了转化率预测,进而将增候选对象在日期d1这一天的转化数据加入到多任务模型中通用子模型的训练中。从第二天起,首先采用前一天更新训练的通用子模型对新增候选对象第二天的转化数据进行转化率预测,并继续采用包括新增候选对象的全部候选对象第二天的转化数据对通用子模型进行训练更新。其中,可以采用现有的模型收敛指标评估工具,例如AUC评估工具,对新增候选对象的转化率预测结果进行评估,得到第二天的模型收敛指标。并将模型收敛指标与预设指标阈值进行比较,若达到预设指标阈值,则将当前日期di与日期d1做差,取差值作为模型收敛时长。
S240、将新增候选对象的模型收敛时长,与多任务模型中的区间子模型关联的模型收敛时长区间进行比较;根据模型收敛时长的比较结果,将模型收敛时长区间与新增候选对象的模型收敛时长相符的区间子模型,确定为目标区间子模型。
在本申请具体实施例中,通过通用子模型对于新增候选对象一段时间的训练,在得到新增候选对象的模型收敛时长后,为了进一步提高多任务模型对于新增候选对象预测的准确率,可以将新增候选对象分配至模型收敛时长区间相符的区间子模型中进行训练。
具体的,将新增候选对象的模型收敛时长,与多任务模型中各个区间子模型关联的模型收敛时长区间进行比较,将模型收敛时长所落入区间的区间子模型确定为目标区间子模型。
S250、将新增候选对象的转化数据,加入到目标区间子模型的周期性训练中,以更新目标区间子模型。
在本申请具体实施例中,从新增候选对象当前周期的转化数据开始,加入到目标区间子模型的周期性训练中,以使目标区间子模型逐渐学习到新增候选对象的数据特征,逐步提目标区间子模型对于新增候选对象的预测准确率。同时,通用子模型也继续对新增候选对象进行学习。
S260、基于目标区间子模型,对新增候选对象进行转化率预测。
在本申请具体实施例中,当对新增候选对象进行再次预测时,可以通过模型收敛时长的比较,直接分配目标区间子模型对新增候选对象进行转化率预测。实现了新增候选对象加入多任务模型中的平滑过渡,不仅提高了多任务模型对于新增候选对象转化率预测的准确率,而且降低了多任务模型的维护成本。
本实施例的技术方案,通过多任务模型中的通用子模型可以对新增候选对象进行粗粒度的转化率预测,并将新增候选对象加入到通用子模型的周期性训练中,基于通用子模型确定新增候选对象的模型收敛时长,从而为新增候选对象选择模型收敛时长相符的目标区间子模型,将新增候选对象同时也加入到目标区间子模型的周期性训练中,基于目标区间子模型实现对新增候选对象转化率的精确预测。因为采用了由通用子模型过度至区间子模型进行转化率预测的技术手段,新增候选对象可以自动从粗粒度通用预测过度到区间子模型的精确预测实现了新增候选对象加入多任务模型中的平滑过渡,不仅提高了多任务模型对于新增候选对象转化率预测的准确率,而且降低了多任务模型的维护成本。促进了模型的适用范围自动化推广,提高了转化率预测的准确率。
第三实施例
图3是根据本申请第三实施例的多任务模型创建的流程图,本实施例在上述第一实施例的基础上,进一步对多任务模型从无到有的创建过程进行解释说明,能够在模型收敛指标评估的基础上,基于模型收敛时长进行样本的组织来创建多任务模型。如图3所示,该多任务模型创建流程具体包括如下:
A、确定候选对象的模型收敛时长。
本实施例中,由于推广商品、服务等的差异,不同广告主的转化类型、转化率、转化价值、转化路径等指标也差异很大,包含各维度转化信息的转化数据呈现显著的异质性。其中,转化数据包括转化类型、转化价值、转化路径、订单数量、用户等。转化类型是指转化的具体形式,可以包括订单提交、电话咨询等。转化价值是指广告主所得到的收益。转化路径是指广告被点击之后,到成功转化过程中,用户的操作行为经过的链接或网页等。若以至少一个维度信息作为多任务模型中各子模型训练样本的组织依据,则训练得到的多任务模型不能充分考虑各维度转化信息的异质性,降低多任务模型对于转化率预测的准确率。
本实施例中,采用能够反映模型训练效果的模型收敛指标作为多任务模型训练时样本的组织依据。具体的,通过所有候选对象的转化数据来训练一个单任务模型。基于广告主的转化数据是逐天生成的,因此以天为周期训练该单任务模型。即每一天中首先采用前一天训练得到的单任务模型对任一候选对象当天的转化数据进行转化率预测,根据转化率预测结果评估得到该候选对象的AUC值等模型收敛指标。其次采用所有候选对象当天的转化数据继续训练并更新该单任务模型,以此循环。
其中,若任一候选对象的AUC值等模型收敛指标达到预设指标阈值,则统计该候选对象参与训练之日起至当天的天数,作为AUC增长速度,即该候选对象的模型收敛时长。此外,若达到最长训练日期阈值时仍未得到某一候选对象的模型收敛时长,则可以确定该候选对象的模型收敛时长为正无穷。
B、划分模型收敛时长区间,每个模型收敛时长区间对应建立一个区间子模型,并建立一个通用子模型。
本实施例中,模型收敛时长介于0到正无穷,可以预先将模型收敛时长划分为N个连续的区间,例如[0,d1]、[d1,d2]、…、[dN-1,正无穷]。每个区间对应建立一个区间子任务模型,同时建立一个通用子模型。
C、根据每个候选对象的模型收敛时长所属的区间,确定每个候选对象关联的区间子模型。
本实施例中,将每个候选对象的模型收敛时长,与区间子模型关联的模型收敛时长区间进行比较,将模型收敛时长多落入的模型收敛时长区间对应的区间子模型,确定为该候选对象所应分配训练的区间子模型。
D、利用区间子任务模型对应的候选对象的转化数据,训练各个区间子任务模型,得到包含区间子任务模型的多任务模型。
E、利用所有候选对象的转化数据,训练通用子模型,得到包含通用子模型的多任务模型。
本实施例中,基于各个候选对象每天的转化数据不断的训练和更新各个子模型。在所构建的多任务模型的基础上,若基于任意一个候选对象的新的转化数据进行转化率预测,将该候选对象的转化数据输入至多任务模型中,直接根据预先评估得到的该候选对象的模型收敛时长,将该候选对象的模型收敛时长所落入的区间对应的区间子模型,确定为该候选对象的目标区间子模型,基于目标区间子模型对该候选对象进行转化率预测。若检测到新增候选对象,则确定多任务模型中的通用子模型为目标子模型,基于通用子模型对该候选对象进行转化率预测。并基于上述实施例对新增候选对象预测的过度,来提高对新增候选对象预测的准确率。
本实施例的技术方案,基于单任务模型对于各个候选对象的模型收敛时长的评估,基于模型收敛时长来组织样本进行多任务模型的创建,以使模型的训练考虑到了转化数据各维度的异质性,提高转化率预测的准确性。
第四实施例
图4是根据本申请第四实施例的转化率预测装置的结构示意图,本实施例可适用于基于对象的转化数据进行转化率预测的情况,该装置可实现本申请任意实施例所述的转化率预测方法。该装置400具体包括如下:
模型收敛时长确定模块410,用于若检测到新增候选对象,则基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长;
模型确定模块420,用于根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型;
转化率预测模块430,用于基于所述目标区间子模型,对所述新增候选对象进行转化率预测。
可选的,所述模型收敛时长确定模块410具体用于:
将所述新增候选对象的转化数据,加入到所述通用子模型的周期性训练中,以更新所述通用子模型;
根据更新后的通用子模型,确定所述新增候选对象的模型收敛时长。
可选的,所述模型收敛时长确定模块410具体用于:
基于更新后的通用子模型,根据所述新增候选对象当前周期内的转化数据,确定所述新增候选对象当前周期的转化率;
根据所述新增候选对象当前周期的转化率,确定所述新增候选对象当前周期的模型收敛指标;
若所述新增候选对象当前周期的模型收敛指标达到预设指标阈值,则将所述新增候选对象的训练时长,确定为所述新增候选对象的模型收敛时长。
可选的,所述模型收敛时长确定模块410具体用于:
在所述基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长之前,基于所述通用子模型,根据所述新增候选对象的转化数据,对所述新增候选对象进行转化率预测。
可选的,所述模型确定模块420具体用于:
将所述新增候选对象的模型收敛时长,与所述多任务模型中的区间子模型关联的模型收敛时长区间进行比较;
根据模型收敛时长的比较结果,将模型收敛时长区间与所述新增候选对象的模型收敛时长相符的区间子模型,确定为目标区间子模型。
可选的,所述模型确定模块420具体用于:
将所述新增候选对象的转化数据,加入到所述目标区间子模型的周期性训练中,以更新所述目标区间子模型。
可选的,所述区间子模型是基于与所述区间子模型关联的模型收敛时长区间相符的候选对象的转化数据训练得到,所述通用子模型是基于覆盖至少两个模型收敛时长区间的候选对象的转化数据训练得到。
本实施例的技术方案,通过各个功能模块之间的相互配合,实现了模型收敛时长的评估、样本的组织、多任务模型的构建、转化率的预测、新增候选对象的加入等功能。通过由通用子模型过度至区间子模型进行转化率预测,新增候选对象可以自动从粗粒度通用预测过度到区间子模型的精确预测,促进了模型的适用范围自动化推广,提高了转化率预测的准确率。
第五实施例
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图5所示,是根据本申请实施例的转化率预测方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图5所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置,诸如,耦合至接口的显示设备,其上显示图形用户界面(Graphical User Interface,GUI)的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作,例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统。图5中以一个处理器501为例。
存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的转化率预测方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的转化率预测方法。
存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的转化率预测方法对应的程序指令/模块,例如,附图4所示的模型收敛时长阈值确定模块410、模型确定模块420和转化率预测模块430。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的转化率预测方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据转化率预测方法的电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至转化率预测方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
转化率预测方法的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置503可接收输入的数字或字符信息,以及产生与转化率预测方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置和触觉反馈装置等,其中,辅助照明装置例如发光二极管(LightEmitting Diode,LED);触觉反馈装置例如,振动电机等。该显示设备可以包括但不限于,液晶显示器(Liquid Crystal Display,LCD)、LED显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用集成电路(Application Specific Integrated Circuit,ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序,也称作程序、软件、软件应用、或者代码,包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置,例如,磁盘、光盘、存储器、可编程逻辑装置(Programmable Logic Device,PLD),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置,例如,阴极射线管(Cathode Ray Tube,CRT)或者LCD监视器;以及键盘和指向装置,例如,鼠标或者轨迹球,用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈,例如,视觉反馈、听觉反馈、或者触觉反馈;并且可以用任何形式,包括声输入、语音输入或者、触觉输入,来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统,例如,数据服务器,或者实施在包括中间件部件的计算系统,例如,应用服务器、或者实施在包括前端部件的计算系统,例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互,或者实施在包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信,例如,通信网络,来将系统的部件相互连接。通信网络的示例包括:局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,由通用子模型过度至区间子模型进行转化率预测,新增候选对象可以自动从粗粒度通用预测过度到区间子模型的精确预测,促进了模型的适用范围自动化推广,提高了转化率预测的准确率。
上述申请中的一个实施例具有如下优点或有益效果:通过将新增候选对象的转化数据加入到通用子模型的周期性训练中,得到更新后的通用子模型,以使通用子模型能够学习到新增候选对象的数据特征,提高通用子模型对于新增候选对象预测的准确率,以及新增候选对象模型收敛时长确定的准确率。
上述申请中的一个实施例具有如下优点或有益效果:通过采用通用子模型学习新增候选对象的数据特征,并用通用子模型对新增候选对象进行转化率预测,确定新增候选对象的模型收敛指标,以此评估新增候选对象的模型收敛时长,为新增候选对象数据特征的精确学习提供条件。
上述申请中的一个实施例具有如下优点或有益效果:可以通过通用子模型对新增候选对象进行粗粒度的转化率预测,避免传统多任务学习中在无学习的情况下不能对新增候选对象进行转化率预测。
上述申请中的一个实施例具有如下优点或有益效果:通过模型收敛时长来组织对象进行多任务模型训练,以使各个区间子模型都能够对模型收敛时长指标在区间之内的对象进行精准预测,提高转化率预测的准确率。
上述申请中的一个实施例具有如下优点或有益效果:通过子模型周期性的基于全部候选对象的转化数据进行模型训练和更新,区间子模型周期性的基于指标区间相符的候选对象的转化数据进行模型训练和更新,保障各候选对象转化数据的精确学习,以及保障各个子模型的实时适用性。
上述申请中的一个实施例具有如下优点或有益效果:区间子模型基于指标区间相符的候选对象的转化数据训练得到,以使区间子模型对于指标区间相符的候选对象进行精确的转化率预测;通用子模型基于覆盖至少两个指标区间的候选对象的转化数据训练得到,以使多任务模型具有普遍适用性,且通过通用子模型向区间子模型的过度,实现新增候选对象的精确预测。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (9)

1.一种转化率预测方法,其特征在于,包括:
若检测到新增候选对象,则基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长;其中,所述通用子模型是基于覆盖至少两个模型收敛时长区间的候选对象的转化数据训练得到的;
根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型;
基于所述目标区间子模型,对所述新增候选对象进行转化率预测;
其中,所述根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型,包括:
将所述新增候选对象的模型收敛时长,与所述多任务模型中的区间子模型关联的模型收敛时长区间进行比较;
根据模型收敛时长的比较结果,将模型收敛时长区间与所述新增候选对象的模型收敛时长相符的区间子模型,确定为目标区间子模型;其中,所述区间子模型是基于与区间子模型关联的模型收敛时长区间相符的候选对象的转化数据训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长,包括:
将所述新增候选对象的转化数据,加入到所述通用子模型的周期性训练中,以更新所述通用子模型;
根据更新后的通用子模型,确定所述新增候选对象的模型收敛时长。
3.根据权利要求2所述的方法,其特征在于,所述根据更新后的通用子模型,确定所述新增候选对象的模型收敛时长,包括:
基于更新后的通用子模型,根据所述新增候选对象当前周期内的转化数据,确定所述新增候选对象当前周期的转化率;
根据所述新增候选对象当前周期的转化率,确定所述新增候选对象当前周期的模型收敛指标;
若所述新增候选对象当前周期的模型收敛指标达到预设指标阈值,则将所述新增候选对象的训练时长,确定为所述新增候选对象的模型收敛时长。
4.根据权利要求1所述的方法,其特征在于,在所述基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长之前,还包括:
基于所述通用子模型,根据所述新增候选对象的转化数据,对所述新增候选对象进行转化率预测。
5.根据权利要求1所述的方法,其特征在于,在所述根据所述新增候选对象的模型收敛时长,从所述多任务模型中确定目标区间子模型之后,还包括:
将所述新增候选对象的转化数据,加入到所述目标区间子模型的周期性训练中,以更新所述目标区间子模型。
6.根据权利要求1所述的方法,其特征在于,所述区间子模型是基于与所述区间子模型关联的模型收敛时长区间相符的候选对象的转化数据训练得到,所述通用子模型是基于覆盖至少两个模型收敛时长区间的候选对象的转化数据训练得到。
7.一种转化率预测装置,其特征在于,包括:
模型收敛时长确定模块,用于若检测到新增候选对象,则基于多任务模型中的通用子模型,确定所述新增候选对象的模型收敛时长;其中,所述通用子模型是基于覆盖至少两个模型收敛时长区间的候选对象的转化数据训练得到的;
模型确定模块,具体用于将所述新增候选对象的模型收敛时长,与所述多任务模型中的区间子模型关联的模型收敛时长区间进行比较;根据模型收敛时长的比较结果,将模型收敛时长区间与所述新增候选对象的模型收敛时长相符的区间子模型,确定为目标区间子模型;其中,所述区间子模型是基于与区间子模型关联的模型收敛时长区间相符的候选对象的转化数据训练得到的;
转化率预测模块,用于基于所述目标区间子模型,对所述新增候选对象进行转化率预测。
8. 一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的转化率预测方法。
9.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的转化率预测方法。
CN201911130006.XA 2019-11-18 2019-11-18 转化率预测方法、装置、设备和介质 Active CN112818291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911130006.XA CN112818291B (zh) 2019-11-18 2019-11-18 转化率预测方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911130006.XA CN112818291B (zh) 2019-11-18 2019-11-18 转化率预测方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN112818291A CN112818291A (zh) 2021-05-18
CN112818291B true CN112818291B (zh) 2023-09-01

Family

ID=75852603

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911130006.XA Active CN112818291B (zh) 2019-11-18 2019-11-18 转化率预测方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN112818291B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108475349A (zh) * 2016-02-12 2018-08-31 谷歌有限责任公司 用于稳健的大规模机器学习的系统和方法
CN110008399A (zh) * 2019-01-30 2019-07-12 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110443364A (zh) * 2019-06-21 2019-11-12 深圳大学 一种深度神经网络多任务超参数优化方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108475349A (zh) * 2016-02-12 2018-08-31 谷歌有限责任公司 用于稳健的大规模机器学习的系统和方法
CN110008399A (zh) * 2019-01-30 2019-07-12 阿里巴巴集团控股有限公司 一种推荐模型的训练方法及装置、一种推荐方法及装置
CN110443364A (zh) * 2019-06-21 2019-11-12 深圳大学 一种深度神经网络多任务超参数优化方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于机器学习混合算法的APP广告转化率预测研究;赵杨等;数据分析与知识发现;第2-9页 *

Also Published As

Publication number Publication date
CN112818291A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN111309479A (zh) 一种任务并行处理的实现方法、装置、设备和介质
CN111143686B (zh) 资源推荐方法及装置
CN111539479A (zh) 生成样本数据的方法和装置
CN112650907A (zh) 搜索词的推荐方法、目标模型的训练方法、装置及设备
CN112258268B (zh) 确定推荐模型和确定物品价格的方法、装置、设备和介质
CN112163676A (zh) 多任务服务预测模型训练方法、装置、设备以及存储介质
JP7262505B2 (ja) 人材需要予測方法、人材需要予測装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム
CN111680517A (zh) 用于训练模型的方法、装置、设备以及存储介质
CN111506803A (zh) 内容推荐方法、装置、电子设备及存储介质
CN112017009A (zh) 订单处理方法、装置、电子设备和可读存储介质
CN111158666A (zh) 实体归一化处理方法、装置、设备及存储介质
CN112819497B (zh) 转化率预测方法、装置、设备和存储介质
CN112580723B (zh) 多模型融合方法、装置、电子设备和存储介质
CN113869377A (zh) 训练方法、装置及电子设备
CN112818291B (zh) 转化率预测方法、装置、设备和介质
CN112598136B (zh) 数据的校准方法和装置
CN112734454B (zh) 一种用户信息确定方法、装置、电子设备和存储介质
CN111522928B (zh) 一种知识抽取方法、装置、设备和介质
CN112801682B (zh) 数据修正方法、装置、设备和存储介质
CN111563202A (zh) 资源数据处理方法、装置、电子设备和介质
CN111967492A (zh) 分类模型的训练方法、装置、电子设备以及存储介质
CN111475614A (zh) 知识推理对话方法、装置、电子设备和存储介质
CN114331379B (zh) 用于输出待办任务的方法、模型训练方法和装置
CN112819498B (zh) 转化率确定方法、装置、电子设备和存储介质
CN112508599B (zh) 信息反馈方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant