CN110046711B - 一种模型特征剔除方法及装置 - Google Patents

一种模型特征剔除方法及装置 Download PDF

Info

Publication number
CN110046711B
CN110046711B CN201811636726.9A CN201811636726A CN110046711B CN 110046711 B CN110046711 B CN 110046711B CN 201811636726 A CN201811636726 A CN 201811636726A CN 110046711 B CN110046711 B CN 110046711B
Authority
CN
China
Prior art keywords
feature
time
preset
current
time difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811636726.9A
Other languages
English (en)
Other versions
CN110046711A (zh
Inventor
岳赟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Advanced New Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced New Technologies Co Ltd filed Critical Advanced New Technologies Co Ltd
Priority to CN201811636726.9A priority Critical patent/CN110046711B/zh
Publication of CN110046711A publication Critical patent/CN110046711A/zh
Application granted granted Critical
Publication of CN110046711B publication Critical patent/CN110046711B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

公开了一种模型特征剔除方法及装置。一种模型特征剔除方法,该方法包括:在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征;对于在当前轮次线上模型训练过程中使用的任一特征:根据预设的计算算法计算特征使用时刻对应的使用次数;当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数;对于在当前轮次线上模型训练过程中未使用的任一特征:当当前时刻达到所述预设的时刻时,获取特征的历史使用次数;利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数;判断特征的当前使用次数是否小于预设的阈值;若是,则从模型特征集中剔除。

Description

一种模型特征剔除方法及装置
技术领域
本说明书实施例涉及机器学习技术领域,尤其涉及一种模型特征剔除方法及装置。
背景技术
当前在广告营销、推荐、搜索等诸如类似场景中,普遍采用在线学习的线上模型训练方式,例如对于当天新出现的item(商品),在线学习能够快速学习到该item的特征,为模型不断积累新的特征。例如模型A初始所拥有的特征为x1、x2、x3,经过在线学习,模型A可以不断累积新的特征(x4、……、xn)。由此可以看出在线学习是一个不断迭代的过程,模型累积的特征会越来越多,其中包括很多不再出现的特征,例如广告产生的item_ID,当这个广告结束投放后item_ID就不会再出现,但是仍然保留在了模型特征集(由模型包括的特征所组成的集合)中,随着模型特征集中包含的特征越来越多,规模越来越大,因此目前急需一种可以剔除特征的技术方案。
当前普遍采用的技术方案是:定期(例如每个月)线下训练一个离线模型,该离线模型累积的特征是最近一段时间内(例如最近一个月)出现过的特征,将现有的在线模型替换为该离线模型,在该离线模型基础之上继续采用在线学习的线上模型训练方式,从而达到将不再出现的特征剔除的目的。
但是目前这种技术方案,由于需要定期线下训练一个离线模型,增加了离线模型训练的开销。
发明内容
针对上述技术问题,本说明书实施例提供一种模型特征剔除方法及装置,技术方案如下:
一种模型特征剔除方法,该方法包括:
在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征;
对于在当前轮次线上模型训练过程中使用的任一特征,执行以下操作:
根据预设的计算算法计算特征使用时刻对应的使用次数;
当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数;
对于在当前轮次线上模型训练过程中未使用的任一特征,执行以下操作:
当当前时刻达到所述预设的时刻时,获取特征的历史使用次数;利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数;
对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值;若是,则从模型特征集中剔除。
一种模型特征剔除装置,该装置包括:
特征确定模块,用于在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征;
次数计算模块,用于对于在当前轮次线上模型训练过程中使用的任一特征,根据预设的计算算法计算特征使用时刻对应的使用次数;
第一衰减模块,用于对于在当前轮次线上模型训练过程中使用的任一特征,当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数;
次数获取模块,用于对于在当前轮次线上模型训练过程中未使用的任一特征,当当前时刻达到所述预设的时刻时,获取特征的历史使用次数;
第二衰减模块,用于对于在当前轮次线上模型训练过程中未使用的任一特征,利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数;
判断模块,用于对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值;
特征剔除模块,用于对于模型特征集中的任一特征,若是,则从模型特征集中剔除。
本说明书实施例所提供的技术方案,对于在当前轮次线上模型训练过程中使用的特征,当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数,对于在当前轮次线上模型训练过程中未使用的特征,当当前时刻达到所述预设的时刻时,利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数,如此可以得到全量特征的当前使用次数,对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值,若是,则从模型特征集中剔除。如此可以识别出那些长久不再出现的特征,将其从模型特征集中剔除,进而从模型中剔除,并不需要额外定期线下训练离线模型。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书实施例。
此外,本说明书实施例中的任一实施例并不需要达到上述的全部效果。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本说明书实施例的模型特征剔除方法的流程示意图;
图2是本说明书实施例的一示例性在线学习系统框架图;
图3是本说明书实施例的模型特征剔除装置的结构示意图;
图4是用于配置本说明书实施例装置的一种设备的结构示意图。
具体实施方式
在本说明书中,所说的特征指的是模型特征,例如对于模型A,其表达式可以为:
y=a*x1 3+b*x2 2+c*x3+x4
其中a、b、c、d为特征权重,x1、x2、x3、x4为模型特征。当前在广告营销、推荐、搜索等诸如类似场景中,普遍采用在线学习的线上模型训练方式,在线学习能够快速学习到新的特征,为模型不断积累新的特征。由此可以看出在线学习是一个不断迭代的过程,模型累积的特征会越来越多,其中包括很多不再出现的特征,例如广告产生的item_ID,当这个广告结束投放后item_ID就不会再出现,但是仍然保留在了模型特征集(由模型包括的特征所组成的集合)中,随着模型特征集中包含的特征越来越多,规模越来越大,系统内存开销会不断增大,模型预测耗时会增加,影响模型的整体性能,为此目前急需一种可以剔除特征的技术方案,剔除不再出现的特征,以降低系统内存开销,减少模型预测耗时,提升模型的整体性能。
但是目前采用的技术方案,利用最近一段时间的数据(比如最近7天或30天),定期线下训练离线模型,将现有的在线模型替换为该离线模型,并在该离线模型的基础上继续采用在线学习的线上模型训练方式,从而达到将不再出现的特征剔除的目的。由于需要定期线下训练一个离线模型,增加了离线模型训练的开销。
针对上述技术问题,本说明书实施例提供一种新颖的在线特征剔除技术方案,对于在当前轮次线上模型训练过程中使用的特征,当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数,对于在当前轮次线上模型训练过程中未使用的特征,当当前时刻达到所述预设的时刻时,利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数,如此可以得到全量特征的当前使用次数,对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值,若是,则从模型特征集中剔除。如此可以识别出那些长久不再出现的特征,将其从模型特征集中剔除,进而从模型中剔除,并不需要额外定期线下训练离线模型,一样可以达到降低系统内存开销、减少模型预测耗时、提升模型的整体性能的目的。
具体的,本说明书实施例提供的技术方案如下:
在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征;对于在当前轮次线上模型训练过程中使用的任一特征,执行以下操作:根据预设的计算算法计算特征使用时刻对应的使用次数;当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数;对于在当前轮次线上模型训练过程中未使用的任一特征,执行以下操作:当当前时刻达到所述预设的时刻时,获取特征的历史使用次数;利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数;对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值;若是,则从模型特征集中剔除。
为了使本领域技术人员更好地理解本说明书实施例中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行详细地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于保护的范围。
如图1所示,为本说明书实施例提供的模型特征剔除方法的实施流程图,该方法具体可以包括以下步骤:
S101,在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征;
在本说明书中,如图2所示的一示例性在线学习系统框架图,在广告营销、推荐、搜索等诸如类似场景中,在线学习系统会定期进行线上模型训练,是一个不断迭代的过程,在日志系统中将item的展现、点击等信息以及相关特征落到日志系统中,将展现、点击等行为以及相关特征进行关联,生成正负训练样本,将生成的训练样本输入到模型中,进行线上模型训练,以达到更新模型特征、更新模型特征权重的目的。在每次进行迭代的过程中,在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征,本说明书中所指的在当前轮次线上模型训练过程中使用的特征为模型特征集中的特征,对于在当前轮次线上模型训练过程中使用的特征为新特征的情况下,将新特征加入模型特征集中,并记录其使用次数(1)以及特征使用时刻。
例如,模型特征集中包括6个特征,在当前轮次线上模型训练过程中,依次记录所使用的特征:特征1、特征2、特征3、特征4、特征5,可以确定在当前轮次线上模型训练过程中使用的特征为上述特征,进而可以确定在当前轮次线上模型训练过程中未使用的特征为特征6。
对于在当前轮次线上模型训练过程中使用的任一特征,执行以下操作:
S102,根据预设的计算算法计算特征使用时刻对应的使用次数;
对于在当前轮次线上模型训练过程中使用的任一特征,根据预设的计算算法计算特征使用时刻对应的使用次数,具体的可以通过以下方式实现特征使用时刻对应的使用次数的计算:
记录特征使用时刻(即当前轮次特征使用时刻),获取特征历史使用时刻;将该特征使用时刻与该特征历史使用时刻作差得到时间差(即第三时间差),与预设的时间差(T)进行比较;若该时间差(即第三时间差)小于预设的时间差,则根据预设的第一计算算法计算特征使用时刻对应的使用次数(即当前轮次特征使用次数);若该时间差(即第三时间差)不小于预设的时间差,则根据预设的第二计算算法计算特征使用时刻对应的使用次数(即当前轮次特征使用次数)。其中对于在当前轮次线上模型训练过程中使用的任一特征,当前轮次特征使用时刻可以作为以后第N(N=1,2,3……)轮次的特征历史使用时刻(前提是两轮线上模型训练过程中使用的特征一致),当前轮次特征使用次数可以作为以后第N(N=1,2,3……)轮次的特征的历史使用次数(前提是两轮线上模型训练过程中使用的特征一致)。
例如,记录特征使用时刻t,获取特征历史使用时刻t0,将该特征使用时刻t与特征历史使用时刻t0作差得到时间差Δt,Δt=t-t0,将该Δt与预设的时间差T进行比较,若Δt小于T,则根据预设的第一计算算法计算特征使用时刻对应的使用次数,若Δt不小于T,则根据预设的第二计算算法计算特征使用时刻对应的使用次数。
其中,所述预设的第一计算算法为:
y=y0+1;
所述y为特征使用时刻对应的使用次数,所述y0为特征的历史使用次数,意味着若时间差(即第三时间差)小于预设的时间差T,则在特征的特征使用次数的基础之上加1即可得到当前轮次特征使用时刻对应的使用次数。
所述预设的第二计算算法为:
所述y为特征使用时刻对应的使用次数,所述y0为特征的历史使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为特征使用时刻,所述t0为特征历史使用时刻。
例如,所述T=1,所述α=0.9,意味着α为小于1的衰减系数,若Δt不小于T,则可以根据上述预设的第二计算算法计算特征使用时刻对应的使用次数。
在经过上述步骤之后,可以计算得到特征使用时刻对应的使用次数。
S103,当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数;
在本说明书中,定期对全量特征进行处理,对于在当前轮次线上模型训练过程中使用的特征以及未使用的特征,分开进行处理。对于在当前轮次线上模型训练过程中使用的任一特征,当当前时刻达到预设的时刻(例如每天的12:00)时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数,其中衰减算法有很多种,本说明书实施例对其中一种进行说明:
所述预设的衰减算法可以为:
其中,对于在当前轮次线上模型训练过程中使用的任一特征,所述y为特征的当前使用次数(即经过衰减得到的当前使用次数),所述y0为特征使用时刻对应的使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为当前时刻,所述t0为特征使用时刻。
例如,所述T=1,所述α=0.9,意味着α为小于1的衰减系数,当当前时刻达到预设的时刻(例如每天的12:00)时,可以利用上述预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数。
优选的,在利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数之前,当当前时刻达到预设的时刻时,将当前时刻与特征使用时刻作差得到时间差(即第一时间差),与预设的时间差(T)进行比较,若所述时间差(即第一时间差)大于所述预设的时间差,则利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到当前使用次数。
对于在当前轮次线上模型训练过程中未使用的任一特征,执行以下操作:
S104,当当前时刻达到所述预设的时刻时,获取特征的历史使用次数;
S105,利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数;
对于在当前轮次线上模型训练过程中未使用的任一特征,当当前时刻达到所述预设的时刻(例如每天的12:00)时,获取特征的历史使用次数,利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数,其中衰减算法有很多种,本说明书实施例对其中一种进行说明:
所述预设的衰减算法可以为:
其中,对于在当前轮次线上模型训练过程中未使用的任一特征,所述y为特征的当前使用次数,所述y0为特征的历史使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为当前时刻,所述t0为特征历史使用时刻。
例如,所述T=1,所述α=0.9,意味着α为小于1的衰减系数,当当前时刻达到所述预设的时刻时,获取特征的历史使用次数,可以利用上述所说的预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数。
优选的,在利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数之前,当当前时刻达到所述预设的时刻时,获取特征历史使用时刻,将当前时刻与特征历史使用时刻作差得到时间差(即第二时间差),与预设的时间差(T)进行比较,若所述时间差(即第二时间差)大于所述预设的时间差,则利用所述预设的衰减算法对特征的历史使用次数进行衰减得到当前使用次数。
S106,对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值;
经过上述步骤,对于全量特征,可以得到其对应的当前使用次数,此时判断特征的当前使用次数是否小于预设的阈值,若小于,则表示该特征满足剔除的条件,从模型特征集中剔除,如此通过上述的衰减算法,可以将那些长期不再出现的特征对应的使用次数随着时间窗口滑动衰减,当小于某个临界值时,从模型特征集中剔除,达到剔除特征的目的。
例如,预设的阈值可以为1e-5,那些长期不再出现的特征对应的使用次数随着时间窗口滑动衰减,某个时刻势必会小于预设的阈值,可以将其从模型特征集中剔除。
S107,若是,则从模型特征集中剔除。
若某个特征的当前使用次数小于预设的阈值,则从模型特征集中剔除,可以放入另外一个特征集中,以供在线模型剔除特征使用。在执行下一轮次线上模型训练之前,访问另外一个特征集,以便剔除模型中的特征,以使在线模型进行特征更新,例如模型A:
y=a*x1 3+b*x2 2+c*x3+x4
在经过特征剔除步骤之后,模型A:
y=a*x1 3+b*x2 2+c*x3
通过上述对本说明书实施例提供的技术方案的描述,对于在当前轮次线上模型训练过程中使用的特征,当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数,对于在当前轮次线上模型训练过程中未使用的特征,当当前时刻达到所述预设的时刻时,利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数,如此可以得到全量特征的当前使用次数,对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值,若是,则从模型特征集中剔除。如此可以识别出那些长久不再出现的特征,将其从模型特征集中剔除,进而从模型中剔除,并不需要额外定期线下训练离线模型,一样可以达到降低系统内存开销、减少模型预测耗时、提升模型的整体性能的目的。
相对于上述方法实施例,本说明书实施例还提供一种模型特征剔除装置,参见图3所示,该装置可以包括:特征确定模块310、次数计算模块320、第一衰减模块330、次数获取模块340、第二衰减模块350、判断模块360、特征剔除模块370。
特征确定模块310,用于在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征;
次数计算模块320,用于对于在当前轮次线上模型训练过程中使用的任一特征,根据预设的计算算法计算特征使用时刻对应的使用次数;
第一衰减模块330,用于对于在当前轮次线上模型训练过程中使用的任一特征,当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数;
次数获取模块340,用于对于在当前轮次线上模型训练过程中未使用的任一特征,当当前时刻达到所述预设的时刻时,获取特征的历史使用次数;
第二衰减模块350,用于对于在当前轮次线上模型训练过程中未使用的任一特征,利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数;
判断模块360,用于对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值;
特征剔除模块370,用于对于模型特征集中的任一特征,若是,则从模型特征集中剔除。
在本说明书的一种具体实施方式中,所述装置还包括:
使用时刻记录模块380,用于在当前轮次线上模型训练过程中使用的任一特征,记录特征使用时刻;
所述第一衰减模块330具体用于:
当当前时刻达到预设的时刻时,将当前时刻与特征使用时刻作差得到第一时间差,与预设的时间差进行比较;
若所述第一时间差大于所述预设的时间差,则利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数。
在本说明书的一种具体实施方式中,所述装置还包括:
使用时刻获取模块390,用于对于在当前轮次线上模型训练过程中未使用的任一特征,当当前时刻达到所述预设的时刻时,获取特征历史使用时刻。
所述第二衰减模块350具体用于:
将当前时刻与特征历史使用时刻作差得到第二时间差,与预设的时间差进行比较;
若所述第二时间差大于所述预设的时间差,则利用所述预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数。
在本说明书的一种具体实施方式中,所述预设的衰减算法为:
其中,对于在当前轮次线上模型训练过程中使用的任一特征,所述y为特征的当前使用次数,所述y0为特征使用时刻对应的使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为当前时刻,所述t0为特征使用时刻;
其中,对于在当前轮次线上模型训练过程中未使用的任一特征,所述y为特征的当前使用次数,所述y0为特征的历史使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为当前时刻,所述t0为特征历史使用时刻。
在本说明书的一种具体实施方式中,所述次数计算模块320包括:
比较子模块321,用于获取特征历史使用时刻,将特征使用时刻与特征历史使用时刻作差得到第三时间差,与预设的时间差进行比较;
第一计算子模块322,用于若所述第三时间差小于预设的时间差,则根据预设的第一计算算法计算特征使用时刻对应的使用次数;
第二计算子模块323,用于若所述第三时间差不小于预设的时间差,则根据预设的第二计算算法计算特征使用时刻对应的使用次数。
在本说明书的一种具体实施方式中,所述第一计算子模块322具体用于:
若所述第三时间差小于预设的时间差,则在特征的历史使用次数的基础之上加1计算得到特征使用时刻对应的使用次数。
在本说明书的一种具体实施方式中,所述预设的第二计算算法为:
其中,对于在当前轮次线上模型训练过程中使用的任一特征,所述y为特征使用时刻对应的使用次数,所述y0为特征的历史使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为特征使用时刻,所述t0为特征历史使用时刻。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
通过上述对本说明书实施例提供的技术方案的描述,对于在当前轮次线上模型训练过程中使用的特征,当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数,对于在当前轮次线上模型训练过程中未使用的特征,当当前时刻达到所述预设的时刻时,利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数,如此可以得到全量特征的当前使用次数,对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值,若是,则从模型特征集中剔除。如此可以识别出那些长久不再出现的特征,将其从模型特征集中剔除,进而从模型中剔除,并不需要额外定期线下训练离线模型,一样可以达到降低系统内存开销、减少模型预测耗时、提升模型的整体性能的目的。
本说明书实施例还提供一种计算机设备,如图4所示,该设备可以包括:处理器410、存储器420、输入/输出接口430、通信接口440和总线450。其中处理器410、存储器420、输入/输出接口430和通信接口440通过总线450实现彼此之间在设备内部的通信连接。
处理器410可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器420可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器420可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器420中,并由处理器410来调用执行。
输入/输出接口430用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口440用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线450包括一通路,在设备的各个组件(例如处理器410、存储器420、输入/输出接口430和通信接口440)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器410、存储器420、输入/输出接口430、通信接口440以及总线450,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述的模型特征剔除方法。该方法至少包括:
一种模型特征剔除方法,该方法包括:
在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征;
对于在当前轮次线上模型训练过程中使用的任一特征,执行以下操作:
根据预设的计算算法计算特征使用时刻对应的使用次数;
当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数;
对于在当前轮次线上模型训练过程中未使用的任一特征,执行以下操作:
当当前时刻达到所述预设的时刻时,获取特征的历史使用次数;利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数;
对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值;若是,则从模型特征集中剔除。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本说明书实施例的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护范围。

Claims (15)

1.一种基于模型特征剔除的预测方法,该方法包括:
针对预设的场景,在线学习系统定期进行线上模型训练,基于商品的展现、点击信息以及相关特征生成训练样本,并将生成的训练样本输入到模型中进行线上模型训练,以更新模型特征集;所述预设的场景至少包括广告营销、推荐和搜索场景;
在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征;
对于在当前轮次线上模型训练过程中使用的任一特征,执行以下操作:
根据预设的计算算法计算特征使用时刻对应的使用次数;
当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数;
对于在当前轮次线上模型训练过程中未使用的任一特征,执行以下操作:
当当前时刻达到所述预设的时刻时,获取特征的历史使用次数;利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数;
对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值;若是,则从模型特征集中剔除,以使线上模型进行特征更新;
基于更新后的线上模型进行预测。
2.根据权利要求1所述的方法,对于在当前轮次线上模型训练过程中使用的任一特征,所述方法还包括:
记录特征使用时刻;
所述当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数,包括:
当当前时刻达到预设的时刻时,将当前时刻与特征使用时刻作差得到第一时间差,与预设的时间差进行比较;
若所述第一时间差大于所述预设的时间差,则利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数。
3.根据权利要求1所述的方法,对于在当前轮次线上模型训练过程中未使用的任一特征,所述方法还包括:
当当前时刻达到所述预设的时刻时,获取特征历史使用时刻;
所述利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数,包括:
将当前时刻与特征历史使用时刻作差得到第二时间差,与预设的时间差进行比较;
若所述第二时间差大于所述预设的时间差,则利用所述预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数。
4.根据权利要求1至3任一项所述的方法,所述预设的衰减算法为:
其中,对于在当前轮次线上模型训练过程中使用的任一特征,所述y为特征的当前使用次数,所述y0为特征使用时刻对应的使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为当前时刻,所述t0为特征使用时刻;
其中,对于在当前轮次线上模型训练过程中未使用的任一特征,所述y为特征的当前使用次数,所述y0为特征的历史使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为当前时刻,所述t0为特征历史使用时刻。
5.根据权利要求2所述的方法,所述根据预设的计算算法计算特征使用时刻对应的使用次数,包括:
获取特征历史使用时刻,将特征使用时刻与特征历史使用时刻作差得到第三时间差,与预设的时间差进行比较;
若所述第三时间差小于预设的时间差,则根据预设的第一计算算法计算特征使用时刻对应的使用次数;
若所述第三时间差不小于预设的时间差,则根据预设的第二计算算法计算特征使用时刻对应的使用次数。
6.根据权利要求5所述的方法,所述若所述第三时间差小于预设的时间差,则根据预设的第一计算算法计算特征使用时刻对应的使用次数,包括:
若所述第三时间差小于预设的时间差,则在特征的历史使用次数的基础之上加1计算得到特征使用时刻对应的使用次数。
7.根据权利要求5所述的方法,所述预设的第二计算算法为:
其中,对于在当前轮次线上模型训练过程中使用的任一特征,所述y为特征使用时刻对应的使用次数,所述y0为特征的历史使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为特征使用时刻,所述t0为特征历史使用时刻。
8.一种基于模型特征剔除的预测装置,该装置包括:
训练模块,针对预设的场景,在线学习系统定期进行线上模型训练,基于商品的展现、点击信息以及相关特征生成训练样本,并将生成的训练样本输入到模型中进行线上模型训练,以更新模型特征集;所述预设的场景至少包括广告营销、推荐和搜索场景;
特征确定模块,用于在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征;
次数计算模块,用于对于在当前轮次线上模型训练过程中使用的任一特征,根据预设的计算算法计算特征使用时刻对应的使用次数;
第一衰减模块,用于对于在当前轮次线上模型训练过程中使用的任一特征,当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数;
次数获取模块,用于对于在当前轮次线上模型训练过程中未使用的任一特征,当当前时刻达到所述预设的时刻时,获取特征的历史使用次数;
第二衰减模块,用于对于在当前轮次线上模型训练过程中未使用的任一特征,利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数;
判断模块,用于对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值;
特征剔除模块,用于对于模型特征集中的任一特征,若是,则从模型特征集中剔除,以使线上模型进行特征更新;
预测模块,基于更新后的线上模型进行预测。
9.根据权利要求8所述的装置,所述装置还包括:
使用时刻记录模块,用于在当前轮次线上模型训练过程中使用的任一特征,记录特征使用时刻;
所述第一衰减模块具体用于:
当当前时刻达到预设的时刻时,将当前时刻与特征使用时刻作差得到第一时间差,与预设的时间差进行比较;
若所述第一时间差大于所述预设的时间差,则利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数。
10.根据权利要求8所述的装置,所述装置还包括:
使用时刻获取模块,用于对于在当前轮次线上模型训练过程中未使用的任一特征,当当前时刻达到所述预设的时刻时,获取特征历史使用时刻;
所述第二衰减模块具体用于:
将当前时刻与特征历史使用时刻作差得到第二时间差,与预设的时间差进行比较;
若所述第二时间差大于所述预设的时间差,则利用所述预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数。
11.根据权利要求8至10任一项所述的装置,所述预设的衰减算法为:
其中,对于在当前轮次线上模型训练过程中使用的任一特征,所述y为特征的当前使用次数,所述y0为特征使用时刻对应的使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为当前时刻,所述t0为特征使用时刻;
其中,对于在当前轮次线上模型训练过程中未使用的任一特征,所述y为特征的当前使用次数,所述y0为特征的历史使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为当前时刻,所述t0为特征历史使用时刻。
12.根据权利要求9所述的装置,所述次数计算模块包括:
比较子模块,用于获取特征历史使用时刻,将特征使用时刻与特征历史使用时刻作差得到第三时间差,与预设的时间差进行比较;
第一计算子模块,用于若所述第三时间差小于预设的时间差,则根据预设的第一计算算法计算特征使用时刻对应的使用次数;
第二计算子模块,用于若所述第三时间差不小于预设的时间差,则根据预设的第二计算算法计算特征使用时刻对应的使用次数。
13.根据权利要求12所述的装置,所述第一计算子模块具体用于:
若所述第三时间差小于预设的时间差,则在特征的历史使用次数的基础之上加1计算得到特征使用时刻对应的使用次数。
14.根据权利要求12所述的装置,所述预设的第二计算算法为:
其中,对于在当前轮次线上模型训练过程中使用的任一特征,所述y为特征使用时刻对应的使用次数,所述y0为特征的历史使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为特征使用时刻,所述t0为特征历史使用时刻。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如权利要求1至7任一项所述的方法。
CN201811636726.9A 2018-12-29 2018-12-29 一种模型特征剔除方法及装置 Active CN110046711B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811636726.9A CN110046711B (zh) 2018-12-29 2018-12-29 一种模型特征剔除方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811636726.9A CN110046711B (zh) 2018-12-29 2018-12-29 一种模型特征剔除方法及装置

Publications (2)

Publication Number Publication Date
CN110046711A CN110046711A (zh) 2019-07-23
CN110046711B true CN110046711B (zh) 2023-08-04

Family

ID=67274029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811636726.9A Active CN110046711B (zh) 2018-12-29 2018-12-29 一种模型特征剔除方法及装置

Country Status (1)

Country Link
CN (1) CN110046711B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654200A (zh) * 2015-12-30 2016-06-08 上海珍岛信息技术有限公司 一种基于深度学习的广告点击率预测方法及装置
WO2016095708A1 (zh) * 2014-12-16 2016-06-23 高德软件有限公司 一种交通流量预测方法、预测模型生成方法及装置
CN108335200A (zh) * 2018-05-03 2018-07-27 湖南大学 一种基于特征选取的信用评级方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016095708A1 (zh) * 2014-12-16 2016-06-23 高德软件有限公司 一种交通流量预测方法、预测模型生成方法及装置
CN105654200A (zh) * 2015-12-30 2016-06-08 上海珍岛信息技术有限公司 一种基于深度学习的广告点击率预测方法及装置
CN108335200A (zh) * 2018-05-03 2018-07-27 湖南大学 一种基于特征选取的信用评级方法

Also Published As

Publication number Publication date
CN110046711A (zh) 2019-07-23

Similar Documents

Publication Publication Date Title
TW202008237A (zh) 針對新場景的預測模型訓練方法及裝置
CN109634819B (zh) 告警根因定位方法和装置、电子设备
CN110728458B (zh) 一种目标对象的风险监测方法、装置及电子设备
CN110298716B (zh) 信息推送方法和装置
CN110555172B (zh) 用户关系挖掘方法及装置、电子设备和存储介质
GB2532542A (en) Risk quantification for policy deployment
CN110929799B (zh) 用于检测异常用户的方法、电子设备和计算机可读介质
CN111401940A (zh) 特征预测方法、装置、电子设备及存储介质
CN111126623A (zh) 一种模型更新方法、装置及设备
CN112149285A (zh) 一种基于优化参数选择的滑坡预测方法
CN113222813A (zh) 图像超分辨率重建方法、装置、电子设备及存储介质
CN112767028B (zh) 一种活跃用户数量的预测方法、计算机设备及存储介质
JP6971181B2 (ja) 予測装置、予測方法、およびプログラム
CN110046711B (zh) 一种模型特征剔除方法及装置
CN109948800B (zh) 风险控制方法及其系统
CN111798263A (zh) 一种交易趋势的预测方法和装置
CN110929285A (zh) 一种隐私数据的处理方法及装置
CN113763077A (zh) 用于检测虚假交易订单的方法和装置
CN111461328B (zh) 一种神经网络的训练方法
CN113051400B (zh) 标注数据确定方法、装置、可读介质及电子设备
CN110264333B (zh) 一种风险规则确定方法和装置
CN114254204A (zh) 数据处理方法、装置、介质及电子设备
CN111898626B (zh) 模型确定方法、装置和电子设备
CN111582456B (zh) 用于生成网络模型信息的方法、装置、设备和介质
CN108958902B (zh) 图计算方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200927

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200927

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant