CN113988908A - 营销人群的投放方法、装置、电子设备和存储介质 - Google Patents
营销人群的投放方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113988908A CN113988908A CN202111197937.9A CN202111197937A CN113988908A CN 113988908 A CN113988908 A CN 113988908A CN 202111197937 A CN202111197937 A CN 202111197937A CN 113988908 A CN113988908 A CN 113988908A
- Authority
- CN
- China
- Prior art keywords
- sample
- marketing
- model
- intention
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002716 delivery method Methods 0.000 title description 4
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 40
- 238000013145 classification model Methods 0.000 claims abstract description 17
- 238000004590 computer program Methods 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000007477 logistic regression Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 10
- 230000003993 interaction Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本申请涉及营销人群的投放方法、装置、电子设备和存储介质,属于互联网技术领域,该方法包括:随机生成噪声数据,并将所述噪声数据输入预先训练的样本生成模型,生成新样本,其中,噪声数据为样本特征的随机数值;将原始样本和新样本按预设比例混合,得到混合样本,并基于混合样本训练分类模型,得到营销意向预测模型;将拟营销人群的样本特征输入营销意向预测模型,得到意向值,并根据意向值选取投放的营销人群。通过样本生成模型生成新样本,增加了样本数量,训练出的营销意向预测模型性能更佳,用该营销意向预测模型能够更加准确的预测营销意向值,所以根据该意向值选取的投放的营销人群也更加精准,能够进一步降低营销成本。
Description
技术领域
本申请涉及互联网技术领域,特别是涉及营销人群的投放方法、装置、电子设备和存储介质。
背景技术
在现有的营销场景中,会通过算法筛选一部分人进行精准营销以减小成本。以营销信用卡为例,对申请信用卡有意向的人标签(label)为1,对申请信用卡无意向的人标签(label)为0。在对这批样本进行特征工程后,将特征和标签输入算法,通过学习不同标签人群的特征,生成一个能够拟合这批样本的模型,然后可以通过该模型对要营销的人群进行意向预测,从而筛选出营销人群。
在上述过程中,模型和营销成本决定了能够投放的营销人群数量。然而,能够营销的高分人群数量是有限的,不能满足不断增加的营销需求,当高分人群营销完,很难再产生新的高分人群。所以,有限的样本数量导致训练出的模型性能较差,模型的预测结果准确性较低,这会影响投放营销人群的精准度,也会进一步影响到营销成本的高低。
发明内容
本申请实施例提供了营销人群的投放方法、装置、电子设备和存储介质,以至少解决相关技术中营销意向预测结果准确性低,导致投放营销人群的精准度低的问题。
第一方面,本申请实施例提供了一种营销人群的投放方法,所述方法包括:随机生成噪声数据,并将所述噪声数据输入预先训练的样本生成模型,生成新样本,其中,所述噪声数据为样本特征的随机数值;将原始样本和所述新样本按预设比例混合,得到混合样本,并基于所述混合样本训练分类模型,得到营销意向预测模型;将拟营销人群的样本特征输入所述营销意向预测模型,得到意向值,并根据所述意向值选取投放的营销人群。
在其中一些实施例中,所述样本生成模型包括生成器和判别器,所述生成器采用深度神经网络,所述判别器采用xDeepFM(极深因子分解机)模型。
在其中一些实施例中,所述样本生成模型的训练方式包括如下步骤:随机生成噪声数据,将所述噪声数据输入所述生成器,生成假样本,所述假样本包含样本特征和类别标签,所述类别标签用于指示样本的类别;将真样本和所述假样本混合,得到混合样本,并对该混合样本增加真假标签,所述真假标签用于指示样本为真或假;将所述混合样本输入所述判别器,通过对样本特征的学习拟合所述类别标签和所述真假标签以训练所述判别器;将所述噪声数据输入联合模块,并设定真假标签的值为真,所述联合模块包含所述生成器和所述判别器;在所述联合模块中保持所述判别器的参数不变,训练所述生成器;重复训练所述判别器和所述生成器,直到得到性能符合目标预期的生成器,所述样本生成模型训练完成。
在其中一些实施例中,所述判别器包括线性模型、CIN模型和DNN模型,所述通过对样本特征的学习拟合所述类别标签和所述真假标签以训练所述判别器包括:对所述混合样本,分别通过所述线性模型、所述CIN模型和所述DNN模型处理特征;将所述线性(Linear)模型、所述CIN(Compressed InteractionNetwork)模型和所述DNN(Deep Neural Networks)模型的输出结果进行拼接,得到特征向量;基于所述特征向量判断样本的类别和真假。
在其中一些实施例中,所述基于所述混合样本训练分类模型,得到营销意向预测模型包括:基于所述混合样本训练逻辑回归模型、GBDT(GradientBoosting DecisionTree)模型或xDeepFM模型,得到营销意向预测模型。
在其中一些实施例中,所述将所述原始样本和所述新样本按预设比例混合,得到混合样本包括:将所述原始样本和所述新样本按10:1混合,得到混合样本。
在其中一些实施例中,所述根据所述意向值选取投放的营销人群包括:将拟营销人群中的已营销人员进行去除;将保留的样本按照所述意向值从大到小排序,选取靠前的预设数量的样本作为投放的营销人群。
第二方面,本申请实施例提供一种营销人群的投放装置,包括:生成模块、训练模块和预测模块,生成模块用于随机生成噪声数据,并将所述噪声数据输入预先训练的样本生成模型,生成新样本,其中,所述噪声数据为样本特征的随机数值;训练模块用于将原始样本和所述新样本按预设比例混合,得到混合样本,并基于所述混合样本训练分类模型,得到营销意向预测模型;预测模块用于将拟营销人群的样本特征输入所述营销意向预测模型,得到意向值,并根据所述意向值选取投放的营销人群。
第三方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项所述的方法。
第四方面,本申请实施例提供一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项所述的方法。
本申请实施例提供的一种营销人群的投放方法包括:随机生成噪声数据,并将噪声数据输入预先训练的样本生成模型,生成新样本,其中,噪声数据为样本特征的随机数值;将原始样本和新样本按预设比例混合,得到混合样本,并基于混合样本训练分类模型,得到营销意向预测模型;将拟营销人群的样本特征输入营销意向预测模型,得到意向值,并根据意向值选取投放的营销人群。本申请实施例通过样本生成模型生成新样本,解决了当高分人群营销完,很难再产生新的高分人群的问题;并且,将新样本与原始样本进行混合,增加了样本数量,用混合样本训练分类模型,得到的营销意向预测模型性能更佳,用该营销意向预测模型能够更加准确的预测营销意向值,所以根据该意向值选取的投放的营销人群也更加精准,能够进一步降低营销成本。另外,使用xDeepFM作为样本生成模型的判别器,能够更好的对营销领域中存在的稀疏特征进行高维特征交叉,对人群能有更准确的区分。而且,在线性模型处理的特征的基础上增加了CIN模型和DNN模型处理的特征,以显式和隐式的形式学习了高阶的特征交互,所以能够获得更好的预测效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的营销人群的投放方法的流程图;
图2是根据本申请实施例的样本生成模型的结构示意图;
图3是根据本申请实施例的判别器的结构示意图;
图4是根据本申请实施例的营销人群的投放装置的结构框图;
图5是根据本申请实施例的电子设备的内部结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
在营销场景中,由于不断的营销,高分人群会越来越少,即有高意向的人群越来越少,最终转化的人也会越来越少,导致营销成本逐渐增加。为了解决该问题,本申请实施例提供一种营销人群的投放方法,图1是根据本申请实施例的营销人群的投放方法的流程图,如图1所示,该方法包括以下步骤:
S101:随机生成噪声数据,并将该噪声数据输入预先训练的样本生成模型,生成新样本,其中,随机生成的噪声数据为样本特征的随机数值;
S102:将原始样本和新样本按预设比例混合,得到混合样本,并基于混合样本训练分类模型,得到营销意向预测模型;
S103:将拟营销人群的样本特征输入营销意向预测模型,得到意向值,并根据意向值选取投放的营销人群。
根据上述方法,通过样本生成模型生成新样本,将新样本与原始样本进行混合,增加了样本数量,用混合样本训练分类模型,得到的营销意向预测模型性能更佳,用该营销意向预测模型能够更加准确的预测营销意向值,所以根据该意向值选取的投放的营销人群也更加精准,能够进一步降低营销成本。需要说明的是,本申请实施例所涉及的“样本”、“样本特征”、“特征”均指经过特征工程得到的特征数据。
下文对每个步骤进行详细说明。
步骤S101中,图2是根据本申请实施例的样本生成模型的结构示意图,如图2所示,样本生成模型包括生成器G和判别器D,其中,生成器G采用深度神经网络,判别器D采用xDeepFM模型,并且,本申请的样本生成模型的判别器D为多分类模型,类型数量为N+1,其包括N个类别(用label表示)和一个判断是否真假(用valid表示)的标签。需要说明的是,通过one-hot编码将分类变量作为二进制向量的表示,首先,先将分类值映射为索引(整数值),然后将每个整数值表示为二进制向量,即除了整数的索引被标记为1,其他都是0。比如有三个类别的场景下,索引0对应二进制向量[1,0,0],索引1对应二进制向量[0,1,0],索引2对应二进制向量[0,0,1]。
值得说明的是,本申请实施例使用xDeepFM作为样本生成模型的判别器,能够更好的对营销领域中存在的稀疏特征进行高维特征交叉,对人群能有更准确的区分。
作为一个示例,请参阅图2所示的样本生成模型,根据该样本生成模型生成新样本的步骤包括:
步骤一:随机生成噪声数据(noise),并将其输入生成器G,得到生成的假样本(false_sample),给这部分样本打上类别标签(用label表示,用于指示样本的类别),即该假样本包括特征(features)和label;
步骤二:将原始样本即真样本(true_sample)和假样本放在一起得到混合样本,增加真假标签(用valid表示,用于指示样本为真或假),其中真样本对应valid=1,假样本对应valid=0;
步骤三:将混合样本输入判别器D以训练该判别器D,在训练过程中,判别器D通过对特征的学习来拟合标签(包括label和valid),即,在该过程中判别器D不断的调整参数,直到判别器D训练成熟,其中,label用来判断样本本身的类别,valid用来判断样本是原始样本还是生成的样本(即判断样本的真假);
步骤四:将noise输入联合(Combine)模块,该联合模块包含生成器G和判别器D,设定valid=1,以训练生成器G,由于步骤三中得到了训练好的判别器D,所以在训练生成器G的过程中,判别器D的参数不改变,因此,该步骤四中将noise输入联合模块是为了更新生成器G的参数,让生成器G生成的样本更像真样本;需要说明的是,样本生成模型包括判别器D和生成器G,生成器G的输入为noise,输出为features(指假样本的特征);判别器的输入为该features,输出为label和valid。联合模块用于训练生成器G,在训练过程中,将noise输入生成器G,然后输出生成的features,再将该features输入判别器D(该判别器D的参数固定),判别器D输出valid,然后计算损失,更新生成器G的参数。所以,联合模块的输入是noise,输出是valid。另外,该步骤四中设定valid=1是为了使生成的样本像真样本,基于此来训练生成器G,从而能够拟合valid=1。
步骤五:重复步骤二至步骤五,以得到性能合适(即符合目标预期)的生成器G;
步骤六:重新生成噪声数据,输入生成器G,输出features,使用判别器D对features进行预测,输出label,取label中前两个类别的概率例如为prob_0和prob_1,若prob_0>prob_1则label标为0,反之label标为1,以此得到二分类的label和features,从而一起构成新的样本,并输出。
根据上文,本申请实施例在样本生成模型的整个训练过程中,判别器不断调整参数以最大力度分辨样本的真假,而生成器生成的样本越来越像真实样本以迷惑判别器,在两者相互博弈下,性能都越来越好,最后生成的数据能够以假乱。
需要说明的是,步骤一至步骤五属于样本生成模型的训练阶段,当得到符合目标预期的生成器时,就得到了训练完成的样本生成模型;步骤六属于样本生成模型的应用阶段,即,通过预选训练的样本生成模型生成新样本。
作为一个示例,上述判别器包含线性模型、CIN模型和DNN模型。
作为一个示例,在训练判别器时,包括如下步骤:
步骤1:对上述步骤三中的混合样本,分别通过线性(Linear)模型、CIN(Compressed Interaction Network)模型和DNN(Deep Neural Networks)模型处理特征;
步骤2:将线性模型、CIN模型和DNN模型的输出结果Linear_Output、CIN_Output、DNN_Output这三个部分拼接起来形成特征向量;
步骤3:基于特征向量判断样本的类别和真假,并计算损失,当损失收敛时,停止训练。
作为一个示例,图3是根据本申请实施例的判别器的结构示意图,如图3所示,将通过one-hot编码得到的特征输入判别器之后,第一方面,通过线性模型处理输入的特征,得到第一特征(Linear_Output);第二方面,对输入的特征进行嵌入(Embedding),使其降维成低维度稠密特征,将这些低维度稠密特征拼接成一个隐含的嵌入层(Embedding layer),再分别通过CIN模型和DNN模型处理,得到第二特征(CIN_Output)和第三特征(DNN_Output);然后,将第一特征、第二特征和第三特征进行拼接;最后通过输出单元(Output unit)输出特征向量,例如,拼接前为[1,2],[2,3,1],[10,4],拼接后为[1,2,2,3,1,10,4]。
因此,在线性模型处理的特征的基础上增加了CIN模型和DNN模型处理的特征,以显式和隐式的形式学习了高阶的特征交互,所以会获得更好的效果。
基于上述内容,可以得到训练完成的样本生成模型。从而,在本申请实施例的步骤S101中,对原始样本进行特征工程,得到的样本包括原始样本特征和label,其中label为0或者1,0表示无意向,1表示有意向。然后,将原始样本特征输入预先训练的样本生成模型,通过样本生成模型的生成器生成新样本。
在步骤S102中,将原始样本和新样本按预设比例(比如10:1)混合,得到混合样本;然后,基于混合样本训练分类模型(例如逻辑回归模型、GBDT模型或xDeepFM模型等),在训练过程中,分类模型根据输入的特征进行学习,不断的拟合label,最后,将训练完成所得到的模型称为营销意向预测模型。
在步骤S103中,对拟营销的全量人群进行特征工程,得到每个人对应的特征;将所有拟营销人群的样本特征输入营销意向预测模型,得到意向值,该意向值是位于0-1区间的概率值,概率越高代表这个人的意向越高。然后,根据意向值的大小选取投放的营销人群。
作为一种方式,可以将拟营销人群的样本按照意向值从大到小排序,选取靠前的预设数量的样本作为投放的营销人群。该方法的优点是输出结果比较清晰。若拟营销人群中有已营销的人群,去掉已营销的人群之后,按照意向值从大到小进行排序,选取前N个人作为营销人群包。
作为另一种方式,无需执行排序步骤,当得出某个人的意向值低于预设阈值(例如为0.6)时,过滤掉这个人的信息;保留意向值在预设阈值以上的人群作为投放的营销人群,该方法的优点是效率高。
在计算营销成本时,比如营销10万(w)人群,只有100个人有响应,假设每个人的营销成本是0.1元,那么单个转化人群的营销成本为0.1*10w/100=100元/人。在本申请实施例中,通过样本生成模型能够生成以假乱真的新样本,通过对新样本的学习可以挖掘更多的潜在高分人群,以扩充营销人数。由于新样本的加入,分类模型学习到了新的特征表征方式,使得有新的高分人群出现,从而在营销成本一定的情况下,营销人群数量较之前增加。
所以,通过增加后的营销人群的样本训练分类模型,得到的营销意向预测模型性能更佳,用该营销意向预测模型能够更加准确的预测营销意向值,根据该意向值选取的投放的营销人群也更加精准,从而能够降低营销成本。
需要说明的是,本申请所记载的“真标签”是指标签的信息代表真样本;“假标签”是指标签的信息代表假样本,即由生成器生成的样本。
本申请实施例还提供一种营销人群的投放装置,图4是根据本申请实施例的营销人群的投放装置的结构框图,如图4所示,该装置包括生成模块1、训练模块2和预测模块3,生成模块1用于将原始样本特征输入预先训练的样本生成模型,生成新样本,其中,原始样本特征由原始样本经过特征工程得到;训练模块2用于将原始样本和新样本按预设比例混合,得到混合样本,并基于混合样本训练分类模型,得到营销意向预测模型;预测模块3用于将拟营销人群的样本特征输入营销意向预测模型,得到意向值,并根据意向值选取投放的营销人群。
根据上述装置,通过样本生成模型生成新样本,将新样本与原始样本进行混合,增加了样本数量,用混合样本训练分类模型,得到的营销意向预测模型性能更佳,用该营销意向预测模型能够更加准确的预测营销意向值,根据该意向值选取的投放的营销人群也更加精准,能够进一步降低营销成本。
进一步的,样本生成模型包括生成器和判别器,生成器采用深度神经网络,而判别器采用xDeepFM模型,能够更好的对营销领域中存在的稀疏特征进行高维特征交叉,对人群能有更准确的区分。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
另外,结合上述实施例中的营销人群的投放方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种营销人群的投放方法。
本申请的一个实施例中还提供了一种电子设备,该电子设备可以是终端。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种营销人群的投放方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,图5是根据本申请实施例的电子设备的内部结构示意图,如图5所示,提供了一种电子设备,该电子设备可以是服务器,其内部结构图可以如图5所示。该电子设备包括通过内部总线连接的处理器、网络接口、内存储器和非易失性存储器,其中,该非易失性存储器存储有操作系统、计算机程序和数据库。处理器用于提供计算和控制能力,网络接口用于与外部的终端通过网络连接通信,内存储器用于为操作系统和计算机程序的运行提供环境,计算机程序被处理器执行时以实现一种营销人群的投放方法,数据库用于存储数据。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种营销人群的投放方法,其特征在于,所述方法包括:
随机生成噪声数据,并将所述噪声数据输入预先训练的样本生成模型,生成新样本,其中,所述噪声数据为样本特征的随机数值;
将原始样本和所述新样本按预设比例混合,得到混合样本,并基于所述混合样本训练分类模型,得到营销意向预测模型;
将拟营销人群的样本特征输入所述营销意向预测模型,得到意向值,并根据所述意向值选取投放的营销人群。
2.根据权利要求1所述的方法,其特征在于,所述样本生成模型包括生成器和判别器,所述生成器采用深度神经网络,所述判别器采用xDeepFM模型。
3.根据权利要求2所述的方法,其特征在于,所述样本生成模型的训练方式包括如下步骤:
随机生成噪声数据,将所述噪声数据输入所述生成器,生成假样本,所述假样本包含样本特征和类别标签,所述类别标签用于指示样本的类别;
将真样本和所述假样本混合,得到混合样本,并对该混合样本增加真假标签,所述真假标签用于指示样本为真或假;
将所述混合样本输入所述判别器,通过对样本特征的学习拟合所述类别标签和所述真假标签以训练所述判别器;
将所述噪声数据输入联合模块,并设定真假标签的值为真,所述联合模块包含所述生成器和所述判别器;
在所述联合模块中保持所述判别器的参数不变,训练所述生成器;
重复训练所述判别器和所述生成器,直到得到性能符合目标预期的生成器,所述样本生成模型训练完成。
4.根据权利要求3所述的方法,其特征在于,所述判别器包括线性模型、CIN模型和DNN模型,所述通过对样本特征的学习拟合所述类别标签和所述真假标签以训练所述判别器包括:
对所述混合样本,分别通过所述线性模型、所述CIN模型和所述DNN模型处理特征;
将所述线性模型、所述CIN模型和所述DNN模型的输出结果进行拼接,得到特征向量;
基于所述特征向量判断样本的类别和真假。
5.根据权利要求1所述的方法,其特征在于,所述基于所述混合样本训练分类模型,得到营销意向预测模型包括:
基于所述混合样本训练逻辑回归模型、GBDT模型或xDeepFM模型,得到营销意向预测模型。
6.根据权利要求1所述的方法,其特征在于,所述将所述原始样本和所述新样本按预设比例混合,得到混合样本包括:
将所述原始样本和所述新样本按10:1混合,得到混合样本。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述意向值选取投放的营销人群包括:
将拟营销人群中的已营销人员进行去除;
将保留的样本按照所述意向值从大到小排序,选取靠前的预设数量的样本作为投放的营销人群。
8.一种营销人群的投放装置,其特征在于,包括:
生成模块,用于随机生成噪声数据,并将所述噪声数据输入预先训练的样本生成模型,生成新样本,其中,所述噪声数据为样本特征的随机数值;
训练模块,用于将原始样本和所述新样本按预设比例混合,得到混合样本,并基于所述混合样本训练分类模型,得到营销意向预测模型;
预测模块,用于将拟营销人群的样本特征输入所述营销意向预测模型,得到意向值,并根据所述意向值选取投放的营销人群。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至7中任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111197937.9A CN113988908A (zh) | 2021-10-14 | 2021-10-14 | 营销人群的投放方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111197937.9A CN113988908A (zh) | 2021-10-14 | 2021-10-14 | 营销人群的投放方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113988908A true CN113988908A (zh) | 2022-01-28 |
Family
ID=79738606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111197937.9A Pending CN113988908A (zh) | 2021-10-14 | 2021-10-14 | 营销人群的投放方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113988908A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111241291A (zh) * | 2020-04-24 | 2020-06-05 | 支付宝(杭州)信息技术有限公司 | 利用对抗生成网络生成对抗样本的方法及装置 |
CN112541817A (zh) * | 2020-12-22 | 2021-03-23 | 建信金融科技有限责任公司 | 一种个人消费贷款潜在客户的营销响应处理方法及系统 |
WO2021068563A1 (zh) * | 2019-10-11 | 2021-04-15 | 平安科技(深圳)有限公司 | 样本数据处理方法、装置、计算机设备及存储介质 |
CN113298230A (zh) * | 2021-05-14 | 2021-08-24 | 西安理工大学 | 一种基于生成对抗网络的不平衡数据集的预测方法 |
-
2021
- 2021-10-14 CN CN202111197937.9A patent/CN113988908A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021068563A1 (zh) * | 2019-10-11 | 2021-04-15 | 平安科技(深圳)有限公司 | 样本数据处理方法、装置、计算机设备及存储介质 |
CN111241291A (zh) * | 2020-04-24 | 2020-06-05 | 支付宝(杭州)信息技术有限公司 | 利用对抗生成网络生成对抗样本的方法及装置 |
CN112541817A (zh) * | 2020-12-22 | 2021-03-23 | 建信金融科技有限责任公司 | 一种个人消费贷款潜在客户的营销响应处理方法及系统 |
CN113298230A (zh) * | 2021-05-14 | 2021-08-24 | 西安理工大学 | 一种基于生成对抗网络的不平衡数据集的预测方法 |
Non-Patent Citations (5)
Title |
---|
吴茂贵等: ""智能系统与技术丛书 深入浅出Embedding 原理解析与应用实践"", 30 June 2021, 机械工业出版社, pages: 283 - 284 * |
季晨雨: ""不平衡数据分类研究及在银行营销中的应用"", 山西电子技术, no. 5, 15 October 2018 (2018-10-15) * |
方志军等: ""TensorFlow应用案例教程"", 31 August 2020, 中国铁道出版社, pages: 140 * |
王青天等: ""Python金融大数据风控建模实战"", 31 May 2020, 机械工业出版社, pages: 218 - 219 * |
陈云霁等: ""智能计算系统"", 29 February 2020, 机械工业出版社, pages: 91 - 93 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112632385A (zh) | 课程推荐方法、装置、计算机设备及介质 | |
CN112231485B (zh) | 文本推荐方法、装置、计算机设备及存储介质 | |
CN110888911A (zh) | 样本数据处理方法、装置、计算机设备及存储介质 | |
CN113435998B (zh) | 贷款逾期预测方法、装置、电子设备及存储介质 | |
Vesely et al. | Permutation-based true discovery guarantee by sum tests | |
CN112308237A (zh) | 一种问答数据增强方法、装置、计算机设备及存储介质 | |
CN112686301A (zh) | 基于交叉验证的数据标注方法及相关设备 | |
Nowotny | Two challenges of correct validation in pattern recognition | |
CN113886550A (zh) | 基于注意力机制的问答匹配方法、装置、设备及存储介质 | |
WO2023024408A1 (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN112269875A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN113515593A (zh) | 基于聚类模型的话题检测方法、装置和计算机设备 | |
CN110597977B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN113609337A (zh) | 图神经网络的预训练方法、训练方法、装置、设备及介质 | |
CN110991538A (zh) | 样本分类方法、装置、存储介质和计算机设备 | |
CN113988908A (zh) | 营销人群的投放方法、装置、电子设备和存储介质 | |
CN116958622A (zh) | 数据的分类方法、装置、设备、介质及程序产品 | |
CN115375453A (zh) | 系统资源分配方法及装置 | |
CN113570286B (zh) | 基于人工智能的资源分配方法、装置、电子设备及介质 | |
CN113656690A (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
Xue et al. | User navigation behavior mining using multiple data domain description | |
CN113886577A (zh) | 一种文本分类方法、装置、设备及存储介质 | |
CN113591881A (zh) | 基于模型融合的意图识别方法、装置、电子设备及介质 | |
CN113806540A (zh) | 文本打标签方法、装置、电子设备及存储介质 | |
Burduk et al. | Homogeneous ensemble selection-experimental studies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |