CN111667308A - 广告推荐预测系统及方法 - Google Patents

广告推荐预测系统及方法 Download PDF

Info

Publication number
CN111667308A
CN111667308A CN202010479033.4A CN202010479033A CN111667308A CN 111667308 A CN111667308 A CN 111667308A CN 202010479033 A CN202010479033 A CN 202010479033A CN 111667308 A CN111667308 A CN 111667308A
Authority
CN
China
Prior art keywords
data
advertisement
prediction
model
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010479033.4A
Other languages
English (en)
Inventor
范大煌
姚俊展
漆英
胡文涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010479033.4A priority Critical patent/CN111667308A/zh
Publication of CN111667308A publication Critical patent/CN111667308A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种广告推荐预测系统及方法,所述系统包含数据获取模块、特征提取与预处理模块、模型构建与训练模块和预测推荐模块;数据获取模块用于获取用户日志数据和广告信息数据;特征提取与预处理模块用于根据用户日志数据和广告信息数据获得用户有效点击数据;根据用户有效点击数据分析获得对应的特征图谱;模型构建与训练模块用于根据特征图谱通过循环神经网络算法构建GRU神经网络模型;根据广告信息数据建立正负样本训练集,根据正负样本训练集构建二分类模型;通过二分类模型和GRU神经网络模型获得预测模型;预测推荐模块用于根据预测模型和测试数据获得广告预测点击率,根据广告预测点击率获得广告预测数据。

Description

广告推荐预测系统及方法
技术领域
本发明涉及数据分析领域,尤指一种基于CNN+GRU的广告推荐预测系统及方法。
背景技术
互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展而带来的网上信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正有用的那部分信息,对信息的使用效率反而降低了。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的用户不断流失。
为了更好的为用户提供服务,在为用户提供服务的同时赚取更多的利润,越来越多的公司通过采用个性化推荐技术,辅助用户更快地发现自己喜欢的东西。公司根据用户在产品上的行为记录,结合用户自身和“标的物”的信息,利用广告推荐技术(机器学习的一个分支)来为用户推荐可能感兴趣的广告。伴随着深度学习的热潮,越来越多人将深度学习应用在广告推荐系统中。典型的有基于长短期记忆(LSTM,Long Short Term Memory)模型用于预测并推荐广告,但此方法的模型训练时更不容易收敛,在训练模型是耗时较长,难度较大。因此,如何从海量的广告与多种的用户历史行为中学习用户偏好,为客户提供精准的广告推荐服务是业内亟待解决的问题。
发明内容
本发明目的在于提供一种广告推荐预测系统及方法,为平台提供更准确、更高效的广告点击率预测,推荐更符合用户心理的信息,减少无关信息推荐,改善用户体验。
为达上述目的,本发明所提供的广告推荐预测系统,具体包含数据获取模块、特征提取与预处理模块、模型构建与训练模块和预测推荐模块;所述数据获取模块用于获取用户日志数据和广告信息数据;所述特征提取与预处理模块用于根据所述用户日志数据和所述广告信息数据获得用户有效点击数据;根据所述用户有效点击数据分析获得对应的特征图谱;所述模型构建与训练模块用于根据所述特征图谱通过循环神经网络算法构建GRU神经网络模型;根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型;通过所述二分类模型和所述GRU神经网络模型获得预测模型;所述预测推荐模块用于根据所述预测模型和待测数据获得广告预测点击率,根据所述广告预测点击率获得广告预测数据。
在上述广告推荐预测系统中,优选的,所述特征提取与预处理模块还包含预处理单元,所述预处理单元用于将所述用户日志数据和所述广告信息数据按预设时间周期划分为训练数据和测试数据;比对筛除所述训练数据中所述用户日志数据和所述广告信息数据中用户的无效点击数据,获得用户有效点击数据。
在上述广告推荐预测系统中,优选的,所述特征提取与预处理模块包含排序单元,所述排序单元用于根据所述用户有效点击数据的对应时间信息,对所述用户有效点击数据进行排序处理获得序列数据。
在上述广告推荐预测系统中,优选的,所述特征提取与预处理模块还包含挖掘单元,所述挖掘单元用于通过对所述序列数据进行cnn深度网络挖掘结合dropout技术获得特征图谱。
在上述广告推荐预测系统中,优选的,所述数据获取模块还包含转换单元,所述转换单元用于将所述用户日志数据和所述广告信息数据中非结构化数据通过预设数据字典转换为结构化数据。
在上述广告推荐预测系统中,优选的,所述模型构建与训练模块包含二分类模型构建单元,所述二分类模型构建单元用于根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型;通过所述二分类模型和预设的影响点击量的信息计算获得损失值。
在上述广告推荐预测系统中,优选的,所述模型构建与训练模块包含GRU模型构建单元,所述GRU模型构建单元包含Dense层,所述Dense层用于将输出的向量转换为标签向量的维度后分析获得所述GRU神经网络模型的损失函数,根据所述损失函数和所述损失值调整所述GRU神经网络模型获得预测模型。
本发明还提供一种广告推荐预测方法,所述方法包含:获取用户日志数据和广告信息数据;根据所述用户日志数据和所述广告信息数据获得用户有效点击数据;根据所述用户有效点击数据分析获得对应的特征图谱;根据所述特征图谱通过循环神经网络算法构建GRU神经网络模型;根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型;通过所述二分类模型和所述GRU神经网络模型获得预测模型;根据所述预测模型和待测数据获得广告预测点击率,根据所述广告预测点击率获得广告预测数据。
在上述广告推荐预测方法中,优选的,根据所述用户日志数据和所述广告信息数据获得用户有效点击数据包含:将所述用户日志数据和所述广告信息数据按预设时间周期划分为训练数据和测试数据;比对筛除所述训练数据中所述用户日志数据和所述广告信息数据中用户的无效点击数据,获得用户有效点击数据。
在上述广告推荐预测方法中,优选的,根据所述用户有效点击数据分析获得对应的特征图谱包含:根据所述用户有效点击数据的对应时间信息,对所述用户有效点击数据进行排序处理获得序列数据;通过对所述序列数据进行cnn深度网络挖掘结合dropout技术获得特征图谱。
在上述广告推荐预测方法中,优选的,获取用户日志数据和广告信息数据还包含:将所述用户日志数据和所述广告信息数据中非结构化数据通过预设数据字典转换为结构化数据。
在上述广告推荐预测方法中,优选的,根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型还包含:通过所述二分类模型和预设的影响点击量的信息计算获得损失值。
在上述广告推荐预测方法中,优选的,通过所述二分类模型和所述GRU神经网络模型获得预测模型包含:将所述GRU神经网络模型输出的向量转换为标签向量的维度后,分析获得所述GRU神经网络模型的损失函数;根据所述损失函数和所述损失值调整所述GRU神经网络模型获得预测模型。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
本发明的有益技术效果在于:通过CNN强大的特征提取能力,对预处理后的原数据进行关键性的特征提取,降低了人力开销,又提升了整体预测模型的效率;基于GRU的预测模型相比传统预测模型能提高预测的准确率,相比基于LSTM的预测模型,在提升预测准确率的同时,能更快速地进行模型训练;可以为平台提供更准确、更高效的的广告点击率预测,推荐更符合用户心理的信息,减少无关信息推荐,改善用户体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:
图1为本发明一实施例所提供的广告推荐预测系统的结构示意图;
图2A为本发明一实施例所提供的GRU的结构示意图;
图2B为本发明一实施例所提供的数据输入GRU模型的学习流程示意图;
图3为本发明一实施例所提供的广告推荐预测系统的应用流程示意图;
图4为本发明一实施例所提供的广告推荐预测方法的流程示意图;
图5为本发明一实施例所提供的电子设备的结构示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
请参考图1所示,本发明所提供的一种本发明所提供的广告推荐预测系统,具体包含数据获取模块、特征提取与预处理模块、模型构建与训练模块和预测推荐模块;所述数据获取模块用于获取用户日志数据和广告信息数据;所述特征提取与预处理模块用于根据所述用户日志数据和所述广告信息数据获得用户有效点击数据;根据所述用户有效点击数据分析获得对应的特征图谱;所述模型构建与训练模块用于根据所述特征图谱通过循环神经网络算法构建GRU神经网络模型;根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型;通过所述二分类模型和所述GRU神经网络模型获得预测模型;所述预测推荐模块用于根据所述预测模型和待测数据获得广告预测点击率,根据所述广告预测点击率获得广告预测数据。
在上述实施例中,所述数据获取模块还可包含转换单元,所述转换单元用于将所述用户日志数据和所述广告信息数据中非结构化数据通过预设数据字典转换为结构化数据。实际工作中,所述数据获取模块得到的数据为用户日志数据与广告信息数据。用户日志数据包含用户个人信息与用户点击数据,如用户年龄、性别,籍贯、点击时间、停留时间、点击广告ID等;广告信息数据为广告ID、广告位、广告素材、广告分类、推广计划等,例如:
用户数据A:(小明,23,男,广东,2020-04-01 08:34:31,46,124…)分别对应(用户名、年龄、性别,籍贯、点击时间、点击广告ID…);
广告数据X:(124,首页板块,图片,促销广告,一季度主打…)分别对应(广告ID,广告位、广告素材、广告分类、推广计划…);
因为用户数据与广告数据有部分为非结构化数据(如:性别,籍贯等),不利于分析及处理。因此将其转换为结构化数据,建立相应的数据字典将其转换为结构化数据;例如:
用户数据A:(66,23,1,4,2020-04-01 08:34:31,46,124…)分别对应(用户ID、年龄、性别ID,籍贯ID、点击时间、停留时间、点击广告ID…);
广告数据X:(124,1,2,2,1…)分别对应(广告ID、广告位ID、广告素材ID、广告分类ID、推广计划ID)。
在本发明一实施例中,所述特征提取与预处理模块还包含预处理单元,所述预处理单元用于将所述用户日志数据和所述广告信息数据按预设时间周期划分为训练数据和测试数据;比对筛除所述训练数据中所述用户日志数据和所述广告信息数据中用户的无效点击数据,获得用户有效点击数据。进一步的,所述特征提取与预处理模块还可包含排序单元和挖掘单元,所述排序单元用于根据所述用户有效点击数据的对应时间信息,对所述用户有效点击数据进行排序处理获得序列数据;所述挖掘单元用于通过对所述序列数据进行cnn深度网络挖掘结合dropout技术获得特征图谱。
实际工作中,所述特征提取与预处理模块主要作用在于运用特征处理手段从原始数据中获取影响力高的特征,并划分为训练数据与测试数据两大部分,为了保证预测的准确率,选取的原始数据时间长度可为12天,前面10天数据划分为训练数据,后边两天数据为测试数据;具体流程可参考如下实例:
第一步,对数据进行预处理。对数据进行分析,去除用户无效的点击数据,然后把两类数据进行拼接。通过设置时间界限来划分用户有无效果的点击,当用户停留在广告页面的时间超过15秒时,则为有效点击,否则为无效点击。在拼接和统计数据过程中,去掉不能合并或者统计的字段,如籍贯与籍贯所属省份,去掉籍贯所属省份只保留籍贯信息。例如:输入数据a:(66,23,1,4,2020-04-01 08:34:31,46,124,1,2,2,1……)分别对应(用户ID、年龄、性别ID,籍贯ID、点击时间、停留时间、广告ID、广告位ID、广告素材ID、广告分类ID、推广计划ID…);
第二步,构建时间先后顺序的序列数据。广告点击率时间以天为计算单位,把同一条广告的数据排好顺序,将每条数据进行先后排序。例如:
输入数据a1:(66,23,1,4,04-01,46,124,1,2,2,1……);
a2:(65,24,1,3,04-02,24,124,1,2,2,1……);
a3:(43,23,2,4,04-03,18,124,1,2,2,1……);
……
b1:(65,24,1,3,04-01,46,110,1,1,3,1……);
b2:(66,23,1,4,04-02,46,110,1,1,3,1……);
……
不同广告的时间序列数据最后可以表示为矩阵A,B…。
第三步,构建cnn模型并输入训练集,本发明中输入数据特征经过CNN网络地挖掘,维度可以得到降低,为了防止低维度训练数据造成预测模型过拟合,引进了dropout技术,最后通过cnn网络得到特征图谱。
其中,在cnn中主要使用了一维的卷积层(提取特征),即Conv1D层,最大池化层(减少输入数据的维度)与dropout层(防止过拟合)。最后经过Softmax层得到处理后的重要特征。处理得到的特征权重如下表1所示:
表1
Figure BDA0002516698840000061
Figure BDA0002516698840000071
经cnn处理得到不同广告的特征权重矩阵可表示为Xn=[X1,X2,X3…Xt]。
在本发明一实施例中,所述模型构建与训练模块还可包含二分类模型构建单元和GRU模型构建单元,所述二分类模型构建单元用于根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型;通过所述二分类模型和预设的影响点击量的信息计算获得损失值。所述GRU模型构建单元包含Dense层,所述Dense层用于将输出的向量转换为标签向量的维度后分析获得所述GRU神经网络模型的损失函数,根据所述损失函数和所述损失值调整所述GRU神经网络模型获得预测模型。其中,GRU神经网络是循环神经网络(Recurrent Neural Network,RNN)的一种。由于RNN能够保留对现在任务产生影响的历史结果,所以在处理前后结果有依赖关系的任务时,RNN表现优异,经常被使用于时间序列的处理,但是RNN在实际处理时间序列任务时,当前后相关联的两个时间序列相距步长超过一定范围时,就可能会出现梯度爆炸和梯度消失的现象;为了解决这一工程难题,本发明采用GRU神经网络,GRU又两个重要的门结构,更新门和重置门,详细结构请参考图2A所示。再请参考以下定义公式:
ut=σ(Wuit+Uuht-1+bu),
rt=σ(Writ+Urht-1+br),
Figure BDA0002516698840000081
Figure BDA0002516698840000082
其中σ表示的是sigmoid激活函数,ο表示的是点积,Wu,Wr,
Figure BDA0002516698840000083
Uz,Ur,Uh∈nH×nH,nH是隐藏层的大小,nI是输入的维度大小,it是GRU的输入,ht是第t个隐含状态。
GRU的输入门可以有效过滤部分不必要的信息以构造广告数据的状态,例如由于用户突然兴趣变化而引起的概念漂移。遗忘门表示数据对整体影响程度的下降,其作用相当于具有自适应的时间衰减因子。输出们的作用是过滤掉下一个细胞状态中不应该关注的内容。在上式中可以认为ht是提取广告数据中影响点击量的信息,为了更加准确的表示影响大小,本发明增加了一个loss即二分类模型,来提升影响程度的准确性。本发明所提供的GRU模型包含四层,前三层都是GRU单元构成,最后一层为Dense层,Dense层可以将输的向量转换为标签向量的维度,实现特征的非线性组合,利于计算损失;Dense层的激活函数为sigmoid,模型的损失函数为logloss,模型的评价指标则由AUC和logloss共同决定。
在上述实施例中,所述二分类模型即loss在实际工作中可测试数据中的广告数据的下一时刻的真实行为e(t+1)作为正例,负采样得到的广告数据行为作为负例
Figure BDA0002516698840000084
分别于提取的影响点击量的信息结合输入到辅助网络中得到预测结果,并通过logloss计算得到一个辅助的损失值。
Figure BDA0002516698840000085
Figure BDA0002516698840000086
其中ht表示的是GRU的第t个隐含状态,N为处理后的广告数据序列数量,σ表示的是Sigmoid激活函数。模型结合目标函数的损失和辅助函数的损失,可得到最后的损失值,模型的损失函数如下公式:
L=Ltraget+β*Laux
其中β调节目标损失和辅助损失的参数,其作用是平衡处理后的广告数据和最终的点击量关系。模型构建好后,将序列数据输入模型进行训练。广告的序列数据作为训练数据特征,对应的有效点击率作为训练数据的结果,用测试数据进行测试。例如:数据输入GRU模型及其学习过程:输入X广告训练数据:X=[X1,X2,X3,…Xt];具体请参考图2B所示,其中σ表示的是sigmoid激活函数,损失函数是用来估量预测值与真实值不一致的程度,Log函数为单调递增函数,不会改变优化结果,方便得到相应的参数值。在模型收敛的同时,使得损失函数的值尽可能的趋于0且AUC的值尽可能的趋于1。在训练完成后,用测试数据进行点击率的预测时,AUC的值越趋于1且logloss的值越接近0则代表预测的效果越好。
在本发明一实施例中,上述预测推荐模块主要用于用训练好的模型进行广告推荐预测。实际工作中,预测模型输出部分与一个神经元T进行全连接,以此对GRU的输出进行线性变化得到点击率预测值
Figure BDA0002516698840000091
其中,用
Figure BDA0002516698840000092
表示预测模型的输出值。最后,将测试数据输入训练完成的模型进行预测,平台按照预测得到的点击率来排序,从而得出广告展示区域。整体流程图如图3所示。
请参考图4所示,本发明还提供一种广告推荐预测方法,所述方法包含:
S401获取用户日志数据和广告信息数据;
S402根据所述用户日志数据和所述广告信息数据获得用户有效点击数据;根据所述用户有效点击数据分析获得对应的特征图谱;
S403根据所述特征图谱通过循环神经网络算法构建GRU神经网络模型;
S404根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型;
S405通过所述二分类模型和所述GRU神经网络模型获得预测模型;
S406根据所述预测模型和待测数据获得广告预测点击率,根据所述广告预测点击率获得广告预测数据。
其中获取用户日志数据和广告信息数据还可包含:将所述用户日志数据和所述广告信息数据中非结构化数据通过预设数据字典转换为结构化数据。
在上述实施例中,根据所述用户日志数据和所述广告信息数据获得用户有效点击数据包含:将所述用户日志数据和所述广告信息数据按预设时间周期划分为训练数据和测试数据;比对筛除所述训练数据中所述用户日志数据和所述广告信息数据中用户的无效点击数据,获得用户有效点击数据。进一步的,还可根据所述用户有效点击数据的对应时间信息,对所述用户有效点击数据进行排序处理获得序列数据;通过对所述序列数据进行cnn深度网络挖掘结合dropout技术获得特征图谱。
在上述实施例中,根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型还包含:通过所述二分类模型和预设的影响点击量的信息计算获得损失值。
在上述实施例中,通过所述二分类模型和所述GRU神经网络模型获得预测模型包含:将所述GRU神经网络模型输出的向量转换为标签向量的维度后,分析获得所述GRU神经网络模型的损失函数;根据所述损失函数和所述损失值调整所述GRU神经网络模型获得预测模型。
本发明的有益技术效果在于:通过CNN强大的特征提取能力,对预处理后的原数据进行关键性的特征提取,降低了人力开销,又提升了整体预测模型的效率;基于GRU的预测模型相比传统预测模型能提高预测的准确率,相比基于LSTM的预测模型,在提升预测准确率的同时,能更快速地进行模型训练;可以为平台提供更准确、更高效的的广告点击率预测,推荐更符合用户心理的信息,减少无关信息推荐,改善用户体验。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
如图5所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图5中所示的所有部件;此外,电子设备600还可以包括图5中没有示出的部件,可以参考现有技术。
如图5所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600的各个部件的操作。
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种广告推荐预测系统,其特征在于,所述系统包含数据获取模块、特征提取与预处理模块、模型构建与训练模块和预测推荐模块;
所述数据获取模块用于获取用户日志数据和广告信息数据;
所述特征提取与预处理模块用于根据所述用户日志数据和所述广告信息数据获得用户有效点击数据;根据所述用户有效点击数据分析获得对应的特征图谱;
所述模型构建与训练模块用于根据所述特征图谱通过循环神经网络算法构建GRU神经网络模型;根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型;通过所述二分类模型和所述GRU神经网络模型获得预测模型;
所述预测推荐模块用于根据所述预测模型和待测数据获得广告预测点击率,根据所述广告预测点击率获得广告预测数据。
2.根据权利要求1所述的广告推荐预测系统,其特征在于,所述特征提取与预处理模块还包含预处理单元,所述预处理单元用于将所述用户日志数据和所述广告信息数据按预设时间周期划分为训练数据和测试数据;比对筛除所述训练数据中所述用户日志数据和所述广告信息数据中用户的无效点击数据,获得用户有效点击数据。
3.根据权利要求2所述的广告推荐预测系统,其特征在于,所述特征提取与预处理模块包含排序单元,所述排序单元用于根据所述用户有效点击数据的对应时间信息,对所述用户有效点击数据进行排序处理获得序列数据。
4.根据权利要求3所述的广告推荐预测系统,其特征在于,所述特征提取与预处理模块还包含挖掘单元,所述挖掘单元用于通过对所述序列数据进行cnn深度网络挖掘结合dropout技术获得特征图谱。
5.根据权利要求1所述的广告推荐预测系统,其特征在于,所述数据获取模块还包含转换单元,所述转换单元用于将所述用户日志数据和所述广告信息数据中非结构化数据通过预设数据字典转换为结构化数据。
6.根据权利要求2所述的广告推荐预测系统,其特征在于,所述模型构建与训练模块包含二分类模型构建单元,所述二分类模型构建单元用于根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型;通过所述二分类模型和预设的影响点击量的信息计算获得损失值。
7.根据权利要求6所述的广告推荐预测系统,其特征在于,所述模型构建与训练模块包含GRU模型构建单元,所述GRU模型构建单元包含Dense层,所述Dense层用于将输出的向量转换为标签向量的维度后分析获得所述GRU神经网络模型的损失函数,根据所述损失函数和所述损失值调整所述GRU神经网络模型获得预测模型。
8.一种广告推荐预测方法,其特征在于,所述方法包含:
获取用户日志数据和广告信息数据;
根据所述用户日志数据和所述广告信息数据获得用户有效点击数据;
根据所述用户有效点击数据分析获得对应的特征图谱;
根据所述特征图谱通过循环神经网络算法构建GRU神经网络模型;
根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型;
通过所述二分类模型和所述GRU神经网络模型获得预测模型;
根据所述预测模型和待测数据获得广告预测点击率,根据所述广告预测点击率获得广告预测数据。
9.根据权利要求8所述的广告推荐预测方法,其特征在于,根据所述用户日志数据和所述广告信息数据获得用户有效点击数据包含:
将所述用户日志数据和所述广告信息数据按预设时间周期划分为训练数据和测试数据;
比对筛除所述训练数据中所述用户日志数据和所述广告信息数据中用户的无效点击数据,获得用户有效点击数据。
10.根据权利要求9所述的广告推荐预测方法,其特征在于,根据所述用户有效点击数据分析获得对应的特征图谱包含:
根据所述用户有效点击数据的对应时间信息,对所述用户有效点击数据进行排序处理获得序列数据;
通过对所述序列数据进行cnn深度网络挖掘结合dropout技术获得特征图谱。
11.根据权利要求8所述的广告推荐预测方法,其特征在于,获取用户日志数据和广告信息数据还包含:将所述用户日志数据和所述广告信息数据中非结构化数据通过预设数据字典转换为结构化数据。
12.根据权利要求8所述的广告推荐预测方法,其特征在于,根据所述广告信息数据建立正负样本训练集,根据所述正负样本训练集构建二分类模型还包含:通过所述二分类模型和预设的影响点击量的信息计算获得损失值。
13.根据权利要求12所述的广告推荐预测方法,其特征在于,通过所述二分类模型和所述GRU神经网络模型获得预测模型包含:
将所述GRU神经网络模型输出的向量转换为标签向量的维度后,分析获得所述GRU神经网络模型的损失函数;
根据所述损失函数和所述损失值调整所述GRU神经网络模型获得预测模型。
14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求8至13任一所述方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求8至13任一所述方法的计算机程序。
CN202010479033.4A 2020-05-29 2020-05-29 广告推荐预测系统及方法 Pending CN111667308A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010479033.4A CN111667308A (zh) 2020-05-29 2020-05-29 广告推荐预测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010479033.4A CN111667308A (zh) 2020-05-29 2020-05-29 广告推荐预测系统及方法

Publications (1)

Publication Number Publication Date
CN111667308A true CN111667308A (zh) 2020-09-15

Family

ID=72385240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010479033.4A Pending CN111667308A (zh) 2020-05-29 2020-05-29 广告推荐预测系统及方法

Country Status (1)

Country Link
CN (1) CN111667308A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115365A (zh) * 2020-09-25 2020-12-22 贝壳技术有限公司 模型协同优化的方法、装置、介质和电子设备
CN112150206A (zh) * 2020-09-28 2020-12-29 京东数字科技控股股份有限公司 用户感兴趣物品的预测方法及设备
CN112200602A (zh) * 2020-09-21 2021-01-08 北京达佳互联信息技术有限公司 用于广告推荐的神经网络模型训练方法及装置
CN112860999A (zh) * 2021-02-10 2021-05-28 脸萌有限公司 信息推荐方法、装置、设备和存储介质
CN113190725A (zh) * 2021-03-31 2021-07-30 北京达佳互联信息技术有限公司 对象的推荐及模型训练方法和装置、设备、介质和产品
CN113610582A (zh) * 2021-08-16 2021-11-05 脸萌有限公司 广告推荐方法、装置、存储介质及电子设备
CN113806568A (zh) * 2021-08-10 2021-12-17 中国人民大学 多媒体资源推荐方法、装置、电子设备及存储介质
CN114048392A (zh) * 2022-01-13 2022-02-15 北京达佳互联信息技术有限公司 多媒体资源推送方法、装置、电子设备及存储介质
CN115440317A (zh) * 2022-07-20 2022-12-06 中南大学 一种浸出铀浓度的预测方法及装置、电子设备、存储介质
CN116911954A (zh) * 2023-09-12 2023-10-20 深圳须弥云图空间科技有限公司 基于兴趣和流行度推荐物品的方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875916A (zh) * 2018-06-27 2018-11-23 北京工业大学 一种基于gru神经网络的广告点击率预测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875916A (zh) * 2018-06-27 2018-11-23 北京工业大学 一种基于gru神经网络的广告点击率预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王鹏 等: "基于AC-BiGRU 网络的文本情感分析模型", 《电子技术与软件工程》, pages 151 - 155 *
田武: "基于GRU 神经网络的广告精准投放预测模型研究", vol. 2020, no. 4, pages 140 - 35 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200602A (zh) * 2020-09-21 2021-01-08 北京达佳互联信息技术有限公司 用于广告推荐的神经网络模型训练方法及装置
CN112115365A (zh) * 2020-09-25 2020-12-22 贝壳技术有限公司 模型协同优化的方法、装置、介质和电子设备
CN112150206A (zh) * 2020-09-28 2020-12-29 京东数字科技控股股份有限公司 用户感兴趣物品的预测方法及设备
CN112860999B (zh) * 2021-02-10 2023-04-18 脸萌有限公司 信息推荐方法、装置、设备和存储介质
CN112860999A (zh) * 2021-02-10 2021-05-28 脸萌有限公司 信息推荐方法、装置、设备和存储介质
CN113190725A (zh) * 2021-03-31 2021-07-30 北京达佳互联信息技术有限公司 对象的推荐及模型训练方法和装置、设备、介质和产品
CN113190725B (zh) * 2021-03-31 2023-12-12 北京达佳互联信息技术有限公司 对象的推荐及模型训练方法和装置、设备、介质和产品
CN113806568A (zh) * 2021-08-10 2021-12-17 中国人民大学 多媒体资源推荐方法、装置、电子设备及存储介质
CN113806568B (zh) * 2021-08-10 2023-11-03 中国人民大学 多媒体资源推荐方法、装置、电子设备及存储介质
CN113610582A (zh) * 2021-08-16 2021-11-05 脸萌有限公司 广告推荐方法、装置、存储介质及电子设备
CN114048392A (zh) * 2022-01-13 2022-02-15 北京达佳互联信息技术有限公司 多媒体资源推送方法、装置、电子设备及存储介质
CN115440317A (zh) * 2022-07-20 2022-12-06 中南大学 一种浸出铀浓度的预测方法及装置、电子设备、存储介质
CN116911954A (zh) * 2023-09-12 2023-10-20 深圳须弥云图空间科技有限公司 基于兴趣和流行度推荐物品的方法及装置
CN116911954B (zh) * 2023-09-12 2024-01-05 深圳须弥云图空间科技有限公司 基于兴趣和流行度推荐物品的方法及装置

Similar Documents

Publication Publication Date Title
CN111667308A (zh) 广告推荐预测系统及方法
CN111966914B (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN111475613A (zh) 案件分类方法、装置、计算机设备及存储介质
CN111932269B (zh) 设备信息处理方法及装置
CN111815432B (zh) 金融服务风险预测方法及装置
CN111339309B (zh) 一种用户意图的语料扩展方法和系统
US20220172260A1 (en) Method, apparatus, storage medium, and device for generating user profile
CN112085541A (zh) 基于浏览消费时序数据的用户需求分析方法及装置
CN106649696A (zh) 信息分类方法及装置
CN111950295A (zh) 一种训练自然语言处理模型的方法和系统
CN111783873A (zh) 基于增量朴素贝叶斯模型的用户画像方法及装置
CN112328909A (zh) 信息推荐方法、装置、计算机设备及介质
CN112528164A (zh) 一种用户协同过滤召回方法及装置
CN112819024A (zh) 模型处理方法、用户数据处理方法及装置、计算机设备
CN113962965A (zh) 图像质量评价方法、装置、设备以及存储介质
CN112381236A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
CN113033912A (zh) 问题解决人推荐方法及装置
CN116910202A (zh) 一种数据处理方法及相关设备
CN115965456A (zh) 数据变动分析方法及装置
CN112818084B (zh) 信息交互方法、相关装置、设备及计算机可读介质
CN113377951A (zh) 智能客服机器人的语料构建方法及装置
CN113570044A (zh) 客户流失分析模型训练方法及装置
CN114238798A (zh) 基于神经网络的搜索排序方法、系统、设备及存储介质
CN113312445A (zh) 数据处理方法、模型构建方法、分类方法及计算设备
CN112418442A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination