CN107742221A - 一种推广信息的处理方法、装置和系统 - Google Patents

一种推广信息的处理方法、装置和系统 Download PDF

Info

Publication number
CN107742221A
CN107742221A CN201610707899.XA CN201610707899A CN107742221A CN 107742221 A CN107742221 A CN 107742221A CN 201610707899 A CN201610707899 A CN 201610707899A CN 107742221 A CN107742221 A CN 107742221A
Authority
CN
China
Prior art keywords
promotion message
launched
type
clicking rate
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610707899.XA
Other languages
English (en)
Inventor
刘凯
刘大鹏
肖磊
李毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610707899.XA priority Critical patent/CN107742221A/zh
Publication of CN107742221A publication Critical patent/CN107742221A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种推广信息的处理方法、装置和系统;本发明实施例可以获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息,然后,根据该点击用户信息对该已投放推广信息进行标注,并采用预设分类模型对标注数据进行训练,得到训练后分类模型,然后,基于该训练后分类模型预测待投放推广信息的点击率,从而达到对待投放推广信息的点击率进行预测的目的;该方案可以提高预测的准确性,有利于提高推广信息投放的精准性。

Description

一种推广信息的处理方法、装置和系统
技术领域
本发明涉及通信技术领域,具体涉及一种推广信息的处理方法、装置和系统。
背景技术
大数据的背景下,各种推广信息如广告的投放等,已经成为数据变现的重要途径。以广告为例,在现有技术中,一般会根据用户的喜好来对广告进行投放,比如,A用户的兴趣为美妆,则系统可以在该用户的兴趣标签中打上“美妆”等标签,这样,当有涉及到“美妆”方面的广告时,便可以将具有相应“美妆”等标签的用户作为目标用户,并进行推送;为了提高广告投放的精准性,在对新的广告进行投放之前,一般都会对点击率进行预测,比如,可以根据用户的兴趣标签,来对该新的广告的点击率进行预测,并根据预测将该新的广告投放给点击率相对较高的人群。
在对现有技术的研究和实践过程中,本发明的发明人发现,由于用户的兴趣在不断变化,因此,现有的点击率预测的准确性并不高,从而影响到推广信息,比如广告的投放精准性。
发明内容
本发明实施例提供一种推广信息的处理方法、装置和系统,可以提高点击率预测的准确性、以及提高推广信息投放的精准性。
本发明实施例提供的一种推广信息的处理方法,包括:
获取多条已投放推广信息、以及所述已投放推广信息对应的点击用户信息;
根据所述点击用户信息对所述已投放推广信息进行标注,得到标注数据;
采用预设分类模型对所述标注数据进行训练,得到训练后分类模型;
基于所述训练后分类模型对待投放推广信息的点击率进行预测。
相应的,本发明实施例还提供一种推广信息的处理装置,包括:
获取单元,用于获取多条已投放推广信息、以及所述已投放推广信息对应的点击用户信息;
标注单元,用于根据所述点击用户信息对所述已投放推广信息进行标注,得到标注数据;
训练单元,用于采用预设分类模型对所述标注数据进行训练,得到训练后分类模型;
预测单元,用于基于所述训练后分类模型对待投放推广信息的点击率进行预测。
此外,本发明实施例还提供一种推广信息的处理系统,包括本发明实施例所提供的任一种推广信息的处理装置。
本发明实施例可以获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息,然后,根据该点击用户信息对该已投放推广信息进行标注,并采用预设分类模型对标注数据进行训练,得到训练后分类模型,然后,基于该训练后分类模型预测待投放推广信息的点击率,从而达到对待投放推广信息的点击率进行预测的目的;由于该方案可以根据历史用户点击信息(即已投放推广信息对应的点击用户信息)对已投放推广信息进行标识并进行训练,然后基于训练得到的分类模型对待投放推广信息的点击率进行预测,因此,相对于现有技术中根据用户兴趣标签来进行预测的方案而言,大大减少了由于用户兴趣变化所导致的不确定因素,预测的准确性更高,有利于提高后续推广信息投放的精准性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的推广信息的处理方法的场景示意图;
图1b是本发明实施例提供的推广信息的处理方法的流程图;
图2a是本发明实施例提供的推广信息的处理方法的另一流程图;
图2b是本发明实施例提供的推广信息的处理方法中AlexNet模型的示意图;
图3a是本发明实施例提供的推广信息的处理装置的结构示意图;
图3b是本发明实施例提供的推广信息的处理装置的另一结构示意图;
图4是本发明实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种推广信息的处理方法、装置和系统。
该推广信息的处理系统可以包括本发明所提供的任一种推广信息的处理装置,其中,该推广信息的处理装置可以集成在服务器,比如广告服务器中等设备中。此外,该推广信息的处理系统还可以包括其他的设备,比如用户设备等,该用户设备用于对该推广信息的处理装置投放的推广信息,比如广告等进行点击,以进行观看,并将相应的用户点击信息反馈给该推广信息的处理装置。
例如,以该推广信息处理装置集成在广告服务器中为例,参见图1a,该广告服务器可以获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息,比如,可以在对投放信息,比如广告图片进行投放后,采集点击这些推广信息的用户的性别、年龄、地域、学历、和/或收入等信息(如接收点击用户所在的用户设备发送的用户信息),得到点击用户信息,然后,将推广信息和相应的点击用户信息进行保存,在需要时,从本地进行获取,等等;在获取到多条已投放推广信息、以及该已投放推广信息对应的点击用户信息后,广告服务器可以根据该点击用户信息对该已投放推广信息进行标注,得到标注数据,并采用预设分类模型对该标注数据进行训练,得到训练后分类模型,此后,便可以基于该训练后分类模型对待投放推广信息(比如待投放广告图片)的点击率进行预测。
可选的,在得到预测的点击率之后,广告服务器还可以根据该预测的点击率确定待投放推广信息的投放对象,然后,将该待投放推广信息投放给该投放对象,比如,发送给该投放对象所在的用户设备,等等。
以下分别进行详细说明。需说明的是,以下实施例的序号不作为实施例优选顺序的限定。
实施例一、
本发明实施例将从推广信息的处理装置的角度进行描述,该推广信息的处理装置具体可以集成在服务器,比如广告服务器中。
一种推广信息的处理方法,包括:获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息;根据该点击用户信息对该已投放推广信息进行标注,得到标注数据;采用预设分类模型对该标注数据进行训练,得到训练后分类模型;基于该训练后分类模型对待投放推广信息的点击率进行预测。
如图1b所示,该推广信息的处理方法的具体流程可以如下:
101、获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息。
其中,该推广信息可以包括广告或文宣等信息,其样式可以包括图片、和/文字等,为了描述方便,在本发明实施例均以该推广信息具体为广告,且样式为图片为例进行说明,即,该已投放推广信息具体可以为广告图片。
其中,该已投放推广信息对应的点击用户信息指的是点击该已投放推广信息的用户所对应的用户信息,比如,该点击用户信息可以包括用户的性别、年龄、地域、学历、和/或收入等信息。
可选的,获取该多条已投放推广信息和点击用户信息的方式可以有多种,比如,可以在对推广信息进行投放后,采集点击该推广信息的用户的用户信息(即点击用户信息),比如,接收各个用户设备发送的点击用户信息,等等,然后,将该推广信息、以及相应的点击用户信息保存本地(即该推广信息的处理装置)或其他网络侧设备,比如网络存储器中,然后,在需要获取该已投放推广信息、以及对应的点击用户信息时,从保存的位置,比如本地或其他网络侧设备中获取相应的投放推广信息、以及对应的点击用户信息。
其中,获取的已投放推广信息、以及对应的点击用户信息的数量可以根据实际应用的需求而定,可以是预设时间范围内,比如,可以以当前时间为基准,获取过去一个月内的已投放推广信息、以及对应的点击用户信息,或者,也可以不对时间进行限制,而是获取预设数据数量,比如,获取60万条历史记录(即已投放推广信息和对应的点击用户信息),等等,在此不再赘述。
102、根据该点击用户信息对该已投放推广信息进行标注,得到标注数据。
例如,可以根据该点击用户信息,分别统计各已投放推广信息在不同人口统计学特性上的点击率,根据统计得到的点击率的大小分别对该已投放推广信息进行标注,得到标注数据。
其中,人口统计学特性可以包括性别、年龄、地域、学历、和/或收入等信息。例如,以该人口统计学特性可以包括性别、年龄、地域、学历、和/或收入等信息为例,则步骤“根据统计得到的点击率的大小分别对该已投放推广信息进行标注”可以包括:
根据统计得到的点击率的大小确定点击率较大的性别类型,得到目标性别类型,将该已投放推广信息的性别类型标注为该目标性别类型;和/或,
根据统计得到的点击率的大小确定点击率较大的年龄类型,得到目标年龄类型,将该已投放推广信息的年龄类型标注为该目标年龄类型;和/或,
根据统计得到的点击率的大小确定点击率较大的地域类型,得到目标地域类型,将该已投放推广信息的地域类型标注为该目标地域类型;和/或,
根据统计得到的点击率的大小确定点击率较大的学历类型,得到目标学历类型,将该已投放推广信息的学历类型标注为该目标学历类型;和/或,
根据统计得到的点击率的大小确定点击率较大的收入类型,得到目标收入类型,将该已投放推广信息的收入类型标注为该目标收入类型。
其中,性别类型、年龄类型、地域类型、学历类型、以及收入类型等的具体划分可以根据实际应用的需求而定,比如,性别可以划分为男性、女性和其他;年龄类型可以划分为“0~14岁”、“15~25岁”、“16~35岁”、“36岁~45岁”、以及“46岁以上”;地域类型的划分可以是南方和北方、或者国内和国外、或者是具体的国家、省份或城市,等等,以此类推,在此不再赘述。
103、采用预设分类模型对该标注数据进行训练,得到训练后分类模型。
其中,该预设分类模型可以根据实际应用的需求进行设置,比如,可以根据推广信息的具体类型而定,譬如,以该推广信息为图片为例,则该预设分类模型可以为卷积神经网络(CNN,Convolutional Neural Network),比如AlexNet(一种图像分类模型)、VGG(一种图像分类模型)、或Lenet(一种图像分类模型)等。即若该推广信息为图片,则步骤“采用预设分类模型对该训练数据进行训练,得到初始分类模型”可以包括:
采用卷积神经网络对该训练数据进行训练,得到初始分类模型。
其中,采用预设分类模型对该标注数据进行训练的方式可以有多种,例如,可以如下:
(1)将该标注数据转换为预设格式的数据并进行划分,得到训练数据和测试数据。
其中,训练数据用于构建模型,而测试数据则用于对构建得到的模型的准确性进行验证。
具体划分的方式可以根据实际应用的需求而定,可以按照一定的规则,也可以是随机的,在此不再赘述。
(2)采用预设分类模型对该训练数据进行训练,得到初始分类模型。
例如,以推广信息具体为图片为例,则此时,可以采用卷积神经网络对该训练数据进行训练,得到初始分类模型。
(3)采用该测试数据对该初始分类模型的准确率进行检验,若准确率高于预设准确率阈值,则执行(4),若准确率不高于预设准确率阈值,则执行步骤(5)。
(4)在准确率高于预设准确率阈值时,确定该初始分类模型为训练后分类模型。
(5)在准确率不高于预设准确率阈值时,返回执行获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息的步骤(即步骤101)。
也就是说,此时可以继续获取新的数据进行训练,以提高模型的准确率。
可选的,为了提高模型的可靠性,可以设置当标注数据的数量达到一定数量时,才进行数据的训练,即在步骤“将该标注数据转换为预设格式的数据并进行划分”之前,该推广信息的处理方法还可以包括:
确定该标注数据的数量是否超过预设数据量阈值;若是,则执行将该标注数据转换为预设格式的数据并进行划分的步骤;若否,则返回执行获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息的步骤(即步骤101)。
同理,为了提高模型的准确率,也可以设置当训练的数据达到一定数量时,才对模型进行验证,即在步骤“采用该测试数据对该初始分类模型的准确率进行检验”之前,该推广信息的处理方法还可以包括:
确定训练的次数是否超过预设训练次数阈值;若是,则执行采用该测试数据对该初始分类模型的准确率进行检验的步骤;若否,则返回执行采用预设分类模型对该训练数据进行训练,得到初始分类模型的步骤。
104、基于该训练后分类模型对待投放推广信息的点击率进行预测。
例如,可以从待投放推广信息中提取特征信息,采用该训练后分类模型对该特征信息对应的点击率进行计算,得到该待投放推广信息的点击率的预测值。
其中,该特征信息可以根据实际应用的需求而定,比如,以图片为例,则该特征信息可以包括该图片的内容,比如是篮球、或鲜花,等等,此外,还可以包括该图片的其他信息,比如形状和/或颜色,等等。
可选的,在得到预测的点击率之后,还可以根据该预测的点击率进行推广信息的投放,即,在步骤“基于该训练后分类模型对待投放推广信息的点击率进行预测”之后,该推广信息的处理方法还可以包括:
根据预测的点击率确定该待投放推广信息的投放对象,将该待投放推广信息向该投放对象进行投放。
由上可知,本实施例可以获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息,然后,根据该点击用户信息对该已投放推广信息进行标注,并采用预设分类模型对标注数据进行训练,得到训练后分类模型,然后,基于该训练后分类模型预测待投放推广信息的点击率,从而达到对待投放推广信息的点击率进行预测的目的;由于该方案可以根据历史用户点击信息(即已投放推广信息对应的点击用户信息)对已投放推广信息进行标识并进行训练,然后基于训练得到的分类模型对待投放推广信息的点击率进行预测,因此,相对于现有技术中根据用户兴趣标签来进行预测的方案而言,大大减少了由于用户兴趣变化所导致的不确定因素,预测的准确性更高,有利于提高后续推广信息投放的精准性。
实施例二、
根据实施例一所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该推广信息具体为广告图片、且该推广信息的处理装置具体集成在广告服务器为例进行说明。
如图2a所示,一种推广信息的处理装置,具体流程可以如下:
201、广告服务器获取多张已投放广告图片、以及该已投放广告图片对应的点击用户信息。
例如,可以将不同广告位上投放的图片(即已投放广告图片)采集下来,并保存在网络存储设备,比如分布式存储系统(CephFs,The Ceph File system)中,其中,每个广告图片对应有一个广告标识(ID,Identification),根据该广告标识可以获取到对应的投放对象集合(即投放给了哪些用户),根据该投放对象集合中的用户标识,可以获取到相应的用户信息,包括哪些用户点击了该广告标识对应的广告,哪些用户没有点击,以及点击了该广告标识对应的广告的这些用户对应的用户信息(即本发明实施例所说的点击用户信息),比如用户的性别、年龄、地域、学历、和/或收入等信息,等等。可以将获取到的这些信息也保存在该分布式存储系统中,并与相应的广告图片关联,这样,当广告服务器需要获取这些信息时,便可以从该分布式存储系统中获取到相应的已投放广告图片、以及该已投放广告图片对应的点击用户信息。
需说明的是,获取的已投放广告图片、以及对应的点击用户信息的数量可以根据实际应用的需求而定,可以是预设时间范围内比如,可以以当前时间为基准,获取过去一个月内的已投放广告图片、以及对应的点击用户信息,或者,也可以不对时间进行限制,而是获取预设数据数量,比如,获取60万条历史记录(即已投放广告图片和对应的点击用户信息),等等,在此不再赘述。
202、广告服务器根据该点击用户信息,分别统计各已投放广告图片在不同人口统计学特性上的点击率。
其中,人口统计学特性可以包括性别、年龄、地域、学历、和/或收入等信息。
例如,若某广告投放给100万个男性用户,被点击了2万次,投放给100万女性用户,被点击了1万次,则该广告在男女上的点击率分别为2%和1%;其他的特性与此类似,在此不再赘述。
203、广告服务器根据统计得到的点击率的大小分别对该已投放广告图片进行标注,得到标注数据。
例如,以该人口统计学特性可以包括性别、年龄、地域、学历、和/或收入等信息为例,则标注的方式具体可以如下:
根据统计得到的点击率的大小确定点击率较大的性别类型,得到目标性别类型,将该已投放广告图片的性别类型标注为该目标性别类型;和/或,
根据统计得到的点击率的大小确定点击率较大的年龄类型,得到目标年龄类型,将该已投放广告图片的年龄类型标注为该目标年龄类型;和/或,
根据统计得到的点击率的大小确定点击率较大的地域类型,得到目标地域类型,将该已投放广告图片的地域类型标注为该目标地域类型;和/或,
根据统计得到的点击率的大小确定点击率较大的学历类型,得到目标学历类型,将该已投放广告图片的学历类型标注为该目标学历类型;和/或,
根据统计得到的点击率的大小确定点击率较大的收入类型,得到目标收入类型,将该已投放广告图片的收入类型标注为该目标收入类型。
其中,性别类型、年龄类型、地域类型、学历类型、以及收入类型等的具体划分可以根据实际应用的需求而定,比如,性别可以划分为男性、女性和其他;年龄类型可以划分为“0~7岁”、“8~14岁”、“15~25岁”、“16~35岁”、“36岁~45岁”、“46~55岁”、“56~65岁”、“66~75岁”、以及“76岁以上”;地域类型的划分可以是南方和北方、或者国内和国外、或者是具体的国家、省份或城市,等等,以此类推,在此不再赘述。
例如,还是以步骤202中的例子为例,若某广告在男女上的点击率分别为2%和1%,则说明比较受男性喜欢(因为在男性上的点击率比较高),所以,该广告在性别这个人口统计学特性上(即性别类型)的标注值是男性,相应的广告图片标注值也是男性。类似的,根据该方式,可以得到每个图片在不同人口统计学特性上的标注值,比如,该广告图片受什么年龄段的人喜欢,在哪个收入等级的人群中比较受欢迎,等等。
204、广告服务器采用预设分类模型对该标注数据进行训练,得到训练后分类模型。
例如,广告服务器可以采用卷积神经网络,比如AlexNet对该训练数据进行训练,得到初始分类模型,具体可以如下:
将该标注数据转换为预设格式的数据,并对转换好格式的数据进行划分,得到训练数据和测试数据,采用AlexNet对该训练数据进行训练,得到初始分类模型,采用该测试数据对该初始分类模型的准确率进行检验,若准确率高于预设准确率阈值,则确定该初始分类模型为训练后分类模型,反之,若准确率不高于预设准确率阈值,则返回执行“获取多张已投放广告图片、以及该已投放广告图片对应的点击用户信息”的步骤(即步骤201)。
可选的,为了提高模型的可靠性,可以设置当标注数据的数量达到一定数量时,才进行数据的训练。同理,为了提高模型的准确率,也可以设置当训练的数据达到一定数量时,才对模型进行验证,详见实施例一,在此不再赘述。
比如,以性别和年龄为例,若采用AlexNet模型来进行数据训练,则具体可以如下:
如图2b所示,AlexNet使用8层网络结构,其中5层卷积层,3层全连接层,输出的一层可以通过使用softmax(一种分类函数)来实现多分类。在第一层卷积conv1和第二次卷积conv2(conv指的是convolution,即卷积和多项式相乘)之后是修正线性单元(relu,rectified linear unit)、最大池化(Max pooling)层和标准化响应层(rnorm,Response-normalization layer),此外,在第5个conv层也加入了Max pooling操作。比如,参见图2b中,其中的conv1之后,依次连接着reul1层、pool1层和rnorm1层,同理,在conv2之后,依次连接着reul2层、pool2层和rnorm2层,而在conv5之后,则连接着relu5层和pool5层。
在其它的conv层以及全连接(full-connected,图2b中简称为fc)层后紧跟的操作也是relu操作,比如,可参见图2b conv3层、conv4层、和conv5层,其后分别连接着relu3、relu4和relu5,而full-connected层,比如fc6层和fc7层之后,也分别连接着relu6和relu7
为防止过拟合,在第6层和第7层这两个full-connected层还可以加上dropout操作(dropout是指在模型训练时随机让网络某些隐含层节点的权重不工作,不工作的那些节点可以暂时认为不是网络结构的一部分,但是它的权重得保留下来(只是暂时不更新而已),因为下次样本输入时它可能又得工作了)。此外,性别和年龄两个目标输出之前各有一个full-connected层,分别为fc8_1和fc8_2,其中,fc8_1依次连接着relu8_1层和dropout8_1层,而fc8_2依次连接着relu8_2层和dropout8_2层。为了柔化输出值,对于dropout8_1层和dropout8_2层输出的值,还可以分别采用softmax(最大柔化)函数进行处理。
在使用该AlexNet模型时,首先,需要把标注数据转化为所需格式,lmdb格式(一种数据格式),并将转换格式后的数据分成训练数据和测试数据;或者,也可以将标注数据先分为训练数据和测试数据,然后,再将训练数据和测试数据转换为预设格式,比如转换成lmdb格式,等等。
在这个过程中,图片大小也可以做了统一,比如,在本实施例中,可以把图片大小都转成了256x256,等等。与此同时,也需要对该AlexNet模型的配置文件进行相应设置,比如,设置读取的图片大小为“256x256”,等等。另外,还可以生成图片的均值文件,以便在后续训练数据时使用。
其次,需要对该AlexNet模型的solver.prototxt、train_val.prototxt和deploy.prototxt文件进行配置,其中,solver.prototxt是配置深度学习方法的全局参数,比如学习率、学习步长,模型保存路径等等;train_val.prototxt用于对网络进行训练的模型定义,以及设定训练数据和测试数据的路径等;而deploy.prototxt是用来在网络完成训练之后进行部署。
完成上述配置文件的设置后,在图形处理器(GPU,Graphics Processing Unit)调度平台上调用solver.prototxt,并且指定使用的GPU数目之后,便可以启动模型训练。比如,假设设定每隔1000次训练就在测速数据上做一次测试,其中,测试的准确度在不断提高,同时训练数据的损失函数(loss)也在一直下降,而且,随着训练次数的增加,损失函数也趋向于稳定,则此时,可以考虑停止训练,将该训练好的模型作为训练后分类模型。
205、广告服务器基于该训练后分类模型对待投放广告信息,比如待投放广告图片的点击率进行预测。
例如,可以从待投放推广信息中提取特征信息,采用该训练后分类模型对该特征信息对应的点击率进行计算,得到该待投放推广信息的点击率的预测值。
其中,该特征信息可以根据实际应用的需求而定,比如,以图片为例,则该特征信息可以包括该图片的内容,比如是篮球、或鲜花,等等,此外,还可以包括该图片的其他信息,比如形状和/或颜色,等等。
206、广告服务器根据预测的点击率确定该待投放广告信息的投放对象,比如是男性用户还是女生用户,是哪个年龄段的用户,等等。
例如,以性别为例,若预测得到的男性点击率高于女性点击率,则该投放对象可以确定为男性,或者是让男性用户所占的比例更高一些,等等。
207、广告服务器将该待投放广告信息向该投放对象进行投放。
由上可知,本实施例可以获取多条已投放广告图片、以及该已投放广告图片对应的点击用户信息,然后,根据该点击用户信息对该已投放广告图片进行标注,并采用预设分类模型对标注数据进行训练,得到训练后分类模型,然后,基于该训练后分类模型预测待投放广告信息的点击率,从而达到对待投放广告信息的点击率进行预测的目的;由于该方案可以根据历史用户点击信息(即已投放广告信息对应的点击用户信息)对已投放广告信息进行标识并进行训练,然后基于训练得到的分类模型对待投放广告信息的点击率进行预测,因此,相对于现有技术中根据用户兴趣标签来进行预测的方案而言,大大减少了由于用户兴趣变化所导致的不确定因素,预测的准确性更高,有利于提高后续广告信息投放的精准性。
实施例三、
为了更好地实现以上方法,本发明实施例还提供一种推广信息的处理装置,如图3a所示,该推广信息的处理装置包括获取单元301、标注单元302、训练单元303和预测单元304,如下:
(1)获取单元301;
获取单元301,用于获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息。
其中,该推广信息可以包括广告或文宣等信息,其样式可以包括图片、和/文字等。该已投放推广信息对应的点击用户信息指的是点击该已投放推广信息的用户所对应的用户信息,比如,该点击用户信息可以包括用户的性别、年龄、地域、学历、和/或收入等信息。
其中,获取的已投放推广信息、以及对应的点击用户信息的数量可以根据实际应用的需求而定,可以是预设时间范围内,也可以是预设数据数量,在此不再赘述。
(2)标注单元302;
标注单元302,用于根据该点击用户信息对该已投放推广信息进行标注,得到标注数据;
例如,该标注单元302可以包括统计子单元和标注子单元,如下:
统计子单元,用于根据该点击用户信息,分别统计各已投放推广信息在不同人口统计学特性上的点击率;
标注子单元,用于根据统计得到的点击率的大小分别对该已投放推广信息进行标注,得到标注数据。
其中,人口统计学特性可以包括性别、年龄、地域、学历、和/或收入等信息。例如,以该人口统计学特性可以包括性别、年龄、地域、学历、和/或收入等信息为例,则该标注子单元,具体可以用于:
根据统计得到的点击率的大小确定点击率较大的性别类型,得到目标性别类型,将该已投放推广信息的性别类型标注为该目标性别类型;和/或,
根据统计得到的点击率的大小确定点击率较大的年龄类型,得到目标年龄类型,将该已投放推广信息的年龄类型标注为该目标年龄类型;和/或,
根据统计得到的点击率的大小确定点击率较大的地域类型,得到目标地域类型,将该已投放推广信息的地域类型标注为该目标地域类型;和/或,
根据统计得到的点击率的大小确定点击率较大的学历类型,得到目标学历类型,将该已投放推广信息的学历类型标注为该目标学历类型;和/或,
根据统计得到的点击率的大小确定点击率较大的收入类型,得到目标收入类型,将该已投放推广信息的收入类型标注为该目标收入类型。
其中,性别类型、年龄类型、地域类型、学历类型、以及收入类型等的具体划分可以根据实际应用的需求而定,比如,性别可以划分为男性、女性和其他;年龄类型可以划分为“0~14岁”、“15~25岁”、“16~35岁”、“36岁~45岁”、以及“46岁以上”;地域类型的划分可以是南方和北方、或者国内和国外、或者是具体的国家、省份或城市,等等,以此类推,在此不再赘述。
(3)训练单元303;
训练单元303,用于采用预设分类模型对该标注数据进行训练,得到训练后分类模型;
其中,该预设分类模型可以根据实际应用的需求进行设置,比如,可以根据推广信息的具体类型而定,譬如,以该推广信息为图片为例,则该预设分类模型可以为卷积神经网络,如下:
该训练单元303,具体可以用于采用卷积神经网络对该训练数据进行训练,得到初始分类模型。
其中,采用预设分类模型对该标注数据进行训练的方式可以有多种,即训练单元303,具体可以用于:
将该标注数据转换为预设格式的数据并进行划分,得到训练数据和测试数据;采用预设分类模型对该训练数据进行训练,得到初始分类模型;采用该测试数据对该初始分类模型的准确率进行检验;若准确率高于预设准确率阈值,则确定该初始分类模型为训练后分类模型;若准确率不高于预设准确率阈值,则触发获取单元执行获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息的操作。
可选的,为了提高模型的可靠性,可以设置当标注数据的数量达到一定数量时,才进行数据的训练,即:
该训练单元303,还可以用于在将该标注数据转换为预设格式的数据并进行划分之前,确定该标注数据的数量是否超过预设数据量阈值,若是,则执行将该标注数据转换为预设格式的数据并进行划分的操作;若否,则触发获取单元301执行获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息的操作。
同理,为了提高模型的准确率,也可以设置当训练的数据达到一定数量时,才对模型进行验证,即:
该训练单元303,还可以用于在采用该测试数据对该初始分类模型的准确率进行检验之前,确定训练的次数是否超过预设训练次数阈值;若是,则执行采用该测试数据对该初始分类模型的准确率进行检验的操作;若否,则触发获取单元301执行采用预设分类模型对该训练数据进行训练,得到初始分类模型的操作。
(4)预测单元304;
预测单元304,用于基于该训练后分类模型对待投放推广信息的点击率进行预测。
例如,该预测单元304,具体可以用于从待投放推广信息中提取特征信息;采用该训练后分类模型对该特征信息对应的点击率进行计算,得到该待投放推广信息的点击率的预测值。
可选的,在得到预测的点击率之后,还可以根据该预测的点击率进行推广信息的投放,即如图3b所示,该推广信息的处理装置还可以包括投放单元305,如下:
该投放单元305,可以用于根据预测的点击率确定该待投放推广信息的投放对象;将该待投放推广信息向该投放对象进行投放。
具体实施时,以上各个单元可以作为独立的实体实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
该推广信息的处理装置具体可以集成在服务器,比如广告服务器中。
由上可知,本实施例的推广信息的处理装置的获取单元301可以获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息,然后,由标注单元302根据该点击用户信息对该已投放推广信息进行标注,并由训练单元303采用预设分类模型对标注数据进行训练,得到训练后分类模型,然后,由预测单元304基于该训练后分类模型预测待投放推广信息的点击率,从而达到对待投放推广信息的点击率进行预测的目的;由于该方案可以根据历史用户点击信息(即已投放推广信息对应的点击用户信息)对已投放推广信息进行标识并进行训练,然后基于训练得到的分类模型对待投放推广信息的点击率进行预测,因此,相对于现有技术中根据用户兴趣标签来进行预测的方案而言,大大减少了由于用户兴趣变化所导致的不确定因素,预测的准确性更高,有利于提高后续推广信息投放的精准性。
实施例四、
相应的,本发明实施例还提供一种推广信息的处理系统,可以包括本发明实施例所提供的任一种推广信息的处理装置,具体可参见实施例三;其中,该推广信息的处理装置具体可以集成在服务器中,例如,可以如下:
服务器,用于获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息;根据该点击用户信息对该已投放推广信息进行标注,得到标注数据;采用预设分类模型对该标注数据进行训练,得到训练后分类模型;基于该训练后分类模型对待投放推广信息的点击率进行预测。
该服务器,还可以用于根据预测的点击率确定该待投放推广信息的投放对象,将该待投放推广信息向该投放对象进行投放。
可选的,该推广信息的处理系统还可以包括其他的设备,比如用户设备,具体可以如下:
用户设备,用于接收服务器发送的推广信息。
该用户设备,还可以用于对接收到的推广信息进行点击,以进行观看,并将相应的用户点击信息反馈给服务器。
以上各个设备的具体实施可参见前面的实施例,在此不再赘述。
由于该推广信息的处理系统可以包括本发明实施例所提供的任一种推广信息的处理装置,因此,可以实现本发明实施例所提供的任一种推广信息的处理系统所能实现的有益效果,详见前面的实施例,在此不再赘述。
实施例五、
本发明实施例还提供一种服务器,如图4所示,其示出了本发明实施例所涉及的服务器的结构示意图,具体来讲:
该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、射频(Radio Frequency,RF)电路403、电源404、输入单元405、以及显示单元406等部件。本领域技术人员可以理解,图4中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
RF电路403可用于收发信息过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器401处理;另外,将涉及上行的数据发送给基站。通常,RF电路403包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路403还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GSM,Global System of Mobilecommunication)、通用分组无线服务(GPRS,General Packet Radio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband CodeDivision Multiple Access)、长期演进(LTE,Long Term Evolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
服务器还包括给各个部件供电的电源404(比如电池),优选的,电源404可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源404还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入单元405,该输入单元405可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元405可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器401,并能接收处理器401发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元405还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
该服务器还可包括显示单元406,该显示单元406可用于显示由用户输入的信息或提供给用户的信息以及服务器的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元406可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-EmittingDiode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器401以确定触摸事件的类型,随后处理器401根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图4中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
尽管未示出,服务器还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,服务器中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息;根据该点击用户信息对该已投放推广信息进行标注,得到标注数据;采用预设分类模型对该标注数据进行训练,得到训练后分类模型;基于该训练后分类模型对待投放推广信息的点击率进行预测。
例如,具体可以根据该点击用户信息,分别统计各已投放推广信息在不同人口统计学特性上的点击率,根据统计得到的点击率的大小分别对该已投放推广信息进行标注,得到标注数据。
可选的,存储在存储器402中的应用程序,还可以实现如下功能:
根据预测的点击率确定该待投放推广信息的投放对象,将该待投放推广信息向该投放对象进行投放。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本实施例的服务器可以获取多条已投放推广信息、以及该已投放推广信息对应的点击用户信息,然后,根据该点击用户信息对该已投放推广信息进行标注,并采用预设分类模型对标注数据进行训练,得到训练后分类模型,然后,基于该训练后分类模型预测待投放推广信息的点击率,从而达到对待投放推广信息的点击率进行预测的目的;由于该方案可以根据历史用户点击信息(即已投放推广信息对应的点击用户信息)对已投放推广信息进行标识并进行训练,然后基于训练得到的分类模型对待投放推广信息的点击率进行预测,因此,相对于现有技术中根据用户兴趣标签来进行预测的方案而言,大大减少了由于用户兴趣变化所导致的不确定因素,预测的准确性更高,有利于提高后续推广信息投放的精准性。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,RandomAccess Memory)、磁盘或光盘等。
以上对本发明实施例所提供的一种推广信息的处理方法、装置和系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (19)

1.一种推广信息的处理方法,其特征在于,包括:
获取多条已投放推广信息、以及所述已投放推广信息对应的点击用户信息;
根据所述点击用户信息对所述已投放推广信息进行标注,得到标注数据;
采用预设分类模型对所述标注数据进行训练,得到训练后分类模型;
基于所述训练后分类模型对待投放推广信息的点击率进行预测。
2.根据权利要求1所述的方法,其特征在于,所述根据所述点击用户信息对所述已投放推广信息进行标注,得到标注数据,包括:
根据所述点击用户信息,分别统计各已投放推广信息在不同人口统计学特性上的点击率;
根据统计得到的点击率的大小分别对所述已投放推广信息进行标注,得到标注数据。
3.根据权利要求2所述的方法,其特征在于,所述人口统计学特性包括性别、年龄、地域、学历、和/或收入,则所述根据统计得到的点击率的大小分别对所述已投放推广信息进行标注,包括:
根据统计得到的点击率的大小确定点击率较大的性别类型,得到目标性别类型,将所述已投放推广信息的性别类型标注为所述目标性别类型;和/或,
根据统计得到的点击率的大小确定点击率较大的年龄类型,得到目标年龄类型,将所述已投放推广信息的年龄类型标注为所述目标年龄类型;和/或,
根据统计得到的点击率的大小确定点击率较大的地域类型,得到目标地域类型,将所述已投放推广信息的地域类型标注为所述目标地域类型;和/或,
根据统计得到的点击率的大小确定点击率较大的学历类型,得到目标学历类型,将所述已投放推广信息的学历类型标注为所述目标学历类型;和/或,
根据统计得到的点击率的大小确定点击率较大的收入类型,得到目标收入类型,将所述已投放推广信息的收入类型标注为所述目标收入类型。
4.根据权利要求1所述的方法,其特征在于,所述采用预设分类模型对所述标注数据进行训练,得到训练后分类模型,包括:
将所述标注数据转换为预设格式的数据并进行划分,得到训练数据和测试数据;
采用预设分类模型对所述训练数据进行训练,得到初始分类模型;
采用所述测试数据对所述初始分类模型的准确率进行检验;
若准确率高于预设准确率阈值,则确定所述初始分类模型为训练后分类模型;
若准确率不高于预设准确率阈值,则返回执行获取多条已投放推广信息、以及所述已投放推广信息对应的点击用户信息的步骤。
5.根据权利要求4所述的方法,其特征在于,所述将所述标注数据转换为预设格式的数据并进行划分之前,还包括:
确定所述标注数据的数量是否超过预设数据量阈值;
若是,则执行将所述标注数据转换为预设格式的数据并进行划分的步骤;
若否,则返回执行获取多条已投放推广信息、以及所述已投放推广信息对应的点击用户信息的步骤。
6.根据权利要求4所述的方法,其特征在于,所述采用所述测试数据对所述初始分类模型的准确率进行检验之前,还包括:
确定训练的次数是否超过预设训练次数阈值;
若是,则执行采用所述测试数据对所述初始分类模型的准确率进行检验的步骤;
若否,则返回执行采用预设分类模型对所述训练数据进行训练,得到初始分类模型的步骤。
7.根据权利要求4至6任一项所述的方法,其特征在于,所述推广信息为图片,则所述采用预设分类模型对所述训练数据进行训练,得到初始分类模型,包括:
采用卷积神经网络对所述训练数据进行训练,得到初始分类模型。
8.根据权利要求1至6任一项所述的方法,其特征在于,所述基于所述训练后分类模型对待投放推广信息的点击率进行预测,包括:
从待投放推广信息中提取特征信息;
采用所述训练后分类模型对所述特征信息对应的点击率进行计算,得到所述待投放推广信息的点击率的预测值。
9.根据权利要求1至6任一项所述的方法,其特征在于,所述基于所述训练后分类模型对待投放推广信息的点击率进行预测之后,还包括:
根据预测的点击率确定所述待投放推广信息的投放对象;
将所述待投放推广信息向所述投放对象进行投放。
10.一种推广信息的处理装置,其特征在于,包括:
获取单元,用于获取多条已投放推广信息、以及所述已投放推广信息对应的点击用户信息;
标注单元,用于根据所述点击用户信息对所述已投放推广信息进行标注,得到标注数据;
训练单元,用于采用预设分类模型对所述标注数据进行训练,得到训练后分类模型;
预测单元,用于基于所述训练后分类模型对待投放推广信息的点击率进行预测。
11.根据权利要求10所述的装置,其特征在于,所述标注单元包括统计子单元和标注子单元;
统计子单元,用于根据所述点击用户信息,分别统计各已投放推广信息在不同人口统计学特性上的点击率;
标注子单元,用于根据统计得到的点击率的大小分别对所述已投放推广信息进行标注,得到标注数据。
12.根据权利要求11所述的装置,其特征在于,所述人口统计学特性包括性别、年龄、地域、学历、和/或收入,则所述标注子单元,具体用于:
根据统计得到的点击率的大小确定点击率较大的性别类型,得到目标性别类型,将所述已投放推广信息的性别类型标注为所述目标性别类型;和/或,
根据统计得到的点击率的大小确定点击率较大的年龄类型,得到目标年龄类型,将所述已投放推广信息的年龄类型标注为所述目标年龄类型;和/或,
根据统计得到的点击率的大小确定点击率较大的地域类型,得到目标地域类型,将所述已投放推广信息的地域类型标注为所述目标地域类型;和/或,
根据统计得到的点击率的大小确定点击率较大的学历类型,得到目标学历类型,将所述已投放推广信息的学历类型标注为所述目标学历类型;和/或,
根据统计得到的点击率的大小确定点击率较大的收入类型,得到目标收入类型,将所述已投放推广信息的收入类型标注为所述目标收入类型。
13.根据权利要求10所述的装置,其特征在于,所述训练单元,具体用于:
将所述标注数据转换为预设格式的数据并进行划分,得到训练数据和测试数据;
采用预设分类模型对所述训练数据进行训练,得到初始分类模型;
采用所述测试数据对所述初始分类模型的准确率进行检验;
若准确率高于预设准确率阈值,则确定所述初始分类模型为训练后分类模型;
若准确率不高于预设准确率阈值,则触发获取单元执行获取多条已投放推广信息、以及所述已投放推广信息对应的点击用户信息的操作。
14.根据权利要求13所述的装置,其特征在于,
所述训练单元,还用于在将所述标注数据转换为预设格式的数据并进行划分之前,确定所述标注数据的数量是否超过预设数据量阈值,若是,则执行将所述标注数据转换为预设格式的数据并进行划分的操作;若否,则触发获取单元执行获取多条已投放推广信息、以及所述已投放推广信息对应的点击用户信息的操作。
15.根据权利要求13所述的装置,其特征在于,
所述训练单元,还用于在采用所述测试数据对所述初始分类模型的准确率进行检验之前,确定训练的次数是否超过预设训练次数阈值;若是,则执行采用所述测试数据对所述初始分类模型的准确率进行检验的操作;若否,则触发获取单元执行采用预设分类模型对所述训练数据进行训练,得到初始分类模型的操作。
16.根据权利要求13至15任一项所述的装置,其特征在于,
所述训练单元,具体用于采用卷积神经网络对所述训练数据进行训练,得到初始分类模型。
17.根据权利要求10至15任一项所述的装置,其特征在于,
所述预测单元,具体用于从待投放推广信息中提取特征信息;采用所述训练后分类模型对所述特征信息对应的点击率进行计算,得到所述待投放推广信息的点击率的预测值。
18.根据权利要求10至15任一项所述的装置,其特征在于,还包括投放单元;
所述投放单元,用于根据预测的点击率确定所述待投放推广信息的投放对象;将所述待投放推广信息向所述投放对象进行投放。
19.一种推广信息的处理系统,其特征在于,包括权利要求10至18任一项所述的推广信息的处理装置。
CN201610707899.XA 2016-08-23 2016-08-23 一种推广信息的处理方法、装置和系统 Pending CN107742221A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610707899.XA CN107742221A (zh) 2016-08-23 2016-08-23 一种推广信息的处理方法、装置和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610707899.XA CN107742221A (zh) 2016-08-23 2016-08-23 一种推广信息的处理方法、装置和系统

Publications (1)

Publication Number Publication Date
CN107742221A true CN107742221A (zh) 2018-02-27

Family

ID=61235025

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610707899.XA Pending CN107742221A (zh) 2016-08-23 2016-08-23 一种推广信息的处理方法、装置和系统

Country Status (1)

Country Link
CN (1) CN107742221A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145245A (zh) * 2018-07-26 2019-01-04 腾讯科技(深圳)有限公司 预测点击率的方法、装置、计算机设备及存储介质
CN109472632A (zh) * 2018-09-25 2019-03-15 平安科技(深圳)有限公司 评价广告竞争力的方法、装置、介质及电子设备
CN109495552A (zh) * 2018-10-31 2019-03-19 北京字节跳动网络技术有限公司 用于更新点击率预测模型的方法和装置
CN109559158A (zh) * 2018-11-06 2019-04-02 北京奇虎科技有限公司 推广信息投放方法、装置、电子设备及可读存储介质
CN109598544A (zh) * 2018-11-21 2019-04-09 优估(上海)信息科技有限公司 一种媒体目标匹配方法及系统
CN109635110A (zh) * 2018-11-30 2019-04-16 北京百度网讯科技有限公司 数据处理方法、装置、设备以及计算机可读存储介质
CN109858942A (zh) * 2018-11-06 2019-06-07 北京奇虎科技有限公司 推广信息展示方法、装置、电子设备及可读存储介质
CN110223108A (zh) * 2019-05-27 2019-09-10 北京金山安全软件有限公司 点击通过率的预测方法、装置及设备
CN110245969A (zh) * 2018-03-09 2019-09-17 腾讯科技(深圳)有限公司 推广信息处理方法、装置、电子设备及计算机可读介质
CN110796465A (zh) * 2018-08-03 2020-02-14 阿里巴巴集团控股有限公司 资源展示设备确定方法、广告展示屏幕确定方法及装置
CN111178866A (zh) * 2019-12-24 2020-05-19 天阳宏业科技股份有限公司 账户管理的方法、装置及设备
CN111369271A (zh) * 2018-12-25 2020-07-03 北京达佳互联信息技术有限公司 一种广告的排序方法、装置、电子设备及存储介质
CN111539757A (zh) * 2019-12-30 2020-08-14 支付宝实验室(新加坡)有限公司 信息投放方法、装置、服务器及存储介质
CN113256034A (zh) * 2021-07-07 2021-08-13 北京达佳互联信息技术有限公司 信息投放方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951965A (zh) * 2015-06-26 2015-09-30 深圳市腾讯计算机系统有限公司 广告投放方法及装置
CN105046515A (zh) * 2015-06-26 2015-11-11 深圳市腾讯计算机系统有限公司 广告排序方法及装置
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN105654198A (zh) * 2015-12-30 2016-06-08 合网络技术(北京)有限公司 具有最优阈值筛选的品牌广告效果优化的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951965A (zh) * 2015-06-26 2015-09-30 深圳市腾讯计算机系统有限公司 广告投放方法及装置
CN105046515A (zh) * 2015-06-26 2015-11-11 深圳市腾讯计算机系统有限公司 广告排序方法及装置
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN105654198A (zh) * 2015-12-30 2016-06-08 合网络技术(北京)有限公司 具有最优阈值筛选的品牌广告效果优化的方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245969B (zh) * 2018-03-09 2022-11-22 腾讯科技(深圳)有限公司 推广信息处理方法、装置、电子设备及计算机可读介质
CN110245969A (zh) * 2018-03-09 2019-09-17 腾讯科技(深圳)有限公司 推广信息处理方法、装置、电子设备及计算机可读介质
CN109145245A (zh) * 2018-07-26 2019-01-04 腾讯科技(深圳)有限公司 预测点击率的方法、装置、计算机设备及存储介质
CN110796465A (zh) * 2018-08-03 2020-02-14 阿里巴巴集团控股有限公司 资源展示设备确定方法、广告展示屏幕确定方法及装置
CN109472632A (zh) * 2018-09-25 2019-03-15 平安科技(深圳)有限公司 评价广告竞争力的方法、装置、介质及电子设备
CN109495552A (zh) * 2018-10-31 2019-03-19 北京字节跳动网络技术有限公司 用于更新点击率预测模型的方法和装置
CN109559158A (zh) * 2018-11-06 2019-04-02 北京奇虎科技有限公司 推广信息投放方法、装置、电子设备及可读存储介质
CN109858942B (zh) * 2018-11-06 2023-12-15 三六零科技集团有限公司 推广信息展示方法、装置、电子设备及可读存储介质
CN109858942A (zh) * 2018-11-06 2019-06-07 北京奇虎科技有限公司 推广信息展示方法、装置、电子设备及可读存储介质
CN109598544A (zh) * 2018-11-21 2019-04-09 优估(上海)信息科技有限公司 一种媒体目标匹配方法及系统
CN109635110A (zh) * 2018-11-30 2019-04-16 北京百度网讯科技有限公司 数据处理方法、装置、设备以及计算机可读存储介质
CN111369271A (zh) * 2018-12-25 2020-07-03 北京达佳互联信息技术有限公司 一种广告的排序方法、装置、电子设备及存储介质
CN111369271B (zh) * 2018-12-25 2024-03-19 北京达佳互联信息技术有限公司 一种广告的排序方法、装置、电子设备及存储介质
CN110223108A (zh) * 2019-05-27 2019-09-10 北京金山安全软件有限公司 点击通过率的预测方法、装置及设备
CN111178866A (zh) * 2019-12-24 2020-05-19 天阳宏业科技股份有限公司 账户管理的方法、装置及设备
CN111178866B (zh) * 2019-12-24 2023-05-12 天阳宏业科技股份有限公司 账户管理的方法、装置及设备
CN111539757A (zh) * 2019-12-30 2020-08-14 支付宝实验室(新加坡)有限公司 信息投放方法、装置、服务器及存储介质
CN111539757B (zh) * 2019-12-30 2023-07-28 支付宝实验室(新加坡)有限公司 信息投放方法、装置、服务器及存储介质
CN113256034A (zh) * 2021-07-07 2021-08-13 北京达佳互联信息技术有限公司 信息投放方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN107742221A (zh) 一种推广信息的处理方法、装置和系统
CN110209450A (zh) 页面生成方法、装置、存储介质及服务器
CN108470253B (zh) 一种用户识别方法、装置及存储设备
CN108280115B (zh) 识别用户关系的方法及装置
CN104679969B (zh) 防止用户流失的方法及装置
CN108334887B (zh) 一种用户选取方法和装置
CN109241431A (zh) 一种资源推荐方法和装置
CN108984731A (zh) 歌单推荐方法、装置及存储介质
CN108647957A (zh) 一种支付方法、装置及移动终端
CN110097419A (zh) 商品数据处理方法、计算机设备和存储介质
CN110347781B (zh) 文章倒排方法、文章推荐方法、装置、设备及存储介质
US11240777B2 (en) Device positioning method and apparatus
CN111125523B (zh) 搜索方法、装置、终端设备及存储介质
CN110309405A (zh) 一种项目推荐方法、装置及存储介质
CN109493592A (zh) 路径推荐方法及装置
US20150220566A1 (en) System and Method for Determining Interests from Location Data
CN107464290A (zh) 三维信息展示方法、装置和移动终端
CN106713840A (zh) 虚拟信息显示方法及装置
CN108566666A (zh) Wi-Fi热点推荐方法、装置及存储介质
CN104978353B (zh) 一种桌面应用的生成控制方法、装置及系统
CN112989148A (zh) 纠错词排序方法、装置、终端设备和存储介质
CN107547741A (zh) 一种信息处理方法、装置及计算机可读存储介质
CN110276010A (zh) 一种权重模型训练方法和相关装置
CN111259257A (zh) 一种信息展示方法、系统、装置、电子设备及存储介质
CN107566909A (zh) 一种基于弹幕的视频内容搜索方法及用户终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180227

RJ01 Rejection of invention patent application after publication