CN110188942A - 点击通过率的预测方法、装置及设备 - Google Patents
点击通过率的预测方法、装置及设备 Download PDFInfo
- Publication number
- CN110188942A CN110188942A CN201910444934.7A CN201910444934A CN110188942A CN 110188942 A CN110188942 A CN 110188942A CN 201910444934 A CN201910444934 A CN 201910444934A CN 110188942 A CN110188942 A CN 110188942A
- Authority
- CN
- China
- Prior art keywords
- feature data
- data
- prediction
- building information
- building
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
- G06Q30/0246—Traffic
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供的一种点击通过率的预测方法、装置及设备,在接收到关于指示进行点击通过率预测的预测指令后,获取所述预测指令对应的多个互不相同的关于构建第一特征数据的构建信息;针对每个构建信息,从所述预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据;分别利用每个构建信息对应的第二特征数据,构建第一特征数据;分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据;基于所述组合特征数据,获得所述网络广告的预测点击通过率。通过本方案,可以实现在提高点击通过率的预测准确度的同时,兼顾点击通过率的预测的便捷性。
Description
技术领域
本发明涉及网络广告技术领域,特别是涉及一种点击通过率的预测方法、装置及设备。
背景技术
在网络广告投放中,CTR(Click-Through-Rate,点击通过率),即某一网络广告的实际点击次数与该广告展现量的比值,是衡量广告投放效果的一项重要指标。不同特征的网络广告会产生不同的点击通过率,因此,为了合理利用广告位,需要预测待投放的网络广告的点击通过率。在对待投放的网络广告进行点击通过率预测时,为了提高预测的准确度,可以将待投放的网络广告的多个类型相同的特征数据作为一组组合特征数据,并基于所得到的组合特征数据,获得待投放的网络广告的预测点击通过率。
相关技术中,组合特征数据的获取可以是:运维人员从待投放的网络广告的多个特征数据中确定至少一个特征数据作为第一特征数据;从待投放的网络广告的除第一特征数据以外的多个特征数据中,确定与第一特征数据的类型相同的特征数据作为待组合特征数据;将所确定的待组合特征数据和用于确定待组合特征数据的第一特征数据,作为一组组合特征数据。并且,针对同一待投放的广告,可以多次确定与上一次确定的第一特征数据不同的第一特征数据,以得到多组不同的组合特征数据,从而利用多组不同的组合特征数据提高点击通过率的预测准确度。
但是,待投放的网络广告的数量往往是海量的,在进行点击通过率预测时,需要运维人员多次确定不同的第一特征数据,导致点击通过率的预测不够便捷。因此,如何在提高点击通过率的预测准确度的同时,兼顾点击通过率的预测的便捷性,是网络广告的点击通过率的预测中亟待解决的问题。
发明内容
本发明实施例的目的在于提供一种点击通过率的预测方法、装置及设备,以实现在提高点击通过率的预测准确度的同时,兼顾点击通过率的预测的便捷性的效果。具体技术方案如下:
第一方面,本发明实施例提供了一种点击通过率的预测方法,该方法包括:
在接收到关于指示进行点击通过率预测的预测指令后,获取所述预测指令对应的多个互不相同的关于构建第一特征数据的构建信息;
针对每个构建信息,从所述预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据;
分别利用每个构建信息对应的第二特征数据,构建第一特征数据;
分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据;
基于所述组合特征数据,获得所述网络广告的预测点击通过率。
可选的,所述构建信息包括:构建类型;所述构建类型为按照将第二特征数据构建为所述第一特征数据的构建形式划分得到的类型;
所述分别利用每个构建信息对应的第二特征数据,构建第一特征数据,包括:
针对每个构建信息,判断该构建信息所表明的构建类型;
如果该构建信息的构建类型为第一构建类型,将该构建信息对应的至少一个第二特征数据,拼接为第一特征数据;
如果该构建信息对应的构建类型为第二构建类型,从该构建信息中读取第三特征数据的数据标识;
从预存的第三特征数据中,查找所述数据标识对应的第三特征数据;其中,所述第三特征数据为所述网络广告的特征数据中指定的特征数据;
拼接该构建信息对应的第二特征数据和第三特征数据,得到第一特征数据。
可选的,所述构建信息包括:第二特征数据的来源标识和第二特征数据的数据标识;
所述针对每个构建信息,从所述预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据,包括:
针对每个构建信息,读取该构建信息中的第二特征数据的来源标识;
根据预设的来源标识与存储位置的对应关系,从预存的第二特征数据的存储位置中,查找所读取的来源标识对应的存储位置;
按照所查找到的存储位置和第二特征数据的数据标识,查找第二特征数据。
可选的,所述在接收到关于指示进行点击通过率预测的预测指令后,获取所述预测指令对应的多个互不相同的关于构建第一特征数据的构建信息,包括:
在接收到关于指示进行点击通过率预测的预测指令后,读取所述预测指令中的预测模型标识;
从预存的预测模型数据中,查找所述预测模型标识对应的预测模型数据,并从所查找到的预测模型数据中,读取第一特征配置文件;
从所读取到的第一特征配置文件中,提取多个互不相同的关于构建第一特征数据的构建信息。
可选的,所述分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据,包括:
针对每个构建信息对应的第一特征数据,利用预设的分类模型,将所述网络广告的多个特征数据中除该第一特征数据以外的特征数据中,与该第一特征数据的类型相同的特征数据,确定为待组合特征数据;
将所确定的待组合特征数据和用于确定待组合特征数据的第一特征数据,作为一组组合特征数据;
其中,所述预设的分类模型为预先利用样本特征数据和样本特征数据的类型标签训练得到的模型,且所述样本特征数据与第一特征数据所反映的网络广告的特征相同。
第二方面,本发明实施例提供了一种点击通过率的预测装置,该装置包括:
获取模块,用于在接收到关于指示进行点击通过率预测的预测指令后,获取所述预测指令对应的多个互不相同的关于构建第一特征数据的构建信息;
查找模块,用于针对每个构建信息,从所述预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据;
构建模块,用于分别利用每个构建信息对应的第二特征数据,构建第一特征数据;
组合模块,用于分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据;
预测模块,用于基于所述组合特征数据,获得所述网络广告的预测点击通过率。
可选的,所述构建信息包括:构建类型;所述构建类型为按照将第二特征数据构建为所述第一特征数据的构建形式划分得到的类型;
所述构建模块,具体包括:判断子模块,第一拼接子模块以及第二拼接子模块;
所述判断子模块,用于针对每个构建信息,判断该构建信息所表明的构建类型;
所述第一拼接子模块,用于在该构建信息的构建类型为第一构建类型时,将该构建信息对应的至少一个第二特征数据,拼接为第一特征数据;
所述第二拼接子模块,用于在该构建信息对应的构建类型为第二构建类型时,从该构建信息中读取第三特征数据的数据标识;从预存的第三特征数据中,查找所述数据标识对应的第三特征数据;其中,所述第三特征数据为所述网络广告的特征数据中指定的特征数据;拼接该构建信息对应的第二特征数据和第三特征数据,得到第一特征数据。
可选的,所述构建信息包括:第二特征数据的来源标识和第二特征数据的数据标识;
所述查找模块,具体用于:
针对每个构建信息,读取该构建信息中的第二特征数据的来源标识;
根据预设的来源标识与存储位置的对应关系,从预存的第二特征数据的存储位置中,查找所读取的来源标识对应的存储位置;
按照所查找到的存储位置和第二特征数据的数据标识,查找第二特征数据。
可选的,所述获取模块,具体用于:
在接收到关于指示进行点击通过率预测的预测指令后,读取所述预测指令中的预测模型标识;
从预存的预测模型数据中,查找所述预测模型标识对应的预测模型数据,并从所查找到的预测模型数据中,读取第一特征配置文件;
从所读取到的第一特征配置文件中,提取多个互不相同的关于构建第一特征数据的构建信息。
可选的,所述组合模块,具体用于:
针对每个构建信息对应的第一特征数据,利用预设的分类模型,将所述网络广告的多个特征数据中除该第一特征数据以外的特征数据中,与该第一特征数据的类型相同的特征数据,确定为待组合特征数据;
将所确定的待组合特征数据和用于确定待组合特征数据的第一特征数据,作为一组组合特征数据;
其中,所述预设的分类模型为预先利用样本特征数据和样本特征数据的类型标签训练得到的模型,且所述样本特征数据与第一特征数据所反映的网络广告的特征相同。
第三方面,本发明实施例提供了一种电子设备,该设备包括:
处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序,实现上述第一方面提供的点击通过率的预测方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,该存储介质内存储有计算机程序,该计算机程序被处理器执行时实现上述第一方面提供的点击通过率的预测方法的步骤。
本发明实施例提供的方案中,由于多个构建信息是关于构建第一特征数据的信息,因此,可以针对每个构建信息,从预测指令对应的网络广告的多个特征数据中,获取该构建信息对应的第二特征数据;进而分别利用每个构建信息对应的第二特征数据,构建第一特征数据。并且获取的多个构建信息互不相同,因此,构建得到的多个第一特征数据互不相同,实现自动确定用于获取组合特征数据的多个不同的第一特征数据。在进行点击通过率预测时,与需要人工多次确定不同的第一特征数据相比,节省确定多个不同的第一特征数据时的人工操作,实现在提高点击通过率的预测准确度的同时,兼顾点击通过率的预测的便捷性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明一实施例提供的点击通过率的预测方法的流程示意图;
图2为本发明另一实施例提供的点击通过率的预测方法的流程示意图;
图3为本发明一实施例提供的点击通过率的预测装置的结构示意图;
图4为本发明另一实施例提供的点击通过率的预测装置的结构示意图;
图5为本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为了使本领域技术人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面首先对本发明一实施例的点击通过率的预测方法进行介绍。
本发明实施例提供的点击通过率的预测方法,可以应用于能够进行数据处理的电子设备,该设备可以包括台式计算机、便携式计算机、互联网电视、智能移动终端、可穿戴式智能终端以及服务器等,在此不作限定,任何可以实现本发明实施例的电子设备,均属于本发明实施例的保护范围。
此外,由于网络广告的投放具体可以是在各类与互联网相关的应用上,因此,在具体应用中,本发明实施例提供的点击通过率的预测方法的执行主体,可以是各种与互联网相关的应用的服务器。示例性的,可以是直播应用、社交应用或者购物应用等等应用的服务器。
如图1所示,本发明一实施例的点击通过率的预测方法的流程,该方法可以包括:
S101,在接收到关于指示进行点击通过率预测的预测指令后,获取预测指令对应的多个互不相同的关于构建第一特征数据的构建信息。
在具体应用中,预测指令的来源可以是多种的。示例性的,预测指令可以是运维人员输入的指令,可以是用于进行点击通过率预测的组件启动运行时触发的指令,或者,可以是用于进行点击通过率预测的组件在检测到待投放的网络广告的特征数据完成存储时触发的指令。
并且,预测指令与待投放的网络广告可以是一一对应的,对某一待投放的网络广告进行点击通过率预测时,将接收到该待投放的网络广告对应的预测指令。相应的,为了对该待投放的网络广告进行点击通过率预测,需要获取该待投放的网络广告的组合特征数据。因此,关于构建第一特征数据的构建信息与预测指令对应。另外,为了得到多组不同的第一特征数据,需要获取多个互不相同的构建信息。
其中,构建信息为能够表明构建第一特征数据所使用的数据,和/或者,第一特征数据的构建方式的信息。构建信息的内容可以是多种的。示例性的,构建信息可以包括构建第一特征数据所使用的数据的标识或者存储位置,和/或者,包括表明第一特征数据的构建方式的信息。构建信息的获取方式可以是多种的。示例性的,可以接收运维人员输入的构建信息,也可以从能够表明构建信息的配置文件中读取构建信息。为了便于理解的合理布局,后续以可选实施例的方式对构建信息的获取进行具体描述。
S102,针对每个构建信息,从预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据。
在具体应用中,为了进行点击通过率预测,预测指令对应的网络广告的特征数据可以进行预先存储,例如,该网络广告的特征数据:内容类型为视频、投放时间为黄金时段以及投放位置为电视剧TV1的片头等等数据可以进行预先存储。另外,进行点击通过率预测的待投放的网络广告,为预测指令对应的网络广告。
由于多个构建信息互不相同,且构建信息是关于构建第一特征数据的信息,因此,可以针对每个构建信息,查找构建该构建信息对应的第一特征数据所使用的数据。并且,为了利用第一特征数据得到网络广告的组合特征数据,可以将网络广告的多个特征数据中所查找的第二特征数据,作为构建该构建信息对应的第一特征数据的数据。此外,针对每个构建信息,该构建信息对应的第二特征数据的数量可以是一个,也可以是多个,可以按照具体应用设置不同的构建信息以调整第二特征数据的数量。
其中,第二特征数据的查找方式可以是多种的。示例性的,如果构建信息包括第二特征数据的标识,可以从预测指令对应的网络广告的多个特征数据中,查找具有第二特征数据的标识的数据,作为第二特征数据。或者,示例性的,如果构建信息包括第二特征数据的存储位置,可以按照构建信息中的存储位置,查找第二特征数据。任何第二特征数据的查找方式均可用于本发明,本实施例对此不作限制。
在具体应用中,特征数据的形式可以是多种的。示例性的,特征数据可以是网络广告的特征本身,例如,“图像”以及“女性”等等。或者,示例性的,特征数据可以是网络广告的特征的特征值,例如,特征“图像”的特征值以及特征“女性”的特征值等等。
S103,分别利用每个构建信息对应的第二特征数据,构建第一特征数据。
在具体应用中,第一特征数据的构建方式可以是多种的。示例性的,可以针对每个构建信息,将该构建信息对应的至少一个第二特征数据拼接为第一特征数据。例如,构建信息inf1对应一个第二特征数据d1,可以将第二特征数据d1本身作为第一特征数据。构建信息inf2对应第二特征数据d2和第二特征数据d3,可以将第二特征数据d2和第二特征数据d3,拼接为第一特征数据:“d2d3”,或者“d3d2”。或者,示例性的,为了提高特征数据所反映的网络广告的特征的准确度,可以查找构建信息对应的第三特征数据,拼接该构建信息对应的第二特征数据和第三特征数据,得到第一特征数据。其中,第三特征数据为网络广告的特征数据中指定的特征数据,例如,观看网络广告的用户的用户信息、不同类型的特征数据的权重等等。
其中,将多个第二特征数据拼接为第一特征数据,或者,将至少一个第二特征数据和第三特征数据时,具体的拼接方式可以是多种的。为了便于理解和合理布局,后续在本发明图2实施例中进行具体说明。
任何利用第二特征数据构建第一特征数据的方式均可用于本发明,本实施例对此不作限制。
S104,分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据。
在具体应用中,组合特征数据的获取方式可以是多种的。示例性的,可以是维护人员针对每个构建信息对应的第一特征数据,从待投放的网络广告的多个特征数据中,选择与该第一特征数据的类型相同、且除该第一特征数据以外的特征数据作为待组合特征数据;将该第一特征数据和与该第一特征数据类型相同的待组合特征数据,确定为一组组合特征数据。或者,示例性的,可以针对每个构建信息对应的第一特征数据,利用预设的分类模型,从网络广告的多个特征数据中除该第一特征数据以外的特征数据中,确定与该第一特征数据的类型相同的待组合特征数据;将所确定的待组合特征数据和用于确定待组合特征数据的第一特征数据,作为一组组合特征数据;其中,所述预设的分类模型为预先利用样本特征数据和样本特征数据的类型标签训练得到的模型,且所述样本特征数据与第一特征数据所反映的网络广告的特征相同。
其中,特征数据的类型可以为按照特征数据所反映的网络广告的特征划分的类型。示例性的,特征数据的类型可以是按特征的来源划分,例如,用户信息和广告信息。其中,用户信息表明特征数据的来源为用户数据,如用户性别、用户地理位置以及用户年龄等等特征数据均属于用户信息。广告信息表明特征数据的来源为广告数据,如网络广告的内容形式,网络广告的投放方式以及网络广告的投放时间等等。或者,示例性的,特征数据的类型可以是按特征的具体内容划分,例如,用户性别为女性、用户地理位置、网络广告的内容形式为视频形式以及网络广告的内容形式为图像形式互为不同类型的特征数据。任何网络广告的类型的划分方式均可用于本发明,本实施例对此不作限制。
S105,基于组合特征数据,获得网络广告的预测点击通过率。
基于组合特征数据,获得待投放的网络广告的预测点击通过率的方式可以是多种的。示例性的,可以将组合特征数据中的每个特征数据分别输入预设的LR模型,得到组合特征数据中每个特征数据对应的第一点击通过率,从所得到的多个第一点击通过率中选取一个作为预测点击通过率。或者,示例性的,可以将组合特征数据中的每个特征数据分别输入预设的LR模型,得到组合特征数据中每个特征数据对应的第一点击通过率,将组合特征数据中每个特征数据对应的第一点击通过率输入预设的点击通过率计算公式,获得待投放的网络广告的预测点击通过率。
或者,示例性的,如果得到的组合特征数据为多组,可以针对每组组合特征数据,将该组组合特征数据中的每个特征数据分别输入预设的LR模型,得到该组组合特征数据对应的第一点击通过率,从所得到的多个第一点击通过率中选取一个作为预测点击通过率。或者,示例性的,如果得到的组合特征数据为多组,可以针对每组组合特征数据,将该组组合特征数据中的每个特征数据分别输入预设的LR模型,得到该组组合特征数据对应的第一点击通过率,针对每组组合特征数据,将该组组合特征数据对应的第一点击通过率输入预设的点击通过率计算公式,获得待投放的网络广告的第二点击通过率,从所获得的多个第二点击通过率中选取一个作为预测点击通过率。为了便于理解和合理布局,后续将以可选实施例的形式对预测点击通过率的获取方式进行详细说明。
任何能够基于所得到的组合特征数据,获得待投放的网络广告的预测点击通过率的方式均可用于本发明,本实施例对此不作限制。
本发明实施例提供的方案中,由于多个构建信息是关于构建第一特征数据的信息,因此,可以针对每个构建信息,从预测指令对应的网络广告的多个特征数据中,获取该构建信息对应的第二特征数据;进而分别利用每个构建信息对应的第二特征数据,构建第一特征数据。并且获取的多个构建信息互不相同,因此,构建得到的多个第一特征数据互不相同,实现自动确定用于获取组合特征数据的多个不同的第一特征数据。在进行点击通过率预测时,与需要人工多次确定不同的第一特征数据相比,节省确定多个不同的第一特征数据时的人工操作,实现在提高点击通过率的预测准确度的同时,兼顾点击通过率的预测的便捷性。
可选的,上述在接收到关于指示进行点击通过率预测的预测指令后,获取预测指令对应的多个互不相同的关于构建第一特征数据的构建信息,具体可以包括如下步骤:
在接收到关于指示进行点击通过率预测的预测指令后,读取预测指令中的预测模型标识;
从预存的预测模型数据中,查找预测模型标识对应的预测模型数据,并从所查找到的预测模型数据中,读取第一特征配置文件;
从所读取到的第一特征配置文件中,提取多个互不相同的关于构建第一特征数据的构建信息。
在具体应用中,为了应对点击通过率的不同预测需求,可以设置适用于不同测试需求的不同预测模型。举例而言,预测模型P1适用于预测组合数据的数量为2组的网络广告,预测模型P2适用于预测组合数据的数量为5组的网络广告等等。因此,为了从多个不同的预测模型中选择适用于要进行预测的网络广告的模型,可以在预测指令中表明所适用的预测模型的预测模型标识。
相应的,为了保证后续利用第一特征数据得到的组合特征数据适用于预测模型标识对应的预测模型,需要获取与预测模型标识对应的构建信息。为此,可以从预存的预测模型数据中,查找预测模型标识对应的预测模型数据,并从所查找到的预测模型数据中,读取第一特征配置文件;进而从所读取到的第一特征配置文件中,提取多个互不相同的关于构建第一特征数据的构建信息。
其中,预测模型数据为能够表明预测模型所适用的测试需求的数据。举例而言,预测模型数据可以是预测模型的配置文件,也可以是表明预测模型所适用的测试需求的需求文档等等。并且,为了提高后续对所使用的第一特征数据的追溯分析、以及在历史第一特征数据的基础上扩展新的第一特征数据等等对点击通过率预测的扩展的便捷性,可以利用第一特征配置文件表明第一特征的构建信息,通过配置文件获取构建信息。此外,多个构建信息可以是从同一个配置文件中提取的,也可以是分别从多个配置文件中提取的。
相应的,从查找到的预测模型数据中,读取第一特征配置文件的具体方式,可以是多种的。示例性的,如果预测模型数据是预测模型的配置文件,且第一特征配置文件是预测模型的配置文件的子文件,可以直接从预测模型的配置文件中读取第一特征配置文件。例如,预测模型的配置文件包括:第一特征配置文件、以及预测模型中分类模型的配置文件等等子文件。或者,示例性的,对于任意形式的预测模型数据,第一特征配置文件的读取可以是:从所查找的预测模型数据中提取第一特征配置文件的文件标识,在预存的第一特征配置文件中,读取具有所提取的文件标识的第一特征配置文件。
任何能够从查找到的预测模型数据中,读取第一特征配置文件的方式均可用于本发明,本实施例对此不作限制。
可选的,上述构建信息可以包括:第二特征数据的来源标识和第二特征数据的数据标识;
上述针对每个构建信息,从预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据,具体可以包括如下步骤1至步骤3:
步骤1,针对每个构建信息,读取该构建信息中的第二特征数据的来源标识。
在具体应用中,网络广告的特征数据的来源可以是多种的。示例性的,网络广告的特征数据的来源可以是已经以特征值形式存储的历史特征数据。例如,网络广告的投放时间、广告形式以及投放持续时长等等特征可以采用历史特征数据,历史特征数据可以被存储为离线文件,使用时从离线文件的存储空间中查找。或者,示例性的,网络广告的特征数据的来源可以是通过计算得到的、且历史特征数据中未存储的新特征值。例如,网络广告所介绍的产品类型、代言人以及与历史广告形式不同的新型广告形式等等,新特征值可以由计算网络广告的特征数据的组件计算后进行存储,如存储在缓存中,使用时从缓存中查找。
相应的,从网络广告的特征数据中查找的第二特征数据也具有上述多种来源。针对第二特征数据的不同来源,可以对第二特征数据进行分区存储。例如,来源为历史特征数据的,可以作为离线文件存储在非缓存区域,来源为需要计算得到的新特征值的,可以存储在缓存中。因此,可以在构建信息中利用来源标识表明第二特征数据的来源,以在后续步骤2中确定第二特征数据的来源标识对应的存储位置,通过步骤3按照所查找到的存储位置查找第二特征数据。
步骤2,根据预设的来源标识与存储位置的对应关系,从预存的第二特征数据的存储位置中,查找所读取的来源标识对应的存储位置。
与将所有第二特征数据存储在相同的存储空间相比,按照第二特征数据的来源进行分区存储,并通过来源标识在相应的位置查找,可以减少在网络广告的所有特征数据中查找所涉及的数据的数量,提高第二特征数据的查找效率。
其中,来源标识可以是预设的符号,例如,来源标识“afs”是来源历史特征数据,如“离线文件”的标识;来源标识“ufs”是来源计算得到的特征数据,如“新特征值”的标识。相应的,预设的来源标识与存储位置的对应关系中,存储位置可以是多种的。示例性的,该存储位置可以是按照第二特征数据的来源划分的存储空间。例如,缓存服务器和非缓存的存储服务器。或者,示例性的,该存储位置可以是第二特征数据的存储路径。与存储路径相比,存储空间或者索引更加简洁,便于存储和编辑,能够提高点击通过率预测的便捷性。
步骤3,按照所查找到的存储位置和第二特征数据的数据标识,查找第二特征数据。
其中,第二特征数据的数据标识可以是多种的。示例性的,第二特征数据的数据标识可以是能够表明第二特征数据的唯一性的标识。例如,第二特征数据的名称,或者序号等等。或者,示例性的,第二特征数据的数据标识可以是用于查找第二特征数据的索引。按照所查找到的存储位置和数据标识,查找第二特征数据,具体可以是在所查找到的存储位置中,查找具有第二特征数据的数据标识的特征数据。
示例性的,从某一构建信息中读取的第二特征数据的来源标识为“afs”,第二特征数据的标识为“name=lgc2,index_start=168,index_end=169”。“afs”对应的存储位置为缓存服务器。因此,在缓存服务器中查找名称为“lgc2”的索引文件,并将该索引文件中查找索引为“168”至“169”的特征数据,查找到的数据为第二特征数据。
可选的,上述分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据,具体可以包括如下步骤1至步骤2:
步骤1,针对每个构建信息对应的第一特征数据,利用预设的分类模型,将网络广告的多个特征数据中除该第一特征数据以外的特征数据中,与该第一特征数据的类型相同的特征数据,确定为待组合特征数据;其中,预设的分类模型为预先利用样本特征数据和样本特征数据的类型标签训练得到的模型,且样本特征数据与第一特征数据所反映的网络广告的特征相同
步骤2,将所确定的待组合特征数据和用于确定待组合特征数据的第一特征数据,作为一组组合特征数据。
其中,预设的分类模型可以将第一特征数据作为分类依据,从网络广告的多个特征数据中确定与第一特征数据的类型相同的特征数据,实现对网络广告的多个特征数据的分类。并且,为了保证后续得到的组合特征与第一特征数据相比,所反映的特征更多,进行分类的网络广告的多个特征数据需要为网络广告的特征数据中,除第一特征数据以外的特征数据。
并且,预设的分类模型可以是多种的。示例性的,预设的分类模型可以是预设的梯度增强决策树,也可以是预设的神经网络模型。为了从网络广告的多个特征数据中,确定与所构建的第一特征数据的类型相同的第二特征数据,预设的分类模型需要为预先利用样本特征数据和样本特征数据的类型标签训练得到的模型,且样本特征数据与第一特征数据所反映的网络广告的特征相同。例如,第一特征数据包括反映用户信息的特征数据,那么样本数据也包括反映用户信息的特征数据。任何能够用于获得待组合特征数据的预设的分类模型均可用于本发明,本实施例对此不作限制。
示例性的,第一特征数据包括:反映广告展示位置的特征数据C1和反映用户是否为会员的特征数据C2。待组合特征数据包括:与第一特征数据C1的类型相同,均反映广告信息的特征数据:反映广告的内容形式的第二特征数据C11、反映广告的投放形式的第二特征数据C12以及反映广告的投放时间的第二特征数据C13;与第一特征数据C2的类型相同,均反映用户信息的第二特征数据:反映用户性别的第二特征数据C21、反映用户地理位置的第二特征数据C22以及反映用户年龄的第二特征数据C23。由此,将所确定的第二特征数据C11、第二特征数据C12以及第二特征数据C13,和相应的第一特征数据C1作为一组组合特征数据;将所确定的第二特征数据C21、第二特征数据C22以及第二特征数据C23,和相应的第一特征数据C2作为一组组合特征数据。
此外,为了适用于不同的组合特征数据,可以有多个预设的分类模型;此时,在上述从预存的预测模型数据中,查找所读取的预测模型标识对应的预测模型数据的步骤之后,本发明实施例提供的点击通过率的预测方法还可以包括如下步骤:
从所查找到的预测模型数据中,读取预设的分类模型的分类模型标识;
相应的,上述针对每个构建信息,利用预设的分类模型,从待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据中,确定与该构建信息对应的第一特征数据的类型相同的待组合特征数据,具体可以包括如下步骤:
从预存的多个预设的分类模型中,查找所读取的分类模型标识对应的预设的分类模型;
针对每个构建信息,利用所查找到的预设的分类模型,将待投放的网络广告的多个特征数据中,除该构建信息对应的第一特征数据以外的特征数据,确定为与该构建信息对应的第一特征数据的类型相同的待组合特征数据。
与存在一个预设的分类模型相比,当存在多个预设的分类模型时,为了保证预设的分类模型适用于获得与第一特征数据的类型相同的待组合特征数据,可以在预测模型数据中增加分类模型标识,以利用分类模型标识从预存的多个预设的分类模型中,查找适用于所构建的第一特征数据的预设的分类模型。
示例性的,预测模型数据为预测模型配置文件,从该配置文件中读取了预设的分类模型的分类模型标识“booster[0]”,则从多个预设的梯度增强决策树中,查找具有分类模型标识“booster[0]”的预设的梯度增强决策树。预设的梯度增强决策树booster[0]可以对特征数据进行二分类,包括:投放时间和广告形式。因此,适用于获得与反映投放时间这一特征的第一特征数据d1,以及反映广告形式的第一特征数据d2的类型相同的待组合特征数据。当然,预设的分类模型具体实现的分类效果取决于样本特征数据和样本特征数据的类型标签,上述预设的梯度增强决策树booster[0]仅为示例性说明。任何能够用于获得待组合特征数据的预设的分类模型均可用于本发明,本实施例对此不作限制。
如图2所示,本发明另一实施例的点击通过率的预测方法的流程,该方法可以包括:
S201,在接收到关于指示进行点击通过率预测的预测指令后,获取预测指令对应的多个互不相同的关于构建第一特征数据的构建信息。构建信息包括:构建类型;构建类型为按照将第二特征数据构建为第一特征数据的构建形式划分得到的类型。
步骤S201与本发明图1实施例的S102至S103为相似的步骤,区别在于为了后续按照不同的构建类型进行第一特征数据的构建,S201中的构建信息可以包括构建类型,构建类型为按照将第二特征数据构建为第一特征数据的构建形式划分得到的类型。对于相同部分在此不再赘述,详见上述本发明图1实施例的描述。其中,将第二特征数据构建为第一特征数据的构建形式可以是多种的,具体在后续步骤S204至步骤S207中进行说明。
并且,构建类型的内容可以是多种的。示例性的,可以将类型标识作为构建类型的内容,例如,第二构建类型的类型标识“depend”时,如果构建信息中存在类型标识“depend”,确定构建类型为第二构建类型,如果构建信息中不存在类型标识“depend”,确定构建类型为第一构建类型。或者,示例性的,可以将构建类型对应的构建形式本身作为构建类型的内容,例如,将拼接形式“按照第二特征数据在构建信息中的顺序,对第二特征数据进行拼接,得到第一特征数据”作为构建类型的内容。可以理解的是,与将构建类型对应的拼接形式本身作为构建类型的内容相比,将类型标识作为构建类型的内容,可以简化构建类型的内容,降低构建信息所占的存储空间成本,以及进行点击通过率预测的电子设备的数据处理压力,有利于提高点击通过率的预测效率。
S202,针对每个构建信息,从预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据。
S202与本发明图1实施例的S102为相同的步骤,在此不再赘述,详见上述本发明图1实施例的描述。
S203,针对每个构建信息,判断该构建信息所表明的构建类型;如果该构建信息的构建类型为第一构建类型,执行步骤S204以及步骤S208至S209;如果该构建信息对应的构建类型为第二构建类型,执行步骤S205至S207。
其中,对构建信息所表明的构建类型的判断方式可以是多种的。示例性的,如果将类型标识作为构建类型的内容,例如,第二构建类型的类型标识“depend”时,或者,将第三特征数据的数据标识作为第二构建类型的类型标识时,可以判断构建信息中是否存在第二构建类型的类型标识“depend”或者第三特征数据的数据标识。如果存在,判断结果为构建类型为第二构建类型,如果不存在,判断结果为构建类型为第一构建类型。或者,示例性的,如果将构建类型对应的构建形式本身作为构建类型的内容,可以判断构建类型所描述的构建方式中是否涉及与第三特征数据的拼接。如果涉及,判断结果为构建类型为第二构建类型,如果不涉及,判断结果为构建类型为第一构建类型。
在该步骤中,按照类型标识判断构建信息所表明的构建类型,可以减少判断过程中需要分析的内容,提高判断效率。并且,在更改构建信息以得到不同的第一特征数据时,与将构建形式本身作为构建类型的内容相比,可以降低构建信息的描述难度和数据量,提高点击通过率的预测便捷性。
S204,将该构建信息对应的至少一个第二特征数据,拼接为第一特征数据。
在具体应用中,将某一构建信息对应的至少一个第二特征数据拼接为第一特征数据的方式可以是多种的。示例性的,如果构建信息对应有一个第二特征数据,可以将该第二特征数据本身作为第一特征数据。例如,构建信息inf1对应一个第二特征数据d1,可以将第二特征数据d1作为第一特征数据。或者,示例性的,如果构建信息对应有多个第二特征数据,可以将多个第二特征数据拼接为第一特征数据。例如,构建信息inf2对应第二特征数据d2和第二特征数据d3,可以将第二特征数据d2和第二特征数据d3,拼接为第一特征数据:“d2d3”,或者“d3d2”。
S205,从该构建信息中读取第三特征数据的数据标识。
S206,从预存的第三特征数据中,查找数据标识对应的第三特征数据;其中,第三特征数据为网络广告的特征数据中指定的特征数据。
其中,作为网络广告的特征数据中指定的特征数据的第三特征数据,具体可以是多种的。示例性的,第三特征数据可以是观看网络广告的用户的用户信息。例如,用户的年龄、性别以及所在地理位置等等。或者,第三特征数据可以是为待构建得到的第一特征数据设置的权重。例如,待构建得到的第一特征数据是网络广告的投放时间,可以设置权重为0.8,待构建得到的第一特征数据是网络广告的广告形式,可以设置权重为0.7等等。
S207,拼接该构建信息对应的第二特征数据和第三特征数据,得到第一特征数据。
在上述步骤S204和步骤S207中,将多个第二特征数据,或者,第二特征数据和第三特征数据拼接得到第一特征数据的拼接方式,具体可以是多种的。示例性的,拼接方式可以为:按照第二特征数据和第三特征数据在构建信息中的分布顺序,进行拼接,得到第一特征数据。例如,构建信息中第二特征数据和第三特征数据的排布顺序为“name=lgc2;index_start=168,index_end=169;depend=posid”。并且,第二特征数据的数据标识“name=lgc2;index_start=168,index_end=169”对应的第二特征数据为“20:00”和“视频”;第三特征数据的数据标识“ag”对应的第三特征数据为“18岁”。此时,拼接得到的第一特征数据为“20:00,视频,18岁”。或者,示例性的,拼接方式可以为:按照随机顺序进行拼接。例如,利用预设的随机排序算法对第二特征数据和第三特征数据进行随机排序,按照随机排序后第二特征数据和第三特征数据的顺序,对第二特征数据和第三特征数据进行拼接。
按照第二特征数据和第三特征数据在构建信息中的分布顺序进行拼接,可以方便维护人员按照自身对用于构建第一特征数据的特征数据的表述习惯,描述构建信息,减少按照指定顺序描述构建信息时,需要特意确认指定顺序的步骤,提高点击通过率预测的便捷性。
S208,分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据。
S209,基于组合特征数据,获得网络广告的预测点击通过率。
S208至S209与本发明图1实施例的S104至S105为相同的步骤,在此不再赘述,详见上述本发明图1实施例的描述。
上述本发明图2实施例,通过构建类型的划分增加所构建的第一特征数据的多样性,扩展了点击通过率预测的适用范围。并且利用属于指定特征数据,例如权重,和/或者用户信息的第三特征数据,为点击通过率的预测提供多样性的预测依据,有利于提高点击通过率的预测准确度。
相应于上述方法实施例,本发明一实施例还提供了点击通过率的预测装置。
如图3所示,本发明一实施例的点击通过率的预测装置的结构,该装置可以包括:
获取模块301,用于在接收到关于指示进行点击通过率预测的预测指令后,获取所述预测指令对应的多个互不相同的关于构建第一特征数据的构建信息;
查找模块302,用于针对每个构建信息,从所述预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据;
构建模块303,用于分别利用每个构建信息对应的第二特征数据,构建第一特征数据;
组合模块304,用于分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据;
预测模块305,用于基于所述组合特征数据,获得所述网络广告的预测点击通过率。
本发明实施例提供的方案中,由于多个构建信息是关于构建第一特征数据的信息,因此,可以针对每个构建信息,从预测指令对应的网络广告的多个特征数据中,获取该构建信息对应的第二特征数据;进而分别利用每个构建信息对应的第二特征数据,构建第一特征数据。并且获取的多个构建信息互不相同,因此,构建得到的多个第一特征数据互不相同,实现自动确定用于获取组合特征数据的多个不同的第一特征数据。在进行点击通过率预测时,与需要人工多次确定不同的第一特征数据相比,节省确定多个不同的第一特征数据时的人工操作,实现在提高点击通过率的预测准确度的同时,兼顾点击通过率的预测的便捷性。
可选的,所述构建信息包括:第二特征数据的来源标识和第二特征数据的数据标识;
所述查找模块302,具体用于:
针对每个构建信息,读取该构建信息中的第二特征数据的来源标识;
根据预设的来源标识与存储位置的对应关系,从预存的第二特征数据的存储位置中,查找所读取的来源标识对应的存储位置;
按照所查找到的存储位置和第二特征数据的数据标识,查找第二特征数据。
可选的,所述获取模块302,具体用于:
在接收到关于指示进行点击通过率预测的预测指令后,读取所述预测指令中的预测模型标识;
从预存的预测模型数据中,查找所述预测模型标识对应的预测模型数据,并从所查找到的预测模型数据中,读取第一特征配置文件;
从所读取到的第一特征配置文件中,提取多个互不相同的关于构建第一特征数据的构建信息。
可选的,所述组合模块304,具体用于:
针对每个构建信息对应的第一特征数据,利用预设的分类模型,将所述网络广告的多个特征数据中除该第一特征数据以外的特征数据中,与该第一特征数据的类型相同的特征数据,确定为待组合特征数据;
将所确定的待组合特征数据和用于确定待组合特征数据的第一特征数据,作为一组组合特征数据;
其中,所述预设的分类模型为预先利用样本特征数据和样本特征数据的类型标签训练得到的模型,且所述样本特征数据与第一特征数据所反映的网络广告的特征相同。
如图4所示,本发明另一实施例的点击通过率的预测装置的结构,该装置可以包括:
获取模块401,用于在接收到关于指示进行点击通过率预测的预测指令后,获取所述预测指令对应的多个互不相同的关于构建第一特征数据的构建信息;所述构建信息包括:构建类型;所述构建类型为按照将第二特征数据构建为所述第一特征数据的构建形式划分得到的类型;
查找模块402,用于针对每个构建信息,从所述预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据;
构建模块403,具体包括:判断子模块4031,第一拼接子模块4032以及第二拼接子模块4033;
所述判断子模块4031,用于针对每个构建信息,判断该构建信息所表明的构建类型;
所述第一拼接子模块4032,用于在该构建信息的构建类型为第一构建类型时,将该构建信息对应的至少一个第二特征数据,拼接为第一特征数据;
所述第二拼接子模块4033,用于在该构建信息对应的构建类型为第二构建类型时,从该构建信息中读取第三特征数据的数据标识;从预存的第三特征数据中,查找所述数据标识对应的第三特征数据;其中,所述第三特征数据为所述网络广告的特征数据中指定的特征数据;拼接该构建信息对应的第二特征数据和第三特征数据,得到第一特征数据;
组合模块404,用于分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据;
预测模块405,用于基于所述组合特征数据,获得所述网络广告的预测点击通过率。
相应于上述实施例,本发明实施例还提供了一种电子设备,如图5所示,该设备可以包括:
处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器通503过通信总线504完成相互间的通信;
存储器503,用于存放计算机程序;
处理器501,用于执行上述存储器503上所存放的计算机程序时,实现上述实施例中任一点击通过率的预测方法的步骤。
本发明实施例提供的方案中,由于多个构建信息是关于构建第一特征数据的信息,因此,可以针对每个构建信息,从预测指令对应的网络广告的多个特征数据中,获取该构建信息对应的第二特征数据;进而分别利用每个构建信息对应的第二特征数据,构建第一特征数据。并且获取的多个构建信息互不相同,因此,构建得到的多个第一特征数据互不相同,实现自动确定用于获取组合特征数据的多个不同的第一特征数据。在进行点击通过率预测时,与需要人工多次确定不同的第一特征数据相比,节省确定多个不同的第一特征数据时的人工操作,实现在提高点击通过率的预测准确度的同时,兼顾点击通过率的预测的便捷性。
上述存储器可以包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-Volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离于上述处理器的存储装置。
上述处理器可以是通用处理器,包括CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processor,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明一实施例提供的计算机可读存储介质,包含于电子设备,该计算机可读存储介质内存储有计算机程序,该计算机程序被处理器执行时,实现上述实施例中任一点击通过率的预测方法的步骤。
本发明实施例提供的方案中,由于多个构建信息是关于构建第一特征数据的信息,因此,可以针对每个构建信息,从预测指令对应的网络广告的多个特征数据中,获取该构建信息对应的第二特征数据;进而分别利用每个构建信息对应的第二特征数据,构建第一特征数据。并且获取的多个构建信息互不相同,因此,构建得到的多个第一特征数据互不相同,实现自动确定用于获取组合特征数据的多个不同的第一特征数据。在进行点击通过率预测时,与需要人工多次确定不同的第一特征数据相比,节省确定多个不同的第一特征数据时的人工操作,实现在提高点击通过率的预测准确度的同时,兼顾点击通过率的预测的便捷性。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的点击通过率的预测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、DSL(Digital Subscriber Line,数字运维人员线)或无线(例如:红外线、无线电、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如:DVD(Digital Versatile Disc,数字通用光盘))、或者半导体介质(例如:SSD(Solid StateDisk,固态硬盘))等。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种点击通过率的预测方法,其特征在于,所述方法包括:
在接收到关于指示进行点击通过率预测的预测指令后,获取所述预测指令对应的多个互不相同的关于构建第一特征数据的构建信息;
针对每个构建信息,从所述预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据;
分别利用每个构建信息对应的第二特征数据,构建第一特征数据;
分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据;
基于所述组合特征数据,获得所述网络广告的预测点击通过率。
2.根据权利要求1所述的方法,其特征在于,所述构建信息包括:构建类型;所述构建类型为按照将第二特征数据构建为所述第一特征数据的构建形式划分得到的类型;
所述分别利用每个构建信息对应的第二特征数据,构建第一特征数据,包括:
针对每个构建信息,判断该构建信息所表明的构建类型;
如果该构建信息的构建类型为第一构建类型,将该构建信息对应的至少一个第二特征数据,拼接为第一特征数据;
如果该构建信息对应的构建类型为第二构建类型,从该构建信息中读取第三特征数据的数据标识;
从预存的第三特征数据中,查找所述数据标识对应的第三特征数据;其中,所述第三特征数据为所述网络广告的特征数据中指定的特征数据;
拼接该构建信息对应的第二特征数据和第三特征数据,得到第一特征数据。
3.根据权利要求1所述的方法,其特征在于,所述构建信息包括:第二特征数据的来源标识和第二特征数据的数据标识;
所述针对每个构建信息,从所述预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据,包括:
针对每个构建信息,读取该构建信息中的第二特征数据的来源标识;
根据预设的来源标识与存储位置的对应关系,从预存的第二特征数据的存储位置中,查找所读取的来源标识对应的存储位置;
按照所查找到的存储位置和第二特征数据的数据标识,查找第二特征数据。
4.根据权利要求1至3任一所述的方法,其特征在于,所述在接收到关于指示进行点击通过率预测的预测指令后,获取所述预测指令对应的多个互不相同的关于构建第一特征数据的构建信息,包括:
在接收到关于指示进行点击通过率预测的预测指令后,读取所述预测指令中的预测模型标识;
从预存的预测模型数据中,查找所述预测模型标识对应的预测模型数据,并从所查找到的预测模型数据中,读取第一特征配置文件;
从所读取到的第一特征配置文件中,提取多个互不相同的关于构建第一特征数据的构建信息。
5.一种点击通过率的预测装置,其特征在于,所述装置包括:
获取模块,用于在接收到关于指示进行点击通过率预测的预测指令后,获取所述预测指令对应的多个互不相同的关于构建第一特征数据的构建信息;
查找模块,用于针对每个构建信息,从所述预测指令对应的网络广告的多个特征数据中,查找该构建信息对应的第二特征数据;
构建模块,用于分别利用每个构建信息对应的第二特征数据,构建第一特征数据;
组合模块,用于分别利用每个构建信息对应的第一特征数据,以及待投放的网络广告的多个特征数据中除第一特征数据以外的特征数据,获取组合特征数据;
预测模块,用于基于所述组合特征数据,获得所述网络广告的预测点击通过率。
6.根据权利要求5所述的装置,其特征在于,所述构建信息包括:构建类型;所述构建类型为按照将第二特征数据构建为所述第一特征数据的构建形式划分得到的类型;
所述构建模块,具体包括:判断子模块,第一拼接子模块以及第二拼接子模块;
所述判断子模块,用于针对每个构建信息,判断该构建信息所表明的构建类型;
所述第一拼接子模块,用于在该构建信息的构建类型为第一构建类型时,将该构建信息对应的至少一个第二特征数据,拼接为第一特征数据;
所述第二拼接子模块,用于在该构建信息对应的构建类型为第二构建类型时,从该构建信息中读取第三特征数据的数据标识;从预存的第三特征数据中,查找所述数据标识对应的第三特征数据;其中,所述第三特征数据为所述网络广告的特征数据中指定的特征数据;拼接该构建信息对应的第二特征数据和第三特征数据,得到第一特征数据。
7.根据权利要求5所述的装置,其特征在于,所述构建信息包括:第二特征数据的来源标识和第二特征数据的数据标识;
所述查找模块,具体用于:
针对每个构建信息,读取该构建信息中的第二特征数据的来源标识;
根据预设的来源标识与存储位置的对应关系,从预存的第二特征数据的存储位置中,查找所读取的来源标识对应的存储位置;
按照所查找到的存储位置和第二特征数据的数据标识,查找第二特征数据。
8.根据权利要求5至7任一所述的装置,其特征在于,所述获取模块,具体用于:
在接收到关于指示进行点击通过率预测的预测指令后,读取所述预测指令中的预测模型标识;
从预存的预测模型数据中,查找所述预测模型标识对应的预测模型数据,并从所查找到的预测模型数据中,读取第一特征配置文件;
从所读取到的第一特征配置文件中,提取多个互不相同的关于构建第一特征数据的构建信息。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序,实现如权利要求1-4任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-4任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910444934.7A CN110188942A (zh) | 2019-05-27 | 2019-05-27 | 点击通过率的预测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910444934.7A CN110188942A (zh) | 2019-05-27 | 2019-05-27 | 点击通过率的预测方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110188942A true CN110188942A (zh) | 2019-08-30 |
Family
ID=67717921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910444934.7A Pending CN110188942A (zh) | 2019-05-27 | 2019-05-27 | 点击通过率的预测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110188942A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110223108A (zh) * | 2019-05-27 | 2019-09-10 | 北京金山安全软件有限公司 | 点击通过率的预测方法、装置及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663617A (zh) * | 2012-03-20 | 2012-09-12 | 亿赞普(北京)科技有限公司 | 一种广告的点击率预测方法及系统 |
CN106295844A (zh) * | 2015-06-12 | 2017-01-04 | 华为技术有限公司 | 一种数据处理方法、装置、系统及电子设备 |
CN108805332A (zh) * | 2018-05-07 | 2018-11-13 | 北京奇艺世纪科技有限公司 | 一种特征评估方法和装置 |
CN109711872A (zh) * | 2018-12-14 | 2019-05-03 | 中国平安人寿保险股份有限公司 | 基于大数据分析的广告投放方法及装置 |
-
2019
- 2019-05-27 CN CN201910444934.7A patent/CN110188942A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663617A (zh) * | 2012-03-20 | 2012-09-12 | 亿赞普(北京)科技有限公司 | 一种广告的点击率预测方法及系统 |
CN106295844A (zh) * | 2015-06-12 | 2017-01-04 | 华为技术有限公司 | 一种数据处理方法、装置、系统及电子设备 |
CN108805332A (zh) * | 2018-05-07 | 2018-11-13 | 北京奇艺世纪科技有限公司 | 一种特征评估方法和装置 |
CN109711872A (zh) * | 2018-12-14 | 2019-05-03 | 中国平安人寿保险股份有限公司 | 基于大数据分析的广告投放方法及装置 |
Non-Patent Citations (1)
Title |
---|
王少平、凌岚著: "《产业共生网络的结构特征研究》", 30 June 2011, 同济大学出版社 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110223108A (zh) * | 2019-05-27 | 2019-09-10 | 北京金山安全软件有限公司 | 点击通过率的预测方法、装置及设备 |
CN110223108B (zh) * | 2019-05-27 | 2022-05-24 | 北京金山安全软件有限公司 | 点击通过率的预测方法、装置及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111680221B (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
US20240172010A1 (en) | Systems and methods for communications node upgrade and selection | |
CN102541893B (zh) | 关键词分析方法及装置 | |
CN110019616B (zh) | 一种poi现势状态获取方法及其设备、存储介质、服务器 | |
CN109657138A (zh) | 一种视频推荐方法、装置、电子设备及存储介质 | |
US20160171510A1 (en) | Systems and Methods for Gathering, Merging, and Returning Data Describing a Person from Data Aggregated from Multiple Remote Data Sources | |
CN107040648A (zh) | 信息展示方法及装置 | |
CN101990668A (zh) | 推荐信息生成装置和推荐信息生成方法 | |
CN102446118A (zh) | 聚焦于上下文和任务的计算 | |
CN104750839B (zh) | 一种数据推荐方法、终端及服务器 | |
CN102222103A (zh) | 视频内容的匹配关系的处理方法及装置 | |
CN101535996A (zh) | 用于识别由数字图像捕获的对象的方法和设备 | |
CN104021163A (zh) | 产品推荐系统及方法 | |
CN110162292A (zh) | 语音播报方法及装置 | |
KR20080082513A (ko) | 등급 설정을 통한 웹사이트 지도정보 표시 방법 | |
CN109889891A (zh) | 获取目标媒体文件的方法、装置及存储介质 | |
US10929491B2 (en) | Social sharing path user interface insights | |
CN108960912A (zh) | 用于确定目标位置的方法和装置 | |
CN109961299A (zh) | 数据分析的方法和装置 | |
CN110134759A (zh) | 一种获取企业的行业信息的方法 | |
CN105976188A (zh) | 一种多渠道客户信息处理系统及处理方法 | |
CN110188942A (zh) | 点击通过率的预测方法、装置及设备 | |
CN100555283C (zh) | 一种直接针对用户的相关信息的发布方法和系统 | |
CN110189171B (zh) | 特征数据的生成方法、装置及设备 | |
CN110457607A (zh) | 一种部分行程信息推荐方法、装置、介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |