CN109167816A - 信息推送方法、装置、设备和存储介质 - Google Patents
信息推送方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN109167816A CN109167816A CN201810879407.4A CN201810879407A CN109167816A CN 109167816 A CN109167816 A CN 109167816A CN 201810879407 A CN201810879407 A CN 201810879407A CN 109167816 A CN109167816 A CN 109167816A
- Authority
- CN
- China
- Prior art keywords
- promotion message
- user
- data
- click
- clicks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/535—Tracking the activity of the user
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种信息推送方法、装置、设备和存储介质。所述方法包括:获取目标用户对应的用户属性数据;将该用户属性数据及待推广信息对应的信息属性数据输入推广信息点击预测模型,获取目标用户对待推广信息的点击预测结果;上述模型通过至少两个用户对应的推广信息点击数据和用户属性数据训练生成;推广信息点击数据至少包括推送的推广信息、推广信息对应的属性信息及推广信息的点击次数;根据点击预测结果确定是否向目标用户推送待推广信息。本发明实施例的技术方案解决了现有技术中推广信息与用户兴趣点匹配度低,导致推广信息点击率低的技术缺陷,通过向用户推送与用户属性匹配的推广信息,提高了推广信息的点击率。
Description
技术领域
本发明实施例涉及信息推送技术领域,尤其涉及一种信息推送方法、装置、设备和存储介质。
背景技术
随着互联网技术的迅速发展,可通过网络传播的信息的种类和数量越来越多,人们不断追求能够有效组织和利用网络信息的技术,因此推广信息推送技术应运而生。推广信息推送是指向用户打开的网页或应用程序中的信息呈现位置推送适合的推广信息,以吸引用户的点击。
现有技术中,推广信息的推送方式一般是在网页或应用程序中的信息呈现位置,向所有用户推送相同的推广信息,或是从待推广的信息中随机选取一个信息向当前用户推送。
发明人在实现本发明的过程中,发现现有技术存在如下缺陷:难以保证所推送的推广信息是用户所感兴趣的信息,因此,难以保证及提高推广信息的点击率。
发明内容
有鉴于此,本发明实施例提供了一种信息推送方法、装置、设备和存储介质,以优化现有的推广信息的推送方法,提高了推广信息的点击率。
在第一方面,本发明实施例提供了一种信息推送方法,包括:
获取目标用户对应的用户属性数据;
将所述目标用户对应的用户属性数据以及待推广信息对应的信息属性数据输入推广信息点击预测模型,获取所述目标用户对所述待推广信息的点击预测结果;
所述推广信息点击预测模型通过至少两个用户分别对应的推广信息点击数据和用户属性数据训练生成;所述推广信息点击数据至少包括:向对应的用户推送的推广信息、所述推广信息对应的属性信息以及所述对应的用户对所述推广信息的点击次数;
根据所述点击预测结果确定是否向所述目标用户推送所述待推广信息。
在上述方法中,可选的是,在所述获取目标用户对应的用户属性数据之前,还包括:
获取与所述至少两个用户分别对应的所述推广信息点击数据和用户属性数据;
将所述至少两个用户中的任一个用户对应的所述推广信息点击数据中的任一个推广信息对应的所有数据,以及该任一个用户的用户属性数据作为一份训练样本数据,其中,所述任一个推广信息对应的所有数据至少包括:该推广信息、该推广信息对应的属性信息以及所述任一个用户对该推广信息的点击次数;
使用所述训练样本数据训练基础模型,得到所述推广信息点击预测模型。
在上述方法中,可选的是,所述使用所述训练样本数据训练基础模型,得到所述推广信息点击预测模型,包括:
将包括的所述对应的用户对所述推广信息的点击次数大于设定阈值的所述训练样本数据划分为正样本数据;
将包括的所述对应的用户对所述推广信息的点击次数小于等于设定阈值的所述训练样本数据划分为负样本数据;
使用所述正样本数据和所述负样本数据训练基础模型,得到所述推广信息点击预测模型。
在上述方法中,可选的是,所述使用所有所述训练样本数据训练基础模型,得到所述推广信息点击预测模型,包括:
按照设定比例将所有所述训练样本数据划分为常规样本数据和检验样本数据;
使用所述常规样本数据训练基础模型,得到待检验模型;
使用所述检验样本数据检验所述待检验模型的输出数据的准确率是否大于设定阈值;
若所述待检验模型的输出数据的准确率大于所述设定阈值,则将所述待检验模型作为所述推广信息点击预测模型。
在上述方法中,可选的是,所述将所述待检验模型作为所述推广信息点击预测模型,包括:
将所述常规样本数据输入梯度提升决策树,得到梯度样本数据;
使用所述梯度样本数据训练所述基础模型,得到所述推广信息点击预测模型。
在上述方法中,可选的是,所述点击预测结果为预测点击概率;
所述根据所述点击预测结果确定是否向所述目标用户推送所述待推广信息,包括:
判断所述预测点击概率是否大于所述待推广信息对应的推送点击概率;
若所述预测点击概率大于所述待推广信息对应的推送点击概率,则向所述目标用户推送所述待推广信息。
在上述方法中,可选的是,所述点击预测结果为点击或不点击;
所述根据所述点击预测结果确定是否向所述目标用户推送所述待推广信息,包括:
如果所述点击预测结果为点击,则判断所述目标用户对应的用户属性数据是否与所述待推广信息对应的推送人群的属性相匹配;
若所述目标用户对应的用户属性数据与所述待推广信息对应的推送人群的属性相匹配,则向所述目标用户推送所述待推广信息。
在第二方面,本发明实施例提供了一种信息推送装置,包括:
用户属性数据获取模块,用于获取目标用户对应的用户属性数据;
点击预测结果获取模块,用于将所述目标用户对应的用户属性数据以及待推广信息对应的信息属性数据输入推广信息点击预测模型,获取所述目标用户对所述待推广信息的点击预测结果;
所述推广信息点击预测模型通过至少两个用户分别对应的推广信息点击数据和用户属性数据训练生成;所述推广信息点击数据至少包括:向对应的用户推送的推广信息、所述推广信息对应的属性信息以及所述对应的用户对所述推广信息的点击次数;
信息推送模块,用于根据所述点击预测结果确定是否向所述目标用户推送所述待推广信息。
在第三方面,本发明实施例提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任一实施例所述的方法。
在第四方面,本发明实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本发明任一实施例所述的方法。
本发明实施例提供了一种信息推送方法、装置、设备和存储介质,通过使用推广信息点击预测模型,根据目标用户对应的用户属性数据和待推广信息对应的信息属性数据预测目标用户对待推广信息的点击预测结果,并根据点击预测结果确定是否向目标用户推送待推广信息,解决了现有技术中推广信息与用户兴趣点匹配度低,导致推广信息点击率低的技术缺陷,通过向用户推送与用户属性匹配的推广信息,提高了推广信息的点击率。
附图说明
图1是本发明实施例一提供的一种信息推送方法的流程图;
图2是本发明实施例二提供的一种信息推送方法的流程图;
图3是本发明实施例三提供的一种信息推送装置的结构图;
图4是本发明实施例四提供的一种设备的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的一种信息推送方法的流程图,本实施例的方法可以有信息推送装置来执行,该装置可通过硬件和/或软件的方式实现,并一般可集成于服务器或移动终端中。本实施例的方法具体包括:
S101、获取目标用户对应的用户属性数据。
在本实施例中,目标用户具体是指准备向其推送待推广信息的用户。示例性地,目标用户可以是刚刚启动应用程序的用户,或是刚刚打开某一个网页的用户。
在本实施例中,用户属性数据具体是指用于表征用户的性质和用户与其他事物的关系的数据。用户属性数据具体可以包括用户的年龄和性别、所在地理位置、常购物品的类别和品牌、经常浏览的网页类别以及喜好的游戏类别等。
一般来说,用户在使用应用程序或浏览网站时,对应的服务器除了存储用户的注册信息以外,还会相应地存储用户对应用程序或网页的使用数据。进而可以根据数据的统计分析方法对使用数据进行统计分析,得到用户的部分或全部用户属性数据。当然,还可以通过应用程序或网站以询问的方式获取部分或全部用户属性数据。
进一步地,可以理解的是,用户属性数据中的一部分数据是基本固定不变的,一部分数据是变化的。因此,可以在综合考虑数据计算量以及信息的推送精度之后,确定用户属性数据重新统计的频率。具体来说,如果待推广信息的推送精度要求比较高,那么可以在每一次向目标用户推送该待推广信息之前都重新获取目标用户的用户属性数据(第一种情况);如果待推广信息的推送精度要求不是很高,那么可以每间隔设定时间长度重新获取一次目标用户的用户属性数据,以降低服务器或移动终端的计算量,当然,为了保证用户属性数据的准确度,设定时间长度也不宜过长(例如,设定时间长度可设置为15天)(第二种情况)。
对于上述第一种情况,本步骤101具体为重新根据目标用户的使用数据,和/或目标用户对与用户属性相关的询问的解答数据,使用数据统计分析方法重新获取目标用户的用户属性数据;对于上述第二种情况,本步骤101具体为通过从存储设备中读取数据的方式获取目标用户的用户属性数据。
S102、将目标用户对应的用户属性数据以及待推广信息对应的信息属性数据输入推广信息点击预测模型,获取目标用户对待推广信息的点击预测结果,其中,推广信息点击预测模型通过至少两个用户分别对应的推广信息点击数据和用户属性数据训练生成,推广信息点击数据至少包括:向对应的用户推送的推广信息、推广信息对应的属性信息以及对应的用户对推广信息的点击次数。
在本实施例中,待推广信息对应的信息属性数据具体是指用于表征待推广信息性质的数据。示例性的,如果待推广信息为一幅图片,那么信息属性数据具体可以是该图片的尺寸、图片的分辨率以及图片中图像的内容等;如果待推广信息为一首歌曲,那么信息属性数据具体可以是该歌曲的名称、歌曲的演唱者、歌曲的风格、歌曲的总时长以及歌曲的作者等。
在本实施例中,推广信息点击预测模型是用于预测输入的用户属性数据对应的目标用户,对输入的信息属性数据对应的待推广信息的点击结果。点击预测结果具体可以是目标用户对待推广信息的点击概率,也可以是目标用户是否点击待推广信息这样的一个确切的结果等预测结果。
进一步地,推广信息点击预测模型具体是通过至少两个用户分别对应的推广信息点击数据和用户属性数据训练生成。具体来说,可以是将一个用户对应的推广信息点击数据中的一个推广信息及其相关数据,以及该用户的用户属性数据作为一份训练样本数据,然后使用至少两份上述的训练样本数据对原始模型进行训练,得到推广信息点击预测模型。当然,训练样本数据的数量越多所训练得到的推广信息点击预测模型的预测结果越准确,但是,相应地,推广信息点击预测模型的训练计算量也就越大、模型的训练时长也就越长。因此,应该在平衡推广信息点击预测模型的预测结果准确率和模型训练的计算量的同时,确定所需的训练样本数据的数量。
在本实施例中,推广信息点击数据至少包括向对应的用户推送的推广信息、推广信息对应的属性信息以及对应的用户对推广信息的点击次数。其中,向对应的用户推送的推广信息具体可以为该推广信息的唯一性标识信息(例如,该推广信息的名称或编号等),也可以是该推广信息本身。其中,对应的用户对推广信息的点击次数具体是用户在设定时间长度内点击该推广信息的次数,当然上述“设定时间长度”应该与用于确定用户属性数据的使用数据所涵盖的时间长度相同。
S103、根据点击预测结果确定是否向目标用户推送待推广信息。
在本实施例中,是否向目标用户推送待推广信息是由推广信息点击预测模型输出的点击预测结果确定的。
示例性的,如果点击预测结果为目标用户对待推广信息的点击概率,那么当该点击概率大于等于设定推送阈值时,则向目标用户推送待推广信息;当该点击概率小于设定推送阈值时,则不向目标用户推送待推广信息。进一步地,既可以所有的待推广信息对应相同的设定推送阈值,也可以是不同的待推广信息对应不同的设定推送阈值等。
示例性的,如果点击预测结果为目标用户是否点击待推广信息这样一个确切结果(例如点击或不点击),那么则可以直接根据点击预测结果确定是否向目标用户推送待推广信息。
本发明实施例提供了一种信息推送方法,该方法通过使用推广信息点击预测模型,根据目标用户对应的用户属性数据和待推广信息对应的信息属性数据预测目标用户对待推广信息的点击预测结果,并根据点击预测结果确定是否向目标用户推送待推广信息,解决了现有技术中推广信息与用户兴趣点匹配度低,导致推广信息点击率低的技术缺陷,通过向用户推送与用户属性匹配的推广信息,提高了推广信息的点击率。
实施例二
图2是本发明实施例二提供的一种信息推送方法的流程图。本实施例以上述实施例为基础进行优化,在本实施例中,给出了一种增加推广信息点击预测模型的生成过程,具体化推广信息点击预测模型的检验方法和训练方法,具体化是否向目标用户推送待推广信息的判断过程的具体实施方式。
相应的,本实施例的方法具体包括:
S201、获取与至少两个用户分别对应的推广信息点击数据和用户属性数据。
在本实施例中,增加了步骤201至步骤207所组成的推广信息点击预测模型的训练及检验过程。步骤201用于获取推广信息点击预测模型的训练样本数据所对应的原始数据,即与至少两个用户分别对应的推广信息点击数据和用户属性数据。
进一步地,为了提高推广信息点击预测模型的输出数据的准确度,可以获取尽量多的用户所对应的推广信息点击数据和用户属性数据,当然,还应同时考虑模型训练时的总体计算量来最终确定所需的推广信息点击数据和用户属性数据的数量。
进一步地,为了使训练样本数据可以更好地体现不同类别的用户对推广信息的偏好,可以选取不同年龄段、不同性别、不同地域和不同工作性质的用户所对应的推广信息点击数据和用户属性数据作为训练样本数据所对应的原始数据。
S202、将至少两个用户中的任一个用户对应的推广信息点击数据中的任一个推广信息对应的所有数据,以及该任一个用户的用户属性数据作为一份训练样本数据,其中,任一个推广信息对应的所有数据至少包括:该推广信息、该推广信息对应的属性信息以及任一个用户对该推广信息的点击次数。
示例性地,一份训练样本数据包括:用户A对应的推广信息点击数据中图片A对应的所有数据(图片A对应的所有数据至少包括:图像A、图像A的信息属性数据以及用户A在设定时间内对图片A的点击次数),以及用户A的用户属性数据。
S203、按照设定比例将所有训练样本数据划分为常规样本数据和检验样本数据。
一般来说,在获取训练样本数据之后,都会使用其中一大部分数据作为真正的训练数据对模型进行训练,其余一小部分数据作为检验数据,用于在模型训练完成后,检验模型的训练成果。
在本实施例中,也将步骤202中所确定的所有的训练样本数据按照设定比例(典型的可以是8:2,即80%的训练样本数据作为常规样本数据,其余20%的训练样本数据作为检验样本数据)进行划分,并将划分之后数量居多的训练样本数据作为常规样本数据,将划分之后数量较少的训练样本数据作为检验样本数据。其中,常规样本数据用于对基础模型进行训练,检验样本数据用于对训练完成的模型进行检验。
S204、使用常规样本数据训练基础模型,得到待检验模型。
在本实施例中,基础模型具体可以是二分类模型等,典型的二分类模型可以是逻辑回归模型等。
S205、使用检验样本数据检验待检验模型的输出数据的准确率是否大于设定阈值,若是,则执行步骤206,若否,则返回执行步骤201。
在本实施例中,在训练得到待检验模型之后,会将检验样本数据输入待检验模型,然后根据待检验模型到的输出数据的准确率与设定阈值的比较结果,确定待检验模型是否合格。
在本实施例中,当使用检验样本数据检验待检验模型的输出数据的准确率小于等于设定阈值时,则会返回执行步骤201。由于在此种情况下导致模型训练失败的原因可能是由训练样本数据不正确引起的,因此,再次为获取推广信息点击数据和用户属性数据所选定的用户,应完全或绝大部分区别于上次所选定的用户。
S206、将常规样本数据输入梯度提升决策树,得到梯度样本数据。
可以理解的是,如果将梯度提升决策树对常规样本数据的梯度分类处理结果作为常规样本数据对基础模型进行训练,可以使得训练得到的模型的性能更加优越。但是,使用梯度提升决策树对训练样本数据进行梯度分类处理的数据运算量较大,用时较长。当步骤201中所选取的用户不合适时,如果直接使用梯度提升决策树先对常规样本数据进行处理,然后再使用处理得到的数据训练基础模型,会浪费较长的时间,且会进行很多无用的数据计算。
因此,在本实施例中,首先通过步骤201至步骤205确定所选定的基础模型是否合适(即检验样本数据检验待检验模型的输出数据的准确率是否大于设定阈值),如果步骤201中所选定的用户不合适(即检验样本数据检验待检验模型的输出数据的准确率小于等于设定阈值),则会返回步骤201,此时,由于是直接使用常规样本数据对基础模型进行训练,而没有使用梯度提升决策树对常规样本数据进行梯度分类处理,因此所涉及的计算量较小;如果步骤201中所选定的用户合适,则会执行本步骤206,使用梯度提升决策树对常规样本数据进行梯度分类处理,以提高推广信息点击预测模型的性能。
由此可见,通过本实施例中的步骤201至步骤207可以在提高推广信息点击预测模型的性能的同时,尽量降低模型训练的计算量。
进一步地,为了使梯度样本数据的梯度较为合理,本实施例中的梯度提升决策树的层数典型的可以为8层或12层。另外,在综合考虑计算量和计算时间长度的同时,8层的梯度提升决策树优于12层的梯度提升决策树。
进一步地,为了使梯度样本数据的残差尽量小,同时综合考虑计算量和计算时间的前提下,梯度提升决策树的“颗数”典型的可以是100颗,即通过梯度提升决策树对常规样本数据进行100次训练得到最终的梯度样本数据。
S207、使用所梯度样本数据训练基础模型,得到推广信息点击预测模型。
S208、获取目标用户对应的用户属性数据。
S209、将目标用户对应的用户属性数据以及待推广信息对应的信息属性数据输入推广信息点击预测模型,获取目标用户对待推广信息的预测点击概率。
在本实施例中,将点击预测结果具体化为预测点击概率,该预测点击概率用于表征用户点击待推广信息的可能性的大小,预测点击概率越大,用户点击待推广信息的可能性就越大。使用预测点击概率作为点击预测结果,可以更加直观地表征用户对待推广信息点击的可能性的大小,更可以依据不同待推广信息对点击用户的不同要求,更加准确地将待推广信息推送至匹配度更佳的用户。
S210、判断预测点击概率是否大于待推广信息对应的推送点击概率,若是,则执行步骤211,若否,则执行步骤212。
在本实施例中,待推广信息对应的推送点击概率既可以相同,也可以不同。
S211、向目标用户推送待推广信息。
S212、不向目标用户推送待推广信息。
本发明实施例提供了一种信息推送方法,该方法具体增加了推广信息点击预测模型的生成过程以及具体化推广信息点击预测模型的检验方法和训练方法,实现在在提供推广信息点击预测模型的性能的同时,尽量降低该模型的训练计算量,还具体化了是否向目标用户推送待推广信息的判断过程,提高了信息推送的有效性。
在上述各实施例的基础上,将使用训练样本数据训练基础模型,得到推广信息点击预测模型,具体化为:将包括的对应的用户对推广信息的点击次数大于设定阈值的训练样本数据划分为正样本数据;将包括的对应的用户对推广信息的点击次数小于等于设定阈值的训练样本数据划分为负样本数据;使用正样本数据和负样本数据训练基础模型,得到推广信息点击预测模型。
这样设置的好处是:进一步提高推广信息点击预测模型的性能。
在上述各实施例的基础上,将点击预测结果具体化为点击或不点击;
相应地,将根据点击预测结果确定是否向目标用户推送待推广信息,具体化为:如果点击预测结果为点击,则判断目标用户对应的用户属性数据是否与待推广信息对应的推送人群的属性相匹配;若目标用户对应的用户属性数据与待推广信息对应的推送人群的属性相匹配,则向目标用户推送待推广信息。
这样设置的好处是:简化是否向目标用户推送待推广信息的判断过程,缩短推广信息推送前的判断处理时长。
实施例三
图3是本发明实施例三提供的一种信息推送装置的结构图。如图3所示,所述装置包括:用户属性数据获取模块301、点击预测结果获取模块302以及信息推送模块303,其中:
用户属性数据获取模块301,用于获取目标用户对应的用户属性数据;
点击预测结果获取模块302,用于将目标用户对应的用户属性数据以及待推广信息对应的信息属性数据输入推广信息点击预测模型,获取目标用户对待推广信息的点击预测结果;
推广信息点击预测模型通过至少两个用户分别对应的推广信息点击数据和用户属性数据训练生成;推广信息点击数据至少包括:向对应的用户推送的推广信息、推广信息对应的属性信息以及对应的用户对推广信息的点击次数;
信息推送模块303,用于根据点击预测结果确定是否向目标用户推送待推广信息。
本发明实施例提供了一种信息推送装置,该装置首先通过用户属性数据获取模块301获取目标用户对应的用户属性数据,然后通过点击预测结果获取模块302将目标用户对应的用户属性数据以及待推广信息对应的信息属性数据输入推广信息点击预测模型,获取目标用户对待推广信息的点击预测结果,其中,推广信息点击预测模型通过至少两个用户分别对应的推广信息点击数据和用户属性数据训练生成,推广信息点击数据至少包括:向对应的用户推送的推广信息、推广信息对应的属性信息以及对应的用户对推广信息的点击次数,最后通过信息推送模块303根据点击预测结果确定是否向目标用户推送待推广信息。
该装置解决了现有技术中推广信息与用户兴趣点匹配度低,导致推广信息点击率低的技术缺陷,通过向用户推送与用户属性匹配的推广信息,提高了推广信息的点击率。
在上述各实施例的基础上,还可以包括:
数据获取模块,用于在获取目标用户对应的用户属性数据之前,获取与至少两个用户分别对应的推广信息点击数据和用户属性数据;
训练样本数据生成模块,用于将至少两个用户中的任一个用户对应的推广信息点击数据中的任一个推广信息对应的所有数据,以及该任一个用户的用户属性数据作为一份训练样本数据,其中,任一个推广信息对应的所有数据至少包括:该推广信息、该推广信息对应的属性信息以及任一个用户对该推广信息的点击次数;
模型训练模块,用于使用训练样本数据训练基础模型,得到推广信息点击预测模型。
在上述各实施例的基础上,模型训练模块可以包括:
正样本划分单元,用于将包括的对应的用户对推广信息的点击次数大于设定阈值的训练样本数据划分为正样本数据;
负样本划分单元,用于将包括的对应的用户对推广信息的点击次数小于等于设定阈值的训练样本数据划分为负样本数据;
正负样本模型训练单元,用于使用正样本数据和负样本数据训练基础模型,得到推广信息点击预测模型。
在上述各实施例的基础上,模型训练模块还可以包括::
样本划分单元,用于按照设定比例将所有训练样本数据划分为常规样本数据和检验样本数据;
常规样本模型训练单元,用于使用常规样本数据训练基础模型,得到待检验模型;
模型检验单元,用于使用检验样本数据检验待检验模型的输出数据的准确率是否大于设定阈值;
推广信息点击预测模型确定单元,用于若待检验模型的输出数据的准确率大于设定阈值,则将待检验模型作为推广信息点击预测模型。
在上述各实施例的基础上,点击预测模型确定单元可以包括:
梯度样本数据获取子单元,用于将常规样本数据输入梯度提升决策树,得到梯度样本数据;
梯度样本模型训练单元,用于使用梯度样本数据训练基础模型,得到推广信息点击预测模型。
在上述各实施例的基础上,点击预测结果可以为预测点击概率;
相应地,信息推送模块可以包括:
判断单元,用于判断预测点击概率是否大于待推广信息对应的推送点击概率;
第一待推广信息推送单元,用于若预测点击概率大于待推广信息对应的推送点击概率,则向目标用户推送待推广信息。
在上述各实施例的基础上,点击预测结果可以为点击或不点击;
相应地,信息推送模块还可以包括:
属性判断单元,用于如果点击预测结果为点击,则判断目标用户对应的用户属性数据是否与待推广信息对应的推送人群的属性相匹配;
第二待推广信息推送单元,用于若目标用户对应的用户属性数据与待推广信息对应的推送人群的属性相匹配,则向目标用户推送待推广信息。
本发明实施例所提供的信息推送装置可用于执行本发明任意实施例提供的信息推送方法,具备相应的功能模块,实现相同的有益效果。
实施例四
图4为本发明实施例四提供的一种设备的结构示意图,如图4所示,该设备包括处理器40、存储器41、输入装置42和输出装置43;设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的信息推送方法对应的模块(例如,信息推送装置中的用户属性数据获取模块301、点击预测结果获取模块302以及信息推送模块303)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的信息推送方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置43可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种信息推送方法,该方法包括:
获取目标用户对应的用户属性数据;
将目标用户对应的用户属性数据以及待推广信息对应的信息属性数据输入推广信息点击预测模型,获取目标用户对待推广信息的点击预测结果;推广信息点击预测模型通过至少两个用户分别对应的推广信息点击数据和用户属性数据训练生成;推广信息点击数据至少包括:向对应的用户推送的推广信息、推广信息对应的属性信息以及对应的用户对推广信息的点击次数;
根据点击预测结果确定是否向目标用户推送待推广信息。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的信息推送方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述信息推送装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种信息推送方法,其特征在于,包括:
获取目标用户对应的用户属性数据;
将所述目标用户对应的用户属性数据以及待推广信息对应的信息属性数据输入推广信息点击预测模型,获取所述目标用户对所述待推广信息的点击预测结果;
所述推广信息点击预测模型通过至少两个用户分别对应的推广信息点击数据和用户属性数据训练生成;所述推广信息点击数据至少包括:向对应的用户推送的推广信息、所述推广信息对应的属性信息以及所述对应的用户对所述推广信息的点击次数;
根据所述点击预测结果确定是否向所述目标用户推送所述待推广信息。
2.根据权利要求1所述的方法,其特征在于,在所述获取目标用户对应的用户属性数据之前,还包括:
获取与所述至少两个用户分别对应的所述推广信息点击数据和用户属性数据;
将所述至少两个用户中的任一个用户对应的所述推广信息点击数据中的任一个推广信息对应的所有数据,以及该任一个用户的用户属性数据作为一份训练样本数据,其中,所述任一个推广信息对应的所有数据至少包括:该推广信息、该推广信息对应的属性信息以及所述任一个用户对该推广信息的点击次数;
使用所述训练样本数据训练基础模型,得到所述推广信息点击预测模型。
3.根据权利要求2所述的方法,其特征在于,所述使用所述训练样本数据训练基础模型,得到所述推广信息点击预测模型,包括:
将包括的所述对应的用户对所述推广信息的点击次数大于设定阈值的所述训练样本数据划分为正样本数据;
将包括的所述对应的用户对所述推广信息的点击次数小于等于设定阈值的所述训练样本数据划分为负样本数据;
使用所述正样本数据和所述负样本数据训练基础模型,得到所述推广信息点击预测模型。
4.根据权利要求2所述的方法,其特征在于,所述使用所述训练样本数据训练基础模型,得到所述推广信息点击预测模型,包括:
按照设定比例将所有所述训练样本数据划分为常规样本数据和检验样本数据;
使用所述常规样本数据训练基础模型,得到待检验模型;
使用所述检验样本数据检验所述待检验模型的输出数据的准确率是否大于设定阈值;
若所述待检验模型的输出数据的准确率大于所述设定阈值,则将所述待检验模型作为所述推广信息点击预测模型。
5.根据权利要求4所述的方法,其特征在于,所述将所述待检验模型作为所述推广信息点击预测模型,包括:
将所述常规样本数据输入梯度提升决策树,得到梯度样本数据;
使用所述梯度样本数据训练所述基础模型,得到所述推广信息点击预测模型。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述点击预测结果为预测点击概率;
所述根据所述点击预测结果确定是否向所述目标用户推送所述待推广信息,包括:
判断所述预测点击概率是否大于所述待推广信息对应的推送点击概率;
若所述预测点击概率大于所述待推广信息对应的推送点击概率,则向所述目标用户推送所述待推广信息。
7.根据权利要求1-5中任一项所述的方法,其特征在于,所述点击预测结果为点击或不点击;
所述根据所述点击预测结果确定是否向所述目标用户推送所述待推广信息,包括:
如果所述点击预测结果为点击,则判断所述目标用户对应的用户属性数据是否与所述待推广信息对应的推送人群的属性相匹配;
若所述目标用户对应的用户属性数据与所述待推广信息对应的推送人群的属性相匹配,则向所述目标用户推送所述待推广信息。
8.一种信息推送装置,其特征在于,包括:
用户属性数据获取模块,用于获取目标用户对应的用户属性数据;
点击预测结果获取模块,用于将所述目标用户对应的用户属性数据以及待推广信息对应的信息属性数据输入推广信息点击预测模型,获取所述目标用户对所述待推广信息的点击预测结果;
所述推广信息点击预测模型通过至少两个用户分别对应的推广信息点击数据和用户属性数据训练生成;所述推广信息点击数据至少包括:向对应的用户推送的推广信息、所述推广信息对应的属性信息以及所述对应的用户对所述推广信息的点击次数;
信息推送模块,用于根据所述点击预测结果确定是否向所述目标用户推送所述待推广信息。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810879407.4A CN109167816B (zh) | 2018-08-03 | 2018-08-03 | 信息推送方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810879407.4A CN109167816B (zh) | 2018-08-03 | 2018-08-03 | 信息推送方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109167816A true CN109167816A (zh) | 2019-01-08 |
CN109167816B CN109167816B (zh) | 2021-11-16 |
Family
ID=64898829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810879407.4A Active CN109167816B (zh) | 2018-08-03 | 2018-08-03 | 信息推送方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109167816B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109981785A (zh) * | 2019-04-02 | 2019-07-05 | 北京字节跳动网络技术有限公司 | 用于推送信息的方法和装置 |
CN110363346A (zh) * | 2019-07-12 | 2019-10-22 | 腾讯科技(北京)有限公司 | 点击率预测方法、预测模型的训练方法、装置及设备 |
CN111861540A (zh) * | 2020-06-09 | 2020-10-30 | 上海钧正网络科技有限公司 | 信息推送方法、装置、计算机设备和存储介质 |
CN111898019A (zh) * | 2019-05-06 | 2020-11-06 | 北京达佳互联信息技术有限公司 | 信息推送方法及装置 |
CN112015978A (zh) * | 2020-07-24 | 2020-12-01 | 上海淇玥信息技术有限公司 | 一种定制信息发送方法、装置和电子设备 |
CN112053184A (zh) * | 2020-08-20 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 推广信息投放方法、装置、电子设备以及存储介质 |
WO2020143849A3 (en) * | 2020-04-13 | 2021-02-11 | Alipay (Hangzhou) Information Technology Co., Ltd. | Method and system for optimizing user grouping for advertisement |
WO2021027362A1 (zh) * | 2019-08-13 | 2021-02-18 | 平安科技(深圳)有限公司 | 基于数据分析的信息推送方法、装置、计算机设备及存储介质 |
CN113705698A (zh) * | 2021-08-31 | 2021-11-26 | 平安科技(深圳)有限公司 | 基于点击行为预测的信息推送方法及装置 |
CN113743972A (zh) * | 2020-08-17 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种生成物品信息的方法和装置 |
CN114677168A (zh) * | 2022-03-11 | 2022-06-28 | 百果园技术(新加坡)有限公司 | 一种资源推荐方法、装置、设备及介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103412882A (zh) * | 2013-07-18 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 一种识别消费意图的方法及装置 |
CN103685502A (zh) * | 2013-12-09 | 2014-03-26 | 腾讯科技(深圳)有限公司 | 一种消息推送方法、装置及系统 |
CN104537252A (zh) * | 2015-01-05 | 2015-04-22 | 深圳市腾讯计算机系统有限公司 | 用户状态单分类模型训练方法和装置 |
CN105631707A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 基于决策树的广告点击率预估方法与应用推荐方法及装置 |
CN105915438A (zh) * | 2016-04-15 | 2016-08-31 | 北京奇虎科技有限公司 | 消息推送方法、装置及系统 |
CN106295832A (zh) * | 2015-05-12 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 产品信息推送方法及装置 |
US20170169345A1 (en) * | 2015-12-10 | 2017-06-15 | AVG Netherlands B.V. | Predicting churn for (mobile) app usage |
CN107766580A (zh) * | 2017-11-20 | 2018-03-06 | 北京奇虎科技有限公司 | 消息的推送方法及装置 |
CN108109008A (zh) * | 2017-12-21 | 2018-06-01 | 暴风集团股份有限公司 | 用于预估广告的点击率的方法、装置、设备和存储介质 |
-
2018
- 2018-08-03 CN CN201810879407.4A patent/CN109167816B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103412882A (zh) * | 2013-07-18 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 一种识别消费意图的方法及装置 |
CN103685502A (zh) * | 2013-12-09 | 2014-03-26 | 腾讯科技(深圳)有限公司 | 一种消息推送方法、装置及系统 |
CN104537252A (zh) * | 2015-01-05 | 2015-04-22 | 深圳市腾讯计算机系统有限公司 | 用户状态单分类模型训练方法和装置 |
CN106295832A (zh) * | 2015-05-12 | 2017-01-04 | 阿里巴巴集团控股有限公司 | 产品信息推送方法及装置 |
US20170169345A1 (en) * | 2015-12-10 | 2017-06-15 | AVG Netherlands B.V. | Predicting churn for (mobile) app usage |
CN105631707A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 基于决策树的广告点击率预估方法与应用推荐方法及装置 |
CN105915438A (zh) * | 2016-04-15 | 2016-08-31 | 北京奇虎科技有限公司 | 消息推送方法、装置及系统 |
CN107766580A (zh) * | 2017-11-20 | 2018-03-06 | 北京奇虎科技有限公司 | 消息的推送方法及装置 |
CN108109008A (zh) * | 2017-12-21 | 2018-06-01 | 暴风集团股份有限公司 | 用于预估广告的点击率的方法、装置、设备和存储介质 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109981785A (zh) * | 2019-04-02 | 2019-07-05 | 北京字节跳动网络技术有限公司 | 用于推送信息的方法和装置 |
CN109981785B (zh) * | 2019-04-02 | 2020-08-14 | 北京字节跳动网络技术有限公司 | 用于推送信息的方法和装置 |
CN111898019B (zh) * | 2019-05-06 | 2024-04-16 | 北京达佳互联信息技术有限公司 | 信息推送方法及装置 |
CN111898019A (zh) * | 2019-05-06 | 2020-11-06 | 北京达佳互联信息技术有限公司 | 信息推送方法及装置 |
CN110363346A (zh) * | 2019-07-12 | 2019-10-22 | 腾讯科技(北京)有限公司 | 点击率预测方法、预测模型的训练方法、装置及设备 |
WO2021027362A1 (zh) * | 2019-08-13 | 2021-02-18 | 平安科技(深圳)有限公司 | 基于数据分析的信息推送方法、装置、计算机设备及存储介质 |
WO2020143849A3 (en) * | 2020-04-13 | 2021-02-11 | Alipay (Hangzhou) Information Technology Co., Ltd. | Method and system for optimizing user grouping for advertisement |
US11227309B2 (en) | 2020-04-13 | 2022-01-18 | Alipay (Hangzhou) Information Technology Co., Ltd. | Method and system for optimizing user grouping for advertisement |
CN111861540A (zh) * | 2020-06-09 | 2020-10-30 | 上海钧正网络科技有限公司 | 信息推送方法、装置、计算机设备和存储介质 |
CN112015978A (zh) * | 2020-07-24 | 2020-12-01 | 上海淇玥信息技术有限公司 | 一种定制信息发送方法、装置和电子设备 |
CN113743972A (zh) * | 2020-08-17 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种生成物品信息的方法和装置 |
CN112053184A (zh) * | 2020-08-20 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 推广信息投放方法、装置、电子设备以及存储介质 |
CN112053184B (zh) * | 2020-08-20 | 2024-01-30 | 腾讯科技(深圳)有限公司 | 推广信息投放方法、装置、电子设备以及存储介质 |
CN113705698A (zh) * | 2021-08-31 | 2021-11-26 | 平安科技(深圳)有限公司 | 基于点击行为预测的信息推送方法及装置 |
WO2023029350A1 (zh) * | 2021-08-31 | 2023-03-09 | 平安科技(深圳)有限公司 | 基于点击行为预测的信息推送方法及装置 |
CN113705698B (zh) * | 2021-08-31 | 2024-05-14 | 平安科技(深圳)有限公司 | 基于点击行为预测的信息推送方法及装置 |
CN114677168A (zh) * | 2022-03-11 | 2022-06-28 | 百果园技术(新加坡)有限公司 | 一种资源推荐方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109167816B (zh) | 2021-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109167816A (zh) | 信息推送方法、装置、设备和存储介质 | |
JP7343568B2 (ja) | 機械学習のためのハイパーパラメータの識別および適用 | |
US10489399B2 (en) | Query language identification | |
KR101999471B1 (ko) | 정보 추천 방법 및 장치 | |
US7877389B2 (en) | Segmentation of search topics in query logs | |
WO2020077824A1 (zh) | 异常问题的定位方法、装置、设备及存储介质 | |
WO2019000710A1 (zh) | 页面加载方法、装置和电子设备 | |
KR101452082B1 (ko) | 리서치 미션 식별 | |
CN108596695B (zh) | 实体推送方法及系统 | |
JP2020126587A (ja) | コミュニティ質問応答データの検証方法、装置、コンピュータ機器、及び記憶媒体 | |
US20200334697A1 (en) | Generating survey responses from unsolicited messages | |
CN103559313B (zh) | 搜索方法及装置 | |
CN105069077A (zh) | 搜索方法及装置 | |
CN110363427A (zh) | 模型质量评估方法和装置 | |
US20210173874A1 (en) | Feature and context based search result generation | |
CN110069769A (zh) | 应用标签生成方法、装置及存储设备 | |
CN110598109A (zh) | 一种信息推荐方法、装置、设备及存储介质 | |
CN106998336B (zh) | 渠道中的用户检测方法和装置 | |
CN110489032B (zh) | 用于电子书的词典查询方法及电子设备 | |
CN108121741B (zh) | 网站质量评估方法及装置 | |
CN103944935A (zh) | 一种网址信息投放方法和装置 | |
CN112347100B (zh) | 数据库索引优化方法、装置、计算机设备和存储介质 | |
CN110096609A (zh) | 房源搜索方法、装置、设备及计算机可读存储介质 | |
CN114693011A (zh) | 一种政策匹配方法、装置、设备和介质 | |
CN111930891A (zh) | 基于知识图谱的检索文本扩展方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |