CN104462593B

CN104462593B - 一种提供用户个性化资源消息推送的方法和装置

Info

Publication number: CN104462593B
Application number: CN201410848646.5A
Authority: CN
Inventors: 刘鎏; 苏晓东; 王安滨
Original assignee: Beijing Qihoo Technology Co Ltd; Qizhi Software Beijing Co Ltd
Current assignee: Beijing Qihoo Technology Co Ltd
Priority date: 2014-12-29
Filing date: 2014-12-29
Publication date: 2018-07-31
Anticipated expiration: 2034-12-29
Also published as: CN104462593A

Abstract

本发明公开了一种提供用户个性化资源消息推送的方法和装置，所述方法包括步骤：根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段；在当前日期及时间段属于所述消息推送日期及时间段的情况下，从资源集合中选择符合用户的偏好特征的一个或多个资源；以及在操作系统中提供关于一个或多个资源的消息推送。

Description

一种提供用户个性化资源消息推送的方法和装置

技术领域

本发明涉及信息处理技术领域，尤其涉及一种提供用户个性化资源消息推送的方法和装置。

背景技术

个性化推荐是根据用户的历史访问记录，计算出用户的可能偏好，从而向用户推荐个性化内容的方法。消息推送(例如，弹窗)是一种重要的推广手段，但也会对用户造成一定程度的打扰。

在现有技术中，通常由产品或运营人员进行设定，人工进行推荐，或者对于所有的用户都进行消息推送。这样会打扰到用户，也无法对于每个用户实现个性化推荐，用户体验不佳，影响了消息推送的推广效果。

发明内容

鉴于上述问题，提出了本发明，以便提供一种克服上述问题或者至少部分地解决上述问题的提供用户个性化资源消息推送的方法和装置。

依据本发明的第一方面，提供了一种提供用户个性化资源消息推送的方法，包括步骤：根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段；在当前日期及时间段属于所述消息推送日期及时间段的情况下，从资源集合中选择符合用户的偏好特征的一个或多个资源；以及在操作系统中提供关于一个或多个资源的消息推送。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的方法中，在所述在操作系统中提供关于一个或多个资源的消息推送的步骤之前，所述方法还包括步骤：根据用户、资源、以及用户对于消息推送反馈的历史特征、以及用户当前对于消息推送反馈的在线特征，利用预先定义的训练模型对所选择的一个或多个资源进行预测，以给出反映所选择的一个或多个资源中的每个资源是否适合对该用户进行消息推送的分数，并且在所述在操作系统中提供关于一个或多个资源的消息推送的步骤中，根据所述分数，在操作系统中提供关于一个或多个资源的消息推送。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的方法中，还包括步骤：在所确定的消息推送日期及时间段的个数小于第一阈值的情况下，将其他用户访问资源频率最高的多个日期及时间段补充为适于对该用户进行消息推送的消息推送日期及时间段，以使所述消息推送日期及时间段的个数等于第一阈值。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的方法中，还包括步骤：按照相同或者不同的时间周期更新所述用户的历史特征、所述资源的历史特征、以及所述用户对于消息推送反馈的历史特征。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的方法中，用户的历史特征包括以下特征中的一个或多个：用户的基础特征、用户的偏好特征、用户的行为特征，其中：用户的基础特征包括以下特征中的一个或多个：性别、年龄、职业；用户的偏好特征包括以下特征中的一个或多个：用户偏好的资源的类型、主题、画面风格；用户的行为特征包括以下特征中的一个或多个：用户访问资源运行页面的情况、用户访问资源网站的情况、用户访问资源支付页面的情况、用户访问资源论坛的情况。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的方法中，资源的历史特征包括资源的基础特征和/或统计特征，其中：资源的基础特征包括以下特征中的一个或多个：资源的类型、主题、画面风格、主要角色；资源的统计特征包括以下特征中的一个或多个：资源的平均点击率、平均启动量、平均搜索量。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的方法中，用户对于消息推送反馈的历史特征包括以下特征中的一个或多个：用户点击消息推送的情况、用户没有点击消息推送的情况、用户点击消息推送后注册的情况。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的方法中，用户当前对于消息推送反馈的在线特征是通过组合用户对于消息推送反馈的历史特征以及用户当前在线状态下对于消息推送反馈的特征而得到的。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的方法中，所述预先定义的训练模型是L1-logistic regression模型。

依据本发明的第二方面，提供了一种提供用户个性化资源消息推送的装置，包括：消息推送时机确定模块，用于根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段；偏好资源选择模块，用于在当前日期及时间段属于所述消息推送日期及时间段的情况下，从资源集合中选择符合用户的偏好特征的一个或多个资源；以及消息推送模块，用于在操作系统中提供关于一个或多个资源的消息推送。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的装置中，还包括消息推送预测模块，用于根据用户、资源、以及用户对于消息推送反馈的历史特征、以及用户当前对于消息推送反馈的在线特征，利用预先定义的训练模型对所选择的一个或多个资源进行预测，以给出反映所选择的一个或多个资源中的每个资源是否适合对该用户进行消息推送的分数，其中，所述消息推送模块根据所述分数，在操作系统中提供关于一个或多个资源的消息推送。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的装置中，在所确定的消息推送日期及时间段的个数小于第一阈值的情况下，所述消息推送时机确定模块将其他用户访问资源频率最高的多个日期及时间段补充为适于对该用户进行消息推送的消息推送日期及时间段，以使所述消息推送日期及时间段的个数等于第一阈值。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的装置中，还包括：历史特征更新模块，用于按照相同或者不同的时间周期更新所述用户的历史特征、所述资源的历史特征、以及所述用户对于消息推送反馈的历史特征。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的装置中，用户的历史特征包括以下特征中的一个或多个：用户的基础特征、用户的偏好特征、用户的行为特征，其中：用户的基础特征包括以下特征中的一个或多个：性别、年龄、职业；用户的偏好特征包括以下特征中的一个或多个：用户偏好的资源的类型、主题、画面风格；用户的行为特征包括以下特征中的一个或多个：用户访问资源运行页面的情况、用户访问资源网站的情况、用户访问资源支付页面的情况、用户访问资源论坛的情况。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的装置中，资源的历史特征包括资源的基础特征和/或统计特征，其中：资源的基础特征包括以下特征中的一个或多个：资源的类型、主题、画面风格、主要角色；资源的统计特征包括以下特征中的一个或多个：资源的平均点击率、平均启动量、平均搜索量。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的装置中，用户对于消息推送反馈的历史特征包括以下特征中的一个或多个：用户点击消息推送的情况、用户没有点击消息推送的情况、用户点击消息推送后注册的情况。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的装置中，消息推送预测模块通过组合用户对于消息推送反馈的历史特征以及用户当前在线状态下对于消息推送反馈的特征，得到用户当前对于消息推送反馈的在线特征。

可选地，在根据本发明的上述实施例的提供用户个性化资源消息推送的装置中，所述预先定义的训练模型是L1-logistic regression模型。

本发明提供了上述提供用户个性化资源消息推送的方法和装置。根据本发明的实施例，可以根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段，在当前日期及时间段属于所述消息推送日期及时间段的情况下，从资源集合中选择符合用户的偏好特征的一个或多个资源，并在操作系统中提供关于一个或多个资源的消息推送。由此，可以准确地选择适合对用户进行消息推送的日期和时间段来进行消息推送，极大地减少了打扰用户的概率，并可以针对用户的偏好特征进行个性化的资源消息推送，提高了消息推送的准确性和成功率。根据本发明的可选实施例，还可以根据用户、资源、以及用户对于消息推送反馈的历史特征、以及用户当前对于消息推送反馈的在线特征，利用预先定义的训练模型对所选择的一个或多个资源进行预测，以给出反映所选择的一个或多个资源中的每个资源是否适合对该用户进行消息推送的分数，并根据分数进行资源的消息推送，进一步提高了消息推送的准确性和成功率。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是根据本发明的实施例的提供用户个性化资源消息推送的方法的流程图；以及

图2是根据本发明的实施例的为提供用户个性化资源消息推送的装置以及用户终端的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

根据本发明的第一方面，提供了一种提供用户个性化资源消息推送的方法。根据本发明的实施例，可选地，所述资源例如可以是游戏、音乐、视频、购物信息等等，而消息推送可以例如采用弹窗等形式。在下面的描述中，将以游戏弹窗为例对于本发明的原理进行描述，但这仅是为了帮助读者更容易地理解本发明的原理，而非意在将本发明的范围限制于此，本领域技术人员应当理解，可以对于各种资源进行各种形式的消息推送，这些实现方式都在本发明的范围之内。

图1示出了根据本发明的实施例的提供用户个性化资源消息推送的方法100的流程图。

如图1所示，所述方法100始于步骤S110，在步骤S110中，根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段。

个性化的弹窗应当在合适的时机进行推送，可避免过多地打扰用户，增强用户体验，同时提高点击率。由于通过用户活跃数据较为稀疏，因此在本发明的一个实施例中，弹窗时机的计算可以例如选择在7*24天(即近6个月)的时间窗口中用户习惯玩游戏的时间段。考虑到用户的行为在不同周的同一天具有一定规律性，将时机定义为“周几的几点”，一种具体实现的算法例如为：

首先，例如将一天按照小时划分为24个时间段(0～23，其中0表示00:00～01:00以此类推)，计算在规定的时间窗口内用户在每一个周的周几的某时间段浏览游戏网站的频率，如周一的12点表示为1_12。那么预测本周内用户弹窗时机可以转化为：计算给定周几的情况下，用户在任何时间点击的概率，即求条件概率：

P(hour|day)＝P(hour,day)/P(day)＝#(hour,day)/#(day)；

其中，#(hour,day)表示用户标识(mid)在周几的某个时间段访问的频次，#(day)表示mid在周几访问的频次，这样通过贝叶斯公式即可计算mid在周几的弹窗时机。

然后，可以统计每一个时间段访问浏览游戏网站的用户数，将周天的24个时间段按照访问用户数从高到低顺序排列。

之后，对于每一个mid，将其在时间窗口内浏览游戏网站的时间段，首先按照上述步骤1计算出来的mid个性化时机从高到低排列，然后确保时间段的升序排列，比如用户A的候选时间段第一次排序是：2_20,2_19,6_21,7_23，则移除2_19这个时间段，最终用户A的时间段是2_20,6_21,7_23。

根据本发明的一种实施例，可选地，所述方法还可以包括以下步骤：在所确定的消息推送日期及时间段的个数小于第一阈值的情况下，将其他用户访问资源频率最高的多个日期及时间段补充为适于对该用户进行消息推送的消息推送日期及时间段，以使所述消息推送日期及时间段的个数等于第一阈值。

例如，假设第一阈值为6，如果mid的候选时间段少于6个，则将其他用户访问资源频率最高的多个日期及时间段依次补入(确保时间段的升序排列)直至达到6个时间段；

这样每个mid最多具有6个候选时间段，比如用户A其候选时间段分别为1_11，6_13，3_15，1_16，2_18，6_21；默认情况下，当用户A来访问时，只有当前的时间在上述六个时间段之内才满足弹窗时间；另外，为了提升召回率，可以将时间段前推30分钟，后推30分钟，以用户A的11时间段为例，即可扩展为10:30～12:30。

上述步骤S110的操作以较低的计算成本实现了较高准确率的用户行为预测，且预测效率很高。应当注意的是，上述步骤S110的具体示例仅为实现该步骤操作的其中一种方式，本领域技术人员完全可以采用其它的算法和操作来达到相同的目的，只要能够根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段即可。

在步骤S110之后，执行步骤S130，其中，在当前日期及时间段属于所述消息推送日期及时间段的情况下，从资源集合中选择符合用户的偏好特征的一个或多个资源。

以游戏为例，在步骤S130中，在当前日期及时间段属于适合对该用户进行消息推送的一个或多个消息推送日期及时间段的情况下，可以从全量游戏集合中，根据该用户的偏好特征初选游戏集合，选择符合该用户的偏好特征的一个或多个游戏。

根据本发明的实施例，用户的偏好特征可以包括以下特征中的一个或多个：用户偏好的资源的类型、主题、画面风格。在此示例中，可以是用户偏好的游戏的类型、主题、画面风格等。

随后，可以执行步骤S150，其中，在操作系统中提供关于一个或多个资源的消息推送。仍以游戏弹窗为例，可以在操作系统中向用户提供关于一个或多个游戏的弹窗，以进行推广。

可选地，在本发明的一种实施例中，在步骤S150之前，所述方法100还可以包括以下步骤：根据用户、资源、以及用户对于消息推送反馈的历史特征、以及用户当前对于消息推送反馈的在线特征，利用预先定义的训练模型对所选择的一个或多个资源进行预测，以给出反映所选择的一个或多个资源中的每个资源是否适合对该用户进行消息推送的分数。在执行上述步骤的情况下，在步骤S150中，可以根据所述分数，在操作系统中提供关于一个或多个资源的消息推送。

根据本发明的实施例，所述用户的历史特征包括以下特征中的一个或多个：用户的基础特征、用户的偏好特征、用户的行为特征，其中：用户的基础特征包括以下特征中的一个或多个：性别、年龄、职业；用户的偏好特征包括以下特征中的一个或多个：用户偏好的资源的类型、主题、画面风格；用户的行为特征包括以下特征中的一个或多个：用户访问资源运行页面的情况、用户访问资源网站的情况、用户访问资源支付页面的情况、用户访问资源论坛的情况。

根据本发明的实施例，资源的历史特征包括资源的基础特征和/或统计特征，其中：资源的基础特征包括以下特征中的一个或多个：资源的类型、主题、画面风格、主要角色；资源的统计特征包括以下特征中的一个或多个：资源的平均点击率、平均启动量、平均搜索量。

根据本发明的实施例，用户对于消息推送反馈的历史特征包括以下特征中的一个或多个：用户点击消息推送的情况、用户没有点击消息推送的情况、用户点击消息推送后注册的情况。

根据本发明的实施例，特征值(0或1)建立在正例和反例的基础上。训练数据包括正例(特征值为1)和反例(特征值为0)两类数据，此处以一个用户访问的会话为窗口来划分，仍以游戏弹窗为例，比如2014-05-01，用户A点击了游戏弹窗G1，用户B点击了游戏弹窗G2，用户C没有点击游戏弹窗G1，用户A没有点击游戏弹窗G2，则将这四个行为数据划分为两个正例和两个反例：

下表中仍以游戏弹窗为例，示出了用户的历史特征、资源的历史特征、用户对于消息推送反馈的历史特征的一些示例，以帮助读者更好地理解本发明的原理，但本领域技术人员应当理解，本发明的范围并不局限于此，本发明的原理适用于各种历史特征。

根据本发明的实施例，可选地，下面示例性地给出了上述各种特征的获取方法：用户的基础特征，例如可以基于用户的上网行为和注册信息获得；用户的偏好特征，例如可以基于用户的上网行为和注册信息获得；用户的行为特征，例如可以基于用户的搜索和浏览数据获得，而在通过标注相关的特征数据之后，可以获取用户的精确的行为数据；资源的基础特征，可以通过爬虫爬取和人工标注给该资源实体打上标签，从而获得；资源的统计特征，可以通过每日的搜索日志和云查杀日志，计算该游戏的启动量和搜索量来获得；用户对于消息推送反馈的历史特征可以通过资源消息推送的反馈日志，获悉用户对资源推送点击与否以及点击之后的行为数据，从而获得。

可选地，在本发明的一种实施例中，方法100还可以包括下述步骤：按照相同或者不同的时间周期更新所述用户的历史特征、所述资源的历史特征、以及所述用户对于消息推送反馈的历史特征。

根据本发明的实施例，所述用户的历史特征、所述资源的历史特征、以及所述用户对于消息推送反馈的历史特征可以统称为离线特征。离线特征集例如可以每隔一个月构建一次，特征的属性不同其构建特征的时间窗口也不同，以2014-05-01为基准时间，构建特征的时间窗口例如可以分别为：

-用户的基础特征，例如可以每三个月更新一次；

-用户的偏好特征，窗口时间例如可以为30天，根据用户在2014-04-01～2014-04-30之间的浏览数据，计算用户的偏好特征；

-用户的行为特征，窗口时间例如可以为15天，计算用户在2014-04-15～2014-04-30之间访问过的游戏官网、贴吧、启动页等特征数据；

-资源的基础特征，例如可以在收集完毕后不更新，或者定期更新；

-资源的统计特征，窗口时间例如可以为7天，统计资源在2014-04-24～2014-04-30之间的平均点击率，平均启动量，平均检索量；

-用户对于消息推送反馈的历史特征，窗口时间例如可以为15天，记录用户此窗口时间之内对游戏弹窗的操作行为，比如某用户A在2014-04-28点击了游戏G1的弹窗，但没有注册该游戏则记录；在2014-04-29没有点击游戏G2的弹窗；在2014-04-30日点击了游戏G2弹窗，同时注册该游戏；此次反馈特征为：

上述皆为线性特征，为了挖掘特征的非线性关系，可以将特征互相组合，以构建特征之间的交叉关系，故将反馈特征两两组合，形成新的组合特征，

上述反馈新增组合特征：

用户对于消息推送反馈的历史特征	特征值
		3天前点击游戏G1&&2天前没点击游戏G2	1
3天前点击游戏G1&&1天前点击游戏G3	1
		3天前点击游戏G1&&1天前点击游戏G3并注册	1
2天前没点击游戏G2&&1天前点击游戏G3	1
		2天前没点击游戏G2&&1天前点击游戏G3并注册	1

根据本发明的实施例，用户当前对于消息推送反馈的在线特征是通过组合用户对于消息推送反馈的历史特征以及用户当前在线状态下对于消息推送反馈的特征而得到的。在线特征是指需要用户在线才能获取的特征属性；在训练数据构建中，在线特征集可以通过离线数据生成。以用户A的行为为例，设定2014-05-01为预测基准点，在当日的弹窗中，用户A点击了游戏弹窗G1，没有点击游戏弹窗G2，而其历史行为是：3天前点击游戏G1，2天前没有点击游戏G2，1天前点击游戏G3，则通过两两组合，新增在线特征如下：

用户当前对于消息推送反馈的在线特征	特征值
		3天前点击游戏G1&&在线点击游戏G1	1
3天前点击游戏G1&&在线不点击游戏G2	1
		2天前没有点击游戏G2&&在线点击游戏G1	1
2天前没有点击游戏G2&&在线不点击游戏G2	1
		1天前点击游戏G3&&在线点击游戏G1	1
1天前点击游戏G3&&在线不点击游戏G2	1

可选地，在本发明的一种实施例中，还可以包括特征词扩展的操作。特征词扩展主要针对用户历史访问或搜索行为，对搜索词、访问的网页标题等进行语义上的扩展后作为用户特征的一部分，其例如可以包括下述步骤：

1.训练词向量。将新闻语料分词后，可以例如采用多层神经网络对每个词进行表示学习(representation learning)，即学习每个词的另外一种表征，该表征以固定维数的实向量表示。该词向量能捕捉更深层次词语间的语义关系。可以例如使用开源项目word2vec进行训练，模型采用continuous bag-of-words。输入语料包括新闻语料和用户搜索长词，处理包括：将新闻语料分词并整理(删除标点、语气词等)，每段作为训练输入的一行；单个搜索长词分词后作为训练输入数据的一行。

2.组合。用户的搜索词或网页标题中在分词后可能包含多个短词，将每个短词语对应的词向量相加后乘以归一化系数得到整个搜索词或网页标题的词向量。

3.查找最相似的词。基于步骤1计算的词向量表征，查找与搜索词分词后的短词最相似的其它2个词；然后查找与组合后的搜索词语向量最相似的其它2个词。

4.添加特征。将步骤3的词语作为扩展特征加入用户行为特征中，设置其权值为w/2，w为来源词的权值。

根据上述各步骤的操作(可以包括或者不包括上述各可选步骤)，就可以得到用户的历史特征、资源的历史特征、用户对于消息推送反馈的历史特征、以及用户当前对于消息推送反馈的在线特征。之后，可以根据上述特征，利用预先定义的训练模型对一个或多个资源进行预测，以给出反映一个或多个资源中的每个资源是否适合对该用户进行消息推送的分数。

在本发明的一种实施例中，所述预先定义的训练模型是L1-logistic regression模型。输入特征使用上述离线特征和在线特征，采用L1-logistic regression模型进行特征的筛选。

利用上述预先定义的训练模型对一个或多个资源(以游戏为例)进行预测，可以给出反映所述一个或多个游戏中的每个游戏是否适合对用户进行消息推送的分数。如果所得到的游戏G1的分数例如为0.9，游戏G2的分数例如为0.85，游戏G3的分数例如为0.7，等等。在此情况下，在方法100的步骤S130中，可以根据上述分数，在操作系统中提供关于一个或多个资源的消息推送。在一种实施例中，可以仅提供关于分数最高的一个资源(在上述示例中为游戏G1)的消息推送，可以提供关于分数最高的多个资源的消息推送，还可以设定阈值，对于分数高于该阈值的资源都进行消息推送。

根据本发明的实施例，利用上述模型预测，每个用户标识(mid)点击消息推送的可能性以[0-1]的概率值表示，那么对于某些预测值比较低的mid则没必要进行消息推送。为了自动控制每天影响的mid数量，同时避免无效的消息推送干扰用户，使用序自动控制弹出用户的算法达到以上目的：

1.预测概率值离散化，将其划分为1000个区间段：即每个预测值精确至0.001，那么0-1之间的每个概率值便为一个区间段；

2.统计在以上各区间段中的mid数量，比如0.500:21000表示预测值为0.5的mid数为21000；

3.根据步骤2计算的每个区间段中的mid数量，计算预测值的累计分布函数表。rcdf(p)＝n表示预测值大于等于p的mid数有n个；

4.假设需要限制影响的mid数为m，需要计算阈值p，预测值在该阈值p之上的用户满足条件，对其产生弹窗影响。有了预测值的累计函数分布表则可以方便的计算p值，只需在分布表中查找rcdf(p)大于等于m的最大值，该值即为阈值p，即argmax(rcdf(p)>＝m)；

例如，在下表的累计分布函数中，要得到23000个mid，按照以上查找规则，概率p应取0.874。

p	n
		…	…
0.876	20000
		0.875	22101
0.874	23201
		0.873	26001
…	…

5.根据上述步骤4计算的和每个mid预测值s决定该mid是否进行消息推送。如果s>＝q，则进行消息推送，如果s<q，则不进行消息推送。

根据本发明的第二方面，与上述方法100相对应，本发明还提供了一种提供用户个性化资源消息推送的装置200。图2是根据本发明的实施例的提供用户个性化资源消息推送的装置200以及用户终端300的结构示意图。

如图2所示，所述装置200主要包括消息推送时机确定模块210、偏好资源选择模块220、消息推送模块230。根据本发明的实施例，消息推送时机确定模块210用于根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段；偏好资源选择模块220用于在当前日期及时间段属于所述消息推送日期及时间段的情况下，从资源集合中选择符合用户的偏好特征的一个或多个资源；消息推送模块230用于在操作系统中提供关于一个或多个资源的消息推送。

根据本发明的实施例，可选地，所述资源例如可以是游戏、音乐、视频、购物信息等等，而消息推送可以例如采用弹窗等形式。在下面的描述中，将以游戏弹窗为例对于本发明的原理进行描述，但这仅是为了帮助读者更容易地理解本发明的原理，而非意在将本发明的范围限制于此，本领域技术人员应当理解，可以对于各种资源进行各种形式的消息推送，这些实现方式都在本发明的范围之内。

首先，所述消息推送时机确定模块210根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段。

P(hour|day)＝P(hour,day)/P(day)＝#(hour,day)/#(day)；

之后，对于每一个mid，将其在时间窗口内浏览游戏网站的时间段，首先按照上述操作计算出来的mid个性化时机从高到低排列，然后确保时间段的升序排列，比如用户A的候选时间段第一次排序是：2_20,2_19,6_21,7_23，则移除2_19这个时间段，最终用户A的时间段是2_20,6_21,7_23。

根据本发明的一种实施例，可选地，在所确定的消息推送日期及时间段的个数小于第一阈值的情况下，消息推送时机确定模块210将其他用户访问资源频率最高的多个日期及时间段补充为适于对该用户进行消息推送的消息推送日期及时间段，以使所述消息推送日期及时间段的个数等于第一阈值。

这样每个mid最多具有6个候选时间段，比如用户A其候选时间段分别为1_11,6_13,3_15,1_16,2_18,6_21；默认情况下，当用户A来访问时，只有当前的时间在上述六个时间段之内才满足弹窗时间；另外，为了提升召回率，可以将时间段前推30分钟，后推30分钟，以用户A的11时间段为例，即可扩展为10:30～12:30。

上述消息推送时机确定模块210的操作以较低的计算成本实现了较高准确率的用户行为预测，且预测效率很高。应当注意的是，上述具体示例仅为实现消息推送时机确定模块210操作的其中一种方式，本领域技术人员完全可以采用其它的算法和操作来达到相同的目的，只要能够根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段即可。

随后，在当前日期及时间段属于所述消息推送日期及时间段的情况下，偏好资源选择模块220从资源集合中选择符合用户的偏好特征的一个或多个资源。

以游戏为例，在当前日期及时间段属于适合对该用户进行消息推送的一个或多个消息推送日期及时间段的情况下，上述偏好资源选择模块220可以从全量游戏集合中，根据该用户的偏好特征初选游戏集合，选择符合该用户的偏好特征的一个或多个游戏。

随后，所述消息推送模块230可以在操作系统中提供关于一个或多个资源的消息推送。仍以游戏弹窗为例，所述消息推送模块230可以在操作系统中向用户提供关于一个或多个游戏的弹窗，以进行推广。

可选地，在本发明的一种实施例中，所述装置200还可以包括可选模块--消息推送预测模块240(未在图2中示出)，在所述消息推送模块230在操作系统中提供关于一个或多个资源的消息推送之前，所述消息推送预测模块240可以根据用户、资源、以及用户对于消息推送反馈的历史特征、以及用户当前对于消息推送反馈的在线特征，利用预先定义的训练模型对所选择的一个或多个资源进行预测，以给出反映所选择的一个或多个资源中的每个资源是否适合对该用户进行消息推送的分数。随后，所述消息推送模块230可以根据所述分数，在操作系统中提供关于一个或多个资源的消息推送。

根据本发明的实施例，可选地，下面示例性地给出了所述消息推送预测模块240获取上述各种特征的方式：用户的基础特征，所述消息推送预测模块240例如可以基于用户的上网行为和注册信息获得；用户的偏好特征，所述消息推送预测模块240例如可以基于用户的上网行为和注册信息获得；用户的行为特征，所述消息推送预测模块240例如可以基于用户的搜索和浏览数据获得，而在通过标注相关的特征数据之后，可以获取用户的精确的行为数据；资源的基础特征，所述消息推送预测模块240可以通过爬虫爬取和人工标注给该资源实体打上标签，从而获得；资源的统计特征，所述消息推送预测模块240可以通过每日的搜索日志和云查杀日志，计算该游戏的启动量和搜索量来获得；用户对于消息推送反馈的历史特征，所述消息推送预测模块240可以通过资源消息推送的反馈日志，获悉用户对资源推送点击与否以及点击之后的行为数据，从而获得。

可选地，在本发明的一种实施例中，装置200还可以包括可选模块--历史特征更新模块250(未在图2中示出)，其用于按照相同或者不同的时间周期更新所述用户的历史特征、所述资源的历史特征、以及所述用户对于消息推送反馈的历史特征。

-用户的基础特征，例如可以每三个月更新一次；

上述皆为线性特征，为了挖掘特征的非线性关系，可以将特征互相组合，以构建特征之间的交叉关系，故将反馈特征两两组合，形成新的组合特征，上述反馈新增组合特征：

根据本发明的实施例，所述消息推送预测模块240通过组合用户对于消息推送反馈的历史特征以及用户当前在线状态下对于消息推送反馈的特征，来获得用户当前对于消息推送反馈的在线特征。在线特征是指需要用户在线才能获取的特征属性；在训练数据构建中，在线特征集可以通过离线数据生成。以用户A的行为为例，设定2014-05-01为预测基准点，在当日的弹窗中，用户A点击了游戏弹窗G1，没有点击游戏弹窗G2，而其历史行为是：3天前点击游戏G1，2天前没有点击游戏G2，1天前点击游戏G3，则通过两两组合，新增在线特征如下：

可选地，在本发明的一种实施例中，还可以包括特征词扩展的操作。特征词扩展主要针对用户历史访问或搜索行为，对搜索词、访问的网页标题等进行语义上的扩展后作为用户特征的一部分，其例如可以包括下述操作：

-训练词向量。将新闻语料分词后，可以例如采用多层神经网络对每个词进行表示学习(representation learning)，即学习每个词的另外一种表征，该表征以固定维数的实向量表示。该词向量能捕捉更深层次词语间的语义关系。可以例如使用开源项目word2vec进行训练，模型采用continuous bag-of-words。输入语料包括新闻语料和用户搜索长词，处理包括：将新闻语料分词并整理(删除标点、语气词等)，每段作为训练输入的一行；单个搜索长词分词后作为训练输入数据的一行。

-组合。用户的搜索词或网页标题中在分词后可能包含多个短词，将每个短词语对应的词向量相加后乘以归一化系数得到整个搜索词或网页标题的词向量。

-查找最相似的词。基于上述操作计算的词向量表征，查找与搜索词分词后的短词最相似的其它2个词；然后查找与组合后的搜索词语向量最相似的其它2个词。

-添加特征。将上述操作的词语作为扩展特征加入用户行为特征中，设置其权值为w/2，w为来源词的权值。

根据所述消息推送预测模块240的上述操作，就可以得到用户的历史特征、资源的历史特征、用户对于消息推送反馈的历史特征、以及用户当前对于消息推送反馈的在线特征。之后，所述消息推送预测模块240可以根据上述特征，利用预先定义的训练模型对一个或多个资源进行预测，以给出反映一个或多个资源中的每个资源是否适合对该用户进行消息推送的分数。

所述消息推送预测模块240利用上述预先定义的训练模型对一个或多个资源(以游戏为例)进行预测，可以给出反映所述一个或多个游戏中的每个游戏是否适合对用户进行消息推送的分数。如果所得到的游戏G1的分数例如为0.9，游戏G2的分数例如为0.85，游戏G3的分数例如为0.7，等等。在此情况下，所述消息推送模块230可以根据上述分数，在操作系统中提供关于一个或多个资源的消息推送。在一种实施例中，所述消息推送模块230可以仅提供关于分数最高的一个资源(在上述示例中为游戏G1)的消息推送，可以提供关于分数最高的多个资源的消息推送，还可以设定阈值，对于分数高于该阈值的资源都进行消息推送。

-预测概率值离散化，将其划分为1000个区间段：即每个预测值精确至0.001，那么0-1之间的每个概率值便为一个区间段；

-统计在以上各区间段中的mid数量，比如0.500:21000表示预测值为0.5的mid数为21000；

-根据上述操作计算的每个区间段中的mid数量，计算预测值的累计分布函数表。rcdf(p)＝n表示预测值大于等于p的mid数有n个；

-假设需要限制影响的mid数为m，需要计算阈值p，预测值在该阈值p之上的用户满足条件，对其产生弹窗影响。有了预测值的累计函数分布表则可以方便的计算p值，只需在分布表中查找rcdf(p)大于等于m的最大值，该值即为阈值p，即argmax(rcdf(p)>＝m)；

p	n
		…	…
0.876	20000
		0.875	22101
0.874	23201
		0.873	26001
…	…

-根据上述操作计算的和每个mid预测值s决定该mid是否进行消息推送。如果s>＝q，则进行消息推送，如果s<q，则不进行消息推送。

在此提供的方法和装置不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类装置所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的装置中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个装置中。可以把实施例中的若干模块组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者模块中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个装置实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的装置中的一些或者全部模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种提供用户个性化资源消息推送的方法，包括步骤：

根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段；

在当前日期及时间段属于所述消息推送日期及时间段的情况下，从资源集合中选择符合用户的偏好特征的一个或多个资源，所述用户的偏好特征包括以下特征中的一个或多个：用户偏好的资源的类型、主题、画面风格；以及

在操作系统中提供关于一个或多个资源的消息推送。

2.如权利要求1所述的方法，其中在所述在操作系统中提供关于一个或多个资源的消息推送的步骤之前，所述方法还包括步骤：

根据用户、资源、以及用户对于消息推送反馈的历史特征、以及用户当前对于消息推送反馈的在线特征，利用预先定义的训练模型对所选择的一个或多个资源进行预测，以给出反映所选择的一个或多个资源中的每个资源是否适合对该用户进行消息推送的分数，并且

在所述在操作系统中提供关于一个或多个资源的消息推送的步骤中，根据所述分数，在操作系统中提供关于一个或多个资源的消息推送。

3.根据权利要求1所述的方法，还包括步骤：

在所确定的消息推送日期及时间段的个数小于第一阈值的情况下，将其他用户访问资源频率最高的多个日期及时间段补充为适于对该用户进行消息推送的消息推送日期及时间段，以使所述消息推送日期及时间段的个数等于第一阈值。

4.根据权利要求2所述的方法，还包括步骤：按照相同或者不同的时间周期更新所述用户的历史特征、所述资源的历史特征、以及所述用户对于消息推送反馈的历史特征。

5.根据权利要求2所述的方法，其中用户的历史特征包括以下特征中的一个或多个：用户的基础特征、用户的偏好特征、用户的行为特征，其中：

用户的基础特征包括以下特征中的一个或多个：性别、年龄、职业；

用户的行为特征包括以下特征中的一个或多个：用户访问资源运行页面的情况、用户访问资源网站的情况、用户访问资源支付页面的情况、用户访问资源论坛的情况。

6.根据权利要求2所述的方法，其中资源的历史特征包括资源的基础特征和/或统计特征，其中：

资源的基础特征包括以下特征中的一个或多个：资源的类型、主题、画面风格、主要角色；

资源的统计特征包括以下特征中的一个或多个：资源的平均点击率、平均启动量、平均搜索量。

7.根据权利要求2所述的方法，其中用户对于消息推送反馈的历史特征包括以下特征中的一个或多个：用户点击消息推送的情况、用户没有点击消息推送的情况、用户点击消息推送后注册的情况。

8.根据权利要求2所述的方法，其中用户当前对于消息推送反馈的在线特征是通过组合用户对于消息推送反馈的历史特征以及用户当前在线状态下对于消息推送反馈的特征而得到的。

9.根据权利要求2-8中的任一项所述的方法，其中所述预先定义的训练模型是L1-logistic regression模型。

10.一种提供用户个性化资源消息推送的装置，包括：

消息推送时机确定模块，用于根据用户在各日期及各时间段访问资源的频率，确定适合对该用户进行消息推送的一个或多个消息推送日期及时间段；

偏好资源选择模块，用于在当前日期及时间段属于所述消息推送日期及时间段的情况下，从资源集合中选择符合用户的偏好特征的一个或多个资源，用户的偏好特征包括以下特征中的一个或多个：用户偏好的资源的类型、主题、画面风格；以及

消息推送模块，用于在操作系统中提供关于一个或多个资源的消息推送。

11.如权利要求10所述的装置，还包括消息推送预测模块，用于根据用户、资源、以及用户对于消息推送反馈的历史特征、以及用户当前对于消息推送反馈的在线特征，利用预先定义的训练模型对所选择的一个或多个资源进行预测，以给出反映所选择的一个或多个资源中的每个资源是否适合对该用户进行消息推送的分数，

其中，所述消息推送模块根据所述分数，在操作系统中提供关于一个或多个资源的消息推送。

12.根据权利要求10所述的装置，其中在所确定的消息推送日期及时间段的个数小于第一阈值的情况下，所述消息推送时机确定模块将其他用户访问资源频率最高的多个日期及时间段补充为适于对该用户进行消息推送的消息推送日期及时间段，以使所述消息推送日期及时间段的个数等于第一阈值。

13.根据权利要求11所述的装置，还包括：

历史特征更新模块，用于按照相同或者不同的时间周期更新所述用户的历史特征、所述资源的历史特征、以及所述用户对于消息推送反馈的历史特征。

14.根据权利要求11所述的装置，其中用户的历史特征包括以下特征中的一个或多个：用户的基础特征、用户的偏好特征、用户的行为特征，其中：

15.根据权利要求11所述的装置，其中资源的历史特征包括资源的基础特征和/或统计特征，其中：

16.根据权利要求11所述的装置，其中用户对于消息推送反馈的历史特征包括以下特征中的一个或多个：用户点击消息推送的情况、用户没有点击消息推送的情况、用户点击消息推送后注册的情况。

17.根据权利要求11所述的装置，其中消息推送预测模块通过组合用户对于消息推送反馈的历史特征以及用户当前在线状态下对于消息推送反馈的特征，得到用户当前对于消息推送反馈的在线特征。

18.根据权利要求11-17中的任一项所述的装置，其中所述预先定义的训练模型是L1-logistic regression模型。