CN112256975A - 信息推送方法、装置、计算机设备及存储介质 - Google Patents
信息推送方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112256975A CN112256975A CN202011268242.0A CN202011268242A CN112256975A CN 112256975 A CN112256975 A CN 112256975A CN 202011268242 A CN202011268242 A CN 202011268242A CN 112256975 A CN112256975 A CN 112256975A
- Authority
- CN
- China
- Prior art keywords
- target
- user
- information
- service
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0239—Online discounts or incentives
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种信息推送方法、装置、计算机设备及存储介质,属于互联网技术领域。方法包括:获取兑换过目标服务的第一用户的特征信息;将该特征信息映射至目标向量空间,得到特征向量;将所述特征向量分别输入至少两个分类模型,由所述至少两个分类模型对所述第一用户进行分类,输出至少两个分类结果;响应于至少一个分类结果指示该第一用户为目标用户的概率大于目标概率,向该第一用户推送目标信息,该目标信息用于指示兑换该目标服务的优惠内容。上述方案,通过向确定为目标用户的第一用户推送包括优惠内容的目标信息,使得该目标信息能够促使部分第一用户继续兑换目标服务,提高兑换目标服务的用户的总人数,避免用户流失。
Description
技术领域
本申请涉及互联网技术领域,特别涉及一种信息推送方法、装置、计算机设备及存储介质。
背景技术
随着互联网技术的发展,用户能够通过支付一定的费用来享受互联网服务提供商所提供的各种服务,如音乐播放服务、视频播放服务、游戏加速服务以及云存储服务等。如何避免用户的流失,提高购买服务的用户的总人数,是互联网服务提供商需要解决的问题。
目前,为了保持用户粘性,增加购买服务的用户的数量,通常采用的方式是根据活动运营人员的业务经验以及活动内容,向用户发送优惠信息,如满减信息、满赠信息以及打折信息等,从而吸引服务到期的用户继续购买服务。
上述方案存在的问题是,由于活动运营人员的水平参差不齐、活动内容又不完全相同,导致上述方案不具有可持续性,且随机性较大,无法精确的预期方案实施后的效果,从而存在用户流失的风险。
发明内容
本申请实施例提供了一种信息推送方法、装置、计算机设备及存储介质,通过向目标用户推送包括优惠内容的目标信息,使得该目标信息能够促使部分目标用户继续购买目标服务,提高购买目标服务的用户的总人数,避免用户流失。所述技术方案如下:
一方面,提供了一种信息推送方法,所述方法包括:
获取兑换过目标服务的第一用户的特征信息,所述特征信息用于指示所述第一用户对所述目标服务的使用特征和兑换特征;
将所述特征信息映射至目标向量空间,得到特征向量;
将所述特征向量分别输入至少两个分类模型,由所述至少两个分类模型对所述第一用户进行分类,输出至少两个分类结果,所述分类结果用于指示所述第一用户为目标用户的概率,所述目标用户为不会再次兑换所述目标服务的用户;
响应于至少一个分类结果指示所述第一用户为目标用户的概率大于目标概率,向所述第一用户推送目标信息,所述目标信息用于指示兑换所述目标服务的优惠内容。
另一方面,提供了一种信息推送装置,所述装置包括:
信息获取模块,用于获取兑换过目标服务的第一用户的特征信息,所述特征信息用于指示所述第一用户对所述目标服务的使用特征和兑换特征;
信息处理模块,用于将所述特征信息映射至目标向量空间,得到特征向量;
分类模块,用于将所述特征向量分别输入至少两个分类模型,由所述至少两个分类模型对所述第一用户进行分类,输出至少两个分类结果,所述分类结果用于指示所述第一用户为目标用户的概率,所述目标用户为不会再次兑换所述目标服务的用户;
信息推送模块,用于响应于至少一个分类结果指示所述第一用户为目标用户的概率大于目标概率,向所述第一用户推送目标信息,所述目标信息用于指示兑换所述目标服务的优惠内容。
在一种可选的实现方式中,所述至少两个分类模型的训练步骤包括:
获取正样本和负样本,所述正样本为历史兑换过且当前已兑换所述目标服务的用户,所述负样本为历史兑换过且当前未兑换所述目标服务的用户;
获取所述正样本和所述负样本的样本特征信息,所述样本特征信息用于指示所述正样本和所述负样本对所述目标服务的使用特征和兑换特征;
基于所述样本特征信息,训练得到所述至少两个分类模型。
在一种可选的实现方式中,所述获取正样本和负样本,包括:
获取目标日期,所述目标日期与当前日期间隔第三时长;
根据所述目标日期,获取历史已兑换不小于第四时长的所述目标服务且所述目标服务在所述目标日期到期的多个用户;
从所述多个用户中选择满足第一条件的用户作为所述正样本,所述第一条件为在所述目标日期对应的目标时间范围内兑换了不小第五时长的所述目标服务;
从所述多个用户中选择满足第二条件的用户作为所述负样本,所述第二条件为在所述目标日期对应的目标时间范围内未兑换所述目标服务。
在一种可选的实现方式中,所述基于所述样本特征信息,训练得到所述至少两个分类模型,包括:
将任一正样本或者负样本的所述样本特征信息,输入本次迭代过程对应的逻辑回归模型,确定所述逻辑回归模型的损失函数;
对所述损失函数进行正则化处理,根据正则化处理后的所述损失函数,对所述逻辑回归模型进行参数调整;
响应于所述逻辑回归模型满足训练结束条件,将所述逻辑回归模型作为所述至少两个分类模型中的一个。
在一种可选的实现方式中,所述将任一正样本或者负样本的所述样本特征信息,输入本次迭代过程对应的逻辑回归模型,包括:
对所述任一正样本或者负样本的所述样本特征信息进行归一化处理,得到归一化特征,将所述归一化特征输入所述本次迭代过程对应的逻辑回归模型。
在一种可选的实现方式中,所述将任一正样本或者负样本的所述样本特征信息,输入本次迭代过程对应的逻辑回归模型,包括:
将任一正样本或者负样本的所述样本特征信息映射为独热编码向量,将所述独热编码向量输入所述本次迭代过程对应的逻辑回归模型。
在一种可选的实现方式中,所述目标服务为加速服务;
所述信息获取模块,用于获取所述兑换过目标服务的第一用户的加速时间特征、加速延迟丢包特征、登录特征、加速内容特征、用于指示使用其他加速服务的服务切换行为特征、用于指示最近兑换所述加速服务的第一兑换行为特征以及用于指示历史兑换所述加速服务的第二兑换行为特征中的至少两种;对获取到的至少两种特征进行数据预处理,得到所述第一用户的特征信息。
在一种可选的实现方式中,信息推送模块,用于根据所述至少两个分类结果确定至少两个概率;响应于所述至少两个概率中任一概率大于所述目标概率,向所述第一用户推送所述目标信息;或者,响应于所述至少两个概率均大于所述目标概率,向所述第一用户推送所述目标信息;或者,响应于所述至少两个概率中超过目标比例的概率大于所述目标概率,向所述第一用户推送所述目标信息。
在一种可选的实现方式中,所述装置还包括:
用户获取模块,用于获取满足目标条件的用户作为所述第一用户,所述目标条件为第一时长后所述目标服务到期,且已购买所述目标服务的时长不小于第二时长。
在一种可选的实现方式中,所述信息处理模块,用于将所述特征信息映射为独热编码向量,将所述独热编码向量作为所述特征向量。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器用于存储至少一段程序代码,所述至少一段程序代码由所述处理器加载并执行以实现本申请实施例中的信息推送方法中所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一段程序代码,所述至少一段程序代码由处理器加载并执行以实现如本申请实施例中信息推送方法中所执行的操作。
另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得该计算机设备执行上述各方面或者各方面的各种可选实现方式中提供的信息推送方法。
本申请实施例提供的技术方案带来的有益效果是:
本申请实施例提供了一种信息推送方法,通过获取兑换过目标服务的第一用户对该目标服务使用特征和兑换特征,从而能够得到有利于对第一用户进行分类的特征,然后基于至少两个分类模型,根据上述特征对应的特征向量对该第一用户进行分类,能够确定该第一用户是否为不会继续兑换该目标服务的目标用户的概率,基于上述概率与目标概率之间的关系向第一用户推送包括优惠内容的目标信息,使得该目标信息能够促使第一用户继续兑换目标服务,提高兑换目标服务的用户的总人数,避免用户流失。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例提供的信息推送方法的实施环境示意;
图2是根据本申请实施例提供的一种信息推送方法的流程图;
图3是根据本申请实施例提供的一种信息推送方法的流程图;
图4是根据本申请实施例提供的一种信息推送系统的架构示意图;
图5是根据本申请实施例提供的另一种信息推送方法的流程图;
图6是根据本申请实施例提供的一种信息推送装置的框图;
图7是根据本申请实施例提供的一种终端的结构框图;
图8是根据本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
以下介绍本申请实施例涉及到的名词。
行采样和列采样是随机森林,XGBoost等集成模型中常用的方式。它的主要作用是加快训练速度和防止过拟合。
网格搜索法是指定参数值的一种穷举搜索方法,通过将估计函数的参数通过交叉验证的方法进行优化来得到最优的学习算法。即,将各个参数可能的取值进行排列组合,列出所有可能的组合结果生成“网格”。然后将各组合用于SVM(Support Vector Machine,支持向量机)训练,并使用交叉验证对表现进行评估。在拟合函数尝试了所有的参数组合后,返回一个合适的分类器,自动调整至最佳参数组合,可以通过clf.best_params_获得参数值。
投票机制,分为软投票和硬投票两种,其原理采用少数服从多数的思想。硬投票:对多个模型直接进行投票,最终投票数最多的类为最终被预测的类。软投票:和硬投票原理相同,增加了设置权重的功能,可以为不同模型设置不同权重,进而区别模型不同的重要度。
hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。Hive的优点是学习成本低,可以通过类似SQL语句实现快速MapReduce统计,使MapReduce变得更加简单,而不必开发专门的MapReduce应用程序。hive十分适合对数据仓库进行统计分析。
以下,介绍本申请实施例提供的信息推送方法的实施环境。图1是根据本申请实施例提供的信息推送方法的实施环境示意图。参见图1,该实施环境包括终端101和服务器102。
终端101和服务器102能够通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
可选的,终端101是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端101安装和运行有应用程序。该应用程序是音乐播放类应用程序、视频播放类应用程序、游戏加速类应用程序以及云存储类应用程序中的任意一种。示意性的,终端101是用户使用的终端,用户使用终端101中安装和运行的上述应用程序,使用互联网服务器提供商提供的音乐播放服务、视频播放服务、游戏加速服务以及云存储服务中的任意一种。
可选的,服务器102是独立的物理服务器,也能够是多个物理服务器构成的服务器集群或者分布式系统,还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器102用于为应用程序提供后台服务。可选地,服务器102承担主要计算工作,终端101承担次要计算工作;或者,服务器102承担次要计算工作,终端101承担主要计算工作;或者,服务器102和终端101二者之间采用分布式计算架构进行协同计算。
可选的,终端101泛指多个终端中的一个,本实施例仅以终端101来举例说明。本领域技术人员可以知晓,上述终端101的数量可以更多或更少。比如上述终端101可以仅为一个,或者上述终端101为几十个或几百个,或者更多数量。本申请实施例对终端的数量和设备类型不加以限定。
可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也能够是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合)。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible MarkupLanguage,XML)等的技术和/或格式来代表通过网络交换的数据。此外还能够使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet ProtocolSecurity,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还能够使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
图2是根据本申请实施例提供的一种信息推送方法的流程图,如图2所示,在本申请实施例中以应用于计算机设备为例进行说明。该信息推送方法包括以下步骤:
201、计算机设备获取兑换过目标服务的第一用户的特征信息,该特征信息用于指示该第一用户对该目标服务的使用特征和兑换特征。
在本申请实施例中,目标服务为音乐播放服务、视频播放服务、游戏加速服务以及云存储服务等互联网服务提供商所提供的服务中的任意一种。用户能够通过资源来兑换该目标服务,该资源为积分、点券、电子货币等虚拟资源或者法定货币等实体资源。可选的,用户能够通过购买该目标服务,来实现目标服务的兑换。对于兑换过目标服务的用户,计算机设备能够授权获取该用户使用该目标服务以及兑换该目标服务的行为信息和属性信息,然后计算机设备能够基于获取到的信息,获取该用户使用该目标服务的使用特征和兑换该目标服务的兑换特征。当任一用户已兑换的目标服务即将到期时,该用户即为第一用户。
202、计算机设备将该特征信息映射至目标向量空间,得到特征向量。
在本申请实施例中,计算机设备能够对获取到的特征信息进行进一步处理,将该特征信息映射为独热编码,得到特征向量。
203、计算机设备将特征向量分别输入至少两个分类模型,由该至少两个分类模型对该第一用户进行分类,输出至少两个分类结果,该分类结果用于指示该第一用户为目标用户的概率,该目标用户为不会继续购买该目标服务的用户。
在本申请实施例中,计算机设备能够将得到的特征向量分别输入至少两个分类模型,基于至少两个分类模型分别对上述第一用户的特征信息进行分类,每个分类模型输出一个分类结果,从而能够得到至少两个分类结果。其中,每个分类模型输出的分类结果,均能指示该第一用户为目标用户的概率。其中,该概率越高,表示该第一用户在服务到期后,不会继续兑换该目标服务的概率越高;该概率越低,表示该第一用户在服务到期后,不会继续兑换该目标服务的概率越低。
204、响应于至少一个分类结果指示该第一用户为目标用户的概率大于目标概率,计算机设备向该第一用户推送目标信息,该目标信息用于指示兑换该目标服务的优惠内容。
在本申请实施例中,计算机设备能够根据得到的至少两个分类结果,来确定第一用户是否为目标用户,可选的,当任一分类结果指示该第一用户为目标用户的概率大于目标概率时,确定该第一用户为目标用户;或者当全部的分类结果指示该第一用户为目标用户的概率大于目标概率时,确定该第一用户为目标用户;或者当超过目标比例的分类结果指示该第一用户为目标用户的概率大于目标概率时,确定该第一用户为目标用户。本申请实施例对此不进行限制。当计算机设备确定该第一用户为目标用户之后,计算机设备能够向该第一用户推送用于指示兑换该目标服务的优惠内容的目标信息,以使得该第一用户在收到该目标信息后,能够继续兑换该目标服务,从而避免用户流失,提高兑换该目标服务的用户的总人数。
在本申请实施例中,提供了一种信息推送方法,通过获取兑换过目标服务的第一用户对该目标服务使用特征和兑换特征,从而能够得到有利于对第一用户进行分类的特征,然后基于至少两个分类模型,根据上述特征对应的特征向量对该第一用户进行分类,能够确定该第一用户是否为不会继续兑换该目标服务的目标用户的概率,基于上述概率与目标概率之间的关系向第一用户推送包括优惠内容的目标信息,使得该目标信息能够促使第一用户继续兑换目标服务,提高兑换目标服务的用户的总人数,避免用户流失。
以上图2示例性示出了本申请实施例提供的信息推送方法的主要步骤,本申请提供的信息推送方法能够应用于向目标用户推送互联网服务提供商所提供的各种服务的场景,下面基于向游戏加速服务的用户推送优惠券的应用场景为例进行描述。
图3是根据本申请实施例提供的一种信息推送方法的流程图,如图3所示,在本申请实施例中以应用于服务器为例进行说明。该信息推送方法包括以下步骤:
在目标服务为游戏加速服务时,兑换过目标服务的第一用户为通过虚拟货币或者实体货币购买过该游戏加速服务的用户。可选的,用户能够根据自己的实际需求,通过虚拟货币或者实体货币购买一定时长的游戏加速服务,如一天、七天、一个月、一个季度以及一年等时长。相应的,由于游戏加速服务具有一定的时效性,因此用户购买的游戏加速服务在使用一段时间后会到期,该第一用户能够通过虚拟货币或者实体货币再次购买该游戏加速服务,或者不再购买该游戏加速服务。通过预测用户在游戏加速服务到期后是否会继续购买该游戏加速服务,来确定是否需要向该用户发放优惠券,从而提高用户续费的可能性。也即对于被预测为到期后不会继续购买该游戏加速服务的用户,通过向其推送包含优惠券的信息,能够提高该用户继续购买该游戏加速服务的可能性。
在本申请实施例中,服务器能够通过分类模型来确定用户是否为不会继续购买目标服务的目标用户。服务器训练分类模型的步骤参见步骤301至步骤303。
301、服务器获取训练样本。
在本申请实施例中,训练样本分为正样本和负样本,正样本为历史兑换过且当前已兑换目标服务的用户,负样本为历史兑换过且当前未兑换目标服务的用户。
例如,目标服务为游戏加速服务时,正样本为曾经连续购买游戏加速服务的天数大于等于一个月,且游戏加速服务到期后又购买了大于等于一个月的该游戏加速服务的用户;负样本为曾经连续购买游戏加速服务的天数大于等于一个月,且游戏加速服务到期后到目前为止未再购买该游戏加速服务的用户。其中,用户在游戏加速服务到期前七天和或者到期后七天再次购买,均属于游戏加速服务到期后又购买的行为,而用户在游戏加速服务到期后超过七天再购买,不属于游戏加速服务到期后又购买的行为,也即具有这种行为的用户不属于正样本用户。需要说明的是,上述示例涉及的各个时长仅为示例性示出,本申请实施例对此不进行限定。
在一种可选的实现方式中,服务器在获取训练样本时,能够基于目标日期来获取。该目标日期与服务器获取训练样本的当前日期间隔第三时长。相应的,服务器获取正样本和负样本的步骤包括:服务器获取目标日期,然后根据该目标日期,获取历史已兑换不小于第四时长的目标服务且该目标服务在目标日期到期的多个用户;然后从该多个用户中选择满足第一条件的用户作为正样本,该第一条件为在目标日期对应的目标时间范围内兑换了不小第五时长的目标服务;以及从该多个用户中选择满足第二条件的用户作为负样本,该第二条件为在目标日期对应的目标时间范围内未兑换目标服务。其中,该第三时长为一个月或者多个月。该第四时长和第五时长能够相等,也能够不相等。该目标日期对应的目标时间范围为目标日期前后各三天、五天或者七天。本申请对第三时长、第四时长、第五时长以及目标时间范围不进行限制。
302、服务器获取训练样本的样本特征信息。
在本申请实施例中,正样本和负样本的行为信息和属性信息,能够以数据表格的形式进行存储,服务器能够从该数据表格中提取正样本和负样本的特征数据,从而得到训练样本的样本特征信息。
在本申请实施例中,在目标服务为游戏加速服务时,选取了加速时间特征、加速延迟丢包特征、登录特征、加速内容特征、用于指示使用其他加速服务的服务切换行为特征、用于指示最近兑换加速服务的第一兑换行为特征以及用于指示历史兑换加速服务的第二兑换行为特征这七类特征作为样本特征信息所包含的特征。可选的,服务器还能选取更多类型的特征,如用户画像特征、历史优惠特征等,本申请实施例对此不进行限制。当然,在目标服务为其他类型的服务时,服务器能够获取对应的多种类型的特征。
例如,加速时间特征为用户使用游戏加速服务时的行为特征,通常基于该游戏加速服务到期前三周进行统计。统计的内容包括:第一周加速天数;第一周周末加速天数;第一周加速总时长;第一周周末加速总时长占比(表示第一周周末加速总时长占第一周加速总时长的比例);第一周加速会员游戏总时长占比(会员游戏指购买了游戏会员后才能玩的游戏);第一周平均加速时长(计算方式为加速总时长除以加速天数);第一周0点至6点加速总时长占比;第一周0点至6点加速天数占比(表示第一周0点至6点加速天数占第一周总加速天数的比例);第二周加速天数;第二周周末加速天数;第二周加速总时长;第二周周末加速总时长占比(表示第二周周末加速总时长占第二周加速总时长的比例);第二周加速会员游戏总时长占比(会员游戏指充值了游戏会员后才能玩的游戏);第二周平均加速时长(计算方式为加速总时长除以加速天数);第二周0点至6点加速总时长占比;第二周0点至6点加速天数占比(表示第二周0点至6点加速天数占第二周总加速天数的比例);第三周加速天数;第三周周末加速天数;第三周加速总时长;第三周周末加速总时长占比(表示第三周周末加速总时长占第三周加速总时长的比例);第三周加速会员游戏总时长占比;第三周平均加速时长(计算方式为加速总时长除以加速天数);第三周0点至6点加速总时长占比;第三周0点至6点加速天数占比(表示第三周0点至6点加速天数占第三周总加速天数的比例);三周总加速天数;三周总周末加速天数;三周总加速总时长;三周总周末加速总时长占比(表示三周总周末加速总时长占三周总加速总时长的比例);三周总加速会员游戏总时长占比(;三周总平均加速时长(计算方式为加速总时长除以加速天数);三周总0点至6点加速总时长占比;三周总0点至6点加速天数占比(表示三周总0点至6点加速天数占三周总的总加速天数的比例);第一周加速总时长占比(表示第一周加速总时长占三周总加速时长的比例);第二周加速总时长占比;第三周加速总时长占比;第三周加速总时长占比是否小于十分之一;第三周平均加速时长是否小于整体平均加速时长的四分之一等。当然,服务器还能够对游戏加速服务到期前四周或者前五周进行统计,统计的时间段除了0点至6点时间段,还能够为18点至24点时间段,本申请实施例对此不进行限制。
再如,加速延迟丢包特征通常基于最近一周加速会员游戏时的加速延迟情况和丢包率进行统计。统计的内容包括:最近一周加速会员游戏时的加速延迟0.98分位数;最近一周加速会员游戏时的加速延迟0.9分位数;最近一周加速会员游戏时的加速延迟0.7分位数;最近一周加速会员游戏时的加速延迟平均值;最近一周加速会员游戏时的丢包率0.98分位数;最近一周加速会员游戏时的丢包率0.9分位数;最近一周加速会员游戏时的丢包率0.7分位数;最近一周加速会员游戏时的丢包率平均值等。当然,服务器也能够仅统计用户加速免费游戏时的加速延迟情况和丢包率、也能够统计用户加速所有游戏时的加速延迟情况和丢包率,或者根据不同加速场景分别计算加速延迟情况和丢包率,本申请实施例对此不进行限制。
又如,登录特征为用户登录游戏加速服务的行为特征,通常基于最近三周的情况进行统计。统计的内容包括:最近一周登陆游戏的天数;最近两周登陆游戏的天数;三周内使用过的不同机器数等。
还如,服务切换行为特征用于指示用户使用其他加速服务的特征,如使用其他服务提供商所提供的游戏加速服务的特征。其他服务提供商所提供的游戏加速服务为竞品,本申请涉及的游戏加速服务为本品。统计的内容包括:最近一周使用竞品的总天数;最近两周使用竞品的总天数。当然服务器还能够统计最近三周使用竞品的总天数、最近一周使用竞品的总天数与最近一周使用本品的总天数的比值以及最近两周使用竞品的总天数与最近一周使用本品的总天数的比值等,本申请实施例对此不进行限制。
还如,加速内容特征用于指示用户通过游戏加速服务加速过的免费游戏和会员游戏的相关特征。统计内容包括:加速的免费游戏数量;加速的会员游戏数量;加速过的会员游戏数量占比;加速免费游戏天数;加速会员游戏天数等。当然,服务器还能够统计加速免费游戏天数占比、加速游戏总天数占比等,本申请实施例对此不进行限制。
还如,第一兑换行为特征用于指示最近兑换加速服务的特征,其中通常用户兑换加速服务的方式为购买。通常是统计最后一次购买游戏加速服务时的特征。统计的内容包括:已经连续购买了多少天的游戏加速服务(包含多次购买且中间未间断,即还未到期就再次购买);本次购买的游戏加速服务的天数;本次购买是否是更多特权的游戏加速服务,如SVIP(Super Very Important Person,超级会员),SVIP相比普通的VIP(Very ImportantPerson,会员)拥有更多特权;本次购买游戏加速服务是否是自动续费模式;本次购买游戏加速服务的途径。
还如,第二兑换行为特征用于指示历史兑换加速服务的特征,其中通常用户兑换加速服务的方式为购买。通常是统计最近三个月购买游戏加速服务的行为以及全部购买行为。统计的内容包括:最近三个月在服务有效期内的天数占比;最近三个月购买游戏加速服务间隔总天数/最近三个月内购买游戏加速服务次数;最近三个月购买游戏加速服务间隔为0(连续购买游戏加速服务)的次数占比(占三个月购买游戏加速服务总次数的比例);最近三个月购买游戏加速服务间隔大于0次数占比;全部购买游戏加速服务行为中已经购买了多少次;全部购买游戏加速服务行为中购买游戏加速服务月卡的次数;全部购买游戏加速服务行为中购买游戏加速服务月卡的次数占比(占全部购买游戏加速服务行为中购买游戏加速服务总次数的比例);全部购买游戏加速服务行为中购买天数大于31天的次数;全部购买游戏加速服务行为中购买天数大于31天的次数占比;全部购买游戏加速服务行为中购买天数小于31天的次数;全部购买游戏加速服务行为中购买天数小于31天的次数占比;全部购买游戏加速服务行为中每次购买间隔几天;全部购买游戏加速服务行为中购买间隔为0(连续购买游戏加速服务)的次数占比;全部购买游戏加速服务行为中购买间隔大于0次数占比等。
需要说明的是,服务器获取的上述特征为数字类特征,如占比类特征的取值范围为0-100。可选的,服务器每天能够获取的训练样本不同,如用户A在第i天符合服务器获取训练样本的条件,被服务器获取为正样本或者负样本,而在第i-1天以及第i-1天不符合服务器获取训练样本的条件;用户B在第i-1天不符合服务器获取训练样本的条件,而在第i天符合服务器获取训练样本的条件,被服务器获取为正样本或者负样本,其中i为正整数,表示当天。可选的,服务器能够使用每天新获得的训练样本的样本特征信息来进行模型训练,也能够使用当天以及前几天,如第i天至第i-4天获取的训练样本的样本特征信息来进行模型训练,从而提高训练样本的数量。
303、服务器基于样本特征信息,训练至少两个分类模型。
在本申请实施例中,采用多模型融合的方式,即对多个分类模型的分类结果取交集或者并集,来提高分类模型的整体精确率。由于越相近的分类模型进行融合,融合效果也会越差,因此,服务器训练的至少两个分类模型之间相互独立,结果之间没有相关性。
在一种可选的实现方式中,该至少两个分类模型包括极端梯度提升模型、随机森林模型以及逻辑回归模型。当然服务器还能够采用其他模型,本申请对此不进行限制。
XGBoost(eXtreme Gradient Boosting,极端梯度提升)模型和RF(RandomForest,随机森林)模型都是树模型。RF模型能够将多颗决策树的决策结果进行投票。XGBoost同样由多颗树共同决策,但是与RF模型不同的是,XGBoost中的所有树的学习过程是串行的,也即后面的树的学习和决策需要依赖前面树的结果,后面的树所学的是前面所有树结论和的残差,即后面的树的输入是前面所有树和真实值的差值。可选的,为了加快XGBoost模型和RF模型的训练速度以及防止模型过拟合,本申请采用了列抽样和增加二阶导数的方式来进行训练,能够提升模型的准确率。其中,XGBoost模型整体效果最优,但是RF模型的精确率最高,两个模型的预测效果偏向性具有一定差别。
需要说明的是,由于树模型是根据分裂点来划分样本的,因此树模型的训练样本特征向量不需要做归一化,能够直接将处理好的数字类型的特征向量作为模型输入。
LR(Logistic Regression,逻辑回归)模型采用线性回归函数和Sigmoid函数相结合的方式构建。在训练LR模型时,服务器能够通过多次迭代来训练得到LR模型,在一次迭代过程中,服务器能够将任一正样本或者负样本的样本特征信息,输入本次迭代过程对应的逻辑回归模型,确定该逻辑回归模型的损失函数。然后服务器能够对该损失函数进行正则化处理,根据正则化处理后的损失函数,对该逻辑回归模型进行参数调整。响应于该逻辑回归模型满足训练结束条件,服务器能够将该逻辑回归模型作为至少两个分类模型中的一个。
线性回归函数参见公式(1)所示,逻辑回归函数参见公式(2)所示。
z=θ0+θ1x1+θ2x2+θ3x3...+θnxn=θTx (1);
其中,z表示线性回归值,θ0表示回归线的截距,θ1,θ2,...,θn分别表示n条回归线的斜率,θT表示斜率矩阵,x表示输入的特征向量。
其中,hθ(x)表示逻辑回归值,z表示线性回归值,θT表示斜率矩阵,x表示输入的特征向量。
需要说明的是,为了降低模型过拟合,本申请实施例能够为LR模型的损失函数添加正则项。本申请实施例在LR模型中添加了L2范数正则,L2范数正则是指直接在损失函数中加入θ的绝对值的平方作为正则项。相应的,LR的损失函数参见公式(3)所示。
需要说明的是,服务器还能够在LR模型中添加L1范数正则来替代L2范数正则,L1范数正则是指直接在损失函数中加入θ的绝对值作为正则项,在此不再赘述。
需要说明的是,由于损失函数的正则项是对线性回归中的权重求和,因此权重需要是同样范围内的数,需要对输入的特征向量做归一化,即将原始的数字类型的向量的各维度转化为0至1之间的小数。相应的,服务器能够对任一正样本或者负样本的样本特征信息进行归一化处理,得到归一化特征,然后将该归一化特征输入待训练的逻辑回归模型。归一化公式参见公式(4)所示。
x′=(x-μ)/σ (4);
其中,x′表示归一化后的特征向量,x表示归一化前的特征向量,μ表示均值,σ表示标准差。
在一种可选的实现方式中,服务器能够将任一正样本或者负样本的样本特征信息映射为独热编码向量,将该独热编码向量输入待训练的逻辑回归模型。通过映射为独热编码向量,能够上述进行归一化的过程。
例如,将样本特征信息中与天数和次数相关的特征,如最近一周登陆游戏的天数、最近两周登陆游戏的天数、三周内使用过的不同机器数、最近一周使用竞品的总天数、最近两周使用竞品的总天数、全部购买游戏加速服务器行为中购买天数大于31天的次数等特征转化为one-hot(独热编码)向量,这些转化为one-hot的向量就不需要进行归一化了。
需要说明的是,为了提升模型训练速度,服务器能够采用并行化机制,并行训练该至少两个分类模型。
需要说明的是,上述方案是本申请为了提高分类模型的精确率,提出的一种可选的实现方式,相应的,服务器还能够通过调节分类模型输出的置信度分数的阈值或者调节训练样本中正负样本的比例,来提高单个分类模型的精准率,本申请实施例对此不进行限制。可选的,在模型训练过程中,服务器还能够采用网格搜索等方式确定最优超参数,也能够采用多模型投票的方式来确定目标用户。可选的,服务器还能够采用SHAP(SHapleyAdditive exPlanations)和LIME(Local interpretabe mldel-agnostic explaination)等可解释性模型来计算全局重要性和局部特征重要性,从而提高分类模型的准确率。
需要说明的是,服务器在得到至少两个分类模型之后,能够基于该至少两个分类模型,对第一用户进行分类,确定该第一用户在目标服务到期后再次兑换该目标服务的概率,来确定是否需要向该用户推送目标信息。相应的,服务器对用户进行分类和推送优惠信息的步骤参见步骤304至步骤307。
304、服务器获取第一用户,该第一用户为兑换过目标服务的用户。
在本申请实施例中,当任一用户已兑换的目标服务即将到期时,该用户即为第一用户。
可选的,服务器能够获取满足目标条件的用户作为第一用户,该目标条件为第一时长后目标服务到期,且已兑换目标服务的时长不小于第二时长。
例如,第一时长为3天,第二时长为31天,则游戏加速服务在3天后到期,且最近一次购买了大于等于31天的游戏加速服务的用户为第一用户。
需要说明的是,由于每天都有用户兑换目标服务,且兑换的时长各不相同,相应的,各用户兑换的目标服务的到期时间也就不完全相同,因此,服务器能够每天获取不同的第一用户。相应的,为了保证分类模型的时效性,服务器能够每隔一定时间重新训练一遍分类模型,如每隔一周、每隔三天以及每天等,本申请实施例对此不进行限制。
305、服务器获取第一用户的特征信息,该特征信息用于指示该第一用户对目标服务的使用特征和兑换特征。
在本申请实施例中,对于兑换过目标服务的用户,服务器能够授权获取该用户使用该目标服务以及购买该目标服务的行为信息和属性信息,然后服务器能够基于获取到的行为信息和属性信息,获取该用户使用该目标服务的使用特征和兑换该目标服务的兑换特征。可选的,服务器能够获取兑换过加速服务的第一用户的加速时间特征、加速延迟丢包特征、登录特征、加速内容特征、用于指示使用其他加速服务的服务切换行为特征、用于指示最近兑换加速服务的第一兑换行为特征以及用于指示历史兑换加速服务的第二兑换行为特征中的至少两种,然后对获取到的至少两种特征进行数据预处理,得到第一用户的特征信息。服务器获取特征信息的方式参见步骤302服务器获样本特征信息的方式,在此不再赘述。
306、服务器将该特征信息映射至目标向量空间,得到特征向量。
在本申请实施例中,服务器能够采用多种方式对特征信息进行数据处理,得到用户输入分类模型的特征向量。该目标向量空间为独热编码向量的向量空间,则服务器将该特征信息映射为独热编码向量,然后将该独热编码向量作为特征向量。可选的,服务器还能够对特征信息进行归一化处理,得到该特征向量。本申请实施例对此不进行限制。
307、服务器将特征向量分别输入至少两个分类模型,由该至少两个分类模型对第一用户进行分类,输出至少两个分类结果,该分类结果用于指示该第一用户为目标用户的概率,该目标用户为不会再次兑换目标服务的用户。
在本申请实施例中,服务器能够基于上述训练得到的至少两个分类模型分别对上述第一用户的特征信息进行预测,每个分类模型输出一个分类结果,从而能够得到至少两个分类结果。其中,每个分类模型输出的分类结果,均能指示该第一用户为目标用户的概率,该概率越高,表示该第一用户在目标服务到期后,不会再次兑换该目标服务的概率越高;该概率越低,表示该第一用户在目标服务到期后,不会再次兑换该目标服务的概率越低。
308、响应于至少一个分类结果指示该第一用户为目标用户的概率大于目标概率,服务器向该第一用户推送目标信息,该目标信息用于指示购买该目标服务的优惠内容。
在本申请实施例中,服务器能够根据上述训练得到的三个模型,得到三个分类结果,然后对该三个分类结果取交集,即当全部的三个分类结果指示该第一用户为目标用户的概率大于目标概率时,确定该第一用户为目标用户。可选的,服务器还能够当任一分类结果指示该第一用户为目标用户的概率大于目标概率时,确定该第一用户为目标用户;或者服务器还能够当不小于目标比例的分类结果指示该第一用户为目标用户的概率大于目标概率时,确定该第一用户为目标用户。当服务器确定该第一用户为目标用户之后,服务器能够向该第一用户推送用于指示兑换该目标服务的优惠内容的目标信息,以使得该第一用户在收到该目标信息后,能够再次兑换该目标服务,从而避免用户流失,提高兑换该目标服务的用户的总人数。
需要说明的是,服务器能够通过对照试验来检验上述至少两个分类模型的预测效果。服务器能够将确定的目标用户随机分为两部分,一部分作为实验组,一部分作为对照组,服务器向实验组发送目标信息,获取实验组的总收入和对照组的总收入。由于对照组的总收入明显高于对照组,说明通过分类模型确定目标用户来投放优惠券,能够显著的提高总收入。
需要说明的是,服务器能够向不同的用户推送不同的目标信息,不同的目标信息包括不同额度的优惠券。
在一种可选的实现方式中,服务器能够对至少两个分类模型输出的至少两个概率进行加权求和,得到概率权重,该概率权重用于指示目标信息所指示的优惠内容的优惠力度,且概率权重与优惠力度成正比。也即服务器能够根据该概率权重来确定优惠券的额度。
在一种可选的实现方式中,服务器能够将至少两个分类模型输出的至少两个概率中,最高的概率作为概率权重,发放大额的优惠券,从而能够提高用户续费的可能性;当然服务器也能够将至少两个分类模型输出的至少两个概率中,最低的概率作为概率权重,发放小额的优惠券,从而能够提高总体收入。
可选的,服务器设置有基础额度,服务器将该基础额度与概率权重的乘积作为目标信息中指示的实际优惠额度。例如,基础优惠为减10元,概率权重为0.75,则实际优惠额度为7.5元。
在一种可选的实现方式中,服务器还能够设置多个概率权重区间,一个概率权重区间对应一种优惠券。服务器根据概率权重所在的区间,确定目标信息所指示的优惠内容。
例如,[0,0.5)对应的优惠券为9折券,[0.5,0.75)对应的是8折券,[0.75,0.85)对应的是7折券,[0.85,0.9)对应的是6折券,[0.9,0.95)对应的是5折券,[0.95,1)对应的是4折券。
需要说明的是,上述方案是本申请提供的信息推送方法的可选实现方式,相应的,该信息推送方法还有其他可选的实现方式,如通过至少两个分类模型来预测到期后会再次兑换目标服务的续费用户,然后向非续费用户发放优惠券。通过实验表明,服务器能够将预测得到的续费用户随机分为两部分,一部分作为实验组,一部分作为对照组,服务器向对照组发放优惠券,获取实验组的总收入和对照组的总收入。由于实验组的总收入明显高于对照组,说明通过模型预测续费用户来不予投放优惠券,能够显著的提高总收入。另外,由于服务到期后一周内续费的用户占比很大,这些用户也是续费用户。可选的,优惠券能够设置有效期,如3天、5天以及7天等。
在一种可选的实现方式中,本申请实施例提供的信息推送方法能够应用于信息推送系统中。参见图4所示,图4是根据本申请实施例提供的一种信息推送系统的架构示意图。如图4所示,该信息推送系统由五个部分组成,分别是训练样本获取和特征提取、模型训练、预测样本获取和特征提取、模型预测、优惠券投放。其中,训练样本和预测样本都是从hive数据库中获取,每日例行化更新。训练样本特征提取和预测样本特征提取是通过统一的特征提取引擎提取特征,模型训练和模型预测通过统一的模型引擎完成训练和预测。在优惠券投放步骤中选择出需要投放优惠券的用户,提供给优惠券精准投放系统进行投放。
需要说明的是,为了使上述步骤301至步骤308描述的流程更清晰,参见图5所示,图5是根据本申请实施例提供的另一种信息推送方法的流程图。如图5所示,包括501、训练样本获取;502、训练样本特征提取;503、模型训练;504、预测样本获取;505、预测样本特征提取;506、模型预测;507、信息推送,这七个步骤。其中,步骤501包括:5011、每天获取距今n天前到期的用户;5012、根据到期用户到期后是否续费划分正样本用户和负样本用户;5013、从数据表中提取正负样本用户的行为和属性数据。步骤502包括:5021、将正负样本的原始数据处理成特征向量,得到特征信息;5022、取当天和过去几天的特征信息作为当天分类模型的训练数据。步骤503包括:5031、训练XGBoost模型;5032、训练RF模型;5033、训练LR模型。步骤504包括:5041、获取距今3天后到期的用户作为预测用户;5042、从数据表中提取预测用户的行为和属性数据。步骤505包括:5051、将预测用户的原始数据处理成特征向量,得到特征信息。步骤506包括:5061、将三个模型集成;5062、取模型输出的交集作为预测的目标用户;步骤507包括:5071、向目标用户投放优惠券。
在本申请实施例中,通过获取兑换过目标服务的第一用户对该目标服务使用特征和兑换特征,从而能够得到有利于对第一用户进行分类的特征,然后基于至少两个分类模型分别对该第一用户进行分类,基于得到的至少两个分类结果,能够确定该第一用户是否为不会继续兑换该目标服务的目标用户,然后向确定为目标用户的第一用户推送包括优惠内容的目标信息,使得该目标信息能够促使第一用户继续兑换目标服务,提高兑换目标服务的用户的总人数,避免用户流失。
图6是根据本申请实施例提供的一种信息推送装置的框图。该装置用于执行上述信息推送方法执行时的步骤,参见图6,装置包括:信息获取模块601、信息处理模块602、分类模块603以及信息推送模块604。
信息获取模块601,用于获取兑换过目标服务的第一用户的特征信息,该特征信息用于指示该第一用户对该目标服务的使用特征和兑换特征;
信息处理模块602,用于将该特征信息映射至目标向量空间,得到特征向量;
分类模块603,用于将该特征向量分别输入至少两个分类模型,由该至少两个分类模型对该第一用户进行分类,输出至少两个分类结果,该分类结果用于指示该第一用户为目标用户的概率,该目标用户为不会再次兑换该目标服务的用户;
信息推送模块604,用于响应于至少一个分类结果指示该第一用户为目标用户的概率大于目标概率,向该第一用户推送目标信息,该目标信息用于指示兑换该目标服务的优惠内容。
在一种可选的实现方式中,该分类模块603,用于将该特征向量分别输入至少两个分类模型,由该至少两个分类模型对该第一用户进行分类,输出该至少两个分类结果。
在一种可选的实现方式中,该至少两个分类模型的训练步骤包括:
获取正样本和负样本,该正样本为历史兑换过且当前已兑换该目标服务的用户,该负样本为历史兑换过且当前未兑换该目标服务的用户;
获取该正样本和该负样本的样本特征信息,该样本特征信息用于指示该正样本和该负样本对该目标服务的使用特征和兑换特征;
基于该样本特征信息,训练得到该至少两个分类模型。
在一种可选的实现方式中,该获取正样本和负样本,包括:
获取目标日期,该目标日期与当前日期间隔第三时长;
根据该目标日期,获取历史已兑换不小于第四时长的该目标服务且该目标服务在该目标日期到期的多个用户;
从该多个用户中选择满足第一条件的用户作为该正样本,该第一条件为在该目标日期对应的目标时间范围内兑换了不小第五时长的该目标服务;
从该多个用户中选择满足第二条件的用户作为该负样本,该第二条件为在该目标日期对应的目标时间范围内未兑换该目标服务。
在一种可选的实现方式中,该基于该样本特征信息,训练得到该至少两个分类模型,包括:
将任一正样本或者负样本的该样本特征信息,输入本次迭代过程对应的逻辑回归模型,确定该逻辑回归模型的损失函数;
对该损失函数进行正则化处理,根据正则化处理后的该损失函数,对该逻辑回归模型进行参数调整;
响应于该逻辑回归模型满足训练结束条件,将该逻辑回归模型作为该至少两个分类模型中的一个。
在一种可选的实现方式中,该将任一正样本或者负样本的该样本特征信息,输入本次迭代过程对应的逻辑回归模型,包括:
对该任一正样本或者负样本的该样本特征信息进行归一化处理,得到归一化特征,将该归一化特征输入该本次迭代过程对应的逻辑回归模型。
在一种可选的实现方式中,该将任一正样本或者负样本的该样本特征信息,输入本次迭代过程对应的逻辑回归模型,包括:
将任一正样本或者负样本的该样本特征信息映射为独热编码向量,将该独热编码向量输入该本次迭代过程对应的逻辑回归模型。
在一种可选的实现方式中,该目标服务为加速服务;
该信息获取模块601,用于获取该兑换过目标服务的第一用户的加速时间特征、加速延迟丢包特征、登录特征、加速内容特征、用于指示使用其他加速服务的服务切换行为特征、用于指示最近兑换该加速服务的第一兑换行为特征以及用于指示历史兑换该加速服务的第二兑换行为特征中的至少两种;对获取到的至少两种特征进行数据预处理,得到该第一用户的特征信息。
在一种可选的实现方式中,信息推送模块604,用于根据该至少两个分类结果确定至少两个概率;响应于该至少两个概率中任一概率大于该目标概率,向该第一用户推送该目标信息;或者,响应于该至少两个概率均大于该目标概率,向该第一用户推送该目标信息;或者,响应于该至少两个概率中超过目标比例的概率大于该目标概率,向该第一用户推送该目标信息。
在一种可选的实现方式中,该装置还包括:
用户获取模块605,用于获取满足目标条件的用户作为该第一用户,该目标条件为第一时长后该目标服务到期,且已购买该目标服务的时长不小于第二时长。
在一种可选的实现方式中,该信息处理模块602,用于将该特征信息映射为独热编码向量,将该独热编码向量作为该特征向量。
在本申请实施例中,提供了一种信息推送方法,通过获取兑换过目标服务的第一用户对该目标服务使用特征和兑换特征,从而能够得到有利于对第一用户进行分类的特征,然后基于至少两个分类模型,根据上述特征对应的特征向量对该第一用户进行分类,能够确定该第一用户是否为不会继续兑换该目标服务的目标用户的概率,基于上述概率与目标概率之间的关系向第一用户推送包括优惠内容的目标信息,使得该目标信息能够促使第一用户继续兑换目标服务,提高兑换目标服务的用户的总人数,避免用户流失。
需要说明的是:上述实施例提供的信息推送装置在进行信息推送时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信息推送装置与信息推送方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在本申请实施例中,计算机设备能够被配置为终端或者服务器,当计算机设备被配置为终端时,可以由终端作为执行主体来实施本申请实施例提供的技术方案,当计算机设备被配置为服务器时,可以由服务器作为执行主体来实施本申请实施例提供的技术方案,也可以通过终端和服务器之间的交互来实施本申请提供的技术方案,本申请实施例对此不作限定。
图7是根据本申请实施例提供的一种终端700的结构框图。该终端700可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts GroupAudio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture ExpertsGroup Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端700还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端700包括有:处理器701和存储器702。
处理器701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器701可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器701可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器701还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器702中的非暂态的计算机可读存储介质用于存储至少一个程序代码,该至少一个程序代码用于被处理器701所执行以实现本申请中方法实施例提供的信息推送方法。
在一些实施例中,终端700还可选包括有:外围设备接口703和至少一个外围设备。处理器701、存储器702和外围设备接口703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口703相连。具体地,外围设备包括:射频电路704、显示屏705、摄像头组件706、音频电路707、定位组件708和电源709中的至少一种。
外围设备接口703可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器701和存储器702。在一些实施例中,处理器701、存储器702和外围设备接口703被集成在同一芯片或电路板上;在一些其他实施例中,处理器701、存储器702和外围设备接口703中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路704用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路704通过电磁信号与通信网络以及其他通信设备进行通信。射频电路704将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路704包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路704可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路704还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏705用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏705是触摸显示屏时,显示屏705还具有采集在显示屏705的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器701进行处理。此时,显示屏705还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏705可以为一个,设置在终端700的前面板;在另一些实施例中,显示屏705可以为至少两个,分别设置在终端700的不同表面或呈折叠设计;在另一些实施例中,显示屏705可以是柔性显示屏,设置在终端700的弯曲表面上或折叠面上。甚至,显示屏705还可以设置成非矩形的不规则图形,也即异形屏。显示屏705可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件706用于采集图像或视频。可选地,摄像头组件706包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件706还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路707可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器701进行处理,或者输入至射频电路704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器701或射频电路704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路707还可以包括耳机插孔。
定位组件708用于定位终端700的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件708可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源709用于为终端700中的各个组件进行供电。电源709可以是交流电、直流电、一次性电池或可充电电池。当电源709包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端700还包括有一个或多个传感器710。该一个或多个传感器710包括但不限于:加速度传感器711、陀螺仪传感器712、压力传感器713、指纹传感器714、光学传感器715以及接近传感器716。
加速度传感器711可以检测以终端700建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器711可以用于检测重力加速度在三个坐标轴上的分量。处理器701可以根据加速度传感器711采集的重力加速度信号,控制显示屏705以横向视图或纵向视图进行用户界面的显示。加速度传感器711还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器712可以检测终端700的机体方向及转动角度,陀螺仪传感器712可以与加速度传感器711协同采集用户对终端700的3D动作。处理器701根据陀螺仪传感器712采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器713可以设置在终端700的侧边框和/或显示屏705的下层。当压力传感器713设置在终端700的侧边框时,可以检测用户对终端700的握持信号,由处理器701根据压力传感器713采集的握持信号进行左右手识别或快捷操作。当压力传感器713设置在显示屏705的下层时,由处理器701根据用户对显示屏705的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器714用于采集用户的指纹,由处理器701根据指纹传感器714采集到的指纹识别用户的身份,或者,由指纹传感器714根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器701授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器714可以被设置在终端700的正面、背面或侧面。当终端700上设置有物理按键或厂商Logo时,指纹传感器714可以与物理按键或厂商Logo集成在一起。
光学传感器715用于采集环境光强度。在一个实施例中,处理器701可以根据光学传感器715采集的环境光强度,控制显示屏705的显示亮度。具体地,当环境光强度较高时,调高显示屏705的显示亮度;当环境光强度较低时,调低显示屏705的显示亮度。在另一个实施例中,处理器701还可以根据光学传感器715采集的环境光强度,动态调整摄像头组件706的拍摄参数。
接近传感器716,也称距离传感器,通常设置在终端700的前面板。接近传感器716用于采集用户与终端700的正面之间的距离。在一个实施例中,当接近传感器716检测到用户与终端700的正面之间的距离逐渐变小时,由处理器701控制显示屏705从亮屏状态切换为息屏状态;当接近传感器716检测到用户与终端700的正面之间的距离逐渐变大时,由处理器701控制显示屏705从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图7中示出的结构并不构成对终端700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图8是根据本申请实施例提供的一种服务器的结构示意图,该服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central ProcessingUnits,CPU)801和一个或一个以上的存储器802,其中,该存储器802中存储有至少一条程序代码,该至少一条程序代码由该处理器801加载并执行以实现上述各个方法实施例提供的信息推送方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质应用于计算机设备,该计算机可读存储介质中存储有至少一段程序代码,该至少一段程序代码由处理器加载并执行以实现上述实施例的信息推送方法中计算机设备所执行的操作。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得该计算机设备执行上述各种可选实现方式中提供的信息推送方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (15)
1.一种信息推送方法,其特征在于,所述方法包括:
获取兑换过目标服务的第一用户的特征信息,所述特征信息用于指示所述第一用户对所述目标服务的使用特征和兑换特征;
将所述特征信息映射至目标向量空间,得到特征向量;
将所述特征向量分别输入至少两个分类模型,由所述至少两个分类模型对所述第一用户进行分类,输出至少两个分类结果,所述分类结果用于指示所述第一用户为目标用户的概率,所述目标用户为不会再次兑换所述目标服务的用户;
响应于至少一个分类结果指示所述第一用户为目标用户的概率大于目标概率,向所述第一用户推送目标信息,所述目标信息用于指示兑换所述目标服务的优惠内容。
2.根据权利要求1所述的方法,其特征在于,所述至少两个分类模型的训练步骤包括:
获取正样本和负样本,所述正样本为历史兑换过且当前已兑换所述目标服务的用户,所述负样本为历史兑换过且当前未兑换所述目标服务的用户;
获取所述正样本和所述负样本的样本特征信息,所述样本特征信息用于指示所述正样本和所述负样本对所述目标服务的使用特征和兑换特征;
基于所述样本特征信息,训练得到所述至少两个分类模型。
3.根据权利要求2所述的方法,其特征在于,所述获取正样本和负样本,包括:
获取目标日期,所述目标日期与当前日期间隔第三时长;
根据所述目标日期,获取历史已兑换不小于第四时长的所述目标服务且所述目标服务在所述目标日期到期的多个用户;
从所述多个用户中选择满足第一条件的用户作为所述正样本,所述第一条件为在所述目标日期对应的目标时间范围内兑换了不小第五时长的所述目标服务;
从所述多个用户中选择满足第二条件的用户作为所述负样本,所述第二条件为在所述目标日期对应的目标时间范围内未兑换所述目标服务。
4.根据权利要求2所述的方法,其特征在于,所述基于所述样本特征信息,训练得到所述至少两个分类模型,包括:
将任一正样本或者负样本的所述样本特征信息,输入本次迭代过程对应的逻辑回归模型,确定所述逻辑回归模型的损失函数;
对所述损失函数进行正则化处理,根据正则化处理后的所述损失函数,对所述逻辑回归模型进行参数调整;
响应于所述逻辑回归模型满足训练结束条件,将所述逻辑回归模型作为所述至少两个分类模型中的一个。
5.根据权利要求4所述的方法,其特征在于,所述将任一正样本或者负样本的所述样本特征信息,输入本次迭代过程对应的逻辑回归模型,包括:
对所述任一正样本或者负样本的所述样本特征信息进行归一化处理,得到归一化特征,将所述归一化特征输入所述本次迭代过程对应的逻辑回归模型。
6.根据权利要求2所述的方法,其特征在于,所述将任一正样本或者负样本的所述样本特征信息,输入本次迭代过程对应的逻辑回归模型,包括:
将任一正样本或者负样本的所述样本特征信息映射为独热编码向量,将所述独热编码向量输入所述本次迭代过程对应的逻辑回归模型。
7.根据权利要求1所述的方法,其特征在于,所述目标服务为加速服务;
所述获取兑换过目标服务的第一用户的特征信息,包括:
获取所述兑换过目标服务的第一用户的加速时间特征、加速延迟丢包特征、登录特征、加速内容特征、用于指示使用其他加速服务的服务切换行为特征、用于指示最近兑换所述加速服务的第一兑换行为特征以及用于指示历史兑换所述加速服务的第二兑换行为特征中的至少两种;
对获取到的至少两种特征进行数据预处理,得到所述第一用户的特征信息。
8.根据权利要求1所述的方法,其特征在于,所述响应于至少一个分类结果指示所述第一用户为目标用户的概率大于目标概率,向所述第一用户推送目标信息,包括:
根据所述至少两个分类结果确定至少两个概率;
响应于所述至少两个概率中任一概率大于所述目标概率,向所述第一用户推送所述目标信息;或者,
响应于所述至少两个概率均大于所述目标概率,向所述第一用户推送所述目标信息;或者,
响应于所述至少两个概率中超过目标比例的概率大于所述目标概率,向所述第一用户推送所述目标信息。
9.根据权利要求1所述的方法,其特征在于,所述获取兑换过目标服务的第一用户的特征信息之前,所述方法还包括:
获取满足目标条件的用户作为所述第一用户,所述目标条件为所述目标服务在第一时长后到期,且已兑换所述目标服务的时长不小于第二时长。
10.根据权利要求1所述的方法,其特征在于,所述将所述特征信息映射至目标向量空间,得到特征向量,包括:
将所述特征信息映射为独热编码向量,将所述独热编码向量作为所述特征向量。
11.一种信息推送装置,其特征在于,所述装置包括:
信息获取模块,用于获取兑换过目标服务的第一用户的特征信息,所述特征信息用于指示所述第一用户对所述目标服务的使用特征和兑换特征;
信息处理模块,用于将所述特征信息映射至目标向量空间,得到特征向量;
分类模块,用于将所述特征向量分别输入至少两个分类模型,由所述至少两个分类模型对所述第一用户进行分类,输出至少两个分类结果,所述分类结果用于指示所述第一用户为目标用户的概率,所述目标用户为不会再次兑换所述目标服务的用户;
信息推送模块,用于响应于至少一个分类结果指示所述第一用户为目标用户的概率大于目标概率,向所述第一用户推送目标信息,所述目标信息用于指示兑换所述目标服务的优惠内容。
12.根据权利要求11所述的装置,其特征在于,所述至少两个分类模型的训练步骤包括:
获取正样本和负样本,所述正样本为历史兑换过且当前已兑换所述目标服务的用户,所述负样本为历史兑换过且当前未兑换所述目标服务的用户;
获取所述正样本和所述负样本的样本特征信息,所述样本特征信息用于指示所述正样本和所述负样本对所述目标服务的使用特征和兑换特征;
基于所述样本特征信息,训练得到所述至少两个分类模型。
13.根据权利要求12所述的装置,其特征在于,所述获取正样本和负样本,包括:
获取目标日期,所述目标日期与当前日期间隔第三时长;
根据所述目标日期,获取历史已兑换不小于第四时长的所述目标服务且所述目标服务在所述目标日期到期的多个用户;
从所述多个用户中选择满足第一条件的用户作为所述正样本,所述第一条件为在所述目标日期对应的目标时间范围内兑换了不小第五时长的所述目标服务;
从所述多个用户中选择满足第二条件的用户作为所述负样本,所述第二条件为在所述目标日期对应的目标时间范围内未兑换所述目标服务。
14.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器用于存储至少一段程序代码,所述至少一段程序代码由所述处理器加载并执行权利要求1至10任一权利要求所述的信息推送方法。
15.一种存储介质,其特征在于,所述存储介质用于存储至少一段程序代码,所述至少一段程序代码用于执行权利要求1至10任一权利要求所述的信息推送方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011268242.0A CN112256975A (zh) | 2020-11-13 | 2020-11-13 | 信息推送方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011268242.0A CN112256975A (zh) | 2020-11-13 | 2020-11-13 | 信息推送方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112256975A true CN112256975A (zh) | 2021-01-22 |
Family
ID=74265612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011268242.0A Pending CN112256975A (zh) | 2020-11-13 | 2020-11-13 | 信息推送方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112256975A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113761523A (zh) * | 2021-09-02 | 2021-12-07 | 恒安嘉新(北京)科技股份公司 | 一种基于机器学习的文本数据检测方法、装置和设备 |
CN114298704A (zh) * | 2021-12-29 | 2022-04-08 | 淘电(佛山)物联网信息技术有限公司 | 一种充电桩信息提醒方法、装置、电子设备及存储介质 |
-
2020
- 2020-11-13 CN CN202011268242.0A patent/CN112256975A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113761523A (zh) * | 2021-09-02 | 2021-12-07 | 恒安嘉新(北京)科技股份公司 | 一种基于机器学习的文本数据检测方法、装置和设备 |
CN114298704A (zh) * | 2021-12-29 | 2022-04-08 | 淘电(佛山)物联网信息技术有限公司 | 一种充电桩信息提醒方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111298445B (zh) | 目标账号检测方法、装置、电子设备及存储介质 | |
CN110585726B (zh) | 用户召回方法、装置、服务器及计算机可读存储介质 | |
CN109284445B (zh) | 网络资源的推荐方法、装置、服务器及存储介质 | |
CN109784351B (zh) | 行为数据分类方法、分类模型训练方法及装置 | |
CN112069414A (zh) | 推荐模型训练方法、装置、计算机设备及存储介质 | |
CN111104980B (zh) | 确定分类结果的方法、装置、设备及存储介质 | |
CN112733970B (zh) | 图像分类模型处理方法、图像分类方法及装置 | |
CN113762971A (zh) | 数据加密方法、装置、计算机设备及存储介质 | |
CN112256975A (zh) | 信息推送方法、装置、计算机设备及存储介质 | |
CN112464052A (zh) | 反馈信息的处理方法、显示方法、装置及电子设备 | |
CN113269612A (zh) | 物品推荐方法、装置、电子设备及存储介质 | |
CN114154068A (zh) | 媒体内容推荐方法、装置、电子设备及存储介质 | |
CN112990053A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111914180A (zh) | 基于图结构的用户特征确定方法、装置、设备及介质 | |
CN111931075B (zh) | 一种内容推荐方法、装置、计算机设备及存储介质 | |
CN112561084B (zh) | 特征提取方法、装置、计算机设备及存储介质 | |
CN110490389A (zh) | 点击率预测方法、装置、设备及介质 | |
CN114298123A (zh) | 聚类处理方法、装置、电子设备及可读存储介质 | |
CN113674856A (zh) | 基于人工智能的医学数据处理方法、装置、设备及介质 | |
CN114996487B (zh) | 媒体资源推荐方法、装置、电子设备以及存储介质 | |
CN113762585B (zh) | 数据的处理方法、账号类型的识别方法及装置 | |
CN112765470A (zh) | 内容推荐模型的训练方法、内容推荐方法、装置及设备 | |
CN111294253B (zh) | 测试数据处理方法、装置、计算机设备及存储介质 | |
CN112702375B (zh) | 信息推送方法、装置、计算机设备以及存储介质 | |
CN112035649A (zh) | 问答模型处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |