WO2019214245A1

WO2019214245A1 - 一种信息推送方法、装置、终端设备及存储介质

Info

Publication number: WO2019214245A1
Application number: PCT/CN2018/122729
Authority: WO
Inventors: 蔡梦婵
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2018-05-09
Filing date: 2018-12-21
Publication date: 2019-11-14
Also published as: CN108363821A

Abstract

本申请公开了一种信息推送方法、装置、终端设备及存储介质。所述方法包括：获取用户的历史行为信息；对所述历史行为信息进行分析过滤，获取用户关键字；采用词向量的方式对所述用户关键字进行训练，确定用户标签；基于K-Means聚合算法对所述用户标签进行分类，得到原始用户标签组；根据所述用户的历史行为信息，对所述原始用户标签组进行排序，得到目标用户标签组；基于所述目标用户标签组，获取所述用户的偏好信息；从预设的业务标签库中获取所述偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。本申请的技术方案有效提高了业务资讯推送的智能化水平和业务资讯的推广效率。

Description

一种信息推送方法、装置、终端设备及存储介质

本申请以2018年5月9日提交的申请号为201810435812.7，名称为“一种信息推送方法、装置、终端设备及存储介质”的中国发明专利申请为基础，并要求其优先权。

技术领域

本申请涉及计算机技术领域，尤其涉及一种信息推送方法、装置、终端设备及存储介质。

背景技术

随着互联网络科技的迅速发展，互联网络已经深入到千家万户，许多人的工作和生活已经离不开互联网了，上网已经成为不少人学习、工作和生活的一部分，许多人每天都会使用网络进行购物、社交、娱乐、办公和查找资料等。

众多的政府单位、媒体和企业的业务部门为了满足广大用户需求，往往会在自己的站点上发布符合不同用户需求的海量信息，但这也使得网络信息变得庞杂，使得用户每次都需要花费大量时间去寻找想要购买的商品或者频繁使用搜索工具搜索资料和感兴趣的话题，影响了用户的使用效率。

在现有技术中，一些政府单位、媒体和企业的业务部门根据自己业务上的特色，向用户推送了一些业务资讯，但现有推送业务资讯方式的智能化水平较低，不具有针对性，对不需要这些业务资讯的用户来说，这些业务资讯则变成了一种变相的广告，不利于用户的使用，也影响了业务部门推广业务资讯的效率。

发明内容

本申请实施例提供一种信息推送方法、装置、终端设备及存储介质，以解决现有技术中业务资讯推送的智能化水平较低和业务资讯推广效率不高的问题。

第一方面，本申请实施例提供一种信息推送方法，包括：

获取用户的历史行为信息；

对所述历史行为信息进行分析过滤，获取用户关键字；

采用词向量的方式对所述用户关键字进行训练，确定用户标签；

基于K-Means聚合算法对所述用户标签进行分类，得到原始用户标签组；

根据所述用户的历史行为信息，对所述原始用户标签组进行排序，得到目标用户标签组；

基于所述目标用户标签组，获取所述用户的偏好信息；

从预设的业务标签库中获取所述偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。

第二方面，本申请实施例提供一种信息推送装置，包括：

历史行为信息获取模块，用于获取用户的历史行为信息；

用户关键字获取模块，用于对所述历史行为信息进行分析过滤，获取用户关键字；

用户标签生成模块，用于采用词向量的方式对所述用户关键字进行训练，确定用户标签；

原始用户标签组生成模块，用于基于K-Means聚合算法对所述用户标签进行分类，得到原始用户标签组；

目标用户标签组生成模块，用于根据所述用户的历史行为信息，对所述原始用户标签组进行排序，得到目标用户标签组；

用户偏好信息获取模块，用于基于所述目标用户标签组，获取所述用户的偏好信息；

第一业务资讯信息推送模块，用于从预设的业务标签库中获取所述偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。

第三方面，本申请实施例提供一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，所述处理器执行所述计算机可读指令时实现所述信息推送方法的步骤。

第四方面，本申请实施例提供一个或多个非易失性可读指令，所述所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行所述信息推送方法的步骤。

本申请的一个或多个实施例的细节在下面的附图和描述中提出，本申请的其他特征和优点将从说明书、附图以及权利要求变得明显。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例1提供的信息推送方法的流程图；

图2是本申请实施例1提供的信息推送方法中步骤S30的实现流程图；

图3是本申请实施例1提供的信息推送方法中步骤S40的实现流程图；

图4是本申请实施例1提供的信息推送方法中步骤S50的实现流程图；

图5是本申请实施例1提供的信息推送方法中群体信息推送的实现流程图；

图6是本申请实施例1提供的信息推送方法中确定用户群体并生成群体标签，向用户推送群体标签对应的业务资讯信息的实现流程图；

图7是本申请实施例2提供的信息推送装置的示意图；

图8是本申请实施例4提供的终端设备的示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

实施例1

请参阅图1，图1示出本实施例提供的信息推送方法的实现流程。详述如下：

S10：获取用户的历史行为信息。

具体地，服务器从后台数据库获取记录用户历史行为的日志信息，通过对日志的提取，得到用户的历史行为信息。

其中，用户历史行为是指用户在登录网站平台后的全部操作行为，该操作行为被记录在服务器后台数据库的日志信息中。

历史行为信息包括但不限于：历史搜索记录、历史点击记录、历史浏览记录。

历史搜索记录包括但不限于：用户信息、搜索时间和检索关键词。用户信息包括用户的基本信息，如姓名、性别、年龄等，搜索时间是指检测到检索操作的具体时间，检索关键词是指检索时间输入并进行查询的关键词。

例如，在一具体实施方式中，历史搜索记录为：“(张三，男，23)，2018-01-29 20:46:50，洗衣机”，其中，“张三，男，23”为用户信息，“2018年1月29日20:46:50”为搜索时间，“洗衣机”为搜索关键字。

历史点击记录包括但不限于：用户信息、点击时间和点击超链接的身份识别符(Identification，ID)，点击时间是指检测到点击操作的具体时间，点击超链接的ID是指点击操作的对象的ID，进一步地，点击历史记录还记录了该产品是在搜索结果中点击的还是推荐结果中点击的。

例如，在一具体实施方式中，历史点击记录为：“(张三，男，23)，2018-01-29 20:51:50，65936，S”，其中，“65936”为后台数据库中对应的一国产的洗衣机的具体介绍的页面的超链接的ID，“S”为该所点击的超链接的ID为根据搜索的方式得到的超链接的ID。

历史浏览记录包括但不限于：用户信息、浏览时间和浏览数据，其中，浏览是用户在浏览产品信息的产生的浏览记录，一次点击查看的页面会记录多条浏览数据，该数据是采样数据。

S20：对历史行为信息进行分析过滤，获取用户关键字。

具体地，通过对历史行为信息中的搜索关键字、点击超链接的ID所对应的页面信息和浏览的页面信息进行关键信息提取分析，获取用户初始关键字。

其中，点击超链接的ID所对应的页面信息是指点击操作的对象的ID在后台数据库中对应的页面信息。

例如，在用户点击超链接ID为“NZ_5263”的超链接后，通过在后台数据库中查询获知超链接ID为“NZ_5263”的超链接所对应的页面为“https://miaosha.xxxxxx.com/#1892018”，进而提取该页面的产品标题，产品基本信息等，得到初始用户关键字：“精美奢华亮钻刺绣可媲美XXX知名品牌秋冬新款韩版针织衫”。

进一步地，对用户初始关键字中的干扰词汇进行剔除，得到用户关键字。

具体地，对用户初始关键字中的干扰词汇进行剔除的实现方式为：

根据预设字典对初始用户关键字进行分词处理，得到初始用户关键字的多个分词；

对各个分词按照该分词的词性进行词语分类，例如，按照词性将这些分词分为主观词汇和客观词汇；

获取符合预设词性条件的分词作为用户关键字。

例如，在一具体实施方式中，提取到的用户初始关键字为“精美奢华亮钻刺绣可媲美XXX知名品牌秋冬新款韩版针织衫”，在进行分词处理时，可将“精美奢华亮钻刺绣可媲美XXX知名品牌秋冬新款韩版针织衫”的产品标题分割为“精美奢华”、“亮钻刺绣”、“可媲美”、“XXX知名品牌”、“秋冬”、“新款”、“韩版”、“针织衫”七个关键词汇，而“精美奢华”、“亮钻刺绣”、“可媲美”三个词均为主观词汇，可予剔除，“XXX知名品牌”、“秋冬”、“新款”、“韩版”、和“针织衫”为能反应用户需求的产品特征的词汇，则最后得到的五个关键词为：“XXX知名品牌”、“秋冬”、“新款”、“韩版”和“针织衫”。

S30：采用词向量的方式对用户关键字进行训练，确定用户标签。

在人工智能中，语言表示主要指语言的形式化或数学的描述，以便在计算机中表示语言，并能让计算机可读指令自动处理。本申请实施例中所指的词向量就是用向量的形式来表示一个关键词。

具体地，通过使用词向量的方式对所有用户关键字进行训练，得到符合预设要求的用户标签。

在一具体实施方式中，根据预设语料库，构建每个用户关键字的基础词向量，针对每个基础词向量，计算该基础词向量与其他基础词向量之间的空间距离，获取该基础词向量的最小空间距离，进而将最小空间距离中小于或等于预设空间距离阈值的基础词向量作为用户标签。使得在生成用户标签的时候，过滤掉用户很少关注的用户关键字，进而可以更加准确地确定用户偏好。

S40：基于K-Means聚合算法对用户标签进行分类，得到原始用户标签组。

具体地，使用K-Means聚合算法对用户标签进行聚合，将聚合度高的用户标签放入同一个分类，得到不同的分类，这些分类即为原始用户标签组。

K-means算法是基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。

S50：根据用户的历史行为信息，对原始用户标签组进行排序，得到目标用户标签组。

具体地，由步骤S1可知，用户的历史行为信息包含该历史行为发生的时间，按照历史行为信息发生的时间顺序，对历史行为信息对应的用户标签进行排序，进而根据排序结果对原始用户标签组进行排序，得到目标用户标签组。

S60：基于目标用户标签组，获取用户的偏好信息。

具体地，根据步骤S50生成的目标用户标签组，按照预设的业务资讯信息的推送种类，从目标用户标签组中提取包含该推送种类的目标用户标签组，并从中筛选出排序在前的预设数量的目标用户标签组，进而根据筛选出的目标用户标签组中每个用户标签对应的用户关键字，得到相对应的推送类别的用户偏好。

例如，在一具体实施方式中，预设的业务资讯信息推送种类为不超过三类，即最多获取三类用户兴趣偏好，按照目标用户标签组的排序，按顺序选取前三组目标用户标签组对应的三组用户关键字，并根据该三组用户关键字得到当前用户的偏好信息。

S70：从预设的业务标签库中获取用户的偏好信息对应的业务标签，并向该用户推送该业务标签对应的业务资讯信息。

具体地，根据用户的偏好信息，从预设的业务标签库中选取与之对应的业务标签，进而获取业务标签对应的业务资讯信息，按照步骤S60得到的每种推送类别的用户偏好，优先推送第一类别的用户偏好对应的业务资讯信息，若接收到用户关闭推送该业务咨询信息的请求或者在预设时间内没有接收到用户的反馈，则向用户推送第二类别的用户偏好对应的业务咨询信息，直到达到预设推送次数时结束推送。

在图1对应的实施例中，通过收集用户历史行为信息，并对该用户历史行为信息进行分析过滤，得到用户关键字，通过对用户关键字进行训练，剔除掉含义比较模糊的关键字，得到用户标签，使用K-Means聚合算法对用户标签进行分组，得到原始用户标签组，再对该原始用户标签组进行排序，得到目标用户标签组，基于目标用户标签组和预设的业务标签库中的业务资讯信息，向用户推送用户偏好的业务资讯信息，实现了根据对用户的历史行为进行分析，并利用机器学习的方法，实时动态获取用户的兴趣偏好，针对不同用户的不同兴趣偏好，推送相应的业务资讯，从而有效提高了业务资讯推送的智能化水平，进而提高了不同业务资讯的推广效率。

接下来，在图1对应的实施例的基础之上，下面通过一个具体的实施例来对步骤S30中所提及的采用词向量的方式对用户关键字进行训练，确定用户标签的具体实现方法进行详细说明。

请参阅图2，图2示出了本申请实施例提供的步骤S30的具体实现流程，详述如下：

S31：基于预设语料库，构建每个用户关键字的基础词向量。

具体地，将用户历史行为信息中的关键字按照预设的语料库映射到一个向量中，将这些向量联系在一起，形成一个词向量空间，每个向量相当于是这个空间中的一个点。

例如，某汽车销售公司产品名称里面有宝马、奔驰这两个关键字，根据预设的语料库，获取了这两个关键字的所有可能分类：“汽车”、“奢侈品”、“动物”、“动作”和“美食”。因此，对这两个关键字引入一种向量表示：

<汽车，奢侈品，动物，动作，美食>

根据统计学习的方法计算这两个关键字属于每个分类的概率，计算机学到的可能是：

宝马＝<0.5,0.2,0.2,0.0,0.1>

奔驰＝<0.7,0.2,0.0,0.1,0.0>

可以理解地，基础词向量的每一维的值代表一个具有一定的语义和语法上能够解释的特征，故可以将基础词向量的每一维称为一个关键字特征。

进一步地，为用户的每个关键字均构建关键字词向量，得到基础词向量。

需要说明的是，每个用户关键字对应唯一的基础词向量，每个基础词向量对应至少一个用户关键字。

通过基于预设语料库，构建每个用户关键字的基础词向量，使得将机器无法准确理解的文字转换成了机器容易识别并进行运算的词向量，有利于对用户偏好的准确识别

S32：针对每个基础词向量，计算该基础词向量与其他基础词向量之间的空间距离，并从空间距离中选取最小值作为该基础词向量的最小空间距离。

具体地，针对每个基础词向量，使用空间距离的计算公式，分别计算该基础词向量与其他所有基础词向量之间的空间距离，并找出这些空间距离的最小值。

按照公式(1)计算基础词向量A(a ₁,a ₂,...,a _n)和基础词向量B(b ₁,b ₂,...,b _n)之间的空间距离L：

其中，n为大于或等于2的正整数。

例如，在一具体实施方式中，基础词向量包含G ₁(0.9,0.1)、G ₂(0.5,0.5)G ₃(0.8,0.2)，针对G ₁，按照公式(1)分别计算G ₁到G ₂的空间距离为0.5659，以及G ₁到G ₃的空间距离为0.1414，则G ₁的最小空间距离为0.1414。

S33：将最小空间距离中小于或等于预设空间距离阈值的基础词向量，作为用户标签。

具体地，根据步骤S32计算出每个基础词向量的最小空间距离之后，对这些最小空间距离与预设的空间距离阈值进行比较，将最小空间距离小于或等于空间距离阈值的基础词向量作为用户标签。

通过对不符合空间距离阈值要求的基础词向量进行过滤，避免了将用户关注度低的内容也放入用户标签，从而可以更准确的确定用户偏好。

例如，在一具体实施方式中，预设的空间距离阈值为0.8，基础词向量包括H ₁(0.9,0.1,0)、H ₂(0.8,0.1,0.1)和H ₃(0,0.1,0.9)，通过步骤S32中的公式(1)计算得到H ₁的最小空间距离为0.4243，H ₂的最小空间距离为0.4243，H ₃的最小空间距离为1.1314，H ₁和H ₂的最小空间距离小于预设的空间距离阈值0.8，因此，将H ₁和H ₂作为用户标签。

在图2对应的实施例中，基于预设语料库，构建每个用户关键字的基础词向量，并针对每个基础词向量，计算该基础词向量与其他基础词向量之间的空间距离，并从空间距离中选取最小值作为该基础词向量的最小空间距离，将最小空间距离中小于或等于预设空间距离阈值的基础词向量，作为用户标签，通过将用户关键字转换成机器能够识别运算的词向量，并按照预设条件过滤掉模糊关键字或者其他词向量相似度较低的词向量，实现对用户偏好的准确识别，有效提高了业务资讯推送的智能化水平。

在图1对应的实施例的基础之上，下面通过一个具体的实施例来对步骤S40中所提及的基于K-Means聚合算法对用户标签进行分类，得到原始用户标签组的具体实现方法进行详细说明。

请参阅图3，图3示出了本申请实施例提供的步骤S40的具体实现流程，详述如下：

S41：从n个用户标签A ₁,A ₂,A ₃,...,A _n中随机选取m个用户标签作为聚类中心，其中， n和m均为正整数，m小于或等于n。

具体地，n为用户的用户标签总数，m为根据需要预设的聚类中心个数，从该用户的n个用户标签中随机选取m个用户标签，把这m个用户标签作为原始的聚类中心。

S42：针对每个用户标签，计算该用户标签与当前每个聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类。

具体地，针对每个用户标签，采用步骤S32中的公式(1)，计算该用户标签与每个聚类中心之间的空间距离，作为第一距离，得到m个第一距离，并从该m个第一距离中获取最小值作为做小第一距离，将该用户标签与最小第一距离对应的聚类中心放入同一个聚类中，依照这个方法，得到m个临时聚类。

例如，在一具体实施方式中，存在8个用户标签，预设的聚类中心个数为3个，在随机生成三个聚类中心之后，按照步骤S32中的公式(1)计算得到每个用户标签分别到三个聚类中心的第一距离如表一所示：

表一

	聚类中心1	聚类中心2	聚类中心3
用户标签1	0.5	1.9	0.7
用户标签2	2.5	0.2	0.9
用户标签3	1.3	0.1	0.8
用户标签4	1.6	0.1	0.7
用户标签5	1.8	0.9	0.2
用户标签6	0.6	0.8	1.6
用户标签7	0.7	0.8	0.2
用户标签8	1.1	0.3	0.9

根据计算出的这些第一距离，很容易得到各用户标签到三个聚类中心的最小第一距离，例如，用户标签1到三个聚类中心的最小第一距离为0.5，因此将用户标签1放入聚类中心1所在的聚类中，按照这个方法，得到的三个临时聚类分别为：临时聚类1(用户标签1，用户标签6)、临时聚类2(用户标签2，用户标签3，用户标签4，用户标签8)和临时聚类3(用户标签5，用户标签7)。

S43：针对每个临时聚类，计算该临时聚类的均值，以及该临时聚类中每个用户标签和均值之间的第二距离，选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心，得到更新后的m个临时聚类。

具体地，通过公式(2)计算临时聚类的均值：

其中，

为临时聚类的均值，k为该临时聚类中用户标签的个数，a _i为该临时聚类中第i个用户标签，i∈[1,k]。

使用步骤S32中的公式(1)，计算该聚类中心中每个用户标签和该临时聚类的均值之间的空间距离，即第二距离。选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心，得到更新后的m个临时聚类。

需要说明的是，根据临时聚类的新的聚类中心，得到更新后的m个临时聚类的具体实现过程和步骤S42的处理过程相同，为避免重复，此处不再赘述。

S44：按照公式(3)计算每个更新后的临时聚类的标准差：

其中，σ为标准差，μ为用户标签A _i所在的临时聚类的平均值，i∈[1,n]。

S45：若m个更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值，则返回执行步骤S42。

具体地，通过对步骤S44中计算出的每个更新后的临时聚类标准差与预设的标准差阈值进行对比，当存在临时聚类标准差大于或者等于预设的标准差阈值的临时聚类时，说明该更新后的临时聚类尚未满足用户标签的相似度要求，则返回步骤S42，按照步骤S42至步骤S44的处理过程继续进行聚类。

S46：若m个更新后的临时聚类的标准差均小于预设的标准差阈值，则将该m个更新后的临时聚类作为原始用户标签组。

具体地，当每个更新后的临时聚类的标准差都小于预设的标准差阈值时，说明该更新后的临时聚类已经能够满足用户标签的相似度要求，将m个更新后的临时聚类作为原始用户标签组。

在图3对应的实施例中，通过从n个用户标签中随机选取m个用户标签作为聚类中心，并按照公式(1)计算每个用户标签与这m个聚类中心的距离，找出该用户标签距离m个聚类中心的第一最小距离，进而将该用户标签和第一最小距离对用的聚类中心放入同一个聚类，以此方法，得到m个临时聚类，然后针对每个临时聚类，按照公式(2)计算该临时聚类的平均值，并将与平均值距离最小的用户标签作为新的聚类中心，得到更新后的临时聚类，按照公式(3)计算该更新后的临时聚类的标准差，如果存在更新后的临时聚类的标准差大于或等于预设标准差阈值，则根据新的聚类中心，重新按上述方法继续进行聚类，直到所有更新后的临时聚类的标准差均小于预设标准差阈值的标准差时结束聚类，并将当前的m个临时聚类作为原始用户标签组。通过使用K-Means聚合算法对用户标签进行分类，使得原本分散的用户标签，能够根据用户标签之间的相似度进行聚类，实现对用户标签的分类，有效提高了分类的准确度，从而将具有相同偏好的用户能够被聚类到同一个分类中，从而在按照用户标签向用户推送业务资讯信息时，能够针对用户的兴趣偏好准确推送相关的业务资讯，提高了业务资讯推送的智能化水平和业务部门推广业务资讯的效率。

在图1对应的实施例的基础之上，下面通过一个具体的实施例来对步骤S50中所提及的针对每个用户群体，对该原始群体标签组进行排序，得到该用户群体对应的群体标签组的具体实现方法进行详细说明。

请参阅图4，图4示出了本申请实施例提供的步骤S50的具体实现流程，详述如下：

S51：基于历史行为信息，获取用户标签对应的历史行为信息的生成时间。

具体地，基于步骤S10中的具体说明，历史行为信息包括但不限于：历史搜索记录、历史点击记录和历史浏览记录。其中历史搜索记录包含搜索时间，历史点击记录包含点击时间，历史浏览记录包含浏览时间，因此，每条用户历史行为信息均对应有生成时间。

进一步地，根据用户标签对应的历史行为信息，即可确定该用户标签对应的生成时间。

例如，在一具体实施方式中，用户标签为<0.6,0.15,0.25>，其对应的用户关键字为“洗衣机”，用户关键字“洗衣机”对应的用户历史行为信息包括“历史点击记录：(张三，男，23)，2018-01-29 20:51:50，65936，S”，容易理解地，该用户标签生成时间为“2018-01-29 20:51:50”。

S52：按照生成时间对用户标签进行排序，得到用户标签序列。

具体地，在获取到每个用户标签的生成时间后，根据生成时间的先后顺序，对用户标签进行排序，得到用户标签序列。

例如，用户标签A对应的生成时间为“2018年1月29日15:06:38”，用户标签B对应的生成时间为：“2018年1月29日15:23:54”，用户标签C对应的生成时间为：“2018年1月26日15:07:14”，按照生成时间的先后顺序后得到的用户标签序列为：“用户标签C，用户标签A，用户标签B”。

S53：根据用户标签序列，对原始用户标签组进行排序，得到目标用户标签组。

具体地，根据步骤S52中得到的用户标签序列，获取每个原始用户标签组中排序第一的用户标签，将这些在所在原始标签组中排序第一的用户标签进行排序，得到原始用户标签组的顺序，将原始用户标签组按照该顺序进行排序，得到目标用户标签组。

例如，在一具体实施方式中，存在3组原始用户标签组，分别为原始用户标签组A(用户标签1，用户标签2，用户标签3)、原始用户标签组B(用户标签4，用户标签5)和原始用户标签组C(用户标签6，用户标签7)，其中，用户标签的序列为“用户标签5，用户标签2，用户标签1，用户标签7，用户标签4，用户标签6，用户标签3”，由该序列可知，原始用户标签组A中的排序第一的用户标签为“用户标签2”，原始用户标签组B中的排序第一的用户标签为“用户标签5”，原始用户标签组C中的排序第一的用户标签为“用户标签7”，经过对“用户标签2”、“用户标签5”和“用户标签7”进行排序，得到原始用户标签组的排序顺序，根据该顺序排序得到的目标用户标签组为：“目标用户标签组B、目标用户标签组A、目标用户标签组C”。

在图4对应的实施例中，根据历史行为信息，获取用户标签对应的历史行为信息的生成时间，并按照生成时间对用户标签进行排序，得到用户标签序列，进而根据用户标签序列，对原始用户标签组进行排序，得到目标用户标签组。使得对提取出的用户的偏好按照用户最近关注的时间顺序来进行先后排序，在进行业务资讯的推送时能够优先推选用户最近关注的偏好资讯，提高了业务资讯推送的智能化水平。

在图1对应的实施例的基础之上，在步骤S30提及的采用词向量的方式对用户关键字进行训练，确定用户标签之后，还可以进一步确定用户群体并生成群体标签，向用户推送群体标签对应的业务资讯信息，如图5所示，该信息推送方法还包括：

S81：根据预设的客户标签库，确定不同的用户群体及其对应的用户标签，得到群体标签。

具体地，在预设的客户标签库中，包含不同用户群体的群体特征信息，根据用户的群体特征，将该用户归属于该群体特征对应的用户群体，进而将该用户的用户标签放入该群体标签中，得到不同用户群体以及每个用户群体对应的群体标签。

需要说明的是，按照预设的群体特征信息，每个用户属于至少一个用户群体。

在预设的客户标签库中可以根据需要设置不同的用户群体的分类方式，例如，在一具体实施方式中，客户标签库的用户群体包括：用户群体A(男，18-25岁)、用户群体B(男，26-45岁)和用户群体C(男，46岁以上)，其中，“男”为性别特征，“18-25岁”为年龄特征，在另一具体实施方式中，客户标签库的用户群体包括：用户群体D(男，专科)和用户群体E(男，本科)，其中，“专科”为教育程度特征。进而根据用户的基本信息，确定用户所属用户群体，将每个用户的用户标签放入群体标签之中。

S82：针对每个用户群体，基于K-Means聚合算法对群体标签进行分类，得到该用户群体对应的原始群体标签组。

具体地，针对每个用户群体，使用K-Means聚合算法对群体标签进行聚类，将聚合度高的群体标签放入同一个分类，得到不同的分类，这些分类即为原始群体标签组。

需要说明的是，使用K-Means聚合算法对群体标签进行分类的实现过程与步骤S41至步骤S46对用户标签进行分类的方法相同，为避免重复，此处不再赘述。

S83：针对每个用户群体，对该用户群体对应的原始群体标签组进行排序，得到该用户群体对应的群体标签组。

具体地，针对每个用户群体对应的原始群体标签组，统计每个原始群体标签组中用户标签出现的次数，按出现总次数由大到小的顺序对原始群体标签组进行排序，得到该用户群体对应的群体标签组，使得该群体总体关注度高的内容会优先进行推送，提高了业务咨询信息推送的效率。

S84：确定用户的目标用户群体。

具体地，在接收到用户访问站点的请求后，根据用户的基本信息与步骤S81中提及的客户标签库中的群体特征信息，确定该用户所属的用户群体，即该用户的目标用户群体。

可以理解地，用户的目标用户群体可以为一个也可以为多个。

例如，在一具体实施方式中，用户的基本信息为“男，22岁，本科”，包含这些特征的有两个用户群体，分别为：用户群体G(男，18-25岁)和用户群体K(男，本科)，因此，该用户的目标用户群体为：用户群体G和用户群体K。

S85：根据每个用户群体及其对应的群体标签组，获取该目标用户群体对应的目标群体标签组。

具体地，在步骤S83中，针对每个用户群体均生成了其对应的群体标签组，在确定了用户的目标用户群体之后，获取目标用户群体中包含的所有用户群体所对应的群体标签组，作为该用户的目标群体标签组。

S86：基于目标群体标签组，获取群体偏好信息。

具体地，根据步骤S85得到的目标群体标签组，按照预设的业务资讯信息的推送种类，从目标群体标签组中提取包含该推送种类的目标群体标签组，并从中选择排序在前的预设数量的目标群体标签组，进而根据筛选出的目标群体标签组中每个群体标签对应的用户关键字，得到相对应的推送类别的用户偏好。

S87：从预设的业务标签库中获取用户的群体偏好信息对应的业务标签，并向该用户推送该业务标签对应的业务资讯信息。

具体地，针对历史行为信息比较少的新用户，或者在步骤S70中收到关闭推送该业务咨询信息的请求的老用户，可以向这些用户推荐群体偏好对应的业务资讯信息，具体从预设的业务标签库中获取用户的群体偏好信息对应的业务标签，并向该用户推送该业务标签对应的业务资讯信息的实现过程与步骤S70中的实现方法相同，为避免重复，此处不再赘述。

可以理解地，也可以根据预设的推送条件来选择推送用户的偏好信息或者群体偏好信息对应的业务咨询信息，该预设的推送条件可以根据实际应用的需要进行设置，此处不做限制。

在图5对应的实施例中，通过根据预设的客户标签库，确定不同的用户群体及其对应的用户标签，得到群体标签，并针对每个用户群体，基于K-Means聚合算法对该群体标签进行分类，得到该用户群体对应的原始群体标签组，并对该原始群体标签组进行排序，得到该用户群体对应的群体标签组，在接收到用户的访问站点请求后，根据用户的基本信息确定用户的目标用户群体，进而确定用户的目标用户群体和对应的目标用户群体标签组，从而获取该用户的群体偏好，并能够根据用户的偏好信息或者群体偏好信息灵活选择不同的业务咨询信息，向用户进行推送，提高了业务资讯推送的智能化水平，进而提高了不同业务资讯的推广效率。

在图5对应的实施例的基础之上，下面通过一个具体的实施例来对步骤S83中所提及的针对每个用户群体，对该用户群体对应的原始群体标签组进行排序，得到该用户群体对应的群体标签组具体实现方法进行详细说明。

请参阅图6，图6示出了本申请实施例提供的步骤S83的具体实现流程，详述如下：

S831：针对每个用户群体，获取该用户群体对应的原始群体标签组B ₁,B ₂,...,B _t中每个用户的用户标签A ₁,A ₂,A ₃,...,A _p在预设时间间隔内的用户标签词频

其中，t和p为正整数。

具体地，针对每个用户群体，获取该用户群体对应的原始群体标签组中每个用户的所有用户标签，根据需要预设时间间隔，并对该预设时间间隔内的每个用户的所有用户标签进行词频的计算。

其中，词频是指该用户标签对应的关键字出现的次数占所有用户标签对应的所有关键字的比例。

S832：将原始群体标签组B _j中的每个用户标签的词频相加，得到群体标签组B _j的群体标签词频

其中，j∈[1,t]。

具体地，针对每个原始群体标签组，统计该原始群体标签组里面所有用户标签的词频之和，作为该原始群体标签词频。

S833：根据群体标签词频

的大小对原始群体标签组进行排序，得到群体标签组。

具体地，将所有原始群体标签组的群体标签词频按照词频的值的大小进行排序，将群体标签词频的值大于预设的词频阈值的原始群体标签组作为群体标签组。

在图6对应的实施例中，针对每个用户群体，获取该原始群体标签组中每个用户的所有用户标签所对应的关键字的词频，计算出该原始群体标签组的群体标签词频，并按照群体标签词频的大小顺序，对原始群体标签组进行排序，得到目标群体标签组，使得每个群体的用户关注度高的内容被排在前面优先推送，提高了业务部门推广业务资讯的效率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

实施例2

对应于实施例1中的信息推送方法，图7示出了与实施例1提供的信息推送方法一一对应的信息推送装置，为了便于说明，仅示出了与本申请实施例相关的部分。

如图7所示，该信息推送装置包括：历史行为信息获取模块10、用户关键字获取模块20、用户标签生成模块30、原始用户标签组生成模块40、目标用户标签组生成模块50、用户偏好信息获取模块60和业务资讯信息推送模块70。各功能模块详细说明如下：

历史行为信息获取模块10，用于获取用户的历史行为信息；

用户关键信息获取模块20，用于对历史行为信息进行分析过滤，获取用户关键字；

用户标签生成模块30，用于采用词向量的方式对用户关键字进行训练，确定用户标签；

原始用户标签组生成模块40，用于基于K-Means聚合算法对用户标签进行分类，得到原始用户标签组；

目标用户标签组生成模块50，用于根据用户的历史行为信息，对原始用户标签组进行排序，得到目标用户标签组；

用户偏好信息获取模块60，用于基于目标用户标签组，获取用户的偏好信息；

第一业务资讯信息推送模块70，用于从预设的业务标签库中获取偏好信息对应的业务标签，并向用户推送业务标签对应的业务资讯信息。

进一步地，用户标签生成模块30包括：

基础词向量获取单元31，用于基于预设语料库，构建每个用户关键字的基础词向量；

最小空间距离获取单元32，用于针对每个基础词向量，计算该基础词向量与其他基础词向量之间的空间距离，并从空间距离中选取最小值作为该基础词向量的最小空间距离；

用户标签生成单元33，用于将最小空间距离中小于或等于预设空间距离阈值的基础词向量，作为用户标签。

进一步地，原始用户标签组生成模块40包括：

聚类中心获取单元41，用于从n个用户标签A ₁,A ₂,A ₃,...,A _n中随机选取m个用户标签作为聚类中心，其中，n和m均为正整数，m小于或等于n；

临时聚类获取单元42，用于针对每个用户标签，计算该用户标签与当前每个聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类；

临时聚类更新单元43，用于针对每个临时聚类，计算该临时聚类的均值，以及该临时聚类中每个用户标签和均值之间的第二距离，选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心，得到更新后的m个临时聚类；

标准差计算单元44，用于按照如下公式计算每个更新后的临时聚类的标准差：

其中，σ为标准差，μ为用户标签A _i所在的更新后的临时聚类的平均值，i∈[1,n]；

循环聚类单元45，用于若m个更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值，则返回执行针对每个用户标签，计算该用户标签与当前每个聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类的步骤；

原始用户标签组生成单元46，用于若m个更新后的临时聚类的标准差均小于标准差阈值，则将该m个更新后的临时聚类作为原始用户标签组。

进一步地，目标用户标签组生成模块50包括：

标签生成时间获取单元51，用于基于历史行为信息，获取用户标签对应的历史行为信息的生成时间；

用户标签序列生成单元52，用于按照生成时间对用户标签进行排序，得到用户标签序列；

目标用户标签组生成单元53，用于根据用户标签序列，对原始用户标签组进行排序，得到目标用户标签组。

进一步地，该信息推送装置还包括：

群体标签获取单元81，用于根据预设的客户标签库，确定不同的用户群体及其对应的用户标签，得到群体标签；

原始群体标签组生成单元82，用于针对每个用户群体，基于K-Means聚合算法对该群体标签进行分类，得到用户群体对应的原始群体标签组；

群体标签组生成单元83，用于针对每个用户群体，对原始群体标签组进行排序，得到用户群体对应的群体标签组；

目标用户群体确定单元84，用于确定用户的目标用户群体；

目标群体标签组获取单元85，用于根据每个用户群体及其对应的目标群体标签组，获取目标用户群体对应的目标群体标签组；

群体偏好信息获取单元86，用于基于目标群体标签组，获取群体偏好信息；

第二业务资讯信息推送单元87，用于从预设的业务标签库中获取群体偏好信息对应的业务标签，并向用户推送业务标签对应的业务资讯信息。

进一步地，群体标签组生成单元83包括：

用户标签词频获取子单元831，用于针对每个用户群体，获取原始群体标签组B ₁,B ₂,...,B _t中每个用户的用户标签A ₁,A ₂,A ₃,...,A _p在预设时间间隔内的用户标签词频

其中，t和p为正整数；

群体标签词频获取子单元832，用于将原始群体标签组B _j中的每个用户标签的词频相加，得到原始群体标签组B _j的群体标签词频

其中，j∈[1,t]；

群体标签组生成子单元833，用于根据群体标签词频

的大小对原始群体标签组进行排序，得到目标群体标签组。

本实施例提供的一种信息推送装置中各模块实现各自功能的过程，具体可参考实施例1的描述，此处不再赘述。

实施例3

本实施例提供一个或多个存储有计算机可读指令的非易失性可读存储介质，该计算机可读存储介质上存储有计算机可读指令，该计算机可读指令被一个或多个处理器执行时实现实施例1中信息推送方法，或者，该计算机可读指令被一个或多个处理器执行时实现实施例2中信息推送装置中各模块/单元的功能。为避免重复，这里不再赘述。

可以理解地，所述一个或多个存储有计算机可读指令的非易失性可读存储介质可以包括：能够携带所述计算机可读指令的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、电载波信号和电信信号等。

实施例4

图8是本申请一实施例提供的终端设备的示意图。如图8所示，该实施例的终端设备90包括：处理器91、存储器92以及存储在存储器92中并可在处理器91上运行的计算机可读指令93，例如信息推送方法的程序。处理器91执行计算机可读指令93时实现上述实施例1中的信息推送方法的步骤，例如图1所示的步骤S1至步骤S7。或者，处理器91执行计算机可读指令93时实现上述各装置实施例中各模块/单元的功能，例如图7所示模块10至模块70的功能。

示例性的，计算机可读指令93可以被分割成一个或多个模块/单元，一个或者多个模块/单元被存储在存储器92中，并由处理器91执行，以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令的指令段，该指令段用于描述计算机可读指令93在终端设备90中的执行过程。例如，计算机可读指令93可以被分割成历史行为信息获取模块、用户关键字获取模块、用户标签生成模块、原始用户标签组生成模块、目标用户标签组生成模块、用户偏好信息获取模块和业务资讯信息推送模块。各模块的具体功能如实施例2所示，为避免重复，这里不再赘述。

终端设备90可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备90可包括，但不仅限于，处理器91、存储器92。本领域技术人员可以理解，图8仅仅是终端设备90的示例，并不构成对终端设备90的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如终端设备90还可以包括输入输出设备、网络接入设备、总线等。

所称处理器91可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

存储器92可以是终端设备90的内部存储单元，例如终端设备90的硬盘或内存。存储器92也可以是终端设备90的外部存储设备，例如终端设备90上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，存储器92还可以既包括终端设备90的内部存储单元也包括外部存储设备。存储器92用于存储计算机可读指令以及终端设备90所需的其他程序和数据。存储器92还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种信息推送方法，其特征在于，所述信息推送方法包括：

获取用户的历史行为信息；

对所述历史行为信息进行分析过滤，获取用户关键字；

采用词向量的方式对所述用户关键字进行训练，确定用户标签；

基于K-Means聚合算法对所述用户标签进行分类，得到原始用户标签组；

根据所述用户的历史行为信息，对所述原始用户标签组进行排序，得到目标用户标签组；

基于所述目标用户标签组，获取所述用户的偏好信息；

从预设的业务标签库中获取所述偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。
如权利要求1所述的信息推送方法，其特征在于，所述采用词向量的方式对所述用户关键字进行训练，确定用户标签包括：

基于预设语料库，构建每个所述用户关键字的基础词向量；

针对每个所述基础词向量，计算该基础词向量与其他基础词向量之间的空间距离，并从所述空间距离中选取最小值作为该基础词向量的最小空间距离；

将所述最小空间距离中小于或等于预设空间距离阈值的基础词向量，作为用户标签。
如权利要求1所述的信息推送方法，其特征在于，所述基于K-Means聚合算法对所述用户标签进行分类，得到原始用户标签组包括：

从n个用户标签A ₁,A ₂,A ₃,...,A _n中随机选取m个用户标签作为聚类中心，其中，所述n和所述m均为正整数，所述m小于或等于所述n；

针对每个所述用户标签，计算该用户标签与当前每个所述聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类；

针对每个所述临时聚类，计算该临时聚类的均值，以及该临时聚类中每个用户标签和所述均值之间的第二距离，选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心，得到更新后的m个临时聚类；

按照如下公式计算每个更新后的临时聚类的标准差：

其中，σ为所述标准差，μ为用户标签A _i所在的更新后的临时聚类的平均值，i∈[1,n]；

若m个所述更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值，则返回执行所述针对每个所述用户标签，计算该用户标签与当前每个所述聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类的步骤；

若m个所述更新后的临时聚类的标准差均小于所述标准差阈值，则将该m个所述更新后的临时聚类作为所述原始用户标签组。
如权利要求1所述的信息推送方法，其特征在于，所述根据所述用户的历史行为信息，对所述原始用户标签组进行排序，得到目标用户标签组包括：

基于所述历史行为信息，获取用户标签对应的所述历史行为信息的生成时间；

按照所述生成时间对所述用户标签进行排序，得到用户标签序列；

根据所述用户标签序列，对所述原始用户标签组进行排序，得到所述目标用户标签组。
如权利要求1所述的信息推送方法，其特征在于，在所述采用词向量的方式对所述用户关键字进行训练，确定用户标签之后，所述信息推送方法还包括：

根据预设的客户标签库，确定不同的用户群体及其对应的用户标签，得到群体标签；

针对每个所述用户群体，基于所述K-Means聚合算法对所述群体标签进行分类，得到该用户群体对应的原始群体标签组；

针对每个所述用户群体，对所述原始群体标签组进行排序，得到该用户群体对应的群体标签组；

确定所述用户的目标用户群体；

根据每个所述用户群体及其对应的目标群体标签组，获取所述目标用户群体对应的目标群体标签组；

基于所述目标群体标签组，获取群体偏好信息；

从预设的业务标签库中获取所述群体偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。
如权利要求5所述的信息推送方法，其特征在于，所述针对每个所述用户群体，对所述原始群体标签组进行排序，得到该用户群体对应的群体标签组包括：

针对每个所述用户群体，获取所述原始群体标签组B ₁,B ₂,...,B _t中每个用户的用户标签A ₁,A ₂,A ₃,...,A _p在预设时间间隔内的用户标签词频
其中，所述t和所述p为正整数；

将所述原始群体标签组B _j中的每个所述用户标签的词频相加，得到所述原始群体标签组B _j的群体标签词频
其中，j∈[1,t]；

根据所述群体标签词频
的大小对所述原始群体标签组进行排序，得到所述群体标签组。
一种信息推送装置，其特征在于，所述信息推送装置包括：

历史行为信息获取模块，用于获取用户的历史行为信息；

用户关键字获取模块，用于对所述历史行为信息进行分析过滤，获取用户关键字；

用户标签生成模块，用于采用词向量的方式对所述用户关键字进行训练，确定用户标签；

原始用户标签组生成模块，用于基于K-Means聚合算法对所述用户标签进行分类，得到原始用户标签组；

目标用户标签组生成模块，用于根据所述用户的历史行为信息，对所述原始用户标签组进行排序，得到目标用户标签组；

用户偏好信息获取模块，用于基于所述目标用户标签组，获取所述用户的偏好信息；

第一业务资讯信息推送模块，用于从预设的业务标签库中获取所述偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。
如权利要求7所述的信息推送装置，其特征在于，所述用户标签生成模块包括：

基础词向量获取单元，用于基于预设语料库，构建每个所述用户关键字的基础词向量；

最小空间距离获取单元，用于针对每个所述基础词向量，计算该基础词向量与其他基础词向量之间的空间距离，并从所述空间距离中选取最小值作为该基础词向量的最小空间距离；

用户标签生成单元，用于将所述最小空间距离中小于或等于预设空间距离阈值的基础词向量，作为用户标签。
如权利要求7所述的信息推送装置，其特征在于，所述原始用户标签组生成模块包括：

聚类中心获取单元，用于从n个用户标签A ₁,A ₂,A ₃,...,A _n中随机选取m个用户标签作为聚类中心，其中，所述n和所述m均为正整数，所述m小于或等于所述n；

临时聚类获取单元，用于针对每个所述用户标签，计算该用户标签与当前每个所述聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类；

临时聚类更新单元，用于针对每个所述临时聚类，计算该临时聚类的均值，以及该临时聚类中每个用户标签和所述均值之间的第二距离，选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心，得到更新后的m个临时聚类；

标准差计算单元，用于按照如下公式计算每个更新后的临时聚类的标准差：

其中，σ为所述标准差，μ为用户标签A _i所在的更新后的临时聚类的平均值，i∈[1,n]；

循环聚类单元45，用于若m个所述更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值，则返回执行所述针对每个所述用户标签，计算该用户标签与当前每个所述聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类的步骤；

原始用户标签组生成单元，用于若m个所述更新后的临时聚类的标准差均小于所述标准差阈值，则将该m个所述更新后的临时聚类作为所述原始用户标签组。
如权利要求7所述的信息推送装置，其特征在于，所述信息推送装置还包括：

群体标签获取单元，用于根据预设的客户标签库，确定不同的用户群体及其对应的用户标签，得到群体标签；

原始群体标签组生成单元，用于针对每个所述用户群体，基于所述K-Means聚合算法对所述群体标签进行分类，得到该用户群体对应的原始群体标签组；

群体标签组生成单元，用于针对每个所述用户群体，对所述原始群体标签组进行排序，得到该用户群体对应的群体标签组；

目标用户群体确定单元，用于确定所述用户的目标用户群体；

目标群体标签组获取单元，用于根据每个所述用户群体及其对应的目标群体标签组，获取所述目标用户群体对应的目标群体标签组；

群体偏好信息获取单元，用于基于所述目标群体标签组，获取群体偏好信息；

第二业务资讯信息推送单元，用于从预设的业务标签库中获取所述群体偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。
一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现如下信息推送方法：

获取用户的历史行为信息；

对所述历史行为信息进行分析过滤，获取用户关键字；

采用词向量的方式对所述用户关键字进行训练，确定用户标签；

基于K-Means聚合算法对所述用户标签进行分类，得到原始用户标签组；

根据所述用户的历史行为信息，对所述原始用户标签组进行排序，得到目标用户标签组；

基于所述目标用户标签组，获取所述用户的偏好信息；

从预设的业务标签库中获取所述偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。
如权利要求11所述的终端设备，其特征在于，所述采用词向量的方式对所述用户关键字进行训练，确定用户标签包括：

基于预设语料库，构建每个所述用户关键字的基础词向量；

针对每个所述基础词向量，计算该基础词向量与其他基础词向量之间的空间距离，并从所述空间距离中选取最小值作为该基础词向量的最小空间距离；

将所述最小空间距离中小于或等于预设空间距离阈值的基础词向量，作为用户标签。
如权利要求11所述的终端设备，其特征在于，所述基于K-Means聚合算法对所述用户标签进行分类，得到原始用户标签组包括：

从n个用户标签A ₁,A ₂,A ₃,...,A _n中随机选取m个用户标签作为聚类中心，其中，所述n和所述m均为正整数，所述m小于或等于所述n；

针对每个所述用户标签，计算该用户标签与当前每个所述聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类；

针对每个所述临时聚类，计算该临时聚类的均值，以及该临时聚类中每个用户标签和所述均值之间的第二距离，选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心，得到更新后的m个临时聚类；

按照如下公式计算每个更新后的临时聚类的标准差：

其中，σ为所述标准差，μ为用户标签A _i所在的更新后的临时聚类的平均值，i∈[1,n]；

若m个所述更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值，则返回执行所述针对每个所述用户标签，计算该用户标签与当前每个所述聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类的步骤；

若m个所述更新后的临时聚类的标准差均小于所述标准差阈值，则将该m个所述更新后的临时聚类作为所述原始用户标签组。
如权利要求11所述的终端设备，其特征在于，所述根据所述用户的历史行为信息，对所述原始用户标签组进行排序，得到目标用户标签组包括：

基于所述历史行为信息，获取用户标签对应的所述历史行为信息的生成时间；

按照所述生成时间对所述用户标签进行排序，得到用户标签序列；

根据所述用户标签序列，对所述原始用户标签组进行排序，得到所述目标用户标签组。
如权利要求11所述的终端设备，其特征在于，在所述采用词向量的方式对所述用户关键字进行训练，确定用户标签之后，所述处理器执行所述计算机可读指令时还包括实现如下步骤：

根据预设的客户标签库，确定不同的用户群体及其对应的用户标签，得到群体标签；

针对每个所述用户群体，基于所述K-Means聚合算法对所述群体标签进行分类，得到该用户群体对应的原始群体标签组；

针对每个所述用户群体，对所述原始群体标签组进行排序，得到该用户群体对应的群体标签组；

确定所述用户的目标用户群体；

根据每个所述用户群体及其对应的目标群体标签组，获取所述目标用户群体对应的目标群体标签组；

基于所述目标群体标签组，获取群体偏好信息；

从预设的业务标签库中获取所述群体偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。
一个或多个存储有计算机可读指令的非易失性可读存储介质，其特征在于，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行如下步骤：

获取用户的历史行为信息；

对所述历史行为信息进行分析过滤，获取用户关键字；

采用词向量的方式对所述用户关键字进行训练，确定用户标签；

基于K-Means聚合算法对所述用户标签进行分类，得到原始用户标签组；

根据所述用户的历史行为信息，对所述原始用户标签组进行排序，得到目标用户标签组；

基于所述目标用户标签组，获取所述用户的偏好信息；

从预设的业务标签库中获取所述偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。
如权利要求16所述的非易失性可读存储介质，其特征在于，所述采用词向量的方式对所述用户关键字进行训练，确定用户标签包括：

基于预设语料库，构建每个所述用户关键字的基础词向量；

针对每个所述基础词向量，计算该基础词向量与其他基础词向量之间的空间距离，并从所述空间距离中选取最小值作为该基础词向量的最小空间距离；

将所述最小空间距离中小于或等于预设空间距离阈值的基础词向量，作为用户标签。
如权利要求16所述的非易失性可读存储介质，其特征在于，所述基于K-Means聚合算法对所述用户标签进行分类，得到原始用户标签组包括：

从n个用户标签A ₁,A ₂,A ₃,...,A _n中随机选取m个用户标签作为聚类中心，其中，所述n和所述m均为正整数，所述m小于或等于所述n；

针对每个所述用户标签，计算该用户标签与当前每个所述聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类；

针对每个所述临时聚类，计算该临时聚类的均值，以及该临时聚类中每个用户标签和所述均值之间的第二距离，选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心，得到更新后的m个临时聚类；

按照如下公式计算每个更新后的临时聚类的标准差：

其中，σ为所述标准差，μ为用户标签A _i所在的更新后的临时聚类的平均值，i∈[1,n]；

若m个所述更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值，则返回执行所述针对每个所述用户标签，计算该用户标签与当前每个所述聚类中心之间的第一距离，将该用户标签放入最小第一距离对应的聚类中心所在的聚类中，得到m个临时聚类的步骤；

若m个所述更新后的临时聚类的标准差均小于所述标准差阈值，则将该m个所述更新后的临时聚类作为所述原始用户标签组。
如权利要求16所述的非易失性可读存储介质，其特征在于，所述根据所述用户的历史行为信息，对所述原始用户标签组进行排序，得到目标用户标签组包括：

基于所述历史行为信息，获取用户标签对应的所述历史行为信息的生成时间；

按照所述生成时间对所述用户标签进行排序，得到用户标签序列；

根据所述用户标签序列，对所述原始用户标签组进行排序，得到所述目标用户标签组。
如权利要求16所述的非易失性可读存储介质，其特征在于，在所述采用词向量的方式对所述用户关键字进行训练，确定用户标签之后，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器还执行如下步骤：

根据预设的客户标签库，确定不同的用户群体及其对应的用户标签，得到群体标签；

针对每个所述用户群体，基于所述K-Means聚合算法对所述群体标签进行分类，得到该用户群体对应的原始群体标签组；

针对每个所述用户群体，对所述原始群体标签组进行排序，得到该用户群体对应的群体标签组；

确定所述用户的目标用户群体；

根据每个所述用户群体及其对应的目标群体标签组，获取所述目标用户群体对应的目标群体标签组；

基于所述目标群体标签组，获取群体偏好信息；

从预设的业务标签库中获取所述群体偏好信息对应的业务标签，并向所述用户推送所述业务标签对应的业务资讯信息。