CN107958070B

CN107958070B - 一种基于用户偏好的个性化消息推送方法

Info

Publication number: CN107958070B
Application number: CN201711271886.3A
Authority: CN
Inventors: 阎俊英
Original assignee: Shanghai Dianji University
Current assignee: Shanghai Dianji University
Priority date: 2017-12-05
Filing date: 2017-12-05
Publication date: 2021-11-12
Anticipated expiration: 2037-12-05
Also published as: CN107958070A

Abstract

本发明涉及一种基于用户偏好的个性化消息推送方法，步骤包括：搜集用户的行为，根据用户的偏好，建立用户的兴趣模型。服务器在对用户推送信息之前，判断该信息是否与用户的兴趣模型相匹配，如果匹配，则向用户进行个性化的推送。本发明的优点是：对用户行为进行了充分的分析，考虑了用户标签的浏览频率、浏览时间及浏览时间段等行为，建立用户偏好模型。通过这种方法，信息只推送给感兴趣的用户，而且在用户的最佳时间进行推送，大大提高了用户的体验度。

Description

一种基于用户偏好的个性化消息推送方法

技术领域

本发明涉及一种根据用户的偏好进行个性化消息推送的方法。

背景技术

随着移动互联网的发展，消息推送得到了越来越多的应用。推送技术是指根据一定的发送规则，依据相关的标准和协议通过互联网向用户发送信息的技术。电子商务厂商纷纷向用户的智能移动终端上推送各类信息。

消息推送技术主要有两种方式：一种是客户端使用PULL的方式，就是隔一段时间就去服务器上获取信息，这种方法不仅浪费了用户宝贵的时间和流量，还增加了服务器的压力，降低处理效率，己不再适用。另一种就是服务器使用PUSH的方式，服务器端把最新的信息PUSH到客户端上。传统的PUSH方式虽然可以及时把最新信息推送给用户，但是所推送的信息可能是用户所不关心的。

综上，目前的消息推送服务存在一些不足：现在的推送服务多为群发形式，服务器将某一条信息推送给所有的用户，而不是真正需要这类信息的用户，因此对于大多数用户来说是无效信息，不仅浪费用户的流量，而且还会对用户产生一定的困扰，降低了用户体验效果。目前国内外学者已经有大量关于偏好分析的研究成果，算法也多比较成熟，各大网站的应用也比较普遍广泛，但是还未有将用户行为偏好分析应用于移动服务的情况。

发明内容

本发明的目的是：将用户行为偏好分析应用于移动服务，从而实现根据用户的偏好进行消息推送。

为了达到上述目的，本发明的技术方案是提供了一种基于用户偏好的个性化消息推送方法，其特征在于，包括以下步骤：

步骤1、使用向量空间模型VSM方法创建用户兴趣模型U＝{t_i，w_i，T}，其中t_i表示第i个标签，w_i表示第i个标签的权重，T表示用户偏好访问的时间；

步骤2、将以资源为维度的资源-标签映射，转变为以标签为维度的标签-资源映射，对于第i个标签t_i及第k个资源的特征向量集合r_k＝{t₁，t₂，...，t_i，...，t_n}，若t_i∈r_k，则将第k个资源加入到第i个标签t_i中；

步骤3、通过分析服务器的数据库得到用户感兴趣的标签所对应的资源集R，按照标签对资源集R进行过滤，得到用户U_i可能感兴趣的资源子集R_Ui，根据用户的兴趣模型U＝{t_i，w_i，T}中的用户偏好访问的时间T，每天在时间T前将资源子集R_Ui推送给用户，或用户登录系统后，将资源子集RU_i根据用户标签的权重排序后，由高到低呈现给用户。

优选地，所述步骤1包括：

步骤1.1、从服务器数据库中获取用户的操作日志，搜集：1)用户的登录与注销记录，获取用户访问系统最频繁的时间T；2)对用户浏览过的所有数据进行预处理，每个数据对应一个资源，建立用户-资源-标签的映射，根据TF-IDF算法，建立每个资源的特征向量集合r_k＝{t₁，t₂，...，t_i，...，t_n}，其中，r_k表示第k个资源的特征向量集合，t_i表示第i个标签；

步骤1.2、从用户-资源-标签的映射中提取出用户的所有标签集合，若标签被资源共用过，则标签之间有连线，从而建立用户的标签网络；

步骤1.3、计算标签的权重，包括以下步骤：

步骤1.3.1、根据标签的出现次数，对标签的权值进行初赋值，第i个标签t_i的初值权值为WI(ti)＝f(ti)，f(ti)表示第i个标签t_i出现的频率，其值为第i个标签t_i出现的次数与所有标签对当前用户出现的总次数，WI(ti)≤1；

步骤1.3.2、根据每个标签在标签网络中与其他标签的连接性，计算当前标签在标签网络中的中心度，根据中心度修改每个标签的权重，第i个标签t_i的权重为WC(t_i)＝∑_j∈set(i)w_j，式中，set(i)为与第i个标签t_i相连的标签集合，w为标签集合set(i)中第j个标签的权重值；

步骤1.3.3、计算每个标签的最终权重，第i个标签t_i的最终权重为w_i，w_i＝aWI(t_i)+bWC(t_i)，式中，a、b是常数，且a+b＝1，最终得出每个标签的权重，然后根据标签的权重由高到低进行排列，将低于阈值的标签舍弃，从而获得创建用户兴趣模型U。

传统的消息推送没有考虑用户的偏好，将信息推送给所有的用户，多数用户对此信息往往不敢兴趣。本发明基于用户偏好的个性化消息推送方法，通过分析搜集用户的浏览行为，分析用户所浏览的信息中不同标签之间的联系，给出标签关系网络模型；再对初步得到的标签网络根据一定的算法进行加权计算，给出用户标签偏好，获得用户-标签映射，即用户偏好模型。然后建立资源(即信息)-标签映射，实现对资源的分类。在进行信息推送之前，根据用户偏好模型，对资源进行过滤，避免了无目的的群发推送。

本发明的优点是：对用户行为进行了充分的分析，考虑了用户标签的浏览频率、浏览时间及浏览时间段等行为，建立用户偏好模型。通过这种方法，信息只推送给感兴趣的用户，而且在用户的最佳时间进行推送，大大提高了用户的体验度。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

在本发明中，首先通过定性和定量两种方式，对用户的行为偏好进行分析，然后对用户的偏好进行建模。对用户的消息推送分为两种形式：一是，将服务器上的信息根据用户的偏好模型进行过滤后，定期将符合用户偏好的信息主动推送给用户；二是，当用户登录到客户端后，根据用户的偏好模型将用户感兴趣的信息经过排序后，展示给用户。

本发明提供的一种基于用户偏好的个性化消息推送方法，其特征在于，包括以下步骤：

步骤1、使用向量空间模型VSM方法创建用户兴趣模型U＝{t_i，w_i，T}，其中t_i表示第i个标签，w_i表示第i个标签的权重，T表示用户偏好访问的时间，包括：

步骤1.3、计算标签的权重，包括以下步骤：

步骤1.3.3、计算每个标签的最终权重，第i个标签t_i的最终权重为w_i，w_i＝aWI(t_i)+bWC(t_i)，式中，a、b是常数，且a+b＝1，最终得出每个标签的权重，然后根据标签的权重由高到低进行排列，将低于阈值的标签舍弃，从而获得创建用户兴趣模型U；

步骤3、通过分析服务器的数据库得到用户感兴趣的标签所对应的资源集R，按照标签对资源集R进行过滤，得到用户U_i可能感兴趣的资源子集R_Ui。如用户U_i有标签{t₁，t₂，t₃}，标签t₁、t₂、t₃分别对应资源r₁、r₂、r₃，则用户Ui的资源子集R_Ui为{r₁，r₂，r₃}。个性化推送分为两种形式：一，根据用户的兴趣模型U＝{t_i，w_i，T}中的T，即用户偏好的浏览时间，每天在此时间前将资源子集推送给用户。二，用户登录系统后，将资源子集根据用户标签的权重排序后，由高到低呈现给用户。

Claims

1.一种基于用户偏好的个性化消息推送方法，其特征在于，包括以下步骤：

步骤1、使用向量空间模型VSM方法创建用户兴趣模型U＝{t_i，w_i，T}，其中t_i表示第i个标签，w_i表示第i个标签的权重，T表示用户偏好访问的时间，包括以下步骤：

步骤1.1、从服务器数据库中获取用户的操作日志，搜集：1)用户的登录与注销记录，获取用户访问系统最频繁的时间T；2)对用户浏览过的所有数据进行预处理，每个数据对应一个资源，建立用户-资源-标签的映射，根据TF-IDF算法，建立每个资源的特征向量集合r_k＝{t₁，t₂，…，t_i，…，t_n}，其中，r_k表示第k个资源的特征向量集合，t_i表示第i个标签；

步骤1.3、计算标签的权重，包括以下步骤：

步骤1.3.2、根据每个标签在标签网络中与其他标签的连接性，计算当前标签在标签网络中的中心度，根据中心度修改每个标签的权重，第i个标签t_i的权重为WC(t_i)＝∑_j∈set(i)w_j，式中，set(i)为与第i个标签t_i相连的标签集合，w_为标签集合set(i)中第j个标签的权重值；

步骤2、将以资源为维度的资源-标签映射，转变为以标签为维度的标签-资源映射，对于第i个标签t_i及第k个资源的特征向量集合r_k＝{t₁，t₂，…，t_i，…，t_n}，若t_i∈r_k，则将第k个资源加入到第i个标签t_i中；

步骤3、通过分析服务器的数据库得到用户感兴趣的标签所对应的资源集R，按照标签对资源集R进行过滤，得到用户U_i可能感兴趣的资源子集RU_i，根据用户的户兴趣模型U＝{t_i，w_i，T}中的用户偏好访问的时间T，每天在时间T前将资源子集RU_i推送给用户，或用户登录系统后，将资源子集RU_i根据用户标签的权重排序后，由高到低呈现给用户。