CN107958070B - 一种基于用户偏好的个性化消息推送方法 - Google Patents
一种基于用户偏好的个性化消息推送方法 Download PDFInfo
- Publication number
- CN107958070B CN107958070B CN201711271886.3A CN201711271886A CN107958070B CN 107958070 B CN107958070 B CN 107958070B CN 201711271886 A CN201711271886 A CN 201711271886A CN 107958070 B CN107958070 B CN 107958070B
- Authority
- CN
- China
- Prior art keywords
- user
- label
- resource
- weight
- ith
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000013507 mapping Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及一种基于用户偏好的个性化消息推送方法,步骤包括:搜集用户的行为,根据用户的偏好,建立用户的兴趣模型。服务器在对用户推送信息之前,判断该信息是否与用户的兴趣模型相匹配,如果匹配,则向用户进行个性化的推送。本发明的优点是:对用户行为进行了充分的分析,考虑了用户标签的浏览频率、浏览时间及浏览时间段等行为,建立用户偏好模型。通过这种方法,信息只推送给感兴趣的用户,而且在用户的最佳时间进行推送,大大提高了用户的体验度。
Description
技术领域
本发明涉及一种根据用户的偏好进行个性化消息推送的方法。
背景技术
随着移动互联网的发展,消息推送得到了越来越多的应用。推送技术是指根据一定的发送规则,依据相关的标准和协议通过互联网向用户发送信息的技术。电子商务厂商纷纷向用户的智能移动终端上推送各类信息。
消息推送技术主要有两种方式:一种是客户端使用PULL的方式,就是隔一段时间就去服务器上获取信息,这种方法不仅浪费了用户宝贵的时间和流量,还增加了服务器的压力,降低处理效率,己不再适用。另一种就是服务器使用PUSH的方式,服务器端把最新的信息PUSH到客户端上。传统的PUSH方式虽然可以及时把最新信息推送给用户,但是所推送的信息可能是用户所不关心的。
综上,目前的消息推送服务存在一些不足:现在的推送服务多为群发形式,服务器将某一条信息推送给所有的用户,而不是真正需要这类信息的用户,因此对于大多数用户来说是无效信息,不仅浪费用户的流量,而且还会对用户产生一定的困扰,降低了用户体验效果。目前国内外学者已经有大量关于偏好分析的研究成果,算法也多比较成熟,各大网站的应用也比较普遍广泛,但是还未有将用户行为偏好分析应用于移动服务的情况。
发明内容
本发明的目的是:将用户行为偏好分析应用于移动服务,从而实现根据用户的偏好进行消息推送。
为了达到上述目的,本发明的技术方案是提供了一种基于用户偏好的个性化消息推送方法,其特征在于,包括以下步骤:
步骤1、使用向量空间模型VSM方法创建用户兴趣模型U={ti,wi,T},其中ti表示第i个标签,wi表示第i个标签的权重,T表示用户偏好访问的时间;
步骤2、将以资源为维度的资源-标签映射,转变为以标签为维度的标签-资源映射,对于第i个标签ti及第k个资源的特征向量集合rk={t1,t2,...,ti,...,tn},若ti∈rk,则将第k个资源加入到第i个标签ti中;
步骤3、通过分析服务器的数据库得到用户感兴趣的标签所对应的资源集R,按照标签对资源集R进行过滤,得到用户Ui可能感兴趣的资源子集RUi,根据用户的兴趣模型U={ti,wi,T}中的用户偏好访问的时间T,每天在时间T前将资源子集RUi推送给用户,或用户登录系统后,将资源子集RUi根据用户标签的权重排序后,由高到低呈现给用户。
优选地,所述步骤1包括:
步骤1.1、从服务器数据库中获取用户的操作日志,搜集:1)用户的登录与注销记录,获取用户访问系统最频繁的时间T;2)对用户浏览过的所有数据进行预处理,每个数据对应一个资源,建立用户-资源-标签的映射,根据TF-IDF算法,建立每个资源的特征向量集合rk={t1,t2,...,ti,...,tn},其中,rk表示第k个资源的特征向量集合,ti表示第i个标签;
步骤1.2、从用户-资源-标签的映射中提取出用户的所有标签集合,若标签被资源共用过,则标签之间有连线,从而建立用户的标签网络;
步骤1.3、计算标签的权重,包括以下步骤:
步骤1.3.1、根据标签的出现次数,对标签的权值进行初赋值,第i个标签ti的初值权值为WI(ti)=f(ti),f(ti)表示第i个标签ti出现的频率,其值为第i个标签ti出现的次数与所有标签对当前用户出现的总次数,WI(ti)≤1;
步骤1.3.2、根据每个标签在标签网络中与其他标签的连接性,计算当前标签在标签网络中的中心度,根据中心度修改每个标签的权重,第i个标签ti的权重为WC(ti)=∑j∈set(i)wj,式中,set(i)为与第i个标签ti相连的标签集合,w为标签集合set(i)中第j个标签的权重值;
步骤1.3.3、计算每个标签的最终权重,第i个标签ti的最终权重为wi,wi=aWI(ti)+bWC(ti),式中,a、b是常数,且a+b=1,最终得出每个标签的权重,然后根据标签的权重由高到低进行排列,将低于阈值的标签舍弃,从而获得创建用户兴趣模型U。
传统的消息推送没有考虑用户的偏好,将信息推送给所有的用户,多数用户对此信息往往不敢兴趣。本发明基于用户偏好的个性化消息推送方法,通过分析搜集用户的浏览行为,分析用户所浏览的信息中不同标签之间的联系,给出标签关系网络模型;再对初步得到的标签网络根据一定的算法进行加权计算,给出用户标签偏好,获得用户-标签映射,即用户偏好模型。然后建立资源(即信息)-标签映射,实现对资源的分类。在进行信息推送之前,根据用户偏好模型,对资源进行过滤,避免了无目的的群发推送。
本发明的优点是:对用户行为进行了充分的分析,考虑了用户标签的浏览频率、浏览时间及浏览时间段等行为,建立用户偏好模型。通过这种方法,信息只推送给感兴趣的用户,而且在用户的最佳时间进行推送,大大提高了用户的体验度。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
在本发明中,首先通过定性和定量两种方式,对用户的行为偏好进行分析,然后对用户的偏好进行建模。对用户的消息推送分为两种形式:一是,将服务器上的信息根据用户的偏好模型进行过滤后,定期将符合用户偏好的信息主动推送给用户;二是,当用户登录到客户端后,根据用户的偏好模型将用户感兴趣的信息经过排序后,展示给用户。
本发明提供的一种基于用户偏好的个性化消息推送方法,其特征在于,包括以下步骤:
步骤1、使用向量空间模型VSM方法创建用户兴趣模型U={ti,wi,T},其中ti表示第i个标签,wi表示第i个标签的权重,T表示用户偏好访问的时间,包括:
步骤1.1、从服务器数据库中获取用户的操作日志,搜集:1)用户的登录与注销记录,获取用户访问系统最频繁的时间T;2)对用户浏览过的所有数据进行预处理,每个数据对应一个资源,建立用户-资源-标签的映射,根据TF-IDF算法,建立每个资源的特征向量集合rk={t1,t2,...,ti,...,tn},其中,rk表示第k个资源的特征向量集合,ti表示第i个标签;
步骤1.2、从用户-资源-标签的映射中提取出用户的所有标签集合,若标签被资源共用过,则标签之间有连线,从而建立用户的标签网络;
步骤1.3、计算标签的权重,包括以下步骤:
步骤1.3.1、根据标签的出现次数,对标签的权值进行初赋值,第i个标签ti的初值权值为WI(ti)=f(ti),f(ti)表示第i个标签ti出现的频率,其值为第i个标签ti出现的次数与所有标签对当前用户出现的总次数,WI(ti)≤1;
步骤1.3.2、根据每个标签在标签网络中与其他标签的连接性,计算当前标签在标签网络中的中心度,根据中心度修改每个标签的权重,第i个标签ti的权重为WC(ti)=∑j∈set(i)wj,式中,set(i)为与第i个标签ti相连的标签集合,w为标签集合set(i)中第j个标签的权重值;
步骤1.3.3、计算每个标签的最终权重,第i个标签ti的最终权重为wi,wi=aWI(ti)+bWC(ti),式中,a、b是常数,且a+b=1,最终得出每个标签的权重,然后根据标签的权重由高到低进行排列,将低于阈值的标签舍弃,从而获得创建用户兴趣模型U;
步骤2、将以资源为维度的资源-标签映射,转变为以标签为维度的标签-资源映射,对于第i个标签ti及第k个资源的特征向量集合rk={t1,t2,...,ti,...,tn},若ti∈rk,则将第k个资源加入到第i个标签ti中;
步骤3、通过分析服务器的数据库得到用户感兴趣的标签所对应的资源集R,按照标签对资源集R进行过滤,得到用户Ui可能感兴趣的资源子集RUi。如用户Ui有标签{t1,t2,t3},标签t1、t2、t3分别对应资源r1、r2、r3,则用户Ui的资源子集RUi为{r1,r2,r3}。个性化推送分为两种形式:一,根据用户的兴趣模型U={ti,wi,T}中的T,即用户偏好的浏览时间,每天在此时间前将资源子集推送给用户。二,用户登录系统后,将资源子集根据用户标签的权重排序后,由高到低呈现给用户。
Claims (1)
1.一种基于用户偏好的个性化消息推送方法,其特征在于,包括以下步骤:
步骤1、使用向量空间模型VSM方法创建用户兴趣模型U={ti,wi,T},其中ti表示第i个标签,wi表示第i个标签的权重,T表示用户偏好访问的时间,包括以下步骤:
步骤1.1、从服务器数据库中获取用户的操作日志,搜集:1)用户的登录与注销记录,获取用户访问系统最频繁的时间T;2)对用户浏览过的所有数据进行预处理,每个数据对应一个资源,建立用户-资源-标签的映射,根据TF-IDF算法,建立每个资源的特征向量集合rk={t1,t2,…,ti,…,tn},其中,rk表示第k个资源的特征向量集合,ti表示第i个标签;
步骤1.2、从用户-资源-标签的映射中提取出用户的所有标签集合,若标签被资源共用过,则标签之间有连线,从而建立用户的标签网络;
步骤1.3、计算标签的权重,包括以下步骤:
步骤1.3.1、根据标签的出现次数,对标签的权值进行初赋值,第i个标签ti的初值权值为WI(ti)=f(ti),f(ti)表示第i个标签ti出现的频率,其值为第i个标签ti出现的次数与所有标签对当前用户出现的总次数,WI(ti)≤1;
步骤1.3.2、根据每个标签在标签网络中与其他标签的连接性,计算当前标签在标签网络中的中心度,根据中心度修改每个标签的权重,第i个标签ti的权重为WC(ti)=∑j∈set(i)wj,式中,set(i)为与第i个标签ti相连的标签集合,w为标签集合set(i)中第j个标签的权重值;
步骤1.3.3、计算每个标签的最终权重,第i个标签ti的最终权重为wi,wi=aWI(ti)+bWC(ti),式中,a、b是常数,且a+b=1,最终得出每个标签的权重,然后根据标签的权重由高到低进行排列,将低于阈值的标签舍弃,从而获得创建用户兴趣模型U;
步骤2、将以资源为维度的资源-标签映射,转变为以标签为维度的标签-资源映射,对于第i个标签ti及第k个资源的特征向量集合rk={t1,t2,…,ti,…,tn},若ti∈rk,则将第k个资源加入到第i个标签ti中;
步骤3、通过分析服务器的数据库得到用户感兴趣的标签所对应的资源集R,按照标签对资源集R进行过滤,得到用户Ui可能感兴趣的资源子集RUi,根据用户的户兴趣模型U={ti,wi,T}中的用户偏好访问的时间T,每天在时间T前将资源子集RUi推送给用户,或用户登录系统后,将资源子集RUi根据用户标签的权重排序后,由高到低呈现给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711271886.3A CN107958070B (zh) | 2017-12-05 | 2017-12-05 | 一种基于用户偏好的个性化消息推送方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711271886.3A CN107958070B (zh) | 2017-12-05 | 2017-12-05 | 一种基于用户偏好的个性化消息推送方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107958070A CN107958070A (zh) | 2018-04-24 |
CN107958070B true CN107958070B (zh) | 2021-11-12 |
Family
ID=61957483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711271886.3A Expired - Fee Related CN107958070B (zh) | 2017-12-05 | 2017-12-05 | 一种基于用户偏好的个性化消息推送方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107958070B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108846062B (zh) * | 2018-06-04 | 2019-08-13 | 上海市疾病预防控制中心 | 基于用户个性化需求的推送方法 |
CN110020194B (zh) * | 2018-08-09 | 2021-10-08 | 南京尚网网络科技有限公司 | 资源推荐方法、装置及介质 |
CN109067643B (zh) * | 2018-09-26 | 2022-07-29 | 中国平安财产保险股份有限公司 | 基于关键字的回复方法、装置、计算机设备及存储介质 |
CN113590441A (zh) * | 2021-06-29 | 2021-11-02 | 中孚安全技术有限公司 | 一种基于权重计算的内网用户行为分析方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101923545A (zh) * | 2009-06-15 | 2010-12-22 | 北京百分通联传媒技术有限公司 | 一种个性化信息推荐的方法 |
CN102890689A (zh) * | 2011-07-22 | 2013-01-23 | 北京百度网讯科技有限公司 | 一种用户兴趣模型的建立方法及系统 |
CN103778260A (zh) * | 2014-03-03 | 2014-05-07 | 哈尔滨工业大学 | 一种个性化微博信息推荐系统和方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080183681A1 (en) * | 2007-01-29 | 2008-07-31 | Samsung Electronics Co., Ltd. | Method and system for facilitating information searching on electronic devices |
-
2017
- 2017-12-05 CN CN201711271886.3A patent/CN107958070B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101923545A (zh) * | 2009-06-15 | 2010-12-22 | 北京百分通联传媒技术有限公司 | 一种个性化信息推荐的方法 |
CN102890689A (zh) * | 2011-07-22 | 2013-01-23 | 北京百度网讯科技有限公司 | 一种用户兴趣模型的建立方法及系统 |
CN103778260A (zh) * | 2014-03-03 | 2014-05-07 | 哈尔滨工业大学 | 一种个性化微博信息推荐系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107958070A (zh) | 2018-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107958070B (zh) | 一种基于用户偏好的个性化消息推送方法 | |
CN107862553B (zh) | 广告实时推荐方法、装置、终端设备及存储介质 | |
CN109241427B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN106528693B (zh) | 面向个性化学习的教育资源推荐方法及系统 | |
CN102541999B (zh) | 对象敏感的图像搜索 | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
CN110462604A (zh) | 基于设备使用关联互联网设备的数据处理系统和方法 | |
CN101266620B (zh) | 向用户提供目标信息的方法及设备 | |
CN112765480B (zh) | 一种信息推送方法、装置及计算机可读存储介质 | |
CN106375369A (zh) | 基于用户行为分析的移动Web业务推荐方法及协同推荐系统 | |
CN111522735B (zh) | 测试实验的分流方法及装置 | |
CN110727864B (zh) | 一种基于手机App安装列表的用户画像方法 | |
CN110019703A (zh) | 数据标记方法及装置、智能问答方法及系统 | |
CN111027838A (zh) | 一种众包任务推送方法、装置、设备及其存储介质 | |
CN105701224B (zh) | 一种基于大数据的证券资讯个性化服务系统 | |
CN106682206A (zh) | 一种大数据处理方法及系统 | |
CN116228319A (zh) | 基于埋点的智能广告投放方法与系统 | |
CN109615437A (zh) | 销售获客跟踪管理方法 | |
CN112529638A (zh) | 基于用户分类和深度学习的服务需求动态预测方法及系统 | |
Chakraborty et al. | Clustering of web sessions by FOGSAA | |
CN111506813A (zh) | 一种基于用户画像的遥感信息精准推荐方法 | |
CN112003884A (zh) | 一种网络资产的采集和自然语言检索方法 | |
CN117216362A (zh) | 内容推荐方法、装置、设备、介质和程序产品 | |
CN112118486B (zh) | 内容项投放方法、装置、计算机设备及存储介质 | |
CN111400567B (zh) | 一种基于ai的用户数据的处理方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211112 |
|
CF01 | Termination of patent right due to non-payment of annual fee |