CN105426486B - 一种基于用户行为数据的手机app推送方法 - Google Patents

一种基于用户行为数据的手机app推送方法 Download PDF

Info

Publication number
CN105426486B
CN105426486B CN201510812637.5A CN201510812637A CN105426486B CN 105426486 B CN105426486 B CN 105426486B CN 201510812637 A CN201510812637 A CN 201510812637A CN 105426486 B CN105426486 B CN 105426486B
Authority
CN
China
Prior art keywords
app
user
calculated
data
mobile phone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510812637.5A
Other languages
English (en)
Other versions
CN105426486A (zh
Inventor
王宝亮
李丽丽
鹿凯宁
常鹏
张文彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201510812637.5A priority Critical patent/CN105426486B/zh
Publication of CN105426486A publication Critical patent/CN105426486A/zh
Application granted granted Critical
Publication of CN105426486B publication Critical patent/CN105426486B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明提供一种基于用户行为数据的手机app推送方法,包括:1)用户历史行为数据准备2)数据清洗及数据过滤;3)计算每个app的用户集合和偏好分数;4)依据计算出的各个app的用户集合,利用协同过滤算法计算出所有app之间的相似度矩阵;5)潜客挖掘计算。本发明可以针对一个目标应用,较为准确地找到其潜在的用户,避免推荐资源的浪费以及对用户造成的骚扰。

Description

一种基于用户行为数据的手机app推送方法
技术领域
本发明涉及一种手机app推送方法。
背景技术
云计算平台及大数据处理方面:
在当前的信息社会中,各行各业的数据量在不断增长,于此对应,大数据处理技术也在不断进步,最典型的就是分布式处理技术,如Hadoop,MapReduce等。还有公司推出了大数据处理的云平台,提供完整的大数据服务解决方案,如微软的Azure,阿里云的ODPS。借助这些技术和服务,对于任何企业,存储和处理大量用户数据目前都不是问题。大量的数据以及强大的数据处理能力,使得企业可以从数据中挖掘出更多对于业务有价值的信息,设计更多的业务模式,解决一些之前难以解决的问题,从而获得更多利益。,
推荐系统方面:
个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。最典型的推荐算法是协同过滤算法。
手机app推送方面:
随着智能手机的普及,越来越多的手机app出现,数量可以以百万计。面对如此大量的手机app,用户很难找到自己真正喜欢的app来安装,同样,app的开发者也很难让自己的app被真正需要它的用户了解并安装。因此,很多app开发者谋求和手机操作系统合作,借助手机操作系统来推荐自己开发的app给该操作系统的用户。对于手机操作系统来说,要推荐一个app给用户,一个非常重要的方式就是发手机通知,但是,如果推荐的app是用户不喜欢的,用户就不会安装,造成资源浪费,而且会对用户造成骚扰,造成不良的用户体验,因此,手机操作系统在推送app的时候需要能够精准的找到真正对这个app感兴趣的用户群体,这需要一个推荐系统来支持。
手机操作系统方面:
手机的操作系统越来越智能,如google的安卓,苹果的ios,阿里巴巴的云OS,这些手机操作系统能够完全采集用户在手机上的所有操作行为的信息,因此,手机操作系统采集其用户使用app的行为数据并结合目前的大数据处理技术对这些数据进行保存和处理,在目前来讲都不存在问题。
目前,很多手机app的开发者都在与手机操作系统合作,借助手机操作系统推送其app给用户。但是,同一个手机操作系统的用户差异会很大,兴趣也很不一样,如果手机操作系统在推送一个app的时候都给它所有用户都推送一遍,那么肯定会有很多用户不喜欢这个app,也就不会安装,这样无效的推送既浪费资源,有给用户造成不良体验。例如,一个年老的男性用户接到一个手机美颜app的推送信息,就会觉得这个推送是骚扰,相反,如果一个年轻女性接到这个推送,则很有可能会安装,这次推送就是一个有效推送。
发明内容
本发明的目的是提供一种基于用户行为数据的手机app推送方法,通过分析用户的历史行为数据并建模,针对一个目标应用,准确找到其潜在的用户,避免推荐资源的浪费以及对用户造成的骚扰。本发明的技术方案如下:
一种基于用户行为数据的手机app推送方法,包括下列步骤
1)用户历史行为数据准备
利用某个手机操作系统所收集的所有用户对于其手机上的app的操作行为的数据,其中最重要的数据是某个用户打开某个app的时间。
2)数据清洗及数据过滤
根据历史行为数据统计,将一些非常冷门的app相关数据直接丢弃掉;对于某些特别热门的app,也将其相关数据直接丢弃,因为几乎所有人都在用这些app,它的信息并不能反映用户独特的兴趣;对于某些功能性的app,由于它们也不反应人的兴趣,所以相关数据也直接丢弃。
3)计算每个app的用户集合和偏好分数
根据用户在这段历史时期内使用某个app的行为数据,得出这个app的用户集合,并且计算出这些用户对这个app的偏好分数,该分数就是这段时间内用户使用这个app的天数;对所有app都依照上述方法计算出一个用户集合,并依照偏好分数对用户进行排名。
4)计算app相似度矩阵
依据计算出的各个app的用户集合,利用协同过滤算法计算出所有app之间的相似度矩阵,具体方法如下:对于某个app,首先计算这个app和其他app的用户集合的交集,之后再统计这个app和其他app用户集合的并集,最后用交集的数目除以并集的数目,得到相似度分数,设一共有N个app,则一个app就需要和其他N-1个app计算N-1个相似度分数,对于所有app,都需要做这样的计算,最后得到app相似度矩阵。
5)潜客挖掘计算
利用app相似度矩阵,针对一个待推送app计算出其潜在用户,具体过程为:对于待推送app,首先从app相似度矩阵中根据app相似度分数找到排名最高的k个app,之后对于其中每一个相似app,再从它的用户集合中根据用户偏好分数找到排名最高的m个用户,最后计算对应的app相似度分数和用户偏好分数的乘积,作为潜在用户的评分,在具体圈定待推送用户的时候,就根据潜在用户的评分,取排名靠前的作为最后要推送的用户。
本发明的有益效果如下:
1.本发明设计了一种计算手机app推送时圈定潜在用户的算法,能够利用用户的历史数据,挖掘出其对于app的兴趣偏好,使得在推送app的时候可以准确的圈定一小部分真正对这个app感兴趣的用户,起到了节约资源,避免骚扰的作用。
2.在圈定待推送app的潜在用户时,本发明可以根据计算出来的潜在用户评分,方便的调整人数。
3.本发明的计算方法简单,非常方便进行并行化处理。
附图说明
图1本发明的技术方案的总流程图。
图2针对一个待推送app计算出其潜在用户的具体过程的示意图。
具体实施方式
下面结合附图和实施例对本发明进行说明。
本发明提出的方法的基本思想是:对于一个待推送的app,首先找到和它最相近的一些app,再找到使用这些相近app的用户,在进行排名后将排名靠前的用户当作待推送app的潜在用户,进行推送。方案整体示意图如图(1),具体步骤如下:
1用户历史行为数据准备
我们用到的数据是某个手机操作系统所收集的所有用户对于其手机上的app的操作行为数据,最重要的数据是某个用户打开某个app的时间,本方法至少需要三个月的历史行为数据。
2数据清洗及数据过滤
根据历史数据统计,将一些非常冷门的app相关数据直接丢弃掉;对于某些特别热门的app,如QQ,微信等,也将其相关数据直接丢弃,因为几乎所有人都在用这些app,它的信息并不能反映用户独特的兴趣;对于某些功能性的app,如root工具,手电筒等,由于它们也不反应人的兴趣,所以相关数据也直接丢弃。
3计算每个app的用户集合和偏好分数
假设将计算的历史时间段设置为三个月,根据用户在这段历史时期内使用app的行为数据,可以得出每个app的用户集合,并且计算出这些用户对这个app的偏好分数,该分数就是这段时间内用户使用这个app的天数,范围是1到90。对所有app都依照上述方法计算出一个用户集合,并依照偏好分数对用户进行排名。
4计算app相似度矩阵
依据计算出的app的用户集合,我们就可以利用类似于协同过滤算法的方法计算出所有app之间的相似度矩阵,具体方法如下:对于某一个app来讲,首先计算这个app和其他app的用户集合的交集,之后再统计这个app和其他app用户集合的并集,最后用交集的数目除以并集的数目,得到相似度分数。假设一共有N个app,则一个app就需要和其他N-1个app计算N-1个相似分数。对于所有app,都需要做这样的计算,最后得到的就是一个app相似度矩阵。
5潜客挖掘计算
利用计算出的app相似度矩阵,就可以针对一个待推送app计算出其潜在用户了,具体过程的示意图如图(2),对于待推送app,首先从app相似度矩阵中根据app相似度分数找到排名最高的k个app,之后对于其中每一个相似app,再从它的用户集合中根据用户偏好分数找到排名最高的m个用户,最后计算对应的app相似度分数和用户偏好分数的乘积,作为潜在用户的评分。在具体圈定待推送用户的时候,就根据潜在用户的评分,取排名靠前的作为最后要推送的用户。
本发明适用于手机操作系统的app推送业务,如ios,安卓,云OS等,都可以用到。对于用户数据的处理平台,可以选用hadoop或者阿里云的ODPS平台。在计算app相似度矩阵的部分,该矩阵需要每周跟新一次,以保证信息的及时行。对于不同的app,最终确定出来的潜在用户应该有差异,这个数值需要有经验的运营人员来协助确定。

Claims (1)

1.一种基于用户行为数据的手机app推送方法,包括下列步骤
1)用户历史行为数据准备
利用某个手机操作系统所收集的所有用户对于其手机上的app的操作行为的数据,其中最重要的数据是所有用户打开其手机上的app的时间;
2)数据清洗及数据过滤
根据历史行为数据统计,将一些非常冷门的app相关数据直接丢弃掉;对于某些特别热门的app,也将其相关数据直接丢弃,因为几乎所有人都在用这些app,它的信息并不能反映用户独特的兴趣;对于某些功能性的app,由于它们也不反应人的兴趣,所以相关数据也直接丢弃;
3)计算每个app的用户集合和偏好分数
根据用户在这段历史时期内使用某个app的行为数据,得出这个app的用户集合,并且计算出这些用户对这个app的偏好分数,该分数就是这段时间内用户使用这个app的天数;对所有app都依照上述方法计算出一个用户集合,并依照偏好分数对用户进行排名;
4)计算app相似度矩阵
依据计算出的各个app的用户集合,利用协同过滤算法计算出所有app之间的相似度矩阵,具体方法如下:对于某个app,首先计算这个app和其他app的用户集合的交集,之后再统计这个app和其他app用户集合的并集,最后用交集的数目除以并集的数目,得到相似度分数,设一共有N个app,则一个app就需要和其他N-1个app计算N-1个相似度分数,对于所有app,都需要做这样的计算,最后得到app相似度矩阵;
5)潜客挖掘计算
利用app相似度矩阵,针对一个待推送app计算出其潜在用户,具体过程为:对于待推送app,首先从app相似度矩阵中根据app相似度分数找到排名最高的k个app,之后对于其中每一个相似app,再从它的用户集合中根据用户偏好分数找到排名最高的m个用户,最后计算对应的app相似度分数和用户偏好分数的乘积,作为潜在用户的评分,在具体圈定待推送用户的时候,就根据潜在用户的评分,取排名靠前的作为最后要推送的用户。
CN201510812637.5A 2015-11-20 2015-11-20 一种基于用户行为数据的手机app推送方法 Expired - Fee Related CN105426486B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510812637.5A CN105426486B (zh) 2015-11-20 2015-11-20 一种基于用户行为数据的手机app推送方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510812637.5A CN105426486B (zh) 2015-11-20 2015-11-20 一种基于用户行为数据的手机app推送方法

Publications (2)

Publication Number Publication Date
CN105426486A CN105426486A (zh) 2016-03-23
CN105426486B true CN105426486B (zh) 2018-11-09

Family

ID=55504698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510812637.5A Expired - Fee Related CN105426486B (zh) 2015-11-20 2015-11-20 一种基于用户行为数据的手机app推送方法

Country Status (1)

Country Link
CN (1) CN105426486B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106919580B (zh) * 2015-12-25 2021-04-13 腾讯科技(深圳)有限公司 一种信息推送方法及装置
CN106204103B (zh) * 2016-06-24 2018-08-10 有米科技股份有限公司 一种移动广告平台寻找相似用户的方法
CN107644042B (zh) * 2016-07-22 2020-06-30 平安科技(深圳)有限公司 软件程序点击率预估排序方法及服务器
CN107153907A (zh) * 2017-03-22 2017-09-12 华为技术有限公司 一种评估视频业务的潜在用户的方法及相关装置
CN108737203B (zh) * 2017-04-13 2020-07-17 中国移动通信有限公司研究院 一种集合提取的方法及装置
CN108959319B (zh) * 2017-05-25 2023-06-23 腾讯科技(深圳)有限公司 信息推送方法和装置
CN108076154B (zh) * 2017-12-21 2019-12-31 Oppo广东移动通信有限公司 应用信息推荐方法、装置及存储介质和服务器
CN108052983A (zh) * 2017-12-28 2018-05-18 广州优视网络科技有限公司 应用聚类的方法、装置和设备
CN108549674B (zh) * 2018-03-30 2021-11-09 咪咕文化科技有限公司 一种推荐方法、装置及存储介质
CN109189935B (zh) * 2018-07-02 2021-01-12 北京市天元网络技术股份有限公司 一种基于知识图谱的app传播分析方法及系统
CN109919649A (zh) * 2019-01-11 2019-06-21 北京腾云天下科技有限公司 一种目标用户确定方法、装置、计算设备及介质
CN110096614B (zh) * 2019-04-12 2022-09-20 腾讯科技(深圳)有限公司 信息推荐方法及装置、电子设备
CN110795462A (zh) * 2019-10-30 2020-02-14 太华(深圳)技术有限责任公司 一种自适应场景式服务方法
CN110688582B (zh) * 2019-11-12 2022-10-18 广东小天才科技有限公司 一种应用推荐方法、应用推荐装置及终端设备
CN110969201A (zh) * 2019-11-28 2020-04-07 广州云徙科技有限公司 一种企业会员和潜客关系的识别匹配方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544188A (zh) * 2012-07-17 2014-01-29 中国移动通信集团广东有限公司 移动互联网内容的用户偏好推送方法与装置
CN104572962A (zh) * 2014-12-31 2015-04-29 浙江大学 一种app推荐的方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110213651A1 (en) * 2010-03-01 2011-09-01 Opera Solutions, Llc Computer-Implemented Method For Enhancing Targeted Product Sales

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544188A (zh) * 2012-07-17 2014-01-29 中国移动通信集团广东有限公司 移动互联网内容的用户偏好推送方法与装置
CN104572962A (zh) * 2014-12-31 2015-04-29 浙江大学 一种app推荐的方法和系统

Also Published As

Publication number Publication date
CN105426486A (zh) 2016-03-23

Similar Documents

Publication Publication Date Title
CN105426486B (zh) 一种基于用户行为数据的手机app推送方法
Porell Intermetropolitan migration and quality of life.
CN108427708B (zh) 数据处理方法、装置、存储介质和电子装置
CN106528693A (zh) 面向个性化学习的教育资源推荐方法及系统
US9165305B1 (en) Generating models based on user behavior
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
CN102033883A (zh) 一种提高网站数据传输速度的方法、装置及系统
CA3116778A1 (en) Artificial intelligence engine for generating semantic directions for websites for automated entity targeting to mapped identities
CN104102696A (zh) 一种内容推荐方法及装置
CN102902775A (zh) 互联网实时计算的方法和系统
CN105488107A (zh) 一种推荐系统的线下评价方法
CN112380449B (zh) 信息推荐方法、模型训练方法及相关装置
CN102664744B (zh) 网络消息通信中群发推荐的方法
CN105095311A (zh) 推广信息的处理方法、装置及系统
CN105022807A (zh) 信息推荐方法及装置
CN112148946A (zh) 基于微博的分析及视图展示方法与系统
CN114065038A (zh) 基于大数据的头条资讯推荐方法及装置
CN116340643B (zh) 对象推荐的调整方法及装置、存储介质、电子设备
Wrage The effects of internal migration on regional wage and unemployment disparities in Canada.
CN115222433A (zh) 一种信息推荐方法、装置及存储介质
CN112052378A (zh) 智能终端、智能家居应用的推荐方法及系统
Barkan et al. Modelling Session Activity with Neural Embedding.
CN114219663A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN113138977A (zh) 交易转化分析方法、装置、设备及存储介质
JP2011227720A (ja) 推薦システム、推薦方法、及び推薦プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181109

Termination date: 20201120