CN105404943A - 一种面向移动社交环境的用户行为预测方法 - Google Patents
一种面向移动社交环境的用户行为预测方法 Download PDFInfo
- Publication number
- CN105404943A CN105404943A CN201510897272.0A CN201510897272A CN105404943A CN 105404943 A CN105404943 A CN 105404943A CN 201510897272 A CN201510897272 A CN 201510897272A CN 105404943 A CN105404943 A CN 105404943A
- Authority
- CN
- China
- Prior art keywords
- user
- behavior
- business conduct
- node
- frequent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种面向移动社交环境的用户行为预测方法。该方法首先通过基于编码的二维Apriori方法实现用户行为的关联分析:一方面将目标用户当前的业务行为及其上一时刻的业务行为做关联分析;另一方面先采用影响力因子公式分离出用户的<i>n</i>个朋友圈用户,获得各用户的影响力因子,然后将目标用户当前的业务行为分别及其<i>n</i>个朋友圈用户上一时刻的业务行为做关联分析;最后,采用基于影响力因子改进的最优加权融合方法将上述<i>n+</i>1个关联分析结果进行融合,预测目标用户下一时刻的业务行为。本发明方法考虑用户受到自身的影响以及朋友圈其他用户对其的影响,对移动社交网络的中用户行为进行预测,可有效地提高预测的准确性,适用于用户业务推荐。
Description
技术领域
本发明属于无线通信技术领域,具体涉及一种面向移动社交环境的用户行为预测方法。
背景技术
随着智能移动设备和移动互联网技术的快速发展,移动社交网络(MSN)也呈蓬勃发展势头。移动社交网络是在传统的社交网络的基础上发展起来的,主要是为用户提供方便的网络服务和帮助。作为一种新兴的社交网络,移动社交网络为用户提供了一个交流平台,用户可以通过移动设备和其他人进行交互,找到拥有相同兴趣爱好的朋友圈。用户是移动社交网络的主体,通过了解用户的特性采取一定的措施,这样才能保证移动社交网络的正常发展。为用户提供更好的服务,满足大部分用户的需求,已经成为移动社交网络研究的重要组成部分。
而现阶段,移动互联网服务和信息内容的日益增长将逐渐超出人们所能接受的范围,加之移动设备的界面显示、终端处理、输入/输出等能力有限,为移动用户带来沉重的“移动信息过载问题”,导致移动网络资源利用率和用户体验受到严重影响。而且对于大型的发展中的移动社交圈而言,网络中是否存在用户群体,如何识别用户群体及其特征,以及为用户提供更好的服务,这都是需要进行深入研究的。而且,移动社交环境下的用户行为分析和网络本身的性能是息息相关的,用户是网络服务的主体,适应用户行为的网络体系才能实现资源的最优配置。用户行为显著影响网络性能,而网络应用也必须建立在深刻了解用户行为的基础上。因此,在未来移动社交网络的发展中,研究用户的行为特征,不仅可以为用户提供更好的服务,提升用户体验,而且对移动社交网络的资源优化有一定的研究意义。
移动社交网络的核心是“以人为本”,提供各种社交应用满足用户需求。虽然,群体性是移动社交网络的一大特点,但是,在研究群体之前,必须清楚个体的行为特征。“个性化推荐服务”已经成为提升用户体验的重要渠道。随着大数据时代的到来,用户在移动社交网络中的业务行为也变得越来越复杂。现有的算法难以满足日益复杂的移动社交网络的推荐需求。因此,在移动服务推荐系统中,常用关联挖掘方法来获得用户行为之间的关联关系,分析用户的当前时刻及上一时刻的业务行为,预测其下一时刻的业务行为。
目前,有很多关联规则挖掘算法,而Apriori算法是最经典的关联规则挖掘算法。它利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则,其过程由连接与剪枝组成。针对该算法的效率瓶颈问题,结合移动社交环境的特点采用一种基于编码的二维Apriori方法用于挖掘用户行为来提高运行效率。该方法的核心思想和步骤是:首先统计用户上一时刻和当前时刻的业务行为,并对统计后的数据进行二进制编码,然后采用“与”运算取代传统Apriori算法得到频繁集。而且,朋友圈的划分以及关联结果的数据融合,提高了算法的准确性。
发明内容
为了克服上述现有技术的不足,本发明提出一种面向移动社交环境的用户行为预测方法。该方法考虑用户受到自身的影响以及朋友圈其他用户对其的影响。对移动社交网络的中用户行为进行预测,可有效地提高预测的准确性,适用于用户业务推荐。
为了解决上述技术问题,本发明采用的技术方案是:
本发明即面向移动社交环境的用户行为预测方法,其具体过程为:
步骤A,采用基于编码的二维Apriori方法实现用户行为的关联分析,所述用户行为是指用户的业务行为,包括视频业务行为,新闻业务行为,聊天文本业务行为等,所述关联分析的具体步骤如下:
步骤A-1,将目标用户上一时刻的业务行为及当前时刻的业务行为做关联分析,首先统计各条记录中目标用户上一时刻和当前时刻产生的业务行为,即各条记录中如果业务行为发生记为1,不发生记为0,并对统计的数据进行二进制编码处理,然后采用“与”运算取代传统Apriori算法得到频繁集,进而可获得频繁关联规则,由频繁关联规则预测目标用户下一时刻产生的业务行为;
步骤A-2,将目标用户当前时刻的业务行为分别与所述移动社交环境中其n个朋友圈用户上一时刻的业务行为做关联分析,首先统计各条记录中目标用户当前时刻产生的业务行为及其n个朋友圈用户上一时刻产生的业务行为,即各条记录中如果业务行为发生记为1,不发生记为0,并对统计的数据进行二进制编码,最后采用编码“与”运算取代传统Apriori算法得到频繁集,进而可获得频繁关联规则,由频繁关联规则预测目标用户下一时刻产生的业务行为;
步骤B,使用影响力因子公式在目标用户的朋友圈中获得n个朋友圈用户,影响力因子公式为:
其中,表示一个时间段内用户m和用户ni间的影响力因子;表示一个时间段内用户m和用户ni同时在线的在线时长,i是用户标号,为正整数;SNm表示一个时间段内用户m的在线时长;表示一个时间段内用户m和用户ni交互的次数,INm表示一个时间段内用户m总的交互次数。α,β为权重参数,且α+β=1。α,β通过多次实验获得,而且影响力因子的值是介于0和1之间的,由于考虑到实际情况,用户受自身的影响较大,所以用户受自身影响的影响力因子设为T(m,m)=1;
步骤C,将步骤A中获得的n+1个关联分析结果视为n+1个节点,对其进行融合分析;
假设各节点的方差分别为各个节点支持度的均值分别设为x1,x2,....,xn+1,这些值彼此间相互独立,各个节点的权值系数分别为ω1,ω2,...,ωn+1,则融合分析包含步骤如下:
步骤C-1,对每个节点多次采样取平均值,求出各个节点关于一个频繁关联规则支持度的方差;
步骤C-2,求出各个节点最终的权值系数
初始权值系数ωl为:
则最终的权值系数为:
其中,l是节点标号,为正整数,且1≤l≤n+1;
步骤C-3,求出节点融合值x;
权值系数ωl *必须满足:节点融合值x即为这个频繁关联规则的最终支持度,x越大则表明这个频繁关联规则发生的可能性越高,由此针对用户行为关联分析的预测建模,有效提高用户行为预测的准确性。
有益效果:
1、本发明提出了基于编码的二维Apriori方法实现用户行为的关联分析,克服了传统Apriori方法的效率瓶颈问题,有利于提高预测模型的效率。
2、基于编码的二维Apriori方法使用编码方式来实现频繁集的获取,在做用户行为的关联分析时可以大大降低扫描数据库的次数,节约时间。
3、本发明根据影响力因子公式获得朋友圈用户,然后分别与目标用户做关联分析,从而有效提高预测方法的准确性。
4、本发明采用基于影响力因子改进的最优加权融合方法将关联分析结果进行融合。有利于提高预测方法的准确性。
5、本发明产生的面向移动社交环境的用户行为预测方法非常简单而易于实现,具有很好的应用前景。
附图说明
图1为数据融合框图。
图2为面向移动社交环境的用户行为预测方法流程图。
具体实施方式
下面结合附图对发明的技术方案进行详细说明:
本发明提出了一种面向移动社交环境的用户行为预测方法,根据移动社交环境的群体性,交互性,实时性特点,通过基于编码的二维Apriori方法实现用户行为分析,为用户提供准确的联合业务推荐。
本发明主要包括三个内容:一是用户行为的关联分析,利用基于编码的二维Apriori方法实现用户业务行为的关联分析;二是朋友圈的划分,采用影响力因子公式获得目标用户的朋友圈用户;三是将关联分析结果融合在一起,预测目标用户下一时刻的业务行为。
1.基于编码的二维Apriori方法实现用户行为的关联分析
基于用户自身业务行为的关联分析:
首先,将某一个用户上一时刻的业务行为和当前时刻的业务行为做关联分析。为了便于分辨,记某个目标用户为m。表1-1所示为一个简单的移动社交环境用户m的业务行为数据表,共有7条记录,2个属性(维)。用户的业务类型可以分成n类,如:新闻业务,视频业务,音乐业务,聊天文本业务等。
表1-1移动社交环境用户m的业务行为数据表
对表1-1的业务行为数据表用符号来表示,最终得表1-2事务数据表。
表1-2事务数据表
其中,Tj表示一个记录内目标用户上一时刻的业务行为和当前时刻的业务行为Ik表示用户业务类型,分别表示新闻业务,视频业务,音乐业务,聊天文本业务,游戏业务,网购业务,j是时间段标号,k是业务类型标号。
下面以表1-2所示的事务数据表为例,设最小支持度阈值为20%,利用基于编码的二维Apriori方法生成频繁项集的过程如下:
第一步,扫描事务数据表,对事务项编码,形成项编码表,如表1-3所示:
表1-3项编码表
第二步,根据项的编码计数,得到频繁1-项集L1,如表1-4所示:
表1-4生成频繁1-项集L1
第三步,由L1生成L2,通过“与”运算就可获得结果,不需要重复扫描数据表,如表1-5所示:
表1-5由L1生成L2
由于本发明采用的基于编码的二维Apriori方法,所以只挖掘到频繁2-项集L2结束。设最小置信度为75%,则根据频繁项集求事务数据库D中的所有频繁关联规则,此时,只需考虑长度大于1的频繁项目集。其中一个频繁集为计算关联规则:的置信度,其值为100%。根据最小置信度阈值,得到一条频繁关联规则:频繁关联规则所表达的含义是当前时刻用户的业务是I1,则下一时刻用户最可能产生的业务为I2,两者之间具有一定关联关系。频繁集的支持度为3/7。
多用户关联分析过程:
根据影响力因子公式获得用户m的n个朋友圈用户,然后采用基于编码的二维Apriori方法将用户m分别及其n个朋友圈用户做关联分析。从挖掘出的频繁集中分析其他朋友圈用户上一时刻的业务行为及用户m当前时刻的业务行为,从而预测下一时刻用户m的业务行为。挖掘频繁集的过程与单个用户的业务行为的关联分析过程相同。与此同时,将其他n-1个用户也分别与用户m做关联分析,挖掘出频繁集,挖掘过程与上述相同。
2.朋友圈的划分
移动社交环境中的用户通过上网方式与其他用户交互,故可以采用用户的在线时长和交互次数作指标来划分用户m的n个朋友圈用户,具体划分由公式(1)获得。由于考虑到实际情况,用户受自身的影响较大,所以用户受自身影响的影响力因子设为T(m,m)=1。划分朋友圈用户是多用户关联分析的前提条件,有利于提高预测结果的准确性。
3.数据融合
为了给用户提供更准确的业务推荐服务,需将获得的n+1个关联分析结果做融合分析。现将n+1个分析结果视为节点,假设各节点的方差分别为各个节点支持度的均值分别设为x1,x2,....,xn+1,这些值彼此间相互独立,各个节点的权值系数分别为ω1,ω2,...,ωn+1,则引入权值系数后,节点的融合值就变为:
权值系数ωl *必须满足:l是节点标号,为正整数,且1≤l≤n+1。初始权值系数为将每个朋友圈用户影响力因子与其对应的权值系数中和,则最终的权值系数为:
且满足
结合移动社交环境的特点,对每个节点多次采样取平均值,先求出各个节点关于一个频繁关联规则支持度的方差,再根据式(3)求出各自的权值系数,然后根据(2)式求出融合后的值x,x即为这个频繁关联规则的最终支持度,x越大则表明这个频繁关联规则发生的可能性越高。具体的融合框图如图1所示,首先,目标用户与自身做关联分析,其次,目标用户分别与朋友圈的n个用户做关联分析,最后,将这n+1种关联分析结果融合在一起,预测目标用户下一时刻的业务行为。
本发明即面向移动社交环境的用户行为预测方法具体的流程图如图2所示,实现过程如下:
第一步,通过基于编码的二维Apriori方法研究基于用户自身历史业务行为的关联分析。
第二步:采用影响力因子公式获得目标用户的n个朋友圈用户。
第三步:通过基于编码的二维Apriori方法研究基于多用户历史业务行为的关联分析。
第四步:采用基于影响力因子公式改进的最优加权融合方法将n+1个关联分析结果融合在一起。
第五步:由融合结果分析用户的历史业务行为信息,预测其下一时刻的业务行为。
本行业的技术人员应了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内,本发明要求保护范围由所附的权利要求书其等效物界定。
Claims (1)
1.一种面向移动社交环境的用户行为预测方法,其特征在于,其具体过程如下:
步骤A,采用基于编码的二维Apriori方法实现用户行为的关联分析,所述用户行为是指用户的业务行为,包括视频业务行为,新闻业务行为,聊天文本业务行为,所述关联分析的具体步骤如下:
步骤A-1,将目标用户上一时刻的业务行为及当前时刻的业务行为做关联分析,首先统计各条记录中目标用户上一时刻和当前时刻产生的业务行为,即各条记录中如果业务行为发生记为1,不发生记为0,并对统计的数据进行二进制编码处理,然后采用与运算得到频繁集,进而获得频繁关联规则,由频繁关联规则预测目标用户下一时刻产生的业务行为;
步骤A-2,将目标用户当前时刻的业务行为分别与所述移动社交环境中的n个朋友圈用户上一时刻的业务行为做关联分析,首先统计各条记录中目标用户当前时刻产生的业务行为及所述n个朋友圈用户上一时刻产生的业务行为,即各条记录中,如果业务行为发生记为1,不发生记为0;并对统计的数据进行二进制编码,然后采用编码与运算得到频繁集,进而可获得频繁关联规则,由频繁关联规则,预测目标用户下一时刻产生的业务行为;
步骤B,使用影响力因子公式,在目标用户的朋友圈中获得n个朋友圈用户,影响力因子公式为:
其中,表示一个时间段内用户m和用户ni间的影响力因子;表示一个时间段内用户m和用户ni同时在线的在线时长,i是用户标号,为正整数;SNm表示一个时间段内用户m的在线时长;表示一个时间段内用户m和用户ni交互的次数,INm表示一个时间段内用户m总的交互次数;α,β为权重参数,且α+β=1,α,β通过多次实验获得,而且影响力因子的值是介于0和1之间的,由于用户受自身的影响大,所以用户受自身影响的影响力因子T(m,m)=1;
步骤C,将步骤A中获得的n+1个关联分析结果视为n+1个节点,对其进行融合分析;
假设各节点的方差分别为各个节点支持度的均值分别设为x1,x2,....,xn+1,这些值彼此间相互独立,各个节点的权值系数分别为ω1,ω2,...,ωn+1,则融合分析包含步骤如下:
步骤C-1,对每个节点多次采样取平均值,求出各个节点关于一个频繁关联规则支持度的方差;
步骤C-2,求出各个节点最终的权值系数
初始权值系数ωl为:
则最终的权值系数为:
其中,l是节点标号,为正整数,且1≤l≤n+1;
步骤C-3,求出节点融合值x;
权值系数必须满足:节点融合值x即为这个频繁关联规则的最终支持度,x越大则表明这个频繁关联规则发生的可能性越高,由此针对用户行为关联分析的预测建模,提高用户行为预测的准确性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510897272.0A CN105404943A (zh) | 2015-12-08 | 2015-12-08 | 一种面向移动社交环境的用户行为预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510897272.0A CN105404943A (zh) | 2015-12-08 | 2015-12-08 | 一种面向移动社交环境的用户行为预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105404943A true CN105404943A (zh) | 2016-03-16 |
Family
ID=55470416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510897272.0A Pending CN105404943A (zh) | 2015-12-08 | 2015-12-08 | 一种面向移动社交环境的用户行为预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105404943A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844550A (zh) * | 2016-12-30 | 2017-06-13 | 郑州云海信息技术有限公司 | 一种虚拟化平台操作推荐方法及装置 |
CN106991496A (zh) * | 2017-03-29 | 2017-07-28 | 南京邮电大学 | 一种面向移动社交环境的用户行为分层关联预测方法 |
CN108537636A (zh) * | 2018-04-08 | 2018-09-14 | 林凡 | 基于用户动态行为相似性的在线协同过滤内容推荐算法 |
CN110826799A (zh) * | 2019-11-05 | 2020-02-21 | 广州虎牙科技有限公司 | 业务预测方法、装置、服务器及可读存储介质 |
US20220068507A1 (en) * | 2020-09-03 | 2022-03-03 | International Business Machines Corporation | Iterative memory mapping operations in smart lens/augmented glasses |
CN114338392A (zh) * | 2020-09-29 | 2022-04-12 | 中国电信股份有限公司 | 网络数据分析方法和网络数据分析功能实体 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102117325A (zh) * | 2011-02-24 | 2011-07-06 | 清华大学 | 动态社会网络用户行为的预测方法 |
CN103886105A (zh) * | 2014-04-11 | 2014-06-25 | 北京工业大学 | 一种基于社交网络用户行为的用户影响力分析方法 |
-
2015
- 2015-12-08 CN CN201510897272.0A patent/CN105404943A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102117325A (zh) * | 2011-02-24 | 2011-07-06 | 清华大学 | 动态社会网络用户行为的预测方法 |
CN103886105A (zh) * | 2014-04-11 | 2014-06-25 | 北京工业大学 | 一种基于社交网络用户行为的用户影响力分析方法 |
Non-Patent Citations (1)
Title |
---|
王敏等: "A two-dimensional Apriori based user behavior prediction algorithm in mobile social environment", 《2015 INTERNATIONAL CONFERENCE ON WIRELESS COMMUNICATIONS & SIGNAL PROCESSING (WCSP)》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844550A (zh) * | 2016-12-30 | 2017-06-13 | 郑州云海信息技术有限公司 | 一种虚拟化平台操作推荐方法及装置 |
CN106991496A (zh) * | 2017-03-29 | 2017-07-28 | 南京邮电大学 | 一种面向移动社交环境的用户行为分层关联预测方法 |
CN106991496B (zh) * | 2017-03-29 | 2020-06-30 | 南京邮电大学 | 一种面向移动社交环境的用户行为分层关联预测方法 |
CN108537636A (zh) * | 2018-04-08 | 2018-09-14 | 林凡 | 基于用户动态行为相似性的在线协同过滤内容推荐算法 |
CN110826799A (zh) * | 2019-11-05 | 2020-02-21 | 广州虎牙科技有限公司 | 业务预测方法、装置、服务器及可读存储介质 |
US20220068507A1 (en) * | 2020-09-03 | 2022-03-03 | International Business Machines Corporation | Iterative memory mapping operations in smart lens/augmented glasses |
US11620855B2 (en) * | 2020-09-03 | 2023-04-04 | International Business Machines Corporation | Iterative memory mapping operations in smart lens/augmented glasses |
CN114338392A (zh) * | 2020-09-29 | 2022-04-12 | 中国电信股份有限公司 | 网络数据分析方法和网络数据分析功能实体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105404943A (zh) | 一种面向移动社交环境的用户行为预测方法 | |
CN103488678B (zh) | 一种基于用户签到相似度的好友推荐系统 | |
CN102394798B (zh) | 一种基于多元特征的微博信息传播行为预测方法及系统 | |
Loo et al. | Progress of e-development in China since 1998 | |
CN103150374B (zh) | 一种识别微博异常用户的方法和系统 | |
CN103700018B (zh) | 一种移动社会网络中的人群划分方法 | |
CN106682770A (zh) | 一种基于好友圈子的动态微博转发行为预测系统及方法 | |
CN103617279A (zh) | 基于Pagerank方法的微博信息传播影响力评估模型的实现方法 | |
CN104268271A (zh) | 一种兴趣和网络结构双内聚的社交网络社区发现方法 | |
CN104915392A (zh) | 一种微博转发行为预测方法及装置 | |
CN106055627A (zh) | 话题领域中社交网络关键节点的识别方法 | |
CN105550275A (zh) | 一种微博转发量预测方法 | |
CN102750320B (zh) | 一种网络视频实时关注度的计算方法、装置和系统 | |
CN105354749A (zh) | 一种基于社会网络的移动终端用户分组方法 | |
CN103886105A (zh) | 一种基于社交网络用户行为的用户影响力分析方法 | |
CN107332889A (zh) | 一种基于云计算的云端信息管理控制系统及控制方法 | |
CN110825948A (zh) | 基于促谣-辟谣消息和表示学习的谣言传播控制方法 | |
CN103136331A (zh) | 微博网络意见领袖识别方法 | |
CN106933969A (zh) | 基于行业上下游关系的个性化推荐系统和推荐方法 | |
CN102118711B (zh) | 信息推送方法和信息推送装置 | |
CN103136705A (zh) | 一种人际关系热度统计方法 | |
CN102664744A (zh) | 网络消息通信中群发推荐的方法 | |
CN103425703A (zh) | 一种网络信息的处理方法和装置 | |
Liu et al. | Research of personalized news recommendation system based on hybrid collaborative filtering algorithm | |
CN106919564A (zh) | 一种基于移动用户行为的影响力度量方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160316 |
|
RJ01 | Rejection of invention patent application after publication |