CN104598987A - 一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法 - Google Patents

一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法 Download PDF

Info

Publication number
CN104598987A
CN104598987A CN201410779356.XA CN201410779356A CN104598987A CN 104598987 A CN104598987 A CN 104598987A CN 201410779356 A CN201410779356 A CN 201410779356A CN 104598987 A CN104598987 A CN 104598987A
Authority
CN
China
Prior art keywords
user
net
network
sigma
ict
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410779356.XA
Other languages
English (en)
Other versions
CN104598987B (zh
Inventor
胡漫恬
欧阳晔
程艳云
闫兴秀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Hua Su Science And Technology Co Ltd
Original Assignee
Nanjing Hua Su Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Hua Su Science And Technology Co Ltd filed Critical Nanjing Hua Su Science And Technology Co Ltd
Priority to CN201410779356.XA priority Critical patent/CN104598987B/zh
Publication of CN104598987A publication Critical patent/CN104598987A/zh
Application granted granted Critical
Publication of CN104598987B publication Critical patent/CN104598987B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明包括三个步骤:首先,利用雪球式抽样法确定用户样本数据,并将该样本中用户之间的联系记录代入邻接矩阵,以绘制出t-1期和t期的个人逐月网络信息;然后通过使用用户个人信息和自学习效应、向他人学习效应及网络效应,建立“用户离网行为动态学习模型”,该模型包括:用户在网概率公式和用户离网概率公式,利用t-1期个人逐月网络信息数据并采用两阶段嵌套定点估计方法对模型结构参数进行估值;最后利用条件概率,将步骤二中的参数以及样本中t期的个人逐月网络信息数据,代入用户在网概率公式和用户离网概率公式,得出用户行为的预测结果。本发明首次把社交网络概念融入用户离网预测模型,采用动态模型建模,真实地模拟了用户决策行为。

Description

一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法
技术领域
本发明属于移动通讯领域,特别涉及一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法。
背景技术
随着电信行业的竞争愈演愈烈,并基本趋向于市场饱和,电信运营商的用户离网已经成为一个显著的问题。在这个行业里,每一个新用户都必须从竞争对手那里争取得来。例如,在美国无线产业中,2009年无线普及率整体达到91%,拥有285万用户。平均每月用户离网率(为在给定时间内离网的用户比例)介于1.1%到3.2%之间。由普华永道会计师事务所在2006年进行的一项调查显示:在世界各地,67%的无线运营商的用户年离网率超过了16%。由于赢得一个新用户的成本远远高于维护一个现有(Hadden等人,2007)用户的成本,对运营商来说当务之急是将重点从快速发展新用户策略转移到用户驻留管理策略。因此,对于用户更换运营商的决定,了解其背后的行为机制对于企业和学术界都变得至关重要。
为什么人们要更换无线运营商?根据ComScore网络公司在2007年进行的对于美国无线手机用户的行为和认可的全面调查,主要原因为:无线网络的覆盖问题、价格优势以及朋友或家人使用的运营商(表1)。该结果表明,正如以往文献强调的(例如,MOZER等人,2000,Gaynor等人,2005,Iyengar等人,2007),除了服务质 量和成本等因素外,家人和朋友圈的影响也很重要。社会学家断言,一个人所了解的大部分信息,是通过观察他人做出的决定从而产生的结果来获得(Bandura 1986)。因此,在一个动态社会模型里应该考虑到他人的影响这一点。
表1 更换无线运营商的原因(ComScore的调查)
来自他人的影响可以分为两种机制:社会学习和网络效应。驻留或更换运营商的决定受到几个因素的影响。首先,当前使用的运营商的服务质量将直接影响到用户驻留运营商的决定。然而作为一个服务性产品,人们在真正使用它之前通常不太确定它的好坏(比如具体到某一小区的网络覆盖情况),因此他需要通过直接的用户体验来了解它的质量。而这将被模型中的动态学习机制所捕捉。这一模型机制在之前的文献中已经被证明使用过。社会化传播通过两种机制影响人们的决定。其一,通过朋友圈的意见的反馈,用户将了解其他运营商的服务质量,进而会影响用户的选择,这一点会被模型中的社会学习机制所捕捉。其二,使用相同网络的联系人的数量将产生网络效应从而直接影响用户驻留运营商的决定。这将被模型中的网络效应部分 捕捉到。
我们提出的框架借鉴了三个研究领域:动态学习、社会学习和网络效应。由Phillip Nelson(1970)开始,体验商品或消费前不能确定品质的商品,一直是广为研究的主题(例如,Ackerberg 2002;Clay,Goettler,and Wolff 2003;Israel 2005)。当用户在信息不完全的情况下进行抉择时,各种关于产品质量的信息来源将影响用户的需求,其中包括广告(Ackerberg 2002)、专家评论(Reinstein andSnyder 2005)、定价(Erdem,Keane,and Sun 2008)和借鉴重复消费(Erdem and Keane 1996;Crawford and Shum 2002)。用户还可以可以通过观察朋友圈中他人的选择和他们的体验结果来了解产品的质量,还可以通过其他用户的体验推断出产品质量。这就是我们所说的社会学习(Ellison and Fudenberg 1993)。举例来说,当用户看到更知情的朋友更换了或者正在使用某个无线运营商,他们可能推断出该无线运营商对于他们自己也具有很高的价值。关于从自己的使用体验中学习与从他人的使用体验中学习之间的关系的理论模型已经发展成熟(McFaddenand Train 1996;Bolton and Harris 1999),但实际实施研究还比较罕见。
除了社会学习带来的间接信息的影响,在网络效应下,同龄人的选择也影响着用户的需求。网络效应是指一种外部性效应,“本地”是指直接影响用户的朋友圈作出的决定和行为的影响(即相同无线运营商的直接接触),而不是产品用户群大小的增长(即Katz and Shapiro 1985)。该效应基于同龄人的压力(“跟上攀比”),或用户节 省成本的目的来实现。例如,一些无线运营商对网内、网外通话和短信收取不同的价格,因此使用相同无线运营商(较大的网络规模)的联系人越多,产生的潜在“节省”就越多,同时,此无线运营商越具有吸引力。
这引起了所谓的“资费媒介的网络效应”(Laffont,Rey and Tirole(1998b))。它意味着,用户在做出是否更换运营商决定时包含了他们对其所有联系人所作的更换运营商的决定的预期。在这里,我们的目标不是分别识别不同的网络效应的来源,而是将它与社会学习效应进行比较,因为两者表面上会导致相同的结果。也就是说一个人更换运营商的概率会随着越来越多的联系人离开该无线运营商而增大,然而我们希望能够区分有多少可以归因于更换的不确定性(社会学习效果)的减少,有多少是因为较小的网络规模从而使当前无线运营商对用户的控制力减少。
在这个模型里面,更换无线运营商的决定是动态的。这也符合现实中这一行为的特点。移动服务,作为一种质量不确定的体验产品,用户即使更换也要权衡所要承担的所有风险,或是等待一段时间通过自己的使用体验来积累更多的信息的利弊,朋友圈的决定鼓励着他们要有前瞻性。此外,由于当地网络效应,用户面临着另一个权衡。他们可以在今天更换,但明天可能就因使用不同的无线运营商,而使与联系人的通信成本变高,或者继续留在当前的无线运营商,在观察他们的联系人的决定以后再决定。
最近一些关于用户驻留和用户离网预测的实证研究已经涉及到了的社会效应(Birke 2006,Dasgupta et al.2008;Richter et al.2010;Nitzan and Libai 2010),并用统计模型来验证假设,作出比以前更准确预测。然而,我们的模型与他们的区别在于,作为一个动态的结构化模型,它侧重于识别用户更换决定的基本行为机制。这可以让我们以后进行多次反事实分析(Chintaguanta and Erdemet al.2006)从而制定最优的公司策略。据我们所知,这是第一个在社会网络背景下集成了学习框架的工作,在这里,用户具有前瞻性并且他们的决定是内在的。
动态模型在估计上有两个主要挑战:动态平衡的计算,以及因多重均衡存在而产生的不确定性问题。事实上,平衡状态下网络规模变化,必须与实际所观察到的相一致,因此我们提出了一个算法,其在概念上类似于两阶段式估计,如Hotz and Miller(1993),Pakes,Ostrovsky,and Berry(2007)和Bajari,Benkard,和Bajari,Benkard,and Levin(2007),但在实施的细节上明显不同。我们提出的算法允许未观测状态变量的存在。我们用参数来估计第一步中的网络规模的转移概率。利用给定的估计网络规模,在第二步中,我们使用Keane和Wolpin(1997)技术的变种(Crawford和Shun 2005)来预估结构化参数。为了检验模型,我们对使用了预估参数的模拟数据的汇总统计与实际数据进行了比较,并取得了令人满意的结果。
为了说明该框架的管理和政策的影响,我们发现在给调控计划和个人信息的情况下,对用户更换运营商的决策最具影响的三个 因素是动态学习、社会学习和网络效应。我们的研究结果表明,对用户来说,当前无线运营商的平均服务质量至关重要,这与Mark Israel(AER 2005)的研究结果一致。我们的研究结果还表明,相对于社会学习,从自己的使用体验中学习速度较慢。这强调从竞争对手获取新用户的重要性。模拟结果表明,相对于社会学习,网络效应在网络弹性分解即用户驻留概率的百分比变化与网络规模的百分比变化的比值上有更大的影响。这证明了先前的研究(Israel 2005),说明更快的学习在增加用户的利益方面不如最小化锁定效用(minimizing lock-in utility)通过评估是否取消网络电话价格区别后,用户驻留率的变化,我们还提供了关于移动终接费率政策mobile termination rates policy的见解,这是一个在欧洲颇有争议的监管话题。不考虑社会网络环境的模型,即没有社会学习,没有直接网络效应,往往低估了政策的影响。
发明内容
本发明提供了一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法,主要包括以下内容:
步骤一样本数据采集:所采集的数据包括用户个人信息和用户网络信息;利用雪球式抽样方法,首先选取一定数量的手机用户称为种子,在一段时间内,以月为单位的时间段,该时间分为两段:t-1期和t期分别都以为月为单位,将与种子发生联系人的人员纳入样本,在同一段时间内再将与这些种子的联系人发生联系的人员纳入样本;如此进行n轮取值,归入总样本;然后将所有样本的个人信息 逐月进行采集,同时针对种子及至前n-1轮样本,将他们所有与各自联系人的联系记录逐月代入邻接矩阵,从而绘制出个人逐月的网络信息。
步骤二建立用户离网行为动态学习模型与参数估计:本模型以用户离网行为的动态理论分析为基础,除了使用用户个人信息,还着重模拟了向自己学习效应、向别人学习效应以及网络效应四个因素对用户离网行为的影响。模型建立后将样本中t-1期的用户个人逐月信息及其网络信息,分别带入用户在网概率公式和用户离网概率公式,并采用两阶段嵌套定点估计方法对用户离网行为动态学习模型的结构参数进行估值。
步骤三利用条件概率理论:将步骤二中提取的参数以及样本中t期的用户个人逐月信息及其网络信息,代入用户在网概率公式和用户离网概率公式,进行计算,得出每位用户当月在网概率和离网概率,两者比较,较大的作为当月行为的预测结果。
本发明具有以下优点:
1)首次把社交网络概念融入用户离网预测模型,其涉及了他人学习、网络效应两个因素;
2)采用动态模型建模,更加贴切现实世界的用户决策行为;
3)采用两阶段嵌套定点估计方法对该模型的结构参数进行估值,解决了高微积分计算量大的难题。
附图说明
图1本发明的预测流程示意图。
具体实施方式
下面结合附图对本发明做进一步说明。
如图1所示,本发明主要包括三大步骤具体介绍如下:
步骤一:样本数据采集
数据采样
本专利数据采集采用雪球抽样,雪球抽样用于生成数据。数据提供者从整个移动网络中随机选取20个人并将它们命名为“种子”。基于这些种子,数据提供者找到他们在采样周期开始的短时间内通过电话或者短信所联系的人。该运营商认为那些直接联系的人是种子的邻居或“朋友”。同时,他们形成了一个球形的网络群体。之后,运营商从每一个“邻居”出发,继续收集直接联系人邻居的邻居的信息,拓展网络至直接连接到该“邻居”的个人,并停止滚动。因此,对抽样中的每个人,我们都有一个完整的网络和人口统计信息。
这里所采集的数据包括用户个人信息和用户网络信息;方法是利用上述的雪球式抽样方法,首先选取一定数量的手机用户称为种子,在一段时间内(以月为单位的时间段,该时间分为两段:t-1期和t期分别都以为月为单位),将与种子发生联系人的人员纳入样本,在同一段时间内再将与这些种子的联系人发生联系的人员纳入样本;如此进行n轮取值,归入总样本;然后将所有样本的个人信息逐月进行采集,同时针对种子及至前n-1轮样本,将他们所有与各自联系人的联系记录逐月代入邻接矩阵,从而绘制出个人逐月的网络信息。
步骤二:建立用户离网行为动态学习模型与参数估计
离网行为模型建立
该模型由四个子模型组成,网络质量信息模型、自学习模
型、他人学习模型、网络效应模型。所以下面分四个方面分别建模,
最后把四个子模型统一成离网行为模型。
1)网络质量信息模型
在时间周期t内,假设当前用户的单个周期u1t是sct和zt(Xt,Nett)效用函数,其中sct是在时间t接收到的当前网络的质量属性。正如Crawford和Shum(2005)主张的,在离散选择需求的文献中,使用的线性效用方法受到很大的限制,特别是在被排除不确定影响的情况下嵌入在方法中的中立风险。继他们之后,我们考虑一个拟线性效用方法,对于子效应函数sct以及zt线性成分,该方法可以稳定地规避风险。
u1t(zt,Sct;θ)=-exp(-rSct)+θXt+λNett,                   (1.1) 
其中r表示风险规避程度,λ捕捉当地网络效应。
本文中,我们假设θXt是详细计划和用户特征的线性效用方法:
θXt=θ1Price+θ2Min+θ3Fam+θAAge+θ5Male,            (1.2) 
其中Price是对每个人当前计划的在网/离网通话费用,它是起初设定好的并不随时间改变;Min是该计划包含的时间,单位为分钟;Fam是虚拟的家庭计划。
定义u0t(Sot)为其他无线运营商抽象的效用函数:
u0t(Sot;θ)=-exp(-rSot),            (1.3) 
其中sot是接收到的其他无线运营商的质量属性。
我们假设选择操作之前,每个用户接收一个专用选择偏好影响εit(dit),这只有用户自己知道而没有被研究人员观测到。由假设可知,它是独立于代理商之外的。
假设,如果当前网络效用值+更换折算值+更换特殊体验值〉当前网络效用值+驻留折算值+驻留特殊体验值,用户就会选择更换运营商。
因此,贝尔曼(Bellman)方程给出了,每个周期开始时在网用户的数值(Pakes,Ostrovsky和Berry 2004年;Dunne,Klimek,Roberts和Xu 2009年):
V(It;θ)=max{u1t(zt,Sct;θ)+βVC(It;θ)+εt(1),u1t(zt,sct;θ)+βVX(It;θ)+εt(0)}.(2)
VC(.)是驻留数值,是对下一个周期期望的效用函数:
VX(.)是更换数值,是其他无线运营商预期的效用函数:
2)自学习模型
虽然不能确定体验商品的质量,用户被假定为有起初的相关信息。每个用户对产品实际质量的起初认知Qic,可以用正态分布描述:
Q ic ~ N ( μ c , σ μc 2 ) . - - - ( 3.1 )
在这个表达式中,μc表示起初平均质量,标准差σμc描述了起初方法的准确性。用户i不知道Qic但接受质量属性,这使他能够更 新他对产品实际质量的认知。我们假设信号是独立的,且在围绕实际服务质量(Qic)的周期上服从正太分布:
S ict ~ N ( Q ic , σ c 2 ) . - - - ( 3.2 )
Sict是由用户观测到的,但研究人员不知道;而Qic对两者都是未知的。使用经验及随后的观测信号Sict并不完全显露,但Qic确实提供了有关它的信息。这种带有起初Qic共轭的分布的假设,形成了一个用户关于Qic后验观念的贝叶斯学习过程,可以通过递归的方法由质量平均值为πict,方差为Vict的正态分布序列(DeGroot 1970年)给出:
π ict + 1 = π ict V ict + S ict + 1 σ c 2 1 V ict + 1 σ c 2 = σ c 2 V ict + σ c 2 π ict + V ict V ict + σ c 2 S ict + 1 if d it = 1 π ict otherwise - - - ( 3.3 )
V ict + 1 = 1 1 σ μc 2 + n it + 1 σ c 2 if d it = 1 V ict otherwise , - - - ( 3.4 )
其中nit+1代表直到周期t+1,用户i驻留当前运营商不变的周期数。
我们假定用户具有理性预期,使他们的起初体验等于感知的“真实”质量Qic在用户上的准确分布。因此,μc是当前移动网络运营商服务质量的总体平均值,σμc是它的异质性或分散系数。μc,σμc和 的值就是将要估计的。
3)他人学习模型
向别人学习的过程与从自己的经验中学习是非常相似的,Qic表示用户i对其他无线运营商实际质量的感知,除了两个方面。首先是识别的原因,我们正常化其他无线运营商的起初平均值为零,并假设初始方差的等式:
Q io ~ N ( 0 , σ μo 2 ) - - - ( 4.1 )
σ μc 2 = σ μo 2 .
第二,只有当用户同网络的一些邻居更换了网络时学习过程才会发生,所以可能在许多周期内都没有学习过程,也可能在同一周期发生很多次学习过程。
例如,在周期t中,假定有两个离网的联系人1和2,联系人1在联系人2之前离网。质量属性仍然假设为服从正态分布得出:
S iot ~ N ( Q io , σ o 2 ) . - - - ( 4.2 )
联系人1离网后,
π iot + 1 ′ = π iot V iot + S iot + 1 σ o 2 1 V iot + 1 σ o 2 = σ o 2 V iot + σ o 2 π iot + V iot V iot + σ o 2 S iot + 1 π iot - - - ( 4.3 ) V ict + 1 ′ = 1 1 σ μo 2 + m it + 1 σ o 2 V iot . - - - ( 4.4 )
联系人2离网后,
π iot + 1 = π iot + 1 ′ V iot + 1 ′ + S iot + 1 ′ σ o 2 1 V iot + 1 ′ + 1 σ o 2 = σ o 2 V iot + 1 ′ + σ o 2 π iot + 1 ′ + V iot + 1 ′ V iot + 1 ′ + σ o 2 S iot + 1 ′ π iot - - - ( 4.5 )
V ict + 1 = 1 1 σ μo 2 + m it + 2 σ o 2 V iot + 1 ′ , - - - ( 4.6 )
其中mit为用户的联系人中在时间周期t+1之前离网的人的数量。一个理性的预期假设也是由此提出的。需要注意的是,其他无线运营商的起初均值等于0时,在上一节中所定义的μc实际上表示当前无线运营商的相对质量,而不是绝对的。
4)网络效应模型
Netit代表在每个周期开始时用户i的网络规模,NSWit是在 时间t离网的联系人数量(这在用户做出决定时是未知的)。要计算公式(2.1)中的VC(.),我们需要构造,在当前状态变量下用户对离网联系人数量的感知。这些感知生成了概率分布P(NSWit|Netit,Xit)。为了平衡,P(NSWit|Netit,Xit)应当与联系人的行为一致,换句话说,用户有理性预期。
Net it e = Net it - NSW it e = Net it - ∫ NSW it dp ( NSW it | Net it , X it ) , - - - ( 5 )
其中表示当前状态的期望条件。
在网、离网模型:
在网的用户i的选择方法函数是:
离网的用户i的选择方法函数是:
我们假设选择特定的偏好影响εit(dit)符合极值分布。那么,利用条件概率理论(CCP)可以通过一个简洁的表达式说明。
Prob ( d it = 1 | I t ) = exp ( V 1 ( I t ) ) exp ( V 1 ( I t ) ) + exp ( V 0 ( I t ) ) - - - ( 6.3 )
Prob ( d it = 0 | I t ) = exp ( V 0 ( I t ) ) exp ( V 1 ( I t ) ) + exp ( V 0 ( I t ) ) . - - - ( 6 . 4 )
最终函数是: 
V(It)=∫max{V1(It),V0(It)}dP(εit)=log(exp(V1(It))+exp(V0(It)).   (6.5) 
模型建立后将样本中t-1期的用户个人逐月信息及其网 络信息,分别带入用户在网概率公式和用户离网概率公式,并采用两阶段嵌套定点估计方式对用户离网行为动态学习模型的结构参数进行估值。模型参数估计具体介绍如下:
模型参数估计
该模型采用两阶段嵌套定点估计方式对动态模型的结构参数进行估值,估计包括两个步骤。
第一步,我们想要估计每一个人的说明了网络规模在数据上已经验证的转移概率。我们注意到,对于每个周期,离网邻居的最大数目是2。因此,我们假设可以通过Netit和Xit的多项式 逻辑模型来近似。因为用户的期望必须与平均实现一致,这些估计将收敛到离网邻居的实际预期数:
Prob ( NSW it e = j ) = exp ( γ j 1 Net it + γ j 2 X it ) 1 + Σ j = 1 2 ( γ j 1 Net it + γ i 2 X it ) , j = 1,2 , - - - ( 7.1 )
Prob ( NSW it e = 0 ) = 1 1 + Σ j = 1 2 ( γ j 1 Net it + γ j 2 X it ) . - - - ( 7.2 )
第二步把的估计值作为已知数,并通过从周期开始时的网络规模减去这个数计算出网络规模。然后,我们用Keane和Wolpin(1994)近似法(Crawford和Shum2005年)来估计结构参数。它本质上是一个嵌套定点估计。
在方程(6.1)和(6.2)中,由于Sict和Siot较大,期望难以计算。因此,我们使用模拟来逼近期望。模拟的可能性为,
Π i = 1 I ( 1 s Σ s = 1 S Πt ( exp ( V 1 s ) exp ( V 1 s ) + exp ( V 0 s ) ) dit ( exp ( V 0 s ) exp ( V 1 s ) + exp ( V 0 s ) ) ( 1 - d it ) ) . - - - ( 8 )
在我们这个环境下直接执行BBL(2007年)是不可行的,所以,服务质量是不可观测的。因此,我们的方法是,在一个嵌套定 点估值算法下使用两步模型。我们承认在第一步中使用的假设是受限制的。然而,之后的仿真结果证明了这些假设的有效性。它展示了使用从数据中获得的信息来建立经验模型的重要性。
步骤三:利用条件概率理论,将步骤二中提取的参数以及样本中t期的用户个人逐月信息及其网络信息,代入用户在网概率公式和用户离网概率公式,进行计算,得出每位用户当月在网概率和离网概率,两者比较,较大的作为当月行为的预测结果。
虽然本发明已以较佳实施例公开如上,但实施例和附图并不是用来限定本发明,任何熟悉此技艺者,在不脱离本发明之精神和范围内,自当可作各种变化或润饰,但同样在本发明的保护范围之内。因此本发明的保护范围应当以本申请的权利要求保护范围所界定的为准。

Claims (3)

1.一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法,其特征在于,包括以下步骤:
步骤一:样本数据采集
所采集的数据包括用户个人信息和用户网络信息;利用雪球式抽样方法,首先选取一定数量的手机用户称为种子,在一段时间内即以月为单位的时间段,该时间分为两段:t-1期和t期分别都以为月为单位,将与种子发生联系人的人员纳入样本,在同一段时间内再将与这些种子的联系人发生联系的人员纳入样本;如此进行n轮取值,归入总样本;然后将所有样本的个人信息逐月进行采集,同时针对种子及至前n-1轮样本,将他们所有与各自联系人的联系记录逐月代入邻接矩阵,从而绘制出个人逐月的网络信息。
步骤二:建立用户离网行为动态学习模型与参数估计
本模型以用户离网行为的动态理论分析为基础,除了使用用户个人信息,还着重模拟了向自己学习效应、向别人学习效应以及网络效应四个因素对用户离网行为的影响。模型建立后将样本中t-1期的用户个人逐月信息及其网络信息,分别带入用户在网概率公式和用户离网概率公式,并采用两阶段嵌套定点估计方式对用户离网行为动态学习模型的结构参数进行估值。
用户在网概率公式:
Prob ( d it = 1 | I t ) = exp ( V 1 ( I t ) ) exp ( V 1 ( I t ) ) + exp ( V 0 ( I t ) ) - - - ( 6.3 )
用户离网概率公式:
Prob ( d it = 0 | I t ) = exp ( V 0 ( I t ) ) exp ( V 1 ( I t ) ) + exp ( V 0 ( I t ) ) - - - ( 6 . 4 )
其中:
在网用户i的效用函数V1(It)为:
其中:
Ui1t表示:在时间周期t,在网用户i对当前网络运营商的抽象效用函数;
Sict表示:在时间周期t,用户i接收到的当前网络新的信息;
Netit代表在每个周期开始时用户i的网络大小;
θXt是关于个人计划和用户特征的线性函数;
εit(dit)是每个用户选择偏好的误差项;
VC(.)是延续函数,这是对下一个周期的效用函数的期望函数:
β∈(0,1)是折现因子。
同样的离网用户i的效用函数V0(It)为:
VX(.)是使用其它无线运营商的预期效用,它代表了机会成本:
步骤三:利用条件概率理论,将步骤二中提取的参数以及样本中t期的用户个人逐月信息及其网络信息,代入用户在网概率公式和用户离网概率公式,进行计算,得出每位用户当月在网概率和离网概率,两者比较,较大的作为当月行为的预测结果。
2.根据权利要求1所述的一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法,其特征在于,在步骤二中,用户离网行为动态学习模型与参数估计包括以下步骤:
整个模型的基本假设是用户i在时间点t留在该移动运营商的效用函数有以下四个方面组成:
1)用户计划信息,包括通话费用、计划时间、家庭计划、年龄、性别;
关于个人计划和用户特征的线性函数:
θXt=θ1Price+θ2Min+θ3Fam+θ4Age+θ5Male,                  (1.2)
2)自学习效应,运营商所提供的服务质量,这是通过用户入网后不断学习累积的。入网前,用户对运营商网络质量有个最初的判断,随着使用时间的增加,通过贝叶斯学习过程,用户不断更新对其网络质量的认识,后验的网络质量成为影响用户决策的另一因素。
Q ic ~ N ( μ c , σ μc 2 ) . - - - ( 3.1 )
S ict ~ N ( Q ic , σ c 2 ) . - - - ( 3.2 )
π ict + 1 = π ict V ict + S ict + 1 σ c 2 1 V ict + 1 σ c 2 = σ c 2 V ict + σ c 2 π ict + V ict V ict + σ c 2 S ict + 1 if d it = 1 π ict otherwise - - - ( 3.3 )
V ict + 1 = 1 1 σ μc 2 + n it + 1 σ c 2 if d it = 1 V ict otherwise , - - - ( 3.4 )
Sct是在时间t接收到的当前网络的信息;
3)向他人学习效应,当用户的联系人离网而选择其它运营商时,用户对其它运营商质量的认识在不断累积增加,因此,通过贝叶斯学习,用户对其使用其它运营商效用有所衡量,这构成了用户留在当前运营商的机会成本。
Q io ~ N ( 0 , σ μo 2 ) - - - ( 4.1 )
σ μc 2 = σ μo 2 .
S iot ~ N ( Q io , σ o 2 ) . - - - ( 4.2 )
π ′ iot + 1 = π iot V iot + S iot + 1 σ o 2 1 V iot + 1 σ o 2 = σ o 2 V iot + σ o 2 π iot + V iot V iot + σ o 2 S iot + 1 π iot - - - ( 4.3 )
V ′ ict + 1 = 1 1 σ μo 2 + m it + 1 σ o 2 V iot . - - - ( 4.4 )
4)网络效应,这是由使用同一运营商的用户联系人数量决定,同一运营商的联系人越多,用户使用该网络的效用越高。
Net it e = Net it - NSW it e = Net it - ∫ NSW it dP ( NSW it | Net it , X it ) , - - - ( 5 )
Netit代表在每个周期开始时用户i的网络大小;
Nete it:代表用户i对本周期t结束时的预期网络大小;
模型规定了两组贝叶斯学习的动态机制,假设用户当前的行为由其对行为所产生的未来影响决定(forward looking),将以上四个因素带入贝尔曼(Bellman)动态方程,得到:
V ( I t ; θ ) = max { u 1 t ( z t , S ct ; θ ) + βVC ( I t ; θ ) + ϵ t ( 1 ) , u 1 t ( z t , S ct ; θ ) + βVX ( I t ; θ ) + ϵ t ( 0 ) } . - - - ( 2 )
从而使得模型模拟了个人离网的决策过程。将四组信息通过模型,与观测到的真实行为决策进行最大相似拟合,采用两阶段嵌套定点估计方法,从而得出结构参数的估值。
3.根据权利要求2所述的一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法,其特征在于,在步骤二中,两阶段嵌套定点估计方法(第一阶段含如下第一步、第二步所述,第二阶段是如下第三步所述)包括以下步骤:
第一步,对每位用户个人网络中当月的离网人数进行预测,该预测通过其现有网络人数,网络结构以及用户特征的多项式逻辑模型来近似。
该多项式逻辑模型为:
Prob ( NSW it e = j ) = exp ( γ j 1 Net it + γ j 2 X it ) 1 + Σ j = 1 2 ( γ j 1 Net it + γ j 2 X it ) , j = 1,2 , - - - ( 7.1 )
Prob ( NSW it e = 0 ) = 1 1 + Σ j = 1 2 ( γ j 1 Net it + γ j 2 X it ) . - - - ( 7.2 )
NSWit是在时间t离网的联系人数量。
第二步,把第一步的预测值作为已知数,并通过从周期开始时的网络大小减去该数计算出当月网络大小预测值。
Net it e = Net it - NSW it e = Net it - ∫ NSW it dP ( NSW it | Net it , X it ) , - - - ( 5 )
第三步:使用Keane和Wolpin(1994)动态模型估值法估计,使得模拟值逼近观测值。
CN201410779356.XA 2014-12-16 2014-12-16 一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法 Active CN104598987B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410779356.XA CN104598987B (zh) 2014-12-16 2014-12-16 一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410779356.XA CN104598987B (zh) 2014-12-16 2014-12-16 一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法

Publications (2)

Publication Number Publication Date
CN104598987A true CN104598987A (zh) 2015-05-06
CN104598987B CN104598987B (zh) 2018-08-21

Family

ID=53124755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410779356.XA Active CN104598987B (zh) 2014-12-16 2014-12-16 一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法

Country Status (1)

Country Link
CN (1) CN104598987B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105281959A (zh) * 2015-11-04 2016-01-27 东北大学 一种基于隐马尔可夫模型的移动通信用户流失预测方法
CN108389173A (zh) * 2018-03-24 2018-08-10 厦门大学嘉庚学院 一种基于机会成本的参数优化方法
CN109872242A (zh) * 2019-01-30 2019-06-11 北京字节跳动网络技术有限公司 信息推送方法和装置
CN113543117A (zh) * 2020-04-22 2021-10-22 中国移动通信集团重庆有限公司 携号转网用户的预测方法、装置及计算设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1897573A (zh) * 2006-06-30 2007-01-17 南京联创科技股份有限公司 基于神经网络改进算法的电信客户流失预测方法
CN101620691A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 电信业自动化数据挖掘平台

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1897573A (zh) * 2006-06-30 2007-01-17 南京联创科技股份有限公司 基于神经网络改进算法的电信客户流失预测方法
CN101620691A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 电信业自动化数据挖掘平台

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A GHOSE,SP HAN: "A Dynamic Structural Model of User Learning in Mobile-Media Content in the Internet", 《WORKING PAPERS》 *
徐树华: "基于社会网络的电信客户采纳新业务与流失行为研究", 《中国优秀博士学位论文全文数据库经济与管理科学》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105281959A (zh) * 2015-11-04 2016-01-27 东北大学 一种基于隐马尔可夫模型的移动通信用户流失预测方法
CN105281959B (zh) * 2015-11-04 2018-05-04 东北大学 一种基于隐马尔可夫模型的移动通信用户流失预测方法
CN108389173A (zh) * 2018-03-24 2018-08-10 厦门大学嘉庚学院 一种基于机会成本的参数优化方法
CN108389173B (zh) * 2018-03-24 2021-08-31 厦门大学嘉庚学院 一种基于机会成本的参数优化方法
CN109872242A (zh) * 2019-01-30 2019-06-11 北京字节跳动网络技术有限公司 信息推送方法和装置
CN109872242B (zh) * 2019-01-30 2020-10-13 北京字节跳动网络技术有限公司 信息推送方法和装置
CN113543117A (zh) * 2020-04-22 2021-10-22 中国移动通信集团重庆有限公司 携号转网用户的预测方法、装置及计算设备
CN113543117B (zh) * 2020-04-22 2022-10-04 中国移动通信集团重庆有限公司 携号转网用户的预测方法、装置及计算设备

Also Published As

Publication number Publication date
CN104598987B (zh) 2018-08-21

Similar Documents

Publication Publication Date Title
Botelho et al. The diffusion of cellular phones in Portugal
Firat et al. Comparative analysis of neural network techniques for predicting water consumption time series
Wang et al. Understanding graph sampling algorithms for social network analysis
CN110503531A (zh) 时序感知的动态社交场景推荐方法
Fuller et al. Hot deck imputation for the response model
US20080059284A1 (en) Methods, Systems and Computer Readable Code for Forecasting Time Series and for Forecasting Commodity Consumption
CN109756632B (zh) 一种基于多维时间序列的诈骗电话分析方法
CN104598987A (zh) 一种利用社交网络中的学习与网络效应来预测移动用户离网倾向和概率的方法
Dick et al. Forecasting nursing home utilization of elderly Americans
CN109146116A (zh) 一种工作能力模型的构建方法、其参数计算方法,以及基于所述模型的劳动力评估预测装置
Satopää et al. Probability aggregation in time-series: Dynamic hierarchical modeling of sparse expert beliefs
Swinerd et al. Comparing a simulation model with various analytic models of the international diffusion of consumer technology
CN106126607A (zh) 一种面向社交网络的用户关系分析方法
CN108073782A (zh) 一种基于观测窗口均权重粒子滤波的数据同化方法
Hemati et al. Water allocation using game theory under climate change impact (case study: Zarinehrood)
CN110119540A (zh) 一种用于生存风险分析的多输出梯度提升树建模方法
Postigo-Boix et al. A social model based on customers’ profiles for analyzing the churning process in the mobile market of data plans
Zhou et al. A dynamic logistic regression for network link prediction
Ballis et al. Optimal synthesis of tours from multi-period origin-destination matrices using elements from graph theory and integer programming
Sagi et al. Uncovering the shape of neighborhoods: harnessing data analytics for a smart governance of urban areas
Kinkhabwala et al. Forecasting racial dynamics at the neighborhood scale using Density-Functional Fluctuation Theory
Apputhurai et al. Accounting for uncertainty in extremal dependence modeling using Bayesian model averaging techniques
CN114757695A (zh) 用户购买行为预测模型的构建方法、装置及计算机设备
Fok et al. Ordered logit analysis for selectively sampled data
Jongmuenwai et al. Comparision using Data Mining Algorithm Techniques for Predicting of Dengue fever Data in Northeastern of Thailand

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 211399 6 Longjing Road, Chun Xi Town, Gaochun, Nanjing, Jiangsu

Applicant after: Nanjing Hua Su Science and Technology Ltd.

Address before: 211399 6 Longjing Road, Chun Xi Town, Gaochun, Nanjing, Jiangsu

Applicant before: Nanjing Hua Su Science and Technology Co., Ltd.

CB02 Change of applicant information
CB03 Change of inventor or designer information

Inventor after: Hu Mantian

Inventor after: Ou Yangye

Inventor after: Cheng Yanyun

Inventor after: Yan Xingxiu

Inventor before: Hu Mantian

Inventor before: Ou Yangye

Inventor before: Cheng Yanyun

Inventor before: Yan Xingxiu

CB03 Change of inventor or designer information
GR01 Patent grant
GR01 Patent grant