CN111047338A - 用户活跃度预测方法、预测系统及介质 - Google Patents

用户活跃度预测方法、预测系统及介质 Download PDF

Info

Publication number
CN111047338A
CN111047338A CN201811191136.XA CN201811191136A CN111047338A CN 111047338 A CN111047338 A CN 111047338A CN 201811191136 A CN201811191136 A CN 201811191136A CN 111047338 A CN111047338 A CN 111047338A
Authority
CN
China
Prior art keywords
internet surfing
user
internet
time period
activity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811191136.XA
Other languages
English (en)
Inventor
陈实如
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FOUNDER BROADBAND NETWORK SERVICE CO LTD
Peking University Founder Group Co Ltd
Original Assignee
FOUNDER BROADBAND NETWORK SERVICE CO LTD
Peking University Founder Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FOUNDER BROADBAND NETWORK SERVICE CO LTD, Peking University Founder Group Co Ltd filed Critical FOUNDER BROADBAND NETWORK SERVICE CO LTD
Priority to CN201811191136.XA priority Critical patent/CN111047338A/zh
Publication of CN111047338A publication Critical patent/CN111047338A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种用户活跃度预测方法、预测系统及介质。其中方法包括:在预设统计周期内,根据用户的上网请求时间及下载流量,构建脉冲序列;将脉冲序列输入到构造函数的系统中,得到系统响应曲线;根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长,以及根据上网时间段确定上网次数;将上网次数及上网时长对应的坐标值投影到活跃度坐标系上,并根据坐标值在活跃度坐标系上的活跃度投影位置,确定所述用户的活跃度类型。本发明基于用户上网请求时间和上网下载流量两个维度,能够精准快速地统计出用户上网时间段和在网时长,从而使建模过程变得简便,并有效提高了预测结果准确性,为电信宽带行业的运营提供可靠依据。

Description

用户活跃度预测方法、预测系统及介质
技术领域
本发明涉及信息处理技术领域,具体而言,涉及一种用户活跃度预测方法,一种用户活跃度预测系统,及一种计算机可读存储介质。
背景技术
用户活跃度反映用户使用企业产品的频率和依赖性,度量了用户与公司的交互程度。互联网行业,活跃度高反映用户访问网站频率高,引入流量多,商品成交机会大。电信行业,活跃度高反映用户使用电信服务的依赖性强,留网机会大。企业营销策略目标就是围绕产品对用户进行拉新促活留存管理。用户活跃度的建模基本上是基于用户数据特征,经模型学习、模型验证,模型优化使用几个环节,不同之处主要体现在数据模型的建立方法。
电信运营商利用用户消费特征分析用户的价值度(M)、忠诚度(F)、活跃度(R),建立用户RFM模型,实现用户分类管理。手机流量和社区宽带流量大小直接反应电信用户的活跃度。一定周期内,手机用户流量越大说明用户对流量需求就越大,运营商可以营销个性化流量套餐产品。宽带用户上网时长越大说明用户对宽带产品需求越强,宽带运营商可以营销个性化宽带套餐产品,提高用户对宽带运营商的产品和服务的认可度,增大用户续费留网概率。互联网行业,通常分析用户最近1次访问网页时间,网页驻留时间、网页访问频率等业务特征来建模计算用户活跃度。电信宽带行业,运营商不能直接获得这几个业务特征的数据,需要研究尝试基于其他业务特征进行建模。
相关技术提出了一种基于网络日志建立用户上网活跃度模型的方法,按时间段统计用户的上网行为,比如每一小时作为一个时间段。指定时间段存在用户上网标识为1,不存在用户上网标识为0,形成按时间段统计的上网行为矩阵A。
Figure BDA0001827527230000021
矩阵A有n行m列,每列代表一天的上网记录,每行代表统计周期时长。矩阵A的行数n与设定的考察上网时间段长度有关,假定1小时一个统计时间段,矩阵A的行数n=24。矩阵A的列数m与统计周期时长有关。按周统计,矩阵A的m=7;按月统计,矩阵A的m=30;按季度统计,矩阵A的m=90。
对矩阵A按行求和得矩阵B,按列求和得矩阵C。矩阵B反映统计周期内用户每个时段的上网时长分布,矩阵C反映统计周期内用户每天上网时长分布。
Figure BDA0001827527230000022
将矩阵B中元素排序,从大到小的顺序,取排名前面的几个时段作为用户上网活跃时间段。比如矩阵B中元素为28、15、10对应的时间段就可以作为用户一天中上网活跃时间段,累计可得上网时长。对矩阵C元素求均值和方差可得用户的上网次数分布。
用户活跃度定义为坐标值(上网次数,上网时长)。上网次数多、上网时间长表明用户对网络依赖强,属于高活跃用户。
这种用户上网活跃度建模方法操作简单,但存在以下两个问题:
问题一:用户上网行为不是固定时间发生的,而是存在随机性。统计时间段区间变大变小或者平移,统计结果都会发生变化,结论也会出现差异。
问题二:没有考虑用户消费流量的在网时间。用户点击上网链接,获得下载流量,用户在消费这些流量时往往处于在网状态。当堆积的下载流量越多,用户消费这些流量花费的时间也越长。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一方面在于提出了一种用户活跃度预测方法。
本发明的另一方面在于提出了一种用户活跃度预测系统。
本发明的再一方面在于提出了一种计算机可读存储介质。
有鉴于此,本发明提出了一种用户活跃度预测方法,包括:在预设统计周期内,根据用户的上网请求时间及下载流量,构建脉冲序列;将脉冲序列输入到构造函数的系统中,得到系统响应曲线;根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长,以及根据上网时间段确定上网次数;将上网次数及上网时长对应的坐标值投影到活跃度坐标系上,并根据坐标值在活跃度坐标系上的活跃度投影位置,确定所述用户的活跃度类型。
根据本发明的用户活跃度预测方法,将用户上网请求映射为上网请求时间上的脉冲函数,脉冲幅值为本次请求产生的下行流量,在预设统计周期内(如一天),将用户一天的上网请求映射成脉冲函数分布图,描述成脉冲序列,脉冲函数集中分布的地方表明用户在该时间段集中上网,其中家庭智能设备的上网请求不计入用户上网行为;用户消费流量的过程用构造函数来描述,将脉冲序列输入到构造函数的系统中,得到流量消费的系统响应曲线,通过分析系统响应曲线来判定用户的上网时间区间及上网时长,具体地,根据预设的流量门限值从系统响应曲线中找出用户在网时间,例如,用户在t时刻发起上网请求,获得下载流量M,从t时刻开始消费流量M,当流量低于流量门限值时,表示本次申请流量使用完毕,需要再次点击链接申请新流量,用户完成本次申请流量在网时间为T,上网时间段就是[t,t+T];有了上网请求时间及在网时间就很容易确定出用户的上网时间段;根据用户上网时间段可以确定出用户的上网次数,用户的上网次数和上网时长对应的坐标值就是用户的活跃度,在预设统计周期内,将所有宽带用户的活跃度投影到活跃度坐标系上,利用算法(如Kmean算法)汇聚出多个聚点,对应不同活跃度用户的分类,从而根据投影位置将用户分为高活跃用户、中活跃用户和低活跃用户。
在该技术方案中,从系统日志中确定用户上网请求时间及下载流量,为减少模型运算,对系统日志进行过滤处理,具体而言,下载流量大于设定的门限值的访问请求判定为用户主动上网请求,下载流量低于门限值的访问请求判定为无用户主动上网请求。
本发明的用户活跃度预测方法,基于用户上网请求时间和上网下载流量两个维度,能够精准快速地统计出用户上网时间段和在网时长,从而使建模过程变得简便,并有效提高了预测结果准确性,为电信宽带行业的运营提供可靠依据。
在上述技术方案中,优选地,记录多个预设统计周期中每个预设统计周期对应的活跃度投影位置,生成活跃度位置轨迹变化曲线,基于活跃度位置轨迹变化曲线,推测用户活跃度的变化趋势。
在该技术方案中,不同阶段,用户上网活跃度坐标位置会发生变化,位置点变化对应用户活跃状态的变更,根据活跃度位置轨迹变化趋势预测用户活跃度变化趋势,从而指导宽带业务运营。
在上述任一技术方案中,优选地,脉冲序列为
Figure BDA0001827527230000041
构造函数为H(t)=e-βt;系统响应曲线为
Figure BDA0001827527230000042
其中,δ(ti)为单位脉冲函数,Mi为所述下载流量,ti为所述上网请求时间,β为消费系数,τ为积分变量。
在该技术方案中,用户在t1时刻发起的上网请求映射为流量脉冲函数可用X(t1)=Mδ(t1)来描述,脉冲幅值为本次请求产生的下行流量M,将用户预设统计周期内的上网请求(主动上网请求)映射为脉冲函数分布图,可描述成脉冲序列
Figure BDA0001827527230000051
在该技术方案中,用户消费流量的过程用构造函数H(t)来描述,β为消费系数,可通过算法进行学习得到。将脉冲序列输入到构造函数H(t)=e-βt的系统中,得到系统响应曲线Y(t),用Y(t)描述用户在预设统计周期内的消费流量过程。
在上述任一技术方案中,优选地,根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长的步骤,具体包括:
步骤一,按照预设周期对系统响应曲线进行采样,得到系统响应曲线Y(j),(j=1,2,3,...,N);
步骤二,根据流量门限值找出符合第一预设条件的分界点bj,(j=1,2,3,...,n),将系统响应曲线Y(j),(j=1,2,3,...,N)分成多段区间,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];其中,第一预设条件为:Y(j-1)≥λ&Y(j)≤λ,λ为流量门限值;
步骤三,分别在多段区间的每段区间[bi-1,bi],(i=1,2,3,...,n)内找出符合第一预设条件的分界点,得到分界点aj,(j=1,2,3,...,n);
步骤四,根据分界点bj,(j=1,2,3,...,n)和分界点aj,(j=1,2,3,...,n)确定上网时间段及上网时长;上网时间段为:[a1,b1],[a2,b2],[a3,b3],...,[an,bn];上网时长为:
Figure BDA0001827527230000052
上网次数为:上网时间段分布区间个数n。
在该技术方案中,限定了根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长的步骤,具体而言,将Y(t)采样为Y(j),为保障精度,采样周期(即预设周期)最好控制在半小时内,根据流量门限值,从Y(j)中找出满足第一预设条件的n个分界点bj,(j=1,2,3,...,n),将Y(j)分成n段,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];再在每个分段区间[bi-1,bi],(i=1,2,3,...,n)内,找出满足第一预设条件的n个分界点aj,(j=1,2,3,...,n);由此便可确定出用户的上网时间段为[a1,b1],[a2,b2],[a3,b3],...,[an,bn],上网时间为
Figure BDA0001827527230000053
进一步可知用户的上网时间段分布集合为P={[a1,b1],[a2,b2],[a3,b3],...,[an,bn]}。
在上述任一技术方案中,优选地,根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长的步骤,具体还包括:
步骤五,在相邻上网时间段[aj-1,bj-1]和[aj,bj]符合第二预设条件时,其中第二预设条件为:aj-bj-1≤Δ,Δ为预设阈值,则将相邻上网时间段[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],则
上网时间段合并为:[a1',b1'],[a2',b2'],[a3',b3'],...,[ap',bp'];
上网时长合并为:
Figure BDA0001827527230000061
上网次数为:上网时间段分布区间个数p。
在该技术方案中,在计算得到用户的上网时间段分布集合P后,还可以将所有相近的上网时间段进行合并,在上网时间段[aj-1,bj-1]和[aj,bj]上,如果aj-bj-1≤Δ,Δ为预设阈值,其值由业务特征设定,比如1小时,合并相邻上网时间段,将[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],形成新的上网时间段和上网时长。
在上述任一技术方案中,优选地,
Figure BDA0001827527230000062
Figure BDA0001827527230000063
在该技术方案中,分界点bj和aj可以分别通过如上面给出的具体公式计算得到,其中,tj-1对应Y(j-1)计算时间点,tj对应Y(j)计算时间点,ti-1对应Y(i-1)计算时间点,ti对应Y(i)计算时间点。
本发明还提出了一种用户活跃度预测系统,包括:存储器,用于存储计算机程序;处理器,用于执行计算机程序以:在预设统计周期内,根据用户的上网请求时间及下载流量,构建脉冲函数;将脉冲函数输入到构造函数的系统中,得到系统响应曲线;根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长,以及根据上网时间段确定上网次数;将上网次数及上网时长对应的坐标值投影到活跃度坐标系上,并根据坐标值在活跃度坐标系上的活跃度投影位置,确定所述用户的活跃度类型。
根据本发明的用户活跃度预测系统,将用户上网请求映射为上网请求时间上的脉冲函数,脉冲幅值为本次请求产生的下行流量,在预设统计周期内(如一天),将用户一天的上网请求映射成脉冲函数分布图,描述成脉冲序列,脉冲函数集中分布的地方表明用户在该时间段集中上网,其中家庭智能设备的上网请求不计入用户上网行为;用户消费流量的过程用构造函数来描述,将脉冲序列输入到构造函数的系统中,得到流量消费的系统响应曲线,通过分析系统响应曲线来判定用户的上网时间区间及上网时长,具体地,根据预设的流量门限值从系统响应曲线中找出用户在网时间,有了上网请求时间及在网时间就很容易确定出用户的上网时间段。例如,用户在t时刻发起上网请求,获得下载流量M,从t时刻开始消费流量M,当流量低于流量门限值时,表示本次申请流量使用完毕,需要再次点击链接申请新流量,用户完成本次申请流量在网时间为T,上网时间段就是[t,t+T];根据用户上网时间段可以确定出用户的上网次数,用户的上网次数和上网时长对应的坐标值就是用户的活跃度,在预设统计周期内,将所有宽带用户的活跃度投影到活跃度坐标系上,利用算法(如Kmean算法)汇聚出多个聚点,对应不同活跃度用户的分类,从而根据投影位置将用户分为高活跃用户、中活跃用户和低活跃用户。
在该技术方案中,从系统日志中确定用户上网请求时间及下载流量,为减少模型运算,对系统日志进行过滤处理,具体而言,下载流量大于设定的门限值的访问请求判定为用户主动上网请求,下载流量低于门限值的访问请求判定为无用户主动上网请求。
本发明的用户活跃度预测系统,基于用户上网请求时间和上网下载流量两个维度,能够精准快速地统计出用户上网时间段和在网时长,从而使建模过程变得简便,并有效提高了预测结果准确性,为电信宽带行业的运营提供可靠依据。
在上述技术方案中,优选地,处理器,还用于执行计算机程序以:记录多个预设统计周期中每个预设统计周期对应的活跃度投影位置,生成活跃度位置轨迹变化曲线,基于位置轨迹变化曲线,推测用户活跃度的变化趋势。
在该技术方案中,不同阶段,用户上网活跃度坐标位置会发生变化,位置点变化对应用户活跃状态的变更,根据活跃度位置轨迹变化趋势预测用户活跃度变化趋势,从而指导宽带业务运营。
在上述任一技术方案中,优选地,脉冲序列为
Figure BDA0001827527230000071
构造函数为H(t)=e-βt;系统响应曲线为
Figure BDA0001827527230000072
其中,其中,δ(ti)为单位脉冲函数,Mi为所述下载流量,ti为所述上网请求时间,β为消费系数,τ为积分变量。
在该技术方案中,用户在t1时刻发起的上网请求映射为流量脉冲函数可用X(t1)=Mδ(t1)来描述,脉冲幅值为本次请求产生的下行流量M,将用户预设统计周期内的上网请求(主动上网请求)映射为脉冲函数分布图,可描述成脉冲序列
Figure BDA0001827527230000081
在上述任一技术方案中,优选地,处理器,具体用于执行计算机程序以:步骤一,按照预设周期对系统响应曲线进行采样,得到系统响应曲线Y(j),(j=1,2,3,...,N);
步骤二,根据流量门限值找出符合第一预设条件的分界点bj,(j=1,2,3,...,n),将系统响应曲线Y(j),(j=1,2,3,...,N)分成多段区间,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];其中,第一预设条件为:Y(j-1)≥λ&Y(j)≤λ,λ为流量门限值;
步骤三,分别在多段区间的每段区间[bi-1,bi],(i=1,2,3,...,n)内找出符合第一预设条件的分界点,得到分界点aj,(j=1,2,3,...,n);
步骤四,根据分界点bj,(j=1,2,3,...,n)和分界点aj,(j=1,2,3,...,n)确定上网时间段及上网时长;上网时间段为:[a1,b1],[a2,b2],[a3,b3],...,[an,bn];上网时长为:
Figure BDA0001827527230000082
上网次数为:上网时间段分布区间个数n。
在该技术方案中,限定了根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长的步骤,具体而言,将Y(t)采样为Y(j),为保障精度,采样周期(即预设周期)最好控制在半小时内,根据流量门限值,从Y(j)中找出满足第一预设条件的n个分界点bj,(j=1,2,3,...,n),将Y(j)分成n段,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];再在每个分段区间[bi-1,bi],(i=1,2,3,...,n)内,找出满足第一预设条件的n个分界点aj,(j=1,2,3,...,n);由此便可确定出用户的上网时间段为[a1,b1],[a2,b2],[a3,b3],...,[an,bn],上网时间为
Figure BDA0001827527230000083
进一步可知用户的上网时间段分布集合为P={[a1,b1],[a2,b2],[a3,b3],...,[an,bn]}。
在上述任一技术方案中,优选地,处理器,具体还用于执行计算机程序以:步骤五,在相邻上网时间段[aj-1,bj-1]和[aj,bj]符合第二预设条件时,其中第二预设条件为:aj-bj-1≤Δ,Δ为预设阈值,则将相邻上网时间段[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],则
上网时间段合并为:[a1',b1'],[a2',b2'],[a3',b3'],...,[ap',bp'];
上网时长合并为:
Figure BDA0001827527230000091
上网次数为:
上网时间段分布区间个数p。
在该技术方案中,在计算得到用户的上网时间段分布集合P后,还可以将所有相近的上网时间段进行合并,在上网时间段[aj-1,bj-1]和[aj,bj]上,如果aj-bj-1≤Δ,Δ为预设阈值,其值由业务特征设定,比如1小时,合并相邻上网时间段,将[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],形成新的上网时间段和上网时长。
在上述任一技术方案中,优选地,
Figure BDA0001827527230000092
Figure BDA0001827527230000093
在该技术方案中,分界点bj和aj可以分别通过如上面给出的具体公式计算得到,其中,tj-1对应Y(j-1)计算时间点,tj对应Y(j)计算时间点,ti-1对应Y(i-1)计算时间点,ti对应Y(i)计算时间点。
本发明还提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现了如上述技术方案中任一项的用户活跃度预测方法的步骤。
根据本发明的计算机可读存储介质,其上存储的计算机程序被处理器执行时实现了如上述技术方案中任一项的用户活跃度预测方法的步骤,因而该计算机可读存储介质能够实现该用户活跃度预测方法的全部有益效果,不再赘述。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了本发明一个实施例的用户活跃度预测方法的流程示意图;
图2示出了本发明另一个实施例的用户活跃度预测方法的流程示意图;
图3示出了本发明一个实施例的用户活跃度预测系统的示意框图;
图4a示出了本发明一个具体实施例的脉冲函数的示意图;
图4b示出了本发明一个具体实施例的系统脉冲响应曲线的示意图;
图5a示出了本发明一个具体实施例的脉冲函数分布的示意图;
图5b示出了本发明一个具体实施例的系统脉冲响应曲线的示意图;
图6示出了本发明一个具体实施例的活跃度坐标系的示意图;
图7示出了本发明另一个实施例的用户活跃度预测系统的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
如图1所示,根据本发明的一个实施例的用户活跃度预测方法的流程示意图。其中,该用户活跃度预测方法,包括:
步骤102,在预设统计周期内,根据用户的上网请求时间及下载流量,构建脉冲序列;
步骤104,将脉冲序列输入到构造函数的系统中,得到系统响应曲线;
步骤106,根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长,以及根据上网时间段确定上网次数;
步骤108,将上网次数及上网时长对应的坐标值投影到活跃度坐标系上,并根据坐标值在活跃度坐标系上的活跃度投影位置,确定所述用户的活跃度类型。
本发明实施例提供的用户活跃度预测方法,将用户上网请求映射为时间t时间上的脉冲函数;在预设统计周期内(如一天),将用户一天的上网请求映射成脉冲函数分布图,描述成脉冲序列,脉冲函数集中分布的地方表明用户在该时间段集中上网,其中家庭智能设备的上网请求不计入用户上网行为;用户消费流量的过程用构造函数来描述,将脉冲序列输入到构造函数的系统中,得到流量消费的系统响应曲线;通过分析系统响应曲线来判定用户的上网时间区间及上网时长,具体地,根据预设的流量门限值从系统响应曲线中找出用户在网时间;根据用户上网时间段可以确定出用户的上网次数,用户的上网次数和上网时长对应的坐标值就是用户的活跃度,在预设统计周期内,将所有宽带用户的活跃度投影到活跃度坐标系上,利用算法(如Kmean算法)汇聚出多个聚点,对应不同活跃度用户的分类,从而根据投影位置将用户分为高活跃用户、中活跃用户和低活跃用户。本发明的用户活跃度预测方法,基于用户上网请求时间和上网下载流量两个维度,能够精准快速地统计出用户上网时间段和在网时长,从而使建模过程变得简便,并有效提高了预测结果准确性,为电信宽带行业的运营提供可靠依据。
在本发明的一个实施例中,从系统日志中确定用户上网请求时间及下载流量,为减少模型运算,对系统日志进行过滤处理,具体而言,下载流量大于设定的门限值的访问请求判定为用户主动上网请求,下载流量低于门限值的访问请求判定为无用户主动上网请求。
如图2所示,根据本发明的另一个实施例的用户活跃度预测方法的流程示意图。其中,该用户活跃度预测方法,包括:
步骤202,在预设统计周期内,根据用户的上网请求时间及下载流量,构建脉冲序列;
步骤204,将脉冲序列输入到构造函数的系统中,得到系统响应曲线;
步骤206,根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长,以及根据上网时间段确定上网次数;
步骤208,将上网次数及上网时长对应的坐标值投影到活跃度坐标系上,并根据坐标值在活跃度坐标系上的活跃度投影位置,确定所述用户的活跃度类型;
步骤210,记录多个预设统计周期中每个预设统计周期对应的活跃度投影位置,生成活跃度位置轨迹变化曲线,基于位置轨迹变化曲线,推测用户活跃度的变化趋势。
在该实施例中,不同阶段,用户上网活跃度坐标位置会发生变化,位置点变化对应用户活跃状态的变更,根据活跃度位置轨迹变化趋势预测用户活跃度变化趋势,从而指导宽带业务运营。
在上述任一实施例中,优选地,脉冲序列为
Figure BDA0001827527230000121
构造函数为H(t)=e-βt;系统响应曲线为
Figure BDA0001827527230000122
其中,δ(ti)为单位脉冲函数,Mi为所述下载流量,ti为所述上网请求时间,β为消费系数,τ为积分变量。
在该实施例中,用户在t1时刻发起的上网请求映射为流量脉冲函数可用X(t1)=Mδ(t1)来描述,脉冲幅值为本次请求产生的下行流量M,将用户预设统计周期内的上网请求(主动上网请求)映射为脉冲函数分布图,可描述成脉冲序列
Figure BDA0001827527230000123
在该实施例中,用户消费流量的过程用构造函数H(t)来描述,β为消费系数,可通过算法进行学习得到。将脉冲序列输入到构造函数H(t)=e-βt的系统中,得到系统响应曲线Y(t),用Y(t)描述用户在预设统计周期内的消费流量过程。
在上述任一实施例中,优选地,根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长的步骤,具体包括:
步骤一,按照预设周期对系统响应曲线进行采样,得到系统响应曲线Y(j),(j=1,2,3,...,N);
步骤二,根据流量门限值找出符合第一预设条件的分界点bj,(j=1,2,3,...,n),将系统响应曲线Y(j),(j=1,2,3,...,N)分成多段区间,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];其中,第一预设条件为:Y(j-1)≥λ&Y(j)≤λ,λ为流量门限值;
步骤三,分别在多段区间的每段区间[bi-1,bi],(i=1,2,3,...,n)内找出符合第一预设条件的分界点,得到分界点aj,(j=1,2,3,...,n);
步骤四,根据分界点bj,(j=1,2,3,...,n)和分界点aj,(j=1,2,3,...,n)确定上网时间段及上网时长;上网时间段为:[a1,b1],[a2,b2],[a3,b3],...,[an,bn];上网时长为:
Figure BDA0001827527230000131
上网次数为:上网时间段分布区间个数n。
在该实施例中,限定了根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长的步骤,具体而言,将Y(t)采样为Y(j),为保障精度,采样周期(即预设周期)最好控制在半小时内,根据流量门限值,从Y(j)中找出满足第一预设条件的n个分界点bj,(j=1,2,3,...,n),将Y(j)分成n段,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];再在每个分段区间[bi-1,bi],(i=1,2,3,...,n)内,找出满足第一预设条件的n个分界点aj,(j=1,2,3,...,n);由此便可确定出用户的上网时间段为[a1,b1],[a2,b2],[a3,b3],...,[an,bn],上网时间为
Figure BDA0001827527230000132
进一步可知用户的上网时间段分布集合为P={[a1,b1],[a2,b2],[a3,b3],...,[an,bn]}。
在上述任一实施例中,优选地,根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长的步骤,具体还包括:
步骤五,在相邻上网时间段[aj-1,bj-1]和[aj,bj]符合第二预设条件时,其中第二预设条件为:aj-bj-1≤Δ,Δ为预设阈值,则将相邻上网时间段[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],则
上网时间段合并为:[a1',b1'],[a2',b2'],[a3',b3'],...,[ap',bp'];
上网时长合并为:
Figure BDA0001827527230000133
上网次数为:上网时间段分布区间个数p。
在该实施例中,在计算得到用户的上网时间段分布集合P后,还可以将所有相近的上网时间段进行合并,在上网时间段[aj-1,bj-1]和[aj,bj]上,如果aj-bj-1≤Δ,Δ为预设阈值,其值由业务特征设定,比如1小时,合并相邻上网时间段,将[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],形成新的上网时间段和上网时长。
在上述任一实施例中,优选地,
Figure BDA0001827527230000134
Figure BDA0001827527230000135
在该实施例中,分界点bj和aj可以分别通过如上面给出的具体公式计算得到,其中,tj-1对应Y(j-1)计算时间点,tj对应Y(j)计算时间点,ti-1对应Y(i-1)计算时间点,ti对应Y(i)计算时间点。
如图3所示,根据本发明的一个实施例的用户活跃度预测系统的示意框图。其中,该用户活跃度预测系统300,包括:
存储器302,用于存储计算机程序;
处理器304,用于执行计算机程序以:在预设统计周期内,根据用户的上网请求时间及下载流量,构建脉冲函数;将脉冲函数输入到构造函数的系统中,得到系统响应曲线;根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长,以及根据上网时间段确定上网次数;将上网次数及上网时长对应的坐标值投影到活跃度坐标系上,并根据坐标值在活跃度坐标系上的活跃度投影位置,确定所述用户的活跃度类型。
本发明实施例提供的用户活跃度预测系统300,将用户上网请求映射为上网请求时间上的脉冲函数,脉冲幅值为本次请求产生的下行流量,在预设统计周期内(如一天),将用户一天的上网请求映射成脉冲函数分布图,描述成脉冲序列,脉冲函数集中分布的地方表明用户在该时间段集中上网,其中家庭智能设备的上网请求不计入用户上网行为;用户消费流量的过程用构造函数来描述,将脉冲序列输入到构造函数的系统中,得到流量消费的系统响应曲线,通过分析系统响应曲线来判定用户的上网时间区间及上网时长,具体地,根据预设的流量门限值从系统响应曲线中找出用户在网时间,有了上网请求时间及在网时间就很容易确定出用户的上网时间段。例如,用户在t时刻发起上网请求,获得下载流量M,从t时刻开始消费流量M,当流量低于流量门限值时,表示本次申请流量使用完毕,需要再次点击链接申请新流量,用户完成本次申请流量在网时间为T,上网时间段就是[t,t+T];根据用户上网时间段可以确定出用户的上网次数,用户的上网次数和上网时长对应的坐标值就是用户的活跃度,在预设统计周期内,将所有宽带用户的活跃度投影到活跃度坐标系上,利用算法(如Kmean算法)汇聚出多个聚点,对应不同活跃度用户的分类,从而根据投影位置将用户分为高活跃用户、中活跃用户和低活跃用户。本发明的用户活跃度预测系统300,基于用户上网请求时间和上网下载流量两个维度,能够精准快速地统计出用户上网时间段和在网时长,从而使建模过程变得简便,并有效提高了预测结果准确性,为电信宽带行业的运营提供可靠依据。
在该实施例中,从系统日志中确定用户上网请求时间及下载流量,为减少模型运算,对系统日志进行过滤处理,具体而言,下载流量大于设定的门限值的访问请求判定为用户主动上网请求,下载流量低于门限值的访问请求判定为无用户主动上网请求。
在本发明的一个实施例中,优选地,处理器304,还用于执行计算机程序以:记录多个预设统计周期中每个预设统计周期对应的活跃度投影位置,生成活跃度位置轨迹变化曲线,基于位置轨迹变化曲线,推测用户活跃度的变化趋势。
在该实施例中,不同阶段,用户上网活跃度坐标位置会发生变化,位置点变化对应用户活跃状态的变更,根据活跃度位置轨迹变化趋势预测用户活跃度变化趋势,从而指导宽带业务运营。
在本发明的一个实施例中,优选地,脉冲序列为
Figure BDA0001827527230000151
构造函数为H(t)=e-βt;系统响应曲线为
Figure BDA0001827527230000152
其中,其中,δ(ti)为单位脉冲函数,Mi为所述下载流量,ti为所述上网请求时间,β为消费系数,τ为积分变量。
在该实施例中,用户在t1时刻发起的上网请求映射为流量脉冲函数可用X(t1)=Mδ(t1)来描述,脉冲幅值为本次请求产生的下行流量M,将用户预设统计周期内的上网请求(主动上网请求)映射为脉冲函数分布图,可描述成脉冲序列
Figure BDA0001827527230000153
在本发明的一个实施例中,优选地,处理器304,具体用于执行计算机程序以:步骤一,按照预设周期对系统响应曲线进行采样,得到系统响应曲线Y(j),(j=1,2,3,...,N);
步骤二,根据流量门限值找出符合第一预设条件的分界点bj,(j=1,2,3,...,n),将系统响应曲线Y(j),(j=1,2,3,...,N)分成多段区间,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];其中,第一预设条件为:Y(j-1)≥λ&Y(j)≤λ,λ为流量门限值;
步骤三,分别在多段区间的每段区间[bi-1,bi],(i=1,2,3,...,n)内找出符合第一预设条件的分界点,得到分界点aj,(j=1,2,3,...,n);
步骤四,根据分界点bj,(j=1,2,3,...,n)和分界点aj,(j=1,2,3,...,n)确定上网时间段及上网时长;上网时间段为:[a1,b1],[a2,b2],[a3,b3],...,[an,bn];上网时长为:
Figure BDA0001827527230000161
上网次数为:上网时间段分布区间个数n。
在该实施例中,限定了根据流量门限值及系统响应曲线,计算用户的上网时间段及上网时长的步骤,具体而言,将Y(t)采样为Y(j),为保障精度,采样周期(即预设周期)最好控制在半小时内,根据流量门限值,从Y(j)中找出满足第一预设条件的n个分界点bj,(j=1,2,3,...,n),将Y(j)分成n段,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];再在每个分段区间[bi-1,bi],(i=1,2,3,...,n)内,找出满足第一预设条件的n个分界点aj,(j=1,2,3,...,n);由此便可确定出用户的上网时间段为[a1,b1],[a2,b2],[a3,b3],...,[an,bn],上网时间为
Figure BDA0001827527230000162
进一步可知用户的上网时间段分布集合为P={[a1,b1],[a2,b2],[a3,b3],...,[an,bn]}。
在本发明的一个实施例中,优选地,处理器304,具体还用于执行计算机程序以:步骤五,在相邻上网时间段[aj-1,bj-1]和[aj,bj]符合第二预设条件时,其中第二预设条件为:aj-bj-1≤Δ,Δ为预设阈值,则将相邻上网时间段[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],则
上网时间段合并为:[a1',b1'],[a2',b2'],[a3',b3'],...,[ap',bp'];
上网时长合并为:
Figure BDA0001827527230000163
上网次数为:上网时间段分布区间个数p。
在该实施例中,在计算得到用户的上网时间段分布集合P后,还可以将所有相近的上网时间段进行合并,在上网时间段[aj-1,bj-1]和[aj,bj]上,如果aj-bj-1≤Δ,Δ为预设阈值,其值由业务特征设定,比如1小时,合并相邻上网时间段,将[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],形成新的上网时间段和上网时长。
在本发明的一个实施例中,优选地,
Figure BDA0001827527230000164
Figure BDA0001827527230000165
在该实施例中,分界点bj和aj可以分别通过如上面给出的具体公式计算得到,其中,tj-1对应Y(j-1)计算时间点,tj对应Y(j)计算时间点,ti-1对应Y(i-1)计算时间点,ti对应Y(i)计算时间点。
图4a示出了本发明一个实施例的脉冲函数的示意图,如图4a所示,将用户上网请求映射为时间t上的脉冲函数,t为本次上网请求的发起时刻,脉冲幅值为本次请求产生的申请流量M。
图4b示出了本发明一个实施例的系统脉冲响应曲线的示意图,如图4b所示,通过分析系统脉冲响应来判定用户的上网时间区间和上网时长,用户在t时刻发起上网请求,获得下载流量M,从t时刻开始消费流量M,当流量低于某个门限值时表示本次申请流量使用完毕,需要再次点击链接申请新的流量,用户完成本次申请流量在网时间为T,上网时间段就是[t,t+T]。
图5a示出了本发明一个实施例的脉冲函数分布的示意图,如图5a所示,用户一天的上网请求映射成脉冲函数分布图,脉冲函数集中分布的地方表明用户在该时间段集中上网。将所有脉冲函数描述成脉冲序列为
Figure BDA0001827527230000171
其中家庭智能设备的上网请求不计入用户行为,此外为减少模型运算量,对访问日志进行过滤处理,具体地,下行流量大于门限值λ的访问请求(比如λ=100K)判定为用户主动上网请求;下行流量低于门限值λ的访问请求判定为无用户主动上网请求。
将图5a所示的脉冲序列X(t)输入到构造函数为H(t)=e-βt的系统中,得到脉冲响应曲线
Figure BDA0001827527230000172
如图5b所示。通过设定的门限值可找出用户在网时间T1、T2和T3。用户上网时间段就是[t1,t1+T1]、[t2,t2+T2]和[t3,t3+T3]。
其中,用户上网时长和上网时间段分布判决方法的执行步骤如下:
第1步,将Y(t)采样为Y(j),(j=1,2,3,...,N),采样周期为20分钟;
第2步,根据门限值λ从Y(j),(j=1,2,3,...,N)找出满足Y(j-1)≥λ&Y(j)≤λ的分界点bj,(j=1,2,3,...,n),
Figure BDA0001827527230000173
则将Y(j)分成n段,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];
第3步,在[bi-1,bi]分段区间内,找出满足Y(j-1)≥λ&Y(j)≤λ的分界点aj,(j=1,2,3,...,n),
Figure BDA0001827527230000174
第4步,重复第三步,找出n个分界点a1,a2,a3,...,an
第5步,用户上网时间段为:[a1,b1],[a2,b2],[a3,b3],...,[an,bn],
用户上网时长为:
Figure BDA0001827527230000181
用户上网时间段分布集合为P={[a1,b1],[a2,b2],[a3,b3],...,[an,bn]};
第6步,合并所有相近的上网时间段,在上网时间段[aj-1,bj-1]和[aj,bj]上,如果aj-bj-1≤Δ,Δ大小由业务特征设定,比如1小时,合并相邻上网时间段,将[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],形成新的上网时间段和上网时长,上网时间段合并为:[a1',b1'],[a2',b2'],[a3',b3'],...,[ap',bp'];
上网时长合并为:
Figure BDA0001827527230000182
用户上网时间段分布集合P={[a1',b1'],[a2',b2'],[a3',b3'],...,[an',bn']}。
此外,有了用户一天的上网时间和上网时间段分布,可扩展到一定周期内用户上网时间和上网时间段分布。基于用户一个月上网记录分析用户的上网时长和上网时间段,将一个月用户的上网请求映射到如图5a所示的脉冲函数分布图,相同时刻的脉冲函数进行流量叠加。将脉冲序列X(t)输入到构造函数H(t)=e-βt的系统中,得到系统响应曲线Y(t)。通过步骤1至6计算出用户这一个月内的上网时长和上网时间段分布。还可以利用步骤1至6计算出用户每天的上网时间段分布集合P1,P2,P3,...,P30,用户在这一个月内的上网时间段分布P=P1∩P2∩P3∩...∩P30,根据上网时间段分布计算出上网时长。
用户上网活跃度定义为坐标值(上网次数,上网时长),投影到如图6所示的用户活跃度坐标系中一个点(P,T’),将统计周期内,所有宽带用户的活跃度投影到图6所示的坐标系上,利用Kmean算法汇聚出多个聚点,对应不同活跃度用户的分类。根据(P,T’)位置分布,将用户分为高活跃用户、中活跃用户和低活跃用户。
图7示出了本发明另一个实施例的用户活跃度预测系统的示意图,如图7所示,该用户活跃度预测系统包括:模块702,用于用户上网请求数据采集;模块704,用于构建上网行为脉冲响应;模块706,用于上网时间段和上网时长判决;模块708为用户活跃度模型,模块710,用于用户活跃度分类;模块712,用于用户活跃度预测。该活跃度预测系统的工作流程如下:
模块702从系统日志中提取用户ID、上网时间、请求url和流量记录,生产数据字段;模块704根据101模块生成的数据字段构建脉冲输入信号X(t),并把X(t)输入到H(t)系统中,得到系统响应曲线Y(t);模块706基于系统响应曲线计算出用户上网时间段分布集合和上网时长;模块708根据用户上网时间段分布计算出上网次数,合并上网时长参数,投影到活跃度坐标系上;模块710根据活跃度投影位置度用户进行分类,确定该用户属于高活跃度用户,还是中活跃度用户,还是低活跃度用户;模块712记录多个统计周期内用户活跃度位置点,生产位置轨迹变化曲线,并推测用户未来活跃度的变化趋势,将预测结果反馈给宽带运营系统。
本发明实施例还提出了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现了如上述实施例中任一项的用户活跃度预测方法的步骤。
本发明实施例的计算机可读存储介质,其上存储的计算机程序被处理器执行时实现了如上述实施例中任一项的用户活跃度预测方法的步骤,因而该计算机可读存储介质能够实现该用户活跃度预测方法的全部有益效果,不再赘述。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种用户活跃度预测方法,其特征在于,包括:
在预设统计周期内,根据用户的上网请求时间及下载流量,构建脉冲序列;
将所述脉冲序列输入到构造函数的系统中,得到系统响应曲线;
根据流量门限值及所述系统响应曲线,计算用户的上网时间段及上网时长,以及根据所述上网时间段确定上网次数;
将所述上网次数及所述上网时长对应的坐标值投影到活跃度坐标系上,并根据所述坐标值在所述活跃度坐标系上的活跃度投影位置,确定所述用户的活跃度类型。
2.根据权利要求1所述的用户活跃度预测方法,其特征在于,还包括:
记录多个所述预设统计周期中每个所述预设统计周期对应的所述活跃度投影位置,生成活跃度位置轨迹变化曲线,基于所述位置轨迹变化曲线,推测用户活跃度的变化趋势。
3.根据权利要求1所述的用户活跃度预测方法,其特征在于,
所述脉冲序列为
Figure FDA0001827527220000011
所述构造函数为H(t)=e-βt
所述系统响应曲线为
Figure FDA0001827527220000012
其中,δ(ti)为单位脉冲函数,Mi为所述下载流量,ti为所述上网请求时间,β为消费系数,τ为积分变量。
4.根据权利要求1至3中任一项所述的用户活跃度预测方法,其特征在于,所述根据流量门限值及所述系统响应曲线,计算用户的上网时间段及上网时长的步骤,具体包括:
步骤一,按照预设周期对所述系统响应曲线进行采样,得到系统响应曲线Y(j),(j=1,2,3,...,N);
步骤二,根据所述流量门限值找出符合第一预设条件的分界点bj,(j=1,2,3,...,n),将所述系统响应曲线Y(j),(j=1,2,3,...,N)分成多段区间,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];其中,
所述第一预设条件为:Y(j-1)≥λ&Y(j)≤λ,λ为所述流量门限值;
步骤三,分别在所述多段区间的每段区间[bi-1,bi],(i=1,2,3,...,n)内找出符合所述第一预设条件的分界点,得到分界点aj,(j=1,2,3,...,n);
步骤四,根据所述分界点bj,(j=1,2,3,...,n)和所述分界点aj,(j=1,2,3,...,n)确定所述上网时间段及所述上网时长;
所述上网时间段为:[a1,b1],[a2,b2],[a3,b3],...,[an,bn];
所述上网时长为:
Figure FDA0001827527220000021
所述上网次数为:所述上网时间段分布区间个数n。
5.根据权利要求4所述的用户活跃度预测方法,其特征在于,所述根据流量门限值及所述系统响应曲线,计算用户的上网时间段及上网时长的步骤,具体还包括:
步骤五,在相邻上网时间段[aj-1,bj-1]和[aj,bj]符合第二预设条件时,其中所述第二预设条件为:aj-bj-1≤Δ,Δ为预设阈值,则将所述相邻上网时间段[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],则
所述上网时间段合并为:[a1',b1'],[a2',b2'],[a3',b3'],...,[ap',bp'];
所述上网时长合并为:
Figure FDA0001827527220000022
所述上网次数为:所述上网时间段分布区间个数p。
6.根据权利要求5所述的用户活跃度预测方法,其特征在于,
Figure FDA0001827527220000023
Figure FDA0001827527220000024
7.一种用户活跃度预测系统,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以:
在预设统计周期内,根据用户的上网请求时间及下载流量,构建脉冲序列;将所述脉冲序列输入到构造函数的系统中,得到系统响应曲线;根据流量门限值及所述系统响应曲线,计算用户的上网时间段及上网时长,以及根据所述上网时间段确定上网次数;将所述上网次数及所述上网时长对应的坐标值投影到活跃度坐标系上,并根据所述坐标值在所述活跃度坐标系上的投影位置,确定所述用户的活跃度类型。
8.根据权利要求7所述的用户活跃度预测系统,其特征在于,所述处理器,还用于执行所述计算机程序以:
记录多个所述预设统计周期中每个所述预设统计周期对应的所述投影位置,生成位置轨迹变化曲线,基于所述位置轨迹变化曲线,推测用户活跃度的变化趋势。
9.根据权利要求7所述的用户活跃度预测系统,其特征在于,
所述脉冲序列为
Figure FDA0001827527220000031
所述构造函数为H(t)=e-βt
所述系统响应曲线为
Figure FDA0001827527220000032
其中,δ(ti)为单位脉冲函数,Mi为所述下载流量,ti为所述上网请求时间,β为消费系数,τ为积分变量。
10.根据权利要求7至9中任一项所述的用户活跃度预测系统,其特征在于,所述处理器,具体用于执行所述计算机程序以:
步骤一,按照预设周期对所述系统响应曲线进行采样,得到系统响应曲线Y(j),(j=1,2,3,...,N);
步骤二,根据所述流量门限值找出符合第一预设条件的分界点bj,(j=1,2,3,...,n),将所述系统响应曲线Y(j),(j=1,2,3,...,N)分成多段区间,即[0,b1],[b1,b2],[b2,b3],...,[bn-1,bn];其中,
所述第一预设条件为:Y(j-1)≥λ&Y(j)≤λ,λ为所述流量门限值;
步骤三,分别在所述多段区间的每段区间[bi-1,bi],(i=1,2,3,...,n)内找出符合所述第一预设条件的分界点,得到分界点aj,(j=1,2,3,...,n);
步骤四,根据所述分界点bj,(j=1,2,3,...,n)和所述分界点aj,(j=1,2,3,...,n)确定所述上网时间段及所述上网时长;
所述上网时间段为:[a1,b1],[a2,b2],[a3,b3],...,[an,bn];
所述上网时长为:
Figure FDA0001827527220000033
所述上网次数为:所述上网时间段分布区间个数n。
11.根据权利要求10所述的用户活跃度预测系统,其特征在于,所述处理器,具体还用于执行所述计算机程序以:
步骤五,在相邻上网时间段[aj-1,bj-1]和[aj,bj]符合第二预设条件时,其中所述第二预设条件为:aj-bj-1≤Δ,Δ为预设阈值,则将所述相邻上网时间段[aj-1,bj-1]和[aj,bj]合并为[aj-1,bj],则
所述上网时间段合并为:[a1',b1'],[a2',b2'],[a3',b3'],...,[ap',bp'];
所述上网时长合并为:
Figure FDA0001827527220000041
所述上网次数为:所述上网时间段分布区间个数p。
12.根据权利要求11所述的用户活跃度预测系统,其特征在于,
Figure FDA0001827527220000042
Figure FDA0001827527220000043
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现了如权利要求1至6中任一项所述的用户活跃度预测方法的步骤。
CN201811191136.XA 2018-10-12 2018-10-12 用户活跃度预测方法、预测系统及介质 Pending CN111047338A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811191136.XA CN111047338A (zh) 2018-10-12 2018-10-12 用户活跃度预测方法、预测系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811191136.XA CN111047338A (zh) 2018-10-12 2018-10-12 用户活跃度预测方法、预测系统及介质

Publications (1)

Publication Number Publication Date
CN111047338A true CN111047338A (zh) 2020-04-21

Family

ID=70229779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811191136.XA Pending CN111047338A (zh) 2018-10-12 2018-10-12 用户活跃度预测方法、预测系统及介质

Country Status (1)

Country Link
CN (1) CN111047338A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612826A (zh) * 2020-12-21 2021-04-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112633573A (zh) * 2020-12-21 2021-04-09 北京达佳互联信息技术有限公司 活跃状态的预测方法以及活跃度阈值的确定方法
CN113610555A (zh) * 2021-07-02 2021-11-05 北京达佳互联信息技术有限公司 目标应用的投放方法、装置、电子设备及存储介质
CN113656275A (zh) * 2021-08-24 2021-11-16 广州虎牙科技有限公司 用户活跃度预测方法、装置、电子设备和存储介质
CN116886571A (zh) * 2023-09-07 2023-10-13 武汉博易讯信息科技有限公司 针对家庭宽带用户的分析方法、设备及计算机可读介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446105A (zh) * 2010-09-30 2012-05-09 北大方正集团有限公司 可按需定制应用程序的方法、终端和系统
US20150278837A1 (en) * 2014-03-31 2015-10-01 Liveperson, Inc. Online behavioral predictor
CN105631538A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 一种用户活跃度的预测方法、装置及其应用方法和系统
CN105677772A (zh) * 2015-12-30 2016-06-15 赛尔网络有限公司 一种isp间互联口url活跃度的统计方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446105A (zh) * 2010-09-30 2012-05-09 北大方正集团有限公司 可按需定制应用程序的方法、终端和系统
US20150278837A1 (en) * 2014-03-31 2015-10-01 Liveperson, Inc. Online behavioral predictor
CN105631538A (zh) * 2015-12-23 2016-06-01 北京奇虎科技有限公司 一种用户活跃度的预测方法、装置及其应用方法和系统
CN105677772A (zh) * 2015-12-30 2016-06-15 赛尔网络有限公司 一种isp间互联口url活跃度的统计方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612826A (zh) * 2020-12-21 2021-04-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN112633573A (zh) * 2020-12-21 2021-04-09 北京达佳互联信息技术有限公司 活跃状态的预测方法以及活跃度阈值的确定方法
CN112612826B (zh) * 2020-12-21 2024-02-06 北京达佳互联信息技术有限公司 数据处理方法和装置
CN113610555A (zh) * 2021-07-02 2021-11-05 北京达佳互联信息技术有限公司 目标应用的投放方法、装置、电子设备及存储介质
CN113656275A (zh) * 2021-08-24 2021-11-16 广州虎牙科技有限公司 用户活跃度预测方法、装置、电子设备和存储介质
CN113656275B (zh) * 2021-08-24 2024-03-26 广州虎牙科技有限公司 用户活跃度预测方法、装置、电子设备和存储介质
CN116886571A (zh) * 2023-09-07 2023-10-13 武汉博易讯信息科技有限公司 针对家庭宽带用户的分析方法、设备及计算机可读介质
CN116886571B (zh) * 2023-09-07 2023-11-21 武汉博易讯信息科技有限公司 针对家庭宽带用户的分析方法、设备及计算机可读介质

Similar Documents

Publication Publication Date Title
CN111047338A (zh) 用户活跃度预测方法、预测系统及介质
US9514248B1 (en) System to group internet devices based upon device usage
TWI617927B (zh) 用戶行為資訊收集及資訊發送方法及裝置
Chung et al. Bike angels: An analysis of citi bike's incentive program
CN103200262B (zh) 一种基于移动网络的广告调度方法、装置及系统
CN107689008A (zh) 一种用户投保行为预测的方法及装置
CN104035926B (zh) 一种互联网信息的投放和系统
CN111026971A (zh) 内容的推送方法及装置、计算机存储介质
JP2003523578A (ja) ネットワーク上の対話の妥当性を決定するためのシステムおよび方法
CN104836781A (zh) 区分访问用户身份的方法及装置
Panneerselvam et al. Workload analysis for the scope of user demand prediction model evaluations in cloud environments
CN110111152A (zh) 一种内容推荐方法、装置及服务器
CN104951465A (zh) 应用推荐方法及装置
CN109741177A (zh) 用户信用的评估方法、装置及智能终端
CN107305611A (zh) 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置
CN114780233A (zh) 基于微服务链路分析和强化学习的调度方法及装置
CN117632905B (zh) 基于云端使用记录的数据库管理方法及系统
CN113254472A (zh) 一种参数配置方法、装置、设备及可读存储介质
Sladescu et al. Event aware workload prediction: A study using auction events
CN111209105A (zh) 扩容处理方法、装置、设备及可读存储介质
CN115408586A (zh) 一种智能渠道运营数据分析方法、系统、设备及存储介质
Leka et al. A hybrid cnn-lstm model for virtual machine workload forecasting in cloud data center
CN113821574B (zh) 用户行为分类方法和装置及存储介质
CN108228879A (zh) 一种数据更新方法、存储介质和智能设备
CN112434019B (zh) 应用于户变关系变更的历史电量溯源清洗方法及电力系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200421