CN110148011B - 基于大数据的活跃量下降分析方法、装置、设备及介质 - Google Patents

基于大数据的活跃量下降分析方法、装置、设备及介质 Download PDF

Info

Publication number
CN110148011B
CN110148011B CN201910300462.8A CN201910300462A CN110148011B CN 110148011 B CN110148011 B CN 110148011B CN 201910300462 A CN201910300462 A CN 201910300462A CN 110148011 B CN110148011 B CN 110148011B
Authority
CN
China
Prior art keywords
analyzed
active
activity
group
acquiring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910300462.8A
Other languages
English (en)
Other versions
CN110148011A (zh
Inventor
陈伟源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910300462.8A priority Critical patent/CN110148011B/zh
Publication of CN110148011A publication Critical patent/CN110148011A/zh
Application granted granted Critical
Publication of CN110148011B publication Critical patent/CN110148011B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据的活跃量下降分析方法、装置、设备及介质,所述分析方法包括:获取待分析APP的埋点数据;采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量;分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度;获取所述待分析群体在所述待分析时间跨度内的活跃埋点;获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因。本发明解决了现有技术无法针对具体的用户群体从业务层面上分析活跃量变化的原因的问题,提高了APP活跃量分析的可靠性。

Description

基于大数据的活跃量下降分析方法、装置、设备及介质
技术领域
本发明涉及信息技术领域,尤其涉及一种基于大数据的活跃量下降分析方法、装置、设备及介质。
背景技术
在商业分析中,需要定期地检视关键绩效指标(KPI指标),研究用户数据上浮或下降等活跃量变化的原因。比如通过对APP活跃量下降进行分析,得到是由于注册用户下降或者留存用户减少引起的。然而注册用户下降或者留存用户减少等原因均为APP活跃量下降的现象表现,究竟是什么实际原因导致注册用户下降或者留存用户减少,现有技术无法将活跃量下降的原因与业务联系起来,更无法针对具体的用户群体从业务层面上找到活跃量变化的原因。
因此,寻找一种能够针对具体用户群体分析活跃量变化的业务层面上的原因的方法成为本领域技术人员亟需解决的问题。
发明内容
本发明实施例提供了一种基于大数据的活跃量下降分析方法、装置、设备及介质,以实现对具体的用户群体从业务层面上分析活跃量变化的原因。
一种基于大数据的活跃量下降分析方法,包括:
获取待分析APP的埋点数据;
采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量;
分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度;
获取所述待分析群体在所述待分析时间跨度内的活跃埋点;
获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因。
可选地,所述采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量包括:
获取用于划分用户群体的属性信息,并根据所述属性信息划分出不同的用户群体;
获取统计周期,并采用预设的SQL语句计算每一用户群体在所述统计周期内的活跃用户数,得到所述用户群体的活跃量。
可选地,所述分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度包括:
针对每一用户群体,将其活跃量分别与第一活跃阈值和第二活跃阈值进行比较;
若所述活跃量大于或等于所述第一活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为活跃状态;
若所述活跃量小于或等于所述第二活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为沉默状态;
获取随时间发展从活跃状态变为沉默状态的用户群体作为待分析群体,以及获取活跃状态的持续时间作为待分析时间跨度。
可选地,所述获取所述待分析群体在所述待分析时间跨度内的活跃埋点包括:
获取所述待分析群体在所述待分析时间跨度内的若干个埋点;
获取所述待分析群体在每一个所述埋点对应的活跃量;
选取活跃量最大的埋点作为所述待分析群体的活跃埋点。
可选地,所述获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因之后,还包括:
关联并存储所述用户群体和所述事件信息。
一种基于大数据的活跃量下降分析装置,包括:
数据获取模块,用于获取待分析APP的埋点数据;
统计模块,用于采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量;
分析模块,用于分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度;
埋点获取模块,用于获取所述待分析群体在所述待分析时间跨度内的活跃埋点;
事件获取模块,用于获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因。
可选地,所述统计模块包括:
群体划分单元,用于获取用于划分用户群体的属性信息,并根据所述属性信息划分出不同的用户群体;
活跃量统计单元,用于获取统计周期,并采用预设的SQL语句计算每一用户群体在所述统计周期内的活跃用户数,得到所述用户群体的活跃量。
可选地,所述分析模块包括:
比较单元,用于针对每一用户群体,将其活跃量分别与第一活跃阈值和第二活跃阈值进行比较;
第一标记单元,用于若所述活跃量大于或等于所述第一活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为活跃状态;
第二标记单元,用于若所述活跃量小于或等于所述第二活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为沉默状态;
获取单元,用于获取随时间发展从活跃状态变为沉默状态的用户群体作为待分析群体,以及获取活跃状态的持续时间作为待分析时间跨度。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于大数据的活跃量下降分析方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于大数据的活跃量下降分析方法的步骤。
本发明实施例通过获取待分析APP的埋点数据;采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量;分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度;获取所述待分析群体在所述待分析时间跨度内的活跃埋点;获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因,从而实现了在业务层面上对活跃量的分析,通过结合用户群体和活跃埋点进行分析,找出原本活跃但是当前沉默的群体之前的集中活跃埋点进行定位分析,实现了针对具体的用户群体从业务层面上找到活跃量变化的原因,有效地提高了APP活跃量分析的可靠性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于大数据的活跃量下降分析方法的一应用环境示意图;
图2是本发明一实施例中基于大数据的活跃量下降分析方法的一流程图;
图3是本发明一实施例中基于大数据的活跃量下降分析方法中步骤S202的一流程图;
图4是本发明一实施例中基于大数据的活跃量下降分析方法中步骤S203的一流程图;
图5是本发明一实施例中基于大数据的活跃量下降分析方法中步骤S204的一流程图;
图6是本发明一实施例中基于大数据的活跃量下降分析装置的一原理框图;
图7是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于大数据的活跃量下降分析方法,可应用在如图1的应用环境中,包括终端设备和服务器,两者之间可以通过网络进行通信。所述服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。其中,所述终端设备为APP的客户端,提供给用户安装并使用APP。在这里,所述终端设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。所述服务器为APP的服务端,通过各种协议,可以包括HTTP,把商业逻辑暴露给客户端APP以及存储客户端的用户数据。
在一实施例中,如图2所示,提供一种基于大数据的活跃量下降分析方法,以该方法应用在图1中服务器为例进行说明,包括如下步骤:
在步骤S201中,获取待分析APP的埋点数据。
在这里,本发明实施例可以预先在APP表层即UI层设置埋点,通过所述埋点监控产品的核心指标,获取用户在UI层产生的行为,对UI界面响应事件进行判断和捕捉,获取必要的上下文信息,并整理成埋点数据发送至服务器的指定数据库进行存储。应当理解,所述埋点数据在范围上更针对运营活动的相关内容,在时间维度上集中在运营活动开展期间。在进行活跃量分析时,服务器根据实际的活跃量分析需求从所述指定数据库中下载待分析的埋点数据。
可选地,所述待分析的埋点数据包括但不限于产品规模数据、产品运营数据、用户行为数据。
其中,所述产品规模数据包括但不限于用户数据和业务数据;所述用户数据与用户相关,包括但不限于新增用户、用户类型分布、活跃用户、沉默用户、启动次数、版本分析;所述业务数据与具体业务相关,比如问答社区中的问题数、回答数、全网热度、浏览量,又比如交易平台中的交易量、交易额、客单价、转化率、利润。
所述产品运营数据包括但不限于流量数据和渠道数据。其中,所述流量数据包括但不限于日活跃用户量、月活跃用户量、留存分析数据、流失分析数据;所述渠道数据包括但不限于渠道流量、渠道转换率、渠道评价、渠道时段详情、渠道质量(渠道活跃用户/渠道流量)。
所述用户行为数据包括但不限于操作行为数据和传播行为数据。其中,所述操作行为数据包括但不限于用户访问路径、点击分布、参与度、功能打开率、访问量、登录转化、注册转化、收藏转化;所述传播行为数据包括但不限于分享平台、分享页、分享人数、接收分享人数。
在步骤S202中,采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量。
在这里,活跃量是指所述待分析APP在统计周期内的活跃用户数,用于反映所述待分析APP的运营情况。所述统计周期包括但不限于日、周以及月。比如日活跃量,是指一日之内登录或使用了所述待分析APP的用户数;周活跃量,是指一周之内登录或使用了所述待分析APP的用户数。在这里,本发明实施例采用日活跃量,如图3所示,所述步骤S202采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量包括:
在步骤S2021中,获取用于划分用户群体的属性信息,并根据所述属性信息划分出不同的用户群体。
在这里,所述不同的用户群体是指按照指定属性划分的用户群。可选地,所述指定属性包括但不限于年龄、性别、职业、生命周期。以年龄属性为例,所述不同的用户群可以划分为青年(29岁以下)、中青年(30-39岁)、中年(40-49岁)、中老年(50岁以上)等;以职业属性为例,所述不同的用户群可以划分为农业人员、工业人员、服务业人员等。
在步骤S2022中,获取统计周期,并采用预设的SQL语句计算每一用户群体在所述统计周期内的活跃用户数,得到所述用户群体的活跃量。
在这里,本发明实施例采用日活跃量,针对给定的一种属性来进行统计,通过预设的SQL语句从所述埋点数据中获取日活跃用户量进行统计,得到给定属性下不同用户群体的日活跃量。其中,SQL语句即结构化查询语言(Structured Query Language),是一种非过程语言,能够同时访问多条记录,有利于提高活跃量统计的速度;且作为所有关系型数据库的通用语言,可移植性较高,稍微修改就可以用于各种不同的数据库中,有利于减少对不同用户群体进行活跃量分析的工作量。可选地,所述预设的SQL语句包括但不限于:选择语句(select*from table1where范围)、插入语句(insert into table1(field1,field2)values(value1,value2))、更新语句(update table1set field1=value1where范围)、查找语句(select*from table1where field1like’%value1%’---like)、总数语句(selectcount as totalcount from table1)、求和语句(select sum(field1)as sumvalue fromtable1)、平均值语句(select avg(field1)as avgvalue from table1)、最大值语句(select max(field1)as maxvalue from table1)、最小值语句(select min(field1)asminvalue from table1)。
在步骤S203中,分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度。
在这里,活跃量下降是指从时间维度上看,当前的活跃量远不如之前的活跃量。活跃量下降的用户群体包括从时间维度上看当前的活跃量远不如之前的活跃量的用户群体,即先前为活跃状态而当前为沉默状态的用户群体。可选地,如图4所示,所述步骤S203分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度包括:
在步骤S2031中,针对每一用户群体,将其活跃量分别与第一活跃阈值和第二活跃阈值进行比较。
在这里,本发明实施例通过为活跃量设置参数阈值,将活跃量与所述参数阈值进行比较,得到先前活跃而当前沉默的用户群体。所述参数阈值包括用于判断活跃状态的第一活跃量阈值和用于判断沉默状态的第二活跃量阈值。所述第一活跃阈值大于所述第二活跃阈值。针对每一用户群体,将其在所述统计周期内的活跃量与所述第一活跃阈值进行比较,以判断所述用户群体在所述统计周期内是否活跃;以及将所述用户群体在所述统计周期内的活跃量与第二活跃阈值进行比较,以判断所述用户群体在所述统计周期内是否沉默。
在步骤S2032中,若所述活跃量大于或等于所述第一活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为活跃状态。
在步骤S2033中,若所述活跃量小于或等于所述第二活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为沉默状态。
若某一用户群体在某一统计周期的活跃量大于或等于第一活跃量阈值,则认为该用户群体在所述统计周期内处于活跃状态,将所述统计周期标记为活跃状态。若某一用户群体在某一统计周期的活跃量小于或等于第二活跃量阈值,则认为该用户群体在所述统计周期内处于沉默状态,将所述统计周期标记为沉默状态。
在步骤S2034中,获取随时间发展从活跃状态变为沉默状态的用户群体作为待分析群体,以及获取活跃状态的持续时间作为待分析时间跨度。
在这里,本发明实施例通过对统计周期标记为活跃状态还是沉默状态,可以得到活跃量在时间维度上的变化趋势,从而可以更直观、更准确地得出从活跃状态变为沉默状态的用户群体,即待分析群体。
进一步地,在得到待分析群体后,根据所述待分析群体确定待分析时间跨度。在这里,所述待分析时间跨度是指活跃状态所持续的时间。示例性地,假设第一活跃量阈值为600人,第二活跃量阈值为200人。若经过分析,用户群体A在10月份的日活跃量均在1000人以上,而在11月份的日活跃量均在100人以下,可以得出该用户群体在10月份为活跃状态,在11月份为沉默状态,由活跃状态变为沉默状态,为活跃量下降的用户群体,标记为待分析群体,并记录待分析时间跨度为10月。
在步骤S204中,获取所述待分析群体在所述待分析时间跨度内的活跃埋点。
通常,埋点设置在APP上的一些功能标识或者链接上。通过获取所述待分析群体集中活跃的埋点,可以得出导致活跃量的上升或者下降的事件信息。其中,是否集中活跃可以通过活跃量来判定,活跃量越大则越集中。可选地,如图5所示,所述步骤S204获取所述待分析群体在所述待分析时间跨度内的活跃埋点包括:
在步骤S2041中,获取所述待分析群体在所述待分析时间跨度内的若干个埋点。
在这里,本发明实施例基于所述待分析时间跨度定位所述待分析群体的活跃埋点。所述活跃埋点是指在所述待分析时间跨度内所述待分析群体集中活跃的埋点。在得到待分析群体后,针对所述待分析群体,抽取出所述待分析群体在待分析时间跨度内对应的埋点。
在步骤S2042中,获取所述待分析群体在每一个所述埋点对应的活跃量。
在步骤S2043中,选取活跃量最大的埋点作为所述待分析群体的活跃埋点。
在得到所述待分析群体在所述待分析时间跨度内的埋点后,本发明实施例通过预设的SQL语句或者Excel统计所述待分析群体在每一个埋点的活跃量,然后对所述埋点按照活跃量进行排序。选取出活跃量最大的埋点作为所述待分析群体的活跃埋点。可选地,排序算法包括但不限于冒泡排序法、插入排序法、归并排序法、快速排序法、桶排序法、堆排序法。
为了便于理解,下面以上文用户群体A为例进行说明。承接上文,待分析群体为用户群体A,记录的待分析时间跨度为10月,通过步骤S204将用户群体A在10月的埋点抽取出来,包括埋点1、埋点2、埋点3,统计用户群体A在每一个埋点对应的活跃量,其中埋点1对应的活跃量为100,埋点2对应的活跃量为700,埋点3对应的活跃量为400;对所述埋点按照活跃量由大到小进行排序,得到排序:埋点2—>埋点3—>埋点1,最后选取出活跃量最大的埋点作为所述待分析群体的活跃埋点,即选择埋点2作为所述用户群体A集中活跃的埋点,用以执行下一步分析。
在步骤S205中,获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因。
如前所述,埋点是指在APP的一些功能或者链接上设置的数据采集方式。一个功能标识或者链接对应一个埋点。埋点的发生场景是在表层UI层里,其作用是监控产品的核心指标,获取用户在UI层产生的行为,也就是对UI界面响应事件。在本发明实施例中,埋点对应的事件信息是指埋点所监控的UI界面响应事件,通常与运营活动相关,比如抢红包、签到、绑定、播放。本发明实施例选择集中活跃的埋点更能反映出待分析群体的集中行为、时间等信息。通过获取所述活跃埋点对应的事件信息即可获取到热门的用户操作,得到待分析群体的活跃量变化的业务原因,完成了针对具体的用户群体从业务层面上找到活跃量变化的原因,实现了结合用户群体和活跃埋点来对活跃量的分析。可以理解的是,结合用户群体和活跃埋点来对活跃量的分析包括了基于用户群体的横向分析得到待分析群体以及基于埋点的纵向分析得到活跃埋点。进一步地,由于活跃量变化与业务层面挂钩,从而大大地提高了活跃量分析结论的实用性。
为了便于理解,下面以上文用户群体A为例进行说明。承接上文,待分析APP分别在用户界面的“每日签到”功能标识设置了上述埋点1,“国庆期间抢红包”功能标识设置了上述埋点2,“绑定手机号”功能标识设置了上述埋点3。则埋点1对应的事件信息为每日签到,埋点2对应的事件信息为国庆期间抢红包,埋点3对应的事件信息为绑定手机号。通过步骤S204得到埋点2作为所述用户群体A的活跃埋点,通过步骤S205进一步获取所述活跃埋点对应的事件信息为国庆期间抢红包,从而得到导致所述用户群体A的活跃量变化的业务层面上的原因是国庆期间抢红包这一活动策略,有利于运营人员参考该活动策略进行下一个运营活动的策划,提高了活跃量分析结论的实用性。
可选地,作为本发明的另一个优选示例,在获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因之后,所述方法还可以包括:
关联并存储所述用户群体和事件信息。
在这里,由于所述事件信息为活跃埋点所监控的UI界面响应事件,反映了所述用户群体的活跃行为。本发明实施例通过对所述用户群体和事件信息进行关联,并存储所述用户群体和事件信息之间的关联关系,从而可以将不同用户群体及其活跃行为对应起来,建立起不同用户群体和活跃行为之间的对应关系。后续设置运营活动时,通过查询所述对应关系即可获知不同用户群体的需求,方便了运营人员针对不同的用户群体设置活动策略,有利于改善运营活动的效果。
综上所述,本发明实施例通过获取待分析APP的埋点数据,采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量;然后获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度,获取所述待分析群体在所述待分析时间跨度内的活跃埋点,根据所述活跃埋点获取对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因,从而实现了在业务层面上对活跃量的分析,通过结合用户群体和活跃埋点进行分析,找出原本活跃但是当前沉默的群体之前的集中活跃埋点进行定位分析,实现了针对具体的用户群体从业务层面上找到活跃量变化的原因,有效地提高了APP活跃量分析的可靠性
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于大数据的活跃量下降分析装置,该基于大数据的活跃量下降分析装置与上述实施例中基于大数据的活跃量下降分析方法一一对应。如图6所示,该基于大数据的活跃量下降分析装置包括数据获取模块、统计模块、分析模块、埋点获取模块、事件获取模块。各功能模块详细说明如下:
数据获取模块61,用于获取待分析APP的埋点数据;
统计模块62,用于采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量;
分析模块63,用于分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度;
埋点获取模块64,用于获取所述待分析群体在所述待分析时间跨度内的活跃埋点;
事件获取模块65,用于获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因。
可选地,所述统计模块62包括:
群体划分单元,用于获取用于划分用户群体的属性信息,并根据所述属性信息划分出不同的用户群体;
活跃量统计单元,用于获取统计周期,并采用预设的SQL语句计算每一用户群体在所述统计周期内的活跃用户数,得到所述用户群体的活跃量。
可选地,所述分析模块63包括:
比较单元,用于针对每一用户群体,将其活跃量分别与第一活跃阈值和第二活跃阈值进行比较;
第一标记单元,用于若所述活跃量大于或等于所述第一活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为活跃状态;
第二标记单元,用于若所述活跃量小于或等于所述第二活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为沉默状态;
获取单元,用于获取随时间发展从活跃状态变为沉默状态的用户群体作为待分析群体,以及获取活跃状态的持续时间作为待分析时间跨度。
可选地,所述埋点获取模块64包括:
埋点获取单元,用于获取所述待分析群体在所述待分析时间跨度内的若干个埋点;
活跃量获取单元,用于获取所述待分析群体在每一个所述埋点对应的活跃量;
埋点选取单元,用于选取活跃量最大的埋点作为所述待分析群体的活跃埋点。
可选地,所述装置还包括:
关联模块,用于关联并存储所述用户群体和所述事件信息。
关于基于大数据的活跃量下降分析装置的具体限定可以参见上文中对于基于大数据的活跃量下降分析方法的限定,在此不再赘述。上述基于大数据的活跃量下降分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于大数据的活跃量下降分析方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
获取待分析APP的埋点数据;
采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量;
分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度;
获取所述待分析群体在所述待分析时间跨度内的活跃埋点;
获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待分析APP的埋点数据;
采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量;
分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度;
获取所述待分析群体在所述待分析时间跨度内的活跃埋点;
获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于大数据的活跃量下降分析方法,其特征在于,包括:
获取待分析APP的埋点数据;
采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量;
分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度;
所述分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度包括:
针对每一用户群体,将其活跃量分别与第一活跃阈值和第二活跃阈值进行比较;
若所述活跃量大于或等于所述第一活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为活跃状态;
若所述活跃量小于或等于所述第二活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为沉默状态;
获取随时间发展从活跃状态变为沉默状态的用户群体作为待分析群体,以及获取活跃状态的持续时间作为待分析时间跨度;
获取所述待分析群体在所述待分析时间跨度内的活跃埋点,所述获取所述待分析群体在所述待分析时间跨度内的活跃埋点包括:
获取所述待分析群体在所述待分析时间跨度内的若干个埋点;
获取所述待分析群体在每一个所述埋点对应的活跃量;
选取活跃量最大的埋点作为所述待分析群体的活跃埋点;
获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因。
2.如权利要求1所述的基于大数据的活跃量下降分析方法,其特征在于,所述采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量包括:
获取用于划分用户群体的属性信息,并根据所述属性信息划分出不同的用户群体;
获取统计周期,并采用预设的SQL语句计算每一用户群体在所述统计周期内的活跃用户数,得到所述用户群体的活跃量。
3.如权利要求1或2所述的基于大数据的活跃量下降分析方法,其特征在于,所述获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因之后,还包括:
关联并存储所述用户群体和所述事件信息。
4.一种基于大数据的活跃量下降分析装置,其特征在于,包括:
数据获取模块,用于获取待分析APP的埋点数据;
统计模块,用于采用预设的SQL语句对所述埋点数据进行活跃量统计,得到不同用户群体的活跃量;
分析模块,用于分析每一所述用户群体的活跃量,获取活跃量下降的用户群体作为待分析群体,以及活跃量下降的时间跨度作为待分析时间跨度,所述分析模块包括:
比较单元,用于针对每一用户群体,将其活跃量分别与第一活跃阈值和第二活跃阈值进行比较;
第一标记单元,用于若所述活跃量大于或等于所述第一活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为活跃状态;
第二标记单元,用于若所述活跃量小于或等于所述第二活跃阈值时,将所述用户群体在所述活跃量对应的统计周期内的状态记为沉默状态;
获取单元,用于获取随时间发展从活跃状态变为沉默状态的用户群体作为待分析群体,以及获取活跃状态的持续时间作为待分析时间跨度;
埋点获取模块,用于获取所述待分析群体在所述待分析时间跨度内的活跃埋点,所述埋点获取模块包括:
埋点获取单元,用于获取所述待分析群体在所述待分析时间跨度内的若干个埋点;
活跃量获取单元,用于获取所述待分析群体在每一个所述埋点对应的活跃量;
埋点选取单元,用于选取活跃量最大的埋点作为所述待分析群体的活跃埋点;
事件获取模块,用于获取所述活跃埋点对应的事件信息,以所述事件信息作为所述待分析群体的活跃量变化的业务原因。
5.如权利要求4所述的基于大数据的活跃量下降分析装置,其特征在于,所述统计模块包括:
群体划分单元,用于获取用于划分用户群体的属性信息,并根据所述属性信息划分出不同的用户群体;
活跃量统计单元,用于获取统计周期,并采用预设的SQL语句计算每一用户群体在所述统计周期内的活跃用户数,得到所述用户群体的活跃量。
6.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述的基于大数据的活跃量下降分析方法的步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述的基于大数据的活跃量下降分析方法的步骤。
CN201910300462.8A 2019-04-15 2019-04-15 基于大数据的活跃量下降分析方法、装置、设备及介质 Active CN110148011B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910300462.8A CN110148011B (zh) 2019-04-15 2019-04-15 基于大数据的活跃量下降分析方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910300462.8A CN110148011B (zh) 2019-04-15 2019-04-15 基于大数据的活跃量下降分析方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN110148011A CN110148011A (zh) 2019-08-20
CN110148011B true CN110148011B (zh) 2024-03-22

Family

ID=67588505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910300462.8A Active CN110148011B (zh) 2019-04-15 2019-04-15 基于大数据的活跃量下降分析方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN110148011B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114742569A (zh) * 2021-01-08 2022-07-12 广州视源电子科技股份有限公司 用户生命阶段预测方法、装置、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797894A (zh) * 2017-02-17 2018-03-13 平安科技(深圳)有限公司 App用户行为分析方法和装置
WO2018149085A1 (zh) * 2017-02-20 2018-08-23 平安科技(深圳)有限公司 数据库系统优化的方法、系统、电子装置及存储介质
CN108648000A (zh) * 2018-04-24 2018-10-12 腾讯科技(深圳)有限公司 对用户留存生命周期进行评估的方法及装置、电子设备
CN109271420A (zh) * 2018-09-03 2019-01-25 平安医疗健康管理股份有限公司 信息推送方法、装置、计算机设备和存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160055536A1 (en) * 2014-08-21 2016-02-25 Verizon Patent And Licensing Inc. Providing offers for purchase based on real-time user data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107797894A (zh) * 2017-02-17 2018-03-13 平安科技(深圳)有限公司 App用户行为分析方法和装置
WO2018149085A1 (zh) * 2017-02-20 2018-08-23 平安科技(深圳)有限公司 数据库系统优化的方法、系统、电子装置及存储介质
CN108648000A (zh) * 2018-04-24 2018-10-12 腾讯科技(深圳)有限公司 对用户留存生命周期进行评估的方法及装置、电子设备
CN109271420A (zh) * 2018-09-03 2019-01-25 平安医疗健康管理股份有限公司 信息推送方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN110148011A (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
CN109241358A (zh) 元数据管理方法、装置、计算机设备及存储介质
CN110569222B (zh) 链路追踪方法、装置、计算机设备和可读存储介质
CN111274256B (zh) 基于时序数据库的资源管控方法、装置、设备及存储介质
JP2014006898A (ja) 行動パターンをマイニングするシステム及び方法
WO2019062078A1 (zh) 智能客服方法、电子装置及计算机可读存储介质
CN115171910A (zh) 生成筛查模型、筛查传染病高风险感染人群的方法及系统
CN110147495A (zh) 基于在线配置的页面响应方法、装置、设备及介质
CN112631879A (zh) 数据采集方法、装置、计算机可读介质及电子设备
CN111510368A (zh) 家庭群组识别方法、装置、设备及计算机可读存储介质
CN111159541B (zh) 一种帐号行为偏好的确定方法及装置
CN116781568A (zh) 数据监控告警方法、装置、设备及存储介质
CN110148011B (zh) 基于大数据的活跃量下降分析方法、装置、设备及介质
CN113269370B (zh) 一种活跃用户预测方法、装置、电子设备及可读存储介质
CN104376021A (zh) 文件推荐系统及方法
US20140214826A1 (en) Ranking method and system
WO2019080424A1 (zh) 客户迁徙方法、系统、计算机设备及存储介质
CN110210884B (zh) 确定用户特征数据的方法、装置、计算机设备及存储介质
CN115914363A (zh) 消息推送方法、装置、计算机设备和存储介质
CN114463044A (zh) 广告计划调整方法、装置、计算机设备及存储介质
CN110060091B (zh) 激励因子的留存分析方法、装置、计算机设备及存储介质
CN110659269B (zh) 用户访问数据处理方法、装置、计算机设备及存储介质
CN110442780B (zh) 基于智慧园区的车主画像生成方法、装置和计算机设备
CN113692014A (zh) App流量分析方法、装置、计算机设备及存储介质
CN108694212B (zh) 一种样本对象的处理方法及装置
CN110705736A (zh) 宏观经济预测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant