CN108320168B - 一种数据分析方法及装置 - Google Patents

一种数据分析方法及装置 Download PDF

Info

Publication number
CN108320168B
CN108320168B CN201710029152.8A CN201710029152A CN108320168B CN 108320168 B CN108320168 B CN 108320168B CN 201710029152 A CN201710029152 A CN 201710029152A CN 108320168 B CN108320168 B CN 108320168B
Authority
CN
China
Prior art keywords
data
analysis
target platform
user
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710029152.8A
Other languages
English (en)
Other versions
CN108320168A (zh
Inventor
孙楠
侯婉瑾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd, Beijing Kingsoft Cloud Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN201710029152.8A priority Critical patent/CN108320168B/zh
Publication of CN108320168A publication Critical patent/CN108320168A/zh
Application granted granted Critical
Publication of CN108320168B publication Critical patent/CN108320168B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种数据分析方法及装置,方法包括:采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,目标渠道为用于发布所述目标平台的渠道;判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;若为是,对用户数据、内容数据和渠道数据进行分析,确定用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定目标平台在线人数变化的原因数据集合。利用本发明实施例,确定了平台在线人数变化的原因。

Description

一种数据分析方法及装置
技术领域
本发明涉及运维技术领域,特别涉及一种数据分析方法及装置。
背景技术
在当今信息时代,各种互联网应用层出不穷,人们的娱乐生活方式也开始变得越来越丰富,例如,人们可以使用手机或电脑在游戏平台上进行游戏娱乐,在直播平台上观看直播并进行互动,等等。
随着互联网技术的发展,在运维自动化领域中,以游戏平台为例,现有的数据分析方法仅仅是利用游戏用户的相关数据,分析得出游戏在线人数数据,但并没有深入研究游戏平台在线人数发生变化时的原因所在,导致无法为游戏运维提供进一步的参考,游戏运营商也无法为用户提供更好的服务和游戏体验。
发明内容
本发明实施例的目的在于提供一种数据分析方法及装置,以确定平台在线人数变化的原因,对运维提供参考。
为达到上述目的,本发明实施例公开了一种数据分析方法,方法包括:
采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;
判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;
若为是,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;
根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合。
较佳的,所述采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,包括:
利用水槽技术,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据。
较佳的,所述方法还包括:
采集包含目标平台对应的多媒体信息的非结构化数据;
所述对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据,包括:
对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
较佳的,所述对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,包括:
利用Hadoop分布式模式,对所述用户数据、内容数据、渠道数据和非结构化数据进行过滤,并将过滤得到的完整且不重复的数据存储到预先建立的关系数据库中,对所述关系数据库中的数据进行分析。
较佳的,所述对所述关系数据库中的数据进行分析,包括:
在预先配置的计算结点上,结合所述关系数据库中存储的数据,对目标平台用户进行分类,统计所述得到目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据;
所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,包括:
根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
较佳的,所述预先配置的计算结点为:根据最大重叠度云爆发算法从预先配置的云服务器中确定的。
较佳的,所述对目标平台用户进行分类,包括:
利用维遍历算法、数据立方块与存储算法、寻址算法,并根据目标平台用户的等级,对所述目标平台用户进行分类。
较佳的,所述方法还包括:
展示所述活跃人数数据、所述留存率数据、所述实时运营数据和所述非实时运营数据。
较佳的,每一预设分析项目包括:根据人机料法环分析算法确定的至少一个特征;
所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,包括:
确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据。
较佳的,所述方法还包括:
根据各个预设分析项目、各个预设分析项目包含的特征以及所确定的属于各个预设分析项目的特征的数据,生成目标平台在线人数变化原因数据集合对应的鱼骨图。
为达到上述目的,本发明实施例提供了一种数据分析装置,装置包括:
第一采集模块,用于采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;
判断模块,用于判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;
分析模块,用于在人数变化程度达到预设值的情况下,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;
确定模块,用于根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合。
较佳的,所述第一采集模块,具体用于:
利用水槽技术,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据。
较佳的,所述装置还包括:
第二采集模块,用于采集包含目标平台对应的多媒体信息的非结构化数据;
所述分析模块,包括:
分析单元,用于对所述用户数据、内容数据、渠道数据和非结构化数据进行分析;
确定单元,用于确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
较佳的,所述分析单元,包括:
过滤子单元,用于利用Hadoop分布式模式,对所述用户数据、内容数据、渠道数据和非结构化数据进行过滤;
存储子单元,用于将过滤得到的完整且不重复的数据存储到预先建立的关系数据库中;
分析子单元,用于对所述关系数据库中的数据进行分析。
较佳的,所述分析子单元,具体用于:
在预先配置的计算结点上,结合所述关系数据库中存储的数据,对目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据;
所述确定单元,具体用于:
根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
较佳的,所述预先配置的计算结点为:根据最大重叠度云爆发算法从预先配置的云服务器中确定的。
较佳的,所述分析子单元,具体用于:
在预先配置的计算结点上,结合所述关系数据库中存储的数据,利用维遍历算法、数据立方块与存储算法、寻址算法,并根据目标平台用户的等级,对所述目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据。
较佳的,所述装置还包括:
展示模块,用于展示所述活跃人数数据、所述留存率数据、所述实时运营数据和所述非实时运营数据。
较佳的,每一预设分析项目包括:根据人机料法环分析算法确定的至少一个特征;
所述确定单元,具体用于:
确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据。
较佳的,所述装置还包括:
生成模块,用于根据各个预设分析项目、各个预设分析项目包含的特征以及所确定的属于各个预设分析项目的特征的数据,生成目标平台在线人数变化原因数据集合对应的鱼骨图。
由上述的技术方案可见,本发明实施例提供了一种数据分析方法及装置,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;若为是,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合。
可见,通过采集用户数据、内容数据和渠道数据,在平台在线人数的变化程度值达到预设值时,对采集的数据进行分析,确定出目标平台在线人数变化的原因,以对目标平台的运维提供参考,进而可以为平台用户提供更好的服务和用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的数据分析方法的一种流程示意图;
图2为本发明实施例提供的一种多源数据处理示意图;
图3为本发明实施例提供的一种并行数据分析示意图;
图4为本发明实施例提供的一种鱼骨图;
图5为本发明实施例提供的数据分析方法的另一种流程示意图;
图6为本发明实施例提供的数据分析装置的一种结构示意图;
图7为本发明实施例提供的数据分析装置的另一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面首先对本发明实施例提供的一种数据分析方法进行详细说明。
参见图1,图1为本发明实施例提供的数据分析方法的一种流程示意图,可以包括如下步骤:
S101,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;
具体的,在实际应用中,目标平台可以是游戏平台,还可以是直播平台等等。以下均以目标平台是游戏平台为例,对本发明实施例进行详细说明。
具体的,可以利用水槽(Flume)技术,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据。其中,Flume是一个高可用性的、高可靠性的分布式的海量日志采集、聚合和传输的系统,水槽技术亦为现有技术,本发明实施例在此不对其进行赘述。
示例性的,采集的数据可以称之为数据源。数据源主要可以包括用户数据、内容数据和渠道数据。
其中,用户数据可以包含:
分时段的用户登录人数,如在晚上八点至晚上九点这个时间段内登录游戏平台的用户人数信息;
充值用户的个人账户信息,如充值用户的年龄、性别以及用户画像等信息;
用户对游戏官方网站的访问情况,如游戏官网的浏览量、用户在官网上的停留时间、所点击的网站内容等信息;
用户对官方网站的内容下载情况等数据,如官网上的视频、图片、安装包等内容的下载信息,等等。
内容数据主要包括:用户针对游戏内容的下载数据(游戏平台安装包等下载数据)、登录信息、消费信息和退出信息等。
渠道数据主要包括:渠道实时流量情况(浏览该渠道页面的实时流量数据),在该渠道上的用户点击、下载、消费等数据,其中,渠道为用于发布游戏平台的渠道,如小米手机的应用商店、苹果手机的app store等。
需要说明的是,本申请仅仅以上述为例进行说明,实际应用中用户数据、内容数据和渠道数据并不仅限于上述情况。
具体的,在实际应用中,还可以采集包含目标平台对应的多媒体信息的非结构化数据,如游戏的音频、游戏画面、视频影像、文本(游戏中玩家间的文字对话)等非结构化数据。
S102,判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值,若为是,执行S103;
具体的,变化程度值可以是当前在线人数相对于历史在线人数数值的差值、当前在线人数相对于历史在线人数的的变化率等数值。
示例性的,在后台检测出的游戏平台当前在线人数,与历史在线人数相比较时,可以用在线人数的差值来衡量变化程度。例如,可以认为当人数差值不超过5万时,变化程度为不大;当人数差值大于5万、且不超过10万时,变化程度为较大;当人数差值超出10万时,变化程度为很大。预设值可以称之为预设变化程度,如人数变化程度达到或超过较大时,可以得出判断结果为是。假设预设变化程度设为较大,当前平台在线人数为50万人,前一周的历史在线人数为30万人,人数差值为20万,变化程度为很大,可以判断出人数变化程度达到了预设变化程度,即达到了预设值。在实际应用中,由于游戏平台的寿命限制等因素,可以用半年内的某个时间点的历史在线人数,来与当前在线人数进行相对比。
S103,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;
具体的,在采集包含目标平台对应的多媒体信息的非结构化数据的情况下,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据,可以对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
具体的,对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,可以利用Hadoop(海杜普)分布式模式,对所述用户数据、内容数据、渠道数据和非结构化数据进行过滤,并将过滤得到的完整且不重复的数据存储到预先建立的关系数据库中,对所述关系数据库中的数据进行分析。其中,利用Hadoop对数据进行过滤处理,更为可靠、高效,容错性更高,并且具备高扩展性和低成本的优势。而且,过滤得到完整且不重复的数据,使得这些数据可以满足精细化查询和统计要求,避免对无用的重复数据和缺失数据所进行的多余分析,避免无用数据对分析目标平台在线人数变化原因所带来的干扰。
示例性的,图2为本发明实施例提供的一种多源数据处理示意图。如图2所示,本发明实施例可以采用多元化大数据处理机制。对于采集的游戏用户、游戏内容和渠道等3种碎片化数据,可以通过Hadoop分布式模式进行数据处理,将不完整的、存在重复的无用数据过滤掉,得到完整且不重复的目标数据,其中目标数据中包含有用户充值、付费和平台收入等经营关键数据,该类关键数据要满足精细化查询和统计要求,且具有结构化数据特性,故而可以采用关系数据库存储过滤后得到的数据。在实际应用中,还可以采集包含游戏平台对应的多媒体信息的非结构化数据,如游戏的音频、图像、视频影像、文本等非结构化数据,对非结构化数据同样利用Hadoop分布式模式进行处理,并将处理得到的数据存储到关系数据库中。在后续对关系数据库中的数据进行数据分析时,可以从中提取数据,所提取的数据可以称之为分析结果数据。
具体的,所述对所述关系数据库中的数据进行分析,可以在预先配置的计算结点上,结合所述关系数据库中存储的数据,对目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据。
具体的,所述预先配置的计算结点可以为:根据最大重叠度云爆发算法从预先配置的云服务器中确定的。其中,预先配置的云服务器可以为具备可扩展性的云平台,即联合云。最大重叠度云爆发算法(MOBB算法)为现有技术中的算法,是一种基于最大时间重叠度负载均衡的云爆发算法,可对运行于联合云等松散耦合分布式计算环境的大数据服务性能进行优化,从而更好地进行大数据分析服务。
具体的,在对所述关系数据库中的数据进行分析时,由于关系数据库中的数据过多,可以把数据分析任务部署到具备可扩展性的云平台上。为了对联合云资源进行最佳利用,以实现数据分析性能最优,可以在多个计算结点上进行并行数据分析。
具体的,在针对多个计算结点进行并行数据分析时,可以确定计算结点,即确定应该使用联合云中的哪些及多少个计算结点。其次,保证同步完成,即如何最优地把数据分配给并行计算结点,保证同步性,其中,同步性指即使资源和网络互不相同,且位于多个互联网云上时,所有负载分配均在同一时间完成。最后确定数据分配方案,即如何将不同的数据块依次发往给个结点,避免结点流量过大或过小。在本发明的一种具体实现方式中,可以利用MOBB算法,确定使用的计算结点个数和哪些计算结点,以在进行并行数据分析中,尽量提高各个计算结点上的时间重叠度。
示例性的,图3为本发明实施例提供的一种并行数据分析示意图。如图3所示,处理后的大数据是指利用Hadoop分布式模式进行过滤处理后得到的、存储在关系数据库中的数据。在将处理后的大数据发送给中心云后,中心云将大数据划分为多个数据块,并进行数据块分配。针对每一组数据块,将数据块中的数据分别分配给中型容量远程云、中型容量本地云、低容量本地云和高容量远程云,其中,中心云、中型容量远程云、中型容量本地云、低容量本地云和高容量远程云等云服务器可以统称为联合云,且网络容量满足联合云所需的运行条件。然后,通过遍历算法(即维遍历算法)、数据立方块与存储算法、以及寻址算法、统计分析来对大数据进行分析,得到游戏信息输出,其中,游戏信息输出包含分类结果、活跃人数数据、留存率数据、实时运营数据和非实时运营数据。
具体的,所述对目标平台用户进行分类,可以利用维遍历算法、数据立方块与存储算法、寻址算法,并根据目标平台用户的等级,对所述目标平台用户进行分类。
示例性的,可以通过维遍历算法、数据立方块与存储算法、以及寻址算法分析从关系数据库中提取的游戏用户数据。可以根据这三种算法,并结合用户等级,识别新玩家(最新注册并登陆的游戏用户)、睡眠玩家(一段时间内持续未登陆游戏的用户)、流失玩家(退出游戏平台并不再登陆该游戏的用户)和活跃玩家(经常登陆游戏平台并进行游戏娱乐的用户),即对游戏用户进行了分类。
示例性的,可以利用从关系数据库中提取的数据,统计DAU(Day Average Users,日均活跃用户数)、WAU(Week Average Users,周均活跃用户数)、MAU(Month AverageUsers,月均活跃用户数)、三日留存率和7天留存率,并根据统计的数据生成相应的可视化图表,其中,留存率=新增用户中登录用户数/新增用户数*100%,三日留存率=(第一天新增用户中,在注册的第3天还有登录的用户数)/第一天新增总用户数,7天留存率=(第一天新增的用户中,在注册的第7天还有登录的用户数)/第一天新增总用户数。
示例性的,可以利用从关系数据库中提取的数据,获取游戏平台的实时运营数据(当前一段时间内的实时用户付费数据、下载量数据和运营监控的重点数据)和非实时运营数据(近一个月、一天以及一季度的活跃用户、留存率、下载率、产品不同渠道转化率等)。其中,下载率是指用户下载游戏的次数占点击游戏次数的比率,渠道转化率是指用户在渠道上完成的转化行为次数占用户点击次数的比率,其中,完成点击、安装、注册并登陆,即代表完成一次转化行为。
具体的,所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,可以根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
示例性的,在当前游戏平台在线人数与历史在线人数变化较为明显地达到预设值时,为了确定游戏在线人数变化的原因,预设的分析项目可以为:玩家分析、游戏运维、游戏设计、付费和环境。根据对游戏用户分类所识别出的新玩家、睡眠玩家、流失玩家和活跃玩家,统计的DAU、WAU、MAU、三日留存率和7天留存率,获取的实时运营数据和非实时运营数据,以及关系数据库中的其他的与分析项目对应的数据,确定这些数据中属于各个预设分析项目的数据。
具体的,在实际应用中,所述方法还可以包括:展示所述活跃人数数据、所述留存率数据、所述实时运营数据和所述非实时运营数据。
示例性的,可以生成可视化图表用来展示统计得到的DAU、WAU、MAU、三日留存率和7天留存率。并且,可以展示实时运营数据和非实时运营数据。
S104,根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合。
具体的,每一预设分析项目包括:根据人机料法环分析算法确定的至少一个特征。
具体的,人机料法环是对全面质量管理理论中的五个影响产品质量的主要因素的简称。人,指制造产品的人员;机,制造产品所用的设备;料,指制造产品所使用的原材料;法,指制造产品所使用的方法;环,指产品制造过程中所处的环境。在实际应用中,人机料法环可以对应为5个分析项目,其中,人可以对应为玩家分析,机可以对应为游戏运维,料可以对应为游戏设计,法可以对应为付费(或称为付费分析),环可以对应为环境(或称为环境分析)。
示例性的,从人、机器、料、方法、环境5个方面,对应的分析项目分别为玩家分析、游戏运维、游戏设计、付费和环境。每一个分析项目可以包含有一个或多个特征。其中,玩家分析对应的特征可以为物理特征、外部行为、游戏行为、群体行为;游戏运维对应的特征可以为下载量(游戏安装包的下载量)、注册量(注册游戏平台账号的人数)、硬件使用率(运行游戏平台的网络硬盘的使用率)、下载完成率;游戏设计对应的特征可以为道具分析、画风分析、操作分析、互动分析;付费对应的特征可以为消费偏好、付费设置、付费性行为;环境对应的特征可以为热点事件、明星代言、游戏活动。
示例性的,上述的物理特征可以为游戏用户的性别、年龄等特征;外部行为(或称为外部行为特征)可以为用户登录游戏的频率、每次游戏在线的时长、每次登录在线的时间段等特征;游戏行为(或称为游戏行为特征)为流失用户的等级以及流失用户人数的变化等特征;群体行为(或称群体行为描述)为游戏用户同时在线的人数峰值、活跃用户信息、忠诚用户(持续关注并使用游戏平台进行游戏娱乐的注册时间较长的老用户)信息、活跃用户比例及忠诚用户比例、新进用户(即新玩家)、活跃度、忠诚度、游戏用户流失率、产品不同渠道转化率等特征。
示例性的,消费偏好可以(或称为消费偏好分析)为换金(游戏金币道具兑换成人民币)、消费个性(游戏用户偏好消费的方面,如喜欢购买游戏道具、喜欢购买游戏点卡或月卡等)、增强(针对游戏经验、装备或技能的增强)、为了方便互动所进行的消费等特征,付费设置(或称为消费与游戏设置之间的联系)为游戏道具对应的等级、玩家习惯行为(如释放某种技能的习惯)、游戏任务(如需要付费来解锁相应任务)、场景的开放(如游戏的某些场景需要付费后才可开放)等特征,付费性行为(或称为付费行为分析)为每位游戏玩家拥有的道具数量情况、游戏用户付费数额的等级、游戏用户付费数额的分布、游戏用户的续费分析、对重点用户的追踪(如对高消费游戏用户的追踪)。
具体的,所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,可以确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据。
具体的,在实际应用中,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据,可以根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据。
示例性的,关系数据库存储的数据包含a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p、q、r、s、t、z,分类结果为u,活跃人数数据为v,留存率数据为w,实时运营数据为x,非实时运营数据为y。预设分析项目A、B、C、D、E,其中,A的特征为A1、A2、A3、A4,B的特征为B1、B2、B3、B4,C的特征为C1、C2、C3,D的特征为D1、D2、D3,E的特征为E1、E2、E3。根据所需的这些数据,确定属于特征A1的数据为a、b,属于特征A2的数据为c、d,属于特征A3的数据为e、f,属于特征A4的数据为g、h,属于特征B1的数据为i、j,属于特征B2的数据为k、l,属于特征B3的数据为m、n,属于特征B4的数据为o、p,属于特征C1的数据为q,属于特征C2的数据为r,属于特征C3的数据为s,属于特征D1的数据为t,属于特征D2的数据为u,属于特征D3的数据为v,属于特征E1的数据为w,属于特征E2的数据为x,属于特征E3的数据为y、z。
具体的,在实际应用中,所述方法还可以包括:根据各个预设分析项目、各个预设分析项目包含的特征以及所确定的属于各个预设分析项目的特征的数据,生成目标平台在线人数变化原因数据集合对应的鱼骨图。其中,鱼骨图又可称之为因果图,是一种发现问题根本原因的分析方法。
示例性的,图4为本发明实施例提供的一种鱼骨图。如图4所示,问题\特性\结果为预先确定的分析项目所对应的分析目的,即目标平台在线人数变化的原因,作为鱼骨图中的鱼头。根据鱼头,画出一个指向鱼头的水平箭头,作为1鱼骨图的1根主骨。然后根据各个预设的分析项目画出鱼骨图的大骨,即根据玩家分析、游戏运维、游戏设计、付费和环境,分别画出指向主骨的5个箭头,作为鱼骨图的5根大骨。在5根大骨上,分别画出指向各个大骨的水平箭头,作为次骨,其中,在次骨上,物理特征、外部行为、游戏行为、群体行为是玩家分析的特征,下载量、注册量、硬件使用率是游戏运维的特征,道具分析、画风分析、操作分析、互动分析是游戏设计的特征,消费偏好、付费设置、付费性行为是付费的特征,热点事件、明星代言、游戏活动是环境的特征,实际应用中还要将属于各个特征的具体数据,展示在各个特征所在的次骨上,即可生成包含鱼头、主骨、大骨和次骨的鱼骨图,且在鱼骨图上展示有分析目的、分析项目、各个分析项目的特征、属于各个特征的数据,从而直观展现出导致目标平台在线人数变化的具体原因的数据集合。
可见,通过采集用户数据、内容数据和渠道数据,在平台在线人数的变化程度值达到预设值时,对采集的数据进行分析,确定出目标平台在线人数变化的原因,以对目标平台的运维提供参考,进而可以为平台用户提供更好的服务和用户体验。
参见图5,图5为本发明实施例提供的数据分析方法的另一种流程示意图,本发明图5所示实施例在图1所示实施例的基础上,增加步骤S105:采集包含目标平台对应的多媒体信息的非结构化数据,本发明实施例S103具体可以为S103A:对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
具体的,所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,可以根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
具体的,所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,可以确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据。
可见,通过采集用户数据、内容数据和渠道数据,在平台在线人数的变化程度值达到预设值时,对采集的数据进行分析,确定出目标平台在线人数变化的原因,以对目标平台的运维提供参考,进而可以为平台用户提供更好的服务和用户体验。
参见图6,图6为本发明实施例提供的数据分析装置的一种结构示意图,与图1所示的流程相对应,该分析装置可以包括:第一采集模块601、判断模块602、分析模块603和确定模块604。
所述第一采集模块601,用于采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;
所述判断模块602,用于判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;
所述分析模块603,用于在人数变化程度达到预设值的情况下,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;
所述确定模块604,用于根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合。
具体的,所述第一采集模块,具体用于:
利用水槽技术,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据。
具体的,所述分析单元,包括:
过滤子单元,用于利用Hadoop分布式模式,对所述用户数据、内容数据、渠道数据和非结构化数据进行过滤;
存储子单元,用于将过滤得到的完整且不重复的数据存储到预先建立的关系数据库中;
分析子单元,用于对所述关系数据库中的数据进行分析。
具体的,所述分析子单元,具体用于:
在预先配置的计算结点上,结合所述关系数据库中存储的数据,对目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据;
所述确定单元,具体用于:
根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
具体的,所述预先配置的计算结点为:根据最大重叠度云爆发算法从预先配置的云服务器中确定的。
具体的,所述分析子单元,具体用于:
在预先配置的计算结点上,结合所述关系数据库中存储的数据,利用维遍历算法、数据立方块与存储算法、寻址算法,并根据目标平台用户的等级,对所述目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据。
具体的,所述装置还包括:
展示模块,用于展示所述活跃人数数据、所述留存率数据、所述实时运营数据和所述非实时运营数据。
具体的,
每一预设分析项目包括:根据人机料法环分析算法确定的至少一个特征;
所述确定单元,具体用于:
确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据。
具体的,所述装置还包括:
生成模块,用于根据各个预设分析项目、各个预设分析项目包含的特征以及所确定的属于各个预设分析项目的特征的数据,生成目标平台在线人数变化原因数据集合对应的鱼骨图。
可见,通过采集用户数据、内容数据和渠道数据,在平台在线人数的变化程度值达到预设值时,对采集的数据进行分析,确定出目标平台在线人数变化的原因,以对目标平台的运维提供参考,进而可以为平台用户提供更好的服务和用户体验。
参见图7,图7为本发明实施例提供的数据分析装置的另一种结构示意图,与图5所示的流程相对应,本发明图7所示实施例在图6所示实施例的基础上,增加第二采集模块605,用于采集包含目标平台对应的多媒体信息的非结构化数据。
具体的,所述分析模块,可以包括:
分析单元,用于对所述用户数据、内容数据、渠道数据和非结构化数据进行分析;
确定单元,用于确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
可见,通过采集用户数据、内容数据和渠道数据,在平台在线人数的变化程度值达到预设值时,对采集的数据进行分析,确定出目标平台在线人数变化的原因,以对目标平台的运维提供参考,进而可以为平台用户提供更好的服务和用户体验。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (14)

1.一种数据分析方法,其特征在于,所述方法包括:
采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,以及包含目标平台对应的多媒体信息的非结构化数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;
判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;
若为是,对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据;
根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合;
其中,每一预设分析项目包括:根据人机料法环分析算法确定的至少一个特征;
所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,包括:
确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据;
根据各个预设分析项目、各个预设分析项目包含的特征以及所确定的属于各个预设分析项目的特征的数据,生成目标平台在线人数变化原因数据集合对应的鱼骨图;
所述根据各个预设分析项目、各个预设分析项目包含的特征以及所确定的属于各个预设分析项目的特征的数据,生成目标平台在线人数变化原因数据集合对应的鱼骨图,包括:
将目标平台在线人数变化的原因作为鱼骨图中的鱼头;
将指向鱼头的水平箭头作为鱼骨图的主骨;
将指向主骨的表示玩家分析、游戏运维、游戏设计、付费和环境的5个箭头,作为鱼骨图的5根大骨;
将分别指向各个大骨的水平箭头,作为次骨,其中,指向表示玩家分析大骨的次骨包括物理特征、外部行为、游戏行为和群体行为,指向表示游戏运维大骨的次骨包括下载量、注册量和硬件使用率,指向表示游戏设计大骨的次骨包括道具分析、画风分析、操作分析和互动分析,指向表示付费大骨的次骨包括消费偏好、付费设置和付费性行为,指向表示环境大骨的次骨包括热点事件、明星代言和游戏活动。
2.根据权利要求1所述的方法,其特征在于,所述采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,包括:
利用水槽技术,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述用户数据、内容数据、渠道数据和非结构化数据进行分析,包括:
利用Hadoop分布式模式,对所述用户数据、内容数据、渠道数据和非结构化数据进行过滤,并将过滤得到的完整且不重复的数据存储到预先建立的关系数据库中,对所述关系数据库中的数据进行分析。
4.根据权利要求3所述的方法,其特征在于,所述对所述关系数据库中的数据进行分析,包括:
在预先配置的计算结点上,结合所述关系数据库中存储的数据,对目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据;
所述确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据,包括:
根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
5.根据权利要求4所述的方法,其特征在于,所述预先配置的计算结点为:根据最大重叠度云爆发算法从预先配置的云服务器中确定的。
6.根据权利要求4或5所述的方法,其特征在于,所述对目标平台用户进行分类,包括:
利用维遍历算法、数据立方块与存储算法、寻址算法,并根据目标平台用户的等级,对所述目标平台用户进行分类。
7.根据权利要求4或5所述的方法,其特征在于,所述方法还包括:
展示所述活跃人数数据、所述留存率数据、所述实时运营数据和所述非实时运营数据。
8.一种数据分析装置,其特征在于,所述装置包括:
第一采集模块,用于采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据,其中,所述目标渠道为:用于发布所述目标平台的渠道;
第二采集模块,用于采集包含目标平台对应的多媒体信息的非结构化数据;
判断模块,用于判断当前在线人数相对于历史在线人数的人数变化程度值是否达到预设值;
分析模块,用于在人数变化程度达到预设值的情况下,对所述用户数据、内容数据和渠道数据进行分析,确定所述用户数据、内容数据和渠道数据中属于各个预设分析项目的数据;
确定模块,用于根据所确定的属于各个预设分析项目的数据、预设的平台在线人数变化原因数据集合与分析项目数据集合之间的对应关系,确定所述目标平台在线人数变化的原因数据集合;
其中,所述分析模块,包括:
分析单元,用于对所述用户数据、内容数据、渠道数据和非结构化数据进行分析;
确定单元,用于确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据;
每一预设分析项目包括:根据人机料法环分析算法确定的至少一个特征;
所述确定单元,具体用于:
确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的特征的数据;
生成模块,用于根据各个预设分析项目、各个预设分析项目包含的特征以及所确定的属于各个预设分析项目的特征的数据,生成目标平台在线人数变化原因数据集合对应的鱼骨图;
所述生成模块,具体用于:
将目标平台在线人数变化的原因作为鱼骨图中的鱼头;
将指向鱼头的水平箭头作为鱼骨图的主骨;
将指向主骨的表示玩家分析、游戏运维、游戏设计、付费和环境的5个箭头,作为鱼骨图的5根大骨;
将分别指向各个大骨的水平箭头,作为次骨,其中,指向表示玩家分析大骨的次骨包括物理特征、外部行为、游戏行为和群体行为,指向表示游戏运维大骨的次骨包括下载量、注册量和硬件使用率,指向表示游戏设计大骨的次骨包括道具分析、画风分析、操作分析和互动分析,指向表示付费大骨的次骨包括消费偏好、付费设置和付费性行为,指向表示环境大骨的次骨包括热点事件、明星代言和游戏活动。
9.根据权利要求8所述的装置,其特征在于,所述第一采集模块,具体用于:
利用水槽技术,采集用户在目标平台进行操作时产生的用户数据以及被操作内容对应的内容数据,并采集用户在目标渠道上针对所述目标平台的操作产生的渠道数据。
10.根据权利要求8所述的装置,其特征在于,所述分析单元,包括:
过滤子单元,用于利用Hadoop分布式模式,对所述用户数据、内容数据、渠道数据和非结构化数据进行过滤;
存储子单元,用于将过滤得到的完整且不重复的数据存储到预先建立的关系数据库中;
分析子单元,用于对所述关系数据库中的数据进行分析。
11.根据权利要求10所述的装置,其特征在于,所述分析子单元,具体用于:
在预先配置的计算结点上,结合所述关系数据库中存储的数据,对目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据;
所述确定单元,具体用于:
根据分类结果、所述活跃人数数据、所述留存率数据、所述实时运营数据、所述非实时运营数据,以及关系数据库中的数据,确定所述用户数据、内容数据、渠道数据和非结构化数据中属于各个预设分析项目的数据。
12.根据权利要求11所述的装置,其特征在于,所述预先配置的计算结点为:根据最大重叠度云爆发算法从预先配置的云服务器中确定的。
13.根据权利要求11或12所述的装置,其特征在于,所述分析子单元,具体用于:
在预先配置的计算结点上,结合所述关系数据库中存储的数据,利用维遍历算法、数据立方块与存储算法、寻址算法,并根据目标平台用户的等级,对所述目标平台用户进行分类,统计得到所述目标平台用户的活跃人数数据和留存率数据,获取所述目标平台对应的实时运营数据和非实时运营数据。
14.根据权利要求11或12所述的装置,其特征在于,所述装置还包括:
展示模块,用于展示所述活跃人数数据、所述留存率数据、所述实时运营数据和所述非实时运营数据。
CN201710029152.8A 2017-01-16 2017-01-16 一种数据分析方法及装置 Active CN108320168B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710029152.8A CN108320168B (zh) 2017-01-16 2017-01-16 一种数据分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710029152.8A CN108320168B (zh) 2017-01-16 2017-01-16 一种数据分析方法及装置

Publications (2)

Publication Number Publication Date
CN108320168A CN108320168A (zh) 2018-07-24
CN108320168B true CN108320168B (zh) 2021-05-07

Family

ID=62892399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710029152.8A Active CN108320168B (zh) 2017-01-16 2017-01-16 一种数据分析方法及装置

Country Status (1)

Country Link
CN (1) CN108320168B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457557A (zh) * 2019-07-29 2019-11-15 甘肃梦农物联网科技有限公司 一种自动标记行为数据的智慧城市网络管理方法
CN111061778B (zh) * 2019-12-13 2023-05-16 上海尘泥信息技术有限公司 数据分析方法、系统及电子设备
CN111160768A (zh) * 2019-12-28 2020-05-15 镇江新一代信息技术产业研究院有限公司 一种电子商务数据管理系统
CN111383056B (zh) * 2020-03-13 2022-09-16 成都魔力百聚科技有限公司 业务信息分析处理方法
CN112734482A (zh) * 2021-01-13 2021-04-30 上海群之脉信息科技有限公司 一种客户转化漏斗智能系统
CN116109121B (zh) * 2023-04-17 2023-06-30 西昌学院 基于大数据分析的用户需求挖掘方法及系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620692A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 一种移动通信业务的客户流失分析方法
CN101729571A (zh) * 2009-12-28 2010-06-09 广州游家信息技术有限公司 网络在线用户人数统计方法、服务器和系统
CN103996131A (zh) * 2014-04-30 2014-08-20 杭州顺网科技股份有限公司 一种针对网游人群的精准广告投放方法
CN104424339A (zh) * 2013-09-11 2015-03-18 腾讯科技(深圳)有限公司 数据分析的方法、装置及系统
CN104679969A (zh) * 2013-11-29 2015-06-03 腾讯科技(深圳)有限公司 防止用户流失的方法及装置
CN104699710A (zh) * 2013-12-09 2015-06-10 腾讯科技(深圳)有限公司 用户结构判断方法和装置以及账号状态记录方法和装置
CN105354133A (zh) * 2015-09-28 2016-02-24 网易(杭州)网络有限公司 一种游戏日志数据的处理方法及装置
CN105354725A (zh) * 2015-11-20 2016-02-24 珠海多玩信息技术有限公司 一种应用推广效果的预测方法及系统
CN105426292A (zh) * 2015-10-29 2016-03-23 网易(杭州)网络有限公司 一种游戏日志实时处理系统及方法
CN106027289A (zh) * 2016-05-09 2016-10-12 北京奇虎科技有限公司 用户状态统计系统及方法
CN106033455A (zh) * 2015-03-17 2016-10-19 阿里巴巴集团控股有限公司 一种处理用户操作信息的方法与设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140067518A1 (en) * 2012-08-31 2014-03-06 Accenture Global Services Limited Multi-channel marketing attribution analytics
US20160171540A1 (en) * 2014-12-12 2016-06-16 Suryanarayana MANGIPUDI Dynamic Omnichannel Relevant Content And Services Targeting In Real Time

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101620692A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 一种移动通信业务的客户流失分析方法
CN101729571A (zh) * 2009-12-28 2010-06-09 广州游家信息技术有限公司 网络在线用户人数统计方法、服务器和系统
CN104424339A (zh) * 2013-09-11 2015-03-18 腾讯科技(深圳)有限公司 数据分析的方法、装置及系统
CN104679969A (zh) * 2013-11-29 2015-06-03 腾讯科技(深圳)有限公司 防止用户流失的方法及装置
CN104699710A (zh) * 2013-12-09 2015-06-10 腾讯科技(深圳)有限公司 用户结构判断方法和装置以及账号状态记录方法和装置
CN103996131A (zh) * 2014-04-30 2014-08-20 杭州顺网科技股份有限公司 一种针对网游人群的精准广告投放方法
CN106033455A (zh) * 2015-03-17 2016-10-19 阿里巴巴集团控股有限公司 一种处理用户操作信息的方法与设备
CN105354133A (zh) * 2015-09-28 2016-02-24 网易(杭州)网络有限公司 一种游戏日志数据的处理方法及装置
CN105426292A (zh) * 2015-10-29 2016-03-23 网易(杭州)网络有限公司 一种游戏日志实时处理系统及方法
CN105354725A (zh) * 2015-11-20 2016-02-24 珠海多玩信息技术有限公司 一种应用推广效果的预测方法及系统
CN106027289A (zh) * 2016-05-09 2016-10-12 北京奇虎科技有限公司 用户状态统计系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《基于IOS的移动游戏数据统计分析平台的设计与实现》;张书豪;《中国优秀硕士学位论文全文数据库信息科技辑》;20151231(第2015年09期);第4章 *
游戏大数据平台研究与实践;苏洋等;《电信科学》;20141231(第10期);第2-5部分 *

Also Published As

Publication number Publication date
CN108320168A (zh) 2018-07-24

Similar Documents

Publication Publication Date Title
CN108320168B (zh) 一种数据分析方法及装置
JP6891170B2 (ja) ステムリソース利用を最適化するための映像セグメントの将来の視聴予測
WO2017193897A1 (zh) 一种数据推荐方法及其设备、存储介质
US10664872B2 (en) Systems and methods for generating network intelligence through real-time analytics
Chen et al. Crowdsourced live streaming over the cloud
CN111459986B (zh) 数据计算系统及方法
CN105898209A (zh) 视频平台监控分析系统
US10958704B2 (en) Feature generation for online/offline machine learning
CN103838867A (zh) 日志处理方法和装置
CN107404658A (zh) 一种交互式网络电视系统及用户数据实时获取方法
US20200159764A1 (en) Method for Processing and Displaying Real-Time Social Data on Map
CN102208991A (zh) 一种日志处理方法、设备和系统
JafariAsbagh et al. Clustering memes in social media streams
CN109729376B (zh) 一种生命周期的处理方法、装置、设备和存储介质
CN103577593A (zh) 一种基于微博热门话题的视频聚合方法及系统
CN103997662A (zh) 节目推送的方法及系统
US20150112814A1 (en) System and method for an integrated content publishing system
WO2022155450A1 (en) Crowdsourcing platform for on-demand media content creation and sharing
CN103002329B (zh) 一种预测网络视频广告的到达频次表数据的装置及方法
CN106604068A (zh) 一种更新媒体节目的方法及其系统
US20170331909A1 (en) System and method of monitoring and tracking online source content and/or determining content influencers
JP6549643B2 (ja) 視聴率推定システム、方法およびコンピュータプログラム
CN111569412B (zh) 一种云游戏资源调度的方法和装置
US20150294331A1 (en) Peer-to-peer data collector and analyzer
US20160277490A1 (en) Using hierarchical reservoir sampling to compute percentiles at scale

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant