背景技术
随着移动互联网的发展以及智能手机和Pad等移动终端设备的普及,人们逐渐习惯了使用应用客户端上网的方式,例如汇聚各类信息的综合社交类应用,如QQ空间、微博等;或是相对细分、专业、小众的垂直类社交应用,如图片/视频社交、社区社交、婚恋/交友社交、匿名社交、职场社交等,使得各种应用平台进入到新的阶段,人们的生活越来越方便快捷。
在实施本发明的过程中,发明人发现现有技术至少存在如下问题:
客户端各种应用平台相互之间的竞争越发的激烈,如何掌握各大应用平台的市场份额和用户使用率等信息,对于各大应用平台的发展战略的制定和功能业务的扩展,具有重要的数据依据和市场价值。
但是,目前对市场上的应用平台的用户使用份额和使用情况的数据统计,并没有一个很好的数据来源和统计方法。
应该注意,上面对技术背景的介绍只是为了方便对本发明的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本发明的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
针对上述问题,本发明实施方式的目的在于提供一种客户端应用平台的统计方法和装置,能够对应用平台使用的市场占比情况和使用方式进行统计,为各个应用平台的市场战略的制定和业务功能的完善和扩展提供了重要的数据依据。
为实现上述目的,本发明实施方式提供一种客户端应用平台的统计方法,包括:获取用户网络行为信息,并从所述用户网络行为信息中提取出用户代理和统一资源定位符;从用户代理中获取客户端的设备信息,从统一资源定位符信息中获取客户端对应用平台的访问信息,根据客户端的设备信息和客户端对应用平台的访问信息,对客户端应用平台进行识别和市场占比统计。
进一步地,所述从用户代理中获取客户端的设备信息,包括:从用户代理中获取客户端的硬件ID、使用的操作系统、设备类型和浏览器信息。
进一步地,所述从统一资源定位符信息中获取客户端对应用平台的访问信息,包括:从统一资源定位符信息中获取客户端对应用平台的访问信息的关键字。
进一步地,所述方法还包括:根据客户端的硬件ID和统一资源定位符中客户端对应用平台的访问信息的关键字作为识别依据,判断客户端是否是应用平台的用户;若判定客户端是应用平台的用户,则将客户端的设备信息添加到应用平台的用户群;若判定客户端不是应用平台的用户,则将客户端添加到应用平台的非用户群。
进一步地,所述方法还包括:对每一条用户网络行为信息进行客户端应用平台识别;对应用平台的用户群中客户端的设备信息进行去重统计,计算出客户端个数,标记为U1;对非用户群中的客户端的设备信息进行去重统计,计算出客户端个数,标记为U2;根据统计出的用户群中客户端的个数和非用户群中客户端的个数,对客户端应用平台市场占比进行统计。
进一步地,所述客户端应用平台的用户占比情况计算公式为:W=U1/(U1+U2)。
为实现上述目的,本发明实施方式还提供一种客户端应用平台的统计装置,包括:第一处理模块,用于获取用户网络行为信息,并从所述用户网络行为信息中提取出用户代理和统一资源定位符;第二处理模块,用于从用户代理中获取客户端的设备信息,从统一资源定位符信息中获取客户端对应用平台的访问信息,根据客户端的设备信息和客户端对应用平台的访问信息,对客户端应用平台进行识别和市场占比统计。
由上可见,本发明实施方式提供的一种客户端应用平台的统计方法和装置,通过对用户网络行为日志信息中提取出来的UA和URL信息进行分析,确定用户终端所使用的终端设备类型和终端应用平台,从而对应用平台的用户终端使用的市场占比情况和使用方式进行统计,为各个应用平台的市场战略的制定和业务功能的完善和扩展提供了重要的数据依据,具有重要的市场价值和意义。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
本发明实施方式提供一种客户端应用平台的统计方法。请参阅图1,所述方法包括以下步骤:
步骤S1:获取用户网络行为信息,并从所述用户网络行为信息中提取出用户代理(User Agent,UA)和统一资源定位符(Uniform Resource Locator,URL)。
UA用来标识浏览器客户端信息,使得服务器能够识别客户端使用的操作系统及版本、CPU类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等客户端信息。
URL也被称为网页地址,是互联网上标准资源的地址,即互联网上的每个文件都有唯一的URL。URL由四个部分组成,包含模式(或称协议)、服务器名称(或IP地址)、路径和文件名。
步骤S2:从用户代理中获取客户端的设备信息,从统一资源定位符信息中获取客户端对应用平台的访问信息,根据客户端的设备信息和客户端对应用平台的访问信息,对客户端应用平台进行识别和市场占比统计。
在本实施例中,根据用户代理UA,获取客户端的设备信息,例如获取该客户端硬件ID、所使用的操作系统(Operating System,OS)、设备类型(如手机、PC或Pad)和浏览器信息等设备信息。
根据获取到的客户端设备信息,判断该客户端是否是应用平台的用户。具体地,根据客户端的设备类型在应用平台的统一资源定位符结构特征的关键字作为识别依据,判断该客户端是否是该应用平台的用户。
例如,根据客户端硬件ID等唯一标注硬件设备的信息来唯一性标注客户端,从客户端日志中提取出的广告标示符(identifierForIdentifier,IDFA),通过网络爬虫和统一资源定位符的结构和关键字确定平台类型,例如jd.com关键字代表京东。
若判定客户端是应用平台的用户,则将该客户端的设备信息添加到应用平台的用户群;若判定客户端不是应用平台的用户,则将该客户端添加到应用平台的非用户群。
循环执行上述流程,对每一条用户网络行为样本数据,进行客户端应用平台识别。
对应用平台的用户群中客户端的设备信息进行去重统计,计算出客户端个数,标记为U1;对非用户群中的客户端的设备信息进行去重统计,计算出客户端个数,标记为U2。
根据统计出的用户群中客户端的个数和非用户群中客户端的个数,对客户端应用平台市场占比进行统计。
例如,应用平台的客户占比情况计算公式为:W=U1/(U1+U2)。
请参阅图2。本发明一个实施方式还提供一种客户端应用平台的统计装置,包括:
第一处理模块,用于获取用户网络行为信息,并从所述用户网络行为信息中提取出用户代理和统一资源定位符;
第二处理模块,用于从用户代理中获取客户端的设备信息,从统一资源定位符信息中获取客户端对应用平台的访问信息,根据客户端的设备信息和客户端对应用平台的访问信息,对客户端应用平台进行识别和市场占比统计。
所述第二处理模块,具体用于:
从用户代理中获取客户端的硬件ID、使用的操作系统、设备类型和浏览器信息;从统一资源定位符信息中获取客户端对应用平台的访问信息的关键字。
根据客户端的硬件ID和统一资源定位符中客户端对应用平台的访问信息的关键字作为识别依据,判断客户端是否是应用平台的用户;若判定客户端是应用平台的用户,则将客户端的设备信息添加到应用平台的用户群;若判定客户端不是应用平台的用户,则将客户端添加到应用平台的非用户群。
对每一条用户网络行为信息进行客户端应用平台识别;对应用平台的用户群中客户端的设备信息进行去重统计,计算出客户端个数,标记为U1;对非用户群中的客户端的设备信息进行去重统计,计算出客户端个数,标记为U2;根据统计出的用户群中客户端的个数和非用户群中客户端的个数,对客户端应用平台市场占比进行统计;所述客户端应用平台的用户占比情况计算公式为:W=U1/(U1+U2)。
上述的涉及到的客户端应用平台的统计装置的具体技术细节和客户端应用平台的统计方法中的类似,故不再具体赘述。
由上可见,本发明实施方式提供的一种客户端应用平台的统计方法和装置,通过对用户网络行为日志信息中提取出来的UA和URL信息进行分析,确定用户终端所使用的终端设备类型和终端应用平台,从而对应用平台的用户终端使用的市场占比情况和使用方式进行统计,为各个应用平台的市场战略的制定和业务功能的完善和扩展提供了重要的数据依据,具有重要的市场价值和意义。
本说明书中的各个实施方式均采用递进的方式描述,各个实施方式之间相同相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。
最后应说明的是:上面对本发明的各种实施方式的描述以描述的目的提供给本领域技术人员。其不旨在是穷举的、或者不旨在将本发明限制于单个公开的实施方式。如上所述,本发明的各种替代和变化对于上述技术所属领域技术人员而言将是显而易见的。因此,虽然已经具体讨论了一些另选的实施方式,但是其它实施方式将是显而易见的,或者本领域技术人员相对容易得出。本发明旨在包括在此已经讨论过的本发明的所有替代、修改、和变化,以及落在上述申请的精神和范围内的其它实施方式。