CN102938789B - 一种移动互联网手机应用下载组合分析方法和装置 - Google Patents

一种移动互联网手机应用下载组合分析方法和装置 Download PDF

Info

Publication number
CN102938789B
CN102938789B CN201210466780.XA CN201210466780A CN102938789B CN 102938789 B CN102938789 B CN 102938789B CN 201210466780 A CN201210466780 A CN 201210466780A CN 102938789 B CN102938789 B CN 102938789B
Authority
CN
China
Prior art keywords
download
application
url
mobile phone
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210466780.XA
Other languages
English (en)
Other versions
CN102938789A (zh
Inventor
嵇正鹏
汪敏娟
袁海
胡仲刚
李琦
马安华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Digital Life Technology Co Ltd
Original Assignee
JIANGSU PUBLIC INFORMATION CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU PUBLIC INFORMATION CO Ltd filed Critical JIANGSU PUBLIC INFORMATION CO Ltd
Priority to CN201210466780.XA priority Critical patent/CN102938789B/zh
Publication of CN102938789A publication Critical patent/CN102938789A/zh
Application granted granted Critical
Publication of CN102938789B publication Critical patent/CN102938789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Telephone Function (AREA)

Abstract

一种移动互联网手机应用下载组合分析装置及其方法,它包括DPI系统和移动互联网应用下载分析单元,所述的DPI系统对HTTP流量和AAA认证流量数据进行预处理,得到下载URL、用户手机号、下载时间并发送至移动互联网应用下载分析单元;所述的移动互联网应用下载分析单元对下载URL进行分析,获取下载来源网站和应用程序名称,将下载URL对应的用户手机号、下载时间、下载来源网站和应用程序名称存入数据库。本发明通过组合多种分析方法,更加准确分析用户下载手机应用软件的行为和习惯,提高手机应用下载分析的准确率和覆盖率,为产品营销和提升用户体验提供有力的数据支撑。

Description

一种移动互联网手机应用下载组合分析方法和装置
技术领域
 本发明属于移动互联网领域,尤其是手机应用下载分析相关技术,具体地说是一种移动互联网手机应用下载组合分析方法和装置。
背景技术
随着移动互联网和智能手机的发展,越来越多的用户通过智能手机下载和使用游戏、阅读、聊天、社交网络、影音等应用软件。分析用户下载手机应用软件的行为和习惯,可以了解用户对哪些应用感兴趣,为产品营销提供数据支撑。
现有的手机应用下载分析方法,主要包括两种类型。
1、在手机终端采集用户下载应用软件的数据。这种方法可以统计用户安装的应用,但需要用户安装带统计功能的应用程序,分析用户覆盖率较低。
2、在应用下载网站统计分析用户下载数据。这种方法可以统计某个应用下载网站的用户下载数据,可以统计该网站各应用软件的下载数据,但不能准确定位到用户手机号码,用户分析覆盖率也不高。
此外,在对DPI采集的用户下载日志分析过程中,发现部分用户在下载应用时,存在多次发送HTTP请求的情况。为提升数据分析的准确性,需要对重复下载请求进行处理。
发明内容
本发明的目的是针对目前现有手机应用下载分析方法准确率和覆盖率较低的问题,提出一种移动互联网手机应用下载组合分析方法和装置,手机应用包括Android应用和IOS应用。本发明通过DPI系统采集用户移动互联网流量,并基于DPI技术对用户流量进行分析。目前Android应用和IOS应用下载绝大多数是使用HTTP协议的,因此本发明根据协议过滤出HTTP流量数据,再根据HTTP数据分析出用户下载应用的HTTP请求数据包,通过对重复HTTP请求日志的处理,添加IMSI、MDN等,采用网页内容分析、文件解包分析等方法,获得用户应用下载的分析结果。
本发明的技术方案是:
一种移动互联网手机应用下载组合分析装置,它包括深度包检测系统即DPI系统和移动互联网应用下载分析单元,所述的移动互联网应用下载分析单元包括分析模块和数据库;
所述的DPI系统通过分光采集用户移动互联网流量和AAA认证流量,从用户移动互联网流量中过滤出HTTP流量数据,并对HTTP流量和AAA认证流量数据进行预处理,得到用户下载手机应用的统一资源定位符即下载URL、用户手机号、下载时间并发送至移动互联网应用下载分析单元;
所述的移动互联网应用下载分析单元接收来自DPI系统预处理后的数据,对下载URL进行分析,获取下载来源网站和应用程序名称,将下载URL对应的用户手机号、下载时间、下载来源网站和应用程序名称存入数据库。
本发明的移动互联网应用下载分析单元对下载URL进行分析,获取应用下载网站和应用程序名称具体包括:首先,对下载URL进行检索,判断是否在数据库中存在;如果存在,直接通过数据库查到应用名称、下载来源网站;如果不存在,对下载URL进行分析,确定下载来源网站,并根据URL结尾字符判断应用下载类型;
如果是Android应用下载,使用网页分析法获得应用程序名称;如果不成功,则使用文件解包法获得应用程序名称;
如果是IOS应用下载,根据下载URL的一级域名进行判断,如果为apple.com,则该下载属于App store应用下载,使用App store应用下载分析法获得应用程序名称;如果一级域名不为apple.com,则该下载属于越狱应用下载,使用越狱应用下载分析法获得应用程序名称。
一种移动互联网手机应用下载组合分析方法,应用移动互联网手机应用下载组合分析装置,它包括以下步骤:
步骤一、获取用户移动互联网流量和AAA认证流量,从用户移动互联网流量中过滤出HTTP流量数据;
步骤二、DPI系统对HTTP流量数据和AAA认证数据进行预处理;得到下载URL、用户手机号、下载时间并发送至移动互联网应用下载分析单元;
步骤三、移动互联网应用下载分析单元对预处理后的数据进行分析,根据下载URL获取下载来源网站和应用程序名称, 将下载URL对应的用户手机号、下载时间、下载来源网站和应用程序名称存入数据库。
本发明的步骤二所述的数据预处理流程,包括以下步骤:
步骤A、分析HTTP 流量数据中Request的GET方式报文,将其中请求URL以“.apk”和“.ipa”为结尾的报文确定为用户下载应用的请求报文,请求报文中包括下载URL、下载时间、源IP地址;
步骤B、对重复下载请求进行处理,处理方法:按源IP地址、下载URL、下载时间进行排序,对后一条与前一条日志时间进行比较,小于设定时间只算作1次下载,剔除后一次日志,大于设定时间的日志保留,算作多次下载;
步骤C、实时分析AAA认证流量,过滤出其中来自PDSN的Accounting Request报文;
步骤D、分析Accounting Request报文,取其中Framed-IP-Address字段为用户手机IP,Calling-Station-ID字段为用户IMSI;
步骤E、根据GET报文中的源IP地址,实时查询其在AAA认证Accounting Request报文中相对应的IMSI;
步骤F、通过与BSS接口查询用户IMSI与用户手机号码MDN的对应关系,得到相应的用户手机号码MDN;
步骤G、得到预处理结果:下载URL、用户手机号、下载时间。
本发明的步骤三所述的根据下载URL获取下载来源网站和应用程序名称,具体包括以下步骤:
步骤A、在数据库中对下载URL进行检索,判断是否存在;
步骤B、如果存在,转步骤C;如果不存在,转步骤D;
步骤C、通过数据库查到应用名称、下载来源网站,转步骤N;
步骤D、对下载URL进行分析,确定下载来源网站,并根据URL结尾字符判断应用下载类型;
步骤E、判断下载URL结尾字符,如果以apk结尾,则转步骤F;如果以ipa结尾,则转步骤J;
步骤F、确定该下载为Android应用下载;
步骤G、使用网页分析法获取应用程序名称;
步骤H、判断网页分析法是否成功,如果成功,转步骤N;如果不成功,转步骤I;
步骤I、使用文件解包法获得应用程序名称,转步骤N;
步骤J、确定该下载为IOS应用下载;
步骤K、根据下载URL的一级域名进行判断,如果是apple.com,则该下载属于App store应用下载,转步骤L;如果不是apple.com,则该下载属于越狱应用下载,转步骤M;
步骤L、使用App store应用下载分析法获得应用程序名称,转步骤N;
步骤M、使用越狱应用下载分析法获得应用程序名称;
步骤N、最终得到分析结果,包括:用户手机号、下载软件名称、下载时间、下载来源网站。
本发明的步骤G通过网页分析法获取应用名称,包括以下步骤:
步骤A、利用爬虫程序对下载网站进行分析,自动判断应用下载URL上一级页面为应用展示页面;
步骤B、分析应用展示页面的源代码,取源代码中的title字段,得到应用程序名称;
步骤C、将下载URL与应用程序名称的对应关系写入数据库。
本发明的步骤I通过文件解包法获取应用名称,包括以下步骤:
步骤A、根据应用下载URL下载apk文件,对apk文件计算MD5校验值;
步骤B、判断apk文件MD5值在数据库中是否存在,如果不存在则转步骤C1,如果存在则转步骤D;
步骤C1、对apk文件进行解包处理,读其中AndroidManifest.xml文件的lable字段作为应用程序名称;
步骤C2、得到下载URL和应用程序名称的对应关系,并将应用程序名称、MD5值、下载URL对应关系写入数据库;
步骤D、通过数据库直接查询到应用名称。
本发明的步骤L通过App store应用下载分析法获取应用名称,包括以下步骤:
步骤A、通过程序分析该用户的HTTP数据,得到在用户发起应用下载URL请求的之前访问的URL;
步骤B、对访问URL进行分析,根据源代码的特征,识别出应用展示页面;
步骤C、程序自动分析应用展示页面的源代码,取源代码中的title字段,得到应用程序名称;
步骤D、将下载URL与应用程序名称的对应关系写入数据库。
本发明的步骤M通过越狱应用下载分析法获取应用名称,包括以下步骤:
步骤A、根据下载URL下载ipa文件,对ipa文件计算MD5校验值;
步骤B、判断ipa文件MD5值是否在数据库中存在,如果不存在则转步骤C1,如果存在则转步骤D;
步骤C1、如果不存在,则对ipa文件进行解包处理,读其中iTunesMetadata.plist文件的itemName字段作为应用程序名称;
步骤C2、得到下载URL和应用程序名称的对应关系,并将应用程序名称、MD5值、下载URL对应关系写入数据库;
步骤D、通过数据库直接查询到应用名称。
本发明的有益效果:
本发明通过DPI系统采集用户移动互联网流量,并基于DPI技术对用户流量进行分析。目前Android应用和IOS应用下载绝大多数是使用HTTP协议的,因此本发明根据协议过滤出HTTP流量数据,再根据HTTP数据分析出用户下载应用的HTTP请求数据包,通过对重复HTTP请求日志的处理,添加IMSI、MDN等,采用网页内容分析、文件解包分析等方法,获得用户应用下载的分析结果。
本发明从基础网络入手,通过组合多种分析方法,更加准确分析用户下载手机应用软件的行为和习惯,提高手机应用下载分析的准确率和覆盖率,为产品营销和提升用户体验提供有力的数据支撑。
本发明基于DPI技术对用户流量进行分析结合文件解包分析、网页内容分析等方法,最终得到用户下载手机应用的分析结果,可以准确定位到用户手机号码,大大提高了应用下载分析的准确率。
本发明不需要用户手机端配合,只要用户通过手机上网下载应用,就能获得分析结果,大大提高了分析的覆盖率。
附图说明
图1是本发明的流程示意图
图2是本发明数据预处理流程图
图3是本发明获取应用名称的流程图
图4是本发明通过网页分析法获取应用名称的流程图
图5是本发明通过文件解包法获取应用名称的流程图
图6是本发明通过App store应用下载分析法获取应用名称的流程图
图7是本发明通过越狱应用下载分析法获取应用名称的流程图
图8是本发明的结构示意图
具体实施方式
下面结合附图和实施例对本发明作进一步的说明。
如图1所示,本发明提出一种移动互联网手机应用下载组合分析方法和装置。具体说明如下:
(一)本发明的实现流程
如图1所示,为本发明手机应用下载组合分析的主流程示意图,包括以下步骤:
步骤一、DPI系统通过分光采集用户移动互联网和AAA认证流量,对用户流量进行分析,根据协议过滤出HTTP流量数据;
步骤二、DPI系统对HTTP流量数据和AAA认证数据进行预处理;
步骤三、对预处理后的数据进行数据分析;最终得到分析结果,包括:用户手机号、下载软件名称、下载时间、下载来源网站。
数据预处理流程
如图2所示,为本发明数据预处理流程,包括以下步骤:
步骤A、分析HTTP Request中的GET方式报文,将其中请求URL以“.apk”和“.ipa”为结尾的报文确定为用户下载应用的请求报文;
步骤B、对重复下载请求进行处理,处理方法:按源IP地址、下载URL、请求时间进行排序,对后一条与前一条日志时间进行比较,小于设定时间只算作1次下载(剔除其它日志),大于设定时间的日志保留(可算作多次下载);
步骤C、实时分析AAA认证流量,过滤出其中来自PDSN的Accounting Request报文;
步骤D、分析Accounting Request报文,取其中Framed-IP-
Address字段为用户手机IP,Calling-Station-ID字段为用户IMSI;
步骤E、根据GET报文中的源IP地址,实时查询其在AAA认证Accounting Request报文中相对应的IMSI;
步骤F、通过与BSS接口查询用户IMSI与手机号码(MDN)的对应关系,得到相应的用户手机号码;
步骤G、得到预处理结果:下载URL、用户手机号、下载时间。
(三)应用程序名称分析方法
应用下载网站为用户提供移动互联网应用程序下载,常见的Android应用下载网站有安卓市场、安智市场等,常见的IOS应用下载网站有App store、同步推等。
在网页分析法中,移动互联网应用下载分析单元利用爬虫程序对下载网站进行分析,自动判断应用下载URL上一级页面为应用展示页面;并分析应用展示页面的源代码,取源代码中的title字段,得到应用程序名称。
在App store应用下载分析法中,移动互联网应用下载分析单元对访问URL进行分析,根据源代码的特征,识别出应用展示页面;并分析应用展示页面的源代码,取源代码中的title字段,得到应用程序名称。
如图3所示,为本发明移动互联网应用下载分析单元获取应用名称的流程示意图,包括以下步骤:
步骤A、在数据库中对下载URL进行检索,判断是否存在;
步骤B、如果存在,转步骤C;如果不存在,转步骤D;
步骤C、通过数据库查到应用名称、下载来源网站,转步骤N;
步骤D、对下载URL进行分析,确定下载来源网站,并根据URL结尾字符判断应用下载类型;
步骤E、判断下载URL结尾字符,如果以apk结尾,则转步骤F;如果以ipa结尾,则转步骤J;
步骤F、确定该下载为Android应用下载;
步骤G、尝试使用网页分析法获取应用程序名称;
步骤H、判断网页分析法是否成功,如果成功,转步骤N;如果不成功,转步骤I;
步骤I、使用文件解包法获得应用程序名称,转步骤N;
步骤J、确定该下载为IOS应用下载;
步骤K、根据下载URL的一级域名进行判断,如果是apple.com,则该下载属于App store应用下载,转步骤L;如果不是apple.com,则该下载属于越狱应用下载,转步骤M;
步骤L、使用App store应用下载分析法获得应用程序名称,转步骤N;
步骤M、使用越狱应用下载分析法获得应用程序名称;
步骤N、最终得到分析结果,包括:用户手机号、下载软件名称、下载时间、下载来源网站。
本发明在获取应用程序名称时,是通过网页分析法、文件解包法、App store应用下载分析法、越狱应用下载分析法共四个方法组合实现的。
1、如图4所示,为本发明通过网页分析法获取应用名称的流程图,包括以下步骤:
步骤A、利用爬虫程序对下载网站进行分析,自动判断应用下载URL上一级页面为应用展示页面;
步骤B、分析应用展示页面的源代码,取源代码中的title字段,得到应用程序名称;
步骤C、将下载URL与应用程序名称的对应关系写入数据库。
2、如图5所示,为本发明通过文件解包法获取应用名称的流程图,包括以下步骤:
步骤A、程序根据应用下载URL自动下载apk文件,对apk文件计算MD5校验值;
步骤B、判断apk文件MD5值在数据库中是否存在,如果不存在则转步骤C1,如果存在则转步骤D;
步骤C1、通过程序对apk文件进行自动解包处理,读其中AndroidManifest.xml文件的lable字段作为应用程序名称;
步骤C2、得到下载URL和应用程序名称的对应关系,并将应用程序名称、MD5值、下载URL对应关系写入数据库;
步骤D、通过数据库直接查询到应用名称。
3、如图6所示,为本发明通过App store应用下载分析法获取应用名称的流程图,包括以下步骤:
步骤A、用户通过App store下载安装应用的流程是通过手机打开App store应用,在App store中打开具体应用展示页面,然后用Apple ID登录,获得授权后下载安装应用,所以用户下载应用之前会打开应用展示页面。该用户在发起应用下载URL的请求之前,会发起对应用展示页面的访问请求。通过程序分析该用户的HTTP数据,得到在用户发起应用下载URL请求的之前访问的URL;
步骤B、对访问URL进行分析,根据源代码的特征,识别出应用展示页面;
步骤C、程序自动分析应用展示页面的源代码,取源代码中的title字段,得到应用程序名称;
步骤D、将下载URL与应用程序名称的对应关系写入数据库。
4、如图7所示,为本发明通过越狱应用下载分析法获取应用名称的流程图,包括以下步骤:
步骤A、程序根据应用下载URL自动下载ipa文件,对ipa文件计算MD5校验值;
步骤B、判断ipa文件MD5值是否在数据库中存在,如果不存在则转步骤C1,如果存在则转步骤D;
步骤C1、如果不存在,则对通过程序对ipa文件进行自动解包处理,读其中iTunesMetadata.plist文件的itemName字段作为应用程序名称;
步骤C2、得到下载URL和应用程序名称的对应关系,并将应用程序名称、MD5值、下载URL对应关系写入数据库;
步骤D、通过数据库直接查询到应用名称。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。

Claims (8)

1.一种移动互联网手机应用下载组合分析装置,其特征是它包括深度包检测系统即DPI系统和移动互联网应用下载分析单元,所述的移动互联网应用下载分析单元包括分析模块和数据库;
所述的DPI系统通过分光采集用户移动互联网流量和AAA认证流量,从用户移动互联网流量中过滤出HTTP流量数据,并对HTTP流量和AAA认证流量数据进行预处理,得到用户下载手机应用的统一资源定位符即URL、用户手机号、下载时间并发送至移动互联网应用下载分析单元;
所述的移动互联网应用下载分析单元接收来自DPI系统预处理后的数据,对下载URL进行分析,获取下载来源网站和应用程序名称,将下载URL对应的用户手机号、下载时间、下载来源网站和应用程序名称存入数据库;
移动互联网应用下载分析单元对下载URL进行分析,获取应用下载网站和应用程序名称具体包括:首先,对下载URL进行检索,判断是否在数据库中存在;如果存在,直接通过数据库查到应用名称、下载来源网站;如果不存在,对下载URL进行分析,确定下载来源网站,并根据URL结尾字符判断应用下载类型;
如果是Android应用下载,使用网页分析法获得应用程序名称;如果不成功,则使用文件解包法获得应用程序名称;
如果是IOS应用下载,根据下载URL的一级域名进行判断,如果为apple.com,则该下载属于App store应用下载,使用App store应用下载分析法获得应用程序名称;如果一级域名不为apple.com,则该下载属于越狱应用下载,使用越狱应用下载分析法获得应用程序名称;
所述的网页分析法包括以下步骤:
步骤A、利用爬虫程序对下载网站进行分析,自动判断应用下载URL上一级页面为应用展示页面;
步骤B、分析应用展示页面的源代码,取源代码中的title字段,得到应用程序名称;
步骤C、将下载URL与应用程序名称的对应关系写入数据库;
所述的文件解包法包括以下步骤:
步骤A、根据应用下载URL下载apk文件,对apk文件计算MD5校验值;
步骤B、判断apk文件MD5值在数据库中是否存在,如果不存在则转步骤C1,如果存在则转步骤D;
步骤C1、对apk文件进行解包处理,读其中AndroidManifest.xml文件的lable字段作为应用程序名称;
步骤C2、得到下载URL和应用程序名称的对应关系,并将应用程序名称、MD5值、下载URL对应关系写入数据库;
步骤D、通过数据库直接查询到应用名称;
所述的App store应用下载分析法包括以下步骤:
步骤A、通过程序分析该用户的HTTP数据,得到在用户发起应用下载URL请求的之前访问的URL;
步骤B、对访问URL进行分析,根据源代码的特征,识别出应用展示页面;
步骤C、程序自动分析应用展示页面的源代码,取源代码中的title字段,得到应用程序名称;
步骤D、将下载URL与应用程序名称的对应关系写入数据库;
所述的越狱应用下载分析法包括以下步骤:
步骤A、根据下载URL下载ipa文件,对ipa文件计算MD5校验值;
步骤B、判断ipa文件MD5值是否在数据库中存在,如果不存在则转步骤C1,如果存在则转步骤D;
步骤C1、如果不存在,则对ipa文件进行解包处理,读其中iTunesMetadata.plist文件的itemName字段作为应用程序名称;
步骤C2、得到下载URL和应用程序名称的对应关系,并将应用程序名称、MD5值、下载URL对应关系写入数据库;
步骤D、通过数据库直接查询到应用名称。
2.一种移动互联网手机应用下载组合分析方法,应用权利要求1所述移动互联网手机应用下载组合分析装置,其特征是它包括以下步骤:
步骤一、获取用户移动互联网流量和AAA认证流量,从用户移动互联网流量中过滤出HTTP流量数据;
步骤二、DPI系统对HTTP流量数据和AAA认证数据进行预处理;得到下载URL、用户手机号、下载时间并发送至移动互联网应用下载分析单元;
步骤三、移动互联网应用下载分析单元对预处理后的数据进行分析,根据下载URL获取下载来源网站和应用程序名称, 将下载URL对应的用户手机号、下载时间、下载来源网站和应用程序名称存入数据库。
3.根据权利要求2所述的移动互联网手机应用下载组合分析方法,其特征是所述的步骤二所述的数据预处理流程,包括以下步骤:
步骤A、分析HTTP 流量数据中Request的GET方式报文,将其中请求URL以“.apk”和“.ipa”为结尾的报文确定为用户下载应用的请求报文,请求报文中包括下载URL、下载时间、源IP地址;
步骤B、对重复下载请求进行处理,处理方法:按源IP地址、下载URL、下载时间进行排序,对后一条与前一条日志时间进行比较,小于设定时间只算作1次下载,剔除后一次日志,大于设定时间的日志保留,算作多次下载;
步骤C、实时分析AAA认证流量,过滤出其中来自PDSN的Accounting Request报文;
步骤D、分析Accounting Request报文,取其中Framed-IP-Address字段为用户手机IP,Calling-Station-ID字段为用户IMSI;
步骤E、根据GET报文中的源IP地址,实时查询其在AAA认证Accounting Request报文中相对应的IMSI;
步骤F、通过与BSS接口查询用户IMSI与用户手机号码MDN的对应关系,得到相应的用户手机号码MDN;
步骤G、得到预处理结果:下载URL、用户手机号、下载时间。
4.根据权利要求2所述的移动互联网手机应用下载组合分析方法,其特征是所述的步骤三所述的根据下载URL获取下载来源网站和应用程序名称,具体包括以下步骤:
步骤A、在数据库中对下载URL进行检索,判断是否存在;
步骤B、如果存在,转步骤C;如果不存在,转步骤D;
步骤C、通过数据库查到应用名称、下载来源网站,转步骤N;
步骤D、对下载URL进行分析,确定下载来源网站,并根据URL结尾字符判断应用下载类型;
步骤E、判断下载URL结尾字符,如果以apk结尾,则转步骤F;如果以ipa结尾,则转步骤J;
步骤F、确定该下载为Android应用下载;
步骤G、使用网页分析法获取应用程序名称;
步骤H、判断网页分析法是否成功,如果成功,转步骤N;如果不成功,转步骤I;
步骤I、使用文件解包法获得应用程序名称,转步骤N;
步骤J、确定该下载为IOS应用下载;
步骤K、根据下载URL的一级域名进行判断,如果是apple.com,则该下载属于App store应用下载,转步骤L;如果不是apple.com,则该下载属于越狱应用下载,转步骤M;
步骤L、使用App store应用下载分析法获得应用程序名称,转步骤N;
步骤M、使用越狱应用下载分析法获得应用程序名称;
步骤N、最终得到分析结果,包括:用户手机号、下载软件名称、下载时间、下载来源网站。
5.根据权利要求4所述的移动互联网手机应用下载组合分析方法,其特征是所述的步骤G通过网页分析法获取应用名称,包括以下步骤:
步骤A、利用爬虫程序对下载网站进行分析,自动判断应用下载URL上一级页面为应用展示页面;
步骤B、分析应用展示页面的源代码,取源代码中的title字段,得到应用程序名称;
步骤C、将下载URL与应用程序名称的对应关系写入数据库。
6.根据权利要求4所述的移动互联网手机应用下载组合分析方法,其特征是所述的步骤I通过文件解包法获取应用名称,包括以下步骤:
步骤A、根据应用下载URL下载apk文件,对apk文件计算MD5校验值;
步骤B、判断apk文件MD5值在数据库中是否存在,如果不存在则转步骤C1,如果存在则转步骤D;
步骤C1、对apk文件进行解包处理,读其中AndroidManifest.xml文件的lable字段作为应用程序名称;
步骤C2、得到下载URL和应用程序名称的对应关系,并将应用程序名称、MD5值、下载URL对应关系写入数据库;
步骤D、通过数据库直接查询到应用名称。
7.根据权利要求4所述的移动互联网手机应用下载组合分析方法,其特征是所述的步骤L通过App store应用下载分析法获取应用名称,包括以下步骤:
步骤A、通过程序分析该用户的HTTP数据,得到在用户发起应用下载URL请求的之前访问的URL;
步骤B、对访问URL进行分析,根据源代码的特征,识别出应用展示页面;
步骤C、程序自动分析应用展示页面的源代码,取源代码中的title字段,得到应用程序名称;
步骤D、将下载URL与应用程序名称的对应关系写入数据库。
8.根据权利要求4所述的移动互联网手机应用下载组合分析方法,其特征是所述的步骤M通过越狱应用下载分析法获取应用名称,包括以下步骤:
步骤A、根据下载URL下载ipa文件,对ipa文件计算MD5校验值;
步骤B、判断ipa文件MD5值是否在数据库中存在,如果不存在则转步骤C1,如果存在则转步骤D;
步骤C1、如果不存在,则对ipa文件进行解包处理,读其中iTunesMetadata.plist文件的itemName字段作为应用程序名称;
步骤C2、得到下载URL和应用程序名称的对应关系,并将应用程序名称、MD5值、下载URL对应关系写入数据库;
步骤D、通过数据库直接查询到应用名称。
CN201210466780.XA 2012-11-19 2012-11-19 一种移动互联网手机应用下载组合分析方法和装置 Active CN102938789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210466780.XA CN102938789B (zh) 2012-11-19 2012-11-19 一种移动互联网手机应用下载组合分析方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210466780.XA CN102938789B (zh) 2012-11-19 2012-11-19 一种移动互联网手机应用下载组合分析方法和装置

Publications (2)

Publication Number Publication Date
CN102938789A CN102938789A (zh) 2013-02-20
CN102938789B true CN102938789B (zh) 2015-04-29

Family

ID=47697657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210466780.XA Active CN102938789B (zh) 2012-11-19 2012-11-19 一种移动互联网手机应用下载组合分析方法和装置

Country Status (1)

Country Link
CN (1) CN102938789B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103248677B (zh) * 2013-04-24 2016-01-27 深圳天源迪科信息技术股份有限公司 互联网行为分析系统及其工作方法
CN103561176B (zh) * 2013-11-07 2015-08-19 腾讯科技(深圳)有限公司 一种终端设备的通话记录获取方法、装置及终端设备
CN103559440A (zh) * 2013-11-11 2014-02-05 北京国双科技有限公司 ios设备用户权限的检测方法、装置和系统
CN105528351A (zh) * 2014-09-29 2016-04-27 中国电信股份有限公司 一种移动终端获取互联网信息的内容去重方法及系统
CN104935478A (zh) * 2015-06-19 2015-09-23 上海斐讯数据通信技术有限公司 一种智能终端深度感知方法及其系统
CN106936663B (zh) * 2015-12-31 2020-02-21 中国移动通信集团上海有限公司 一种确定终端安装的应用的方法及装置
CN105959173A (zh) * 2016-04-05 2016-09-21 王攀 一种基于dpi的固定宽带互联网流量中提取手机号码的方法v1.0
CN108376071B (zh) * 2016-11-11 2021-08-24 中移(杭州)信息技术有限公司 一种app识别方法及系统
CN106488320B (zh) * 2016-11-22 2019-04-12 国家计算机网络与信息安全管理中心山东分中心 一种电视机顶盒安全监测分析研究方法与系统
CN106534146B (zh) * 2016-11-28 2019-11-15 拓尔思天行网安信息技术有限责任公司 一种安全监测系统及方法
CN106534145B (zh) * 2016-11-28 2019-11-15 拓尔思天行网安信息技术有限责任公司 一种应用识别方法及设备
CN108965011A (zh) * 2018-07-25 2018-12-07 中天宽带技术有限公司 一种基于智能网关深度报文分析系统和分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003308397A (ja) * 2002-04-15 2003-10-31 Ntt Docomo Inc コンテンツの取得状況通知方法、管理装置、プログラムおよび記録媒体
CN102186167A (zh) * 2011-04-11 2011-09-14 中兴通讯股份有限公司 一种对应用进行监控的方法及系统
CN102426589A (zh) * 2011-10-31 2012-04-25 合一网络技术(北京)有限公司 一种用于数据库信息检索的中间层系统及信息检索方法
CN102739838A (zh) * 2011-04-06 2012-10-17 北京双迪广告有限公司 智能手机应用程序的使用者行为分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003308397A (ja) * 2002-04-15 2003-10-31 Ntt Docomo Inc コンテンツの取得状況通知方法、管理装置、プログラムおよび記録媒体
CN102739838A (zh) * 2011-04-06 2012-10-17 北京双迪广告有限公司 智能手机应用程序的使用者行为分析方法
CN102186167A (zh) * 2011-04-11 2011-09-14 中兴通讯股份有限公司 一种对应用进行监控的方法及系统
CN102426589A (zh) * 2011-10-31 2012-04-25 合一网络技术(北京)有限公司 一种用于数据库信息检索的中间层系统及信息检索方法

Also Published As

Publication number Publication date
CN102938789A (zh) 2013-02-20

Similar Documents

Publication Publication Date Title
CN102938789B (zh) 一种移动互联网手机应用下载组合分析方法和装置
CN106202117B (zh) 数据处理方法、装置和服务器
CN107018001B (zh) 一种应用故障定位方法及装置
US10262341B2 (en) Resource downloading method and device
CN101594241B (zh) 一种网络视频的下载方法及系统
CN103744985A (zh) 网页适配的方法和系统
CN111740923A (zh) 应用识别规则的生成方法、装置、电子设备和存储介质
CN102469117A (zh) 一种异常访问行为的识别方法及装置
CN102469435A (zh) 一种提高移动终端的终端型号识别准确率的方法及装置
CN102752170A (zh) 一种网络速度测试方法
CN102750352A (zh) 浏览器中分类收藏历史访问记录的方法及装置
CN104219230B (zh) 识别恶意网站的方法及装置
CN110929183A (zh) 一种数据处理方法、装置和机器可读介质
CN103152387B (zh) 一种获取http用户行为轨迹的装置与方法
CN101354706A (zh) 一种收集网页信息的方法及装置
CN104023046A (zh) 移动终端识别方法和装置
CN102843270A (zh) 基于url与本地文件关联的可疑url检测方法和装置
CN103905421A (zh) 一种基于url异构性的可疑事件检测方法及系统
CN102882988A (zh) 一种获得资源信息的地址信息的方法、装置及设备
CN111666193B (zh) 基于实时日志解析的终端功能监控与测试的方法与系统
CN108399129B (zh) H5页面性能检测方法
CN104158697A (zh) 一种死链检测方法及装置
CN104636340A (zh) 网页url过滤方法、装置及系统
CN102469450B (zh) 一种手机病毒特征的识别方法及装置
CN103117892A (zh) 添加网站访问记录的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190322

Address after: 210006 Tongyu Building, 501 Zhongshan South Road, Nanjing City, Jiangsu Province

Patentee after: Tianyi Smart Family Technology Co., Ltd.

Address before: 210006 No. 501 Zhongshan South Road, Nanjing, Jiangsu Province

Patentee before: Jiangsu Public Information Co., Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220128

Address after: Room 1423, No. 1256 and 1258, Wanrong Road, Jing'an District, Shanghai 200072

Patentee after: Tianyi Digital Life Technology Co.,Ltd.

Address before: 210006 Tongyu Building, 501 Zhongshan South Road, Nanjing City, Jiangsu Province

Patentee before: Tianyi Smart Family Technology Co.,Ltd.

TR01 Transfer of patent right