CN104951431A - 一种安卓智能终端网页业务识别方法 - Google Patents
一种安卓智能终端网页业务识别方法 Download PDFInfo
- Publication number
- CN104951431A CN104951431A CN201510221688.0A CN201510221688A CN104951431A CN 104951431 A CN104951431 A CN 104951431A CN 201510221688 A CN201510221688 A CN 201510221688A CN 104951431 A CN104951431 A CN 104951431A
- Authority
- CN
- China
- Prior art keywords
- intelligent terminal
- android intelligent
- web traffic
- business
- terminal web
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及一种安卓智能终端网页业务识别方法,包括部署设备,搭建被测安卓智能终端网页业务运行的纯粹环境;所述部署设备包括:安卓智能终端、PC端、无线网卡、数据库、服务器、公网网络和WIRESHARK;通过WIRESHARK获取被测安卓智能终端网页业务产生的TCP业务流;分析TCP业务流中的各个协议,获取并整理业务特征;根据业务特征识别被测安卓智能终端网页业务。解决了安卓智能终端网页业务无法高效并准确地识别的问题,创造了针对安卓智能终端网页业务实现精准识别的新的运营模式和商业模型,为运营商和服务提供商缔造新的利润增长空间。
Description
技术领域
本发明涉及一种识别方法,具体涉及一种安卓智能终端网页业务识别方法。
背景技术
在风起云涌的高科技时代,智能终端的普及不仅推动了移动互联网的发展,而且带来了终端应用/业务的爆炸式增长。终端应用包括有网页业务和移动APP业务,其中,针对网页业务的无穷性的特点,是移动APP业务无法相比的。
亚当·博斯沃思(Adam Bosworth)不仅是一个硅谷资深人士、XML语言技术的先驱者,还担任了云计算机及移动创新企业Salesforce的首席战略师。近日,博斯沃思在接受Re/code网站采访时表示,移动APP业务的数量永远无法超越网页。
与此同时,根据调查数据显示,当前人们对于新出现的移动应用程序已经不再有着强烈的兴趣,关注的依旧是最初的几个应用程序。博斯沃思预测,未来移动APP应用将会仍然占据主导地位,但是人们使用移动应用的种类和时间将会持续下降。相比较之下,网页的生命力却会依旧旺盛。
如今网页业务普遍存在于网络中,如何快速动态地、高效率地、高识别率地识别出内容各不相同的网页业务,如何实现识别出网络中网页业务,挖掘出网页业务数据的价值以及创造新的运营模式和商业模型,提高利润增长正有待解决。
发明内容
为了解决上述问题,本发明提出一种安卓智能终端网页业务识别方法,基于针对被测安卓智能终端网页运行时产生的TCP业务流的深度分析和挖掘来说明如何识别出运行在一种安卓智能终端网页业务识别方法,解决安卓智能终端网页业务无法高效并准确地识别的问题;创造了基于针对安卓智能终端网页业务实现精准识别的新的运营模式和商业模型,由此缔造新的利润增长空间。
本发明的目的是采用下述技术方案实现的:
一种安卓智能终端网页业务识别方法,所述方法包括:
(1)部署设备,搭建被测安卓智能终端网页业务运行的纯粹环境;
所述部署设备包括:安卓智能终端、PC端、无线网卡、数据库、服务器、公网网络和 WIRESHARK;
(2)通过WIRESHARK获取被测安卓智能终端网页业务产生的TCP业务流;
(3)分析TCP业务流中的各个协议,获取并整理业务特征;
(4)根据业务特征识别被测安卓智能终端网页业务。
优选的,所述步骤(1)中,搭建安卓智能终端网页业务运行的纯粹环境包括,
2-1启动PC端,连接公网网络;
2-2运行免费热点,形成WIFI覆盖;
2-3安卓智能终端和PC端通过无线网卡单一连接;
2-4删除安卓智能终端的所有应用,仅打开被测安卓智能终端网页业务。
优选的,所述步骤(2)中,选择唯一连接安卓智能终端的无线网卡启动WIRESHARK,运行安卓智能终端网页业务获得响应,通过人工手动化模拟或程序自动化模拟,获得TCP业务流;
其中,所述响应包括成功响应和错误响应。
进一步地,所述TCP业务流包括请求报文和响应报文;其中,请求报文包括有HTTP GET和HTTP POST;响应报文包括HTTP GET响应和HTTP POST响应。
进一步地,所述HTTP GET请求报文携带的字段,包括URL、HOST、CONNECTION、ACCEPT、X-WAP-PROFILE、X-REQUESTED-WITH、USER-AGENT、ACCEPT-ENCODING、ACCEPT-LANGUAGE、ACCEPT-CHARSET、X-GETZIP和CACHE-CONTROL;
所述HTTP响应报文携带的字段,包括EXPIRES、DATE、CONTENT-TYPE、LAST-MODIFIED、TRANSFER-ENCODING、CACHE-CONTROL、CONTENT-ENCODING、AGE、X-VIA、CONNECTION和DATA。
优选的,所述步骤(3)的协议为HTTP协议和DNS协议;获取业务特征包括包含模式和等于模式;
所述包含模式为被测安卓智能终端网页业务类型不同,但存在共同字段;所述等于模式为被测安卓智能终端网页业务类型不同,且无共同字段。
优选的,整理业务特征包括,定义或者组合模式和并且组合模式;
当一种业务特征可以作为通用唯一标识时,采用所述或者组合模式与其他业务特征并列存在;当一种业务特征无法作为通用唯一标识时,则联合其他特征成为一个整合的业务特征。
优选的,所述步骤(4)包括,将所述业务特征库录入数据库,将被测安卓智能终端网页业务的TCP业务流的形成的流量包以离线文件上传至服务器后运行,调用该数据库的业务特征读取该离线文件并进行逐包识别;当识别到其中任一数据包携带所述业务特征,则该数据 包包含的源地址、端口号和目的地址所产生的所有数据均属于该业务,即该业务能够被识别;当该业务产生的所有数据包均被识别出来,则表示该业务的识别率为100%。
与最接近的现有技术相比,本发明达到的有益效果是:
可以实现高效地、动态地、高准确地、高识别率地识别出安卓智能终端网页业务,创造新的运营模式和商业模型,为运营商和服务提供商缔造新的利润增长空间。
附图说明
图1是本发明提供的安卓智能终端网页业务识别方法流程图;
图2是本发明提供的安卓智能终端网页业务识别结构示意图;
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细说明。
如图1所示,一种安卓智能终端网页业务识别方法,所述方法包括:
(1)部署设备,搭建被测安卓智能终端网页业务运行的纯粹环境;
所述部署设备包括:安卓智能终端、PC端、无线网卡(内置/外置均可)、数据库、服务器、公网网络和WIRESHARK;如表1所示,
序号 | 硬件设备 | 软件设备 |
1 | ANDROID智能手机一部 | 可访问INTERNET的公网网络 |
2 | 电脑一台 | WIRESHARK |
3 | 无线网卡一个(内置/外置均可) | |
4 | 数据库 | |
5 | 服务器 |
表1
所述步骤(1)中,搭建安卓智能终端网页业务运行的纯粹环境包括,
2-1启动PC端,连接公网网络;
2-2运行免费热点,形成WIFI覆盖;
2-3安卓智能终端和PC端通过无线网卡单一连接;
2-4删除安卓智能终端的所有应用,仅打开被测安卓智能终端网页业务。
(2)通过WIRESHARK获取被测安卓智能终端网页业务产生的TCP业务流;如图2所示:
序号 | 硬件设备 | 软件设备 |
1 | ANDROID智能手机一部 | 可访问INTERNET的公网网络 |
2 | 电脑一台 | WIFI热点、WIRESHARK |
3 | 无线网卡一个(内置/外置均可) | |
4 | 数据库 | |
5 | 服务器 |
表2
所述步骤(2)中,选择唯一连接安卓智能终端的无线网卡启动WIRESHARK,运行安卓智能终端网页业务获得响应,通过人工手动化模拟或程序自动化模拟,获得TCP业务流;
其中,所述响应包括成功响应和错误响应。
所述TCP业务流包括请求报文和响应报文;其中,请求报文包括有HTTP GET和HTTP POST;响应报文包括HTTP GET响应和HTTP POST响应。以下实施例为安卓智能终端网页业务(58.com)的HTTP协议GET请求报文和响应报文:
所述HTTP GET请求报文携带的字段,包括URL、HOST、CONNECTION、ACCEPT、X-WAP-PROFILE、X-REQUESTED-WITH、USER-AGENT、ACCEPT-ENCODING、ACCEPT-LANGUAGE、ACCEPT-CHARSET、 X-GETZIP和CACHE-CONTROL;
所述HTTP响应报文携带的字段,包括EXPIRES、DATE、CONTENT-TYPE、LAST-MODIFIED、TRANSFER-ENCODING、CACHE-CONTROL、CONTENT-ENCODING、AGE、X-VIA、CONNECTION和DATA。
(3)分析TCP业务流中的各个协议,获取并整理业务特征;所述步骤(3)的协议为HTTP协议和DNS协议;获取业务特征包括包含模式和等于模式;例如,依次整理、精剪ANDROID手机侧网页业务(58同城)特征,ANDROID手机侧网页业务(58同城)对应的HOST字段的特征,HOST可以等于STATIC.58.COM或者等于TRACKLOG.58.COM或者等于TRACK.58.COM或者等于SUGGEST.58.COM.CN或者等于STATIC.TRACK.58.COM或者等于PIC2.58.COM或者等于M.58.COM……包含的类型很多,但有个共同特点都是包含“58.COM”,所以整理和精剪后为:HOST:包含"58.COM"。
依次类推,可以陆续获取其他的ANDROID手机侧网页业务(58同城)特征,例如URL、REFERER、DATA等字段携带的ANDROID手机侧网页业务(58同城)特征。
所述包含模式为被测安卓智能终端网页业务类型不同,但存在共同字段;当包含的内容类型较多时,但其共同特点很明显,则可以划分为包含的关系,即对应的业务特征为某字段包含什么,例如URL字段对应的ANDROID手机侧网页业务(58同城)特征:URL中包含“58.COM”。所述等于模式为被测安卓智能终端网页业务类型不同,且无共同字段。
整理业务特征包括,定义或者组合模式和并且组合模式;
当一种业务特征可以作为通用唯一标识时,采用所述或者组合模式与其他业务特征并列存在;当一种业务特征无法作为通用唯一标识时,则联合其他特征成为一个整合的业务特征。
如图2所示,(4)根据业务特征识别被测安卓智能终端网页业务。
所述步骤(4)包括,将所述业务特征库录入数据库,将被测安卓智能终端网页业务的TCP业务流的形成的流量包以离线文件上传至服务器后运行,调用该数据库的业务特征读取该离线文件并进行逐包识别;当识别到其中任一数据包携带所述业务特征,则该数据包包含的源地址、端口号和目的地址所产生的所有数据均属于该业务,即该业务能够被识别;当该业务产生的所有数据包均被识别出来,则表示该业务的识别率为100%。
本发明以(58同城)为例,将离线文件--纯粹的完整的ANDROID手机侧网页业务(58同城)TCP业务流形成的流量包文件上传到服务器,服务器后台运行,通过调用数据库业务特征进行读取识别该离线文件,经过多次验证,其业务识别率达到98%及以上,即识别出的安卓智能终端网页业务(58同城)数据包数量占离线文件中包含的总数据包数量的98%及以上。从而实现了高效地、精准地、动态地、实时地识别出安卓智能终端网页业务(58同城)。
在高效率、高准确率识别出ANDROID手机侧网页业务(58同城)的基础上,可以由此实现综合分析出该业务的使用情况、在网络中该业务的占比、使用该业务的用户/用户群的行为,进一步地,仿照安卓智能终端网页业务(58同城)的识别方法和过程,可实现识别出多种业务;在此基础上可以掌握网络中业务的组成情况、热门的业务应用、用户的喜好及习惯、业务使用的高峰时段及低谷时段等信息,由此挖掘出业务数据的价值,创造基于针对安卓智能终端网页业务实现精准识别的新的运营模式和商业模型,为运营商和服务提供商缔造新的利润增长空间。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。
Claims (8)
1.一种安卓智能终端网页业务识别方法,其特征在于,所述方法包括:
(1)部署设备,搭建被测安卓智能终端网页业务运行的纯粹环境;
所述部署设备包括:安卓智能终端、PC端、无线网卡、数据库、服务器、公网网络和WIRESHARK;
(2)通过WIRESHARK获取被测安卓智能终端网页业务产生的TCP业务流;
(3)分析TCP业务流中的各个协议,获取并整理业务特征;
(4)根据业务特征识别被测安卓智能终端网页业务。
2.如权利要求1所述的安卓智能终端网页业务识别方法,所述步骤(1)中,搭建安卓智能终端网页业务运行的纯粹环境包括,
2-1启动PC端,连接公网网络;
2-2运行免费热点,形成WIFI覆盖;
2-3安卓智能终端和PC端通过无线网卡单一连接;
2-4删除安卓智能终端的所有应用,仅打开被测安卓智能终端网页业务。
3.如权利要求1所述的安卓智能终端网页业务识别方法,其特征在于,所述步骤(2)中,选择唯一连接安卓智能终端的无线网卡启动WIRESHARK,运行安卓智能终端网页业务获得响应,通过人工手动化模拟或程序自动化模拟,获得TCP业务流;
其中,所述响应包括成功响应和错误响应。
4.如权利要求3所述的安卓智能终端网页业务识别方法,其特征在于,所述TCP业务流包括请求报文和响应报文;其中,请求报文包括有HTTP GET和HTTP POST;响应报文包括HTTPGET响应和HTTP POST响应。
5.如权利要求4所述的安卓智能终端网页业务识别方法,其特征在于,所述HTTP GET请求报文携带的字段,包括URL、HOST、CONNECTION、ACCEPT、X-WAP-PROFILE、X-REQUESTED-WITH、USER-AGENT、ACCEPT-ENCODING、ACCEPT-LANGUAGE、ACCEPT-CHARSET、X-GETZIP和CACHE-CONTROL;
所述HTTP响应报文携带的字段,包括EXPIRES、DATE、CONTENT-TYPE、LAST-MODIFIED、TRANSFER-ENCODING、CACHE-CONTROL、CONTENT-ENCODING、AGE、X-VIA、CONNECTION和DATA。
6.如权利要求1所述的安卓智能终端网页业务识别方法,其特征在于,所述步骤(3)的协议为HTTP协议和DNS协议;获取业务特征包括包含模式和等于模式;
所述包含模式为被测安卓智能终端网页业务类型不同,但存在共同字段;所述等于模式为被测安卓智能终端网页业务类型不同,且无共同字段。
7.如权利要求1所述的安卓智能终端网页业务识别方法,其特征在于,整理业务特征包括,定义或者组合模式和并且组合模式;
当一种业务特征可以作为通用唯一标识时,采用所述或者组合模式与其他业务特征并列存在;当一种业务特征无法作为通用唯一标识时,则联合其他特征成为一个整合的业务特征。
8.如权利要求1所述的安卓智能终端网页业务识别方法,其特征在于,所述步骤(4)包括,将所述业务特征库录入数据库,将被测安卓智能终端网页业务的TCP业务流的形成的流量包以离线文件上传至服务器后运行,调用该数据库的业务特征读取该离线文件并进行逐包识别;当识别到其中任一数据包携带所述业务特征,则该数据包包含的源地址、端口号和目的地址所产生的所有数据均属于该业务,即该业务能够被识别;当该业务产生的所有数据包均被识别出来,则表示该业务的识别率为100%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510221688.0A CN104951431A (zh) | 2015-05-05 | 2015-05-05 | 一种安卓智能终端网页业务识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510221688.0A CN104951431A (zh) | 2015-05-05 | 2015-05-05 | 一种安卓智能终端网页业务识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104951431A true CN104951431A (zh) | 2015-09-30 |
Family
ID=54166094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510221688.0A Pending CN104951431A (zh) | 2015-05-05 | 2015-05-05 | 一种安卓智能终端网页业务识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104951431A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8239756B2 (en) * | 2001-03-19 | 2012-08-07 | International Business Machines Corporation | Intelligent document filtering |
CN102932555A (zh) * | 2012-12-03 | 2013-02-13 | 南京安讯科技有限责任公司 | 一种快速识别手机客户端软件的方法和系统 |
-
2015
- 2015-05-05 CN CN201510221688.0A patent/CN104951431A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8239756B2 (en) * | 2001-03-19 | 2012-08-07 | International Business Machines Corporation | Intelligent document filtering |
CN102932555A (zh) * | 2012-12-03 | 2013-02-13 | 南京安讯科技有限责任公司 | 一种快速识别手机客户端软件的方法和系统 |
Non-Patent Citations (3)
Title |
---|
FINDYOU: "Android抓包方法(三)之Win7笔记本WiFi热点+WireShark工具", 《HTTP://WWW.CNBOLGS.COM/FINDYOU/P/3491065/HTML》 * |
弯柚博客: "详解使用tcpdump、wireshark对Android应用程序进行抓包并分析", 《HTTP://WWW.MYHACK58.COM/ARTICLE/48/67/2013/39798.HTM》 * |
谢伟: "《嵌入式Linux系统工程师标准培训教材1基础篇 嵌入式体验ARM系统进阶应用程序开发》", 31 December 2011 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106202117B (zh) | 数据处理方法、装置和服务器 | |
CN103402177B (zh) | 一种WiFi终端信息推送系统及其实现方法 | |
CN103200262B (zh) | 一种基于移动网络的广告调度方法、装置及系统 | |
CN103533530A (zh) | 一种跨设备的用户对应及用户追踪方法、系统 | |
CN107464117A (zh) | 基于区块链的数据管理方法及区块链系统 | |
CN105187392B (zh) | 基于网络接入点的移动终端恶意软件检测方法及其系统 | |
CN105447147B (zh) | 一种数据处理方法及装置 | |
CN107515915A (zh) | 基于用户行为数据的用户标识关联方法 | |
CN109905873B (zh) | 一种基于特征标识信息的网络账号关联方法 | |
CN105975479A (zh) | 一种基于标签库的电信用户兴趣度分析方法及系统 | |
CN104217346A (zh) | 一种精准广告设备与精准广告方法 | |
WO2015073755A1 (en) | Generating sequenced instructions for connecting through captive portals | |
CN102469117A (zh) | 一种异常访问行为的识别方法及装置 | |
TW201409393A (zh) | 電信行為統計分析系統 | |
CN104615765A (zh) | 一种移动用户上网记录的数据处理方法及装置 | |
CN103716826A (zh) | 基于无线数据业务仿真场景的用户体验质量测试方法 | |
CN109639655A (zh) | 一种智能深度解析系统及解析方法 | |
CN102857917A (zh) | 一种基于信令分析的手机连接pc上网识别方法 | |
CN110034970A (zh) | 网络设备区分判别方法及装置 | |
CN104298782A (zh) | 互联网用户主动访问行为轨迹的分析方法 | |
CN110737645B (zh) | 一种不同系统间数据迁移方法、数据迁移系统及相关设备 | |
CN102999424B (zh) | 一种并行远程自动化测试的方法 | |
CN105099769A (zh) | 业务平台的异常操作处理方法、设备和系统 | |
CN105912583A (zh) | 移动终端会员服务数据交互方法及装置 | |
CN106302162A (zh) | 一种基于客户端的应用类型智能识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150930 |
|
RJ01 | Rejection of invention patent application after publication |