CN109219050A - 一种基于虚拟ap的wifi采集系统及其方法 - Google Patents

一种基于虚拟ap的wifi采集系统及其方法 Download PDF

Info

Publication number
CN109219050A
CN109219050A CN201811431639.XA CN201811431639A CN109219050A CN 109219050 A CN109219050 A CN 109219050A CN 201811431639 A CN201811431639 A CN 201811431639A CN 109219050 A CN109219050 A CN 109219050A
Authority
CN
China
Prior art keywords
data
mac address
module
virtual
true
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811431639.XA
Other languages
English (en)
Inventor
舒文兵
舒张磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HONGXU INFORMATION TECHNOLOGY Co Ltd WUHAN
Original Assignee
HONGXU INFORMATION TECHNOLOGY Co Ltd WUHAN
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HONGXU INFORMATION TECHNOLOGY Co Ltd WUHAN filed Critical HONGXU INFORMATION TECHNOLOGY Co Ltd WUHAN
Priority to CN201811431639.XA priority Critical patent/CN109219050A/zh
Publication of CN109219050A publication Critical patent/CN109219050A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W48/00Access restriction; Network selection; Access point selection
    • H04W48/08Access restriction or access information delivery, e.g. discovery data delivery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W48/00Access restriction; Network selection; Access point selection
    • H04W48/16Discovering, processing access restriction or access information

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于虚拟AP的WIFI采集系统及其方法,涉及虚拟AP和WIFI采集技术。本系统包括依次交互的虚拟AP模块(100)、数据采集模块(200)、数据预处理模块(300)、真伪MAC地址过滤模块(400)和数据中心模块(500)。本发明具有下列优点和积极效果:①先进性,可以实现对发射伪MAC地址的手机终端的真实MAC地址的采集,有效的避免WIFI采集系统采集到虚假的手机MAC地址;②数据具有可靠性;③实用性;④可扩展性,能够有效保护已有投资。

Description

一种基于虚拟AP的WIFI采集系统及其方法
技术领域
本发明涉及虚拟AP和WIFI采集技术,尤其涉及一种基于虚拟AP的WIFI采集系统及其方法。
背景技术
进入到21世纪,随着通信技术及移动互联网技术飞速发展,网络应用方式由过去单一的上网形式演变成丰富多样的业务应用,任何人的生活方式都无法与互联网完全脱离,无论从最基本的衣食住行,甚至工作学习等,都与互联网息息相关。中国作为网民数量大国,面对纷繁复杂的互联网世界,不像现实中能够看清暗礁险滩,飞沙走石。随着无线局域网技术的迅猛发展,WiFi覆盖范围广、接入门槛低,这些特点使得WiFi成为首选上网接入方式。上网过程中会产生大量的用户信息,如终端信息、位置信息、通信信息、网络购物信息、用户上网轨迹信息和用户认证信息等。在TCP/IP的架构中,MAC地址扮演着非常重要的角色。在通信中,由MAC地址标识的主机网卡,作为主机身份的硬件地址。每块网卡被生产出来后,都会有一个全球唯一的编号来标识自己,不会重复,这个编号就是MAC地址,也就是网卡的物理地址。但是随着终端技术的发展,为了保护用户隐私安全,苹果iOS9以上、华为P9等Android 7.0以上的主流智能终端设备开启了MAC伪装功能,在某些特定情况下会发出伪MAC且同一个终端每次链接AP发送出的伪MAC还不唯一,无法对WIFI上网终端用户信息进行有效关联,空口中大量存在的伪MAC地址,极大的削弱了正常的WIFI采集系统的作用,所以针对发送伪MAC地址的手机终端,采集其真实的MAC地址一直是需要解决的重要难点问题。持久的真实MAC数据的积累,可以为数据挖掘和上层业务关联分析等提供数据支撑。
发明内容
本发明的目的在于克服现有数据WIFI采集系统的缺点和不足,提供一种基于虚拟AP的WIFI采集系统及其方法,即:针对苹果IOS9以上系统和部分Android7.0以上系统发送伪MAC地址的手机终端,利用虚拟AP嗅探方式诱发手机终端主动与虚拟AP完成扫描阶段信令协商,在进入到认证阶段时采集其真实的MAC地址数据。
实现本发明目的技术方案是:
本发明利用了手机终端在打开WIFI开关时,会主动链接曾经成功接入过的热点的技术原理,提出了一种利用虚拟AP设备发送手机连接过的热点信息,诱发发送伪MAC地址的手机终端主动与虚拟AP设备进行通信信令协商,从而采集该手机终端真实MAC地址的技术。随着终端技术的发展,为了保护用户隐私安全,苹果iOS9以上、华为P9等Android 7.0以上的主流智能终端设备开启了MAC伪装功能,在某些特定情况下会发出伪MAC且同一个终端每次链接AP发送出的伪MAC还不唯一。手机在打开WIFI控制开关时,会优先扫描曾经连接过的热点信息。本发明正是利用该技术原理,在虚拟AP模块配置常用的热点名列表,以该热点名列表轮流间隔一段时间发送AP热点信号,在空口中广播该热点名信息。发送伪MAC地址的手机终端随机化一个虚拟MAC地址来代替自身真实的MAC地址,手机用这个虚拟MAC地址找到周围可能存在的热点。当虚拟AP设备发送该手机曾经链接过的热点信息后,手机终端启动与虚拟AP设备的信令接入流程,手机终端根据虚拟的MAC地址发送Probe Request(ProbeRequest 携带指定的SSID):因为客户端携带指定的SSID,只会单播发送探查请求帧(ProbeRequest),虚拟AP 接受到该虚拟MAC地址发送的探查请求消息后回复探查响应消息,扫描阶段完成后,手机终端主动向虚拟AP发送携带真实MAC地址的认证请求消息,此时数据采集模块完成对真实MAC地址采集。
本发明是基于WIFI海量前端采集大数据通过安全协议无线传输集群服务器数据中心分析处理系统。当今互联网发展壮大,针对数据量大的问题,能够采集大数据进行统一分析成为一项重要的课题。大数据处理基于集群服务器,在服务支撑方面实现业务与数据的解耦,保证业务的一致性、敏捷性和体系架构的灵活性。通过对数据、计算能力、分析模型等资源的服务化封装,实现全网互联,也实现业务和数据资源共享,从而为业务联动、业务扩展和业务创新提供有力保障。
一、基于虚拟AP的WIFI采集系统
本系统包括依次交互的虚拟AP模块、数据采集模块、数据预处理模块、真伪MAC地址过滤模块和数据中心模块;
虚拟AP模块配置手机终端接入热点名,同时提供WIFI接入扫描阶段信令功能,诱发手机终端主动完成与虚拟AP进行扫描阶段信令流程协商,在关联阶段发射出真实的手机MAC地址;
数据采集模块实现空口中无线WIFI信号采集;
数据预处理模块完成MAC地址数据清洗与过滤;
真伪MAC地址过滤模块依据过滤规则完成真伪MAC地址判断与过滤;
数据中心模块实现真实MAC存储入库。
二、基于虚拟AP的WIFI采集方法
①虚拟AP模块配置手机终端接入热点名,同时提供WIFI接入扫描阶段信令功能,诱发手机终端主动完成与虚拟AP进行扫描阶段信令流程协商,在关联阶段发射出真实的手机MAC地址;
②数据采集模块完成对覆盖区域内所有频道空口无线WIFI数据的采集,对MAC层以及MAC层之上的协议数据进行解析,并对数据进行分类,将解析数据发送给数据预处理模块;
③数据预处理模块接收解析数据,对解析出的数据进行统一的流式标准化处理,并对CRC等校验不合法数据进行非法数据清洗,将数据发送给真伪MAC地址过滤模块进行过滤;
④真伪MAC过滤模块是通过MAC的定义判断MAC是否合法,并结合全球组织唯一标识符OUI库进行甄别区分,用于实时判断;
⑤数据中心模块对真伪MAC地址判断模块过滤后的数据进行存储入库,并实现对业务数据的挖掘分析,为上层业务提供支撑。
本发明具有下列优点和积极效果:
①先进性,可以实现对发射伪MAC地址的手机终端的真实MAC地址的采集,有效的避免WIFI采集系统采集到虚假的手机MAC地址;
②数据具有可靠性;
③实用性;
④可扩展性,能够有效保护已有投资。
附图说明
图1是本系统的结构方框图;
其中:
100—虚拟AP模块;
200—数据采集模块;
300—数据预处理模块;
400—真伪MAC地址过滤模块;
500—数据中心模块。
具体实施方式:
下面结合附图和实施例详细说明:
一、系统
1、总体
如图1,本系统包括依次交互的虚拟AP模块100、数据采集模块200、数据预处理模块300、真伪MAC地址过滤模块400和数据中心模块500。
虚拟AP模块100配置手机终端接入热点名,同时提供WIFI接入扫描阶段信令功能,诱发手机终端主动完成与虚拟AP进行扫描阶段信令流程协商,在关联阶段发射出真实的手机MAC地址;
数据采集模块200实现空口中无线WIFI信号采集;
数据预处理模块300完成MAC地址数据清洗与过滤;
真伪MAC地址过滤模块400依据过滤规则完成真伪MAC地址判断与过滤;
数据中心模块500实现真实MAC存储入库。
2、功能模块
1)虚拟AP模块100
虚拟AP模块100是一种提供AP信令协商功能且诱导手机终端发送真实MAC地址的虚拟化AP技术。
2)数据采集模块200
数据采集模块200是一种WIFI数据包采集与解析方法。
3)数据预处理模块300
数据预处理模块300是一种数据规范化输出方法。
4)真伪MAC地址过滤模块400
真伪MAC过滤规则模块400是一种伪MAC过滤规则和算法。
5)数据中心模块500
数据中心模块500是一种数据存储和分析方法。
二、方法
1、步骤①:
a、在虚拟AP模块配置常用的热点名列表,以该热点名列表轮流间隔一段时间发送AP热点信号,在空口中广播该热点名信息;
b、发送伪MAC地址的手机终端随机化一个虚拟MAC地址来代替自身真实的MAC地址,手机用这个虚拟MAC地址找到周围可能存在的热点;当虚拟AP设备发送该手机曾经链接过的热点信息后,手机终端启动与虚拟AP设备的信令接入流程;
c、手机终端根据虚拟的MAC地址发送Probe Request(Probe Request 携带指定的SSID):因为客户端携带指定的SSID,只会单播发送探查请求帧(Probe Request),虚拟AP接受到该虚拟MAC地址发送的探查请求消息后回复探查响应消息,扫描阶段完成;
d、扫描阶段完成后,手机终端主动向虚拟AP发送携带真实MAC地址的认证请求消息,此时数据采集模块完成对真实MAC地址采集。
2、步骤②:
a、捕获空口中WIFI数据包,包括捕获采集热点、终端以及用户上网数据包;
b、解析数据是解析被采集热点信息、终端信息和用户上网信息,并根据不同数据类型进行数据传输约束;
c、数据采集模块以TCP方式与数据预处理模块建立SOCKET通信,数据预处理模块作为服务器端,按照制定的规范数据格式传输数据。
3、步骤③:
a、数据预处理模块作为SOCKET服务端,与作为SOCKET客户端的数据采集模块建立连接;
b、标准化处理包括热点数据、终端数据和用户上网数据,按照数据类型分类生成不同格式文件。
4、步骤④:
a、从数据预处理模块中读取MAC地址数据,通过真伪MAC判断规则判断真伪MAC地址,将伪MAC地址丢弃;
b、真伪MAC地址判断规则为终端设备MAC地址对应的品牌的第一个字节的第二位十六进制为{0,4,8,C}的是真MAC,其余MAC地址与全球组织唯一标识符OUI库进行比对,存在该列表中为真,否则为伪MAC地址。
5、步骤⑤:
a、针对真伪MAC地址模块判断后为真的MAC地址,将数据按照数据类型写入到不同的表中;
b、定时对数据做统计分析,并解析海量数据。

Claims (8)

1.一种基于虚拟AP的WIFI采集系统,其特征在于:
包括依次交互的虚拟AP模块(100)、数据采集模块(200)、数据预处理模块(300)、真伪MAC地址过滤模块(400)和数据中心模块(500);
虚拟AP模块(100)配置手机终端接入热点名,同时提供WIFI接入扫描阶段信令功能,诱发手机终端主动完成与虚拟AP进行扫描阶段信令流程协商,在关联阶段发射出真实的手机MAC地址;
数据采集模块(200)实现空口中无线WIFI信号采集;
数据预处理模块(300)完成MAC地址数据清洗与过滤;
真伪MAC地址过滤模块(400)依据过滤规则完成真伪MAC地址判断与过滤;
数据中心模块(500)实现真实MAC存储入库。
2.基于权利要求1所述的一种基于虚拟AP的WIFI采集系统,其特征在于:
所述的虚拟AP模块(100)是一种提供AP信令协商功能且诱导手机终端发送真实MAC地址的虚拟化AP技术;
所述的数据采集模块(200)是一种WIFI数据包采集与解析方法;
所述的数据预处理模块(300)是一种数据规范化输出方法;
所述的真伪MAC过滤规则模块(400)是一种伪MAC过滤规则和算法;
所述的数据中心模块(500)是一种数据存储和分析方法。
3.按权利要求1-2所述系统的WIFI采集方法,其特征在于包括下列步骤:
①虚拟AP模块(100)配置手机终端接入热点名,同时提供WIFI接入扫描阶段信令功能,诱发手机终端主动完成与虚拟AP进行扫描阶段信令流程协商,在关联阶段发射出真实的手机MAC地址;
②数据采集模块(200)完成对覆盖区域内所有频道空口无线WIFI数据的采集,对MAC层以及MAC层之上的协议数据进行解析,并对数据进行分类,将解析数据发送给数据预处理模块;
③数据预处理模块(300)接收解析数据,对解析出的数据进行统一的流式标准化处理,并对CRC等校验不合法数据进行非法数据清洗,将数据发送给真伪MAC地址过滤模块进行过滤;
④真伪MAC过滤模块(400)通过MAC的定义判断MAC是否合法,并结合全球组织唯一标识符OUI库进行甄别区分,用于实时判断;
⑤数据中心模块(500)对真伪MAC地址判断模块过滤后的数据进行存储入库,并实现对业务数据的挖掘分析,为上层业务提供支撑。
4.按权利要求3所述的WIFI采集方法,,其特征在于所述的步骤①:
a、在虚拟AP模块配置常用的热点名列表,以该热点名列表轮流间隔一段时间发送AP热点信号,在空口中广播该热点名信息;
b、发送伪MAC地址的手机终端随机化一个虚拟MAC地址来代替自身真实的MAC地址,手机用这个虚拟MAC地址找到周围可能存在的热点;当虚拟AP设备发送该手机曾经链接过的热点信息后,手机终端启动与虚拟AP设备的信令接入流程;
c、手机终端根据虚拟的MAC地址发送Probe Request(Probe Request 携带指定的SSID):因为客户端携带指定的SSID,只会单播发送探查请求帧(Probe Request),虚拟AP接受到该虚拟MAC地址发送的探查请求消息后回复探查响应消息,扫描阶段完成;
d、扫描阶段完成后,手机终端主动向虚拟AP发送携带真实MAC地址的认证请求消息,此时数据采集模块完成对真实MAC地址采集。
5.按权利要求3所述的WIFI采集方法,其特征在于所述的步骤②:
a、捕获空口中WIFI数据包,包括捕获采集热点、终端以及用户上网数据包;
b、解析数据是解析被采集热点信息、终端信息和用户上网信息,并根据不同数据类型进行数据传输约束;
c、数据采集模块以TCP方式与数据预处理模块建立SOCKET通信,数据预处理模块作为服务器端,按照制定的规范数据格式传输数据。
6.按权利要求3所述的WIFI采集方法,其特征在于所述的步骤③:
a、数据预处理模块作为SOCKET服务端,与作为SOCKET客户端的数据采集模块建立连接;
b、标准化处理包括热点数据、终端数据和用户上网数据,按照数据类型分类生成不同格式文件。
7.按权利要求3所述的WIFI采集方法,,其特征在于所述的步骤④:
a、从数据预处理模块中读取MAC地址数据,通过真伪MAC判断规则判断真伪MAC地址,将伪MAC地址丢弃;
b、真伪MAC地址判断规则为终端设备MAC地址对应的品牌的第一个字节的第二位十六进制为{0,4,8,C}的是真MAC,其余MAC地址与全球组织唯一标识符OUI库进行比对,存在该列表中为真,否则为伪MAC地址。
8.按权利要求3所述的WIFI采集方法,其特征在于所述的步骤⑤:
a、针对真伪MAC地址模块判断后为真的MAC地址,将数据按照数据类型写入到不同的表中;
b、定时对数据做统计分析,并解析海量数据。
CN201811431639.XA 2018-11-27 2018-11-27 一种基于虚拟ap的wifi采集系统及其方法 Withdrawn CN109219050A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811431639.XA CN109219050A (zh) 2018-11-27 2018-11-27 一种基于虚拟ap的wifi采集系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811431639.XA CN109219050A (zh) 2018-11-27 2018-11-27 一种基于虚拟ap的wifi采集系统及其方法

Publications (1)

Publication Number Publication Date
CN109219050A true CN109219050A (zh) 2019-01-15

Family

ID=64994051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811431639.XA Withdrawn CN109219050A (zh) 2018-11-27 2018-11-27 一种基于虚拟ap的wifi采集系统及其方法

Country Status (1)

Country Link
CN (1) CN109219050A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109819469A (zh) * 2019-03-05 2019-05-28 武汉虹信通信技术有限责任公司 基于多重载体的物联网嗅探平台系统及其方法
CN110650220A (zh) * 2019-09-11 2020-01-03 珠海格力电器股份有限公司 一种mac地址的获取方法及探测设备
CN111093250A (zh) * 2019-12-26 2020-05-01 Oppo(重庆)智能科技有限公司 网络扫描方法、装置、终端及存储介质
CN112187961A (zh) * 2019-07-05 2021-01-05 苏州盈虚有数信息科技有限公司 一种真实mac采集机制系统及方法
CN112395332A (zh) * 2020-11-18 2021-02-23 安徽四创电子股份有限公司 一种基于时空分析法识别真伪mac地址的实施方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109819469A (zh) * 2019-03-05 2019-05-28 武汉虹信通信技术有限责任公司 基于多重载体的物联网嗅探平台系统及其方法
CN112187961A (zh) * 2019-07-05 2021-01-05 苏州盈虚有数信息科技有限公司 一种真实mac采集机制系统及方法
CN110650220A (zh) * 2019-09-11 2020-01-03 珠海格力电器股份有限公司 一种mac地址的获取方法及探测设备
CN111093250A (zh) * 2019-12-26 2020-05-01 Oppo(重庆)智能科技有限公司 网络扫描方法、装置、终端及存储介质
CN112395332A (zh) * 2020-11-18 2021-02-23 安徽四创电子股份有限公司 一种基于时空分析法识别真伪mac地址的实施方法

Similar Documents

Publication Publication Date Title
CN109219050A (zh) 一种基于虚拟ap的wifi采集系统及其方法
CN106797405B (zh) 分布式负载均衡系统、健康检查方法和服务节点
CN109922160B (zh) 一种基于电力物联网的终端安全接入方法、装置及系统
CN110048927B (zh) 通信方法和通信装置
CN104486835B (zh) 一种基于无线接入点和视频监控的定位装置
CN101848235B (zh) 一种支持nat穿越的实时多媒体数据p2p传输方案
CN110213212A (zh) 一种设备的分类方法和装置
CN109271793A (zh) 物联网云平台设备类别识别方法及系统
CN103384274B (zh) 基于http协议的公网连接内网计算机的通信方法
CN109189698A (zh) 设备控制方法、装置以及物联网系统
CN106211217A (zh) 一种wifi网络安全审计方法、平台
CN106817353A (zh) 用于mac采集和网络安全审计的无线ap和方法
CN107623754A (zh) 基于真伪MAC识别的WiFi采集系统及其方法
CN103532795A (zh) 一种检测web业务系统可用性的监控系统及方法
CN109617963A (zh) 设备控制方法、装置以及物联网系统
CN106789486B (zh) 共享接入的检测方法、装置、电子设备及计算机可读存储介质
CN104363262A (zh) 无线接入设备、服务器、服务信息推送系统及方法
CN103581909A (zh) 一种疑似手机恶意软件的定位方法及其装置
Du et al. A context-aware IoT architecture through software-defined data plane
CN108810053A (zh) 物联网应用处理方法和物联网应用系统
CN102271331B (zh) 一种检测业务提供商sp站点可靠性的方法及系统
CN100366002C (zh) 互联网共享接入检测系统
CN106878102A (zh) 一种基于网络流量多字段识别的人流量检测方法及系统
CN102045182B (zh) 一种业务故障确定方法、装置和系统
CN111148136B (zh) 无线物联网边缘协同感知方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190115

WW01 Invention patent application withdrawn after publication