CN109451486A - 基于探测请求帧的WiFi采集系统及WiFi终端探测方法 - Google Patents
基于探测请求帧的WiFi采集系统及WiFi终端探测方法 Download PDFInfo
- Publication number
- CN109451486A CN109451486A CN201811451097.2A CN201811451097A CN109451486A CN 109451486 A CN109451486 A CN 109451486A CN 201811451097 A CN201811451097 A CN 201811451097A CN 109451486 A CN109451486 A CN 109451486A
- Authority
- CN
- China
- Prior art keywords
- data
- wifi
- module
- record
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/22—Processing or transfer of terminal data, e.g. status or physical capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L2101/00—Indexing scheme associated with group H04L61/00
- H04L2101/60—Types of network addresses
- H04L2101/618—Details of network addresses
- H04L2101/622—Layer-2 addresses, e.g. medium access control [MAC] addresses
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W84/00—Network topologies
- H04W84/02—Hierarchically pre-organised networks, e.g. paging networks, cellular networks, WLAN [Wireless Local Area Network] or WLL [Wireless Local Loop]
- H04W84/10—Small scale networks; Flat hierarchical networks
- H04W84/12—WLAN [Wireless Local Area Networks]
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Small-Scale Networks (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种基于探测请求(Probe Request)帧的WiFi采集系统及WiFi终端探测方法,属于WiFi采集技术领域。该采集系统包括数据采集模块、数据预处理模块、数据存储模块和数据分析模块,其中数据采集模块、数据预处理模块和数据存储模块顺序连接,数据存储模块和数据分析模块双向连接。本发明能实现对WiFi终端的准确统计。
Description
技术领域
本发明涉及一种基于探测请求(Probe Request)帧的WiFi采集系统及WiFi终端探测方法,属于WiFi采集技术领域。
背景技术
随着智能手机的普及与迭代,人们需要越来越多的移动带宽来支持各种流行应用。相比于手机网络,WiFi(一种基于IEEE 802.11标准的无线局域网技术)因成本低、功耗低、稳定性高、配置简单等特点,成为人们首选的上网方式。
由于WiFi终端会不断向周围发送数据包,因此产生一些应用。根据人们随身携带手机的特点,利用WiFi信号来统计周围WiFi终端的数量,从而推算出人流量、终端位置等信息,为销售、交通、安防等分析策划提供数据基础。
在目前主流网络协议中,MAC地址(Media Access Control Address,媒体访问控制地址,即网络设备的物理地址)在底层的协议中发挥了重要的作用,它是网络终端(包括但不限于以太网、蓝牙、WiFi)全球唯一的网络编号,在底层的网络协议中,数据包根据MAC地址发送到对应的设备。
但随着人们隐私意识的提升,越来越多的终端在扫描周围WiFi信号时,不再使用出厂MAC地址、而是使用随机MAC地址来发送数据包,外加上在户外等场合,多数人的WiFi终端没有与接入点关联,发送带随机MAC地址的数据包,导致传统利用MAC地址来统计终端数量的方法会产生较大的偏差,从而影响上层的数据分析的效果。
发明内容
为了克服随机化MAC地址对终端数量的统计造成的偏差,针对主流WiFi终端在扫描接入点时发送带有随机MAC地址的Probe Request帧的特点,本发明提出一种基于探测请求帧的WiFi采集系统及WiFi终端探测方法,实现对WiFi终端的准确统计。
本发明为解决其技术问题采用如下技术方案:
一种基于探测请求帧的WiFi采集系统,包括数据采集模块、数据预处理模块、数据存储模块和数据分析模块,其中数据采集模块、数据预处理模块和数据存储模块顺序连接,数据存储模块和数据分析模块双向连接。
基于探测请求帧的WiFi采集系统的WiFi终端探测方法,包括下列步骤:
①数据采集模块通过监听所有频段的WiFi通信,将WiFi信号转换成计算机识别的数据,校验其合法性,并交由数据预处理模块;
②数据预处理模块对一个地点采集到的数据,过滤出终端、接入点两者的MAC地址、接入点的SSID信息,按阈值去除重复数据,并附加上时间戳、数据采集模块编号,最后将结果发送给数据存储模块;
③数据存储模块对于接收到的数据,使用关系型数据库进行保存和再次提取;
④数据分析模块对于预处理后的数据,按时间片切割,在单个时间片内分析各个SSID、MAC地址之间的关联性,将分析结果保存回数据存储模块。
所述步骤①的具体过程如下:
1)监听WiFi信道,解析信道上加载的所有WiFi数据包,将其转换成计算机能识别的数据结构;
2)将转换结果通过总线的方式,传递给数据预处理模块。
所述的步骤②的具体过程如下:
a、数据预处理模块通过总线获取到所有WiFi信道上的数据包;
b、对获取到的数据包,根据WiFi协议的阶段,进行初步分析和过滤:
b.1、对于WiFi终端与AP关联前所发出的数据包,仅记录下Probe Request帧里的SSID名称以及数据包信号强度,并将其标记为类型A;
b.2、对于WiFi终端与AP关联后所发出的数据包,记录下数据包里终端的MAC地址和信号强度,并将其标记为类型B;
b.3、对于其他数据包,全部舍弃;对过滤的结果,按阈值去除重复的记录,并附加上时间戳、数据采集模块编号,发送给数据存储模块,待进一步分析。
所述的步骤③的具体内容如下:
A、对于数据存储模块里的预处理后的数据,以时间切片的形式,按数据预处理模块的顺序,对该时间片内的数据,用以下步骤分析:
B.1、对于类型A的记录,首先统计出该时间片内所有出现过的SSID的名称,然后依次枚举出所有不足10个SSID名称的组合;
B.2、根据选定的SSID组合,在时间片内过滤出带有其中任一SSID的Probe Request帧记录,然后对两组SSID的记录按时间向量的高斯距离最小的原则,选出相同数量的记录;
B.3、对于过滤出的记录,计算两两SSID之间Probe Request帧信号强度的关联性,如果关联性超过阈值,则判定这些两个SSID的Probe Request帧来自同一个WiFi终端,并将分析结果保存回数据存储模块;
C.1、在类型A的记录处理完后,继续处理类型B的记录,统计该时间片内出现的所有类型B记录内的MAC地址;
C.2、对于每一个类型B记录的MAC地址,计算与类型A终端的关联性;
C.3、根据选定WiFi终端的类型A记录、选定MAC地址的类型B记录,抽取出相同数量、且时间差最小的两组记录,然后计算这两组记录之间信号强度的相关性;如果相关性超过阈值,则判定选定的类型A的WiFi终端与类型B的MAC地址是同一个终端,并将分析结果保存到数据存储模块。
所述的步骤④的具体内容如下:
(1)针对采集的原始数据、分析的结果的字段,构建能存储所需数据的关系型数据库;
(2)按选定的时间片大小,把采集到的原始数据推送到数据分析模块,进行数据分析。
本发明具有以下有益效果:
1、先进性,可以在新型WiFi终端开启MAC地址隐私保护的前提下,对在WiFi终端进行分析。
2、可靠性,利用Probe Requst帧与终端信号强度之间的关联性来判别是否来自同一个终端,比利用单一MAC地址判断更可靠。
3、实用性:目前主流的WiFi手机终端开启了MAC地址随机化,在扫描WiFi时会发送随机MAC地址,影响基于WiFi终端MAC地址的应用,因此通过改善WiFi终端的基于ProbeRequest帧的被动WiFi采集方法具有实用性。
4、可扩展性,在不修改系统架构的前提下,能根据不同需求,将数据与其他应用进行整合。
附图说明
图1是本系统的结构方框图。
具体实施方式
下面结合附图对本发明创造做进一步详细说明。
本WiFi采集系统如图1所示包括数据采集模块、数据预处理模块、数据存储模块和数据分析模块,其交互关系是:单个数据预处理模块与多个数据采集模块依次交互,实现所有WiFi信道上的数据的获取;单个数据存储模块与多个数据预处理模块依次交互,实现WiFi数据的累积和存储;数据分析模块与数据存储模块循环交互,实现原始数据分析、分析结果累积。
数据采集模块:是一种WiFi信道的监听与解析方法:通过监听所有频段的WiFi通信,将WiFi信号转换成计算机能处理的数据,校验其合法性,并交由数据预处理模块。
数据预处理模块:是一种数据处理和输出方法:对一个地点采集到的数据,过滤出终端与接入点两者的MAC地址、接入点的SSID(Service Set Identifier,服务集标识,即无线接入点的名称),按阈值去除重复数据,并附加上时间戳、数据采集模块的编号,最后将结果发送给数据存储模块。
数据存储模块:是一种数据保存和获取方法:对于接收到的数据,使用高效的方法进行保存和再次提取。
数据分析模块:是一种数据分析方法:对于预处理后的数据,按时间片切割,在单个时间片内分析各个Probe Request帧与WiFi终端之间的关联性,将分析结果保存到数据存储模块。
工作机理如下:
首先,数据采集模块监听所有WiFi信道,解析出WiFi的数据包,交由数据预处理模块进行处理,从中提取出核心的信息,过滤掉重复、冗余的数据,附加上元数据后,保存到数据存储模块,待进一步分析处理。
然后,数据分析模块读取数据存储模块中的预处理后的数据,通过分析记录之间的相关性,计算出实际WiFi终端的数量,并将分析结果保存到数据存储模块中。
本终端探测方法由以下4个步骤组成。
步骤①
a、监听WiFi信道,解析信道上加载的所有WiFi数据包,将其转换成计算机能处理的数据结构;
b、将转换结果通过总线的方式,传递给数据预处理模块。
步骤②
a、数据预处理模块通过总线获取到所有WiFi信道上的数据包;
b、对获取到的数据包,根据WiFi协议的阶段,进行初步分析和过滤:
b.1、对于WiFi终端与AP(接入点)关联前所发出的数据包,仅记录下Probe Request帧里的SSID名称以及数据包信号强度,并将其标记为类型A;
b.2、对于WiFi终端与AP关联后所发出的数据包,记录下数据包里终端的MAC地址和信号强度,并将其标记为类型B;
b.3、对于其他数据包,全部舍弃。
对过滤的结果,按阈值去除重复的记录,然后附加上时间戳、数据采集模块编号,发送给数据存储模块。
步骤③
A、对于数据存储模块里的预处理后的数据,以时间切片的形式,按数据预处理模块的顺序,对该时间片内的数据,用以下步骤分析:
B.1、对于类型A的记录,首先统计出该时间片内所有出现过的SSID的名称,然后依次枚举出所有不足10个SSID名称的组合;
B.2、根据选定的SSID组合,在时间片内查找出带有其中任一SSID的Probe Request帧记录,然后对两组SSID的记录按时间向量的高斯距离最小的原则,选出相同数量的记录;
B.3、对于过滤出的记录,计算两两SSID之间Probe Request帧信号强度的关联性,如果关联性超过阈值,则判定这些两个SSID的Probe Request帧来自同一个WiFi终端,并将分析结果保存回数据存储模块;
C.1、在类型A的记录处理完后,继续处理类型B的记录,统计该时间片内出现的所有类型B记录内的MAC地址;
C.2、对于每一个类型B记录的MAC地址,计算与类型A终端的关联性;
C.3、根据选定WiFi终端的类型A记录、选定MAC地址的类型B记录,抽取出相同数量、且时间差最小的两组记录,然后计算这两组记录之间信号强度的相关性。如果相关性超过阈值,则判定选定的类型A的WiFi终端与类型B的MAC地址是同一个终端,并将分析结果保存到数据存储模块。
步骤④
i、针对采集的原始数据、分析的结果的特征,构建高效的数据结构来存储数据;
ii、按选定的时间片大小,把采集到的原始数据推送到数据分析模块,进行数据分析。
Claims (6)
1.一种基于探测请求帧的WiFi采集系统,其特征在于:包括数据采集模块、数据预处理模块、数据存储模块和数据分析模块,其中数据采集模块、数据预处理模块和数据存储模块顺序连接,数据存储模块和数据分析模块双向连接。
2.根据权利要求1所述的基于探测请求帧的WiFi采集系统的WiFi终端探测方法,其特征在于,包括下列步骤:
①数据采集模块通过监听所有频段的WiFi通信,将WiFi信号转换成计算机识别的数据,校验其合法性,并交由数据预处理模块;
②数据预处理模块对一个地点采集到的数据,过滤出终端、接入点两者的MAC地址、接入点的SSID信息,按阈值去除重复数据,并附加上时间戳、数据采集模块编号,最后将结果发送给数据存储模块;
③数据存储模块对于接收到的数据,使用关系型数据库进行保存和再次提取;
④数据分析模块对于预处理后的数据,按时间片切割,在单个时间片内分析各个SSID、MAC地址之间的关联性,将分析结果保存回数据存储模块。
3.根据权利要求2所述的基于探测请求帧的WiFi采集系统的WiFi终端探测方法,其特征在于,所述步骤①的具体过程如下:
1)监听WiFi信道,解析信道上加载的所有WiFi数据包,将其转换成计算机能识别的数据结构;
2)将转换结果通过总线的方式,传递给数据预处理模块。
4.根据权利要求2所述的基于探测请求帧的WiFi采集系统的WiFi终端探测方法,其特征在于,所述的步骤②的具体过程如下:
a、数据预处理模块通过总线获取到所有WiFi信道上的数据包;
b、对获取到的数据包,根据WiFi协议的阶段,进行初步分析和过滤:
b.1、对于WiFi终端与AP关联前所发出的数据包,仅记录下Probe Request帧里的SSID名称以及数据包信号强度,并将其标记为类型A;
b.2、对于WiFi终端与AP关联后所发出的数据包,记录下数据包里终端的MAC地址和信号强度,并将其标记为类型B;
b.3、对于其他数据包,全部舍弃;对过滤的结果,按阈值去除重复的记录,并附加上时间戳、数据采集模块编号,发送给数据存储模块,待进一步分析。
5.根据权利要求4所述的基于探测请求帧的WiFi采集系统的WiFi终端探测方法,其特征在于,所述的步骤③的具体内容如下:
A、对于数据存储模块里的预处理后的数据,以时间切片的形式,按数据预处理模块的顺序,对该时间片内的数据,用以下步骤分析:
B.1、对于类型A的记录,首先统计出该时间片内所有出现过的SSID的名称,然后依次枚举出所有不足10个SSID名称的组合;
B.2、根据选定的SSID组合,在时间片内过滤出带有其中任一SSID的Probe Request帧记录,然后对两组SSID的记录按时间向量的高斯距离最小的原则,选出相同数量的记录;
B.3、对于过滤出的记录,计算两两SSID之间Probe Request帧信号强度的关联性,如果关联性超过阈值,则判定这些两个SSID的Probe Request帧来自同一个WiFi终端,并将分析结果保存回数据存储模块;
C.1、在类型A的记录处理完后,继续处理类型B的记录,统计该时间片内出现的所有类型B记录内的MAC地址;
C.2、对于每一个类型B记录的MAC地址,计算与类型A终端的关联性;
C.3、根据选定WiFi终端的类型A记录、选定MAC地址的类型B记录,抽取出相同数量、且时间差最小的两组记录,然后计算这两组记录之间信号强度的相关性;如果相关性超过阈值,则判定选定的类型A的WiFi终端与类型B的MAC地址是同一个终端,并将分析结果保存到数据存储模块。
6.根据权利要求2所述的基于探测请求帧的WiFi采集系统的WiFi终端探测方法,其特征在于,所述的步骤④的具体内容如下:
(1)针对采集的原始数据、分析的结果的字段,构建能存储所需数据的关系型数据库;
(2)按选定的时间片大小,把采集到的原始数据推送到数据分析模块,进行数据分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811451097.2A CN109451486B (zh) | 2018-11-30 | 2018-11-30 | 基于探测请求帧的WiFi采集系统及WiFi终端探测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811451097.2A CN109451486B (zh) | 2018-11-30 | 2018-11-30 | 基于探测请求帧的WiFi采集系统及WiFi终端探测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109451486A true CN109451486A (zh) | 2019-03-08 |
CN109451486B CN109451486B (zh) | 2021-09-21 |
Family
ID=65555876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811451097.2A Active CN109451486B (zh) | 2018-11-30 | 2018-11-30 | 基于探测请求帧的WiFi采集系统及WiFi终端探测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109451486B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110536324A (zh) * | 2019-09-05 | 2019-12-03 | 山东一瓦信息技术有限公司 | 一种WiFi信号数据的采集和处理方法及其系统 |
CN111581199A (zh) * | 2020-05-08 | 2020-08-25 | 广东电网有限责任公司 | 一种智能数据分析系统及方法 |
CN111865996A (zh) * | 2020-07-24 | 2020-10-30 | 中国工商银行股份有限公司 | 数据检测方法、装置和电子设备 |
CN115988609A (zh) * | 2022-12-28 | 2023-04-18 | 北京数原数字化城市研究中心 | 一种设备归类方法、装置、电子设备及存储介质 |
CN116887339A (zh) * | 2023-09-07 | 2023-10-13 | 深圳中科爱讯科技有限公司 | 一种基于WiFi探针的实时客流统计系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102497667A (zh) * | 2011-12-20 | 2012-06-13 | 中国电信股份有限公司 | WiFi 应用聚焦区域的定位方法及系统 |
US20140050210A1 (en) * | 2010-09-13 | 2014-02-20 | Texas Instruments Incorporated | System and Method for Positioning |
CN104778642A (zh) * | 2015-03-20 | 2015-07-15 | 北京邮电大学 | 基于WiFi的校园用户数据处理方法、服务器和监测系统 |
CN106888424A (zh) * | 2015-12-16 | 2017-06-23 | 杭州海康威视数字技术股份有限公司 | 介质访问控制地址的采集方法、采集装置及网络摄像机 |
-
2018
- 2018-11-30 CN CN201811451097.2A patent/CN109451486B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140050210A1 (en) * | 2010-09-13 | 2014-02-20 | Texas Instruments Incorporated | System and Method for Positioning |
CN102497667A (zh) * | 2011-12-20 | 2012-06-13 | 中国电信股份有限公司 | WiFi 应用聚焦区域的定位方法及系统 |
CN104778642A (zh) * | 2015-03-20 | 2015-07-15 | 北京邮电大学 | 基于WiFi的校园用户数据处理方法、服务器和监测系统 |
CN106888424A (zh) * | 2015-12-16 | 2017-06-23 | 杭州海康威视数字技术股份有限公司 | 介质访问控制地址的采集方法、采集装置及网络摄像机 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110536324A (zh) * | 2019-09-05 | 2019-12-03 | 山东一瓦信息技术有限公司 | 一种WiFi信号数据的采集和处理方法及其系统 |
CN110536324B (zh) * | 2019-09-05 | 2022-08-12 | 山东一瓦信息技术有限公司 | 一种WiFi信号数据的采集和处理方法及其系统 |
CN111581199A (zh) * | 2020-05-08 | 2020-08-25 | 广东电网有限责任公司 | 一种智能数据分析系统及方法 |
CN111581199B (zh) * | 2020-05-08 | 2024-01-30 | 广东电网有限责任公司 | 一种智能数据分析系统及方法 |
CN111865996A (zh) * | 2020-07-24 | 2020-10-30 | 中国工商银行股份有限公司 | 数据检测方法、装置和电子设备 |
CN115988609A (zh) * | 2022-12-28 | 2023-04-18 | 北京数原数字化城市研究中心 | 一种设备归类方法、装置、电子设备及存储介质 |
CN115988609B (zh) * | 2022-12-28 | 2023-12-19 | 北京数原数字化城市研究中心 | 一种设备归类方法、装置、电子设备及存储介质 |
CN116887339A (zh) * | 2023-09-07 | 2023-10-13 | 深圳中科爱讯科技有限公司 | 一种基于WiFi探针的实时客流统计系统及方法 |
CN116887339B (zh) * | 2023-09-07 | 2023-11-28 | 深圳中科爱讯科技有限公司 | 一种基于WiFi探针的实时客流统计系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109451486B (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109451486A (zh) | 基于探测请求帧的WiFi采集系统及WiFi终端探测方法 | |
US10652265B2 (en) | Method and apparatus for network forensics compression and storage | |
Wang et al. | A smart home gateway platform for data collection and awareness | |
CN107623754B (zh) | 基于真伪MAC识别的WiFi采集系统及其方法 | |
CN106921637A (zh) | 网络流量中的应用信息的识别方法和装置 | |
WO2012106861A1 (zh) | 终端分布信息获取方法、数据获取装置以及通信系统 | |
CN106911523A (zh) | 移动互联网用户通过lte上网问题定位的方法和系统 | |
CN105306246B (zh) | 一种自动应答网络类投诉的方法、装置和服务器 | |
CN106326280B (zh) | 数据处理方法、装置及系统 | |
CN105978748A (zh) | 一种基于哈希节点的终端设备信息统计的方法及装置 | |
US20220103442A1 (en) | Internet of things operations monitoring system | |
CN111859127A (zh) | 消费数据的订阅方法、装置及存储介质 | |
CN104350488A (zh) | 用于资源受限主机的选择性数据冗余消除的系统和方法 | |
CN101562824A (zh) | 用户面分析的方法、装置及系统 | |
CN103426105B (zh) | 面向公共无线网络的广告信息推送方法及系统 | |
CN104202389A (zh) | 云环境下的存储空间和运行状态的监测方法及云存储系统 | |
CN111198806A (zh) | 一种基于服务开放平台的服务调用数据统计分析方法及系统 | |
CN105357071A (zh) | 一种网络复杂流量识别方法及识别系统 | |
Qian et al. | Characterization of 3g data-plane traffic and application towards centralized control and management for software defined networking | |
CN104349339A (zh) | 移动智能终端Wi-Fi信号数据包的收集装置、方法及系统 | |
CN103024767A (zh) | 移动通信业务端到端性能评估方法及系统 | |
CN115766471B (zh) | 一种基于组播流量的网络业务质量分析方法 | |
CN114679318B (zh) | 一种高速网络中轻量级的物联网设备识别方法 | |
KR102069095B1 (ko) | 에너지 효율 와이파이 인원 계수 시스템 및 방법 | |
US11528211B2 (en) | Data inspection system for inspecting operating situations of multiple IoT devices in a plurality of target IoT systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |