CN109246685B - 基于mac地址的客流量统计方法、设备及存储介质 - Google Patents

基于mac地址的客流量统计方法、设备及存储介质 Download PDF

Info

Publication number
CN109246685B
CN109246685B CN201811446366.6A CN201811446366A CN109246685B CN 109246685 B CN109246685 B CN 109246685B CN 201811446366 A CN201811446366 A CN 201811446366A CN 109246685 B CN109246685 B CN 109246685B
Authority
CN
China
Prior art keywords
mac address
random
set time
random mac
mac addresses
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811446366.6A
Other languages
English (en)
Other versions
CN109246685A (zh
Inventor
李娟�
杨仁凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruijie Networks Co Ltd
Original Assignee
Ruijie Networks Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ruijie Networks Co Ltd filed Critical Ruijie Networks Co Ltd
Priority to CN201811446366.6A priority Critical patent/CN109246685B/zh
Publication of CN109246685A publication Critical patent/CN109246685A/zh
Application granted granted Critical
Publication of CN109246685B publication Critical patent/CN109246685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/22Processing or transfer of terminal data, e.g. status or physical capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W8/00Network data management
    • H04W8/22Processing or transfer of terminal data, e.g. status or physical capabilities
    • H04W8/24Transfer of terminal data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/60Types of network addresses
    • H04L2101/618Details of network addresses
    • H04L2101/622Layer-2 addresses, e.g. medium access control [MAC] addresses

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请实施例提供一种基于MAC地址的客流量统计方法、设备及存储介质。在本实施例中,针对设定时间内从业务场景中探测到的多个MAC地址,从中识别出随机MAC地址,并结合业务场景内用户在该设定时间内的行为规律,从识别出的随机MAC地址中识别出来自不同终端设备的随机MAC地址,进而统计客流量时,可将探测到的来自不同终端设备的随机MAC地址纳入统计范围,提升了客流量统计的准确性。

Description

基于MAC地址的客流量统计方法、设备及存储介质
技术领域
本申请涉及无线通信技术领域,尤其涉及一种基于MAC地址的客流量统计方法、设备及存储介质。
背景技术
目前,客流量已经成为各大商家进行有效商业管理的数据基础,逐渐受到各商家的重视。例如,基于客流量,商铺可在客流量高峰期增加工作人员,提升服务质量;例如,基于客流量,商场可对商铺的铺位进行合理规划,以提高销售量;再例如,基于客流量,商场可合理安排维护人员以及安保人员,以预防因客流量较大引起的突发事件。
现有技术通常采用的客流量统计方法主要通过WiFi(WIreless-Fidelity,无线保真技术)实现。这种方法需要获取处于WiFi环境下的终端设备的MAC地址(Media AccessContro,硬件地址),并基于获取到的MAC地址的数量实现客流量的统计。
但是,针对一些终端设备而言,为了保证数据安全性,当其处于WiFi环境中且未连接到WiFi热点的时候,向外广播的是终端设备随机生成的随机MAC地址而不是真实MAC地址,该随机MAC地址将导致客流量统计结果偏离真实客流量。因此,一种解决方案有待提出。
发明内容
本申请实施例提供一种基于MAC地址的客流量统计方法、设备及存储介质,用以提升客流量统计的准确率。
本申请实施例供一种基于MAC地址的客流量统计方法,包括:获取在设定时间内从业务场景中探测到的多个MAC地址;从所述多个MAC地址中识别出至少一个随机MAC地址;结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量;根据所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量。
进一步可选地,还包括:从所述多个MAC地址中识别出至少一个真实MAC地址;根据所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量,包括:根据所述至少一个真实MAC地址的数量以及所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量。
进一步可选地,从所述多个MAC地址中识别出至少一个随机MAC地址,包括:将所述多个MAC地址的前缀分别与组织唯一标识符OUI提供的MAC地址的前缀进行匹配;将在所述OUI提供的MAC地址的前缀中,未匹配到前缀的MAC地址作为预估随机MAC地址;从所述预估随机MAC地址中,确定末位字节与真实MAC地址末位字节的编码规律不符的MAC地址作为随机MAC地址。
进一步可选地,结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量,包括:确定所述设定时间内终端设备应当满足的运动距离阈值;根据已知的终端设备发出MAC地址的时间规律和所述设定时间内终端设备应当满足的运动距离阈值,确定所述至少一个随机MAC地址所属的终端设备的数量。
进一步可选地,确定所述设定时间内终端设备应当满足的运动距离阈值,包括:若所述设定时间内探测到的所述多个MAC地址包含至少一个真实MAC地址,则根据所述设定时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到所述设定时间内终端设备应当满足的运动距离阈值;若所述设定时间内探测到的所述多个MAC地址不包含真实MAC地址,则根据历史时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到所述设定时间内终端设备应当满足的运动距离阈值。
进一步可选地,根据已知的终端设备发出MAC地址的时间规律和所述设定时间内终端设备应当满足的运动距离阈值,确定所述至少一个随机MAC地址所属的终端设备的数量,包括:根据所述终端设备发出MAC地址的时间规律,将所述至少一个随机MAC地址中活动时间范围存在交叉的随机MAC地址划分到不同的聚类簇,其中,同一聚类簇中的随机MAC地址的活动时间范围不交叉,所述终端设备发出MAC地址的时间规律是指任一终端设备在同一时刻只能发出一个MAC地址;判断所述至少一个随机MAC地址中除被划分到已有的聚类簇的随机MAC地址之外是否存在剩余随机MAC地址;若存在剩余随机MAC地址,则针对剩余随机MAC地址中的第一随机MAC地址,计算所述第一随机MAC地址与已有的聚类簇中的随机MAC地址之间的运动距离,以及在所述运动距离大于所述设定时间内终端设备应当满足的运动距离阈值时,将所述第一随机MAC地址划分至新的聚类簇,在所述运动距离小于或等于所述设定时间内终端设备应当满足的运动距离阈值时,将所述第一随机MAC地址划分至已有的聚类簇,并重复执行所述判断所述至少一个随机MAC地址中除被划分到已有的聚类簇的随机MAC地址之外是否存在剩余随机MAC地址的步骤;若不存在剩余随机MAC地址,则根据已有的聚类簇的数量,确定所述至少一个随机MAC地址所属的终端设备的数量。
进一步可选地,计算所述第一随机MAC地址与已有的聚类簇中的随机MAC地址之间的运动距离,包括:针对已有的聚类簇中的第一聚类簇,获取所述第一随机MAC地址对应的信号强度特征向量和所述第一聚类簇包含的M个随机MAC地址各自对应的信号强度特征向量,M为正整数;分别计算所述第一聚类簇包含的M个随机MAC地址各自对应的信号强度特征向量和所述第一随机MAC地址对应的信号强度特征向量之间的欧几里得距离,得到M个欧几里得距离;计算所述M个欧几里得距离的均值,作为所述第一随机MAC地址与所述第一聚类簇中的随机MAC地址之间的运动距离;或者,分别将所述M个欧几里得距离,作为所述第一随机MAC地址与所述第一聚类簇中的随机MAC地址之间的运动距离。
进一步可选地,根据所述设定时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到所述设定时间内终端设备应当满足的运动距离阈值,包括:获取所述至少一个真实MAC地址各自对应的至少一个信号强度特征向量;根据所述至少一个真实MAC地址各自对应的至少一个信号强度特征向量,计算所述至少一个真实MAC地址各自对应的运动距离阈值;将所述至少一个真实MAC地址各自对应的运动距离阈值的均值,作为所述设定时间内终端设备应当满足的运动距离阈值。
进一步可选地,根据所述至少一个真实MAC地址各自对应的至少一个信号强度特征向量,计算所述至少一个真实MAC地址各自对应的运动距离阈值,包括:针对所述至少一个真实MAC地址中的第一真实MAC地址,按照所述第一真实MAC地址对应的至少一个信号强度特征向量对应的探测时间信息,对所述至少一个信号强度特征向量进行排序;计算所述至少一个信号强度特征向量中相邻两两信号强度特征向量之间的欧几里得距离,或者,计算隔行的两两信号强度特征向量之间的欧几里得距离;将所述相邻两两信号强度特征向量之间的欧几里得距离的均值,或者,所述隔行的两两N维信号强度特征向量之间的欧几里得距离的均值,作为所述第一真实MAC地址的运动距离阈值。
进一步可选地,在从所述多个MAC地址中识别出至少一个随机MAC地址之前,还包括:对从所述设定时间内从业务场景中探测到的多个MAC地址对应的信号强度数据,执行数据飘动清洗操作和/或数据缺失值补充操作。
本申请实施例还提供一种基于MAC地址的客流量统计装置,包括:探测模块,用于获取在设定时间内从业务场景中探测到的多个MAC地址;第一识别模块,用于从所述多个MAC地址中识别出至少一个随机MAC地址;第二识别模块,用于结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量;统计模块,用于根据所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量。
本申请实施例还提供一种电子设备,包括:处理器和存储器;其中,所述存储器用于存储一条或多条计算机指令;所述处理器,具体用于:执行所述一条或多条计算机指令,以用于:通过所述通信组件获取在设定时间内从业务场景中探测到的多个MAC地址;从所述多个MAC地址中识别出至少一个随机MAC地址;结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量;根据所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,所述计算机程序被执行时能够实现本申请实施例提供的基于MAC地址的客流量统计方法中的步骤。
在本申请实施例中,针对设定时间内从业务场景中探测到的多个MAC地址,从中识别出随机MAC地址,并结合业务场景内用户在该设定时间内的行为规律,从识别出的随机MAC地址中识别出来自不同终端设备的随机MAC地址,进而统计客流量时,可将探测到的来自不同终端设备的随机MAC地址纳入统计范围,提升了客流量统计的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一示例性实施例提供的客流量统计系统的结构示意图;
图2为本申请一示例性实施例提供的基于MAC地址的客流量统计方法的流程示意图;
图3为本申请另一示例性实施例提供的基于MAC地址的客流量统计方法的流程示意图;
图4为本申请一示例性实施例提供的确定至少一个随机MAC地址所属的终端设备的数量的方法流程示意图;
图5为本申请一示例性实施例提供的基于MAC地址的客流量统计装置的结构示意图;
图6为本申请一示例性实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对现有技术中,某些终端设备处于WiFi环境中但未连接到WiFi热点时,向外广播随机MAC地址而不是真实MAC地址,进而导致基于MAC地址统计出的客流量偏离真实客流量的技术问题,本申请实施例提供了一种解决方案,在该解决方案中,针对设定时间内从业务场景中探测到的多个MAC地址,从中识别出随机MAC地址,并结合业务场景内用户在该设定时间内的行为规律,从识别出的随机MAC地址中识别出来自不同终端设备的随机MAC地址,进而统计客流量时,可将探测到的来自不同终端设备的随机MAC地址纳入统计范围,提升了客流量统计的准确性。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本申请一示例性实施例提供的客流量统计系统的结构示意图,如图1所示,该客流量统计系统100包括定位设备10以及服务器20。图1中还示意了终端设备,终端设备未连接无线网络时,通常通过广播自身的探测请求来实施主动扫描,以请求附近的无线网络热点能够识别到它们。
在客流量统计系统100中,定位设备10部署在业务场景中,用于捕获位于业务场景内的终端设备广播出的探测请求,生成关于终端设备的定位数据并将定位数据发送至服务器20。其中,业务场景可包括任何需要统计客流量的场景,例如商场、景点、会馆、展览馆等场景。通常,在业务场景中可部署多个定位设备10,以避免出现探测死角进而导致最终客流量统计结果出现较大偏差。例如,当商场包含四层楼时,可在每层楼都部署至少一个定位设备10。位于业务场景内的终端设备,可包括用户的手机、电脑、智能穿戴设备等等。
实际中,定位设备10可实现为AP(WirelessAccessPoint,无线访问接入点)。通常,当终端设备位于AP的覆盖范围内时,可通过广播自身的探测请求来实施主动扫描,以请求附近的AP能够识别到他们。AP可探测到终端设备广播出的探测请求,生成定位数据并发送至服务器20。
在客流量统计系统100中,服务器20主要用于接收定位设备10发出的定位数据,从该定位数据中获取到多个MAC地址,并从多个MAC地址中识别出至少一个随机MAC地址;接着,结合业务场景内用户在该设定时间内的行为规律,从至少一个随机MAC地址中识别出来自不同终端设备的随机MAC地址,并根据该至少一个随机MAC地址所属的终端设备的数量,统计设定时间内该业务场景中的客流量。实际中,服务器20可实现为LBS(Location BasedService,基于位置的服务)服务器。
在本实施例中,定位设备10和服务器20之间的可采用有线通信方式无线通信方式进行通信,进而定位设备10可将探测到的MAC地址发送至服务器20。其中,无线通信方式包括蓝牙、ZigBee、红外线、WiFi(WIreless-Fidelity,无线保真技术)等短距离通信方式,也包括LORA等远距离无线通信方式,还可包括基于移动网络的无线通信方式。其中,当通过移动网络通信连接时,移动网络的网络制式可以为2G(GSM)、2.5G(GPRS)、3G(WCDMA、TD-SCDMA、CDMA2000、UTMS)、4G(LTE)、4G+(LTE+)、WiMax等中的任意一种。
可选地,在一些示例性的实施方式中,定位设备10向服务器20发送的定位数据包含定位设备10所在的位置信息、探测到的MAC地址、探测到该MAC地址的探测时间、探测到该MAC地址的信号强度。
通常,定位数据以定位记录的形式存储在服务器20处,一条典型的记录可如下所示:
{"floor_id":4,"aptime":"2018-02-0609:04:59","bssidRssi":"00749c083fd5,-59,2;","isAssociate":2,"mac":"0a749c856be7"}
该记录包含5个字段,分别为:floor_id(定位设备所在的楼层)、aptime(探测到MAC地址的探测时间)、bssidRssi(探测到该MAC地址的信号强度)、isAssociate(是否关联)、mac(探测到的MAC地址)。
针对一终端设备而言,当业务场景内部署有多个定位设备10时,多个定位设备10可在同一时刻探测到该终端设备的定位数据。也就是说,存在探测时间相同且MAC地址相同的多条定位记录。
基于此,针对一个MAC地址,服务器20可获取其在同一探测时刻被多个定位设备探测到时的信号强度,并可将其在同一探测时刻被多个定位设备探测到时的信号强度作为元素,生成该MAC地址在该探测时刻对应的信号强度特征向量。例如,当业务场景中部署有N个定位设备时,可根据N个定位设备在T时刻探测到某一MAC地址时的定位数据,生成该MAC地址在T时刻对应的N维信号强度特征向量,N为正整数。
需要说明的是,不同的N维信号强度特征向量中,相同位置的元素对应的定位设备相同,以便于后续计算。例如,当客流量统计系统部署有5个定位设备AP1~AP5时,第i个N维信号强度特征向量
Figure BDA0001885802550000081
可表示为[Ri1、Ri2、Ri3、Ri4、Ri5],其中Ri1~Ri5分别由定位设备AP1~AP5探测到,i为正整数。
需要说明的是,在上述各实施例中,在生成MAC地址对应的N维信号强度特征向量之前,服务器20还可对从定位数据包含的信号强度数据,执行数据飘动清洗操作和/或数据缺失值补充操作。其中,数据飘动清洗操作,主要根据信号的强度变化规律,从信号强度数据中去除异常值。数据缺失值补充操作,主要对信号强度变化缺失的部分进行补充。
在实际中,由于信号传播距离有限,且信号在传播的过程中存在衰减,使得客流量统计系统中部署的多个定位设备并非均能够探测到同一终端设备。也就是说,同一MAC地址在同一探测时刻对应的信号强度存在缺失值。可选地,在本实施例中,以定位设备能够探测到的最小信号强度值对这些缺失值进行补充,以确保每个信号强度特征向量的长度相同。可选地,在一些实施例中,可以信号强度为-75来补充缺失值。
通常,客流量统计系统中,定位设备10以较小的探测周期对终端设备广播出的探测请求进行探测,以准确地捕捉到终端设备的运动行为的持续性特征。那么,在设定时间段内,服务器20可接收到每个定位设备发送的至少一个定位数据包,每个定位数据包对应不同的探测时刻。可选地,定位设备10的探测周期为毫秒(ms)级别,在设定时间段内,服务器20可接收到每个定位设备发送的多个定位数据包。也就是说,针对一MAC地址,服务器20可生成该MAC地址在不同探测时刻对应的至少一个N维信号强度特征向量。
在图1所示的客流量统计系统的基础上,本申请实施例可实现基于MAC地址对客流量进行统计的方法,以下将具体进行说明。
图2为本申请一示例性实施例提供的基于MAC地址的客流量统计方法的流程示意图,如图2所示,该方法包括:
步骤201、获取在设定时间内从业务场景中探测到的多个MAC地址。
步骤202、从该多个MAC地址中识别出至少一个随机MAC地址。
步骤203、结合该业务场景内用户在该设定时间内的行为规律,识别该至少一个随机MAC地址所属的终端设备的数量。
步骤204、根据该至少一个随机MAC地址所属的终端设备的数量,统计该设定时间内该业务场景中的客流量。
在本实施例中,设定时间内从业务场景中探测到的多个MAC地址中,每个MAC地址由该业务场景内的一台终端设备发出。同一终端设备可发出真实MAC地址,也可发出随机MAC地址,也就是说,不同的MAC地址可能由同一台终端设备发出,也可能由不同的终端设备发出。
针对真实MAC地址而言,其所属的终端设备的数量即为真实MAC地址的数量。针对随机MAC地址而言,其所属的终端设备的数量可能小于随机MAC地址的数量。因此,为准确统计客流量,需要确定随机MAC地址所属的终端设备的数量。
在本实施例中,主要结合业务场景内用户在该设定时间内的行为规律,识别该至少一个随机MAC地址所属的终端设备的数量。
应当理解,针对业务场景内的终端设备而言,尽管其发出的MAC地址可能是变化的,但是其在空间范围内的运动行为是具有一定持续性特征的。在本实例中,将终端设备在设定时间内的运动行为的持续性特征,作为用户在设定时间内的行为规律。基于该行为规律,可寻找发出该至少一个随机MAC地址且与该行为规律匹配的终端设备,作为该至少一个随机MAC地址所属的终端设备。
通常,在业务场景中,不同时间段内用户的行为规律不同。例如商场在上午9点至10点刚开始营业时,用户的行为规律为A;商场在中午12点至两点举办促销活动时,用户的行为规律为B。由于随机MAC地址所属的终端设备的数量主要基于用户的行为规律进行计算,因此,在计算不同时间段内探测到的随机MAC地址所属的终端设备时,选取合适的行为规律作为计算依据,可提升随机MAC地址对应的客流量计算结果的准确性。
在本实施例中,可对需要统计客流量的时段进行划分,得到设定时间。针对每个设定时间,在计算该设定时间内探测到的随机MAC地址所属的终端设备时,将该设定时间段内用户的行为规律作为计算依据。例如,计算上午9点至10点内在商场内探测到的随机MAC地址所属的终端设备时,可将商场在上午9点至10点对应的用户的行为规律A作为计算依据。
其中,设定时间,可以是1小时、30分钟或者5分钟等,在实际中可根据需求进行设置。通常,在客流量高峰期时,可以较小值设置该设定时间;在非客流量高峰期时,可以较大值设置该设定时间。
在本实施例中,针对设定时间内从业务场景中探测到的多个MAC地址,从中识别出随机MAC地址,并结合业务场景内用户在该设定时间内的行为规律,从识别出的随机MAC地址中识别出来自不同终端设备的随机MAC地址,进而统计客流量时,可同时将探测到的来自不同终端设备的随机MAC地址纳入统计范围,提升了客流量统计的准确性。
在一些示例性实施例中,业务场景中用户在设定时间内的行为规律,可包括终端设备发出MAC地址的时间规律和设定时间内终端设备应当满足的运动距离阈值。以下将结合图3进行进一步说明。
图3为本申请另一示例性实施例提供的基于MAC地址的客流量统计方法的流程示意图,如图3所示,该方法包括:
步骤301、获取在设定时间内从业务场景中探测到的多个MAC地址,每个MAC地址由该业务场景内一台终端设备发出。
步骤302、从该多个MAC地址中识别出至少一个随机MAC地址。
步骤303、确定该设定时间内终端设备应当满足的运动距离阈值。
步骤304、根据已知的终端设备发出MAC地址的时间规律和该设定时间内终端设备应当满足的运动距离阈值,确定该至少一个随机MAC地址所属的终端设备的数量。
步骤305、根据该至少一个随机MAC地址所属的终端设备的数量,统计该设定时间内该业务场景中的客流量。
在步骤302中,从该多个MAC地址中识别出至少一个随机MAC地址的一种方式可包括:根据组织唯一标识符(Organizationally unique identifier,OUI)对随机MAC地址进行初步筛选,再结合真实MAC地址的编码特征对初步筛选的结果进行误判分析。
MAC地址的前缀(前三个字节)由IEEE的注册管理机构分配,称为OUI,每个设备的OUI在全球具有唯一性。可选地,根据OUI对随机MAC地址进行初步筛选时,将该多个MAC地址的前缀分别与OUI提供的MAC地址的前缀进行匹配;将在OUI提供的MAC地址的前缀中,未匹配到前缀的MAC地址作为预估随机MAC地址,将在该OUI提供的MAC地址的前缀中匹配到前缀的MAC地址作为真实MAC地址。
预估随机MAC地址中,可能包含随机MAC地址,也可能包含前缀未被记录在OUI中的真实MAC地址。接下来,可对随机MAC地址进行误判分析。可选地,可从该预估随机MAC地址中,确定末位字节与真实MAC地址末位字节的编码规律不符的MAC地址作为随机MAC地址,并确定末位字节与真实MAC地址末位字节的编码规律相符合的MAC地址作为真实MAC地址。通常,真实MAC地址末位字节对应的二进制编码的最末两位为01,也就是说,若一预估随机MAC地址的末位字节对应的二进制编码的最末两位不为01,那么可认为该预估随机MAC地址为真实MAC地址。基于上述步骤,可从该多个MAC地址中识别出至少一个随机MAC地址。
确定至少一个随机MAC地址后,可基于业务场景中用户在设定时间段内的行为规律,识别该至少一个随机MAC地址所属的终端设备的数量。
可选地,在本实施例中,业务场景内用户在设定时间段内的行为规律,可表现为终端设备发出MAC地址的时间规律,以及设定时间内终端设备应当满足的运动距离阈值。
其中,终端设备发出MAC地址的时间规律可表现为:终端设备在一个时刻只能发出一个MAC地址。也就是说,若两个MAC地址的活动时间范围存在交叉,那么这两个MAC地址一定是不同终端设备发出的。应当理解,MAC地址的活动时间范围,指的是探测到该MAC地址的时间范围,后续不再重复解释。
其中,设定时间内终端设备应当满足的运动距离阈值,可基于步骤303进行计算。
在一些示例性实施方式中,若设定时间内探测到的多个MAC地址包含至少一个真实MAC地址,则设定时间内终端设备应当满足的运动距离阈值,可根据该设定时间内探测到的至少一个真实MAC地址的信号强度数据计算得到。
在另一些示例性实施例中,若设定时间内探测到的多个MAC地址不包含真实MAC地址,则设定时间内终端设备应当满足的运动距离阈值,可根据历史时间内探测到的至少一个真实MAC地址的信号强度数据计算得到。
可选地,在一些场景下,历史时间,可以是该设定时间之前、且与该设定时间的间隔较小的时间。当历史时间与设定时间的间隔较小时,可认为历史时间内终端设备应当满足的运动距离阈值与该设定时间内终端设备应当满足的运动距离阈值较为接近。可选地,在另一些场景下,历史时间,还可以为:前n(n=1,2,3…)天内与该设定时间相同的时间。例如,设定时间为10月5日的12:00~13:00,则历史时间可以为10月4日的12:00~13:00或者10月3日的12:00~13:00等,不再赘述。
以下将以该设定时间内探测到的至少一个真实MAC地址为例,对计算设定时间内终端设备应当满足的运动距离阈值的可选实施方式将进行具体说明。
首先,获取该至少一个真实MAC地址各自对应的至少一个信号强度特征向量。在图1对应的客流量统计系统中,服务器可获取设定时间内探测到的多个MAC地址对应的信号强度特征向量。基于此,在从探测到的多个MAC地址中区分出真实MAC地址和随机MAC地址之后,可从多个MAC地址对应的信号强度特征向量中,筛选出真实MAC地址对应的至少一个信号强度特征向量。
接着,根据该至少一个真实MAC地址各自对应的至少一个信号强度特征向量,计算该至少一个真实MAC地址各自对应的运动距离阈值。
在本步骤中,可选地,针对该至少一个真实MAC地址中的第一真实MAC地址,可按照该第一真实MAC地址对应的至少一个信号强度特征向量对应的探测时间,对该至少一个信号强度特征向量进行排序;例如,按照时间升序排序,或者按照时间降序排序。其中,第一真实MAC地址为该至少一个真实MAC地址中的任一真实MAC地址。
接着,计算该至少一个信号强度特征向量中相邻两两信号强度特征向量之间的欧几里得距离,或者,计算隔行的两两信号强度特征向量之间的欧几里得距离。
例如,第一真实MAC地址,其对应的5个信号强度特征向量按照探测时间顺序进行排序的结果为:
Figure BDA0001885802550000131
则,可依次计算
Figure BDA0001885802550000132
Figure BDA0001885802550000133
之间的欧几里得距离、
Figure BDA0001885802550000134
Figure BDA0001885802550000135
之间的欧几里得距离、
Figure BDA0001885802550000136
Figure BDA0001885802550000137
之间的欧几里得距离、
Figure BDA0001885802550000138
Figure BDA0001885802550000139
之间的欧几里得距离。或者,计算
Figure BDA00018858025500001310
Figure BDA00018858025500001311
之间的欧几里得距离、
Figure BDA00018858025500001312
Figure BDA00018858025500001313
之间的欧几里得距离、
Figure BDA00018858025500001314
Figure BDA00018858025500001315
之间的欧几里得距离。
Figure BDA00018858025500001316
为例,计算两个信号强度特征向量之间的欧几里得距离,可采用如下公式:
Figure BDA0001885802550000141
其中,d表示欧几里得距离,K表示每个信号强度特征向量包含的元素的个数,Rim表示
Figure BDA0001885802550000142
的第i个元素,Rin表示
Figure BDA0001885802550000143
的第i个元素。
接着,将该相邻两两信号强度特征向量之间的欧几里得距离的均值,或者,该隔行的两两信号强度特征向量之间的欧几里得距离的均值,作为该第一真实MAC地址的运动距离阈值。
最后,将该至少一个真实MAC地址各自对应的运动距离阈值的均值,作为该设定时间内终端设备应当满足的运动距离阈值。该运动距离阈值,体现了业务场景内,真实MAC地址所属的终端设备的运动行为的持续性特征。
接着,执行步骤304,根据已知的终端设备发出MAC地址的时间规律和该设定时间内终端设备应当满足的运动距离阈值,计算该至少一个随机MAC地址所属的终端设备的数量,以对该至少一个随机MAC地址对应的客流量进行统计。
可选地,该步骤可基于如下的实施方式实现:根据终端设备发出MAC地址的时间规律和该设定时间内终端设备应当满足的运动距离阈值,确定该至少一个随机MAC地址所属的终端设备的数量。如图4所示,该实施方式可包括如下的步骤:
步骤3041、根据终端设备发出MAC地址的时间规律,将该至少一个随机MAC地址中活动时间范围存在交叉的随机MAC地址划分到不同的聚类簇,其中,同一聚类簇中的随机MAC地址的活动时间范围不交叉。
其中,终端设备发出MAC地址的时间规律是指任一终端设备在同一时刻只能发出一个MAC地址,若两个MAC地址的运动时间范围存在交叉,那么这两个MAC地址一定不属于同一终端设备。基于此,可从该至少一个随机MAC地址中,选出活动时间范围存在交叉的随机MAC地址划分到不同的聚类簇。例如,若多个随机MAC地址中,有3个随机MAC地址的活动时间范围存在交叉,则可将这3个随机MAC地址分别划分到三个聚类簇中。接着,执行步骤3042。
步骤3042、判断该至少一个随机MAC地址中除被划分到已有的聚类簇的随机MAC地址之外,是否存在剩余随机MAC地址;若存在,执行步骤3043;若不存在,执行步骤3044。
步骤3043、针对剩余随机MAC地址中的第一随机MAC地址,计算该第一随机MAC地址与已有的聚类簇中的随机MAC地址之间的运动距离,以及在该运动距离大于该设定时间内终端设备应当满足的运动距离阈值时,将该第一随机MAC地址划分至新的聚类簇,在该运动距离小于或等于该设定时间内终端设备应当满足的运动距离阈值时,将该第一随机MAC地址划分至已有的聚类簇,并重复执行步骤3042。其中,第一随机MAC地址为该至少一个随机MAC地址中的任一随机MAC地址。
可选地,在本步骤中,可根据该第一随机MAC地址对应的信号强度特征向量和每一个已有的聚类簇中的随机MAC地址对应的信号强度特征向量,计算该第一随机MAC地址与每一个已有的聚类簇中的随机MAC地址之间的运动距离。以下将以已有的聚类簇中的第一聚类簇为例,对计算该第一随机MAC地址与第一聚类簇中的随机MAC地址之间的运动距离的可选实施方式进行具体说明。其中,第一聚类簇为已有的聚类簇中的任一聚类簇。
可选地,可获取该第一随机MAC地址和该第一聚类簇包含的M个随机MAC地址各自对应的信号强度特征向量,M为正整数;接着,分别计算该第一聚类簇包含的M个随机MAC地址各自对应的信号强度特征向量和该第一随机MAC地址对应的信号强度特征向量之间的欧几里得距离,得到M个欧几里得距离。
在得到M个欧几里得距离之后,在一种实施方式中,可计算该M个欧几里得距离的均值,作为该第一随机MAC地址与该第一聚类簇中的随机MAC地址之间的运动距离;在这种实施方式中,当该M个欧几里得距离的均值大于设定时间内终端设备应当满足的运动距离阈值时,可认为第一随机MAC地址与第一聚类簇中的随机MAC地址之间的运动距离大于设定时间内终端设备应当满足的运动距离阈值;当该M个欧几里得距离的均值小于或等于设定时间内终端设备应当满足的运动距离阈值时,可认为第一随机MAC地址与第一聚类簇中的随机MAC地址之间的运动距离小于或等于设定时间内终端设备应当满足的运动距离阈值。
在另一种实施方式中,可直接将该M个欧几里得距离,作为该第一随机MAC地址与该第一聚类簇中的随机MAC地址之间的运动距离。在这种实施方式中,当该M个欧几里得距离均大于设定时间内终端设备应当满足的运动距离阈值时,可认为第一随机MAC地址与第一聚类簇中的随机MAC地址之间的运动距离大于设定时间内终端设备应当满足的运动距离阈值;当该M个欧几里得距离均小于或等于设定时间内终端设备应当满足的运动距离阈值时,可认为第一随机MAC地址与第一聚类簇中的随机MAC地址之间的运动距离小于或等于设定时间内终端设备应当满足的运动距离阈值。
若该第一随机MAC地址与某一个已有的聚类簇中的随机MAC地址之间的运动距离小于或者等于前述步骤计算得到的设定时间内终端设备应当满足的运动距离阈值,则可认为该第一随机MAC地址与该已有的聚类簇中的随机MAC地址属于同一个终端设备,并将该第一随机MAC地址划分到该已有的聚类簇中。若该第一随机MAC地址与每一个已有的聚类簇中的随机MAC地址之间的运动距离均大于前述步骤计算得到的设定时间内终端设备应当满足的运动距离阈值,则可认为该第一随机MAC地址与每一个已有的聚类簇中的随机MAC地址均不属于同一个终端设备,此时,可将该第一随机MAC地址划分到新的聚类簇中。若本步骤产生了新增的聚类簇,那么下一次执行步骤3042~3043时,已有的聚类簇包含该新增的聚类簇。
步骤3044、根据已有的聚类簇的数量,确定该至少一个随机MAC地址所属的终端设备的数量。
在本步骤中,已有的聚类簇中,任意两个聚类簇中的随机MAC地址均不属于同一终端设备,因此,可将已有的聚类簇的数量作为该至少一个随机MAC地址所属的终端设备的数量。
在这种实施方式中,基于一定不属于同一终端设备的随机MAC地址的信号强度特征向量对其他随机MAC地址进行聚类,进一步提升了最终聚类结果的准确性,并同时减少了聚类的计算量,提升了客流量统计效率。
在步骤305中,可选地,在确定该至少一个随机MAC地址所属的终端设备的数量之后,可根据该至少一个随机MAC地址所属的终端设备的数量,获取该设定时间内该业务场景中的客流量。
例如,在一些可能的应用场景中,设定时间内从业务场景中探测到的多个MAC地址中,可能包含真实MAC地址,本实施例可基于上述步骤203记载的方式,从探测到的多个MAC地址中识别出至少一个真实MAC地址;进而,在根据至少一个随机MAC地址所属的终端设备的数量,统计该设定时间内该业务场景中的客流量时,可根据探测到的该至少一个真实MAC地址的数量以及该至少一个随机MAC地址所属的终端设备的数量,统计设定时间内该业务场景中的客流量。可选的地,可将探测到的该至少一个真实MAC地址的数量和该至少一个随机MAC地址所属的终端设备的数量之和,作为该设定时间内该业务场景中的客流量。
又例如,在一些可能的应用场景中,业务场景内,除位于无线网络的覆盖范围内但未连接无线网络的终端设备之外,还包括已连接无线网络的终端设备。在这种场景中,除了探测到的多个MAC地址外,还可从终端设备发送的通信数据报文中,解析得到已连接无线网络的终端设备的真实MAC地址。基于此,可将解析得到的真实MAC地址的数量、探测到的该至少一个真实MAC地址的数量和该至少一个随机MAC地址所属的终端设备的数量之和,作为该设定时间内所该业务场景中的客流量,不再赘述。
在本实施例中,针对设定时间内从业务场景中探测到的多个MAC地址,从中识别出真实MAC地址和随机MAC地址,并结合业务场景内用户在该设定时间内的行为规律,从识别出的随机MAC地址中识别出来自不同终端设备的随机MAC地址,进而统计客流量时,可同时将探测到的真实MAC地址和来自不同终端设备的随机MAC地址纳入统计范围,提升了客流量统计的准确性。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤201至步骤204的执行主体可以为设备A;又比如,步骤201和202的执行主体可以为设备A,步骤203的执行主体可以为设备B;等等。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如201、202等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
除上述实施例记载的基于MAC地址进行客流量统计的方法之外,本申请是实施例还提供一种基于MAC地址的客流量统计装置,如图5所示,该装置包括:探测模块501、第一识别模块502、第二识别模块503、统计模块504。
其中,探测模块501,用于获取在设定时间内从业务场景中探测到的多个MAC地址;第一识别模块502,用于从所述多个MAC地址中识别出至少一个随机MAC地址;第二识别模块503,用于结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量;统计模块504,用于根据所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量。
进一步可选地,第一识别模块502,还用于:从该多个MAC地址中识别出至少一个真实MAC地址;统计模块504,在根据该至少一个随机MAC地址所属的终端设备的数量,统计该设定时间内该业务场景中的客流量时,具体用于:根据该至少一个真实MAC地址的数量以及该至少一个随机MAC地址所属的终端设备的数量,统计该设定时间内该业务场景中的客流量。
进一步可选地,第一识别模块502在从该多个MAC地址中识别出至少一个随机MAC地址时,具体用于:将该多个MAC地址的前缀分别与OUI提供的MAC地址的前缀进行匹配;将在该OUI提供的MAC地址的前缀中,未匹配到前缀的MAC地址作为预估随机MAC地址;从该预估随机MAC地址中,确定末位字节与真实MAC地址末位字节的编码规律不符的MAC地址作为随机MAC地址。
进一步可选地,第二识别模块503在结合该业务场景内用户在该设定时间内的行为规律,识别该至少一个随机MAC地址所属的终端设备的数量时,具体用于:确定该设定时间内终端设备应当满足的运动距离阈值;根据已知的终端设备发出MAC地址的时间规律和该设定时间内终端设备应当满足的运动距离阈值,确定该至少一个随机MAC地址所属的终端设备的数量。
进一步可选地,第二识别模块503在确定该设定时间内终端设备应当满足的运动距离阈值时,具体用于:若该设定时间内探测到的该多个MAC地址包含至少一个真实MAC地址,则根据该设定时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到该设定时间内终端设备应当满足的运动距离阈值;若该设定时间内探测到的该多个MAC地址不包含真实MAC地址,则根据历史时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到该设定时间内终端设备应当满足的运动距离阈值。
进一步可选地,第二识别模块503在根据该已知的终端设备发出MAC地址的时间规律和该设定时间内终端设备应当满足的运动距离阈值,确定该至少一个随机MAC地址所属的终端设备的数量时,具体用于:根据该终端设备发出MAC地址的时间规律,将该至少一个随机MAC地址中活动时间范围存在交叉的随机MAC地址划分到不同的聚类簇,其中,同一聚类簇中的随机MAC地址的活动时间范围不交叉;其中,终端设备发出MAC地址的时间规律是指任一终端设备在同一时刻只能发出一个MAC地址;判断该至少一个随机MAC地址中除被划分到已有的聚类簇的随机MAC地址之外是否存在剩余随机MAC地址;若存在剩余随机MAC地址,则针对剩余随机MAC地址中的第一随机MAC地址,计算该第一随机MAC地址与已有的聚类簇中的随机MAC地址之间的运动距离,以及在该运动距离大于该设定时间内终端设备应当满足的运动距离阈值时,将该第一随机MAC地址划分至新的聚类簇,在该运动距离小于或等于该设定时间内终端设备应当满足的运动距离阈值时,将该第一随机MAC地址划分至已有的聚类簇,并重复执行该判断该至少一个随机MAC地址中除被划分到已有的聚类簇的随机MAC地址之外是否存在剩余随机MAC地址的步骤;若不存在剩余随机MAC地址,则根据已有的聚类簇的数量,确定该至少一个随机MAC地址所属的终端设备的数量。
进一步可选地,第二识别模块503在计算该第一随机MAC地址与已有的聚类簇中的随机MAC地址之间的运动距离时,具体用于:针对已有的聚类簇中的第一聚类簇,获取该第一随机MAC地址对应的信号强度特征向量和该第一聚类簇包含的M个随机MAC地址各自对应的信号强度特征向量,M为正整数;分别计算该第一聚类簇包含的M个随机MAC地址各自对应的信号强度特征向量和该第一随机MAC地址对应的信号强度特征向量之间的欧几里得距离,得到M个欧几里得距离;计算该M个欧几里得距离的均值,作为该第一随机MAC地址与该第一聚类簇中的随机MAC地址之间的运动距离;或者,分别将所述M个欧几里得距离,作为所述第一随机MAC地址与所述第一聚类簇中的随机MAC地址之间的运动距离。
进一步可选地,第二识别模块503在根据该设定时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到该设定时间内终端设备应当满足的运动距离阈值时,具体用于:获取该至少一个真实MAC地址各自对应的至少一个信号强度特征向量;根据该至少一个真实MAC地址各自对应的至少一个信号强度特征向量,计算每一个真实MAC地址各自对应的运动距离阈值;将该至少一个真实MAC地址各自对应的运动距离阈值的均值,作为该设定时间内终端设备应当满足的运动距离阈值。
进一步可选地,第二识别模块503在根据该至少一个真实MAC地址各自对应的至少一个信号强度特征向量,计算该至少一个真实MAC地址各自对应的运动距离阈值时,具体用于:针对该至少一个真实MAC地址中的第一真实MAC地址,按照该第一真实MAC地址对应的至少一个信号强度特征向量对应的探测时间信息,对该至少一个信号强度特征向量进行排序;计算该至少一个信号强度特征向量中相邻两两信号强度特征向量之间的欧几里得距离,或者,计算隔行的两两信号强度特征向量之间的欧几里得距离;将该相邻两两信号强度特征向量之间的欧几里得距离的均值,或者,该隔行的两两N维信号强度特征向量之间的欧几里得距离的均值,作为该第一真实MAC地址的运动距离阈值。
进一步可选地,第一识别模块502在从该多个MAC地址中识别出至少一个随机MAC地址之前,还用于:对从该设定时间内从业务场景中探测到的多个MAC地址对应的信号强度数据,执行数据飘动清洗操作和/或数据缺失值补充操作。
上述基于MAC地址的客流量统计装置可执行本申请实施例所提供的基于MAC地址的客流量统计方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法,不再赘述。
上述实施例记载了基于MAC地址的客流量统计装置的模块结构及各模块的功能,实际中,该基于MAC地址的客流量统计装置可实现为一种电子设备,该电子设备可执行前述实施例记载的基于MAC地址的客流量统计方法。在一些实施例中,该电子设备可实现为图1该的客流量统计系统中的服务器,以下将结合附图进行具体说明。
图6是本申请一示例性实施例提供的电子设备的结构示意图,如图6所示,该电子设备包括:处理器601、存储器602和通信组件603;
其中,存储器601用于存储一条或多条计算机指令,并可被配置为存储其它各种数据以支持在电子设备上的操作。这些数据的示例包括用于在电子设备上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。
存储器601可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
处理器602,与存储器601耦合,具体用于:执行该一条或多条计算机指令,以用于:通过通信组件603获取在设定时间内从业务场景中探测到的多个MAC地址;从该多个MAC地址中识别出至少一个随机MAC地址;结合该业务场景内用户在该设定时间内的行为规律,识别该至少一个随机MAC地址所属的终端设备的数量;根据该至少一个随机MAC地址所属的终端设备的数量,统计该设定时间内该业务场景中的客流量。
进一步可选地,处理器602,还用于:从该多个MAC地址中识别出至少一个真实MAC地址;处理器602在根据该至少一个随机MAC地址所属的终端设备的数量,统计该设定时间内该业务场景中的客流量时,具体用于:根据该至少一个真实MAC地址的数量以及该至少一个随机MAC地址所属的终端设备的数量,统计该设定时间内该业务场景中的客流量。
进一步可选地,处理器602在从该多个MAC地址中识别出至少一个随机MAC地址时,具体用于:将该多个MAC地址的前缀分别与OUI提供的MAC地址的前缀进行匹配;将在该OUI提供的MAC地址的前缀中,未匹配到前缀的MAC地址作为预估随机MAC地址;从该预估随机MAC地址中,确定末位字节与真实MAC地址末位字节的编码规律不符的MAC地址作为随机MAC地址。
进一步可选地,处理器602在结合该业务场景内用户在该设定时间内的行为规律,识别该至少一个随机MAC地址所属的终端设备的数量时,具体用于:确定该设定时间内终端设备应当满足的运动距离阈值;根据已知的终端设备发出MAC地址的时间规律和该设定时间内终端设备应当满足的运动距离阈值,确定该至少一个随机MAC地址所属的终端设备的数量。
进一步可选地,处理器602在确定该设定时间内终端设备应当满足的运动距离阈值时,具体用于:若该设定时间内探测到的该多个MAC地址包含至少一个真实MAC地址,则根据该设定时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到该设定时间内终端设备应当满足的运动距离阈值;若该设定时间内探测到的该多个MAC地址不包含真实MAC地址,则根据历史时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到该设定时间内终端设备应当满足的运动距离阈值。
进一步可选地,处理器602在根据该已知的终端设备发出MAC地址的时间规律和该设定时间内终端设备应当满足的运动距离阈值,确定该至少一个随机MAC地址所属的终端设备的数量时,具体用于:根据该终端设备发出MAC地址的时间规律,将该至少一个随机MAC地址中活动时间范围存在交叉的随机MAC地址划分到不同的聚类簇,其中,同一聚类簇中的随机MAC地址的活动时间范围不交叉;其中,终端设备发出MAC地址的时间规律是指任一终端设备在同一时刻只能发出一个MAC地址;判断该至少一个随机MAC地址中除被划分到已有的聚类簇的随机MAC地址之外是否存在剩余随机MAC地址;若存在剩余随机MAC地址,则针对剩余随机MAC地址中的第一随机MAC地址,计算该第一随机MAC地址与已有的聚类簇中的随机MAC地址之间的运动距离,以及在该运动距离大于该设定时间内终端设备应当满足的运动距离阈值时,将该第一随机MAC地址划分至新的聚类簇,在该运动距离小于或等于该设定时间内终端设备应当满足的运动距离阈值时,将该第一随机MAC地址划分至已有的聚类簇,并重复执行该判断该至少一个随机MAC地址中除被划分到已有的聚类簇的随机MAC地址之外是否存在剩余随机MAC地址的步骤;若不存在剩余随机MAC地址,则根据已有的聚类簇的数量,确定该至少一个随机MAC地址所属的终端设备的数量。
进一步可选地,处理器602在计算该第一随机MAC地址与已有的聚类簇中的随机MAC地址之间的运动距离时,具体用于:针对已有的聚类簇中的第一聚类簇,获取该第一随机MAC地址对应的信号强度特征向量和该第一聚类簇包含的M个随机MAC地址各自对应的信号强度特征向量,M为正整数;分别计算该第一聚类簇包含的M个随机MAC地址各自对应的信号强度特征向量和该第一随机MAC地址对应的信号强度特征向量之间的欧几里得距离,得到M个欧几里得距离;计算该M个欧几里得距离的均值,作为该第一随机MAC地址与该第一聚类簇中的随机MAC地址之间的运动距离;或者,分别将所述M个欧几里得距离,作为所述第一随机MAC地址与所述第一聚类簇中的随机MAC地址之间的运动距离。
进一步可选地,处理器602在根据该设定时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到该设定时间内终端设备应当满足的运动距离阈值时,具体用于:获取该至少一个真实MAC地址各自对应的至少一个信号强度特征向量;根据该至少一个真实MAC地址各自对应的至少一个信号强度特征向量,计算每一个真实MAC地址各自对应的运动距离阈值;将该至少一个真实MAC地址各自对应的运动距离阈值的均值,作为该设定时间内终端设备应当满足的运动距离阈值。
进一步可选地,处理器602在根据该至少一个真实MAC地址各自对应的至少一个信号强度特征向量,计算该至少一个真实MAC地址各自对应的运动距离阈值时,具体用于:针对该至少一个真实MAC地址中的第一真实MAC地址,按照该第一真实MAC地址对应的至少一个信号强度特征向量对应的探测时间信息,对该至少一个信号强度特征向量进行排序;计算该至少一个信号强度特征向量中相邻两两信号强度特征向量之间的欧几里得距离,或者,计算隔行的两两信号强度特征向量之间的欧几里得距离;将该相邻两两信号强度特征向量之间的欧几里得距离的均值,或者,该隔行的两两N维信号强度特征向量之间的欧几里得距离的均值,作为该第一真实MAC地址的运动距离阈值。
进一步可选地,处理器602在从该多个MAC地址中识别出至少一个随机MAC地址之前,还用于:对从该设定时间内从业务场景中探测到的多个MAC地址对应的信号强度数据,执行数据飘动清洗操作和/或数据缺失值补充操作。
其中,通信组件603被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,该通信组件可基于近场通信(NFC)技术、射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
进一步可选地,本实施例提供的电子设备还包括电源组件604。电源组件604可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件,用于为电源组件所在设备的各种组件提供电力。
在本实施例中,针对设定时间内从业务场景中探测到的多个MAC地址,从中识别出真实MAC地址和随机MAC地址,并结合业务场景内用户在该设定时间内的行为规律,从识别出的随机MAC地址中识别出来自不同终端设备的随机MAC地址,进而统计客流量时,可同时将探测到的真实MAC地址和来自不同终端设备的随机MAC地址纳入统计范围,提升了客流量统计的准确性。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,该计算机程序被执行时能够实现本申请实施例提供的基于MAC地址的客流量统计方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (12)

1.一种基于媒体访问控制MAC地址的客流量统计方法,其特征在于,包括:
获取在设定时间内从业务场景中探测到的多个MAC地址;
从所述多个MAC地址中识别出至少一个随机MAC地址;
结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量;
根据所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量;
其中,结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量,包括:
确定所述设定时间内终端设备应当满足的运动距离阈值;
根据已知的终端设备发出MAC地址的时间规律和所述设定时间内终端设备应当满足的运动距离阈值,确定所述至少一个随机MAC地址所属的终端设备的数量。
2.根据权利要求1所述的方法,其特征在于,还包括:
从所述多个MAC地址中识别出至少一个真实MAC地址;
根据所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量,包括:
根据所述至少一个真实MAC地址的数量以及所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量。
3.根据权利要求1所述的方法,其特征在于,从所述多个MAC地址中识别出至少一个随机MAC地址,包括:
将所述多个MAC地址的前缀分别与组织唯一标识符OUI提供的MAC地址的前缀进行匹配;
将在所述OUI提供的MAC地址的前缀中,未匹配到前缀的MAC地址作为预估随机MAC地址;
从所述预估随机MAC地址中,确定末位字节与真实MAC地址末位字节的编码规律不符的MAC地址作为随机MAC地址。
4.根据权利要求3所述的方法,其特征在于,确定所述设定时间内终端设备应当满足的运动距离阈值,包括:
若所述设定时间内探测到的所述多个MAC地址包含至少一个真实MAC地址,则根据所述设定时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到所述设定时间内终端设备应当满足的运动距离阈值;
若所述设定时间内探测到的所述多个MAC地址不包含真实MAC地址,则根据历史时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到所述设定时间内终端设备应当满足的运动距离阈值。
5.根据权利要求4所述的方法,其特征在于,根据已知的终端设备发出MAC地址的时间规律和所述设定时间内终端设备应当满足的运动距离阈值,确定所述至少一个随机MAC地址所属的终端设备的数量,包括:
根据所述终端设备发出MAC地址的时间规律,将所述至少一个随机MAC地址中活动时间范围存在交叉的随机MAC地址划分到不同的聚类簇,其中,同一聚类簇中的随机MAC地址的活动时间范围不交叉,所述终端设备发出MAC地址的时间规律是指任一终端设备在同一时刻只能发出一个MAC地址;
判断所述至少一个随机MAC地址中除被划分到已有的聚类簇的随机MAC地址之外是否存在剩余随机MAC地址;
若存在剩余随机MAC地址,则针对剩余随机MAC地址中的第一随机MAC地址,计算所述第一随机MAC地址与已有的聚类簇中的随机MAC地址之间的运动距离,以及在所述运动距离大于所述设定时间内终端设备应当满足的运动距离阈值时,将所述第一随机MAC地址划分至新的聚类簇,在所述运动距离小于或等于所述设定时间内终端设备应当满足的运动距离阈值时,将所述第一随机MAC地址划分至已有的聚类簇,并重复执行所述判断所述至少一个随机MAC地址中除被划分到已有的聚类簇的随机MAC地址之外是否存在剩余随机MAC地址的步骤;
若不存在剩余随机MAC地址,则根据已有的聚类簇的数量,确定所述至少一个随机MAC地址所属的终端设备的数量。
6.根据权利要求5所述的方法,其特征在于,计算所述第一随机MAC地址与已有的聚类簇中的随机MAC地址之间的运动距离,包括:
针对已有的聚类簇中的第一聚类簇,获取所述第一随机MAC地址对应的信号强度特征向量和所述第一聚类簇包含的M个随机MAC地址各自对应的信号强度特征向量,M为正整数;
分别计算所述第一聚类簇包含的M个随机MAC地址各自对应的信号强度特征向量和所述第一随机MAC地址对应的信号强度特征向量之间的欧几里得距离,得到M个欧几里得距离;
计算所述M个欧几里得距离的均值,作为所述第一随机MAC地址与所述第一聚类簇中的随机MAC地址之间的运动距离;或者,分别将所述M个欧几里得距离,作为所述第一随机MAC地址与所述第一聚类簇中的随机MAC地址之间的运动距离。
7.根据权利要求4-6任一项所述的方法,其特征在于,根据所述设定时间内探测到的至少一个真实MAC地址的信号强度数据,分析得到所述设定时间内终端设备应当满足的运动距离阈值,包括:
获取所述至少一个真实MAC地址各自对应的至少一个信号强度特征向量;
根据所述至少一个真实MAC地址各自对应的至少一个信号强度特征向量,计算所述至少一个真实MAC地址各自对应的运动距离阈值;
将所述至少一个真实MAC地址各自对应的运动距离阈值的均值,作为所述设定时间内终端设备应当满足的运动距离阈值。
8.根据权利要求7所述的方法,其特征在于,根据所述至少一个真实MAC地址各自对应的至少一个信号强度特征向量,计算所述至少一个真实MAC地址各自对应的运动距离阈值,包括:
针对所述至少一个真实MAC地址中的第一真实MAC地址,按照所述第一真实MAC地址对应的至少一个信号强度特征向量对应的探测时间信息,对所述至少一个信号强度特征向量进行排序;
计算所述至少一个信号强度特征向量中相邻两两信号强度特征向量之间的欧几里得距离,或者,计算隔行的两两信号强度特征向量之间的欧几里得距离;
将所述相邻两两信号强度特征向量之间的欧几里得距离的均值,或者,所述隔行的两两N维信号强度特征向量之间的欧几里得距离的均值,作为所述第一真实MAC地址的运动距离阈值。
9.根据权利要求1-6任一项所述的方法,其特征在于,在从所述多个MAC地址中识别出至少一个随机MAC地址之前,还包括:
对从所述设定时间内从业务场景中探测到的多个MAC地址对应的信号强度数据,执行数据飘动清洗操作和/或数据缺失值补充操作。
10.一种基于MAC地址的客流量统计装置,其特征在于,包括:
探测模块,用于获取在设定时间内从业务场景中探测到的多个MAC地址;
第一识别模块,用于从所述多个MAC地址中识别出至少一个随机MAC地址;
第二识别模块,用于结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量;
其中,结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量,包括:
确定所述设定时间内终端设备应当满足的运动距离阈值;
根据已知的终端设备发出MAC地址的时间规律和所述设定时间内终端设备应当满足的运动距离阈值,确定所述至少一个随机MAC地址所属的终端设备的数量;
统计模块,用于根据所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量。
11.一种电子设备,其特征在于,包括:处理器、存储器和通信组件;
其中,所述存储器用于存储一条或多条计算机指令;
所述处理器,具体用于:执行所述一条或多条计算机指令,以用于:通过所述通信组件获取在设定时间内从业务场景中探测到的多个MAC地址;从所述多个MAC地址中识别出至少一个随机MAC地址;结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量;根据所述至少一个随机MAC地址所属的终端设备的数量,统计所述设定时间内所述业务场景中的客流量;
其中,结合所述业务场景内用户在所述设定时间内的行为规律,识别所述至少一个随机MAC地址所属的终端设备的数量,包括:
确定所述设定时间内终端设备应当满足的运动距离阈值;
根据已知的终端设备发出MAC地址的时间规律和所述设定时间内终端设备应当满足的运动距离阈值,确定所述至少一个随机MAC地址所属的终端设备的数量。
12.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述计算机程序被执行时能够实现权利要求1-9任一项所述的方法中的步骤。
CN201811446366.6A 2018-11-29 2018-11-29 基于mac地址的客流量统计方法、设备及存储介质 Active CN109246685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811446366.6A CN109246685B (zh) 2018-11-29 2018-11-29 基于mac地址的客流量统计方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811446366.6A CN109246685B (zh) 2018-11-29 2018-11-29 基于mac地址的客流量统计方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109246685A CN109246685A (zh) 2019-01-18
CN109246685B true CN109246685B (zh) 2021-08-17

Family

ID=65073793

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811446366.6A Active CN109246685B (zh) 2018-11-29 2018-11-29 基于mac地址的客流量统计方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109246685B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109951804B (zh) * 2019-02-26 2020-09-22 北京莱利时空科技有限公司 一种人流量估计方法及装置
CN112423236B (zh) * 2019-08-22 2022-06-14 腾讯科技(深圳)有限公司 终端设备识别方法、装置及存储介质
CN110545219A (zh) * 2019-09-25 2019-12-06 杭州安恒信息技术股份有限公司 工业资产的被动识别方法、装置和电子设备
US11526392B2 (en) * 2020-05-07 2022-12-13 Armis Security Ltd. System and method for inferring device model based on media access control address
CN112511973A (zh) * 2020-12-14 2021-03-16 每日互动股份有限公司 数据处理方法及装置、电子设备和计算机可读存储介质
CN114158031B (zh) * 2021-12-02 2023-08-22 深圳市共进电子股份有限公司 一种统计终端的方法、装置、路由器及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103634227A (zh) * 2012-08-20 2014-03-12 百度在线网络技术(北京)有限公司 一种基于用户数量的业务流量精确调度方法及装置
CN106211067A (zh) * 2016-06-30 2016-12-07 北京奇虎科技有限公司 一种基于终端的人流监控方法及装置
CN107396304A (zh) * 2017-06-29 2017-11-24 毛国强 基于智能手机的实时城市人口密度及人群流动估计方法
CN107766981A (zh) * 2017-10-24 2018-03-06 东南大学 基于站点WiFi的公交客流OD估计及短时预测方法
CN108012309A (zh) * 2017-11-28 2018-05-08 北京锐安科技有限公司 基于WiFi的人流量统计方法、装置及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7889737B2 (en) * 2005-12-02 2011-02-15 Texas Instruments Incorporated Locally administered MAC address based method for selectively and efficiently identifying enhanced version nodes of standards

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103634227A (zh) * 2012-08-20 2014-03-12 百度在线网络技术(北京)有限公司 一种基于用户数量的业务流量精确调度方法及装置
CN106211067A (zh) * 2016-06-30 2016-12-07 北京奇虎科技有限公司 一种基于终端的人流监控方法及装置
CN107396304A (zh) * 2017-06-29 2017-11-24 毛国强 基于智能手机的实时城市人口密度及人群流动估计方法
CN107766981A (zh) * 2017-10-24 2018-03-06 东南大学 基于站点WiFi的公交客流OD估计及短时预测方法
CN108012309A (zh) * 2017-11-28 2018-05-08 北京锐安科技有限公司 基于WiFi的人流量统计方法、装置及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于WiFi 嗅探数据的地铁网络客流分析技术;陈菁菁等;《城市轨道交通研究》;20180510(第5期);全文 *
客流量监测的WiFi嗅探网格化方法;佟慧姣等;《电 子 测 量 技 术》;20180423(第41卷第8期);全文 *

Also Published As

Publication number Publication date
CN109246685A (zh) 2019-01-18

Similar Documents

Publication Publication Date Title
CN109246685B (zh) 基于mac地址的客流量统计方法、设备及存储介质
US9408036B2 (en) Managing wireless beacon devices
US9258713B2 (en) Rogue wireless beacon device detection
CN109327856B (zh) 客流量统计方法、网络设备及存储介质
US8922344B2 (en) Detecting rogue radio frequency based tags based on locationing
US8305271B2 (en) Cuckoo hashing to store beacon reference data
US11151611B2 (en) Mobile device detection and tracking
CN107623754B (zh) 基于真伪MAC识别的WiFi采集系统及其方法
CN112040432A (zh) 一种移动终端用户类型识别的方法和装置
US10459066B2 (en) Self-adaptive system and method for robust Wi-Fi indoor localization in large public site
WO2020114131A1 (zh) 同行分析方法及装置
US20220095120A1 (en) Using machine learning to develop client device test point identify a new position for an access point (ap)
CN115393681A (zh) 一种目标融合方法、装置、电子设备及存储介质
CN106331060B (zh) 一种基于wifi进行布控的方法和系统
WO2022029415A1 (en) Identifying wireless network devices
CN110933662A (zh) 一种基于数据挖掘的时空伴随关系分析方法和系统
WO2017140710A1 (en) Detection of malware in communications
CN113691483B (zh) 异常用户设备的检测方法、装置、设备及存储介质
US20210112097A1 (en) Occupancy detection and people counting using passive wireless interfaces
CN115729683A (zh) 任务处理方法、装置、系统、计算机设备和存储介质
CN112185045B (zh) 一种报警方法和系统
CN111935637A (zh) 一种人流量分析方法、存储介质及处理器
CN110858338A (zh) 目的地预测方法、装置和设备
JP7459548B2 (ja) 人数推定システム、人数推定装置、人数推定方法及び人数推定プログラム
Djervbrant et al. A Study on Fingerprinting of Locally Assigned MAC-Addresses

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant