CN108363783B - Mac地址与身份信息的绑定方法及装置 - Google Patents

Mac地址与身份信息的绑定方法及装置 Download PDF

Info

Publication number
CN108363783B
CN108363783B CN201810143584.6A CN201810143584A CN108363783B CN 108363783 B CN108363783 B CN 108363783B CN 201810143584 A CN201810143584 A CN 201810143584A CN 108363783 B CN108363783 B CN 108363783B
Authority
CN
China
Prior art keywords
mac
data
registration
foothold
mac address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810143584.6A
Other languages
English (en)
Other versions
CN108363783A (zh
Inventor
沈贝伦
张登
沈俊青
周鹏
李冰
盛丽兰
孙云
丁萍网
陆韵
田甜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Zhongao Technology Co Ltd
Original Assignee
Hangzhou Zhongao Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Zhongao Technology Co Ltd filed Critical Hangzhou Zhongao Technology Co Ltd
Priority to CN201810143584.6A priority Critical patent/CN108363783B/zh
Publication of CN108363783A publication Critical patent/CN108363783A/zh
Application granted granted Critical
Publication of CN108363783B publication Critical patent/CN108363783B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/60Types of network addresses
    • H04L2101/618Details of network addresses
    • H04L2101/622Layer-2 addresses, e.g. medium access control [MAC] addresses

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种MAC地址与身份信息的绑定方法及装置,该方法包括:获取目标数据集;基于目标数据集计算身份信息和MAC地址的地址绑定置信度;基于目标数据集计算身份信息和MAC地址的行为绑定置信度;结合地址绑定置信度和行为绑定置信度计算身份信息和MAC地址的综合置信度。本发明中的MAC地址与身份信息的绑定方法能够有效的匹配身份信息和MAC地址,并最终以数值的形式表征身份信息和MAC地址的绑定关系的强弱,该绑定方法能够大量减少人工校验成本,缓解了现有技术中无法将MAC地址与身份信息进行绑定的技术问题。

Description

MAC地址与身份信息的绑定方法及装置
技术领域
本发明涉及身份绑定的技术领域,尤其是涉及一种MAC地址与身份信息的绑定方法及装置。
背景技术
MAC(Medium/Media Access Control)地址广泛存在于各种可移动设备中,包括每个人携带的手机、笔记本电脑、车辆中的行车记录仪,每个MAC地址对应了一个设备,这些MAC地址的活动时间和活动地点可以被MAC采集器所记录,得到MAC地址的轨迹,但是,无法获知该MAC地址所属的人的身份信息。人在出行时,其身份信息也会被采集记录,比如进出小区、网吧、车站、机场等。如果将MAC地址与身份信息进行绑定后,就能够根据可疑的MAC地址得到其对应的身份信息,也可以根据可疑的身份信息得到其具体的MAC轨迹,为公安部门破案,查询嫌疑人提供有力的支持。
综上,目前关于无法将MAC地址与身份信息进行绑定的问题,尚无有效的解决办法。
发明内容
有鉴于此,本发明的目的在于提供一种MAC地址与身份信息的绑定方法及装置,以缓解现有技术中无法将MAC地址与身份信息进行绑定的技术问题。
第一方面,本发明实施例提供了一种MAC地址与身份信息的绑定方法,所述方法包括:
获取目标数据集,其中,所述目标数据集包括:登记数据集和感知数据集,所述登记数据集中包括身份信息,所述感知数据集中包括MAC地址;
基于所述目标数据集计算所述身份信息和所述MAC地址的地址绑定置信度;
基于所述目标数据集计算所述身份信息和所述MAC地址的行为绑定置信度;
结合所述地址绑定置信度和所述行为绑定置信度计算所述身份信息和所述MAC地址的综合置信度,其中,所述综合置信度用于表示所述身份信息和所述MAC地址的绑定关系的强弱。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,获取目标数据集包括:
获取预设时间内目标区域的初始数据,其中,所述初始数据包括:登记数据和感知数据,所述登记数据至少包括:身份信息数据,工作信息数据,登记记录数据,所述登记记录数据包括:登记地点,登记时间,所述感知数据包括:车辆通过卡口时的记录数据,MAC采集器采集得到的MAC记录,所述MAC记录包括:MAC地址,MAC地址对应的经纬度坐标,MAC地址在各经纬度出现时对应的时间;
对所述登记数据进行第一预处理,得到所述登记数据集,其中,所述第一预处理至少包括:第一数据清洗,第一分类处理,所述第一数据清洗为去除所述登记数据中不符合预设字段要求的数据,所述第一分类处理为将所述第一数据清洗后的登记数据按照预设数据项进行分类;
对所述感知数据进行第二预处理,得到所述感知数据集,其中,所述第二预处理至少包括:第二数据清洗,第二分类处理,所述第二数据清洗为去除所述感知数据中的不符合预设字段要求的数据,所述第二分类处理为将所述第二数据清洗后的感知数据按照预设数据项进行分类;
将所述登记数据集和所述感知数据集作为所述目标数据集。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,基于所述目标数据集计算所述身份信息和所述MAC地址的地址绑定置信度包括:
基于所述目标数据集计算登记地点权重和MAC落脚点权重;
根据登记地点坐标和所述登记地点权重进行聚类,得到登记地点簇和登记地点簇中心坐标;
采集预设时间段内MAC地址的坐标点,并将同一个MAC地址的坐标点进行聚类,得到MAC落脚点和MAC落脚点坐标;
根据所述MAC落脚点坐标和MAC落脚点权重进行聚类,得到落脚点覆盖区域簇和落脚点覆盖区域簇中心坐标;
根据所述登记地点簇中心坐标和所述落脚点覆盖区域簇中心坐标计算得到距离最近的登记地点簇和落脚点覆盖区域簇;
对所述距离最近的登记地点簇和所述落脚点覆盖区域簇进行绑定,得到绑定的登记地点簇和落脚点覆盖区域簇;
在所述绑定的登记地点簇和所述落脚点覆盖区域簇中,计算所述身份信息和所述MAC地址的地址绑定置信度。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,基于所述目标数据集计算登记地点权重和MAC落脚点权重包括:
将所述登记数据集中的所有登记地点转换为坐标,得到登记地点坐标;
根据登记地点权重计算公式计算相关人员的所述登记地点权重,其中,表示身份j在登记地点r对应的权重,αr表示登记地点r的类型权重,R表示身份j的全部登记地点集合,表示登记地点r在身份j的记录中出现的次数;
根据落脚点权重计算公式计算所述MAC落脚点权重,其中,表示MACi在落脚点s的权重,S表示MACi的落脚点集合,表示MACi的落脚点s的密度,表示在落脚点s范围内MACi的总量。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,在所述绑定的登记地点簇和所述落脚点覆盖区域簇中,计算所述身份信息和所述MAC地址的地址绑定置信度包括:
通过地址绑定置信度计算公式计算所述身份信息和所述MAC地址的地址绑定置信度,其中,表示身份IDj和MACi的地址绑定置信度,Nl表示在同一个时间滑窗内登记地点坐标和MAC落脚点坐标的坐标对总数,Nt表示时间滑窗数量,Dl(i,j)表示登记地点坐标与MAC落脚点坐标中坐标对的欧拉距离,It表示指示函数,在时间滑窗内,当Dl(i,j)超过预设阈值时,则为1,反之为0,γ为常参数。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,基于所述目标数据集计算所述身份信息和所述MAC地址的行为绑定置信度包括:
在所述登记数据集中提取身份标签,其中,所述身份标签至少包括:职业,年龄,性别,工作性质;
在所述感知数据集中提取MAC地址的采集点特征,得到MAC采集点特征向量;
在所述感知数据集中提取MAC地址的行为特征,得到MAC行为特征向量;
将所述身份标签,所述MAC采集点特征向量,所述MAC行为特征向量输入至递归神经网络模型中,得到MAC特征向量与每一种身份标签的匹配度,其中,所述MAC特征向量包括:所述MAC采集点特征向量,所述MAC行为特征向量;
基于所述MAC特征向量与每一种身份标签的匹配度确定所述MAC特征向量与所有身份标签的匹配度矩阵;
根据行为绑定置信度计算公式计算所述身份信息和所述MAC地址的行为绑定置信度,其中,表示所述匹配度矩阵。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,结合所述地址绑定置信度和所述行为绑定置信度计算所述身份信息和所述MAC地址的综合置信度包括:
根据综合置信度计算公式计算所述身份信息和所述MAC地址的综合置信度,其中,表示所述地址绑定置信度,表示所述行为绑定置信度,θ1和θ2表示常参数。
第二方面,本发明实施例还提供了一种MAC地址与身份信息的绑定装置,所述装置包括:
获取模块,用于获取目标数据集,其中,所述目标数据集包括:登记数据集和感知数据集,所述登记数据集中包括身份信息,所述感知数据集中包括MAC地址;
第一计算模块,基于所述目标数据集计算所述身份信息和所述MAC地址的地址绑定置信度;
第二计算模块,基于所述目标数据集计算所述身份信息和所述MAC地址的行为绑定置信度;
第三计算模块,用于结合所述地址绑定置信度和所述行为绑定置信度计算所述身份信息和所述MAC地址的综合置信度,其中,所述综合置信度用于表示所述身份信息和所述MAC地址的绑定关系的强弱。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,所述获取模块包括:
获取单元,用于获取预设时间内目标区域的初始数据,其中,所述初始数据包括:登记数据和感知数据,所述登记数据至少包括:身份信息数据,工作信息数据,登记记录数据,所述登记记录数据包括:登记地点,登记时间,所述感知数据包括:车辆通过卡口时的记录数据,MAC采集器采集得到的MAC记录,所述MAC记录包括:MAC地址,MAC地址对应的经纬度坐标,MAC地址在各经纬度出现时对应的时间;
第一预处理单元,用于对所述登记数据进行第一预处理,得到所述登记数据集,其中,所述第一预处理至少包括:第一数据清洗,第一分类处理,所述第一数据清洗为去除所述登记数据中不符合预设字段要求的数据,所述第一分类处理为将所述第一数据清洗后的登记数据按照预设数据项进行分类;
第二预处理单元,用于对所述感知数据进行第二预处理,得到所述感知数据集,其中,所述第二预处理至少包括:第二数据清洗,第二分类处理,所述第二数据清洗为去除所述感知数据中的不符合预设字段要求的数据,所述第二分类处理为将所述第二数据清洗后的感知数据按照预设数据项进行分类;
设定单元,用于将所述登记数据集和所述感知数据集作为所述目标数据集。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中,所述第一计算模块包括:
第一计算单元,用于基于所述目标数据集计算登记地点权重和MAC落脚点权重;
第一聚类单元,用于根据登记地点坐标和所述登记地点权重进行聚类,得到登记地点簇和登记地点簇中心坐标;
MAC落脚点确定单元,用于采集预设时间段内MAC地址的坐标点,并将同一个MAC地址的坐标点进行聚类,得到MAC落脚点和MAC落脚点坐标;
第二聚类单元,用于根据所述MAC落脚点坐标和MAC落脚点权重进行聚类,得到落脚点覆盖区域簇和落脚点覆盖区域簇中心坐标;
第二计算单元,用于根据所述登记地点簇中心坐标和所述落脚点覆盖区域簇中心坐标计算得到距离最近的登记地点簇和落脚点覆盖区域簇;
绑定单元,用于对所述距离最近的登记地点簇和所述落脚点覆盖区域簇进行绑定,得到绑定的登记地点簇和落脚点覆盖区域簇;
第三计算单元,用于在所述绑定的登记地点簇和所述落脚点覆盖区域簇中,计算所述身份信息和所述MAC地址的地址绑定置信度。
本发明实施例带来了以下有益效果:本发明实施例提供了一种MAC地址与身份信息的绑定方法及装置,该方法包括:获取目标数据集,其中,目标数据集包括:登记数据集和感知数据集,登记数据集中包括身份信息,感知数据集中包括MAC地址;基于目标数据集计算身份信息和MAC地址的地址绑定置信度;基于目标数据集计算身份信息和MAC地址的行为绑定置信度;结合地址绑定置信度和行为绑定置信度计算身份信息和MAC地址的综合置信度,其中,综合置信度用于表示身份信息和MAC地址的绑定关系的强弱。
现有技术中无法将MAC地址与身份信息进行绑定,本发明实施例提供的MAC地址与身份信息的绑定方法中,先获取目标数据集,然后基于目标数据集分别计算身份信息和MAC地址的地址绑定置信度以及行为绑定置信度,最终根据地址绑定置信度和行为绑定置信度计算得到身份信息和MAC地址的综合置信度,通过该综合置信度就能得知身份信息和MAC地址的绑定关系的强弱。本发明中的MAC地址与身份信息的绑定方法能够有效的匹配身份信息和MAC地址,并最终以数值的形式表征身份信息和MAC地址的绑定关系的强弱,该绑定方法能够大量减少人工校验成本,缓解了现有技术中无法将MAC地址与身份信息进行绑定的技术问题。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种MAC地址与身份信息的绑定方法的流程图;
图2为本发明实施例提供的基于目标数据集计算身份信息和MAC地址的地址绑定置信度的方法流程图;
图3为本发明实施例提供的基于目标数据集计算登记地点权重和MAC落脚点权重的方法流程图;
图4为本发明实施例提供的基于目标数据集计算身份信息和MAC地址的行为绑定置信度的方法流程图;
图5为本发明实施例提供的一种MAC地址与身份信息的绑定装置的结构框图。
图标:
11-获取模块;12-第一计算模块;13-第二计算模块;14-第三计算模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种MAC地址与身份信息的绑定方法进行详细介绍。
实施例一:
一种MAC地址与身份信息的绑定方法,参考图1,该方法包括:
S102、获取目标数据集,其中,目标数据集包括:登记数据集和感知数据集,登记数据集中包括身份信息,感知数据集中包括MAC地址;
在本发明实施例中,目标数据集中包括了登记数据集和感知数据集。具体的,登记数据集中包括身份信息,感知数据集中包括MAC地址。
这些身份信息可以是通过第三方获得,本发明实施例对其不做具体限制。
具体的,MAC地址是通过MAC采集器获得的。
S104、基于目标数据集计算身份信息和MAC地址的地址绑定置信度;
在得到目标数据集后,就能够基于目标数据集计算身份信息和MAC地址的地址绑定置信度,下文中再对该过程进行详细描述,在此不再赘述。
S106、基于目标数据集计算身份信息和MAC地址的行为绑定置信度;
在得到目标数据集后,也能够基于目标数据集计算身份信息和MAC地址的行为绑定置信度,同理,下文中再对该过程进行详细描述,在此不再赘述。
S108、结合地址绑定置信度和行为绑定置信度计算身份信息和MAC地址的综合置信度,其中,综合置信度用于表示身份信息和MAC地址的绑定关系的强弱。
在得到地址绑定置信度和行为绑定置信度后,通过地址绑定置信度和行为绑定置信度进一步计算身份信息和MAC地址的综合置信度。其中,综合置信度用于表示身份信息和MAC地址的绑定关系的强弱。
综合置信度的值决定了身份信息和MAC地址的绑定关系的强弱,因为最终只能得到一个身份和MAC地址绑定的可能性,一个身份也可能和多个MAC都有很高的绑定可能性,同样一个MAC地址也可能和多个身份相关,所以绑定方法最终计算得到的为综合置信度,至于如何应用综合置信度,是选取综合置信度最高的一对绑定还是多对绑定,或者是其他用法,就由该方法的应用场景决定,本方法中不进行具体限制。
现有技术中无法将MAC地址与身份信息进行绑定,本发明实施例提供的MAC地址与身份信息的绑定方法中,先获取目标数据集,然后基于目标数据集分别计算身份信息和MAC地址的地址绑定置信度以及行为绑定置信度,最终根据地址绑定置信度和行为绑定置信度计算得到身份信息和MAC地址的综合置信度,通过该综合置信度就能得知身份信息和MAC地址的绑定关系的强弱。本发明中的MAC地址与身份信息的绑定方法能够有效的匹配身份信息和MAC地址,并最终以数值的形式表征身份信息和MAC地址的绑定关系的强弱,该绑定方法能够大量减少人工校验成本,缓解了现有技术中无法将MAC地址与身份信息进行绑定的技术问题。
上述内容从整体上描述了MAC地址与身份信息的绑定方法,下面对其中涉及到的具体内容进行详细介绍。
在一个可选地实施方式中,获取目标数据集的过程包括:
(1)获取预设时间内目标区域的初始数据,其中,初始数据包括:登记数据和感知数据,登记数据至少包括:身份信息数据,工作信息数据,登记记录数据,登记记录数据包括:登记地点,登记时间,感知数据包括:车辆通过卡口时的记录数据,MAC采集器采集得到的MAC记录,MAC记录包括:MAC地址,MAC地址对应的经纬度坐标,MAC地址在各经纬度出现时对应的时间;
具体的,获取一段时间内城市中的登记数据和感知数据,另外目标区域还可以为其它区域,不一定是城市中,本发明实施例对其不做具体限制。
其中,登记数据包括:人员的身份证,姓名,常住地,暂住地,工作单位,出入旅馆记录,网吧上网记录,各类交通工具乘坐记录姓名,户口,在登记地点Pa出现的时间,登记地点Pa的坐标,在登记地点Pb出现的时间,登记地点Pb的坐标等数据。
感知数据包括:车辆通过卡口时的记录数据和MAC采集器采集得到的MAC记录,MAC记录包括:MAC地址,MAC地址对应的经纬度坐标,MAC地址在各经纬度时对应的时间,记录数据具体包括:车牌,车身信息,车辆前排人员与驾驶人相关的MAC地址。
(2)对登记数据进行第一预处理,得到登记数据集,其中,第一预处理至少包括:第一数据清洗,第一分类处理,第一数据清洗为去除登记数据中不符合预设字段要求的数据,第一分类处理为将第一数据清洗后的登记数据按照预设数据项进行分类;
在得到登记数据后,对登记数据进行第一预处理,包括:第一数据清洗和第一分类处理。
第一数据清洗为去除登记数据中不符合预设字段要求的数据,对于不同的数据数据清洗的情况不同。比如:出入旅馆记录中,入住旅馆时间晚于退定旅馆时间或者出生日期晚于当前时间等。
第一分类处理为将第一数据清洗后的登记数据按照预设数据项进行分类。比如,将关于人物身份的信息归为一类,将登记地点的数据归为一类等。
(3)对感知数据进行第二预处理,得到感知数据集,其中,第二预处理至少包括:第二数据清洗,第二分类处理,第二数据清洗为去除感知数据中的不符合预设字段要求的数据,第二分类处理为将第二数据清洗后的感知数据按照预设数据项进行分类;
该过程与上述(2)中的过程相似,在此不再赘述。
(4)将登记数据集和感知数据集作为目标数据集。
在得到登记数据集和感知数据集后,将登记数据集和感知数据集作为目标数据集。
上述内容介绍了获取目标数据集的具体过程,下面对基于目标数据集计算身份信息和MAC地址的地址绑定置信度的过程进行详细介绍。
在一个可选地实施方式中,参考图2,基于目标数据集计算身份信息和MAC地址的地址绑定置信度包括:
S201、基于目标数据集计算登记地点权重和MAC落脚点权重;
在得到目标数据集后,先基于目标数据集计算登记地点权重和MAC落脚点权重。
下面对MAC落脚点进行解释:如果把MAC地址当做一个独立的个体,通过坐标的采集,可以获取该MAC地址代表的个体在地图上的位置变化,从而得到它的活动区域,而相对静态的活动区域就是落脚点。所以可以理解为,该MAC地址所代表个体的落脚点。
下文中再对计算登记地点权重和MAC落脚点权重的过程进行详细介绍。
S202、根据登记地点坐标和登记地点权重进行聚类,得到登记地点簇和登记地点簇中心坐标;
在得到登记地点权重后,根据登记地点坐标和登记地点权重进行聚类。具体的,将每个人员的登记数据看成一个由许多登记地点坐标和其对应的权重组成的特征向量,使用聚类算法DBSCAN来进行聚类。本发明实施例对聚类算法不进行具体限制,也可以为其它聚类算法。
在聚类算法中,最重要的为聚类时使用的两个向量的距离的确定,该距离可以由以下函数来定义,具体的,对距离函数定义如下:
其中,Na表示人员A的登记数据中登记地点的数量,Nb表示人员B的登记数据中登记地点的数量,表示登记地点i在人员A的登记数据中的权重,表示登记地点i在人员A的登记数据中的坐标,表示登记地点j在人员B的登记数据中的权重,表示登记地点j在人员B的登记数据中的坐标。
由此得到聚类的距离,然后通过聚类算法DBSCAN来进行聚类,得到登记地点簇和登记地点簇中心坐标。
S203、采集预设时间段内MAC地址的坐标点,并将同一个MAC地址的坐标点进行聚类,得到MAC落脚点和MAC落脚点坐标;
每隔一定的时间间隔周期,对MAC地址所在的坐标进行采集,在一定长度的时间区间内,可以采集到同一个MAC地址在地图上出现的多个坐标点,根据这些点的坐标间的欧拉距离进行聚类,获得MAC地址常出现的活动范围,既MAC落脚点区域,称之为MAC落脚点,该区域的中心位置所对应的点即为MAC落脚点坐标,进而得到MAC落脚点区域的区域密度及活动总量,这里的密度为单位面积内坐标点数量,活动总量为聚合后的落脚点区域内坐标点总数。
S204、根据MAC落脚点坐标和MAC落脚点权重进行聚类,得到落脚点覆盖区域簇和落脚点覆盖区域簇中心坐标;
在得到MAC落脚点权重后,根据MAC落脚点坐标和MAC落脚点权重进行聚类。具体的,将每条MAC采集数据看成一个由许多MAC落脚点坐标和其对应的权重组成的特征向量,使用聚类算法DBSCAN来进行聚类。本发明实施例对聚类算法不进行具体限制,也可以为其它聚类算法。
在聚类算法中,最重要的为聚类时使用的两个向量的距离的确定,该距离可以由以下函数来定义,具体的,对距离函数定义如下:
其中,Na表示MAC地址为A的数据中落脚点的数量,Nb表示MAC地址为B的数据中登记地点的数量,表示登记地点i在MAC地址为A的数据中的权重,表示登记地点i在MAC地址为A的数据中的坐标,表示登记地点j在MAC地址为B的数据中的权重,表示登记地点j在MAC地址为B的数据中的坐标
由此得到聚类的距离,然后通过聚类算法DBSCAN来进行聚类,得到落脚点覆盖区域簇和落脚点覆盖区域簇中心坐标。
S205、根据登记地点簇中心坐标和落脚点覆盖区域簇中心坐标计算得到距离最近的登记地点簇和落脚点覆盖区域簇;
在得到登记地点簇,登记地点簇中心坐标,落脚点覆盖区域簇和落脚点覆盖区域簇中心坐标后,根据登记地点簇中心坐标和落脚点覆盖区域簇中心坐标计算得到距离最近的登记地点簇和落脚点覆盖区域簇。
具体的,登记地点簇和落脚点覆盖区域簇之间的距离计算公式为:
其中,表示登记地点簇中心坐标,表示落脚点覆盖区域簇中心坐标。
在得到多个距离后,在多个距离中确定距离最近的登记地点簇和落脚点覆盖区域簇。
S206、对距离最近的登记地点簇和落脚点覆盖区域簇进行绑定,得到绑定的登记地点簇和落脚点覆盖区域簇;
在绑定的登记地点簇和落脚点覆盖区域簇中,取出人员的登记数据坐标和MAC地址坐标的坐标对。
S207、在绑定的登记地点簇和落脚点覆盖区域簇中,计算身份信息和MAC地址的地址绑定置信度。
在得到绑定的登记地点簇和落脚点覆盖区域簇后,计算身份信息和MAC地址的地址绑定置信度,下文中再对该过程进行详细描述。
上述内容介绍了基于目标数据集计算身份信息和MAC地址的地址绑定置信度的过程,下面对其中涉及到的具体内容进行详细介绍。
在一个可选地实施方式中,参考图3,基于目标数据集计算登记地点权重和MAC落脚点权重包括以下步骤:
S301、将登记数据集中的所有登记地点转换为坐标,得到登记地点坐标;
S302、根据登记地点权重计算公式计算相关人员的登记地点权重,其中,表示身份j在登记地点r对应的权重,αr表示登记地点r的类型权重,R表示身份j的全部登记地点集合,表示登记地点r在身份j的记录中出现的次数;
具体的,对登记地点r的类型权重进行介绍,比如,登记地点为出生地,其对应一个预设的权重,再比如,登记地点为工作地点,其对应另一个预设的权重,本发明实施例对类型权重的值不进行具体限制。
S303、根据落脚点权重计算公式计算MAC落脚点权重,其中,表示MACi在落脚点s的权重,S表示MACi的落脚点集合,表示MACi的落脚点s的密度,表示在落脚点s范围内MACi的总量。
在长时间范围内,通过聚类对MACi进行落脚点分析,获得该MAC的主要活动区域及中心点坐标,然后根据区域密度及活动总量计算MAC落脚点权重。
地理位置并不是单次采集,而是在一定的时间区间内根据一定的时间间隔多次采集的,每次采集到的地理位置也可能在变化,如果把某一MAC每次采集到的位置作为一个点画在地图上,那么就会看到一个一个的点的簇,一个族就是一个落脚点,簇的中心位置就是落脚点的中心位置,而权重可以用来表述某一个落脚点簇的密集程度和对于这个MAC地址的重要性,落脚点权重是针对某个MAC地址的落脚点权重。
上述内容介绍了基于目标数据集计算登记地点权重和MAC落脚点权重的过程,下面对计算身份信息和MAC地址的地址绑定置信度的过程进行详细介绍。
在一个可选地实施方式中,在绑定的登记地点簇和落脚点覆盖区域簇中,计算身份信息和MAC地址的地址绑定置信度包括:
通过地址绑定置信度计算公式计算身份信息和MAC地址的地址绑定置信度,其中,表示身份IDj和MACi的地址绑定置信度,Nl表示在同一个时间滑窗内登记地点坐标和MAC落脚点坐标的坐标对总数,Nt表示时间滑窗数量,Dl(i,j)表示登记地点坐标与MAC落脚点坐标中坐标对的欧拉距离,It表示指示函数,在时间滑窗内,当Dl(i,j)超过预设阈值时,则为1,反之为0,γ为常参数。
具体的,在同一个时间滑窗内,因为登记地点簇和落脚点覆盖区域簇进行了绑定,所以登记地点坐标和MAC落脚点坐标是一对一对的,Nl就表示坐标对总数。
上述内容即为基于目标数据集计算身份信息和MAC地址的地址绑定置信度的过程,下面介绍基于目标数据集计算身份信息和MAC地址的行为绑定置信度的过程。
在一个可选地实施方式中,参考图4,基于目标数据集计算身份信息和MAC地址的行为绑定置信度包括以下步骤:
S401、在登记数据集中提取身份标签,其中,身份标签至少包括:职业,年龄,性别,工作性质;
S402、在感知数据集中提取MAC地址的采集点特征,得到MAC采集点特征向量;
具体的,采集点特征包括:MAC出现数量,频率,流动性等特征,本发明实施例对采集点特征不进行限制。
S403、在感知数据集中提取MAC地址的行为特征,得到MAC行为特征向量;
具体的,行为特征包括:MAC活动区域次数、移动速率、持续时间、时间段等行为特征,本发明实施例对行为特征不进行限制。
S404、将身份标签,MAC采集点特征向量,MAC行为特征向量输入至递归神经网络模型中,得到MAC特征向量与每一种身份标签的匹配度,其中,MAC特征向量包括:MAC采集点特征向量,MAC行为特征向量;
采集一些与已知身份信息绑定的MAC地址,计算上述步骤中提到的身份标签,以及含有时序特性的MAC特征向量,使用这些特征作为输入,身份信息匹配度为输出,匹配度与实际身份的差别作为损失函数,建立RNN(递归神经网络)模型。对于待匹配的身份标签和MAC特征向量,将其输入到已训练完成的RNN中,得到MAC特征向量和一种身份标签的匹配度。
S405、基于MAC特征向量与每一种身份标签的匹配度确定MAC特征向量与所有身份标签的匹配度矩阵;
在具体实现时,可以为每个登记身份l提取身份特征向量,向量中的每位代表一种标签信息,如,是否为医生如果满足则为1,不满足则为0,获取身份l的身份标签特征向量Fl,以及MACi含有时序特性的特征向量(即采集点特征向量)和(即行为特征向量),使用训练完成的RNN模型计算特征向量和所有身份标签x的匹配度矩阵
S406、根据行为绑定置信度计算公式计算身份信息和MAC地址的行为绑定置信度,其中,表示匹配度矩阵。
在得到地址绑定置信度和行为绑定置信度后,在一个可选地实施方式中,结合地址绑定置信度和行为绑定置信度计算身份信息和MAC地址的综合置信度包括:
根据综合置信度计算公式计算身份信息和MAC地址的综合置信度,其中,表示地址绑定置信度,表示行为绑定置信度,θ1和θ2表示常参数,由经验得到。
本发明实施例中的MAC地址与身份信息的绑定方法中,首先提取一段时间内城市中的多元数据,将其分为登记数据和感知数据,并用独特的方法提取的地理信息和时间信息的特征,通过相近地理位置聚类的方式,降低计算的复杂度,并采用空间和行为多重绑定的方法,计算出身份信息和MAC在静态空间上置信度和动态行为上的置信度从而获得综合置信度。此外,在MAC采集过程中会存在随机MAC,本方法提出的MAC特征提取方法可以有效过滤该类MAC,提高绑定准确率。该方法不但能有效的匹配身份信息与MAC地址,还能大量减少人工校验的成本。
实施例二:
一种MAC地址与身份信息的绑定装置,参考图5,该装置包括:
获取模块11,用于获取目标数据集,其中,目标数据集包括:登记数据集和感知数据集,登记数据集中包括身份信息,感知数据集中包括MAC地址;
第一计算模块12,基于目标数据集计算身份信息和MAC地址的地址绑定置信度;
第二计算模块13,基于目标数据集计算身份信息和MAC地址的行为绑定置信度;
第三计算模块14,用于结合地址绑定置信度和行为绑定置信度计算身份信息和MAC地址的综合置信度,其中,综合置信度用于表示身份信息和MAC地址的绑定关系的强弱。
本发明实施例提供的MAC地址与身份信息的绑定装置中,先获取目标数据集,然后基于目标数据集分别计算身份信息和MAC地址的地址绑定置信度以及行为绑定置信度,最终根据地址绑定置信度和行为绑定置信度计算得到身份信息和MAC地址的综合置信度,通过该综合置信度就能得知身份信息和MAC地址的绑定关系的强弱。本发明中的MAC地址与身份信息的绑定装置能够有效的匹配身份信息和MAC地址,并最终以数值的形式表征身份信息和MAC地址的绑定关系的强弱,该绑定装置能够大量减少人工校验成本,缓解了现有技术中无法将MAC地址与身份信息进行绑定的技术问题。
可选地,获取模块包括:
获取单元,用于获取预设时间内目标区域的初始数据,其中,初始数据包括:登记数据和感知数据,登记数据至少包括:身份信息数据,工作信息数据,登记记录数据,登记记录数据包括:登记地点,登记时间,感知数据包括:车辆通过卡口时的记录数据,MAC采集器采集得到的MAC记录,MAC记录包括:MAC地址,MAC地址对应的经纬度坐标,MAC地址在各经纬度出现时对应的时间;
第一预处理单元,用于对登记数据进行第一预处理,得到登记数据集,其中,第一预处理至少包括:第一数据清洗,第一分类处理,第一数据清洗为去除登记数据中不符合预设字段要求的数据,第一分类处理为将第一数据清洗后的登记数据按照预设数据项进行分类;
第二预处理单元,用于对感知数据进行第二预处理,得到感知数据集,其中,第二预处理至少包括:第二数据清洗,第二分类处理,第二数据清洗为去除感知数据中的不符合预设字段要求的数据,第二分类处理为将第二数据清洗后的感知数据按照预设数据项进行分类;
设定单元,用于将登记数据集和感知数据集作为目标数据集。
可选地,第一计算模块包括:
第一计算单元,用于基于目标数据集计算登记地点权重和MAC落脚点权重;
第一聚类单元,用于根据登记地点坐标和登记地点权重进行聚类,得到登记地点簇和登记地点簇中心坐标;
MAC落脚点确定单元,用于采集预设时间段内MAC地址的坐标点,并将同一个MAC地址的坐标点进行聚类,得到MAC落脚点和MAC落脚点坐标;
第二聚类单元,用于根据MAC落脚点坐标和MAC落脚点权重进行聚类,得到落脚点覆盖区域簇和落脚点覆盖区域簇中心坐标;
第二计算单元,用于根据登记地点簇中心坐标和落脚点覆盖区域簇中心坐标计算得到距离最近的登记地点簇和落脚点覆盖区域簇;
绑定单元,用于对距离最近的登记地点簇和落脚点覆盖区域簇进行绑定,得到绑定的登记地点簇和落脚点覆盖区域簇;
第三计算单元,用于在绑定的登记地点簇和落脚点覆盖区域簇中,计算身份信息和MAC地址的地址绑定置信度。
可选地,第一计算单元包括:
转换子单元,用于将登记数据集中的所有登记地点转换为坐标,得到登记地点坐标;
第一计算子单元,用于根据登记地点权重计算公式计算相关人员的登记地点权重,其中,表示身份j在登记地点r对应的权重,αr表示登记地点r的类型权重,R表示身份j的全部登记地点集合,表示登记地点r在身份j的记录中出现的次数;
第二计算子单元,用于根据落脚点权重计算公式计算MAC落脚点权重,其中,表示MACi在落脚点s的权重,S表示MACi的落脚点集合,表示MACi的落脚点s的密度,表示在落脚点s范围内MACi的总量。
可选地,第三计算单元包括:
第三计算子单元,用于通过地址绑定置信度计算公式计算身份信息和MAC地址的地址绑定置信度,其中,表示身份IDj和MACi的地址绑定置信度,Nl表示在同一个时间滑窗内登记地点坐标和MAC落脚点坐标的坐标对总数,Nt表示时间滑窗数量,Dl(i,j)表示登记地点坐标与MAC落脚点坐标中坐标对的欧拉距离,It表示指示函数,在时间滑窗内,当Dl(i,j)超过预设阈值时,则为1,反之为0,γ为常参数。
可选地,第二计算模块包括:
第一提取单元,用于在登记数据集中提取身份标签,其中,身份标签至少包括:职业,年龄,性别,工作性质;
第二提取单元,用于在感知数据集中提取MAC地址的采集点特征,得到MAC采集点特征向量;
第三提取单元,用于在感知数据集中提取MAC地址的行为特征,得到MAC行为特征向量;
匹配度输出单元,用于将身份标签,MAC采集点特征向量,MAC行为特征向量输入至递归神经网络模型中,得到MAC特征向量与每一种身份标签的匹配度,其中,MAC特征向量包括:MAC采集点特征向量,MAC行为特征向量;
匹配度矩阵输出单元,用于基于MAC特征向量与每一种身份标签的匹配度确定MAC特征向量与所有身份标签的匹配度矩阵;
第四计算单元,用于根据行为绑定置信度计算公式计算身份信息和MAC地址的行为绑定置信度,其中,表示匹配度矩阵。
可选地,第三计算模块包括:
第五计算单元,用于根据综合置信度计算公式计算身份信息和MAC地址的综合置信度,其中,表示地址绑定置信度,表示行为绑定置信度,θ1和θ2表示常参数。
该实施例二中的具体内容可以参考上述实施例一中的描述,在此不再赘述。
本发明实施例所提供的MAC地址与身份信息的绑定方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种MAC地址与身份信息的绑定方法,其特征在于,所述方法包括:
获取目标数据集,其中,所述目标数据集包括:登记数据集和感知数据集,所述登记数据集中包括身份信息,所述感知数据集中包括MAC地址;
基于所述目标数据集计算所述身份信息和所述MAC地址的地址绑定置信度;
基于所述目标数据集计算所述身份信息和所述MAC地址的行为绑定置信度;
结合所述地址绑定置信度和所述行为绑定置信度计算所述身份信息和所述MAC地址的综合置信度,其中,所述综合置信度用于表示所述身份信息和所述MAC地址的绑定关系的强弱。
2.根据权利要求1所述的方法,其特征在于,获取目标数据集包括:
获取预设时间内目标区域的初始数据,其中,所述初始数据包括:登记数据和感知数据,所述登记数据至少包括:身份信息数据,工作信息数据,登记记录数据,所述登记记录数据包括:登记地点,登记时间,所述感知数据包括:车辆通过卡口时的记录数据,MAC采集器采集得到的MAC记录,所述MAC记录包括:MAC地址,MAC地址对应的经纬度坐标,MAC地址在各经纬度出现时对应的时间;
对所述登记数据进行第一预处理,得到所述登记数据集,其中,所述第一预处理至少包括:第一数据清洗,第一分类处理,所述第一数据清洗为去除所述登记数据中不符合预设字段要求的数据,所述第一分类处理为将所述第一数据清洗后的登记数据按照预设数据项进行分类;
对所述感知数据进行第二预处理,得到所述感知数据集,其中,所述第二预处理至少包括:第二数据清洗,第二分类处理,所述第二数据清洗为去除所述感知数据中的不符合预设字段要求的数据,所述第二分类处理为将所述第二数据清洗后的感知数据按照预设数据项进行分类;
将所述登记数据集和所述感知数据集作为所述目标数据集。
3.根据权利要求1所述的方法,其特征在于,基于所述目标数据集计算所述身份信息和所述MAC地址的地址绑定置信度包括:
基于所述目标数据集计算登记地点权重和MAC落脚点权重;
根据登记地点坐标和所述登记地点权重进行聚类,得到登记地点簇和登记地点簇中心坐标;
采集预设时间段内MAC地址的坐标点,并将同一个MAC地址的坐标点进行聚类,得到MAC落脚点和MAC落脚点坐标;
根据所述MAC落脚点坐标和MAC落脚点权重进行聚类,得到落脚点覆盖区域簇和落脚点覆盖区域簇中心坐标;
根据所述登记地点簇中心坐标和所述落脚点覆盖区域簇中心坐标计算得到距离最近的登记地点簇和落脚点覆盖区域簇;
对所述距离最近的登记地点簇和所述落脚点覆盖区域簇进行绑定,得到绑定的登记地点簇和落脚点覆盖区域簇;
在所述绑定的登记地点簇和所述落脚点覆盖区域簇中,计算所述身份信息和所述MAC地址的地址绑定置信度。
4.根据权利要求3所述的方法,其特征在于,基于所述目标数据集计算登记地点权重和MAC落脚点权重包括:
将所述登记数据集中的所有登记地点转换为坐标,得到登记地点坐标;
根据登记地点权重计算公式计算相关人员的所述登记地点权重,其中,表示身份j在登记地点r对应的权重,αr表示登记地点r的类型权重,R表示身份j的全部登记地点集合,表示登记地点r在身份j的记录中出现的次数;
根据落脚点权重计算公式计算所述MAC落脚点权重,其中,表示MACi在落脚点s的权重,S表示MACi的落脚点集合,表示MACi的落脚点s的密度,表示在落脚点s范围内MACi的总量。
5.根据权利要求3所述的方法,其特征在于,在所述绑定的登记地点簇和所述落脚点覆盖区域簇中,计算所述身份信息和所述MAC地址的地址绑定置信度包括:
通过地址绑定置信度计算公式计算所述身份信息和所述MAC地址的地址绑定置信度,其中,表示身份IDj和MACi的地址绑定置信度,Nl表示在同一个时间滑窗内登记地点坐标和MAC落脚点坐标的坐标对总数,Nt表示时间滑窗数量,Dl(i,j)表示登记地点坐标与MAC落脚点坐标中坐标对的欧拉距离,It表示指示函数,在时间滑窗内,当Dl(i,j)超过预设阈值时,则为1,反之为0,γ为常参数。
6.根据权利要求1所述的方法,其特征在于,基于所述目标数据集计算所述身份信息和所述MAC地址的行为绑定置信度包括:
在所述登记数据集中提取身份标签,其中,所述身份标签至少包括:职业,年龄,性别,工作性质;
在所述感知数据集中提取MAC地址的采集点特征,得到MAC采集点特征向量;
在所述感知数据集中提取MAC地址的行为特征,得到MAC行为特征向量;
将所述身份标签,所述MAC采集点特征向量,所述MAC行为特征向量输入至递归神经网络模型中,得到MAC特征向量与每一种身份标签的匹配度,其中,所述MAC特征向量包括:所述MAC采集点特征向量,所述MAC行为特征向量;
基于所述MAC特征向量与每一种身份标签的匹配度确定所述MAC特征向量与所有身份标签的匹配度矩阵;
根据行为绑定置信度计算公式计算所述身份信息和所述MAC地址的行为绑定置信度,其中,表示所述匹配度矩阵,表示人物j的身份标签特征向量,表示所述MAC采集点特征向量,表示所述MAC行为特征向量。
7.根据权利要求1所述的方法,其特征在于,结合所述地址绑定置信度和所述行为绑定置信度计算所述身份信息和所述MAC地址的综合置信度包括:
根据综合置信度计算公式计算所述身份信息和所述MAC地址的综合置信度,其中,表示所述地址绑定置信度,表示所述行为绑定置信度,θ1和θ2表示常参数。
8.一种MAC地址与身份信息的绑定装置,其特征在于,所述装置包括:
获取模块,用于获取目标数据集,其中,所述目标数据集包括:登记数据集和感知数据集,所述登记数据集中包括身份信息,所述感知数据集中包括MAC地址;
第一计算模块,基于所述目标数据集计算所述身份信息和所述MAC地址的地址绑定置信度;
第二计算模块,基于所述目标数据集计算所述身份信息和所述MAC地址的行为绑定置信度;
第三计算模块,用于结合所述地址绑定置信度和所述行为绑定置信度计算所述身份信息和所述MAC地址的综合置信度,其中,所述综合置信度用于表示所述身份信息和所述MAC地址的绑定关系的强弱。
9.根据权利要求8所述的装置,其特征在于,所述获取模块包括:
获取单元,用于获取预设时间内目标区域的初始数据,其中,所述初始数据包括:登记数据和感知数据,所述登记数据至少包括:身份信息数据,工作信息数据,登记记录数据,所述登记记录数据包括:登记地点,登记时间,所述感知数据包括:车辆通过卡口时的记录数据,MAC采集器采集得到的MAC记录,所述MAC记录包括:MAC地址,MAC地址对应的经纬度坐标,MAC地址在各经纬度出现时对应的时间;
第一预处理单元,用于对所述登记数据进行第一预处理,得到所述登记数据集,其中,所述第一预处理至少包括:第一数据清洗,第一分类处理,所述第一数据清洗为去除所述登记数据中不符合预设字段要求的数据,所述第一分类处理为将所述第一数据清洗后的登记数据按照预设数据项进行分类;
第二预处理单元,用于对所述感知数据进行第二预处理,得到所述感知数据集,其中,所述第二预处理至少包括:第二数据清洗,第二分类处理,所述第二数据清洗为去除所述感知数据中的不符合预设字段要求的数据,所述第二分类处理为将所述第二数据清洗后的感知数据按照预设数据项进行分类;
设定单元,用于将所述登记数据集和所述感知数据集作为所述目标数据集。
10.根据权利要求8所述的装置,其特征在于,所述第一计算模块包括:
第一计算单元,用于基于所述目标数据集计算登记地点权重和MAC落脚点权重;
第一聚类单元,用于根据登记地点坐标和所述登记地点权重进行聚类,得到登记地点簇和登记地点簇中心坐标;
MAC落脚点确定单元,用于采集预设时间段内MAC地址的坐标点,并将同一个MAC地址的坐标点进行聚类,得到MAC落脚点和MAC落脚点坐标;
第二聚类单元,用于根据所述MAC落脚点坐标和MAC落脚点权重进行聚类,得到落脚点覆盖区域簇和落脚点覆盖区域簇中心坐标;
第二计算单元,用于根据所述登记地点簇中心坐标和所述落脚点覆盖区域簇中心坐标计算得到距离最近的登记地点簇和落脚点覆盖区域簇;
绑定单元,用于对所述距离最近的登记地点簇和所述落脚点覆盖区域簇进行绑定,得到绑定的登记地点簇和落脚点覆盖区域簇;
第三计算单元,用于在所述绑定的登记地点簇和所述落脚点覆盖区域簇中,计算所述身份信息和所述MAC地址的地址绑定置信度。
CN201810143584.6A 2018-02-11 2018-02-11 Mac地址与身份信息的绑定方法及装置 Active CN108363783B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810143584.6A CN108363783B (zh) 2018-02-11 2018-02-11 Mac地址与身份信息的绑定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810143584.6A CN108363783B (zh) 2018-02-11 2018-02-11 Mac地址与身份信息的绑定方法及装置

Publications (2)

Publication Number Publication Date
CN108363783A CN108363783A (zh) 2018-08-03
CN108363783B true CN108363783B (zh) 2019-09-17

Family

ID=63005920

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810143584.6A Active CN108363783B (zh) 2018-02-11 2018-02-11 Mac地址与身份信息的绑定方法及装置

Country Status (1)

Country Link
CN (1) CN108363783B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109325429B (zh) * 2018-09-11 2021-03-19 深圳前海中电慧安科技有限公司 一种关联特征数据的方法、装置、存储介质及终端
CN111090650A (zh) * 2019-12-16 2020-05-01 北京明略软件系统有限公司 一种数据关系确定方法、装置、电子设备及存储介质
CN111511016B (zh) * 2020-04-09 2021-10-08 腾讯科技(深圳)有限公司 确定同源无线网络的方法、装置、服务器及存储介质
CN112711218B (zh) * 2020-12-08 2022-03-15 杭州电子科技大学上虞科学与工程研究院有限公司 一种工业设备数据采集的方法
CN113676837B (zh) * 2021-08-15 2023-05-23 南京明科电子科技有限公司 一种将蓝牙id转换成ant+id的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105790955A (zh) * 2016-04-06 2016-07-20 深圳市博康智能信息技术有限公司 一种基于mac地址与人脸信息关联的方法和系统
CN105991598A (zh) * 2015-02-15 2016-10-05 中兴通讯股份有限公司 用户获取方法及装置
CN106874347A (zh) * 2016-12-26 2017-06-20 深圳市深网视界科技有限公司 一种匹配人体特征与mac地址的方法及系统
CN107645709A (zh) * 2017-09-28 2018-01-30 浙江大华技术股份有限公司 一种确定人员信息的方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140278839A1 (en) * 2013-03-15 2014-09-18 Joe M. Lynam Location Based Payment System

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105991598A (zh) * 2015-02-15 2016-10-05 中兴通讯股份有限公司 用户获取方法及装置
CN105790955A (zh) * 2016-04-06 2016-07-20 深圳市博康智能信息技术有限公司 一种基于mac地址与人脸信息关联的方法和系统
CN106874347A (zh) * 2016-12-26 2017-06-20 深圳市深网视界科技有限公司 一种匹配人体特征与mac地址的方法及系统
CN107645709A (zh) * 2017-09-28 2018-01-30 浙江大华技术股份有限公司 一种确定人员信息的方法及装置

Also Published As

Publication number Publication date
CN108363783A (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
CN108363783B (zh) Mac地址与身份信息的绑定方法及装置
Chen et al. From traces to trajectories: How well can we guess activity locations from mobile phone traces?
Bachir et al. Inferring dynamic origin-destination flows by transport mode using mobile phone data
Wang et al. Applying mobile phone data to travel behaviour research: A literature review
Zhong et al. Inferring building functions from a probabilistic model using public transportation data
CN110505583B (zh) 一种基于卡口数据与信令数据的轨迹匹配方法
Xu et al. Understanding aggregate human mobility patterns using passive mobile phone location data: A home-based approach
Widhalm et al. Discovering urban activity patterns in cell phone data
CN106874432B (zh) 一种公共交通乘客出行时空轨迹提取方法
Yuan et al. An unlicensed taxi identification model based on big data analysis
Kim et al. Physical boundaries and city boundaries: consequences for crime patterns on street segments?
CN105493109B (zh) 使用多个数据源的空气质量推断
Zhang et al. Mining the semantics of origin-destination flows using taxi traces.
Holleczek et al. Detecting weak public transport connections from cellphone and public transport data
Zhou et al. A data-driven method for trip ends identification using large-scale smartphone-based GPS tracking data
Malleson et al. The characteristics of asymmetric pedestrian behavior: A preliminary study using passive smartphone location data
Doyle et al. Utilising mobile phone billing records for travel mode discovery
CN106682427A (zh) 基于位置服务的个人健康状态评估方法及装置
Burkhard et al. On the requirements on spatial accuracy and sampling rate for transport mode detection in view of a shift to passive signalling data
CN108898520A (zh) 基于轨迹数据的学生安全监控方法和系统
CN111639786A (zh) 资源配置方法、装置、存储介质及计算机设备
Cai et al. A novel trip coverage index for transit accessibility assessment using mobile phone data
Chen et al. A context-aware nonnegative matrix factorization framework for traffic accident risk estimation via heterogeneous data
Ghorpade et al. An integrated stop-mode detection algorithm for real world smartphone-based travel survey
Jiao et al. Understanding the land use function of station areas based on spatiotemporal similarity in rail transit ridership: A case study in Shanghai, China

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PP01 Preservation of patent right

Effective date of registration: 20191118

Granted publication date: 20190917

PP01 Preservation of patent right
PD01 Discharge of preservation of patent

Date of cancellation: 20200714

Granted publication date: 20190917

PD01 Discharge of preservation of patent