CN110662169B - 一种终端设备的匹配方法及装置 - Google Patents
一种终端设备的匹配方法及装置 Download PDFInfo
- Publication number
- CN110662169B CN110662169B CN201910909599.3A CN201910909599A CN110662169B CN 110662169 B CN110662169 B CN 110662169B CN 201910909599 A CN201910909599 A CN 201910909599A CN 110662169 B CN110662169 B CN 110662169B
- Authority
- CN
- China
- Prior art keywords
- terminal device
- information
- equipment
- terminal
- acquired
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W16/00—Network planning, e.g. coverage or traffic planning tools; Network deployment, e.g. resource partitioning or cells structures
- H04W16/22—Traffic simulation tools or models
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请提供一种终端设备的匹配方法及装置,通过获取的WIFI探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息,可以确定第一终端设备的第一行为规律和第二终端设备的第二行为规律,并按照第一行为规律,可以对缺失的第一设备信息进行补充,以及按照第二行为规律,可以对缺失的第二设备信息进行补充,这样,可以使设备信息更加完整,并根据采集的和补充后的第一设备信息和第二设备信息,可以更好地生成表征第一终端设备和第二终端设备之间关联关系的特征向量,并通过将该特征向量输入目标匹配模型中,可以准确地确定出第一终端设备和第二终端设备是否为同一终端设备,可以提高匹配的准确性。
Description
技术领域
本申请涉及信息匹配技术领域,尤其涉及一种终端设备的匹配方法及装置。
背景技术
目前,WIFI探针和手机电子围栏都是一种有效的采集终端设备的设备信息的设备,广泛被应用于各个场景,比如,监测景区的游客量、高速公路的测速、网络环境的监测、定位等场景。
但是,WIFI探针和手机电子围栏提供的是不同的服务,WIFI探针采集的是终端设备的媒体存取控制位址(Media Access Control Address,MAC),手机电子围栏采集的是终端设备的国际移动用户识别码(International Mobile Subscriber Identity,IMSI),而且WIFI探针和手机电子围栏都不能采集到终端设备的额外信息,并且终端设备的这两个MAC和IMSI设备标识没有匹配表。因此,怎么准确的将WIFI探针采集到的MAC和手机电子围栏采集到的IMSI匹配起来是目前亟待解决的技术问题。
发明内容
有鉴于此,本申请实施例的目的在于提供一种终端设备的匹配方法及装置,可以准确地确定出第一终端设备和第二终端设备是否为同一终端设备,可以提高匹配的准确性。
本申请主要包括以下几个方面:
第一方面,本申请实施例提供一种终端设备的匹配方法,所述匹配方法包括:
获取WIFI探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息;所述第一设备信息中的所述第一终端设备的第一设备标识和所述第二设备信息中的所述第二终端设备的第二设备标识的标识类型不同;
根据所述第一设备信息,确定所述第一终端设备的第一行为规律,以及根据所述第二设备信息,确定所述第二终端设备的第二行为规律;
按照所述第一行为规律,对所述第一终端设备缺失的第一设备信息进行补充,以及按照所述第二行为规律,对所述第二终端设备缺失的第二设备信息进行补充;
根据采集的和补充后的所述第一终端设备的第一设备信息,以及所述第二终端设备的第二设备信息,生成表征所述第一终端设备和所述第二终端设备之间关联关系的特征向量;
将所述特征向量输入预先训练好的目标匹配模型中,确定所述第一终端设备和所述第二终端设备是否为同一终端设备。
在一种可能的实施方式中,所述第一设备信息包括采集到所述第一终端设备的各个第一采集时刻和各个第一采集地点;所述第二设备信息包括采集到所述第二终端设备的各个第二采集时刻和各个第二采集地点;所述根据所述第一设备信息,确定所述第一终端设备的第一行为规律,以及根据所述第二设备信息,确定所述第二终端设备的第二行为规律,包括:
根据所述各个第一采集时刻和所述各个第一采集地点,判断所述第一终端设备是否在不同日期的同一第一时间段出现在同一第一采集地点;若是,则将所述第一终端设备在所述第一时间段出现在同一第一采集地点的行为规律,确定为所述第一行为规律;
以及,根据所述各个第二采集时刻和所述各个第二采集地点,判断所述第二终端设备是否在不同日期的同一第二时间段出现在同一第二采集地点;若是,则将所述第二终端设备在所述第二时间段出现在同一第二采集地点的行为规律,确定为所述第二行为规律。
在一种可能的实施方式中,所述按照所述第一行为规律,对所述第一终端设备缺失的第一设备信息进行补充,以及按照所述第二行为规律,对所述第二终端设备缺失的第二设备信息进行补充,包括:
若在一个或多个日期里没有采集到所述第一设备信息,且在所述一个或多个日期中存在满足所述第一行为规律的第一日期,则按照所述第一行为规律,对所述第一日期缺失的第一设备信息进行补充;
以及,若在一个或多个日期里没有采集到所述第二设备信息,且在所述一个或多个日期中存在满足所述第二行为规律的第二日期,则按照所述第二行为规律,对所述第二日期缺失的第二设备信息进行补充。
在一种可能的实施方式中,所述根据采集的和补充后的所述第一终端设备的第一设备信息,以及所述第二终端设备的第二设备信息,生成表征所述第一终端设备和所述第二终端设备之间关联关系的特征向量,包括:
根据采集的所述第一设备信息和所述第二设备信息,确定所述特征向量的第一特征信息;
根据补充后的所述第一设备信息和所述第二设备信息,确定所述特征向量的第二特征信息;
根据所述第一特征信息和所述第二特征信息,生成所述特征向量。
在一种可能的实施方式中,所述第一特征信息包括以下信息中的至少一种:所述第一终端设备被采集到的第一采集时刻和所述第二终端设备被采集到的第二采集时刻之间的时间间隔小于第一预设时长且出现在相同地点的地点数量、所述第一终端设备被采集到的第一采集地点的地点数量、所述第二终端设备被采集到的第二采集地点的地点数量、所述第一终端设备和所述第二终端设备被采集到在相同地点且被采集的时间间隔小于第二预设时长的次数;
所述第二特征信息包括以下信息中的至少一种:所述第一终端设备和所述第二终端设备在同一预设时间段内,被采集到在相同时间内出现在相同地点的总次数、所述第一终端设备和所述第二终端设备在相同时间内同时出现的地点数量。
在一种可能的实施方式中,根据以下步骤训练所述目标匹配模型:
将同一终端设备的特征向量,确定为正样本,并为所述正样本添加第一标签;
将不同终端设备的特征向量,确定为负样本,并为所述负样本添加第二标签;
根据所述正样本、所述负样本、所述第一标签和所述第二标签,对初始匹配模型进行训练,生成所述目标匹配模型。
在一种可能的实施方式中,所述将所述特征向量输入预先训练好的目标匹配模型中,确定所述第一终端设备和所述第二终端设备是否为同一终端设备,包括:
将所述特征向量输入预先训练好的目标匹配模型中,输出所述第一终端设备和所述第二终端设备是否为同一终端设备的目标概率;
根据所述目标概率,确定所述第一终端设备和所述第二终端设备是否为同一终端设备。
第二方面,本申请实施例还提供一种终端设备的匹配装置,所述匹配装置包括:
获取模块,用于获取WIFI探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息;所述第一设备信息中的所述第一终端设备的第一设备标识和所述第二设备信息中的所述第二终端设备的第二设备标识的标识类型不同;
第一确定模块,用于根据所述第一设备信息,确定所述第一终端设备的第一行为规律,以及根据所述第二设备信息,确定所述第二终端设备的第二行为规律;
补充模块,用于按照所述第一行为规律,对所述第一终端设备缺失的第一设备信息进行补充,以及按照所述第二行为规律,对所述第二终端设备缺失的第二设备信息进行补充;
生成模块,用于根据采集的和补充后的所述第一终端设备的第一设备信息,以及所述第二终端设备的第二设备信息,生成表征所述第一终端设备和所述第二终端设备之间关联关系的特征向量;
第二确定模块,用于将所述特征向量输入预先训练好的目标匹配模型中,确定所述第一终端设备和所述第二终端设备是否为同一终端设备。
在一种可能的实施方式中,所述第一设备信息包括采集到所述第一终端设备的各个第一采集时刻和各个第一采集地点;所述第二设备信息包括采集到所述第二终端设备的各个第二采集时刻和各个第二采集地点;所述第一确定模块包括:
第一判断单元,用于根据所述各个第一采集时刻和所述各个第一采集地点,判断所述第一终端设备是否在不同日期的同一第一时间段出现在同一第一采集地点;若是,则将所述第一终端设备在所述第一时间段出现在同一第一采集地点的行为规律,确定为所述第一行为规律;
第二判断单元,用于根据所述各个第二采集时刻和所述各个第二采集地点,判断所述第二终端设备是否在不同日期的同一第二时间段出现在同一第二采集地点;若是,则将所述第二终端设备在所述第二时间段出现在同一第二采集地点的行为规律,确定为所述第二行为规律。
在一种可能的实施方式中,所述补充模块包括:
第一补充单元,用于若在一个或多个日期里没有采集到所述第一设备信息,且在所述一个或多个日期中存在满足所述第一行为规律的第一日期,则按照所述第一行为规律,对所述第一日期缺失的第一设备信息进行补充;
第二补充单元,用于若在一个或多个日期里没有采集到所述第二设备信息,且在所述一个或多个日期中存在满足所述第二行为规律的第二日期,则按照所述第二行为规律,对所述第二日期缺失的第二设备信息进行补充。
在一种可能的实施方式中,所述生成模块包括:
第一确定单元,用于根据采集的所述第一设备信息和所述第二设备信息,确定所述特征向量的第一特征信息;
第二确定单元,用于根据补充后的所述第一设备信息和所述第二设备信息,确定所述特征向量的第二特征信息;
生成单元,用于根据所述第一特征信息和所述第二特征信息,生成所述特征向量。
在一种可能的实施方式中,所述第一特征信息包括以下信息中的至少一种:所述第一终端设备被采集到的第一采集时刻和所述第二终端设备被采集到的第二采集时刻之间的时间间隔小于第一预设时长且出现在相同地点的地点数量、所述第一终端设备被采集到的第一采集地点的地点数量、所述第二终端设备被采集到的第二采集地点的地点数量、所述第一终端设备和所述第二终端设备被采集到在相同地点且被采集的时间间隔小于第二预设时长的次数;
所述第二特征信息包括以下信息中的至少一种:所述第一终端设备和所述第二终端设备在同一预设时间段内,被采集到在相同时间内出现在相同地点的总次数、所述第一终端设备和所述第二终端设备在相同时间内同时出现的地点数量。
在一种可能的实施方式中,所述匹配装置还包括训练模块;所述训练模块,用于根据以下步骤训练所述目标匹配模型:
将同一终端设备的特征向量,确定为正样本,并为所述正样本添加第一标签;
将不同终端设备的特征向量,确定为负样本,并为所述负样本添加第二标签;
根据所述正样本、所述负样本、所述第一标签和所述第二标签,对初始匹配模型进行训练,生成所述目标匹配模型。
在一种可能的实施方式中,所述第二确定模块,用于根据以下步骤确定所述第一终端设备和所述第二终端设备是否为同一终端设备:
将所述特征向量输入预先训练好的目标匹配模型中,输出所述第一终端设备和所述第二终端设备是否为同一终端设备的目标概率;
根据所述目标概率,确定所述第一终端设备和所述第二终端设备是否为同一终端设备。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的终端设备的匹配方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面或第一方面中任一种可能的实施方式中所述的终端设备的匹配方法的步骤。
本申请实施例中,通过获取的WIFI探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息,可以确定第一终端设备的第一行为规律和第二终端设备的第二行为规律,并按照第一行为规律,可以对缺失的第一设备信息进行补充,以及按照第二行为规律,可以对缺失的第二设备信息进行补充,这样,可以使设备信息更加完整,并根据采集的和补充后的第一设备信息和第二设备信息,可以更好地生成表征第一终端设备和第二终端设备之间关联关系的特征向量,并通过将该特征向量输入目标匹配模型中,可以准确地确定出第一终端设备和第二终端设备是否为同一终端设备,可以提高匹配的准确性。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种终端设备的匹配方法的流程图;
图2示出了本申请实施例所提供的一种终端设备的匹配装置的功能模块图之一;
图3示出了图2中的第一确定模块的功能模块图;
图4示出了图2中的补充模块的功能模块图;
图5示出了图2中的生成模块的功能模块图;
图6示出了本申请实施例所提供的一种终端设备的匹配装置的功能模块图之二;
图7示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“如何确定MAC和IMSI这两个设备标识是否来自同一终端设备”,给出以下实施方式,对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。
本申请实施例下述方法、装置、电子设备或计算机可读存储介质可以应用于任何需要进行终端设备的匹配的场景,本申请实施例并不对具体的应用场景作限制,任何使用本申请实施例提供的终端设备的匹配方法及装置的方案均在本申请保护范围内。
值得注意的是,WIFI探针和手机电子围栏提供的是不同的服务,WIFI探针采集的是终端设备的媒体存取控制位址(Media Access Control Address,MAC),手机电子围栏采集的是终端设备的国际移动用户识别码(International Mobile Subscriber Identity,IMSI),而且WIFI探针和手机电子围栏都不能采集到终端设备的额外信息,并且终端设备的这两个MAC和IMSI设备标识没有匹配表。在本申请提出之前,现有方案中,没有考虑采集的终端设备的设备信息的缺失性,直接根据缺失的设备信息,来判断MAC和IMSI是否来自同一终端设备,匹配的准确率较低。
针对上述问题,本申请实施例中,通过获取的WIFI探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息,可以确定第一终端设备的第一行为规律和第二终端设备的第二行为规律,并按照第一行为规律,可以对缺失的第一设备信息进行补充,以及按照第二行为规律,可以对缺失的第二设备信息进行补充,这样,可以使设备信息更加完整,并根据采集的和补充后的第一设备信息和第二设备信息,可以更好地生成表征第一终端设备和第二终端设备之间关联关系的特征向量,并通过将该特征向量输入目标匹配模型中,可以准确地确定出第一终端设备和第二终端设备是否为同一终端设备,可以提高匹配的准确性。
需要说明的是,WIFI探针是指在该设备的探测范围内,可以检测到信号覆盖范围内的所有终端设备,并记录采集到终端设备的时刻、地点和设备标识MAC;手机电子围栏又称无线数据采集终端,属于公共安全卡口型设备,能够对特定的区域或指定的人员进行精确管控。
这里,网络中每台终端设备都有一个唯一的设备标识MAC地址,由终端设备制造商生产时写在硬件内部,MAC地址通常用12个16进制数表示,每2个16进制数之间用冒号隔开,如08:00:20:0A:8C:6D就是一个MAC地址;国际移动用户识别码IMSI是用于区分蜂窝网络中不同用户的、在所有蜂窝网络中不重复的识别码,IMSI码比如460003111370261。
为便于对本申请进行理解,下面结合具体实施例对本申请提供的技术方案进行详细说明。
图1为本申请实施例所提供的一种终端设备的匹配方法的流程图。如图1所示,本申请实施例提供的终端设备的匹配方法,包括以下步骤:
S101:获取WIFI探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息;所述第一设备信息中的所述第一终端设备的第一设备标识和所述第二设备信息中的所述第二终端设备的第二设备标识的标识类型不同。
在具体实施中,获取事先部署在各个地点的WIFI探针和手机电子围栏采集的终端设备的设备信息,具体地,可以获取预设时间段内WIFI探针和手机电子围栏采集的终端设备的设备信息,该预设时间段可以为几个月。
需要说明的是,WIFI探针和手机电子围栏提供的是不同的服务,WIFI探针采集的是终端设备的MAC地址,手机电子围栏采集的是终端设备的IMSI码,对于本申请WIFI探针采集的第一终端设备的第一设备信息中的第一设备标识为MAC地址,手机电子围栏采集的第二终端设备的第二设备信息中的第二设备标识为IMSI码,其中,第一终端设备和第二终端设备可能为同一终端设备,也可能为不同的终端设备。
这里,终端设备可以为手机、笔记本、平板电脑等。
S102:根据所述第一设备信息,确定所述第一终端设备的第一行为规律,以及根据所述第二设备信息,确定所述第二终端设备的第二行为规律。
在具体实施中,在从WIFI探针获取到第一终端设备在预设时间段内的第一设备信息之后,可以根据获取到的第一终端设备的第一设备信息,确定出第一终端设备在该预设时间段内的第一行为规律;在从手机电子围栏获取到第二终端设备在预设时间段内的第二设备信息之后,可以根据获取到的第二终端设备的第二设备信息,确定出第二终端设备在该预设时间段内的第二行为规律。
需要说明的是,第一设备信息包括采集到第一终端设备的第一设备标识、各个第一采集时刻和各个第一采集地点;第二设备信息包括采集到第二终端设备的第二设备标识、各个第二采集时刻和各个第二采集地点。
在具体实施中,可以在各个地点部署WIFI探针和手机电子围栏,这样,通过WIFI探针可以采集到第一终端设备的各个第一采集时刻和各个第一采集地点,这里,不同次采集到的第一终端设备的第一采集时刻可能存在相同的情况,或者第一采集时刻落入相同时间段的情况,不同次采集到的第一终端设备的第一采集地点也可能存在相同的情况,进而,可以根据采集的第一设备信息确定第一终端设备的第一行为规律;通过手机电子围栏可以采集到第二终端设备的各个第二采集时刻和各个第二采集地点,这里,不同次采集到的第二终端设备的第二采集时刻可能存在相同的情况,或者第二采集时刻落入相同时间段的情况,不同次采集到的第二终端设备的第二采集地点也可能存在相同的情况,进而,可以根据采集的第二设备信息确定第二终端设备的第二行为规律。
进一步地,步骤S102中所述根据所述第一设备信息,确定所述第一终端设备的第一行为规律,以及根据所述第二设备信息,确定所述第二终端设备的第二行为规律,包括:
根据所述各个第一采集时刻和所述各个第一采集地点,判断所述第一终端设备是否在不同日期的同一第一时间段出现在同一第一采集地点;若是,则将所述第一终端设备在所述第一时间段出现在同一第一采集地点的行为规律,确定为所述第一行为规律。
在具体实施中,可以通过统计预设时间段内各个日期采集的各个第一采集时刻和各个第一采集地点,确定第一终端设备的第一行为规律,具体地,可以判断第一终端设备是否在不同日期的同一第一时间段出现在同一第一采集地点,若是,则将第一终端设备在第一时间段出现在同一第一采集地点的行为规律,确定为第一行为规律。
一示例中,第一终端设备在一个月的21个工作日内,有19个工作日都在9点到10点间的时间段出现在了地点A,那么可以判断第一终端设备在工作日的9点到10点的时间段的行为具有一定的规律性。
另一示例中,第一终端设备在一个月的9天周末中,有三天在8点到9点间的时间段出现在了地点B,有两天出现在地点C,还有四天没有记录,那么可以判断第一终端设备在周末的早上8点到9点间的时间段是不规律的。
根据所述各个第二采集时刻和所述各个第二采集地点,判断所述第二终端设备是否在不同日期的同一第二时间段出现在同一第二采集地点;若是,则将所述第二终端设备在所述第二时间段出现在同一第二采集地点的行为规律,确定为所述第二行为规律。
在具体实施中,可以通过统计预设时间段内各个日期采集的各个第二采集时刻和各个第二采集地点,确定第二终端设备的第二行为规律,具体地,可以判断第二终端设备是否在不同日期的同一第二时间段出现在同一第二采集地点,若是,则将第二终端设备在第二时间段出现在同一第二采集地点的行为规律,确定为第二行为规律。
一示例中,第二终端设备在一个月的22个工作日内,有18个工作日都在17点到18点间的时间段出现在了地点D,那么可以判断第二终端设备在工作日的17点到18点的时间段的行为具有一定的规律性。
另一示例中,第二终端设备在一个月的8天周末中,有两天在17点到18点间的时间段出现在了地点E,有三天出现在地点F,有三天出现在地点G,那么可以判断第二终端设备在周末的17点到18点间的时间段是不规律的。
S103:按照所述第一行为规律,对所述第一终端设备缺失的第一设备信息进行补充,以及按照所述第二行为规律,对所述第二终端设备缺失的第二设备信息进行补充。
在具体实施中,可以通过统计预设时间段内WIFI探针在各个日期采集到的第一终端设备的设备信息,确定出第一终端设备的第一行为规律,进而根据第一行为规律,可以对在某个日期内缺失的第一终端设备的第一设备信息进行补充;可以通过统计预设时间段内手机电子围栏在各个日期采集到的第二终端设备的设备信息,确定出第二终端设备的第二行为规律,进而根据第二行为规律,可以对在某个日期内缺失的第二终端设备的第二设备信息进行补充。
需要说明的是,无论是WIFI探针还是手机电子围栏,采集得到的设备信息都有很大的缺失性。因为WIFI探针只有在终端设备打开WIFI时,才能采集终端设备的MAC地址,而电子围栏需要终端设备处于“空闲”状态才能采集设备的IMSI码,这里,“空闲”状态指的是终端设备未与基站通信,通常,终端设备在打电话、下载视频时都处于非“空闲”状态。
进一步地,步骤S103中所述按照所述第一行为规律,对所述第一终端设备缺失的第一设备信息进行补充,以及按照所述第二行为规律,对所述第二终端设备缺失的第二设备信息进行补充,包括:
若在一个或多个日期里没有采集到所述第一设备信息,且在所述一个或多个日期中存在满足所述第一行为规律的第一日期,则按照所述第一行为规律,对所述第一日期缺失的第一设备信息进行补充。
在具体实施中,若WIFI探针在预设时间段内的一个或多个日期里没有采集到第一终端设备的第一设备信息,而且在未采集到第一设备信息的一个或多个日期中,存在满足第一行为规律的第一日期,则可以按照第一行为规律,对第一日期缺失的第一设备信息进行补充。
一示例中,第一终端设备在一个月的21个工作日内,有19个工作日都在9点到10点间的时间段出现在了地点A,则认为第一终端设备在工作日的行为具有第一行为规律,若第一终端设备在另外的两个工作日的9点到10点间没有被任何WIFI探针监测到,那么可以根据第一终端设备的第一行为规律,对另外两个工作日的第一设备信息进行补充,即补充第一终端设备在另外两个工作日的9点到10点间出现在了A点,具体地,可以选取9点到10点之间的一个时刻作为另外两个工作日的第一采集时刻,比如将19个有记录的工作日的第一采集时刻的平均值9点21分,作为第一终端设备在剩下的两个没有记录的工作日的第一采集时刻,即补充第一终端设备在另外两个工作日的9点21分出现在A点。
若在一个或多个日期里没有采集到所述第二设备信息,且在所述一个或多个日期中存在满足所述第二行为规律的第二日期,则按照所述第二行为规律,对所述第二日期缺失的第二设备信息进行补充。
在具体实施中,若手机电子围栏在预设时间段内的一个或多个日期里没有采集到第二终端设备的第二设备信息,而且在未采集到第二设备信息的一个或多个日期中,存在满足第二行为规律的第二日期,则可以按照第二行为规律,对第二日期缺失的第二设备信息进行补充。
一示例中,第二终端设备在一个月的22个工作日内,有18个工作日都在17点到18点间的时间段出现在了地点D,则认为第二终端设备在工作日的行为具有第二行为规律,若第二终端设备在另外的四个工作日的17点到18点间没有被任何WIFI探针监测到,那么可以根据第二终端设备的第二行为规律,对另外四个工作日的第二设备信息进行补充,即补充第二终端设备在另外四个工作日的17点到18点间出现在了D点,具体地,可以选取17点到18点之间的一个时刻作为另外四个工作日的第二采集时刻,比如将18个有记录的工作日的第二采集时刻的平均值17点30分,作为第二终端设备在剩下的四个没有记录的工作日的第二采集时刻,即补充第一终端设备在剩下的四个没有记录的工作日的17点30分出现在D点。
S104:根据采集的和补充后的所述第一终端设备的第一设备信息,以及所述第二终端设备的第二设备信息,生成表征所述第一终端设备和所述第二终端设备之间关联关系的特征向量。
在具体实施中,在对满足第一行为规律,且WIFI探针在预设时间段内的一个或多个日期未采集到的第一终端设备的第一设备信息进行补充后,以及在对满足第二行为规律,且手机电子围栏在预设时间段内的一个或多个日期未采集到的第二终端设备的第二设备信息进行补充后,根据原先采集到的和补充后的第一终端设备的第一设备信息,以及原先采集到的和补充后的第二终端设备的第二设备信息,可以生成表征第一终端设备和第二终端设备之间关联关系的特征向量。这里,本申请通过对采集的和补充后的第一设备信息和第二设备信息进行特征提取,在使设备信息更加完整的同时,可以更好地生成表征第一终端设备和第二终端设备之间关联关系的特征向量。
进一步地,步骤S104中所述根据采集的和补充后的所述第一终端设备的第一设备信息,以及所述第二终端设备的第二设备信息,生成表征所述第一终端设备和所述第二终端设备之间关联关系的特征向量,包括以下步骤:
步骤(1):根据采集的所述第一设备信息和所述第二设备信息,确定所述特征向量的第一特征信息。
在具体实施中,从WIFI探针采集的预设时间段内各个日期的第一终端设备的第一设备信息,以及从手机电子围栏采集的预设时间段内各个日期的第二终端设备的第二设备信息中提取第一特征信息。
步骤(2):根据补充后的所述第一设备信息和所述第二设备信息,确定所述特征向量的第二特征信息。
在具体实施中,从补充后的第一终端设备的第一设备信息,以及从补充后的第二终端设备的第二设备信息中提取第二特征信息。
步骤(3):根据所述第一特征信息和所述第二特征信息,生成所述特征向量。
在具体实施中,将第一特征信息和第二特征信息都作为特征向量中的元素,进而生成特征向量。这里,生成的特征向量依赖于采集的和补充后的第一设备信息和第二设备信息,可以更好地表征第一终端设备和第二终端设备之间关联关系。
进一步地,第一特征信息包括第一终端设备被采集到的第一采集时刻和第二终端设备被采集到的第二采集时刻之间的时间间隔小于第一预设时长且出现在相同地点的地点数量、第一终端设备被采集到的第一采集地点的地点数量、第二终端设备被采集到的第二采集地点的地点数量、第一终端设备和第二终端设备被采集到在相同地点且被采集的时间间隔小于第二预设时长的次数。
这里,第一预设时长和第二预设时长可以根据实际需求进行设置。
进一步地,第二特征信息包括第一终端设备和第二终端设备在同一预设时间段内,被采集到在相同时间内出现在相同地点的总次数、第一终端设备和第二终端设备在相同时间内同时出现的地点数量。
需要说明的是,由于采集的设备信息的真实性是可以保证的,而基于行为过滤补充后的设备信息的真实性是无法保证的,故本申请分别对采集的设备信息和补充后的设备信息提取不同的特征信息,可以提高提取的特征向量的准确性。
S105:将所述特征向量输入预先训练好的目标匹配模型中,确定所述第一终端设备和所述第二终端设备是否为同一终端设备。
在具体实施中,通过将表征第一终端设备和第二终端设备之间关联关系的特征向量输入预先训练好的目标匹配模型中,可以确定第一终端设备和第二终端设备是否为同一终端设备,即确定出第一设备标识和第二设备标识是否来自同一终端设备。
需要说明的是,目标匹配模型是预先训练好的,用于确定第一终端设备和第二终端设备是否为同一终端设备。
这里,根据以下步骤训练所述目标匹配模型:
将同一终端设备的特征向量,确定为正样本,并为所述正样本添加第一标签;将不同终端设备的特征向量,确定为负样本,并为所述负样本添加第二标签;根据所述正样本、所述负样本、所述第一标签和所述第二标签,对初始匹配模型进行训练,生成所述目标匹配模型。
在具体实施中,从外部数据源中获取到大量第一设备标识和第二设备标识对,这里,第一设备标识和第二设备标识来自同一终端设备,并将这些终端设备的特征向量确定为正样本,并为正样本添加第一标签;从外部数据源中获取到大量第一设备标识和第二设备标识对,这里,第一设备标识和第二设备标识来自不同终端设备,并将这些终端设备之间的特征向量确定为负样本,并为负样本添加第二标签,进而根据正样本、负样本、第一标签和第二标签,对初始匹配模型进行训练,生成目标匹配模型。
进一步地,步骤S105中将所述特征向量输入预先训练好的目标匹配模型中,确定所述第一终端设备和所述第二终端设备是否为同一终端设备,包括:
将所述特征向量输入预先训练好的目标匹配模型中,输出所述第一终端设备和所述第二终端设备是否为同一终端设备的目标概率;根据所述目标概率,确定所述第一终端设备和所述第二终端设备是否为同一终端设备。
在具体实施中,将第一终端设备和第二终端设备之间的特征向量输入至目标匹配模型中,会输出第一终端设备和第二终端设备是否为同一终端设备的目标概率,进而,可以根据目标概率,确定第一终端设备和第二终端设备是否来自同一终端设备,即确定出第一设备标识和第二设备标识是否来自同一终端设备。这里,第一终端设备被WIFI探针采集到的第一设备信息中的第一设备标识为MAC地址,第二终端设备被手机电子围栏采集到的第二设备信息中的第二设备标识为IMSI码。
具体地,可以根据以下方式确定第一终端设备和第二终端设备是否为同一终端设备:
方式一:若目标概率大于或等于预设概率,则确定第一终端设备和第二终端设备为同一终端设备。
方式二:第一终端设备有一个,第二终端设备有多个,这样,该第一终端设备和每个第二终端设备都会对应一个目标概率,将概率最大的目标概率对应的第二终端设备和该第一终端设备,确定为同一终端设备。
方式三:第一终端设备有多个,第二终端设备有一个,这样,每个第一终端设备和该第二终端设备都会对应一个目标概率,将概率最大的目标概率对应的第一终端设备和该第二终端设备,确定为同一终端设备。
方式四:将上述方式一、方式二、方式三进行组合,即选取目标概率最大,且目标概率大于或等于预设概率对应的第一终端设备和第二终端设备确定为同一终端设备。
一示例中,第一终端设备有三个,分别为A1、A2、A3,第二终端设备有二个,分别为B1和B2,预设概率为0.8;其中,对于A1来说,A1和B1是否为同一终端设备的目标概率为0.8、A1和B2是否为同一终端设备的目标概率为0.5,故A1和B1为同一终端的概率更高;对比B1来说,B1和A2是否为同一终端设备的目标概率为0.6、B1和A3是否为同一终端设备的目标概率为0.95,故B1和A3为同一终端的概率更高,而0.8小于0.95,且0.95大于预设概率0.8,综合来看,B1和A3更可能为同一终端,因此,确定B1和A3为同一终端。
在本申请实施例中,通过获取的Wifi探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息,可以确定第一终端设备的第一行为规律和第二终端设备的第二行为规律,并按照第一行为规律,可以对缺失的第一设备信息进行补充,以及按照第二行为规律,可以对缺失的第二设备信息进行补充,这样,可以使设备信息更加完整,并根据采集的和补充后的第一设备信息和第二设备信息,可以更好地生成表征第一终端设备和第二终端设备之间关联关系的特征向量,并通过将该特征向量输入目标匹配模型中,可以准确地确定出第一终端设备和第二终端设备是否为同一终端设备,可以提高匹配的准确性。
基于同一申请构思,本申请实施例中还提供了与图1所示的终端设备的匹配方法对应的终端设备的匹配装置,由于本申请实施例中的装置解决问题的原理与本申请图1所示的终端设备的匹配方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
如图2至图6所示,图2为本申请实施例提供的一种终端设备的匹配装置200的功能模块图之一,图3为图2中的第一确定模块220的功能模块图,图4为图2中的补充模块230的功能模块图,图5为图2中的生成模块240的功能模块图,图6为本申请实施例提供的一种终端设备的匹配装置200的功能模块图之二。
如图2和图6所示,终端设备的匹配装置200包括:
获取模块210,用于获取WIFI探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息;所述第一设备信息中的所述第一终端设备的第一设备标识和所述第二设备信息中的所述第二终端设备的第二设备标识的标识类型不同;
第一确定模块220,用于根据所述第一设备信息,确定所述第一终端设备的第一行为规律,以及根据所述第二设备信息,确定所述第二终端设备的第二行为规律;
补充模块230,用于按照所述第一行为规律,对所述第一终端设备缺失的第一设备信息进行补充,以及按照所述第二行为规律,对所述第二终端设备缺失的第二设备信息进行补充;
生成模块240,用于根据采集的和补充后的所述第一终端设备的第一设备信息,以及所述第二终端设备的第二设备信息,生成表征所述第一终端设备和所述第二终端设备之间关联关系的特征向量;
第二确定模块250,用于将所述特征向量输入预先训练好的目标匹配模型中,确定所述第一终端设备和所述第二终端设备是否为同一终端设备。
在一种可能的实施方式中,所述第一设备信息包括采集到所述第一终端设备的各个第一采集时刻和各个第一采集地点;所述第二设备信息包括采集到所述第二终端设备的各个第二采集时刻和各个第二采集地点;如图3所示,所述第一确定模块220包括:
第一判断单元222,用于根据所述各个第一采集时刻和所述各个第一采集地点,判断所述第一终端设备是否在不同日期的同一第一时间段出现在同一第一采集地点;若是,则将所述第一终端设备在所述第一时间段出现在同一第一采集地点的行为规律,确定为所述第一行为规律;
第二判断单元224,用于根据所述各个第二采集时刻和所述各个第二采集地点,判断所述第二终端设备是否在不同日期的同一第二时间段出现在同一第二采集地点;若是,则将所述第二终端设备在所述第二时间段出现在同一第二采集地点的行为规律,确定为所述第二行为规律。
在一种可能的实施方式中,如图4所示,所述补充模块230包括:
第一补充单元232,用于若在一个或多个日期里没有采集到所述第一设备信息,且在所述一个或多个日期中存在满足所述第一行为规律的第一日期,则按照所述第一行为规律,对所述第一日期缺失的第一设备信息进行补充;
第二补充单元234,用于若在一个或多个日期里没有采集到所述第二设备信息,且在所述一个或多个日期中存在满足所述第二行为规律的第二日期,则按照所述第二行为规律,对所述第二日期缺失的第二设备信息进行补充。
在一种可能的实施方式中,如图5所示,所述生成模块240包括:
第一确定单元242,用于根据采集的所述第一设备信息和所述第二设备信息,确定所述特征向量的第一特征信息;
第二确定单元244,用于根据补充后的所述第一设备信息和所述第二设备信息,确定所述特征向量的第二特征信息;
生成单元246,用于根据所述第一特征信息和所述第二特征信息,生成所述特征向量。
在一种可能的实施方式中,所述第一特征信息包括以下信息中的至少一种:所述第一终端设备被采集到的第一采集时刻和所述第二终端设备被采集到的第二采集时刻之间的时间间隔小于第一预设时长且出现在相同地点的地点数量、所述第一终端设备被采集到的第一采集地点的地点数量、所述第二终端设备被采集到的第二采集地点的地点数量、所述第一终端设备和所述第二终端设备被采集到在相同地点且被采集的时间间隔小于第二预设时长的次数;
所述第二特征信息包括以下信息中的至少一种:所述第一终端设备和所述第二终端设备在同一预设时间段内,被采集到在相同时间内出现在相同地点的总次数、所述第一终端设备和所述第二终端设备在相同时间内同时出现的地点数量。
在一种可能的实施方式中,如图6所示,所述匹配装置200还包括训练模块260;所述训练模块260,用于根据以下步骤训练所述目标匹配模型:
将同一终端设备的特征向量,确定为正样本,并为所述正样本添加第一标签;
将不同终端设备的特征向量,确定为负样本,并为所述负样本添加第二标签;
根据所述正样本、所述负样本、所述第一标签和所述第二标签,对初始匹配模型进行训练,生成所述目标匹配模型。
在一种可能的实施方式中,如图2和图6所示,所述第二确定模块250,用于根据以下步骤确定所述第一终端设备和所述第二终端设备是否为同一终端设备:
将所述特征向量输入预先训练好的目标匹配模型中,输出所述第一终端设备和所述第二终端设备是否为同一终端设备的目标概率;
根据所述目标概率,确定所述第一终端设备和所述第二终端设备是否为同一终端设备。
本申请实施例中,通过获取模块210获取的Wifi探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息,可以通过第一确定模块220确定第一终端设备的第一行为规律和第二终端设备的第二行为规律,并按照第一行为规律,可以通过补充模块230对缺失的第一设备信息进行补充,以及按照第二行为规律,可以对缺失的第二设备信息进行补充,这样,可以使设备信息更加完整,并根据采集的和补充后的第一设备信息和第二设备信息,可以更好地生成表征第一终端设备和第二终端设备之间关联关系的特征向量,并通过将该特征向量输入目标匹配模型中,可以准确地确定出第一终端设备和第二终端设备是否为同一终端设备,可以提高匹配的准确性。
基于同一申请构思,参见图7所示,为本申请实施例提供的一种电子设备700的结构示意图,包括:处理器710、存储器720和总线730,所述存储器720存储有所述处理器710可执行的机器可读指令,当电子设备700运行时,所述处理器710与所述存储器720之间通过所述总线730进行通信,所述机器可读指令被所述处理器710运行时执行如图1所示的终端设备的匹配方法的步骤。
具体地,所述机器可读指令被所述处理器710执行时可以执行如下处理:
获取WIFI探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息;所述第一设备信息中的所述第一终端设备的第一设备标识和所述第二设备信息中的所述第二终端设备的第二设备标识的标识类型不同;
根据所述第一设备信息,确定所述第一终端设备的第一行为规律,以及根据所述第二设备信息,确定所述第二终端设备的第二行为规律;
按照所述第一行为规律,对所述第一终端设备缺失的第一设备信息进行补充,以及按照所述第二行为规律,对所述第二终端设备缺失的第二设备信息进行补充;
根据采集的和补充后的所述第一终端设备的第一设备信息,以及所述第二终端设备的第二设备信息,生成表征所述第一终端设备和所述第二终端设备之间关联关系的特征向量;
将所述特征向量输入预先训练好的目标匹配模型中,确定所述第一终端设备和所述第二终端设备是否为同一终端设备。
本申请实施例中,通过获取的Wifi探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息,可以确定第一终端设备的第一行为规律和第二终端设备的第二行为规律,并按照第一行为规律,可以对缺失的第一设备信息进行补充,以及按照第二行为规律,可以对缺失的第二设备信息进行补充,这样,可以使设备信息更加完整,并根据采集的和补充后的第一设备信息和第二设备信息,可以更好地生成表征第一终端设备和第二终端设备之间关联关系的特征向量,并通过将该特征向量输入目标匹配模型中,可以准确地确定出第一终端设备和第二终端设备是否为同一终端设备,可以提高匹配的准确性。
基于同一申请构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行图1所示的终端设备的匹配方法的步骤。
具体地,所述存储介质能够为通用的存储介质,如移动磁盘、硬盘等,所述存储介质上的计算机程序被运行时,能够执行上述终端设备的匹配方法,可以准确地确定出第一终端设备和第二终端设备是否为同一终端设备,可以提高匹配的准确性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应所述理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来,所述计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种终端设备的匹配方法,其特征在于,所述匹配方法包括:
获取WIFI探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息;所述第一设备信息中的所述第一终端设备的第一设备标识和所述第二设备信息中的所述第二终端设备的第二设备标识的标识类型不同;
根据所述第一设备信息,确定所述第一终端设备的第一行为规律,以及根据所述第二设备信息,确定所述第二终端设备的第二行为规律;
按照所述第一行为规律,对所述第一终端设备缺失的第一设备信息进行补充,以及按照所述第二行为规律,对所述第二终端设备缺失的第二设备信息进行补充;
根据采集的和补充后的所述第一终端设备的第一设备信息,以及所述第二终端设备的第二设备信息,生成表征所述第一终端设备和所述第二终端设备之间关联关系的特征向量;
将所述特征向量输入预先训练好的目标匹配模型中,确定所述第一终端设备和所述第二终端设备是否为同一终端设备;
其中,根据以下步骤训练所述目标匹配模型:
将同一终端设备的特征向量,确定为正样本,并为所述正样本添加第一标签;所述同一终端设备的特征向量用于表征该终端设备的样本第一设备标识和样本第二设备标识之间的关联关系;
将不同终端设备的特征向量,确定为负样本,并为所述负样本添加第二标签;所述不同终端设备的特征向量用于表征第一终端设备的样本第一设备标识和第二终端的样本第二设备标识之间的关联关系;
根据所述正样本、所述负样本、所述第一标签和所述第二标签,对初始匹配模型进行训练,生成所述目标匹配模型;
所述根据所述正样本、所述负样本、所述第一标签和所述第二标签,对初始匹配模型进行训练,生成所述目标匹配模型,包括:
将所述同一终端设备的特征向量输入初始匹配模型,得到样本第一设备标识和样本第二设备标识是否来自同一终端设备的第一预测概率,并根据第一预测概率和第一标签调整初始模型的模型参数;以及,将不同终端设备的特征向量输入初始匹配模型,得到样本第一设备标识和样本第二设备标识是否来自同一终端设备的第二预测概率,并根据第二预测概率和第二标签调整初始模型的模型参数,训练得到目标匹配模型。
2.根据权利要求1所述的匹配方法,其特征在于,所述第一设备信息包括采集到所述第一终端设备的各个第一采集时刻和各个第一采集地点;所述第二设备信息包括采集到所述第二终端设备的各个第二采集时刻和各个第二采集地点;所述根据所述第一设备信息,确定所述第一终端设备的第一行为规律,以及根据所述第二设备信息,确定所述第二终端设备的第二行为规律,包括:
根据所述各个第一采集时刻和所述各个第一采集地点,判断所述第一终端设备是否在不同日期的同一第一时间段出现在同一第一采集地点;若是,则将所述第一终端设备在所述第一时间段出现在同一第一采集地点的行为规律,确定为所述第一行为规律;以及,
根据所述各个第二采集时刻和所述各个第二采集地点,判断所述第二终端设备是否在不同日期的同一第二时间段出现在同一第二采集地点;若是,则将所述第二终端设备在所述第二时间段出现在同一第二采集地点的行为规律,确定为所述第二行为规律。
3.根据权利要求2所述的匹配方法,其特征在于,所述按照所述第一行为规律,对所述第一终端设备缺失的第一设备信息进行补充,以及按照所述第二行为规律,对所述第二终端设备缺失的第二设备信息进行补充,包括:
若在一个或多个日期里没有采集到所述第一设备信息,且在所述一个或多个日期中存在满足所述第一行为规律的第一日期,则按照所述第一行为规律,对所述第一日期缺失的第一设备信息进行补充;以及,
若在一个或多个日期里没有采集到所述第二设备信息,且在所述一个或多个日期中存在满足所述第二行为规律的第二日期,则按照所述第二行为规律,对所述第二日期缺失的第二设备信息进行补充。
4.根据权利要求1所述的匹配方法,其特征在于,所述根据采集的和补充后的所述第一终端设备的第一设备信息,以及所述第二终端设备的第二设备信息,生成表征所述第一终端设备和所述第二终端设备之间关联关系的特征向量,包括:
根据采集的所述第一设备信息和所述第二设备信息,确定所述特征向量的第一特征信息;
根据补充后的所述第一设备信息和所述第二设备信息,确定所述特征向量的第二特征信息;
根据所述第一特征信息和所述第二特征信息,生成所述特征向量。
5.根据权利要求4所述的匹配方法,其特征在于,所述第一特征信息包括以下信息中的至少一种:所述第一终端设备被采集到的第一采集时刻和所述第二终端设备被采集到的第二采集时刻之间的时间间隔小于第一预设时长且出现在相同地点的地点数量、所述第一终端设备被采集到的第一采集地点的地点数量、所述第二终端设备被采集到的第二采集地点的地点数量、所述第一终端设备和所述第二终端设备被采集到在相同地点且被采集的时间间隔小于第二预设时长的次数;
所述第二特征信息包括以下信息中的至少一种:所述第一终端设备和所述第二终端设备在同一预设时间段内,被采集到在相同时间内出现在相同地点的总次数、所述第一终端设备和所述第二终端设备在相同时间内同时出现的地点数量。
6.根据权利要求1所述的匹配方法,其特征在于,所述将所述特征向量输入预先训练好的目标匹配模型中,确定所述第一终端设备和所述第二终端设备是否为同一终端设备,包括:
将所述特征向量输入预先训练好的目标匹配模型中,输出所述第一终端设备和所述第二终端设备是否为同一终端设备的目标概率;
根据所述目标概率,确定所述第一终端设备和所述第二终端设备是否为同一终端设备;
所述根据所述目标概率,确定所述第一终端设备和所述第二终端设备是否为同一终端设备,包括:
若目标概率大于或等于预设概率,则确定第一终端设备和第二终端设备为同一终端设备。
7.一种终端设备的匹配装置,其特征在于,所述匹配装置包括:
获取模块,用于获取WIFI探针采集的第一终端设备的第一设备信息,以及手机电子围栏采集的第二终端设备的第二设备信息;所述第一设备信息中的所述第一终端设备的第一设备标识和所述第二设备信息中的所述第二终端设备的第二设备标识的标识类型不同;
第一确定模块,用于根据所述第一设备信息,确定所述第一终端设备的第一行为规律,以及根据所述第二设备信息,确定所述第二终端设备的第二行为规律;
补充模块,用于按照所述第一行为规律,对所述第一终端设备缺失的第一设备信息进行补充,以及按照所述第二行为规律,对所述第二终端设备缺失的第二设备信息进行补充;
生成模块,用于根据采集的和补充后的所述第一终端设备的第一设备信息,以及所述第二终端设备的第二设备信息,生成表征所述第一终端设备和所述第二终端设备之间关联关系的特征向量;
第二确定模块,用于将所述特征向量输入预先训练好的目标匹配模型中,确定所述第一终端设备和所述第二终端设备是否为同一终端设备;
训练模块,用于根据以下步骤训练所述目标匹配模型:
将同一终端设备的特征向量,确定为正样本,并为所述正样本添加第一标签;所述同一终端设备的特征向量用于表征该终端设备的样本第一设备标识和样本第二设备标识之间的关联关系;
将不同终端设备的特征向量,确定为负样本,并为所述负样本添加第二标签;所述不同终端设备的特征向量用于表征第一终端设备的样本第一设备标识和第二终端的样本第二设备标识之间的关联关系;
根据所述正样本、所述负样本、所述第一标签和所述第二标签,对初始匹配模型进行训练,生成所述目标匹配模型;
所述根据所述正样本、所述负样本、所述第一标签和所述第二标签,对初始匹配模型进行训练,生成所述目标匹配模型,包括:
将所述同一终端设备的特征向量输入初始匹配模型,得到样本第一设备标识和样本第二设备标识是否来自同一终端设备的第一预测概率,并根据第一预测概率和第一标签调整初始模型的模型参数;以及,将不同终端设备的特征向量输入初始匹配模型,得到样本第一设备标识和样本第二设备标识是否来自同一终端设备的第二预测概率,并根据第二预测概率和第二标签调整初始模型的模型参数,训练得到目标匹配模型。
8.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行如权利要求1至6任一所述的终端设备的匹配方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至6任一所述的终端设备的匹配方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910909599.3A CN110662169B (zh) | 2019-09-25 | 2019-09-25 | 一种终端设备的匹配方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910909599.3A CN110662169B (zh) | 2019-09-25 | 2019-09-25 | 一种终端设备的匹配方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110662169A CN110662169A (zh) | 2020-01-07 |
CN110662169B true CN110662169B (zh) | 2021-04-27 |
Family
ID=69039023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910909599.3A Active CN110662169B (zh) | 2019-09-25 | 2019-09-25 | 一种终端设备的匹配方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110662169B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104918327A (zh) * | 2015-06-08 | 2015-09-16 | 浙江每日互动网络科技有限公司 | 一种实时探测移动终端地理位置的方法及系统 |
CN107358158A (zh) * | 2017-06-07 | 2017-11-17 | 浙江大华技术股份有限公司 | 一种团伙作案预警方法及装置 |
CN108320520A (zh) * | 2018-02-07 | 2018-07-24 | 江苏本能科技有限公司 | 重点车辆驾驶人员比对方法及系统 |
CN207911033U (zh) * | 2018-03-23 | 2018-09-25 | 廖晓曦 | 一种基于无线通信技术的移动终端监控系统 |
CN109033440A (zh) * | 2018-08-15 | 2018-12-18 | 武汉烽火众智数字技术有限责任公司 | 一种视频侦查多维轨迹分析方法 |
CN109461106A (zh) * | 2018-10-11 | 2019-03-12 | 浙江公共安全技术研究院有限公司 | 一种多维信息感知处理方法 |
CN109615573A (zh) * | 2018-12-05 | 2019-04-12 | 武汉烽火众智数字技术有限责任公司 | 基于大数据的外地人员流窜作案分析方法及系统 |
CN109886204A (zh) * | 2019-02-25 | 2019-06-14 | 武汉烽火众智数字技术有限责任公司 | 一种基于大数据警务应用的多维感知系统 |
CN110162588A (zh) * | 2019-05-29 | 2019-08-23 | 浪潮软件集团有限公司 | 一种多维关联信息的轨迹融合方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130157628A1 (en) * | 2009-01-15 | 2013-06-20 | Dt Systems, Inc. | Smart phone based electronic fence system |
US20130031047A1 (en) * | 2011-07-28 | 2013-01-31 | Microsoft Corporation | Efficiency and accuracy of geo-fencing based on user history |
CN109345260B (zh) * | 2018-10-09 | 2021-11-30 | 北京芯盾时代科技有限公司 | 一种异常操作行为的检测方法 |
CN109614450A (zh) * | 2018-12-05 | 2019-04-12 | 武汉烽火众智数字技术有限责任公司 | 基于多维数据的人员去向分析的方法及系统 |
-
2019
- 2019-09-25 CN CN201910909599.3A patent/CN110662169B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104918327A (zh) * | 2015-06-08 | 2015-09-16 | 浙江每日互动网络科技有限公司 | 一种实时探测移动终端地理位置的方法及系统 |
CN107358158A (zh) * | 2017-06-07 | 2017-11-17 | 浙江大华技术股份有限公司 | 一种团伙作案预警方法及装置 |
CN108320520A (zh) * | 2018-02-07 | 2018-07-24 | 江苏本能科技有限公司 | 重点车辆驾驶人员比对方法及系统 |
CN207911033U (zh) * | 2018-03-23 | 2018-09-25 | 廖晓曦 | 一种基于无线通信技术的移动终端监控系统 |
CN109033440A (zh) * | 2018-08-15 | 2018-12-18 | 武汉烽火众智数字技术有限责任公司 | 一种视频侦查多维轨迹分析方法 |
CN109461106A (zh) * | 2018-10-11 | 2019-03-12 | 浙江公共安全技术研究院有限公司 | 一种多维信息感知处理方法 |
CN109615573A (zh) * | 2018-12-05 | 2019-04-12 | 武汉烽火众智数字技术有限责任公司 | 基于大数据的外地人员流窜作案分析方法及系统 |
CN109886204A (zh) * | 2019-02-25 | 2019-06-14 | 武汉烽火众智数字技术有限责任公司 | 一种基于大数据警务应用的多维感知系统 |
CN110162588A (zh) * | 2019-05-29 | 2019-08-23 | 浪潮软件集团有限公司 | 一种多维关联信息的轨迹融合方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110662169A (zh) | 2020-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110505196B (zh) | 物联网卡异常检测方法及装置 | |
CN108009844B (zh) | 确定广告作弊行为的方法、装置及云服务器 | |
CN107330459B (zh) | 一种数据处理方法、装置和电子设备 | |
CN111479321B (zh) | 一种网格构建方法、装置、电子设备和存储介质 | |
CN108200643B (zh) | 一种定位智能终端的方法、装置 | |
CN110545292B (zh) | 一种异常流量监测的方法及装置 | |
CN110706376A (zh) | 一种人流量统计方法和装置 | |
CN105208528A (zh) | 一种用于识别同行人员的系统及方法 | |
EP2495696A1 (en) | Management server, population information calculation management server, zero population distribution area management method, and population information calculation method | |
CN109885636B (zh) | 一种用户画像方法和服务器 | |
CN110674879B (zh) | 一种标识匹配方法、装置、电子设备及可读存储介质 | |
CN106610997B (zh) | 人物信息处理方法、装置及系统 | |
CN108182282A (zh) | 地址真实性验证方法、装置及电子设备 | |
CN111629374A (zh) | 一种物理地址的识别方法、装置、计算机设备和存储介质 | |
CN108197050B (zh) | 一种设备识别方法、装置及系统 | |
CN110662169B (zh) | 一种终端设备的匹配方法及装置 | |
CN106911537A (zh) | 信息采集方法和信息采集装置 | |
CN108765823B (zh) | 一种报警方法、装置和系统 | |
CN111984519A (zh) | 一种用于业务系统的测试方法及其装置 | |
CN111935637A (zh) | 一种人流量分析方法、存储介质及处理器 | |
CN109121137A (zh) | 双卡终端的用户号码使用类型识别方法及装置 | |
CN107040603A (zh) | 用于确定应用程序App活跃场景的方法和装置 | |
CN109783265B (zh) | 异常业务数据处理方法及装置 | |
CN112256552A (zh) | 地图引擎的压力测试方法及装置 | |
CN106993290B (zh) | 通信记录的检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |