CN108399387A - 用于识别目标群体的数据处理方法及装置 - Google Patents

用于识别目标群体的数据处理方法及装置 Download PDF

Info

Publication number
CN108399387A
CN108399387A CN201810164720.XA CN201810164720A CN108399387A CN 108399387 A CN108399387 A CN 108399387A CN 201810164720 A CN201810164720 A CN 201810164720A CN 108399387 A CN108399387 A CN 108399387A
Authority
CN
China
Prior art keywords
data
identification
target group
group
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810164720.XA
Other languages
English (en)
Inventor
张为
朱智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Zhima Information Tech Co Ltd
Original Assignee
Nanjing Zhima Information Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Zhima Information Tech Co Ltd filed Critical Nanjing Zhima Information Tech Co Ltd
Priority to CN201810164720.XA priority Critical patent/CN108399387A/zh
Publication of CN108399387A publication Critical patent/CN108399387A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本申请公开了一种用于识别目标群体的数据处理方法,通过在预设区域内部署多个Wi‑Fi探针用于识别所述预设区域内的待检测设备,通过所述待检测设备用于获得探测数据,该方法包括:接收所述探测数据;按照预设的数据格式将所述探测数据整理为特征识别数据;以及将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,其中,所述目标群体用于作为进入预设区域内的目标场所的群体。本申请解决了现有技术中使用单个Wi‑Fi探针探测到的未经处理的Wi‑Fi信号数据和经验阈值判断特定群体进入目标场所的判定结果存在较大误差的技术问题。

Description

用于识别目标群体的数据处理方法及装置
技术领域
本申请涉及通信领域,具体而言,涉及一种用于识别目标群体的数据处理方法及装置。
背景技术
Wi-Fi探针技术是指基于Wi-Fi探测技术来识别无线访问接入点附近已开启Wi-Fi的智能手机或者其他Wi-Fi终端的技术,无需用户接入Wi-Fi,Wi-Fi探针就能够识别用户的信息。Wi-Fi探针采集到的数据主要为Mac层的信息,比如设备Mac地址、Wi-Fi信号强度、Wi-Fi信号频道、信号帧类型等。
Wi-Fi探针常被应用于客流统计领域,根据Wi-Fi终端距离Wi-Fi探针越近,探测到的信号强度越强的原理,现有技术中在区域内部署一个Wi-Fi探针,通过人为设定一个信号强度阈值,直接比较探测到的信号强度与阈值的大小来判定顾客是否进店,即当探测到的信号强度大于阈值的时候判定进店,反之判定未进店。但在实际操作中,随着探针和Wi-Fi终端之间距离的增加,探测到的信号强度减小的趋势是不稳定的,另外信号强度还与中间是否存在遮挡物等因素有关,导致单个Wi-Fi探针采集到的单条信号强度有较大的随机性,使用这种未经处理的探测到的信号强度与根据经验人为确定出的阈值来判定是否进店,判定结果也会存在较大的误差。此外,单个Wi-Fi探针的探测范围有限,在目标场所较大时,可能并不能将其全面覆盖,同样会对判定结果造成较大的误差。
针对相关技术中使用单个Wi-Fi探针探测到的未经处理的Wi-Fi信号数据和经验阈值判断特定群体进入目标场所的判定结果存在较大误差的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种用于识别目标群体的数据处理方法,以解决现有技术中使用单个Wi-Fi探针探测到的未经处理的Wi-Fi信号数据和经验阈值判断特定群体进入目标场所的判定结果存在较大误差的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种用于识别目标群体的数据处理方法,通过在预设区域内部署多个Wi-Fi探针用于识别所述预设区域内的待检测设备,通过所述待检测设备用于获得探测数据,所述方法包括:
接收所述探测数据;按照预设的数据格式将所述探测数据整理为特征识别数据;以及将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,其中,所述目标群体用于作为进入预设区域内的目标场所的群体。
进一步地,所述按照预设的数据格式将所述探测数据整理为特征识别数据包括:确定所述预设区域内部署Wi-Fi探针的探针Mac信息;获取所述待检测设备上的设备Mac信息,信号强度和探测时间戳;确定设定周期,并将所述设定周期的起始时间作为聚合时间戳;统计所述设定周期内探针探测到的设备Mac信息的次数,并计算出被探测到的信号强度的平均信号强度,同时确定其中的最大信号强度和最小信号强度。
进一步地,按照如下预设的数据格式整理得到所述特征识别数据:{探针Mac,设备Mac,探测次数,平均信号强度,最大信号强度,最小信号强度,聚合时间戳}。
进一步地,所述将所述特征识别数据作为训练特征,训练得到目标群体的识别模型包括:根据预设分类条件选取正样本和负样本;利用所述正样本和负样本的的特征识别数据训练分类模型;以及将所述分类模型作为目标群体的识别模型。
进一步地,所述根据预设分类条件选取正样本和负样本包括:将一天内被探测到的时长大于8小时,且一周内被探测到的天数不小于两天的样本定义为正样本;将一天内被探测到的时长小于3小时,且一周内被探测到的天数为一天的样本定义为负样本。
进一步地,在将所述特征识别数据作为训练特征,训练得到目标群体的识别模型之后还包括:采集所述未知群体的探测数据;按照所述预设的数据格式将所述未知群体的探测数据整理为特征识别数据;将所述未知群体的特征识别数据输入所述目标群体的识别模型;以及根据所述识别模型得出的识别结果判定未知群体是否属于目标群体。
为了实现上述目的,根据本申请的一个方面,提供了一种用于识别目标群体的数据处理装置,该装置包括:
数据采集模块,用于接收所述探测数据;数据处理模块,用于按照预设的数据格式将所述探测数据整理为特征识别数据;以及训练模块,用于将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,所述目标群体为进入预设区域内的目标场所的群体。
进一步地,所述数据处理模块包括:提取模块,用于提取所述探测数据中的特征数据;以及整理模块,用于将所述探测数据中的特征数据按照预设的数据格式整理为所述特征识别数据。
进一步地,所述数据处理装置还包括:识别模块,用于利用所述目标群体的识别模型对未知群体进行识别,所述识别模块包括:预处理模块,用于采集所述未知群体的探测数据并按照所述预设的数据格式将所述未知群体的探测数据整理为特征识别数据;以及判定模块,用于将所述未知群体的特征识别数据输入所述目标群体的识别模型并根据所述识别模型得出的识别结果判定未知群体是否属于目标群体。
进一步地,所述数据处理装置还包括:可视化模块,用于将识别目标群体的数据处理结果显示在web端,所述可视化模块包括:统计模块,用于统计预设时段内所述目标群体的数量;以及显示模块,用于将所述统计结果显示在web端。
在本申请实施例中,采用在预设区域内部署多个Wi-Fi探针的方式,通过多个Wi-Fi探针获取预设区域内的待检测设备的探测数据,能够多方位全面覆盖目标场所,对探测数据进行整理后用于训练得到目标群体的识别模型,达到了了客观、准确、稳定地识别进入预设区域内的目标场所的目标群体的目的,进而解决了现有技术中使用单个Wi-Fi探针探测到的未经处理的Wi-Fi信号数据和经验阈值判断特定群体进入目标场所的判定结果存在较大误差的问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请第一实施例的用于识别目标群体的数据处理方法的流程示意图;
图2是根据本发明第二实施例的用于识别目标群体的数据处理方法的流程示意图;
图3是根据本发明第三实施例的用于识别目标群体的数据处理方法的流程示意图;
图4是根据本发明第四实施例的用于识别目标群体的数据处理方法的流程示意图;
图5是根据本发明第一实施例的用于识别目标群体的数据处理装置的示意图;
图6是根据本发明第二实施例的用于识别目标群体的数据处理装置的示意图;
图7是根据本发明第三实施例的用于识别目标群体的数据处理装置的示意图;以及
图8是根据本发明第四实施例的用于识别目标群体的数据处理装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1是根据本申请第一实施例的用于识别目标群体的数据处理方法的流程示意图,通过在预设区域内部署多个Wi-Fi探针用于识别所述预设区域内的待检测设备,通过所述待检测设备用于获得探测数据,该方法包括如下的步骤S100至步骤S102:
步骤S100,接收所述探测数据;
在预设区域内部署多个Wi-Fi探针,可以多角度全方位的覆盖预设区域,从而保证了当待检测设备出现在预设区域内的特定目标场所或者目标场所周围时能够被至少一个Wi-Fi探针探测到。此时,接收到的多个Wi-Fi探针的探测数据是完整的,在识别目标群体时不会遗漏。
例如,在店铺内的多个区域和位置部署多个Wi-Fi探针,用以保证整个店铺被全面覆盖到,从而保证了不遗漏进店的顾客所携带设备的Wi-Fi信号,减小判定顾客进店的误差。
步骤S101,按照预设的数据格式将所述探测数据整理为特征识别数据;
通过多个Wi-Fi探针探测到的信息是多样化的,因此预先设定一种数据格式,用于将接收到的探测数据按此格式转化为后续步骤中需要的特征识别数据,该特征识别数据包含能够反映待检测设备Wi-Fi信号特征的信息。
步骤S102,将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,其中,所述目标群体用于作为进入预设区域内的目标场所的群体。
使用多个Wi-Fi探针采集到的数据样本量大,可以用于作为机器学习的训练样本,将探测数据整理后得到的特征识别数据作为训练特征,可以训练得到目标群体的识别模型,样本量越大,所述训练得到的模型就越精确,因此适量增加预设区域内的Wi-Fi探针数量,有利于提高模型的精度,从而使识别结果更加准确。
从以上的描述中,可以看出,本发明通过在预设区域内部署多个Wi-Fi探针,有效地解决了部署单个Wi-Fi探针不能全面覆盖预设区域容易造成遗漏的问题,带来获取数据全面、所得结果准确的效果;同时,通过多个Wi-Fi探针获得的大量数据样本,使用处理过的特征识别数据作为训练特征,训练得到的识别模型克服了使用经验阈值的主观性强的局限,使得能够客观、准确识别进入预设区域内的目标场所的群体。综上所述,本发明克服了现有技术的局限,实现了更加客观、稳定、准确地判断目标群体是否进入目标场所的技术效果。
图2是根据本发明第二实施例的用于识别目标群体的数据处理方法的流程示意图,该方法包括:
在上述步骤S101中按照预设的数据格式将所述探测数据整理为特征识别数据包括:
步骤S200,确定所述预设区域内部署Wi-Fi探针的探针Mac信息;
步骤S201,获取所述待检测设备上的设备Mac信息,信号强度和探测时间戳;
步骤S202,确定设定周期,并将所述设定周期的起始时间作为聚合时间戳;
步骤S203,统计所述设定周期内探针探测到的设备Mac信息的次数,并计算出被探测到的信号强度的平均信号强度,同时确定其中的最大信号强度和最小信号强度。
对设定周期内单个Wi-Fi采集到的待检测设备的Wi-Fi信号强度进行聚合,得到平均信号强度,并确定设定周期内的最大信号强度和最小信号强度,克服了采集到的单条信号强度具有随机性的问题。
将每个待检测设备被单个Wi-Fi采集到的数据按设定周期t进行聚合整理,计算这个时间周期内的平均信号强度avgsignal=(signal_1+signal_2+…+signal_n)/n,其中,signal_1,signal_2…signal_n为设定周期t内某设备被探测到的Wi-Fi信号强度,n为设定周期t内某设备被探测到的次数,通过这种算法将原始的探测信息转化为聚合信息。
例如,取3分钟为设定周期t,假设设定周期t的开始时间为begintime,截止时间时间为endtime,那么endtime-begintime=3分钟,并且将begintime作为聚合时间戳;假设设定周期t内某探针共探测到某个设备mac三次,信号强度分别为-75、-80、-85,则计算出平均信号强度为(-75-80-85)/3=-80,确定最大信号强度为-75,最小信号强度为-85。
优选地,按照如下预设的数据格式整理得到特征识别数据:
{探针Mac,设备Mac,探测次数,平均信号强度,最大信号强度,最小信号强度,聚合时间戳}。
例如,整理得到的特征识别数据为:{探针Mac,设备Mac,探测次数3,最大信号强度-75,最小信号强度-85,平均信号强度-80,聚合时间戳begintime}。
图3是根据本发明第三实施例用于识别目标群体的数据处理方法的流程示意图,该方法包括:
步骤S102中将所述特征识别数据作为训练特征,训练得到目标群体的识别模型包括:
步骤S300,根据预设分类条件选取正样本和负样本;
步骤S301,利用所述正样本和负样本的的特征识别数据训练分类模型;
步骤S302,将所述分类模型作为目标群体的识别模型。
其中,根据预设分类条件选取正样本和负样本包括:
将一天内被探测到的时长大于8小时,且一周内被探测到的天数不小于两天的样本定义为正样本;
将一天内被探测到的时长小于3小时,且一周内被探测到的天数为一天的样本定义为负样本。
例如,在判断顾客进店的实际应用中,通过上述预设分类条件挑选出店员群体作为正样本,顾客群体作为负样本,这是因为店员大部分活动范围在店内,而被探测到的大部分顾客的活动范围在店外,并且店员被探测到的时间较长,且会连续多天被探测到,而顾客被探测到的时间短,且一周内只被探测到一天。使用在步骤S101中获得的上述正样本和负样本的特征识别数据:探针Mac,设备Mac,探测次数,平均信号强度,最大信号强度,最小信号强度,聚合时间戳作为训练特征训练得到分类模型,将训练得到的分类模型作为进店群体的识别模型。
图4是根据本发明第四实施例的用于识别目标群体的数据处理方法的流程示意图,该方法包括:
在步骤S102将所述特征识别数据作为训练特征,训练得到目标群体的识别模型之后还包括:
步骤S400,采集所述未知群体的探测数据;
步骤S401,按照所述预设的数据格式将所述未知群体的探测数据整理为特征识别数据;
步骤S402,将所述未知群体的特征识别数据输入所述目标群体的识别模型;
步骤S403,根据所述识别模型得出的识别结果判定未知群体是否属于目标群体。
例如,在判断顾客进店的实际应用中,将采集到的某一顾客的探测数据整理为特征识别数据,输入训练好的识别模型,如所述识别模型的输出结果为店员群体,则判断该顾客进店,这主要是因为店员群体的活动范围大部分位于店内,被探测到的Wi-Fi信号特征更接近在店内应该被探测到的Wi-Fi信号特征,故将该顾客判定为进店群体。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施第一实施例中的用于识别目标群体的数据处理方法的数据处理装置,如图5所述,该装置包括:数据采集模块10,数据处理模块20和训练模块30。
数据采集模块10,用于接收所述探测数据;
优选地,数据采集模块10中包括存储服务器,用于接收并存储WiFi探针上报的原始探测数据。
数据处理模块20,用于按照预设的数据格式将所述探测数据整理为特征识别数据;
优选地,数据处理模块20中包括统计服务器,用于对所述存储服务器中存储的原始探测数据进行聚合处理,计算出设定周期内的待检测设备Wi-Fi信号的平均信号强度,确定该周期内的最大信号强度和最小信号强度,连同Wi-Fi探针的Mac和设备Mac一起,整理成如下的数据格式:
{探针Mac,设备Mac,探测次数,平均信号强度,最大信号强度,最小信号强度,聚合时间戳}。
训练模块30,用于将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,所述目标群体为进入预设区域内的目标场所的群体。
优选地,训练模块30将一天内被探测到的时长大于8小时,且一周内被探测到的天数不小于两天的样本定义为正样本;将一天内被探测到的时长小于3小时,且一周内被探测到的天数为一天的样本定义为负样本。
优选地,训练模块30使用二元逻辑回归分类算法作为分类器,构建分类模型。
图6是根据本发明第二实施例的用于识别目标群体的数据处理装置的示意图,该装置中的数据处理模块20包括:
提取模块201,用于提取所述探测数据中的特征数据;
优选地,在Wi-Fi探针探测到信息中提取用于建模的特征数据,所述探测数据中的特征数据包括:探针Mac信息,设备Mac信息,探测到的信号强度,探测时间。
整理模块202,用于将所述探测数据中的特征数据按照预设的数据格式整理为所述特征识别数据。
优选地,设定周期t,将时间周期t的开始时间作为探测时间戳,得到时间周期t内某探针Mac探测到某设备Mac的次数,计算时间周期t内某探针Mac探测到某设备Mac的信号强度的平均值,得到平均信号强度,确定周期t内的最大信号强度和最小信号强度,最终整理模块202将提取模块201中获得的特征数据整理为如下的数据格式:
{探针Mac,设备Mac,探测次数,平均信号强度,最大信号强度,最小信号强度,聚合时间戳}。
图7是根据本发明第三实施例的用于识别目标群体的数据处理装置的示意图,该装置还包括:识别模块40,用于利用所述目标群体的识别模型对未知群体进行识别,识别模块40包括:
预处理模块401,用于采集所述未知群体的探测数据并按照所述预设的数据格式将所述未知群体的探测数据整理为特征识别数据;
优选地,预处理模块401提取未知群体探测数据中的特征数据,并将其整理为如下的数据格式:
{探针Mac,设备Mac,探测次数,平均信号强度,最大信号强度,最小信号强度,聚合时间戳}。
判定模块402,用于将所述未知群体的特征识别数据输入所述目标群体的识别模型并根据所述识别模型得出的识别结果判定未知群体是否属于目标群体。
例如,在判断顾客进店的实际应用中,训练模块30按上述优选的分类方式定义店员群体并作为正样本,定义顾客群体并作为负样本,判定模块402将预处理模块401中某一顾客的特征识别数据输入训练模块30训练得到的识别模型中,通过识别模型输出的结果判定顾客是否进店,即输出结果为店员群体时,判断该顾客进店,输出结果为顾客群体时则判断该顾客未进店。
图8是根据本发明第四实施例的用于识别目标群体的数据处理装置的示意图,该装置还包括:可视化模块50,用于将识别目标群体的数据处理结果显示在web端,可视化模块50包括:
统计模块501,用于统计预设时段内所述目标群体的数量;
显示模块502,用于将所述统计结果显示在web端。
优选地,在判断顾客进店的实际应用中,根据判定模块402输出的判定结果识别进店群体,进店群体中个体的数量被定义为进店量,将上述的数量对映到时间轴上,得到实时客流趋势图,将其显示在web端,此外,还可以按日、周、月进行统计,得到相应时段内的顾客进店趋势图。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种用于识别目标群体的数据处理方法,其特征在于,通过在预设区域内部署多个Wi-Fi探针用于识别所述预设区域内的待检测设备,通过所述待检测设备用于获得探测数据,所述方法包括:
接收所述探测数据;
按照预设的数据格式将所述探测数据整理为特征识别数据;以及
将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,
其中,所述目标群体用于作为进入预设区域内的目标场所的群体。
2.根据权利要求1所述的用于识别目标群体的数据处理方法,其特征在于,所述按照预设的数据格式将所述探测数据整理为特征识别数据包括:
确定所述预设区域内部署Wi-Fi探针的探针Mac信息;
获取所述待检测设备上的设备Mac信息,信号强度和探测时间戳;
确定设定周期,并将所述设定周期的起始时间作为聚合时间戳;
统计所述设定周期内探针探测到的设备Mac信息的次数,并计算出被探测到的信号强度的平均信号强度,同时确定其中的最大信号强度和最小信号强度。
3.根据权利要求2所述的用于识别目标群体的数据处理方法,其特征在于,按照如下预设的数据格式整理得到所述特征识别数据:
{探针Mac,设备Mac,探测次数,平均信号强度,最大信号强度,最小信号强度,聚合时间戳}。
4.根据权利要求1所述的用于识别目标群体的数据处理方法,其特征在于,所述将所述特征识别数据作为训练特征,训练得到目标群体的识别模型包括:
根据预设分类条件选取正样本和负样本;
利用所述正样本和负样本的的特征识别数据训练分类模型;
将所述分类模型作为目标群体的识别模型。
5.根据权利要求4所述的用于识别目标群体的数据处理方法,其特征在于,所述根据预设分类条件选取正样本和负样本包括:
将一天内被探测到的时长大于8小时,且一周内被探测到的天数不小于两天的样本定义为正样本;
将一天内被探测到的时长小于3小时,且一周内被探测到的天数为一天的样本定义为负样本。
6.根据权利要求1所述的用于识别目标群体的数据处理方法,其特征在于,在将所述特征识别数据作为训练特征,训练得到目标群体的识别模型之后还包括:
采集所述未知群体的探测数据;
按照所述预设的数据格式将所述未知群体的探测数据整理为特征识别数据;
将所述未知群体的特征识别数据输入所述目标群体的识别模型;
根据所述识别模型得出的识别结果判定未知群体是否属于目标群体。
7.一种用于识别目标群体的数据处理装置,其特征在于,包括:
数据采集模块,用于接收所述探测数据;
数据处理模块,用于按照预设的数据格式将所述探测数据整理为特征识别数据;
训练模块,用于将所述特征识别数据作为训练特征,训练得到目标群体的识别模型,所述目标群体为进入预设区域内的目标场所的群体。
8.根据权利要求7所述的用于识别目标群体的数据处理装置,其特征在于,所述数据处理模块包括:
提取模块,用于提取所述探测数据中的特征数据;
整理模块,用于将所述探测数据中的特征数据按照预设的数据格式整理为所述特征识别数据。
9.根据权利要求7所述的用于识别目标群体的数据处理装置,其特征在于,所述数据处理装置还包括:识别模块,用于利用所述目标群体的识别模型对未知群体进行识别,所述识别模块包括:
预处理模块,用于采集所述未知群体的探测数据并按照所述预设的数据格式将所述未知群体的探测数据整理为特征识别数据;
判定模块,用于将所述未知群体的特征识别数据输入所述目标群体的识别模型并根据所述识别模型得出的识别结果判定未知群体是否属于目标群体。
10.根据权利要求7所述的用于识别目标群体的数据处理装置,其特征在于,所述数据处理装置还包括:可视化模块,用于将识别目标群体的数据处理结果显示在web端,所述可视化模块包括:
统计模块,用于统计预设时段内所述目标群体的数量;
显示模块,用于将所述统计结果显示在web端。
CN201810164720.XA 2018-02-27 2018-02-27 用于识别目标群体的数据处理方法及装置 Pending CN108399387A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810164720.XA CN108399387A (zh) 2018-02-27 2018-02-27 用于识别目标群体的数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810164720.XA CN108399387A (zh) 2018-02-27 2018-02-27 用于识别目标群体的数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN108399387A true CN108399387A (zh) 2018-08-14

Family

ID=63096716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810164720.XA Pending CN108399387A (zh) 2018-02-27 2018-02-27 用于识别目标群体的数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN108399387A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110035392A (zh) * 2018-11-09 2019-07-19 阿里巴巴集团控股有限公司 设备是否位于目标区域的识别方法及装置和电子设备
CN111491258A (zh) * 2020-03-26 2020-08-04 微民保险代理有限公司 一种对象类型的检测方法和装置
CN112423224A (zh) * 2020-11-19 2021-02-26 杭州云深科技有限公司 基于wifi特征数据的居住地类型识别方法、电子设备和介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103347267A (zh) * 2013-05-31 2013-10-09 南京芝麻信息科技有限公司 目标区域内移动客户端识别系统及识别方法
CN104778642A (zh) * 2015-03-20 2015-07-15 北京邮电大学 基于WiFi的校园用户数据处理方法、服务器和监测系统
CN104916012A (zh) * 2014-03-14 2015-09-16 北京众源线下信息科技有限公司 一种基于WiFi技术的行为分析方法和系统
CN106210144A (zh) * 2016-08-22 2016-12-07 北京易游华成科技有限公司 人流量统计方法和设备
CN106550326A (zh) * 2016-10-20 2017-03-29 华迪计算机集团有限公司 一种基于无线AP和WiFi网络的景区客流侦测系统及方法
CN106714225A (zh) * 2016-12-29 2017-05-24 北京酷云互动科技有限公司 网络设备的识别方法及其系统、智能终端
CN106792523A (zh) * 2016-12-10 2017-05-31 武汉白虹软件科技有限公司 一种基于大规模WiFi活动轨迹的异常行为检测方法
CN106937253A (zh) * 2017-04-17 2017-07-07 上海汇纳信息科技股份有限公司 一种顾客判断方法及系统、服务器

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103347267A (zh) * 2013-05-31 2013-10-09 南京芝麻信息科技有限公司 目标区域内移动客户端识别系统及识别方法
CN104916012A (zh) * 2014-03-14 2015-09-16 北京众源线下信息科技有限公司 一种基于WiFi技术的行为分析方法和系统
CN104778642A (zh) * 2015-03-20 2015-07-15 北京邮电大学 基于WiFi的校园用户数据处理方法、服务器和监测系统
CN106210144A (zh) * 2016-08-22 2016-12-07 北京易游华成科技有限公司 人流量统计方法和设备
CN106550326A (zh) * 2016-10-20 2017-03-29 华迪计算机集团有限公司 一种基于无线AP和WiFi网络的景区客流侦测系统及方法
CN106792523A (zh) * 2016-12-10 2017-05-31 武汉白虹软件科技有限公司 一种基于大规模WiFi活动轨迹的异常行为检测方法
CN106714225A (zh) * 2016-12-29 2017-05-24 北京酷云互动科技有限公司 网络设备的识别方法及其系统、智能终端
CN106937253A (zh) * 2017-04-17 2017-07-07 上海汇纳信息科技股份有限公司 一种顾客判断方法及系统、服务器

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ZHENG YANG ET AL.: ""From RSSI to CSI:Indoor Localization via Channel Response"", 《ACM COMPUTING SURVEYS》 *
刘湘黔: ""基于智能WIFI的客流统计系统设计"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
张游杰 等: ""基于WiFi身份识别和公交IC卡数据的公交客流起讫点分析"", 《计算机应用》 *
李邦鹏: ""基于深度学习的室内时空客流预测"", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110035392A (zh) * 2018-11-09 2019-07-19 阿里巴巴集团控股有限公司 设备是否位于目标区域的识别方法及装置和电子设备
WO2020093828A1 (zh) * 2018-11-09 2020-05-14 阿里巴巴集团控股有限公司 设备是否位于目标区域的识别方法及装置和电子设备
TWI718620B (zh) * 2018-11-09 2021-02-11 開曼群島商創新先進技術有限公司 設備是否位於目標區域的識別方法及裝置和電子設備
CN111491258A (zh) * 2020-03-26 2020-08-04 微民保险代理有限公司 一种对象类型的检测方法和装置
CN112423224A (zh) * 2020-11-19 2021-02-26 杭州云深科技有限公司 基于wifi特征数据的居住地类型识别方法、电子设备和介质
CN112423224B (zh) * 2020-11-19 2022-07-01 杭州云深科技有限公司 基于wifi特征数据的居住地类型识别方法、电子设备和介质

Similar Documents

Publication Publication Date Title
CN111614690B (zh) 一种异常行为检测方法及装置
CN110363076B (zh) 人员信息关联方法、装置及终端设备
CN111475680A (zh) 检测异常高密子图的方法、装置、设备及存储介质
CN111385297B (zh) 无线设备指纹识别方法、系统、设备及可读存储介质
CN109711890B (zh) 一种用户数据处理方法及其系统
CN102955902B (zh) 雷达模拟设备可信度的评估方法及评估系统
CN110210508A (zh) 模型生成方法、异常流量检测方法、装置、电子设备、计算机可读存储介质
CN108399387A (zh) 用于识别目标群体的数据处理方法及装置
CN110443224A (zh) 翻页检测方法、装置、电子设备及存储介质
CN110493363B (zh) 一种智能手机随机mac地址的辨别系统及方法
CN112463859B (zh) 基于大数据和业务分析的用户数据处理方法及服务器
CN102890777A (zh) 可识别面部表情的电脑系统
CN110209551A (zh) 一种异常设备的识别方法、装置、电子设备及存储介质
CN110046074A (zh) 数据中心动力环境监测系统及监测方法
CN108764369A (zh) 基于数据融合的人物识别方法、装置和计算机存储介质
CN110301892A (zh) 一种基于静脉识别的检测方法及相关产品
CN108449716A (zh) 一种基于无线传感器的用户属性分析方法和系统
CN114817518B (zh) 基于大数据档案识别的证照办理方法、系统及介质
CN107818390A (zh) 一种考核要求生成方法及装置
CN108418644A (zh) 信号处理方法及装置
CN109064578A (zh) 一种基于云服务的考勤系统及方法
CN105987753A (zh) 一种基于云计算的光谱专家系统及其使用方法
CN116246303A (zh) 用于模型跨域训练的样本构建方法、装置、设备及介质
CN111899137B (zh) 一种基于手写时序数据的考试系统和方法
CN104301330B (zh) 基于异常行为监测和成员亲密度测量的陷阱网络检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180814

RJ01 Rejection of invention patent application after publication