CN106326263A - 获取数据之间的匹配关系的方法和装置 - Google Patents

获取数据之间的匹配关系的方法和装置 Download PDF

Info

Publication number
CN106326263A
CN106326263A CN201510370088.0A CN201510370088A CN106326263A CN 106326263 A CN106326263 A CN 106326263A CN 201510370088 A CN201510370088 A CN 201510370088A CN 106326263 A CN106326263 A CN 106326263A
Authority
CN
China
Prior art keywords
wireless router
destination object
wireless
daily record
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510370088.0A
Other languages
English (en)
Other versions
CN106326263B (zh
Inventor
范文
傅劲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510370088.0A priority Critical patent/CN106326263B/zh
Priority to PCT/CN2016/086649 priority patent/WO2017000817A1/zh
Publication of CN106326263A publication Critical patent/CN106326263A/zh
Application granted granted Critical
Publication of CN106326263B publication Critical patent/CN106326263B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开一种获取数据之间的匹配关系的方法和装置。该方法包括:获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;从日志信息中读取任意一个或多个目标对象的位置信息,并从定位日志中读取任意一个或多个无线路由器的位置信息;根据任意一个或多个目标对象的位置信息和任意一个或多个无线路由器的位置信息,确定目标对象所对应的一组无线路由器,以获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系。本发明解决了由于现有技术中采用人工方式获取目标对象与移动终端的对应关系的方法,导致获取到的目标对象和无线网络之间的关系不准确且成本高的技术问题。

Description

获取数据之间的匹配关系的方法和装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种获取数据之间的匹配关系的方法和装置。
背景技术
中国信息点(Point of Interest,POI)数据库中包含全国各地区的POI数据,数据主要包含四方面内容:名称、类别、经纬度、附近的酒店、饭店、商铺等信息。以酒店、饭店、商铺等作为目标对象,可以从POI数据库中获取目标对象的日志信息,该日志信息可以涵盖如下几个方面的内容:目标对象的名称、目标对象的坐标信息(例如目标对象的经纬度信息)、目标对象的地址(例如目标对象所在街道)、目标对象的位置信息(例如目标对象所在的城市和行政区域)。
为了给消费者提供更好的消费体验,大多数酒店、饭店、商铺等目标对象会对外提供例如WiFi的无线网络,以满足消费者的网络需求。消费者在经过或者进入目标对象时,其所持有的移动终端会所搜索并记录周边区域的无线网络,其所记录的无线网络的日志信息基本包括如下几方面的内容:移动终端唯一标识、移动终端的坐标信息(例如移动终端的经纬度信息)、移动终端的位置信息(例如移动终端所在的城市和行政区域)、移动终端搜索到的无线网络的标识和该无线网络信号的强度信息等。
获取目标对象和无线网络的对应关系,并以此进行统计分析,可以获取例如消费者的消费情况、消费偏好、或商铺的经营状况等极具商业价值的分析数据。例如,以目标对象作为分析对象,如果得知该目标对象对应的无线网络,便可以通过查询移动终端记录的无线网络的日志信息,获知该目标对象在不同时间段内的人流情况,还可以获知曾连接过该无线网络的消费者的信息,并根据该消费者的社交关系网,深入分析该目标对象的消费人群分布或向该消费者的好友自动推荐该目标对象。又例如,以消费者作为分析对象,可以获取到消费者曾连接过的无线网络,此时,如果得知这些无线网络对应的目标对象,就可以分析出该消费者在这些目标对象的逗留时间或消费者光临这些目标对象的频率/次数,还可以通过对目标对象进行整合,分析消费者的消费喜好,还可以根据分析结果向消费者推荐相似的目标对象。
现有技术中基本上是通过与目标对象主动合作的方式来协助目标对象部署无线网络(例如,小米WiFi、360WiFi等),以此获取比较准确的目标对象和无线网络的对应关系。然而,现有技术中的这种获取方式经济成本高,需要耗费大量人力、物力和财力,而且在要获取的目标对象的数量巨大时,为了获取对应关系所耗费的时间成本也相当高,获取大量目标对象与无线网络的匹配关系难度极大。
由于现有技术中采用人工方式获取目标对象与移动终端的对应关系的方法,导致获取到的目标对象和无线网络之间的关系不准确且成本高的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种获取数据之间的匹配关系的方法和装置,以至少解决由于现有技术中采用人工方式获取目标对象与移动终端的对应关系的方法,导致获取到的目标对象和无线网络之间的关系不准确且成本高的技术问题。
根据本发明实施例的一个方面,提供了一种获取数据之间的匹配关系的方法,包括:获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;从日志信息中读取任意一个或多个目标对象的位置信息,并从定位日志中读取任意一个或多个无线路由器的位置信息;根据任意一个或多个目标对象的位置信息和任意一个或多个无线路由器的位置信息,确定目标对象所对应的一组无线路由器,以获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系。
根据本发明实施例的另一方面,还提供了一种获取数据之间的匹配关系的装置,包括:获取模块,用于获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;读取模块,用于从日志信息中读取任意一个或多个目标对象的位置信息,并从定位日志中读取任意一个或多个无线路由器的位置信息;处理模块,用于根据任意一个或多个目标对象的位置信息和任意一个或多个无线路由器的位置信息,确定目标对象所对应的一组无线路由器,以获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系。
在本发明实施例中,采用获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志的方式,通过从日志信息和定位日志中分别读取目标对象和无线路由器的位置信息,达到了根据目标对象和无线路由器的位置信息确定目标对象与一组无线路由器之间的对应关系的目的,从而实现了获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系的技术效果,进而解决了由于现有技术中采用人工方式获取目标对象与移动终端的对应关系的方法,导致获取到的目标对象和无线网络之间的关系不准确且成本高的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本申请实施例一的一种获取数据之间的匹配关系的方法的计算机终端的硬件结构框图;
图2是根据本申请实施例一的获取数据之间的匹配关系的方法的流程示意图;
图3是根据本申请实施例一的一种可选的获取数据之间的匹配关系的方法的流程图;
图4是根据本申请实施例二的获取数据之间的匹配关系的装置的结构示意图;
图5是根据本申请图4所示实施例的一种可选的获取模块的结构示意图;
图6是根据本申请图5所示实施例的一种可选的获取数据之间的匹配关系的装置的结构示意图;
图7是根据本申请图6所示实施例的一种可选的获取数据之间的匹配关系的装置的结构示意图;
图8是根据本申请图7所示实施例的一种可选的第二筛选模块的结构示意图;
图9是根据本申请图4所示实施例的一种可选的处理模块的结构示意图;
图10是根据本申请图9所示实施例的一种可选的获取数据之间的匹配关系的装置的结构示意图;
图11是根据本申请图4所示实施例的一种可选的获取数据之间的匹配关系的装置的结构示意图;以及
图12是根据本申请实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面对本申请涉及到的术语进行解释如下:
POI数据库,即中国信息点(Point of Interest,POI)数据库,该数据库中包含全国各地区的POI数据,数据主要包含四方面内容:名称、类别、经纬度、附近的酒店/饭店/商铺等信息。本申请以中国信息点数据库进行举例说明,本领域技术人员可以不经创造性劳动想到本申请也可以应用在国外各地区的POI数据。
移动终端的国际身份码(International Mobile Equipment Identity,IMEI)是由15位数字组成的电子串号,与每台移动设备一一对应,是移动设备在全世界的唯一识别码。
编辑距离(Edit Distance),又称Levenshtein距离,是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符、插入一个字符、删除一个字符。
实施例1
根据本发明实施例,还提供了一种获取数据之间的匹配关系的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种获取数据之间的匹配关系的方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的获取数据之间的匹配关系的方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的获取数据之间的匹配关系的方法。图2是根据本发明实施例一的获取数据之间的匹配关系的方法的流程图。
如图2所示,一种可选的获取数据之间的匹配关系的方法包括如下实施步骤:
步骤S202:获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;
本申请上述步骤S202中,目标对象集合中包含至少一个目标对象。上述日志信息以目标对象为记录单元,其中任意一个目标对象的日志信息包含至少一种类别的数据字段。可选地,从记载着大量目标对象信息的原始数据库中,筛选出目标对象集合中包含的目标对象的指定类别的数据字段,加以整理后得到上述的目标对象集合中包含的目标对象的日志信息。
此处需要说明的是,记载着大量目标对象信息的原始数据库可以为POI数据库,或者为二次处理整合后的数据库(例如高德地图的商铺数据库、大众点评的商铺数据库)。数据字段的类别可以至少包括如下任意一种:目标对象的名称、目标对象所属类别、目标对象的坐标信息、目标对象的地址、目标对象的位置信息,其中,目标对象的地址、目标对象的位置信息还可以由目标对象的坐标信息间接得到。
本申请上述步骤S202中,无线路由设备集合中包含至少一个无线路由器。上述定位日志以无线路由器为记录单元,其中任意一个无线路由器的定位日志包含至少一种类别的数据字段。上述无线路由设备集合中包含的无线路由器的定位日志中包含了无线路由设备集合中包含的无线路由器的指定数据字段的信息。
例如,以获取餐厅与无线路由器的匹配关系为例,目标对象集合中包含若干待匹配的餐厅,指定数据字段例如包括名称和经纬度坐标,从高德地图的餐厅数据库中提取所有待匹配餐厅的指定数据字段的信息,整理后得到了目标对象集合中包含的若干待匹配餐厅的日志信息。囿于篇幅限制,在本申请实施例中,从待匹配餐厅中随机抽取比如京味斋、鱼头泡饼、东北菜、庆丰包子铺这四家餐厅对本申请的方案予以详细说明。无线路由设备集合中包含若干待匹配的无线路由器,同样可以获取无线路由设备集合中包含的无线路由器的定位日志。囿于篇幅限制,在本申请实施例中,从待匹配无线路由器中抽取如下无线路由器为例对本申请的方案予以详细说明:Jwz、ytpb、dongbeicai、Q@fbzp、quan-ju-de。
步骤S204:从日志信息中读取任意一个或多个目标对象的位置信息,并从定位日志中读取任意一个或多个无线路由器的位置信息;
本申请上述步骤S204中,上述目标对象可以是携带了移动终端的对象,或者是移动终端本身,移动终端可以采用国际身份码作为唯一识别码进行标识。上述目标对象的日志信息中包含的数据字段的类别可以至少包括目标对象的位置信息,上述无线路由器的定位日志中包含的数据字段的类别至少包括无线路由器的位置信息。此处需要说明的是,位置信息可以包括如下任意一种:经纬度信息、街道信息、所处地理区域信息、所归属的商圈信息等。
仍旧以获取餐厅与无线路由器的匹配关系为例,位置信息为获取的目标对象集合中包含的若干待匹配餐厅的日志信息中包含待匹配餐厅的所属地理区域,比如上述四个餐厅均位处北京市朝阳区;获取的无线路由设备集合中包含若干待匹配的无线路由器的定位日志中也包含了待匹配路由器所属地理区域,比如,上述无线路由器中,quan-ju-de位处北京市海淀区,其余位处北京市朝阳区。
步骤S206:根据任意一个或多个目标对象的位置信息和任意一个或多个无线路由器的位置信息,确定目标对象所对应的一组无线路由器,以获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系。
本申请上述步骤S206中,根据目标对象的位置信息和无线路由器的位置信息,可以判断目标对象和无线路由器是否处于相同的、极其接近的、或者有特定关系的地理位置,来确定与目标对象具有对应关系的一组无线路由器,以进一步的获取目标对象与无线路由器的匹配关系。
仍旧以获取餐厅与无线路由器的匹配关系为例,以待匹配餐厅中的京味斋为例,根据待匹配餐厅和待匹配无线路由器的所属地理区域信息,可以确定京味斋与待匹配无线路由器的对应关系,例如,可以确定无线路由器quan-ju-de位处北京市海淀区,与位处北京市朝阳区的京味斋不具有对应关系。
本申请提供的上述步骤S202至步骤S206,可以实现根据获取的目标对象的日志信息和无线路由器的定位日志中的位置信息,从大量且繁杂的数据中,自动识别每个目标对象所对应的无线路由器。通过上述步骤,能够在目标对象信息数据库(例如POI数据)和记载无线路由器指定数据字段的数据库之间建立桥梁,使得两个数据库的联合分析成为可能。
由上可知,本申请上述实施例一所提供的方案中,采用获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志的方式,通过从日志信息和定位日志中分别读取目标对象和无线路由器的位置信息,达到了根据目标对象和无线路由器的位置信息确定目标对象与一组无线路由器之间的对应关系的目的,从而实现了获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系的技术效果,进而解决了由于现有技术中采用人工方式获取目标对象与移动终端的对应关系的方法,导致获取到的目标对象和无线网络之间的关系不准确且成本高的技术问题。
本申请上述实施例提供的一种可选方案中,步骤S202中:获取无线路由设备集合中包含的无线路由器的定位日志,包括如下具体的实施步骤:
步骤S2022:获取移动终端集合中包含的移动终端的网络日志信息,其中,网络日志信息至少包括如下数据字段:移动终端的位置信息和移动终端接入的无线路由器的路由信息;
本申请上述步骤S2022中,移动终端可以通过其上设置的无线通信模块获取移动终端附近的无线路由器的路由信息,移动终端接入无线路由器是指移动终端通过正确的密码连接该无线路由器或者移动终端通过检测获取到附近的无线路由器。无线路由信息可以包括如下至少一种:无线路由器的名称、无线路由器的标识、无线路由器发出的无线信号的强度。
此处需要说明的是,移动终端的网络日志信息中包含的移动终端的位置信息可以是通过移动终端的定位模块采集到的GPS信息,也可以是通过移动终端连接周边WiFi,并通过WiFi定位技术获取到的移动终端的位置信息,也可以是通过移动终端的第一类位置信息转换生成的第二类位置信息(例如,根据移动终端的经纬度坐标获取到移动终端所处区域信息),还可以是以上任意多种信息的组合。
此处还需要说明的是,移动终端集合中包含至少一个移动终端,理论上移动终端集合中包含的移动终端数量越多,则收集的移动终端的网络日志信息中覆盖的无线路由器数量也越多。
仍旧以获取餐厅与无线路由器的匹配关系为例,开启了WiFi功能的手机,会自动检测周边WiFi无线路由器信息,生成单个手机检测到的WiFi日志。通过对经常活动于北京市朝阳区的手机用户中的WiFi日志进行收集和统计,可生成关于WiFi信息的原始日志。单个手机检测到的WiFi日志例如包括:手机标识、手机位置、手机检测到的WiFi信息,其中,手机检测到的WiFi信息包括WiFi标识和WiFi信号强度。可选的,原始日志中还可以包含根据上述手机标识、手机位置、手机检测到的WiFi信息进行进一步处理的数据,例如,根据经纬度信息获取的手机所处城市和区域的信息。表1示例性的展现了对若干手机的WiFi日志进行统计后生成的原始日志。在表1中,SSID(Service Set Identifier)为WiFi网络的网络名称。
表1
用户标识(IMEI) 位置信息 WiFi SSID列表及其信号强度
123456789012345 北京市朝阳区 Jwz,-30;ytpb,-80;dongbeicai,-15;
123456789012346 北京市朝阳区 Jwz,-70;Q@fbzp,-25;
123456789012347 北京市朝阳区 Jwz,-25;
123456789012348 北京市海淀区 quan-ju-de,-10
步骤S2024:对网络日志信息进行格式化转换,生成任意一个或多个无线路由器的定位日志,无线路由器的定位日志至少包括如下数据字段:标识信息和位置信息。
本申请上述步骤S2024中,标识信息可以为移动终端获取的无线路由器的名称或者其他能够用于区分无线路由器的数据,位置信息可以为检测到该无线路由器时移动终端的位置信息,也可以为以根据移动终端的位置信息转换后的另一种数据格式的位置信息。格式化转换主要是记载单元的转换,即将以移动终端为记载单元的网络日志,转换为以无线路由器为记载单元的定位日志。具体的,由于移动终端的网络日志信息记录每个移动终端所检测到的无线路由器的路由信息,这种数据格式并不能直接得到无线路由器的路由信息;而转换后生成的无线路由器的定位日志记录每个无线路由器的标识信息和位置信息。通过本申请上述步骤S2024,解决了由于目标对象的日志信息和移动终端记录的无线网络的日志信息相互独立、且难以对接,造成的不能直接根据目标对象的日志信息和无线网络的日志信息来获取目标对象与无线路由器的对应关系。
仍旧以获取餐厅与无线路由器的匹配关系为例,转换后的无线路由器的定位日志中至少包含了无线路由器的WiFi SSID和无线路由器的位置信息,在一种示例中,无线路由器的位置信息设定为无线路由器所归属的城市和行政区域(可根据经纬度信息获取)。表2示例性的展现了转换生成的无线路由器的定位日志。在表2中,除无线路由器的WiFi SSID和无线路由器的位置信息外,还包括了无线网络的信号强度。
表2
标识信息 位置信息 信号强度
Jwz 北京市朝阳区 -30
ytpb 北京市朝阳区 -80
dongbeicai 北京市朝阳区 -15
Jwz 北京市朝阳区 -70
Q@fbzp 北京市朝阳区 -25
Jwz 北京市朝阳区 -25
quan-ju-de 北京市海淀区 -10
本申请上述步骤S2022至步骤S2024提供了一种获取无线路由设备集合中包含的无线路由器的定位日志的可选方案。基于上述步骤S2022实现了移动终端的网络日志的获取和整合,通过步骤S2024实现了从常见的以移动终端为单元的网络日志向以无线路由器为单元的定位日志的转换,使得在执行步骤S202至S206时,可以直接从无线路由器的定位日志中获取无线路由器的位置信息,并获取目标对象与无线路由器的对应关系。
本申请上述实施例提供的一种可选方案中,在执行上述步骤S2024:对网络日志信息进行格式化转换,生成任意一个或多个无线路由器的定位日志之后,还可以执行如下实施步骤:
步骤S2032:根据无线路由器的标识信息对无线路由设备集合中的无线路由器进行聚合处理,生成无线路由设备集合中的任意一个或多个无线路由器的聚合结果,其中,聚合结果包括:无线路由器的信号强度;
本申请上述步骤S2032中,由于同一个无线路由器可能会被多个移动终端在多个位置采集到,所以在定位日志中关于同一个无线路由器可能有对应的多个位置信息和多个信号强度数据,因而需要进一步判断定位日志中多个位置信息里的哪一个与无线路由器的真实地理位置最接近,或者进一步的根据上述多个位置信息计算无线路由器的最有可能的位置。本申请上述步骤S2032中对无线路由器进行聚合处理,可以是以无线路由器的标识信息为依据,将定位日志中无线路由器标识信息相同的数据进行聚合,形成包含了无线路由器标识、无线路由器位置信息和无线路由器信号强度的聚合结果。
仍旧以获取餐厅与无线路由器的匹配关系为例,从转换生成的无线路由器的定位日志中,以无线路由器的标识信息为关键字,对每个无线路由器进行聚合处理。表3仅展示了以其中标识信息为jwz的无线路由器为例的一部分数据聚合结果。
表3
标识信息 位置信息 信号强度
jwz 北京市朝阳区 -30
jwz 北京市朝阳区 -70
jwz 北京市朝阳区 -25
步骤S2034:使用预先设置的过滤阈值对聚合结果进行筛选,确定任意一个或多个无线路由器的定位日志中的有效日志,有效日志为信号强度大于等于过滤阈值的无线路由器的定位日志。
本申请上述步骤S2034中,当信号强度弱到一定程度时,其所对应的整条数据(尤其是位置信息)的可信度就较低。通过设置过滤阈值,并根据信号强度与过滤阈值的大小关系,来判断该信号强度对应的整条数据是否可靠,当该信号强度对应的整条数据不可靠时,可从定位日志的聚合结果中剔除该条数据,以最终获取有效日志。
仍旧以获取餐厅与无线路由器的匹配关系为例,可选的,可以设定过滤阈值D=-30,当信号强度小于该过滤阈值时,判定该信号强度所对应的整条信息不可靠,从聚合结果中删除该条信息。表4仅展示了以其中标识信息为jwz的无线路由器为例的、对聚合结果进行筛选后得到的有效日志。
表4
标识信息 位置信息 信号强度
jwz lat2,lng2 -30
jwz lat3,lng3 -25
本申请上述步骤S2032至步骤S2034提供了一种对于定位日志进行筛选处理的可选方案。基于上述步骤S2032,对定位日志按照无线路由器的标识信息进行聚合,生成每个无线路由器的聚合结果,再通过步骤S2034对聚合结果进行筛选,保留聚合结果中可靠的数据并得到有效日志,实现了对定位日志的进一步筛选处理,当定位日志的信息量庞大时,通过上述步骤S2032至步骤S2034的处理,可以简化数据并确保数据的可靠性。
本申请上述实施例提供的一种可选方案中,无线路由器的定位日志还包括:无线路由器的定位坐标。
具体的,定位坐标可以为基于任何预先建立的坐标系的坐标数据,例如经纬度坐标数据。此处需要说明的是,在执行步骤S2024以生成无线路由器的定位日志时,无线路由器的定位日志包含的位置信息可以为坐标信息(例如经纬度坐标信息、其他坐标系下的坐标信息),也可以为非坐标信息(例如根据经纬度坐标信息转换得到的无线路由器所属城市和行政区域信息)。在执行步骤S2024时生成的位置信息为非坐标信息的应用场景下,本申请提供的另一种可选方案中无线路由器的定位日志还需包括无线路由器的定位坐标。
本申请上述实施例提供的一种可选方案中,在无线路由器的定位日志还包括:无线路由器的定位坐标时,在执行上述步骤S2034:在确定任意一个或多个无线路由器的定位日志中的有效日志之后,还可以执行如下实施步骤:
步骤S2036:使用预设条件对任意一个或多个无线路由器的定位坐标进行聚类,获取任意一个或多个无线路由器的聚类簇,其中,无线路由器至少生成一个聚类簇;
本申请上述步骤S2036中,对有效日志中筛选出的每一个无线路由器,可以使用算法对每一个无线路由器所对应的多个定位坐标进行聚类,例如可以选择基于密度的聚类算法,即当在一个区域中定位坐标的密度超过阈值时,可以将其划分为聚类簇。预设条件为使用聚类算法时需要预先设定的条件,不同的聚类算法所需预设条件不同。
以使用基于密度的聚类算法中的DBSCAN算法为例,预设条件包括:E领域和核心对象,E领域是指给定对象半径为E内的区域,核心对象是指给定对象E领域内的样本点数的最小值。通过DBSCAN算法,对有效日志中筛选的每个无线路由器的定位坐标一列进行聚类,此时,只需执行DBSCAN算法的第一步,即将定位坐标聚成满足我们预设条件的一个个“小圆”,而不进行第二步的再合并。在使用DBSCAN算法时,设置E领域为10米,核心对象为20个,即我们要求如果一个wifi在一个半径为10米的圆内被20个不同的imei定位过,则形成一个聚类簇。
步骤S2038:根据无线路由器的聚类簇的数量,对无线路由设备集合中的无线路由器进行筛选。
本申请上述步骤S2038中,当一个无线路由器处于性能稳定且位置固定的状态时,该无线路由器的聚类簇的位置可能会呈现一定的区域性,聚类簇的数量也可能会呈现一定的规律性。本申请提供的上述步骤S2038通过预设规则,通过判断无线路由器的聚类簇的数量,来推断无线路由器的运行状况,实现了通过聚类簇的情况来对无线路由设备集合中的无线路由器进行筛选。
本申请上述步骤S2036至步骤S2038提供了一种对无线路由设备集合中的无线路由器进行筛选的可选方案。基于上述步骤S2036生成的每个无线路由器的聚类簇,通过步骤S2038来判断每个无线路由器的状态,完成对无线路由设备集合中的无线路由器的筛选。
本申请上述实施例提供的一种可选方案中,步骤S2038:根据无线路由器的聚类簇的数量,对无线路由设备集合中的无线路由器进行筛选,包括如下具体的实施步骤:
步骤S20380:计算无线路由器的每一个聚类簇的中心点坐标;
本申请上述步骤S20380中,聚类簇的中心点坐标的计算方法可以采用欧式空间下的中心点计算方法。计算聚类簇的中心点坐标的计算公式为:
center(簇)=[(lat1+lat2+…+latn)/n,(lng1+lng2+…+lngn)/n]
其中:center(簇)表示聚类簇的中心点坐标,lat为latitude(纬度)的缩写,lat1、lat2…latn为该聚类簇内各个定位坐标中的纬度,lng为longitude(经度)的缩写,lng1、lng2…lngn为该聚类簇内各个定位坐标中的经度,n为该聚类簇内包含的定位坐标的个数。
步骤S20382:在无线路由器的聚类簇的数量超过预设阈值的情况下,使用无线路由器的任意两个聚类簇的中心点坐标,计算得到无线路由器的任意两个聚类簇的中心距离;
本申请上述步骤S20382中,预设阈值例如为2,当一个无线路由器的位置固定时,由于无线路由器的信号覆盖范围有限,即便是该无线路由器相距最远的两个聚类簇,其中心距离也具有上限。因此,可以通过计算无线路由器的任意两个聚类簇的中心距离,并与距离阈值进行比对,判断是否存在中心距离大于距离阈值的两个聚类簇。通过这种方式,可以判断聚类簇中定位坐标的有效性。
此处需要说明的是,在一个无线路由器的聚类簇的数量超过预设阈值的情况下,可以先获取该无线路由器中每个聚类簇内定位坐标的个数,并根据聚类簇内定位坐标的个数对聚类簇进行排序,再按照该排序中聚类簇的顺序,依次判断两个聚类簇中心点的距离。也可以计算任意两个聚类簇的中心距离。可选地,计算无线路由器两个聚类簇的中心距离时采用球面距离的计算方法。
此处还需要说明的是,在一个无线路由器的聚类簇的数量没有超过预设阈值的情况下,可直接确定该无线路由器为有效无线路由器,并将该聚类簇的中心点坐标赋值给该有效无线路由器;也可根据该聚类簇的簇内个数,在判断簇内个数小于可信阈值时,认定该无线路由器为无效无线路由器,避免了因为该无线路由器的定位坐标的数量不足够而可能导致的无线路由器可信度低的问题。
步骤S20384:当无线路由器的中心距离小于等于距离阈值时,确定无线路由器为有效无线路由器;
此处需要说明的是,当无线路由器的中心距离大于距离阈值时,则认为该无线路由器的定位日志出现了错误,或者该无线路由器的位置发生了变化,需要重新获取该无线路由器的定位日志,因此可以确定该无线路由器为无效路由器。
例如,如果distance(NO.1center(簇),NO.2center(簇))>N,N=150米,则确定该无线路由器为无效无线路由器,或从定位日志中剔除该无线路由器;如果distance(NO.1center(簇),NO.2center(簇))≤N时,确定该无线路由器为有效无线路由器;其中,distance采用球面距离的计算方法,NO.1center(簇)可以为根据聚类簇内定位坐标的个数对聚类簇进行由多至少的排序后,定位坐标个数最多的聚类簇,NO.2center(簇)的坐标个数次之。
通过本申请上述步骤S20382和步骤S20384,实现了对无线路由器是否有效进行判定。在一种情况下,当定位日志中出现错误或较大误差时,通过上述步骤可以对无线路由器的定位信息进行甄别,避免定位日志中的定位信息的误差引起的目标对象与无线路由器的对应关系的错误。在另一种情况下,当无线路由器的位置并非固定,而是产生移动时,无线路由器在移动过程中可能被大量的无线终端获取,通过上述步骤还可以对无线路由器进行甄别,避免移动无线路由器被定位而引起的目标对象与无线路由器的对应关系的错误。
步骤S20386:保留无线路由设备集合中的有效无线路由器,并读取有效无线路由器的簇内个数最大的聚类簇;
本申请上述步骤S20386中,可以通过删除无效的无线路由器或者提取有效无线路由器的方式,实现保留无线路由设备集合中的有效无线路由器。
步骤S20388:将簇内个数最大的聚类簇的中心点坐标赋值给有效无线路由器。
本申请上述步骤S20388中,簇内个数最大的聚类簇表征着在该区域范围内,该无线路由器被定位的次数最多,其最接近该无线路由器真实位置的概率也最大。通过本申请提供的上述步骤S20388实现了根据无线路由器定位日志,获取无线路由器的最优位置坐标。
本申请上述步骤S20380至步骤S20388提供了一种对所述无线路由设备集合中的无线路由器进行筛选的可选方案。基于上述步骤S20380至步骤S20384,实现了对无线路由器是否有效的判断,通过步骤S20386至S20388实现了提取有效无线路由器并对有效无线路由器赋予最优位置坐标,最终达到了精确筛选无线路由器设备集合中的无线路由器并对筛选后的无线路由器赋予最优位置坐标的技术效果。
本申请上述实施例提供的一种可选方案中,目标对象的日志信息至少包括:目标对象的坐标信息;无线路由器的定位日志至少包括:无线路由器的坐标信息。
具体的,目标对象的日志信息或无线路由器的定位日志包含的位置信息可以为坐标信息(例如经纬度坐标信息、其他坐标系下的坐标信息),也可以为非坐标信息(例如根据经纬度坐标信息转换得到的目标对象或无线路由器所属城市和行政区域信息)。在目标对象的日志信息中和/或无线路由器的日志信息中包含的位置信息为非坐标信息的应用场景下,本申请提供的另一种可选方案中目标对象的日志信息或无线路由器的定位日志还需包括坐标信息,该坐标信息可以为任何坐标系下的坐标数据。
仍旧以获取餐厅与无线路由器的匹配关系为例,表5示例性的展现了包含餐厅坐标信息的日志信息,表6示例性的展现了经过步骤S2032至步骤S2034的第一次筛选、以及经过步骤S2036至步骤S2038的第二次筛选后包含无线路由器坐标信息的定位日志;在表5和表6中,lng1至lng4分别表示餐厅所在的经度信息,lng5至lng8分别表示有效无线路由器的簇内个数最大的聚类簇的中心点的经度信息;lat1至lat4分别表示表示餐厅所在的纬度信息,lat5至lat8分别表示有效无线路由器的簇内个数最大的聚类簇的中心点的纬度信息。
表5
名称 位置信息 坐标信息
京味斋 北京市朝阳区 lat1,lng1
鱼头泡饼 北京市朝阳区 lat2,lng2
东北菜 北京市朝阳区 lat3,lng3
庆丰包子铺 北京市朝阳区 lat4,lng4
表6
标识信息 位置信息 坐标信息
Jwz 北京市朝阳区 lat5,lng5
dongbeicai 北京市朝阳区 Lat6,lng6
Q@fbzp 北京市朝阳区 lat7,lng7
quan-ju-de 北京市海淀区 lat8,lng8
本申请上述实施例提供的一种可选方案中,当目标对象的日志信息至少包括目标对象的坐标信息、无线路由器的日志信息至少包括无线路由器的坐标信息时,步骤S206:根据任意一个或多个目标对象的位置信息和任意一个或多个无线路由器的位置信息,确定目标对象所对应的一组无线路由器,包括如下具体的实施步骤:
步骤S2062:将目标对象的位置信息和无线路由器的位置信息作为关键字进行匹配,获取与目标对象具有映射关系的至少一个无线路由器;
本申请上述步骤S2062中,在位置信息相同、相邻近或具有特定关系的目标对象与无线路由器之间建立映射关系,而后既可以以目标对象为单元,获取与目标对象具有映射关系的至少一个无线路由器,还可以以无线路由器为单元,获取与无线路由器具有映射关系的至少一个目标对象。
仍旧以获取餐厅与无线路由器的匹配关系为例,以“北京市朝阳区”作为关键字,获取与餐厅具有映射关系的无线路由器,结合上述表5和表6,目标对象“京味斋”与Jwz、dongbeicai、Q@fbzp三个无线路由器有映射关系。
步骤S2064:根据目标对象的坐标信息,以及与目标对象具有映射关系的至少一个无线路由器的坐标信息,计算得到目标对象与具有映射关系的任意一个无线路由器之间的球面距离;
仍旧以获取餐厅与无线路由器的匹配关系为例,根据目标对象“京味斋”的坐标信息(lat1,lng1)和上述三个无线路由器的坐标信息(lat5,lng5)、(lat6,lng6)、(lat7,lng7),分别计算目标对象与每个无线路由器之间的球面距离。
步骤S2066:提取球面距离小于等于位置阈值的目标对象和具有映射关系的无线路由器,以获取与目标对象具有匹配关系的至少一个无线路由器。
仍旧以获取餐厅与无线路由器的匹配关系为例,例如设定位置阈值为20米,京味斋与Jwz、Q@fbzp之间的球面距离小于20米,以此可以获取与京味斋球面距离小于等于位置阈值的无线路由器为Jwz、Q@fbzp。
此处需要说明的是,上述步骤S2062至步骤S2066所示的方案是以目标对象为单元,来获取与某个目标对象具有映射关系的、且球面距离小于位置阈值的无线路由器;而对上述步骤做适应性修改后,还可以实现以无线路由器为单元,来获取与某个无线路由器具有映射关系的、且球面距离小于位置阈值的目标对象。
本申请上述步骤S2062至步骤S2066提供了一种获取目标对象与一组无线路由器的映射关系的可选方案。基于上述步骤S2062获取位置信息相同的目标对象与无线路由器,通过步骤S2064计算目标对象与位置信息相同的每一个无线路由器的球面距离,并经由步骤S2066中球面距离与位置阈值的判断,提取球面距离小于等于位置阈值的目标对象和具有映射关系的无线路由器,以实现目标对象与无线路由器匹配关系的建立。
本申请上述实施例提供的一种可选方案中,当目标对象的日志信息至少包括如下数据字段:目标对象名称、目标对象坐标信息和目标对象位置信息,无线路由器的定位日志还包括:无线路由器名称时,在步骤S2066:获取与目标对象具有匹配关系的至少一个无线路由器之后,还可以执行如下实施步骤:
步骤S2072:对目标对象名称进行第一预处理,生成满足第一预定格式和/或第一预定内容的新目标对象名称;
本申请上述步骤S2072中,第一预定格式用于规定目标对象名称的格式,例如目标对象名称所使用的语言、目标对象名称所包含的字符种类、目标对象为英文时字母的大小写格式等;第一预定内容用于规定目标对象名称的具体内容及其展示方式,例如,目标对象名称为全拼或首字母拼音、目标对象名称包含英文时的简写方式等。
此处需要说明的是,在可能的其中一个应用场景中,由于目标对象名称多为未经修改的原始商户名称,可能包含中文、英文、数字、图片以及特殊字符等内容,而无线路由器的名称多为字母,而且,无线路由器的名称通常会根据目标对象名称来设置,具有较高的辨识度,因此,需要对目标对象的名称进行第一预处理,使得处理后的新目标对象名称能够与无线路由器名称对应,以进一步保证匹配关系的准确性。
例如,为生成满足第一预定格式的新目标对象名称,第一预处理用于判断目标对象的名称是否为中文,若否,则查询其对应的公认的中文或将其丢弃,和/或,第一预处理用于判断目标对象名称中是否包含特殊字符和数字,特殊字符例如~!#$%^&*()_+-=等,若是,则去掉目标对象名称中的特殊字符和数字。可以使用开源java项目pinyin4j来进行第一预处理。
又例如,为生成满足第一预定内容的新目标对象名称,第一预处理用于将目标对象的中文名称转为该中文名称的全拼或首字母拼音。可以使用开源java项目pinyin4j来进行第一预处理。
仍旧以获取餐厅与无线路由器的匹配关系为例,对于餐厅京味斋,首先判断出该名称中不包含特殊字符(包括~!#$%^&*()_+-=)与数字,且该名称为中文,则该名称满足第一预定格式;然后,将名称京味斋转换为满足第一预定内容的新名称,当第一预定内容规定使用目标对象名称的全拼时,转换后的新目标对象名称为jingweizhai,记为P1,当第一预定内容规定使用目标对象名称的首字母拼音时,转换后的新目标对象名称为jwz,记为P2。
步骤S2074:对与目标对象具有匹配关系的至少一个无线路由器的无线路由器名称进行第二预处理,生成满足第二预定格式和/或第二预定内容的新无线路由器名称;
此处需要说明的是,第二预定格式和/或第二预定内容可以与第一预定格式和/或第一预定内容的规定保持一致,也可以略作调整。虽然,无线路由器的名称通常会根据目标对象名称来设置以供消费者识别,然而同一个目标对象可能会设置多个无线路由器或通过一个无线路由器发射出多个无线网络,此时,无线路由器的名称中就会具有与目标对象的原始名称并无关联的、仅用以区分无线网络的数字或特殊字符。因此,也需要对无线路由器的名称进行第一预处理,使得处理后的新无线路由器名称能够与目标对象名称对应,以进一步保证匹配关系的准确性。
例如,为生成满足第二预定格式的新无线路由器名称,第二预处理用于判断无线路由器名称中是否包含特殊字符和数字,特殊字符例如~!#$%^&*()_+-=等,若是,则去掉无线路由器名称中的特殊字符和数字,和/或,第二预处理用于判断无线路由器名称中的字母是否均为小写,若否,则将无线路由器名称中的字母转化成小写字母。
又例如,为生成满足第二预定内容的新无线路由器名称,第二预处理用于识别无线路由器名称的类别为目标对象的全拼、首字母拼音或对应英文,若能识别或能从预先存储的数据库中唯一确定该无线路由器名称的类别,则将无线路由器名称对应转换为与第一预定内容相同的类别。
仍旧以获取餐厅与无线路由器的匹配关系为例,对于餐厅京味斋,经过第一预处理后的新目标对象名称为P2(jwz),与京味斋具有匹配关系的无线路由器名称分别为Jwz、Q@fbzp,通过第二预处理后的新无线路由器名称分别为jwz,qfbzp。
步骤S2076:根据新目标对象名称和新无线路由器名称,对与目标对象具有匹配关系的至少一个无线路由器进行筛选处理,得到满足预设条件的与目标对象匹配的无线路由器。
本申请上述步骤S2076中,预设条件可以为新目标对象名称与新无线路由器名称完全相同,和/或,新目标对象名称与新无线路由器名称相似程度达到相似度阈值。可选的,将新目标对象名称与具有匹配关系的新无线路由器名称进行逐一比对,如果新目标对象名称与新无线路由器名称完全一致,则判定该无线路由器与该目标对象匹配。可选的,将新目标对象名称与具有匹配关系的新无线路由器名称进行逐一比对,如果新目标对象名称与新无线路由器名称并非完全一致,则计算新目标对象名称与新无线路由器名称的相似度,如果新目标对象名称与新无线路由器名称相似度达到相似度阈值,则判定该无线路由器与该目标对象匹配。
具体的,判断新目标对象名称与新无线路由器名称的相似度,可采用计算二者字符串编辑距离的方式,当新目标对象名称与新无线路由器名称的字符串编辑距离小于等于编辑距离阈值,且新目标对象名称的字符个数大于字符数阈值时,则认为新目标对象名称与新无线路由器名称相似程度达到相似度阈值,判定该无线路由器与该目标对象匹配。
仍旧以获取餐厅与无线路由器的匹配关系为例,设置预设条件为新目标对象名称与新无线路由器名称完全相同,和,新目标对象名称与新无线路由器名称的字符串编辑距离为1且新无线路由器名称字符个数大于等于5。对于餐厅京味斋,新目标对象名称为jwz,与新无线路由器名称分别为jwz,qfbzp对比筛选后,得到满足预设条件的目标对象匹配的无线路由器为jwz,
本申请上述步骤S2072至步骤S2076提供了一种获取与目标对象具有匹配关系的至少一个无线路由器的可选方案。基于上述步骤S2072和步骤S2074,完成了对目标对象名称和无线路由器名称的处理,并通过步骤S2076的筛选,得到了与目标对象匹配的无线路由器,进一步提高了目标对象和无线路由器的匹配准确性。
本申请上述实施例提供的一种可选方案中,在步骤S206:获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系之后,方还可以执行如下实施步骤:
步骤S208:当同一个无线路由器与多个目标对象具有匹配关系的情况下,读取与无线路由器距离最近的目标对象。
本申请提供的上述步骤S208通过判断这个无线路由器与目标对象的距离,例如球面距离,避免了不论以目标对象为单元,来获取与某个目标对象匹配的无线路由器,还是以无线路由器为单元,来获取与某个无线路由器匹配的目标对象时可能造成的一个无线路由器归属于多个目标对象的情况。
图3是根据本申请实施例的一种可选的获取数据之间的匹配关系的方法的流程图。下面就结合图3,将本申请的方案应用在应用场景所实现的功能进行详细描述:
步骤A:格式化转换,生成无线路由器的定位日志。
在本申请上述步骤A中,移动终端获取到周边的无线路由器的路由信息,并结合移动终端获取到路由信息时的位置信息,生成移动终端的网络信息日志。将网络信息日志进行格式化转换,转为以无线路由器为记载单元的无线路由器的定位日志,其中,定位日志中包含了无线路由器的标识信息、位置信息和信号强度。
步骤B:进行聚合处理,得到包含信号强度的聚合结果。
在本申请上述步骤B中,以无线路由器的标识信息为依据,将定位日志中无线路由器标识信息相同的数据进行聚合,形成包含了无线路由器标识、无线路由器位置信息和无线路由器信号强度的聚合结果。
步骤C:判断信号强度是否大于等于过滤阈值。
在本申请上述步骤C中,当信号强度弱到一定程度时,其所对应的整条数据(尤其是位置信息)的可信度就较低。通过设置过滤阈值,来判断信号强度与过滤阈值的大小关系,进而可以判断该信号强度对应的整条数据是否可靠。
步骤D:丢弃该无线路由器。
在本申请上述步骤D中,当信号强度小于该过滤阈值时,判定该信号强度所对应的整条信息不可靠,从聚合结果中删除该无线路由器中对应于该信号强度小于过滤阈值的相关日志。
步骤E:得到有效日志。
在本申请上述步骤E中,当信号强度大于等于该过滤阈值时,确定该无线路由器中对应于该信号强度大于等于过滤阈值的定位日志为有效日志。
步骤F:进行聚类处理,生成聚类簇。
在本申请上述步骤F中,选择基于密度的聚类算法:DBSCAN,对无线路由器的定位坐标进行聚类,生成聚类簇。
步骤G:判断聚类簇数量是否未超预设阈值。
在本申请上述步骤G中,可以通过判断无线路由器的聚类簇的数量,来推断无线路由器的运行状况。
步骤H:判断聚类簇中心距离是否小于等于距离阈值。
在本申请上述步骤H中,在一个无线路由器的聚类簇的数量超过预设阈值的情况下,进一步判断任意两个聚类簇的中心距离是否小于等于距离阈值。此时,可以先获取该无线路由器中每个聚类簇内定位坐标的个数,并根据聚类簇内定位坐标的个数对聚类簇进行排序,再按照该排序中聚类簇的顺序,依次判断两个聚类簇中心点的距离。也可以计算任意的或随机的两个聚类簇的中心距离。
步骤I:丢弃该无线路由器。
在本申请上述步骤I中,在判断出有其中两个聚类簇的中心距离大于距离阈值的情况下,则认为该无线路由器的定位日志出现了错误,或者该无线路由器的位置发生了变化,需要重新获取该无线路由器的定位日志,因此可以确定该无线路由器为无效路由器。
步骤J:簇内个数最大的聚类簇的中心点坐标赋值给有效无线路由器。
在本申请上述步骤J中,有如下两种情况:
情况一:在一个无线路由器的聚类簇的数量没有超过预设阈值的情况下,可直接确定该无线路由器为有效无线路由器,并将该聚类簇的中心点坐标赋值给该有效无线路由器。当然,也可根据该聚类簇的簇内个数,在判断簇内个数小于可信阈值时,认定该无线路由器为无效无线路由器。
情况二:在一个无线路由器的聚类簇的数量超过预设阈值、且任意两个聚类簇的中心距离均小于等于距离阈值的情况下,确定无线路由器为有效无线路由器,并读取有效无线路由器的簇内个数最大的聚类簇,将簇内个数最大的聚类簇的中心点坐标赋值给有效无线路由器。
步骤K:判断是否为中文。
步骤L:丢弃该目标对象名称。
在本申请上述步骤L中,当机器翻译结果不理想时,可以直接丢弃名称中部分或全部为非中文的目标对象。
步骤M:第一预处理,得到新目标对象名称P1(全拼)和P2(首字母拼音)。
在本申请上述步骤M中,第一预处理去掉名称中的特殊字符(包括~!#$%^&*()_+-=)与数字,然后使用开源java项目pinyin4j(可以将中文转化成拼音)将将剩下的目标对象名称转为两种内容,一种是目标对象名称的全拼,设为P1;一种是目标对象名称的首字母,设为P2。
上述步骤K至步骤M为对目标对象的名称进行的处理,需要说明的是,该步骤K至步骤M可以在步骤N之前来执行,作为对目标对象名称的预处理;也可以在步骤N之后再来执行。
步骤N:根据目标对象的位置信息和无线路由器的位置信息,确定目标对象所对应的一组无线路由器。
在本申请上述步骤N中,根据目标对象的位置信息和无线路由器的位置信息,可以判断目标对象和无线路由器是否处于相同的、极其接近的、或者有特定关系的地理位置,来确定与目标对象具有对应关系的一组无线路由器,以进一步的获取目标对象与无线路由器的匹配关系。
步骤O:第二预处理,得到新无线路由器名称S。
在本申请上述步骤O中,第二预处理将无线路由器名称转化成小写字母,并去掉特殊字符(包括~!#$%^&*()_+-=)与数字,得到的新无线路由器名称设为S。
步骤P:判断是否S=P1或者S=P2。
在本申请上述步骤P中,将新无线路由器名称S逐一与该目标对象的P1,P2计算,计算方法如下,如果S=P1,则认为该无线路由器属于该目标对象;否则,如果S=P2,则认为该无线路由器属于该目标对象。
步骤Q:将该无线路由器赋予该目标对象。
步骤R:判断是否Levenshtein(S,P1)=1或者Levenshtein(S,P2)=1且S长度≥5。
在本申请上述步骤R中,在S=P1或者S=P2都不满足的情况下,逐一判断S与P1、P2的字符串间距,其中,当levenshtein(S,P1)=1,认为该无线路由器属于该目标对象;否则,如果levenshtein(S,P2)=1,且S的字符个数>=5,则认为该无线路由器属于该目标对象。特别的,对于加上S的字符个数>=5这一条件,是为了降低由于首字母组合在较短的情况下,虽然levenshtein(S,P2)=1,但是依然存在较大误差的可能。
步骤S:丢弃该无线路由器。
在本申请上述步骤S中,如果步骤P和步骤R中的条件都不满足,则丢弃该无线路由器。
步骤T:对于同一无线路由器属于多个目标对象的情况进行过滤。
在本申请上述步骤T中,对于可能造成的同一个无线路由器被赋予多个目标对象的可能,需要通过判断这个无线路由器与哪个商铺更近来进行过滤,距离计算函数依然使用球面距离。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述获取数据之间的匹配关系的方法的装置,如图4所示,该装置包括:获取模块402、第一读取模块404以及处理模块406;
其中,获取模块402,用于获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;
第一读取模块404,用于从日志信息中读取任意一个或多个目标对象的位置信息,并从定位日志中读取任意一个或多个无线路由器的位置信息;
处理模块406,用于根据任意一个或多个目标对象的位置信息和任意一个或多个无线路由器的位置信息,确定目标对象所对应的一组无线路由器,以获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系。
此处需要说明的是,上述获取模块402、第一读取模块404以及处理模块406,对应于实施例一中的步骤S202至步骤S206,三个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
本申请提供的上述获取模块402、第一读取模块404以及处理模块406,可以实现根据获取的目标对象的日志信息和无线路由器的定位日志中的位置信息,从大量且繁杂的数据中,自动识别每个目标对象所对应的无线路由器。通过上述装置,能够在目标对象信息数据库(例如POI数据)和记载无线路由器指定数据字段的数据库之间建立桥梁,使得两个数据库的联合分析成为可能。
由上可知,本申请上述实施例二所提供的方案中,采用获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志的方式,通过从日志信息和定位日志中分别读取目标对象和无线路由器的位置信息,达到了根据目标对象和无线路由器的位置信息确定目标对象与一组无线路由器之间的对应关系的目的,从而实现了获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系的技术效果,进而解决了由于现有技术中采用人工方式获取目标对象与移动终端的对应关系的方法,导致获取到的目标对象和无线网络之间的关系不准确且成本高的技术问题。
可选地,图5是根据本申请图4所示实施例的一种可选的获取模块的结构示意图;如图5所示,获取模块402包括:获取单元502以及转换单元504,其中:
获取单元502,用于获取移动终端集合中包含的移动终端的网络日志信息,其中,网络日志信息至少包括如下数据字段:移动终端的位置信息和移动终端接入的无线路由器的路由信息;
转换单元504,用于对网络日志信息进行格式化转换,生成任意一个或多个无线路由器的定位日志,无线路由器的定位日志至少包括如下数据字段:标识信息和位置信息。
此处需要说明的是,上述获取单元502以及转换单元504,对应于实施例一中的步骤S2022至步骤S2024,两个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
本申请实施例提供的上述获取单元502以及转换单元504提供了一种获取无线路由设备集合中包含的无线路由器的定位日志的可选方案。基于上述获取单元502实现了移动终端的网络日志的获取和整合,通过转换单元504实现了从常见的以移动终端为单元的网络日志向以无线路由器为单元的定位日志的转换,使得根据本申请实施例的获取数据之间的匹配关系的装置可以直接从无线路由器的定位日志中获取无线路由器的位置信息,并获取目标对象与无线路由器的对应关系。
可选地,图6是根据本申请图5所示实施例的一种可选的获取数据之间的匹配关系的装置的结构示意图,如图6所示,根据本申请实施例的获取数据之间的匹配关系的装置还包括:第一处理模块602以及第一筛选模块604,其中:
第一处理模块602,用于根据无线路由器的标识信息对无线路由设备集合中的无线路由器进行聚合处理,生成无线路由设备集合中的任意一个或多个无线路由器的聚合结果,其中,聚合结果包括:无线路由器的信号强度;
第一筛选模块604,用于使用预先设置的过滤阈值对聚合结果进行筛选,确定任意一个或多个无线路由器的定位日志中的有效日志,有效日志为信号强度大于等于过滤阈值的无线路由器的定位日志。
此处需要说明的是,上述第一处理模块602以及第一筛选模块604,对应于实施例一中的步骤S2032至步骤S2034,两个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
本申请实施例提供的上述第一处理模块602以及第一筛选模块604提供了一种对于定位日志进行筛选处理的可选方案。基于上述第一处理模块602,对定位日志按照无线路由器的标识信息进行聚合,生成每个无线路由器的聚合结果,再通过第一筛选模块604对聚合结果进行筛选,保留聚合结果中可靠的数据并得到有效日志,实现了对定位日志的进一步筛选处理,尤其是在定位日志的信息量庞大时可以简化数据并确保数据的可靠性。
可选地,无线路由器的定位日志还包括:无线路由器的定位坐标,图7是根据本申请图6所示实施例的一种可选的获取数据之间的匹配关系的装置的结构示意图,如图7所示,根据本申请实施例的获取数据之间的匹配关系的装置还包括:第二处理模块702以及第二筛选模块704,其中:
第二处理模块702,用于使用预设条件对任意一个或多个无线路由器的定位坐标进行聚类,获取任意一个或多个无线路由器的聚类簇,其中,无线路由器至少生成一个聚类簇;
第二筛选模块704,用于根据无线路由器的聚类簇的数量,对无线路由设备集合中的无线路由器进行筛选。
此处需要说明的是,上述第二处理模块702以及第二筛选模块704,对应于实施例一中的步骤S2036至步骤S2038,两个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
本申请实施例提供的上述第二处理模块702以及第二筛选模块704实现了通过判断每个无线路由器的状态,完成对无线路由设备集合中的无线路由器的筛选。
可选地,图8是根据本申请图7所示实施例的一种可选的第二筛选模块的结构示意图;如图8所示,第二筛选模块704包括:第一计算单元800、第二计算单元802、第一处理单元804、第二处理单元806以及第三处理单元808,其中:
第一计算单元800,用于计算无线路由器的每一个聚类簇的中心点坐标;
第二计算单元802,用于在无线路由器的聚类簇的数量超过预设阈值的情况下,使用无线路由器的任意两个聚类簇的中心点坐标,计算得到无线路由器的任意两个聚类簇的中心距离;
第一处理单元804,用于当无线路由器的中心距离小于等于距离阈值时,确定无线路由器为有效无线路由器;
第二处理单元806,用于保留无线路由设备集合中的有效无线路由器,并读取有效无线路由器的簇内个数最大的聚类簇;
第三处理单元808,用于将簇内个数最大的聚类簇的中心点坐标赋值给有效无线路由器。
此处需要说明的是,上述第一计算单元800、第二计算单元802、第一处理单元804、第二处理单元806以及第三处理单元808,对应于实施例一中的步骤S20380至步骤S20388,五个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
本申请实施例提供的上述第二计算单元802以及第一处理单元804实现了对无线路由器是否有效进行判定。在一种情况下,当定位日志中出现错误或较大误差时,通过上述步骤可以对无线路由器的定位信息进行甄别,避免定位日志中的定位信息的误差引起的目标对象与无线路由器的对应关系的错误。在另一种情况下,当无线路由器的位置并非固定,而是产生移动时,无线路由器在移动过程中可能被大量的无线终端获取,通过上述步骤还可以对无线路由器进行甄别,避免移动无线路由器被定位而引起的目标对象与无线路由器的对应关系的错误。
本申请实施例提供的上述第一计算单元800、第二计算单元802、第一处理单元804、第二处理单元806以及第三处理单元808提供了一种对所述无线路由设备集合中的无线路由器进行筛选的可选方案。既实现了对无线路由器是否有效的判断,又实现了提取有效无线路由器并对有效无线路由器赋予最优位置坐标,最终达到了精确筛选无线路由器设备集合中的无线路由器并对筛选后的无线路由器赋予最优位置坐标的技术效果。
可选地,目标对象的日志信息至少包括:目标对象的坐标信息,无线路由器的定位日志至少包括:无线路由器的坐标信息,图9是根据本申请图4所示实施例的一种可选的处理模块的结构示意图;如图9所示,处理模块406包括:匹配单元902、第三计算单元904以及提取单元906,其中:
匹配单元902,用于将目标对象的位置信息和无线路由器的位置信息作为关键字进行匹配,获取与目标对象具有映射关系的至少一个无线路由器;
第三计算单元904,用于根据目标对象的坐标信息,以及与目标对象具有映射关系的至少一个无线路由器的坐标信息,计算得到目标对象与具有映射关系的任意一个无线路由器之间的球面距离;
提取单元906,用于提取球面距离小于等于位置阈值的目标对象和具有映射关系的无线路由器,以获取与目标对象具有匹配关系的至少一个无线路由器。
此处需要说明的是,上述匹配单元902、第三计算单元904以及提取单元906,对应于实施例一中的步骤S2062至步骤S2066,三个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
本申请实施例提供的上述匹配单元902、第三计算单元904以及提取单元906提供了一种获取目标对象与一组无线路由器的映射关系的可选方案。基于上述匹配单元902获取位置信息相同的目标对象与无线路由器,通过第三计算单元904计算目标对象与位置信息相同的每一个无线路由器的球面距离,并经由提取单元906中球面距离与位置阈值的判断,提取球面距离小于等于位置阈值的目标对象和具有映射关系的无线路由器,以实现目标对象与无线路由器匹配关系的建立。
可选地,目标对象的日志信息至少包括如下数据字段:目标对象名称、目标对象坐标信息和目标对象位置信息,无线路由器的定位日志还包括:无线路由器名称。图10是根据本申请图9所示实施例的一种可选的获取数据之间的匹配关系的装置的结构示意图;如图10所示,根据本申请实施例的获取数据之间的匹配关系的装置还包括:第一预处理模块1002、第二预处理模块1004以及第三筛选模块1006,其中:
第一预处理模块1002,用于对目标对象名称进行第一预处理,生成满足第一预定格式和/或第一预定内容的新目标对象名称;
第二预处理模块1004,对与目标对象具有匹配关系的至少一个无线路由器的无线路由器名称进行第二预处理,生成满足第二预定格式和/或第二预定内容的新无线路由器名称;
第三筛选模块1006,用于根据新目标对象名称和新无线路由器名称,对与目标对象具有匹配关系的至少一个无线路由器进行筛选处理,得到满足预设条件的与目标对象匹配的无线路由器。
此处需要说明的是,上述第一预处理模块1002、第二预处理模块1004以及第三筛选模块1006,对应于实施例一中的步骤S2072至步骤S2076,三个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
本申请实施例提供的上述第一预处理模块1002、第二预处理模块1004以及第三筛选模块1006,基于第一预处理模块1002、第二预处理模块1004完成了对目标对象名称和无线路由器名称的处理,并通过第三筛选模块1006的筛选,得到了与目标对象匹配的无线路由器,进一步提高了目标对象和无线路由器的匹配准确性。
可选地,图11是根据本申请图4所示实施例的一种可选的获取数据之间的匹配关系的装置的结构示意图,如图11所示,根据本申请实施例的获取数据之间的匹配关系的装置还包括:第二读取模块1102,其中,第二读取模块1102,用于当同一个无线路由器与多个目标对象具有匹配关系的情况下,读取与无线路由器距离最近的目标对象。
此处需要说明的是,上述第二读取模块1102,对应于实施例一中的步骤S208,模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
本申请实施例提供的上述第二读取模块1102通过判断这个无线路由器与目标对象的距离,例如球面距离,避免了不论以目标对象为单元,来获取与某个目标对象匹配的无线路由器,还是以无线路由器为单元,来获取与某个无线路由器匹配的目标对象时可能造成的一个无线路由器归属于多个目标对象的情况。
此处需要说明的是,本申请上述实施例二所提供的优选实施方案与实施例一所提供的可选方案以及应用场景实施过程相同,但不限于实施例一所提供的方案。
实施例3
本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的漏洞检测方法中以下步骤的程序代码:获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;从日志信息中读取任意一个或多个目标对象的位置信息,并从定位日志中读取任意一个或多个无线路由器的位置信息;根据任意一个或多个目标对象的位置信息和任意一个或多个无线路由器的位置信息,确定目标对象所对应的一组无线路由器,以获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系。
可选地,图12是根据本发明实施例的一种计算机终端的结构框图。如图12所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器51、存储器53、以及传输装置55。
其中,存储器53可用于存储软件程序以及模块,如本发明实施例中的安全漏洞检测方法和装置对应的程序指令/模块,处理器51通过运行存储在存储器53内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的系统漏洞攻击的检测方法。存储器53可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器53可进一步包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置55用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置55包括一个网络适配器(NetworkInterface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置55为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器53用于存储预设动作条件和预设权限用户的信息、以及应用程序。
处理器51可以通过传输装置调用存储器53存储的信息及应用程序,以执行下述步骤:获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;从日志信息中读取任意一个或多个目标对象的位置信息,并从定位日志中读取任意一个或多个无线路由器的位置信息;根据任意一个或多个目标对象的位置信息和任意一个或多个无线路由器的位置信息,确定目标对象所对应的一组无线路由器,以获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系。
可选的,上述处理器51还可以执行如下步骤的程序代码:获取移动终端集合中包含的移动终端的网络日志信息,其中,网络日志信息至少包括如下数据字段:移动终端的位置信息和移动终端接入的无线路由器的路由信息;对网络日志信息进行格式化转换,生成任意一个或多个无线路由器的定位日志,无线路由器的定位日志至少包括如下数据字段:标识信息和位置信息。
可选的,上述处理器51还可以执行如下步骤的程序代码:根据无线路由器的标识信息对无线路由设备集合中的无线路由器进行聚合处理,生成无线路由设备集合中的任意一个或多个无线路由器的聚合结果,其中,聚合结果包括:无线路由器的信号强度;使用预先设置的过滤阈值对聚合结果进行筛选,确定任意一个或多个无线路由器的定位日志中的有效日志,有效日志为信号强度大于等于过滤阈值的无线路由器的定位日志。
可选的,上述处理器51还可以执行如下步骤的程序代码:使用预设条件对任意一个或多个无线路由器的定位坐标进行聚类,获取任意一个或多个无线路由器的聚类簇,其中,无线路由器至少生成一个聚类簇;根据无线路由器的聚类簇的数量,对无线路由设备集合中的无线路由器进行筛选。
可选的,上述处理器51还可以执行如下步骤的程序代码:计算无线路由器的每一个聚类簇的中心点坐标;在无线路由器的聚类簇的数量超过预设阈值的情况下,使用无线路由器的任意两个聚类簇的中心点坐标,计算得到无线路由器的任意两个聚类簇的中心距离;当无线路由器的中心距离小于等于距离阈值时,确定无线路由器为有效无线路由器;保留无线路由设备集合中的有效无线路由器,并读取有效无线路由器的簇内个数最大的聚类簇;将簇内个数最大的聚类簇的中心点坐标赋值给有效无线路由器。
可选的,上述处理器51还可以执行如下步骤的程序代码:将目标对象的位置信息和无线路由器的位置信息作为关键字进行匹配,获取与目标对象具有映射关系的至少一个无线路由器;根据目标对象的坐标信息,以及与目标对象具有映射关系的至少一个无线路由器的坐标信息,计算得到目标对象与具有映射关系的任意一个无线路由器之间的球面距离;提取球面距离小于等于位置阈值的目标对象和具有映射关系的无线路由器,以获取与目标对象具有匹配关系的至少一个无线路由器。
可选的,上述处理器51还可以执行如下步骤的程序代码:对目标对象名称进行第一预处理,生成满足第一预定格式和/或第一预定内容的新目标对象名称;对与目标对象具有匹配关系的至少一个无线路由器的无线路由器名称进行第二预处理,生成满足第二预定格式和/或第二预定内容的新无线路由器名称;根据新目标对象名称和新无线路由器名称,对与目标对象具有匹配关系的至少一个无线路由器进行筛选处理,得到满足预设条件的与目标对象匹配的无线路由器。
可选的,上述处理器51还可以执行如下步骤的程序代码:当同一个无线路由器与多个目标对象具有匹配关系的情况下,读取与无线路由器距离最近的目标对象。
采用本发明实施例,提供了一种获取数据之间的匹配关系的方案。通过获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;从日志信息中读取任意一个或多个目标对象的位置信息,并从定位日志中读取任意一个或多个无线路由器的位置信息;根据任意一个或多个目标对象的位置信息和任意一个或多个无线路由器的位置信息,确定目标对象所对应的一组无线路由器,从而达到了获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系的目的,进而解决了由于现有技术中采用人工方式获取目标对象与移动终端的对应关系的方法,导致获取到的目标对象和无线网络之间的关系不准确且成本高的技术问题。
本领域普通技术人员可以理解,图10所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图10其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图10中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图10所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
实施例4
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的获取数据之间的匹配关系的方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;从日志信息中读取任意一个或多个目标对象的位置信息,并从定位日志中读取任意一个或多个无线路由器的位置信息;根据任意一个或多个目标对象的位置信息和任意一个或多个无线路由器的位置信息,确定目标对象所对应的一组无线路由器,以获取目标对象集合中包含的目标对象与无线路由设备集合中包含的无线路由器之间的匹配关系。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:上述处理器51还可以执行如下步骤的程序代码:获取移动终端集合中包含的移动终端的网络日志信息,其中,网络日志信息至少包括如下数据字段:移动终端的位置信息和移动终端接入的无线路由器的路由信息;对网络日志信息进行格式化转换,生成任意一个或多个无线路由器的定位日志,无线路由器的定位日志至少包括如下数据字段:标识信息和位置信息。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:根据无线路由器的标识信息对无线路由设备集合中的无线路由器进行聚合处理,生成无线路由设备集合中的任意一个或多个无线路由器的聚合结果,其中,聚合结果包括:无线路由器的信号强度;使用预先设置的过滤阈值对聚合结果进行筛选,确定任意一个或多个无线路由器的定位日志中的有效日志,有效日志为信号强度大于等于过滤阈值的无线路由器的定位日志。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:使用预设条件对任意一个或多个无线路由器的定位坐标进行聚类,获取任意一个或多个无线路由器的聚类簇,其中,无线路由器至少生成一个聚类簇;根据无线路由器的聚类簇的数量,对无线路由设备集合中的无线路由器进行筛选。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:计算无线路由器的每一个聚类簇的中心点坐标;在无线路由器的聚类簇的数量超过预设阈值的情况下,使用无线路由器的任意两个聚类簇的中心点坐标,计算得到无线路由器的任意两个聚类簇的中心距离;当无线路由器的中心距离小于等于距离阈值时,确定无线路由器为有效无线路由器;保留无线路由设备集合中的有效无线路由器,并读取有效无线路由器的簇内个数最大的聚类簇;将簇内个数最大的聚类簇的中心点坐标赋值给有效无线路由器。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:将目标对象的位置信息和无线路由器的位置信息作为关键字进行匹配,获取与目标对象具有映射关系的至少一个无线路由器;根据目标对象的坐标信息,以及与目标对象具有映射关系的至少一个无线路由器的坐标信息,计算得到目标对象与具有映射关系的任意一个无线路由器之间的球面距离;提取球面距离小于等于位置阈值的目标对象和具有映射关系的无线路由器,以获取与目标对象具有匹配关系的至少一个无线路由器。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:对目标对象名称进行第一预处理,生成满足第一预定格式和/或第一预定内容的新目标对象名称;对与目标对象具有匹配关系的至少一个无线路由器的无线路由器名称进行第二预处理,生成满足第二预定格式和/或第二预定内容的新无线路由器名称;根据新目标对象名称和新无线路由器名称,对与目标对象具有匹配关系的至少一个无线路由器进行筛选处理,得到满足预设条件的与目标对象匹配的无线路由器。
可选地,在本实施例中,存储介质还被设置为存储用于执行以下步骤的程序代码:当同一个无线路由器与多个目标对象具有匹配关系的情况下,读取与无线路由器距离最近的目标对象。
此处需要说明的是,上述计算机终端群中的任意一个可以与网站服务器和扫描器建立通信关系,扫描器可以扫描计算机终端上php执行的web应用程序的值命令。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (16)

1.一种获取数据之间的匹配关系的方法,其特征在于,包括:
获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;
从所述日志信息中读取任意一个或多个目标对象的位置信息,并从所述定位日志中读取任意一个或多个无线路由器的位置信息;
根据所述任意一个或多个目标对象的位置信息和所述任意一个或多个无线路由器的位置信息,确定所述目标对象所对应的一组无线路由器,以获取所述目标对象集合中包含的目标对象与所述无线路由设备集合中包含的无线路由器之间的匹配关系。
2.根据权利要求1所述的方法,其特征在于,获取无线路由设备集合中包含的无线路由器的定位日志包括:
获取移动终端集合中包含的移动终端的网络日志信息,其中,所述网络日志信息至少包括如下数据字段:所述移动终端的位置信息和所述移动终端接入的无线路由器的路由信息;
对所述网络日志信息进行格式化转换,生成所述任意一个或多个无线路由器的定位日志,所述无线路由器的定位日志至少包括如下数据字段:标识信息和所述位置信息。
3.根据权利要求2所述的方法,其特征在于,在对所述网络日志信息进行格式化转换,生成所述任意一个或多个无线路由器的定位日志之后,所述方法还包括:
根据所述无线路由器的标识信息对所述无线路由设备集合中的无线路由器进行聚合处理,生成所述无线路由设备集合中的任意一个或多个无线路由器的聚合结果,其中,所述聚合结果包括:所述无线路由器的信号强度;
使用预先设置的过滤阈值对所述聚合结果进行筛选,确定所述任意一个或多个无线路由器的定位日志中的有效日志,所述有效日志为所述信号强度大于等于所述过滤阈值的无线路由器的定位日志。
4.根据权利要求3所述的方法,其特征在于,所述无线路由器的定位日志还包括:所述无线路由器的定位坐标,其中,在确定所述任意一个或多个无线路由器的定位日志中的有效日志之后,所述方法还包括:
使用预设条件对所述任意一个或多个无线路由器的定位坐标进行聚类,获取所述任意一个或多个无线路由器的聚类簇,其中,所述无线路由器至少生成一个聚类簇;
根据所述无线路由器的聚类簇的数量,对所述无线路由设备集合中的无线路由器进行筛选。
5.根据权利要求4所述的方法,其特征在于,根据所述无线路由器的聚类簇的数量,对所述无线路由设备集合中的无线路由器进行筛选,包括:
计算所述无线路由器的每一个聚类簇的中心点坐标;
在所述无线路由器的聚类簇的数量超过预设阈值的情况下,使用所述无线路由器的任意两个聚类簇的中心点坐标,计算得到所述无线路由器的任意两个聚类簇的中心距离;
当所述无线路由器的中心距离小于等于距离阈值时,确定所述无线路由器为有效无线路由器;
保留所述无线路由设备集合中的有效无线路由器,并读取所述有效无线路由器的簇内个数最大的聚类簇;
将所述簇内个数最大的聚类簇的中心点坐标赋值给所述有效无线路由器。
6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述目标对象的日志信息至少包括:所述目标对象的坐标信息,所述无线路由器的定位日志至少包括:所述无线路由器的坐标信息,其中,
根据所述任意一个或多个目标对象的位置信息和所述任意一个或多个无线路由器的位置信息,确定所述目标对象所对应的一组无线路由器,包括:
将所述目标对象的位置信息和所述无线路由器的位置信息作为关键字进行匹配,获取与所述目标对象具有映射关系的至少一个无线路由器;
根据所述目标对象的坐标信息,以及与所述目标对象具有映射关系的至少一个无线路由器的坐标信息,计算得到所述目标对象与具有所述映射关系的任意一个无线路由器之间的球面距离;
提取所述球面距离小于等于位置阈值的目标对象和具有所述映射关系的所述无线路由器,以获取与所述目标对象具有所述匹配关系的至少一个无线路由器。
7.根据权利要求6所述的方法,其特征在于,所述目标对象的日志信息至少包括如下数据字段:目标对象名称、目标对象坐标信息和目标对象位置信息,所述无线路由器的定位日志还包括:无线路由器名称,其中,
在获取与所述目标对象具有所述匹配关系的至少一个无线路由器之后,所述方法还包括:
对所述目标对象名称进行第一预处理,生成满足第一预定格式和/或第一预定内容的新目标对象名称;
对与所述目标对象具有所述匹配关系的至少一个无线路由器的无线路由器名称进行第二预处理,生成满足第二预定格式和/或第二预定内容的新无线路由器名称;
根据所述新目标对象名称和所述新无线路由器名称,对与所述目标对象具有所述匹配关系的至少一个无线路由器进行筛选处理,得到满足预设条件的与所述目标对象匹配的无线路由器。
8.根据权利要求1所述的方法,其特征在于,在获取所述目标对象集合中包含的目标对象与所述无线路由设备集合中包含的无线路由器之间的匹配关系之后,所述方法还包括:
当同一个无线路由器与多个目标对象具有所述匹配关系的情况下,读取与所述无线路由器距离最近的目标对象。
9.一种获取数据之间的匹配关系的装置,其特征在于,包括:
获取模块,用于获取目标对象集合中包含的目标对象的日志信息和无线路由设备集合中包含的无线路由器的定位日志;
第一读取模块,用于从所述日志信息中读取任意一个或多个目标对象的位置信息,并从所述定位日志中读取任意一个或多个无线路由器的位置信息;
处理模块,用于根据所述任意一个或多个目标对象的位置信息和所述任意一个或多个无线路由器的位置信息,确定所述目标对象所对应的一组无线路由器,以获取所述目标对象集合中包含的目标对象与所述无线路由设备集合中包含的无线路由器之间的匹配关系。
10.根据权利要求9所述的装置,其特征在于,获取模块包括:
获取单元,用于获取移动终端集合中包含的移动终端的网络日志信息,其中,所述网络日志信息至少包括如下数据字段:所述移动终端的位置信息和所述移动终端接入的无线路由器的路由信息;
转换单元,用于对所述网络日志信息进行格式化转换,生成所述任意一个或多个无线路由器的定位日志,所述无线路由器的定位日志至少包括如下数据字段:标识信息和所述位置信息。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第一处理模块,用于根据所述无线路由器的标识信息对所述无线路由设备集合中的无线路由器进行聚合处理,生成所述无线路由设备集合中的任意一个或多个无线路由器的聚合结果,其中,所述聚合结果包括:所述无线路由器的信号强度;
第一筛选模块,用于使用预先设置的过滤阈值对所述聚合结果进行筛选,确定所述任意一个或多个无线路由器的定位日志中的有效日志,所述有效日志为所述信号强度大于等于所述过滤阈值的无线路由器的定位日志。
12.根据权利要求11所述的装置,其特征在于,所述无线路由器的定位日志还包括:所述无线路由器的定位坐标,所述装置还包括:
第二处理模块,用于使用预设条件对所述任意一个或多个无线路由器的定位坐标进行聚类,获取所述任意一个或多个无线路由器的聚类簇,其中,所述无线路由器至少生成一个聚类簇;
第二筛选模块,用于根据所述无线路由器的聚类簇的数量,对所述无线路由设备集合中的无线路由器进行筛选。
13.根据权利要求12所述的装置,其特征在于,第二筛选模块包括:
第一计算单元,用于计算所述无线路由器的每一个聚类簇的中心点坐标;
第二计算单元,用于在所述无线路由器的聚类簇的数量超过预设阈值的情况下,使用所述无线路由器的任意两个聚类簇的中心点坐标,计算得到所述无线路由器的任意两个聚类簇的中心距离;
第一处理单元,用于当所述无线路由器的中心距离小于等于距离阈值时,确定所述无线路由器为有效无线路由器;
第二处理单元,用于保留所述无线路由设备集合中的有效无线路由器,并读取所述有效无线路由器的簇内个数最大的聚类簇;
第三处理单元,用于将所述簇内个数最大的聚类簇的中心点坐标赋值给所述有效无线路由器。
14.根据权利要求9至13中任意一项所述的装置,其特征在于,所述目标对象的日志信息至少包括:所述目标对象的坐标信息,所述无线路由器的定位日志至少包括:所述无线路由器的坐标信息,所述处理模块包括:
匹配单元,用于将所述目标对象的位置信息和所述无线路由器的位置信息作为关键字进行匹配,获取与所述目标对象具有映射关系的至少一个无线路由器;
第三计算单元,用于根据所述目标对象的坐标信息,以及与所述目标对象具有映射关系的至少一个无线路由器的坐标信息,计算得到所述目标对象与具有所述映射关系的任意一个无线路由器之间的球面距离;
提取单元,用于提取所述球面距离小于等于位置阈值的目标对象和具有所述映射关系的所述无线路由器,以获取与所述目标对象具有所述匹配关系的至少一个无线路由器。
15.根据权利要求14所述的装置,其特征在于,所述目标对象的日志信息至少包括如下数据字段:目标对象名称、目标对象坐标信息和目标对象位置信息,所述无线路由器的定位日志还包括:无线路由器名称,所述装置还包括:
第一预处理模块,用于对所述目标对象名称进行第一预处理,生成满足第一预定格式和/或第一预定内容的新目标对象名称;
第二预处理模块,对与所述目标对象具有所述匹配关系的至少一个无线路由器的无线路由器名称进行第二预处理,生成满足第二预定格式和/或第二预定内容的新无线路由器名称;
第三筛选模块,用于根据所述新目标对象名称和所述新无线路由器名称,对与所述目标对象具有所述匹配关系的至少一个无线路由器进行筛选处理,得到满足预设条件的与所述目标对象匹配的无线路由器。
16.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二读取模块,用于当同一个无线路由器与多个目标对象具有所述匹配关系的情况下,读取与所述无线路由器距离最近的目标对象。
CN201510370088.0A 2015-06-29 2015-06-29 获取数据之间的匹配关系的方法和装置 Active CN106326263B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510370088.0A CN106326263B (zh) 2015-06-29 2015-06-29 获取数据之间的匹配关系的方法和装置
PCT/CN2016/086649 WO2017000817A1 (zh) 2015-06-29 2016-06-22 获取数据之间的匹配关系的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510370088.0A CN106326263B (zh) 2015-06-29 2015-06-29 获取数据之间的匹配关系的方法和装置

Publications (2)

Publication Number Publication Date
CN106326263A true CN106326263A (zh) 2017-01-11
CN106326263B CN106326263B (zh) 2019-10-08

Family

ID=57607714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510370088.0A Active CN106326263B (zh) 2015-06-29 2015-06-29 获取数据之间的匹配关系的方法和装置

Country Status (2)

Country Link
CN (1) CN106326263B (zh)
WO (1) WO2017000817A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110493848A (zh) * 2019-08-20 2019-11-22 赛尔网络有限公司 用户终端路由ip变化的监测方法、装置、系统及介质
CN110740418A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 用于生成用户到访信息的方法和装置
CN111475562A (zh) * 2020-04-11 2020-07-31 吴媛媛 应用于业务处理系统的数据格式优化方法及业务服务器

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232639B (zh) * 2020-09-22 2023-06-30 支付宝(杭州)信息技术有限公司 统计方法、装置和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063499A (zh) * 2011-01-04 2011-05-18 百度在线网络技术(北京)有限公司 构建电子地图定位数据库的方法及系统
US8200427B2 (en) * 2008-11-17 2012-06-12 Lg Electronics Inc. Method for providing POI information for mobile terminal and apparatus thereof
CN102737048A (zh) * 2011-04-01 2012-10-17 北京千橡网景科技发展有限公司 用于修正社交网站中保存的poi的方法和设备
CN103945007A (zh) * 2014-05-08 2014-07-23 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN104501798A (zh) * 2014-12-18 2015-04-08 深圳先进技术研究院 一种基于增强现实ip地图的网络对象定位追踪方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103152696A (zh) * 2013-03-19 2013-06-12 沈志松 基于WiFi的兴趣点定位系统
CN103607771B (zh) * 2013-11-15 2017-04-19 四川长虹电器股份有限公司 基于wifi的定位系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8200427B2 (en) * 2008-11-17 2012-06-12 Lg Electronics Inc. Method for providing POI information for mobile terminal and apparatus thereof
CN102063499A (zh) * 2011-01-04 2011-05-18 百度在线网络技术(北京)有限公司 构建电子地图定位数据库的方法及系统
CN102737048A (zh) * 2011-04-01 2012-10-17 北京千橡网景科技发展有限公司 用于修正社交网站中保存的poi的方法和设备
CN103945007A (zh) * 2014-05-08 2014-07-23 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN104501798A (zh) * 2014-12-18 2015-04-08 深圳先进技术研究院 一种基于增强现实ip地图的网络对象定位追踪方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110740418A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 用于生成用户到访信息的方法和装置
CN110493848A (zh) * 2019-08-20 2019-11-22 赛尔网络有限公司 用户终端路由ip变化的监测方法、装置、系统及介质
CN111475562A (zh) * 2020-04-11 2020-07-31 吴媛媛 应用于业务处理系统的数据格式优化方法及业务服务器

Also Published As

Publication number Publication date
WO2017000817A1 (zh) 2017-01-05
CN106326263B (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN107291888B (zh) 基于机器学习统计模型的入住酒店附近生活推荐系统方法
CN106649464B (zh) 一种中文地址树的构建方法及装置
CN107798557A (zh) 电子装置、基于lbs数据的服务场所推荐方法及存储介质
CN106790468B (zh) 一种分析用户WiFi活动轨迹规律的分布式实现方法
CN106326263A (zh) 获取数据之间的匹配关系的方法和装置
CN110008300A (zh) Poi别名的确定方法、装置、计算机设备和存储介质
CN105682097B (zh) 一种伪基站识别定位方法及装置
CN106843941B (zh) 信息处理方法、装置和计算机设备
CN110363076A (zh) 人员信息关联方法、装置及终端设备
CN105865478A (zh) 一种导航信息推送方法和装置、设备
CN104715127B (zh) 一种投诉热点区域识别方法及系统
CN109993184A (zh) 一种数据融合的方法以及数据融合设备
CN110392122A (zh) 地址类型的确定方法和装置、存储介质、电子装置
CN110688888B (zh) 一种基于深度学习的行人属性识别方法和系统
CN109068272A (zh) 相似用户识别方法、装置、设备及可读存储介质
CN107038649B (zh) 一种终端用户的好友推荐方法及装置
CN106033443B (zh) 一种车辆检索中的扩展查询方法及装置
CN109936820A (zh) 一种用户终端定位方法及装置
CN110502670A (zh) 基于人工智能的网络社交关系知识图谱生成方法和系统
CN110781256B (zh) 基于发送位置数据确定与Wi-Fi相匹配的POI的方法及装置
CN110445772A (zh) 一种基于主机关系的互联网主机扫描方法及系统
CN107133689A (zh) 一种位置标记方法
CN109041208A (zh) 一种基于Wi-Fi指纹库的定位方法和定位服务器
CN109325177A (zh) 信息推送方法、系统、可读存储介质和计算机设备
CN110619090B (zh) 一种区域吸引力评估方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant