CN111291145B - 无线热点与兴趣点的映射方法、装置和存储介质 - Google Patents

无线热点与兴趣点的映射方法、装置和存储介质 Download PDF

Info

Publication number
CN111291145B
CN111291145B CN202010072289.3A CN202010072289A CN111291145B CN 111291145 B CN111291145 B CN 111291145B CN 202010072289 A CN202010072289 A CN 202010072289A CN 111291145 B CN111291145 B CN 111291145B
Authority
CN
China
Prior art keywords
interest point
interest
mapping
wireless
sniffing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010072289.3A
Other languages
English (en)
Other versions
CN111291145A (zh
Inventor
肖邱勇
张长旺
黄新营
张纪红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010072289.3A priority Critical patent/CN111291145B/zh
Publication of CN111291145A publication Critical patent/CN111291145A/zh
Priority to PCT/CN2020/124594 priority patent/WO2021147431A1/zh
Priority to US17/678,478 priority patent/US20220286956A1/en
Application granted granted Critical
Publication of CN111291145B publication Critical patent/CN111291145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W48/00Access restriction; Network selection; Access point selection
    • H04W48/20Selecting an access point
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W48/00Access restriction; Network selection; Access point selection
    • H04W48/16Discovering, processing access restriction or access information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/10Scheduling measurement reports ; Arrangements for measurement reports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W48/00Access restriction; Network selection; Access point selection
    • H04W48/18Selecting a network or a communication service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/08Access point devices

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • Health & Medical Sciences (AREA)
  • Remote Sensing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请涉及一种无线热点与兴趣点的映射方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取嗅探记录;每条嗅探记录包含嗅探设备所嗅探到的无线热点的数据;根据所述嗅探记录,确定无线热点之间的嗅探设备重叠度;根据无线热点与兴趣点的距离,确定无线热点与兴趣点间的初始映射概率;基于所述嗅探设备重叠度进行所述初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点间的目标映射概率;根据所述目标映射概率,建立无线热点与兴趣点之间的映射。本申请提供的方案适用场景广,映射准确性高。

Description

无线热点与兴趣点的映射方法、装置和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种无线热点与兴趣点的映射方法、装置和存储介质。
背景技术
随着移动互联网和移动设备的不断发展普及,无线热点成为了个人、家庭、企业、餐饮、酒店、零售等服务行业必备的设施和服务之一。无线热点可通过无线局域网为周围一定距离范围内的用户提供接入互联网服务。若用户嗅探或连接了无线热点,则可以认为该用户到访了此无线热点所在的兴趣点(POI,Point of Interest)。因而,构建无线热点与POI之间的映射关系,对于人群活动规律挖掘、店铺选址、交通规划等具有重要意义。
传统方式主要基于名称构建无线热点与POI的映射关系。基于名称的映射方式,需要无线热点名称与POI名称具有强相关性,然而实际场景中由用户自定义的大部分无线热点名称与POI名称的相关性是极弱的,从而基于名称的映射方式能够适用的场景非常有限。
发明内容
基于此,有必要针对基于名称的无线热点和兴趣点映射方法适用场景有限的技术问题,提供一种无线热点与兴趣点的映射方法、装置、计算机可读存储介质和计算机设备。
一种无线热点与兴趣点的映射方法,包括:
获取嗅探记录,所述嗅探记录包括嗅探设备所嗅探到的无线热点的数据;
根据所述嗅探记录,确定嗅探设备重叠度;
根据无线热点与相应的兴趣点的距离,确定所述无线热点与所述相应的兴趣点间的初始映射概率;
基于所述嗅探设备重叠度进行所述初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点间的目标映射概率;
根据所述目标映射概率,建立无线热点与兴趣点之间的映射。
一种无线热点与兴趣点的映射装置,所述装置包括:
热点相关性度量模块,用于获取嗅探记录,所述嗅探记录包括嗅探设备所嗅探到的无线热点的数据;根据所述嗅探记录,确定的嗅探设备重叠度;
映射概率传播模块,用于根据无线热点与相应的兴趣点的距离,确定所述无线热点与所述相应的兴趣点间的初始映射概率;基于所述嗅探设备重叠度进行所述初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点间的目标映射概率;
热点兴趣点映射模块,用于根据所述目标映射概率,建立无线热点与兴趣点之间的映射。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述无线热点与兴趣点的映射方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述无线热点与兴趣点的映射方法的步骤。
上述无线热点与兴趣点的映射方法、装置、计算机可读存储介质和计算机设备,基于无线热点的嗅探记录建立无线热点与兴趣点的映射关系,无需人工采集上报POI到访数据,不仅提高映射效率;由于减少了对无线热点和兴趣点名称的依赖,使这种映射方式适用范围广,进而提高无线热点召回率。基于嗅探设备重叠度度量无线热点之间的相关性,可以辅助判断用户在兴趣点之间的流动属性,保留了用户的空间行为特征信息,可以更好的实现无线热点在空间位置上的区分,从而使反映出的无线热点相关性可靠性更高。进而,综合考虑无线热点与兴趣点的距离,以及无线热点之间的嗅探设备重叠度,建立无线热点及兴趣点之间的映射,可以提高映射准确性。
附图说明
图1为一个实施例中无线热点与兴趣点的映射方法的应用环境图;
图2为一个实施例中无线热点与兴趣点的映射方法的流程示意图;
图3为一个实施例中基于标签传播算法进行映射概率传播时采用的完全图的示意图;
图4为另一个实施例中无线热点与兴趣点的映射方法的流程示意图;
图5为一个实施例中引入兴趣点层级关系的原理示意图;
图6为又一个实施例中无线热点与兴趣点的映射方法的流程示意图;
图7为一个实施例中划分为多个子区域的统计区域的示意图;
图8为再一个实施例中无线热点与兴趣点的映射方法的流程示意图;
图9为一个具体实施例中无线热点与兴趣点的映射方法的流程示意图;
图10为另一个具体实施例中无线热点与兴趣点的映射方法的流程示意图;
图11为一个实施例中无线热点与兴趣点的映射装置的结构框图;
图12为另一个实施例中无线热点与兴趣点的映射装置的结构框图;
图13为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中无线热点与兴趣点的映射方法的应用环境图。(例子:参照图1,该无线热点与兴趣点的映射方法应用于无线热点与兴趣点的映射系统。该无线热点与兴趣点的映射系统包括终端110、服务器120、嗅探设备130。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑、智能穿戴设备等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。嗅探设备130是具有无线热点嗅探及连接功能的设备,如手机、电脑、智能穿戴设备、电子阅读设备等。嗅探设备130用于将对无线热点的嗅探记录直接上报至终端110或服务器120,或者上报至其他存储设备,由终端110或服务器120从该存储设备拉取。终端110和服务器120均可单独基于嗅探记录执行本申请实施例中提供的无线热点与兴趣点的映射方法。终端110和服务器120也可协同基于嗅探记录执行本申请实施例中提供的无线热点与兴趣点的映射方法。
如图2所示,在一个实施例中,提供了一种无线热点与兴趣点的映射方法。本实施例主要以该方法应用于计算机设备来举例说明,该计算机设备具体可以是上图中的终端110或者服务器120。参照图2,该无线热点与兴趣点的映射方法具体包括如下步骤:
S202,获取嗅探记录;嗅探记录包括嗅探设备所嗅探到的无线热点的数据。
其中,嗅探记录是指嗅探设备在嗅探到无线热点时上报的数据。无线热点可以是通过无线接入点(AP,Access Point)或路由器提供的WiFi(Wireless-Fidelity)网络,也可以是通过移动终端等设备提供的移动热点,如手机WiFi热点、车载WiFi热点等。
嗅探记录包括嗅探设备的设备标识、嗅探记录生成时间以及嗅探设备所嗅探到的每个无线热点的数据等。无线热点的数据包括无线热点的名称、位置坐标、信号强度等。无线热点的名称是指无线热点广播出来的SSID(Service Set Identity,服务集标识),具体可以是提供无线热点的用户自定义的字符串,如“TP-LINK-XX”、“光明小区-13”等。无线热点的位置坐标是用经度lon和纬度lat表示无线热点所在地面点位置的球面坐标(lon,lat)。地理坐标具体可以是天文经纬度、大地经纬度或地心经纬度。比如,嗅探设备A的t1时刻上报的嗅探记录可以是[A,t1,(TP-LINK-YY,光明小区-13,3-506A,Yuij99),[(114.32,30.51),(110.22,35.09),(11.32,31.77),(109.92,30.01)]]。
用户携带嗅探设备在某个位置停留或进行位置移动时,嗅探设备对周围存在的无线热点进行嗅探,并将嗅探到的无线热点以列表的形式展示给用户,用户可以选择其中一个无线热点进行连接。每个嗅探设备按照预设时间频率基于嗅探到的无线热点的数据生成嗅探记录,并将生成的嗅探记录上报至指定设备。
具体地,计算机设备通过USB(Universal Serial Bus,通用串行总线)接口连接或网络连接等通信方式从指定设备拉取统计区域在统计时段内的嗅探记录。统计区域是需要对区域内无线热点和兴趣点进行映射的地理区域。统计区域的区域边界可以根据统计需求自由限定,如整个国家的领土地域,某个省份或城镇的地域等。在数字地图中,统计区域可以是多个连续坐标点围成的封闭轮廓内的区域。统计时段是指进行无线热点和兴趣点映射时所依赖嗅探记录的生成时间的时间跨度,包括统计起始时间和统计结束时间。统计时段的时间长度太短会影响最终无线热点与兴趣点的映射准确性;时间长度过长会导致数据计算量增大。统计时段的时间长度需要根据需求合理设定,如1个月等。
在一个实施例中,计算机设备将所获取的仅包含一个无线热点的数据的嗅探记录剔除。可以理解,本申请的嗅探记录用于度量无线热点之间的相关性,仅包含单个无线热点数据的嗅探记录对度量无线热点之间的相关性并不具分析价值,剔除该类嗅探记录可以在不影响相关性分析准确性的情况下,减小需要处理的嗅探记录数据量。
在一个实施例中,嗅探设备也可以将产生的嗅探记录直接上报至用于无线热点和兴趣点映射的计算机设备。
在一个实施例中,无线热点还可以是通过近场通信方式提供的点对点传输网络,如BLE(Bluetooth Low Energy,蓝牙低能耗)、NFC(near field communication,近场通信)或RFID(Radio Frequency Identification,无线射频识别)等无线连接网络。
S204,根据嗅探记录,确定嗅探设备重叠度。
其中,无线热点具有对应的嗅探距离范围,如周围50米。每个无线热点可以被嗅探距离范围内的任意嗅探设备嗅探到。如此,位置相近的无线热点可能会被同一嗅探设备嗅探到,从而同一个无线热点的数据可能会出现在多个不同的嗅探记录中。出现在同一嗅探记录中的嗅探设备和无线热点,可以认为具有关联关系。不同无线热点所关联的嗅探设备可能存在重叠。
嗅探设备重叠度是能够反映无线热点所关联的嗅探设备发生重叠程度的数值。两个无线热点之间的嗅探设备重叠度具体可以是两个无线热点所关联的嗅探设备中重叠的嗅探设备的数量相对其中一个无线热点所关联的全部嗅探设备的数量的占比,也可以是两个无线热点所关联的嗅探设备去重后的总数量相对其中一个无线热点所关联的全部嗅探设备的数量的占比,还可以是两个无线热点所关联的嗅探设备中重叠的嗅探设备的数量相对两个无线热点所关联的去重后全部嗅探设备的数量的占比。
具体地,计算机设备确定所拉取的嗅探记录中所涉及的无线热点,以及每个无线热点所关联的嗅探设备。计算机设备统计每个无线热点WiFii所关联的嗅探设备的总数量NUMi。计算机设备统计每两个无线热点WiFii和WiFij所关联的嗅探设备中重叠的嗅探设备的数量NUMij。i和j为大于0的整数。
计算机设备可以计算重叠的嗅探设备的数量NUMij相对无线热点WiFii所关联的嗅探设备的总数量NUMi的占比,将该占比NUMij/NUMi作为无线热点WiFii相对无线热点WiFij的嗅探设备重叠度Wij。计算机设备计算重叠的嗅探设备的数量NUMij相对无线热点WiFij所关联的嗅探设备的总数量NUMj的占比,将该占比NUMij/NUMj作为无线热点WiFij相对无线热点WiFii的嗅探设备重叠度Wji
在一个实施例中,计算机设备也可以计算无线热点WiFii与WiFij所关联的嗅探设备去重后的总数量NUMi+NUMj-NUMij,计算去重后的总数量NUMi+NUMj-NUMij相对无线热点WiFii所关联的嗅探设备的总数量NUMi的占比,将该占比(NUMi+NUMj-NUMij)/NUMi作为无线热点WiFii相对无线热点WiFij的嗅探设备重叠度Wij。计算机设备计算去重后的总数量NUMi+NUMj-NUMij相对无线热点WiFij所关联的嗅探设备的总数量NUMj的占比,将该占比(NUMi+NUMj-NUMij)/NUMj作为无线热点WiFij相对无线热点WiFii的嗅探设备重叠度Wji
在一个实施例中,计算机设备计算重叠的嗅探设备的数量NUMij相对无线热点WiFii以及无线热点WiFij所关联的嗅探设备去重后的总数量NUMi+NUMj-NUMij的占比,将该占比NUMij/(NUMi+NUMj-NUMij),将该占比作为无线热点WiFii与无线热点WiFij的嗅探设备重叠度Wi+j。可以理解,这种方式中无线热点WiFii相对无线热点WiFij的嗅探设备重叠度Wij,与无线热点WiFij相对无线热点WiFii的嗅探设备重叠度Wji相同,均为嗅探设备重叠度Wi+j
在一个实施例中,嗅探记录包含嗅探设备标识及至少两个无线热点的热点名称;确定无线热点之间的嗅探设备重叠度包括:基于嗅探设备标识,确定每个热点名称对应的去重嗅探设备集合;识别每两个去重嗅探设备集合中重叠的嗅探设备标识;基于重叠的嗅探设备标识的数量以及相应去重嗅探设备集合中嗅探设备标识的数量,确定对应两个无线热点的嗅探设备重叠度。
其中,嗅探设备标识是能够唯一标识一个嗅探设备的信息。嗅探记录中的嗅探设备标识可以是已被数据生产方做了不可逆加密处理的标识数据。嗅探设备标识具体可以是SUPI(Subscription Permanent Identifier)用户永久标识符,GPSI(Generic PublicSubscription Identifier,通用公共用户标识符)、PEI(Permanent EquipmentIdentifier,永久设备标识符)等。当SUPI取值为0时,嗅探设备标识为IMSI(InternationalMobile Subscriber Identification Number,国际移动用户识别码);当SUPI取值为1时,嗅探设备标识为NAI(Network Access Identifier,网络接入标识符)。
嗅探设备集合是由一个或多个嗅探设备标识构成的集合。每个嗅探设备集合对应于一个无线热点的热点名称。同一嗅探设备在统计时段可能会上报多条嗅探记录,且多次上报的嗅探记录可能包含相同的无线热点。如此,无线热点对应的嗅探设备集合中嗅探设备标识可能会发生重复。去重嗅探设备集合是对进行嗅探设备标识去重后的嗅探设备集合。
具体地,计算机设备对拉取到的嗅探记录进行解析,构建所涉及的每个无线热点对应的嗅探设备集合。虽然存在同一个用户同时携带多个嗅探设备的可能,但在较高置信度上仍可以认为每个嗅探设备可唯一代表一个用户。由于嗅探记录中直接记录了嗅探设备标识,从而基于嗅探设备标识可以对用户进行更好的区分。计算机设备对嗅探设备集合中嗅探设备标识进行去重,得到去重嗅探设备集合。
进一步地,计算机设备对每两个去重嗅探设备集合进行对比分析,识别出每两个去重嗅探设备集合中发生重叠的那部分嗅探设备标识。计算机设备计算统计发生重叠的嗅探设备标识的数量,计算发生重叠的嗅探设备标识的数量相对两个无线热点中目标的无线热点对应的去重嗅探设备集合中嗅探设备标识总数量的占比,将该占比作为目标的无线热点相对另一个无线热点的嗅探设备重叠度。比如,对WiFii对应的去重嗅探设备集合和WiFij对应的去重嗅探设备集合进行对比分析后,计算得到无线热点WiFij相对无线热点WiFii的嗅探设备重叠度Wij=(WiFii嗅探设备标识去重数+WiFij嗅探设备标识去重数-WiFii和WiFij的嗅探设备标识去重数)/WiFii嗅探设备标识去重数。
本实施例,基于嗅探设备重叠度可以度量无线热点之间的相关性,计算得到的相关性数值范围为[0,1],无需进行归一化处理。更重要的是,由于每个嗅探设备可唯一代表一个用户,从而在较高置信程度上嗅探设备重叠度反映了不同无线热点之间用户的相似度,可以辅助判断用户的属性,如流动用户、常驻用户等。因而,基于嗅探设备重叠度度量无线热点之间相关性的方式,相比单纯基于无线热点的位置坐标、或者出现在同一嗅探记录的次数等方式,保留了用户的空间行为特征信息,可以更好的实现无线热点在空间位置上的区分,有效解决了相邻兴趣点之间无线兴趣点区分困难的问题,从而使反映出的无线热点相关性更加客观稳定,可靠性更高。
S206,根据无线热点与相应的兴趣点的距离,确定无线热点与相应的兴趣点间的初始映射概率。
其中,兴趣点POI是指地理信息系统中的地标、景点等,如某地区的政府部门、社区建筑、商业机构(如加油站、百货公司、超市、餐厅、酒店、便利店、邮筒、医院等)、名胜古迹、旅游景点(如公园、公共厕所等)、交通设施(如车站、停车场、收费站、速限标示)等地物。
映射概率是指无线热点归属映射于某个POI的概率。初始映射概率从空间距离的维度上反映了无线热点与兴趣点的关联度,换言之,单纯从空间距离的维度考虑,无线热点归属映射于相应POI的概率为初始映射概率。可以理解,出现在同一嗅探记录中的多个无线热点位置相近。位置相近的无线热点所关联的嗅探设备的重叠度高且归属于同一个POI的概率较大。
具体地,计算机设备获取兴趣点的数据。兴趣点的数据可以是从第三方渠道商获取得到,也可以通过网络爬虫获取得到,对于兴趣点数据的获取方式不作限制。兴趣点的数据包括兴趣点名称、兴趣点位置等。兴趣点名称是人们对兴趣点的命名,如“星空小学校”、“中国技术交易大厦”等。兴趣点位置可以是兴趣点的地理坐标。计算机设备根据无线热点的地理坐标和兴趣点的地理坐标,计算统计区域内每个无线热点与各兴趣点的距离。
进一步地,计算机设备对无线热点和各兴趣点的距离进行归一化处理,将距离值转换为[0,1]范围的概率值,将该概率值作为相应无线热点与兴趣点之间的初始映射概率。归一化处理所采用的方法具体可以是01标准化、Z-score标准化、sigmoid函数标准化等。可以理解,计算机设备还可以采用其他方式确定兴趣点与无线热点之间的初始映射概率,比如,还可以确定统计区域内无线热点与兴趣点的最远距离,将当前无线热点与兴趣点之间的距离与该最远距离的比值作为当前无线热点与兴趣点之间的初始映射概率。
在一个实施例中,兴趣点位置也可以是用于描述兴趣点所在位置的地址文本。地址文本是用于描述兴趣点的地理位置信息的文本,如“北京市海淀区中关村海淀大街麦当劳”。计算机设备基于地址编码服务将地址文本转换为兴趣点的地理坐标。地理编码服务得到的地理坐标与地址文本一一对应。计算机设备也可以基于坐标检索服务搜索每个地址文本对应的地理坐标。坐标检索服务得到地理坐标与地址文本可能是一对一的关系,也可能是多对一的关系。换言之,基于坐标检索服务可得到每个地址文本对应的一个或多个地理坐标。不同的坐标检索服务提供方提供不同的坐标检索方式。比如,百度地图、谷歌地图等提供的坐标检索方式不同。
当转换得到的地理坐标有多个时,计算机设备识别地址文本中的关键地址元素。关键地址元素是指能够使地址文本描述的地址位置信息处于收敛状态的地址元素。收敛状态是指可从大量分散的可能区域集中精准定位到某个可能区域的状态。关键地址元素具体可以是将地理位置从大量POI中限缩至其中一个或几个POI的POI前缀。比如,在上述举例的地址文本中POI“麦当劳”在北京市有很多,但是“海淀大街麦当劳”或者“中关村麦当劳”则只有少量的几个,表明海淀大街或中关村是能够帮助地址文本描述的地理位置信息收敛的关键地址元素。最终,计算机设备可以根据关键地址元素从转换得到的多个地理坐标中筛选目标的一个地理坐标。
S208,基于嗅探设备重叠度进行初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点间的目标映射概率。
其中,本申请目的在于建立无线热点与兴趣点之间的映射关系,且需要保证每个无线热点只能归属映射于一个兴趣点,属于非重叠区域划分问题。用于解决非重叠区域划分问题的算法具体可以采用基于模块度优化的区域划分、基于谱分析的区域划分、基于信息论的区域划分、基于标签传播的区域划分等。其中,基于标签传播的区域划分算法可以是LPA(Label Propagation Algorithm,标签传播算法)、COPRA(基于标签传递的重叠社区发现算法)、SLPA(Speaker-listener Label Propagation Algorithm,社区发现算法)等。
具体地,假设根据拉取的统计区域在统计时段产生的嗅探记录,解析发现统计区域内部署了n个无线热点;根据兴趣点的数据,发现统计区域包含有m个POI。当需要计算目标无线热点WiFii(0≤i<n)与兴趣点POIj(0≤j<m)的目标映射概率时,计算机设备可以基于上述非重叠区域划分算法,将统计区域内除了目标无线热点WiFii的其他无线热点分别与目标无线热点WiFii之间的嗅探设备重叠度作为传播权重,将统计区域内每个其他无线热点与兴趣点POIj的初始映射概率以传播权重传播叠加在目标无线热点WiFii与兴趣点POIj的初始映射概率上,得到目标无线热点WiFii与兴趣点POIj的中间映射概率,将该中间映射概率作为目标无线热点WiFii与兴趣点POIj的初始映射概率进行迭代,直至达到预设的迭代停止条件。迭代停止条件可以是中间映射概率收敛,或达到设定的最大迭代次数等。计算机设备将停止迭代时计算得到的中间映射概率确认为相应无线热点与兴趣点之间的目标映射概率。
以标签传播算法LPA为例,标签传播算法LPA是一种基于图的半监督学习方法,其基本思路是用已标记节点的标签信息去预测未标记节点的标签信息。利用样本间的关系建立关系完全图模型,在完全图中,节点包括已标注和未标注数据,其边表示两个节点的相似度,节点的标签按相似度传递给其他节点。标签数据就像是一个源头,可以对无标签数据进行标注,节点的相似度越大,标签越容易传播。
参考图3所示,计算机设备可以以每组待映射的无线热点与兴趣点POI作为节点302建立完全图。完全图中每个节点具有对应的标签信息,用于连接节点的每个连接边304具有对应的边权重。在本申请的实施例中,节点对应的标签信息是指相应无线热点与兴趣点POI之间的初始映射概率;节点之间连接边对应的边权重是指对应两个无线热点之间的嗅探设备重叠度。
在一个实施例中,上述无线热点与兴趣点的映射方法还包括:将无线热点之间的嗅探设备重叠度作为矩阵元素建立传播矩阵;将无线热点与兴趣点间的初始映射概率作为矩阵元素建立初始映射矩阵;基于嗅探设备重叠度进行初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点间的目标映射概率包括:将传播矩阵与初始映射矩阵相乘,计算得到概率传播后的映射矩阵;将概率传播后的映射矩阵作为初始映射矩阵进行迭代,直至满足迭代停止条件时停止迭代,得到目标映射矩阵;目标映射矩阵记录了各无线热点与兴趣点之间的目标映射概率。
具体地,计算机设备根据统计区域所涉及的无线热点的数量初始化构建传播矩阵。假设统计区域内部署了n个无线热点,则传播矩阵可以是n*n的二维矩阵Wn*n。初始化的传播矩阵Wn*n的矩阵元素Wij默认均为0。矩阵元素Wij用于记录反映无线热点WiFii相对无线热点WiFij相关度的数值。计算机设备在计算得到无线热点之前的嗅探重叠度之后,将其作为矩阵元素填充至初始化的传播矩阵Wn*n
计算机设备根据统计区域所涉及的无线热点和兴趣点的数量初始化构建映射矩阵。假设统计区域内部署了n个无线热点,包含有m个POI,则映射矩阵可以是n*m的二维矩阵
Figure BDA0002377607030000111
上标0代表映射矩阵为初始化状态。初始化的映射矩阵
Figure BDA0002377607030000112
的矩阵元素
Figure BDA0002377607030000113
默认均为0。矩阵元素
Figure BDA0002377607030000114
用于记录反映无线热点WiFii与兴趣点POIj相关度的数值。计算机设备在计算得到无线热点与兴趣点之间的初始映射概率之后,将其作为矩阵元素填充至初始化的映射矩阵
Figure BDA0002377607030000115
进一步地,计算机设备将传播矩阵Wn*n与初始化状态的映射矩阵
Figure BDA0002377607030000116
相乘,计算得到概率传播后的映射矩阵
Figure BDA0002377607030000117
计算机设备将概率传播后的映射矩阵
Figure BDA0002377607030000121
作为初始映射矩阵进行迭代,直至满足迭代停止条件时停止迭代,得到目标映射矩阵
Figure BDA0002377607030000122
目标映射矩阵记录了各无线热点与兴趣点之间的目标映射概率。
S210,根据目标映射概率,建立无线热点与兴趣点之间的映射。
具体地,目标映射概率反映了一个无线热点在地址位置上归属于一个POI的概率。计算机设备确定每个无线热点所对应的目标映射概率最大的POI,记作目标POI。计算机设备建立无线热点与目标POI之间的映射。换言之,计算机设备建立无线热点WiFii与目标映射矩阵中第i行中最大元素值对应的POI之间的映射。
在一个实施例中,根据目标映射概率,建立无线热点与兴趣点之间的映射包括:剔除与每个兴趣点之间的目标映射概率均小于第二阈值的无线热点;建立所保留的每个无线热点与对应目标映射概率最大的兴趣点间的映射。
其中,第二阈值是设定的用于判定是否需要将一个无线热点WiFii映射至某个POI的目标映射概率最小值。第二阈值的大小可以根据需求自由设定。
具体地,计算机设备对无线热点WiFii与每个POI之间的目标映射概率是否达到第二阈值进行遍历。当无线热点WiFii与每个POI之间的目标映射概率均小于第二阈值时,计算机设备将无线热点WiFii判定为噪声WiFii,剔除噪声WiFii,建立所保留的无线热点WiFiii与达到第二阈值且最大的目标映射概率的POI之间的映射。基于本申请提供的方法所建立的无线热点与兴趣点之间的映射关系可以实现用户到场识别,并用于人群活动规律的挖掘,进而支撑店铺选址、交通规划等诸多重要的商业决策和政策制定,具有非常高的应用价值。
本实施例中,剔除与每个兴趣点之间的目标映射概率均小于第二阈值的噪声无线热点,可以提高所建立的映射关系的准确可靠性。
上述无线热点与兴趣点的映射方法,基于无线热点的嗅探记录建立无线热点与兴趣点的映射关系,无需人工采集上报POI到访数据,不仅提高映射效率;由于减少了对无线热点和兴趣点名称的依赖,使这种映射方式适用范围广,还可以提高无线热点召回率。基于嗅探设备重叠度度量无线热点之间的相关性,可以辅助判断用户在兴趣点之间的流动属性,保留了用户的空间行为特征信息,可以更好的实现无线热点在空间位置上的区分,从而使反映出的无线热点相关性可靠性更高。进而,综合无线热点与兴趣点的距离,以及无线热点之间的嗅探设备重叠度,建立无线热点及兴趣点之间的映射,可以提高映射准确性。
在一个实施例中,上述无线热点与兴趣点的映射方法还包括:根据无线热点在不同嗅探记录中的位置变化,识别无线热点中的移动热点;剔除每条嗅探记录中关于移动热点的数据;根据无线热点的嗅探记录,确定无线热点之间的嗅探设备重叠度包括:根据完成数据剔除的嗅探记录,确定无线热点之间的嗅探设备重叠度。
其中,根据无线热点的位置移动属性,可以将无线热点区分为移动热点和稳定热点。移动热点是热点位置会随着时间变化的无线热点,比如,手机WiFi热点、车载WiFi热点等。移动热点在不同时间可能处于不同POI的位置,难以建立移动热点与POI之间的稳定映射关系。
具体地,为了提高所建立的无线热点与兴趣点之间映射关系的准确性,计算机设备识别统计区域所涉及无线热点中的移动热点。移动热点和稳定热点的识别方法有多种,比如,可以根据统计时段内的嗅探记录反推出每个无线热点在不同时间点的位置坐标,计算相邻时间点的位置变化值,当存在预设数量的位置变化值大于预设值时,可以判定为该无线热点为移动热点。
在一个实施例中,计算机设备可以对无线热点在不同时间点的位置坐标进行聚类,通过聚类算法计算每个地理坐标的聚类特征,根据聚类特征在多个地理坐标中确定一个类簇中心点。聚类特征是表征地理坐标的聚类特征的特征,比如高斯密度分布值。高斯密度分布值越大,表示相应地理坐标越有聚集性,可作为类簇中心点。类簇中心点是指多个地理坐标点中聚集性最高的地理坐标点。聚类算法,比如,k-means(基于划分的聚类方法)、fuzzy cluster(模糊聚类算法)、DBSCAN(Density-Based Spatial Clustering ofApplication with Noise,基于密度的聚类算法)或Fast Search and Find of DensityPeaks(快速搜索和发现密度峰的聚类算法)等。
计算机设备统计与类簇中心点距离小于目标值的地理坐标的数量相对该无线热点在全部时间点的地理坐标的总数量的比值,该比值反映了无线热点在全部时间点的地理坐标的集中度。当集中度小于预设值时,计算机设备将相应无线热点判定为移动热点。
计算机设备剔除每条嗅探记录中关于移动热点的数据,后续只需计算稳定热点之间的嗅探设备重叠度,只需计算稳定热点与兴趣点之间初始映射概率和目标映射概率,建立稳定热点与兴趣点之间的映射。
本实施例中,根据无线热点在不同嗅探记录中的位置变化,对移动热点进行识别,过滤了嗅探记录中的噪音数据,在提高所建立映射关系稳定性的同时,精准缩小了需要进行映射处理的数据量,提高映射效率,节约计算机设备数据处理资源。
在一个实施例中,上述无线热点与兴趣点的映射方法还包括:剔除去重嗅探设备集合中嗅探设备标识数量小于第一阈值的无线热点,得到目标的去重嗅探设备集合;识别每两个嗅探设备集合中重叠的嗅探设备标识包括:识别保留的每两个目标的去重嗅探设备集合中重叠的嗅探设备标识。
其中,第一阈值是设定的用于判定是否需要将一个无线热点WiFii映射至某个POI的嗅探设备标识数量最小值。第一阈值的大小可以根据需求自由设定。
具体地,计算机设备统计嗅探设备集合中嗅探设备标识数量,以确定每个无线热点所对应的到访用户的数量。计算机设备对每个无线热点WiFii关联的嗅探设备标识数量是否达到第一阈值进行遍历。当无线热点WiFii关联的嗅探设备标识数量小于第一阈值时,表示该无线热点可能在统计时段的某种时间点发生了故障异常,使得到访用户携带的嗅探设备无法嗅探到,或者该无线热点本身的到访用户较少,计算机设备将这类无线热点WiFii判定为故障热点或冷门热点。计算机设备剔除故障热点和冷门热点。后续只需计算所保留的无线热点WiFiii之间的嗅探设备重叠度,只需计算所保留的无线热点与兴趣点之间初始映射概率和目标映射概率,建立所保留的无线热点与兴趣点之间的映射。
本实施例中,对于嗅探设备标识数量少的无线热点不纳入嗅探设备重叠度统计范畴,提高嗅探设备重叠度准确性同时降低了传播矩阵Wn*n的维度,有助于提高映射效率。
在一个实施例中,根据无线热点与兴趣点的距离,计算无线热点与相应的兴趣点间的初始映射概率,包括:筛选与兴趣点的距离小于预设值的无线热点作为相应兴趣点的种子热点;确定种子热点与相应兴趣点之间的初始映射概率为1;确定除种子节点之外的各无线热点与兴趣点之间的初始映射概率为0。
其中,预设值是预设的用于判断一个无线热点是否可以作为某个兴趣点的种子热点的距离最大值。种子热点是至少与一个兴趣点的距离小于预设值的无线热点,在较高置信度上单纯根据距离已经可以确定归属于哪个兴趣点。事实上,对于种子热点,计算机设备此时已经可以建立其与相应兴趣点之间的映射。除种子节点之外的无线热点可以称作待映射热点。待映射热点是与每个兴趣点的距离均大于或等于预设值的无线热点,单纯根据距离尚不能确定归属于哪个兴趣点。
值得强调的是,每个兴趣点可以具有对应的多个种子节点,但每个无线热点只能作为一个兴趣点的种子热点。换句话说,初始化的映射矩阵
Figure BDA0002377607030000151
中每行无线热点WiFii至多与一个兴趣点POI的初始映射概率为1。当一个无线热点与多个兴趣点的距离小于预设值时,可以将该无线热点判定为距离最近的那个兴趣点的种子热点。容易发现,预设值为用于判定种子热点的阈值,而每个无线热点只能作为一个兴趣点的种子热点,因而不宜太大,可以是远小于无线热点辐射范围的距离值,如20m等。
具体地,计算机设备确定每个兴趣点POI对应的编号。编号范围可以是0至m-1。其中,m为统计区域所包含POI的数量。该编号可以是计算机设备随机确定的,也可以是POI的位置坐标确定的,比如按照经度和/或纬度减小的顺序编号等。如此,兴趣点编号可以直接作为映射矩阵
Figure BDA0002377607030000152
的列下标。
进一步地,计算机设备按照兴趣点编号,对每个无线热点WiFii与各兴趣点POIj的距离是否小于预设值进行遍历。当无线热点WiFii与兴趣点POIj的距离大于或等于预设值时,计算机设备将无线热点WiFii与兴趣点POIj的初始映射概率设定为0。当无线热点WiFii与兴趣点POIj的距离小于预设值时,计算机设备将无线热点WiFii与兴趣点POIj的初始映射概率设定为1,并将无线热点WiFii与兴趣点POIj+k的初始映射概率设定为0。换言之,当确定无线热点WiFii为一个兴趣点POIj的种子节点后,则无需对兴趣点POIj之后的兴趣点POIj+k与无线热点WiFii的距离是否小于预设值进行判断。其中,j+k≤m-1。
在一个实施例中,参考图4所示,上述无线热点与兴趣点的映射方法包括:
S402,获取嗅探记录;嗅探记录包括嗅探设备所嗅探到的无线热点的数据。
S404,根据嗅探记录,确定嗅探设备重叠度。
S406,获取待映射的每个兴趣点的兴趣点名称。
S408,将兴趣点名称之间具有包含关系的多个兴趣点划分至一个兴趣点组。
S410,根据无线热点与相应的兴趣点组中兴趣点的距离,计算无线热点与相应的兴趣点组间的初始映射概率。
S412,基于嗅探设备重叠度进行初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点组间的目标映射概率。
S414,根据目标映射概率,建立无线热点与兴趣点组之间的映射。
其中,兴趣点名称包括一个或多个地址元素,比如,POI“光明小区东区1栋”包括“光明小区”“东区”和“1栋”三个地址元素。现实场景中POI之间是存在层级关系的,这种层级关系体现在兴趣点名称之间的包含关系。兴趣点名称之间具有包含关系是指一个兴趣点名称为另一个兴趣点名称中的一种或多种地址元素。比如,POI“光明小区”包含于POI“光明小区东区1栋”。容易理解,兴趣点名称之间具有包含关系只需进行词间比对即可,并不需要对兴趣点名称进行分词处理。
具体地,计算机设备对各兴趣点名称是否包含在另一个兴趣点名称中进行遍历。当兴趣点名称POIi包含在兴趣点名称POIj中时,计算机设备将兴趣点名称POIi对应兴趣点确定为兴趣点名称POIj对应兴趣点的父级兴趣点,将兴趣点名称POIj对应兴趣点确定为兴趣点名称POIi对应兴趣点的子级兴趣点。具有父子关系兴趣点组构成兴趣点组。比如,父级兴趣点“光明小区”与对应的子级兴趣点“光明小区东区1栋”“光明小区东区3栋”等构成一个兴趣点组{“光明小区”,“光明小区东区1栋”,“光明小区东区3栋”,…}。
在一个实施例中,同一个兴趣点组可以包含多层级的兴趣点,即子级兴趣点可以作为其他兴趣点的父级兴趣点。比如,{“光明小区”,“光明小区东区”,“光明小区东区1栋”,“光明小区东区3栋”,…}。“光明小区东区”为“光明小区”的子级兴趣点,但同时是“光明小区东区1栋”和“光明小区东区3栋”的父级兴趣点。当兴趣点组包含多层级的兴趣点时,计算机设备最高层级的兴趣点确定为兴趣点组的父级兴趣点。
在一个实施例中,当统计区域涉及的兴趣点名称较多时,计算机设备也可以将多个兴趣点名称划分为多组,同步按照上述方式对每组兴趣点名称进行层级划分,最后将各组层级划分的结果融合,确定统计区域最终的兴趣点层级关系。
如此,计算机设备可以以兴趣点组为单位进行无线热点和兴趣点之间的映射。具体地,计算机设备根据无线热点与兴趣点组中每个兴趣点的距离,计算无线热点与相应兴趣点组间的初始映射概率。比如,计算机设备可以根据无线热点WiFii与根据兴趣点组{POIi}中兴趣点的最小距离或者平均距离等,计算无线热点与相应兴趣点组间{POIi}的初始映射概率。计算机设备按照上述方式基于嗅探设备重叠度对无线热点与相应兴趣点组间{POIi}的初始映射概率进行迭代传播,得到无线热点与相应兴趣点组间{POIi}的目标映射概率,建立无线热点WiFii与目标映射概率最高的一个兴趣点组间{POIi}中每个兴趣点之间的映射。
当限定了将一个无线热点WiFii映射至某个POI的目标映射概率最小值,即第二阈值时,计算机设备对无线热点WiFii与每个兴趣点组间{POIi}之间的目标映射概率是否达到第二阈值进行遍历。当无线热点WiFii与每个兴趣点组间{POIi}之间的目标映射概率均小于第二阈值时,计算机设备将无线热点WiFii判定为噪声WiFii,剔除噪声WiFii,建立所保留的无线热点WiFiii与达到第二阈值且最大的目标映射概率的兴趣点组间{POIi}中每个兴趣点之间的映射。
值得注意的是,实现无线热点与兴趣点之间的映射是基于无线热点与兴趣点之间的目标映射概率。假设在无线热点与兴趣点之间建立映射的目标映射概率的第二阈值为0.7。参考图5所示,无线热点WiFii与兴趣点“润城花园”的目标映射概率为0.2,与兴趣点“润城花园1栋”的目标映射概率为0.5,与兴趣点“润城花园9栋”的目标映射概率为0.1,与兴趣点“龙都花园”的目标映射概率为0.2,在未引入POI层级关系时,由于无线热点WiFii的目标映射概率会被附近的多个POI稀释,导致映射到各POI的概率值都很小,最终被剔除,导致无线热点WiFii召回率低。
而本申请的实施例,通过引入POI层级关系,可以将“润城花园1栋”和“润城花园9栋”与“润城花园”划分为同一个兴趣点组{“润城花园”“润城花园1栋”,“润城花园9栋”},最终得到润城花园映射到{“润城花园”“润城花园1栋”,“润城花园9栋”}的概率为0.8,“润城花园”被召回。因此,引入POI层级关系可以提升无线热点WiFi与POI的映射召回率。
可以理解,在引入POI层级关系后,假设统计区域所包含的m个POI被划分为p个兴趣点组,上述n*m的映射矩阵
Figure BDA0002377607030000181
可以降维至
Figure BDA0002377607030000182
m≥p。因而引入POI层级关系还可以降低初始映射概率迭代传播环节的映射矩阵维度,减缓数据倾斜的影响,大大降低计算量,提升所建立映射关系的稳定性。
本实施例中,对根据兴趣点名称对兴趣点进行群组划分,映入POI层级关系,不仅可以以兴趣点组为单位进行无线热点和兴趣点之间的映射,提高映射效率;在限定目标映射概率第二阈值的场景中,映入POI层级关系,还可以提升无线热点WiFi与POI的映射召回率。
在一个实施例中,基于嗅探设备重叠度进行初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点间的目标映射概率包括:将传播矩阵与初始映射矩阵相乘,计算得到中间映射矩阵;将中间映射矩阵中种子热点与相应兴趣点的中间映射概率重置为1后作为初始映射矩阵进行迭代,直至满足迭代停止条件时停止迭代,得到目标映射矩阵;目标映射矩阵记录了各无线热点与兴趣点之间的目标映射概率。
具体地,计算机设备将传播矩阵Wn*n与初始化状态的映射矩阵
Figure BDA0002377607030000183
相乘,计算得中间映射矩阵
Figure BDA0002377607030000184
中间映射矩阵记录了各无线热点与兴趣点之间的中间映射概率。计算机设备将中间映射矩阵
Figure BDA0002377607030000185
中种子热点与相应兴趣点的中国映射概率重置为初始值,即1。计算机设备将中间映射矩阵
Figure BDA0002377607030000186
待映射热点与兴趣点的中间映射概率进行归一化处理。计算机设备将完成种子热点中间映射概率重置和待映射热点中间映射概率归一化处理的中间映射矩阵
Figure BDA0002377607030000187
作为初始映射矩阵进行迭代,得到中间映射矩阵
Figure BDA0002377607030000188
在对中间映射矩阵
Figure BDA0002377607030000191
完成种子热点中间映射概率重置和待映射热点中间映射概率归一化处理后,将
Figure BDA0002377607030000192
作为初始映射矩阵继续迭代,直至满足迭代停止条件时停止迭代,得到目标映射矩阵
Figure BDA0002377607030000193
由于种子节点与相应兴趣点的初始映射概率是可靠的,在迭代传播过程中通过重置,可以保证种子节点与相应兴趣点的映射概率自始至终为1,进而可以将可靠性强的种子热点作为传播的源头发起传播,通过迭代将种子热点的初始映射概率不断传播给周围的待映射热点,提高映射关系准确性。
本实施例中,嗅探记录中所记录的无线热点的热点位置可能存在偏差,数据可靠性差。通过限定无线热点与兴趣点之间较小的距离阈值,可以在待映射的大量无线热点中识别发现可以单纯根据距离即可实现可靠映射的种子节点;将种子节点与相应兴趣点的初始映射概率确定为1,而将其他无线节点与各兴趣点的初始映射概率确定为0,可以尽可能减少对嗅探记录中热点位置数据的使用,而仅将可靠性强的种子热点作为传播的源头发起传播,提高映射关系准确性。
在一个实施例中,参考图6所示,上述无线热点与兴趣点的映射方法包括:
S602,获取嗅探记录;嗅探记录包括嗅探设备所嗅探到的无线热点的数据。
S604,将需要进行无线热点和兴趣点映射的统计区域划分为多个子区域。
S606,根据嗅探记录,确定每个子区域内无线热点之间的嗅探设备重叠度。
S608,根据无线热点与兴趣点的距离,确定相应子区域内无线热点与兴趣点间的初始映射概率。
S610,基于嗅探设备重叠度进行初始映射概率之间的迭代传播,在迭代结束时得到相应子区域内无线热点与兴趣点间的目标映射概率。
S612,根据同一子区域内的无线热点与兴趣点之间的目标映射概率,建立相应子区域内无线热点与兴趣点之间的映射。
S614,通过融合全部子区域内无线热点与兴趣点之间映射的数据,建立统计区域内各无线热点与兴趣点之间的映射。
其中,当统计区域的区域面积较小时,所包含的POI及无线热点数量较少,可以按照上述方式遍历计算统计区域内每个无线热点和兴趣点的映射关系。但当统计区域的区域面积较大时,所包含的POI及无线热点数量通常是非常大的。比如全国区域内的无线热点和兴趣点的数量在十亿量级。为了实现对大面积的统计区域内无线热点和兴趣点之间的高效映射,本申请的实施例将统计区域划分为多个子区域。
具体地,各子区域的区域面积和区域边界轮廓形状可以不同。对统计区域进行区域划分的方法具体可以是计算机设备根据人口分布以及常规情况下的客流量将统计区域划分为多个区域面积和/或区域边界轮廓形状不等的子区域。可以理解,对于人口数量较多或者客流量较大的位置,可以通过限缩区域边界将其划分为区域面积小的子区域;对于人口数量较少或者客流量较小的位置,可以通过增大区域边界将其划分为区域面积大的子区域,以使各个子区域内所包含的无线热点的数量和兴趣点的数量相近。
各子区域的区域面积和区域边界轮廓形状也可以相同。对统计区域进行区域划分的方法具体可以是计算机设备基于预设的网格将统计区域划分为多个区域面积和/或区域边界轮廓形状相同的子区域。参考图7所示,计算机设备在数字地图中,基于统计区域所在地面建立平面坐标系,在该平面坐标系基于预设大小的正方向网格702将统计区域平均划分为多个区域面积相等的子区域。可以理解,预设的网格还可以是其他规则的多边形,如三角形、平行四边形、菱形等。预设的网格还可以是不规则边框,对此不做限定。不同子区域之间可以没有重叠区域,也可以设置一定的用于过渡的重叠区域,对此不作限制。本领域技术人员还可以采用其他区域划分方法,对此不作限制。
进一步地,计算机设备按照上述方式分别建立每个子区域内无线热点和兴趣点的映射,最后再将全部子区域内无线热点与兴趣点的映射数据合并,得到统计区域内全部无线热点与兴趣点的完整映射关系。
本实施例中,将统计区域划分为多个子区域,对于每个子区域内需要映射处理无线热点和兴趣点的数据较少,且可以同步对多个子区域内无线热点和兴趣点进行映射,大大提高映射效率,使本申请提供的无线热点和兴趣点的映方法适用于大面积统计区域的场景。
在一个实施例中,参考图8所示,上述无线热点与兴趣点的映射方法包括:
S802,获取嗅探记录;嗅探记录包括嗅探设备所嗅探到的无线热点的数据。
S804,将需要进行无线热点和兴趣点映射的统计区域划分为多个子区域。
S806,根据嗅探记录,确定同一子区域内无线热点之间的嗅探设备重叠度。
S808,对同一子区域内多个兴趣点进行分组,得到一个或多个兴趣点组。
S810,将相邻子区域中存在兴趣点名称包含关系的两个兴趣点组合并。
S812,根据无线热点与相应的兴趣点组中兴趣点的距离,计算无线热点与相应的兴趣点组间的初始映射概率。
S814,基于嗅探设备重叠度进行初始映射概率之间的迭代传播,在迭代结束时得到相应子区域内无线热点与兴趣点组间的目标映射概率。
S816,根据同一子区域内的无线热点与兴趣点之间的目标映射概率,建立相应子区域内无线热点与兴趣点之间的映射。
S818,通过融合全部子区域内无线热点与兴趣点之间映射的数据,建立统计区域内各无线热点与兴趣点之间的映射。
其中,相邻子区域可以是区域边界相邻的两个子区域。在一个实施例中,每个子区域具有对应的用于表征区域位置的位置坐标,如中心点的位置坐标。相邻子区域也可以是位置坐标距离小于预设的距离阈值的两个子区域。比如,在图7所示的统计区域内,当相邻子区域为区域边界相邻的两个子区域时,子区域E对应的相邻子区域包括子区域B、D、F和H。当相邻子区域为位置坐标距离小于距离阈值的两个子区域,且距离阈值为子区域对角线长度时,子区域E对应的相邻子区域包括子区域A、B、C、D、F、G、H和J。
具体地,计算机设备按照上述方式分别对每个子区域内的POI进行层级划分,得到每个子区域内的一个或多个兴趣点组。在一个实施例中,对同一子区域内多个兴趣点进行分组,得到一个或多个兴趣点组包括:获取同一子区域内每个兴趣点的兴趣点名称;将兴趣点名称之间具有包含关系的多个兴趣点划分至一个兴趣点组;将被包含的兴趣点名称对应兴趣点确定为兴趣点组中的父级兴趣点。
进一步地,在进行区域划分,并确定每个子区域内POI的层级关系后,计算机设备对各个子区域内的兴趣点组进行融合,得到整个统计区域内POI的层级关系。在一个实施例中,将相邻子区域中存在兴趣点名称包含关系的两个兴趣点组合并包括:在当前子区域内一个父级兴趣点的兴趣点名称包含了相邻子区域内一个父级兴趣点的兴趣点名称时,将当前子区域内父级兴趣点所在的兴趣点组合并至相邻子区域内相应父级兴趣点所在的兴趣点组中;在当前子区域内一个父级兴趣点的兴趣点名称包含于相邻子区域内一个父级兴趣点的兴趣点名称时,将相邻子区域内父级兴趣点所在的兴趣点组合并至当前子区域内相应父级兴趣点所在的兴趣点组中。
计算机设备遍历各子区域,识别当前子区域内的所有父级兴趣点以及当前子区域的相邻子区域内的所有父级兴趣点是否存在兴趣点名称包含关系。如果当前子区域内的某个兴趣点组中父级兴趣点POIi的兴趣点名称包含于相邻子区域内的某个兴趣点组中父级兴趣点POIj的兴趣点名称中,则将父级兴趣点POIj所在的兴趣点组都划到父级兴趣点POIi所在的兴趣点组中。如果当前子区域内的某个兴趣点组中父级兴趣点POIi的兴趣点名称包含了相邻子区域内的某个兴趣点组中父级兴趣点POIj的兴趣点名称中,则将父级兴趣点POIi所在的兴趣点组都划到父级兴趣点POIj所在的兴趣点组中。
比如,在当前子区域E中有父级POI“光明小区”及其子POI集{“光明小区东区1栋”,“光明小区东区3栋”,…},其相邻子区域B中有父级POI“光明小区西区”及其子POI集{“光明小区西区1栋”,“光明小区西区2栋”,…}。按照上述方式合并后的父级POI为“光明小区”,其子POI集为{“光明小区东区1栋”,“光明小区东区3栋”,“光明小区西区1栋”,“光明小区西区2栋”,…}。
值得说明的是,在对相邻子区域中存在兴趣点名称包含关系的两个兴趣点组进行合并时,可能发生同一个兴趣点组被合并至不同的兴趣点组中的问题,继而发生同一兴趣点在不同子区域的兴趣点组中重复出现的情况。比如,在上述举例中,子区域E中的兴趣点组{POIe}被同时合并至子区域D中的兴趣点组{POId}和子区域H中的兴趣点组{POIh}中,进而合并后的{POId,POIe}与{POIh,POIe}存在部分兴趣点重复的问题,进而引发兴趣点与无线热点的重复映射的问题。
为了解决上述问题,本申请的实施例,在对相邻子区域中存在兴趣点名称包含关系的两个兴趣点组进行合并时,若发现一个兴趣点组可以合并至多个相邻子区域内的兴趣点组中,计算机设备随机将兴趣点组合并至其中一个相邻子区域内的兴趣点组中。或者,各个子区域具有对应的编号,可以将兴趣点组合并至其中子区域编号最大的相邻子区域内的兴趣点组中。
进一步地,在融合确定每个子区域的POI层级关系后,计算机设备按照上述方式分别计算每个子区域内无线热点之间的嗅探设备重叠度,分别计算每个子区域内无线热点与兴趣点之间的初始映射概率。在一个实施例中,根据无线热点与兴趣点组中每个兴趣点的距离,计算无线热点与相应兴趣点组间的初始映射概率,包括:筛选与兴趣点组中至少一个兴趣点的距离小于预设值的无线热点作为相应兴趣点组的种子热点;确定种子热点与相应兴趣点组之间的初始映射概率为1;确定除种子节点之外的各无线热点与兴趣点组之间的初始映射概率为0。
若引入了POI层级关系,每个兴趣点组{POI}具有对应的编号。假设统计区域所包含的m个POI被划分为p个兴趣点组,则编号范围可以是0至p-1。如此,兴趣点编号可以直接作为映射矩阵
Figure BDA0002377607030000231
的列下标。
计算机设备按照兴趣点组编号,对每个无线热点WiFii与兴趣点组{POIj}中每个兴趣点的距离是否小于预设值进行遍历。当无线热点WiFii与兴趣点组{POIj}中每个兴趣点的距离大于或等于预设值时,计算机设备将无线热点WiFii与兴趣点组{POIj}的初始映射概率设定为0。当无线热点WiFii与兴趣点组{POIj}中至少一个兴趣点的距离小于预设值时,计算机设备将无线热点WiFii与兴趣点组{POIj}的初始映射概率设定为1,并将无线热点WiFii与兴趣点组{POIj+k}的初始映射概率设定为0。换言之,当确定无线热点WiFii为一个兴趣点组{POIj}的种子节点后,则无需对兴趣点组{POIj}之后的兴趣点组{POIj+k}与无线热点WiFii的距离是否小于预设值进行判断。其中,j+k≤p-1。
计算机设备基于每个子区域内无线热点之间的嗅探设备重叠度,将相应子区域内种子热点的初始映射概率迭代传播至待映射热点,在迭代结束时得到相应子区域内各个无线热点与兴趣点间的目标映射概率,最后根据目标映射概率,建立相应子区域内各无线热点与兴趣点之间的映射。
本实施例中,对统计区域进行区域划分的同时,引入了POI层级关系,进而在提高映射效率,延伸本申请实施例使用场景的同时,还可以提升无线热点WiFi与POI的映射召回率,换句话说,本申请的实施例可以提高无线热点与兴趣点的准召率。
在一个具体的实施例中,参考图9所示,上述无线热点与兴趣点的映射方法包括:
S902,获取嗅探记录;嗅探记录包括嗅探设备标识及至少一个无线热点的位置及热点名称。
S904,根据无线热点在不同嗅探记录中的位置变化,识别无线热点中的移动热点。
S906,剔除每条嗅探记录中关于移动热点的数据。
S908,将需要进行无线热点和兴趣点映射的统计区域划分为多个子区域。
S910,根据完成数据剔除的嗅探记录,确定同一子区域内每个无线热点对应的去重嗅探设备集合。
S912,剔除去重嗅探设备集合中嗅探设备标识数量小于第一阈值的无线热点,得到目标的去重嗅探设备集合。
S914,识别每两个目标的去重嗅探设备集合中重叠的嗅探设备标识。
S916,基于重叠的嗅探设备标识的数量和相应去重嗅探设备集合中嗅探设备标识的数量,确定相应子区域内对应两个无线热点的嗅探设备重叠度。
S918,获取同一子区域内每个兴趣点的兴趣点名称。
S920,将兴趣点名称之间具有包含关系的多个兴趣点划分至一个兴趣点组。
S922,将被包含的兴趣点名称对应兴趣点确定为兴趣点组中的父级兴趣点。
S924,在当前子区域内一个父级兴趣点的兴趣点名称包含了相邻子区域内一个父级兴趣点的兴趣点名称时,将当前子区域内父级兴趣点所在的兴趣点组合并至相邻子区域内相应父级兴趣点所在的兴趣点组中。
S926,在当前子区域内一个父级兴趣点的兴趣点名称包含于相邻子区域内一个父级兴趣点的兴趣点名称时,将相邻子区域内父级兴趣点所在的兴趣点组合并至当前子区域内相应父级兴趣点所在的兴趣点组中。
S928,筛选与兴趣点组中至少一个兴趣点的距离小于预设值的无线热点作为相应兴趣点组的种子热点。
S930,确定种子热点与相应兴趣点组之间的初始映射概率为1;确定除种子节点之外的各无线热点与兴趣点组之间的初始映射概率为0。
S932,将无线热点之间的嗅探设备重叠度作为矩阵元素建立传播矩阵。
S934,将无线热点与兴趣点间的初始映射概率作为矩阵元素建立初始映射矩阵。
S936,将传播矩阵与初始映射矩阵相乘,计算得到中间映射矩阵。
S938,将中间映射矩阵中种子热点与相应兴趣点的中间映射概率重置为1后作为初始映射矩阵进行迭代,直至满足迭代停止条件时停止迭代,得到目标映射矩阵;目标映射矩阵记录了各无线热点与兴趣点之间的目标映射概率。
S940,剔除与每个兴趣点之间的目标映射概率均小于第二阈值的无线热点。
S942,建立相应子区域内所保留的每个无线热点与对应目标映射概率最大的兴趣点间的映射。
S944,通过融合全部子区域内无线热点与兴趣点之间映射的数据,建立统计区域内各无线热点与兴趣点之间的映射。
上述无线热点与兴趣点的映射方法,基于无线热点的嗅探记录建立无线热点与兴趣点的映射关系,无需人工采集上报POI到访数据,不仅提高映射效率;由于减少了对无线热点和兴趣点名称的依赖,使这种映射方式适用范围广,还可以提高无线热点召回率。基于嗅探设备重叠度度量无线热点之间的相关性,可以辅助判断用户在兴趣点之间的流动属性,保留了用户的空间行为特征信息,可以更好的实现无线热点在空间位置上的区分,从而使反映出的无线热点相关性可靠性更高。进而,综合无线热点与兴趣点的距离,以及无线热点之间的嗅探设备重叠度,建立无线热点及兴趣点之间的映射,可以提高映射准确性。
在一个最具体的实施例中,参考图10所示,上述无线热点与兴趣点的映射方法包括:
S1002,获取嗅探记录,识别嗅探记录中的移动热点并剔除。
移动热点的位置是随着时间变化的,无法得到其与POI的稳定映射关系,因此需要剔除。无线热点移动/固定识别可以通过一段时间的嗅探记录反推出各无线热点一系列位置数据,如果一个无线热点的多个位置变化非常大,则可以判断为移动,反之为固定。无线热点移动/固定识别还可以采用其他手段,对此不做限定。
S1004,确定各无线热点与兴趣点所在地理网格的编号。
全国无线热点、POI量级数十亿,遍历计算所有无线热点与POI的映射关系没有必要。本实施例采用的方法是先将无线热点与POI进行网格划分,然后计算各地理网格内无线热点与POI的映射关系,最后进行融合得到完整的映射结果。每个地理网格具有对应的编号。该编号可以是按照如下方式确定的:在包含需要进行无线热点和兴趣点映射的地理区域的平面区域内建立二维坐标系,给定地理网格的大小可以边长为d米的正方形网格,每个正方形网格在二维坐标系中具有对应的坐标,如中心点或顶点等的坐标(x,y),则无线热点与POI对应地理网格编号的计算方法为:(x,y)->([x/d]*d,[y/d]*d),其中,其中,x为横坐标,y为纵坐标,[]为取整运算。
S1006,基于兴趣点的名称之间的包含关系识别其中的父级兴趣点。
现实场景很多POI之间是存在层级关系的,以住宅小区类POI“润城花园”为例,其附近会存在“润城花园1栋”、“润城花园9栋”等POI。每个POI数据包括id,name(名称),lon(经度),lat(纬度)等。POI层级划分的步骤如下:
(1)根据POI的lon、lat计算各POI所属的地理网格。
(2)遍历各地理网格,执行计算:如果某个POI的名称中不包含其它任何POI的名称,则将该POI置为父级POI,所有包含该POI名称的POI为其子POI。
(3)遍历各地理网格,执行计算:在以当前网格为中心的九宫格区域内,获取当前网格内的所有父级POI和与该网格相邻的8个地理网格内的所有父级POI,如果当前网格内的某个父级POIi的名称包含于相邻8个网格内的某个父级POIj的名称中,则将该POIj以及POIj的子POI都划到POIi的子POI集合中。
S1008,根据无线热点之间的嗅探设备重叠度,生成传播矩阵Wn*n
传播矩阵Wn*n是一个n*n的二阶方阵,其中行/列下标n为无线热点的数量,位置[i,j]上的元素表示wifii与wifij的相关性,数值范围为[0,1]。WiFi间的相关性有多种度量方法,比如距离、出现在同一嗅探记录中的次数等。本实施例提出一种基于嗅探设备重叠度的无线热点间相关性度量方法,该方法计算的相关性数值范围为[0,1],无需进行归一化处理,同时保留了用户的个体信息,可以更好的实现无线热点关系网的分割。无线热点关系网构建步骤如下:
(1)解析WiFi嗅探记录(如一个月),得到各无线热点的嗅探设备集合。
(2)剔除一个月内被嗅探的设备数小于阈值的WiFi。
(3)初始化传播矩阵Wn*n,所有元素默认值为0。
(4)计算嗅探用户重叠度wi,j=(wifii嗅探设备去重数+wifij嗅探设备去重数-wifii和wifij的嗅探设备去重数)/wifii嗅探设备去重数。
(5)返回传播矩阵W。
S1010,根据无线热点与兴趣点间的距离,初始化映射矩阵
Figure BDA0002377607030000271
映射矩阵L0 n*m是一个n*m的二阶矩阵,其中上标0表示初始化状态,行下标n为WiFi数量,列下标m为所有POI的父级POI数量,位置[i,j]上的元素表示wifii归属于父级poij的概率值。映射矩阵L0 n*m初始状态默认所有元素为0。列对应的下标值j=poi.parentid.no为当前POI的父级POI编号值,该编号从0开始,最大值为所有POI的父级POI数量减1。
映射矩阵L0 n*m的初始化流程为:获取地理网格内所有父级POI,从0开始进行编号;遍历所有POI(包括父级POI及其子POI),如果存在无线热点wifii满足Distance(wifii,poi)<默认距离阈值,则给映射矩阵元素赋值Li*j=1。初始化之后,标签矩阵L0 n*m中的元素包含0,1两种数值,其中1对应种子热点,0对应待映射热点。
S1012,基于传播矩阵Wn*n和映射矩阵L0 n*m执行标签传播算法,得到当前地理网格内全量无线热点与父级兴趣点的最终标签矩阵L。
执行半监督标签传播算法的步骤如下:
(1)初始化后的传播矩阵Wn*n和映射矩阵L0 n*m
(2)执行传播,将传播矩阵Wn*n记录的无线热点之间的嗅探重叠度作为传播权重,按照传播权重将种子热点与相应兴趣点的初始映射概率传播至映射矩阵L0 n*m中周围的待映射热点,并更新到待映射热点自己的概率分布,得到映射矩阵Lt=W*Lt-1。
(3)重置Lt中初始化的种子热点对应的映射概率值为初始值。
(4)重复(2)、(3)直至映射矩阵L收敛或达到最大迭代次。
(5)返回映射矩阵L。
S1014,识别标签矩阵L中的噪声热点并过滤,得到各地理网格内无线热点与兴趣点的映射数据。
传播迭代结束,得到最终的标签矩阵Ln*m,计算每一行最大元素值,如果最大值大于给定的过滤阈值则保留该无线热点,并建立与最大值对应的POI之间的映射关系,否则判定该无线热点为噪声热点并剔除。
S1016,合并所有地理网格内的映射数据,得到全量无线热点与兴趣点映射结果。
经实际测试,在具有10个住宅小区的范围内以高于80%的精度召回无线热点数量超过5000,而传统基于名称的映射方法仅召回无线热点数量约100个,在相同精度条件下基于位置的映射方法仅召回无线热点数量约2000个,本申请提供的映射方法无论在准确性方面,还是召回率方面均明显优于传统基于名称或者位置的映射方法。
图2、4、6、8、9和10为一个实施例中无线热点与兴趣点的映射方法的流程示意图。应该理解的是,虽然图2、4、6、8、9和10的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、4、6、8、9和10中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图11所示,在一个实施例中,提供了无线热点与兴趣点的映射装置1100,包括热点相关性度量模块1102、映射概率传播模块1104和热点兴趣点映射模块1106,其中,
热点相关性度量模块1102,用于获取嗅探记录,嗅探记录包包括嗅探设备所嗅探到的无线热点的数据;根据嗅探记录,确定嗅探设备重叠度。
映射概率传播模块1104,用于根据无线热点与相应的兴趣点的距离,确定无线热点与相应的兴趣点间的初始映射概率;基于嗅探设备重叠度进行初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点间的目标映射概率。
热点兴趣点映射模块1106,用于根据目标映射概率,建立无线热点与兴趣点之间的映射。
在一个实施例中,无线热点的数据包括无线热点的位置;参考图12所示,上述无线热点与兴趣点的映射装置1100还包括移动热点剔除模块1108,用于根据无线热点在不同嗅探记录中的位置变化,识别无线热点中的移动热点;剔除每条嗅探记录中关于移动热点的数据;根据无线热点的嗅探记录,确定无线热点之间的嗅探设备重叠度包括:根据完成数据剔除的嗅探记录,确定无线热点之间的嗅探设备重叠度。
在一个实施例中,嗅探记录包含嗅探设备标识及至少两个无线热点的热点名称;热点相关性度量模块1102还用于基于嗅探设备标识,确定每个热点名称对应的去重嗅探设备集合;识别每两个去重嗅探设备集合中重叠的嗅探设备标识;基于重叠的嗅探设备标识的数量与相应去重嗅探设备集合中嗅探设备标识的数量,确定对应两个无线热点的嗅探设备重叠度。
在一个实施例中,上述无线热点与兴趣点的映射装置1100还包括冷门热点剔除模块1110,用于剔除去重嗅探设备集合中嗅探设备标识数量小于第一阈值的无线热点,得到目标的去重嗅探设备集合;热点相关性度量模块1102还用于识别每两个目标的去重嗅探设备集合中重叠的嗅探设备标识。
在一个实施例中,上述无线热点与兴趣点的映射装置1100还包括POI层级划分模块1112,用于获取待映射的每个兴趣点的兴趣点名称;将兴趣点名称之间具有包含关系的多个兴趣点划分至一个兴趣点组;映射概率传播模块1104还用于根据无线热点与相应的兴趣点组中兴趣点的距离,计算无线热点与相应的兴趣点组间的初始映射概率。
在一个实施例中,映射概率传播模块1104还用于筛选与兴趣点的距离小于预设值的无线热点作为相应兴趣点的种子热点;确定种子热点与相应兴趣点之间的初始映射概率为1;确定除种子节点之外的各无线热点与兴趣点之间的初始映射概率为0。
在一个实施例中,上述无线热点与兴趣点的映射装置1100还包括统计区域划分模块1114,用于将需要进行无线热点和兴趣点映射的统计区域划分为多个子区域;POI层级划分模块1112还用于对同一子区域内多个兴趣点进行分组,得到一个或多个兴趣点组;将相邻子区域中存在兴趣点名称包含关系的两个兴趣点组合并;映射概率传播模块1104还用于根据无线热点与兴趣点组中每个兴趣点的距离,计算无线热点与相应兴趣点组间的初始映射概率。
在一个实施例中,POI层级划分模块1112还用于获取同一子区域内每个兴趣点的兴趣点名称;将兴趣点名称之间具有包含关系的多个兴趣点划分至一个兴趣点组;将被包含的兴趣点名称对应兴趣点确定为兴趣点组中的父级兴趣点。
在一个实施例中,POI层级划分模块1112还用于在当前子区域内一个父级兴趣点的兴趣点名称包含了相邻子区域内一个父级兴趣点的兴趣点名称时,将当前子区域内父级兴趣点所在的兴趣点组合并至相邻子区域内相应父级兴趣点所在的兴趣点组中;在当前子区域内一个父级兴趣点的兴趣点名称包含于相邻子区域内一个父级兴趣点的兴趣点名称时,将相邻子区域内父级兴趣点所在的兴趣点组合并至当前子区域内相应父级兴趣点所在的兴趣点组中。
在一个实施例中,映射概率传播模块1104还用于筛选与兴趣点组中至少一个兴趣点的距离小于预设值的无线热点作为相应兴趣点组的种子热点;确定种子热点与相应兴趣点组之间的初始映射概率为1;确定除种子节点之外的各无线热点与兴趣点组之间的初始映射概率为0。
在一个实施例中,上述无线热点与兴趣点的映射装置1100还包括矩阵初始化模块1116,用于将无线热点之间的嗅探设备重叠度作为矩阵元素建立传播矩阵;将无线热点与兴趣点间的初始映射概率作为矩阵元素建立初始映射矩阵;映射概率传播模块1104还用于将传播矩阵与初始映射矩阵相乘,计算得到中间映射矩阵;将中间映射矩阵中种子热点与相应兴趣点的中间映射概率重置为1后作为初始映射矩阵进行迭代,直至满足迭代停止条件时停止迭代,得到目标映射矩阵;目标映射矩阵记录了各无线热点与兴趣点之间的目标映射概率。
在一个实施例中,热点兴趣点映射模块1106还用于剔除与每个兴趣点之间的目标映射概率均小于第二阈值的无线热点;建立所保留的每个无线热点与对应目标映射概率最大的兴趣点间的映射。
在一个实施例中,统计区域划分模块1114,用于将需要进行无线热点和兴趣点映射的统计区域划分为多个子区域;热点兴趣点映射模块1106还用于根据同一子区域内的无线热点与兴趣点之间的目标映射概率,建立相应子区域内无线热点与兴趣点之间的映射;通过融合全部子区域内无线热点与兴趣点之间映射的数据,建立统计区域内各无线热点与兴趣点之间的映射。
上述无线热点与兴趣点的映射装置,基于无线热点的嗅探记录建立无线热点与兴趣点的映射关系,无需人工采集上报POI到访数据,不仅提高映射效率;由于减少了对无线热点和兴趣点名称的依赖,使这种映射方式适用范围广,还可以提高无线热点召回率。基于嗅探设备重叠度度量无线热点之间的相关性,可以辅助判断用户在兴趣点之间的流动属性,保留了用户的空间行为特征信息,可以更好的实现无线热点在空间位置上的区分,从而使反映出的无线热点相关性可靠性更高。进而,综合无线热点与兴趣点的距离,以及无线热点之间的嗅探设备重叠度,建立无线热点及兴趣点之间的映射,可以提高映射准确性。
图13示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110或服务器120。如图13所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现无线热点与兴趣点的映射方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行无线热点与兴趣点的映射方法。
本领域技术人员可以理解,图13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的无线热点与兴趣点的映射装置可以实现为一种计算机程序的形式,计算机程序可在如图13所示的计算机设备上运行。计算机设备的存储器中可存储组成该无线热点与兴趣点的映射装置的各个程序模块,比如,图11所示的相关性度量模块、映射概率传播模块和热点兴趣点映射模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的无线热点与兴趣点的映射方法中的步骤。
例如,图13所示的计算机设备可以通过如图11所示的无线热点与兴趣点的映射装置中的热点相关性度量模块执行步骤S202和S204。计算机设备可通过映射概率传播模块执行步骤S206和S208。计算机设备可通过热点兴趣点映射模块执行步骤S210。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述无线热点与兴趣点的映射方法的步骤。此处无线热点与兴趣点的映射方法的步骤可以是上述各个实施例的无线热点与兴趣点的映射方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述无线热点与兴趣点的映射方法的步骤。此处无线热点与兴趣点的映射方法的步骤可以是上述各个实施例的无线热点与兴趣点的映射方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (26)

1.一种无线热点与兴趣点的映射方法,包括:
获取嗅探记录,所述嗅探记录包括嗅探设备所嗅探到的至少两个无线热点的热点名称;所述嗅探记录还包括嗅探设备标识;
基于所述嗅探设备标识,确定每个热点名称对应的去重嗅探设备集合;
识别每两个去重嗅探设备集合中重叠的嗅探设备标识;
基于所述重叠的嗅探设备标识的数量以及相应去重嗅探设备集合中嗅探设备标识的数量,确定对应两个无线热点的嗅探设备重叠度;
根据无线热点与相应的兴趣点的距离,确定所述无线热点与所述相应的兴趣点间的初始映射概率;
基于所述嗅探设备重叠度进行所述初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点间的目标映射概率;
根据所述目标映射概率,建立无线热点与兴趣点之间的映射。
2.根据权利要求1所述的方法,其特征在于,所述无线热点的数据包括无线热点的位置;所述获取嗅探记录,包括:
根据无线热点在不同嗅探记录中的位置变化,识别无线热点中的移动热点;
剔除每条嗅探记录中关于所述移动热点的数据;
获取完成数据剔除的嗅探记录。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
剔除所述去重嗅探设备集合中嗅探设备标识数量小于第一阈值的无线热点,得到目标的去重嗅探设备集合;
所述识别每两个去重嗅探设备集合中重叠的嗅探设备标识,包括:
识别每两个所述目标的去重嗅探设备集合中重叠的嗅探设备标识。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待映射的每个兴趣点的兴趣点名称;
将所述兴趣点名称之间具有包含关系的多个兴趣点划分至一个兴趣点组;
所述根据无线热点与相应的兴趣点的距离,确定所述无线热点与所述相应的兴趣点间的初始映射概率,包括:根据无线热点与相应的兴趣点组中兴趣点的距离,计算无线热点与所述相应的兴趣点组间的初始映射概率。
5.根据权利要求1所述的方法,其特征在于,所述根据无线热点与相应的兴趣点的距离,确定所述无线热点与所述相应的兴趣点间的初始映射概率,包括:
筛选与兴趣点的距离小于预设值的无线热点作为相应兴趣点的种子热点;
确定种子热点与相应兴趣点之间的初始映射概率为1;
确定除种子节点之外的各无线热点与兴趣点之间的初始映射概率为0。
6.根据权利要求1所述的方法,其特征在于,所述方法包括:
将需要进行无线热点和兴趣点映射的统计区域划分为多个子区域;
对同一子区域内多个兴趣点进行分组,得到一个或多个兴趣点组;
将相邻子区域中存在兴趣点名称包含关系的两个兴趣点组合并;
所述根据无线热点与相应的兴趣点的距离,确定所述无线热点与所述相应的兴趣点间的初始映射概率,包括:根据无线热点与相应的兴趣点组中兴趣点的距离,计算所述无线热点与所述相应的兴趣点组间的初始映射概率。
7.根据权利要求6所述的方法,其特征在于,所述对同一子区域内多个兴趣点进行分组,得到一个或多个兴趣点组包括:
获取同一子区域内每个兴趣点的兴趣点名称;
将所述兴趣点名称之间具有包含关系的多个兴趣点划分至一个兴趣点组;
将被包含的兴趣点名称对应兴趣点确定为所述兴趣点组中的父级兴趣点。
8.根据权利要求7所述的方法,其特征在于,所述将相邻子区域中存在兴趣点名称包含关系的两个兴趣点组合并,包括:
在当前子区域内一个父级兴趣点的兴趣点名称包含了相邻子区域内一个父级兴趣点的兴趣点名称时,将当前子区域内所述父级兴趣点所在的兴趣点组合并至所述相邻子区域内相应父级兴趣点所在的兴趣点组中;
在当前子区域内一个父级兴趣点的兴趣点名称包含于相邻子区域内一个父级兴趣点的兴趣点名称时,将相邻子区域内所述父级兴趣点所在的兴趣点组合并至所述当前子区域内相应父级兴趣点所在的兴趣点组中。
9.根据权利要求6至8任意一项所述的方法,其特征在于,所述根据无线热点与相应的兴趣点组中兴趣点的距离,计算所述无线热点与所述相应的兴趣点组间的初始映射概率,包括:
筛选与兴趣点组中至少一个兴趣点的距离小于预设值的无线热点作为相应兴趣点组的种子热点;
确定种子热点与相应兴趣点组之间的初始映射概率为1;
确定除种子节点之外的各无线热点与兴趣点组之间的初始映射概率为0。
10.根据权利要求5所述的方法,其特征在于,所述方法还包括:
将无线热点之间的嗅探设备重叠度作为矩阵元素建立传播矩阵;
将无线热点与兴趣点间的初始映射概率作为矩阵元素建立初始映射矩阵;
所述基于所述嗅探设备重叠度进行所述初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点间的目标映射概率,包括:
将所述传播矩阵与初始映射矩阵相乘,计算得到中间映射矩阵;
将中间映射矩阵中种子热点与相应兴趣点的中间映射概率重置为1后作为初始映射矩阵进行迭代,直至满足迭代停止条件时停止迭代,得到目标映射矩阵;所述目标映射矩阵记录了各无线热点与兴趣点之间的目标映射概率。
11.根据权利要求10所述的方法,其特征在于,所述根据所述目标映射概率,建立无线热点与兴趣点之间的映射,包括:
剔除与每个兴趣点之间的目标映射概率均小于第二阈值的无线热点;
建立所保留的每个无线热点与对应目标映射概率最大的兴趣点间的映射。
12.根据权利要求1所述的方法,其特征在于,所述方法包括:
将需要进行无线热点和兴趣点映射的统计区域划分为多个子区域;
所述根据所述目标映射概率,建立无线热点与兴趣点之间的映射,包括:
根据同一子区域内的无线热点与兴趣点之间的目标映射概率,建立相应子区域内无线热点与兴趣点之间的映射;
通过融合全部子区域内无线热点与兴趣点之间映射的数据,建立所述统计区域内各无线热点与兴趣点之间的映射。
13.一种无线热点与兴趣点的映射装置,所述装置包括:
热点相关性度量模块,用于获取嗅探记录,所述嗅探记录包括嗅探设备所嗅探到的至少两个无线热点的热点名称;所述嗅探记录还包括嗅探设备标识;基于所述嗅探设备标识,确定每个热点名称对应的去重嗅探设备集合;识别每两个去重嗅探设备集合中重叠的嗅探设备标识;基于所述重叠的嗅探设备标识的数量以及相应去重嗅探设备集合中嗅探设备标识的数量,确定对应两个无线热点的嗅探设备重叠度;
映射概率传播模块,用于根据无线热点与相应的兴趣点的距离,确定所述无线热点与所述相应的兴趣点间的初始映射概率;基于所述嗅探设备重叠度进行所述初始映射概率之间的迭代传播,在迭代结束时得到无线热点与兴趣点间的目标映射概率;
热点兴趣点映射模块,用于根据所述目标映射概率,建立无线热点与兴趣点之间的映射。
14.根据权利要求13所述的装置,其特征在于,所述无线热点的数据包括无线热点的位置;所述装置还包括移动热点剔除模块,用于根据无线热点在不同嗅探记录中的位置变化,识别无线热点中的移动热点;剔除每条嗅探记录中关于所述移动热点的数据;
所述热点相关性度量模块,还用于获取完成数据剔除的嗅探记录。
15.根据权利要求13所述的装置,其特征在于,所述装置还包括冷门热点剔除模块,用于剔除所述去重嗅探设备集合中嗅探设备标识数量小于第一阈值的无线热点,得到目标的去重嗅探设备集合;
所述热点相关性度量模块,还用于识别每两个所述目标的去重嗅探设备集合中重叠的嗅探设备标识。
16.根据权利要求13所述的装置,其特征在于,所述装置还包括POI层级划分模块,用于获取待映射的每个兴趣点的兴趣点名称;将所述兴趣点名称之间具有包含关系的多个兴趣点划分至一个兴趣点组;
所述映射概率传播模块,还用于根据无线热点与相应的兴趣点组中兴趣点的距离,计算无线热点与所述相应的兴趣点组间的初始映射概率。
17.根据权利要求13所述的装置,其特征在于,所述映射概率传播模块还用于筛选与兴趣点的距离小于预设值的无线热点作为相应兴趣点的种子热点;确定种子热点与相应兴趣点之间的初始映射概率为1;确定除种子节点之外的各无线热点与兴趣点之间的初始映射概率为0。
18.根据权利要求13所述的装置,其特征在于,所述装置还包括统计区域划分模块,用于将需要进行无线热点和兴趣点映射的统计区域划分为多个子区域;
所述装置还包括POI层级划分模块,用于对同一子区域内多个兴趣点进行分组,得到一个或多个兴趣点组;将相邻子区域中存在兴趣点名称包含关系的两个兴趣点组合并;
所述映射概率传播模块,还用于根据无线热点与相应的兴趣点组中兴趣点的距离,计算所述无线热点与所述相应的兴趣点组间的初始映射概率。
19.根据权利要求18所述的装置,其特征在于,所述POI层级划分模块,还用于获取同一子区域内每个兴趣点的兴趣点名称;将所述兴趣点名称之间具有包含关系的多个兴趣点划分至一个兴趣点组;将被包含的兴趣点名称对应兴趣点确定为所述兴趣点组中的父级兴趣点。
20.根据权利要求19所述的装置,其特征在于,所述POI层级划分模块,还用于在当前子区域内一个父级兴趣点的兴趣点名称包含了相邻子区域内一个父级兴趣点的兴趣点名称时,将当前子区域内所述父级兴趣点所在的兴趣点组合并至所述相邻子区域内相应父级兴趣点所在的兴趣点组中;在当前子区域内一个父级兴趣点的兴趣点名称包含于相邻子区域内一个父级兴趣点的兴趣点名称时,将相邻子区域内所述父级兴趣点所在的兴趣点组合并至所述当前子区域内相应父级兴趣点所在的兴趣点组中。
21.根据权利要求18至20任一项所述的装置,其特征在于,所述映射概率传播模块,还用于筛选与兴趣点组中至少一个兴趣点的距离小于预设值的无线热点作为相应兴趣点组的种子热点;确定种子热点与相应兴趣点组之间的初始映射概率为1;确定除种子节点之外的各无线热点与兴趣点组之间的初始映射概率为0。
22.根据权利要求17所述的装置,其特征在于,所述装置还包括矩阵初始化模块,用于将无线热点之间的嗅探设备重叠度作为矩阵元素建立传播矩阵;将无线热点与兴趣点间的初始映射概率作为矩阵元素建立初始映射矩阵;
所述映射概率传播模块,还用于将所述传播矩阵与初始映射矩阵相乘,计算得到中间映射矩阵;将中间映射矩阵中种子热点与相应兴趣点的中间映射概率重置为1后作为初始映射矩阵进行迭代,直至满足迭代停止条件时停止迭代,得到目标映射矩阵;所述目标映射矩阵记录了各无线热点与兴趣点之间的目标映射概率。
23.根据权利要求22所述的装置,其特征在于,所述热点兴趣点映射模块,还用于剔除与每个兴趣点之间的目标映射概率均小于第二阈值的无线热点;建立所保留的每个无线热点与对应目标映射概率最大的兴趣点间的映射。
24.根据权利要求13所述的装置,其特征在于,所述装置还包括统计区域划分模块,用于将需要进行无线热点和兴趣点映射的统计区域划分为多个子区域;
所述热点兴趣点映射模块,还用于根据同一子区域内的无线热点与兴趣点之间的目标映射概率,建立相应子区域内无线热点与兴趣点之间的映射;通过融合全部子区域内无线热点与兴趣点之间映射的数据,建立所述统计区域内各无线热点与兴趣点之间的映射。
25.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
26.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
CN202010072289.3A 2020-01-21 2020-01-21 无线热点与兴趣点的映射方法、装置和存储介质 Active CN111291145B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010072289.3A CN111291145B (zh) 2020-01-21 2020-01-21 无线热点与兴趣点的映射方法、装置和存储介质
PCT/CN2020/124594 WO2021147431A1 (zh) 2020-01-21 2020-10-29 无线热点与兴趣点的映射方法、装置、计算机可读存储介质和计算机设备
US17/678,478 US20220286956A1 (en) 2020-01-21 2022-02-23 Method and apparatus for mapping wireless hotspots and points of interest, computer-readable storage medium, and computer device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010072289.3A CN111291145B (zh) 2020-01-21 2020-01-21 无线热点与兴趣点的映射方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN111291145A CN111291145A (zh) 2020-06-16
CN111291145B true CN111291145B (zh) 2022-07-29

Family

ID=71029222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010072289.3A Active CN111291145B (zh) 2020-01-21 2020-01-21 无线热点与兴趣点的映射方法、装置和存储介质

Country Status (3)

Country Link
US (1) US20220286956A1 (zh)
CN (1) CN111291145B (zh)
WO (1) WO2021147431A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111291145B (zh) * 2020-01-21 2022-07-29 腾讯科技(深圳)有限公司 无线热点与兴趣点的映射方法、装置和存储介质
CN112261570B (zh) * 2020-09-30 2023-01-06 汉海信息技术(上海)有限公司 兴趣点与无线网络的关联方法、装置、服务器及存储介质
CN112487312A (zh) * 2020-11-30 2021-03-12 北京百度网讯科技有限公司 关联兴趣点的方法、装置及确定兴趣点状态的方法、装置
CN115292342B (zh) * 2022-10-09 2022-12-20 湖北省国土测绘院 一种基于poi数据更新城市用地现状图的方法、系统及设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103533501B (zh) * 2013-10-15 2018-12-18 厦门雅迅网络股份有限公司 一种地理围栏生成方法
CN106991159B (zh) * 2017-03-30 2018-07-24 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN110309434B (zh) * 2018-10-10 2023-10-13 腾讯大地通途(北京)科技有限公司 一种轨迹数据处理方法、装置以及相关设备
CN109672980B (zh) * 2018-12-25 2020-04-07 腾讯科技(深圳)有限公司 确定兴趣点对应的无线局域网热点的方法、装置及存储介质
CN111291145B (zh) * 2020-01-21 2022-07-29 腾讯科技(深圳)有限公司 无线热点与兴趣点的映射方法、装置和存储介质

Also Published As

Publication number Publication date
US20220286956A1 (en) 2022-09-08
CN111291145A (zh) 2020-06-16
WO2021147431A1 (zh) 2021-07-29

Similar Documents

Publication Publication Date Title
CN111291145B (zh) 无线热点与兴趣点的映射方法、装置和存储介质
Chen et al. Delineating urban functional areas with building-level social media data: A dynamic time warping (DTW) distance based k-medoids method
Hasnat et al. Identifying tourists and analyzing spatial patterns of their destinations from location-based social media data
Guo et al. A graph-based approach to vehicle trajectory analysis
Zhao et al. A trajectory clustering approach based on decision graph and data field for detecting hotspots
CN106462627B (zh) 根据多个位置数据报告分析语义地点和相关数据
Guo et al. Discovering spatial patterns in origin‐destination mobility data
CN110765219B (zh) 地理围栏生成方法、装置、计算机设备和存储介质
CN109493119B (zh) 一种基于poi数据的城市商业中心识别方法及系统
Pavlis et al. A modified DBSCAN clustering method to estimate retail center extent
WO2016086786A1 (zh) 地理围栏生成方法及装置
CN110298687B (zh) 一种区域吸引力评估方法及设备
Ai et al. Generation of constrained network Voronoi diagram using linear tessellation and expansion method
US20220037033A1 (en) Systems and methods for implementing density variation (densvar) clustering algorithms
Lera et al. Analysing human mobility patterns of hiking activities through complex network theory
CN114548811A (zh) 一种机场可达性的检测方法、装置、电子设备及存储介质
Zhang et al. Duplicate report detection in urban crowdsensing applications for smart city
CN105205051A (zh) 移动通信资源的分析方法和系统
Eum et al. Vehicle detection from airborne LiDAR point clouds based on a decision tree algorithm with horizontal and vertical features
Celes et al. Calibrating bus mobility data for bus-based urban vehicular networks
Cai et al. Discovery of urban functional regions based on Node2vec
Lian et al. Mining regional mobility patterns for urban dynamic analytics
Yang Spatial analytics and data visualization
CN114245329B (zh) 通行方式识别方法、装置、设备及存储介质
CN114529043B (zh) 一种城市空间组团划分方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40023256

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant