CN111881377A - 位置兴趣点的处理方法及装置 - Google Patents

位置兴趣点的处理方法及装置 Download PDF

Info

Publication number
CN111881377A
CN111881377A CN202010779193.0A CN202010779193A CN111881377A CN 111881377 A CN111881377 A CN 111881377A CN 202010779193 A CN202010779193 A CN 202010779193A CN 111881377 A CN111881377 A CN 111881377A
Authority
CN
China
Prior art keywords
wireless local
local area
key information
area network
area networks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010779193.0A
Other languages
English (en)
Other versions
CN111881377B (zh
Inventor
张升
曹睿
孙福宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010779193.0A priority Critical patent/CN111881377B/zh
Publication of CN111881377A publication Critical patent/CN111881377A/zh
Application granted granted Critical
Publication of CN111881377B publication Critical patent/CN111881377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences

Abstract

本申请提供了一种位置兴趣点的处理方法及装置;方法包括:获取至少两个无线局域网的第一关键信息,及各无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息;对第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇;分别将各无线局域网的第一关键信息与目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各无线局域网与目标区域范围内的位置兴趣点的相似度;分别根据各簇中无线局域网与目标区域范围内的位置兴趣点的相似度,选取各簇的目标位置兴趣点;分别将各无线局域网与所属簇的目标位置兴趣点进行关联。通过本申请,能够提高目标位置兴趣点确定的准确性。

Description

位置兴趣点的处理方法及装置
技术领域
本申请涉及云技术领域,尤其涉及一种位置兴趣点的处理方法及装置。
背景技术
云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
大数据(Big data)是云技术的重要应用领域之一,位置兴趣点是地理信息系统中的数据,可以是一栋房子、一个商铺、一个邮筒、一个公交站等,属于大数据。
为获取用户所访问的位置兴趣点,需要根据用户搜索或连接的无线局域网,将与该无线局域网相关联的位置兴趣点,确定为用户所访问位置兴趣点。相关技术中,通常是将每个无线局域网与其覆盖范围内的所有位置兴趣点进行匹配,将匹配度最高的位置兴趣点与其关联,但采用该关联方式,会因为位置兴趣点的覆盖面积大、无线局域网坐标不准确、位置兴趣点坐标不准确等原因,导致匹配不准确,进而导致确定的用户所访问的位置兴趣点不准确。
发明内容
本申请实施例提供一种位置兴趣点的处理方法及装置,能够提高目标位置兴趣点确定的准确性。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种位置兴趣点的处理方法,包括:
获取至少两个无线局域网的第一关键信息,及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息;
对所述关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇,所述簇包含至少一个无线局域网;
分别将各所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度;
分别根据各所述簇中无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取对应各所述簇的目标位置兴趣点;
分别将各无线局域网与所述无线局域网所属簇对应的目标位置兴趣点进行关联,以
根据搜索或连接的无线局域网,确定与所述搜索或连接的无线局域网相关联的目标位置兴趣点。
本申请实施例提供一种位置兴趣点的处理装置,包括:
获取模块,用于获取至少两个无线局域网的第一关键信息,及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息;
聚类模块,用于对所述第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇,所述簇包含至少一个无线局域网;
匹配模块,用于分别将各所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度;
选取模块,用于分别根据各所述簇中无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取对应各所述簇的目标位置兴趣点;
关联模块,用于分别将各无线局域网与所述无线局域网所属簇对应的目标位置兴趣点进行关联,以
根据搜索或连接的无线局域网,确定与所述搜索或连接的无线局域网相关联的目标位置兴趣点。
上述方案中,所述获取模块,还用于获取至少两个无线局域网的名称、及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的名称;
将至少两个所述无线局域网的名称中与地理信息相关联的部分信息,作为所述无线局域网的第一关键信息;
将所述位置兴趣点的名称所对应的拼音和/或英文翻译,作为所述位置兴趣点的关键词,以得到各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息。
上述方案中,所述聚类模块,还用于根据各所述无线局域网的第一关键信息,对至少两个无线局域网进行分类,得到对应各关键信息的至少两个无线局域网;
分别对各关键信息对应的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇。
上述方案中,所述聚类模块,还用于获取所述第一关键信息相同的至少两个无线局域网所处的经纬度;
根据所述第一关键信息相同的至少两个无线局域网所处的经纬度,确定所述第一关键信息相同的至少两个无线局域网在地理空间的密度分布;
根据所述密度分布,对所述关键信息相同的至少两个无线局域网进行聚类,得到对应各关键信息的至少两个簇,所述簇中无线局域网在地理空间的密度大于密度阈值。
上述方案中,所述匹配模块,还用于对于每个无线局域网执行以下操作:
获取所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息的最长公共字符串;
获取所述最长公共字符串的字符数与所述无线局域网的第一关键信息的字符数的比值,作为所述无线局域网与相应目标区域范围内的位置兴趣点的相似度。
上述方案中,所述匹配模块,还用于对于每个无线局域网执行以下操作:
对所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息取交集,并获取所述交集的字符数;
对所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息取并集,并获取所述并集的字符数;
将所述交集的字符数与所述并集的字符数的比值,作为所述无线局域网与相应目标区域范围内的位置兴趣点的相似度。
上述方案中,所述选取模块,还用于根据各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取与所述无线局域网相似度最大的位置兴趣点,作为所述无线局域网对应的候选位置兴趣点;
分别根据各所述簇中无线局域网与相应候选位置兴趣点的相似度,选取对应各所述簇的目标位置兴趣点。
上述方案中,所述选取模块,还用于对于每个簇分别执行以下操作:
当所述簇包含至少两个无线局域网时,根据所述簇中至少两个无线局域网与相应候选位置兴趣点的相似度大小,对所述簇中至少两个无线局域网对应的候选位置兴趣点进行排序;
根据排序结果,将所述相似度最大值所对应的候选位置兴趣点,作为对应所述簇的目标位置兴趣点。
上述方案中,所述选取模块,还用于对于每个簇分别执行以下操作:
当所述簇包含至少两个无线局域网时,根据所述簇中至少两个无线局域网对应的候选位置兴趣点,获取所述簇中与各候选位置兴趣点对应的无线局域网的数量;
将对应的无线局域网的数量最多的候选位置兴趣点,作为所述簇的目标位置兴趣点。
本申请实施例提供一种计算机设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的位置兴趣点的处理方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本申请实施例提供的位置兴趣点的处理方法。
本申请实施例具有以下有益效果:
本申请通过对所述第一关键信息相同的至少两个无线局域网进行聚类,得到对应各关键信息的至少两个簇;分别将各无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各无线局域网与相应目标区域范围内的位置兴趣点的相似度;分别根据各簇中无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取对应各簇的目标位置兴趣点;分别将各无线局域网与无线局域网所属簇对应的目标位置兴趣点进行关联,以根据搜索或连接的无线局域网,确定与搜索或连接的无线局域网相关联的目标位置兴趣点;如此,通过对所述关键信息相同的至少两个无线局域网进行聚类,利用了无线局域网之间的关联关系,避免了因为位置兴趣点的覆盖面积大、无线局域网坐标不准确、位置兴趣点坐标不准确等原因,导致的匹配不准确的问题,进而提高了目标位置兴趣点确定的准确性。
附图说明
图1是本申请实施例提供的无线局域网及位置兴趣点在地图中的示意图;
图2是本申请实施例提供的位置兴趣点的处理系统100的架构示意图;
图3是本申请实施例提供的服务器200的结构示意图;
图4是本申请实施例提供的位置兴趣点的处理方法的流程示意图;
图5是本申请实施例提供的聚类结果的示意图;
图6是本申请实施例提供的位置兴趣点的处理方法的流程示意图;
图7是本申请实施例提供的位置兴趣点的处理方法的流程示意图;
图8是本申请实施例提供的WiFi与POI匹配的示意图;
图9是本申请实施例提供的基于DBSCAN算法的聚类方法的流程示意图;
图10是本申请实施例提供的位置兴趣点的处理装置的组成结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)位置兴趣点,是地理信息系统中的一个术语,泛指一切可以抽象为点的地理对象,尤其是一些与人们生活密切相关的地理实体,如学校、银行、餐馆、加油站、医院、超市等。位置兴趣点的主要用途是对事物或事件的地址进行描述,能在很大程度上增强对事物或事件位置的描述能力和查询能力,提高地理定位的精度和速度。
2)聚类,将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。
3)最长公共字符串,指的是两个或两个以上的字符串所共有的字符串中,最长的一个字符串,其中,最长公共字符串中的字符在原字符串中是连续的,例如,字符串“ABABC”,“BABCA”以及“ABCBA”的最长公共字符串串是“ABC”,其他的公共字符串包括“A”、“AB”、“B”、“BA”、“BC”以及“C”。
相关技术中,为了将无线局域网与位置兴趣点相关联,通常是先获取无线局域网的名称和位置兴趣点的名称,并对无线局域网的名称和位置兴趣点的名称进行数据清洗;然后针对每个无线局域网,提取距离无线局域网250米范围以内所有的位置兴趣点,计算无线局域网的名称与每个位置兴趣点的名称之间的相似度;最后,将相似度最大的位置兴趣点作为与无线局域网相关联的位置兴趣点。
上述方案存在以下问题:
1、对于一些具有轮廓数据的位置兴趣点,其对应的地理实体实际覆盖了一个区域,通常用该区域中心的坐标来表示位置兴趣点的位置。对于处于其覆盖区域的无线局域网,理论上应该是与该位置兴趣点相关联的,但当覆盖区域过大时,可能会由于无线局域网距离区域中心较远,而无法准确将无线局域网与该位置兴趣点相关联。
示例性地,图1是本申请实施例提供的无线局域网及位置兴趣点在地图中的示意图,参见图1,图1中的点为名称为pku的无线局域网所对应的坐标点;“星星”为位置兴趣点“北京大学”所对应的坐标点,虚线圈为以位置兴趣点“北京大学”为圆点,半径为250米的圈,需要说明的是,这里250米指的是实际距离,而非地图中的距离。也即,位于虚线圈之外的点所对应的无线局域网与位置兴趣点“北京大学”的距离超过250米。
从图1中可知,位于虚线圈之外的很多点所对应的无线局域网所处的位置,实际是在北京大学的覆盖区域内,其应该与位置兴趣点“北京大学”相关联。但由于在相关技术中,是将无线局域网与距离无线局域网250米范围以内所有的位置兴趣点进行匹配,对于这些位于虚线圈之外的很多点所对应的无线局域网,在匹配过程中,并不会将其与位置兴趣点“北京大学”进行匹配,因此,无法匹配到正确的位置兴趣点,进而无法准确将无线局域网与位置兴趣点相关联。
2、由于无线局域网的坐标和位置兴趣点的坐标都存在误差,这也会导致无法准确将无线局域网与位置兴趣点相关联。
基于此,本申请实施例提供一种位置兴趣点的处理方法及装置,以至少解决相关技术中的上述问题,接下来分别说明。
参见图2,图2是本申请实施例提供的位置兴趣点的处理系统100的架构示意图,为实现支撑一个示例性应用,终端400(示例性示出了终端400-1和终端400-2)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。
服务器200,用于获取至少两个无线局域网的第一关键信息,及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息;对所述第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇,所述簇包含至少一个无线局域网;分别将各所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度;分别根据各所述簇中无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取对应各所述簇的目标位置兴趣点;分别将各无线局域网与所述无线局域网所属簇对应的目标位置兴趣点进行关联。
终端400,用于将用户搜索或连接的无线局域网发送给服务器;
服务器200,用于根据搜索或连接的无线局域网,确定与所述搜索或连接的无线局域网相关联的目标位置兴趣点,并确定到的目标位置兴趣点返回给终端400。
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN,ContentDelivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
参见图3,图3是本申请实施例提供的服务器200的结构示意图,图3所示的服务器200包括:至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。服务器200中的各个组件通过总线系统240耦合在一起。可理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图3中将各种总线都标为总线系统240。
处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口230包括使得能够呈现媒体内容的一个或多个输出装置231,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口230还包括一个或多个输入装置232,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器250可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Me mory),易失性存储器可以是随机存取存储器(RAM,Random Access Memor y)。本申请实施例描述的存储器250旨在包括任意适合类型的存储器。
在一些实施例中,存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块252,用于经由一个或多个(有线或无线)网络接口220到达其他计算设备,示例性的网络接口220包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块253,用于经由一个或多个与用户接口230相关联的输出装置231(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块254,用于对一个或多个来自一个或多个输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的装置可以采用软件方式实现,图3示出了存储在存储器250中的位置兴趣点的处理装置255,其可以是程序和插件等形式的软件,包括以下软件模块:获取模块2551、聚类模块2552、匹配模块2553、选取模块2554及关联模块2555,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。
将在下文中说明各个模块的功能。
在另一些实施例中,本申请实施例提供的装置可以采用硬件方式实现,作为示例,本申请实施例提供的装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的位置兴趣点的处理方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Applicati on Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,ComplexProgrammable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable GateArray)或其他电子元件。
本申请实施例提供的位置兴趣点的处理方法可由服务器或终端单独实施,或由服务器及终端协同实施,以服务器实施为例,说明本申请实施例提供的位置兴趣点的处理方法。
参见图4,图4是本申请实施例提供的位置兴趣点的处理方法的流程示意图,将结合图4示出的步骤进行说明。
步骤401:服务器获取至少两个无线局域网的第一关键信息,及各无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息。
这里,无线局域网的第一关键信息可以为无线局域网的名称中的全部信息或部分信息,位置兴趣点的第一关键信息可以为位置兴趣点的全部信息或部分信息;无线局域网所覆盖的目标区域范围可以是该无线局域网所能够覆盖的整个范围,也可以是从该无线局域网所能够覆盖的整个范围中选取的部分范围。
需要说明的是,无线局域网所能覆盖的范围是指无线网络产品比如无线网卡、无线AP(无线访问点)等设备发射信号所能达到的最远距离。根据802.11标准(做链接),一般无线设备所能覆盖的最大距离通常为300米。
在一些实施例中,无线局域网所覆盖的目标区域范围可以是预设大小的区域方位,如半径为250米的圆形范围,其中,圆形范围的中心为无线局域网所处的位置,无线局域网所处的位置可以由相应无线网络产品所处的位置表示。
在一些实施例中,可以通过以下方式获取至少两个无线局域网的第一关键信息,及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息:
获取至少两个无线局域网的名称、及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的名称;将至少两个所述无线局域网的名称中与地理信息相关联的部分信息,作为所述无线局域网的第一关键信息;将所述位置兴趣点的名称所对应的拼音和/或英文翻译,作为所述位置兴趣点的关键词,以得到各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息。
在实际实施时,由于无线局域网的名称的命名规则各异,无线局域网的名称中存在较大噪声,需要对无线局域网的名称进行清洗,以从中提取到与地理信息相关联的部分信息作为第一关键信息。
这里地理信息可以为与地理实体对应的信息,例如,地理实体可以为学校、银行、餐馆,相应的,与地理实体对应的信息可以为学校名称、银行名称、餐馆名称。
例如,无线局域网的名称包括PKU-teacher、PKU-student、PKU-staff,其中,PKU是与北京大学相关联的信息,因此,分别从这些名称中提取PKU作为第一关键信息,也即,PKU-teacher、PKU-student、PKU-staff所对应的第一关键信息都为PKU。
在实际应用中,由于无线局域网的名称通常由字母组成,从中提取到的第一关键信息也由字母组成,基于此,需要将位置兴趣点的名称转换为字母形式,也即拼音和/或英文翻译。需要说明的是,这里的拼音可以是完整的拼音,也可以是拼音的部分内容,如拼音缩写;英文翻译可以是完整的英文翻译,也可以是英文翻译的部分内容,如英文翻译的缩写。
例如,北京大学所对应的完整的拼音为“bei jing da xue”,对应的拼音缩写“bjdx”,也即,北京大学所对应的拼音可以表示为“bei jing da xue”,也可以表示为“bjdx”;北京大学所对应的完整的英文翻译为“peking university”,英文翻译的缩写为“pku”,也即北京大学所对应的英文翻译可以为“peking un iversity”,也可以为“pku”。
需要说明的是,这里将位置兴趣点的名称所对应的拼音和/或英文翻译,作为所述位置兴趣点的第二关键信息,指的是可以仅将位置兴趣点的名称所对应的拼音作为位置兴趣点的第二关键信息,也可以仅将位置兴趣点的名称所对应的英文翻译作为所述位置兴趣点的第二关键信息,还可以将位置兴趣点的名称所对应的拼音和英文翻译一起作为位置兴趣点的关键词。
步骤402:对第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇,簇包含至少一个无线局域网。
在实际实施时,根据无线局域网所处位置的相似性,来对第一关键信息相同的至少两个无线局域网进行聚类,其中,无线局域网所处位置的相似性由两个无线局域网之间的距离衡量,距离越近,则相似性越高。这里,聚类得到的同一簇内的无线局域网所处位置相似,而不同簇内的不限局域网所处位置相异。
需要说明的是,这里进行聚类的至少两个局域网的第一关键信息是相同的,例如,对所有第一关键信息为“PKU”的无线局域网进行聚类,得到对应第一关键信息“PKU”的至少两个簇。图5是本申请实施例提供的聚类结果的示意图,参见图5,将所有第一关键信息为“PKU”的无线局域网划分为了两个簇,图5中两个簇中的无线局域网所对应的坐标点分别由不同的点表示,同一簇内无线局域网所对应的坐标点相近,也即无线局域网所处位置相似;不同簇内无线局域网所对应的坐标点差异较大。
在一些实施例中,可以通过以下方式对所述第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇:
根据各所述无线局域网的第一关键信息,对至少两个无线局域网进行分类,得到对应各第一关键信息的至少两个无线局域网;分别对各第一关键信息对应的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇。
在实际实施时,根据第一关键信息对无线局域网进行分类,每个类别中的无线局域网的第一关键信息是相同的,且每个类别对应一个第一关键信息,进而分别对各类别中的无线局域网进行聚类,以得到对应各第一关键信息的至少两个簇。
需要说明的是,这里只有在对应第一关键信息的无线局域网的数量为至少两个的时候,才能够对该第一关键信息对应的无线局域网进行聚类。若某一第一关键信息对应的无线局域网的数量仅为1个,则无法对该第一关键信息对应的无线局域网进行聚类。
在一些实施例中,可以通过以下方式对所述第一关键信息相同的至少两个无线局域网进行聚类:获取所述第一关键信息相同的至少两个无线局域网所处的经纬度;根据所述第一关键信息相同的至少两个无线局域网所处的经纬度,确定所述第一关键信息相同的至少两个无线局域网在地理空间的密度分布;根据所述密度分布,对所述第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇,所述簇中无线局域网在地理空间的密度大于密度阈值。
在实际实施时,可以采用经纬度表示无线局域网所处的位置,以根据至少两个无线局域网在地理空间的位置,来确定至少两个无线局域网在地理空间的密度分布。
这里的密度指的是对特定区域内无线局域网的数量的度量,可以由无线局域网的数量除以特定区域面积得到,在某一特定区域内无线局域网的数量越多,则密度越大;在某一特定区域面积内无线局域网的数量越少,则密度越小。
这里,得到的簇中无线局域网在地理空间的密度大于密度阈值,也即,该簇对应的区域范围内,无线局域网的数量与该区域范围的面积的比值大于密度阈值。
在一些实施例中,可以采用具有噪声的基于密度的聚类方法(DBSCAN,Density-Based Spatial Clustering of Applications with Noise)算法来对第一关键信息相同的至少两个无线局域网进行聚类。
DBSCAN是一种基于密度的聚类算法,它将密度相连的点的最大集合定义为簇,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。
步骤403:分别将各无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第一关键信息进行匹配,得到各无线局域网与相应目标区域范围内的位置兴趣点的相似度。
在实际实施时,计算无线局域网的第一关键信息与位置兴趣点的第一关键信息之间的相似度,以表示无线局域网与位置兴趣点之间的相似度。
在一些实施例中,可以通过以下方式获取无线局域网与相应目标区域范围内的位置兴趣点的相似度:
对于每个无线局域网执行以下操作:获取所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息的最长公共字符串;获取所述最长公共字符串的字符数与所述无线局域网的第一关键信息的字符数的比值,作为所述无线局域网与相应目标区域范围内的位置兴趣点的相似度。
在实际实施时,可以采用最长公共字符串匹配的方式,来将无线局域网的第一关键信息与位置兴趣点的第二关键信息进行匹配。也即,获取无线局域网的第一关键信息与位置兴趣点的第二关键信息中共有的字符串,并从中选取最长的一个作为最长公共字符串。其中,选取的共有的字符串在无线局域网的第一关键信息及位置兴趣点的第二关键信息应该是连续的。
例如,无线局域网的第一关键信息为“ABABC”,位置兴趣点的第二关键信息为“BABCA”,那么,无线局域网的第一关键信息与位置兴趣点的第二关键信息中共有的字符串包括“A”、“AB”、“B”、“BA”、“BAB”、“BABC”、“ABC”、“BC”以及“C”,其中,最长公共字符串为“BABC”,那么,该无线局域网与位置兴趣点的相似度为80%。
这里,无线局域网的第一关键信息与位置兴趣点的第二关键信息中最长公共字符串的长度越长,则无线局域网的第一关键信息与位置兴趣点的第二关键信息越相似。
在一些实施例中,在获取所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息的最长公共字符串之后,还可以将最长公共字符串的字符数与所述位置兴趣点的第一关键信息的字符数的比值,作为无线局域网与相应目标区域范围内的位置兴趣点的相似度;或者,在获取所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息的最长公共字符串之后,获取无线局域网的第一关键信息的字符数与位置兴趣点的第二关键信息的字符数的和,将最长公共字符串的字符数与获取的和的比值,作为无线局域网与相应目标区域范围内的位置兴趣点的相似度。
在一些实施例中,可以通过以下方式获取无线局域网与相应目标区域范围内的位置兴趣点的相似度:
对于每个无线局域网执行以下操作:对所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息取交集,并获取所述交集的字符数;对所述无线局域网的第二关键信息与相应目标区域范围内的位置兴趣点的第一关键信息取并集,并获取所述并集的字符数;将所述交集的字符数与所述并集的字符数的比值,作为所述无线局域网与相应目标区域范围内的位置兴趣点的相似度。
在实际实施时,对所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息取交集,指的是获取无线局域网的第一关键信息与位置兴趣点的第二关键信息中共有的字符。这里,共有的字符在无线局域网的第一关键信息、及位置兴趣点的第二关键信息中,可以是连续的,也可以是分散的。
例如,无线局域网的第一关键信息为“ABC”,位置兴趣点的第二关键信息为“BCD”,交集为“BC”,并集为“ABCD”,那么,无线局域网与位置兴趣点的相似度为50%。
在一些实施例中,还可以通过字符串编辑距离,来获取无线局域网与相应目标区域范围内的位置兴趣点的相似度。这里,字符串编辑距离指的是两个字符串转换时需要的最少操作,需要的操作越少说明两个字符串越相似。字符串的操作包括:插入一个字符、删除一个字符和替换一个字符。
在实际实施时,获取从无线局域网的第一关键信息,转换为位置兴趣点的第二关键信息的最少操作的次数,将最少操作的次数,作为无线局域网与位置兴趣点的相似度。
在一些实施例中,可以通过深度学习的方式获取无线局域网与相应目标区域范围内的位置兴趣点的相似度:通过训练得到的神经网络模型(如卷积申请网络模型(CNN,Convolutional Neural Networks)),获取无线局域网与相应目标区域范围内的位置兴趣点的相似度。
在实际实施时,将无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息输入训练得到的神经网络模型,输出无线局域网与相应目标区域范围内的位置兴趣点的相似度。
其中,神经网络模型是通过以下方式训练得到的:获取样本无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息,并人工标记无线局域网与位置兴趣点的相似度,以得到训练样本集;通过构建的训练样本集,对神经网络模型进行训练。
步骤404:分别根据各簇中无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取对应各簇的目标位置兴趣点。
这里,每个簇包括至少一个无线局域网,当该簇仅包括一个无线局域网时,将该无线局域网
在一些实施例中,可以通过以下方式选取对应各簇的目标兴趣点:
根据各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取与所述无线局域网相似度最大的位置兴趣点,作为所述无线局域网对应的候选位置兴趣点;分别根据各所述簇中无线局域网与相应候选位置兴趣点的相似度,选取对应各所述簇的目标位置兴趣点。
在实际实施时,对于每一个无线局域网,将相应目标范围内的位置兴趣点中,与该无线局域网的相似度最大的位置兴趣点,作为该无线局域网对应的候选位置兴趣点。
例如,某一无线局域网所覆盖的目标区域范围内有三个位置兴趣点,位置兴趣点A、位置兴趣点B、位置兴趣点C,其中,该无线局域网与位置兴趣点A的相似度为60%,该无线局域网与位置兴趣点B的相似度为50%,该无线局域网与位置兴趣点C的相似度为90%,那么,将位置兴趣点C作为该无线局域网的候选位置兴趣点。
在实际应用中,当簇中仅包括一个无线局域网时,可以直接将该簇包括的无线局域网对应的候选位置兴趣点,作为该簇对应的目标位置兴趣点;当簇中包括至少两个无线局域网时,需要从包括的至少两个无线局域网对应的候选位置兴趣点中,选取一个候选位置兴趣点作为所述簇的目标位置兴趣点。
在一些实施例中,可以通过以下方式选取对应各簇的目标兴趣点:
对于每个簇分别执行以下操作:当所述簇包含至少两个无线局域网时,根据所述簇中至少两个无线局域网与相应候选位置兴趣点的相似度大小,对所述簇中至少两个无线局域网对应的候选位置兴趣点进行排序;根据排序结果,将所述相似度最大值所对应的候选位置兴趣点,作为对应所述簇的目标位置兴趣点。
在实际实施时,当簇包含至少两个无线局域网时,通过簇中所有无线局域网对应的候选位置兴趣点进行排序,获取相似度最高的候选位置兴趣点作为目标位置兴趣点。如此,能够解决由于无线局域网与位置兴趣点距离过远,而未能将其与该位置兴趣点进行匹配,导致最终匹配得到的目标位置兴趣点不准确的问题。
例如,簇中包括三个无线局域网,分别为无线局域网A、无线局域网B、无线局域网C,其中,无线局域网A对应的候选位置兴趣点为位置兴趣点D,无线局域网B对应的候选位置兴趣点为位置兴趣点E,无线局域网C对应的候选位置兴趣点为位置兴趣点F。无线局域网A与位置兴趣点D的相似度为80%,无线局域网B与位置兴趣点E的相似度为70%,无线局域网C与位置兴趣点F的相似度为90%,根据相似度从大到小,对这三个候选位置进行排序,排序结果为位置兴趣点F、位置兴趣点D、位置兴趣点E,那么,将位置兴趣点F作为该簇的目标位置兴趣点。
在一些实施例中,可以通过以下方式选取对应各簇的目标兴趣点:
对于每个簇分别执行以下操作:当所述簇包含至少两个无线局域网时,根据所述簇中至少两个无线局域网对应的候选位置兴趣点,获取所述簇中与各候选位置兴趣点对应的无线局域网的数量;将对应的无线局域网的数量最多的候选位置兴趣点,作为所述簇的目标位置兴趣点。
在实际实施时,当所述簇包含至少两个无线局域网时,这些无线局域网中存在一些无线局域网对应的候选位置兴趣点是相同的,基于此,可以获取每个候选兴趣点对应的无线局域网的数量,以将对应的无线局域网的数量最多的候选位置兴趣点,作为所述簇的目标位置兴趣点。
例如,簇包含5个无线局域网,其中4个无线局域网对应的候选位置兴趣点都为位置兴趣点A,另外1个无线局域网对应的候选位置兴趣点为位置兴趣点B,那么将兴趣点A作为该簇的目标位置兴趣点。
步骤405:分别将各无线局域网与无线局域网所属簇对应的目标位置兴趣点进行关联。
这里,分别将各无线局域网与无线局域网所属簇对应的目标位置兴趣点进行关联,以根据搜索或连接的无线局域网,确定与搜索或连接的无线局域网相关联的目标位置兴趣点。
在实际应用中,本申请将各无线局域网与无线局域网所属簇对应的目标位置兴趣点进行关联之后,可以得到一个无线局域网与目标位置兴趣点的映射表,若用户连接了映射表中的无线局域网,基于可以直接判断用户到访的目标位置兴趣点;如果用户扫描了映射表中的无线局域网,可以通过到访模型判断用户到访的目标位置兴趣点。如此,只需要输入时间和具体的位置兴趣点,就能够得到在该时间,访问该位置兴趣点的人群,以实现对用户线下到访的挖掘。
本申请通过对所述第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇;分别将各无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各无线局域网与相应目标区域范围内的位置兴趣点的相似度;分别根据各簇中无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取对应各簇的目标位置兴趣点;分别将各无线局域网与无线局域网所属簇对应的目标位置兴趣点进行关联,以根据搜索或连接的无线局域网,确定与搜索或连接的无线局域网相关联的目标位置兴趣点;如此,通过对所述第一关键信息相同的至少两个无线局域网进行聚类,利用了无线局域网之间的关联关系,避免了因为位置兴趣点的覆盖面积大、无线局域网坐标不准确、位置兴趣点坐标不准确等原因,导致的匹配不准确的问题,进而提高了目标位置兴趣点确定的准确性。
下面继续说明本申请实施例提供的位置兴趣点的处理方法。参见图6,图6是本申请实施例提供的位置兴趣点的处理方法的流程示意图,本申请实施例提供的位置兴趣点的处理方法包括:
步骤601:服务器获取至少两个无线局域网的名称、及各无线局域网所覆盖的目标区域范围内的位置兴趣点的名称。
步骤602:将至少两个无线局域网的名称中与地理信息相关联的部分信息,作为无线局域网的第一关键信息。
步骤603:将位置兴趣点的名称所对应的拼音和英文翻译,作为位置兴趣点的关键词,以得到各无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息。
步骤604:根据各无线局域网的第一关键信息,对至少两个无线局域网进行分类,得到对应各第一关键信息的至少两个无线局域网。
步骤605:获取对应各第一关键信息的至少两个无线局域网所处的经纬度。
步骤606:根据至少两个无线局域网所处的经纬度,确定各第一关键信息的至少两个无线局域网在地理空间的密度分布。
步骤607:根据密度分布,对各第一关键信息的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇。
其中,簇中无线局域网在地理空间的密度大于密度阈值。
步骤608:分别将各无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各无线局域网与相应目标区域范围内的位置兴趣点的相似度。
步骤609:对于每个簇,当该簇包含至少两个无线局域网时,根据簇中至少两个无线局域网与相应候选位置兴趣点的相似度大小,对簇中至少两个无线局域网对应的候选位置兴趣点进行排序。
步骤610:根据排序结果,将相似度最大值所对应的候选位置兴趣点,作为对应簇的目标位置兴趣点。
步骤611:分别将各无线局域网与无线局域网所属簇对应的目标位置兴趣点进行关联,得到无线局域网与目标位置兴趣点的映射表。
在得到无线局域网与目标位置兴趣点的映射表之后,若用户连接了映射表中的无线局域网,基于可以直接判断用户到访的目标位置兴趣点;如果用户扫描了映射表中的无线局域网,可以通过到访模型判断用户到访的目标位置兴趣点。如此,只需要输入时间和具体的位置兴趣点,就能够得到在该时间,访问该位置兴趣点的人群,以实现对用户线下到访的挖掘。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。
本申请实施例提供的位置兴趣点的处理方法,主要应用于用户线下到访的挖掘。用户线下到访,是当用户定位时,结合定位时间、定位坐标、连接及扫描Wi-Fi列表的信息,得到用户到访的POI信息。因为用户定位坐标的误差较大,直接将定位坐标最近的POI作为召回POI,精确度很低。因此需要采用W i-Fi信息作为连接用户定位信息与POI信息的桥梁,所以Wi-Fi与POI的绑定关系对于用户到访的挖掘至关重要。将每个Wi-Fi与周边POI进行匹配,得到Wi-Fi与POI的映射表,那么如果用户连接了映射表中的Wi-Fi,可以直接判断用户到访的POI;如果用户扫描了映射表中的Wi-Fi,可以通过到访模型判断到访的POI。产品侧只需要规定时间和具体的POI,就可以得到线下精准到访过该POI的人群。
图7是本申请实施例提供的位置兴趣点的处理方法的流程示意图,参见图7,本申请实施例提供的位置兴趣点的处理方法包括:
步骤701:清洗Wi-Fi和POI的名称,得到POI名称的拼音及英文翻译。
这里,因为Wi-Fi的命名规则各异,所以噪音极大,需要做清洗,比如PK U-teacher、PKU-student,PKU-staff等等,我们只取与地理信息相关联的部分,即PKU。对POI,如北京大学,会得到拼音“bei jing da xue”和英文“pekin g university”。
步骤702:通过DBSCAN算法,对同一个城市中,名称相同的Wi-Fi进行聚类,得到多个簇。
步骤703:对于每个Wi-Fi,提取距离该Wi-Fi 250米范围以内的所有POI,并计算Wi-Fi名称与相应POI名称的相似度。
例如,在对北京大学周边的Wi-Fi及POI进行匹配的时候,我们会提取每个Wi-Fi周边250米的所有POI。图8是本申请实施例提供的WiFi与POI匹配的示意图,参见图8,图8中有两个名称为“PKU-teacher”和“PKU-student”的Wi-Fi,虚线圈为250米范围,也即,对于名称为“PKU-teacher”和“PKU-student”的Wi-Fi,分别获取位于这两个Wi-Fi所对应的虚线圈内所有的POI。
这里,对Wi-Fi与周边250米范围内所有POI计算相似度,可以使用基于最大匹配字符串的方法,也可以使用深度学习的方法等等。
步骤704:将相似度最大的POI作为对应Wi-Fi的候选POI。
在实际实施时,对于每一个Wi-Fi,根据相似度大小,对距离该Wi-Fi 250米范围以内的所有POI进行排序,将相似度最大的POI作为对应该Wi-Fi的候选POI。
步骤705:对于每个簇,获取该簇中所有Wi-Fi对应的候选POI,并根据W i-Fi名称与相应候选POI名称的相似度,将相似度最大值所对应的候选POI,作为整个簇的目标POI。
这里,对同一簇中WiFi对应的候选POI进行排序,将相似度最大值所对应的候选POI作为该簇的目标POI。例如,某个簇包括“PKU-teacher”与“P KU-student”两个Wi-Fi,“PKU-teacher”对应候选POI为“北京大学”,相似度为0.99,而“PKU-student”对应候选POI为“北大复印店”,相似度为0.65,那么,将“北京大学”作为该簇的目标POI。如此,避免了由于“PKU-student”的Wi-Fi与“北京大学”这个POI的距离过远,导致无法匹配到“北京大学”这个POI的问题,提升了匹配的准确率。
步骤706:将目标POI与目标POI所对应的簇中所有的Wi-Fi进行关联。
这里,将目标POI与该簇中所有的Wi-Fi进行关联,得到无线局域网与目标位置兴趣点的映射表。
这里,对DBSCAN算法进行说明。
DBSCAN是一种基于密度的聚类方法,这里,使用参数(∈,minPts)来描述某一无线局域网的邻域中无线局域网的密度,其中∈为邻域的半径阈值,minPts为距离为∈的邻域中无线局域网的个数阈值。假设第一关键信息相同的至少两个无线局域网组成的样本集合为D=(x1,…xn),DBSCAN有如下定义:
(1)∈领域,对于某一无线局域网xj∈D,∈领域表示以xj为中心,半径不大于∈的区域;
(2)核心点,对于某一无线局域网xj∈D,如果其∈领域中无线局域网的个数至少为minPts,则xj为核心点;
(3)密度直达,如果xi位于xj的∈邻域,且xj是核心点,则称xi由xj密度直达;
(4)密度可达,如果存在一条路径p1,…pT,满足p1=xi和pT=xj,且pt+1由pt密度直达,则称xi由xj密度可达。
图9是本申请实施例提供的基于DBSCAN算法的聚类方法的流程示意图,参见图9,本申请实施例提供的基于DBSCAN算法的聚类方法包括:
步骤901:获取第一关键信息相同的至少两个无线局域网组成的样本集合D=(x1,…xn),参数(∈,minPts)。
步骤902:初始化聚类簇数i=0,初始化未访问样本集合Τ=D,簇集合
Figure BDA0002619577950000231
步骤903:判断T是否为空集,若是,执行步骤914;否则,执行步骤904。
步骤904:从T中取未访问点p,生成∈邻域N=N∈(p),将点p从T中删除,即T=T-{p}。
步骤905:判断p是否为核心点,若是,执行步骤906;否则,执行步骤903。
步骤906:将p加入新的簇Ci=Ci∪N。
步骤907:判断N中是否为空集,若是,执行步骤913;否则,执行步骤908。
步骤908:从N中取点p',判断p'是否属于T,若是,执行步骤909;否则,执行步骤910。
步骤909:将p′加入簇Ci,即Ci=Ci∪{p′},并将p′从N中删除,即N=N-{p′},返回步骤907。
步骤910:生成N′=N(p′),并判断p′是否为核心点,若是,执行步骤911;否则,执行步骤912。
步骤911:将N′加入簇Ci,即Ci=Ci∪N′,并将p′从N中删除,即N=N-{p′}。
步骤912:将p′加入簇Ci,即Ci=Ci∪{p′},并将p′从N中删除,即N=N-{p′}。
步骤913:生成新的簇C=C∪{Ci},并使i=i+1,返回步骤903。
步骤914:输出C={C1,…,Ck}。
本申请实施例具有以下有益效果:
能够解决相关技术中因为距离阈值导致无法匹配到正确的目标POI的问题,提高了目标POI确定的准确性。
下面继续说明本申请实施例提供的位置兴趣点的处理装置255的实施为软件模块的示例性结构,图10是本申请实施例提供的位置兴趣点的处理装置的组成结构示意图,如图10所示,本申请实施例提供的位置兴趣点的处理装置包括:
获取模块2551,用于获取至少两个无线局域网的第一关键信息,及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息;
聚类模块2552,用于对所述第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇,所述簇包含至少一个无线局域网;
匹配模块2553,用于分别将各所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度;
选取模块2554,用于分别根据各所述簇中无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取对应各所述簇的目标位置兴趣点;
关联模块2555,用于分别将各无线局域网与所述无线局域网所属簇对应的目标位置兴趣点进行关联,以
根据搜索或连接的无线局域网,确定与所述搜索或连接的无线局域网相关联的目标位置兴趣点。
在一些实施例中,所述获取模块2551,还用于获取至少两个无线局域网的名称、及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的名称;
将至少两个所述无线局域网的名称中与地理信息相关联的部分信息,作为所述无线局域网的第一关键信息;
将所述位置兴趣点的名称所对应的拼音和/或英文翻译,作为所述位置兴趣点的关键词,以得到各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息。
在一些实施例中,所述聚类模块2552,还用于根据各所述无线局域网的第一关键信息,对至少两个无线局域网进行分类,得到对应各第一关键信息的至少两个无线局域网;
分别对各第一关键信息对应的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇。
在一些实施例中,所述聚类模块2552,还用于获取所述第一关键信息相同的至少两个无线局域网所处的经纬度;
根据所述第一关键信息相同的至少两个无线局域网所处的经纬度,确定所述第一关键信息相同的至少两个无线局域网在地理空间的密度分布;
根据所述密度分布,对所述第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇,所述簇中无线局域网在地理空间的密度大于密度阈值。
在一些实施例中,所述匹配模块2553,还用于对于每个无线局域网执行以下操作:
获取所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息的最长公共字符串;
获取所述最长公共字符串的字符数与所述无线局域网的第一关键信息的字符数的比值,作为所述无线局域网与相应目标区域范围内的位置兴趣点的相似度。
在一些实施例中,所述匹配模块2553,还用于对于每个无线局域网执行以下操作:
获取对所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息的取交集,并获取所述交集的字符数;
对获取所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息的取并集,并获取所述并集的字符数;
将所述交集的字符数与所述并集的字符数的比值,作为所述无线局域网与相应目标区域范围内的位置兴趣点的相似度。
在一些实施例中,所述选取模块2554,还用于根据各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取与所述无线局域网相似度最大的位置兴趣点,作为所述无线局域网对应的候选位置兴趣点;
分别根据各所述簇中无线局域网与相应候选位置兴趣点的相似度,选取对应各所述簇的目标位置兴趣点。
在一些实施例中,所述选取模块2554,还用于对于每个簇分别执行以下操作:
当所述簇包含至少两个无线局域网时,根据所述簇中至少两个无线局域网与相应候选位置兴趣点的相似度大小,对所述簇中至少两个无线局域网对应的候选位置兴趣点进行排序;
根据排序结果,将所述相似度最大值所对应的候选位置兴趣点,作为对应所述簇的目标位置兴趣点。
在一些实施例中,所述选取模块2554,还用于对于每个簇分别执行以下操作:
当所述簇包含至少两个无线局域网时,根据所述簇中至少两个无线局域网对应的候选位置兴趣点,获取所述簇中与各候选位置兴趣点对应的无线局域网的数量;
将对应的无线局域网的数量最多的候选位置兴趣点,作为所述簇的目标位置兴趣点。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例上述的位置兴趣点的处理方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的方法,例如,如图4示出的方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(H TML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。

Claims (10)

1.一种位置兴趣点的处理方法,其特征在于,所处方法包括:
获取至少两个无线局域网的第一关键信息,及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息;
对所述第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇,所述簇包含至少一个无线局域网;
分别将各所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度;
分别根据各所述簇中无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取对应各所述簇的目标位置兴趣点;
分别将各无线局域网与所述无线局域网所属簇对应的目标位置兴趣点进行关联,以
根据搜索或连接的无线局域网,确定与所述搜索或连接的无线局域网相关联的目标位置兴趣点。
2.如权利要求1所述的方法,其特征在于,所述获取至少两个无线局域网的关键信息,及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的关键信息,包括:
获取至少两个无线局域网的名称、及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的名称;
将至少两个所述无线局域网的名称中与地理信息相关联的部分信息,作为所述无线局域网的第一关键信息;
将所述位置兴趣点的名称所对应的拼音和/或英文翻译,作为所述位置兴趣点的关键词,以得到各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息。
3.如权利要求1所述的方法,其特征在于,所述对所述关键信息相同的至少两个无线局域网进行聚类,得到对应各关键信息的至少两个簇,包括:
根据各所述无线局域网的关键信息,对至少两个无线局域网进行分类,得到对应各关键信息的至少两个无线局域网;
分别对各第一关键信息对应的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇。
4.如权利要求1所述的方法,其特征在于,所述对所述关键信息相同的至少两个无线局域网进行聚类,包括:
获取所述第一关键信息相同的至少两个无线局域网所处的经纬度;
根据所述第一关键信息相同的至少两个无线局域网所处的经纬度,确定所述第一关键信息相同的至少两个无线局域网在地理空间的密度分布;
根据所述密度分布,对所述第一关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇,所述簇中无线局域网在地理空间的密度大于密度阈值。
5.如权利要求1所述的方法,其特征在于,所述分别将各所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度,包括:
对于每个无线局域网执行以下操作:
获取所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息的最长公共字符串;
获取所述最长公共字符串的字符数与所述无线局域网的关键信息的字符数的比值,作为所述无线局域网与相应目标区域范围内的位置兴趣点的相似度。
6.如权利要求1所述的方法,其特征在于,所述分别将各所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第一关键信息进行匹配,得到各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度,包括:
对于每个无线局域网执行以下操作:
对所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息取交集,并获取所述交集的字符数;
对所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息取并集,并获取所述并集的字符数;
将所述交集的字符数与所述并集的字符数的比值,作为所述无线局域网与相应目标区域范围内的位置兴趣点的相似度。
7.如权利要求1所述的方法,其特征在于,所述分别根据各所述簇中无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取对应各所述簇的目标位置兴趣点,包括:
根据各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取与所述无线局域网相似度最大的位置兴趣点,作为所述无线局域网对应的候选位置兴趣点;
从各所述簇中无线局域网对应的候选位置兴趣点中,选取对应各所述簇的目标位置兴趣点。
8.如权利要求7所述的方法,其特征在于,所述从各所述簇中无线局域网对应的候选位置兴趣点中,选取对应各所述簇的目标位置兴趣点,包括:
对于每个簇分别执行以下操作:
当所述簇包含至少两个无线局域网时,根据所述簇中至少两个无线局域网与相应候选位置兴趣点的相似度大小,对所述簇中至少两个无线局域网对应的候选位置兴趣点进行排序;
根据排序结果,将所述相似度最大值所对应的候选位置兴趣点,作为对应所述簇的目标位置兴趣点。
9.如权利要求7所述的方法,其特征在于,所述从各所述簇中无线局域网对应的候选位置兴趣点中,选取对应各所述簇的目标位置兴趣点,包括:
对于每个簇分别执行以下操作:
当所述簇包含至少两个无线局域网时,根据所述簇中至少两个无线局域网对应的候选位置兴趣点,获取所述簇中与各候选位置兴趣点对应的无线局域网的数量;
将对应的无线局域网的数量最多的候选位置兴趣点,作为所述簇的目标位置兴趣点。
10.一种位置兴趣点的处理装置,其特征在于,所处装置包括:
获取模块,用于获取至少两个无线局域网的第一关键信息,及各所述无线局域网所覆盖的目标区域范围内的位置兴趣点的第二关键信息;
聚类模块,用于对所述关键信息相同的至少两个无线局域网进行聚类,得到对应各第一关键信息的至少两个簇,所述簇包含至少一个无线局域网;
匹配模块,用于分别将各所述无线局域网的第一关键信息与相应目标区域范围内的位置兴趣点的第二关键信息进行匹配,得到各所述无线局域网与相应目标区域范围内的位置兴趣点的相似度;
选取模块,用于分别根据各所述簇中无线局域网与相应目标区域范围内的位置兴趣点的相似度,选取对应各所述簇的目标位置兴趣点;
关联模块,用于分别将各无线局域网与所述无线局域网所属簇对应的目标位置兴趣点进行关联,以
根据搜索或连接的无线局域网,确定与所述搜索或连接的无线局域网相关联的目标位置兴趣点。
CN202010779193.0A 2020-08-05 2020-08-05 位置兴趣点的处理方法及装置 Active CN111881377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010779193.0A CN111881377B (zh) 2020-08-05 2020-08-05 位置兴趣点的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010779193.0A CN111881377B (zh) 2020-08-05 2020-08-05 位置兴趣点的处理方法及装置

Publications (2)

Publication Number Publication Date
CN111881377A true CN111881377A (zh) 2020-11-03
CN111881377B CN111881377B (zh) 2024-01-26

Family

ID=73210809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010779193.0A Active CN111881377B (zh) 2020-08-05 2020-08-05 位置兴趣点的处理方法及装置

Country Status (1)

Country Link
CN (1) CN111881377B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112328915A (zh) * 2020-11-25 2021-02-05 山东师范大学 基于空间实体匹配性能评估的多源兴趣点融合方法及系统
CN112487312A (zh) * 2020-11-30 2021-03-12 北京百度网讯科技有限公司 关联兴趣点的方法、装置及确定兴趣点状态的方法、装置
CN113420781A (zh) * 2021-05-25 2021-09-21 北京百度网讯科技有限公司 品牌识别方法、装置、设备、存储介质和程序产品
CN113420104A (zh) * 2021-06-29 2021-09-21 北京百度网讯科技有限公司 兴趣点采全率确定方法、装置、电子设备及存储介质
CN113723405A (zh) * 2021-08-31 2021-11-30 北京百度网讯科技有限公司 区域轮廓的确定方法、装置和电子设备
CN115525841A (zh) * 2022-10-14 2022-12-27 高德软件有限公司 兴趣点信息的获取方法、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130103697A1 (en) * 2011-10-12 2013-04-25 Mapquest, Inc. Systems and Methods for Ranking Points of Interest
CN104080043A (zh) * 2013-03-29 2014-10-01 百度在线网络技术(北京)有限公司 兴趣点的位置信息的校正方法及设备
US20180041867A1 (en) * 2016-08-05 2018-02-08 Baidu Online Network Technology (Beijing) Co., Ltd Method and apparatus for matching wireless hotspot with poi
CN108271120A (zh) * 2017-12-22 2018-07-10 阿里巴巴集团控股有限公司 目标区域及目标用户的确定方法、装置及设备
CN109389119A (zh) * 2018-10-23 2019-02-26 百度在线网络技术(北京)有限公司 兴趣点区域确定方法、装置、设备和介质
CN109672980A (zh) * 2018-12-25 2019-04-23 腾讯科技(深圳)有限公司 确定兴趣点对应的无线局域网热点的方法、装置及存储介质
US20190242720A1 (en) * 2018-02-07 2019-08-08 Topos Inc. Systems and methods for constructing spatial activity zones
CN111309834A (zh) * 2020-01-20 2020-06-19 腾讯云计算(北京)有限责任公司 一种无线热点与兴趣点的匹配方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130103697A1 (en) * 2011-10-12 2013-04-25 Mapquest, Inc. Systems and Methods for Ranking Points of Interest
CN104080043A (zh) * 2013-03-29 2014-10-01 百度在线网络技术(北京)有限公司 兴趣点的位置信息的校正方法及设备
US20180041867A1 (en) * 2016-08-05 2018-02-08 Baidu Online Network Technology (Beijing) Co., Ltd Method and apparatus for matching wireless hotspot with poi
CN108271120A (zh) * 2017-12-22 2018-07-10 阿里巴巴集团控股有限公司 目标区域及目标用户的确定方法、装置及设备
US20190242720A1 (en) * 2018-02-07 2019-08-08 Topos Inc. Systems and methods for constructing spatial activity zones
CN109389119A (zh) * 2018-10-23 2019-02-26 百度在线网络技术(北京)有限公司 兴趣点区域确定方法、装置、设备和介质
CN109672980A (zh) * 2018-12-25 2019-04-23 腾讯科技(深圳)有限公司 确定兴趣点对应的无线局域网热点的方法、装置及存储介质
CN111309834A (zh) * 2020-01-20 2020-06-19 腾讯云计算(北京)有限责任公司 一种无线热点与兴趣点的匹配方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JING XU; YANCHAO ZHAO; JIE WU; HONGYAN QIAN;: "Enhancing Smartphone-Based Multi-modal Indoor Localization with Camera and WiFi Signal", 2018 IEEE 15TH INTERNATIONAL CONFERENCE ON MOBILE AD HOC AND SENSOR SYSTEMS (MASS), pages 147 - 148 *
朱敏;王翔坤;姚林;罗富智;庞潇;: "面向城市空间热点分析的可视化方法综述", 计算机辅助设计与图形学学报, pages 551 - 567 *
王;艾浩军;涂卫平;: "Wi-Fi指纹聚类在室内感兴趣区域定位中的应用", 计算机应用, no. 02, pages 488 - 491 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112328915A (zh) * 2020-11-25 2021-02-05 山东师范大学 基于空间实体匹配性能评估的多源兴趣点融合方法及系统
CN112487312A (zh) * 2020-11-30 2021-03-12 北京百度网讯科技有限公司 关联兴趣点的方法、装置及确定兴趣点状态的方法、装置
CN113420781A (zh) * 2021-05-25 2021-09-21 北京百度网讯科技有限公司 品牌识别方法、装置、设备、存储介质和程序产品
CN113420781B (zh) * 2021-05-25 2023-08-08 北京百度网讯科技有限公司 品牌识别方法、装置、设备、存储介质和程序产品
CN113420104A (zh) * 2021-06-29 2021-09-21 北京百度网讯科技有限公司 兴趣点采全率确定方法、装置、电子设备及存储介质
CN113420104B (zh) * 2021-06-29 2023-10-13 北京百度网讯科技有限公司 兴趣点采全率确定方法、装置、电子设备及存储介质
CN113723405A (zh) * 2021-08-31 2021-11-30 北京百度网讯科技有限公司 区域轮廓的确定方法、装置和电子设备
CN115525841A (zh) * 2022-10-14 2022-12-27 高德软件有限公司 兴趣点信息的获取方法、电子设备及存储介质
CN115525841B (zh) * 2022-10-14 2024-02-02 高德软件有限公司 兴趣点信息的获取方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN111881377B (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
CN111881377B (zh) 位置兴趣点的处理方法及装置
Fisher et al. Modelling the errors in areal interpolation between zonal systems by Monte Carlo simulation
CN110609902B (zh) 一种基于融合知识图谱的文本处理方法及装置
Zhao et al. A trajectory clustering approach based on decision graph and data field for detecting hotspots
JP6575335B2 (ja) ソーシャルメディアメッセージ及び施設の間のリンクを推定する方法、コンピュータシステム、及びプログラム
Tong et al. A linear road object matching method for conflation based on optimization and logistic regression
Li et al. An optimisation model for linear feature matching in geographical data conflation
KR20170030379A (ko) 사용자 선호에 맞춘 여행 큐레이션 서비스 방법 및 시스템
Hoch et al. Geolinguistics: The incorporation of geographic information systems and science
CN108182253B (zh) 用于生成信息的方法和装置
CN106416313A (zh) 识别与无线网络接入点相关联的实体
US11663282B2 (en) Taxonomy-based system for discovering and annotating geofences from geo-referenced data
CN112861972B (zh) 一种展业区域的选址方法、装置、计算机设备和介质
US9501563B2 (en) Server, information-management method, information-management program, and computer-readable recording medium with said program recorded thereon
Zandbergen Influence of street reference data on geocoding quality
CN112711713B (zh) 兴趣点推荐和展示方法、装置、计算机设备和存储介质
US20120143598A1 (en) Server, dictionary creation method, dictionary creation program, and computer-readable recording medium recording the program
JP2023530795A (ja) 地理的位置区域の符号化方法、符号化モデルを確立する方法、及び装置
Pereira et al. crowdsensing in the web: Analyzing the citizen experience in the urban space
Reuschke et al. Locating creativity in the city using Twitter data
Nowak et al. Geotagging of natural history collections for reuse in environmental research
CN111143534A (zh) 基于人工智能的品牌名的提取方法、装置及存储介质
KR20210065773A (ko) 빅데이터 기반의 감성정보 분석평가 시스템 및 그 구동방법
Mackaness et al. Assessing the Veracity of Methods for Extracting Place Semantics from F lickr Tags
CN109917456B (zh) 地震信息快速提取方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant