CN111782980B - 地图兴趣点的挖掘方法、装置、设备及存储介质 - Google Patents
地图兴趣点的挖掘方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111782980B CN111782980B CN202010616396.8A CN202010616396A CN111782980B CN 111782980 B CN111782980 B CN 111782980B CN 202010616396 A CN202010616396 A CN 202010616396A CN 111782980 B CN111782980 B CN 111782980B
- Authority
- CN
- China
- Prior art keywords
- name
- map
- scanning
- interest point
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000005065 mining Methods 0.000 title claims abstract description 42
- 239000013598 vector Substances 0.000 claims description 84
- 238000012545 processing Methods 0.000 claims description 35
- 238000003058 natural language processing Methods 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 26
- 238000012549 training Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000000060 site-specific infrared dichroism spectroscopy Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Remote Sensing (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Fuzzy Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Navigation (AREA)
Abstract
本申请公开了一种地图兴趣点的挖掘方法,涉及大数据领域、自然语言处理领域,该方法包括:采集多个用户设备的至少一条Wi‑Fi扫描信息和定位信息;根据多个用户设备的至少一条Wi‑Fi扫描信息和定位信息,得到至少一个Wi‑Fi的关联信息,关联信息包括名称和地理位置;如果Wi‑Fi的名称为兴趣点名称,则根据Wi‑Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点,从而有效地提高了地图兴趣点的挖掘效率。本申请还公开了一种地图兴趣点的挖掘装置、设备及存储介质。
Description
技术领域
本申请实施例涉及计算机技术领域中的大数据领域和自然语言处理领域,尤其涉及一种地图兴趣点的挖掘方法、装置、设备及存储介质。
背景技术
地图兴趣点(Point Of Interest,POI)是指电子地图中通过图标来表示能够引起用户关注的场所,如:商场、饭店、学校、医院。通过对地图兴趣点进行挖掘,可以将现实中新增的场所添加为新的地图兴趣点。
目前,地图兴趣点的挖掘方式主要为人工实地采集方式,该方式需要投入大量的人力资源进行实地采集,成本较高,且对于一些偏远的地方,由于采集方式和周期的局限性,不一定可以及时覆盖到。
可见,地图兴趣点的挖掘方式的效率不高,较可能发生部分地图兴趣点缺失的情况,导致用户在检索这类地图兴趣点时,电子地图无法为用户返回相关结果。
发明内容
本申请提供了一种效率更高的地图兴趣点的挖掘方法、装置、设备以及存储介质。
第一方面,本申请提供了一种地图兴趣点的挖掘方法,包括:
采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息;
根据所述多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,所述关联信息包括名称和地理位置;
如果所述Wi-Fi的名称为兴趣点名称,则根据所述Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点。
第二方面,本申请提供了一种地图兴趣点的挖掘装置,包括:
采集模块,用于采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息;
处理模块,用于根据所述多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,所述关联信息包括名称和地理位置;
添加模块,用于如果所述Wi-Fi的名称为兴趣点名称,则根据所述Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点。
第三方面,本申请提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述第一方面所述的方法。
第四方面,本申请提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上述第一方面所述的方法。
第五方面,本申请提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
本申请提供的地图兴趣点的挖掘方法、装置、设备及存储介质,采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息,根据多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,在至少一个Wi-Fi中,如果Wi-Fi的名称为兴趣点名称,则根据Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点。因此,实现了地图兴趣点的自动挖掘和添加,并有效地提高了地图兴趣点的挖掘效率和便捷性。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例适用的一种网络架构的示意图;
图2为本申请的一实施例提供的地图兴趣点的挖掘方法的流程示意图;
图3为本申请的另一实施例提供的地图兴趣点的挖掘方法的流程示意图;
图4为本申请的另一实施例提供的地图兴趣点的挖掘方法的流程示意图;
图5为本申请的一实施例提供的通过语言识别模型识别Wi-Fi的名称是否为兴趣点名称的流程示意图;
图6为本申请的另一实施例提供的地图兴趣点的挖掘方法的流程示意图;
图7为本申请的一实施例提供的地图兴趣点的挖掘装置的结构示意图;
图8为本申请一实施例提供的一种电子设备的结构示意图;
图9是根据本实施例提供的地图兴趣点的挖掘装置900的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
现实世界中用户关注的场所(例如:商场、饭店、学校、医院、住宅、停车场)增加时,需要进行地图兴趣点的挖掘,以将新增的场所添加为电子地图上新的地图兴趣点。
一般的,地图兴趣点的挖掘方式包括三种方式:方式一:用户发现某处新增的场所时,向电子地图应用程序反馈;方式二:由电子地图所属的公司安排人员进行实地采集,以通过人工采集方式发现各个地方增加的、且电子地图上没有显示的场所;方式三:通过采集各个地区不同时期的图像,通过将不同时期的图像进行对比,发现该地区新增的场所。
然而,方式一依赖于用户上报,比较被动;方式二需要投入大量的人力资源进行实地采集,成本较高,且效率不高,对于一些偏远地区,由于采集方式和采集周期的局限性,不一定可以及时覆盖到;方式三只能对拥有不同时期图像的地区进行处理,覆盖范围有限。
本申请实施例提供一种地图兴趣点的挖掘方法、装置、设备及存储介质,应用于计算机技术领域中的大数据领域和自然语言处理领域,采集多个用户设备的至少一条无线保真(Wireless Fidelity,简称Wi-Fi)扫描信息和定位信息,根据多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,如果Wi-Fi的名称为兴趣点名称,则根据Wi-Fi的关联信息中Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点,实现了地图兴趣点的自动挖掘和新增,并提高了地图兴趣点挖掘的覆盖范围、效率和便捷性。
图1为本申请实施例适用的一种网络架构的示意图。如图1所示,该网络架构包括多个用户终端101和至少一个服务器102,各用户终端101与服务器102分别建立有通信连接。用户终端101上设有Wi-Fi扫描模块和定位模块,Wi-Fi扫描模块用于扫描并连接Wi-Fi信号,定位模块用于获取用户终端101的定位信息。例如,定位模块可以为GPS模块,也可以为通信模块,当定位模块为GPS模块时,可通过GPS模块获得用户终端101的地理位置,当定位模块为通信模块时,可通过通信模块与通信基站之间的通信时差和通信基站的地理位置,获得用户终端101的地理位置。
其中,用户终端101可为个人数字处理(personal digital assistant,简称PDA)设备、智能电视、具有无线通信功能的手持设备(例如智能手机、平板电脑)、计算设备(例如个人电脑(personal computer,简称PC))、车载设备以及可穿戴设备(例如智能手表、智能手环)等。服务器102可以为集中式服务器,也可以为分布式服务器,还可以为云端服务器。
下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图2为本申请的一实施例提供的地图兴趣点的挖掘方法的流程示意图。如图2所示,该方法包括:
S201、采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息。
具体的,每个用户设备的Wi-Fi扫描信息中至少包括该用户设备扫描到的Wi-Fi的名称。用户设备的定位信息可为用户设备的地理位置,也可为用户设备和通信基站之间的通信时差(或者相对位置)、以及该通信基站的地理位置。在用户设备的用户设备和通信基站之间的通信时差(或者相对位置)、以及该通信基站的地理位置时,可根据用户设备和通信基站之间的通信时差(或者相对位置)和该通信基站的地理位置,得到用户设备的地理位置。
具体的,可接收多个用户设备分别发送的至少一条Wi-Fi扫描信息和定位信息。也可获取预先采集的多个用户设备的至少一条Wi-Fi扫描信息和定位信息。
作为示例的,Wi-Fi的名称为Wi-Fi的服务集标识(Service Set Identifier,简称SSID)。
在一个可行的实施方式中,可在检测到用户设备打开电子地图和定位模块的情况下,接收用户设备发送的Wi-Fi扫描信息和定位信息,从而实现用户设备的Wi-Fi扫描信息和定位信息的自动采集,提高Wi-Fi扫描信息和定位信息获取的便捷性和准确性。
作为示例的,在用户设备上,在电子地图被应用程序(例如,打车应用程序、导航应用程序)调用的情况下,用户设备可获取自身扫描到的Wi-Fi的名称和设备标识作为Wi-Fi扫描信息、以及自身的定位信息,并发送至电子地图所在的服务器。
S202、根据多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,关联信息包括名称和地理位置。
具体的,在获取至少一个Wi-Fi的关联信息的过程中,可在多个用户设备的至少一条Wi-Fi扫描信息中,获得至少一个Wi-Fi的名称。针对每一个Wi-Fi,通过用户设备的定位信息,可得到用户设备扫描到该Wi-Fi时用户设备的地理位置,因此根据用户设备通常只能扫描到距离自身较近的Wi-Fi的特点,可将该地理位置确定为该Wi-Fi的地理位置,也可将该地理位置加上预设的距离误差值,得到该Wi-Fi的地理位置。其中,距离误差值可有专业人员根据自身经验和研究进行设置,在此不进行限制。
S203、如果Wi-Fi的名称为兴趣点名称,则根据Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点。
具体的,在得到至少一个Wi-Fi的名称和地理位置之后,可针对每一个Wi-Fi,识别该Wi-Fi的名称是否为兴趣点名称,如果是,则表示该Wi-Fi对应一个地图兴趣点,可根据该Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点,否则,则表示该Wi-Fi不对应地理兴趣点,无需再电子地图上添加相应的地图兴趣点,因此提高了地图兴趣点的准确性。
例如,用户设备可能扫描到自身周围的个人热点,并将个人热点的扫描信息作为Wi-Fi扫描信息发送至服务器,而个人热点的名称通常不可能为兴趣点名称,个人热点也不可能对应地图兴趣点,因此通过对Wi-Fi扫描信息中Wi-Fi的名称进行识别,可筛选掉该个人热点。
具体的,在Wi-Fi的名称为兴趣点名称时,可将Wi-Fi的名称确定为地图兴趣点的名称,将Wi-Fi的地理位置确定为地图兴趣点的地理位置,按照地图兴趣点的名称和地理位置,在电子地图上添加该地图兴趣点。
在一个可行的实施方式中,在识别Wi-Fi的名称是否为兴趣点名称的过程中,可采用预先训练好的语言识别模型,识别Wi-Fi名称是否为兴趣点名称,从而提高兴趣点名称识别准确度。其中,语言识别模型可为神经网络模型,采用有监督方式进行训练。
在一个可行的实施方式中,在识别Wi-Fi的名称是否为兴趣点名称的过程中,可在Wi-Fi的名称中识别出现预设的关键字,若出现,则确定Wi-Fi的名称为兴趣点名称,否则确定Wi-Fi的名称不为兴趣点名称,从而提高兴趣点名称识别效率和准确度。例如,可预先设置“百货”、“广场”、“医院”、“超市”、“停车场”、“加油站”等关键字。
本申请实施例中,在采集得到的多个用户设备的至少一条Wi-Fi扫描信息和定位信息中,得到至少一个Wi-Fi的名称和地理位置,在Wi-Fi的名称为兴趣点名称时,根据Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点,从而不仅实现地图兴趣点的自动挖掘和新增,而且由于数据采集便捷、用户设备活动范围广泛,有效地提高了地图兴趣点挖掘和新增的便捷性、效率和覆盖范围。
图3为本申请的另一实施例提供的地图兴趣点的挖掘方法的流程示意图。如图3所示,该方法包括:
S301、采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息,用户设备的Wi-Fi扫描信息包括用户设备扫描到的Wi-Fi的名称和设备标识,用户设备的定位信息包括用户设备的地理位置。
具体的,每个用户设备的Wi-Fi扫描信息包括用户设备扫描到的Wi-Fi的名称和设备标识,每个Wi-Fi的设备标识唯一。用户设备的定位信息可为用户设备的地理位置,也可为用户设备和通信基站之间的通信时差(或者相对位置)、以及该通信基站的地理位置。在用户设备的用户设备和通信基站之间的通信时差(或者相对位置)、以及该通信基站的地理位置时,可根据用户设备和通信基站之间的通信时差(或者相对位置)和该通信基站的地理位置,得到用户设备的地理位置。
作为示例的,Wi-Fi的设备标识为Wi-Fi的媒体访问控制(media access control,简称mac)地址。
具体的,可连续一个或多个单位时间内采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息,其中,一个单位时间可为一个小时、一天、一周、一个月等等,例如,在连续的一个小时、一天、一周或者一个月内采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息。
S302、按照Wi-Fi的设备标识,对Wi-Fi扫描信息进行聚类,得到多个类,每个类分别对应一个Wi-Fi。
具体的,由于用户设备的活动范围的不特定性,不同用户设备的Wi-Fi扫描信息中可能相同,不同时刻采集到的同一用户设备的Wi-Fi扫描信息中也可能相同。例如,用户设备A和用户设备B都曾出现在同一商场C,则采集得到的用户设备A的Wi-Fi扫描信息中和用户设备B的Wi-Fi扫描信息中都包括商场C的Wi-Fi的名称和设备标识。又如,用户设备B在一天的上午和下午出现商场C,则在该天的上午和下午分别采集到的用户设备B的Wi-Fi扫描信息中都包括商场C的Wi-Fi的名称和设备标识。
具体的,考虑到Wi-Fi扫描信息的内容重复性,可按照Wi-Fi的设备标识,对采集到的所有Wi-Fi扫描信息进行聚类,聚类后的每个类对应一个Wi-Fi,不同类对应不同的Wi-Fi。同一Wi-Fi的名称可能发生变化,因此,每个类中各Wi-Fi扫描信息内的Wi-Fi的设备标识相同、Wi-Fi的名称可能相同也可能不同。
S303、根据每个类中各Wi-Fi扫描信息中Wi-Fi的名称,确定每个类所对应的Wi-Fi的名称。
具体的,针对每个类,可获取所有Wi-Fi扫描信息中出现次数最多的Wi-Fi的名称,将该出现次数最多的Wi-Fi的名称确定为该类所对应的Wi-Fi的名称,以提高Wi-Fi的名称的准确性。
在一个可行的实施方式中,针对每个类,在该类中的所有Wi-Fi扫描信息中,获取采集时间最晚的Wi-Fi扫描信息中的Wi-Fi的名称,将该Wi-Fi的名称确定为该类所对应的Wi-Fi的名称,以提高Wi-Fi的名称的准确性。
S304、根据每个类中各Wi-Fi扫描信息所属用户设备的地理位置,确定Wi-Fi的地理位置。
具体的,针对每个类,可在与各Wi-Fi扫描信息同时采集得到的定位信息中,获得各Wi-Fi扫描信息所属用户设备的地理位置,可将该地理位置确定为该类所对应的Wi-Fi的地理位置,也可将该地理位置加上预设的距离误差值,得到该类所对应的Wi-Fi的地理位置。
在一个可行的实施方式中,针对每个类,可在与各Wi-Fi扫描信息同时采集得到的定位信息中,获得各Wi-Fi扫描信息所属用户设备的地理位置,计算所有Wi-Fi扫描信息所属用户设备的地理位置的平均值,根据该平均值,确定该类所对应的Wi-Fi的地理位置。因此,针对每个类,通过计算各用户设备在采集到该类中Wi-Fi扫描信息的地理位置的平均值,确定该类所对应的Wi-Fi的地理位置,提高了Wi-Fi的地理位置的准确性。
其中,地理位置可通过地理坐标(通常为经纬度坐标)表示,计算地理位置的平均值时,即计算地理坐标各维度的平均值,因此,可将各维度的平均值组合得到的地理位置确定为Wi-Fi的地理位置。
S305、如果Wi-Fi的名称为兴趣点名称,则根据Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点。
具体的,针对每个类所对应的Wi-Fi,可识别该Wi-Fi的名称是否为兴趣点名称,如果是,则表示该Wi-Fi对应一个地图兴趣点,可根据该Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点,否则,则表示该Wi-Fi不对应地理兴趣点,无需再电子地图上添加相应的地图兴趣点,因此提高了地图兴趣点的准确性。
具体的,在Wi-Fi的名称为兴趣点名称时,可将Wi-Fi的名称确定为地图兴趣点的名称,将Wi-Fi的地理位置确定为地图兴趣点的地理位置,按照地图兴趣点的名称和地理位置,在电子地图上添加该地图兴趣点。
具体的,在名称都为兴趣点名称的不同Wi-Fi的地理位置相同时,可在电子地图上的同一地理位置上分别添加这些Wi-Fi对应的地图兴趣点。例如,Wi-Fi A的名称为A酒店和Wi-Fi B的名称为B停车场,Wi-Fi A的地理位置和Wi-Fi B的地理位置相同。在Wi-Fi A的名称和Wi-Fi B的名称都被识别为兴趣点名称之后,可在电子地图的同一地理位置上添加上Wi-Fi A对应的地图兴趣点和Wi-Fi B对应的地图兴趣点。
本申请实施例中,在采集得到的多个用户设备的至少一条Wi-Fi扫描信息和定位信息中,通过对Wi-Fi扫描信息进行聚类,得到每个类所对应的Wi-Fi以及该Wi-Fi的名称,根据定位信息得到每个类所对应的Wi-Fi的地理位置,在Wi-Fi的名称为兴趣点名称时,根据Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点,从而不仅实现地图兴趣点的自动挖掘和新增,而且由于数据采集便捷、用户设备活动范围广泛以及基于对大量的Wi-Fi扫描信息和定位信息的分析,有效地提高了地图兴趣点挖掘和新增的便捷性、效率、覆盖范围和准确性。
图4为本申请的另一实施例提供的地图兴趣点的挖掘方法的流程示意图。如图4所示,该方法包括:
S401、采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息,用户设备的Wi-Fi扫描信息包括用户设备扫描到的Wi-Fi的名称和设备标识,用户设备的定位信息包括用户设备的地理位置。
具体的,步骤S401可参照步骤S301的具体描述,不再赘述。
S402、根据多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,关联信息包括名称、地理位置和扫描用户数。
具体的,由于用户设备的活动范围的不特定性,不同用户设备的Wi-Fi扫描信息中可能相同,不同时刻采集到的同一用户设备的Wi-Fi扫描信息中也可能相同。考虑到Wi-Fi扫描信息的内容重复性,可按照Wi-Fi的设备标识,对采集到的所有Wi-Fi扫描信息进行聚类,聚类后的每个类对应一个Wi-Fi,不同类对应不同的Wi-Fi。同一Wi-Fi的名称可能发生变化,因此,每个类中各Wi-Fi扫描信息内的Wi-Fi的设备标识相同、Wi-Fi的名称可能相同也可能不同。
具体的,针对每个类,可参照步骤S303确定该类所对应Wi-Fi的名称,可参照步骤S304确定该类所对应Wi-Fi的地理位置,不再赘述。
具体的,针对每个类,可通过各Wi-Fi扫描信息所来自的用户设备的设备标识,得到扫描到该类所对应的Wi-Fi的用户设备的个数,将扫描到该类所对应的Wi-Fi的用户设备的个数,确定该Wi-Fi的扫描用户数。
S403、根据连续多个单位时间内Wi-Fi的扫描用户数,确定Wi-Fi是否存在,如果确定Wi-Fi存在,则确定Wi-Fi的名称是否为兴趣点名称。
具体的,针对每个类,可根据各Wi-Fi扫描信息的采集时间,得到连续多个单位时间内该类所对应Wi-Fi的扫描用户数。如果连续多个单位时间内该类所对应Wi-Fi的扫描用户数大于预设的数量阈值(例如,数量阈值可设为0),则确定该Wi-Fi存在,否则确定该Wi-Fi不存在。针对确定存在的Wi-Fi,确定Wi-Fi的名称是否为兴趣点名称。因此,在确定Wi-Fi的名称是否为兴趣点名称之前,先通过连续多个单位时间Wi-Fi的扫描用户数,确定Wi-Fi的存在性,以对Wi-Fi进行筛选,提高地图兴趣点挖掘的效率和准确性。
S404、如果Wi-Fi的名称为兴趣点名称,则根据Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点。
具体的,步骤S404可参照步骤S203或者步骤S303的具体描述,不再赘述。
在一个可行的实施方式中,Wi-Fi扫描信息还包括用户设备连接到的Wi-Fi的名称和设备标识,关联信息还包括连接用户数。在对Wi-Fi扫描信息进行聚类后,针对每个类,可将连接到该类所对应的Wi-Fi的用户设备的个数,确定该Wi-Fi的连接用户数,根据连续多个单位时间内该Wi-Fi的连接用户数,确定该Wi-Fi是否存在,如果确定该Wi-Fi存在,则确定该Wi-Fi的名称是否为兴趣点名称。因此,在确定Wi-Fi的名称是否为兴趣点名称之前,先通过连续多个单位时间Wi-Fi的连接用户数,确定Wi-Fi的存在性,以对Wi-Fi进行筛选,提高地图兴趣点挖掘的效率和准确性,以避免个人热点、车载Wi-Fi等噪声数据对地图兴趣点挖掘效率和准确性的影响。其中,针对每个类,可通过连接到该类所对应的Wi-Fi的用户设备的设备标识,得到连接到该Wi-Fi的用户设备的个数。
本申请实施例中,在采集得到的多个用户设备的至少一条Wi-Fi扫描信息和定位信息中,通过对Wi-Fi扫描信息进行聚类和依据定位信息,得到每个类所对应的Wi-Fi,针对各Wi-Fi,若Wi-Fi是否存在、且Wi-Fi的名称为兴趣点名称,则根据Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点,从而不仅实现地图兴趣点的自动挖掘和新增,而且由于数据采集便捷、用户设备活动范围广泛以及基于对大量的Wi-Fi扫描信息和定位信息的分析,有效地提高了地图兴趣点挖掘和新增的便捷性、效率、覆盖范围和准确性。
在上述各方法实施例中,可通过预先训练好的语言识别模型,确定Wi-Fi的名称是否为兴趣点名称,图5为本申请的一实施例提供的通过语言识别模型识别Wi-Fi的名称是否为兴趣点名称的流程示意图。如图5所示,该识别过程包括:
S501、对Wi-Fi的名称进行编码,得到相应的词向量。
具体的,可通过预设的词典,对Wi-Fi的名称进行编码,将Wi-Fi的名称转换为相应的词向量。例如,可采用one-hot编码方式(又称为一位有效编码方式)对Wi-Fi的名称进行编码。
作为示例的,Wi-Fi的名称为“海边民宿”,“海边民宿”这四个字符在词典(词典中共有1000个字符)中的位置分别为10、20、30、40,则“海边民宿”这四个字符分别对应1000维的向量。“海”对应的向量中第10维的值为1,其它维的值为0,“边”对应的向量中第20维的值为1,其它维的值为0,“民”对应的向量中第30维的值为1,其它维的值为0,“宿”对应的向量中第40维的值为1,其它维的值为0。由“海边民宿”这四个字符分别对应的向量组合得到该Wi-Fi的名称的词向量。
S502、对词向量进行处理。
具体的,考虑到Wi-Fi的名称转换为词向量的过程中,忽略了Wi-Fi的名称中字符与字符之间的上下文联系,且词向量过于稀疏,维度过大,可计算词向量的嵌入表示,以对词向量进行降维。其中,嵌入表示的计算为自然语言处理中的已有技术,在此不进行描述。
S503、通过语言识别模型中的多头自注意力层,对处理后的词向量进行特征提取,得到词向量特征。
具体的,语言识别模型依次包括输入层、多头自注意力层(multi-head attentionlayer)、全连接层和输出层。在对词向量进行处理后,可将处理后的词向量输入多头自注意力层,以提取词向量特征。例如,可采用6个多头自注意力层,每个多头自注意力层包括8个自注意力(selef-attention)单元,以提高词向量特征的效果。
S504、通过语言识别模型中的全连接层和词向量特征,得到Wi-Fi的名称为兴趣点名称的概率值。
具体的,将词向量特征输入全连接层,计算得到Wi-Fi的名称为兴趣点名称的概率值,通过输出层输出该概率值。
S505、根据Wi-Fi的名称为兴趣点名称的概率值,确定Wi-Fi的名称是否为兴趣点名称。
具体的,如果Wi-Fi的名称为兴趣点名称的概率值大于预设的概率阈值,则确定Wi-Fi的名称为兴趣点名称,否则确定Wi-Fi的名称不为兴趣点名称。
在一个可行的实施方式中,在对词向量进行处理的过程中,可先计算得到词向量的嵌入表示,再根据各字符在词典中的位置和各字符在Wi-Fi的名称中的位置,生成位置向量,根据嵌入表示和位置向量,得到处理后的词向量,从而在词向量中充分体现字符与字符之间的位置关系,提高词向量的质量,进而提高识别Wi-Fi的名称是否为兴趣点名称的准确性。
作为示例的,计算词向量的嵌入表示的公式可表示为:
X'=W1X,其中,X为词向量,表示为(X1,X2,…,Xn),Xi表示Wi-Fi的名称中第i个字符的向量,1≤i≤n,W1为预设的矩阵参数,X'为词向量的嵌入表示。
作为示例的,计算各个字符在位置向量中的值的公式可表示为:
其中,j为各字符在词向量中的位置,pos表示各字符在Wi-Fi的名称中的位置,例如“海边民宿”中民的pos为3,K为预设常数(例如,可设为10000),dmodel为词典的大小,PE(pos,2j)表示各字符在位置向量中的值,由各字符在位置向量中的值,可得到位置向量。
在一个可行的实施方式中,在根据嵌入表示和位置向量,得到处理后的词向量的过程中,可通过将嵌入表示与位置向量进行叠加,得到处理后的词向量,使得处理后的词向量中包含字符和字符之间的位置关系。
作为示例的,嵌入表示与位置向量进行叠加的公式可表示为:
X”=X'+P(X),其中,X”为处理后的词向量,P(X)为位置向量。
作为示例的,通过全连接层计算计算得到Wi-Fi的名称为兴趣点名称的概率值的公式可表示为:
Y=softmax(W2*H+B),其中,Y为Wi-Fi的名称为兴趣点名称的概率值,W2和B为全连接层的预设参数,H为多头自注意力提取的词向量特征。
在一个可行的实施方式中,可预先通过有监督训练方式和预设的训练数据,对语言识别模型进行训练,以提高语言识别模型的训练效果。其中,训练数据包括一些训练名称和训练名称对应的标签。例如,训练名称的标签为1,则表示该训练名称为兴趣点名称,训练名称的标签为0,则表示该训练名称不为兴趣点名称。
本申请实施例中,在语言识别模型中,将Wi-Fi的名称转换为词向量,并对词向量进行处理,通过多头自注意力层提取处理后的词向量的词向量特征,通过全连接层和词向量特征计算得到Wi-Fi的名称为兴趣点名称的概率,依据概率确定Wi-Fi的名称是否为兴趣点名称,从而有效地提高了确定Wi-Fi的名称是否为兴趣点名称的准确度,进而提高了地图兴趣点的挖掘和新增的准确度。
图6为本申请的另一实施例提供的地图兴趣点的挖掘方法的流程示意图。如图6所示,该方法包括:
S601、采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息。
S602、根据多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,关联信息包括名称和地理位置。
具体的,步骤S601和步骤S602可参照上述各方法实施例的相应描述,不再赘述。
S603、如果Wi-Fi的名称为兴趣点名称,则在电子地图上,获取与Wi-Fi的地理位置之间的距离小于等于预设距离阈值的已有地图兴趣点。
具体的,如果Wi-Fi的名称为兴趣点名称,则可根据该Wi-Fi的地理位置,在电子地图上获取与该Wi-Fi的地理位置之间的距离小于等于预设距离阈值的已有地图兴趣点。
在一个可行的实施方式中,可预先设置不同类型的地图兴趣点对应的距离阈值,例如,酒店类型的地图兴趣点对应的距离阈值为500m,商店类型的地图兴趣点对应的距离阈值为200m。在电子地图上获取已有地图兴趣点时,可以Wi-Fi的地理位置为起点,在不同的距离阈值的范围内获取相应类型的地图兴趣点,例如,在500m范围内获取酒店类型的已有地图兴趣点,在200m范围内获取商店类型的地图兴趣点。因此,充分考虑不同地图兴趣点的规模,提高获取的已有地图兴趣点的准确度。
S604、确定Wi-Fi的名称与已有地图兴趣点的名称是否匹配。
具体的,可将Wi-Fi的名称与已有地图兴趣点的名称进行比较,确定Wi-Fi的名称与已有地图兴趣点的名称是否相同,若存在名称与Wi-Fi的名称相同的已有地图兴趣点,则确定Wi-Fi的名称与已有地图兴趣点的名称匹配,执行步骤S605,否则确定Wi-Fi的名称与已有地图兴趣点的名称不匹配,执行步骤S606。
在一个可行的实施方式中,可将Wi-Fi的名称与已有地图兴趣点的名称进行匹配,得到各已有地图兴趣点的名称分别与Wi-Fi的名称的相似度,若存在相似度超过预设相似度阈值的已有地图兴趣点,则确定相似度超过预设相似度阈值的已有地图兴趣点的名称与Wi-Fi的名称匹配,从而通过计算各已有地图兴趣点的名称分别与Wi-Fi的名称的相似度,提高已有地图兴趣点的名称与Wi-Fi的名称进行比较的准确度。
S605、确定Wi-Fi对应已有地图兴趣点。
具体的,若存在名称与Wi-Fi的名称匹配的已有地图兴趣点,则名称与Wi-Fi的名称匹配的已有地图兴趣点为电子地图上该Wi-Fi对应的地图兴趣点,表示电子地图上已有与Wi-Fi对应的地图兴趣点。
S606、在电子地图上添加与Wi-Fi对应的地图兴趣点。
具体的,若不存在名称与Wi-Fi的名称匹配的已有地图兴趣点,则可可根据该Wi-Fi的名称和地理位置,在电子地图上添加与该Wi-Fi对应的地图兴趣点,其中,添加的地图兴趣点的名称为该Wi-Fi的名称,添加的地图兴趣点的地理位置为该Wi-Fi的地理位置。
本申请实施例中,在采集得到的多个用户设备的至少一条Wi-Fi扫描信息和定位信息中,得到至少一个Wi-Fi的名称和地理位置,在Wi-Fi的名称为兴趣点名称时,确定Wi-Fi是否为已有地图兴趣点,若不是,则在电子地图上添加相应的地图兴趣点,从而不仅实现地图兴趣点的自动挖掘和新增,而且由于数据采集便捷、用户设备活动范围广泛,有效地提高了地图兴趣点挖掘和新增的便捷性、效率和覆盖范围。
图7为本申请的一实施例提供的地图兴趣点的挖掘装置的结构示意图。如图7所示,该装置包括:
采集模块701,用于采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息;
处理模块702,用于根据多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,关联信息包括名称和地理位置;
添加模块703,用于如果Wi-Fi的名称为兴趣点名称,则根据Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点。
在一个可行的实施方式中,Wi-Fi扫描信息包括用户设备扫描到的Wi-Fi的名称和设备标识,定位信息包括用户设备的地理位置;处理模块702,具体用于:按照Wi-Fi的设备标识,对Wi-Fi扫描信息进行聚类,得到多个类,每个类分别对应一个Wi-Fi;根据每个类中各Wi-Fi扫描信息中Wi-Fi的名称,确定Wi-Fi的名称;根据每个类中各Wi-Fi扫描信息所属用户设备的地理位置,确定Wi-Fi的地理位置。
在一个可行的实施方式中,处理模块702,具体用于:针对每个类,计算所有Wi-Fi扫描信息所属用户设备的地理位置的平均值;根据平均值确定Wi-Fi的地理位置。
在一个可行的实施方式中,Wi-Fi的关联信息还包括Wi-Fi的扫描用户数;处理模块702,还具体用于:针对每个类,按照扫描到Wi-Fi的用户设备的个数,确定Wi-Fi的扫描用户数。
在一个可行的实施方式中,处理模块702,还用于:获取连续多个单位时间内Wi-Fi的扫描用户数;根据连续多个单位时间内Wi-Fi的扫描用户数,确定Wi-Fi是否存在,如果确定Wi-Fi存在,则确定Wi-Fi的名称是否为兴趣点名称。
在一个可行的实施方式中,Wi-Fi扫描信息还包括用户设备连接到的Wi-Fi的名称和设备标识,Wi-Fi的关联信息还包括Wi-Fi的连接用户数;处理模块702,还具体用于:针对每个类,按照连接到Wi-Fi的用户设备的个数,确定Wi-Fi的连接用户数。
在一个可行的实施方式中,处理模块702,还用于:获取连续多个单位时间内Wi-Fi的连接用户数;根据连续多个单位时间内Wi-Fi的连接用户数,确定Wi-Fi是否存在,如果确定Wi-Fi存在,则确定Wi-Fi的名称是否为兴趣点名称。
在一个可行的实施方式中,处理模块702,还用于:通过训练好的语言识别模型,确定Wi-Fi的名称是否为兴趣点名称。
在一个可行的实施方式中,处理模块702,具体用于:对Wi-Fi的名称进行编码,得到相应的词向量;对词向量进行处理;通过语言识别模型中的多头自注意力层,对处理后的词向量进行特征提取,得到词向量特征;通过语言识别模型中的全连接层和词向量特征,得到Wi-Fi的名称为兴趣点名称的概率值;根据Wi-Fi的名称为兴趣点名称的概率值,确定Wi-Fi的名称是否为兴趣点名称。
在一个可行的实施方式中,处理模块702,具体用于:根据Wi-Fi的名称中各字符在预设词典中的位置,生成词向量;处理模块702,还具体用于:计算词向量的嵌入表示;根据各字符在词典中的位置和各字符在Wi-Fi名称中的位置,生成位置向量;根据嵌入表示和位置向量,得到处理后的词向量。
在一个可行的实施方式中,添加模块703,具体用于:在电子地图上,获取与Wi-Fi的地理位置之间的距离小于等于预设距离阈值的已有地图兴趣点;如果Wi-Fi的名称与已有地图兴趣点的名称匹配,则确定Wi-Fi对应已有地图兴趣点;如果Wi-Fi的名称与已有地图兴趣点的名称不匹配,则在电子地图上添加与Wi-Fi对应的地图兴趣点。
图7提供的地图兴趣点的挖掘装置,可以执行上述相应方法实施例,其实现原理和技术效果类似,在此不再赘述。
图8为本申请一实施例提供的一种电子设备的结构示意图。如图8所示,该电子设备可以包括:至少一个处理器801和与至少一个处理器801通信连接的存储器802。存储器802存储有可被至少一个处理器801执行的指令,该指令被至少一个处理器801执行,以使至少一个处理器801能够实现如上述任一实施例的方法。
上述的处理器801可以是通用处理器,包括中央处理器CPU、网络处理器(networkprocessor,NP)等;还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。上述存储器802可能包含随机存取存储器(random access memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
本申请一实施例还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行如上述任一实施例的方法。
本申请的一实施例还提供了一种计算机程序产品,程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例所述的方法。
图9是根据本实施例提供的地图兴趣点的挖掘装置900的框图。例如,装置900可以被提供为一服务器或者一计算机。参照图9,装置900包括处理组件901,其进一步包括一个或多个处理器,以及由存储器902所代表的存储器资源,用于存储可由处理组件901的执行的指令,例如应用程序。存储器902中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件901被配置为执行指令,以执行上述任一实施例的方法。
装置900还可以包括一个电源组件903被配置为执行装置900的电源管理,一个有线或无线网络接口904被配置为将装置900连接到网络,和一个输入输出(I/O)接口905。装置900可以操作基于存储在存储器902的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。
应该理解,在本申请的实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本申请实施例的范围。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (20)
1.一种地图兴趣点的挖掘方法,其特征在于,所述方法包括:
采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息;
根据所述多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,所述关联信息包括名称和地理位置;
对所述Wi-Fi的名称进行编码,得到相应的词向量;
对所述词向量进行处理;
通过语言识别模型中的多头自注意力层,对处理后的所述词向量进行特征提取,得到词向量特征;
通过所述语言识别模型中的全连接层和所述词向量特征,得到所述Wi-Fi的名称为兴趣点名称的概率值;
根据所述Wi-Fi的名称为兴趣点名称的概率值,确定所述Wi-Fi的名称是否为兴趣点名称;
如果所述Wi-Fi的名称为兴趣点名称,则根据所述Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点。
2.根据权利要求1所述的方法,其特征在于,所述Wi-Fi扫描信息包括所述用户设备扫描到的Wi-Fi的名称和设备标识,所述定位信息包括所述用户设备的地理位置;
所述根据所述多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,包括:
按照Wi-Fi的设备标识,对所述Wi-Fi扫描信息进行聚类,得到多个类,每个类分别对应一个所述Wi-Fi;
根据所述每个类中各Wi-Fi扫描信息中Wi-Fi的名称,确定所述Wi-Fi的名称;
根据所述每个类中各Wi-Fi扫描信息所属用户设备的地理位置,确定所述Wi-Fi的地理位置。
3.根据权利要求2所述的方法,其特征在于,所述根据所述每个类中各Wi-Fi扫描信息所属用户设备的地理位置,确定所述Wi-Fi的地理位置,包括:
针对所述每个类,计算所有所述Wi-Fi扫描信息所属用户设备的地理位置的平均值;
根据所述平均值确定所述Wi-Fi的地理位置。
4.根据权利要求2所述的方法,其特征在于,所述Wi-Fi的关联信息还包括所述Wi-Fi的扫描用户数;
所述根据所述多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,还包括:
针对所述每个类,按照扫描到所述Wi-Fi的用户设备的个数,确定所述Wi-Fi的扫描用户数。
5.根据权利要求4所述的方法,其特征在于,所述如果所述Wi-Fi的名称为兴趣点名称,则根据所述Wi-Fi的名称和地理位置,在所述电子地图上添加相应的地图兴趣点之前,所述方法还包括:
获取连续多个单位时间内所述Wi-Fi的扫描用户数;
根据连续多个单位时间内所述Wi-Fi的扫描用户数,确定所述Wi-Fi是否存在,如果确定所述Wi-Fi存在,则确定所述Wi-Fi的名称是否为兴趣点名称。
6.根据权利要求2所述的方法,其特征在于,所述Wi-Fi扫描信息还包括所述用户设备连接到的Wi-Fi的名称和设备标识,所述Wi-Fi的关联信息还包括所述Wi-Fi的连接用户数;
所述根据所述多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,还包括:
针对所述每个类,按照连接到所述Wi-Fi的用户设备的个数,确定所述Wi-Fi的连接用户数。
7.根据权利要求6所述的方法,其特征在于,所述如果所述Wi-Fi的名称为兴趣点名称,则根据所述Wi-Fi的名称和地理位置,在所述电子地图上添加相应的地图兴趣点之前,所述方法还包括:
获取连续多个单位时间内所述Wi-Fi的连接用户数;
根据连续多个单位时间内所述Wi-Fi的连接用户数,确定所述Wi-Fi是否存在,如果确定所述Wi-Fi存在,则确定所述Wi-Fi的名称是否为兴趣点名称。
8.根据权利要求1所述的方法,其特征在于,所述对所述Wi-Fi的名称进行编码,得到相应的词向量,包括:
根据所述Wi-Fi的名称中各字符在预设词典中的位置,生成所述词向量;
所述对所述词向量进行处理,包括:
计算所述词向量的嵌入表示;
根据所述各字符在所述词典中的位置和所述各字符在所述Wi-Fi名称中的位置,生成位置向量;
根据所述嵌入表示和所述位置向量,得到处理后的所述词向量。
9.根据权利要求1-7任一项所述的方法,其特征在于,所述如果所述Wi-Fi的名称为兴趣点名称,则根据所述Wi-Fi的名称和地理位置,在所述电子地图上添加相应的地图兴趣点,包括:
在所述电子地图上,获取与所述Wi-Fi的地理位置之间的距离小于等于预设距离阈值的已有地图兴趣点;
如果所述Wi-Fi的名称与所述已有地图兴趣点的名称匹配,则确定所述Wi-Fi对应所述已有地图兴趣点;
如果所述Wi-Fi的名称与所述已有地图兴趣点的名称不匹配,则在所述电子地图上添加与所述Wi-Fi对应的地图兴趣点。
10.一种地图兴趣点的挖掘装置,其特征在于,所述装置包括:
采集模块,用于采集多个用户设备的至少一条Wi-Fi扫描信息和定位信息;
处理模块,用于根据所述多个用户设备的至少一条Wi-Fi扫描信息和定位信息,得到至少一个Wi-Fi的关联信息,所述关联信息包括名称和地理位置;
添加模块,用于如果所述Wi-Fi的名称为兴趣点名称,则根据所述Wi-Fi的名称和地理位置,在电子地图上添加相应的地图兴趣点;
所述处理模块,还用于对所述Wi-Fi的名称进行编码,得到相应的词向量;对所述词向量进行处理;通过所述语言识别模型中的多头自注意力层,对处理后的所述词向量进行特征提取,得到词向量特征;通过所述语言识别模型中的全连接层和所述词向量特征,得到所述Wi-Fi的名称为兴趣点名称的概率值;根据所述Wi-Fi的名称为兴趣点名称的概率值,确定所述Wi-Fi的名称是否为兴趣点名称。
11.根据权利要求10所述的装置,其特征在于,所述Wi-Fi扫描信息包括所述用户设备扫描到的Wi-Fi的名称和设备标识,所述定位信息包括所述用户设备的地理位置;
所述处理模块,具体用于:
按照Wi-Fi的设备标识,对所述Wi-Fi扫描信息进行聚类,得到多个类,每个类分别对应一个所述Wi-Fi;
根据所述每个类中各Wi-Fi扫描信息中Wi-Fi的名称,确定所述Wi-Fi的名称;
根据所述每个类中各Wi-Fi扫描信息所属用户设备的地理位置,确定所述Wi-Fi的地理位置。
12.根据权利要求11所述的装置,其特征在于,所述处理模块,具体用于:
针对所述每个类,计算所有所述Wi-Fi扫描信息所属用户设备的地理位置的平均值;
根据所述平均值确定所述Wi-Fi的地理位置。
13.根据权利要求11所述的装置,其特征在于,所述Wi-Fi的关联信息还包括所述Wi-Fi的扫描用户数;
所述处理模块,还具体用于:
针对所述每个类,按照扫描到所述Wi-Fi的用户设备的个数,确定所述Wi-Fi的扫描用户数。
14.根据权利要求13所述的装置,其特征在于,所述处理模块,还用于:
获取连续多个单位时间内所述Wi-Fi的扫描用户数;
根据连续多个单位时间内所述Wi-Fi的扫描用户数,确定所述Wi-Fi是否存在,如果确定所述Wi-Fi存在,则确定所述Wi-Fi的名称是否为兴趣点名称。
15.根据权利要求11所述的装置,其特征在于,所述Wi-Fi扫描信息还包括所述用户设备连接到的Wi-Fi的名称和设备标识,所述Wi-Fi的关联信息还包括所述Wi-Fi的连接用户数;
所述处理模块,还具体用于:
针对所述每个类,按照连接到所述Wi-Fi的用户设备的个数,确定所述Wi-Fi的连接用户数。
16.根据权利要求15所述的装置,其特征在于,所述处理模块,还用于:
获取连续多个单位时间内所述Wi-Fi的连接用户数;
根据连续多个单位时间内所述Wi-Fi的连接用户数,确定所述Wi-Fi是否存在,如果确定所述Wi-Fi存在,则确定所述Wi-Fi的名称是否为兴趣点名称。
17.根据权利要求10所述的装置,其特征在于,所述处理模块,具体用于:
根据所述Wi-Fi的名称中各字符在预设词典中的位置,生成所述词向量;
所述处理模块,还具体用于:
计算所述词向量的嵌入表示;
根据所述各字符在所述词典中的位置和所述各字符在所述Wi-Fi名称中的位置,生成位置向量;
根据所述嵌入表示和所述位置向量,得到处理后的所述词向量。
18.根据权利要求10-16任一项所述的装置,其特征在于,所述添加模块,具体用于:
在所述电子地图上,获取与所述Wi-Fi的地理位置之间的距离小于等于预设距离阈值的已有地图兴趣点;
如果所述Wi-Fi的名称与所述已有地图兴趣点的名称匹配,则确定所述Wi-Fi对应所述已有地图兴趣点;
如果所述Wi-Fi的名称与所述已有地图兴趣点的名称不匹配,则在所述电子地图上添加与所述Wi-Fi对应的地图兴趣点。
19.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。
20.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令被执行时,实现如权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010616396.8A CN111782980B (zh) | 2020-06-30 | 2020-06-30 | 地图兴趣点的挖掘方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010616396.8A CN111782980B (zh) | 2020-06-30 | 2020-06-30 | 地图兴趣点的挖掘方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111782980A CN111782980A (zh) | 2020-10-16 |
CN111782980B true CN111782980B (zh) | 2023-08-04 |
Family
ID=72760369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010616396.8A Active CN111782980B (zh) | 2020-06-30 | 2020-06-30 | 地图兴趣点的挖掘方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111782980B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182409B (zh) * | 2020-11-03 | 2024-07-09 | 北京百度网讯科技有限公司 | 数据处理方法、装置、设备及计算机存储介质 |
CN112507249A (zh) * | 2020-11-30 | 2021-03-16 | 北京百度网讯科技有限公司 | 兴趣点生成的方法、装置、电子设备及存储介质 |
CN115396813A (zh) * | 2021-05-24 | 2022-11-25 | 北京三快在线科技有限公司 | 一种兴趣点画像生成方法、系统、电子设备及存储介质 |
CN116184312B (zh) * | 2022-12-22 | 2023-11-21 | 泰州雷德波达定位导航科技有限公司 | 一种基于语义Wi-Fi的室内众源指纹库构建方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014180196A1 (zh) * | 2013-05-08 | 2014-11-13 | 华为技术有限公司 | 信息推荐处理方法及装置 |
CN107729459A (zh) * | 2017-09-30 | 2018-02-23 | 百度在线网络技术(北京)有限公司 | 地图兴趣点失效挖掘方法、装置、设备和计算机可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106303955B (zh) * | 2016-08-05 | 2018-06-19 | 百度在线网络技术(北京)有限公司 | 用于对无线热点和poi进行匹配的方法和装置 |
-
2020
- 2020-06-30 CN CN202010616396.8A patent/CN111782980B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014180196A1 (zh) * | 2013-05-08 | 2014-11-13 | 华为技术有限公司 | 信息推荐处理方法及装置 |
CN107729459A (zh) * | 2017-09-30 | 2018-02-23 | 百度在线网络技术(北京)有限公司 | 地图兴趣点失效挖掘方法、装置、设备和计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
A Positioning Algorithm Based on WIFI BSSID Similarity and RSSI Probability Distribution;LY Wang;Computer Technology and Development;全文 * |
一种基于先验信息的WiFi室内定位方法;杨敏;刘思怡;;电子测量与仪器学报(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111782980A (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111782980B (zh) | 地图兴趣点的挖掘方法、装置、设备及存储介质 | |
Du et al. | Large-scale urban functional zone mapping by integrating remote sensing images and open social data | |
Huang et al. | Big spatial data for urban and environmental sustainability | |
CN110869926B (zh) | 基于语义状态的传感器跟踪和更新 | |
CN106462627B (zh) | 根据多个位置数据报告分析语义地点和相关数据 | |
US10534870B2 (en) | Methods, apparatuses and computer program products for automatic, non-parametric, non-iterative three dimensional geographic modeling | |
CN110782284A (zh) | 信息推送方法、装置以及可读存储介质 | |
US8244227B2 (en) | Information providing device, mobile communication device, information providing system, information providing method, and program | |
CN102204238B (zh) | 便携式设备上的图像标注 | |
US11966424B2 (en) | Method and apparatus for dividing region, storage medium, and electronic device | |
US20150080012A1 (en) | Systems and methods for detecting associated devices | |
CN103761539B (zh) | 一种基于环境特征物体的室内定位方法 | |
CN111757464B (zh) | 一种区域轮廓提取方法及装置 | |
Kalantar et al. | Smart counting–oil palm tree inventory with UAV | |
WO2021114615A1 (zh) | 行为风险识别的可视化方法、装置、设备及存储介质 | |
EP3860163B1 (en) | Matching location-related information with name information of points of interest | |
CN114708545A (zh) | 基于图像的对象侦测方法、装置、设备和存储介质 | |
JP2003330953A (ja) | サーバ装置、携帯端末、情報提供システム、情報提供方法、及び情報取得方法 | |
CN116528282B (zh) | 覆盖场景识别方法、装置、电子设备和可读存储介质 | |
CN111372211A (zh) | 一种基于集成学习的智能手机WiFi室内定位方法 | |
Lee et al. | QRLoc: User-involved calibration using quick response codes for Wi-Fi based indoor localization | |
KR100671164B1 (ko) | 이동 통신 단말기를 이용한 위치 정보 제공 시스템 및 방법 | |
CN116668580A (zh) | 场景识别的方法、电子设备及可读存储介质 | |
US20180138999A1 (en) | Information processing method, information processing device, and storage medium | |
CN115310672A (zh) | 城市发展预测模型的构建方法、城市发展预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |