CN108376141A - 室内指纹库构建方法、装置、设备及存储介质 - Google Patents
室内指纹库构建方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN108376141A CN108376141A CN201711444709.0A CN201711444709A CN108376141A CN 108376141 A CN108376141 A CN 108376141A CN 201711444709 A CN201711444709 A CN 201711444709A CN 108376141 A CN108376141 A CN 108376141A
- Authority
- CN
- China
- Prior art keywords
- address
- information
- data
- base
- validated user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明提供一种室内指纹库构建方法、装置、设备及存储介质。该方法包括:获取基础地址数据信息;获取有效用户地址信息;建立所述基础地址数据信息与所述有效用户地址信息的匹配关系,生成符合预定要求的地址数据;获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息;将所述位置信息与所述符合预定要求的地址数据匹配生成室内地址数据;将所述有效用户的所述通信信号特征信息与对应的所述室内地址数据关联,构建室内指纹数据库数据。本发明的室内指纹库构建方法、装置、设备及存储介质有助于提高指纹库数据的匹配成功率和处理效率。
Description
技术领域
本发明涉及网络技术领域,尤其涉及一种室内指纹库构建方法、装置、设备及存储介质。
背景技术
现有技术中,基于位置的服务(LBS)提供给人们越来越多的便利,相关的定位技术也得到迅速的发展。全球卫星导航系统(GNSS)能够在开阔环境中提供米级别精度的定位服务,但是在室内环境中,由于建筑物对信号的遮挡,GNSS或GIS系统时常无法提供能涵盖所有的住宅小区的地址数据,并不能够用来进行室内定位。然而现实中某些地址信息含有别名,GIS系统的poi数据无法体现。上述问题导致在匹配短信和家宽的地址信息时遇到无法匹配或错误匹配的情况。
目前在室内环境中基于WiFi、RFID、声波等信号的定位技术被研发出来。但是在实际中仍然存在指纹库数据构建不够准确的技术问题。
发明内容
本发明实施例提供了一种室内指纹库构建方法、装置、设备及存储介质,用以解决现有技术中指纹库数据构建匹配成功率低的技术问题。
第一方面,本发明实施例提供了一种室内指纹库构建方法,方法包括:
获取基础地址数据信息;
获取有效用户地址信息;
建立所述基础地址数据信息与所述有效用户地址信息的匹配关系,生成符合预定要求的地址数据;
获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息;
将所述位置信息与所述符合预定要求的地址数据匹配生成室内地址数据;
将所述有效用户的所述通信信号特征信息与对应的所述室内地址数据关联,构建室内指纹数据库数据。
第二方面,本发明实施例提供了一种室内指纹库构建装置,装置包括:
第一获取模块,用于获取基础地址数据信息;
第二获取模块,用于获取有效用户地址信息;
第一匹配模块,用于建立所述基础地址数据信息与所述有效用户地址信息的匹配关系,生成符合预定要求的地址数据;
第三获取模块,用于获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息;
第二匹配模块,用于将所述位置信息与所述符合预定要求的地址数据匹配生成室内地址数据;
指纹库构建模块,用于将所述有效用户的所述通信信号特征信息与对应的所述室内地址数据关联,构建室内指纹数据库数据。
第三方面,本发明实施例提供了一种室内指纹库构建设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
本发明实施例提供的室内指纹库构建方法、装置、设备及介质,通过建立所述基础地址数据信息与所述有效用户地址信息的匹配关系,生成符合预定要求的地址数据,有助于构建一个准确的室内MRO指纹库数据。通过过滤掉不可用的用户地址数据,提升整体处理效率。通过模糊匹配,提升关联率。利用有限状态机验证地址信息数据是否可用,加快整体数据处理速度。利用文本相似度分析来模糊匹配基础地址数据和用户地址数据,提高匹配成功率,扩充室内指纹库信息量。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例的室内指纹库构建方法的流程示意图。
图2示出了本发明实施例的室内指纹库构建方法的图形化示意图。
图3示出了采用网络爬虫在指定网站搜索到的包含地址信息的页面内容。
图4示出了采用有限状态机判断用户地址有效性的示意图。
图5示出了本发明实施例的室内指纹库构建装置的结构示意图。
图6示出了本发明实施例的室内指纹库构建设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
请参见图1和图2,本发明实施例提供一种室内指纹库构建方法,主要发明思路是利用用户开通家庭宽带时登记的家庭地址数据,也即用户输入的地址信息,基于网络爬虫和文本分析创建一整套地址获取,识别和匹配的流程,从而构建一个准确的室内MRO指纹库数据。该方法主要步骤如下:
S1、获取基础地址数据信息;
S2、获取有效用户地址信息;
S3、建立所述基础地址数据信息与所述有效用户地址信息的匹配关系,生成符合预定要求的地址数据;
S4、获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息;
S5、将所述位置信息与所述符合预定要求的地址数据匹配生成室内地址数据;
S6、将所述有效用户的所述通信信号特征信息与对应的所述室内地址数据关联,构建室内指纹数据库数据。
进一步地,所述获取基础地址数据信息包括:
通过网络爬虫获取指定网站的地址列表信息;
获取所述地址列表信息中各地址对应的经纬度信息;
校正所述经纬度信息,其中,所述基础地址数据信息包括所述地址列表信息与校正后的经纬度信息。
进一步地,所述建立所述基础地址数据信息与所述有效用户地址信息的匹配关系,生成符合预定要求的地址数据包括:
拆分指定用户输入的用户地址信息为若干词组,将所述若干词组集合形成文本特征向量;
计算所述文本特征向量与所述基础地址数据信息中的各个基础地址特征向量之间的相似度,将与所述文本特征向量相似度最高且超过预设阈值的所述基础地址特征向量作为所述指定用户的基础地址数据;
将所述指定用户的基础地址数据与所述有效用户地址信息进行匹配,生成符合预定要求的地址数据。
进一步地,所述拆分指定用户输入的用户地址信息为若干词组,将所述若干词组集合形成文本特征向量包括:
将所述指定用户输入的用户地址信息拆分成若干词组;
从所述若干词组中排除干扰词组;
将余下词组按预定顺序集合形成所述文本特征向量。
进一步地,所述计算所述文本特征向量与所述基础地址数据信息中的各个基础地址特征向量之间的相似度,将与所述文本特征向量相似度最高且超过预设阈值的所述基础地址特征向量作为所述指定用户的基础地址数据包括:
获取所述文本特征向量与所述基础地址数据信息中的各个基础地址特征向量之间的夹角,按照余弦定理计算所述夹角的余弦值,依据所述余弦值获得所述文本特征向量与各个基础地址特征向量之间的所述相似度;
选取与所述文本特征向量相似度最高且超过预设阈值的所述基础地址特征向量作为所述指定用户的基础地址数据。
进一步地,所述获取有效用户地址信息包括:
采用有限状态机对用户输入的地址信息进行验证,以获得所述有效用户地址信息。
进一步地,所述获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息包括:
通过S1-U接口和S1-MME接口获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息。
图2中,采用图示的方法简要总结了本发明实施例的室内指纹库构建方法的流程。从图2可以看出,本发明实施例的室内指纹库构建方法的基础数据包括GIS系统中的数据和来源于互联网网络的数据,接着进行地址验证,筛选出有效数据和无效数据,这里的有效数据是指有效的地址数据,无效数据是指无效的地址数据,比如有的地址信息不存在,或者有错误等。然后进行地址匹配,对用户输入的有效地址数据进行分词,分成若干词组后,集合形成文本特征向量,与基础地址数据信息的每个基础地址特征向量进行相似度分析。之后进入匹配MR步骤,与测量报告(MR)相匹配。这一步涉及信令信息和MR信息。通过将所述有效用户的所述通信信号特征信息与对应的所述室内地址数据关联,构建室内指纹数据库数据。
下面结合具体的实施例说明本发明的室内指纹库构建方法。
步骤S1的获取基础地址数据信息,这里基础地址数据信息主要包含地市,区县,街道,住宅小区名称和具体楼宇,楼层,房号等。步骤1具体包括:
S11、通过网络爬虫获取小区信息列表;这里通过网络爬虫获取小区列表指定的网站为58同城和赶集网,当然也可以是其它社交网站,如其它一些常见的租房网站。
如图3所示,在58同城,赶集网等信息分类网站的房产模块下,通常都有住宅小区的详细信息,以58同城为例,包含所属区县,详细地址和小区名称以及别名等信息:其中有中庚书香大第北区(中庚书香大第北区),下面一行有【台江白马南路】白马路125号等地址信息。
通过目前已经较为成熟的网络爬虫技术,批量获取这些小区信息。将获取到的小区信息数据,和GIS系统的poi数据进行对比并整理出GIS系统中不存在的地址数据。
S12、调用地图软件接口将经纬度填入S11获取到的小区信息数据的列表中;这里以腾讯地图为例,当然也可以是谷歌地图、百度地图或者其它商业地图。调用腾讯地图开发者接口(通过网络爬虫获取的地址数据,获取指定地址数据的经纬度)
腾讯地图提供了输入地址,返回经纬度的功能。如前文所述,我们通过网络爬虫获取到的信息包括区县,街道和小区名称,如鼓楼区鼓西路396号西湖美家4座801室。因此,我们可以提供给接口详细并且规范的地址数据从而得到较为准确的经纬度。
S13、校正经纬度信息。
腾讯地图使用火星坐标系,实际生产应用的时候,需要转换成WGS84坐标系。如福州市鼓楼区鼓西路396号西湖美家4座801室,最终得到一个如下所示的基础地址数据:
上述步骤S2中获取有效用户地址信息,在本实施例主要包括以下步骤:
S21、家庭宽带地址文本(用户输入的用户地址信息)验证;
用户在开通家庭宽带的时候,会手工登记待开通的地址。手工登记的过程中,会产生一些不准确的填写方法,如鼓楼区鼓西路396号西湖美家4座801室,为了使登记地址和本地的基础地址数据信息准确关联,需要对地址进行验证,且地址验证是一个必不可少的过程。这里采用有限状态机作为一种有效的地址验证和分析方法。
如图4所示,有限状态机是一个特殊的有向图,它包括一些结点和连接这些结点的有向弧。
每一个有限状态机都有一个开始状态和一个终止状态,以及若干中间状态。每一个弧上有从一个状态进入下一个状态的条件,比如上图中,当前的状态是省,如果遇到下一个词组和区县名有关,就进入状态区县;如果遇到的下一个词组和城市有关,就进入市的状态,如此等等。如果一条地址能够从状态机的开始状态经过状态机的若干中间状态,走到终止状态,则这条地址有效,否则无效。
S22、家庭宽带地址文本匹配。
为了得到一个完整的用户-地址数据,需要将将上述步骤中获取到的基础地址数据信息和有效用户地址信息关联。使用精确匹配可以关联到部分数据,但是更多的数据因为手工填写误差或地址别名等诸多原因无法关联,此时需要一个模糊匹配将大量的此类数据进行关联。本发明实施例首先对用户地址文本(即用户的家庭宽带地址文本)拆分为若干本词组,将得到的词组集合形成一个文本特征向量,再通过文本相似度分析,计算特征向量最大相似度。筛选出相似度超过阈值的基础地址数据信息,选择相似度最高的基础地址数据信息和有效用户地址信息进行匹配。具体来说,若干词组形成文本特征向量的具体实现方式是通过将文本拆分成若干词组,对这些词组,按照相应的位置依次排列并移除楼宇相关信息,最终得到一个向量,此向量即为文本特征向量。例如,用户填写数据为:"鼓楼区鼓西路396号西湖美家4座801室",最终形成的词组数组为:["鼓楼区","鼓西路","396号","西湖","美家"],因为缺失地市信息,最终得到的文本特征向量为:
其中,该文本特征向量组成的顺序为地市,区县,街道,门牌号和详细地址等词组。
在若干词组形成文本特征向量之后便进行文本相似度分析。
向量的实质是从多维空间中从原点出发的有向线段。两个文本特征向量,如果方向一致,说明内容基本一致。可以通过计算两个向量的夹角来判断对应的地址文本的接近程度。而要计算两个向量的夹角,则可以使用余弦定理。假设两个文本特征向量分别为[x1,x2,…xn]和[y1,y2,…,yn],则两个向量的余弦等于:
在计算的时候,对两个文本特征向量中完全相同的文本项取1值,如果不完全相同,则以较长文本作为分母,较短文本作分子,按照相同文字得出一个小于1的得分.因为基础地址数据信息和用户有效地址信息在拆分成词组时使用相同的分词字典,故可以认为两个文本特征向量如果相似,则其向量长度必然相等。
由于两个文本特征向量中的每一个变量都取非负数,因此余弦的取值在0到1之间,也就是说,夹角在0到90度之间。当两个文本特征向量夹角的余弦等于1时,这两个文本特征向量的夹角为0,两个文本完全相同;当两个文本特征向量正交时,余弦为0,两个文本可以被认为毫不相关。
以前文提到的用户地址信息构成的文本特征向量为例,假设基础地址数据中,有如下向量:
则两个文本特征向量的夹角为:
在基本地址数据集中,此地址数据和当前用户地址信息相似度最高,且超过阈值0.8(80%),故匹配结束。可以看出,用户信息数据在填写的时候,关于详细地址的填写有误,但是通过文本相似度分析,依然可以匹配得到正确的地址。
此外,在本发明实施例的匹配MR中,其沿用现有技术中的方法,通过S1-U接口和S1-MME接口获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息。之后将所述有效用户的所述通信信号特征信息与对应的所述室内地址数据关联,构建室内指纹数据库数据。具体来说,通过匹配S1-MME数据和MRO数据关联得到MR信息,得到分层覆盖的详细室内指纹库数据。当然关于这一步,并非本发明的发明主要部分,可以采用现有技术中常见方式来匹配S1-MME数据和MRO数据关联得到MR信息,从而构建出室内指纹库数据。
请参见图5,本发明实施例还提供一种室内指纹库构建装置,对应图1的室内指纹库构建方法。该室内指纹库构建装置包括:
第一获取模块10,用于获取基础地址数据信息;
第二获取模块20,用于获取有效用户地址信息;
第一匹配模块30,用于建立所述基础地址数据信息与所述有效用户地址信息的匹配关系,生成符合预定要求的地址数据;
第三获取模块40,用于获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息;
第二匹配模块50,用于将所述位置信息与所述符合预定要求的地址数据匹配生成室内地址数据;
指纹库构建模块60,用于将所述有效用户的所述通信信号特征信息与对应的所述室内地址数据关联,构建室内指纹数据库数据。
第一获取模块10包括:
地址列表获取单元,通过网络爬虫获取指定网站的地址列表信息;
经纬度信息获取单元,获取所述地址列表信息中各地址对应的经纬度信息;
经纬度校正单元,校正所述经纬度信息,其中,所述基础地址数据信息包括所述地址列表信息与校正后的经纬度信息。
进一步地,匹配模块30包括:
用于拆分指定用户输入的用户地址信息为若干词组,将所述若干词组集合形成文本特征向量的单元;
用于计算所述文本特征向量与所述基础地址数据信息中的各个基础地址特征向量之间的相似度,将与所述文本特征向量相似度最高且超过预设阈值的所述基础地址特征向量作为所述指定用户的基础地址数据的单元;
用于将所述指定用户的基础地址数据与所述有效用户地址信息进行匹配,生成符合预定要求的地址数据的单元。
用于所述拆分指定用户输入的用户地址信息为若干词组,将所述若干词组集合形成文本特征向量的单元包括:
用于将所述指定用户输入的用户地址信息拆分成若干词组的子单元;
用于从所述若干词组中排除干扰词组的子单元;
用于将余下词组按预定顺序集合形成所述文本特征向量的子单元。
所述用于所述计算所述文本特征向量与所述基础地址数据信息中的各个基础地址特征向量之间的相似度,将与所述文本特征向量相似度最高且超过预设阈值的所述基础地址特征向量作为所述指定用户的基础地址数据的单元包括:
用于获取所述文本特征向量与所述基础地址数据信息中的各个基础地址特征向量之间的夹角,按照余弦定理计算所述夹角的余弦值,依据所述余弦值获得所述文本特征向量与各个基础地址特征向量之间的所述相似度的子单元;
用于选取与所述文本特征向量相似度最高且超过预设阈值的所述基础地址特征向量作为所述指定用户的基础地址数据的子单元。
第二获取模块20包括:
采用有限状态机对用户输入的地址信息进行验证,以获得所述有效用户地址信息。
另外,结合图1和图2描述的本发明实施例的室内指纹库构建方法可以由室内指纹库构建设备来实现。图6示出了本发明实施例提供的室内指纹库构建设备的硬件结构示意图。
室内指纹库构建设备可以包括处理器401以及存储有计算机程序指令的存储器402。
具体地,上述处理器401可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器402可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器402可在数据处理装置的内部或外部。在特定实施例中,存储器402是非易失性固态存储器。在特定实施例中,存储器402包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现上述实施例中的任意一种室内指纹库构建方法。
在一个示例中,室内指纹库构建设备还可包括通信接口403和总线410。其中,如图6所示,处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。
通信接口403,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线410包括硬件、软件或两者,将室内指纹库构建设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线410可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该室内指纹库构建设备可以基于获取到待测小区的网管性能指标,执行本发明实施例中的室内指纹库构建方法,从而实现结合图1和图2描述的室内指纹库构建方法。
另外,结合上述实施例中的室内指纹库构建方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种室内指纹库构建方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种室内指纹库构建方法,其特征在于,所述方法包括:
获取基础地址数据信息;
获取有效用户地址信息;
建立所述基础地址数据信息与所述有效用户地址信息的匹配关系,生成符合预定要求的地址数据;
获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息;
将所述位置信息与所述符合预定要求的地址数据匹配生成室内地址数据;
将所述有效用户的所述通信信号特征信息与对应的所述室内地址数据关联,构建室内指纹数据库数据。
2.根据权利要求1所述的室内指纹库构建方法,其特征在于,所述获取基础地址数据信息包括:
通过网络爬虫获取指定网站的地址列表信息;
获取所述地址列表信息中各地址对应的经纬度信息;
校正所述经纬度信息,其中,所述基础地址数据信息包括所述地址列表信息与校正后的所述经纬度信息。
3.根据权利要求1所述的室内指纹库构建方法,其特征在于,所述建立所述基础地址数据信息与所述有效用户地址信息的匹配关系,生成符合预定要求的地址数据包括:
拆分指定用户输入的用户地址信息为若干词组,将所述若干词组集合形成文本特征向量;
计算所述文本特征向量与所述基础地址数据信息中的各个基础地址特征向量之间的相似度,将与所述文本特征向量相似度最高且超过预设阈值的所述基础地址特征向量作为所述指定用户的基础地址数据;
将所述指定用户的基础地址数据与所述有效用户地址信息进行匹配,生成符合预定要求的地址数据。
4.根据权利要求3所述的室内指纹库构建方法,其特征在于,所述拆分指定用户输入的用户地址信息为若干词组,将所述若干词组集合形成文本特征向量包括:
将所述指定用户输入的用户地址信息拆分成若干词组;
从所述若干词组中排除干扰词组;
将余下词组按预定顺序集合形成所述文本特征向量。
5.根据权利要求3所述的室内指纹库构建方法,其特征在于,所述计算所述文本特征向量与所述基础地址数据信息中的各个基础地址特征向量之间的相似度,将与所述文本特征向量相似度最高且超过预设阈值的所述基础地址特征向量作为所述指定用户的基础地址数据包括:
获取所述文本特征向量与所述基础地址数据信息中的各个基础地址特征向量之间的夹角,按照余弦定理计算所述夹角的余弦值,依据所述余弦值获得所述文本特征向量与各个基础地址特征向量之间的所述相似度;
选取与所述文本特征向量相似度最高且超过预设阈值的所述基础地址特征向量作为所述指定用户的基础地址数据。
6.根据权利要求1所述的室内指纹库构建方法,其特征在于,所述获取有效用户地址信息包括:
采用有限状态机对用户输入的地址信息进行验证,以获得所述有效用户地址信息。
7.根据权利要求1所述的室内指纹库构建方法,其特征在于,所述获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息包括:
通过S1-U接口和S1-MME接口获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息。
8.一种室内指纹库构建装置,其特征在于,所述装置包括:
第一获取模块,用于获取基础地址数据信息;
第二获取模块,用于获取有效用户地址信息;
第一匹配模块,用于建立所述基础地址数据信息与所述有效用户地址信息的匹配关系,生成符合预定要求的地址数据;
第三获取模块,用于获取所述有效用户的移动通信终端的测量报告数据,所述测量报告数据包括通信信号特征信息与相应的所述移动通信终端的位置信息;
第二匹配模块,用于将所述位置信息与所述符合预定要求的地址数据匹配生成室内地址数据;
指纹库构建模块,用于将所述有效用户的所述通信信号特征信息与对应的所述室内地址数据关联,构建室内指纹数据库数据。
9.一种室内指纹库构建设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711444709.0A CN108376141B (zh) | 2017-12-27 | 2017-12-27 | 室内指纹库构建方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711444709.0A CN108376141B (zh) | 2017-12-27 | 2017-12-27 | 室内指纹库构建方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108376141A true CN108376141A (zh) | 2018-08-07 |
CN108376141B CN108376141B (zh) | 2020-06-30 |
Family
ID=63016442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711444709.0A Active CN108376141B (zh) | 2017-12-27 | 2017-12-27 | 室内指纹库构建方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108376141B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110035392A (zh) * | 2018-11-09 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 设备是否位于目标区域的识别方法及装置和电子设备 |
CN110831015A (zh) * | 2018-08-14 | 2020-02-21 | 中国移动通信集团设计院有限公司 | 室分弱覆盖识别方法及装置 |
CN112987064A (zh) * | 2021-02-09 | 2021-06-18 | 北京百度网讯科技有限公司 | 建筑物定位方法、装置、设备、存储介质和终端设备 |
CN113079468A (zh) * | 2021-03-23 | 2021-07-06 | 西安交通大学 | 一种基于Wifi信号RSSI特征的室内定位方法、系统 |
CN113316249A (zh) * | 2021-07-08 | 2021-08-27 | 深圳市研强物联技术有限公司 | 一种基于IoT云提高穿戴设备定位准确度的方法及系统 |
CN114007188A (zh) * | 2022-01-04 | 2022-02-01 | 深圳市优网科技有限公司 | 一种目标用户定位方法、系统及存储介质 |
CN116184312A (zh) * | 2022-12-22 | 2023-05-30 | 泰州雷德波达定位导航科技有限公司 | 一种基于语义Wi-Fi的室内众源指纹库构建方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102402533A (zh) * | 2010-09-13 | 2012-04-04 | 方正国际软件有限公司 | 地址匹配方法及系统 |
CN102918875A (zh) * | 2010-04-07 | 2013-02-06 | 瑞典爱立信有限公司 | 使用城市地址信息的定位和位置服务 |
CN104113868A (zh) * | 2014-06-20 | 2014-10-22 | 浙江工业大学 | 利用众包维护的室内位置指纹库建立方法及系统 |
CN105188134A (zh) * | 2015-08-14 | 2015-12-23 | 长沙创客软件有限公司 | 一种移动终端定位系统及定位方法 |
CN105338498A (zh) * | 2015-09-29 | 2016-02-17 | 北京航空航天大学 | 一种WiFi室内定位系统中指纹库的构建方法 |
US20160371394A1 (en) * | 2015-06-22 | 2016-12-22 | The Governing Council Of The University Of Toronto | Indoor localization using crowdsourced data |
CN106547770A (zh) * | 2015-09-21 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 一种基于用户地址信息的用户分类、用户识别方法及装置 |
-
2017
- 2017-12-27 CN CN201711444709.0A patent/CN108376141B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102918875A (zh) * | 2010-04-07 | 2013-02-06 | 瑞典爱立信有限公司 | 使用城市地址信息的定位和位置服务 |
CN102402533A (zh) * | 2010-09-13 | 2012-04-04 | 方正国际软件有限公司 | 地址匹配方法及系统 |
CN104113868A (zh) * | 2014-06-20 | 2014-10-22 | 浙江工业大学 | 利用众包维护的室内位置指纹库建立方法及系统 |
US20160371394A1 (en) * | 2015-06-22 | 2016-12-22 | The Governing Council Of The University Of Toronto | Indoor localization using crowdsourced data |
CN105188134A (zh) * | 2015-08-14 | 2015-12-23 | 长沙创客软件有限公司 | 一种移动终端定位系统及定位方法 |
CN106547770A (zh) * | 2015-09-21 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 一种基于用户地址信息的用户分类、用户识别方法及装置 |
CN105338498A (zh) * | 2015-09-29 | 2016-02-17 | 北京航空航天大学 | 一种WiFi室内定位系统中指纹库的构建方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110831015A (zh) * | 2018-08-14 | 2020-02-21 | 中国移动通信集团设计院有限公司 | 室分弱覆盖识别方法及装置 |
CN110035392A (zh) * | 2018-11-09 | 2019-07-19 | 阿里巴巴集团控股有限公司 | 设备是否位于目标区域的识别方法及装置和电子设备 |
CN112987064A (zh) * | 2021-02-09 | 2021-06-18 | 北京百度网讯科技有限公司 | 建筑物定位方法、装置、设备、存储介质和终端设备 |
CN113079468A (zh) * | 2021-03-23 | 2021-07-06 | 西安交通大学 | 一种基于Wifi信号RSSI特征的室内定位方法、系统 |
CN113079468B (zh) * | 2021-03-23 | 2022-12-09 | 西安交通大学 | 一种基于Wifi信号RSSI特征的室内定位方法、系统 |
CN113316249A (zh) * | 2021-07-08 | 2021-08-27 | 深圳市研强物联技术有限公司 | 一种基于IoT云提高穿戴设备定位准确度的方法及系统 |
CN113316249B (zh) * | 2021-07-08 | 2022-12-02 | 深圳市研强物联技术有限公司 | 一种基于IoT云提高穿戴设备定位准确度的方法及系统 |
CN114007188A (zh) * | 2022-01-04 | 2022-02-01 | 深圳市优网科技有限公司 | 一种目标用户定位方法、系统及存储介质 |
CN116184312A (zh) * | 2022-12-22 | 2023-05-30 | 泰州雷德波达定位导航科技有限公司 | 一种基于语义Wi-Fi的室内众源指纹库构建方法 |
CN116184312B (zh) * | 2022-12-22 | 2023-11-21 | 泰州雷德波达定位导航科技有限公司 | 一种基于语义Wi-Fi的室内众源指纹库构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108376141B (zh) | 2020-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108376141A (zh) | 室内指纹库构建方法、装置、设备及存储介质 | |
CN107798557B (zh) | 电子装置、基于lbs数据的服务场所推荐方法及存储介质 | |
US8321375B2 (en) | Search data update method and search data update system | |
CN101965500A (zh) | 用于呈现位置信息的图形用户界面 | |
CN109996279A (zh) | 过覆盖小区定位方法、装置、设备及介质 | |
CN104596531A (zh) | 一种导航路线的生成方法、装置及服务器 | |
CN108304423A (zh) | 一种信息识别方法及装置 | |
US20100204917A1 (en) | Map data distribution server and method for processing map data | |
CN107368480B (zh) | 一种兴趣点数据错误类型定位、重复识别方法及装置 | |
CN112240773A (zh) | 导航方法、装置、计算机装置及可读存储介质 | |
CN103644921B (zh) | 一种实现街景显示的方法和装置 | |
KR102149914B1 (ko) | 클라우드 소싱 기반 관심 지점 정보 업데이트 방법, 및 이를 위한 장치 | |
CN111382765B (zh) | 投诉热点区域聚类方法、装置、设备、介质 | |
CN110796060A (zh) | 高速行车路线确定方法、装置、设备和存储介质 | |
JP5903955B2 (ja) | 目的位置までの経路を決定するためのシステム及び方法 | |
CN111382138A (zh) | Poi数据处理方法、装置、设备及介质 | |
KR101049817B1 (ko) | 이종 장치에 관심 지점 정보를 제공하는 방법 및 그 시스템 | |
CN103218406B (zh) | 兴趣点的地址信息的处理方法及设备 | |
CN110110015B (zh) | 信息点数据处理方法、处理装置及计算机可读存储介质 | |
CN114117261B (zh) | 轨迹检测方法、装置、电子设备及存储介质 | |
CN112861532B (zh) | 地址标准化处理方法、装置、设备及在线搜索系统 | |
Chen et al. | Optimal region search with submodular maximization | |
CN106940189B (zh) | 导航系统中的经典线路获取方法、装置 | |
CN112579713B (zh) | 地址识别方法、装置、计算设备及计算机存储介质 | |
TWI451791B (zh) | 搜尋聯絡人的方法、電子裝置及電腦程式產品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |