CN112000901A

CN112000901A - 一种提取地理位置点空间关系的方法和装置

Info

Publication number: CN112000901A
Application number: CN202010872307.6A
Authority: CN
Inventors: 黄际洲; 张昊; 王海峰
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-08-26
Filing date: 2020-08-26
Publication date: 2020-11-27
Anticipated expiration: 2040-08-26
Also published as: EP3961422A1; JP2022040063A; JP7298090B2; US20220067372A1; US11615613B2; KR20220027000A; KR102565798B1; CN112000901B

Abstract

本申请公开了一种提取地理位置点空间关系的方法和装置，涉及大数据技术领域。具体实现方案为：对各终端设备采集的实景图像进行招牌识别，确定实景图像中包含的地理位置点对；获取同一终端设备采集的包含同一地理位置点对的至少两张实景图像；利用所述至少两张实景图像的拍摄参数，确定所述同一地理位置点对的空间关系。通过本申请提取的地理位置点空间关系具备更高的准确率和覆盖率。

Description

一种提取地理位置点空间关系的方法和装置

技术领域

本申请涉及计算机应用技术领域，特别涉及大数据技术领域中提取地理位置点空间关系的方法和装置。

背景技术

地图主要的目标就是刻画真实世界，让用户的出行更简单。地理位置点的高精知识图谱是满足用户在地图找点和出行等核心诉求的基础。而地理位置点空间关系是知识图谱的必备要素之一，可以实现对地理位置点进行辅助描述以及实现更准确的逻辑推理查询。

发明内容

有鉴于此，本申请提供了一种提取地理位置点空间关系的方法、装置、设备和计算机存储介质。

第一方面，本申请提供了一种提取地理位置点空间关系的方法，包括：

对各终端设备采集的实景图像进行招牌识别，确定实景图像中包含的地理位置点对；

获取同一终端设备采集的包含同一地理位置点对的至少两张实景图像；

利用所述至少两张实景图像的拍摄参数，确定所述同一地理位置点对的空间关系。

第二方面，本申请提供了一种提取地理位置点空间关系的装置，包括：

地理位置点提取模块，用于对各终端设备采集的实景图像进行招牌识别，确定实景图像中包含的地理位置点对；

空间关系生成模块，用于获取同一终端设备采集的包含同一地理位置点对的至少两张实景图像；利用所述至少两张实景图像的拍摄参数，确定所述同一地理位置点对的空间关系。

第三方面，本申请还提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上中任一项所述的方法。

第四方面，本申请还提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行如上中任一项所述的方法。

上述可选方式所具有的效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1示出了可以应用本申请实施例一提供的示例性系统架构图；

图2为本申请实施例二提供的主要方法流程图；

图3为本申请实施例二提供的实景图像的实例图；

图4为本申请实施例三提供的详细方法流程图；

图5为本申请实施例三提供的利用拍摄参数计算地理位置点坐标的示意图；

图6为本申请实施例四提供的装置结构图；

图7是用来实现本申请实施例的方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

目前，地理位置点空间关系的确定方式主要有以下两种：

第一种方法是利用具有定位功能的设备上报的地理位置点的坐标自动生成，但是该方法依赖坐标的准确度，而地理位置点的坐标误差一般在几十米甚至百米以上，导致该方法生成的地理位置点空间关系不准确。

例如，几十米甚至几百米的误差会导致地理位置点空间关系的误差甚至跨越几个街道。

再例如，由于不同设备针对同一地理位置点上报的坐标信息可能存在一定误差或精度不同，如果武断地对一定范围内同名的地理位置点进行去重，则可能会误伤原本就距离比较接近的连锁机构。

第二种方法是人工对地理位置点空间关系进行标注，但这种方式效率低下、覆盖面有限。

针对于此，本申请的核心思想在于，利用招牌识别的方式确定图像中包含的地理位置点，利用同一终端设备采集的包含同一地理位置点对的至少两张图像的拍摄参数，来确定该同一地理位置点对的空间关系。下面结合实施例对本申请进行详细描述。

实施例一

图1示出了可以应用本申请实施例的方法或装置的示例性系统架构。如图1所示，该系统架构可以包括终端设备101和102，网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101和102通过网络103与服务器104交互。终端设备101和102上可以安装有各种应用，例如地图类应用、网页浏览器应用、通信类应用等。

终端设备101和102可以是能够运行地图类应用的各类用户设备。包括但不限于智能手机、平板电脑、PC、智能电视等等。本申请所提供的提取地理位置点空间关系的装置可以设置并运行于上述服务器104中，也可以运行于独立于服务器104的设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务)，也可以实现成单个软件或软件模块，在此不做具体限定。服务器104可以与地图数据库105之间进行交互，具体地，服务器104可以从地图数据库105中获取数据，也可以将数据存储于地图数据库105中。地图数据库105中存储有包括POI信息的地图数据。

例如，提取地理位置点空间关系的装置设置并运行于上述服务器104中，服务器104采用本申请实施例提供的方法进行地理位置点空间关系的提取，然后利用获取的地理位置点的空间关系更新地图数据库105。服务器104能够响应于终端设备101、102的查询请求，查询地图数据库105，并向终端设备101、102返回所查询地理位置点的相关信息，包括基于地理位置点空间关系所产生的信息。

服务器104可以是单一服务器，也可以是多个服务器构成的服务器群组。另外104除了以服务器的形式存在之外，也可以是具有较高计算性能的其他计算机系统或处理器。应该理解，图1中的终端设备、网络、服务器和数据库的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络、服务器和数据库。

本申请中涉及的地理位置点指的是地图类应用中的地理位置点，该地理位置点可以供用户查询、浏览，向用户展现等。这些地理位置点具有经纬度、名称、行政地址、类型等基本属性的描述。其中地理位置点可以包括但不限于POI(Point Of Interest，兴趣点)、AOI(Area of Interest，兴趣面)、ROI(Regin of Interest，兴趣区域)等。在后续实施例中均以POI为例进行描述。POI是地理信息系统中的一个术语，泛指一切可以抽象为点的地理对象，一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站、一所学校、一个医院，等等。POI的主要用途是对事物或事件的位置进行描述，从而增强对事物或事件位置的描述能力和查询能力。

实施例二、

图2为本申请实施例二提供的主要方法流程图，如图2中所示，该方法可以包括以下步骤：

在201中，对各终端设备采集的实景图像进行招牌识别，确定实景图像中包含的地理位置点对。

在本申请中，利用的是终端设备对地理位置点进行拍摄得到的实景图像来确定地理位置点之间的空间关系。因此，获取各终端设备采集的实景图像后，可以对实景图像进行招牌识别，筛选出包含至少两个招牌的实景图像。然后对包含至少两个招牌的实景图像进行招牌的文字识别，确定实景图像中包含的地理位置点对。本申请中涉及的地理位置点对由两个不同的地理位置点构成。

其中，实景图像指的是终端设备在实地对地理位置点进行拍摄得到的图像。本申请中使用的实景图像需要包含至少两个招牌，以便后续利用实景图像的拍摄参数确定两个招牌所对应地理位置点之间的空间关系。所谓招牌指的是挂在地理位置点对应的建筑物门前作为标志的牌子。例如在店铺门口挂出的店名招牌、在学校门口的学校名称的招牌，等等。

本步骤实际上是从实景图像中挖掘地理位置点对的过程，例如从图3所示的实景图像中，挖掘出地理位置点对：(张一元茶庄，大明眼镜)。该部分的具体实现将在后续实施例三中进行详细描述。

在202中，获取同一终端设备采集的包含同一地理位置点对的至少两张实景图像。

挖掘出各实景图像的地理位置点对之后，可以利用各地理位置点对建立实景图像的倒排索引。本步骤可以通过查找倒排索引来获取同一地理位置点对的实景图像，但需要保证获取的实景图像是同一终端设备采集的，且数量为至少两张。

在203中，利用至少两张实景图像的拍摄参数，确定所述同一地理位置点对的空间关系。

本步骤中涉及的拍摄参数主要包括：

1)实景图像的定位坐标即拍摄该实景图像的拍摄点的坐标，通常终端设备在进行图像拍摄时，会获取终端设备当前的定位坐标作为所拍摄图像的定位坐标。

2)对实景图像中地理位置点对的招牌的拍摄角度和拍摄距离。

由于拍摄设备的设置或功能上的原因，有些实景图像具备上述拍摄参数，有些实景图像则不具备上述拍摄参数。在本申请中，仅获取并利用具备上述拍摄参数的实景图像来确定地理位置点对的空间关系。

本步骤中主要利用实景图像的上述拍摄参数，基于诸如正弦定理和余弦定理等几何关系进行计算，从而得到地理位置点对中两个地理位置点的坐标；基于两个地理位置点的坐标，确定两个地理位置点的空间关系。

本申请实施例中涉及的空间关系的信息可以包括：空间关系的类型和取值。空间关系的类型主要包括一些方位上的空间关系类型，例如东、南、西、北、东南、东北、西南、西北、左边、右边、楼上、楼下等等。取值可以包括距离的取值、楼层的取值等等。可以看出，地理位置点的空间关系是相对的。

下面结合实施例三对本申请上述方法的具体实现方式进行详细描述。

实施例三

图4为本申请实施例三提供的详细方法流程图，如图4中所示，该方法可以包括以下步骤：

在401中，从图像库获取各终端设备采集的实景图像。

对于各终端设备采集并上报的实景图像可以存储于图像库中，图像库是本申请中提取地理位置点空间关系的基础。在图像库中存储的各实景图像有些具备拍摄参数，有些不具备拍摄参数，有些可能具备部分拍摄参数，等等。在本实施例中，在从实景图像中挖掘地理位置点对过程中利用的实景图像至少具备实景图像的定位坐标信息，还可以进一步要求具备拍摄时间信息。后续在确定地理位置点的空间关系时，还要求实景图像进一步具备拍摄角度等信息。

在402中，对实景图像进行招牌判别，筛选出包含至少两个招牌的实景图像。

对于终端设备拍摄的大量实景图像中，可能存在一些实景图像不包含招牌或者仅包含一个招牌，这类实景图像是无法用于本申请中确定地理位置点的空间关系的。因此，需要筛选出包含至少两个招牌的实景图像。

在对实景图像进行招牌判别时，可以利用预先训练得到的招牌判别模型。首先对实景图像进行区域划分，因为一般情况下实景图像中的招牌是一个封闭区域，因此可以对实景图像进行区域的识别和划分，对于确定出的封闭区域输入招牌判别模型，由招牌判别模型输出该封闭区域是否为招牌区域的判别结果。

其中招牌判别模型实际上是一个分类模型，可以预先收集一些实景图像在其中标注出招牌区域和非招牌区域分别作为正、负样本，然后训练分类模型而得到该招牌判别模型。

在403中，基于实景图像之间的定位距离，对筛选出的实景图像进行聚类，得到一个以上的相似定位类簇。

终端设备在对相同的地理位置点进行拍摄时，往往拍摄位置是比较接近的，因此在提取地理位置点对时，考虑从拍摄位置接近的实景图像中来提取，一方面降低计算量，另一方面也排除一些实景图像中包含的招牌显示但拍摄位置差别很大的特殊情况。例如，终端设备在北京西单商圈拍摄到一张实景图像中包含“链家”和“审美美容美发”的招牌，在北京上地商圈拍摄到一张实景图像中也包含“链家”和“审美美容美发”的招牌。由于连锁店的招牌都相同或相似，若采用这两张实景图像来确定链家审美两个地理位置点的空间关系，显然会造成错误。因此，作为一种优选的实施方式，可以基于实景图像之间的定位距离对实景图像进行聚类，使得定位坐标相近的实景图像聚为一类，以从中来提取地理位置点。也就是说，各相似定位类簇中包含的实景图像都是拍摄位置比较接近的。

其中本申请并不限制聚类所采用的具体方式，可以采用诸如K-means、DBSCAN(Density-Based Spatial Clustering of Applications with Noise，基于密度的聚类算法)、GMM(Gaussian Mixed Model，高斯混合模型)等聚类方式。

在404中，分别对各相似定位类簇中的图像进一步基于内容相似度进行聚类，得到一个以上的相似内容类簇。

本步骤实际上是从拍摄位置相近的实景图像中提取包含相同地理位置点的实景图像。其中的聚类处理分别针对各相似定位类簇执行。

图像之间的相似度计算可以基于图像的特征，例如可以从图像中提取旋转不变、尺度不变的特征，例如采用Harris Corner(焦点检测算法)，、SIFT(Scale-invariantfeature transform，尺度不变特征变换)算法、SURF(Speeded Up Robust Features，加速稳健特征)算法等进行特征提取。然后通过计算所提取特征之间的相似度来确定图像之间的相似度，相似度满足要求的被聚为一类。

在一些情况下，随着时间的推移，地理位置点会发生变化，例如，某些店铺新开张、某些店铺更换地点，等等。为了保证获取的地理位置点信息是最新的，在本步骤中可以先分别将各相似定位类簇中的图像按照拍摄时间进行划分，得到各时间段拍摄的图像；然后选取最近时间段拍摄的图像；将同一相似定位类簇中最近时间段拍摄的图像基于内容相似度进行聚类。

在405中，分别对各相似内容类簇中的实景图像进行招牌判别，确定招牌区域。

本步骤中进行招牌判别的方式与上述步骤402中类似，在此不做赘述。

在406中，对各实景图像中确定出的招牌区域进行ID(标识)唯一化处理。

ID唯一化处理目的是使得各实景图像中指代同一招牌的招牌区域采用同一个ID。其中指代同一招牌的招牌区域可以基于相似度来计算。相似度计算同样可以是从招牌区域中提取旋转不变、尺度不变的特征，例如采用Harris Corner、SIFT、SURF算法等进行特征提取，然后通过计算所提取特征之间的相似度来确定招牌区域之间的相似度。若招牌区域之间的相似度超过预设的相似度阈值，则认为其指代同一招牌，采用同一个ID。指代不同招牌的招牌区域则采用不同的ID。ID的分配方式本申请不加以限制。

在407中，确定各实景图像包含的招牌区域ID序列并从中获取频繁项序列。

对于每一个实景图像而言，可以按照预设的排列顺序对各招牌区域的ID进行排列，得到实景图像的招牌区域ID序列。例如，采用优先从左至右辅助从上到下的顺序。举个例子，可以依据各招牌区域的左上角的像素点位置，从左至右对各招牌区域ID进行排列，若两个以上的招牌区域的像素点位置在竖直方向相同，则采用从上到下的顺序对该两个以上的招牌区域ID进行排列。当然，除了依据各招牌区域的左上角的像素点位置之前，也可以依据其他像素点位置，例如都统一依据各招牌区域中心点的位置等，主要采用的像素点位置统一即可。

经过上述序列化处理后，相似内容类簇中所有实景图像都分别存在一个招牌区域ID序列。可以采用序列模式挖掘算法，对相似内容类簇中所有实景图像的招牌区域ID序列进行挖掘，获取频繁项序列。其中，若仅存在一个频繁项序列，则保留该频繁项序列。若存在多个频繁项序列，则可以获取出现最频繁的频繁项序列。假设各频繁项序列记为<ID₁,ID₂,ID₃,ID₄,...,ID_n＞,n为频繁项序列包含的ID数量。

其中序列模式挖掘算法可以采用但不限于诸如Apriori算法(关联分析原始挖掘算法)、FreeSpan算法(频繁模式投影挖掘算法)、PrefixSpan算法(从FreeSpan演化的另外一种算法)等。鉴于序列模式挖掘算法为现有较为成熟的算法，在此不做详述。

在408中，对频繁项序列中各ID对应的招牌区域进行文字识别。

文字识别方式可以是诸如OCR(Optical Character Recognition，光学字符识别)等现有较为成熟的文字识别方式。若针对频繁项序列中同一ID对应的招牌区域识别得到多个文字识别结果，则从多个文字识别结果中选择置信度最高的一个。

其中在确定置信度最高的文字识别结果时，可以基于出现次数、出现频率等来确定。例如，可以将同一ID对应的多个文字识别结果中，出现次数最多的一个作为该ID的文字识别结果。频繁项序列对应的出现次数最多的文字识别结果也可以采用序列模式挖掘算法来确定。

频繁项序列＜ID₁，ID₂，ID₃，ID₄，...，ID_n＞得到的文字识别结果可表示为：

＜(ID₁，TEXT₁)，(ID₂，TEXT₂)，(ID₃，TEXT₃)，(ID₄，TEXT₄)，...，(ID_n，TEXT_n)＞。

其中，TEXT表示文字识别结果。

在409中，针对包含频繁项序列的实景图像，从频繁项序列中选择n-1个地理位置点对，该n-1个地理位置点对构成的集合包含该频繁项序列中所有招牌ID对应的地理位置点，且各地理位置点对在实景图像中对应的招牌距离之和最小，n为频繁项序列中包含的招牌数量。

举个例子，假设一个频繁项序列中包含四个招牌ID：ID₁，ID₂，ID₃，ID₄，这四个招牌ID可以组合成多种地理位置点对的组合，组合方式非常多。但本申请上述步骤409所采用的优选方式中，选择出的地理位置点对的组合为＜(ID₁，ID₂)，(ID₂，ID₃)，(ID₃，ID₄)＞，这种组合方式包含所有四个招牌ID，且ID₁与ID₂对应的招牌距离、ID₂与ID₃对应的招牌距离、ID₃与ID₄对应的招牌距离之和是最小的。其它地理位置点对之间的空间关系，实际上是可以根据这些最近地理位置点对推导而来。例如确定了ID₁与ID₂对应的地理位置点之间的空间关系、ID₂与ID₃对应的地理位置点之间的空间关系，则就可以推导出ID₁与与ID₃对应的地理位置点之间的空间关系。

本步骤中选择地理位置点对的方式基于的是最相近地理位置对的方式，这种方式能够最大程度的减小计算量，提高计算效率。但很容易理解地，也可以采用其他选择方式。

在410中，利用各地理位置点对建立实景图像的倒排索引。

建立倒排索引之后，通过地理位置点就能够快速查询到包含该地理位置点的实景图像有哪些。

在411中，查询倒排索引，获取同一终端设备采集的包含同一地理位置点对的至少两张实景图像。

获取的这些实景图像中，需要均具备实景图像的定位坐标信息、拍摄角度等拍摄参数。

在412中，利用至少两张实景图像的定位坐标、对地理位置点对的招牌的拍摄角度，进行基于几何关系的计算，得到该地理位置点对中两个地理位置点的坐标。

以图5为例，假设同一终端设备拍摄的两张实景图像中均包含地理位置点M和地理位置点N构成的地理位置点对。第一张实景图像中对应的拍摄位置坐标为拍摄点A，图中的夹角α和β可以由拍摄角度确定。第二张实景图像中对应的拍摄位置坐标为拍摄点B，图中的夹角γ和δ可以由拍摄角度确定。两个拍摄点之间的距离x可以由两张实景图像的定位坐标得到。

根据正弦定理，可以得到地理位置点M与拍摄点A的距离P，以及地理位置点N与拍摄点A的距离Q：

根据这些距离信息和夹角信息、拍摄点A和B的定位坐标，就可以确定出两个地理位置点的坐标。

另外需要说明的是，由于同一终端设备可能会拍摄包含同一地理位置点对(M，N)的实景图像数量多于两张，而通过本步骤中的方式实际上可以利用两两的实景图像确定出上述地理位置点M和N的多个坐标。对于这种情况，可以将确定出的地理位置点M的多个坐标进行诸如求平均、取聚类中心、求中值等方式进行处理后，得到地理位置点M的坐标。同理将确定出的地理位置点N的多个坐标进行诸如求平均、取聚类中心、求中值等方式进行处理后，得到地理位置点N的坐标。

在413中，基于两个地理位置点的坐标，确定两个地理位置点的空间关系。

在得到两个地理位置点的坐标之后，就能够确定出两个地理位置点在空间上的相对位置关系，例如在方向上的关系以及距离关系等。

本申请实施例中涉及的空间关系的信息可以包括：空间关系的类型和取值。空间关系的类型主要包括一些方位上的空间关系类型，例如东、南、西、北、东南、东北、西南、西北、左边、右边、楼上、楼下等等。空间关系类型的种类由人工预先定义好，通过本申请实施例中的方式确定两个地理位置点的空间关系类型具体属于哪一种。取值可以包括距离的取值、楼层的取值等等。例如，确定出地理位置点M和N的空间关系类型为：向东20米。

可以看出，确定出的地理位置点的空间关系是相对的。传统的现有技术中是基于地理位置点的定位坐标来确定地理位置点的空间关系，但由于两个地理位置点的定位坐标可能由不同终端设备进行定位后上报得到，定位坐标的误差会严重影响地理位置点之间的空间关系。而本申请中，地理位置点的坐标是由同一设备拍摄的实景图像得到，即便终端设备定位的拍摄位置坐标会存在误差，但同一设备拍摄的两张实景图像的定位误差是相近的，特别是同一设备在距离相近的拍摄点可以认为定位误差是相同的，例如都向北偏移了50米。但由同一设备拍摄的两者实景图像确定出的两个地理位置点的相对位置关系，则因为都向西偏移了50米而相对不存在误差。

另外，这种方式只要存在终端设备上传了包含同一地理位置对的至少两张实景图像，即可实现对该地理位置对中两个地理位置点空间关系的提取，相比较传统的现有技术中通过人工标注空间关系的方式，覆盖面更大，效率更高。

在414中，采用四元组的形式，对地理位置点的空间关系进行存储和维护。

在通过本申请实施例所提供的方式提取出地理位置点空间关系后，可以采用<地理位置点1，地理位置点2，空间关系类型，空间关系取值>的四元组格式，使得空间关系的表达更规范统一，使得空间关系知识的系统化的计算、推理、存储成为可能。例如，表示成一个四元组R＝<S,O,P,A>，其中，S和O为地理位置点的信息，例如可以采用地理位置点的唯一ID，P为空间关系类型，A为空间关系取值。

通过上述实施例中所示的方法，可以实现诸如如下应用场景：

用户输入query(查询)“清华科技园在哪”，如果数据库中有以下地理位置点空间关系：<清华科技园，清华大学东南门，南，100米>，通过这个空间关系，我们可以准确地给出答案“清华科技园在清华大学东南门向南100米”。

另外，也可以根据多个关联地理位置点对的空间关系进行推理，得到新的地理位置点对的空间关系。例如，存在以下地理位置点空间关系：<清华科技园，清华大学东南门，南，100米>，<华清嘉园，清华科技园，南，200米>，则可以推理得到：<华清嘉园，清华大学东南门，南，300米>。当用户输入query“华清嘉园在哪”，就可以向用户返回答案“华清嘉园在清华大学东南门向南300米”。

以上是对本申请所提供的方法进行的详细描述，下面结合实施例四对本申请提供的装置进行详细描述。

图6为本申请实施例四提供的装置结构图，装置是可以位于服务器端的应用，或者还可以为位于服务器端的应用中的插件或软件开发工具包(Software Development Kit，SDK)等功能单元，或者，还可以位于计算机系统，本发明实施例对此不进行特别限定。如图6中所示，该装置可以包括：地理位置点提取模块00和空间关系生成模块10，还可以包括索引维护单元20、四元组维护单元30。其中各组成模块的主要功能如下：

地理位置点提取模块00，用于对各终端设备采集的实景图像进行招牌识别，确定实景图像中包含的地理位置点对。

空间关系生成模块10，用于获取同一终端设备采集的包含同一地理位置点对的至少两张实景图像；利用至少两张实景图像的拍摄参数，确定同一地理位置点对的空间关系。

具体地，上述地理位置点提取模块00可以包括：第一获取子模块01、图像筛选子模块02和文字识别子模块03，还可以包括第一聚类子模块04和第二聚类子模块05。

其中，第一获取子模块01，用于获取各终端设备采集的实景图像。

对于各终端设备采集并上报的实景图像可以存储于图像库中，图像库是本申请中提取地理位置点空间关系的基础。在图像库中存储的各实景图像有些具备拍摄参数，有些不具备拍摄参数，有些可能具备部分拍摄参数，等等。在本实施例中，地理位置点提取模块00，利用的实景图像至少具备实景图像的定位坐标信息，还可以进一步要求具备拍摄时间信息。空间关系生成模块10获取的实景图像会要求实景图像进一步具备拍摄角度等信息。

图像筛选子模块02，用于对实景图像进行招牌判别，筛选出包含至少两个招牌的实景图像。

文字识别子模块03，用于对包含至少两个招牌的实景图像进行招牌的文字识别，确定实景图像中包含的地理位置点对。

优选地，第一聚类子模块04，用于基于实景图像之间的定位距离，对图像筛选子模块02筛选出的包含至少两个招牌的实景图像进行聚类，得到一个以上的相似定位类簇。

第二聚类子模块05，用于分别对各相似定位类簇中的图像进一步基于内容相似度进行聚类，得到一个以上的相似内容类簇。

在一些情况下，随着时间的推移，地理位置点会发生变化，例如，某些店铺新开张、某些店铺更换地点，等等。为了保证获取的地理位置点信息是最新的，第二聚类子模块05可以分别将各相似定位类簇中的图像按照拍摄时间进行划分，得到各时间段拍摄的图像；选取最近时间段拍摄的图像；将同一相似定位类簇中最近时间段拍摄的图像基于内容相似度进行聚类。

文字识别子模块03，具体用于分别对各相似内容类簇中的实景图像进行招牌的文字识别。

具体地，文字识别子模块03在对包含至少两个招牌的实景图像进行招牌的文字识别时，可以对包含至少两个招牌的实景图像进行招牌判别，确定招牌区域；对各实景图像中确定出的招牌区域进行标识唯一化处理，以使得各实景图像中指代同一招牌的招牌区域采用同一个标识；确定各实景图像包含的招牌区域标识序列并从中获取频繁项序列；对频繁项序列中各标识对应的招牌区域进行文字识别。

其中，若针对频繁项序列中同一标识对应的招牌区域识别得到多个文字识别结果，则文字识别子模块03可以从多个文字识别结果中选择置信度最高的一个。

作为一种优选的实施方式，文字识别子模块03在确定实景图像中包含的地理位置点对时，可以针对包含频繁项序列的实景图像，从频繁项序列中选择n-1个地理位置点对，n-1个地理位置点对构成的集合包含该频繁项序列中所有标识对应的地理位置点，且各地理位置点对在实景图像中对应的招牌距离之和最小，n为频繁项序列中包含的招牌数量。

索引维护单元20，用于利用各地理位置点对建立实景图像的倒排索引。

空间关系生成模块10可以具体包括：第二获取子模块11和关系生成子模块12。

其中，第二获取子模块11，用于查询倒排索引以获取同一终端设备采集的包含同一地理位置点对的至少两张实景图像。

关系生成子模块12，用于利用至少两张实景图像的定位坐标、对地理位置点对的招牌的拍摄角度，进行基于几何关系的计算，得到地理位置点对中两个地理位置点的坐标；基于两个地理位置点的坐标，确定两个地理位置点的空间关系。

四元组维护单元30，用于采用四元组的形式，存储两个地理位置点的空间关系；其中四元组包括：两个地理位置点的信息、空间关系类型和空间关系取值。

其中，空间关系的信息可以包括：空间关系的类型和取值。空间关系的类型主要包括一些方位上的空间关系类型，例如东、南、西、北、东南、东北、西南、西北、左边、右边、楼上、楼下等等。空间关系类型的种类由人工预先定义好，通过本申请实施例中的方式确定两个地理位置点的空间关系类型具体属于哪一种。取值可以包括距离的取值、楼层的取值等等。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图7所示，是根据本申请实施例的提取地理位置点空间关系的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图7所示，该电子设备包括：一个或多个处理器701、存储器702，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。

存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的提取地理位置点空间关系的方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的提取地理位置点空间关系的方法。

存储器702作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的提取地理位置点空间关系的方法对应的程序指令/模块。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的提取地理位置点空间关系的方法。

存储器702可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据该电子设备的使用所创建的数据等。此外，存储器702可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器702可选包括相对于处理器701远程设置的存储器，这些远程存储器可以通过网络连接至该电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

该电子设备还可以包括：输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接，图7中以通过总线连接为例。

输入装置703可接收输入的数字或字符信息，以及产生与该电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种提取地理位置点空间关系的方法，包括：

2.根据权利要求1所述的方法，其中，所述对各终端设备采集的实景图像进行招牌识别，确定实景图像中包含的地理位置点对包括：

获取各终端设备采集的实景图像；

对所述实景图像进行招牌判别，筛选出包含至少两个招牌的实景图像；

对包含至少两个招牌的实景图像进行招牌的文字识别，确定实景图像中包含的地理位置点对。

3.根据权利要求2所述的方法，在所述对包含至少两个招牌的实景图像进行招牌的文字识别之前，还包括：

基于实景图像之间的定位距离，对筛选出的所述包含至少两个招牌的实景图像进行聚类，得到一个以上的相似定位类簇；

分别对各相似定位类簇中的图像进一步基于内容相似度进行聚类，得到一个以上的相似内容类簇；

分别对各相似内容类簇中的实景图像进行所述招牌的文字识别。

4.根据权利要求3所述的方法，其中，所述分别对各相似定位类簇中的图像进一步基于内容相似度进行聚类包括：

分别将各相似定位类簇中的图像按照拍摄时间进行划分，得到各时间段拍摄的图像；

选取最近时间段拍摄的图像；

将同一相似定位类簇中最近时间段拍摄的图像基于内容相似度进行聚类。

5.根据权利要求2所述的方法，其中，所述对包含至少两个招牌的实景图像进行招牌的文字识别包括：

对所述包含至少两个招牌的实景图像进行招牌判别，确定招牌区域；

对各实景图像中确定出的招牌区域进行标识唯一化处理，以使得各实景图像中指代同一招牌的招牌区域采用同一个标识；

确定各实景图像包含的招牌区域标识序列并从中获取频繁项序列；

对所述频繁项序列中各标识对应的招牌区域进行文字识别。

6.根据权利要求5所述的方法，其中，对所述频繁项序列中各标识对应的招牌区域进行文字识别包括：

若针对所述频繁项序列中同一标识对应的招牌区域识别得到多个文字识别结果，则从所述多个文字识别结果中选择置信度最高的一个。

7.根据权利要求5所述的方法，其中，所述确定实景图像中包含的地理位置点对包括：

针对包含频繁项序列的实景图像，从所述频繁项序列中选择n-1个地理位置点对，所述n-1个地理位置点对构成的集合包含该频繁项序列中所有标识对应的地理位置点，且各地理位置点对在实景图像中对应的招牌距离之和最小，所述n为所述频繁项序列中包含的招牌数量。

8.根据权利要求1所述的方法，在所述确定实景图像中包含的地理位置点对之后，还包括：利用各地理位置点对建立实景图像的倒排索引；

查询所述倒排索引以执行所述获取同一终端设备采集的包含同一地理位置点对的至少两张实景图像。

9.根据权利要求1所述的方法，其中，利用所述至少两张实景图像的拍摄参数，确定所述同一地理位置点对的空间关系包括：

利用所述至少两张实景图像的定位坐标、对所述地理位置点对的招牌的拍摄角度，进行基于几何关系的计算，得到所述地理位置点对中两个地理位置点的坐标；

基于两个地理位置点的坐标，确定所述两个地理位置点的空间关系。

10.根据权利要求1至9中任一项所述的方法，该方法还包括：

采用四元组的形式，存储所述两个地理位置点的空间关系；

其中所述四元组包括：所述两个地理位置点的信息、空间关系类型和空间关系取值。

11.一种提取地理位置点空间关系的装置，包括：

12.根据权利要求11所述的装置，其中，所述地理位置点提取模块包括：

第一获取子模块，用于获取各终端设备采集的实景图像；

图像筛选子模块，用于对所述实景图像进行招牌判别，筛选出包含至少两个招牌的实景图像；

文字识别子模块，用于对包含至少两个招牌的实景图像进行招牌的文字识别，确定实景图像中包含的地理位置点对。

13.根据权利要求12所述的装置，所述地理位置点提取模块还包括：

第一聚类子模块，用于基于实景图像之间的定位距离，对所述图像筛选子模块筛选出的所述包含至少两个招牌的实景图像进行聚类，得到一个以上的相似定位类簇；

第二聚类子模块，用于分别对各相似定位类簇中的图像进一步基于内容相似度进行聚类，得到一个以上的相似内容类簇；

所述文字识别子模块，具体用于分别对各相似内容类簇中的实景图像进行所述招牌的文字识别。

14.根据权利要求13所述的装置，其中，所述第二聚类子模块，具体用于分别将各相似定位类簇中的图像按照拍摄时间进行划分，得到各时间段拍摄的图像；选取最近时间段拍摄的图像；将同一相似定位类簇中最近时间段拍摄的图像基于内容相似度进行聚类。

15.根据权利要求12所述的装置，其中，所述文字识别子模块，在对包含至少两个招牌的实景图像进行招牌的文字识别时，具体执行：

对所述频繁项序列中各标识对应的招牌区域进行文字识别。

16.根据权利要求15所述的装置，其中，所述文字识别子模块，在确定实景图像中包含的地理位置点对时，具体执行：

17.根据权利要求11所述的装置，还包括：

索引维护单元，用于利用各地理位置点对建立实景图像的倒排索引；

所述空间关系生成模块包括：

第二获取子模块，用于查询所述倒排索引以获取同一终端设备采集的包含同一地理位置点对的至少两张实景图像。

18.根据权利要求11所述的装置，其中，所述空间关系生成模块包括：

关系生成子模块，用于利用所述至少两张实景图像的定位坐标、对所述地理位置点对的招牌的拍摄角度，进行基于几何关系的计算，得到所述地理位置点对中两个地理位置点的坐标；基于两个地理位置点的坐标，确定所述两个地理位置点的空间关系。

19.根据权利要求11至18中任一项所述的装置，还包括：

四元组维护单元，用于采用四元组的形式，存储所述两个地理位置点的空间关系；其中所述四元组包括：所述两个地理位置点的信息、空间关系类型和空间关系取值。

20.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。

21.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。