CN112015937A - 一种图片地理定位方法及系统 - Google Patents
一种图片地理定位方法及系统 Download PDFInfo
- Publication number
- CN112015937A CN112015937A CN202010897189.4A CN202010897189A CN112015937A CN 112015937 A CN112015937 A CN 112015937A CN 202010897189 A CN202010897189 A CN 202010897189A CN 112015937 A CN112015937 A CN 112015937A
- Authority
- CN
- China
- Prior art keywords
- picture
- geographic
- classification
- pictures
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 239000013598 vector Substances 0.000 claims abstract description 95
- 238000013145 classification model Methods 0.000 claims abstract description 26
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims description 25
- 238000012549 training Methods 0.000 claims description 16
- 238000002372 labelling Methods 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 8
- 238000007621 cluster analysis Methods 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/587—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Abstract
本发明涉及一种图片地理定位方法及系统。该方法包括:获取地理图片数据库;地理图片数据库中的地理图片包括位置信息;利用图片分类模型对图片数据库中的地理图片进行分类,得到每个地理图片的分类向量;分类向量为地理图片属于每个分类类别的概率值组成的向量;根据地理图片的分类向量,计算地理图片数据库中任意两个地理图片之间的相似度;根据地理图片之间的相似度,采用启发式密度聚类算法对地理图片数据库的地理图片进行聚类分析,得到多个聚类簇;获取输入图片与各个聚类簇之间的距离;将距离最小值对应的聚类簇确定为输入图片的目标簇;根据目标簇中地理图片的位置信息,确定输入图片的位置信息。本发明可以提高地理定位的精度。
Description
技术领域
本发明涉及图像处理领域,特别是涉及一种图片地理定位方法及系统。
背景技术
随着图片分享网站的兴起与发展,互联网上积累了海量地理图片(地理图片指带有地理标签或者地理位置信息的图片),由于地理图片蕴含着丰富的地理信息,其成为重要的VGI(Volunteered Geographic Information)信息源之一。地理图片数据具有时效性强、更新快、成本低的优势,具有巨大的应用价值与研究价值,被广泛应用于旅游景点发现、旅游路线规划、城市景观评价等领域。
但目前互联网上存在的海量图片中,地理图片占比相对较低,绝大多数图片缺乏地理信息,无法满足众多领域中的科研需求和商业需求。图片地理定位是指根据目标图片内容进行挖掘分析,推断其地理位置信息。借助于图片地理定位技术,能够有效纾解地理图片匮乏的问题,为大量图片赋予地理位置信息,提升其使用价值。
目前已有的图片地理定位方法主要是通过提取图片的颜色特征、直方图特征、纹理特征、几何特征等生成图片的描述向量,然后结合各种方法来推断目标图片的地理位置,主要有以下几种方法:
方法一、基于图片特征,利用K-NN算法在图片库中搜索出与目标图片最相似的K张图片,来推断目标图片的位置或其位置概率地图;
方法二、将图片特征与文本标签相结合,采用Mean-Shift算法或KNN算法推断图片的地理位置。
上述方法均未考虑区域内部差异性,未能有效利用区域性特征,而是直接计算点与点之间的相似度,易受到异常点的影响,导致定位精度较低且计算量较大,不能满足实际需求。
发明内容
本发明的目的是提供一种图片地理定位方法及系统,以提高地理定位的精度。
为实现上述目的,本发明提供了如下方案:
一种图片地理定位方法,包括:
获取地理图片数据库;所述地理图片数据库中的地理图片包括位置信息;
利用图片分类模型对所述图片数据库中的地理图片进行分类,得到每个地理图片的分类向量;所述分类向量为所述地理图片属于每个分类类别的概率值组成的向量;
根据所述地理图片的分类向量,计算所述地理图片数据库中任意两个地理图片之间的相似度;
根据所述地理图片之间的相似度,采用启发式密度聚类算法对所述地理图片数据库的地理图片进行聚类分析,得到多个聚类簇;每个聚类簇包括多张地理图片;
获取输入图片与各个聚类簇之间的距离;
将距离最小值对应的聚类簇确定为所述输入图片的目标簇;
根据所述目标簇中地理图片的位置信息,确定所述输入图片的位置信息。
可选的,所述获取地理图片数据库,具体包括:
基于爬虫技术抓取互联网图片分享网站上的地理图片,得到图片集;
对所述图片集中的地理图片进行预处理,并删除与地理位置无关联的地理图片,得到所述地理图片数据库。
可选的,所述利用图片分类模型对所述图片数据库中的地理图片进行分类,得到每个地理图片的分类向量,之前还包括:
对所述地理图片数据库中的地理图片标注类别标签,构建图片分类标注数据集;
对所述图片分类标注数据集进行数据增强和数据均衡处理,并将处理后的图片分类标注数据集划分为图片分类训练集和图片分类验证集;
根据所述图片分类训练集和所述图片分类验证集,基于卷积神经网络算法对所述图片分类模型进行训练,得到训练好的图片分类模型。
可选的,所述根据所述地理图片的分类向量,计算所述地理图片数据库中任意两个地理图片之间的相似度,具体包括:
对于第i个地理图片和第j个地理图片,根据所述第i个地理图片的分类向量和第j个地理图片的分类向量计算所述第i个地理图片和所述第j个地理图片之间的欧氏距离;
利用公式sij=1/(d+1)计算所述第i个地理图片和所述第j个地理图片之间的相似度;其中,sij为所述第i个地理图片和所述第j个地理图片之间的相似度,d为所述第i个地理图片和所述第j个地理图片之间的欧氏距离。
可选的,所述根据所述地理图片之间的相似度,采用启发式密度聚类算法对所述地理图片数据库的地理图片进行聚类分析,得到多个聚类簇,具体包括:
遍历所述地理图片数据库,将邻域范围内图片相似度大于0.7的图片数目大于设定阈值的地理图片确定为核心点,生成核心点集合;所述邻域范围的半径为5KM;
对于每个核心点,将所述核心点的邻域范围内的所有地理图片加入所述核心点对应的簇中,得到所述核心点对应的临时聚类簇;
将包含同一核心点的所有临时聚类簇合并,更新所有的临时聚类簇;
判断不同的临时聚类簇之间是否包含相同的核心点;
当不同的临时聚类簇之间包含相同的核心点时,返回“将包含同一核心点的所有临时聚类簇合并,更新所有的临时聚类簇”的步骤;
当所有不同的临时聚类簇之间都不包含相同的核心点时,将每个临时聚类簇确定为最终的聚类簇。
可选的,所述获取输入图片与各个聚类簇之间的距离,具体包括:
利用所述图片分类模型计算所述输入图片的分类向量;
计算每个聚类簇的分类标识向量;所述聚类簇的分类标识向量为所述聚类簇中所有地理图片的分类向量的平均值;
计算所述输入图片的分类向量与每个聚类簇的分类标识向量之间的欧式距离,得到所述输入图片与各个聚类簇之间的距离。
可选的,所述根据所述目标簇中地理图片的位置信息,确定所述输入图片的位置信息,具体包括:
利用KNN算法计算所述目标簇中与所述输入图片之间距离最近的K张地理图片;所述地理图片与所述输入图片之间的距离为所述地理图片的分类向量与所述输入图像的分类向量之间的欧氏距离;
将所述K张地理图片对应的空间位置进行加权平均计算,得到所述输入图片的位置信息。
本发明还提供一种图片地理定位系统,包括:
地理图片数据库获取模块,用于获取地理图片数据库;所述地理图片数据库中的地理图片包括位置信息;
分类模块,用于利用图片分类模型对所述图片数据库中的地理图片进行分类,得到每个地理图片的分类向量;所述分类向量为所述地理图片属于每个分类类别的概率值组成的向量;
相似度计算模块,用于根据所述地理图片的分类向量,计算所述地理图片数据库中任意两个地理图片之间的相似度;
聚类分析模块,用于根据所述地理图片之间的相似度,采用启发式密度聚类算法对所述地理图片数据库的地理图片进行聚类分析,得到多个聚类簇;每个聚类簇包括多张地理图片;
距离获取模块,用于获取输入图片与各个聚类簇之间的距离;
目标簇确定模块,用于将距离最小值对应的聚类簇确定为所述输入图片的目标簇;
位置信息确定模块,用于根据所述目标簇中地理图片的位置信息,确定所述输入图片的位置信息。
可选的,所述距离获取模块具体包括:
输入图片分类向量计算单元,用于利用所述图片分类模型计算所述输入图片的分类向量;
分类标识向量计算单元,用于计算每个聚类簇的分类标识向量;所述聚类簇的分类标识向量为所述聚类簇中所有地理图片的分类向量的平均值;
距离计算单元,用于计算所述输入图片的分类向量与每个聚类簇的分类标识向量之间的欧式距离,得到所述输入图片与各个聚类簇之间的距离。
可选的,所述位置信息确定模块具体包括:
KNN计算单元,用于利用KNN算法计算所述目标簇中与所述输入图片之间距离最近的K张地理图片;所述地理图片与所述输入图片之间的距离为所述地理图片的分类向量与所述输入图像的分类向量之间的欧氏距离;
加权平均计算单元,用于将所述K张地理图片对应的空间位置进行加权平均计算,得到所述输入图片的位置信息。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明通过对地理图片进行分类、基于相似度进行聚类,进而根据相似度计算输入图片对应的聚类簇,根据聚类簇中的图片可以准确推断输入图片的地理位置信息;而且,整个方法实现方便,可快速得到目标图片地理位置信息,计算精度较高;采用本发明定位得到的图片的地理位置能够显著提升图片的使用价值。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明图片地理定位方法的流程示意图;
图2为本发明图片地理定位系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明图片地理定位方法的流程示意图。如图1所示,本发明图片地理定位方法包括以下步骤:
步骤100:获取地理图片数据库。所述地理图片数据库中的地理图片包括位置信息。本发明基于爬虫技术抓取互联网图片分享网站上的地理图片,得到图片集,然后对所述图片集中的地理图片进行预处理,并删除与地理位置无关联的地理图片,得到所述地理图片数据库。以Flickr网站为例,具体操作为:
1)在官网注册开发者账号,获取api_key和secret信息;
2)设定参数,包括抓取起始时间、终止时间、bbox(即某一空间区域的坐标范围);
3)构造爬虫,将参数和开发者信息传递给Flickr指定服务器,获取返回数据;
4)根据返回数据,抽取所需信息,包括图片链接、拍摄时间、height、width、经度、纬度、标题、标签、id、拥有者等字段信息;
5)根据图片链接,获取图片数据;
6)将图片数据与其属性信息,上传至特定数据库中(如MongoDB),建立地理图片数据集。
7)对地理图片数据集中的地理图片进行预处理,包括图片筛选、尺寸规范化等操作。然后将图片内容与地理位置无关联的图片删除,具体操作为:调用PlacesCNN模型(一种基于卷积神经网络的图片场景分类模型,能够识别上百种场景),将地理图片数据集中的每张照片输入PlacesCNN模型,推断其所属的场景类型,建立筛选规则,删除场景类型为餐点、玩具、家具等各种物体的照片和酒吧、剧院、教室、商店、超市等各种室内场景的照片以及无法准确归类的照片,得到地理图片数据库。
步骤200:利用图片分类模型对图片数据库中的地理图片进行分类,得到每个地理图片的分类向量。所述分类向量为所述地理图片属于每个分类类别的概率值组成的向量;向量长度为分类模型的类别总数;向量中每个数值位于[0,1]之间,表示该图片属于对应类别的概率。在采用图片分类模型进行分类之前,需要对构建的图片分类模型进行训练,具体过程如下:
1)对所述地理图片数据库中的地理图片标注类别标签,构建图片分类标注数据集。以湖泊为图片类别、百度图片为检索网站为例,具体操作为:
a、打开百度图片网站https://image.baidu.com/,输入关键词“湖泊”,点击查询;
b、获取网站返回图片数据并下载;
c、为每张图片赋予标签“湖泊”,上传至数据库;
d、针对“河流”、“森林”、“公路”、“林间小路”等类别,重复上述步骤,从而构建图片分类标注数据集。
2)对所述图片分类标注数据集进行数据增强和数据均衡处理,并将处理后的图片分类标注数据集划分为图片分类训练集和图片分类验证集。进行数据增强,有助于增加训练集规模,提升模型泛化能力,具体为:对图片按照特定参数随机进行翻转、旋转、缩放、裁剪、平移、添加噪声等操作。进行数据均衡处理,可以避免出现类别不平衡现象,提升模型精度。
3)根据所述图片分类训练集和所述图片分类验证集,基于卷积神经网络算法对所述图片分类模型进行训练,得到训练好的图片分类模型。具体过程如下:
a、选择VGG16、VGG19、InceptionV3、ResNet18、ResNet34、ResNet50、ResNet_101中的一种互联网开源模型作为训练模型;
b、将训练数据中场景类别数量作为模型输出类别数目,设定batch数目、迭代次数等模型参数;
c、将所述图片分类训练集输入模型中进行模型训练,并在每完成一次迭代后,将模型在所述图片分类验证集上进行精度计算,不断训练迭代直到模型在所述图片分类验证集上的精度达到要求,然后停止训练,得到训练好的图片分类模型。
步骤300:根据地理图片的分类向量,计算地理图片数据库中任意两个地理图片之间的相似度。对于任意两个地理图片,根据两个地理图片的分类向量计算两个地理图片之间的欧氏距离,两个图片之间欧式距离越小,相似度越高。利用公式sij=1/(d+1)计算两个地理图片(第i个地理图片和第j个地理图片)之间的相似度sij,其中d为两个地理图片之间的欧氏距离,
步骤400:根据地理图片之间的相似度,采用启发式密度聚类算法对地理图片数据库的地理图片进行聚类分析,得到多个聚类簇。每个聚类簇包括多张地理图片。具体过程如下:
1)设置邻域半径∈=5KM,设定阈值MinPts=100。
2)遍历所述地理图片数据库,将邻域范围内图片相似度大于0.7的图片数目大于设定阈值的地理图片确定为核心点,生成核心点集合。
3)对于每个核心点,将所述核心点的邻域范围内的所有地理图片加入所述核心点对应的簇中,得到所述核心点对应的临时聚类簇。将不是核心点但在某个核心点∈邻域内的图片作为边界点,将既不是核心点也不是边界点的图片作为噪声点,将所有的噪声点剔除。
4)将包含同一核心点的所有临时聚类簇合并,更新所有的临时聚类簇。具体的,对于每个临时聚类簇,检查其中的点是否为核心点,如果是,将该点对应的临时聚类簇和当前临时聚类簇合并,得到新的临时聚类簇,依次完成所有临时聚类簇的合并过程。
5)判断不同的临时聚类簇之间是否包含相同的核心点。此步骤为判断是否需要进一步合并的步骤,不再继续合并的条件是:临时聚类簇中的每个点或者不是核心点,或者是核心点时其∈邻域内的点都已属于当前临时聚类簇。
6)当不同的临时聚类簇之间包含相同的核心点时,返回步骤4),继续进行临时簇的合并过程。
7)当所有不同的临时聚类簇之间都不包含相同的核心点时,将每个临时聚类簇确定为最终的聚类簇。当满足上述条件时,则全部临时聚类簇转换为聚类簇,最终地理图片数据库中的每张地理图片仅属于某一聚类簇或作为噪声点被剔除。
步骤500:获取输入图片与各个聚类簇之间的距离。输入图片与聚类簇之间的距离是指输入图片的分类向量与聚类簇的分类标识向量之间的欧式距离。输入图片的分类向量通过图片分类模型计算得到,每个聚类簇的分类标识向量通过将该聚类簇中所有地理图片的分类向量累加后取平均值得到,所有地理图片的分类向量平均值即为该聚类簇的分类标识向量。
步骤600:将距离最小值对应的聚类簇确定为输入图片的目标簇。该目标簇中地理图片的位置信息即为输入图片大致的空间位置范围。
步骤700:根据目标簇中地理图片的位置信息,确定输入图片的位置信息。本发明利用KNN算法计算所述目标簇中与所述输入图片之间距离最近的K张地理图片,然后将所述K张地理图片对应的空间位置进行加权平均计算,得到所述输入图片的位置信息。所述地理图片与所述输入图片之间的距离为所述地理图片的分类向量与所述输入图像的分类向量之间的欧氏距离。在进行加权平均计算时,权值与距离大小成反比,与输入图片之间距离越小的地理图片,其对应的权值越大,进而得到输入图片的位置信息,完成对输入图片的地理定位。
对应上述图片地理定位方法,本发明还提供一种图片地理定位系统,图2为本发明图片地理定位系统的结构示意图。如图2所示,本发明图片地理定位系统包括:
地理图片数据库获取模块201,用于获取地理图片数据库;所述地理图片数据库中的地理图片包括位置信息。
分类模块202,用于利用图片分类模型对所述图片数据库中的地理图片进行分类,得到每个地理图片的分类向量;所述分类向量为所述地理图片属于每个分类类别的概率值组成的向量。
相似度计算模块203,用于根据所述地理图片的分类向量,计算所述地理图片数据库中任意两个地理图片之间的相似度。
聚类分析模块204,用于根据所述地理图片之间的相似度,采用启发式密度聚类算法对所述地理图片数据库的地理图片进行聚类分析,得到多个聚类簇;每个聚类簇包括多张地理图片。
距离获取模块205,用于获取输入图片与各个聚类簇之间的距离。
目标簇确定模块206,用于将距离最小值对应的聚类簇确定为所述输入图片的目标簇。
位置信息确定模块207,用于根据所述目标簇中地理图片的位置信息,确定所述输入图片的位置信息。
作为具体的实施例,本发明的图片地理定位系统中,所述距离获取模块205具体包括:
输入图片分类向量计算单元,用于利用所述图片分类模型计算所述输入图片的分类向量。
分类标识向量计算单元,用于计算每个聚类簇的分类标识向量;所述聚类簇的分类标识向量为所述聚类簇中所有地理图片的分类向量的平均值。
距离计算单元,用于计算所述输入图片的分类向量与每个聚类簇的分类标识向量之间的欧式距离,得到所述输入图片与各个聚类簇之间的距离。
作为具体的实施例,本发明的图片地理定位系统中,所述位置信息确定模块207具体包括:
KNN计算单元,用于利用KNN算法计算所述目标簇中与所述输入图片之间距离最近的K张地理图片;所述地理图片与所述输入图片之间的距离为所述地理图片的分类向量与所述输入图像的分类向量之间的欧氏距离。
加权平均计算单元,用于将所述K张地理图片对应的空间位置进行加权平均计算,得到所述输入图片的位置信息。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种图片地理定位方法,其特征在于,包括:
获取地理图片数据库;所述地理图片数据库中的地理图片包括位置信息;
利用图片分类模型对所述图片数据库中的地理图片进行分类,得到每个地理图片的分类向量;所述分类向量为所述地理图片属于每个分类类别的概率值组成的向量;
根据所述地理图片的分类向量,计算所述地理图片数据库中任意两个地理图片之间的相似度;
根据所述地理图片之间的相似度,采用启发式密度聚类算法对所述地理图片数据库的地理图片进行聚类分析,得到多个聚类簇;每个聚类簇包括多张地理图片;
获取输入图片与各个聚类簇之间的距离;
将距离最小值对应的聚类簇确定为所述输入图片的目标簇;
根据所述目标簇中地理图片的位置信息,确定所述输入图片的位置信息。
2.根据权利要求1所述的图片地理定位方法,其特征在于,所述获取地理图片数据库,具体包括:
基于爬虫技术抓取互联网图片分享网站上的地理图片,得到图片集;
对所述图片集中的地理图片进行预处理,并删除与地理位置无关联的地理图片,得到所述地理图片数据库。
3.根据权利要求1所述的图片地理定位方法,其特征在于,所述利用图片分类模型对所述图片数据库中的地理图片进行分类,得到每个地理图片的分类向量,之前还包括:
对所述地理图片数据库中的地理图片标注类别标签,构建图片分类标注数据集;
对所述图片分类标注数据集进行数据增强和数据均衡处理,并将处理后的图片分类标注数据集划分为图片分类训练集和图片分类验证集;
根据所述图片分类训练集和所述图片分类验证集,基于卷积神经网络算法对所述图片分类模型进行训练,得到训练好的图片分类模型。
4.根据权利要求1所述的图片地理定位方法,其特征在于,所述根据所述地理图片的分类向量,计算所述地理图片数据库中任意两个地理图片之间的相似度,具体包括:
对于第i个地理图片和第j个地理图片,根据所述第i个地理图片的分类向量和第j个地理图片的分类向量计算所述第i个地理图片和所述第j个地理图片之间的欧氏距离;
利用公式sij=1/(d+1)计算所述第i个地理图片和所述第j个地理图片之间的相似度;其中,sij为所述第i个地理图片和所述第j个地理图片之间的相似度,d为所述第i个地理图片和所述第j个地理图片之间的欧氏距离。
5.根据权利要求1所述的图片地理定位方法,其特征在于,所述根据所述地理图片之间的相似度,采用启发式密度聚类算法对所述地理图片数据库的地理图片进行聚类分析,得到多个聚类簇,具体包括:
遍历所述地理图片数据库,将邻域范围内图片相似度大于0.7的图片数目大于设定阈值的地理图片确定为核心点,生成核心点集合;所述邻域范围的半径为5KM;
对于每个核心点,将所述核心点的邻域范围内的所有地理图片加入所述核心点对应的簇中,得到所述核心点对应的临时聚类簇;
将包含同一核心点的所有临时聚类簇合并,更新所有的临时聚类簇;
判断不同的临时聚类簇之间是否包含相同的核心点;
当不同的临时聚类簇之间包含相同的核心点时,返回“将包含同一核心点的所有临时聚类簇合并,更新所有的临时聚类簇”的步骤;
当所有不同的临时聚类簇之间都不包含相同的核心点时,将每个临时聚类簇确定为最终的聚类簇。
6.根据权利要求1所述的图片地理定位方法,其特征在于,所述获取输入图片与各个聚类簇之间的距离,具体包括:
利用所述图片分类模型计算所述输入图片的分类向量;
计算每个聚类簇的分类标识向量;所述聚类簇的分类标识向量为所述聚类簇中所有地理图片的分类向量的平均值;
计算所述输入图片的分类向量与每个聚类簇的分类标识向量之间的欧式距离,得到所述输入图片与各个聚类簇之间的距离。
7.根据权利要求6所述的图片地理定位方法,其特征在于,所述根据所述目标簇中地理图片的位置信息,确定所述输入图片的位置信息,具体包括:
利用KNN算法计算所述目标簇中与所述输入图片之间距离最近的K张地理图片;所述地理图片与所述输入图片之间的距离为所述地理图片的分类向量与所述输入图像的分类向量之间的欧氏距离;
将所述K张地理图片对应的空间位置进行加权平均计算,得到所述输入图片的位置信息。
8.一种图片地理定位系统,其特征在于,包括:
地理图片数据库获取模块,用于获取地理图片数据库;所述地理图片数据库中的地理图片包括位置信息;
分类模块,用于利用图片分类模型对所述图片数据库中的地理图片进行分类,得到每个地理图片的分类向量;所述分类向量为所述地理图片属于每个分类类别的概率值组成的向量;
相似度计算模块,用于根据所述地理图片的分类向量,计算所述地理图片数据库中任意两个地理图片之间的相似度;
聚类分析模块,用于根据所述地理图片之间的相似度,采用启发式密度聚类算法对所述地理图片数据库的地理图片进行聚类分析,得到多个聚类簇;每个聚类簇包括多张地理图片;
距离获取模块,用于获取输入图片与各个聚类簇之间的距离;
目标簇确定模块,用于将距离最小值对应的聚类簇确定为所述输入图片的目标簇;
位置信息确定模块,用于根据所述目标簇中地理图片的位置信息,确定所述输入图片的位置信息。
9.根据权利要求8所述的图片地理定位系统,其特征在于,所述距离获取模块具体包括:
输入图片分类向量计算单元,用于利用所述图片分类模型计算所述输入图片的分类向量;
分类标识向量计算单元,用于计算每个聚类簇的分类标识向量;所述聚类簇的分类标识向量为所述聚类簇中所有地理图片的分类向量的平均值;
距离计算单元,用于计算所述输入图片的分类向量与每个聚类簇的分类标识向量之间的欧式距离,得到所述输入图片与各个聚类簇之间的距离。
10.根据权利要求9所述的图片地理定位系统,其特征在于,所述位置信息确定模块具体包括:
KNN计算单元,用于利用KNN算法计算所述目标簇中与所述输入图片之间距离最近的K张地理图片;所述地理图片与所述输入图片之间的距离为所述地理图片的分类向量与所述输入图像的分类向量之间的欧氏距离;
加权平均计算单元,用于将所述K张地理图片对应的空间位置进行加权平均计算,得到所述输入图片的位置信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010897189.4A CN112015937B (zh) | 2020-08-31 | 2020-08-31 | 一种图片地理定位方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010897189.4A CN112015937B (zh) | 2020-08-31 | 2020-08-31 | 一种图片地理定位方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112015937A true CN112015937A (zh) | 2020-12-01 |
CN112015937B CN112015937B (zh) | 2024-01-19 |
Family
ID=73502447
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010897189.4A Active CN112015937B (zh) | 2020-08-31 | 2020-08-31 | 一种图片地理定位方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112015937B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112950601A (zh) * | 2021-03-11 | 2021-06-11 | 成都微识医疗设备有限公司 | 用于食管癌模型训练的图片的筛选方法、系统及存储介质 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102881125A (zh) * | 2012-09-25 | 2013-01-16 | 杭州立高科技有限公司 | 基于多信息融合集中处理平台的报警监控系统 |
CN106503656A (zh) * | 2016-10-24 | 2017-03-15 | 厦门美图之家科技有限公司 | 一种图像分类方法、装置和计算设备 |
CN106845536A (zh) * | 2017-01-09 | 2017-06-13 | 西北工业大学 | 一种基于图像缩放的并行聚类方法 |
CN106874924A (zh) * | 2015-12-14 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种图片风格识别方法及装置 |
CN106874936A (zh) * | 2017-01-17 | 2017-06-20 | 腾讯科技(上海)有限公司 | 图像传播监测方法及装置 |
CN108399413A (zh) * | 2017-02-04 | 2018-08-14 | 清华大学 | 一种图片拍摄区域识别及地理定位方法及装置 |
CN109063788A (zh) * | 2018-09-04 | 2018-12-21 | 四川文轩教育科技有限公司 | 一种基于聚类算法的教学资源分类管理方法 |
US20190220678A1 (en) * | 2018-01-13 | 2019-07-18 | Toyota Jidosha Kabushiki Kaisha | Localizing Traffic Situation Using Multi-Vehicle Collaboration |
CN110175249A (zh) * | 2019-05-31 | 2019-08-27 | 中科软科技股份有限公司 | 一种相似图片的检索方法及系统 |
CN110298269A (zh) * | 2019-06-13 | 2019-10-01 | 北京百度网讯科技有限公司 | 场景图像定位方法、装置、设备及可读存储介质 |
CN110321956A (zh) * | 2019-07-08 | 2019-10-11 | 府谷县鑫兴泰农贸有限公司 | 一种基于人工智能的牧草病虫害治理方法及装置 |
CN110321873A (zh) * | 2019-07-12 | 2019-10-11 | 苏州惠邦医疗科技有限公司 | 基于深度学习卷积神经网络的敏感图片识别方法及系统 |
US20190373466A1 (en) * | 2018-06-05 | 2019-12-05 | Capital One Services, Llc | Visual display systems and method for manipulating images of a real scene using augmented reality |
CN110704712A (zh) * | 2019-09-20 | 2020-01-17 | 武汉大学 | 基于图像检索的场景图片拍摄位置范围识别方法及系统 |
CN110738100A (zh) * | 2019-09-04 | 2020-01-31 | 沈阳工业大学 | 一种基于深度学习的伪装军事目标识别方法及系统 |
CN111126470A (zh) * | 2019-12-18 | 2020-05-08 | 创新奇智(青岛)科技有限公司 | 基于深度度量学习的图片数据迭代聚类分析方法 |
-
2020
- 2020-08-31 CN CN202010897189.4A patent/CN112015937B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102881125A (zh) * | 2012-09-25 | 2013-01-16 | 杭州立高科技有限公司 | 基于多信息融合集中处理平台的报警监控系统 |
CN106874924A (zh) * | 2015-12-14 | 2017-06-20 | 阿里巴巴集团控股有限公司 | 一种图片风格识别方法及装置 |
CN106503656A (zh) * | 2016-10-24 | 2017-03-15 | 厦门美图之家科技有限公司 | 一种图像分类方法、装置和计算设备 |
CN106845536A (zh) * | 2017-01-09 | 2017-06-13 | 西北工业大学 | 一种基于图像缩放的并行聚类方法 |
CN106874936A (zh) * | 2017-01-17 | 2017-06-20 | 腾讯科技(上海)有限公司 | 图像传播监测方法及装置 |
CN108399413A (zh) * | 2017-02-04 | 2018-08-14 | 清华大学 | 一种图片拍摄区域识别及地理定位方法及装置 |
US20190220678A1 (en) * | 2018-01-13 | 2019-07-18 | Toyota Jidosha Kabushiki Kaisha | Localizing Traffic Situation Using Multi-Vehicle Collaboration |
US20190373466A1 (en) * | 2018-06-05 | 2019-12-05 | Capital One Services, Llc | Visual display systems and method for manipulating images of a real scene using augmented reality |
CN109063788A (zh) * | 2018-09-04 | 2018-12-21 | 四川文轩教育科技有限公司 | 一种基于聚类算法的教学资源分类管理方法 |
CN110175249A (zh) * | 2019-05-31 | 2019-08-27 | 中科软科技股份有限公司 | 一种相似图片的检索方法及系统 |
CN110298269A (zh) * | 2019-06-13 | 2019-10-01 | 北京百度网讯科技有限公司 | 场景图像定位方法、装置、设备及可读存储介质 |
CN110321956A (zh) * | 2019-07-08 | 2019-10-11 | 府谷县鑫兴泰农贸有限公司 | 一种基于人工智能的牧草病虫害治理方法及装置 |
CN110321873A (zh) * | 2019-07-12 | 2019-10-11 | 苏州惠邦医疗科技有限公司 | 基于深度学习卷积神经网络的敏感图片识别方法及系统 |
CN110738100A (zh) * | 2019-09-04 | 2020-01-31 | 沈阳工业大学 | 一种基于深度学习的伪装军事目标识别方法及系统 |
CN110704712A (zh) * | 2019-09-20 | 2020-01-17 | 武汉大学 | 基于图像检索的场景图片拍摄位置范围识别方法及系统 |
CN111126470A (zh) * | 2019-12-18 | 2020-05-08 | 创新奇智(青岛)科技有限公司 | 基于深度度量学习的图片数据迭代聚类分析方法 |
Non-Patent Citations (3)
Title |
---|
NUHA ZAMZAMI 等: "High-dimensional count data clustering based on an exponential approximation to the multinomial Beta-Liouville distribution", 《INFORMATION SCIENCES》, vol. 524, pages 116 - 135, XP086145588, DOI: 10.1016/j.ins.2020.03.028 * |
叶凌菲: "基于旅游大数据的景点位置识别与信息搜索研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 10, pages 138 - 555 * |
王磊: "视频人体运动的检测跟踪与识别", 《中国博士学位论文全文数据库 信息科技辑》, no. 08, pages 138 - 119 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112950601A (zh) * | 2021-03-11 | 2021-06-11 | 成都微识医疗设备有限公司 | 用于食管癌模型训练的图片的筛选方法、系统及存储介质 |
CN112950601B (zh) * | 2021-03-11 | 2024-01-09 | 成都微识医疗设备有限公司 | 用于食管癌模型训练的图片的筛选方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112015937B (zh) | 2024-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109948425B (zh) | 一种结构感知自注意和在线实例聚合匹配的行人搜索方法及装置 | |
Chen et al. | City-scale map creation and updating using GPS collections | |
Deng et al. | Generating urban road intersection models from low-frequency GPS trajectory data | |
Li et al. | GPS estimation for places of interest from social users' uploaded photos | |
Hu et al. | GeoAI at ACM SIGSPATIAL: progress, challenges, and future directions | |
CN104794219A (zh) | 一种基于地理位置信息的场景检索方法 | |
CN111008337B (zh) | 一种基于三元特征的深度注意力谣言鉴别方法及装置 | |
CN103810299A (zh) | 基于多特征融合的图像检索方法 | |
CN109978035A (zh) | 基于改进的k-means和损失函数的行人检测方法 | |
Ali et al. | Rule-guided human classification of Volunteered Geographic Information | |
CN108897750B (zh) | 融合多元上下文信息的个性化地点推荐方法及设备 | |
Vishal et al. | Accurate localization by fusing images and GPS signals | |
CN102193934B (zh) | 用于寻找图像集合中的代表性图像的系统和方法 | |
CN113449111B (zh) | 基于时空语义知识迁移的社会治理热点话题自动识别方法 | |
Li et al. | A method based on an adaptive radius cylinder model for detecting pole-like objects in mobile laser scanning data | |
Liao et al. | Tag features for geo-aware image classification | |
CN112258254A (zh) | 基于大数据架构的互联网广告风险监测方法及系统 | |
Jiang et al. | ContextRank: personalized tourism recommendation by exploiting context information of geotagged web photos | |
CN115422441A (zh) | 一种基于社交时空信息与用户偏好的连续兴趣点推荐方法 | |
CN114743139A (zh) | 视频场景检索方法、装置、电子设备及可读存储介质 | |
CN112015937B (zh) | 一种图片地理定位方法及系统 | |
CN106250396A (zh) | 一种图像标签自动生成系统及方法 | |
CN108932275A (zh) | 用于地理空间对象/特性检测的贝叶斯方法 | |
Zhang et al. | Wild plant data collection system based on distributed location | |
Lyu et al. | Movement-aware map construction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |