WO2021237973A1

WO2021237973A1 - 图像定位模型获取方法及装置、终端和存储介质

Info

Publication number: WO2021237973A1
Application number: PCT/CN2020/113099
Authority: WO
Inventors: 葛艺潇; 朱烽; 王海波; 赵瑞; 李鸿升
Original assignee: 深圳市商汤科技有限公司
Priority date: 2020-05-29
Filing date: 2020-09-02
Publication date: 2021-12-02
Also published as: CN111522988A; CN111522988B; TW202145075A; TWI780563B

Abstract

一种图像定位模型获取方法及相关装置，其中，所述方法包括：根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，K为大于1的整数；根据所述第一相似度向量，确定第一目标损失函数；根据所述第一目标损失函数对初始模型进行调整，得到第二图像定位模型，所述初始模型为所述第一图像定位模型初始化后得到的模型。

Description

图像定位模型获取方法及装置、终端和存储介质

相关申请的交叉引用

本申请基于申请号为202010478436.7、申请日为2020年05月29日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此以全文引入的方式引入本申请。

技术领域

本申请涉及数据处理技术领域，尤其涉及一种图像定位模型获取方法、装置、终端和存储介质。

背景技术

图像定位技术旨在通过在大规模数据库中匹配与目标图像最相似(近)的参考图像，并将其所标注的GPS(Global Positioning System，全球定位系统)作为目标图像的地理位置。图像定位技术目前主要通过三种方法进行实现，包括图像检索、3D(three dimensional，三维)结构匹配、按地理位置进行分类。

目前在进行模型训练的情况下为了避免被错误的正样本(指代GPS相近但画面没有重叠的图像样本对)误导，只选用排行第一的最佳匹配样本作为正样本进行训练，也就是在训练中只使用最简单的样本进行匹配，其中，最佳匹配样本可以是在特征空间中距离最近的样本。然而，只通过学习最佳匹配的样本无法获得对不同视角、光线等条件鲁棒性佳的网络，导致了训练后的网络模型在进行图像定位的情况下的准确性较低。

发明内容

本申请实施例提出了一种图像定位模型获取方法及装置、终端和存储介质。

本申请实施例提供了一种图像定位模型获取方法，该方法包括：根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，K为大于1的整数；根据第一相似度向量，确定第一目标损失函数；根据第一目标损失函数对初始模型进行调整，得到第二图像定位模型，初始模型为第一图像定位模型初始化后得到的模型。

本示例中，通过第一图像定位模型确定目标图像与K个第一样本定位图像之间的相似度，得到第一相似度向量，根据该相似度向量确定出第一目标损失函数，根据第一目标损失函数对初始模型进行调整，以得到第二图像定位模型，从而可以根据第一图像定位模型、目标图像和K个第一样本定位图像来确定的第一目标损失函数，对初始模型进行相似度监督学习以得到第二图像定位模型，从而可以提升第二图像定位模型在进行图像定位的情况下的准确性。

在一个可能的实现方式中，根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，包括：将K个第一样本定位图像中的每个第一样本定位图像进行拆分，以得到与每个第一样本定位图像对应的N个子第一样本定位图像；根据第一图像定位模型确定每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值，以得到与每个第一样本定位图像对应的特征向量；根据第一图像定位模型确定目标图像的特征值；根据每个第一样本定位图像对应的特征向量和目标图像的特征值，确定第一相似度向量。

本示例中，通过将K个第一样本定位图像中的每个第一样本定位图像进行拆分得到N个子第一样本定位图像，根据该K*N个子第一样本定位图像的特征值和目标图像的特征值，确定第一相似度向量，从而可以细粒度的确定第一相似度向量，提升了第一相似度向量对样本进行反映的准确性，进而提升了确定第二图像定位模型的准确性。

在一个可能的实现方式中，根据第一相似度向量，确定第一目标损失函数，包括：根据第一相似度向量，确定出第一子损失函数；根据与目标图像对应的困难负样本图像，确定第二子损失函数；根据第一子损失函数和第二子损失函数，确定第一目标损失函数。

本示例中，可以根据第一相似度向量确定的第一子损失函数，以及目标图像对应的困难负样本图像确定的第二子损失函数确定出第一目标损失函数，从而可以根据准确的第一相似度向量以及困难负样本图像确定的第二子损失函数确定出第一目标损失函数，从而提升了第一目标损失函数确定的准确性。

在一个可能的实现方式中，根据第一相似度向量，确定出第一子损失函数，包括：根据初始模型获取目标图像与K个第一样本定位图像之间的相似度，以得到第二相似度向量；根据第一相似度向量和第二相似度向量，确定第一子损失函数。

本示例中，可以通过初始模型确定的第二相似度向量和第一相似度向量确定第一子损失函数，从而可以通过第一图像定位模型确定的相似度向量对第二相似度向量进行监督，提升了第一子损失函数确定的准确性，由于第一相似度向量对第二相似度向量进行监督，从而也可以提升第二图像定位模型在进行图像定位的准确性。

在一个可能的实现方式中，根据第一子损失函数和第二子损失函数，确定第一目标损失函数，包括：根据与第一子损失函数和第二子损失函数对应的损失加权因子，对第一子损失函数和第二子损失函数进行运算，以得到第一目标损失函数。

在一个可能的实现方式中，该方法还包括：接收待标记图像；获取与待标记图像对应的K个第二样本定位图像；将K个第二样本定位图像中的每个第二样本定位图像进行拆分，以得到与每个第二样本定位图像对应的N个子第二样本定位图像；通过第二图像定位模型，确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。

本示例中，通过第二图像定位模型确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签，相对于相关技术方案中通过单一的样本对(最优样本对)训练得到的图像定位模型确定相似度标签，能够提升获取到的相似度标签的准确性。

在一个可能的实现方式中，第一图像定位模型包括基础图像定位模型，基础图像定位模型为采用目标图像与K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。

在一个可能的实现方式中，方法还包括：根据第二图像定位模型、目标图像与K个第一样本定位图像，确定第二目标损失函数；根据第二目标损失函数对初始模型进行调整，得到第三图像定位模型；采用第三图像定位模型替换第一图像定位模型。

本申请实施例提供了一种图像定位方法，该方法包括：接收待检测图像；根据如上述任一项的第二图像定位模型对待检测图像进行定位，得到与待检测图像对应的定位信息。

本申请实施例提供了一种图像定位模型获取装置，该装置包括：第一确定单元，配置为根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，K为大于1的整数；第二确定单元，配置为根据第一相似度向量，确定第一目标损失函数；调整单元，配置为根据第一目标损失函数对初始模型进行调整，得到第二图像定位模型，初始模型为第一图像定位模型初始化后得到的模型。

本申请实施例提供了一种图像定位装置，该装置包括：接收单元，配置为接收待检测图像；定位单元，配置为根据如上述任一项的第二图像定位模型对待检测图像进行定位，得到与待检测图像对应的定位信息。

本申请实施例提供一种终端，包括处理器、输入设备、输出设备和存储器，处理器、输入设备、输出设备和存储器相互连接，其中，存储器配置为存储计算机程序，计算机程序包括程序指令，处理器被配置为调用程序指令，执行如本申请实施例图像定位模型获取方法或图像定位方法中的步骤指令。

本申请实施例提供了一种计算机可读存储介质，其中，上述计算机可读存储介质存储配置为电子数据交换的计算机程序，其中，上述计算机程序使得计算机执行如本申请实施例图像定位模型获取方法或图像定位方法中所描述的部分或全部步骤。

本申请实施例提供了一种计算机程序产品，其中，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如本申请实施例图像定位模型获取方法或图像定位方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本申请实施例。

根据下面参考附图对示例性实施例的详细说明，本申请的其它特征及方面将变得清楚。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，此处的附图被并入说明书中并构成本说明书中的一部分，这些附图示出了符合本申请的实施例，并与说明书一起用于说明本申请的技术方案。应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1a为本申请实施例提供的一种图像定位模型的应用场景的示意图；

图1b为本申请实施例提供的一种图像定位模型获取方法的流程示意图；

图2a为本申请实施例提供的一种样本定位图像的示意图；

图2b为本申请实施例提供的一种第一样本定位图像的拆分示意图；

图2c为本申请实施例提供的另一种第一样本定位图像的拆分示意图；

图2d为本申请实施例提供的一种子第一样本定位图像的示意图；

图3为本申请实施例提供的另一种图像定位模型获取方法的流程示意图；

图4为本申请实施例提供的又一种图像定位模型获取方法的流程示意图；

图5为本申请实施例提供的一种终端的结构示意图；

图6为本申请实施例提供的一种图像定位模型获取装置的结构示意图；

图7为本申请实施例提供的一种图像定位装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本申请中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本申请所描述的实施例可以与其它实施例相结合。

本申请实施例所描述电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、行车记录仪、交通指挥平台、服务器、笔记本电脑、移动互联网设备(MID，Mobile Internet Devices)或穿戴式设备(如智能手表、蓝牙耳机)等，上述仅是举例，而非穷举，包含但不限于上述电子设备，电子设备还可以为服务器，或者，视频矩阵，在此不做限定，电子设备还可以为物联网设备。本申请实施例中终端与电子设备可以是相同的设备。

为了更好的理解本申请实施例提供的一种图像定位模型获取方法，下面首先对通过图像定位模型获取方法确定的图像定位模型的应用场景进行简要的介绍。如图1a所示，图像定位模型101a可以应用于电子设备102a中，用户在需要进行位置定位的情况下，例如，用户需要告知其他人自己当前所在的位置，用户可以通过电子设备102a采集当前所在位置附近的图像，例如，用户在xx大厦旁边，当前所在位置附近的图像可以是该xx大厦附近的区域的图像，得到待检测图像103a。电子设备通过图像定位模型101a，对待检测图像103a进行定位分析和计算，得到与该待检测图像对应的定位信息104a，定位信息为该待检测图像所反映的区域的位置信息(xx大厦)，例如，位置信息可以是待检测图像103a中标志性建筑的位置信息等，标志性建筑可以是用户自己选择的建筑物，也可以是通过图像定位模型101a确定出的建筑物等，当然也可以是其它的标志的位置信息，此处仅为举例说明。如此可以通过图像定位模型101a来确定出用户当前所在的位置，给用户带来较高的便捷性。由于相关技术的图像定位模型在对图像进行定位的情况下其定位的准确性不高，其在进行模型训练的情况下，通常采用单一的样本对，对初始模型进行训练，因此需要对图像定位模型进行优化训练，从而来提升图像定位模型对图像进行定位的准确性。下面实施例中主要阐述了对初始模型进行调整以提升调整后得到的图像定位模型进行图像定位的准确性。

如图1b所示，图像定位模型获取方法应用于电子设备，该方法包括步骤101b至103b，如下：

101b、电子设备根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，K为大于1的整数。

其中，K个第一样本定位图像可以是根据目标图像的GPS(全球定位系统)定位信息确定的样本图像，例如，可以是目标图像GPS定位信息指示的位置处的预设范围内的图像，例如可以为在该指示的位置处的10米范围内的地图图像等。目标图像可以通过手机、电脑等移动终端进行采集得到，该目标图像可以用于确定样本对，以通过样本对对初始模型进行调整，即目标图像与K个第一样本定位图像为对初始模型进行调整的样本对。预设范围可以是通过经验值或历史数据设定。

K个第一样本定位图像与目标图像之间的相似度标签可以是0-1之间的值，也可以包括0或1。如图2a所示，图2a中示出了一种可能的目标图像和第一样本定位图像，其中，第一样本定位图像与目标图像之间的相似度标签包括有0.45、0.35等。

第一相似度向量中元素可以包括目标图像与第一样本定位图像之间的相似度和目标图像与第一样本定位图像进行拆分后的子图像之间的相似度。对第一样本定位图像进行拆分，可以得到多个子第一样本定位图像，在进行图像拆分的情况下，可以将图像拆分为面积相同的多个子第一样本定位图像，也可以拆分为面积不同的多个子第一样本定位图像等。

电子设备可以用于对初始模型进行调整，也可以用于对初始模型进行调整以及采用图像定位模型进行图像定位。

102b、电子设备根据第一相似度向量，确定第一目标损失函数。

可以根据第一相似度向量确定出对应的损失函数，并至少通过该对应的损失函数来确定出第一目标损失函数。

103b、电子设备根据第一目标损失函数对初始模型进行调整，得到第二图像定位模型，初始模型为第一图像定位模型初始化后得到的模型。

通过包括目标图像以及K个第一样本定位图像的样本集和第一目标损失函数对初始模型进行训练，以得到第二图像定位模型。初始模型为第一图像定位模型初始化后得到的模型，可以理解为，将第一图像定位模型中的模型参数进行初始化，以得到初始模型。第二图像定位模型为通过包括目标图像以及K个第一样本定位图像的样本集对初始模型进行训练得到的模型。

本示例中，通过第一图像定位模型确定目标图像与K个第一样本定位图像之间的相似度，得到第一相似度向量，根据该相似度向量确定出第一目标损失函数，根据第一目标损失函数对初始模型进行调整，以得到第二图像定位模型，从而可以根据第一图像定位模型、目标图像和K个第一样本定位图像来确定的第一目标损失函数，对初始模型进行相似度监督学习以得到第二图像定位模型，从而可以提升第二图像定位模型在进行图像定位的准确性。

在一个可能的实施例中，一种可能的根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量的方法包括步骤A1至A4，如下：A1、将K个第一样本定位图像中的每个第一样本定位图像进行拆分，以得到与每个第一样本定位图像对应的N个子第一样本定位图像；A2、根据第一图像定位模型确定每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值，以得到与每个第一样本定位图像对应的特征向量；A3、根据第一图像定位模型确定目标图像的特征值；A4、根据每个第一样本定位图像对应的特征向量和目标图像的特征值，确定第一相似度向量。

将第一样本定位图像进行拆分的情况下，可以将图像拆分为面积相同的多个子第一样本定位图像，也可以拆分为面积不同的多个子第一样本定位图像等。一种可能的拆分方式可以为：将第一样本定位图像拆分为面积相等的两个子第一样本定位图像，以及将第一样本定位图像拆分为面积相等的4个子第一样本定位图像。可以参见图2b所示，可以将第一样本定位图像拆分为上下两个子第一样本定位图像，也可以将第一样本定位图像拆分为左右两个子第一样本定位图像；如图2c所示，可以将第一样本定位图像拆分为4个面积相等的子第一样本定位图像。

N个子第一样本图像可以包括多种不同的拆分方式得到的子第一样本图像，例如可以是如图2b和图2c的拆分方式得到的所有子第一样本定位图像，此时N＝8，当然N还可以是其它任意的数值，此处仅为举例说明，不作限定。

在确定特征向量以及目标图像的特征值的情况下，可以通过第一图像定位模型进行计算得到。每个第一样本定位图像对应的特征向量可以表示为：

其中，

为第i个第一样本定位图像的第一个子第一样本定位图像的特征值。

可以通过交叉熵的计算方式来获取第一相似度向量，可以为通过如下公式(1)所示的方法来确定第一相似度向量：

其中，

为第一相似度向量，softmax为归一化运算，τ _ω为超参(温度系数)，

为目标图像的特征值，

为第一样本定位图像p1的特征值，

为第一样本图像p1的第一个子第一样本定位图像的特征值，

为第一样本定位图像pk的特征值，

为第一样本图像pk的第八个子第一样本定位图像的特征值。

在一个可能的实施例中，一种可能的根据第一相似度向量，确定第一目标损失函数的方法包括步骤B1至B3，如下：B1、根据第一相似度向量，确定出第一子损失函数；B2、根据与目标图像对应的困难负样本图像，确定第二子损失函数；B3、根据第一子损失函数和第二子损失函数，确定第一目标损失函数。

其中，可以根据第一图像定位模型确定的目标图像与第一样本定位图像之间的相似度向量，即第一相似度向量来确定第一子损失函数。与目标图像对应的困难负样本图像可以理解为，与目标图像对应的负样本图像中，相似度低于预设阈值的负样本图像，预设阈值可以通过经验值或历史数据设定。在确定第二子损失函数的情况下，可以通过如下公式(2)所示的方法来确定第二子损失函数：

其中，

为第二子损失函数，

为相似度标签最高的正样本图像的特征值，

为相似度标签最低的负样本图像的特征值，K为第一样本定位图像的个数。

可以对第一子损失函数和第二子损失函数进行加权运算，以得到第一目标损失函数。

在一个可能的实施例中，一种可能的根据第一相似度向量，确定出第一子损失函数的方法包括步骤C1至C2，如下：C1、根据初始模型获取目标图像与K个第一样本定位图像之间的相似度，以得到第二相似度向量；C2、根据第一相似度向量和第二相似度向量，确定第一子损失函数。

获取第二相似度向量的方法可以参考前述实施例中获取第一相似度向量的方法，在实施的情况下采用初始模型进行计算，以得到第二相似度向量。

第一相似度向量和第二相似度向量可以采用交叉熵的运算，获取到第一子损失函数。例如，可以通过如下公式(3)所示的方式获取到第一子损失函数：

其中，L _soft(θ _ω)为第一子损失函数，

为第二相似度向量，

为第一相似度向量，l _ec()为交叉熵运算，ω为大于或等于2的正整数。上述公式在用于表示多次调整的情况下ω可以理解为调整的次数。

l _ec()可以通过如下公式(4)表示：

其中，y，

为需要进行交叉熵运算的元素。

本示例中，可以通过初始模型确定的第二相似度向量和第一相似度向量确定第一子损失函数，从而可以通过第一图像定位模型确定的相似度向量对第二相似度向量进行监督，提升了第一子损失函数确定的准确性，由于第一相似度向量对第二相似度向量进行监督，从而也可以提升第二图像定位模型在进行图像定位的情况下的准确性。

在一个可能的实施例中，一种可能的根据第一子损失函数和第二子损失函数，确定第一目标损失函数的方法可以为：

根据与第一子损失函数和第二子损失函数对应的损失加权因子，对第一子损失函数和第二子损失函数进行运算，以得到第一目标损失函数。

损失加权因子与第一子损失函数和第二子损失函数相对应，一种可能的加权损失因子的对应方式可以为：第一子损失函数的损失加权因子为

第二子损失函数的损失加权因子为1。

获取第一目标损失函数的方法也是通过如下公式(5)所示的方法：

其中，L(θ _ω)为第一目标损失函数，

为第二子损失函数，

为第一子损失函数，λ为加权因子。

在一个可能的实施例中，还可以对待标记图像进行标记，得到待标记图像与对应的样本定位图像之间的相似度标签，可以包括步骤D1至D4：D1、接收待标记图像；D2、获取与待标记图像对应的K个第二样本定位图像；D3、将K个第二样本定位图像中的每个第二样本定位图像进行拆分，以得到与每个第二样本定位图像对应的N个子第二样本定位图像；D4、通过第二图像定位模型，确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。

获取第二样本定位图像的方法可以参考前述实施例中获取第一样本定位图像的获取方法，此处不再赘述。步骤D3可以参照前述步骤A1所示的方法，此处不再赘述。

在获取相似度标签的情况下，可以通过第二图像定位模型进行计算，以得到待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。在计算的情况下，可以是通过待标记图像的特征向量与N个子样本定位图像的特征向量之间的距离，确定相似度，以及将该相似度确定为对应的相似度标签。

本示例中，通过第二图像定位模型确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签，相对于相关方案中通过单一的样本对(最优样本对)训练得到的图像定位模型确定相似度标签，能够提升获取到的相似度标签的准确性。

在一个可能的实施例中，第一图像定位模型包括基础图像定位模型，基础图像定位模型为包括采用目标图像与K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。

在一个可能的实施例中，还包括有获取第一图像定位模型的方法，包括步骤E1至E3，如下所示：E1、根据第二图像定位模型、目标图像与K个第一样本定位图像，确定第二目标损失函数；E2、根据第二目标损失函数对初始模型进行调整，得到第三图像定位模型；E3、采用第三图像定位模型替换第一图像定位模型。

上述步骤E1的实现方法可以参照前述实施例中确定第一目标损失函数，E2的实现方法可以参照前述实施例中确定第二图像定位模型的方法。

在一个可能的实施例中，可以采用第二图像定位模型对待检测图像进行定位，得到与待检测图像对应的定位信息，可以包括步骤F1至F2，如下：F1、接收待检测图像； F2、根据如上述任一实施例中的第二图像定位模型对待检测图像进行定位，得到与待检测图像对应的定位信息。

本示例中，通过第二图像定位模型来对待检测图像进行定位，从而可以提升定位信息获取的准确性。

在一个可能的实现方式中，包括有多次根据损失函数对图像定位模型进行调整，然后获取到最终的图像定位模型，详细方法如下：

采用包括目标图像与K个第一样本定位图像中相似度最高的图像作为样本对，对初始模型进行训练，得到基础图像定位模型；采用基础图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，根据该第一相似度向量确定出第一子损失函数；根据初始模型、目标图像和目标图像对应的困难负样本，确定第二子损失函数；对第一子损失函数和第二子损失函数进行加权运算，得到第一目标损失函数，通过第一目标损失函数对初始模型进行调整，得到第二图像定位模型；再次根据第二图像定位模型、目标图像与K个第一样本定位图像，确定第二目标损失函数，并根据第二目标损失函数对初始模型进行调整训练，得到第三图像定位模型，以此，重复执行上述步骤，从而可以获取到最终的图像定位模型。如2d中所示，为三次对初始模型进行调整，在第一次进行调整的情况下，已经将K个第一样本图像进行了拆分(图中未示出)，图中示出的相似度条，可以理解为相似度也可以理解为相似度标签，相似度高相似度标签的值越大，相似度越低相似度标签的值越小。图2d中，在进行三次调整后的模型计算得到的子第一样本定位图像的相似度标签，相对于第一次调整后的模型计算得到的子第一样本定位图像的相似度标签更加准确。

请参阅图3，图3为本申请实施例提供了另一种图像定位模型获取方法的流程示意图。如图3所示，图像定位模型获取方法包括步骤301至306，如下：

301、将K个第一样本定位图像中的每个第一样本定位图像进行拆分，以得到与每个第一样本定位图像对应的N个子第一样本定位图像，K为大于1的整数；

K个第一样本定位图像可以是根据目标图像的GPS定位信息确定的样本图像，例如，可以是目标图像GPS定位信息指示的位置处的预设范围内的图像，可以为，在该指示的位置处的10米范围内的地图图像等。预设范围可以是通过经验值或历史数据设定。

302、根据第一图像定位模型确定每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值，以得到与每个第一样本定位图像对应的特征向量；

特征向量中包括有多个元素。

303、根据第一图像定位模型确定目标图像的特征值；

304、根据每个第一样本定位图像对应的特征向量和目标图像的特征值，确定第一相似度向量；

305、根据第一相似度向量，确定第一目标损失函数；

306、根据第一目标损失函数对初始模型进行调整，得到第二图像定位模型，初始模型为第一图像定位模型初始化后得到的模型。

通过包括目标图像以及K个第一样本定位图像的样本集和第一目标损失函数对初始模型进行训练，以得到第二图像定位模型。初始模型为第一图像定位模型初始化后得到的模型，可以理解为，将第一图像定位模型中的模型参数进行初始化，以得到初始模型。第一图像定位模型为通过包括目标图像以及K个第一样本定位图像的样本集对初始模型进行训练得到的模型。

请参阅图4，图4为本申请实施例提供了另一种图像定位模型获取方法的流程示意图。如图4所示，图像定位模型获取方法包括步骤401至405，如下：

401、根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，K为大于1的整数；402、根据第一相似度向量，确定出第一子损失函数；403、根据与目标图像对应的困难负样本图像，确定第二子损失函数；404、根据第一子损失函数和第二子损失函数，确定第一目标损失函数；405、根据第一目标损失函数对初始模型进行调整，得到第二图像定位模型，初始模型为第一图像定位模型初始化后得到的模型。

与上述实施例一致的，请参阅图5，图5为本申请实施例提供的一种终端的结构示意图，如图所示，包括处理器、输入设备、输出设备和存储器，处理器、输入设备、输出设备和存储器相互连接，其中，存储器配置为存储计算机程序，计算机程序包括程序指令，处理器被配置为调用程序指令，上述程序包括配置为执行上述图像定位模型获取方法和图像定位方法中的步骤的指令。

相关技术中图像检索的方法在大规模图像定位中更为有效，图像检索的基础和关键在于如何通过神经网络学习更有分辨力的图像特征，相关技术中用于图像定位的数据集只提供带有噪声的GPS标注，然而带有相似GPS的图像不一定涵盖相似的场景，可能面向不同方向，所以训练过程可以看作弱监督的训练，神经网络的学习需要采用较难的正样本，而相关算法中忽略了这一点。

此外，即使是正确的正样本对，它们也大概率存在没有画面重叠的区域。在基于图像级别的标注进行学习的情况下，会要求两张图片的所有区域都趋于相似，这对没有重叠的部分来说是一种误导。所以，我们需要将图像级别的标注细化为区域级别的标注，而相关的算法忽略了这一点。

在以图像检索为基础的图像定位技术中，相关的数据集仅能够提供带有噪声的GPS标签，无法有效识别正确的正样本对；相关的算法无法有效地利用较难的正样本训练网络，导致网络的鲁棒性不足；相关的算法针对图像级别进行监督，误导了正样本对中无重叠区域的训练；仅利用图像级标签进行训练，对图像区域级的监督不足；需要通过额外耗时且精度有限的算法进行图像验证，挑选正样本用于训练。

本申请实施例提出一种自监督图像相似性的算法，参见图2d，本申请提出的自监督图像-区域的相似性标签来自于上一代网络的预测，网络进行迭代训练，上一代的网络预测用于监督下一代的网络训练，从而网络的能力与自监测标签的精确度可以同步优化。其中区域级的标签通过将图片拆分成四张1/2区域和四张1/4区域的图像组成。

采用本申请实施例，能够有效地利用自我增强的标签进行图像相似性的监督学习，标签的精度和网络的能力同步增强，从而充分利用较难的正样本进行网络训练，增强鲁棒性；将图像级标签细粒化为区域级标签，通过自监督的方法学习图像与区域之间的相似性，减轻含有噪声的标签对网络学习造成的干扰；在图像检索为基础的图像定位问题上达到先进的识别度；可以有效的自监测图像-区域相似性，从而增强网络鲁棒性；可以利用本算法训练的神经网络提取目标图像特征，在街景图像中进行检索，判断图像所属拍摄位置；可以利用本申请实施例，在自监督的情况下提升神经网络的鲁棒性。

上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是，终端为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所提供的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对终端进行功能单元的划分，例如，可以对应各个功能划分各个功能单元，也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。需要说明的是，本申请实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现的情况下可以有另外的划分方式。

与上述一致的，请参阅图6，图6为本申请实施例提供的一种图像定位模型获取装置的结构示意图。如图6所示，该装置包括：第一确定单元601，配置为根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，K为大于1的整数；第二确定单元602，配置为根据第一相似度向量，确定第一目标损失函数；调整单元603，配置为根据第一目标损失函数对初始模型进行调整，得到第二图像定位模型，初始模型为第一图像定位模型初始化后得到的模型。

在一种可能的实现方式中，第一确定单元601配置为：将K个第一样本定位图像中的每个第一样本定位图像进行拆分，以得到与每个第一样本定位图像对应的N个子第一样本定位图像；根据第一图像定位模型确定每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值，以得到与每个第一样本定位图像对应的特征向量；根据第一图像定位模型确定目标图像的特征值；根据每个第一样本定位图像对应的特征向量和目标图像的特征值，确定第一相似度向量。

在一种可能的实现方式中，第二确定单元602配置为：根据第一相似度向量，确定出第一子损失函数；根据与目标图像对应的困难负样本图像，确定第二子损失函数；根据第一子损失函数和第二子损失函数，确定第一目标损失函数。

在一个可能的实现方式中，在根据第一相似度向量，确定出第一子损失函数方面，第二确定单元602配置为：根据初始模型获取目标图像与K个第一样本定位图像之间的相似度，以得到第二相似度向量；根据第一相似度向量和第二相似度向量，确定第一子损失函数。

在一个可能的实现方式中，在根据第一子损失函数和第二子损失函数，确定第一目标损失函数方面，第二确定单元602配置为：根据与第一子损失函数和第二子损失函数对应的损失加权因子，对第一子损失函数和第二子损失函数进行运算，以得到第一目标损失函数。

在一个可能的实现方式中，该装置还配置为：接收待标记图像；获取与待标记图像对应的K个第二样本定位图像；将K个第二样本定位图像中的每个第二样本定位图像进行拆分，以得到与每个第二样本定位图像对应的N个子第二样本定位图像；通过第二图像定位模型，确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。

在一个可能的实现方式中，第一图像定位模型包括基础图像定位模型，基础图像定位模型为包括采用目标图像与K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。

在一个可能的实现方式中，该装置还配置为：根据第二图像定位模型、目标图像与K个第一样本定位图像，确定第二目标损失函数；根据第二目标损失函数对初始模型进行调整，得到第三图像定位模型；采用第三图像定位模型替换第一图像定位模型。

请参阅图7，图7为本申请实施例提供了一种图像定位装置的结构示意图。如图7所示，该装置包括：接收单元701，配置为接收待检测图像；定位单元702，配置为根据如上述实施例中任一项的第二图像定位模型对待检测图像进行定位，得到与待检测图像对应的定位信息。

本申请实施例还提供一种计算机存储介质，其中，该计算机存储介质存储配置为电子数据交换的计算机程序，该计算机程序使得计算机执行如上述方法实施例中记载的任何一种图像定位模型获取方法或图像定位方法的部分或全部步骤。

本申请实施例还提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，该计算机程序使得计算机执行如上述方法实施例中记载的任何一种图像定位模型获取方法或图像定位方法的部分或全部步骤。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在申请明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器、随机存取器、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

工业实用性

本实施例中，通过第一图像定位模型确定目标图像与K个第一样本定位图像之间的相似度，得到第一相似度向量，根据该相似度向量确定出第一目标损失函数，根据第一目标损失函数对初始模型进行调整，以得到第二图像定位模型，从而可以根据第一图像定位模型、目标图像和K个第一样本定位图像来确定的第一目标损失函数，对初始模型进行相似度监督学习以得到第二图像定位模型，从而可以提升第二图像定位模型在进行图像定位的情况下的准确性。

Claims

一种图像定位模型获取方法，所述方法包括：

根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，K为大于1的整数；

根据所述第一相似度向量，确定第一目标损失函数；

根据所述第一目标损失函数对初始模型进行调整，得到第二图像定位模型，所述初始模型为所述第一图像定位模型初始化后得到的模型。
根据权利要求1所述的方法，其中，所述根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，包括：

将所述K个第一样本定位图像中的每个第一样本定位图像进行拆分，以得到与所述每个第一样本定位图像对应的N个子第一样本定位图像；

根据所述第一图像定位模型确定所述每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值，以得到与所述每个第一样本定位图像对应的特征向量；

根据所述第一图像定位模型确定所述目标图像的特征值；

根据所述每个第一样本定位图像对应的特征向量和所述目标图像的特征值，确定所述第一相似度向量。
根据权利要求1或2所述的方法，其中，所述根据所述第一相似度向量，确定第一目标损失函数，包括：

根据所述第一相似度向量，确定出第一子损失函数；

根据与所述目标图像对应的困难负样本图像，确定第二子损失函数；

根据所述第一子损失函数和所述第二子损失函数，确定所述第一目标损失函数。
根据权利要求3所述的方法，其中，所述根据所述第一相似度向量，确定出第一子损失函数，包括：

根据所述初始模型获取所述目标图像与所述K个第一样本定位图像之间的相似度，以得到第二相似度向量；

根据所述第一相似度向量和所述第二相似度向量，确定所述第一子损失函数。
根据权利要求3或4所述的方法，其中，所述根据所述第一子损失函数和所述第二子损失函数，确定所述第一目标损失函数，包括：

根据与所述第一子损失函数和所述第二子损失函数对应的损失加权因子，对所述第一子损失函数和所述第二子损失函数进行运算，以得到所述第一目标损失函数。
根据权利要求1至5任一项所述的方法，其中，所述方法还包括：

接收待标记图像；

获取与所述待标记图像对应的K个第二样本定位图像；

将K个第二样本定位图像中的每个第二样本定位图像进行拆分，以得到与所述每个第二样本定位图像对应的N个子第二样本定位图像；

通过所述第二图像定位模型，确定所述待标记图像与所述每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。
根据权利要求1至6任一项所述的方法，其中，所述第一图像定位模型包括基础图像定位模型，所述基础图像定位模型为包括采用所述目标图像与所述K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。
根据权利要求1至7任一项所述的方法，其中，所述方法还包括：

根据所述第二图像定位模型、所述目标图像与所述K个第一样本定位图像，确定第二目标损失函数；

根据所述第二目标损失函数对所述初始模型进行调整，得到第三图像定位模型；

采用所述第三图像定位模型替换所述第一图像定位模型。
一种图像定位方法，，所述方法包括：

接收待检测图像；

根据如权利要求1至8任一项所述的第二图像定位模型对所述待检测图像进行定位，得到与所述待检测图像对应的定位信息。
一种图像定位模型获取装置，所述装置包括：第一确定单元，配置为根据第一图像定位模型，确定目标图像与K个第一样本定位图像之间的相似度，以得到第一相似度向量，K为大于1的整数；第二确定单元，配置为根据所述第一相似度向量，确定第一目标损失函数；调整单元，配置为根据所述第一目标损失函数对初始模型进行调整，得到第二图像定位模型，所述初始模型为所述第一图像定位模型初始化后得到的模型。
根据权利要求10所述的装置，其中，所述第一确定单元配置为：将所述K个第一样本定位图像中的每个第一样本定位图像进行拆分，以得到与所述每个第一样本定位图像对应的N个子第一样本定位图像；根据所述第一图像定位模型确定所述每个第一样本定位图像对应的N个子第一样本定位图像对应的特征值，以得到与所述每个第一样本定位图像对应的特征向量；根据所述第一图像定位模型确定所述目标图像的特征值；根据所述每个第一样本定位图像对应的特征向量和所述目标图像的特征值，确定所述第一相似度向量。
根据权利要求10或11所述的装置，其中，所述第二确定单元配置为：根据所述第一相似度向量，确定出第一子损失函数；根据与所述目标图像对应的困难负样本图像，确定第二子损失函数；根据所述第一子损失函数和所述第二子损失函数，确定所述第一目标损失函数。
根据权利要求12所述的装置，其中，所述第二确定单元配置为：根据初始模型获取目标图像与K个第一样本定位图像之间的相似度，以得到第二相似度向量；根据第一相似度向量和第二相似度向量，确定第一子损失函数。
根据权利要求12或13所述的装置，其中，所述第二确定单元配置为：根据与第一子损失函数和第二子损失函数对应的损失加权因子，对第一子损失函数和第二子损失函数进行运算，以得到第一目标损失函数。
根据权利要求10至14任一项所述的装置，其中，所述装置还配置为：接收待标记图像；获取与待标记图像对应的K个第二样本定位图像；将K个第二样本定位图像中的每个第二样本定位图像进行拆分，以得到与每个第二样本定位图像对应的N个子第二样本定位图像；通过第二图像定位模型，确定待标记图像与每个第二样本定位图像对应的N个子第二样本定位图像对应的相似度标签。
根据权利要求10至15任一项所述的装置，其中，所述第一图像定位模型包括基础图像定位模型，基础图像定位模型为包括采用目标图像与K个第一样本定位图像中相似度最高的图像作为样本对进行训练得到的模型。
根据权利要求10至16任一项所述的装置，其中，所述装置还配置为：根据第二图像定位模型、目标图像与K个第一样本定位图像，确定第二目标损失函数；根据第二目标损失函数对初始模型进行调整，得到第三图像定位模型；采用第三图像定位模型替换第一图像定位模型。
一种图像定位装置，所述装置包括：接收单元，配置为接收待检测图像；定位单元，配置为根据权利要求1至8任一项所述的方法中的第二图像定位模型对待检测图像进行定位，得到与待检测图像对应的定位信息。
一种终端，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器配置为存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置为调用所述程序指令，执行如权利要求1至9任一项所述的方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令在被处理器执行的情况下使所述处理器执行如权利要求1至9任一项所述的方法。
一种计算机程序产品，包括计算机可读代码，在所述计算机可读代码在电子设备中运行的情况下，所述电子设备中的处理器执行如权利要求1至9任一项所述的方法。