WO2021051868A1

WO2021051868A1 - 目标的定位方法及装置、计算机设备、计算机存储介质

Info

Publication number: WO2021051868A1
Application number: PCT/CN2020/093150
Authority: WO
Inventors: 王威; 蒋晖; 韩茂琨; 刘玉宇
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-09-20
Filing date: 2020-05-29
Publication date: 2021-03-25
Also published as: CN110796135B; CN110796135A

Abstract

一种目标的定位方法及装置、计算机设备、计算机存储介质，该方法包括：在目标图像中确定预设对象的预测区域，其中，所述目标图像包括所述预测区域（S202）；提取所述预测区域的特征向量，其中，所述特征向量包括所述预测区域中的多个像素点到所述预测区域的四个边界的多组边框距离值（S204）；根据所述特征向量定位所述目标图像中的目标区域（S206）。该方法解决了相关技术中的目标定位方法的计算方案复杂且计算量大等技术问题。

Description

目标的定位方法及装置、计算机设备、计算机存储介质

相关申请的交叉引用

本申请申明享有2019年09月20日递交的申请号为CN201910894135.X、名称为“目标的定位方法及装置、计算机设备、计算机存储介质”的中国专利申请的优先权，该中国专利申请的整体内容以参考的方式结合在本申请中。

技术领域

本申请涉及计算机领域，具体而言，涉及一种目标的定位方法及装置、计算机设备、计算机存储介质。

背景技术

相关技术中，目标检测是计算机视觉领域极其重要的一个分支，近年对于目标检测研究不断深入，已经在该领域获得了许多成就。从起初的RCNN(全称为Region with CNN，目标检测)系列，再到SSD(全称为Single Shot multibox Detector，单次多框检测器)和YOLO(全称为You Only Look Once，是一种物体检查方法)系列，目标检测的发展不断进步。现有的目标检测算法大多采用的都是基于传统的生成锚框的机制。从最早目标检测算法采用选择性搜索提取出大量region proposal(备选区域)，再到后来的anchor box(锚框)机制的系列算法，都取得了目标定位领域突破性的进展。

然而，发明人发现，基于region proposal和anchor box的方案计算量过大，在实际实现的过程中并不能有效地满足实时性的要求，也加大了AI(全称为Artificial Intelligence，人工智能)算法产品化的难度。

针对相关技术中存在的上述问题，目前尚未发现有效的解决方案。

发明内容

本申请实施例提供了一种目标的定位方法及装置、计算机设备、计算机存储介质，以至少解决相关技术中的目标定位方法的计算方案复杂且计算量大等技术问题。

根据本申请的一个实施例，提供了一种目标的定位方法，包括：在目标图像中确定预设对象的预测区域，其中，所述目标图像包括所述预测区域；提取所述预测区域的特征向量，其中，所述特征向量包括所述预测区域中的多个像素点到所述预测区域的四个边界的多组边框距离值；根据所述特征向量定位所述目标图像中的目标区域。

根据本申请的一个实施例，提供了一种目标的定位装置，包括：确定模块，用于在目标图像中确定预设对象的预测区域，其中，所述目标图像包括所述预测区域；提取模块，用于提取所述预测区域的特征向量，其中，所述特征向量包括所述预测区域中的多个像素点到所述预测区域的四个边界的多组边框距离值；定位模块，用于根据所述特征向量定位所述目标图像中的目标区域。

根据本申请的又一个实施例，还提供了一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述方法中的如下步骤：在目标图像中确定预设对象的预测区域，其中，所述目标图像包括所述预测区域；提取所述预测区域的特征向量，其中，所述特征向量包括所述预测区域中的多个像素点到所述预测区域的四个边界的多组边框距离值；根据所述特征向量定位所述目标图像中的目标区域。

根据本申请的又一个实施例，还提供了一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述方法中的如下步骤：在目标图像中确定预设对象的预测区域，其中，所述目标图像包括所述预测区域；提取所述预测区域的特征向量，其中，所述特征向量包括所述预测区域中的多个像素点到所述预测区域的四个边界的多组边框距离值；根据所述特征向量定位所述目标图像中的目标区域。

通过本申请，根据预设对象的特征数据在目标图像中初步确定一个预测区域；计算预测区域中的每个像素点到预测区域的四个边界的边框距离值；根据每个像素点到预测区域的四个边界的边框距离值来定位所述目标图像中的目标区域。通过本申请，在预测区域中根据每个像素点到该区域的四个边界的距离值来定位预设目标的目标区域，使得本申请的定位方案操作简单，且计算量较少，解决了相关技术中的目标定位方法的计算方案复杂且计算量大等技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本申请实施例的一种目标的定位方法应用于计算机终端的硬件结构框图；

图2是根据本申请提供的一种目标的定位方法的流程图；

图3是根据本申请一具体实施例提供的目标到边框的距离示意图；

图4是根据本申请实施例的一种目标的定位装置的结构框图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本申请。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例一所提供的方法实施例可以在移动终端、服务器、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例，图1是本申请实施例的一种目标的定位方法应用于计算机终端的硬件结构框图。如图1所示，计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，可选地，上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述计算机终端的结构造成限定。例如，计算机终端还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本申请实施例中的目标定位方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种目标的定位方法，图2是根据本申请提供的一种目标的定位方法的流程图。如图2所示，该流程包括如下步骤：

步骤S202，在目标图像中确定预设对象的预测区域，其中，目标图像包括预测区域；

本实施例中，网络输入一张图像以及预设对象，其中，预设对象包含了给定目标的真实区域以及给定目标的属性数据，即，目标图像和真实区域是已知的，通过采用神经网络训练给定目标的属性数据来获取图像中的预测区域。

步骤S204，提取预测区域的特征向量，其中，特征向量包括预测区域中的多个像素点到预测区域的四个边界的多组边框距离值；

本实施例中的多组边框距离值，包括了预测区域中的每个像素点到预测区域的上边框、下边框、左边框以及右边框的边框距离值。

步骤S206，根据特征向量定位目标图像中的目标区域。

通过上述步骤，根据预设对象的特征数据在目标图像中初步确定一个预测区域；计算预测区域中的每个像素点到预测区域的四个边界的边框距离值；根据每个像素点到预测区域的四个边界的边框距离值来定位目标图像中的目标区域。通过本申请，在预测区域中根据每个像素点到该区域的四个边界的距离值来定位预设目标的目标区域，使得本申请的定位方案操作简单，且计算量较少，解决了相关技术中的目标定位方法的计算方案复杂且计算量大等技术问题。

可选地，在目标图像中确定预设对象的预测区域，包括：提取目标图像中的每个对象在所述目标图像中的特征图；将每个对象的特征图和预设对象的属性数据进行匹配，以确定预测区域。在本实施例中，网络需要输入一张目标图像和真实框(即上述预设对象)，由于卷积操作拟合了传统的图像处理中的滤波概念，更新卷积核(滤波器)参数，因此对输入图像实施卷积操作，通过卷积神经网络训练的方式，来提取到图像中的特征图。

在一个可选的示例中，将每个对象的特征图和预设对象的属性数据进行匹配，以确定预测区域包括：根据预设对象的属性数据获取预设对象的第一属性和第一位置信息，其中，第一属性用于指示预设对象的种类，第一位置信息用于指示预设对象中的多个关键点在真实区域中的坐标，其中，真实区域是预设对象在目标图像中占用的区域；提取特征图的第二属性和第二位置信息，其中，第二属性用于指示特征图的种类，第二位置信息用于指示特征图中的多个关键点的坐标；匹配第一属性和第二属性，以及匹配第一位置信息和第二位置信息；在第一属性与第二属性、第一位置信息和第二位置信息均匹配的情况下，将特征图在目标图像中占用的区域确定为预测区域。

在一个可选的示例中，根据预设对象的属性数据对特征图进行分类，确定预设对象在目标图像中的预测区域以及不相关区域。在本实施例中，神经网络会根据真实框的属性数据进行学习，从而获得预设对象的种类信息和位置信息，与提取到的特征图进行匹配，从而对目标图像中的每个对象进行分类。以狗为例，神经网络对预设目标的属性数据进行标注学习，确定出预设对象为狗，以及狗的头部坐标，和两只前脚、两只后脚的坐标；在网络输入图像后，通过利用卷积操作提取输入图像的每个对象的特征图，并获取特征图的种类和关键点位置；将特征图于预设对象的属性数据进行匹配，若匹配到特征图中有与狗，以及狗的位置信息相似，则将特征图所占用的区域初步确定为狗的预测区域，将其他匹配不一致的对象确定为非预测区域。

可选地，提取预测区域的特征向量，包括：分别计算预测区域中每个像素点到预测区域的四个边界的边框距离值，得到多组边框距离值；将每组边框距离值转换为一个子特征向量，并将多个子特征向量合并为特征向量。

可选地，分别计算预测区域中每个像素点到预测区域的四个边界的边框距离值，得到多组边框距离值，包括：针对预测区域中的每个像素点，将计算第一像素点投影至预测区域的左边界的第一投影距离，第一像素点投影至预测区域的右边界的第二投影距离，第一像素点投影至预测区域的上边界的第三投影距离，第一像素点投影至预测区域的下边界的第四投影距离，其中，第一像素点为预测区域中任一像素点；将第一投影距离、第二投影距离、第三投影距离、第四投影距离确定为第一像素点的一组边框距离值。

在一个可选的实施例中，计算计算预测目标区域中任一像素点到预测框的四个边界的距离l*；r*；t*；b*，其中，l*，t*，r*，b*分别代表预测区域中任一像素点到预测框的左边界的距离，与预测框的右边界的距离，与预测框的上边界的距离，与预测框的下边界的距离，将计算得到的四个数值合并为一个4维的特征向量。图3是根据本申请一具体实施例提供的目标到边框的距离示意图。如图3所示，中间圆点代表当前选中的像素点，到预测区域的上下左右四个边界的距离标注，到四个边框的距离的计算公式如下：

其中，x和y代表预测中的像素点的坐标，x ₀代表x坐标投影到预测框左边界的x方向坐标；y ₀代表y坐标投影到预测框上边界的y方向坐标；x ₁代表x坐标投影到预测框右边界的x方向坐标；y ₁代表x坐标投影到预测框下边界的y方向坐标。

可选地，根据特征向量定位目标图像中的目标区域，包括：针对预测区域和真实区域中的对应像素点，提取对应像素点在真实区域中的第一特征向量，以及提取对应像素点在预测区域中的第二特征向量，其中，真实区域是预设对象在目标图像中占用的区域；根据第一特征向量和第二特征向量定位目标区域。

在本实施例中，神经网络在实现目标检测时，会利用卷积操作后的特征图与标注数据(即真实框的属性数据)中的相关信息(即预设对象的种类信息和位置信息)进行模式匹配。训练初期，网络的学习能力较弱不能实现较为精准的定位，需要根据真实区域，对初步确定的预测区域中获取到的特征向量进一步的学习，同时进行参数优化提升训练模型性能。

在一个可选的实施例中，根据第一特征向量的边框距离值和第二特征向量的边框距离值定位目标区域，包括：针对每个对应像素点，对第一特征向量中的四个边框距离值求和，得到第一数值，以及对第二特征向量中的四个边框距离求和，得到第二数值；根据第一数值和第二数值基于损失函数计算对应像素点在真实区域和预测区域之间的损失值；将在损失值达到最小时对应的对应像素点集合组成的区域定位为目标区域。

根据上述实施例，获取每一个像素点在预测区域中的特征向量以及在真实区域中的特征向量；进而计算预测区域中的每一个像素点到预测区域四边的距离之和，即K ₁＝l*+t*+r*+b*；以及同样的算法，计算真实区域中的相应的像素点到真实区域四边的距离之和K ₂；在一个可选的示例中，通过最小化真实区域和预测区域之间的L2范数损失函数，来确定一个与真实区域最接近的目标区域。

其中，L2范数损失函数计算公式如下：

其中，针对每个像素点，S表示预测区域与真实区域之间的损失，N表示像素点的总数，i为正自然数。

最小化上述损失函数‖S‖ ₂，然后采用Topn算法，从计算得到的损失值的数组中，找出损失值最小对应的前n个像素点，将上述n个像素点集合组成的区域定位为与预设对象最接近的目标区域。

通过对L2损失函数进行最小化，使得预测区域中的像素点坐标与预设对象的像素点坐标的差距最小，让预测区域更加接近真实框，使得预测目标与预设对象最接近，从而提升网络的性能；且在保证原有识别精度的前提下，大大减少模型的参数和计算量，为算法的产品化提供了可能。

实施例2

在本实施例中还提供了一种目标的定位装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图4是根据本申请实施例的一种目标的定位装置的结构框图，如图4所示，该装置包括：确定模块402，用于在目标图像中确定预设对象的预测区域，其中，目标图像包括预测区域；提取模块404，连接至上述确定模块402，用于提取预测区域的特征向量，其中，特征向量包括预测区域中的多个像素点到预测区域的四个边界的多组边框距离值；定位模块406，连接至上述提取模块404，用于根据特征向量定位目标图像中的目标区域。

可选的，确定模块402包括：第一提取单元，用于提取目标图像中的每个对象在目标图像中的特征图；匹配单元，用于将每个对象的特征图和预设对象的属性数据进行匹配，以确定预测区域。

可选的，匹配单元包括：获取子单元，用于根据预设对象的属性数据获取预设对象的第一属性和第一位置信息，其中，第一属性用于指示预设对象的种类，第一位置信息用于指示预设对象中的多个关键点在真实区域中的坐标，其中，真实区域是预设对象在目标图像中占用的区域；提取子单元，用于提取特征图的第二属性和第二位置信息，其中，第二属性用于指示特征图的种类，第二位置信息用于指示特征图中的多个关键点的坐标；匹配子单元，用于匹配第一属性和第二属性，以及匹配第一位置信息和第二位置信息；第一确定子单元，用于在第一属性与第二属性、第一位置信息和第二位置信息均匹配的情况下，将特征图在目标图像中占用的区域确定为预测区域。

可选的，提取模块404包括：计算单元，用于分别计算预测区域中每个像素点到预测区域的四个边界的边框距离值，得到多组边框距离值；合并单元，用于将每组边框距离值转换为一个子特征向量，并将多个子特征向量合并为特征向量。

可选的，计算单元包括：第一计算子单元，用于针对预测区域中的每个像素点，将计算第一像素点投影至预测区域的左边界的第一投影距离，第一像素点投影至预测区域的右边界的第二投影距离，第一像素点投影至预测区域的上边界的第三投影距离，第一像素点投影至预测区域的下边界的第四投影距离，其中，第一像素点为预测区域中任一像素点；第二确定子单元，用于将第一投影距离、第二投影距离、第三投影距离、第四投影距离确定为第一像素点的一组边框距离值。

可选的，定位模块406包括：第二提取单元，用于针对预测区域和真实区域中的对应像素点，提取对应像素点在真实区域中的第一特征向量，以及提取对应像素点在预测区域中的第二特征向量，其中，真实区域是预设对象在目标图像中占用的区域；定位单元，用于根据第一特征向量的边框距离值和第二特征向量的边框距离值定位目标区域。

可选的，定位单元包括：第二计算子单元，用于针对每个对应像素点，对第一特征向量中的四个边框距离值求和，得到第一数值，以及对第二特征向量中的四个边框距离求和，得到第二数值；第三计算子单元，用于根据第一数值和第二数值基于损失函数计算对应像素点在真实区域和预测区域之间的损失值；定位子单元，用于将在损失值达到最小时对应的对应像素点集合组成的区域定位为目标区域。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本申请的实施例还提供了一种存储介质，所述计算机可读存储介质可以是非易失性，也可以是易失性，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S1，在目标图像中确定预设对象的预测区域，其中，所述目标图像包括所述预测区域；

S2，提取所述预测区域的特征向量，其中，所述特征向量包括所述预测区域中的多个像素点到所述预测区域的四个边界的多组边框距离值；

S3，根据所述特征向量定位所述目标图像中的目标区域。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本申请的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S3，根据所述特征向量定位所述目标图像中的目标区域。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本申请的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

一种目标的定位方法，其中，包括：

在目标图像中确定预设对象的预测区域，其中，所述目标图像包括所述预测区域；

提取所述预测区域的特征向量，其中，所述特征向量包括所述预测区域中的多个像素点到所述预测区域的四个边界的多组边框距离值；

根据所述特征向量定位所述目标图像中的目标区域。
根据权利要求1所述的方法，其中，在目标图像中确定预设对象的预测区域，包括：

提取所述目标图像中的每个对象在所述目标图像中的特征图；

将每个对象的特征图和所述预设对象的属性数据进行匹配，以确定所述预测区域。
根据权利要求2所述的方法，其中，将每个对象的特征图和所述预设对象的属性数据进行匹配，以确定所述预测区域包括：

根据所述预设对象的属性数据获取所述预设对象的第一属性和第一位置信息，其中，所述第一属性用于指示所述预设对象的种类，所述第一位置信息用于指示所述预设对象中的多个关键点在真实区域中的坐标，其中，所述真实区域是所述预设对象在所述目标图像中占用的区域；

提取所述特征图的第二属性和第二位置信息，其中，所述第二属性用于指示所述特征图的种类，所述第二位置信息用于指示所述特征图中的多个关键点的坐标；

匹配所述第一属性和所述第二属性，以及匹配所述第一位置信息和所述第二位置信息；

在所述第一属性与所述第二属性、所述第一位置信息和所述第二位置信息均匹配的情况下，将所述特征图在所述目标图像中占用的区域确定为所述预测区域。
根据权利要求1所述的方法，其中，提取所述预测区域的特征向量，包括：

分别计算所述预测区域中每个像素点到所述预测区域的四个边界的边框距离值，得到多组边框距离值；

将每组边框距离值转换为一个子特征向量，并将多个子特征向量合并为所述特征向量。
根据权利要求4所述的方法，其中，分别计算所述预测区域中每个像素点到所述预测区域的四个边界的边框距离值，得到多组边框距离值，包括：

针对所述预测区域中的每个像素点，计算第一像素点投影至所述预测区域的左边界的第一投影距离，第一像素点投影至所述预测区域的右边界的第二投影距离，第一像素点投影至所述预测区域的上边界的第三投影距离，第一像素点投影至所述预测区域的下边界的第四投影距离，其中，所述第一像素点为所述预测区域中任一像素点；

将所述第一投影距离、所述第二投影距离、所述第三投影距离、所述第四投影距离确定为所述第一像素点的一组边框距离值。
根据权利要求1所述的方法，其中，根据所述特征向量定位所述目标图像中的目标区域，包括：

针对所述预测区域和真实区域中的对应像素点，提取所述对应像素点在所述真实区域中的第一特征向量，以及提取所述对应像素点在所述预测区域中的第二特征向量，其中，所述真实区域是所述预设对象在所述目标图像中占用的区域；

根据所述第一特征向量的边框距离值和所述第二特征向量的边框距离值定位所述目标区域。
根据权利要求6所述的方法，其中，根据所述第一特征向量的边框距离值和所述第二特征向量的边框距离值定位所述目标区域包括：

针对每个对应像素点，对所述第一特征向量中的四个边框距离值求和，得到第一数值，以及对所述第二特征向量中的四个边框距离求和，得到第二数值；

根据所述第一数值和所述第二数值基于损失函数计算所述对应像素点在所述真实区域和所述预测区域之间的损失值；

将所述损失值达到最小时的对应像素点集合组成的区域定位为所述目标区域。
一种目标的定位装置，其中，包括：

确定模块，用于在目标图像中确定预设对象的预测区域，其中，所述目标图像包括所述预测区域；

提取模块，用于提取所述预测区域的特征向量，其中，所述特征向量包括所述预测区域中的多个像素点到所述预测区域的四个边界的多组边框距离值；

定位模块，用于根据所述特征向量定位所述目标图像中的目标区域。
根据权利要求8所述的装置，其中，所述确定模块包括：

第一提取单元，用于提取所述目标图像中的每个对象在所述目标图像中的特征图；

匹配单元，用于将每个对象的特征图和所述预设对象的属性数据进行匹配，以确定所述预测区域。
根据权利要求9所述的装置，其中，所述匹配单元包括：

获取子单元，用于根据所述预设对象的属性数据获取所述预设对象的第一属性和第一位置信息，其中，所述第一属性用于指示所述预设对象的种类，所述第一位置信息用于指示所述预设对象中的多个关键点在真实区域中的坐标，其中，所述真实区域是所述预设对象在所述目标图像中占用的区域；

提取子单元，用于提取所述特征图的第二属性和第二位置信息，其中，所述第二属性用于指示所述特征图的种类，所述第二位置信息用于指示所述特征图中的多个关键点的坐标；

匹配子单元，用于匹配所述第一属性和所述第二属性，以及匹配所述第一位置信息和所述第二位置信息；

第一确定子单元，用于在所述第一属性与所述第二属性、所述第一位置信息和所述第二位置信息均匹配的情况下，将所述特征图在所述目标图像中占用的区域确定为所述预测区域。
根据权利要求8所述的装置，其中，所述提取模块包括：

计算单元，用于分别计算所述预测区域中每个像素点到所述预测区域的四个边界的边框距离值，得到多组边框距离值；

合并单元，用于将每组边框距离值转换为一个子特征向量，并将多个子特征向量合并为所述特征向量。
根据权利要求11所述的装置，其中，所述计算单元包括：

第一计算子单元，用于针对所述预测区域中的每个像素点，将计算第一像素点投影至所述预测区域的左边界的第一投影距离，第一像素点投影至所述预测区域的右边界的第二投影距离，第一像素点投影至所述预测区域的上边界的第三投影距离，第一像素点投影至所述预测区域的下边界的第四投影距离，其中，所述第一像素点为所述预测区域中任一像素点；

第二确定子单元，用于将所述第一投影距离、所述第二投影距离、所述第三投影距离、所述第四投影距离确定为所述第一像素点的一组边框距离值。
根据权利要求8所述的装置，其中，所述定位模块包括：

第二提取单元，用于针对所述预测区域和真实区域中的对应像素点，提取所述对应像素点在所述真实区域中的第一特征向量，以及提取所述对应像素点在所述预测区域中的第二特征向量，其中，所述真实区域是所述预设对象在所述目标图像中占用的区域；

定位单元，用于根据所述第一特征向量的边框距离值和所述第二特征向量的边框距离值定位所述目标区域。
根据权利要求13所述的装置，其中，所述定位单元包括：第二计算子单元，用于针对每个对应像素点，对所述第一特征向量中的四个边框距离值求和，得到第一数值，以及对所述第二特征向量中的四个边框距离求和，得到第二数值；第三计算子单元，用于根据所述第一数值和所述第二数值基于损失函数计算所述对应像素点在所述真实区域和所述预测区域之间的损失值；定位子单元，用于将在所述损失值达到最小时对应的对应像素点集合组成的区域定位为所述目标区域。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其中，所述处理器执行所述计算机程序时实现如下步骤：

在目标图像中确定预设对象的预测区域，其中，所述目标图像包括所述预测区域；

提取所述预测区域的特征向量，其中，所述特征向量包括所述预测区域中的多个像素点到所述预测区域的四个边界的多组边框距离值；

根据所述特征向量定位所述目标图像中的目标区域。
根据权利要求15所述的计算机设备，其中，在目标图像中确定预设对象的预测区域的步骤包括：

提取所述目标图像中的每个对象在所述目标图像中的特征图；

将每个对象的特征图和所述预设对象的属性数据进行匹配，以确定所述预测区域。
根据权利要求16所述的计算机设备，其中，将每个对象的特征图和所述预设对象的属性数据进行匹配，以确定所述预测区域的步骤包括：

根据所述预设对象的属性数据获取所述预设对象的第一属性和第一位置信息，其中，所述第一属性用于指示所述预设对象的种类，所述第一位置信息用于指示所述预设对象中的多个关键点在真实区域中的坐标，其中，所述真实区域是所述预设对象在所述目标图像中占用的区域；

提取所述特征图的第二属性和第二位置信息，其中，所述第二属性用于指示所述特征图的种类，所述第二位置信息用于指示所述特征图中的多个关键点的坐标；

匹配所述第一属性和所述第二属性，以及匹配所述第一位置信息和所述第二位置信息；

在所述第一属性与所述第二属性、所述第一位置信息和所述第二位置信息均匹配的情况下，将所述特征图在所述目标图像中占用的区域确定为所述预测区域。
一种计算机存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如下步骤：

在目标图像中确定预设对象的预测区域，其中，所述目标图像包括所述预测区域；

提取所述预测区域的特征向量，其中，所述特征向量包括所述预测区域中的多个像素点到所述预测区域的四个边界的多组边框距离值；

根据所述特征向量定位所述目标图像中的目标区域。
根据权利要求18所述的计算机存储介质，其中，在目标图像中确定预设对象的预测区域的步骤包括：

提取所述目标图像中的每个对象在所述目标图像中的特征图；

将每个对象的特征图和所述预设对象的属性数据进行匹配，以确定所述预测区域。
根据权利要求19所述的计算机设备，其中，将每个对象的特征图和所述预设对象的属性数据进行匹配，以确定所述预测区域的步骤包括：

根据所述预设对象的属性数据获取所述预设对象的第一属性和第一位置信息，其中，所述第一属性用于指示所述预设对象的种类，所述第一位置信息用于指示所述预设对象中的多个关键点在真实区域中的坐标，其中，所述真实区域是所述预设对象在所述目标图像中占用的区域；

提取所述特征图的第二属性和第二位置信息，其中，所述第二属性用于指示所述特征图的种类，所述第二位置信息用于指示所述特征图中的多个关键点的坐标；

匹配所述第一属性和所述第二属性，以及匹配所述第一位置信息和所述第二位置信息；

在所述第一属性与所述第二属性、所述第一位置信息和所述第二位置信息均匹配的情况下，将所述特征图在所述目标图像中占用的区域确定为所述预测区域。