WO2023241372A1

WO2023241372A1 - 相机内参标定方法及相关设备

Info

Publication number: WO2023241372A1
Application number: PCT/CN2023/097798
Authority: WO
Inventors: 王润之; 徐其超; 冯思淇; 李江伟; 时天欣
Original assignee: 华为技术有限公司
Priority date: 2022-06-13
Filing date: 2023-06-01
Publication date: 2023-12-21
Also published as: CN117274392A

Abstract

一种相机内参标定方法及相关设备，涉及图像处理领域。方法（300）先获取第一图像和目标终端的标识（301）；基于目标终端获取的第一图像和高精度三维地图确定相机的第一内参标定数据，以及根据目标终端的标识和历史内参标定数据库确定目标终端的历史内参标定数据（302）。继而可以根据第一内参标定数据和历史内参标定数据确定相机的标定内参数（303）。方法可以实时对目标终端的相机内参进行标定，提升标定效率，进而有效降低相机内参标定所需的工作量。

Description

相机内参标定方法及相关设备

本申请要求于2022年06月13日提交中国专利局、申请号为202210660950.1、申请名称为“相机内参标定方法及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及图像处理领域，尤其涉及一种相机内参标定方法及相关设备。

背景技术

相机内参数是与相机自身特性相关的参数，比如相机的焦距、像素大小等。相机内参数标定技术是摄影测量和计算机视觉领域的一个重点研究内容之一，它是视觉定位、机器人视觉导航建图、工业控制等领域技术的基础。

随着终端的处理能力的不断增强，基于增强现实(Augmented Reality，AR)技术的应用程序逐渐增多，AR应用中的算法通常需要有先验的相机内参数作为输入。然而由于不同的手机机型使用的相机传感器不同，对应的相机内参数也不同，为了适配不同的手机机型，需要逐个机型进行标定获得对应的相机内参数。目前，可以利用标定板完成终端相机的内参标定，这种方法需要事先通过离线标定的方式获取每个机型内参数并储存，然后才能在AR应用的算法中读取和调用相机的内参，但是，这种标定方法需要耗费大量人力物力，而且不能获取实时的相机内参数用于AR应用后续的计算。

如何解决上述问题，是本领域技术人员正在研究的热点。

发明内容

本申请提供一种相机内参标定方法及相关设备，可以实时对相机内参进行标定，有效降低相机内参标定所需的工作量。

第一方面，本申请提供一种相机内参标定方法，该方法可以应用于电子设备上。上述电子设备例如为服务器或智能终端等。电子设备获取第一图像和目标终端的标识。该第一图像为目标终端在第一位置处利用自身的相机拍摄得到的图像，第一位置位于预设区域内。电子设备再根据第一图像和预设区域对应的高精度三维地图，确定相机的第一内参标定数据；以及，根据目标终端的标识和历史内参标定数据库确定目标终端的历史内参标定数据。历史内参标定数据库包括一个或多个标识的终端的历史内参标定数据。电子设备最后根据第一内参标定数据和目标终端的历史内参标定数据确定相机的标定内参数。

本方案先基于目标终端获取的第一图像和高精度三维地图确定相机的第一内参标定数据，以及根据目标终端的标识和历史内参标定数据库确定该目标终端的历史内参标定数据。继而可以根据第一内参标定数据和历史内参标定数据确定相机的标定内参数。该方法可以实时对目标终端的相机内参进行标定，提升标定效率，进而有效降低相机内参标定所需的工作量。

在一种可能的实施方式中，高精度三维地图包括多张场景图像、场景图像的二维特征点坐标、二维特征点的特征描述子以及二维特征点对应的三维空间点坐标。其中，多张是指大于或等于两张。

上述根据第一图像和预设区域对应的高精度三维地图，确定相机的第一内参标定数据，包括：

从高精度三维地图中确定与第一图像的图像相似度最高的N张场景图像，N为大于零的整数。确定第一图像的M个图像特征点，M为大于零的整数。根据M个图像特征点的特征描述子和N张场景图像的二维特征点对应的特征描述子进行匹配，确定M个图像特征点中的X个图像特征点的坐标对。坐标对包括二维特征点坐标和三维空间点坐标，X小于或等于M。根据X个图像特征点的坐标对确定第一内参标定数据。

本方案中，由于第一图像是在预设区域中的第一位置拍摄得到的图像，因此，利用图像特征点的特征描述子在高精度三维地图中进行匹配，以确定第一图像的X个图像特征点对应的坐标对，进而可以根据X个图像特征点的坐标对确定第一内参标定数据。

在一种可能的实施方式中，根据X个图像特征点的坐标对确定第一内参标定数据，包括：

将X个图像特征点的坐标对确定为第一内参标定数据。

进一步地，根据第一内参标定数据和目标终端的历史内参标定数据确定相机的标定内参数，包括：

根据X个图像特征点的坐标对确定相机的第一内参数。根据X个图像特征点的坐标对、目标终端的历史内参标定数据确定相机的第二内参数。将第一内参数、第二内参数中重投影误差最小的一个确定为标定内参数。

本方案中，分别确定第一内参数和第二内参数，再将前后两者中重投影误差最小的一个确定为相机的标定内参数，利用重投影误差比较可以有效提升标定内参数的精度。

根据X个图像特征点的坐标对确定相机的第一内参数。将第一内参数确定为第一内参标定数据。

根据第一内参数及其第一权重、目标终端对应的每个历史内参标定数据及其第二权重进行加权计算，以确定相机的第二内参数。将第一内参数、第二内参数中重投影误差最小的一个确定为标定内参数。

本方案中，联合第一内参数和历史内参标定数据，利用加权计算的方式确定相机的第二内参数，再根据重投影误差将第一内参数和第二内参数中的一个确定为标定内参数。

在一种可能的实施方式中，第一权重为第一内参数对应的重投影误差的倒数；第二权重为历史内参标定数据对应的重投影误差的倒数。

在一种可能的实施方式中，上述相机内参标定方法还包括：

标定内参数满足内参数有效性条件时，电子设备根据标定内参数更新目标终端的本地内参数，并将第一内参标定数据保存至历史内参标定数据库中。而标定内参数不满足内参数有效性条件时，电子设备根据预设内参数更新目标终端的本地内参数。

其中，内参数有效性条件是预设的内参数需要满足的标准，具体的标准可以根据实际情况进行设置。本方案中，此时的电子设备为上述目标终端，即在目标终端执行获取标定内参数的方法步骤，再判断内参数的有效性，当标定内参数满足内参数有效性条件时，目标终端根据标定内参数更新其本地内参数，并将第一内参标定数据保存至历史内参标定数据库中。而标定内参数不满足内参数有效性条件时，目标终端根据预设内参数更新其本地内参数。

在一种可能的实施方式中，上述相机内参标定方法还包括：

标定内参数满足内参数有效性条件时，电子设备将第一内参标定数据保存至历史内参标定数据库中，以及将标定内参数发送给目标终端，以使目标终端根据标定内参数更新目标终端的本地内参数。标定内参数不满足内参数有效性条件时，电子设备将预设内参数发送给目标终端，以使目标终端更新目标终端的本地内参数。

在一种可能的实施方式中，上述获取第一图像和目标终端的标识，包括：

接收来自目标终端的第一图像以及目标终端的标识。

第二方面，本申请还提供一种相机内参标定装置，该装置包括获取模块、确定模块和标定模块。

获取模块，用于获取第一图像和目标终端的标识。第一图像为目标终端在第一位置处利用自身的相机拍摄得到的图像，第一位置位于预设区域内。

确定模块，用于根据第一图像和预设区域对应的高精度三维地图，确定相机的第一内参标定数据；以及，根据目标终端的标识和历史内参标定数据库确定目标终端的历史内参标定数据。历史内参标定数据库包括一个或多个标识的终端的历史内参标定数据。

标定模块，用于根据第一内参标定数据和目标终端的历史内参标定数据确定相机的标定内参数。

在一种可能的实施方式中，高精度三维地图包括多张场景图像、场景图像的二维特征点坐标、二维特征点的特征描述子以及二维特征点对应的三维空间点坐标。

上述确定模块，具体用于：

在一种可能的实施方式中，确定模块在根据X个图像特征点的坐标对确定第一内参标定数据方面，具体用于：

将X个图像特征点的坐标对确定为第一内参标定数据。

标定模块，具体用于：

上述标定模块，具体用于：

在一种可能的实施方式中，相机内参标定装置还包括：

处理模块，用于标定内参数满足内参数有效性条件时，根据标定内参数更新目标终端的本地内参数，并将第一内参标定数据保存至历史内参标定数据库中。以及，标定内参数不满足内参数有效性条件时，根据预设内参数更新目标终端的本地内参数。

在一种可能的实施方式中，相机内参标定装置还包括：

处理模块，用于标定内参数满足内参数有效性条件时，将第一内参标定数据保存至历史内参标定数据库中，以及将标定内参数发送给目标终端，以使目标终端根据标定内参数更新目标终端的本地内参数。以及，标定内参数不满足内参数有效性条件时，将预设内参数发送给目标终端，以使目标终端更新目标终端的本地内参数。

在一种可能的实施方式中，获取模块，具体用于：

接收来自目标终端的第一图像以及目标终端的标识。

第三方面，本申请还提供一种相机内参标定设备，包括处理器和存储器，其中，处理器和存储器相连，其中，存储器用于存储程序代码，处理器用于调用程序代码，以执行如第一方面所述的相机内参标定方法。

第四方面，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现如第一方面所述的相机内参标定方法。

第五方面，本申请还提供一种包含指令的计算机程序产品，当所述计算机程序产品在计算机上运行时，使得计算机执行第一方面所述的相机内参标定方法。

第六方面，本申请还提供一种芯片，所述芯片包括处理器与数据接口，所述处理器通过所述数据接口读取存储器上存储的指令，执行第一方面所述的相机内参标定方法。

可选地，作为一种实现方式，所述芯片还可以包括存储器，所述存储器中存储有指令，所述处理器用于执行所述存储器上存储的指令，当所述指令被执行时，所述处理器用于执行第一方面所述的相机内参标定方法。

附图说明

下面对本申请实施例用到的附图进行介绍。

图1是本申请实施例提供的一种系统架构示意图；

图2是本申请实施例提供的一种卷积神经网络的结构示意图；

图3是本申请实施例提供的一种相机内参标定方法的流程示意图；

图4是本申请实施例提供的一种相机内参标定方法的示意图；

图5a是本申请实施例提供的一种确定第一内参标定数据的流程示意图；

图5b是本申请实施例提供的一种确定标定内参数的流程示意图；

图5c是本申请实施例提供的一种相机内参标定方法的流程示意图；

图6a是本申请实施例提供的另一种确定标定内参数的流程示意图；

图6b是本申请实施例提供的另一种相机内参标定方法的流程示意图；

图7是本申请实施例提供的一种相机内参标定装置的结构示意图；

图8是本申请实施例提供的一种相机内参标定设备的结构示意图。

具体实施方式

下面将结合附图，对本申请中的技术方案进行描述。其中，在本申请实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

本申请中实施例提到的“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a、b、或c中的至少一项(个)，可以表示：a、b、c、(a和b)、(a和c)、(b和c)、或(a和b和c)，其中a、b、c可以是单个，也可以是多个。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a、同时存在a和b、单独存在b这三种情况，其中a、b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。而本申请中实施例的步骤的序号(如步骤S1、步骤S21等)只为了区分不同的步骤，不对步骤之间的先后执行顺序造成限定。

以及，除非有相反的说明，本申请实施例使用“第一”、“第二”等序数词是用于对多个对象进行区分，不用于限定多个对象的顺序、时序、优先级或者重要程度。例如，第一图像和第二图像，只是为了便于描述，而并不是表示这第一图像和第二图像的顺序或重要程度等的不同。

上述实施例中所用，根据上下文，术语“当……时”可以被解释为意思是“如果……”或“在……后”或“响应于确定……”或“响应于检测到……”。以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的构思和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

为了便于理解，下面先对本申请实施例涉及的相关术语等相关概念进行介绍。

(1)、深度学习模型

机器学习是一种人工智能技术。深度学习是一种机器学习算法，通过使用多层处理单元来处理输入和提供相应输出。深度学习算法可以由多层神经网络(NN)来实现。这样的多层神经网络也被称为“深度学习模型”。

(2)、神经网络

神经网络可以是由神经单元组成的，神经单元可以是指以x_s和截距1为输入的运算单元，该运算单元的输出可以为：

其中，s＝1、2、……n，n为大于1的自然数，W_s为x_s的权重，b为神经单元的偏置。f为神经单元的激活函数(Activation Functions)，用于将非线性特性引入神经网络中，来将神经单元中的输入信号转换为输出信号。该激活函数的输出信号可以作为下一层卷积层的输入。激活函数可以是Sigmoid函数。神经网络是将许多个上述单一的神经单元联结在一起形成的网络，即一个神经单元的输出可以是另一个神经单元的输入。每个神经单元的输入可以与前一层的局部接受域相连，来提取局部接受域的特征，局部接受域可以是由若干个神经单元组成的区域。

(3)、深度神经网络

深度神经网络(Deep Neural Network，DNN)，也称多层神经网络，可以理解为具有很多层隐含层的神经网络，这里的“很多”并没有特别的度量标准。从DNN按不同层的位置划分，DNN内部的神经网络可以分为三类：输入层，隐含层，输出层。一般来说第一层是输入层，最后一层是输出层，中间的层数都是隐含层。层与层之间是全连接的，也就是说，第i层的任意一个神经元一定与第i+1层的任意一个神经元相连。虽然DNN看起来很复杂，但是就每一层的工作来说，其实并不复杂，简单来说就是如下线性关系表达式：其中，是输入向量，是输出向量，是偏移向量，W是权重矩阵(也称系数)，α()是激活函数。每一层仅仅是对输入向量经过如此简单的操作得到输出向量由于DNN层数多，则系数W和偏移向量的数量也就很多了。这些参数在DNN中的定义如下所述：以系数W为例：假设在一个三层的DNN中，第二层的第4个神经元到第三层的第2个神经元的线性系数定义为上标3代表系数W所在的层数，而下标对应的是输出的第三层索引2和输入的第二层索引4。

总结就是：第L-1层的第k个神经元到第L层的第j个神经元的系数定义为需要注意的是，输入层是没有W参数的。在深度神经网络中，更多的隐含层让网络更能够刻画现实世界中的复杂情形。理论上而言，参数越多的模型复杂度越高，“容量”也就越大，也就意味着它能完成更复杂的学习任务。训练深度神经网络的也就是学习权重矩阵的过程，其最终目的是得到训练好的深度神经网络的所有层的权重矩阵(由很多层的向量W形成的权重矩阵)。

(4)、卷积神经网络

卷积神经网络(CNN，Convolutional Neuron Network)是一种带有卷积结构的深度神经网络。卷积神经网络包含了一个由卷积层和子采样层构成的特征抽取器。该特征抽取器可以看作是滤波器，卷积过程可以看作是使用一个可训练的滤波器与一个输入的图像或者卷积特征平面(Feature Map)做卷积。卷积层是指卷积神经网络中对输入信号进行卷积处理的神经元层。在卷积神经网络的卷积层中，一个神经元可以只与部分邻层神经元连接。一个卷积层中，通常包含若干个特征平面，每个特征平面可以由一些矩形排列的神经单元组成。同一特征平面的神经单元共享权重，这里共享的权重就是卷积核。共享权重可以理解为提取图像信息的方式与位置无关。这其中隐含的原理是：图像的某一部分的统计信息与其他部分是一样的。即意味着在某一部分学习的图像信息也能用在另一部分上。所以对于图像上的所有位置，都能使用同样的学习得到的图像信息。在同一卷积层中，可以使用多个卷积核来提取不同的图像信息，一般地，卷积核数量越多，卷积操作反映的图像信息越丰富。

卷积核可以以随机大小的矩阵的形式初始化，在卷积神经网络的训练过程中卷积核可以通过学习得到合理的权重。另外，共享权重带来的直接好处是减少卷积神经网络各层之间的连接，同时又降低了过拟合的风险。

(5)、相机成像

相机成像系统中，共包含四个坐标系：世界坐标系、相机坐标系、图像坐标系、像素坐标系。

世界坐标系是描述目标物体在真实世界的位置而引入的三维世界坐标系，用来描述三维空间中的物体和相机之间的坐标位置，满足右手法则。

相机坐标系是以相机为中心，从相机角度描述物体位置，作为像素坐标系和世界坐标系的桥梁。

图像坐标系是描述真实物体在相机焦距处成像的坐标系，用来连接相机坐标系与像素坐标系。

像素坐标系是描述物体在照片上数字图像的位置而引入的一种数字坐标系。

而相机成像的过程实质上是上述几个坐标系的转换，具体地，空间中的一点由世界坐标系转换到相机坐标系，然后再将其投影到成像平面(即从相机坐标系转换到图像坐标系)，最后再将成像平面上的数据转换到图像平面(即从图像坐标系转换到像素坐标系)。

把相机认为是一个函数，输入量是一个场景，输出量是一幅灰度图。这个从三维到二维的过程的函数是不可逆的。相机标定的目标是找一个合适的数学模型，求出这个模型的参数，这样能够近似这个三维到二维的过程，使这个三维到二维的过程的函数找到反函数。这个逼近的过程就是相机标定。换句话说，相机标定是从世界坐标系转换到像素坐标系的过程，相机标定的目的包括获得相机的内参数和外参数。

相机的外参数用于把坐标从世界坐标系转换到相机坐标系中，外参数是在世界坐标系中的参数，比如相机的位置、旋转方向等。

而相机的内参数用于把坐标从相机坐标系转换到像素坐标系中，内参数是与相机自身特性相关的参数，比如相机的焦距(如X轴焦距、Y轴焦距)、像主点坐标(如X轴上的像主点坐标、Y轴上的像主点坐标)等。相机的内参数一般都是相机出厂就定下来的，可以通过相机标定的方式计算出具体的内参数。

本申请实施例提供的相机内参标定方法能够应用在增强现实(Augmented Reality，AR)场景、视觉定位导航场景等机器视觉场景，具体地，机器视觉场景中，机器视觉应用利用相机获取图像，进而根据获取到的图像完成相关的机器视觉任务。为了使得机器视觉应用的机器视觉任务正常完成，需要先对相机进行参数标定，包括标定相机的内参数。

下面将对相机内参标定进行简单的介绍。目前，可以通过标定板对终端的相机进行内参数标定，这种方法需要事先通过离线标定的方式获取内参数并储存，然后AR应用的算法才能读取和调用相机的内参，但是这样的标定方法需要耗费大量人力物力，而且不能获取实时的相机内参数用于AR应用后续的计算。

因此，本申请实施例提供一种相机内参标定方法，可以对相机内参进行实时标定，有效降低相机内参标定的工作量，节省相机内参标定所需的人力物力。

参见附图1，本申请实施例提供了一种系统架构100。如所述系统架构100所示，数据采集设备160用于采集训练数据，本申请实施例中训练数据包括训练图像；并将训练数据存入数据库130，训练设备120基于数据库130中维护的训练数据训练得到目标模型101，这里的目标模型101可以为经训练阶段训练得到的特征检测模型、图像检索模型等。在实际的应用中，所述数据库130中维护的训练数据不一定都来自于数据采集设备160的采集，也有可能是从其他设备接收得到的。另外需要说明的是，训练设备120也不一定完全基于数据库130维护的训练数据进行目标模型101的训练，也有可能从云端或其他地方获取训练数据进行模型训练，上述描述不应该作为对本申请实施例的限定。

根据训练设备120训练得到的目标模型101可以应用于不同的系统或设备中，如应用于图1所示的执行设备110，所述执行设备110可以是终端，如手机终端，平板电脑，笔记本电脑，AR/VR，车载终端等，还可以是服务器或者云端等。在附图1中，执行设备110配置有I/O接口112，用于与外部设备进行数据交互，用户可以通过客户设备140向I/O接口112输入数据，所述输入数据在本申请实施例中可以包括第一图像，也就是说，在执行设备110上执行本申请的相机内参标定方法，对第一图像进行处理，进而得到相机的标定内参数。数据库130也可以根据需要将训练数据输入至I/O接口112中，例如，将训练图像作为第一图像时。

预处理模块113用于根据I/O接口112接收到的输入数据(如所述第一图像)进行预处理，在本申请实施例中，预处理模块113可以用于输入数据进行图像复原处理或图像增强处理等预处理，以使输入数据达到预设的标准。

其中，在实际应用中常常发生图像退化现象。例如大气流的扰动，光学系统的像差，相机和物体的相对运动都会使遥感图像发生退化。因此，对图像进行复原处理的目的是校正各种原因所造成的图像退化，使重建或估计得到的图像尽可能逼近于理想无退化的像场。图像复原处理的原理为：首先要对图像退化的整个过程加以适当的估计，在此基础上建立近似的退化数学模型，之后还需要对模型进行适当的修正，以对退化过程出现的失真进行补偿，以保证复原之后所得到的图像趋近于原始图像，实现图像的最优化。

而图像增强处理是对图像中的信息有选择地加强和抑制，以改善图像的视觉效果，或将图像转变为更适合于机器处理的形式，以便于数据抽取或识别。例如一个图像增强系统可以通过高通滤波器来突出图像的轮廓线，从而使机器能够测量轮廓线的形状和周长。图像增强技术有多种方法，反差展宽、对数变换、密度分层和直方图均衡等都可用于改变图像灰调和突出细节。

在执行设备110对输入数据进行预处理，或者在执行设备110的计算模块111执行计算等相关的处理过程中，执行设备110可以调用数据存储系统150中的数据、代码等以用于相应的处理，也可以将相应处理得到的数据、指令等存入数据存储系统150中。数据存储系统150具体可以为本申请实施例中的历史内参标定数据库。

最后，I/O接口112将处理结果，如上述得到的相机的标定内参数返回给客户设备140，从而提供给用户。

在附图1中所示情况下，用户可以手动给定输入数据，该手动给定可以通过I/O接口112提供的界面进行操作。另一种情况下，客户设备140可以自动地向I/O接口112发送输入数据，如果要求客户设备140自动发送输入数据需要获得用户的授权，则用户可以在客户设备140中设置相应权限。用户可以在客户设备140查看执行设备110输出的结果，具体的呈现形式可以是显示、声音、动作等具体方式。客户设备140也可以作为数据采集端，采集如图1所示输入I/O接口112的输入数据及I/O接口112的输出结果作为新的样本数据，并存入数据库130。当然，也可以不经过客户设备140进行采集，而是由I/O接口112直接将如图1所示输入I/O接口112的输入数据及I/O接口112的输出结果，作为新的样本数据存入数据库130。

其中，附图1仅是本申请实施例提供的一种系统架构的示意图，图中所示设备、器件、模块等之间的位置关系不构成任何限制，例如，在附图1中，数据存储系统150相对执行设备110是外部存储器，在其它情况下，也可以将数据存储系统150置于执行设备110中。

如图1所示，根据训练设备120训练得到目标模型101，该目标模型101在本申请实施例中可以是特征检测模型、图像检索模型等，特征检测模型用于提取图像的特征点并对特征点进行特征描述得到特征描述子。特征描述子包括但不限于尺度不变特征变换(Scale-Invariant Feature Transform，SIFT)特征描述子、加速稳健特征(Speeded Up Robust Features，SURF)描述子、方向梯度直方图(Histogram of Oriented Gradient,HOG)特征描述子、局部二值模式(Local Binary Pattern，LBP)特征描述子以及哈尔特征描述子。图像检索模型用于匹配与目标图像相似的图像。特征检测模型、图像检索模型可以为深度学习模型。本申请方案中具体的特征检测模型或图像检索模型可以是神经网络模型。

如前文的基础概念介绍所述，卷积神经网络是一种带有卷积结构的深度神经网络，是一种深度学习(deep learning)架构，深度学习架构是指通过机器学习的算法，在不同的抽象层级上进行多个层次的学习。作为一种深度学习架构，CNN是一种前馈(feed-forward)人工神经网络，该前馈人工神经网络中的各个神经元可以对输入其中的图像作出响应。

如图2所示，图2是本申请实施例提供的一种卷积神经网络的结构示意图。卷积神经网络(CNN)200可以包括输入层210，卷积层/池化层220(其中池化层为可选的)，以及全连接层230。待处理图像通过输入层210输入卷积神经网络200中进行处理。其中：

卷积层/池化层220：

卷积层：

如图2所示卷积层/池化层220可以包括如图2中示例的221-226层，举例来说：在一种实现中，221层为卷积层，222层为池化层，223层为卷积层，224层为池化层，225为卷积层，226为池化层。在另一种实现方式中，221、222为卷积层，223为池化层，224、225为卷积层，226为池化层。即卷积层的输出可以作为随后的池化层的输入，也可以作为另一个卷积层的输入以继续进行卷积操作。

下面将以卷积层221为例，介绍一层卷积层的内部工作原理。

卷积层221可以包括很多个卷积算子，卷积算子也称为核，其在图像处理中的作用相当于一个从输入图像矩阵中提取特定信息的过滤器，卷积算子本质上可以是一个权重矩阵，这个权重矩阵通常被预先定义，在对图像进行卷积操作的过程中，权重矩阵通常在输入图像上沿着水平方向一个像素接着一个像素(或两个像素接着两个像素……这取决于步长Stride的取值)的进行处理，从而完成从图像中提取特定特征的工作。该权重矩阵的大小应该与图像的大小相关，需要注意的是，权重矩阵的纵深维度(Depth Dimension)和输入图像的纵深维度是相同的，在进行卷积运算的过程中，权重矩阵会延伸到输入图像的整个深度。因此，和一个单一的权重矩阵进行卷积会产生一个单一纵深维度的卷积化输出，但是大多数情况下不使用单一权重矩阵，而是应用多个尺寸(行×列)相同的权重矩阵，即多个同型矩阵。每个权重矩阵的输出被堆叠起来形成卷积图像的纵深维度，这里的维度可以理解为由上面所述的“多个”来决定。不同的权重矩阵可以用来提取图像中不同的特征，例如一个权重矩阵用来提取图像边缘信息，另一个权重矩阵用来提取图像的特定颜色，又一个权重矩阵用来对图像中不需要的噪点进行模糊化等。该多个权重矩阵尺寸(行×列)相同，经过该多个尺寸相同的权重矩阵提取后的特征图的尺寸也相同，再将提取到的多个尺寸相同的特征图合并形成卷积运算的输出。

这些权重矩阵中的权重值在实际应用中需要经过大量的训练得到，通过训练得到的权重值形成的各个权重矩阵可以用来从输入图像中提取信息，从而使得卷积神经网络200进行正确的预测。

当卷积神经网络200有多个卷积层的时候，初始的卷积层(例如221)往往提取较多的一般特征，该一般特征也可以称之为低级别的特征；随着卷积神经网络200深度的加深，越往后的卷积层(例如226)提取到的特征越来越复杂，比如高级别的语义之类的特征，语义越高的特征越适用于待解决的问题。

池化层：

由于常常需要减少训练参数的数量，因此卷积层之后常常需要周期性的引入池化层，在如图2中220所示例的221-226各层，可以是一层卷积层后面跟一层池化层，也可以是多层卷积层后面接一层或多层池化层。在图像处理过程中，池化层的唯一目的就是减少图像的空间大小。池化层可以包括平均池化算子和/或最大池化算子，以用于对输入图像进行采样得到较小尺寸的图像。平均池化算子可以在特定范围内对图像中的像素值进行计算产生平均值作为平均池化的结果。最大池化算子可以在特定范围内取该范围内值最大的像素作为最大池化的结果。另外，就像卷积层中用权重矩阵的大小应该与图像尺寸相关一样，池化层中的运算符也应该与图像的大小相关。通过池化层处理后输出的图像尺寸可以小于输入池化层的图像的尺寸，池化层输出的图像中每个像素点表示输入池化层的图像的对应子区域的平均值或最大值。

全连接层230：

在经过卷积层/池化层220的处理后，卷积神经网络200还不足以输出所需要的输出信息。因为如前所述，卷积层/池化层220只会提取特征，并减少输入图像带来的参数。然而为了生成最终的输出信息(所需要的类信息或其他相关信息)，卷积神经网络200需要利用全连接层230来生成一个或者一组所需要的类的数量的输出。因此，在全连接层230中可以包括多层隐含层(如图2所示的231、232至23n)以及输出层240，该多层隐含层中所包含的参数可以根据具体的任务类型的相关训练数据进行预先训练得到，例如该任务类型可以包括图像特征检测，图像检索等等。

在全连接层230中的多层隐含层之后，也就是整个卷积神经网络200的最后层为输出层240，该输出层240具有类似分类交叉熵的损失函数，具体用于计算预测误差，一旦整个卷积神经网络200的前向传播(如图2由210至240方向的传播为前向传播)完成，反向传播(如图2由240至210方向的传播为反向传播)就会开始更新前面提到的各层的权重值以及偏差，以减少卷积神经网络200的损失，及卷积神经网络200通过输出层输出的结果和理想结果之间的误差。

需要说明的是，如图2所示的卷积神经网络200仅作为一种卷积神经网络的示例，在具体的应用中，卷积神经网络还可以以其他网络模型的形式存在。

下面对相机内参标定方法进行具体说明。

该相机内参标定方法可以应用于电子设备。本申请实施例中，电子设备可以为智能手机、服务器、智能电视、平板电脑、桌面型计算机、膝上型计算机、手持计算机、笔记本电脑、超级移动个人计算机(Ultra-Mobile Personal Computer，UMPC)、上网本，以及蜂窝电话、个人数字助理(Personal Digital Assistant，PDA)、增强现实(Augmented Reality，AR)设备、虚拟现实(Virtual Reality，VR)设备、人工智能(Artificial Intelligence,AI)设备、可穿戴式设备、车载设备、智能家居设备和/或智慧城市设备等。本申请实施例对该电子设备的具体类型不作特殊限制。电子设备根据第一图像、目标终端的标识、高精度三维地图以及历史内参标定数据库进行处理，最终可以获得目标终端的相机的标定内参。可以实时对相机内参进行标定，有效降低相机内参标定的工作量。

参考图3和图4，图3是本申请实施例提供的一种相机内参标定方法的流程示意图，图4是本申请实施例提供的一种相机内参标定方法的示意图。相机内参标定方法300包括步骤301、步骤302和步骤303。

301、获取第一图像和目标终端的标识。

具体地，该第一图像为目标终端在第一位置处利用自身的相机拍摄得到的图像，第一位置位于预设区域内，第一图像所拍摄的场景位于预设区域内。第一图像可以为一张或多张。上述预设区域的具体范围可以根据实际需要进行设置，不做具体限定。例如，预设区域为公园A、广场B或者商场C等。而目标终端的标识可以为目标终端的唯一标记信息或者目标终端的型号信息等可以标识终端的信息，目标终端的唯一标记可以由数字、字母、特殊字符等中的至少一个来组成，例如，目标终端的唯一标记为BJ22-2598。目标终端的型号可以由数字、字母、特殊字符等中的至少一个来组成，例如，目标终端的型号为XH1-123。

进一步地，目标终端可以为上述电子设备本身，此时，用户可以利用目标终端在预设区域内获取第一图像。或者，目标终端和电子设备为两个不同的设备，此时，目标终端获取第一图像和自身的标识，将第一图像和标识发送给电子设备，电子设备接收来自目标终端的第一图像以及目标终端的标识，并根据第一图像和目标终端的标识进行图3所示的方法步骤的处理。

302、根据第一图像和预设区域对应的高精度三维地图，确定相机的第一内参标定数据；以及，根据目标终端的标识和历史内参标定数据库确定目标终端的历史内参标定数据。

具体地，高精度三维地图为上述预设区域对应的三维地图。历史内参标定数据库包括一个或多个标识的终端的历史内参标定数据。历史内参标定数据库可以设置在电子设备中，例如，当电子设备为云端的服务器时，服务器执行图3所示的方法，并设置有历史内参标定数据库。或者，历史内参标定数据库可以设置在其他设备上，电子设备通过访问其他设备以建立与历史内参标定数据库的连接。而第一内参标定数据是与目标终端的标定参数相关的数据。

进一步地，高精度三维地图为精度更高的电子地图。预设区域对应的高精度三维地图包括预设区域中的多张场景图像、上述场景图像的二维特征点坐标、二维特征点的特征描述子以及二维特征点对应的三维空间点坐标。其中，多张是指大于或等于两张，二维特征点坐标是指场景图像的二维特征点在场景图像中的坐标，即二维特征点坐标在像素坐标系下的坐标，而三维空间点坐标是指场景图像的二维特征点在世界坐标系中的坐标。示例性地，高精度三维地图的二维特征点坐标的精度在5个像素以内。高精度三维地图的坐标精度在10-50厘米左右。例如，预设区域为室内场景时，高精度三维地图的三维空间点坐标的精度为10厘米；预设区域为室外场景时，高精度三维地图的三维空间点坐标的精度为20厘米。

具体地，上述场景图像是在预设区域中的若干个图像获取位置上获取的预设方向(如上下左右等方向)的图像。利用场景图像可以进行特征点提取以确定二维特征点坐标以及二维特征点对应的特征描述子，再获取二维特征点对应的三维空间点坐标，即可以建立高精度三维地图。上述二维特征点坐标以及相应的三维空间点坐标可以理解为像素坐标系中的二维特征点与世界坐标系中的三维空间点的坐标对应关系。

例如，预设区域为公园A，则可以从公园A的入口出发，每间隔一定距离(例如0.5米等)获取一次场景图像，每次获取至少一张场景图像，直到公园A的出口，可以确定若干个图像获取位置。在每个图像获取位置上获取场景图像时，可以是获取图像获取位置的左侧视野图像作为场景图像，同样地，还可以获取图像获取位置的右侧、上方、前方等方向的视野图像作为场景图像。基于上述获得的场景图像可以建立预设区域对应的高精度三维地图。

303、根据第一内参标定数据和目标终端的历史内参标定数据确定相机的标定内参数。

具体地，本申请实施例利用高精度三维地图和历史内参标定数据库先分别得到第一内参标定数据和目标终端的历史内参标定数据，进而根据第一内参标定数据和目标终端的历史内参标定数据进行内参数标定，确定相机的标定内参数。

本申请实施例的标定方法，不需要利用额外的标定设备(如标定板)进行离线标定，也不需要用户采用特定的动作来完成内参标定。用户只需要在预设区域中，使用目标终端的相机获取第一图像即可自动完成标定，因此，可以实现实时对目标终端的相机内参进行标定，有效提升了标定效率，相比现有技术中需要人工离线标定，可以有效降低相机内参标定所需的工作量。进一步地，目标终端中的机器视觉应用可以根据标定内参数进行其他相关处理，以正常完成相关的机器视觉任务。因此，本申请实施例的标定方法，不会阻塞机器视觉应用的进程，即使是未标定过的目标终端，也能够和已标定的目标终端一样能够正常使用机器视觉应用，减少用户的操作，给用户带来更大的便利，还能提升机器视觉应用在不同目标终端的普及率。

参考图3，示例性地，上述相机内参标定方法还包括：

具体地，内参数有效性条件是内参数需要满足的标准，具体的标准可以根据实际情况进行设置。而预设内参数的具体数值可以根据实际需要进行设置，不做特别限定。本申请实施例中，此时的电子设备为上述目标终端，即在目标终端执行获取标定内参数的方法步骤，再判断进行标定内参数有效性判断，当标定内参数满足内参数有效性条件时，目标终端根据标定内参数更新其本地内参数，并将第一内参标定数据保存至历史内参标定数据库中，更新历史内参标定数据库。而标定内参数不满足内参数有效性条件时，目标终端根据预设内参数更新其本地内参数。

可见，利用上述数据更新的步骤，无需人工专门更新和维护历史内参标定数据库；而且可以在用户后续使用机器视觉应用的过程中，基于历史内参标定数据库中保存的数据越来越多，可以不断提升相机内参数的标定精度，给用户带来越用越好的体验。另外，相同型号的目标终端之间可以通过历史内参标定数据库实现标定内参数的共享，有利于提升首次标定的目标终端的内参标定精度。

参考图3，又一示例，上述相机内参标定方法还包括：

标定内参数满足内参数有效性条件时，电子设备将第一内参标定数据保存至历史内参标定数据库中，以及将标定内参数发送给目标终端，以使目标终端根据标定内参数更新本地内参数。而标定内参数不满足内参数有效性条件时，电子设备将预设内参数发送给目标终端，以使目标终端更新目标终端的本地内参数。

本申请实施例中，电子设备和目标终端为不同的设备，在标定内参数满足内参数有效性条件时，电子设备将标定内参数发送给目标终端，以使目标终端更新其本地内参数，即将本地内参数更新为上述标定内参数，并将第一内参标定数据保存至历史内参标定数据库中。而标定内参数不满足内参数有效性条件时，电子设备将预设内参数发送给目标终端，以使目标终端将本地内参数更新为接收到的预设内参数。

参考图5a，图5a是本申请实施例提供的一种确定第一内参标定数据的流程示意图；上述根据第一图像和预设区域对应的高精度三维地图，确定相机的第一内参标定数据，包括步骤511、步骤512、步骤513和步骤514。其中：

511、从高精度三维地图中确定与第一图像的图像相似度最高的N张场景图像，N为大于零的整数。

具体地，N的具体数值可以根据实际情况进行设置，不做特别限定。根据第一图像，利用图像检索模型可以从高精度三维地图中确定与第一图像的图像相似度最高的N张场景图像，例如十张场景图像。

512、确定第一图像的M个图像特征点，M为大于零的整数。

513、根据M个图像特征点的特征描述子和N张场景图像的二维特征点对应的特征描述子进行匹配，确定M个图像特征点中的X个图像特征点的坐标对。坐标对包括二维特征点坐标和三维空间点坐标，X小于或等于M。

具体地，利用特征检测模型，可以对第一图像进行图像特征点提取，以得到第一图像对应的M个图像特征点，另外，特征检测模型还可以对图像特征点进行特征描述得到M个图像特征点对应的特征描述子。本申请实施例中，对特征描述子的具体种类不做特别限定。

进一步地，由于第一图像是在预设区域中的第一位置拍摄得到的图像，因此，利用图像特征点的特征描述子在高精度三维地图中进行匹配，可以确定第一图像的X个图像特征点对应的坐标对。具体地，根据M个图像特征点的特征描述子和上述N张场景图像的二维特征点对应的特征描述子进行匹配。当前后两者的特征描述子相同时，则将匹配到的特征描述子对应的二维特征点坐标以及三维空间点坐标作为图像特征点的坐标对。

514、根据X个图像特征点的坐标对确定第一内参标定数据。

本申请实施例中，由于相机的外参数(已知)用于把坐标从世界坐标系转换到相机坐标系中，相机的内参数用于把坐标从相机坐标系转换到像素坐标系中；而二维特征点坐标为像素坐标系中的坐标，三维空间点坐标为世界坐标系中的坐标，因此，利用二维特征点坐标以及三维空间点坐标之间的对应关系可以确定第一内参标定数据。

示例性地，在根据X个图像特征点的坐标对确定第一内参标定数据时，可以直接将X个图像特征点的坐标对确定为第一内参标定数据。

参考图5b，图5b是本申请实施例提供的一种确定标定内参数的流程示意图；根据第一内参标定数据和目标终端的历史内参标定数据确定相机的标定内参数，包括步骤521、步骤522和步骤523。其中：

521、根据X个图像特征点的坐标对确定相机的第一内参数。

具体地，此时的第一内参标定数据为X个图像特征点的坐标对，基于X个图像特征点的坐标对进行计算，可以确定相机的第一内参数，示例性地，具体的计算过程如下：

假设在目标终端获取第一图像的时刻，目标终端的相机在世界坐标系中的位姿为[R t]，R为旋转矩阵，t为平移向量；世界坐标系中的一个三维空间点的位置为(X_i Y_i Z_i)^T，将该三维空间点的位置坐标投影至像素坐标系上，可以得到像素坐标(u_i v_i)^T。相应的变换关系如下：

其中，S_i为缩放尺度，K为相机的内参数矩阵，令M＝K[R t]，则M矩阵为3×4维数，公式(1)可以转化为公式(2)：

而公式(2)可以简化为以下两个等式约束，如下所示：

将公式(3)矩阵化可以得到公式(4)：

从公式(4)可以看出，一个坐标对可以得到两个约束，M矩阵一共12个未知数，至少6个不共面的特征点就可以解算出M矩阵。进一步再根据M矩阵和相机的内参数矩阵K之间的关系即可计算出相机的内参数矩阵K，即相机的第一内参数。

522、根据X个图像特征点的坐标对、目标终端的历史内参标定数据确定相机的第二内参数。

具体地，当将X个图像特征点的坐标对确定为第一内参标定数据时，目标终端的历史内参标定数据也为坐标对的形式，即历史内参标定数据为历史保存的与目标终端的标识相同的第一内参标定数据(当目标终端的标识为目标终端的唯一标记时，目标终端对应的历史内参标定数据是目标终端在过往标定过程中保存到数据库中的第一内参标定数据。而当目标终端的标识为目标终端的型号时，目标终端对应的历史内参标定数据为包括目标终端在内的型号相同的终端在过往标定过程中保存到数据库中的第一内参标定数据)。因此，联合上述X个图像特征点的坐标对和目标终端的历史内参标定数据，可以确定相机的第二内参数。第二内参数的计算方法与第一内参数的计算方法类似，不同的是，在第二内参数的计算过程中，需要为X个图像特征点的坐标对和目标终端的历史内参标定数据分别赋予不同的权重，以加权运算的结果进行运算。其中，上述权重可以是三维空间点的深度距离的倒数或者是二维特征点的响应值。

示例性地，具体加权计算的过程如下：

假设X个图像特征点的坐标对以及目标终端的历史内参标定数据总共有n个坐标对，在计算M矩阵时，可以根据坐标对各自的权重进行加权计算，从而获得加权计算后的M矩阵用于计算相机内参数，即第二内参数。

假设公式(4)中的系数为A_i矩阵，M矩阵的12个未知数为X矩阵，则公式(4)可以写成如下形式：
A_iX＝0 (5)

设定第i个坐标对的权重为w_i，w_i矩阵为2×2维数，坐标对加权后的公式(5)可以表示为：
w_iA_iX＝0 (6)

则n个坐标对可以构成方程组，如下：

根据公式(7)即可计算出未知数X矩阵，也就是M矩阵的12个未知数，从而得到M矩阵。

523、将第一内参数、第二内参数中重投影误差最小的一个确定为标定内参数。

具体地，本申请实施例中，分别确定第一内参数和第二内参数，再将前后两者中重投影误差最小的一个确定为相机的标定内参数，利用重投影误差比较可以有效提升标定内参数的精度。

其中，示例性地，第一内参数的重投影误差是基于第一内参数对坐标对集合(此处的坐标对集合是指X个图像特征点的坐标对以及目标终端的历史内参标定数据所组成的集合)中的三维空间点进行重投影运算，可以确定重投影后的二维特征点坐标，根据重投影后得到的二维特征点坐标和坐标对集合中的二维特征点坐标可以确定第一内参数的重投影误差。其中，对于每个坐标对可以得到一个重投影后的二维特征点坐标，相应地可以得到一个子重投影误差，根据坐标对集合对应的多个子重投影误差计算平均值，将该平均值作为第一内参数的重投影误差。或者，根据坐标对集合对应的多个重投影前的二维特征点坐标和重投影后的二维特征点坐标计算均方根误差，将该均方根误差作为第一内参数的重投影误差。同理，利用第一内参数的重投影误差的计算方法，可以确定第二内参数的重投影误差。

进一步地，标定内参数满足内参有效性条件时，除了将X个图像特征点的坐标对存入历史内参标定数据库中之外，还可以将X个图像特征点的坐标对对应的权重存入历史内参标定数据库中，该权重可以坐标对中三维空间点的深度距离的倒数或者是二维特征点的响应值。这样，下一次标定在计算第二内参数时，可以直接从历史内参标定数据库中取出权重进行加权计算。

参考图5c，图5c是本申请实施例提供的一种相机内参标定方法的流程示意图。下面机器视觉应用以增强现实应用为例，而目标终端的标识以型号为例，而电子设备为云端服务器为例，对本申请实施例的标定方法进行具体说明。

步骤一：打开终端设备，用户进入增强现实应用；其中，增强现实应用中包含本申请实施例的标定方法对应的算法。

步骤二：目标终端获取终端型号和一张在当前位置上利用终端的相机拍摄的图像等数据，目标终端向云端服务器上传终端型号和拍摄的图像等数据。

步骤三：根据当前位置图像从高精度三维地图中完成图像检索，得到场景图像，并通过当前位置的图像和场景图像之间的特征点匹配得到坐标对。

步骤四：根据终端型号从历史内参标定数据库中检索出该型号对应的历史有效坐标对。

步骤五：基于步骤三中匹配得到的坐标对实时计算得到相机的内参数K₁。

步骤六：结合步骤三中匹配得到的坐标对和步骤四从历史内参标定数据库中检索出的相同型号的有效坐标对数据，联合计算得到相机内参数在计算时可以根据坐标对各自的权重进行加权计算，从而获得相机内参数

步骤七：比较使用步骤五和步骤六两种方式得到的相机内参数K₁和分别计算三维空间点的重投影误差大小，使用重投影误差较小的相机内参数作为内参数标定结果输出。

步骤八：对步骤七得到的内参数标定结果进行有效性的判断。如果内参数标定结果满足有效性判断条件，则认为本次标定结果有效，并返回内参数标定成功的标志位和有效的相机内参数，同时把该次匹配得到的坐标对数据和对应的权重(权重可以为坐标对中三维空间点的深度距离的倒数或者是二维特征点的响应值)作为有效标定数据保存至历史内参标定数据库中。如果有任意一个有效性判断条件不成立，则认为当前内参数标定结果无效，并返回内参数标定失败的标志位和默认的相机内参数。

步骤九：终端接收云端服务器返回的标志位和标定结果，终端使用返回的相机内参数用于增强现实应用。如果是内参数标定成功的标志位，则使用计算的标定结果作为本次增强现实应用使用过程中的相机内参数，并在本次应用使用过程中不再进行标定。如果是内参数标定失败的标志位，则先使用默认的相机内参数用于增强现实应用，不会阻塞应用的进程，并返回步骤二再次请求标定，直至标定成功。

又一示例性地，在根据X个图像特征点的坐标对确定第一内参标定数据时，可以先根据X个图像特征点的坐标对确定相机的第一内参数，再将第一内参数确定为第一内参标定数据。其中，根据X个图像特征点的坐标对确定相机的第一内参数可以参考上述记载，不再赘述。

参考图6a，图6a是本申请实施例提供的另一种确定标定内参数的流程示意图；根据第一内参标定数据和目标终端的历史内参标定数据确定相机的标定内参数，包括步骤601和步骤602。其中：

601、根据第一内参数及其第一权重、目标终端对应的每个历史内参标定数据及其第二权重进行加权计算，以确定相机的第二内参数。

具体地，此时历史内参标定数据的形式为相机的内参数。当目标终端的标识为目标终端的唯一标记时，目标终端对应的历史内参标定数据是目标终端在过往标定过程中保存到数据库中的第一内参标定数据，即第一内参数。而当目标终端的标识为目标终端的型号时，目标终端对应的历史内参标定数据为包括目标终端在内的型号相同的终端在过往标定过程中保存到数据库中的第一内参标定数据，即第一内参数。目标终端对应的历史内参标定数据，即历史保存的第一内参数的个数是一个以上。

示例性地，加权计算的具体计算过程如下：

假设第一内参数和历史内参标定数据为(K₁,K₂,…,K_n)，每个相机内参数对应的权重为(w₁,w₂,…,w_n)，则加权内参数，即第二内参数的计算公式如下：

602、将第一内参数、第二内参数中重投影误差最小的一个确定为标定内参数。

本方案中，联合第一内参数和历史内参标定数据，利用加权计算的方式确定相机的第二内参数，再根据重投影误差将第一内参数和第二内参数中的一个确定为标定内参数，具体描述可以参考步骤523的相关描述，不再赘述。

进一步地，标定内参数满足内参有效性条件时，除了将第一内参数存入历史内参标定数据库中之外，还可以将第一内参数对应的第一权重，和/或，用于计算第一内参数的X个图像特征点的坐标对存入历史内参标定数据库中；这样，下一次标定在计算第二内参数时，可以直接从历史内参标定数据库中取出第一权重进行加权计算，而X个图像特征点的坐标对用于下一次标定时的重投影误差计算。

示例性地，第一权重为第一内参数对应的重投影误差的倒数；第二权重为历史内参标定数据对应的重投影误差的倒数。

参考图6b，图6b是本申请实施例提供的另一种相机内参标定方法的流程示意图。下面机器视觉应用以增强现实应用为例，而目标终端的标识以型号为例，而电子设备为云端服务器为例，对本申请实施例的标定方法进行具体说明。

步骤一：打开终端设备，进入增强现实应用；其中，增强现实应用包含本申请实施例的标定方法对应的算法。

步骤三：根据当前位置的图像从高精度三维地图中完成图像检索，得到场景图像，并通过当前位置图像和场景图像之间的特征点匹配得到坐标对。

步骤四：根据终端型号从历史内参标定数据库中检索出该型号对应的多组历史有效相机内参数。

步骤五：基于步骤三中匹配得到的坐标对计算得到相机的内参数K₁。

步骤六：结合步骤五中基于匹配得到的坐标对计算得到的相机内参数K₁和步骤四从历史标定数据库中检索出的相同型号的多组历史有效相机内参数，联合计算得到相机内参数在计算时可以根据坐标对各自的权重进行加权计算，从而获得相机内参数

步骤七：比较使用步骤五和步骤六两种方式得到的相机内参数K₁和计算两者的三维空间点的重投影误差大小，使用重投影误差较小的相机内参数作为标定结果输出。

步骤八：对步骤七得到的内参数标定结果进行有效性的判断。如果内参数标定结果满足有效性判断条件，则认为本次标定结果有效，并返回内参数标定成功的标志位和有效的相机内参数，同时把步骤五中得到的相机内参数K₁和对应的权重保存至历史内参标定数据库。如果有任意一个有效性判断条件不成立，则认为当前内参数标定结果无效，并返回内参数标定失败的标志位和一个默认的相机内参数。

步骤九：终端接收云端标定算法返回的标志位和标定结果，终端使用返回的相机内参数用于增强现实应用。如果是内参数标定成功的标志位，则使用计算的标定结果作为本次增强现实应用使用过程中的相机内参数，并在本次应用使用过程中不再进行标定。如果是内参数标定失败的标志位，则先使用默认的相机内参数用于增强现实应用，不会阻塞应用的进程，并返回步骤二再次请求标定，直至标定成功。

示例性地，相机的内参数以包括X轴焦距fx、Y轴焦距fy、X轴上的像主点坐标cx以及Y轴上的像主点坐标cy为例，此时，内参数有效性条件可以为：

相机的标定内参数的结果需大于0，即fx、fy、cx和cy均大于0；

fx和fy的差值不超过a个像素，a的具体数值可以根据实际情况进行设置，不做特别限定，例如a为50；

cx与图像宽度的一半之间的差值不超过b个像素，b的具体数值可以根据实际情况进行设置，不做特别限定，例如b为15；

cy与图像高度的一半之间的差值不超过c个像素，c的具体数值可以根据实际情况进行设置，不做特别限定，例如c为15；

根据相机的内参数计算坐标对集合的重投影误差不超过d个像素，d的具体数值可以根据实际情况进行设置，不做特别限定，例如d为15。其中，根据相机的内参数和坐标对集合中的三维空间点坐标进行重投影处理，可以得到重投影的二维特征点坐标，根据重投影的二维特征点坐标和坐标对集合中的二维特征点坐标可以确定重投影误差。上述坐标对集合可以为上述X个图像特征点的坐标对以及目标终端的历史内参标定数据所组成的集合。

当相机的内参数满足上述所有的内参数有效性条件时，可以确认该相机的内参数为有效的内参数。反之，确认该相机的内参数为无效的内参数。

参考图7，图7是本申请实施例提供的一种相机内参标定装置的结构示意图。相机内参标定装置700包括获取模块701、确定模块702和标定模块703。

获取模块701，用于获取第一图像和目标终端的标识。第一图像为目标终端在第一位置处利用自身的相机拍摄得到的图像，第一位置位于预设区域内。

确定模块702，用于根据第一图像和预设区域对应的高精度三维地图，确定相机的第一内参标定数据；以及，根据目标终端的标识和历史内参标定数据库确定目标终端的历史内参标定数据。历史内参标定数据库包括一个或多个标识的终端的历史内参标定数据。

标定模块703，用于根据第一内参标定数据和目标终端的历史内参标定数据确定相机的标定内参数。

在一些可能的实施方式中，获取模块701，具体用于：

接收来自目标终端的第一图像以及目标终端的标识。

在一些可能的实施方式中，高精度三维地图包括多张场景图像、场景图像的二维特征点坐标、二维特征点的特征描述子以及二维特征点对应的三维空间点坐标。

上述确定模块702，具体用于：

在一些可能的实施方式中，确定模块702在根据X个图像特征点的坐标对确定第一内参标定数据方面，具体用于：将X个图像特征点的坐标对确定为第一内参标定数据。

相应地，上述标定模块703，具体用于：

在一些可能的实施方式中，确定模块702在根据X个图像特征点的坐标对确定第一内参标定数据方面，具体用于：根据X个图像特征点的坐标对确定相机的第一内参数。将第一内参数确定为第一内参标定数据。

相应地，上述标定模块703，具体用于：

在一些可能的实施方式中，第一权重为第一内参数对应的重投影误差的倒数；第二权重为历史内参标定数据对应的重投影误差的倒数。

在一种可能的实施方式中，相机内参标定装置700还包括：

在一些可能的实施方式中，相机内参标定装置700还包括：

需要说明的是，相机内参标定装置700的具体执行过程以及相应的有益效果可以参考相机内参标定方法300的相关描述，不再赘述。

参考图8，图8是本申请实施例提供的一种相机内参标定设备的结构示意图。相机内参标定设备800包括存储器801、处理器802、通信接口804以及总线803。其中，存储器801、处理器802、通信接口804通过总线803实现彼此之间的通信连接。

存储器801可以是只读存储器(Read Only Memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器(Random Access Memory，RAM)。存储器801可以存储程序，当存储器801中存储的程序被处理器802执行时，处理器802用于执行上述任意实施例所述的相机内参标定方法的各个步骤。

处理器802可以采用通用的中央处理器(Central Processing Unit，CPU)，微处理器，应用专用集成电路(Application Specific Integrated Circuit，ASIC)，图形处理器(graphics processing unit，GPU)或者一个或多个集成电路，用于执行相关程序，以实现上述任一实施例所述的相机内参标定装置中的单元所需执行的功能，或者执行上述任一实施例所述的相机内参标定方法。

处理器802还可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，本申请任一实施例所述的相机内参标定方法的各个步骤可以通过处理器802中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器802还可以是通用处理器、数字信号处理器(Digital Signal Processing，DSP)、专用集成电路(ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请任一实施例所述的相机内参标定方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器801，处理器802读取存储器801中的信息，结合其硬件完成上述任一实施例所述的相机内参标定装置中包括的单元所需执行的功能，或者执行本申请任一实施例所述的相机内参标定方法。

通信接口804使用例如但不限于收发器一类的收发装置，来实现相机内参标定设备800与其他设备或通信网络之间的通信。例如，相机内参标定设备800可以通过通信接口804获取第一图像等。

总线803可包括在相机内参标定设备800各个部件(例如，存储器801、处理器802、通信接口804)之间传送信息的通路。

应注意，尽管图8所示的相机内参标定设备800仅仅示出了存储器、处理器、通信接口，但是在具体实现过程中，本领域的技术人员应当理解，相机内参标定设备800还包括实现正常运行所必须的其他器件。同时，根据具体需要，本领域的技术人员应当理解，相机内参标定设备800还可包括实现其他附加功能的硬件器件。此外，本领域的技术人员应当理解，相机内参标定设备800也可仅仅包括实现本申请实施例所必须的器件，而不必包括图8中所示的全部器件。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以计算机程序产品的形式体现出来，该计算机程序产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请实施例还提供一种芯片，所述芯片包括处理器与数据接口，所述处理器通过所述数据接口读取存储器上存储的指令，执行任一实施例所述的相机内参标定方法。

可选地，作为一种实现方式，所述芯片还可以包括存储器，所述存储器中存储有指令，所述处理器用于执行所述存储器上存储的指令，当所述指令被执行时，所述处理器用于执行任一实施例所述的相机内参标定方法。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种相机内参标定方法，其特征在于，所述方法包括：

获取第一图像和目标终端的标识；所述第一图像为所述目标终端在第一位置处利用自身的相机拍摄得到的图像，所述第一位置位于预设区域内；

根据所述第一图像和所述预设区域对应的高精度三维地图，确定所述相机的第一内参标定数据；以及，根据所述目标终端的标识和历史内参标定数据库确定所述目标终端的历史内参标定数据，所述历史内参标定数据库包括一个或多个标识的终端的历史内参标定数据；

根据所述第一内参标定数据和所述目标终端的历史内参标定数据确定所述相机的标定内参数。
根据权利要求1所述的方法，其特征在于，所述高精度三维地图包括多张场景图像、所述场景图像的二维特征点坐标、所述二维特征点的特征描述子以及所述二维特征点对应的三维空间点坐标；

所述根据所述第一图像和所述预设区域对应的高精度三维地图，确定所述相机的第一内参标定数据，包括：

从所述高精度三维地图中确定与所述第一图像的图像相似度最高的N张场景图像，所述N为大于零的整数；

确定所述第一图像的M个图像特征点，所述M为大于零的整数；

根据所述M个图像特征点的特征描述子和所述N张场景图像的二维特征点对应的特征描述子进行匹配，确定所述M个图像特征点中的X个图像特征点的坐标对；所述坐标对包括二维特征点坐标和三维空间点坐标，所述X小于或等于所述M；

根据所述X个图像特征点的坐标对确定所述第一内参标定数据。
根据权利要求2所述的方法，其特征在于，所述根据所述X个图像特征点的坐标对确定所述第一内参标定数据，包括：

将所述X个图像特征点的坐标对确定为所述第一内参标定数据；

所述根据所述第一内参标定数据和所述目标终端的历史内参标定数据确定所述相机的标定内参数，包括：

根据所述X个图像特征点的坐标对确定所述相机的第一内参数；

根据所述X个图像特征点的坐标对、所述目标终端的历史内参标定数据确定所述相机的第二内参数；

将所述第一内参数、所述第二内参数中重投影误差最小的一个确定为所述标定内参数。
根据权利要求2所述的方法，其特征在于，所述根据所述X个图像特征点的坐标对确定所述第一内参标定数据，包括：

根据所述X个图像特征点的坐标对确定所述相机的第一内参数；

将所述第一内参数确定为所述第一内参标定数据；

所述根据所述第一内参标定数据和所述目标终端的历史内参标定数据确定所述相机的标定内参数，包括：

根据所述第一内参数及其第一权重、所述目标终端对应的每个所述历史内参标定数据及其第二权重进行加权计算，以确定所述相机的第二内参数；

将所述第一内参数、所述第二内参数中重投影误差最小的一个确定为所述标定内参数。
根据权利要求4所述的方法，其特征在于，所述第一权重为所述第一内参数对应的重投影误差的倒数；所述第二权重为所述历史内参标定数据对应的重投影误差的倒数。
根据权利要求1至5任一项所述的方法，其特征在于，所述方法还包括：

所述标定内参数满足内参数有效性条件时，根据所述标定内参数更新所述目标终端的本地内参数，并将所述第一内参标定数据保存至所述历史内参标定数据库中；

所述标定内参数不满足所述内参数有效性条件时，根据预设内参数更新所述目标终端的本地内参数。
根据权利要求1至5任一项所述的方法，其特征在于，所述方法还包括：

所述标定内参数满足内参数有效性条件时，将所述第一内参标定数据保存至所述历史内参标定数据库中，以及将所述标定内参数发送给所述目标终端，以使所述目标终端根据所述标定内参数更新所述目标终端的本地内参数；

所述标定内参数不满足所述内参数有效性条件时，将预设内参数发送给所述目标终端，以使所述目标终端更新所述目标终端的本地内参数。
根据权利要求1至5、7中任一项所述的方法，其特征在于，所述获取第一图像和目标终端的标识，包括：

接收来自所述目标终端的所述第一图像以及所述目标终端的标识。
一种相机内参标定装置，其特征在于，所述装置包括：

获取模块，用于获取第一图像和目标终端的标识；所述第一图像为所述目标终端在第一位置处利用自身的相机拍摄得到的图像，所述第一位置位于预设区域内；

确定模块，用于根据所述第一图像和所述预设区域对应的高精度三维地图，确定所述相机的第一内参标定数据；以及，根据所述目标终端的标识和历史内参标定数据库确定所述目标终端的历史内参标定数据，所述历史内参标定数据库包括一个或多个标识的终端的历史内参标定数据；

标定模块，用于根据所述第一内参标定数据和所述目标终端的历史内参标定数据确定所述相机的标定内参数。
根据权利要求9所述的装置，其特征在于，所述高精度三维地图包括多张场景图像、所述场景图像的二维特征点坐标、所述二维特征点的特征描述子以及所述二维特征点对应的三维空间点坐标；

所述确定模块，具体用于：

从所述高精度三维地图中确定与所述第一图像的图像相似度最高的N张场景图像，所述N为大于零的整数；

确定所述第一图像的M个图像特征点，所述M为大于零的整数；

根据所述M个图像特征点的特征描述子和所述N张场景图像的二维特征点对应的特征描述子进行匹配，确定所述M个图像特征点中的X个图像特征点的坐标对；所述坐标对包括二维特征点坐标和三维空间点坐标，所述X小于或等于所述M；

根据所述X个图像特征点的坐标对确定所述第一内参标定数据。
根据权利要求10所述的装置，其特征在于，所述确定模块在根据所述X个图像特征点的坐标对确定所述第一内参标定数据方面，具体用于：

将所述X个图像特征点的坐标对确定为所述第一内参标定数据；

所述标定模块，具体用于：

根据所述X个图像特征点的坐标对确定所述相机的第一内参数；

根据所述X个图像特征点的坐标对、所述目标终端的历史内参标定数据确定所述相机的第二内参数；

将所述第一内参数、所述第二内参数中重投影误差最小的一个确定为所述标定内参数。
根据权利要求10所述的装置，其特征在于，所述确定模块在根据所述X个图像特征点的坐标对确定所述第一内参标定数据方面，具体用于：

根据所述X个图像特征点的坐标对确定所述相机的第一内参数；

将所述第一内参数确定为所述第一内参标定数据；

所述标定模块，具体用于：

根据所述第一内参数及其第一权重、所述目标终端对应的每个所述历史内参标定数据及其第二权重进行加权计算，以确定所述相机的第二内参数；

将所述第一内参数、所述第二内参数中重投影误差最小的一个确定为所述标定内参数。
根据权利要求12所述的装置，其特征在于，所述第一权重为所述第一内参数对应的重投影误差的倒数；所述第二权重为所述历史内参标定数据对应的重投影误差的倒数。
根据权利要求9至13任一项所述的装置，其特征在于，所述装置还包括：

处理模块，用于所述标定内参数满足内参数有效性条件时，根据所述标定内参数更新所述目标终端的本地内参数，并将所述第一内参标定数据保存至所述历史内参标定数据库中；

以及，所述标定内参数不满足所述内参数有效性条件时，根据预设内参数更新所述目标终端的本地内参数。
根据权利要求9至13任一项所述的装置，其特征在于，所述装置还包括：

处理模块，用于所述标定内参数满足内参数有效性条件时，将所述第一内参标定数据保存至所述历史内参标定数据库中，以及将所述标定内参数发送给所述目标终端，以使所述目标终端根据所述标定内参数更新所述目标终端的本地内参数；

以及，所述标定内参数不满足所述内参数有效性条件时，将预设内参数发送给所述目标终端，以使所述目标终端更新所述目标终端的本地内参数。
根据权利要求9至13、15中任一项所述的装置，其特征在于，所述获取模块，具体用于：

接收来自所述目标终端的所述第一图像以及所述目标终端的标识。
一种相机内参标定设备，其特征在于，包括处理器和存储器，其中，处理器和存储器相连，其中，存储器用于存储程序代码，处理器用于调用程序代码，以执行如权利要求1至8任一项所述的相机内参标定方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现如权利要求1至8任一项所述的相机内参标定方法。