WO2021026705A1

WO2021026705A1 - 匹配关系确定方法、重投影误差计算方法及相关装置

Info

Publication number: WO2021026705A1
Application number: PCT/CN2019/100093
Authority: WO
Inventors: 袁维平; 张欢; 王筱治; 苏斌; 吴祖光
Original assignee: 华为技术有限公司
Priority date: 2019-08-09
Filing date: 2019-08-09
Publication date: 2021-02-18
Also published as: CN112640417A; CN112640417B

Abstract

一种匹配关系确定方法、重投影误差计算方法及相关装置，涉及人工智能领域，具体涉及自动驾驶领域，该匹配关系确定方法包括：获取N组特征点对（301），每组特征点对包括两个相匹配的特征点，其中一个特征点为从第一图像提取的特征点，另一个特征点为从第二图像提取的特征点；利用动态障碍物的运动状态信息对所述N组特征点对中目标特征点的像素坐标进行调整（302），所述目标特征点属于所述第一图像和/或所述第二图像中所述动态障碍物对应的特征点；根据所述N组特征点对中各特征点对应的调整后的像素坐标，确定所述第一图像和所述第二图像之间的目标匹配关系（303）；在存在动态障碍物的自动驾驶场景能准确地确定两帧图像之间的匹配关系。

Description

匹配关系确定方法、重投影误差计算方法及相关装置

技术领域

本申请涉及人工智能领域的自动驾驶领域，尤其涉及一种匹配关系确定方法、重投影误差计算方法及相关装置。

背景技术

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。自动驾驶是人工智能领域的一种主流应用，自动驾驶技术依靠计算机视觉、雷达、监控装置和全球定位系统等协同合作，让机动车辆可以在不需要人类主动操作下，实现自动驾驶。自动驾驶的车辆使用各种计算系统来帮助将乘客从一个位置运输到另一位置。由于自动驾驶技术无需人类来驾驶机动车辆，所以理论上能够有效避免人类的驾驶失误，减少交通事故的发生，且能够提高公路的运输效率。因此，自动驾驶技术越来越受到重视。

目前，自动驾驶装置采用即时定位与地图构建(Simultaneous Localization And Mapping，SLAM)等定位方法进行定位时，通常以其采集到的各帧图像的重投影误差为量测量。也就是说，自动驾驶装置在采用SLAM进行定位时，需要计算其采集到的各帧图像的重投影误差。一帧图像的重投影误差是指投影的点与该帧图像上的测量点之间的误差，投影的点可以是该帧图像中的各特征点对应的三维空间坐标投影至该帧图像的坐标点，测量点可以是这些特征点在该帧图像中的坐标点。当前普遍采用的一种计算重投影误差的方式如下：确定目标帧图像中各特征点对应的三维空间坐标，以得到第一三维空间坐标；计算该目标帧图像与参考帧图像之间的平移矩阵和旋转矩阵；利用该平移矩阵和旋转矩阵将该第一三维空间坐标中的各三维空间坐标转换至参考坐标系，以得到第二三维空间坐标；将该第二三维空间坐标中的各三维空间坐标投影至该目标帧图像以得到投影的点；计算投影的点与该目标帧图像中各特征点的坐标点(即测量点)之间的误差，以得到该目标帧图像的重投影误差。其中，该参考坐标系可以是自动驾驶装置在本次行驶的起始地点建立的世界坐标系，该参考帧图像可以是自动驾驶装置在该起始地点采集的第一帧图像，该目标帧图像可以是该自动驾驶装置在本次行驶过程中采集的除该参考帧图像之外的任一帧图像。自动驾驶装置为计算其采集的各帧图像与参考帧图像之间的关系需要计算其采集到的任意两帧相邻图像之间的匹配关系，进而计算得到其采集到的各帧图像与参考帧图像之间的匹配关系。目前，一般采用特征匹配的方式来确定两帧图像之间的匹配关系。

在特征匹配中，为了消除特征匹配中的误匹配，随机抽样一致性(RANdom SAmple Consensus，RANSAC)被使用到特征匹配中。RANSAC算法的流程如下：假设样本(匹配两帧图像得到的多组特征点对)中包含内点(inliers)和外点(outliers)，分别对应正确匹配点对和错误匹配点对，随机从样本中抽取4组点对，计算出两帧图像之间的匹配关系；然后根据该匹配关系，把剩余特征点对分成内点和外点，重复上述步骤，选取数量最多的内点所对应的匹配关系为最终的两帧图像之间的匹配关系。其中，两帧图像分别为自动驾驶装置在第一时刻和第二时刻采集的图像，该匹配关系是这两帧图像之间的平移矩阵和旋转矩阵。RANSAC算法的本质是一种少数服从多数的算法。当动态障碍物占据视野很大一部分的时候，比如，自动驾驶装置跟在一个很大的车后面行驶，外点(其他车辆等动态障碍物)会被算法当成内点，而内点(静态障碍物)被错误当成了外点剔除，这样就不能准确地确定两帧图像之间的匹配关系。可见，在一些存在动态障碍物的自动驾驶场景中，采用RANSAC算法有时候不能准确地确定两帧图像之间的匹配关系。因此，需要研究在存在动态障碍物的自动驾驶场景能准确地确定两帧图像之间的匹配关系的方案。

发明内容

本申请实施例提供了一种匹配关系确定方法、重投影误差计算方法及相关装置，在存在动态障碍物的自动驾驶场景能准确地确定两帧图像之间的匹配关系。

第一方面，本申请实施例提供了一种匹配关系确定方法，该方法可包括：获取N组特征点对，每组特征点对包括两个相匹配的特征点，其中一个特征点为从第一图像提取的特征点，另一个特征点为从第二图像提取的特征点，该第一图像和该第二图像分别为自动驾驶装置在第一时刻和第二时刻采集的图像，N为大于1的整数；利用动态障碍物的运动状态信息对该N组特征点对中目标特征点的像素坐标进行调整，该目标特征点属于该第一图像和/或该第二图像中该动态障碍物对应的特征点，该N组特征点对中除该目标特征点之外的特征点的像素坐标保持不变；根据该N组特征点对中各特征点对应的调整后的像素坐标，确定该第一图像和该第二图像之间的目标匹配关系。

该第一图像和该第二图像之间的匹配关系可以是该第一图像和该第二图像之间的平移矩阵和旋转矩阵。由于动态障碍物的运动状态与静态障碍物的运动状态不同，第一图像和第二图像中动态障碍物对应的特征点之间的平移矩阵和旋转矩阵，与该第一图像和该第二图像中静态障碍物对应的特征点之间的平移矩阵和旋转矩阵不同。可以理解，只有N组特征点对中的特征点均为静态障碍物对应的特征点时，根据该N组特征点对中各特征点对应的像素坐标才能较准确地确定第一图像和第二图像之间的匹配关系。本申请实施例中，利用动态障碍物的运动状态信息对N组特征点对中目标特征点对应的像素坐标进行调整之后，该N组特征点对中动态障碍物对应的特征点之间的平移矩阵和旋转矩阵与该N组特征点对中静态障碍物对应的特征点之间的平移矩阵和旋转矩阵基本相同，因此根据该N组特征点对中各特征点对应的像素坐标能够较准确地确定第一图像和第二图像之间的匹配关系。

在一个可选的实现方式中，运动状态信息包括该动态障碍物从该第一时刻至该第二时刻的位移；利用动态障碍物的运动状态信息对该N组特征点对中目标特征点的像素坐标进行调整包括：利用该位移对参考特征点的像素坐标进行调整，该参考特征点包含于该目标特征点，且属于该第二图像中该动态障碍物对应的特征点。

在该实现方式中，利用动态障碍物从第一时刻至第二时刻的位移对参考特征点的像素坐标进行调整(即运动补偿)，使得该参考特征点的像素坐标被调整后基本等同于静态障碍物的像素坐标，以便于更准确地确定第一图像和第二图像之间的匹配关系。

在一个可选的实现方式中，在利用动态障碍物的运动状态信息对该N组特征点对中目标特征点的像素坐标进行调整之前，该方法还包括：确定该N组特征点对中位于第一投影区域和/或第二投影区域的特征点为该目标特征点；该第一投影区域为该第一图像中该动态障碍物的图像所处的区域，该第二投影区域为该第二图像中该动态障碍物的图像所处的区域；获得该目标特征点对应的像素坐标。

在该实现方式中，根据第一图像和第二图像中动态障碍物的图像所处的区域，可以快速、准确地确定N组特征点对中的目标特征点。

在一个可选的实现方式中，在确定该N组特征点对中位于第一投影区域和/或第二投影区域的特征点为该目标特征点之前，该方法还包括：获得目标点云，该目标点云为表征该动态障碍物在该第一时刻的特性的点云；将该目标点云投影到该第一图像以得到该第一投影区域。

在该实现方式中，将动态障碍物在第一时刻的特性的点云投影至第一图像，可以准确地确定该第一图像中动态障碍物所处的区域。

在一个可选的实现方式中，在确定该N组特征点对中位于第一投影区域和/或第二投影区域的特征点为该目标特征点之前，该方法还包括：对第一点云和第二点云进行插值计算以得到目标点云，该第一点云和该第二点云分别为该自动驾驶装置在第三时刻和第四时刻采集的点云，该目标点云为表征该动态障碍物在该第一时刻的特性的点云，该第三时刻在该第一时刻之前，该第四时刻在该第一时刻之后；将该目标点云投影到该第一图像以得到该第一投影区域。

在该实现方式中，通过插值计算的方式得到目标点云，可以较准确地确定任一时刻的点云。

在一个可选的实现方式中，该目标匹配关系为采用随机抽样一致性RANSAC算法确定的该第一图像和该第二图像之间的两个或两个以上匹配关系中较优的匹配关系。

该N组特征点对可以为从第一图像和第二图像相匹配的多组特征点对中随机获取的N组特征点对。使用该N组特征点对调整后的像素坐标确定的匹配关系，可能不是该第一图像和该第二图像之间最优的匹配关系。为更准确地确定第一图像和第二图像之间的匹配关系，可以采用RANSAC算法来从第一图像和第二图像之间的多个匹配关系中确定一个较优的匹配关系。可选的，在该第一图像和该第二图像之间的匹配关系之后，则重新随机从第一图像和第二图像相匹配的多组特征点对中获取N组特征点对，根据新获取的获取N组特征点对，再次确定该第一图像和该第二图像之间的匹配关系，直到得到较优的匹配关系。采用随机抽样一致性RANSAC算法确定该目标匹配关系为该第一图像和该第二图像之间的两个或两个以上匹配关系中较优的匹配关系可以是：将第一图像和第二图像相匹配的多组特征点对代入至该目标匹配关系可得到最多的内点，且内点的个数大于数量阈值。该数量阈值可以是该多组特征点对的个数的百分之八十、百分之九十等。在该实现方式中，采用RANSAC算法可以更准确地确定该第一图像和该第二图像之间的匹配关系。

在一个可选的实现方式中，根据该N组特征点对中各特征点对应的调整后的像素坐标，确定该第一图像和该第二图像之间的目标匹配关系包括：根据该N组特征点对中各特征点对应的调整后的像素坐标，确定该第一图像和该第二图像之间的平移矩阵和旋转矩阵。

第二方面，本申请实施例提供了一种重投影误差计算方法，该方法可包括：利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标，该第一空间坐标包括第一图像中各特征点对应的空间坐标，该第一特征点为该第一图像中该动态障碍物对应的特征点，该第一图像为自动驾驶装置在第二时刻采集的图像，该运动状态信息包括该自动驾驶装置从第一时刻至该第二时刻的位移和姿态变化；将该第二空间坐标投影至该第一图像以得到第一像素坐标；根据该第一像素坐标和第二像素坐标，计算该第一图像的重投影误差；该第二像素坐标包括该第一图像中各特征点的像素坐标。

本申请实施例中，利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整，使得该第一特征点对应的空间坐标基本等同于静态障碍物对应的特征点所对应的空间坐标；在计算重投影误差时可以有效减少动态障碍物对应的特征点的影响，得到的重投影误差更准确。

在一个可选的实现方式中，在根据该第一像素坐标和第二像素坐标，计算该第一图像的重投影误差之前，该方法还包括；利用该位移对该第一图像中该第一特征点的像素坐标进行调整以得到该第二像素坐标，该第一图像中除该第一特征点之外的特征点的像素坐标均保持不变。

在该实现方式中，利用动态障碍物从第一时刻至第二时刻的位移对第一特征点的像素坐标进行调整(即运动补偿)，使得该第一特征点的像素坐标被调整后基本等同于静态障碍物的像素坐标，以便于更准确地该第一图像的重投影误差。

在一个可选的实现方式中，在利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标之前，该方法还包括：获得第二图像中与该第一特征点相匹配的第二特征点；该第一图像和该第二图像分别为该自动驾驶装置上的第一摄像头和第二摄像头在该第二时刻采集的图像，该第一摄像头和该第二摄像头所处的空间位置不同；根据该第一特征点和该第二特征点，确定第一特征点对应的空间坐标。

在该实现方式中，可以快速、准确地确定第一特征点对应的空间坐标。

在一个可选的实现方式中，在利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标之前，该方法还包括：获得目标点云，该目标点云为表征该动态障碍物在该第二时刻的特性的点云；将该目标点云投影到该第一图像以得到目标投影区域；确定第一特征点集中位于该目标投影区域的特征点为该第一特征点；该第一特征点集包括的特征点为从该第一图像提取的特征点，且均与第二特征点集中的特征点相匹配，该第二特征点集包括的特征点为从第二图像提取的特征点。

在该实现方式中，将位于目标投影区域中的特征点作为动态障碍物对应的特征点，可以准确地确定第一特征点集中动态障碍物对应的特征点。

第三方面，本申请实施例提供了一种匹配关系确定装置，包括：获取单元，用于获取N组特征点对，每组特征点对包括两个相匹配的特征点，其中一个特征点为从第一图像提取的特征点，另一个特征点为从第二图像提取的特征点，该第一图像和该第二图像分别为自动驾驶装置在第一时刻和第二时刻采集的图像，N为大于1的整数；调整单元，用于利用动态障碍物的运动状态信息对该N组特征点对中目标特征点的像素坐标进行调整，该目标特征点属于该第一图像和/或该第二图像中该动态障碍物对应的特征点，该N组特征点对中除该目标特征点之外的特征点的像素坐标保持不变；确定单元，用于根据该N组特征点对中各特征点对应的调整后的像素坐标，确定该第一图像和该第二图像之间的目标匹配关系。

本申请实施例中，利用动态障碍物的运动状态信息对N组特征点对中目标特征点的像素坐标进行调整之后，该N组特征点对中动态障碍物对应的特征点之间的平移矩阵和旋转矩阵与该N组特征点对中静态障碍物对应的特征点之间的平移矩阵和旋转矩阵基本相同，因此根据该N组特征点对中各特征点的像素坐标能够较准确地确定第一图像和第二图像之间的匹配关系。

在一个可选的实现方式中，运动状态信息包括该动态障碍物从该第一时刻至该第二时刻的位移；该调整单元，具体用于利用该位移对参考特征点的像素坐标进行调整，该参考特征点包含于该目标特征点，且属于该第二图像中该动态障碍物对应的特征点。

在一个可选的实现方式中，确定单元，还用于确定该N组特征点对中位于第一投影区域和/或第二投影区域的特征点为该目标特征点；该第一投影区域为该第一图像中该动态障碍物的图像所处的区域，该第二投影区域为该第二图像中该动态障碍物的图像所处的区域；该获取单元，还用于获得该目标特征点对应的像素坐标。

在一个可选的实现方式中，确定单元，还用于对第一点云和第二点云进行插值计算以得到目标点云，该第一点云和该第二点云分别为该自动驾驶装置在第三时刻和第四时刻采集的点云，该目标点云为表征该动态障碍物在该第一时刻的特性的点云，该第三时刻在该第一时刻之前，该第四时刻在该第一时刻之后；该装置还包括：投影单元，用于将该目标点云投影到该第一图像以得到该第一投影区域。

在一个可选的实现方式中，确定单元，具体用于根据该N组特征点对中各特征点对应的调整后的像素坐标，确定该第一图像和该第二图像之间的平移矩阵和旋转矩阵。

第四方面，本申请实施例提供了一种重投影误差计算装置，该装置包括：调整单元，用于利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标，该第一空间坐标包括第一图像中各特征点对应的空间坐标，该第一特征点为该第一图像中该动态障碍物对应的特征点，该第一图像为自动驾驶装置在第二时刻采集的图像，该运动状态信息包括该自动驾驶装置从第一时刻至该第二时刻的位移和姿态变化；投影单元，用于将该第二空间坐标投影至该第一图像以得到第一像素坐标；确定单元，用于根据该第一像素坐标和第二像素坐标，计算该第一图像的重投影误差；该第二像素坐标包括该第一图像中各特征点的像素坐标。

在一个可选的实现方式中，运动状态信息包括该动态障碍物从该第一时刻至该第二时刻的位移；调整单元，具体用于利用该位移对该第一图像中该第一特征点的像素坐标进行调整以得到该第二像素坐标，该第一图像中除该第一特征点之外的特征点的像素坐标均保持不变。

在一个可选的实现方式中，确定单元，还用于确定该N组特征点对中位于第一投影区域和/或第二投影区域的特征点为该目标特征点；该第一投影区域为该第一图像中该动态障碍物的图像所处的区域，该第二投影区域为该第二图像中该动态障碍物的图像所处的区域；获取单元，还用于获得该目标特征点对应的像素坐标。

第五方面本申请实施例提供了一种计算机可读存储介质，该计算机存储介质存储有计算机程序，该计算机程序包括程序指令，该程序指令当被处理器执行时使该处理器执行上述第一方面至第二方面以及任一种可选的实现方式的方法。

第六方面，本申请实施例提供了一种计算机程序产品，该计算机程序产品包括程序指令，该程序指令当被处理器执行时使该信处理器执行上述第一方面至第二方面以及任一种可选的实现方式的方法。

第七方面，本申请实施例提供了一种计算机设备，包括存储器、通信接口以及处理器；该通信接口用于接收自动驾驶装置发送的数据，存储器用于保存程序指令，处理器用于执行该程序指令以执行上述第一方面至第二方面以及任一种可选的实现方式的方法。

附图说明

图1是本申请实施例提供的自动驾驶装置100的功能框图；

图2为本申请实施例提供的一种自动驾驶系统的结构示意图；

图3为本申请实施例提供的一种图像帧之间的匹配关系确定方法流程图；

图4为本申请实施例提供的另一种图像帧之间的匹配关系确定方法流程图；

图5为本申请实施例提供的一种重投影误差计算方法流程图；

图6为一种三角化过程示意图；

图7为本申请实施例提供的一种定位方法流程示意图；

图8为本申请实施例提供的一种匹配关系确定装置的结构示意图；

图9为本申请实施例提供的一种重投影误差计算装置的结构示意图；

图10为本申请实施例提供的一种计算机设备的结构示意图；

图11为本申请实施例提供的一种计算机程序产品的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请实施例方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。

本申请的说明书实施例和权利要求书及上述附图中的术语“第一”、“第二”、和“第三”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元。方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请实施例提供的匹配关系确定方法可以应用到自动驾驶场景。下面对自动驾驶场景进行简单的介绍。

自动驾驶场景：自动驾驶装置(例如自动驾驶汽车)使用激光雷达实时或接近实时的采集周围环境的点云以及使用相机采集图像；采用SLAM根据采集到的点云以及图像来定位自车的位置，并根据定位结果来规划行车路线。自车是指自动驾驶装置。

图1是本申请实施例提供的自动驾驶装置100的功能框图。在一个实施例中，将自动驾驶装置100配置为完全或部分地自动驾驶模式。例如，自动驾驶装置100可以在处于自动驾驶模式中的同时控制自身，并且可通过人为操作来确定自动驾驶装置100及其周边环境的当前状态，确定周边环境中的至少一个其他车辆的可能行为，并确定该其他车辆执行可能行为的可能性相对应的置信水平，基于所确定的信息来控制自动驾驶装置100。在自动驾驶装置100处于自动驾驶模式中时，可以将自动驾驶装置100置为在没有和人交互的情况下操作。

自动驾驶装置100可包括各种子系统，例如行进系统102、传感器系统104、控制系统106、一个或多个外围设备108以及电源110、计算机系统112和用户接口116。可选地，自动驾驶装置100可包括更多或更少的子系统，并且每个子系统可包括多个元件。另外，自动驾驶装置100的每个子系统和元件可以通过有线或者无线互连。

行进系统102可包括为自动驾驶装置100提供动力运动的组件。在一个实施例中，推进系统102可包括引擎118、能量源119、传动装置120和车轮/轮胎121。引擎118可以是内燃引擎、电动机、空气压缩引擎或其他类型的引擎组合，例如汽油发动机和电动机组成的混动引擎，内燃引擎和空气压缩引擎组成的混动引擎。引擎118将能量源119转换成机械能量。

能量源119的示例包括汽油、柴油、其他基于石油的燃料、丙烷、其他基于压缩气体的燃料、乙醇、太阳能电池板、电池和其他电力来源。能量源119也可以为自动驾驶装置100的其他系统提供能量。

传动装置120可以将来自引擎118的机械动力传送到车轮121。传动装置120可包括变速箱、差速器和驱动轴。在一个实施例中，传动装置120还可以包括其他器件，比如离合器。其中，驱动轴可包括可耦合到一个或多个车轮121的一个或多个轴。

传感器系统104可包括感测关于自动驾驶装置100周边的环境的信息的若干个传感器。例如，传感器系统104可包括定位系统122(定位系统可以是全球定位(global positioning system，GPS)系统，也可以是北斗系统或者其他定位系统)、惯性测量单元(inertial measurement unit，IMU)124、雷达126、激光测距仪128以及相机130。传感器系统104还可包括被监视自动驾驶装置100的内部系统的传感器(例如，车内空气质量监测器、燃油量表、机油温度表等)。来自这些传感器中的一个或多个的传感器数据可用于检测对象及其相应特性(位置、形状、方向、速度等)。这种检测和识别是自主自动驾驶装置100的安全操作的关键功能。

定位系统122可用于估计自动驾驶装置100的地理位置。IMU 124用于基于惯性加速度和角速度来感测自动驾驶装置100的位置和朝向变化。在一个实施例中，IMU 124可以是加速度计和陀螺仪的组合。

雷达126可利用无线电信号来感测自动驾驶装置100的周边环境内的物体。

激光测距仪128可利用激光来感测自动驾驶装置100所位于的环境中的物体。在一些实施例中，激光测距仪128可包括一个或多个激光源、激光扫描器以及一个或多个检测器，以及其他系统组件。在一些实施例中，除了感测物体以外，激光测距仪128可以是激光雷达(light detection and ranging，LiDAR)。激光雷达(ibeo)，是以发射激光束探测目标的位置、速度等特征量的雷达系统。激光雷达可以是Ibeo激光传感器。激光雷达可向目标(即障碍物)或某个方向发射探测信号(激光束)，然后将接收到的从目标反射回来的信号(目标回波)与发射信号进行比较，作适当处理后，就可获得目标的有关信息，例如表示目标的表面特性的点云。点云是在同一空间参考系下表达目标空间分布和目标表面特性的海量点集合。本申请中的点云可以是根据激光测量原理得到的点云，包括每个点的三维坐标。

相机130可用于捕捉自动驾驶装置100的周边环境的多个图像。相机130可以是静态相机或视频相机。相机130可以实时或周期性的捕捉自动驾驶装置100的周边环境的多个图像。相机130可以是双目摄像机，包括左目摄像头和右目摄像头，这两个摄像头所处的位置不同。

控制系统106为控制自动驾驶装置100及其组件的操作。控制系统106可包括各种元件，其中包括转向系统132、油门134、制动单元136、计算机视觉系统140、路线控制系统142以及障碍物避免系统144。

转向系统132可操作来调整自动驾驶装置100的前进方向。例如在一个实施例中可以为方向盘系统。

油门134用于控制引擎118的操作速度并进而控制自动驾驶装置100的速度。

制动单元136用于控制自动驾驶装置100减速。制动单元136可使用摩擦力来减慢车轮121。在其他实施例中，制动单元136可将车轮121的动能转换为电流。制动单元136也可采取其他形式来减慢车轮121转速从而控制自动驾驶装置100的速度。

计算机视觉系统140可以操作来处理和分析由相机130捕捉的图像以便识别自动驾驶装置100周边环境中的物体和/或特征。该物体和/或特征可包括交通信号、道路边界和障碍物。计算机视觉系统140可使用物体识别算法、自动驾驶方法、运动中恢复结构(Structure from Motion，SFM)算法、视频跟踪和其他计算机视觉技术。在一些实施例中，计算机视觉系统140可以用于为环境绘制地图、跟踪物体、估计物体的速度等等。计算机视觉系统140可使用激光雷达获取的点云以及相机获取的周围环境的图像。

路线控制系统142用于确定自动驾驶装置100的行驶路线。在一些实施例中，路线控制系统142可结合来自传感器138、GPS 122和一个或多个预定地图的数据以为自动驾驶装置100确定行驶路线。

障碍物避免系统144用于识别、评估和避免或者以其他方式越过自动驾驶装置100的环境中的潜在障碍物。

当然，在一个实例中，控制系统106可以增加或替换地包括除了所示出和描述的那些以外的组件。或者也可以减少一部分上述示出的组件。

自动驾驶装置100通过外围设备108与外部传感器、其他车辆、其他计算机系统或用户之间进行交互。外围设备108可包括无线通信系统146、车载电脑148、麦克风150和/或扬声器152。

在一些实施例中，外围设备108提供自动驾驶装置100的用户与用户接口116交互的手段。例如，车载电脑148可向自动驾驶装置100的用户提供信息。用户接口116还可操作车载电脑148来接收用户的输入。车载电脑148可以通过触摸屏进行操作。在其他情况中，外围设备108可提供用于自动驾驶装置100与位于车内的其它设备通信的手段。例如，麦克风150可从自动驾驶装置100的用户接收音频(例如，语音命令或其他音频输入)。类似地，扬声器152可向自动驾驶装置100的用户输出音频。

无线通信系统146可以直接地或者经由通信网络来与一个或多个设备无线通信。例如，无线通信系统146可使用3G蜂窝通信，或者4G蜂窝通信，例如LTE，或者5G蜂窝通信。无线通信系统146可利用WiFi与无线局域网(wireless local area network，WLAN)通信。在一些实施例中，无线通信系统146可利用红外链路、蓝牙或ZigBee与设备直接通信。其他无线协议，例如各种车辆通信系统，例如，无线通信系统146可包括一个或多个专用短程通信(dedicated short range communications，DSRC)设备，这些设备可包括车辆和/或路边台站之间的公共和/或私有数据通信。

电源110可向自动驾驶装置100的各种组件提供电力。在一个实施例中，电源110可以为可再充电锂离子或铅酸电池。这种电池的一个或多个电池组可被配置为电源为自动驾驶装置100的各种组件提供电力。在一些实施例中，电源110和能量源119可一起实现，例如一些全电动车中那样。

自动驾驶装置100的部分或所有功能受计算机系统112控制。计算机系统112可包括至少一个处理器113，处理器113执行存储在例如数据存储装置114这样的非暂态计算机可读介质中的指令115。计算机系统112还可以是采用分布式方式控制自动驾驶装置100的个体组件或子系统的多个计算设备。

处理器113可以是任何常规的处理器，诸如商业可获得的中央处理器(central processing unit，CPU)。替选地，该处理器可以是诸如ASIC或其它基于硬件的处理器的专用设备。尽管图1功能性地图示了处理器、存储器和在相同块中的计算机系统112的其它元件，但是本领域的普通技术人员应该理解该处理器、计算机、或存储器实际上可以包括可以或者可以不存储在相同的物理外壳内的多个处理器、计算机、或存储器。例如，存储器可以是硬盘驱动器或位于不同于计算机系统112的外壳内的其它存储介质。因此，对处理器或计算机的引用将被理解为包括对可以或者可以不并行操作的处理器或计算机或存储器的集合的引用。不同于使用单一的处理器来执行此处所描述的步骤，诸如转向组件和减速组件的一些组件每个都可以具有其自己的处理器，该处理器只执行与特定于组件的功能相关的计算。

在此处所描述的各个方面中，处理器可以位于远离该自动驾驶装置并且与该自动驾驶装置进行无线通信。在其它方面中，此处所描述的过程中的一些操作在布置于自动驾驶装置内的处理器上执行而其它则由远程处理器执行，包括采取执行单一操纵的必要步骤。

在一些实施例中，数据存储装置114可包含指令115(例如，程序逻辑)，指令115可被处理器113执行来执行自动驾驶装置100的各种功能，包括以上描述的那些功能。数据存储装置114也可包含额外的指令，包括向推进系统102、传感器系统104、控制系统106和外围设备108中的一个或多个发送数据、从其接收数据、与其交互和/或对其进行控制的指令。

除了指令115以外，数据存储装置114还可存储数据，例如道路地图、路线信息，车辆的位置、方向、速度以及其他信息。这些信息可在自动驾驶装置100在自主、半自主和/或手动模式中操作期间被自动驾驶装置100和计算机系统112使用。

用户接口116，用于向自动驾驶装置100的用户提供信息或从其接收信息。可选地，用户接口116可包括在外围设备108的集合内的一个或多个输入/输出设备，例如无线通信系统146、车车在电脑148、麦克风150和扬声器152。

计算机系统112可基于从各种子系统(例如，行进系统102、传感器系统104和控制系统106)以及从用户接口116接收的输入来控制自动驾驶装置100的功能。例如，计算机系统112可利用来自控制系统106的输入以便控制转向单元132来避免由传感器系统104和障碍物避免系统144检测到的障碍物。在一些实施例中，计算机系统112可操作来对自动驾驶装置100及其子系统的许多方面提供控制。

可选地，上述这些组件中的一个或多个可与自动驾驶装置100分开安装或关联。例如，数据存储装置114可以部分或完全地与自动驾驶装置100分开存在。上述组件可以按有线和/或无线方式来通信地耦合在一起。

可选地，上述组件只是一个示例，实际应用中，上述各个模块中的组件有可能根据实际需要增添或者删除，图1不应理解为对本申请实施例的限制。

在道路行进的自动驾驶汽车，如上面的自动驾驶装置100，可以识别其周围环境内的物体以确定对当前速度的调整。该物体可以是其它车辆、交通控制设备、或者其它类型的物体。在一些示例中，可以独立地考虑每个识别的物体，并且基于物体的各自的特性，诸如它的当前速度、加速度、与车辆的间距等，可以用来确定自动驾驶汽车所要调整的速度。

可选地，自动驾驶装置100或者与自动驾驶装置100相关联的计算设备(如图1的计算机系统112、计算机视觉系统140、数据存储装置114)可以基于所识别的物体的特性和周围环境的状态(例如，交通、雨、道路上的冰等等)来预测该识别的物体的行为。可选地，每一个所识别的物体都依赖于彼此的行为，因此还可以将所识别的所有物体全部一起考虑来预测单个识别的物体的行为。自动驾驶装置100能够基于预测的该识别的物体的行为来调整它的速度。换句话说，自动驾驶汽车能够基于所预测的物体的行为来确定车辆将需要调整到(例如，加速、减速、或者停止)什么稳定状态。在这个过程中，也可以考虑其它因素来确定自动驾驶装置100的速度，诸如，自动驾驶装置100在行驶的道路中的横向位置、道路的曲率、静态障碍物和动态障碍物的接近度等等。

除了提供调整自动驾驶汽车的速度的指令之外，计算设备还可以提供修改自动驾驶装置100的转向角的指令，以使得自动驾驶汽车遵循给定的轨迹和/或维持与自动驾驶汽车附近的物体(例如，道路上的相邻车道中的轿车)的安全横向和纵向距离。

上述自动驾驶装置100可以为轿车、卡车、摩托车、公共汽车、船、飞机、直升飞机、割草机、娱乐车、游乐场车辆、施工设备、电车、高尔夫球车、火车、和手推车等，本发明实施例不做特别的限定。

图2介绍了自动驾驶装置100的功能框图，下面介绍一种自动驾驶系统101。图2为本申请实施例提供的一种自动驾驶系统的结构示意图。图1和图2是从不同的角度来描述自动驾驶装置100。如图2所示，计算机系统101包括处理器103，处理器103和系统总线105耦合。处理器103可以是一个或者多个处理器，其中，每个处理器都可以包括一个或多个处理器核。显示适配器(video adapter)107，显示适配器可以驱动显示器109，显示器109和系统总线105耦合。系统总线105通过总线桥111和输入输出(I/O)总线113耦合。I/O接口115和I/O总线耦合。I/O接口115和多种I/O设备进行通信，比如输入设备117(如：键盘，鼠标，触摸屏等)，多媒体盘(media tray)121，例如CD-ROM，多媒体接口等。收发器123(可以发送和/或接受无线电通信信号)，摄像头155(可以捕捉景田和动态数字视频图像)和外部USB接口125。可选的，和I/O接口115相连接的接口可以是USB接口。

其中，处理器103可以是任何传统处理器，包括精简指令集计算(“RISC”)处理器、复杂指令集计算(“CISC”)处理器或上述的组合。可选的，处理器可以是诸如专用集成电路(“ASIC”)的专用装置。可选的，处理器103可以是神经网络处理器(Neural-network Processing Unit，NPU)或者是神经网络处理器和上述传统处理器的组合。可选的，处理器103挂载有一个神经网络处理器。

计算机系统101可以通过网络接口129和软件部署服务器149通信。网络接口129是硬件网络接口，比如，网卡。网络127可以是外部网络，比如因特网，也可以是内部网络，比如以太网或者虚拟私人网络。可选的，网络127还可以是无线网络，比如WiFi网络，蜂窝网络等。

硬盘驱动接口和系统总线105耦合。硬件驱动接口和硬盘驱动器相连接。系统内存135和系统总线105耦合。运行在系统内存135的数据可以包括计算机系统101的操作系统137和应用程序143。

操作系统包括壳(Shell)139和内核(kernel)141。壳139是介于使用者和操作系统之内核(kernel)间的一个接口。壳139是操作系统最外面的一层。壳139管理使用者与操作系统之间的交互：等待使用者的输入，向操作系统解释使用者的输入，并且处理各种各样的操作系统的输出结果。

内核141由操作系统中用于管理存储器、文件、外设和系统资源的那些部分组成。直接与硬件交互，操作系统内核通常运行进程，并提供进程间的通信，提供CPU时间片管理、中断、内存管理、IO管理等等。

应用程序141包括自动驾驶相关程序，比如，管理自动驾驶装置和路上障碍物交互的程序，控制自动驾驶装置的行车路线或者速度的程序，控制自动驾驶装置100和路上其他自动驾驶装置交互的程序。应用程序141也存在于软件部署服务器(deploying server)149的系统上。在一个实施例中，在需要执行应用程序141时，计算机系统101可以从软件部署服务器149下载应用程序141。

传感器153和计算机系统101关联。传感器153用于探测计算机系统101周围的环境。举例来说，传感器153可以探测动物，汽车，障碍物和人行横道等，进一步传感器还可以探测上述动物，汽车，障碍物和人行横道等物体周围的环境，比如：动物周围的环境，例如，动物周围出现的其他动物，天气条件，周围环境的光亮度等。可选的，如果计算机系统101位于自动驾驶装置上，传感器可以是摄像头(即相机)，激光雷达，红外线感应器，化学检测器，麦克风等。传感器153在激活时按照预设间隔感测信息并实时或接近实时地将所感测的信息提供给计算机系统101。可选的，传感器可以包括激光雷达，该激光雷达可以实时或接近实时地将获取的点云提供给计算机系统101，即将获取到的一系列点云提供给计算机系统101，每次获取的点云对应一个时间戳。可选的，摄像头实时或接近实时地将获取的图像提供给计算机系统101，每帧图像对应一个时间戳。应理解，计算机系统101可得到来自摄像头的图像序列。

可选的，在本文该的各种实施例中，计算机系统101可位于远离自动驾驶装置的地方，并且可与自动驾驶装置进行无线通信。收发器123可将自动驾驶任务、传感器153采集的传感器数据和其他数据发送给计算机系统101；还可以接收计算机系统101发送的控制指令。自动驾驶装置可执行收发器接收的来自计算机系统101的控制指令，并执行相应的驾驶操作。在其它方面，本文该的一些过程在设置在自动驾驶车辆内的处理器上执行，其它由远程处理器执行，包括采取执行单个操纵所需的动作。

在自动驾驶过程中，如背景技术该自动驾驶装置在采用SLAM进行定位时，需要确定图像帧之间的匹配关系。下面介绍如何确定两帧图像之间的匹配关系。图3为本申请实施例提供的一种图像帧之间的匹配关系确定方法流程图，如图3所示，该方法可包括：

301、匹配关系确定装置获取N组特征点对。

该匹配关系确定装置可以是自动驾驶装置，也可以是服务器。在一些实施例中，自动驾驶装置采集第一图像和第二图像，并执行图3的方法流程来确定该第一图像和该第二图像之间的匹配关系。在一些实施例中，自动驾驶装置可以将其采集的图像数据以及点云数据等发送至匹配关系确定装置(例如服务器)，该匹配关系确定装置执行图3中的方法流程，根据这些数据来确定第一图像和第二图像之间的匹配关系。每组特征点对包括两个相匹配的特征点，其中一个特征点为从第一图像提取的特征点，另一个特征点为从第二图像提取的特征点，该第一图像和该第二图像分别为自动驾驶装置在第一时刻和第二时刻采集的图像，N为大于1的整数。可选的，该第一图像和该第二图像分别为自动驾驶装置上的同一摄像头在不同时刻采集的图像。可选的，自动驾驶装置在执行步骤301之前，在该第一时刻采集得到该第一图像且在该第二时刻采集到该第二图像；对该第一图像进行特征提取得到第一特征点集，对该第二图像进行特征提取得到第二特征点集；将该第一特征点集中的特征点与该第二特征点集中的特征点进行特征匹配以得到特征匹配点集；其中，该特征匹配点集包括该N组特征点对。该N组特征点对可以是该自动驾驶装置从该特征匹配点集中选取的N组特征点对。N可以是5、6、8等整数。

302、匹配关系确定装置利用动态障碍物的运动状态信息对N组特征点对中目标特征点的像素坐标进行调整。

该目标特征点属于该第一图像和/或该第二图像中该动态障碍物对应的特征点，该N组特征点对中除该目标特征点之外的特征点的像素坐标保持不变。该动态障碍物可以是一个，也可以是多个，本申请不作限定。在一些实施例中，动态障碍物可以是该第一图像和/或该第二图像中所有的动态障碍物。后续再详述步骤302的实现方式。

303、匹配关系确定装置根据N组特征点对中各特征点对应的调整后的像素坐标，确定第一图像和第二图像之间的目标匹配关系。

该第一图像和该第二图像之间的目标匹配关系可以该第一图像和该第二图像之间的平移矩阵和旋转矩阵。自动驾驶装置根据N组特征点对中各特征点对应的调整后的像素坐标，确定第一图像和第二图像之间的目标匹配关系可以是该自动驾驶装置根据N组特征点对中各特征点对应的调整后的像素坐标，确定第一图像和第二图像之间的平移矩阵和旋转矩阵。后续再详述计算两帧图像的之间的平移矩阵和旋转矩阵的方式。

利用运动状态信息对目标特征点的像素坐标进行调整的目的是对N组特征点对中动态障碍物对应的特征点的像素坐标进行调整，使得该N组特征点对中动态障碍物对应的特征点之间的平移矩阵和旋转矩阵与该N组特征点对中静态障碍物对应的特征点之间的平移矩阵和旋转矩阵基本相同，这样可以更准确地确定第一图像和第二图像之间的匹配关系，即第一图像和第二图像之间的平移矩阵和旋转矩阵。举例来说，第一图像中的第1特征点至第5特征点依次与第二图像中的第6特征点至第10特征点相匹配；若该第1特征点至该第5特征点均为静态障碍物对应的特征点，则根据该第1特征点至该第5特征点的像素坐标和该第6特征点至第10特征点的像素坐标，可以准确地确定该第一图像和该第二图像之间的匹配关系；若该第1特征点至该第5特征点中至少一个为动态障碍物对应的特征点，则根据该第1特征点至该第5特征点的像素坐标和该第6特征点至第10特征点的像素坐标，不能准确地确定该第一图像和该第二图像之间的匹配关系。

前述实施例未详述步骤302的实现方式，下面来描述步骤302的一种可选的实现方式。

在一个可选的实现方式中，该运动状态信息包括该动态障碍物从该第一时刻至该第二时刻的位移；利用动态障碍物的运动状态信息对该N组特征点对中目标特征点的像素坐标进行调整可以包括：利用该位移对参考特征点的像素坐标进行调整，该参考特征点包含于该目标特征点，且属于该第二图像中该动态障碍物对应的特征点。

该位移可以是动态障碍物从该第一时刻至该第二时刻在相机坐标系中的位移。由于动态障碍物在相机坐标系(也称摄像机坐标系)下的位移近似等同于该动态障碍物在图像坐标系中的位移，因此该动态障碍物在相机坐标系下的位移可以作为该动态障碍物对应的特征点在图像坐标系中的位移。下面介绍匹配关系确定装置如何获得动态障碍物从该第一时刻至该第二时刻在相机坐标系中的位移的方式。

可选的，匹配关系确定装置可根据自动驾驶装置上的激光雷达采集的点云数据，确定动态障碍物在第一时刻的第一速度以及在第二时刻的第二速度；计算该第一速度和该第二速度的平均值以得到平均速度。假定第一速度为(V _x1，V _y2，V _z3)，第二速度为(V _x2，V _y2，V _z2)，则该平均速度为

其中，

分别为动态障碍物在X方向、Y方向以及Z方向的速度。可以理解，该平均速度为动态障碍物在激光雷达坐标系下的速度。可选的，该匹配关系确定装置可先将该平均速度从激光雷达坐标系转换至自车坐标系，再将该平均速度从自车坐标系转换至相机坐标系。自车坐标系(也称车辆坐标系)是用来描述汽车运动的特殊动坐标系；其原点与质心重合，当自车在水平路面上处于静止状态，X轴平行于地面指向车辆前方，Z轴通过自车质心指向上方，Y轴指向驾驶员的左侧。可选的，该匹配关系确定装置可将该平均速度从激光雷达坐标系直接转换至相机坐标系。

自动驾驶装置将该平均速度从激光雷达坐标系转换至自车坐标系可采用如下公式：

V ₁′＝R ₁×V ₁+T ₁ (1)；

其中，V ₁′为自车坐标系下的平均速度，V ₁为激光雷达坐标系下的平均速度，R ₁为激光雷达标定的旋转矩阵(外参)，T ₁为该激光雷达标定的平移矩阵。

自动驾驶装置将该平均速度从自车坐标系转换至相机坐标系可采用如下公式：

V ₁″＝R ₂×V ₁′+T ₂ (2)；

其中，V ₁″为相机坐标系下的平均速度，V ₁′为自车坐标系下的平均速度，R ₂为自动驾驶装置与相机之间的旋转矩阵，T ₂为该自动驾驶装置与相机之间的平移矩阵。

自动驾驶装置将该平均速度从激光雷达坐标系转换至相机坐标系可采用如下公式：

V ₁″＝R ₃×V ₁+T ₃ (3)；

其中，V ₁″为相机坐标系下的平均速度，V ₁为激光雷达坐标系下的平均速度，R ₃为激光雷达与相机之间的旋转矩阵，T ₃为该激光雷达与相机之间的平移矩阵。

匹配关系确定装置利用位移对参考特征点的像素坐标进行调整的公式如下：

其中，(x′，y′)为参考特征点调整后的像素坐标，(x，y)为该参考特征点调整前的像素坐标，Δt为第一时刻至第二时刻的时长，V _x″为V ₁″在X方向的分量，V _x″为V ₁″在Y方向的分量，即V ₁″为(V _x″，V _y″，V _z″)。应理解，参考特征点中包括的每个特征点的像素点均可采用公式(4)进行调整。

自动驾驶装置在执行步骤302之前，需要确定N组特征点对中该动态障碍物对应的特征点以得到该目标特征点，以便于对该目标特征点的像素坐标进行调整。确定N组特征点对中动态障碍物对应的特征点以得到目标特征点可以是：确定该N组特征点对中位于第一投影区域和/或第二投影区域的特征点为该目标特征点；该第一投影区域为该第一图像中该动态障碍物的图像所处的区域，该第二投影区域为该第二图像中该动态障碍物的图像所处的区域。可选的，自动驾驶装置获得表征该动态障碍物在该第一时刻的特性的目标点云，将该目标点云投影到该第一图像以得到该第一投影区域；获得表征该动态障碍物在该第二时刻的特性的中间点云，将该中间点云投影到该第二图像以得到该第二投影区域。下面介绍点云投影到图像坐标系的方式，具体方式如下：

(1)激光雷达与相机(第一摄像头或第二摄像头)之间的外参(这里的外参主要是指激光雷达和相机之间的旋转矩阵R _ibeoTocam和平移向量T _ibeoTocam)，把激光雷达得到的目标点云投影到相机坐标系，其投影公式为：

P _cam＝P _ibeoTocam*P _ibeo+T _ibeoTocam (5)；

其中，P _ibeo表示激光雷达感知到的动态障碍物的某个点在激光雷达坐标系中的位置，P _cam表示这个点在相机坐标系中的位置。

(2)通过相机的内参，将相机坐标系中的点转换到图像坐标系，其公式如下：

U＝KP _cam (6)；

其中，K为相机的内参矩阵，U为该点在图像坐标系下的坐标。

在实际应用中，自动驾驶装置可以通过激光雷达(ibeo)按照一定扫描频率扫描周围环境以得到障碍物在不同时刻的点云，通过神经网络(Neural Networks，NN)算法或则非NN算法利用不同时刻的点云确定障碍物的运动信息(例如位置、速度、包围盒和姿态等)。激光雷达可以实时或接近实时地将获取的点云提供给计算机系统101，每次获取的点云对应一个时间戳。可选的，相机(摄像头)实时或接近实时地将获取的图像提供给计算机系统101，每帧图像对应一个时间戳。应理解，计算机系统101可得到来自相机的图像序列以及来自激光雷达的点云序列。由于激光雷达和相机(camera)的频率不一致，因此两种传感器的时间戳通常不同步。在以相机的时间戳为基准的情况下，对通过激光雷达检测到的障碍物的运动信息进行插值运算。若激光雷达的扫描频率比相机的拍摄频率高的话，就进行内插，具体运算过程为：例如最新拍摄的相机时间为t _cam，找到距离激光雷达输出中最近的两个时间t _k和t _k+1，其中，t _k<t _cam<t _k+1；以位置插值计算为例，如t _k时刻激光雷达检测到障碍物的位置为

t _k+1检测到障碍物的位置为

则t _cam时刻障碍物的位置为：

其中，

为障碍物在t _cam时刻的位置。应理解，自动驾驶装置可采用相同的方式对障碍物的其他运动信息，例如速度、姿态、点云等，进行插值，进而得到相机拍摄图像时，障碍物的运动信息。举例来说，相机在第一时刻拍摄得到第一图像，激光雷达在第三时刻扫描得到第一点云，在第四时刻扫描得到第二点云，且该第三时刻和该第四时刻为激光雷达的扫描时刻中与该第一时刻最接近的两个扫描时刻，采用与公式(7)类似的公式对该第一点云和该第二点云中相对应的点进行插值运算以得到障碍物在该第一时刻的目标点云。若激光雷达的扫描频率比相机的拍摄频率高的话，就进行外插。内插和外插是常用的数学计算公式，这里不再详述。

前述实施例中，自动驾驶装置根据N组特征点对中各特征点对应的调整后的像素坐标，来确定第一图像和第二图像之间的匹配关系。在实际应用中，自动驾驶装置可以根据从第一图像和第二图像相匹配的多组特征点对中任意选取N组特征点对，并根据该N组特征点对中各特征点对应的调整后的像素坐标来确定第一图像和第二图像之间的匹配关系。由于N组特征点对中可能存在噪声点等不能准确反映该第一图像和该第二图像的匹配关系的特征点对，因此需要选择N组能够准确反映该第一图像和该第二图像的匹配关系的特征点对，进而准确地确定第一图像和第二图像之间的匹配关系。为更准确地确定两帧图像之间的匹配关系，本申请实施例采用一种改进的RANSAC算法来确定前后两帧图像的匹配关系。

图4为本申请实施例提供的一种确定前后两帧图像的匹配关系的方法流程图。图4是对图3中的方法流程的进一步细化和完善。也就是说，图3的方法流程为图4中的方法流程的一部分。如图4所示，该方法可包括：

401、匹配关系确定装置确定第一图像中动态障碍物所处的第一投影区域以及第二图像中动态障碍物所处的第二投影区域。

前述实施例描述了将动态障碍物在第一时刻对应的目标点云投影至第一图像以得到第一投影区域，以及将动态障碍物在第二时刻对应的中间点云投影至第二图像以得到第二投影区域的方式，这里不再赘述。

402、匹配关系确定装置从匹配特征点集中随机选择N组特征点对。

本申请实施例中，步骤402可在执行步骤401之前执行，也可以在执行步骤401之后执行。该匹配特征点集为对从该第一图像提取的特征点与从该第二图像提取的特征点做特征匹配得到的特征点对。自动驾驶装置在执行步骤402之前，可对第一图像进行特征提取以得到第一特征点集，对第二图像进行特征提取以得到第二特征点集；对该第一特征点集中的特征点与该第二特征点集中的特征点进行特征匹配以得到匹配特征点集。步骤402为步骤301的一种实现方式。

403、匹配关系确定装置判断N组特征点对是否包括特殊特征点。

特殊特征点是指该N组特征点对中处于第一投影区域和/或第二投影区域的特征点。若否，执行404；若是，执行405。

404、匹配关系确定装置根据N组特征点中各特征点的像素坐标，计算第一图像与第二图像之间的匹配关系。

本申请中，第一图像与第二图像之间的匹配关系可以是该第一图像和该第二图像之间的平移矩阵和旋转矩阵。

405、匹配关系确定装置利用动态障碍物的运动状态信息对N组特征点对中目标特征点的像素坐标进行调整，并根据该N组特征点对中各特征点调整后的像素坐标确定第一图像和第二图像之间的匹配关系。

该目标特征点属于该第一图像和/或该第二图像中该动态障碍物对应的特征点。该N组特征点对中除该目标特征点之外的特征点对应的像素坐标均保持不变。步骤405对应于图3中的步骤302和步骤303。

406、匹配关系确定装置根据匹配关系，将匹配特征点集中除N组特征点对之外的各特征点对分为内点和外点以得到内点集和外点集。

根据匹配关系，将匹配特征点集中除N组特征点对之外的各特征点对分为内点和外点以得到内点集和外点集可以是依次检测该匹配特征点集中除N组特征点对之外的各特征点是否满足该匹配关系；若是，则确定该特征点对为内点，若否，则确定该特征点对为外点。

407、匹配关系确定装置判断当前得到的内点集中的内点的个数是否最多。

若是，执行408；若否，执行402。图4中的方法流程是一个多次迭代的流程，判断当前得到的内点集中的内点的个数是否最多可以是判断当前得到的内点集与之前得到的各内点集相比是否包括的内点的个数最多。

408、匹配关系确定装置判断当前迭代次数是否满足终止条件。

若是，执行409；若否，执行402。当前迭代次数可以是当前已执行的步骤402的次数。判断当前迭代次数是否满足终止条件可以是判断当前迭代次数是否大于或等于M，M为大于1的整数。M可以是5、10、20、50、100等。

409、结束本流程，且将目标匹配关系作为第一图像与第二图像之间的匹配关系。

该目标匹配关系为已确定的第一图像和该第二图像之间的两个或两个以上匹配关系中较优的匹配关系。可以理解，根据越优的匹配关系，将匹配特征点集中除N组特征点对之外的各特征点对分为内点和外点，可以得到越多的内点。

可以理解，通过执行步骤405可以使得动态障碍物对应的特征点对包括的两个特征点之间的关系与静态障碍物对应的特征点对包括的两个特征点之间的关系基本一致。也就是说，执行步骤405之后，N组特征点对均可视为静态障碍物对应的特征点对，这样就可以减少动态障碍物对应的特征点对的影响，因此能够较快的确定一组较优的匹配关系。另外，采用RANSAC算法可以从已确定的第一图像和第二图像之间的多个匹配关系中，选择一个较优的匹配关系，从而保证确定的匹配关系的质量。

本申请实施例中，采用RANSAC算法可准确、快速地确定第一图像与第二图像之间的匹配关系。

前述实施例未详细描述如何确定第一图像和第二图像的匹配关系的方式。下面介绍如何利用第一图像和第二图像对应的多个特征点对计算这两个图像之间的旋转矩阵R和平移矩阵T。上述匹配特征点集包括对从该第一图像提取的特征点与从该第二图像提取的特征点做特征匹配得到的多组特征点对。该匹配特征点集中每组特征点对包括两个相匹配的特征点，其中一个特征点为从第一图像提取的特征点，另一个特征点为从第二图像提取的特征点，该第一图像和该第二图像分别为自动驾驶装置在第一时刻和第二时刻采集的图像。可以理解，多组特征点对包括点集A和点集B，点集A中的特征点为从第一图像提取的特征点，点集B中的特征点为从第二图像提取的特征点，这两个点集合的元素数目相同且一一对应。点集A可以是N组特征点对中从第一图像提取的特征点，点集B可以是N组特征点对中从第二图像提取的特征点，这两个点集之间的旋转矩阵和平移矩阵就是第一图像和第二图像之间的旋转矩阵和平移矩阵。

为了确定两个点集之间的旋转矩阵和平移矩阵，可以将这个问题建模成如下的公式：

B＝R*A+t (8)；

其中，B表示点集B中的特征点的像素坐标，A表示点集A中特征点的像素坐标。为了寻找这两个点集之间的旋转矩阵和平移矩阵，通常需要以下三个步骤：

(1)、计算点集合的中心点，计算公式如下：

其中，

表示点集A中的第i特征点的像素坐标，

表示点集B中的第i特征点的像素坐标，u _A为点集A对应的中心点，u _B为点集B对应的中心点。

u _A以及u _B均为向量。例如

(2)、将点集合移动到原点，计算最优旋转矩阵R。

为了计算旋转矩阵R，需要消除平移矩阵t的影响，所以首先需要将点集重新中心化，生成新的点集A′和点集B′，然后计算点集A′和点集B′之间的协方差矩阵。

采用如下公式将点集重新中心化：

其中，A′ _i为点集A′中的第i特征点的像素坐标，B′ _i为点集B′中的第i特征点的像素坐标。

计算点集之间的协方差矩阵H，计算公式如下；

通过奇异值分解(Singular Value Decomposition，SVD)方法获得矩阵的U、S和V，计算点集之间的旋转矩阵，公式如下：

[U V D]＝SVD(H) (14)；

R＝VU ^T (15)；

其中，R为点集A和点集B之间的旋转矩阵，即第一图像和第二图像之间的旋转矩阵。

(3)、计算平移矩阵

采用如下公式计算平移矩阵：

t＝-R×u _A+u _B (16)；

其中，t为点集A和点集B之间的平移矩阵，即第一图像和第二图像之间的平移矩阵。

应理解，上述仅是本申请实施例提供的一种确定图像帧之间的匹配关系的一种实现方式，还可以采用其他方式来确定图像帧之间的匹配关系。

前述实施例描述了确定前后两帧图像之间的匹配关系的实现方式。在实际应用中，可以依次确定自动驾驶装置采集的各相邻图像帧之间的匹配关系，进而确定各帧图像与参考帧图像之间的匹配关系。该参考帧图像可以是自动驾驶装置在一次行驶过程中采集的第一帧图像。举例来说，自动驾驶装置在某段时间内按照时间先后顺序依次采集到第1帧图像至第1000帧图像，该自动驾驶装置可以分别确定相邻两帧图像之间的平移矩阵和旋转矩阵，例如第1帧图像和第2帧图像之间的平移矩阵和旋转矩阵，并根据这些平移矩阵和旋转矩阵确定这1000帧图像中除该第1帧图像之外的任一帧图像与该第一帧图像之间的匹配关系，进而计算各帧图像的重投影误差。又举例来说，第一图像和第二图像之间的旋转矩阵为R ₄，平移矩阵为T ₄；第二图像和第五图像之间的旋转矩阵为R ₅，平移矩阵为T ₅；则该第一图像和该第五图像之间的旋转矩阵为(R ₄×R ₅)，该第一图像和该第五图像之间的平移矩阵为(R ₄×T ₅+T ₄)。在一些实施例中，自动驾驶装置采集到一帧图像就确定该帧图像与该帧图像的前一帧图像之间的匹配关系，这样就可以得到任意两帧相邻图像之间的匹配关系，进而得到任意两帧图像之间的匹配关系。在实际应用中，匹配关系确定装置在确定当前帧(即当前时刻采集的图像帧)与参考帧之间的平移矩阵和旋转矩阵之后，可以利用该平移矩阵和旋转矩阵将当前帧中的特征点对应的三维空间坐标从自车坐标系转换至参考坐标系，以便于计算该当前帧的重投影误差。

前述实施例描述了如何更准确地确定图像帧之间的匹配关系。计算图像帧之间的匹配关系的一个重要应用是计算当前帧与参考帧之间的匹配关系，进而计算该当前帧的重投影误差。本申请实施例还提供了一种重投影误差计算方法，下面具体描述该重投影误差计算方法。

图5为本申请实施例提供的一种重投影误差计算方法流程图。如图5所示，该方法可包括：

501、重投影误差计算装置利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标。

重投影误差计算装置可以是自动驾驶装置，也可以是服务器、电脑等计算机设备。在一些实施例中，自动驾驶装置采集第一图像，并执行图5的方法流程来计算该第一图像的重投影误差。在一些实施例中，自动驾驶装置可以将其采集的图像数据以及点云数据等发送至重投影误差计算装置(例如服务器)；该重投影误差计算装置执行图5中的方法，根据这些数据来计算第一图像的重投影误差。该第一空间坐标包括第一图像中各特征点对应的空间坐标，该第一特征点为该第一图像中该动态障碍物对应的特征点。该第一图像可以为自动驾驶装置在第二时刻采集的图像。该第一图像中除该第一特征点之外的特征点的像素坐标均保持不变。该运动状态信息可以包括该自动驾驶装置从第一时刻至该第二时刻的位移(对应一个平移矩阵)和姿态变化(对应一个选择矩阵)。

可选的，重投影误差计算装置在执行步骤501之前，可以确定该第一图像中各特征点在参考坐标系中对应的三维空间坐标以得到第一空间坐标，以及确定该第一空间坐标中第一特征点对应的空间坐标。该参考坐标系可以是自动驾驶装置在本次行驶的起始地点建立的世界坐标系。后续再详述确定第一空间坐标以及第一特征点对应的空间坐标的实现方式。

502、重投影误差计算装置将第二空间坐标投影至第一图像以得到第一像素坐标。

该第二空间坐标可以是在参考坐标系下的空间坐标。重投影误差计算装置将第二空间坐标投影至第一图像以得到第一像素坐标可以是将该参考坐标系下的该第二空间坐标投影至第一图像以得到第一像素坐标。由于需要在一个固定不变的坐标系下计算自动驾驶装置采集到的每帧图像的重投影误差，因此需要确定第二图像中各特征点在参考坐标系下对应的三维空间坐标以得到第一空间坐标。该参考坐标系是一个固定的坐标系，不像自车坐标系会发生改变。利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整是利用动态障碍物的运动状态信息对该第一特征点在参考坐标系下对应的空间坐标进行调整。

503、重投影误差计算装置根据第一像素坐标和第二像素坐标，计算第一图像的重投影误差。

该第二像素坐标包括该第一图像中各特征点的像素坐标，第一像素坐标包括的各像素坐标与该第二像素坐标包括的各像素坐标一一对应。该第一像素坐标包括的每个像素坐标对应一个描述子，每个描述子用于描述其对应的特征点；该第二像素坐标包括的每个像素坐标也对应一个描述子。可以理解，第一像素坐标和第二像素坐标包括的像素坐标中对应的描述子相同的像素坐标相对应。

可选的，重投影误差计算装置在执行步骤503之前，可利用该位移对该第一图像中该第一特征点的像素坐标进行调整以得到该第二像素坐标，该第一图像中除该第一特征点之外的特征点的像素坐标均保持不变。利用该位移对该第一图像中该第一特征点的像素坐标进行调整的实现方式可以与前文描述的利用位移对参考特征点的像素坐标进行调整的实现方式相同，这里不再详述。

重投影误差：投影的点与该帧图像上的测量点之间的误差，投影的点可以是该帧图像中的各特征点对应的三维空间坐标投影至该帧图像的坐标点(即第一像素坐标)，测量点可以是这些特征点在该帧图像中的坐标点(即第二像素坐标)。重投影误差计算装置根据第一像素坐标和第二像素坐标，计算第一图像的重投影误差可以是计算第一像素坐标和第二像素坐标中一一对应的像素坐标之差。举例来说，某个特征点在第一像素坐标中对应的像素坐标为(U1，V1)，该特征点在第二像素坐标中对应的像素坐标为(U2，V2)，则该特征点的重投影误差为

ΔU＝U1-U2，

第一图像的重投影误差包括该第一图像中各个特征点的重投影误差。

重投影误差计算装置在执行步骤501之前，需要确定第一空间坐标以及第一特征点。下面描述如何得到第一空间坐标以及第一特征点的方式。

重投影误差计算装置可采用如下方式确定第一特征点：重投影误差计算装置在执行步骤501之前，获得第一摄像头在第二时刻采集的第一图像以及第二摄像头在该第二时刻采集的第二图像；对该第一图像进行特征提取以得到第一原始特征点集，对第二图像进行特征提取以得到第二原始特征点集；对该第一原始特征点集中的特征点与该第二原始特征点集中的特征点进行特征匹配以得到第一特征点集，该第一特征点集包括的特征点为该第一原始特征点集中与该第二原始特征点集中的特征点相匹配的特征点；确定该第一特征点集中动态障碍物对应的特征点以得到该第一特征点。

重投影误差计算装置可采用如下方式确定该第一特征点集中动态障碍物对应的特征点以得到该第一特征点：获得目标点云，该目标点云为表征该动态障碍物在该第二时刻的特性的点云；将该目标点云投影到该第一图像以得到目标投影区域；确定第一特征点集中位于该目标投影区域的特征点为该第一特征点。

重投影误差计算装置在获得第一原始特征点集和第二原始特征点集之后，可采用如下方式确定第一空间坐标；对该第一原始特征点集中的特征点与该第二原始特征点集中的特征点进行特征匹配以得到第一特征点集，其中，该第一特征点集包括多组特征点对，每组特征点对包括两个相匹配的特征点，一个特征点来自于该第一原始特征点集，另一个特征点来自于该第二原始特征点集；采用三角化公式根据第一特征点集中的每组特征点对确定一个三维空间坐标，得到该第一空间坐标。每组特征点对中一个特征点为从该第一图像提取的，另一个为从该第二图像提取的。由一组特征点对计算得到的一个三维空间坐标即为该组特征点对包括的两个特征点对应的空间坐标。该第一特征点包含于该第一特征点集。三角化最早由高斯提出，并应用于测量学中。简单来讲就是：在不同的位置观测同一个三维点P(x,y,z)，已知在不同位置处观察到的三维点的二维投影点X1(x1,y1),X2(x2,y2)，利用三角关系，恢复出该三维点的深度信息，即三维空间坐标。三角化主要是通过匹配的特征点(即像素点)来计算特征点在相机坐标系下的三维坐标。图6为一种三角化过程示意图。如图6所示，P1表示三维点P在O1(左目坐标系)中的坐标(即二维投影点)，P2表示三维点P在O2(右目坐标系)中的坐标(即二维投影点)，P1和P2为匹配的特征点。三角化公式如下：

公式(17)中s1表示特征点在O1(左目坐标系)中的尺度，s2表示特征点在O2(右目坐标系)中的尺度，R和t分别表示从左目摄像头到右目摄像头之间的旋转矩阵和平移矩阵。T(大写)表示矩阵的转置。应理解，利用三角关系确定特征点的三维空间坐标仅是一种可选的确定特征点的三维空间坐标的方式，还可以采用其他方式确定特征点的三维空间坐标，本申请不作限定。

前述实施例未详述步骤501的实现方式，下面描述如何利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标的实现方式。

该运动状态信息可以包括该自动驾驶装置从第一时刻至该第二时刻的位移(对应一个平移矩阵T ₆)和姿态变化(对应一个旋转矩阵R ₆)。

举例来说，旋转矩阵R ₆表征自动驾驶装置从第一时刻至第二时刻的姿态变化，平移矩阵T ₆表征该自动驾驶装置从第一时刻至第二时刻的位移，重投影误差计算装置可采用如下公式对该第一特征点对应的空间坐标P进行调整(即运动补偿)：

P′＝R ₆P+T ₆ (18)；

其中，P′为该第一特征点对应的调整后的空间坐标，即补偿后的特征点坐标，P′为一个三维向量；R ₆为一个3行3列的矩阵，T ₆为一个三维向量。例如，R ₁为

为[5 1.2 1.5],T ₁为[10 20 0]，其中，α为两帧图像绕z轴之间的旋转角度。

可选的，重投影误差计算装置计算旋转矩阵R ₆的方式如下：通过激光雷达获取动态障碍物在第一时刻的第一角速度以及在第二时刻的第二角速度；计算该第一角速度和该第二角速度的平均值；计算该平均值和第一时长的乘积得到旋转角度α，该第一时长为该第一时刻与该第二时刻之间的时长；根据该旋转角度得到第一旋转矩阵，该第一旋转矩阵为激光雷达坐标系下的旋转矩阵；使用激光雷达的外参(激光雷达的朝向和位置)将该第一旋转矩阵从激光雷达坐标系转换至自车坐标系以得到第二旋转矩阵；将该第二旋转矩阵从自车坐标系转换至参考坐标系，得到旋转矩阵R ₆。可以理解，旋转矩阵R ₆为该动态障碍物在参考坐标系下从第一时刻至第二时刻的姿态变化对应的旋转矩阵。在实际应用中，自动驾驶装置可通过激光雷达检测得到动态障碍物在不同时刻的角速度。重投影误差计算装置可以采用如下公式将该第一旋转矩阵从激光雷达坐标系转换至自车坐标系以得到第二旋转矩阵：

R ₆′＝R ₁×R ₆″ (19)；

R ₆′为第二旋转矩阵，R ₆″为第一旋转矩阵，R ₁为激光雷达标定的旋转矩阵。

重投影误差计算装置可以采用如下公式将该第二旋转矩阵从自车坐标系转换至参考坐标系以得到旋转矩阵R ₆：

R ₆＝R ₇×R ₆′ (20)；

R ₆为该动态障碍物在参考坐标系下从第一时刻至第二时刻的姿态变化对应的旋转矩阵，R ₆′为第二旋转矩阵，R ₇为第一图像与参考帧图像之间的旋转矩阵。重投影误差计算装置与匹配关系确定装置可以是同一装置。前述实施例描述了确定任一帧图像与参考帧之间的平移矩阵和旋转矩阵的实现方式，这里不再详述。

可选的，重投影误差计算装置计算平移矩阵T ₆的方式如下：通过激光雷达获取动态障碍物在第一时刻的第一速度以及在第二时刻的第二速度；计算该第一速度和该第二速度的平均值；计算该平均值和第二时长的乘积得到第一平移矩阵，该第二时长为该第一时刻与该第二时刻之间的时长，该第一平移矩阵为在激光雷达坐标系下的平移矩阵；使用激光雷达的外参(激光雷达的朝向和位置)将该第一平移矩阵从激光雷达坐标系转换至自车坐标系以得到第二平移矩阵；将该第二平移矩阵从该自车坐标系转换至参考坐标系，得到平移矩阵T ₆。平移矩阵T ₆可以理解为该动态障碍物在参考坐标系下从第一时刻至第二时刻的位置变化对应的平移矩阵。在实际应用中，自动驾驶装置可通过激光雷达检测得到动态障碍物在不同时刻的速度。重投影误差计算装置可以采用如下公式将该第一平移矩阵从激光雷达坐标系转换至自车坐标系以得到第二平移矩阵：

T ₆′＝R ₁×T ₆″+T ₁ (21)；

T ₆′为第二平移矩阵，R ₆″为第一平移矩阵，R ₁为激光雷达标定的旋转矩阵，T ₁为激光雷达标定的平移矩阵。重投影误差计算装置可以采用如下公式将该第二平移矩阵从自车坐标系转换至参考坐标系以得到第二平移矩阵：

T ₆＝R ₇×T ₆′+T ₇ (22)；

T ₆为该动态障碍物在参考坐标系下从第一时刻至第二时刻的位置变化对应的平移矩阵，T ₆′为第二平移矩阵，R ₇为第一图像与参考帧图像之间的旋转矩阵，T ₇为第一图像与参考帧图像之间的平移矩阵。

下面介绍前述实施例提供的图像帧之间的匹配关系确定方法以及重投影计算方法在定位过程中的应用。图7为本申请实施例提供的一种定位方法流程示意图，该定位方法应用于包括激光雷达、IMU、双目相机的自动驾驶装置。如图7所示，该方法可包括：

701、自动驾驶装置通过双目相机采集图像。

通过双目相机在(t-1)时刻(对应于第一时刻)采集图像，得到第一图像和第三图像。该第一图像可以是左目摄像头采集的图像，该第三图像可以是右目摄像头采集的图像。在实际应用中，该双目相机可以实时或接近实时的采集图像。如图7所示，该双目摄像机在t时刻(对应于第二时刻)也采集得到第二图像和第四图像。该第二图像可以是左目摄像头采集的图像，该第四图像可以是右目摄像头采集的图像。

702、自动驾驶装置对左目摄像头采集的图像和右目摄像头采集的图像进行特征提取，并进行特征匹配。

可选的，自动驾驶装置对第一图像进行特征提取以得到第一特征点集，对该第三图像进行特征提取以得到第二特征点集；对该第一特征点集中的特征点与该第二特征点集中的特征点做特征匹配，得到第一匹配特征点集。可选的，自动驾驶装置对第二图像进行特征提取以得到第三特征点集，对该第四图像进行特征提取以得到第四特征点集；对该第三特征点集中的特征点与该第四特征点集中的特征点做特征匹配，得到第二匹配特征点集。在实际应用中，自动驾驶装置对双目摄像机在同一时刻采集的两张图像做特征提取以及特征匹配。

703、自动驾驶装置对不同时刻采集的图像进行特征追踪。

自动驾驶装置对不同时刻采集的图像进行特征追踪可以是确定第一图像和第二图像的匹配关系，和/或，第三图像和第四图像的匹配关系。也就是说，自动驾驶装置对不同时刻采集的图像进行特征追踪可以是确定该自动驾驶装置在不同时刻采集的两帧图像之间的匹配关系。图7中特征追踪是指确定前后两帧图像的匹配关系。两帧图像之间的匹配关系可以是两帧图像之间的旋转矩阵和平移矩阵。自动驾驶装置确定两帧图像之间的匹配关系的实现方式可参阅图3和图4，这里不再赘述。在实际应用中，自动驾驶装置可分别确定其先后采集的多帧图像中所有前后相邻的两帧图像之间的匹配关系。在一些实施例中，自动驾驶装置采集到一帧图像就确定该帧图像与该帧图像的前一帧图像之间的匹配关系，这样就可以得到任意两帧相邻图像之间的匹配关系，进而得到任意两帧图像之间的匹配关系。例如，当前帧与参考帧之间的旋转矩阵和平移矩阵。

704、自动驾驶装置根据动态障碍物的角速率和速度进行运动估计。

自动驾驶装置进行运动估计可以是估计动态障碍物的运动状态以得到该动态障碍物的运动状态信息，例如动态障碍物在相机坐标系下从(t-1)时刻至t时刻的位移、该动态障碍物在参考坐标系下从(t-1)时刻至t时刻的姿态变化(例如旋转矩阵R ₆)以及该动态障碍物在参考坐标系下从(t-1)时刻至t时刻的位置变化(例如平移矩阵T ₆)。前述实施例描述了根据动态障碍物的角速率和速度进行运动估计以得到该动态障碍物的运动状态信息的实现方式，这里不再赘述。

705、自动驾驶装置对图像中的特征点所对应的空间坐标进行三维重建。

自动驾驶装置对图像中的特征点所对应的空间坐标进行三维重建可以包括：利用三角化公式根据第一匹配特征点集中每组相匹配的特征点对确定一个三维空间坐标以得到第一参考空间坐标；将该第一参考空间坐标从激光雷达坐标系转换至参考坐标系以得到第一中间空间坐标；根据运动状态信息调整该第一中间空间坐标中动态障碍物对应的特征点对应的空间坐标，得到第一目标空间坐标。该第一目标空间坐标为第一图像和第三图像中的特征点对应的调整后(重建)的三维空间坐标。该图像可以是该第一图像、该第二图像、第三图像以及第四图像中的任一个。该运动状态信息为自动驾驶装置在步骤704得到的。自动驾驶装置对图像中动态障碍物对应的特征点所对应的空间坐标进行三维重建还可以包括：利用三角化公式根据第二匹配特征点集中每组相匹配的特征点对确定一个三维空间坐标以得到第二参考空间坐标；将该第二参考空间坐标从激光雷达坐标系转换至参考坐标系以得到第二中间空间坐标；根据运动状态信息调整该第二中间空间坐标中动态障碍物对应的特征点对应的空间坐标，得到第二目标空间坐标。该第二目标空间坐标为第二图像和第四图像中的特征点对应的调整后(重建)的三维空间坐标。可以理解，自动驾驶装置对图像中的特征点所对应的空间坐标进行三维重建也就是对图像中动态障碍物对应的特征点所对应的三维空间坐标进行调整。步骤705的实现方式可以与步骤501的实现方式相同。

706、自动驾驶装置计算重投影误差。

自动驾驶装置计算重投影误差的方式可以如下：将上述第二目标空间坐标中的三维空间坐标投影至第二图像以得到目标投影点；计算该目标投影点和目标测量点之间的误差，得到该第二图像的重投影误差。该目标测量点包括该第二图像中各特征点的像素坐标，该目标投影点包括的像素坐标与该目标测量点包括的像素坐标一一对应，。应理解，自动驾驶装置可采用类似的方式计算任一帧图像的重投影误差。步骤706的实现方式可参阅图5。

707、自动驾驶装置上的电子控制单元(Electronic Control Unit，ECU)根据激光雷达采集的点云数据确定障碍物的位置和速度。

障碍物可以包括动态障碍物和静态障碍物。具体的，ECU可根据激光雷达采集的点云数据，确定动态障碍物的位置和速度，以及静态障碍物的位置。

708、自动驾驶装置上的ECU根据激光雷达采集的点云数据确定障碍物的包围盒(Bounding Box)，以及输出外参。

该外参可以是表征该激光雷达的位置和朝向的标定参数，即旋转矩阵(对应朝向)和平移矩阵(对应位置)。该外参在自动驾驶装置将该包围盒投影至图像以得到投影区域时会用到。

709、自动驾驶装置确定动态障碍物在图像的投影区域。

可选的，自动驾驶装置确定动态障碍物在第一图像的投影区域，以便于确定从该第一图像提取的特征点中属于该动态障碍物对应的特征点。可选的，自动驾驶装置根据动态障碍物的包围盒确定该动态障碍物在图像中的投影区域，具体实现方式可参阅公式(5)和公式(6)。应理解，自动驾驶装置可根据动态障碍物的包围盒，确定动态障碍物在每一帧图像中的投影区域。自动驾驶装置在执行步骤705时需要根据动态障碍物对应的投影区域来确定动态障碍物对应的特征点。

710、自动驾驶装置确定动态障碍物的速度和角速度等。

可选的，自动驾驶装置通过激光雷达采集的点云数据来确定动态障碍物的速度和角速度，以便于根据该动态障碍物的速度和角速度进行运动估计以得到该动态障碍物的运动状态信息。

711、自动驾驶装置采用扩展卡尔曼滤波器(Extended kalman filter，EKF)确定姿态误差、速度误差、位置误差以及第二输出。

该第二输出可以包括动态障碍物的位置、姿态以及速度。图7中量测量包括当前帧图像的重投影误差以及动态障碍物的位置。如图7所示，IMU将线加速度和角速度输出至状态模型，激光雷达将动态障碍物的位置和速度输出至该状态模型，该状态模型可根据这些信息来构建状态方程；量测模型可根据量测量来构建量测方程；EKF可以根据该量测方程以及该状态方程计算得到姿态误差、速度误差、位置误差以及第二输出。后续再详述构建量测方程以及状态方程的实现方式。图7中，虚线框中的量测模型、状态模型以及扩展卡尔曼滤波器的功能可由计算机系统112实现。卡尔曼滤波的定义：一种利用线性系统状态方程，通过系统输入输出观测数据，对系统状态进行最优估计的算法。由于观测数据中包括系统中的噪声和干扰的影响，所以最优估计也可看作是滤波过程。扩展卡尔曼滤波(Extended Kalman Filter，EKF)是标准卡尔曼滤波在非线性情形下的一种扩展形式，它是一种高效率的递归滤波器(自回归滤波器)。EKF的基本思想是利用泰勒级数展开将非线性系统线性化，然后采用卡尔曼滤波框架对信号进行滤波，因此它是一种次优滤波。自动驾驶装置在定位过程中，由于IMU存在常值漂移，往往不能准确地定位，这时可以利用测量数据对定位结果进行调整。

SLAM过程包含许多步骤，整个过程是为了利用环境来更新自动驾驶装置的位置。由于自动驾驶装置的定位结果往往不够准确。我们可以利用对环境的激光扫描和/或采集图像来纠正自动驾驶装置的位置，这能通过提取环境的特征来实现，然后当自动驾驶装置向四周运动时再进行新的观察。扩展卡尔曼滤波EKF是SLAM过程的核心，其基于这些环境特征来负责更新自动驾驶装置原始的状态位置，这些特征常称为地标。EKF用于跟踪自动驾驶装置位置的不确定估计以及环境中的不确定地标。下文下再介绍本申请实施例中EKR的实现。

712、自动驾驶装置通过惯性导航系统(Inertial Navigation System，INS)确定其自身的姿态、速度以及位置。

图7中，速度误差以及位置误差输出至INS，INS可根据速度误差以及位置误差对其计算得到的自车的速度以及位置进行修正；姿态误差输出至乘法器，该乘法器对INS输出的旋转矩阵(表征姿态)进行修正，这个过程就是对IMU的常值漂移进行修正的过程。IMU的常值漂移是IMU的一种固有属性，会导致其导航误差随时间累积。该乘法器对INS输出的旋转矩阵进行修正可以是计算INS输出的旋转矩阵与姿态误差(一个旋转矩阵)的乘积以得到修正后的旋转矩阵。图7中的第一输出是自动驾驶装置的姿态、速度以及位置。图7中的线加速度和角速度是IMU的输出，INS对该线加速度进行一阶积分可得到自车的速度，对该线加速度进行二阶积分可得到自车的位置，对该角速度进行一阶积分可得到自车的姿态。

本申请实施例中，可以更准确地计算重投影误差，使得定位更准确。

扩展卡尔曼滤波器是本领域常用的技术手段。下面简单描述一下本申请实施例中EKR的应用。

在实际应用中，自动驾驶装置可进行系统建模：将障碍物和自车的位置、速度、姿态以及IMU的常值偏差等建模到系统的方程中，在对自车进行定位时，同时也对障碍物的位置、速度和角度等做进一步的优化。其中，激光雷达可检测动态障碍物的位置、速度、姿态。IMU可估计自车的位置、速度、姿态。

系统的状态方程：系统的状态量

其中前15维状态量为IMU的位置误差、速度误差、姿态误差等。后9n维为障碍物的位置、速度和角度信息。具体的，q为自车(即自动驾驶装置)的姿态误差，b _g为陀螺仪的常值偏差误差，

为速度误差，b _a为加速度计的常值偏差误差，

为自车的位置误差，

为第一个障碍物的位置，

为第一个障碍物的速度，

为第一个障碍物的姿态，同理递推。X中每个参数均对应一个三维的向量。

根据捷联惯导的误差方程以及障碍物的运动模型可得：

其中，

F _I为IMU的状态平移矩阵，G _I为IMU的噪声驱动阵，n _I为IMU的噪声矩阵，F _O为障碍物的状态转换矩阵，G _O为障碍物的噪声驱动阵，n _O为障碍物的噪声矩阵。

系统的量测方程，系统的量测方程主要由两部分组成：

(1)以三维特征点的重投影误差为量测量，其量测方程可以表示为：

其中，

为量测矩阵，

为量测噪声，

为特征点的重投影误差。

(2)以激光雷达观测障碍物到自车的位置为量测量，其量测方程可以表示为：

其中，

为在全局坐标系下自车的位置，

为全局坐标系下障碍物的位置，

为从全局坐标系到自车坐标系下的转换矩阵，

为自车坐标系下障碍物的位置。自车坐标系是以自动驾驶装置的后轮中心点为原点的坐标系，它随着车的位置的变化而变化。全局坐标系指定一个原点和方向，它是不变的，其位置和指向不随车的变换而变化。

由于扩展卡尔曼滤波器是本领域常用的技术手段，这里不再详述通过扩展卡尔曼滤波器确定姿态误差、速度误差以及位置误差的实现过程。

下面结合匹配关系确定装置的结构来描述如何确定图像帧之间的匹配关系。图8为本申请实施例提供的一种匹配关系确定装置的结构示意图。如图8所示，该匹配关系确定装置包括：

获取单元801，用于获取N组特征点对，每组特征点对包括两个相匹配的特征点，其中一个特征点为从第一图像提取的特征点，另一个特征点为从第二图像提取的特征点，该第一图像和该第二图像分别为自动驾驶装置在第一时刻和第二时刻采集的图像，N为大于1的整数；

调整单元802，用于利用动态障碍物的运动状态信息对该N组特征点对中目标特征点的像素坐标进行调整，该目标特征点属于该第一图像和/或该第二图像中该动态障碍物对应的特征点，该N组特征点对中除该目标特征点之外的特征点的像素坐标保持不变；

确定单元803，用于根据该N组特征点对中各特征点对应的调整后的像素坐标，确定该第一图像和该第二图像之间的目标匹配关系。

在具体实现过程中，获取单元801具体用于执行步骤301中所提到的方法以及可以等同替换的方法；调整单元802具体用于执行步骤302中所提到的方法以及可以等同替换的方法；确定单元803，具体用于执行步骤303中所提到的方法以及可以等同替换的方法。获取单元801、调整单元802以及确定单元803的功能均可由处理器113实现。

在一个可选的实现方式中，该运动状态信息包括该动态障碍物从该第一时刻至该第二时刻的位移；

调整单元802，具体用于利用该位移对参考特征点的像素坐标进行调整，该参考特征点包含于该目标特征点，且属于该第二图像中该动态障碍物对应的特征点。

在一个可选的实现方式中，确定单元803，还用于确定该N组特征点对中位于第一投影区域和/或第二投影区域的特征点为该目标特征点；该第一投影区域为该第一图像中该动态障碍物的图像所处的区域，该第二投影区域为该第二图像中该动态障碍物的图像所处的区域；

获取单元801，还用于获得该目标特征点对应的像素坐标。

在一个可选的实现方式中，确定单元803，还用于对第一点云和第二点云进行插值计算以得到目标点云，该第一点云和该第二点云分别为该自动驾驶装置在第三时刻和第四时刻采集的点云，该目标点云为表征该动态障碍物在该第一时刻的特性的点云，该第三时刻在该第一时刻之前，该第四时刻在该第一时刻之后；该装置还包括：

投影单元804，用于将该目标点云投影到该第一图像以得到该第一投影区域。

图9为本申请实施例提供的一种重投影误差计算装置的结构示意图。如图9所示，该重投影误差计算装置包括：

调整单元901，用于利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标，该第一空间坐标包括第一图像中各特征点对应的空间坐标，该第一特征点为该第一图像中该动态障碍物对应的特征点，该第一图像为自动驾驶装置在第二时刻采集的图像，该运动状态信息包括该自动驾驶装置从第一时刻至该第二时刻的位移和姿态变化；

投影单元902，用于将该第二空间坐标投影至该第一图像以得到第一像素坐标；

确定单元903，用于根据该第一像素坐标和第二像素坐标，计算该第一图像的重投影误差；该第二像素坐标包括该第一图像中各特征点的像素坐标。

在一个可选的实现方式中，调整单元901，还用于利用该位移对该第一图像中该第一特征点的像素坐标进行调整以得到该第二像素坐标，该第一图像中除该第一特征点之外的特征点的像素坐标均保持不变。

在一个可选的实现方式中，该装置还包括：

第一获取单元904，用于获得第二图像中与该第一特征点相匹配的第二特征点；该第一图像和该第二图像分别为该自动驾驶装置上的第一摄像头和第二摄像头在该第二时刻采集的图像，该第一摄像头和该第二摄像头所处的空间位置不同；

确定单元903，还用于根据该第一特征点和该第二特征点，确定第一特征点对应的空间坐标。

在一个可选的实现方式中，该装置还包括：

第二获取单元905，用于获得目标点云，该目标点云为表征该动态障碍物在该第二时刻的特性的点云；

投影单元902，还用于将该目标点云投影到该第一图像以得到目标投影区域；

确定单元903，还用于确定第一特征点集中位于该目标投影区域的特征点为该第一特征点；该第一特征点集包括的特征点为从该第一图像提取的特征点，且均与第二特征点集中的特征点相匹配，该第二特征点集包括的特征点为从第二图像提取的特征点。

第一获取单元904和第二获取单元905可以是同一单元，也可以是不同的单元。图9中各单元的功能均可由处理器113实现。

应理解以上匹配关系确定装置以及重投影误差计算装置中的各个单元的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。例如，以上各个单元可以为单独设立的处理元件，也可以集成在终端的某一个芯片中实现，此外，也可以以程序代码的形式存储于控制器的存储元件中，由处理器的某一个处理元件调用并执行以上各个单元的功能。此外各个单元可以集成在一起，也可以独立实现。这里的处理元件可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个单元可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。该处理元件可以是通用处理器，例如中央处理器(英文：central processing unit，简称：CPU)，还可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(英文：application-specific integrated circuit，简称：ASIC)，或，一个或多个微处理器(英文：digital signal processor，简称：DSP)，或，一个或者多个现场可编程门阵列(英文：field-programmable gate array，简称：FPGA)等。

图10为本申请实施例提供的一种计算机设备的结构示意图，如图10所示，该计算机设备包括：存储器1001、处理器1002、通信接口1003以及总线1004；其中，存储器1001、处理器1002、通信接口1003通过总线1004实现彼此之间的通信连接。通信接口1003用于与自动驾驶装置进行数据交互。

处理器1003通过读取该存储器中存储的该代码以用于执行如下操作：获取N组特征点对，每组特征点对包括两个相匹配的特征点，其中一个特征点为从第一图像提取的特征点，另一个特征点为从第二图像提取的特征点，该第一图像和该第二图像分别为自动驾驶装置在第一时刻和第二时刻采集的图像，N为大于1的整数；利用动态障碍物的运动状态信息对该N组特征点对中目标特征点的像素坐标进行调整，该目标特征点属于该第一图像和/或该第二图像中该动态障碍物对应的特征点，该N组特征点对中除该目标特征点之外的特征点的像素坐标保持不变；根据该N组特征点对中各特征点对应的调整后的像素坐标，确定该第一图像和该第二图像之间的目标匹配关系。

处理器1003通过读取该存储器中存储的该代码以用于执行如下操作：利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标，该第一空间坐标包括第一图像中各特征点对应的空间坐标，该第一特征点为该第一图像中该动态障碍物对应的特征点，该第一图像为自动驾驶装置在第二时刻采集的图像，该运动状态信息包括该自动驾驶装置从第一时刻至该第二时刻的位移和姿态变化；将该第二空间坐标投影至该第一图像以得到第一像素坐标；根据该第一像素坐标和第二像素坐标，计算该第一图像的重投影误差；该第二像素坐标包括该第一图像中各特征点的像素坐标。

在一些实施例中，所公开的方法可以实施为以机器可读格式被编码在计算机可读存储介质上的或者被编码在其它非瞬时性介质或者制品上的计算机程序指令。图11示意性地示出根据这里展示的至少一些实施例而布置的示例计算机程序产品的概念性局部视图，该示例计算机程序产品包括用于在计算设备上执行计算机进程的计算机程序。在一个实施例中，示例计算机程序产品1100是使用信号承载介质1101来提供的。该信号承载介质1101可以包括一个或多个程序指令1102，其当被一个或多个处理器运行时可以提供以上针对图8-图9描述的功能或者部分功能。因此，例如，参考图8中所示的实施例，方框801-804的一个或多个的功能的实现可以由与信号承载介质1101相关联的一个或多个指令来承担。此外，图11中的程序指令1102也描述示例指令。上述程序指令1102被处理器执行时实现：获取N组特征点对，每组特征点对包括两个相匹配的特征点，其中一个特征点为从第一图像提取的特征点，另一个特征点为从第二图像提取的特征点，该第一图像和该第二图像分别为自动驾驶装置在第一时刻和第二时刻采集的图像，N为大于1的整数；利用动态障碍物的运动状态信息对该N组特征点对中目标特征点的像素坐标进行调整，该目标特征点属于该第一图像和/或该第二图像中该动态障碍物对应的特征点，该N组特征点对中除该目标特征点之外的特征点的像素坐标保持不变；根据该N组特征点对中各特征点对应的调整后的像素坐标，确定该第一图像和该第二图像之间的目标匹配关系。

或者，上述程序指令1102被处理器执行时实现：利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标，该第一空间坐标包括第一图像中各特征点对应的空间坐标，该第一特征点为该第一图像中该动态障碍物对应的特征点，该第一图像为自动驾驶装置在第二时刻采集的图像，该运动状态信息包括该自动驾驶装置从第一时刻至该第二时刻的位移和姿态变化；将该第二空间坐标投影至该第一图像以得到第一像素坐标；根据该第一像素坐标和第二像素坐标，计算该第一图像的重投影误差；该第二像素坐标包括该第一图像中各特征点的像素坐标

在一些示例中，信号承载介质1101可以包含计算机可读介质1103，诸如但不限于，硬盘驱动器、紧密盘(CD)、数字视频光盘(DVD)、数字磁带、存储器、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等等。在一些实施方式中，信号承载介质1101可以包含计算机可记录介质1104，诸如但不限于，存储器、读/写(R/W)CD、R/W DVD、等等。在一些实施方式中，信号承载介质1101可以包含通信介质1105，诸如但不限于，数字和/或模拟通信介质(例如，光纤电缆、波导、有线通信链路、无线通信链路、等等)。因此，例如，信号承载介质1101可以由无线形式的通信介质1105(例如，遵守IEEE 602.11标准或者其它传输协议的无线通信介质)来传达。一个或多个程序指令1102可以是，例如，计算机可执行指令或者逻辑实施指令。在一些示例中，诸如针对图1描述的处理器可以被配置为，响应于通过计算机可读介质1103、计算机可记录介质1104、和/或通信介质1105中的一个或多个传达到处理器的程序指令1102，提供各种操作、功能、或者动作。应该理解，这里描述的布置仅仅是用于示例的目的。因而，本领域技术人员将理解，其它布置和其它元素(例如，机器、接口、功能、顺序、和功能组等等)能够被取而代之地使用，并且一些元素可以根据所期望的结果而一并省略。另外，所描述的元素中的许多是可以被实现为离散的或者分布式的组件的、或者以任何适当的组合和位置来结合其它组件实施的功能实体。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

一种匹配关系确定方法，其特征在于，包括：

获取N组特征点对，每组特征点对包括两个相匹配的特征点，其中一个特征点为从第一图像提取的特征点，另一个特征点为从第二图像提取的特征点，所述第一图像和所述第二图像分别为自动驾驶装置在第一时刻和第二时刻采集的图像，N为大于1的整数；

利用动态障碍物的运动状态信息对所述N组特征点对中目标特征点的像素坐标进行调整，所述目标特征点属于所述第一图像和/或所述第二图像中所述动态障碍物对应的特征点，所述N组特征点对中除所述目标特征点之外的特征点的像素坐标保持不变；

根据所述N组特征点对中各特征点对应的调整后的像素坐标，确定所述第一图像和所述第二图像之间的目标匹配关系。
根据权利要求1所述的方法，其特征在于，所述运动状态信息包括所述动态障碍物从所述第一时刻至所述第二时刻的位移；所述利用动态障碍物的运动状态信息对所述N组特征点对中目标特征点的像素坐标进行调整包括：

利用所述位移对参考特征点的像素坐标进行调整，所述参考特征点包含于所述目标特征点，且属于所述第二图像中所述动态障碍物对应的特征点。
根据权利要求1或2所述的方法，其特征在于，所述利用动态障碍物的运动状态信息对所述N组特征点对中目标特征点的像素坐标进行调整之前，所述方法还包括：

确定所述N组特征点对中位于第一投影区域和/或第二投影区域的特征点为所述目标特征点；所述第一投影区域为所述第一图像中所述动态障碍物的图像所处的区域，所述第二投影区域为所述第二图像中所述动态障碍物的图像所处的区域；

获得所述目标特征点对应的像素坐标。
根据权利要求3所述的方法，其特征在于，所述确定所述N组特征点对中位于第一投影区域和/或第二投影区域的特征点为所述目标特征点之前，所述方法还包括：

对第一点云和第二点云进行插值计算以得到目标点云，所述第一点云和所述第二点云分别为所述自动驾驶装置在第三时刻和第四时刻采集的点云，所述目标点云为表征所述动态障碍物在所述第一时刻的特性的点云，所述第三时刻在所述第一时刻之前，所述第四时刻在所述第一时刻之后；

将所述目标点云投影到所述第一图像以得到所述第一投影区域。
根据权利要求1至4任一项所述的方法，其特征在于，所述目标匹配关系为采用随机抽样一致性RANSAC算法确定的所述第一图像和所述第二图像之间的两个或两个以上匹配关系中较优的匹配关系。
根据权利要求5所述的方法，其特征在于，所述根据所述N组特征点对中各特征点对应的调整后的像素坐标，确定所述第一图像和所述第二图像之间的目标匹配关系包括：

根据所述N组特征点对中各特征点对应的调整后的像素坐标，确定所述第一图像和所述第二图像之间的平移矩阵和旋转矩阵。
一种重投影误差计算方法，其特征在于，

利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标，所述第一空间坐标包括第一图像中各特征点对应的空间坐标，所述第一特征点为所述第一图像中所述动态障碍物对应的特征点，所述第一图像为自动驾驶装置在第二时刻采集的图像，所述运动状态信息包括所述自动驾驶装置从第一时刻至所述第二时刻的位移和姿态变化；

将所述第二空间坐标投影至所述第一图像以得到第一像素坐标；

根据所述第一像素坐标和第二像素坐标，计算所述第一图像的重投影误差；所述第二像素坐标包括所述第一图像中各特征点的像素坐标。
根据权利要求7所述的方法，其特征在于，所述根据所述第一像素坐标和第二像素坐标，计算所述第一图像的重投影误差之前，所述方法还包括；

利用所述位移对所述第一图像中所述第一特征点的像素坐标进行调整以得到所述第二像素坐标，所述第一图像中除所述第一特征点之外的特征点的像素坐标均保持不变。
根据权利要求7或8所述的方法，其特征在于，所述利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标之前，所述方法还包括：

获得第二图像中与所述第一特征点相匹配的第二特征点；所述第一图像和所述第二图像分别为所述自动驾驶装置上的第一摄像头和第二摄像头在所述第二时刻采集的图像，所述第一摄像头和所述第二摄像头所处的空间位置不同；

根据所述第一特征点和所述第二特征点，确定第一特征点对应的空间坐标。
根据权利要求7至9任一项所述的方法，其特征在于，所述利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标之前，所述方法还包括：

获得目标点云，所述目标点云为表征所述动态障碍物在所述第二时刻的特性的点云；

将所述目标点云投影到所述第一图像以得到目标投影区域；

确定第一特征点集中位于所述目标投影区域的特征点为所述第一特征点；所述第一特征点集包括的特征点为从所述第一图像提取的特征点，且均与第二特征点集中的特征点相匹配，所述第二特征点集包括的特征点为从第二图像提取的特征点。
一种匹配关系确定装置，其特征在于，包括：

获取单元，用于获取N组特征点对，每组特征点对包括两个相匹配的特征点，其中一个特征点为从第一图像提取的特征点，另一个特征点为从第二图像提取的特征点，所述第一图像和所述第二图像分别为自动驾驶装置在第一时刻和第二时刻采集的图像，N为大于1的整数；

调整单元，用于利用动态障碍物的运动状态信息对所述N组特征点对中目标特征点的像素坐标进行调整，所述目标特征点属于所述第一图像和/或所述第二图像中所述动态障碍物对应的特征点，所述N组特征点对中除所述目标特征点之外的特征点的像素坐标保持不变；

确定单元，用于根据所述N组特征点对中各特征点对应的调整后的像素坐标，确定所述第一图像和所述第二图像之间的目标匹配关系。
根据权利要求11所述的装置，其特征在于，所述运动状态信息包括所述动态障碍物从所述第一时刻至所述第二时刻的位移；

所述调整单元，具体用于利用所述位移对参考特征点的像素坐标进行调整，所述参考特征点包含于所述目标特征点，且属于所述第二图像中所述动态障碍物对应的特征点。
根据权利要求11或12所述的装置，其特征在于，

所述确定单元，还用于确定所述N组特征点对中位于第一投影区域和/或第二投影区域的特征点为所述目标特征点；所述第一投影区域为所述第一图像中所述动态障碍物的图像所处的区域，所述第二投影区域为所述第二图像中所述动态障碍物的图像所处的区域；

所述获取单元，还用于获得所述目标特征点对应的像素坐标。
根据权利要求13所述的装置，其特征在于，

所述确定单元，还用于对第一点云和第二点云进行插值计算以得到目标点云，所述第一点云和所述第二点云分别为所述自动驾驶装置在第三时刻和第四时刻采集的点云，所述目标点云为表征所述动态障碍物在所述第一时刻的特性的点云，所述第三时刻在所述第一时刻之前，所述第四时刻在所述第一时刻之后；所述装置还包括：

投影单元，用于将所述目标点云投影到所述第一图像以得到所述第一投影区域。
根据权利要求11至14任一项所述的装置，其特征在于，所述目标匹配关系为采用随机抽样一致性RANSAC算法确定的所述第一图像和所述第二图像之间的两个或两个以上匹配关系中较优的匹配关系。
根据权利要求15所述的装置，其特征在于，

所述确定单元，具体用于根据所述N组特征点对中各特征点对应的调整后的像素坐标，确定所述第一图像和所述第二图像之间的平移矩阵和旋转矩阵。
一种重投影误差计算装置，其特征在于，包括：

调整单元，用于利用动态障碍物的运动状态信息对第一空间坐标中第一特征点对应的空间坐标进行调整以得到第二空间坐标，所述第一空间坐标包括第一图像中各特征点对应的空间坐标，所述第一特征点为所述第一图像中所述动态障碍物对应的特征点，所述第一图像为自动驾驶装置在第二时刻采集的图像，所述运动状态信息包括所述自动驾驶装置从第一时刻至所述第二时刻的位移和姿态变化；

投影单元，用于将所述第二空间坐标投影至所述第一图像以得到第一像素坐标；

确定单元，用于根据所述第一像素坐标和第二像素坐标，计算所述第一图像的重投影误差；所述第二像素坐标包括所述第一图像中各特征点的像素坐标。
根据权利要求17所述的装置，其特征在于，

所述调整单元，还用于利用所述位移对所述第一图像中所述第一特征点的像素坐标进行调整以得到所述第二像素坐标，所述第一图像中除所述第一特征点之外的特征点的像素坐标均保持不变。
根据权利要求17或18所述的装置，其特征在于，所述装置还包括：

第一获取单元，用于获得第二图像中与所述第一特征点相匹配的第二特征点；所述第一图像和所述第二图像分别为所述自动驾驶装置上的第一摄像头和第二摄像头在所述第二时刻采集的图像，所述第一摄像头和所述第二摄像头所处的空间位置不同；

所述确定单元，还用于根据所述第一特征点和所述第二特征点，确定第一特征点对应的空间坐标。
根据权利要求17至19任一项所述的装置，其特征在于，所述装置还包括：

第二获取单元，用于获得目标点云，所述目标点云为表征所述动态障碍物在所述第二时刻的特性的点云；

所述投影单元，还用于将所述目标点云投影到所述第一图像以得到目标投影区域；

所述确定单元，还用于确定第一特征点集中位于所述目标投影区域的特征点为所述第一特征点；所述第一特征点集包括的特征点为从所述第一图像提取的特征点，且均与第二特征点集中的特征点相匹配，所述第二特征点集包括的特征点为从第二图像提取的特征点。
一种电子设备，其特征在于，包括：

存储器，用于存储程序；

处理器，用于执行所述存储器存储的所述程序，当所述程序被执行时，所述处理器用于执行如权利要求1-10中任一所述的步骤。
一种计算机可读存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-10任一项所述的方法。