WO2021027543A1

WO2021027543A1 - 基于单目图像的模型训练方法、装置及数据处理设备

Info

Publication number: WO2021027543A1
Application number: PCT/CN2020/104924
Authority: WO
Inventors: 刘鹏鹏; 许佳
Original assignee: 广州虎牙科技有限公司
Priority date: 2019-08-15
Filing date: 2020-07-27
Publication date: 2021-02-18
Also published as: US20220270354A1; CN112396074A

Abstract

本申请实施例提供了一种基于单目图像的模型训练方法、装置及数据处理设备，该方法包括首先获取单目图像采集装置在不同时间点采集的第一训练图和第二训练图。然后根据第一训练图及第二训练图之间的光度损失，获得从第一训练图到第二训练图的第一光流预测结果。再将第一光流预测结果作为代理标记，使用第一训练图和第二训练图进行光流预测训练。通过将双目图像匹配看作光流预测的特例，采用代理学习的方式，将不同时间点采集的两个单目图像作为训练样本得到的第一光流预测结果作为代理标注来指导模型进行再次光流预测的学习。如此，可以在不依赖校正好的双目图像样本的情况下实现双目图像立体匹配的自监督学习，使用同一个模型进行预测光流和立体匹配。

Description

基于单目图像的模型训练方法、装置及数据处理设备

相关申请的交叉引用

本申请要求于2019年8月15日提交中国专利局的申请号为2019107538107、名称为“基于单目图像的模型训练方法、装置及数据处理设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机视觉技术领域，具体而言，提供一种基于单目图像的模型训练方法、装置及数据处理设备。

背景技术

双目图像对齐(stereo matching)属于计算机视觉问题，广泛应用于3D数字场景重建、自动驾驶等领域。双目图像对齐的目标是预测像素的位移，即两张双目图像之间的立体视差图。

在处理双目图像对齐问题时，可以利用卷积神经网络(Convolutional Neural Networks,CNN)模型，通过大量的样本对CNN模型进行训练，然后使用训练完成的模型实现双目图像对齐。

由于获得带有正确标注的双目图像训练样本成本比较高，因此在一些实现方式中，可以改为采用合成的仿真图像进行训练，但这种方式训练出的模型对真实图像的识别能力不佳。在另一些实现方式中，可以采用未标记的双目图像，根据预测获得的视差图把右图像扭曲到左图像，然后根据光度量损失来测量扭曲过的右图像和左图像之间的差异，但这种方式仍然需要大量校正好的双目图像，训练成本比较高。

发明内容

本申请的目的在于提供一种基于单目图像的模型训练方法、装置及数据处理设备，可以在不依赖校正好的双目图像样本的情况下实现双目图像立体匹配的自监督学习，使用同一个模型进行预测光流和立体匹配。

为实现上述目的中的至少一个目的，本申请采用的技术方案如下：

本申请实施例提供了一种基于单目图像的模型训练方法，应用于对图像匹配模型进行训练，所述方法包括：

获取单目图像采集装置在不同时间点采集的第一训练图和第二训练图；

根据所述第一训练图及第二训练图之间的光度损失，获得从所述第一训练图到第二训练图的第一光流预测结果；

将所述第一光流预测结果作为代理标记，使用所述第一训练图和第二训练图进行光流预测的代理学习；

将训练好的所述图像匹配模型配置成执行双目图像对齐和光流预测。

本申请实施例还提供了一种基于单目图像的模型训练装置，应用于对图像匹配模型进行训练，所述装置包括：

图像获取单元，被配置成获取单目图像采集装置在不同时间点采集的第一训练图和第二训练图；

第一光流预测模块，被配置成根据所述第一训练图及第二训练图之间的光度损失，获得从所述第一训练图到第二训练图的第一光流预测结果；

第二光流预测模块，被配置成将所述第一光流预测结果作为代理标记，使用所述第一训练图和第二训练图进行光流预测的代理学习。

本申请实施例还提供了一种数据处理设备，其特征在于，包括机器可读存储介质及处理器，所述机器可读存储介质存储有机器可执行指令，所述机器可执行指令在被所述处理器执行时，实现上述的基于单目图像的模型训练方法。

本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现上述的基于单目图像的模型训练方法。

附图说明

图1为本申请实施例提供的数据处理设备的方框示意图；

图2为本申请实施例提供的基于单目图像的模型训练方法的步骤流程示意图；

图3为本申请实施例提供的双目图像对齐原理示意图之一；

图4为本申请实施例提供的双目图像对齐原理示意图之二；

图5为本申请实施例提供的图像匹配模型处理的示意图；

图6为相同数据集上光流预测测试结果对比示意图；

图7为相同数据集上双目图像对齐测试结果对比示意图；

图8为本申请实施例提供的基于单目图像的模型训练装置的模块示意图。

具体实施方式

为更清楚地介绍本申请实施例的目的、技术方案和有益效果，下面将附图对本申请实施例提供的技术方案进行示例性描述。

请参照图1，图1为本申请实施例提供的一种数据处理设备100的硬件结构示意图。在一些实施例中，该数据处理设备100可包括处理器130及机器可读存储介质120。处理器130与机器可读存储介质120可经由系统总线通信。并且，机器可读存储介质120存储有机器可执行指令(如图像模型训练装置110相关的代码指令)，通过读取并执行机器可读存储介质120中与图像模型训练逻辑对应的机器可执行指令，处理器130可执行上文描述的基于单目图像的模型训练方法。

在一些实施例中，本申请中提到的机器可读存储介质120可以是任何电子、磁性、光学或其它物理存储装置，可以包含或存储信息，如可执行指令、数据，等等。例如，机器可读存储介质可以是：RAM(Radom Access Memory，随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等)，或者类似的存储介质，或者它们的组合。

请参照图2，本申请实施例提供的一种基于单目图像的模型训练方法的示意性流程图，以下将对所述方法包括各个步骤进行示例性阐述。

步骤210，获取单目图像采集装置在不同时间点采集的第一训练图和第二训练图。

步骤220，根据所述第一训练图及第二训练图之间的光度损失，获得从所述第一训练图到第二训练图的第一光流预测结果。

步骤230，将所述第一光流预测结果作为代理标记，使用所述第一训练图和第二训练图进行光流预测的代理学习。

在一些实施例中，双目图像对齐一般是从具有水平方向立体视察的两个双目图像中确定同一物体的计算机视觉任务。

光流(opticalflow)预测是一种基于亮度恒定性和空间平滑性假设，根据像素的光度来确定不同帧图像中同一物体的运动的技术。

代理学习(proxy learning)是一种利用创建的附加任务来指导针对目标任务进行学习的策略。

经发明人研究发现，双目图像对齐和光流预测可以看作是一类问题，即图像中对应像素点的匹配问题。两者的主要区别在于，双目图像对齐是一维搜索问题，在校正好的双目图像上，对应像素位于对极线上。而光流预测不具有这种约束，可以视作二维搜索问题。因此，双目图像对齐可以被视为是光流的特殊情况。如果训练出在二维场景能够良好执行像素匹配模型，它就也能够在一维场景上很好地实现像素匹配任务。

因此，在一些实施例中，数据处理设备100通过执行步骤210，可以获取单目图像采集装置在不同时间点采集两个图像作为训练样本对图像匹配模型进行训练。

示例性地，对于双目图像对齐，双目摄像机左右两个摄像机可以同时采集图像，并且两个相机的相对位置一般是固定的，因此，根据该几何特性，在双目图像对齐过程中，针对左图像极线上的像素，其对应的像素应位于右图像的极线上，即这是一维图像匹配问题。

请参照图3，三维场景中的点P在双目图像的左图像中的投影点为像素P _l，右图像中的投影点为像素P _r。当P _l确定时，极线过左图像极点e _l，且P _l位于极线上，则在右图像上与P _l的相应像素P _r也总是位于极线上，并且极线通过右图像极点e _r。其中，O _l和O _r分别是左右摄像机中心，e _l和e _r是极点。

请参照图4，图4示出了双目立体图像校正的示例，左右两个摄像机是平行的，极线是水平的，即双目图像对齐是沿水平线找到匹配的像素。

在一些实施例中，光流一般描述了两个相邻帧之间的密集运动。两个图像在不同时间拍摄，并且这两个帧之间的相机位置和姿势可以改变。光流预测的场景可以为刚性场景或非刚性场景。对于刚性场景，场景中物体没有移动，图像的差异仅因为摄像机的移动(旋转或平移)，则光流预测也可以成为沿着极线的一维图像匹配问题。双目图像是在同一时间不同角度拍摄的画面，双目图像对齐问题可以视作在刚性场景中，摄像机在一个位置拍摄后移动另一位置在此拍摄，然后处理两个图像的光流预测的问题。

由于估算自我运动本身将导致额外的误差并且场景并不总是刚性的，因此，在一些实施例中，可以不考虑摄像机自我运动的问题，仅将双目图像对齐作为光流预测的特殊情况。也就是说，若图像匹配模型能在二维空间中实现良好的光流预测，也应该能够在一维空间中良好地实现双目图像对齐。

因此，在一些实施例中，数据处理设备100在执行步骤220时，在光流预测过程中，数据处理设备100可以根据预测的光流把目标图像扭曲到参照图像，并通过测量翘曲目标图像和参照图像之间的差异来构建光度损失。但是，对于场景中被前景遮挡的物体对应的像素，亮度恒定性假设不再成立，因此，对于被遮挡像素，光度损失可能将导致错误的训练监督。为此，在一些实施例中，在采用光度损失预测光流时可以预先确定并排除被遮挡像素。

其中，可以理解的是，如果一个像素点只在一帧图片中可见，而在另一帧图片中不可见，那么该像素点就是被遮挡的。像素点被遮挡可能存在多种原因，比如物体发生运动或者是摄像头发生运动等，都有可能导致像素点被遮挡。例如在一些可能的应用场景中，第一帧中某个物体正面朝前，摄像头拍到的是这个物体的前面部分；而在第二帧中，物体旋转变成朝后，那么摄像头只能捕捉到物体的后面的部分，如此，第一帧中物体的前半部分在第二帧中不可见，就是遮挡的。

示例性地，在一些实施例中，数据处理设备100可以根据所述第一训练图及第二训练图之间的光度损失，获得从第一训练图到第二训练图的初始光流图和初始置信度图，然后根据所述初始光流图和初始置信度图，获得排除被遮挡像素之后的所述第一光流预测结果其中，所述初始光流图可以指示对应的像素点在所述第一训练图到所述第二训练图之间的位移量；所述第一光流预测结果可以指示未被遮挡的像素点在所述第一训练图到所述第二训练图之间的位移量。

另外，所述初始置信度图可以被配置成指示对应像素点的遮挡状态，例如，所述初始置信度图中被遮挡像素的置信度可以被设置为0，未被遮挡像素的置信度可以被设置为1。然后根据所述初始光流图和初始置信度图，获得所述第一光流预测结果。

由于被遮挡像素的置信度为0，当初始光流图与初始置信度图相乘时，即从所述初始光流图中剔除了被遮挡像素的数据，从而获得了未被遮挡的像素组成的高置信度的光流图。

可选地，在一些实施例中，数据处理设备100可以采用前向-后向光度检测对所述初始光流图进行处理，根据光度差异确定各像素点对应的置信度得到所述置信度图。其中，数据处理设备100可以将光度差异超过预设阈值的像素的置信度设置为0，作为被遮挡的像素；数据处理设备100可以将光度差异未超过预设阈值的像素的置信度设置为1，作为未被遮挡的像素。

在一些实施例中，数据处理设备100在进行前向-后向光度检测时，可以获得所述第一训练图I _t到第二训练图I _t+1的初始光流图上像素p的前向光流F _t→t+1(p)及后向光流 F′ _t→t+1(p)，其中，F′ _t→t+1(p)＝F _t+1→t(p+F _t→t+1(p))，F _t+1→t为所述第二训练图到第一训练图的初始光流。

数据处理设备100可以按照以下公式根据所述像素p的前向光流和后向光流获得像素p的置信度图M _t→t+1(p)，

其中，p表示像素点，δ(p)＝0.1(|F _t→t+1(p)+F′ _t→t+1(p)|)+0.05。

另外，在一些实施例中，数据处理设备100还可以交换第一训练图和第二训练图来进行训练，以获得第二训练图到第一训练图的反向光流图。

其中，数据处理设备100在执行步骤220时，可以根据预设的光度损失函数和平滑度损失函数进行从所述第一训练图到第二训练图的光流预测，获得所述第一光流预测结果。

示例性地，所述光度损失函数L _p可以表示为：

其中，p表示像素点，

为将所述第一训练图I _t使用Census变化后获得的图像，

为根据所述第一训练图到所述第二训练图的正向光流将

扭曲到

获得的扭曲图像，Hamming(x)为汉明距离。

所述平滑度损失函数L _m的形式可以为：

其中，I(p)为所述第一训练图或第二训练图上的像素点，N是所述第一训练图或第二训练图的像素总数，

表示梯度，T表示转置，I(p)为第一训练图或第二训练图上的像素点，F(p)为当前处理的光流图上的点。

数据处理设备100在执行步骤220时，可以使用L _p+λL _m作为损失函数训练所述图像匹配模型，其中，λ＝0.1。

此外，在上述步骤230中，由于即使只有稀疏的正确标记，CNN也可以在KITTI数据集上学习到较好的光流预测。因此，在一些实施例中，数据处理设备100可以先通过执行步骤220获得稀疏的高置信度的光流预测，然后将它们用作代理标记来指导图像匹配预测的学习。

请参照图5，在一些实施例中，数据处理设备100可以将所述第一光流预测结果作为代理标记，使用预设的代理自监督损失函数和平滑度损失函数，执行从所述第一训练图到第二训练图的光流预测。

示例性地，所述代理自监督损失函数L _s的形式可以为：

其中，p表示像素点，F ^py为所述初始光流图，M ^py为所述初始置信度图，F为当前处理的光流图。

数据处理设备100在执行步骤230时，可以使用L _S+λL _m作为损失函数训练所述图像匹配模型，其中，λ＝0.1。

需要说明的是，与执行步骤220的训练过程不同，数据处理设备100在执行步骤230时，可以不再执行对未被遮挡像素的剔除动作，以使模型能够预测被遮挡区域的光流。

可选地，在一些实施例中，在数据处理设备100执行步骤230时，可以随机地先对所述第一训练图和第二训练图进行相同的预处理，比如在一些实施例中，该预处理可以是对所述第一训练图和所述第二训练图进行相同位置和相同大小的剪裁，或者是进行相同的随机降采样，又或者是其他一些实施例中，该预处理可以是对所述第一训练图和所述第二训练图进行相同位置和相同大小的剪裁，以及进行相同的随机降采样；然后，数据处理设备100可以使用预处理后的第一训练图和第二训练图执行步骤230的训练，从而可以同时提高遮挡点以及被遮挡点光流预测准确率的效果。

可选地，在一些实施例中，在数据处理设备100执行步骤230时，也可以先对所述第一训练图和第二训练图进行相同系数的随机缩放或相同角度的随机旋转，然后使用处理后的第一训练图和第二训练图执行步骤230的训练。

需要说明的是，在本申请其他一些可能的实施方式中，数据处理设备100也可以采用其他方法可以获得高置信度的光流预测。例如，采用传统方法来计算可靠的视差。

在一些场景中，模型最终需要执行的是光流预测，因此采用数据处理设备100通过步骤220获取到光流预测结果和置信度图，然后在执行步骤230时使用高置信度的光流预测作为代理基础事实来指导神经网络学习图像匹配，可在一个模型中完成上述训练过程。

在一些实施例中，经过代理学习之后，高置信度像素的数量将会增加，因此数据处理设备100执行步骤230之后，还可以使用代理学习获得的第二光流预测结果进行迭代训练，以改善所述图像匹配模型的识别能力。

需要说明的是，通过本申请实施例提供的方法训练获得的图像匹配模型，既可以被配置成进行光流预测，也可以被配置成进行双目图像对齐。当训练好的所述图像匹配模型在进行光流预测时，可以将不同时间点采集的第一训练图I _t到第二训练图I _t+1作为输入，输出I _t到I _t+1的光流图。在将训练好的所述图像匹配模型被配置成双目图像对齐时，则可以将双目图像中左右摄像机采集的图像I _l和I _r作为输入，并获得输出的图像I _l到I _r的立体视差图作为匹配结果。

在一些实施例中，可以使用Adam优化器在TensorFlow系统上建立所述图像匹配模型，并将模型的批量大小设置为4，初始学习率为1e-4，每60k迭代将其衰减一半。在训练期间，可以将标准化的图像为输入并进行例如随机剪裁、缩放或旋转等方式进行数据增强。示例性地，裁剪大小可以设置为[256,640]像素大小，随机缩放系数范围可以设置为[0.75,1.25]。

另外，在数据处理设备100执行步骤220时，可以将光度损失应用于所有像素，并使用光度损失训练所述图像匹配模型，从头开始进行100k次迭代。需要注意的是，在开始时，可以不区分高置信度像素和低置信度像素，因为直接只将光度损失应用于高置信度像素可能会得出所有像素被视为低置信度像素的明显解。之后，运用光度损失函数L _p和平滑度损失函数L _m进行400k次迭代来训练所述图像匹配模型。在数据处理设备100执行步骤230时，可以使用代理自监督损失函数L _s和平滑度损失函数L _m进行400k迭代以训练所述图像匹配模型。

图6示出了在使用KITTI 2012数据集和KITTI 2015数据集上，使用其他模型与使用本申请实施例提供的方法训练出的图像匹配模型进行光流预测的测试结果，从图6可见，采用本申请实施例提供的基于单目图像的模型训练方法训练出的图像匹配模型(“Our+proxy”项)的识别能力明显优于例如MultiFrameOccFlow和DDFlow等无监督方法训练出的模型。

图7示出了在使用KITTI 2012数据集和KITTI 2015数据集上，使用其他模型与使用本申请实施例提供的方法训练出的图像匹配模型进行双目图像对齐的测试结果，从图7可见，本申请实施例提供的基于单目图像的模型训练方法训练出的图像匹配模型(“Our+proxy+ft”项)的识别能力明显优于其他的无监督方法训练出的模型。

请参照图8，本申请实施例还提供一种基于单目图像的模型训练装置110，所述装置包括图像获取模块111、第一光流预测模块112及第二光流预测模块113。

所述图像获取单元111被配置成获取单目图像采集装置在不同时间点采集的第一训练图和第二训练图。

所述第一光流预测模块112被配置成根据所述第一训练图及第二训练图之间的光度损失，获得从所述第一训练图到第二训练图的第一光流预测结果；

所述第二光流预测模块113被配置成将所述第一光流预测结果作为代理标记，使用所述第一训练图和第二训练图进行光流预测的代理学习。

综上所述，本申请提供的基于单目图像的模型训练方法、装置及图像处理设备，通过将双目图像匹配看作光流预测的特例，采用代理学习的方式，将不同时间点采集的两个单目图像作为训练样本得到的第一光流预测结果作为代理标记，被配置成指导模型进行再次光流预测的学习。如此，可以在不依赖校正好的双目图像样本的情况下双目图像立体匹配的自监督学习，使用同一个模型进行预测光流和立体匹配。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个被配置成实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

工业实用性

通过将双目图像匹配看作光流预测的特例，采用代理学习的方式，将不同时间点采集的两个单目图像作为训练样本得到的光流预测结果作为代理标记，以指导模型进行再次光流预测的学习。如此，可以在不依赖校正好的双目图像样本的情况下实现双目图像立体匹配的自监督学习，使用同一个模型进行预测光流和立体匹配。

Claims

一种基于单目图像的模型训练方法，其特征在于，应用于对图像匹配模型进行训练，所述方法包括：

获取单目图像采集装置在不同时间点采集的第一训练图和第二训练图；

根据所述第一训练图及第二训练图之间的光度损失，获得从所述第一训练图到第二训练图的第一光流预测结果；

将所述第一光流预测结果作为代理标记，使用所述第一训练图和第二训练图进行光流预测的代理学习；

将训练好的所述图像匹配模型配置成执行双目图像对齐和光流预测。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

将待处理的双目图像输入训练好的所述图像匹配模型；

获得所述图像匹配模型针对所述待处理的双目图像输出的立体视差图。
根据权利要求1所述的方法，其特征在于，所述获得从所述第一训练图到第二训练图的第一光流预测结果的步骤，包括：

根据所述第一训练图及第二训练图之间的光度损失，获得从第一训练图到第二训练图的初始光流图和初始置信度图；

根据所述初始光流图和初始置信度图，获得排除被遮挡像素之后的所述第一光流预测结果。
根据权利要求3所述的方法，其特征在于，获得所述初始置信度图的方式，包括：

采用前向-后向光度检测对所述初始光流图进行处理，根据光度差异确定各像素点对应的置信度得到所述置信度图；

其中，将光度差异超过预设阈值的像素的置信度设置为0，作为被遮挡的像素；将光度差异未超过预设阈值的像素的置信度设置为1，作为未被遮挡的像素。
根据权利要求4所述的方法，其特征在于，所述采用前向-后向光度检测对所述初始光流图进行处理，根据光度差异确定各像素点对应的置信度得到所述置信度图，包括：

获得所述第一训练图I _t到第二训练图I _t+1的初始光流图上像素p的前向光流F _t→t+1(p)及后向光流F′ _t→t+1(p)，其中，F′ _t→t+1(p)＝F _t+1→t(p+F _t→t+1(p))，F _t+1→t为所述第二训练图到第一训练图的初始光流；

按照以下公式根据所述像素p的前向光流和后向光流获得像素p的置信度图M _t→t+1(p)，

其中，δ(p)＝0.1(|F _t→t+1(p)+F′ _t→t+1(p)|)+0.05。
根据权利要求5所述的方法，其特征在于，所述根据所述初始光流图和初始置信度图，获得所述第一光流预测结果的步骤，包括：

根据预设的光度损失函数和平滑度损失函数进行从所述第一训练图到第二训练图的光流预测，获得所述第一光流预测结果。
根据权利要求6所述的方法，其特征在于，所述光度损失函数L _p的形式为：

其中，
为将所述第一训练图I _t使用Census变化后获得的图像，
为根据所述第一训练图到所述第二训练图的正向光流将
扭曲到
获得的扭曲图像，Hamming(x)为汉明距离。
根据权利要求6所述的方法，其特征在于，所述平滑度损失函数L _m的形式为：

其中，I(p)为所述第一训练图或第二训练图上的像素点，N是所述第一训练图或第二训练图的像素总数，
表示梯度，T表示转置，I(p)为第一训练图或第二训练图上的像素点，F(p)为当前处理的光流图上的点。
根据权利要求5所述的方法，其特征在于，将所述第一光流预测结果作为代理标记，使用所述第一训练图和第二训练图进行光流预测的代理学习的步骤，包括：

将所述第一光流预测结果作为代理标记，使用预设的代理自监督损失函数和平滑度损失函数，执行从所述第一训练图到第二训练图的光流预测。
根据权利要求9所述的方法，其特征在于，所述代理自监督损失函数L _s的形式为：

其中，F ^py为所述初始光流图，M ^py为所述初始置信度图，F为当前处理的光流图。
根据权利要求9所述的方法，其特征在于，所述将所述第一光流预测结果作为代理标记，使用预设的代理自监督损失函数和平滑度损失函数，执行从所述第一训练图到第二训练图的光流预测训练的步骤，包括：

对所述第一训练图及所述第二训练图进行相同的预处理；其中，所述预处理包括随机剪裁和/或随机降采样；

将所述第一光流预测结果作为代理标记，使用预处理后的第一训练图及第二训练图进行图像元素匹配的机器学习训练。
根据权利要求9所述的方法，其特征在于，所述将所述第一光流预测结果作为代理标记，使用预设的代理自监督损失函数和平滑度损失函数，执行从所述第一训练图到第二训练图的光流预测训练的步骤，包括：

对所述第一训练图和第二训练图进行相同的预处理；其中，所述预处理包括系数的随机缩放或角度的随机旋转；

将所述第一光流预测结果作为代理标记，使用预处理后的第一训练图及第二训练图进行图像元素匹配的机器学习训练。
根据权利要求1所述的方法，其特征在于，所述将所述第一光流预测结果作为代理标记，使用所述第一训练图和第二训练图进行光流预测的代理学习的步骤之后，所述方法还包括：

使用代理学习获得的第二光流预测结果进行迭代训练。
一种基于单目图像的模型训练装置，其特征在于，应用于对图像匹配模型进行训练，所述装置包括：

图像获取单元，被配置成获取单目图像采集装置在不同时间点采集的第一训练图和第二训练图；

第一光流预测模块，被配置成根据所述第一训练图及第二训练图之间的光度损失，获得从所述第一训练图到第二训练图的第一光流预测结果；

第二光流预测模块，被配置成将所述第一光流预测结果作为代理标记，使用所述第一训练图和第二训练图进行光流预测的代理学习。
一种数据处理设备，其特征在于，包括机器可读存储介质及处理器，所述机器可读存储介质存储有机器可执行指令，所述机器可执行指令在被所述处理器执行时，实现权利要求1-13任意一项所述的方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现如权利要求1-13任意一项所述的方法。