CN114049510A - 基于损失函数的双目相机立体匹配算法、系统和智能终端 - Google Patents

基于损失函数的双目相机立体匹配算法、系统和智能终端 Download PDF

Info

Publication number
CN114049510A
CN114049510A CN202111248618.6A CN202111248618A CN114049510A CN 114049510 A CN114049510 A CN 114049510A CN 202111248618 A CN202111248618 A CN 202111248618A CN 114049510 A CN114049510 A CN 114049510A
Authority
CN
China
Prior art keywords
loss function
eye image
similarity
binocular camera
stereo matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111248618.6A
Other languages
English (en)
Inventor
刘永才
杨超
葛方海
王鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Smarter Eye Technology Co Ltd
Original Assignee
Beijing Smarter Eye Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Smarter Eye Technology Co Ltd filed Critical Beijing Smarter Eye Technology Co Ltd
Priority to CN202111248618.6A priority Critical patent/CN114049510A/zh
Publication of CN114049510A publication Critical patent/CN114049510A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于损失函数的双目相机立体匹配算法、系统和智能终端,所述方法包括:获取双目相机的左目图像和右目图像;提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数;提取所述左目图像和所述右目图像的整体相似度,并以所述整体相似度的最大值作为第二损失函数;对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数;基于所述联合损失函数对双目相机进行立体匹配。解决了现有技术中由于真值采集依赖性强而导致的双目匹配算法的结果准确性和泛化能力较差的技术问题。

Description

基于损失函数的双目相机立体匹配算法、系统和智能终端
技术领域
本发明涉及立体匹配算法技术领域,具体涉及一种基于损失函数的双目相机立体匹配算法、系统和智能终端。
背景技术
双目相机是指对符合人眼工学的硬连接的两个摄像头,在工作过程中,双目相机拍摄同一场景的左、右两幅视点图像,需要运用立体匹配算法获取视差图,进而获取深度图。因此,双目相机的立体匹配算法的输出结果准确性直接影响到深度图的效果和准确性。
在现有技术中,利用监督学习的深度学习算法实现立体匹配算法,该算法在训练过程需要数据集的距离真值;理论上获取足够多的距离真值,可以实现监督方案的落地。但是,首先,由于获取距离真值时,对场景(包括相机采集到的实际物理场景,也包括镜头本身的参数)的依赖性比较大,导致算法不具备泛化能力。同时,由于需要测量图像上每个像素点的距离真值,因此,获取距离真值的困难度比较大。并且,在工作过程中需要利用激光雷达等传感器采集真值,无法满足获取相机对应的每个像素的距离真值,需要后期加入人工处理,而且多传感器(激光、相机)的融合本身也不稳定,导致数据采集的准确性较差。
发明内容
为此,本发明实施例提供一种基于损失函数的双目相机立体匹配算法、系统和智能终端,以至少部分解决现有技术中由于真值采集依赖性强而导致的双目匹配算法的结果准确性较差的技术问题。
为了实现上述目的,本发明实施例提供如下技术方案:
一种基于损失函数的双目相机立体匹配算法,所述方法包括:
获取双目相机的左目图像和右目图像;
提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数;
提取所述左目图像和所述右目图像的整体相似度,并以所述整体相似度的最大值作为第二损失函数;
对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数;
基于所述联合损失函数对双目相机进行立体匹配。
进一步地,利用残差网络作为第一层网络,通过所述第一层网络计算所述第一损失函数。
进一步地,所述提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数,具体包括:
提取所述左目图像和所述右目图像每个像素的特征向量;
针对所述左目图像中每个像素点可能视差,在所述右目图像中找到相应像素点的位置,并计算该组对应像素点的特征向量的余弦相似度;
基于所述特征向量的余弦相似度计算单点相似度,并将所述单点相似度作为第一损失函数。
进一步地,所述基于所述特征向量的余弦相似度计算单点相似度,具体包括:
利用以下公式计算单点相似度:
Figure 874844DEST_PATH_IMAGE001
其中:
Figure 447776DEST_PATH_IMAGE002
其中,X,Y为左图和右图中的像素值,R,C为邻域大小,则
Figure 227514DEST_PATH_IMAGE003
为左图和右图的平均灰度值,
Figure 91564DEST_PATH_IMAGE004
为左图和右图的灰度值方差,
Figure 905937DEST_PATH_IMAGE005
为左图和右图的协方差,
Figure 384191DEST_PATH_IMAGE006
为经验参数。
进一步地,将所述单点相似度作为第一损失函数,具体包括:
将所述单点相似度作为第一损失函数。
进一步地,利用带有可变形卷积的残差网络作为第二层网络,通过所述第二层网络计算所述第二损失函数。
进一步地,所述对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数,具体包括:
利用以下公式计算所述联合损失函数:
Figure 651225DEST_PATH_IMAGE007
其中,
Figure 850125DEST_PATH_IMAGE008
Figure 191107DEST_PATH_IMAGE009
为联合损失函数的权重,且在模型训练的初始阶段,
Figure 184471DEST_PATH_IMAGE010
,在模型训练的调优阶段
Figure 938801DEST_PATH_IMAGE011
本发明还提供一种基于损失函数的双目相机立体匹配系统,所述系统包括:
图像获取单元,用于获取双目相机的左目图像和右目图像;
第一损失函数获取单元,用于提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数;
第二损失函数获取单元,用于提取所述左目图像和所述右目图像的整体相似度,并以所述整体相似度的最大值作为第二损失函数;
联合损失函数获取单元,用于对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数;
图像立体匹配单元,用于基于所述联合损失函数对双目相机进行立体匹配。
本发明还提供一种智能终端,所述智能终端包括:数据采集装置、处理器和存储器;
所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行如上所述的方法。
本发明还提供一种计算机可读存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行如上所述的方法。
本发明所提供的基于损失函数的双目相机立体匹配算法、系统和智能终端,通过提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数,提取所述左目图像和所述右目图像的整体相似度,并以所述整体相似度的最大值作为第二损失函数,对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数,基于所述联合损失函数对双目相机进行立体匹配。该算法利用双层深度学习网络级联的方式实现双目立体匹配,不依赖数据集的距离真值,减少了人工标注需求,提高了算法准确性,且此损失函数关注的是数据整体的匹配度,不依赖于距离真值的检测准确性,具备很强的泛化能力。解决了现有技术中由于真值采集依赖性强而导致的双目匹配算法的结果准确性和泛化能力较差的技术问题。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
图1为本发明所提供的基于损失函数的双目相机立体匹配算法一种具体实施方式的流程图;
图2为图1所示方法中第一层网络残差块的结构框图;
图3为图1所示方法中第二层网络残差块的结构框图;
图4为本发明所提供的基于损失函数的双目相机立体匹配算法一种具体实施方式的结构框图;
图5为模型训练初始阶段的原图;
图6为模型训练初始阶段的对应效果图;
图7为模型训练调优阶段的对应效果图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
发明所提供的双目相机立体匹配算法基于损失函数,其以联合损失函数为参数,使得基于自监督的深度学习方案可以实现立体匹配算法,符合车载市场的需求,且证明了双目视觉方案适合用自监督的深度学习方案,实现立体匹配算法。尤为重要的是,该算法不依赖数据集的距离真值,减少了人工标注需求,简化了任务难度,避免了距离真值依赖导致的算法准确性差的问题,且此损失函数关注的是数据整体的匹配度,具备很强的泛化能力,基本不需要修改深度学习的推理逻辑,具备较强的基于深度学习芯片的落地能力。
请参考图1,图1为本发明所提供的基于损失函数的双目相机立体匹配算法一种具体实施方式的流程图。
在一种具体实施方式中,本发明所提供的是利用双层深度学习网络级联的方式实现双目立体匹配算法。其中,第一层为提取左右相机图像上单个像素点的相似度,第二层为提取图像上像素整体相似的概率程度。
如图1所示,本发明所提供的基于损失函数的双目相机立体匹配算法包括以下步骤:
S1:获取双目相机的左目图像和右目图像。
S2:提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数。
具体地,在该实施例中,利用残差网络作为第一层网络,通过所述第一层网络计算所述第一损失函数。
当采用残差网络计算第一损失函数时,所述提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数,具体包括以下步骤:
S21:提取所述左目图像和所述右目图像每个像素的特征向量。
在一个具体使用场景中,可以选用残差网络(ResNet)作为第一层网络,残差块的框图如图2所示,级联了50个残差块提取左图和右图每个像素的特征向量。
S22:针对所述左目图像中每个像素点可能视差,在所述右目图像中找到相应像素点的位置,并计算该组对应像素点的特征向量的余弦相似度。
仍以上述使用场景为例,针对左图中每个像素点可能视差(d),在右图中找到相应点的位置,通过公式(1)计算特征向量的余弦相似度(CS):
Figure 675812DEST_PATH_IMAGE012
其中,x,y为左图和右图的特征向量,i为向量下标。
S23:基于所述特征向量的余弦相似度计算单点相似度,并将所述单点相似度作为第一损失函数,具体地,为了提高计算精度,将所述单点相似度的最大值作为第一损失函数,即用单个像素的结构相似程度(SSIM)作为相似度的损失函数(L1),如公式(2):
Figure 730356DEST_PATH_IMAGE013
其中,在步骤S22中,利用以下公式计算单点相似度:
Figure 160200DEST_PATH_IMAGE014
其中,X,Y为左图和右图中的像素值,R,C为邻域大小,则
Figure 401826DEST_PATH_IMAGE003
为左图和右图的平均灰度值,
Figure 676950DEST_PATH_IMAGE004
为左图和右图的灰度值方差,
Figure 241792DEST_PATH_IMAGE005
为左图和右图的协方差,
Figure 576958DEST_PATH_IMAGE006
为经验参数,一般取
Figure 305880DEST_PATH_IMAGE015
为0.02,取
Figure 915853DEST_PATH_IMAGE016
为0.04。
S3:提取所述左目图像和所述右目图像的整体相似度,并以所述整体相似度的最大值作为第二损失函数。
在该具体实施方式中,利用带有可变形卷积的残差网络作为第二层网络,通过所述第二层网络计算所述第二损失函数。
在上述具体使用场景中,第二层网络选用加入可变形卷积的残差网络的形式,提取左图和右图的整体相似度。其中,残差块的框图如图4所示,加入可变形卷积使得相似度在邻近内有一定的传播效果,第二次网络的损失函数(L2)是使得图像整体像素的相似度最大,如公式(3):
Figure 413830DEST_PATH_IMAGE017
S4:对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数。
具体地,利用以下公式计算所述联合损失函数:
Figure 185477DEST_PATH_IMAGE007
其中,α和β为联合损失函数的权重,通过设置不同权重值,以便提供最优的损失函数值。建议在模型训练的初始阶段α>β,在模型训练的调优阶段α<β,即根据训练阶段的不同特点,如图5所示原图,训练的初始阶段,设置α为0.8,β为0.2,对应效果如图6所示;训练的调优阶段设置α为0.2,β为0.8,效果如图7所示。
S5:基于所述联合损失函数对双目相机进行立体匹配。
在上述具体实施方式中,本发明所提供的基于损失函数的双目相机立体匹配算法,通过提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数,提取所述左目图像和所述右目图像的整体相似度,并以所述整体相似度的最大值作为第二损失函数,对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数,基于所述联合损失函数对双目相机进行立体匹配。该算法利用双层深度学习网络级联的方式实现双目立体匹配,不依赖数据集的距离真值,减少了人工标注需求,提高了算法准确性,且此损失函数关注的是数据整体的匹配度,不依赖于距离真值的检测准确性,具备很强的泛化能力。解决了现有技术中由于真值采集依赖性强而导致的双目匹配算法的结果准确性和泛化能力较差的技术问题。
除了上述算法,本发明还提供一种基于损失函数的双目相机立体匹配系统,如图4所示,所述系统包括:
图像获取单元100,用于获取双目相机的左目图像和右目图像;
第一损失函数获取单元200,用于提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数;
第二损失函数获取单元300,用于提取所述左目图像和所述右目图像的整体相似度,并以所述整体相似度的最大值作为第二损失函数;
联合损失函数获取单元400,用于对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数;
图像立体匹配单元500,用于基于所述联合损失函数对双目相机进行立体匹配。
在一种具体实施方式中,本发明所提供的基于损失函数的双目相机立体匹配系统,通过提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数,提取所述左目图像和所述右目图像的整体相似度,并以所述整体相似度的最大值作为第二损失函数,对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数,基于所述联合损失函数对双目相机进行立体匹配。该算法利用双层深度学习网络级联的方式实现双目立体匹配,不依赖数据集的距离真值,减少了人工标注需求,提高了算法准确性,且此损失函数关注的是数据整体的匹配度,不依赖于距离真值的检测准确性,具备很强的泛化能力。解决了现有技术中由于真值采集依赖性强而导致的双目匹配算法的结果准确性和泛化能力较差的技术问题。
本发明还提供一种智能终端,所述智能终端包括:数据采集装置、处理器和存储器;
所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行如上所述的方法。
与上述实施例相对应的,本发明实施例还提供了一种计算机存储介质,该计算机存储介质中包含一个或多个程序指令。其中,所述一个或多个程序指令用于被一种双目相机深度标定系统执行如上所述的方法。
在本发明实施例中,处理器可以是一种集成电路芯片,具有信号的处理能力。处理器可以是通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific工ntegrated Circuit,简称ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。处理器读取存储介质中的信息,结合其硬件完成上述方法的步骤。
存储介质可以是存储器,例如可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
其中,非易失性存储器可以是只读存储器(Read-Only Memory,简称ROM)、可编程只读存储器(Programmable ROM,简称PROM)、可擦除可编程只读存储器(Erasable PROM,简称EPROM)、电可擦除可编程只读存储器(Electrically EPROM,简称EEPROM)或闪存。
易失性存储器可以是随机存取存储器(Random Access Memory,简称RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,简称SRAM)、动态随机存取存储器(Dynamic RAM,简称DRAM)、同步动态随机存取存储器(Synchronous DRAM,简称SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,简称DDRSDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM,简称ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,简称SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,简称DRRAM)。
本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件与软件组合来实现。当应用软件时,可以将相应功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (10)

1.一种基于损失函数的双目相机立体匹配算法,其特征在于,所述方法包括:
获取双目相机的左目图像和右目图像;
提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数;
提取所述左目图像和所述右目图像的整体相似度,并以所述整体相似度的最大值作为第二损失函数;
对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数;
基于所述联合损失函数对双目相机进行立体匹配。
2.根据权利要求1所述的双目相机立体匹配算法,其特征在于,利用残差网络作为第一层网络,通过所述第一层网络计算所述第一损失函数。
3.根据权利要求2所述的双目相机立体匹配算法,其特征在于,所述提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数,具体包括:
提取所述左目图像和所述右目图像每个像素的特征向量;
针对所述左目图像中每个像素点可能视差,在所述右目图像中找到相应像素点的位置,并计算该组对应像素点的特征向量的余弦相似度;
基于所述特征向量的余弦相似度计算单点相似度,并将所述单点相似度作为第一损失函数。
4.根据权利要求3所述的双目相机立体匹配算法,其特征在于,所述基于所述特征向量的余弦相似度计算单点相似度,具体包括:
利用以下公式计算单点相似度:
Figure 784518DEST_PATH_IMAGE001
其中,X,Y为左图和右图中的像素值,R,C为邻域大小,则
Figure 369083DEST_PATH_IMAGE002
为左图和右图的平均灰度值,
Figure 208863DEST_PATH_IMAGE003
为左图和右图的灰度值方差,
Figure 690240DEST_PATH_IMAGE004
为左图和右图的协方差,
Figure 248261DEST_PATH_IMAGE005
为经验参数。
5.根据权利要求4所述的双目相机立体匹配算法,其特征在于,将所述单点相似度作为第一损失函数,具体包括:
将所述单点相似度作为第一损失函数。
6.根据权利要求1所述的双目相机立体匹配算法,其特征在于,利用带有可变形卷积的残差网络作为第二层网络,通过所述第二层网络计算所述第二损失函数。
7.根据权利要求1所述的双目相机立体匹配算法,其特征在于,所述对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数,具体包括:
利用以下公式计算所述联合损失函数:
Figure 370937DEST_PATH_IMAGE006
其中,α和β为联合损失函数的权重,且在模型训练的初始阶段,
Figure 330803DEST_PATH_IMAGE007
,在模型训练的调优阶段
Figure 982364DEST_PATH_IMAGE008
8.一种基于损失函数的双目相机立体匹配系统,其特征在于,所述系统包括:
图像获取单元,用于获取双目相机的左目图像和右目图像;
第一损失函数获取单元,用于提取所述左目图像的像素点和所述右目图像的像素点,并计算每个像素点的单点相似度,以所述单点相似度作为第一损失函数;
第二损失函数获取单元,用于提取所述左目图像和所述右目图像的整体相似度,并以所述整体相似度的最大值作为第二损失函数;
联合损失函数获取单元,用于对所述第一损失函数和所述第二损失函数进行加权求和,以得到联合损失函数;
图像立体匹配单元,用于基于所述联合损失函数对双目相机进行立体匹配。
9.一种智能终端,其特征在于,所述智能终端包括:数据采集装置、处理器和存储器;
所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行如权利要求1-7任一项所述的方法。
CN202111248618.6A 2021-10-26 2021-10-26 基于损失函数的双目相机立体匹配算法、系统和智能终端 Pending CN114049510A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111248618.6A CN114049510A (zh) 2021-10-26 2021-10-26 基于损失函数的双目相机立体匹配算法、系统和智能终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111248618.6A CN114049510A (zh) 2021-10-26 2021-10-26 基于损失函数的双目相机立体匹配算法、系统和智能终端

Publications (1)

Publication Number Publication Date
CN114049510A true CN114049510A (zh) 2022-02-15

Family

ID=80205838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111248618.6A Pending CN114049510A (zh) 2021-10-26 2021-10-26 基于损失函数的双目相机立体匹配算法、系统和智能终端

Country Status (1)

Country Link
CN (1) CN114049510A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109658443A (zh) * 2018-11-01 2019-04-19 北京华捷艾米科技有限公司 立体视觉匹配方法及系统
CN110148179A (zh) * 2019-04-19 2019-08-20 北京地平线机器人技术研发有限公司 一种训练用于估计图像视差图的神经网络模型方法、装置及介质
CN111368882A (zh) * 2020-02-20 2020-07-03 南京信息工程大学 一种基于简化独立成分分析和局部相似性的立体匹配方法
CN112233170A (zh) * 2019-06-27 2021-01-15 阿里巴巴集团控股有限公司 视觉定位和图像处理方法、设备及存储介质
KR20210058683A (ko) * 2019-11-14 2021-05-24 삼성전자주식회사 깊이 맵 생성 방법 및 장치
CN113393510A (zh) * 2020-03-12 2021-09-14 武汉Tcl集团工业研究院有限公司 一种图像处理方法、智能终端及存储介质
CN113409364A (zh) * 2021-06-01 2021-09-17 诡谷子人工智能科技(深圳)有限公司 一种基于像素相似性的立体匹配算法、系统和计算机介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109658443A (zh) * 2018-11-01 2019-04-19 北京华捷艾米科技有限公司 立体视觉匹配方法及系统
CN110148179A (zh) * 2019-04-19 2019-08-20 北京地平线机器人技术研发有限公司 一种训练用于估计图像视差图的神经网络模型方法、装置及介质
CN112233170A (zh) * 2019-06-27 2021-01-15 阿里巴巴集团控股有限公司 视觉定位和图像处理方法、设备及存储介质
KR20210058683A (ko) * 2019-11-14 2021-05-24 삼성전자주식회사 깊이 맵 생성 방법 및 장치
CN111368882A (zh) * 2020-02-20 2020-07-03 南京信息工程大学 一种基于简化独立成分分析和局部相似性的立体匹配方法
CN113393510A (zh) * 2020-03-12 2021-09-14 武汉Tcl集团工业研究院有限公司 一种图像处理方法、智能终端及存储介质
CN113409364A (zh) * 2021-06-01 2021-09-17 诡谷子人工智能科技(深圳)有限公司 一种基于像素相似性的立体匹配算法、系统和计算机介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张亚茹: "基于深度学习的双目视觉立体图像感知研究", 《中国博士学位论文全文数据库 信息科技辑》, 1 May 2021 (2021-05-01) *
张欣彧;尤鸣宇;朱江;韩煊: "基于联合损失函数的小规模数据人脸识别", 《北京理工大学学报》, 15 February 2020 (2020-02-15) *

Similar Documents

Publication Publication Date Title
CN111629262B (zh) 视频图像处理方法和装置、电子设备及存储介质
CN111402170B (zh) 图像增强方法、装置、终端及计算机可读存储介质
CN111160232B (zh) 正面人脸重建方法、装置及系统
CN108073857A (zh) 动态视觉传感器dvs事件处理的方法及装置
CN113343745B (zh) 基于双目相机的远距离目标检测方法、系统和智能终端
CN114926521A (zh) 基于双目相机的立体匹配方法和系统
CN112470192A (zh) 双摄像头标定方法、电子设备、计算机可读存储介质
CN110874852A (zh) 深度图像的确定方法、图像处理器及存储介质
CN114119777B (zh) 基于深度学习的立体匹配方法和系统
CN115329111B (zh) 一种基于点云与影像匹配的影像特征库构建方法及系统
CN113965742B (zh) 基于多传感融合的稠密视差图提取方法、系统和智能终端
CN116258758A (zh) 基于注意力机制和多级代价体的双目深度估计方法及系统
CN115100621A (zh) 基于深度学习网络的地面场景检测方法和系统
CN113792752B (zh) 基于双目相机的图像特征提取方法、系统和智能终端
CN113538538B (zh) 双目图像对齐方法、电子设备和计算机可读存储介质
CN113034666B (zh) 一种基于金字塔视差优化代价计算的立体匹配方法
CN113935934A (zh) 图像处理方法、装置、电子设备和计算机可读存储介质
CN114049510A (zh) 基于损失函数的双目相机立体匹配算法、系统和智能终端
CN114092850A (zh) 重识别方法、装置、计算机设备和存储介质
CN113763303B (zh) 基于双目立体视觉的实时地面融合方法、系统和智能终端
WO2021087812A1 (zh) 图像的深度值的确定方法、图像处理器以及模组
CN111179326B (zh) 一种单目深度估计方法、系统、设备及存储介质
CN114511600A (zh) 基于点云配准的位姿计算方法和系统
CN114387324A (zh) 深度成像方法、装置、电子设备和计算机可读存储介质
CN115100267A (zh) 基于深度学习算子的立体匹配方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination