CN116320358B

CN116320358B - 一种视差图像预测装置及方法

Info

Publication number: CN116320358B
Application number: CN202310564823.6A
Authority: CN
Inventors: 吕国皎; 王艳; 郑骊; 丁锦涛
Original assignee: Chengdu Technological University CDTU
Current assignee: Chengdu Technological University CDTU
Priority date: 2023-05-19
Filing date: 2023-05-19
Publication date: 2023-12-01
Anticipated expiration: 2043-05-19
Also published as: CN116320358A

Abstract

为解决传统相机阵列中，相机所在位置和数量固定，难以大规模获得任意视点数目和对应任意视点位置的视差图像的问题，本发明提出了一种视差图像预测装置及方法。本发明该视差图像预测装置及方法由第一相机、第二相机、第三相机及计算机系统构成，计算机系统内设人工神经网络，并通过三台相机的位置关系及三台相机所采集视差图像的第i行像素训练得到人工神经网络隐藏层，隐藏层揭示了图像像素深度与像素位移之间的关系，本发明可进一步通过隐藏层中的像素深度及像素位移关系进行任意视点位置的视差图像预测，从而方便快速地获得任意视点数目和对应任意视点位置处的视差图像。

Description

一种视差图像预测装置及方法

技术领域

本发明属于立体显示技术领域，更具体地说，本发明涉及一种视差图像预测装置及方法。

背景技术

通常，立体显示器将不同的视差图像投射至空间中不同视点位置，从而实现立体显示。视差图像的获取常以传统的相机阵列实现。因传统相机阵列中，相机所在位置和数量固定，难以大规模获得任意视点数目和对应任意视点位置的视差图像。因此，本发明提出了一种视差图像预测装置及方法，本发明的一种视差图像预测装置采用三台相机进行视差图像进行采集，其预测方法通过人工神经网络进行视差图像训练找到图像像素深度与像素位移之间的关系，并通过该规律进行任意视点位置的视差图像预测，从而方便快速地获得任意视点数目和对应任意视点位置处的视差图像。

发明内容

为解决传统相机阵列中，相机所在位置和数量固定，难以大规模获得任意视点数目和对应任意视点位置的视差图像的问题，本发明提出了一种视差图像预测装置及方法。

本发明的视差图像预测装置由第一相机、第二相机、第三相机及计算机系统构成。

第一相机、第二相机及第三相机在同一直线上排列，第一相机到第二相机镜头间距为D₁，第二相机到第三相机镜头间距为D₂。优选的，D₁≠D₂。

第一相机用于采集第一视点视差图像，第二相机用于采集第二视点视差图像，第三相机用于采集第三视点视差图像。

第一相机、第二相机及第三相机与计算机系统相连，其拍摄的视差图像传输至计算机系统。

计算机系统构建人工神经网络，对第一视点视差图像、第二视点视差图像及第三视点视差图像的第i行像素进行训练，并预测获得任意视点位置处的视差图像的第i行像素。当预测获得任意视点位置处的视差图像的所有行像素时，则按行进行像素组合，获得任意视点位置处的视差图像。

优选的，计算机系统由服务器构成，与第一相机、第二相机及第三相机由计算机网络连接。

优选的，计算机系统以一对多形式，供多个第一相机、第二相机及第三相机形成的组合共享使用。

本发明的视差图像预测方法如下：

构建人工神经网络，人工神经网络的输入层包含第一相机、第二相机及任意视点位置相机的位置关系、第一视点视差图像第i行像素、第二视点视差图像第i行像素；人工神经网络的隐藏层包含若干节点，此处不对节点数目进行限制，隐藏层用于描述图像像素深度与像素位移之间的关系；人工神经网络的输出层包含任意视点位置处的视差图像的第i行像素。

训练阶段内，输入层内输入第一相机、第二相机及任意视点位置相机的位置关系、第一视点视差图像第i行像素、第二视点视差图像第i行像素，其中任意视点位置相机的位置由第三相机位置代入；输出层内，任意视点位置处的视差图像的第i行像素由第三视点视差图像的第i行像素代入，从而训练得到隐藏层。

图像预测阶段，输入层内输入第一相机、第二相机及任意视点位置相机的位置关系、第一视点视差图像第i行像素、第二视点视差图像第i行像素，通过训练得到的隐藏层，计算获得任意视点位置处的视差图像的第i行像素。当预测获得任意视点位置处的视差图像的所有行像素时，则按行进行像素组合，获得任意视点位置处的视差图像。

优选的，第一相机、第二相机及第三相机在训练和预测阶段随机进行定义。

神经网络预测原理方面，区别于传统基于两幅视差图像进行人工神经网络训练，并预测图像像素深度大小进行视差图像获取的方法，本发明采用三台相机进行视差图像进行采集，在输入层中包含第一相机、第二相机位置关系，及其第一视点视差图像第i行像素、第二视点视差图像第i行像素，其已经具备了图像像素深度信息，而通过额外设置第三相机位置作为输入和第三视点视差图像第i行像素作为输出，通过隐藏层找到图像像素深度和像素位移之间的关系，从而进一步提高预测准确性。同时，本发明在使用过程中，第一相机、第二相机及第三相机在训练和预测阶段随机进行定义；因此，当其拍摄一组视差图像时，其在训练阶段可以通过定义不同的第一相机、第二相机及第三相机完成多次的训练，其在预测阶段也可通过定义不同的第一相机、第二相机获得合适的视差和预测结果。

综上所述，因本发明中，并通过人工神经网络进行任意视点位置的视差图像预测，从而可以方便快速地获得任意视点数目和对应任意视点位置处的视差图像，同时，相对于传统基于两幅视差图像的人工神经网络模型，本发明在原理上具备更高的预测精确性。

附图说明

图1为本发明的结构示意图。

图2为本发明的原理示意图。

图3为本发明中人工神经网络示意图。

图4为本发明中人工神经网络的训练示意图。

图标：101-第一相机；102-第二相机；103-第三相机；200-计算机系统；310-第一视点视差图像；320-第二视点视差图像；330-第三视点视差图像；340-任意视点位置处的视差图像；311-第一视点视差图像第i行像素；321-第二视点视差图像第i行像素；331-第三视点视差图像第i行像素；341-任意视点位置处的视差图像的第i行像素；410-输入层；420-隐藏层；430-输出层； 411-第一相机、第二相机及任意视点位置相机的位置关系；412-输入层内输入第一相机、第二相机及第三相机的位置关系；

应该理解上述附图只是示意性的，并没有按比例绘制。

实施方式

图1为本实施例提供的一种视差图像预测装置。为解决传统相机阵列中，相机所在位置和数量固定，难以大规模获得任意视点数目和对应任意视点位置的视差图像的问题，本发明提出了一种视差图像预测装置。

请参考图1，该视差图像预测装置由第一相机101、第二相机102、第三相机103及计算机系统200构成。计算机系统200由服务器构成，与第一相机101、第二相机102及第三相机103由计算机网络连接。

第一相机101、第二相机102及第三相机103在同一直线上排列，第一相机101镜头到第二相机102镜头间距为D₁，第二相机102镜头到第三相机103镜头间距为D₂。

第一相机101用于采集第一视点视差图像310，第二相机102用于采集第二视点视差图像320，第三相机103用于采集第三视点视差图像330。

第一相机101、第二相机102及第三相机103与计算机系统200相连，其拍摄的视差图像传输至计算机系统200。

请参考图2，计算机系统200构建人工神经网络，对第一视点视差图像第i行像素311、第二视点视差图像第i行像素321及第三视点视差图像第i行像素331进行训练，并预测获得任意视点位置处的视差图像的第i行像素341。当预测获得任意视点位置处的视差图像340的所有行像素时，则按行进行像素组合，获得任意视点位置处的视差图像340。

获得任意视点位置处的视差图像的第i行像素341的方法如下：

请参考图3，计算机系统200构建人工神经网络，人工神经网络的输入层410包含第一相机、第二相机及任意视点位置相机的位置关系411、第一视点视差图像第i行像素311、第二视点视差图像第i行像素321；人工神经网络的隐藏层420包含若干节点，隐藏层用于描述图像像素深度与像素位移之间的关系；人工神经网络的输出层430包含任意视点位置处的视差图像的第i行像素341。

请参考图4，训练阶段内，输入层410内输入第一相机、第二相机及任意视点位置相机的位置关系、第一视点视差图像第i行像素311、第二视点视差图像第i行像素321，其中任意视点位置相机的位置由第三相机103位置代入，即为输入层内输入第一相机、第二相机及第三相机的位置关系412，该位置关系参数计为（D₁，D₂）；输出层430内，任意视点位置处的视差图像的第i行像素由第三视点视差图像的第i行像素331代入，从而训练得到隐藏层420。

图像预测阶段，输入层410内输入第一相机、第二相机及任意视点位置相机的位置关系411、第一视点视差图像第i行像素311、第二视点视差图像第i行像素321，第一相机、第二相机及任意视点位置相机的位置关系411，该位置关系参数计为（D₁，x），其中x为第二相机到任意视点位置相机的镜头距离。进一步的，通过训练得到的隐藏层420，计算获得任意视点位置处的视差图像的第i行像素341。当预测获得任意视点位置处的视差图像340的所有行像素时，则按行进行像素组合，获得任意视点位置处的视差图像340。

同时，计算机系统200以一对多形式，供多个第一相机101、第二相机102及第三相机103形成的组合共享使用，即多个相机用户共享使用计算机系统200。一对多的服务形式，可使得计算机系统200获得大量的第一视点视差图像310、第二视点视差图像320及第三视点视差图像330样本，从而在训练过程中提高隐藏层420的准确性。

区别于传统基于两幅视差图像进行人工神经网络训练，并预测图像像素深度大小进行视差图像获取的方法，本发明采用三台相机进行视差图像进行采集，在输入层410中包含第一相机101、第二相机102位置关系，及其第一视点视差图像第i行像素311、第二视点视差图像第i行像素321，其已经具备了图像像素深度信息，而通过额外设置第三相机103位置作为输入和第三视点视差图像第i行像素331作为输出，通过隐藏层420找到图像像素深度和像素位移之间的关系，从而进一步提高预测准确性。

同时，本发明在使用过程中，第一相机101、第二相机102及第三相机103在训练和预测阶段随机进行定义；因此，当其拍摄一组视差图像时，其在训练阶段可以通过定义不同的第一相机101、第二相机102及第三相机103完成多次的训练，如，第一次训练时的第一相机101调整为第二次训练时的第二相机102，第一次训练时的第二相机102调整为第二次训练时的第三相机103，第一次训练时的第三相机103调整为第二次训练时的第一相机101；其在预测阶段也可通过定义不同的第一相机101、第二相机102获得合适的视差和预测结果。

Claims

1.一种视差图像预测装置，其特征在于：

该视差图像预测装置由第一相机、第二相机、第三相机及计算机系统构成；

第一相机、第二相机及第三相机在同一直线上排列，第一相机到第二相机镜头间距为D1，第二相机到第三相机镜头间距为D2；

第一相机用于采集第一视点视差图像，第二相机用于采集第二视点视差图像，第三相机用于采集第三视点视差图像；

第一相机、第二相机及第三相机与计算机系统相连，其拍摄的视差图像传输至计算机系统；

计算机系统构建人工神经网络，对第一视点视差图像、第二视点视差图像及第三视点视差图像的第i行像素进行训练，并预测获得任意视点位置处的视差图像的第i行像素；当预测获得任意视点位置处的视差图像的所有行像素时，则按行进行像素组合，获得任意视点位置处的视差图像；

所述人工神经网络的输入为第一相机、第二相机及任意视点位置相机的位置关系、第一视点视差图像第i行像素、第二视点视差图像第i行像素；所述人工神经网络的输出为任意视点位置处的视差图像的第i行像素。

2.如权利要求1所述的一种视差图像预测装置，其特征在于：

计算机系统由服务器构成，与第一相机、第二相机及第三相机由计算机网络连接。

3.如权利要求1所述的一种视差图像预测装置，其特征在于：

计算机系统以一对多形式，供多个第一相机、第二相机及第三相机形成的组合共享使用。

4.一种视差图像预测方法，应用于权利要求1～3任一项所述的视差图像预测装置，其特征在于：

构建人工神经网络，人工神经网络的输入层包含第一相机、第二相机及任意视点位置相机的位置关系、第一视点视差图像第i行像素、第二视点视差图像第i行像素；人工神经网络的隐藏层包含若干节点，隐藏层用于描述图像像素深度与像素位移之间的关系；人工神经网络的输出层包含任意视点位置处的视差图像的第i行像素；

训练阶段内，输入层内输入第一相机、第二相机及任意视点位置相机的位置关系、第一视点视差图像第i行像素、第二视点视差图像第i行像素，其中任意视点位置相机的位置由第三相机位置代入；输出层内，任意视点位置处的视差图像的第i行像素由第三视点视差图像的第i行像素代入，从而训练得到隐藏层；

图像预测阶段，输入层内输入第一相机、第二相机及任意视点位置相机的位置关系、第一视点视差图像第i行像素、第二视点视差图像第i行像素，通过训练得到的隐藏层计算获得任意视点位置处的视差图像的第i行像素；当预测获得任意视点位置处的视差图像的所有行像素时，则按行进行像素组合，获得任意视点位置处的视差图像。

5.如权利要求4所述的一种视差图像预测方法，其特征在于：

第一相机、第二相机及第三相机在训练和预测阶段随机进行定义。