CN110581977A

CN110581977A - 一种视频画面的输出方法、装置及三目摄像机

Info

Publication number: CN110581977A
Application number: CN201810579605.9A
Authority: CN
Inventors: 姚俊杰; 徐鹏
Original assignee: Hangzhou Hikvision Digital Technology Co Ltd
Current assignee: Hangzhou Hikvision Digital Technology Co Ltd
Priority date: 2018-06-07
Filing date: 2018-06-07
Publication date: 2019-12-17
Anticipated expiration: 2038-06-07
Also published as: CN110581977B

Abstract

本发明实施例提供了一种视频画面的输出方法、装置及三目摄像机。方法包括：利用分析芯片，基于预设的双目行为分析算法，对第一全景画面和第二全景画面进行行为分析，以确定监控场景中是否发生有预设的特定行为；如果监控场景中发生有特定行为，利用分析芯片确定特定行为发生的位置；利用主芯片从第三全景画面中截取包括位置在内的区域的画面，作为特写输出画面，并输出特写输出画面。可以自动地检测监控场景中发生的特定行为，并利用截取第三全景画面的部分区域并放大的方式实现特写，不需要变焦或者转动镜头，因此整个过程响应时间较短，即响应速度较快。

Description

一种视频画面的输出方法、装置及三目摄像机

技术领域

本发明涉及视频监控技术领域，特别是涉及一种视频画面的输出方法、装置及三目摄像机。

背景技术

视频监控系统中，可以包括有一个或多个摄像机，这些摄像机可以拍摄得到监控场景的视频画面，并将监控场景的视频画面输出至后端的主机，供用户实时观看或者录像。并且根据用户的实际需求，在一些情况下，可能需要对监控场景中发生的一些特定行为进行特写，以起到突出焦点的作用。例如假设监控场景为正在上课的教室，当有学生起立回答问题时，可以给对该学生进行特写。

为了实现针对监控场景中特定行为的特写，可以是在用户观察到监控场景中发生特定行为后，增大摄像机的变焦倍数，并转动摄像机以对准该特定行为发生的区域，将此时摄像机拍摄得到的视频画面作为特写画面。例如，用户观察到教室中有学生起立回答问题后，将摄像机的变焦倍数由原来的1调整为8，可以理解的是此时摄像机拍摄得到的视频画面相对于调整变焦倍数前放大了8倍，并转动摄像机，使得摄像机对准起立的学生，以完成针对本次起立回答问题的特写。

但是，从用户观察到监控场景中发生特定行为，到用户调整摄像机的变焦倍数并转动摄像机存在一个反应过程，并且摄像机变焦和转动均需要一定时间才能完成，该方法从特定行为发生到输出特写画面，存在一个较长的响应时间。

发明内容

本发明实施例的目的在于提供一种视频画面输出方法、装置及三目摄像机，以实现快速地响应监控场景中发生的特定行为，并针对该特定行为进行特写。具体技术方案如下：

在本发明实施例的第一方面，提供了一种视频画面的输出方法，应用于三目摄像机，所述三目摄像机包括：第一图像传感器、第二图像传感器、第三图像传感器、主芯片以及分析芯片，所述第一图像传感器和所述第二图像传感器的图像分辨率相同，所述第三图像传感器的图像分辨率高于所述第一图像传感器或者所述第二图像传感器的分辨率；

所述分析芯片与所述第一图像传感器、所述第二图像传感器、所述主芯片电连接；所述第三图像传感器与所述主芯片电连接；所述第一图像传感器、所述第二图像传感器以及所述第三图像传感器用于同步获取监控场景的全景画面；

所述方法包括：

利用所述分析芯片，基于预设的双目行为分析算法，对第一全景画面和第二全景画面进行行为分析，以确定监控场景中是否发生有预设的特定行为，所述第一全景画面为所述第一图像传感器获取到的全景画面，所述第二全景画面为所述第二图像传感器获取到的全景画面；

如果所述监控场景中发生有所述特定行为，利用所述分析芯片确定所述特定行为发生的位置；

利用所述主芯片从第三全景画面中截取包括所述位置在内的区域的画面，作为特写输出画面，所述第三全景画面为所述第三图像传感器获取到的全景画面；并输出所述特写输出画面。

结合第一方面，在第一种可能的实现方式中，在所述确定监控场景中是否发生有预设的特定行为后，还包括：

如果所述监控场景中没有发生所述特定行为，利用所述主芯片输出所述第三全景画面。

结合第一方面，在第二种可能的实现方式中，所述分析芯片包括第一分析芯片和第二分析芯片，所述第一分析芯片与所述第一图像传感器、所述第二图像传感器、所述第二分析芯片电连接，所述第二分析芯片与所述主芯片电连接；

所述利用所述分析芯片，基于预设的双目行为分析算法，对第一全景画面和第二全景画面进行行为分析，以确定监控场景中是否发生有预设的特定行为，包括：

利用所述第一分析芯片，根据第一全景画面和第二全景画面，基于双目视差原理，获取所述监控场景的深度图；

利用所述第二分析芯片，基于所述深度图，确定所述第一全景画面或者所述第二全景画面中是否存在目标；

如果确定存在目标，获取所确定的目标的行为特征；

确定所述行为特征中是否存在与所述特定行为相匹配的特征；

如果存在与所述特定行为相匹配的特征，则确定所述监控场景中发生有所述特定行为；

如果不存在与所述特定行为相匹配的特征，则确定所述监控场景中没有发生所述特定行为。

结合第一方面的第二种可能的实现方式，在第三种可能的实现方式中，利用所述第一分析芯片，根据第一全景画面和第二全景画面，基于双目视差原理，获取所述监控场景的深度图，包括：

利用第一分析芯片分别确定所述第一全景画面或者所述第二全景画面中各个像素点的视差；

利用所述各个像素点的视差分别计算得到所述各个像素点对应于所述监控场景中的深度；

基于所述各个像素点的深度，生成所述监控场景的深度图。

结合第一方面，在第四种可能的实现方式中，所述方法还包括：

在利用所述主芯片输出所述特写输出画面时，利用所述主芯片同步输出所述第一全景画面和所述第二全景画面中的一个全景画面。

在本发明实施例的第二方面，还提供了一种视频画面的输出装置，应用于三目摄像机，所述三目摄像机包括：第一图像传感器、第二图像传感器、第三图像传感器、主芯片以及分析芯片，所述第一图像传感器和所述第二图像传感器的图像分辨率相同，所述第三图像传感器的图像分辨率高于所述第一图像传感器或者所述第二图像传感器的分辨率；

所述装置包括：

行为分析模块，用于利用所述分析芯片，基于预设的双目行为分析算法，对第一全景画面和第二全景画面进行行为分析，以确定监控场景中是否发生有预设的特定行为，所述第一全景画面为所述第一图像传感器获取到的全景画面，所述第二全景画面为所述第二图像传感器获取到的全景画面；

定位模块，用于如果所述监控场景中发生有所述特定行为，利用所述分析芯片确定所述特定行为发生的位置；

视频输出模块，用于利用所述主芯片从所述第三全景画面中截取包括所述位置在内的区域的画面，作为特写输出画面，所述第三全景画面为所述第三图像传感器获取到的全景画面；并输出所述特写输出画面。

结合第二方面，在第一种可能的实现方式中，所述视频输出模块，还用于如果所述监控场景中没有发生所述特定行为，利用所述主芯片输出所述第三全景画面。

结合第二方面，在第二种可能的实现方式中，所述分析芯片包括第一分析芯片和第二分析芯片，所述第一分析芯片与所述第一图像传感器、所述第二图像传感器、所述第二分析芯片电连接，所述第二分析芯片与所述主芯片电连接；

所述行为分析模块，具体用于：

如果确定存在目标，获取所确定的目标的行为特征；

结合第二方面的第二种可能的实现方式，在第三种可能的实现方式中，所述行为分析模块具体用于利用第一分析芯片分别确定所述第一全景画面或者所述第二全景画面中各个像素点的视差；

基于所述各个像素点的深度，生成所述监控场景的深度图。

结合第二方面，在第四种可能的实现方式中，所述视频输出模块，还用于在利用所述主芯片输出所述特写输出画面时，利用所述主芯片同步输出所述第一全景画面和所述第二全景画面中的一个全景画面。

在本发明实施例的第三方面，还提供了一种三目摄像机，其特征在于，包括：

第一图像传感器、第二图像传感器、第三图像传感器、主芯片以及分析芯片，所述第一图像传感器和所述第二图像传感器的图像分辨率相同，所述第三图像传感器的图像分辨率高于所述第一图像传感器或者所述第二图像传感器的分辨率；

所述第一图像传感器和所述第二图像传感器将获取到的全景画面发送至所述分析芯片；所述第三图像传感器将获取到的全景画面发送至所述主芯片；

所述主芯片和所述分析芯片用于控制所述三目摄像机实现上述任一所述的视频画面的输出方法。

结合第三方面，在第一种可能的实现方式中，还包括：

所述三目摄像机还包括第一镜头和第二镜头，所述第一镜头为所述第一图像传感器所属图像采集单元的镜头，所述第二镜头为所述第二图像传感器所属图像采集单元的镜头，所述第一镜头和所述第二镜头的内部参数相同，所述内部参数包括：焦距和畸变系数；

所述第一镜头和所述第二镜头的外部参数相同，所述外部参数包括：安装高度、俯仰角和倾斜角。

结合第三方面，在第二种可能的实现方式中，所述分析芯片包括第一分析芯片和第二分析芯片；

所述第一分析芯片与所述第一图像传感器、所述第二图像传感器、所述第二分析芯片电连接，所述第二分析芯片与所述主芯片电连接。

在本发明实施例的第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一所述的视频画面的输出方法。

本发明实施例提供的视频画面的输出方法、装置及三目摄像机，可以自动地检测监控场景中是否发生有特定行为，并在检测到监控场景中发生有特定行为时，利用截取第三全景画面的部分区域并放大的方式实现特写，不需要变焦或者转动镜头，因此整个过程响应时间较短，即响应速度较快。当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的视频画面的输出方法的一种流程示意图；

图2为本发明实施例提供的视频画面的输出方法的另一种流程示意图；

图3为本发明实施例提供的特定行为确定方法的一种流程示意图；

图4为本发明实施例提供的视频画面的输出装置的一种结构示意图；

图5a为本发明实施例提供的三目摄像机的一种结构示意图；

图5b为本发明实施例提供的三目摄像机的另一种结构示意图；

图5c为本发明实施例提供的三目摄像机的另一种结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，图1所示为本发明实施例提供的视频画面的输出方法的一种流程示意图，可以包括：

S110，利用所述分析芯片，基于预设的双目行为分析算法，对第一全景画面和第二全景画面进行行为分析，以确定监控场景中是否发生有预设的特定行为。

关于三目摄像机的结构可以参见图5a、图5b、以及图5c所示，以及三目摄像机的实施例，在此不做过多描述。其中，第一全景画面为第一图像传感器获取到的监控场景的全景画面，第二全景画面为第二图像传感器获取到的监控场景的全景画面，第一图像传感器和第二图像传感器是同步获取全景画面的。分析芯片可以是一块单独的芯片，也可以是包括多个芯片。分析芯片中可以是内置有用于双目行为分析算法的程序，并通过调用该程序的分析接口，实现对第一全景画面和第二全景画面的行为分析。其中，预设的特定行为可以根据实际需求进行配置，以监控场景为正在上课的教室为例，预设的特定行为可以，包括教室中学生或者教师的一些行为，例如起立、坐下、板书等行为。当监控场景为医院病房时，预设的特定行为，可以包括病人的一些行为，例如行走、倒地、卧床等行为。

进一步的，可以是基于第一全景画面和第二全景画面，对监控场景中的各个目标进行行为分析，以确定各个目标是否正在进行预设的特定行为，当确定存在正在进行预设的特定行为的目标时，确定监控场景中发生有特定行为。以监控场景为正在上课的教室为例，可以是对教室中的学生和教师进行行为分析，假设分析结果表明有一学生正在起立，则可以确定监控场景中发生有特定行为。

S120，如果监控场景中发生有特定行为，利用分析芯片确定特定行为发生的位置。

可以理解的是，特定行为是监控场景中的一个或多个目标的行为，因此特定行为发生的位置可以是正在进行该特定行为的目标的所在位置。以监控场景为正在上课的教室为例，当发生有起立行为时，确定起立的学生所处的位置作为起立行为发生的位置，其中，特定行为发生的位置可以是一个坐标区域，可以是包括该目标在内的一个矩形区域，在这种情况下该位置可以用该矩形区域四个顶点的坐标来表示。

S130，利用主芯片从第三全景画面中截取包括该位置在内的区域的画面，作为特写输出画面。

其中，第三全景画面为第三图像传感器获取到的全景画面，第三图像传感器与第一图像传感器、第二图像传感器同步获取全景画面。包括该位置在内的区域，可以是以该位置为中心且分辨率为预设分辨率的一个区域，也可以是根据实际需求，以该位置为基础进行拓展得到的一个区域。该位置为一矩形区域为例，可以是按照预设算法，对该矩形区域的边界进行拓展，得到一个分辨率为1920×1080的区域，将该区域的画面从第三全景画面中截取出来，作为特写输出画面。

S140，利用主芯片输出特写输出画面。

可以理解的是，特写输出画面由于是从第三全景画面中截取的一个区域的画面，因此特写输出画面的分辨率低于第三全景画面的分辨率。

在一种可选的实施例中，可以在输出特写输出画面时，同步输出第一全景画面或者第二全景画面。具体的，可以是利用预设的第一输出通道输出特写输出画面，同时利用预设的第二输出通道，输出第一全景画面或者第二全景画面。由于本实施例同时输出了特写输出画面，以及第一全景画面和第二全景画面中的一个全景画面，选用该实施例，可以在实现针对特定行为进行特写的同时，使得用户能够观察到监控场景的全景画面。例如，用户可以在显示特写输出画面的同时，以画中画的形式显示第一全景画面或者第二全景画面。

选用该实施例，可以自动地检测监控场景中是否发生有特定行为，并在检测到监控场景中发生有特定行为时，利用截取第三全景画面的部分区域并放大的方式实现特写，不需要变焦或者转动镜头，因此整个过程响应时间较短，即响应速度较快。

在一种可选的实施例中，如图3所示，在S110后还可以包括：

S150，如果监控场景中没有发生特定行为，利用主芯片输出第三全景画面。

选用该实施例，可以在特定行为结束或者发生时，实现在全景画面和特写输出画面之间的自动切换，不需要用户手动切换，节省了用户的操作量，提高了用户体验。

参见图4，图4所示为本发明实施例提供的特定行为确定方法的一种流程示意图，本实施例所使用的三目摄像机的结构可以如所示，方法可以包括：

S310，利用第一分析芯片，根据第一全景画面和第二全景画面，基于双目视差原理，获取监控场景的深度图。

进一步的，可以是利用第一分析芯片将第一全景画面和第二全景画面拼接成一个拼接全景画面，示例性的，假设第一全景画面和第二全景画面的分辨率均为1920*1080，第一分析芯片可以是将第一全景画面拼接于第二全景画面的左侧或者右侧得到的一个分辨率为3840*1080的拼接画面。将两个全景画面拼接为一个拼接画面，减少了后续步骤中所需要处理的画面的数量，便于后续处理。

进一步的，第一分析芯片可以是分别确定第一全景画面或者第二全景画面中各个像素点的视差，利用各个像素点的视差分别计算得到各个像素点对应于监控场景中的深度，并基于各个像素点的深度，生成监控场景的深度图。

由于这两个待分析画面第一全景画面和第二全景画面是从不同位置拍摄得到的，因此第一全景画面和第二全景画面这两个待分析画面之间存在视差，即监控场景空间中的一个坐标点A，在相对于第一全景画面和第二全景画面这两个待分析画面的像素坐标可能原点的位置不同，例如坐标点A在其中一个待分析画面第一全景画面中的像素坐标为(10，8)，在另一个待分析画面第二全景画面中的像素坐标可能为(6,8)，这两个像素坐标之间存在一个坐标差。根据双目立体视觉原理可知，坐标点A在第一全景画面和第二全景画面这两个分析画面之间中的坐标差，与坐标点A的深度负相关，因此可以根据第一全景画面或者第二全景画面中各个像素点的视差，反推出该像素点在监控场景中所对应的点的深度可以根据坐标点A的坐标差计算出坐标点A的深度。

S320，利用第二分析芯片，基于深度图，确定第一全景画面或者第二全景画面中是否存在目标。

具体的，可以是根据深度图中包含的深度信息，和第一全景画面或者第二全景画面中的色彩信息，通过3D点云算法，将监控场景中存在目标从背景中区分出来，以确定监控场景中是否存在的目标。

S330，如果确定存在目标，获取目标的行为的行为特征。

由于特定行为是由目标来执行的，如果确定第一全景画面或者第二全景画面中不存在目标，可以确定监控场景中不存在特定行为，可以终止行为分析。

S340，确定行为特征中是否存在与特定行为相匹配的特征，如果存在与特定行为相匹配的特征，则执行S350，如果不存在与特定行为相匹配的特征，则执行S360。

其中，与特定行为相匹配的特征可以预先保存在一个特征表中，逐个检查各个目标，以确定这些目标的行为特征是否已经存在于该特征表中，当检测到一目标的行为特征已经存在于该特征表中时，停止检测，并确定存在与特定行为相匹配的特征。当所有目标的行为特征均未存在于该特征表中时，确定不存在与特定行为相匹配的特征。

S350，确定监控场景中发生有特定行为。

S360，确定监控场景中没有发生特定行为。

可以理解的是，深度图可以表示监控场景中的深度信息，基于深度图可以准确的获取监控场景的三维信息，相较于单个视频画面提供的监控场景的二维信息，三维信息中包含的信息量更完整，故基于三维信息进行的行为分析更加准确。

参见图4，图4所示为本发明实施例提供的视频画面的输出装置的一种结构示意图，可以包括：

行为分析模块410，用于利用所述分析芯片，基于预设的双目行为分析算法，对第一全景画面和第二全景画面进行行为分析，以确定监控场景中是否发生有预设的特定行为，所述第一全景画面为所述第一图像传感器获取到的全景画面，所述第二全景画面为所述第二图像传感器获取到的全景画面；

定位模块420，用于如果所述监控场景中发生有所述特定行为，利用所述分析芯片确定所述特定行为发生的位置；

视频输出模块430，用于利用所述主芯片从所述第三全景画面中截取包括所述位置在内的区域的画面，作为特写输出画面，所述第三全景画面为所述第三图像传感器获取到的全景画面；并输出所述特写输出画面。

进一步的，所述视频输出模块430，还用于在所述确定监控场景中是否发生有预设的特定行为后，如果所述监控场景中没有发生所述特定行为，利用所述主芯片输出所述第三全景画面。

进一步的，所述分析芯片包括第一分析芯片和第二分析芯片，所述第一分析芯片与所述第一图像传感器、所述第二图像传感器、所述第二分析芯片电连接，所述第二分析芯片与所述主芯片电连接；

所述行为分析模块410具体用于利用所述第一分析芯片，根据第一全景画面和第二全景画面，基于双目视差原理，获取所述监控场景的深度图；

利用所述第二分析芯片，基于所述深度图，确定所述第一全景画面或者所述第二全景画面中是否存在目标；如果确定存在目标，获取所确定的目标的行为特征；确定所述行为特征中是否存在与所述特定行为相匹配的特征；如果存在与所述特定行为相匹配的特征，则确定所述监控场景中发生有所述特定行为；如果不存在与所述特定行为相匹配的特征，则确定所述监控场景中没有发生所述特定行为。

进一步的，行为分析模块410具体用于分别确定所述第一全景画面或者所述第二全景画面中各个像素点的视差；利用所述各个像素点的视差分别计算得到所述各个像素点对应于所述监控场景中的深度；基于所述各个像素点的深度，生成所述监控场景的深度图。

进一步的，视频输出模块430还用于在利用所述主芯片输出所述特写输出画面时，利用所述主芯片同步输出所述第一全景画面和所述第二全景画面中的一个全景画面。

参见图5a，图5a所示为本发明实施例提供的三目摄像机的一种结构示意图，可以包括：

第一图像传感器510、第二图像传感器520、第三图像传感器530、主芯片540以及分析芯片550，所述第一图像传感器510和所述第二图像传感器520的图像分辨率相同，所述第三图像传感器530的图像分辨率高于所述第一图像传感器510或者所述第二图像传感器520的分辨率；

所述分析芯片550与所述第一图像传感器510、所述第二图像传感器520、所述主芯片540电连接，进一步的，分析芯片550和第一图像传感器510、第二图像传感器520之间可以是通过MIPI(Moblie Industry Processor Interface，移动产业处理器接口)，分析芯片550和主芯片540之间可以是通过数据线或者MIPI连接。

所述第三图像传感器530与所述主芯片540电连接，进一步的可以是通过MIPI实现电连接；所述第一图像传感器510、所述第二图像传感器520以及所述第三图像传感器530用于同步获取监控场景的全景画面；

所述第一图像传感器510和所述第二图像传感器520将获取到的全景画面发送至所述分析芯片550；所述第三图像传感器530将获取到的全景画面发送至所述主芯片540；

所述主芯片510和所述分析芯片520用于控制所述三目摄像机实现以下方法步骤：

利用所述分析芯片550，基于预设的双目行为分析算法，对第一全景画面和第二全景画面进行行为分析，以确定监控场景中是否发生有预设的特定行为，所述第一全景画面为所述第一图像传感器510获取到的全景画面，所述第二全景画面为所述第二图像传感器520获取到的全景画面；

如果所述监控场景中发生有所述特定行为，利用所述分析芯片550确定所述特定行为发生的位置；

利用所述主芯片540从第三全景画面中截取包括所述位置在内的区域的画面，作为特写输出画面，所述第三全景画面为所述第三图像传感器530获取到的全景画面；并输出所述特写输出画面。

进一步的，在所述确定监控场景中是否发生有预设的特定行为后，还包括：

如果所述监控场景中没有发生所述特定行为，利用所述主芯片540输出所述第三全景画面。

进一步的，在利用所述主芯片540输出所述特写输出画面时，利用所述主芯片540同步输出所述第一全景画面和所述第二全景画面中的一个全景画面。

在一种可选的实施例中，如图5b所示，所述分析芯片550可以包括第一分析芯片551和第二分析芯片552，所述第一分析芯片551与所述第一图像传感器510、所述第二图像传感器520、所述第二分析芯片552电连接，所述第二分析芯片552与所述主芯片540电连接；

在第一分析芯片551、第二分析芯片552以及主芯片530的控制下，所述三目摄像机可以进一步实现一下步骤：

利用所述第一分析芯片551，根据第一全景画面和第二全景画面，基于双目视差原理，获取所述监控场景的深度图；

利用所述第二分析芯片552，基于所述深度图，确定所述第一全景画面或者所述第二全景画面中是否存在目标；

如果确定存在目标，获取所确定的目标的行为特征；

进一步的，利用所述第一分析芯片551，根据第一全景画面和第二全景画面，基于双目视差原理，获取所述监控场景的深度图，包括：

利用第一分析芯片551分别确定所述第一全景画面或者所述第二全景画面中各个像素点的视差；

基于所述各个像素点的深度，生成所述监控场景的深度图。

在一种可选的实施例中，如图5c所示，还包括第一镜头511和第二镜头521，其中，所述第一镜头为所述第一图像传感器510所属图像采集单元的镜头，所述第二镜头为所述第二图像传感器520所属图像采集单元的镜头，所述第一镜头和所述第二镜头的内部参数相同，所述内部参数包括：焦距和畸变系数；所述第一镜头和所述第二镜头的外部参数相同，所述外部参数包括：安装高度、俯仰角和倾斜角。第一镜头511用于将光线聚焦于第一图像传感器510的感光平面，第二镜头521用于将光线聚焦于第二图像传感器520的感光平面。

具体的，可以是选用两个焦距和畸变参数均相同的镜头作为第一镜头511和第二镜头521，并且在安装这第一镜头511和第二镜头521时，保持着第一镜头511和第二镜头521的光轴相互平行，并且两个辅助镜头的成像平面共面。

可以理解的是，当第一镜头511和第二镜头521的内部参数相同，且外部参数也相同的情况下，监控场景中的各点在第一全景画面和第二全景画面中的像素坐标之间的坐标差，不存在因内部参数或者外部参数不同引起的分量，因此可以简单地根据三角形相似原理和几何光学成像的原理准确地推导出，此时监控场景中的各点在第一全景画面和第二全景画面中的像素坐标之间的坐标差和深度的关系式为：

其中，d为监控场景中的某一点在第一全景画面和第二全景画面中的像素坐标之间的坐标差，f为第一镜头511和第二镜头521的焦距，T为第一镜头511和第二镜头521的光学中心之间的距离，Z为该点的深度。根据两个第一全景画面和第二全景画面，确定监控场景中是否发生有预设的特定行为，需要首先获取监控场景中各点的深度。因此选用该实施例，可以有效地降低分析芯片550在根据两个第一全景画面和第二全景画面，确定监控场景中是否发生有预设的特定行为时需要的计算量，并提高准确性。

上述三目摄像机还可以包括处理器，通信接口，存储器，通信总线。存储器中可以存储有机器可执行指令，处理器用于被该机器可执行指令促使，实现上述任一视频画面的输出方法步骤，其中，通信总线用于完成处理器、存储器及通信接口相互间的通信，具体可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。

通信接口用于上述摄像机与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一视频画面的输出方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一视频画面的输出方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字车主线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、三目摄像机的实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种视频画面的输出方法，应用于三目摄像机，其特征在于，所述三目摄像机包括：第一图像传感器、第二图像传感器、第三图像传感器、主芯片以及分析芯片，所述第一图像传感器和所述第二图像传感器的图像分辨率相同，所述第三图像传感器的图像分辨率高于所述第一图像传感器或者所述第二图像传感器的分辨率；

所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述确定监控场景中是否发生有预设的特定行为后，还包括：

3.根据权利要求1所述的方法，其特征在于，所述分析芯片包括第一分析芯片和第二分析芯片，所述第一分析芯片与所述第一图像传感器、所述第二图像传感器、所述第二分析芯片电连接，所述第二分析芯片与所述主芯片电连接；

如果确定存在目标，获取所确定的目标的行为特征；

4.根据权利要求3所述的方法，其特征在于，利用所述第一分析芯片，根据第一全景画面和第二全景画面，基于双目视差原理，获取所述监控场景的深度图，包括：

基于所述各个像素点的深度，生成所述监控场景的深度图。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.一种视频画面的输出装置，应用于三目摄像机，其特征在于，所述三目摄像机包括：第一图像传感器、第二图像传感器、第三图像传感器、主芯片以及分析芯片，所述第一图像传感器和所述第二图像传感器的图像分辨率相同，所述第三图像传感器的图像分辨率高于所述第一图像传感器或者所述第二图像传感器的分辨率；

所述装置包括：

7.一种三目摄像机，其特征在于，所述三目摄像机包括：

所述主芯片和所述分析芯片用于控制所述三目摄像机实现权利要求1-5所述的方法步骤。

8.根据权利要求7所述的三目摄像机，其特征在于，所述三目摄像机还包括第一镜头和第二镜头，所述第一镜头为所述第一图像传感器所属图像采集单元的镜头，所述第二镜头为所述第二图像传感器所属图像采集单元的镜头，所述第一镜头和所述第二镜头的内部参数相同，所述内部参数包括：焦距和畸变系数；

9.根据权利要求7所述的三目摄像机，其特征在于，所述分析芯片包括第一分析芯片和第二分析芯片；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法步骤。