CN105245811A - 一种录像方法及装置 - Google Patents
一种录像方法及装置 Download PDFInfo
- Publication number
- CN105245811A CN105245811A CN201510676091.5A CN201510676091A CN105245811A CN 105245811 A CN105245811 A CN 105245811A CN 201510676091 A CN201510676091 A CN 201510676091A CN 105245811 A CN105245811 A CN 105245811A
- Authority
- CN
- China
- Prior art keywords
- distance
- target region
- foreground target
- amplitude
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 230000009977 dual effect Effects 0.000 claims description 14
- 230000001105 regulatory effect Effects 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000004807 localization Effects 0.000 description 6
- 230000007812 deficiency Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
Landscapes
- Studio Devices (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本发明实施例公开了一种录像方法,包括:接收录像启动指令,启动摄像头采集录像图像帧,查找所述录像图像帧中的前景目标区域;检测与所述前景目标区域对应的第一距离;获取麦克风采集的与所述前景目标区域对应的音频数据;根据所述第一距离调节所述音频数据的幅值。本发明还相应地公开了一种录像装置。采用本发明实施例,可以在进行录像的过程中对拍摄主体对应的声音进行调节,增加了录像中声音的真实性,提高了录像视频的质量,提升了用户体验。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种录像方法及装置。
背景技术
随着通信技术的不断发展,除了照相机之外,各种通信终端如智能手机、掌上电脑或穿戴设备等,也安装了摄像头,也能提供照相和录像功能,可使用户随时随地记录并分享周围的景色或时刻。
在现有的录像方法中,一般情况下是通过摄像头采集图像,并且在同时通过麦克风或者其声音采集装置采集录像环境中的声音形成音频数据,从而完成录像数据的采集。然而,在录像的过程中,麦克风都是机械地记录录像环境中的声音,在播放录像的过程中对音量进行调节时,也只能是简单的增大或降低所有音量;其他用户在观看视频时,不能准确的根据音频的声音大小来判断目标物与镜头之间的距离,也就是说,录像视频不能真实的反映录像视频中目标物的声音与距离之间的关系,严重影响用户体验。
因此,现有技术中的录像方法不能真实的反映目标物的声音与距离之间的关系,存在录像视频的真实性不足的问题。
发明内容
基于此,为解决上述提到的传统技术中的录像方法存在的录像视频真实性不足的技术问题,特提供了一种录像方法。
一种录像方法,包括:
接收录像启动指令,启动摄像头采集录像图像帧,查找所述录像图像帧中的前景目标区域;
检测与所述前景目标区域对应的第一距离;
获取麦克风采集的与所述前景目标区域对应的音频数据;
根据所述第一距离调节所述音频数据的幅值。
可选的,所述接收录像启动指令,启动摄像头采集录像图像帧,查找所述录像图像帧中的前景目标区域的步骤之后还包括:记录与所述前景目标区域对应的初始距离;所述根据所述第一距离调节所述音频数据的幅值的步骤包括:根据所述第一距离与所述初始距离的差值,调节所述音频数据的幅值。
可选的,所述根据所述第一距离与所述初始距离的差值,调节所述音频数据的幅值的步骤包括:根据预设的反比例系数,计算所述音频数据的幅值变化量,所述第一距离与所述初始距离的差值与所述音频数据的幅值变化量成反比;根据所述幅值变化量调节所述音频数据的幅值。
可选的,所述记录与所述前景目标区域对应的初始距离的步骤之后还包括:根据所述与所述前景目标区域对应的初始距离,计算与所述初始距离对应的初始音频幅值,所述初始距离与所述初始音频幅值成负相关关系;将所述初始音频幅值作为所述音频数据的初始幅值。
可选的,所述获取麦克风采集的与所述前景目标区域对应的音频数据的步骤之前还包括:通过麦克风采集录像环境中各声源发出的音频数据分量及与所述音频数据分量对应的第二距离;查找所述对应的第二距离与所述第一距离匹配的音频数据分量;将与所述查找到的音频数据分量作为所述与所述前景目标区域对应的音频数据存储。
可选的,所述通过麦克风采集录像环境中各声源发出的音频数据分量,获取与所述各声源发出的音频数据分量对应的第二距离的步骤包括:通过所述至少3个麦克风采集所述录像环境中各声源发出的音频数据分量,根据所述至少3个麦克风采集到所述音频数据分量的时间,计算所述与所述各声源发出的音频数据分量对应的第二距离。
可选的,所述检测与所述前景目标区域对应的第一距离的步骤包括:周期性地检测与所述前景目标区域对应的第一距离。
可选的,所述摄像头为双摄像头;所述检测与所述前景目标区域对应的第一距离的步骤包括:通过双摄像头获取所述前景目标区域对应的距离信息。
可选的,所述检测与所述前景目标区域对应的第一距离的步骤包括:选取所述前景目标区域中预设数量的像素点作为参考像素点,获取与所述参考像素点对应的距离信息;获取与所述参考像素点对应的距离信息的平均值作为所述与所述前景目标区域对应的第一距离。
此外,为解决上述提到的传统技术中的录像方法存在的录像视频真实性不足的技术问题,还提供了一种录像装置。
一种录像装置,包括:
图像获取模块,用于接收录像启动指令,启动摄像头采集录像图像帧,查找所述录像图像帧中的前景目标区域;
第一距离获取模块,用于检测与所述前景目标区域对应的第一距离;
音频数据获取模块,用于获取麦克风采集的与所述前景目标区域对应的音频数据;
幅值调节模块,用于根据所述第一距离调节所述音频数据的幅值。
可选的,所述装置还包括初始距离获取模块,用于记录与所述前景目标区域对应的初始距离;所述幅值调节模块还用于:根据所述第一距离与所述初始距离的差值,调节所述音频数据的幅值。
可选的,根据预设的反比例系数,计算所述音频数据的幅值变化量,所述第一距离与所述初始距离的差值与所述音频数据的幅值变化量成反比;根据所述幅值变化量调节所述音频数据的幅值。
可选的,所述装置还包括初始幅值获取模块,用于:根据所述与所述前景目标区域对应的初始距离,计算与所述初始距离对应的初始音频幅值,所述初始距离与所述初始音频幅值成负相关关系;将所述初始音频幅值作为所述音频数据的初始幅值。
可选的,所述装置还包括音频数据分量获取模块,用于:通过麦克风采集录像环境中各声源发出的音频数据分量及与所述音频数据分量对应的第二距离;查找所述对应的第二距离与所述第一距离匹配的音频数据分量;将与所述查找到的音频数据分量作为所述与所述前景目标区域对应的音频数据存储。
可选的,所述音频数据分量获取模块还用于:通过所述至少3个麦克风采集所述录像环境中各声源发出的音频数据分量;根据所述至少3个麦克风采集到所述音频数据分量的时间,计算所述与所述各声源发出的音频数据分量对应的第二距离。
可选的,所述第一距离获取模块还用于:周期性地检测与所述前景目标区域对应的第一距离。
可选的,所述摄像头为双摄像头;所述第一距离获取模块还用于:通过双摄像头获取所述前景目标区域对应的距离信息。
可选的,所述第一距离获取模块还用于:选取所述前景目标区域中预设数量的像素点作为参考像素点,获取与所述参考像素点对应的距离信息;获取与所述参考像素点对应的距离信息的平均值作为所述与所述前景目标区域对应的第一距离。
实施本发明实施例,将具有如下有益效果:
采用了上述录像方法及装置之后,在录像的过程中,可以根据录像的图像中的前景目标区域的距离,即根据拍摄的主体目标的距离,来计算与该距离对应的声音大小值,从而根据该声音大小来调节麦克风采集到的音频数据的声音大小,从而使得录像音频中的拍摄的主体目标的声音更加贴近实际情况,即更加贴近人耳听到的声音,增加了录像中声音的真实性,提高了录像视频的质量,提升了用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中一种录像方法的流程示意图;
图2为一个实施例中一种录像装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为解决上述提到的传统技术中的录像方法存在的录像视频真实性不足的技术问题,在本实施例中,特提供了一种录像方法,该方法可依赖于计算机实现,可运行于基于冯诺依曼体系的计算机系统上。该计算机程序可以是照相机应用或者录像机应用的客户端程序。该计算机系统可以是安装有摄像头的照相机应用或录像机应用的客户端的照相机、智能手机、平板电脑、掌上电脑、笔记本电脑或个人电脑等终端设备。
具体的,该录像方法如图1所示,包括如下步骤:
步骤S102:接收录像启动指令,启动摄像头采集录像图像帧,查找所述录像图像帧中的前景目标区域。
具体实现中,当终端为只具有录像功能的录像机时,用户开启终端的电源按钮,可视为用户输入录像启动指令;若终端为诸如智能手机、照相机等终端进行录像时,首先要启动终端中的照相机或录像机应用下的录像功能,启动该功能可视为输入了录像启动指令。在本实施例中,上述录像启动指令通常为用户通过终端的输入装置(物理键盘、按钮或触摸屏)输入的。
本实施例所提及的摄像头可为终端内置的摄像头,如自带摄像头的手机;本步骤在终端接收到录像启动指令时,启动摄像头并获取摄像头采集的录像图像帧。若终端未包含内置的摄像头,但与外部摄像头相连,如终端为PC(PersonalComputer,个人计算机),PC内未设置摄像头,但PC与外部摄像头相连接;本步骤在接收到录像启动指令时,启动与PC相连的摄像头,并获取摄像头采集的录像图像帧。
在本实施例中,一个图像帧即为构成整个录像的一张图片,视频就是由多个图像帧组成的,录像图像帧即为通过摄像头采集的目标图像,并且,在终端的显示屏上可以以图像帧的形式展示上述目标图像。
目标图像包括了背景和前景目标,在获取了目标图像之后,可以根据前景目标的分割算法提取目标图像中的前景目标对应的前景目标区域。需要说明的是,在本实施例中,前景目标区域的获取过程,既可以是终端根据获取到的目标图像,自动提取在目标图像中的前景目标所在的区域;还可以是根据用户选择的拍摄主体确定用户关心的前景目标,从而确定在该方法中需要获取的前景目标区域。
需要说明的是,前景目标区域的形状可以是为多种形状,例如,可以是以前景目标的中心在目标图像中的对应点为圆心、预设的长度为半径的圆,也可以是以前景目标的中心在目标图像中的对应点为中心的任意的预设形状,还可以是根据实际情况提取到的前景目标对应的像素点构成的区域,该区域即为前景目标区域。
步骤S104:检测与所述前景目标区域对应的第一距离。
第一距离即为前景目标区域对应的目标拍摄物与镜头之间的距离。上述前景目标区域对应的第一距离,可以通过对在步骤S102中已经查找得到的前景目标区域对焦,对焦成功后根据前景目标区域的像距和当前摄像头的焦距,计算与前景目标区域对应的目标物之间的距离值;还可通过在终端上安装测距传感器,如超声测距传感器、激光测距传感器、雷达测距传感器和红外线测距传感器等等,通过测距传感器去检测与目标拍摄对象之间的距离值。
在本实施例中,获取前景目标区域对应的第一距离还可以通过设置在终端上的双摄像头获取。具体的,在终端上设置有两个摄像头,需要说明的是,本实施例中的双摄像头不是例如智能手机的前后摄像头,而是设置在终端的某一侧的两个摄像头,也就是说,这两个摄像头可以同时对同一物体进行拍摄。具体的,使用两个摄像头分别成像,因为两个摄像头之前存在的一定的距离,所以同一物体所成的像会在像素点坐标等信息上存在一定的差别,也就是说,两个摄像头的分别成像,会有一定的视差存在。上述双摄像头成像的视差,可以用来估计和计算物体距离镜头的实体距离,即距离信息,并且可以进一步地获取每一个像素点的距离信息。
根据双摄像头测距原理,通过同一物体在两个摄像头采集的图像中的位置的不同,以及两个摄像头在终端上设置的位置和角度,计算该物体离镜头之间的距离、以及物体离两个镜头的连线的中点的距离。
可选的,在本实施例中,获取所述前景目标区域对应的第一距离步骤包括:选取所述前景目标区域中预设数量的像素点作为参考像素点,获取与所述参考像素点对应的距离信息;获取与所述参考像素点对应的距离信息的平均值作为所述与所述前景目标区域对应的第一距离。
需要说明的是,在上述前景目标区域所对应的第一距离的获取中,获取的第一距离用以代表整个前景目标区域中所有像素点的距离信息。
在本实施例中,用哪一个点或者哪个区域的距离信息用来代表与前景目标区域对应的目标人物的脸部区域的距离信息,是可以进行选择的,如,可以为用户实现设定的,也可以是系统预设的,或者,也可以是系统随机选定的一种方式。
具体的,可以取前景目标区域内的任意一点的距离信息,用该点的距离信息代表整个前景目标区域对应的第一距离。还可以是取前景目标区域中满足预设条件的某一个特定点的对应的距离信息,用以代替整个前景目标区域对应的第一距离,例如取距离信息对应的值最大的像素点的距离信息,例如取前景目标区域的中心点对应的距离信息。在另一个实施例中,前景目标区域对应的第一距离的获取还可以是通过获取前景目标区域中的每一个像素点对应的距离,并计算所有点对应的距离的平均值,以该平均值来代表前景目标区域的距离信息。
在另一个实施例中,与前景目标区域对应的第一距离的获取还可以为如下计算方式:随机选取前景目标区域内一定数量的像素点,以这些像素点为参考像素点,获取上述参考像素点对应的距离信息,然后计算所有参考像素点的距离信息的平均值,以该平均值为与前景目标区域对应的第一距离。
步骤S106:获取麦克风采集的与所述前景目标区域对应的音频数据。
具体的,在录像过程中,除了要启动摄像头采集录像图像帧之外,还需要通过麦克风或者其他声音采集装置采集录像环境中的声音作于录像视频的音频数据。在本实施例中,主要是需要获取与前景目标区域对应的音频数据,即前景目标区域对应的拍摄主体作为声源所发出的声音形成的音频数据。
需要说明的是,在本实施例中,在录像环境中,可能会存在多个声源,每个声源发出的声音综合起来就形成了麦克风采集到的录像的所有音频数据。也就说说,麦克风采集到的音频数据为多个声源所发出的声音对应的音频数据分量的总和。
可选的,在本实施例中,在步骤S106:获取麦克风采集的与所述前景目标区域对应的音频数据之前,该录像方法还包括:通过麦克风采集录像环境中各声源发出的音频数据分量及与所述音频数据分量对应的第二距离;查找所述对应的第二距离与所述第一距离匹配的音频数据分量;将与所述查找到的音频数据分量作为所述与所述前景目标区域对应的音频数据存储。
具体实现中,各声音信号分量到达声音采集装置时已混叠,此时可过采用声音分离技术,去获取各声源相对应的音频数据分量(即各声源对应的声音信号分量)。例如采用基于声音基频的混叠声音信号分离方法,可先把混叠的声音信号进行傅里叶变换,把时域上的信号转变成频域信号,然后在频域上将出现的主频信号分开,即分别通过带通滤波器就得到各主频信号的频谱,再将分离后的频谱变换到时域上来以获取各声音信号分量的时域信号。
在获取音频数据的过程的同时,获取的信息还包括与音频数据对应的距离信息,即发出该音频数据对应的声音的声源的距离信息。因为上述音频数据包括了各个声源所发出的音频数据分量,因此,上述距离信息也包括了与各个声源所发出的音频数据分量对应的距离信息,在本实施例中,即为与音频数据分量对应的第二距离。
需要说明的是,在本实施例中,上述与音频数据分量对应的第二距离是用来判断该音频数据分量所对应的声源是否是步骤S102中所查找到的前景目标区域,也就是说,在本实施例中,对声音或者音频的调节,都是根据目标图像中的前景目标区域来操作的,因此需要判断获取到的声音是否与步骤S102中查找到的前景目标区域对应,只有在上述判断过程中的判断结果为是时,才能根据前景目标区域对该音频数据进行调节。因此,在本实施例中,在所有音频数据分量中查找其对应的第二距离与上述第一距离匹配的音频数据分量,该音频数据分量就是我们所需要的与前景目标区域对应的音频数据,因此,将与所述查找到的音频数据分量作为所述与所述前景目标区域对应的音频数据存储。
需要说明的是,上述查找其对应的第二距离与上述第一距离匹配的音频数据分量的过程中的匹配过程,为一个判断两个距离值是否匹配的过程,例如,在二者相等时即判定为匹配,再例如,在二者的差值小于预设的阈值时即判定为匹配。
进一步地,所述通过麦克风采集录像环境中各声源发出的音频数据分量,获取与所述各声源发出的音频数据分量对应的第二距离的步骤包括:通过所述至少3个麦克风采集所述录像环境中各声源发出的音频数据分量,根据所述至少3个麦克风采集到所述音频数据分量的时间,计算所述与所述各声源发出的音频数据分量对应的第二距离。
在实际实施过程中,可在终端上安装麦克风阵列,采用麦克风阵列的声源定位方法来对录像环境中的各声源进行声源定位。其中基于麦克风阵列的声源定位方法包括:基于最大输出功率的可控波束形成技术、基于高分辨率谱估计的定向技术和基于到声音信号的到达时间差技术。由于基于到声音信号的到达时间差技术计算量小、精度高,因此此种方法在实际应用中常被采用。在采用麦克风阵列的声源定位方法来对录像环境中的各声源进行声源定位之后,便可获取录像环境中各声源与终端之间的距离值,还可获取各声源相对于终端的方位。
具体的,可在终端上安装至少三个麦克风,在同一个平面中任意一点到固定三个点的距离是唯一的,即通过任意三点可以确定平面中另外一个点。由于上述麦克风是固定在终端上的,即上述麦克风的位置是已知的,这样麦克风之间的位置距离就是已知的,而声音信号传播的速度也是已知,这些已知条件再加各麦克风的接收时间就可以计算出各声源与终端的相对位置,例如:通过平面几何相关算法计算出各声源与终端的相对位置。对录像环境中的各声源进行声源定位之后,便可获取录像环境中各声源与终端之间的距离值,还可获取各声源相对于终端的方位,终端获取各声源与终端之间的距离值作为第二距离。
步骤S108:根据所述第一距离调节所述音频数据的幅值。
音频数据包括了音频的声音的大小,或者说声音的振幅大小,在本实施例中,将表示声音大小的属性信息称为声音的幅值,即音频数据的幅值代表了音频数据的声音大小。因为声音是经过空气传播的,并且距离越远,声音衰减得越厉害,也就是说,距离与声音的大小是成负相关关系的。在本实施例中,根据距离与幅值之间的关系,可以计算得到与第一距离对应的合音频数据的幅值期望值,因此,可以根据第一距离调节音频数据的幅值。
需要说明的是,在本实施例中,步骤S108是根据步骤S104中获取到的第一距离执行的,在步骤S104中,检测与前景目标区域对应的第一距离,既可以是实时的进行检测,针对每一张录像图像帧都分别查找对应的前景目标区域,以及获取与前景目标区域对应的第一距离;在另一个实施例中,为了节省计算量,不影响实时录制的录像质量,还可以选择每个一段时间执行一次上述步骤,即查找录像图像中的前景目标区域,获取与前景目标区域对应的第一距离,也就是说,上述步骤的执行是周期性的,可以节省实时录制过程中的计算量。
进一步地,在本实施例中,还后续的录制过程中,为了节省录制过程中的计算量,还可以在获取与前景目标区域对应的第一距离的过程中,距离的获取采取获取前景目标区域中某个特定的像素点的距离来代替,例如,获取前景目标区域的中心点的距离代替,即用该点的距离信息代表前景目标区域对应的第一距离,从而可以节省计算量。
可选的,在步骤S102:接收录像启动指令,启动摄像头采集录像图像帧,查找所述录像图像帧中的前景目标区域之后,本方法还包括:记录与所述前景目标区域对应的初始距离;步骤S108具体为:根据所述第一距离与所述初始距离的差值,调节所述音频数据的幅值。
具体的,根据预设的反比例系数,计算所述音频数据的幅值变化量,所述第一距离与所述初始距离的差值与所述音频数据的幅值变化量成反比;根据所述幅值变化量调节所述音频数据的幅值。
进一步地,还可以根据所述与所述前景目标区域对应的初始距离,计算与所述初始距离对应的初始音频幅值,所述初始距离与所述初始音频幅值成负相关关系;将所述初始音频幅值作为所述音频数据的初始幅值。
具体的,可以首先设定在录像的初始时刻的音频数据对应的幅值大小,即初始音频幅值。在录像的初始时刻,记录与前景目标区域对应的初始距离,然后根据上述初始距离,计算与初始距离对应的初始音频幅值。
需要说明的是,初始距离与初始音频幅值成负相关关系。在本实施例中,初始距离与初始音频幅值之间的负相关关系可以是:初始音频幅值与初始距离成反比例关系,且相关的反比例系数可以通过实际的实验获取。
然后可以根据第一距离与初始距离的差值,调节音频数据的幅值。具体的,在本实施例中,不妨设距离与音频数据的幅值成反比例关系,因此,距离的变化量与音频数据的幅值变化量也是成反比例关系,并且,反比例系数是相同的。
因此,根据预设的反比例系数,在已经获取初始距离和第一距离的情况下,可以通过求取第一距离与初始距离的差值得到距离的变化量,从而可以根据反比例关系计算音频数据的幅值应该有的幅值变化量,即对应的音频数据的幅值大小与初始音频幅值的差值,从而确定音频数据的幅值。
执行上述步骤之后,可以根据获取到的视频信息对应的录像图像帧以及获取到的音频数据,得到最后的录像数据。与现有技术中的直接机械性的采集图像资料和音频资料,用本方法得到的录像数据中的音频数据,可以更真实的反映距离与声音之间的关系,也就是说,可以根据声音的大小去估计距离的大小,也就是说,用本方法得到的录像数据的真实性会更高。
为解决上述提到的传统技术中的录像方法存在的录像视频真实性不足的技术问题,在本实施例中,还提供了一种录像装置,该装置包括图像获取模块102、第一距离获取模块104、音频数据获取模块106以及幅值调节模块108,其中:
图像获取模块102,用于接收录像启动指令,启动摄像头采集录像图像帧,查找录像图像帧中的前景目标区域;
第一距离获取模块104,用于检测与前景目标区域对应的第一距离;
音频数据获取模块106,用于获取麦克风采集的与前景目标区域对应的音频数据;
幅值调节模块108,用于根据第一距离调节音频数据的幅值。
可选的,在本实施例中,上述录像装置还包括初始距离获取模块110,用于记录与前景目标区域对应的初始距离;幅值调节模块108还用于:根据第一距离与初始距离的差值,调节音频数据的幅值。
可选的,在本实施例中,幅值调节模块108还用于:根据预设的反比例系数,计算音频数据的幅值变化量,第一距离与初始距离的差值与音频数据的幅值变化量成反比;根据幅值变化量调节音频数据的幅值。
可选的,在本实施例中,上述录像装置还包括初始幅值获取模块112,用于根据与前景目标区域对应的初始距离,计算与初始距离对应的初始音频幅值,初始距离与初始音频幅值成负相关关系;将初始音频幅值作为音频数据的初始幅值。
可选的,在本实施例中,上述录像装置还包括音频数据分量获取模块114,用于通过麦克风采集录像环境中各声源发出的音频数据分量及与音频数据分量对应的第二距离;查找对应的第二距离与第一距离匹配的音频数据分量;将与查找到的音频数据分量作为与前景目标区域对应的音频数据存储。
可选的,在本实施例中,音频数据分量获取模块114还用于:通过至少3个麦克风采集录像环境中各声源发出的音频数据分量;根据至少3个麦克风采集到音频数据分量的时间,计算与各声源发出的音频数据分量对应的第二距离。
可选的,在本实施例中,第一距离获取模块104还用于:周期性地检测与前景目标区域对应的第一距离。
可选的,在本实施例中,摄像头为双摄像头;第一距离获取模块104还用于:通过双摄像头获取前景目标区域对应的距离信息。
可选的,在本实施例中,第一距离获取模块104还用于:选取前景目标区域中预设数量的像素点作为参考像素点,获取与参考像素点对应的距离信息;获取与参考像素点对应的距离信息的平均值作为与前景目标区域对应的第一距离。
实施本发明实施例,将具有如下有益效果:
采用了上述录像方法及装置之后,在录像的过程中,可以根据录像的图像中的前景目标区域的距离,即根据拍摄的主体目标的距离,来计算与该距离对应的声音大小值,从而根据该声音大小来调节麦克风采集到的音频数据的声音大小,从而使得录像音频中的拍摄的主体目标的声音更加贴近实际情况,即更加贴近人耳听到的声音,增加了录像中声音的真实性,提高了录像视频的质量,提升了用户体验。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (18)
1.一种录像方法,其特征在于,包括:
接收录像启动指令,启动摄像头采集录像图像帧,查找所述录像图像帧中的前景目标区域;
检测与所述前景目标区域对应的第一距离;
获取麦克风采集的与所述前景目标区域对应的音频数据;
根据所述第一距离调节所述音频数据的幅值。
2.根据权利要求1所述的录像方法,其特征在于,所述接收录像启动指令,启动摄像头采集录像图像帧,查找所述录像图像帧中的前景目标区域的步骤之后还包括:
记录与所述前景目标区域对应的初始距离;
所述根据所述第一距离调节所述音频数据的幅值的步骤包括:
根据所述第一距离与所述初始距离的差值,调节所述音频数据的幅值。
3.根据权利要求2所述录像方法,其特征在于,所述根据所述第一距离与所述初始距离的差值,调节所述音频数据的幅值的步骤包括:
根据预设的反比例系数,计算所述音频数据的幅值变化量,所述第一距离与所述初始距离的差值与所述音频数据的幅值变化量成反比;
根据所述幅值变化量调节所述音频数据的幅值。
4.根据权利要求2所述的录像方法,其特征在于,所述记录与所述前景目标区域对应的初始距离的步骤之后还包括:
根据所述与所述前景目标区域对应的初始距离,计算与所述初始距离对应的初始音频幅值,所述初始距离与所述初始音频幅值成负相关关系;
将所述初始音频幅值作为所述音频数据的初始幅值。
5.根据权利要求1所述的录像方法,其特征在于,所述获取麦克风采集的与所述前景目标区域对应的音频数据的步骤之前还包括:
通过麦克风采集录像环境中各声源发出的音频数据分量及与所述音频数据分量对应的第二距离;
查找所述对应的第二距离与所述第一距离匹配的音频数据分量;
将与所述查找到的音频数据分量作为所述与所述前景目标区域对应的音频数据存储。
6.根据权利要求5所述的录像方法,其特征在于,所述通过麦克风采集录像环境中各声源发出的音频数据分量,获取与所述各声源发出的音频数据分量对应的第二距离的步骤包括:
通过所述至少3个麦克风采集所述录像环境中各声源发出的音频数据分量;
根据所述至少3个麦克风采集到所述音频数据分量的时间,计算所述与所述各声源发出的音频数据分量对应的第二距离。
7.根据权利要求1所述的录像方法,其特征在于,所述检测与所述前景目标区域对应的第一距离的步骤包括:
周期性地检测与所述前景目标区域对应的第一距离。
8.根据权利要求1所述的录像方法,其特征在于,所述摄像头为双摄像头;
所述检测与所述前景目标区域对应的第一距离的步骤包括:
通过双摄像头获取所述前景目标区域对应的距离信息。
9.根据权利要求1或8所述的录像方法,其特征在于,所述检测与所述前景目标区域对应的第一距离的步骤包括:
选取所述前景目标区域中预设数量的像素点作为参考像素点,获取与所述参考像素点对应的距离信息;
获取与所述参考像素点对应的距离信息的平均值作为所述与所述前景目标区域对应的第一距离。
10.一种录像装置,其特征在于,包括:
图像获取模块,用于接收录像启动指令,启动摄像头采集录像图像帧,查找所述录像图像帧中的前景目标区域;
第一距离获取模块,用于检测与所述前景目标区域对应的第一距离;
音频数据获取模块,用于获取麦克风采集的与所述前景目标区域对应的音频数据;
幅值调节模块,用于根据所述第一距离调节所述音频数据的幅值。
11.根据权利要求10所述的录像装置,其特征在于,所述装置还包括初始距离获取模块,用于记录与所述前景目标区域对应的初始距离;
所述幅值调节模块还用于:根据所述第一距离与所述初始距离的差值,调节所述音频数据的幅值。
12.根据权利要求11所述录像装置,其特征在于,所述幅值调节模块还用于:
根据预设的反比例系数,计算所述音频数据的幅值变化量,所述第一距离与所述初始距离的差值与所述音频数据的幅值变化量成反比;
根据所述幅值变化量调节所述音频数据的幅值。
13.根据权利要求11所述的录像装置,其特征在于,所述装置还包括初始幅值获取模块,用于:
根据所述与所述前景目标区域对应的初始距离,计算与所述初始距离对应的初始音频幅值,所述初始距离与所述初始音频幅值成负相关关系;
将所述初始音频幅值作为所述音频数据的初始幅值。
14.根据权利要求10所述的录像装置,其特征在于,所述装置还包括音频数据分量获取模块,用于:
通过麦克风采集录像环境中各声源发出的音频数据分量及与所述音频数据分量对应的第二距离;
查找所述对应的第二距离与所述第一距离匹配的音频数据分量;
将与所述查找到的音频数据分量作为所述与所述前景目标区域对应的音频数据存储。
15.根据权利要求14所述的录像装置,其特征在于,所述音频数据分量获取模块还用于:
通过所述至少3个麦克风采集所述录像环境中各声源发出的音频数据分量;
根据所述至少3个麦克风采集到所述音频数据分量的时间,计算所述与所述各声源发出的音频数据分量对应的第二距离。
16.根据权利要求10所述的录像装置,其特征在于,所述第一距离获取模块还用于:周期性地检测与所述前景目标区域对应的第一距离。
17.根据权利要求10所述的录像装置,其特征在于,所述摄像头为双摄像头;
所述第一距离获取模块还用于:通过双摄像头获取所述前景目标区域对应的距离信息。
18.根据权利要求10或17所述的录像装置,其特征在于,所述第一距离获取模块还用于:
选取所述前景目标区域中预设数量的像素点作为参考像素点,获取与所述参考像素点对应的距离信息;
获取与所述参考像素点对应的距离信息的平均值作为所述与所述前景目标区域对应的第一距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510676091.5A CN105245811B (zh) | 2015-10-16 | 2015-10-16 | 一种录像方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510676091.5A CN105245811B (zh) | 2015-10-16 | 2015-10-16 | 一种录像方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105245811A true CN105245811A (zh) | 2016-01-13 |
CN105245811B CN105245811B (zh) | 2018-03-27 |
Family
ID=55043286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510676091.5A Expired - Fee Related CN105245811B (zh) | 2015-10-16 | 2015-10-16 | 一种录像方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105245811B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107071271A (zh) * | 2017-02-16 | 2017-08-18 | 中国石油化工股份有限公司 | 一体化便携防爆摄像系统 |
CN108419016A (zh) * | 2018-04-17 | 2018-08-17 | 北京小米移动软件有限公司 | 拍摄方法、装置及终端 |
CN110740259A (zh) * | 2019-10-21 | 2020-01-31 | 维沃移动通信有限公司 | 视频处理方法及电子设备 |
WO2020062900A1 (zh) * | 2018-09-29 | 2020-04-02 | 华为技术有限公司 | 一种声音处理方法、装置与设备 |
CN111050269A (zh) * | 2018-10-15 | 2020-04-21 | 华为技术有限公司 | 音频处理方法和电子设备 |
CN111724823A (zh) * | 2016-03-29 | 2020-09-29 | 联想(北京)有限公司 | 一种信息处理方法及装置、电子设备 |
WO2023193803A1 (zh) * | 2022-04-08 | 2023-10-12 | 南京地平线机器人技术有限公司 | 音量控制方法、装置、存储介质和电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104934037A (zh) * | 2015-06-02 | 2015-09-23 | 阔地教育科技有限公司 | 一种直录播互动系统中的音频处理方法及装置 |
-
2015
- 2015-10-16 CN CN201510676091.5A patent/CN105245811B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104934037A (zh) * | 2015-06-02 | 2015-09-23 | 阔地教育科技有限公司 | 一种直录播互动系统中的音频处理方法及装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724823A (zh) * | 2016-03-29 | 2020-09-29 | 联想(北京)有限公司 | 一种信息处理方法及装置、电子设备 |
CN111724823B (zh) * | 2016-03-29 | 2021-11-16 | 联想(北京)有限公司 | 一种信息处理方法及装置 |
CN107071271A (zh) * | 2017-02-16 | 2017-08-18 | 中国石油化工股份有限公司 | 一体化便携防爆摄像系统 |
CN108419016A (zh) * | 2018-04-17 | 2018-08-17 | 北京小米移动软件有限公司 | 拍摄方法、装置及终端 |
CN108419016B (zh) * | 2018-04-17 | 2022-03-11 | 北京小米移动软件有限公司 | 拍摄方法、装置及终端 |
WO2020062900A1 (zh) * | 2018-09-29 | 2020-04-02 | 华为技术有限公司 | 一种声音处理方法、装置与设备 |
CN111050269A (zh) * | 2018-10-15 | 2020-04-21 | 华为技术有限公司 | 音频处理方法和电子设备 |
CN110740259A (zh) * | 2019-10-21 | 2020-01-31 | 维沃移动通信有限公司 | 视频处理方法及电子设备 |
CN110740259B (zh) * | 2019-10-21 | 2021-06-25 | 维沃移动通信有限公司 | 视频处理方法及电子设备 |
WO2023193803A1 (zh) * | 2022-04-08 | 2023-10-12 | 南京地平线机器人技术有限公司 | 音量控制方法、装置、存储介质和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN105245811B (zh) | 2018-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105245811A (zh) | 一种录像方法及装置 | |
US10616706B1 (en) | Estimating room acoustic properties using microphone arrays | |
CN100551028C (zh) | 用于音源追踪的装置和方法 | |
KR101771339B1 (ko) | 자체 적응 서라운드 사운드를 구현하는 방법 및 시스템 | |
CN105578097A (zh) | 一种录像方法及终端 | |
US20150022636A1 (en) | Method and system for voice capture using face detection in noisy environments | |
EP2882170A1 (en) | Audio information processing method and apparatus | |
US20210375258A1 (en) | An Apparatus and Method for Processing Volumetric Audio | |
CN103516985A (zh) | 移动终端及其获取图像的方法 | |
CN105208287B (zh) | 一种拍摄方法和装置 | |
CN108668077A (zh) | 摄像头控制方法、装置、移动终端及计算机可读介质 | |
CN104205828A (zh) | 用于自动3d图像创建的方法和系统 | |
US9197870B1 (en) | Automatic projection focusing | |
JP2017118375A (ja) | 電子機器及び音出力制御方法 | |
CN105323480A (zh) | 一种基于超声波的拍照方法及装置 | |
CN106331501A (zh) | 声音采集方法及装置 | |
CN104205825A (zh) | 图像处理装置及方法以及摄像装置 | |
EP2888716B1 (en) | Target object angle determination using multiple cameras | |
EP3929920B1 (en) | Method and device for processing audio signal, and storage medium | |
CN105208283A (zh) | 一种声控拍照的方法及装置 | |
CN108600623B (zh) | 重聚焦显示方法以及终端设备 | |
CN116095254B (zh) | 音频处理方法和装置 | |
US11902754B2 (en) | Audio processing method, apparatus, electronic device and storage medium | |
CN108924529A (zh) | 图像显示的控制方法及装置 | |
CN113709353B (zh) | 图像采集方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Patentee after: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd. Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Patentee before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd. |
|
CP01 | Change in the name or title of a patent holder | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180327 |
|
CF01 | Termination of patent right due to non-payment of annual fee |