CN108604453A

CN108604453A - 一种定向录音方法及电子设备

Info

Publication number: CN108604453A
Application number: CN201680080704.1A
Authority: CN
Inventors: 仇存收; 陶凯; 韩博; 李硕
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2016-10-31
Filing date: 2016-10-31
Publication date: 2018-09-28
Anticipated expiration: 2036-10-31
Also published as: WO2018076387A1; CN108604453B

Abstract

一种定向录音方法及电子设备，涉及音视频处理领域，能够精确定位声源的三维空间方位，以便对期望的录音范围内的声音信号进行拾取，大大提高了声音信号与期望录音范围的匹配程度，实现更准确的定向录音。方法包括：电子设备确定预设录音范围；预设录音范围包括水平角度范围以及俯仰角度范围(101)；电子设备获取麦克风阵列收集到的声音信号(102)；电子设备确定声音信号的声源的方位信息；方位信息包括声源的水平角度与声源的俯仰角(103)；电子设备根据声源的方位信息判断声源是否在预设录音范围内(104)；若声源不在预设录音范围内，则消除声音信号(105)；若声源在预设录音范围内，则存储声音信号(106)。

Description

一种定向录音方法及电子设备

技术领域

本发明涉及音视频处理领域，尤其涉及一种定向录音方法及电子设备。

背景技术

在使用便携式移动终端设备进行录像过程时，麦克风拾取声音范围和终端设备屏幕录制的范围不一致。其中，麦克风录制音频是全向的，即可以拾取各个范围的声音，而终端设备摄像头的录制范围在水平方向、俯仰方向均有限制。

但在许多情况下，用户更关注所录制视频画面内的声音，希望对画面外的声音或者环境噪声能够进行有效抑制。示例的：用户使用前置摄像头自拍时，希望能有效抑制画面以外的干扰音源，凸显自己的声音。

目前，终端设备的两个摄像头一侧各设置一个指向性麦克风，设置于前置摄像头一侧的麦克风用于拾取前置摄像头一侧的声音，设置于后置摄像头一侧的麦克风用于拾取后置摄像头一侧的声音。在使用前置摄像头(或后置摄像头)进行录音时，可以使得收集到摄像头一侧的声音尽可能多于摄像头背侧的声音。如此，可以对摄像头方向的背侧区域的声音进行抑制，使得终端的预设录音范围尽可能与视频录制范围匹配。但在实际使用过程中，实际的拾音范围(即终端摄像头前侧区域)依然远大于视频录制范围，导致音视频录制范围匹配程度不够理想，也就是说实际的录音范围远远大于期望的录音范围，难以实现精准的定向录音。

发明内容

本发明的实施例提供一种定向录音方法及电子设备，在使用电子设备录音时，能够精确定位声源的三维空间方位，以便对期望的录音范围内的声音信号进行拾取，大大提高了声音信号与期望录音范围的匹配程度，实现更准确的定向录音。

为达到上述目的，本发明的实施例采用如下技术方案：

第一方面，公开了一种定向录音方法，方法包括：

电子设备确定预设录音范围，该预设录音范围是用户期望的录音范围，包括水平角度范围以及俯仰角度范围。其次，开始录音后，电子设备可以获取声音信号，进一步确定该声音信号的声源的方位信息，这里确定的方位信息包括声源的水平角与声源的俯仰角。从而电子设备就可以根据声源的方位信息判断声源是否在预设录音范围内，若是声源不在预设录音范围内，则消除该声音信号；若是声源在预设录音范围内，则存储声音信号。

本发明实施例提供的定向录音方法，首先确定预设录音范围的包括的水平角度范围以及俯仰角度范围，进一步还可以确定出声源的空间方位(声源的水平角，俯仰角)，从而可以判断声源的水平角、俯仰角是否在预设录音范围内。可以将不在预设录音范围内的声源的声音信号消除，相反，保留在预设录音范围内的声源的声音信号。相比之下，现有技术仅仅可以对摄像头一侧的声音进行抑制，实际的预设录音范围远远大于用户期望的预设录音范围，定向录音的效果并不理想。可见，本发明实施例提供的方法可以准确获取预设录音范围内的声音信号，达到更准确的定向录音的效果。

结合第一方面，在第一方面的第一种可能的实现方式中，电子设备根据声源的方位信息判断声源是否在预设录音范围内具体包括：电子设备同时判断声源的水平角是否在水平角度范围内，声源的俯仰角是否在俯仰角度范围内。若水平角在水平角度范围内且俯仰角在俯仰角度范围内，则确定声源在预设录音范围内。当声源的水平角、俯仰角二者之一不在预设录音范围则确定声源不在预设录音范围内。

结合第一方面或第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，电子设备包括麦克风阵列，麦克风阵列包括第一麦克风、第二麦克风、第三麦克风和第四麦克风且第一麦克风、第二麦克风、第三麦克风和第四麦克风不在同一平面内。其中，第一麦克风位于电子设备的第一表面，第二麦克风位于电子设备的第二表面，第三麦克风与第四麦克风位于电子设备的第三表面，第一表面与第二表面平行设置，第三表面与第一表面垂直，且第三表面与、第二表面均垂直。电子设备收集声音信号具体包括：电子设备获取麦克风阵列所收集到的声音信息。

这里，麦克风阵列包括的四个麦克风分别在空间三个维度(即第一坐标轴的方向、第二坐标轴的方向、第三坐标轴的方向)提供阵列孔径。所谓阵列孔径即任意一对麦克风之间的连线。通常，根据声源到达一对麦克风的时延差，可以确定出声源与这一对麦克风连线的夹角。由于，麦克风阵列在空间三个维度提供阵列孔径，因此可以确定出声源与空间三个维度的夹角，这三个夹角可以确定声源的空间方位。

结合第一方面的第二种可能的实现方式，在第一方面的第三种可能的实现方式中，进一步地，第一麦克风与第二麦克风所在直线垂直于第三麦克风与第四麦克风所在直线。则，电子设备确定声音信号的声源的方位信息具体包括：

电子设备确定声源的到达方向与三维坐标系的第一坐标轴的第一夹角，到达方向与三维坐标系的第二坐标轴的第二夹角；到达方向与三维坐标系的第三坐标轴的第三夹角；电子设备根据第一夹角、第二夹角、第三夹角确定声源的方位信息。这里的第一坐标轴为第三麦克风和第四麦克风所在直线，第二坐标轴与第一坐标轴相交且与第一麦克风与第二麦克风所在直线平行，第三坐标轴穿过第一坐标轴与第二坐标轴的交点，且与第一坐标轴与第二坐标轴构成的平面垂直。

具体实现中，可以根据麦克风阵列的布局确定出一个空间三维坐标系，进而确定出声源相对于该空间三维坐标系的水平角以及俯仰角，同样的，预设录音范围的水平角度范围、俯仰角度范围也是相对于该三维坐标系的角度范围，如此才能将声源的水平角与预设录音范围的水平角度范围作比较，将声源的俯仰角与预设录音范围的俯仰角度范围作比较。

结合第一方面的第三种可能的实现方式，在第一方面的第四种可能的实现方式中，电子设备确定入射轨迹与三维坐标系的第一坐标轴的第一夹角，入射轨迹与三维坐标系的第二坐标轴的第二夹角；入射轨迹与三维坐标系的第三坐标轴的第三夹角具体包括：确定声源到达第一麦克风与第二麦克风的第一时延差，根据第一时延差确定第一麦克风、第二麦克风所在直线与到达方向的夹角，将第一麦克风、第二麦克风所在直线与到达方向的夹角确定为二夹角；确定声源到达第三麦克风与第四麦克风的第二时延差，根据第二时延差确定第三麦克风、第四麦克风所在直线与到达方向的夹角，将第三麦克风、第四麦克风所在直线与到达方向的夹角确定为第一夹角；确定声源到达第三麦克风与第二麦克风的第三时延差，根据第三时延差确定第三麦克风、第二麦克风所在直线与到达方向的夹角，确定第三麦克风、第二麦克风所在直线与到达方向的夹角为三夹角。

在远场模型中，认为声源到达一对麦克风阵列的方向与麦克风阵列连线的夹角是唯一的，因此根据声源到达麦克风对的时延差可以确定出声源到达方向与麦克风对连线的夹角。同时，由于麦克风对连线与上述三维坐标系的坐标轴的位置关系是已知的，因此，确定了声源到达方向与麦克风对连线的夹角，进而就可以确定出声源到达方向与三维坐标系的每一个坐标轴的夹角，定位出声源相对于该三维坐标系的水平角，以及俯仰角。

结合第一方面的第三或第四种可能的实现方式，在第一方面的第五种可能的实现方式中，根据第一夹角、第二夹角、第三夹角确定声源的方位信息具体包括：当使用电子设备横屏拍摄时，确定第一夹角为声源的俯仰角，确定第二夹角、第三夹角为声源的水平角。当使用电子设备竖屏拍摄时，确定第三夹角为声源的俯仰角，确定第一夹角、第二夹角为声源的水平角。

结合第一方面的第二种可能的实现方式，在第一方面的第六种可能的实现方式中，电子设备还包括摄像头，则，电子设备确定预设录音范围具体包括：电子设备接收视频录制指令；视频录制指令携带录制视频的摄像头的信息；电子设备运行信息指示的摄像头进行拍摄，根据摄像头的拍摄范围确定预设录音范围。

如此，在使用电子设备录制视频时，精确定位声源的三维空间方位，仅对录制画面内的声源进行拾取，大大提高音频录制范围与视频录制范围的匹配程度。

结合第一方面的第六种可能的实现方式，在第一方面的第七种可能的实现方式中，摄像头为第一摄像头和/或第二摄像头，第一摄像头位于第一表面，第二摄像头位于第二表面；第一麦克风与第二麦克风生成第一波束和第二波束，第一波束形成于第一表面一侧，第二波束形成于第二表面一侧；电子设备消除声音信号具体包括：若信息指示的摄像头为第一摄像头，则根据第二波束学习第一波束生成第一抵消波束，根据第一抵消波束消除声音信号；若信息指示的摄像头为第二摄像头，则根据第一波束学习第二波束生成第二抵消波束；根据第二抵消波束消除声音信号。

具体实现中，电子设备通过算法实现一个自适应抵消器，采用后置摄像头拍摄时，则将后置摄像头一侧的波束作为主通道的输入，调整学习步长使得前置摄像头一侧的波束学习后置摄像头一侧的波束，之后两路波束相抵消就可以消除该声音信号。同样的，采用前置摄像头拍摄时，则将前置摄像头一侧的波束作为主通道的输入，调整学习步长使得后置摄像头一侧的波束学习前置摄像头一侧的波束，之后两路波束相抵消就可以消除该声音信号。

第二方面，公开了一种电子设备，包括：

处理器，确定预设录音范围；预设录音范围包括水平角度范围以及俯仰角度范围；处理器还用于，获取声音信号，确定声音信号的声源的方位信息，根据声源的方位信息以及预设录音范围判断声源是否在预设录音范围内；方位信息包括声源的水平角度与声源的俯仰角；处理器还用于，若声源不在预设录音范围内，则消除声音信号；若声源在预设录音范围内，则存储声音信号。

结合第二方面，在第二方面的第一种可能的实现方式中，处理器具体用于，判断水平角是否在水平角度范围内，以及俯仰角是否在俯仰角度范围内；若水平角在水平角度范围内且俯仰角在俯仰角度范围内，则确定声源在预设录音范围内；若水平角不在水平角度范围内和/或俯仰角不在俯仰角度范围内，则确定声源不在预设录音范围内。

结合第二方面或第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，电子设备包括麦克风阵列，麦克风阵列包括第一麦克风、第二麦克风、第三麦克风和第四麦克风且第一麦克风、第二麦克风、第三麦克风和第四麦克风不在同一平面内。其中，第一麦克风位于电子设备的第一表面，第二麦克风位于电子设备的第二表面，第三麦克风与第四麦克风位于电子设备的第三表面，第一表面与第二表面平行设置，第三表面与第一表面垂直，且与第二表面垂直。麦克风阵列具体用于，收集声音信号；处理器具体用于，获取麦克风阵列收集到的信号。

结合第二方面的第二种可能的实现方式，在第二方面的第三种可能的实现方式中，第三麦克风和第四麦克风所在直线与第一麦克风和第二麦克风所在直线垂直。处理器具体用于，确定声源的到达方向与三维坐标系的第一坐标轴的第一夹角，到达方向与三维坐标系的第二坐标轴的第二夹角；到达方向与三维坐标系的第三坐标轴的第三夹角；根据第一夹角、第二夹角、第三夹角确定声源的方位信息。其中，第一坐标轴为第三麦克风和第四麦克风所在直线，第二坐标轴与第一坐标轴相交且与第一麦克风与第二麦克风所在直线平行，第三坐标轴穿过第一坐标轴与第二坐标轴的交点，且与第一坐标轴与第二坐标轴构成的平面垂直。

结合第二方面的第三种可能的实现方式，在第二方面的第四种可能的实现方式中，处理器具体用于，确定声源到达第一麦克风与第二麦克风的第一时延差，根据第一时延差确定第一麦克风、第二麦克风所在直线与到达方向的夹角，将第一麦克风、第二麦克风所在直线与到达方向的夹角确定为二夹角；确定声源到达第三麦克风与第四麦克风的第二时延差，根据第二时延差确定第三麦克风、第四麦克风所在直线与到达方向的夹角，将第三麦克风、第四麦克风所在直线与到达方向的夹角确定为第一夹角；确定声源到达第三麦克风与第二麦克风的第三时延差，根据第三时延差确定第三麦克风、第二麦克风所在直线与到达方向的夹角，确定第三麦克风、第二麦克风所在直线与到达方向的夹角为三夹角。

结合第二方面的第四种可能的实现方式，在第二方面的第五种可能的实现方式中，处理器具体用于，确定第一夹角为声源的俯仰角，确定第二夹角、第三夹角为声源的水平角；或，确定第三夹角为声源的俯仰角，确定第一夹角、第二夹角为声源的水平角。

结合第二方面的第四或第五种可能的实现方式，在第二方面的第六种可能的实现方式中，还包括：输入组件，输入组件用于，接收视频录制指令；视频录制指令携带录制视频的摄像头的信息；处理器还用于，运行信息指示的摄像头进行拍摄，根据摄像头的拍摄范围确定预设录音范围。

结合第二方面的第六种可能的实现方式，在第二方面的第七种可能的实现方式中，摄像头为第一摄像头和/或第二摄像头，第一摄像头位于第一表面，第二摄像头位于第二表面；第一麦克风与第二麦克风生成第一波束和第二波束，第一波束形成于第一表面一侧，第二波束形成于第二表面一侧；处理器具体用于，若信息指示的摄像头为第一摄像头，则根据第二波束学习第一波束生成第一抵消波束，根据第一抵消波束消除声音信号；若信息指示的摄像头为第二摄像头，则根据第一波束学习第二波束生成第二抵消波束；根据第二抵消波束消除声音信号。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的球面坐标系的示意图；

图2为本发明实施例提供的麦克风拾音范围及摄像头录制范围的示意图；

图3为本发明实施例提供的麦克风拾音的角度范围及摄像头录制范围的角度范围；

图4为本发明实施例提供的电子设备的示意图；

图5为本发明实施例提供的三维坐标系的示意图；

图6为本发明实施例提供的远场模型示意图；

图7为本发明实施例提供的声源到达方向与坐标轴夹角的示意图；

图8为本发明实施例提供的声源到达方向与坐标轴夹角的另一示意图；

图9为本发明实施例提供的电子设备的拍摄位置示意图；

图10为本发明实施例提供的电子设备的另一示意图；

图11为本发明实施例提供的电子设备的形成波束的示意图；

图12为本发明实施例提供的电子设备的另一示意图；

图13为本发明实施例提供的定向录音的方法的流程示意图；

图14为本发明实施例提供的定向录音方法的具体示例图；

图15为本发明实施例提供的噪音消除的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为方便理解，以下对本发明涉及水平角和俯仰角做以说明。具体地，水平角、俯仰角是球坐标系中用于说明方位的角度信息。球坐标是三维坐标系的一种，用以确定三维空间中点、线、面以及体的位置，它以坐标原点为参考点，由水平角、俯仰角和距离构成。

参考图1所示的球坐标系，空间一点P，M为点P在xoy面上的投影。对于空间内一点P可用(r，θ，)来确定。其中，r为原点O与点P间的距离，θ为有向线段OP与z轴正向的夹角，为自x轴正向按逆时针方向(从正z轴来看的逆时针方向)转到OM所转过的角。的范围是0°～360°，θ的范围是0°～180°。这里的三个数r，θ，叫做点P的球面坐标，显然，这里r，θ，的变化范围为r∈[0,+∞)，θ∈[0,2π]，

电子设备录制视频时，麦克风录制声音的范围与摄像头画面录制的范围不一致。如图2所示，麦克风拾取声音的范围是全向的，可以近似认为是一个球体。如图2所示，摄像头拍摄范围的水平角度有限、俯仰角度也有限，可见麦克风的拾音范围远远大于画面录制范围。

现有技术在设备设置一对指向性麦克风，设置于前置摄像头一侧的指向性麦克风用于拾取前置摄像头一侧的声音信号，设置于后置摄像头一侧的指向性麦克风用于拾取后置摄像头一侧的声音信号。但是，该方案只能对摄像头背侧的声音进行抑制。示例的，参考图3，当用户使用设备的后置摄像头进行拍摄时，录制画面的范围可以是水平角开度是60°，示例的水平角-30°～+30°；俯仰角开度是30°～40°，俯仰角度范围为±15°～±20°，如：-15°～+20°，设备对前置摄像头背侧的声音进行抑制，因此拾音范围的水平角近似为水平角度范围0°～180°，俯仰角度范围0～180°。拾音范围远远大于录制画面的范围，因此，画面与音频的匹配效果不是很理想。

本发明原理在于：定位出声源的空间方位信息，包括声源的水平角以及声源的俯仰角。进而可以根据声源的水平角以及俯仰角，判断声源是否在预设录音范围的水平角度范围以及俯仰角度范围内。进而可以确定声源是否在预设录音范围内。

具体地，在电子设备设置四个不在同一平面内的麦克风，其中一个麦克风设置在电子设备的前表面，一个麦克风在电子设备的后表面，另外两个摄像头设置于电子设备的底端(电子设备竖屏放置时)。如此，能够根据声源到达三个麦克风对(底端的两个麦克风构成一个麦克风对，前后表面的两个麦克风构成一个麦克风对，底端靠下分布的一个麦克风和前表面的一个麦克风构成一个麦克风对)的时延差，精确定位声源的三维空间方位，当声源不在画面录制范围，则消除该声源的声音信号，仅对录制画面内的声源进行信号拾取。当使用电子设备录制视频时，可以大大提高音频录制范围与视频录制范围的匹配程度。

实施例1：

本发明实施例提供一种电子设备，如图4所示，该电子设备包括麦克风阵列，该麦克风阵列包括第一麦克风1、第二麦克风2、第三麦克风3以及第四麦克风4。其中，第一麦克风1设置于该电子设备的第一表面5；第二麦克风2设置于该电子设备的第二表面6；第三麦克风3以及第四麦克风4设置于该电子设备的第三表面7。需要说明的是，在图4中，第一表面5为电子设备的后表面，可以是设置后置摄像头的一面；第二表面6是电子设备的前表面，可以是设置前置摄像头的一面。

需要说明的是，第一表面5与第二表面6平行，且第三表面7与第一表面5、第二表面6均垂直。另外，第一麦克风1、第二麦克风 2所在的直线与第三麦克风3、第四麦克风4所在的直线垂直。

可以利用第一麦克风1和第二麦克风2所在的直线、第三麦克风3和第四麦克风4所在的直线构成一个构成的三维空间坐标系，如图5所示，该三维坐标系的第一坐标轴(Z轴)为所述第三麦克风3和所述第四麦克风4所在直线，第二坐标轴(X轴)与所述第一坐标轴相交且与所述第一麦克风与所述第二麦克风所在直线平行，第三坐标轴(Y轴)穿过所述第一坐标轴与所述第二坐标轴的交点，且与所述第一坐标轴与所述第二坐标轴构成的平面垂直。

通常，在远场模型中，声源到达麦克风阵列的距离较远，可以认为声波是图6所示的平面波模型。电子设备可以利用根据GCC(Generalized Cross Correlation)算法估计声源的大体方位，即根据声源到一对麦克风对的时延差，确定声源到达方向(可以认为是声音信号传播至麦克风对的轨迹)到麦克风对连线的夹角，如图6所示的夹角1、夹角2等。

在本发明实施例中，同样可以利用GCC算法确定声源到达方向与每个麦克风阵列连线的夹角，进而确定声源的空间方位。参考图7，当使用电子设备横屏拍摄，(即电子设备放置如图4所示)，可以根据声源到达麦克风3、麦克风4的时延差，确定声源到达方向与麦克风3、4连线的夹角，即声源到达方向与Z轴的夹角θ₃，但这仅仅是声源的俯仰角，还需要进一步确定声源的水平角。进而电子设备可以根据声源到达麦克风1、麦克风2的时延差，确定出声源到达方向与麦克风1、2连线的夹角，即声源到达方向与X轴的夹角θ₁，同时，可以根据声源到达麦克风1、麦克风3的时延差，确定出声源到达方向与麦克风1、3连线的夹角θ₂，再将该夹角转化成声源到达方向与Y轴的夹角θ₄，将θ₁、θ₄作为声源的水平角，结合声源的俯仰角θ₃可以确定出声源的准确方位。

进一步说明如何将θ₂转化成θ₄：通常当电子设备的麦克风阵列的分布确定后，每两个麦克风所在直线与图5所示坐标轴的每一个轴的夹角就确定了。参考图7，直线Y^与Y轴平行，假定麦克风1、麦克风3连线与Y^的夹角为α(即麦克风1、麦克风3连线与Y轴的夹角)，根据声源到麦克风1、麦克风3的时延差确定出声源到达方向与麦克风1、麦克风 3连线的夹角θ₂。声源到达方向所在直线、麦克风1和3所在直线以及直线Y^构成了一个三角形，由于三角形的一个内角的补角等于另外两个内角的和，因此可得声源与Y轴的夹角θ₄＝α+θ₂。

当使用电子设备竖屏拍摄(即电子设备放置如图9所示)，可以根据声源到达麦克风1、麦克风3的时延差，确定出声源与麦克风1、3连线的夹角，再将该夹角转化成声源与Y轴的夹角，将这个角作为声源的俯仰角。同时，根据声源到达麦克风1、麦克风2的时延差，确定出声源与Z轴的夹角，根据声源到达麦克风3、麦克风4的时延差，确定出声源与X轴的夹角，根据这三个夹角可以确定出声源的方位。

具体实现中，电子设备还可以包括摄像头，参考图10，包括第一摄像头8，设置于第一表面5；还包括第二摄像头9，设置于第二表面6。

进一步地，参考图11，所述第一麦克风1与所述第二麦克风2共同形成第一波束和第二波束。其中，第一波束形成于第一表面5一侧，第二波束形成于第二表面6一侧。

本发明实施例提供一种电子设备，如图12所示，至少包括处理器、存储器、摄像头组(包括上述第一摄像头8、第二摄像头9)、麦克风阵列(包括上述麦克风1～4)以及输入组件。各个摄像头及各个麦克风的分布可以如图7所示，在此不做赘述。输入组件可以是按键、触控面板等。

本发明实施例中，处理器首先确定预设录音范围，具体地，电子设备接收视频录制指令，该指令携带录制视频的摄像头的信息，进一步电子设备运行该信息指示的摄像头进行拍摄，根据所述摄像头的拍摄范围确定预设录音范围。预设录音范围可以是水平角度范围以及俯仰角度范围。

其次，电子设备的处理器利用麦克风阵列(上述麦克风1～4)收集声音信号，处理器可以根据声源到麦克风阵列的时延差确定声源到达方向与麦克风阵列连线的夹角，进而可以确定出该声音信号的声源的方位信息。该方位信息包括声源到达方向在空间坐标系中的水平角以及俯仰角。

进而，处理器可以根据声源的方位信息判断该声源是否在所述预设录音范围内。具体地，判断该声源的水平角是否在预设录音范围的水平角度范围内，以及该声源的俯仰角是否在预设录音范围的俯仰角度范围内。若该声源的水平角在预设录音范围的水平角度范围内且该声源的俯仰角在预设录音范围的俯仰角度范围内，则确定该声源在预设录音范围内；若该声源的水平角不在预设录音范围的水平角度范围内和/或该声源的俯仰角不在预设录音范围的俯仰角度范围内，则确定该声源不在预设录音范围内。

实施例2：

本发明实施例提供一种定向录音方法，如图13所示，所述方法包括以下步骤：

101、电子设备确定预设录音范围；所述预设录音范围包括水平角度范围以及俯仰角度范围。

具体实现中，电子设备接收视频录制指令，所述视频录制指令携带录制视频的摄像头的信息。进而电子设备运行所述信息指示的摄像头进行拍摄，根据所述摄像头的拍摄范围确定所述预设录音范围。

需要说明的是，这里的水平角度范围是空间三维坐标系中的水平角度范围；这里的俯仰角度范围也空间三维坐标系中俯仰角度范围。该空间三维坐标系即图5所示三维空间坐标系。

102、电子设备获取麦克风阵列收集到的声音信号。

通常，麦克风对可以生成一个波束，对一定范围对的声音信号进行采集。这里的麦克风阵列即图4中的麦克风1～4，其在电子设备的分布可以如图4所示，但不仅仅限制于图4所示的分布位置，在满足“4个麦克风不在同一平面”这一前提条件下，这4个麦克风也可以以其他形式分布，在此不做限制。

103、电子设备确定所述声音信号的声源的方位信息；所述方位信息包括所述声源的水平角度与所述声源的俯仰角。

这里，声源的水平角、俯仰角也是相对于空间三维坐标系的夹角，与步骤101衡量水平角度范围、俯仰角度范围的空间三维坐标系是同一个，均可以是图5所示三维空间坐标系。

具体地，可以根据声源到麦克风阵列中的一对麦克风的时延差，确定该声源到达方向与这一对麦克风所在直线的夹角。参考图4，由于麦克风1、2与麦克风3、4不在同一个平面，那么可以确定出声源到达方向与麦克风对所在直线的夹角，进而转化为在图5所示的空间坐标系中的水平角和俯仰角。

104、电子设备根据所述声源的方位信息判断所述声源是否在所述预设录音范围内。

具体地，若所述声源的水平角在所述水平角度范围内且所述声源的俯仰角在所述俯仰角度范围内，则确定所述声源在所述预设录音范围内。

若所述声源的水平角不在所述水平角度范围内和/或所述声源的俯仰角

若所述声源不在所述预设录音范围内，则执行步骤105；若所述声源在所述预设录音范围内，则执行步骤106；

105、消除所述声音信号。

若所述信息指示的摄像头为所述第一摄像头，则根据所述第二波束学习所述第一波束生成第一抵消波束，根据所述第一抵消波束消除所述声音信号；若所述信息指示的摄像头为所述第二摄像头，则根据所述第一波束学习所述第二波束生成第二抵消波束；根据所述第二抵消波束消除所述声音信号。

106、存储声音信号。

在使用电子设备拍摄视频时，可以将声音信号与图像信号组成为视频文件，此时的音频与视频匹配的程度较高。

示例的，参考图14，使用电子设备横屏拍摄，且使用后置摄像头拍摄。确定画面录制范围(即预设录音范围)是：水平角度范围-30°～+30°、俯仰角度范围-15°～+20°。电子设备确定该声源到麦克风3、4的时延差，根据该时延差确定声源P到达方向与Z轴的夹角为40°，即该声源的俯仰角。确定该声源到麦克风1、2的时延差，根据该时延差确定声源P到达方向与X轴的夹角为120°，根据声源到麦克风2、3的时延差，根据该时延差确定声源P到达方向与Y轴的夹角为60°，即该声源的水平角为：与X轴的夹角为120°、与Y轴的夹角为60°。由于俯仰角40°不在俯仰角范围-15°～+20°内，因此，该声源位于预设录音范围外。进而电子设备根据后向波束(即图11所示的第二波束)学习前向波束(即图11所示的第一波束)，之后前后向波束相抵消，就可以消除后向波束中的该声音信号。

具体实现中，电子设备通过算法实现图15所示的自适应抵消器，其中，T_s为时延，不同的时延对应不同的ω，通过调整学习步长u对ω₀～ω_N的权值进行调整。进一步地，以采用后置摄像头波拍摄为例，解释本发明实施例提供的噪声抵消过程：将前向波束的输出x_f(t)作为自适应抵消器的主通道输入，将后向波束的输出x_b(t)作为自适应抵消器的噪声参考输入。当确定声源不在预设录音范围内，以学习步长u对滤波ω的权值进行调整，可以控制后向波束x_b(t)学习前向波束x_f(t)，当输出的残差能量(即x_b(t)、x_f(t)的差值)达到最小值，算法达到收敛态，此时ε(t)中即实现了对噪声信号的滤除。

同理，当采用前置摄像头进行拍摄，若确定声源不在预设录音区域，则需要根据将后向波束的输出作为自适应抵消器的主通道输入，将前向波束的输出作为自适应抵消器的噪声参考输入。前向波束学习后向波束后进行相抵消，消除该声源的声音信号。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

一种定向录音方法，其特征在于，所述方法包括：

电子设备确定预设录音范围；所述预设录音范围包括水平角度范围以及俯仰角度范围；

所述电子设备获取声音信号；

所述电子设备确定所述声音信号的声源的方位信息；所述方位信息包括所述声源的水平角与所述声源的俯仰角；

所述电子设备根据所述声源的方位信息判断所述声源是否在所述预设录音范围内；

若所述声源不在所述预设录音范围内，则消除所述声音信号；若所述声源在所述预设录音范围内，则存储声音信号。
根据权利要求1所述的方法，其特征在于，所述电子设备根据所述声源的方位信息判断所述声源是否在所述预设录音范围内具体包括：

所述电子设备判断所述水平角是否在所述水平角度范围内，以及所述俯仰角是否在所述俯仰角度范围内；

若所述水平角在所述水平角度范围内且所述俯仰角在所述俯仰角度范围内，则确定所述声源在所述预设录音范围内；

若所述水平角不在所述水平角度范围内和/或所述俯仰角不在所述俯仰角度范围内，则确定所述声源不在所述预设录音范围内。
根据权利要求1或2所述的方法，其特征在于，所述电子设备包括麦克风阵列，所述麦克风阵列包括第一麦克风、第二麦克风、第三麦克风和第四麦克风且所述第一麦克风、所述第二麦克风、所述第三麦克风和所述第四麦克风不在同一平面内；

其中，所述第一麦克风位于所述电子设备的第一表面，所述第二麦克风位于所述电子设备的第二表面，所述第三麦克风与所述第四麦克风位于所述电子设备的第三表面，所述第一表面与所述第二表面平行设置，所述第三表面与所述第一表面垂直，且第三表面与、所述第二表面均垂直；

所述电子设备收集声音信号具体包括：所述电子设备获取所述麦克风阵列所收集到的声音信息。
根据权利要求3所述的方法，其特征在于，所述第一麦克风与所述第二麦克风所在直线垂直于所述第三麦克风与所述第四麦克风所在直线；

所述电子设备确定所述声音信号的声源的方位信息具体包括：

所述电子设备确定所述声源的到达方向与三维坐标系的第一坐标轴的第一夹角，所述到达方向与所述三维坐标系的第二坐标轴的第二夹角；所述到达方向与所述三维坐标系的第三坐标轴的第三夹角；

所述电子设备根据所述第一夹角、所述第二夹角、所述第三夹角确定所述声源的方位信息；

其中，所述第一坐标轴为所述第三麦克风和所述第四麦克风所在直线，所述第二坐标轴与所述第一坐标轴相交且与所述第一麦克风与所述第二麦克风所在直线平行，所述第三坐标轴穿过所述第一坐标轴与所述第二坐标轴的交点，且与所述第一坐标轴与所述第二坐标轴构成的平面垂直。
根据权利要求4所述的方法，其特征在于，所述电子设备确定所述入射轨迹与三维坐标系的第一坐标轴的第一夹角，所述入射轨迹与所述三维坐标系的第二坐标轴的第二夹角；所述入射轨迹与所述三维坐标系的第三坐标轴的第三夹角具体包括：

确定所述声源到达所述第一麦克风与所述第二麦克风的第一时延差，根据所述第一时延差确定所述第一麦克风、所述第二麦克风所在直线与所述到达方向的夹角，将所述所述第一麦克风、所述第二麦克风所在直线与所述到达方向的夹角确定为所述二夹角；

确定所述声源到达所述第三麦克风与所述第四麦克风的第二时延差，根据所述第二时延差确定所述第三麦克风、所述第四麦克风所在直线与所述到达方向的夹角，将所述第三麦克风、所述第四麦克风所在直线与所述到达方向的夹角确定为所述第一夹角；

确定所述声源到达所述第三麦克风与所述第二麦克风的第三时延差，根据所述第三时延差确定所述第三麦克风、所述第二麦克风所在直线与所述到达方向的夹角，确定所述第三麦克风、所述第二麦克风所在直线与所述到达方向的夹角为所述三夹角。
根据权利要求4或5所述的方法，其特征在于，所述根据所述第一夹角、所述第二夹角、所述第三夹角确定所述声源的方位信息具体包括：

所述电子设备确定所述第一夹角为所述声源的俯仰角，确定所述第二夹角、第三夹角为所述声源的水平角；

或，所述电子设备确定所述第三夹角为所述声源的俯仰角，确定所述第一夹角、第二夹角为所述声源的水平角。
根据权利要求3所述的方法，其特征在于，所述电子设备还包括摄像头，

则，所述电子设备确定预设录音范围具体包括：

所述电子设备接收视频录制指令；所述视频录制指令携带录制视频的摄像头的信息；

所述电子设备运行所述信息指示的摄像头进行拍摄，根据所述摄像头的拍摄范围确定所述预设录音范围。
根据权利要求7所述的方法，其特征在于，所述摄像头为第一摄像头和/或第二摄像头，所述第一摄像头位于所述第一表面，所述第二摄像头位于所述第二表面；所述第一麦克风与所述第二麦克风生成第一波束和第二波束，所述第一波束形成于所述第一表面一侧，所述第二波束形成于所述第二表面一侧；

所述电子设备消除所述声音信号具体包括：

若所述信息指示的摄像头为所述第一摄像头，则根据所述第二波束学习所述第一波束生成第一抵消波束，根据所述第一抵消波束消除所述声音信号；

若所述信息指示的摄像头为所述第二摄像头，则根据所述第一波束学习所述第二波束生成第二抵消波束；根据所述第二抵消波束消除所述声音信号。
一种电子设备，其特征在于，包括：

处理器，确定预设录音范围；所述预设录音范围包括水平角度范围以及俯仰角度范围；

所述处理器还用于，获取声音信号，确定所述声音信号的声源的方位信息，根据所述声源的方位信息以及所述预设录音范围判断所述声源是否在所述预设录音范围内；所述方位信息包括所述声源的水平角度与所述声源的俯仰角；

所述处理器还用于，若所述声源不在所述预设录音范围内，则消除所述声音信号；若所述声源在所述预设录音范围内，则存储声音信号。
根据权利要求9所述的电子设备，其特征在于，所述处理器具体用于，判断所述水平角是否在所述水平角度范围内，以及所述俯仰角是否在所述俯仰角度范围内；

若所述水平角在所述水平角度范围内且所述俯仰角在所述俯仰角度范围内，则确定所述声源在所述预设录音范围内；

若所述水平角不在所述水平角度范围内和/或所述俯仰角不在所述俯仰角度范围内，则确定所述声源不在所述预设录音范围内。
根据权利要求9或10所述的电子设备，其特征在于，所述电子设备包括麦克风阵列，所述麦克风阵列包括第一麦克风、第二麦克风、第三麦克风和第四麦克风且所述第一麦克风、所述第二麦克风、所述第三麦克风和所述第四麦克风不在同一平面内；

其中，所述第一麦克风位于所述电子设备的第一表面，所述第二麦克风位于所述电子设备的第二表面，所述第三麦克风与所述第四麦克风位于所述电子设备的第三表面，所述第一表面与所述第二表面平行设置，所述第三表面与所述第一表面垂直，且与所述第二表面垂直；

所述麦克风阵列具体用于，收集声音信号；

所述处理器具体用于，获取所述麦克风阵列收集到的信号。
根据权利要求11所述的电子设备，其特征在于，所述第三麦克风和所述第四麦克风所在直线与所述第一麦克风和所述第二麦克风所在直线垂直；

所述处理器具体用于，确定所述声源的到达方向与三维坐标系的第一坐标轴的第一夹角，所述到达方向与所述三维坐标系的第二坐标轴的第二夹角；所述到达方向与所述三维坐标系的第三坐标轴的第三夹角；

根据所述第一夹角、所述第二夹角、所述第三夹角确定所述声源的方位信息；

其中，所述第一坐标轴为所述第三麦克风和所述第四麦克风所在直线，所述第二坐标轴与所述第一坐标轴相交且与所述第一麦克风与所述第二麦克风所在直线平行，所述第三坐标轴穿过所述第一坐标轴与所述第二坐标轴的交点，且与所述第一坐标轴与所述第二坐标轴构成的平面垂直。
根据权利要求12所述的电子设备，其特征在于，所述处理器具体用于，确定所述声源到达所述第一麦克风与所述第二麦克风的第一时延差，根据所述第一时延差确定所述第一麦克风、所述第二麦克风所在直线与所述到达方向的夹角，将所述所述第一麦克风、所述第二麦克风所在直线与所述到达方向的夹角确定为所述二夹角；

确定所述声源到达所述第三麦克风与所述第四麦克风的第二时延差，根据所述第二时延差确定所述第三麦克风、所述第四麦克风所在直线与所述到达方向的夹角，将所述第三麦克风、所述第四麦克风所在直线与所述到达方向的夹角确定为所述第一夹角；

确定所述声源到达所述第三麦克风与所述第二麦克风的第三时延差，根据所述第三时延差确定所述第三麦克风、所述第二麦克风所在直线与所述到达方向的夹角，确定所述第三麦克风、所述第二麦克风所在直线与所述到达方向的夹角为所述第三夹角。
根据权利要求13所述的电子设备，其特征在于，

所述处理器具体用于，确定所述第一夹角为所述声源的俯仰角，确定所述第二夹角、所述第三夹角为所述声源的水平角；

或，确定所述第三夹角为所述声源的俯仰角，确定所述第一夹角、所述第二夹角为所述声源的水平角。
根据权利要求13或14所述的电子设备，其特征在于，还包括：输入组件，

所述输入组件用于，接收视频录制指令；所述视频录制指令携带录制视频的摄像头的信息；

所述处理器还用于，运行所述信息指示的摄像头进行拍摄，根据所述摄像头的拍摄范围确定所述预设录音范围。
根据权利要求15所述的电子设备，其特征在于，所述摄像头为第一摄像头和/或第二摄像头，所述第一摄像头位于所述第一表面，所述第二摄像头位于所述第二表面；所述第一麦克风与所述第二麦克风生成第一波束和第二波束，所述第一波束形成于所述第一表面一侧，所述第二波束形成于所述第二表面一侧；

所述处理器具体用于，若所述信息指示的摄像头为所述第一摄像头，则根据所述第二波束学习所述第一波束生成第一抵消波束，根据所述第一抵消波束消除所述声音信号；

若所述信息指示的摄像头为所述第二摄像头，则根据所述第一波束学习所述第二波束生成第二抵消波束；根据所述第二抵消波束消除所述声音信号。