CN105355213A

CN105355213A - 一种定向录音的方法及装置

Info

Publication number: CN105355213A
Application number: CN201510768323.XA
Authority: CN
Inventors: 王英茂
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2015-11-11
Filing date: 2015-11-11
Publication date: 2016-02-24
Anticipated expiration: 2035-11-11
Also published as: CN105355213B

Abstract

本发明实施例公开了一种定向录音的方法及装置。该方法包括：获取至少三个麦克风的录音信号；根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号；对所述目标录音信号进行处理，并生成录音文件。本发明实施例通过采用上述技术方案，根据预设录音方向以及至少三个麦克风的排布方式从至少三个麦克风的录音信号中筛选出目标录音信号，该目标录音信号对应于预设录音方向，通过对目标录音信号进行处理，可生成录音文件，从而实现预设录音方向上的定向录音，使用户在收听所生成的录音文件时，能够清楚地听到预设录音方向上的声源的声音，提升用户体验。

Description

一种定向录音的方法及装置

技术领域

本发明实施例涉及录音技术领域，尤其涉及一种定向录音的方法及装置。

背景技术

为了满足用户在生活以及工作中的录音需求，多数移动终端都具备录音功能，如手机、平板电脑、音乐播放器以及专业的录音笔等。

用户在使用移动终端的录音功能时，录音环境往往会存在多个人物说话的声音以及各种环境噪音，所以对于用于实现录音功能的麦克风来说，其四周存在多个声源，麦克风会将这些声源的声音都记录下来形成录音文件。然而，用户所感兴趣的往往只有一个方向上的声源的声音，在听取包含所有声源的声音的录音文件时，会由于其他声源的声音的干扰而无法听清自己感兴趣的声音。

现有技术中存在一种录音方式，选择一段本底噪音文件，并以该本底噪音文件为样本进行参考，将整个录音文件中符合该样本的频率去除，从而消除录音文件中的环境噪音，但此种方式仍然无法仅录取特定方向上的声音，依然无法满足用户需求。

发明内容

本发明实施例的目的是提供一种定向录音的方法及装置，以解决现有的录音方式缺乏针对性的问题。

一方面，本发明实施例提供了一种定向录音的方法，包括：

获取至少三个麦克风的录音信号；

根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号；

对所述目标录音信号进行处理，并生成录音文件。

另一方面，本发明实施例提供了一种定向录音的装置，包括：

录音信号获取模块，用于获取至少三个麦克风的录音信号；

目标录音信号确定模块，用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号；

录音文件生成模块，用于对所述目标录音信号进行处理，并生成录音文件。

本发明实施例中提供的定向录音的方案，获取至少三个麦克风的录音信号，根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号，对目标录音信号进行处理，并生成录音文件。通过采用上述技术方案，根据预设录音方向以及至少三个麦克风的排布方式从至少三个麦克风的录音信号中筛选出目标录音信号，该目标录音信号对应于预设录音方向，通过对目标录音信号进行处理，可生成录音文件，从而实现预设录音方向上的定向录音，使用户在收听所生成的录音文件时，能够清楚地听到预设录音方向上的声源的声音，提升用户体验。

附图说明

图1为本发明实施例一提供的一种定向录音的方法的流程示意图；

图2为本发明实施例二提供的一种定向录音的方法的流程示意图；

图3为本发明实施例三提供的一种优选的定向录音的方法的流程示意图；

图4为本发明实施例三提供的一种移动终端中麦克风的排布示意图；

图5为本发明实施例四提供的一种定向录音的装置的结构框图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一

图1为本发明实施例一提供的一种定向录音的方法的流程示意图，该方法可以由定向录音的装置执行，其中该装置可由软件和/或硬件实现，一般可集成在移动终端中。如图1所示，该方法包括：

步骤101、获取至少三个麦克风的录音信号。

示例性的，本实施例中的移动终端具体可为手机、平板电脑和录音笔等终端设备。所述移动终端中配置有至少三个麦克风。

示例性的，当用户操作移动终端开始录音时，可自动开启移动终端中的全部或者部分麦克风(麦克风的开启数量不少于三个)，并控制开启的麦克风录音，获取所开启的麦克风中的至少三个麦克风的录音信号。例如，移动终端中配置有6个麦克风，可自动开启其中的5个麦克风，并控制该5个麦克风开始录音，获取其中的4个麦克风的录音信号；又如，移动终端中配置有3个麦克风，可自动开启该3个麦克风，并控制该3个麦克风开始录音，获取该3个麦克风的录音信号。

步骤102、根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号。

示例性的，所述预设录音方向可由系统默认设置，也可由用户自行设置。例如，系统可默认将移动终端长度方向上指向移动终端顶部的方向设置为所述预设录音方向，用户在进行定向录音时，可直接将移动终端的顶部指向自己感兴趣的声源的所在方向；又如，移动终端可提供方向选取界面，根据用户的选择操作确定所述预设录音方向。

示例性的，移动终端上的所述至少三个麦克风的排布方式直接决定了每个麦克风在移动终端上的位置，以及每两个麦克风之间的相对位置关系。对于一个方向上声源来说，其发出的声音到达每个麦克风的时间会有所区别，麦克风所采集到的声音信号的强度也不同。当声源与麦克风的直线距离相对较近时，声音到达该麦克风的时间会相对较早，声音信号的强度也相对较强；当声源与麦克风的直线距离相对较远时，声音到达该麦克风的时间会相对较晚，声音信号的强度也相对较弱。因此，可根据上述原理对步骤101中所获取的至少三个麦克风的录音信号进行分析，将预设录音方向上的声源所对应的声音信号筛选出来，作为目标录音信号。

步骤103、对目标录音信号进行处理，并生成录音文件。

示例性的，所述目标录音信号对应于用户感兴趣的声源，所以对目标录音信号进行处理，并生成录音文件。这样，用户在收听录音文件时，便能够听清自己感兴趣的声源的声音。

本实施例中，对目标录音信号的处理方式以及生成录音文件的方式可以有多种，此处不作具体限定。以下提供几种可选的方式作为举例说明：

1、可对目标录音信号进行保留，去掉除目标录音信号以外的其他录音信号，并生成录音文件。

这样做可去掉除预设录音方向以外的其他录音方向上声源的声音，即相当于滤除了用户不感兴趣的声音，可保证用户能够清晰的听到自己感兴趣的声音。

2、可对目标录音信号进行保留，并提升目标录音信号的增益，去掉除目标录音信号以外的其他录音信号，并生成录音文件。

这样做的好处在于，在第一种方式的基础上，可提高录音文件中声音的声音强度以及响度等属性，进一步方便用户听清自己感兴趣的声音。

3、可提升目标录音信号的增益，得到第一录音信号；降低录音信号中除目标录音信号以外的其他录音信号的增益，得到第二录音信号；最后根据第一录音信号和第二录音信号生成录音文件。

其中，增益提升或降低的幅度可由系统默认设置，也可由用户自行设置。例如，可设置提升系数和降低系数，通过对两个系数的配合调节，可实现根据具体情况保留除预设录音方向以外的其他录音方向上的声音的比重，进而避免一些失真声音的产生。

本发明实施例一提供的定向录音的方法，获取至少三个麦克风的录音信号，根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号，对目标录音信号进行处理，并生成录音文件。通过采用上述技术方案，根据预设录音方向以及至少三个麦克风的排布方式从至少三个麦克风的录音信号中筛选出目标录音信号，该目标录音信号对应于预设录音方向，通过对目标录音信号进行处理，可生成录音文件，从而实现预设录音方向上的定向录音，使用户在收听所生成的录音文件时，能够清楚地听到预设录音方向上的声源的声音，提升用户体验。

实施例二

图2为本发明实施例二提供的一种定向录音的方法的流程示意图，本实施例以上述实施例为基础进行优化，在本实施例中，将步骤“根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号”优化为：分别对至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换，得到相应的频谱数据；根据预设录音方向以及至少三个麦克风的排布方式确定频谱数据中的目标频谱数据；根据目标频谱数据确定录音信号中的目标录音信号。

相应的，本实施例的方法包括如下步骤：

步骤201、获取至少三个麦克风的录音信号。

步骤202、分别对至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换，得到相应的频谱数据。

示例性的，对录音信号进行傅立叶变换是为了将不同频率的声音进行分离，所得到的频谱数据中，每个不同的频率分别对应一个声源的频谱数据。

步骤203、根据预设录音方向以及至少三个麦克风的排布方式确定频谱数据中的目标频谱数据。

具体的，本步骤可包括：根据预设录音方向以及至少三个麦克风的排布方式确定幅值差筛选条件；针对每个频率，计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差；将计算出的幅值的差与幅值差筛选条件进行匹配，若匹配成功，则确定当前频率对应的频谱数据为目标频谱数据。

示例性的，当移动终端上的至少三个麦克风的排布方式确定之后，可在录音环境中的相对于移动终端的一个方向上放置一个固定声源，而其他方向上没有声源，通过移动终端上的至少三个麦克风获取固定声源的录音信号，分别对至少三个麦克风中的每个麦克风对应的固定声源的录音信号进行傅立叶变换，得到相应的频谱数据，计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差。之后，沿该方向移动所述固定声源，再次计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差。以此类推，可得到至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差的规律或者所处范围，以该幅值差的规律或者所处范围作为幅值差筛选条件。

在本步骤中，可针对每个频率，计算每两个麦克风对应的频谱数据中对应的幅值的差，并判断计算出的幅值的差是否处于上述幅值的差的范围内(或者是否符合幅值的差的规律)，若在该范围内(或者符合规律)，则说明匹配成功，则确定当前频率对应的频谱数据为目标频谱数据，也相当于确定当前频率所对应的声源为预设录音方向上的声源。

作为另一种实现方式，本步骤可包括：根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件；针对每个频率，计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差；将计算出的相位的差与所述相位差筛选条件进行匹配，若匹配成功，则确定当前频率对应的频谱数据为目标频谱数据。

示例性的，同理，当移动终端上的至少三个麦克风的排布方式确定之后，可在录音环境中的相对于移动终端的一个方向上放置一个固定声源，而其他方向上没有声源，通过移动终端上的至少三个麦克风获取固定声源的录音信号，分别对至少三个麦克风中的每个麦克风对应的固定声源的录音信号进行傅立叶变换，得到相应的频谱数据，计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差。之后，沿该方向移动所述固定声源，再次计算至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差。以此类推，可得到至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差的规律或者所处范围，以该相位差的规律或者所处范围作为相位差筛选条件。

在本步骤中，可针对每个频率，计算每两个麦克风对应的频谱数据中对应的相位的差，并判断计算出的相位的差是否处于上述相位的差的范围内(或者是否符合幅值的差的规律)，若在该范围内(或者符合规律)，则说明匹配成功，则确定当前频率对应的频谱数据为目标频谱数据。

优选的，可将上述两种实现方式结合起来确定目标频谱数据。例如，当对定向录音性能要求较高时，可将既匹配幅值差筛选条件又匹配相位差范围的频率对应的频谱数据确定为目标频谱数据；当对定向录音性能要求较低时，可将匹配幅值差筛选条件或者匹配相位差筛选条件的频率对应的频谱数据均确定为目标频谱数据。

步骤204、根据目标频谱数据确定录音信号中的目标录音信号。

示例性的，对所有频率进行上述步骤的筛选后，根据匹配成功的频率所对应的频谱数据来确定录音信号中的目标录音信号。可以理解的是，在预设录音方向上可能存在多个用户感兴趣的声源，所以可能存在多个匹配成功的频率，可根据所有匹配成功的频率所对应的频谱数据的集合来确定录音信号中的目标录音信号。

步骤205、提升目标录音信号的增益，得到第一录音信号。

步骤206、降低录音信号中除目标录音信号以外的其他录音信号的增益，得到第二录音信号。

步骤207、根据第一录音信号和第二录音信号生成录音文件。

本发明实施例二在实施例一的基础上，对确定目标录音信号的步骤进行了优化，根据幅值差筛选条件或者相位差筛选条件将经过傅里叶变换后的声音信号进行筛选，得到用户感兴趣的目标录音信号，可提高筛选的准确度，从而提升定向录音性能。随后，通过提升目标录音信号的增益并降低其他录音信号的增益来生成录音文件，实现预设录音方向上的定向录音，使用户在收听所生成的录音文件时，能够清楚地听到预设录音方向上的声源的声音，提升用户体验。

实施例三

图3为本发明实施例三提供的一种优选的定向录音的方法的流程示意图，本实施例以移动终端中配置三个麦克风为例进行说明，具体的，该方法包括如下步骤：

步骤301、获取三个麦克风的录音信号。

示例性的，图4为本发明实施例三提供的一种移动终端中麦克风的排布示意图，如图4所示，该移动终端上设置有三个麦克风，分别记为a、b、和c，为了描述方便，此处假设三个麦克风构成等腰三角形，a为等腰三角形的顶点。

步骤302、分别对三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换，得到三组频谱数据。

步骤303、根据预设录音方向以及三个麦克风的排布方式确定频谱数据中的目标频谱数据。

具体的，本步骤可包括：根据预设录音方向以及三个麦克风的排布方式确定幅值差筛选条件和/或相位差筛选条件；针对每个频率，计算三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差和/或相位的差；将计算出的幅值的差和/或相位的差与幅值差筛选条件和/或相位差筛选条件进行匹配，根据匹配情况确定当前频率对应的频谱数据是否为目标频谱数据。

上述幅值差筛选条件和相位差筛选条件的确定方式可参照本发明实施例二中的相关描述。

示例性的，假设移动终端长度方向上指向移动终端顶部的麦克风a的方向为预设录音方向。在频谱数据中，针对某一频率，三组频谱数据中对应的幅值分别记为Aa，Ab和Ac，在预设录音方向上的声源距离a比较近，声音强度较高，所以对应的幅值Aa较大，在预设录音方向上的声源距离b和c比较远，且与b的距离和与c的距离近似相等，那么预设录音方向对应的幅值差筛选条件可为：(Aa-Ab)以及(Aa-Ac)为正值，且(Ab-Ac)或(Ac-Ab)的绝对值很小。如果当前频率满足上述幅值筛选条件，那么该频率对应的频谱数据即为目标频谱数据。如果计算得到的幅值差(Aa-Ab)或(Aa-Ac)为负值，或(Ab-Ac)的绝对值较大，则当前频率不满足幅值筛选条件。同理，在预设录音方向上的声源距离a比较近，声音会先传播到a，在预设录音方向上的声源距离b和c比较远，且与b的距离和与c的距离近似相等，声音会延后同时传播到b和c，由于时间与相位相对应，所以可根据相位差对频谱数据进行筛选。

步骤304、根据目标频谱数据确定录音信号中的目标录音信号。

步骤305、提升目标录音信号的增益，得到第一录音信号。

步骤306、降低录音信号中除目标录音信号以外的其他录音信号的增益，得到第二录音信号。

步骤307、根据第一录音信号和第二录音信号生成录音文件。

示例性的，执行步骤305-步骤307后，加强了移动终端中顶端a麦克风方向的录音效果，削弱了其他方向上的录音效果，从而实现定向录音。同理，也可将预设录音方向设定为上述方向的反方向，即移动终端的底端方向。

本发明实施例三在上述实施例的基础上进行优化，移动终端中配置有三个麦克风，这样可不必改变现有移动终端的硬件配置，还可简化筛选条件，提升运算速度，使用户能够更快的收听到定向录音文件中感兴趣的声音，提升用户体验。

实施例四

图5为本发明实施例四提供的一种定向录音的装置的结构框图，该装置可由软件和/或硬件实现，一般集成在移动终端中，可通过执行定向录音的方法来实现定向录音。如图5所示，该装置包括录音信号获取模块501、目标录音信号确定模块502和录音文件生成模块503。

其中，录音信号获取模块501，用于获取至少三个麦克风的录音信号；目标录音信号确定模块502，用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号；录音文件生成模块503，用于对所述目标录音信号进行处理，并生成录音文件。

本发明实施例四提供的定向录音的装置，录音信号获取模块501获取至少三个麦克风的录音信号，目标录音信号确定模块502根据预设录音方向以及至少三个麦克风的排布方式确定录音信号中的目标录音信号，最后由录音文件生成模块503对目标录音信号进行处理，并生成录音文件。通过采用上述技术方案，可实现预设录音方向上的定向录音，使用户在收听所生成的录音文件时，能够清楚地听到预设录音方向上的声源的声音，提升用户体验。

在上述实施例的基础上，所述目标录音信号确定模块可包括变换单元、目标频谱数据确定单元和目标录音信号确定单元。其中，变换单元，用于分别对所述至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换，得到相应的频谱数据；目标频谱数据确定单元，用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据；目标录音信号确定单元，用于根据所述目标频谱数据确定所述录音信号中的目标录音信号。

在上述实施例的基础上，所述目标频谱数据确定单元具体可用于：根据预设录音方向以及所述至少三个麦克风的排布方式确定幅值差筛选条件；针对每个频率，计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差；将计算出的幅值的差与所述幅值差筛选条件进行匹配，若匹配成功，则确定当前频率对应的频谱数据为目标频谱数据。

在上述实施例的基础上，所述目标频谱数据确定单元具体用于：根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件；针对每个频率，计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差；将计算出的相位的差与所述相位差筛选条件进行匹配，若匹配成功，则确定当前频率对应的频谱数据为目标频谱数据。

在上述实施例的基础上，所述录音文件生成模块可包括增益提升单元、增益减低单元和录音文件生成单元。其中，增益提升单元，用于提升所述目标录音信号的增益，得到第一录音信号；增益减低单元，用于降低所述录音信号中除所述目标录音信号以外的其他录音信号的增益，得到第二录音信号；录音文件生成单元，用于根据所述第一录音信号和所述第二录音信号生成录音文件。

上述实施例中提供的定向录音的装置可执行本发明任意实施例所提供的定向录音的方法，具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本发明任意实施例所提供的定向录音的方法。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种定向录音的方法，其特征在于，包括：

获取至少三个麦克风的录音信号；

对所述目标录音信号进行处理，并生成录音文件。

2.根据权利要求1所述的方法，其特征在于，根据预设录音方向以及所述至少三个麦克风的排布方式确定所述录音信号中的目标录音信号，包括：

分别对所述至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换，得到相应的频谱数据；

根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据；

根据所述目标频谱数据确定所述录音信号中的目标录音信号。

3.根据权利要求2所述的方法，其特征在于，根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据，包括：

根据预设录音方向以及所述至少三个麦克风的排布方式确定幅值差筛选条件；

针对每个频率，计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的幅值的差；将计算出的幅值的差与所述幅值差筛选条件进行匹配，若匹配成功，则确定当前频率对应的频谱数据为目标频谱数据。

4.根据权利要求2所述的方法，其特征在于，根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据，包括：

根据预设录音方向以及所述至少三个麦克风的排布方式确定相位差筛选条件；

针对每个频率，计算所述至少三个麦克风中的每两个麦克风对应的频谱数据中对应的相位的差；将计算出的相位的差与所述相位差筛选条件进行匹配，若匹配成功，则确定当前频率对应的频谱数据为目标频谱数据。

5.根据权利要求1-4中任一项所述的方法，其特征在于，对所述目标录音信号进行处理，并生成录音文件，包括：

提升所述目标录音信号的增益，得到第一录音信号；

降低所述录音信号中除所述目标录音信号以外的其他录音信号的增益，得到第二录音信号；

根据所述第一录音信号和所述第二录音信号生成录音文件。

6.一种定向录音的装置，其特征在于，包括：

录音信号获取模块，用于获取至少三个麦克风的录音信号；

7.根据权利要求6所述的装置，其特征在于，所述目标录音信号确定模块包括：

变换单元，用于分别对所述至少三个麦克风中的每个麦克风对应的录音信号进行傅立叶变换，得到相应的频谱数据；

目标频谱数据确定单元，用于根据预设录音方向以及所述至少三个麦克风的排布方式确定所述频谱数据中的目标频谱数据；

目标录音信号确定单元，用于根据所述目标频谱数据确定所述录音信号中的目标录音信号。

8.根据权利要求7所述的装置，其特征在于，所述目标频谱数据确定单元具体用于：

9.根据权利要求7所述的装置，其特征在于，所述目标频谱数据确定单元具体用于：

10.根据权利要求6-9中任一项所述的装置，其特征在于，所述录音文件生成模块包括：

增益提升单元，用于提升所述目标录音信号的增益，得到第一录音信号；

增益减低单元，用于降低所述录音信号中除所述目标录音信号以外的其他录音信号的增益，得到第二录音信号；

录音文件生成单元，用于根据所述第一录音信号和所述第二录音信号生成录音文件。