WO2022022647A1

WO2022022647A1 - 电子设备的录音方法及录音装置

Info

Publication number: WO2022022647A1
Application number: PCT/CN2021/109323
Authority: WO
Inventors: 史建兴
Original assignee: 维沃移动通信有限公司
Priority date: 2020-07-31
Filing date: 2021-07-29
Publication date: 2022-02-03
Also published as: CN111916102B; CN111916102A

Abstract

一种电子设备的录音方法及录音装置，电子设备包括M个麦克风，且每个麦克风与一个第一语音通路和一个第二语音通路连接，录音方法包括：在处于视频拍摄状态的情况下，获取摄像头的拍摄焦距；若拍摄焦距由初始焦距变化为目标焦距，则根据初始焦距、目标焦距和初始增益，确定目标增益，并将与第i个麦克风连接的第二语音通路的增益调整为目标增益，初始增益为与第i个麦克风连接的第一语音通路的增益；对与第i个麦克风连接的第一语音通路输出的语音信号和第二语音通路输出的语音信号进行信号增强处理，得到第i语音增强信号；对M个语音增强信号进行信号融合处理，得到第一录音信号。

Description

电子设备的录音方法及录音装置

相关申请的交叉引用

本申请主张在2020年07月31日在中国提交的中国专利申请号202010760783.9的优先权，其全部内容通过引用包含于此。

技术领域

本申请属于通信技术领域，具体涉及一种电子设备的录音方法及录音装置。

背景技术

随着通信技术的快速发展，大部分移动终端具备了录音功能，例如，用户可以使用移动终端拍摄一段包括语音的小视频。

目前，当用户处于不同的环境时，声源与移动终端的距离通常会发生变化。随着声源与移动终端的距离逐渐增加，移动终端录制的声音会逐渐减小，导致用户可能无法听清声音；而随着声源与移动终端的距离逐渐减小，移动终端录制的声音会逐渐增大，导致可能出现破音。因此，针对声源与移动终端的距离发生改变的情况，如何提升录音质量成为亟待解决的问题。

发明内容

本申请实施例的目的是提供一种电子设备的录音方法及录音装置，能够解决如何提升录音质量的问题。

为了解决上述技术问题，本申请实施例是这样实现的：

第一方面，本申请实施例提供了一种电子设备的录音方法。该电子设备包括M个麦克风，且每个麦克风与一个第一语音通路和一个第二语音通路连接，M为大于或等于2的整数。该方法包括：在处于视频拍摄状态的情况下，获取摄像头的拍摄焦距；若摄像头的拍摄焦距由初始焦距变化为目标焦距，则根据初始焦距、目标焦距和初始增益，确定目标增益，并将与第i个麦克风连接的第二语音通路的增益调整为目标增益，初始增益为与第i个麦克风连接的第一语音通路的增益，i依次取值为1、2……M；对与第i个麦克风连接的第一语音通路输出的语音信号和与第i个麦克风连接的第二语音通路输出的语音信号进行信号增强处理，得到第i个语音增强信号；对M个语音增强信号进行信号融合处理，得到第一录音信号。

第二方面，本申请实施例提供了一种录音装置。该录音装置包括M个麦克风，且每个麦克风与一个第一语音通路和一个第二语音通路连接，M为大于或等于2的整数。该录音装置包括获取模块、确定模块和处理模块。获取模块，用于在处于视频拍摄状态的情况下，获取摄像头的拍摄焦距。确定模块，用于若获取模块获取的拍摄焦距由初始焦距变化为目标焦距，则根据初始焦距、目标焦距和初始增益，确定目标增益，初始增益为与第i个麦克风连接的第一语音通路的增益。处理模块，用于将与第i个麦克风连接的第二语音通路的增益调整为确定模块确定的目标增益；并对与第i个麦克风连接的第一语音通路输出的语音信号和与第i个麦克风连接的第二语音通路输出的语音信号进行信号增强处理，得到第i个语音增强信号；以及对M个语音增强信号进行信号融合处理，得到第一录音信号。其中，i依次取值为1、2……M。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的程序或指令，该程序或指令被该处理器执行时实现如第一方面提供的方法的步骤。

第四方面，本申请实施例提供了一种可读存储介质，该可读存储介质上存储程序或指令，该程序或指令被处理器执行时实现如第一方面提供的方法的步骤。

第五方面，本申请实施例提供了一种芯片，该芯片包括处理器和通信接口，该通信接口和该处理器耦合，该处理器用于运行程序或指令，实现如第一方面提供的方法。

在本申请实施例中，可以在处于视频拍摄状态的情况下，获取摄像头的拍摄焦距；若摄像头的拍摄焦距由初始焦距变化为目标焦距，则根据初始焦距、目标焦距和初始增益，确定目标增益，并将与第i个麦克风连接的第二语音通路的增益调整为目标增益，初始增益为与第i个麦克风连接的第一语音通路的增益，i依次取值为1、2……M；对与第i个麦克风连接的第一语音通路输出的语音信号和与第i个麦克风连接的第二语音通路输出的语音信号进行信号增强处理，得到第i个语音增强信号；对M个语音增强信号进行信号融合处理，得到第一录音信号。通过该方案，由于当声源与电子设备之间的距离发生改变时，电子设备的摄像头的拍摄焦距也会发生变化，因此，通过将与第i个麦克风的连接的第一语音通路设定为固定增益，将与第i个麦克风连接的第二语音通路设定为随拍摄焦距变化的可变增益，从而使得拍摄焦距变大时该第二语音通路的增益变大以录制更远距离的信号，拍摄焦距变小时该第二语音通路增益较小以录制更近距离的信号，进而通过比较两路信号的差异对语音信号做增强处理，从而改善了最终融合得到的语音信号的质量，并且提高了视频的拍摄效果。

附图说明

图1为本申请实施例提供的一种电子设备的结构示意图；

图2为本申请实施例提供的电子设备的录音方法的示意图之一；

图3为本申请实施例提供的电子设备的录音方法的示意图之二；

图4为本申请实施例提供的摄像头的视场角的示意图；

图5为本申请实施例提供的录音装置的结构示意图；

图6为本申请实施例提供的电子设备的硬件示意图之一；

图7为本申请实施例提供的电子设备的硬件示意图之二。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

本申请实施例提供一种电子设备的录音方法及录音装置，可以在处于视频拍摄状态的情况下，获取摄像头的拍摄焦距；若摄像头的拍摄焦距由初始焦距变化为目标焦距，则根据初始焦距、目标焦距和初始增益，确定目标增益，并将与第i个麦克风连接的第二语音通路的增益调整为目标增益，初始增益为与第i个麦克风连接的第一语音通路的增益，i依次取值为1、2……M；对与第i个麦克风连接的第一语音通路输出的语音信号和与第i个麦克风连接的第二语音通路输出的语音信号进行信号增强处理，得到第i个语音增强信号；对M个语音增强信号进行信号融合处理，得到第一录音信号。通过该方案，由于当声源与电子设备之间的距离发生改变时，电子设备的摄像头的拍摄焦距也会发生变化，因此，通过将与第i个麦克风的连接的第一语音通路设定为固定增益，将与第i个麦克风连接的第二语音通路设定为随拍摄焦距变化的可变增益，从而使得拍摄焦距变大时该第二语音通路的增益变大以录制更远距离的信号，拍摄焦距变小时该第二语音通路增益较小以录制更近距离的信号，进而通过比较两路信号的差异对语音信号做增强处理，从而改善了最终融合得到的语音信号的质量，并且提高了视频的拍摄效果。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供电子设备的录音方法、录音装置及电子设备进行详细地说明。

如图1所示，本申请实施例提供一种电子设备。电子设备包括M个麦克风，且每个麦克风与一个第一语音通路和一个第二语音通路连接，M为大于或等于2的整数。

示例性的，以电子设备为手机，且手机内设置有两个麦克风(mic)、一个编译码器(codec)和一个数字信号处理器(adsp)为例。麦克风1与第一语音通路01和第二语音通路02连接，麦克风2与第一语音通路03和第二语音通路04连接，这4个语音通路中的每个语音通路分别包括一个模数转换器(analog-to-digital converter，ADC)，且4个语音通路的另一端连接至编译码器的编码模块。数字信号处理器包括与编码模块连接的录音增强模块、与录音增强模块连接的降噪模块。

具体的，麦克风，用于采集由声源(例如人物、乐器、水流和风浪等)发出的声音信号(也称为声源信号、声波信号)；ADC，用于将麦克风采集的声音信号由模拟信号转换为数字信号；编码模块，用于对由ADC输出的数字信号进行编码，得到编码信号；录音增强模块，用于对与每个麦克风连接的2路编码信号进行增强处理，得到与每个麦克风对应的1路增强信号，进而得到与两个麦克风对应的2路增强信号；降噪模块，用于对2路增强信号进行融合处理得到1路融合信号，并对该融合信号进行降噪处理，得到最终的录音信号。可以参照下述实施例对电子设备的录音方法的具体描述，此处不予赘述。

需要说明的是，上述图1是电子设备包括两个麦克风为例进行说明的，这两个麦克风可以分别用于采集不同类型的音频，例如，麦克风1可以主要用于采集人声，麦克风2主要用于采集环境声，但其并不对本申请实施例形成任何限定。可以理解，电子设备还可以包括3个麦克风或3个以上的麦克风，随着麦克风数量的增多，录音效果也逐步增强。

如图2所示，本申请实施例提供一种电子设备的录音方法。该方法可以包括下述的S201至S204。下面以执行主体为如图1所示的电子设备为例对该方法进行示例性说明。

S201、在处于视频拍摄状态的情况下，电子设备获取摄像头的拍摄焦距。

本申请实施例中，上述视频拍摄状态是在运行相机应用程序之后，用户通过对视频拍摄控件或视频录制控件的触控输入，触发摄像头采集并缓存视频帧的状态，即电子设备处于视频拍摄过程之中。

在电子设备进入视频拍摄状态之后，摄像头的拍摄焦距随时可能会发生变化。一种可能的实现方式为，电子设备处于自动对焦状态，随着被拍摄对象的移动，摄像头的拍摄焦距自动调整；另一种可能的实现方式为，随着被拍摄对象的移动或被拍摄对象的改变，用户通过手动输入，触发摄像头调整焦距。因此，为了及时检测到摄像头的拍摄焦距的变化，在电子设备进入视频拍摄状态之后，电子设备可以周期性地对摄像头的拍摄焦距进行检测，以确定摄像头的拍摄焦距是否发生了变化，进而确定是否需要对语音通路的增益进行调整。

可选的，在S201之前，本申请实施例提供的录音方法还可以包括：运行相机应用程序；之后，将摄像头的拍摄焦距设置为初始焦距，并将摄像头的视场角设置为初始视场角，以及将每个语音通路的增益设置为初始增益。其中，初始焦距、初始视场角和初始增益均可以为预设值。

示例性的，在用户点击相机应用程序的图标之后，电子设备运行相机应用程序，并进行初始化设置。例如，将摄像头的初始焦距设置为4倍焦距，将摄像头的初始视场角设置为α，将与每个摄像头连接的第一语音通路和第二语音通路中ADC的增益均设置为12dB(分贝)。

需要说明的是，本申请实施例中，第一语音通路的增益为固定增益，随着摄像头的拍摄焦距的变化，第一语音通过的增益保持不变。第二语音通路的增益为可变增益，随着摄像头的拍摄焦距的增加，第二语音通路的增益增加，而随着摄像头的拍摄焦距的减小，第二语音通路的增益减小。另外，上述实施例是以第二语音通路的初始增益和第一语音通路的初始增益相等为例进行说明的，可以理解，实际实现时，第二语音通路的初始增益可以大于或小于第一语音通路的初始增益，具体可以根据实际使用需求确定，本申请实施例不作限定。

S202、若摄像头的拍摄焦距由初始焦距变化为目标焦距，则电子设备根据初始焦距、目标焦距和初始增益，确定目标增益，并将与第i个麦克风连接的第二语音通路的增益调整为目标增益。

其中，上述初始增益为与第i个麦克风连接的第一语音通路的增益，即当摄像头的拍摄焦距为初始焦距时为与第i个麦克风连接的第一语音通路设置的固定增益。

本申请实施例中，i依次取值为1、2……M。即，若摄像头的拍摄焦距由初始焦距变化为目标焦距，则电子设备根据初始焦距、目标焦距和与第1个麦克风连接的第一语音通路的增益，确定与第1个麦克风连接的第二语音通路的增益并对其进行调整；根据初始焦距、目标焦距和与第2个麦克风连接的第一语音通路的增益，确定与第2个麦克风连接的第二语音通路的增益并对其进行调整；……；根据初始焦距、目标焦距和与第M个麦克风连接的第一语音通路的增益，确定与第M个麦克风连接的第二语音通路的增益并对其进行调整。

可选的，上述目标焦距大于初始焦距，或者小于初始焦距。

若目标焦距大于初始焦距，则需要增加与第i个麦克风连接的第二语音通路的增益；若目标焦距小于初始焦距，则需要减小与第i个麦克风连接的第二语音通路的增益。具体的，上述“根据初始焦距、目标焦距和初始增益，确定目标增益”具体可以通过下述两种方式中的任意一种方式实现：

方式一、若目标焦距大于初始焦距，则电子设备将初始增益与第一增益之和，作为目标增益，其中，该第一增益为目标值和预设值的乘积，该目标值为该目标焦距与该初始焦距的差值的绝对值。即，目标增益＝初始增益+第一增益＝初始增益+|目标焦距-初始焦距|*预设值＝初始增益+(目标焦距-初始焦距)*预设值，该预设值可以用于表示连续两个焦距之间的增益差值。

示例性的，假设初始增益为12dB，预设值为3dB，初始焦距为×4(即4倍焦距)。当摄像头的拍摄焦距改变为×6(即6倍焦距)时，目标增益为12dB+(6-4)*3dB＝18dB；当摄像头的拍摄焦距改变为×10(即10倍焦距)时，目标增益为12dB+(10-4)*3dB＝30dB。

方式二、若目标焦距小于初始焦距，则电子设备将初始增益与第一增益之差，作为目标增益，其中，该第一增益为目标值和预设值的乘积，该目标值为该目标焦距与该初始焦距的差值的绝对值。即，目标增益＝初始增益-第一增益＝初始增益-|目标焦距-初始焦距|*预设值＝初始增益-(初始焦距-目标焦距)*预设值，该预设值可以用于表示连续两个焦距之间的增益差值。

示例性的，假设初始增益为12dB，预设值为3dB，初始焦距为×4(即4倍焦距)。当摄像头的拍摄焦距改变为×2(即2倍焦距)时，目标增益为12dB- (4-2)*3dB＝6dB；当摄像头的拍摄焦距改变为×1(即1倍焦距)时，目标增益为12dB-(4-1)*3dB＝3dB。

需要说明的是，本申请实施例为第二语音通路的增益设定了可变增益范围，即第二语音通过的增益仅能在可变增益范围内进行调整。示例性的，假设可变增益范围为0～30dB，结合上述方式一中的示例，当摄像头的拍摄焦距改变为×10(即10倍焦距)时，目标增益为30dB，当摄像头的拍摄焦距改变为大于10倍焦距时，目标增益仍为30dB。

上述实施例是以与每个麦克风连接的第一语音通路的初始增益为同一个增益为例进行示例性说明的，可以理解，实际实现时，与每个麦克风连接的第一语音通路的初始增益也可以不相等，具体可以根据实际使用需求确定。

S203、对与第i个麦克风连接的第一语音通路输出的语音信号和与第i个麦克风连接的第二语音通路输出的语音信号进行信号增强处理，得到第i个语音增强信号。

对于每个麦克风的第一语音通路和第二语音通路，由于第一语音通路的增益和第二语音通路的增益不同，因此，从第一语音通路输出的语音信号和从第二语音通路输出的语音信号存在差异。对于每个麦克风，通过比较从第一语音通路输出的语音信号和从第二语音通路输出的语音信号并进行增强处理，可以得到一个语音增强信号。

可选的，一种方式为，电子设备可以对比第一语音通路输出的语音信号的信噪比和第二语音通路输出的语音信号的信噪比。若第一语音通路输出的语音信号的信噪比大于第二语音通路输出的语音信号的信噪比，则对第一语音通路输出的语音信号进行增强处理，得到一个语音增强信号；若第一语音通路输出的语音信号的信噪比小于第二语音通路输出的语音信号的信噪比，则对第二语音通路输出的语音信号进行增强处理，得到一个语音增强信号。

另一种方式为，电子设备可以对比第一语音通路输出的语音信号的预设特征参数和第二语音通路输出的语音信号的预设特征参数；之后，将两路语音信号中预设特征参数符合需求的语音片段进行合成，从而得到一个语音增强信号。其中，预设特征参数可以包括声波振幅信息、声纹信息和信噪比等中的至少一项。

S204、对M个语音增强信号进行信号融合处理，得到第一录音信号。

示例性的，如图1所示，与麦克风1连接的第一语音通路01输出的语音信号、与麦克风1连接的第二语音通路02输出的语音信号、与麦克风2连接的第一语音通路03输出的语音信号、与麦克风2连接的第二语音通路04输出的语音信号，在分别经过ADC模数转换和编码模块的编码之后被输入录音增强模块。录音增强模块可以比较第一语音通路01输出的语音信号与第二语音通路02输出的语音信号，得到第一个语音增强信号，并且，比较第一语音通路03输出的语音信号和第二语音通路04输出的语音信号，得到第二个语音增强信号。之后，可以对这两个语音增强信号直接进行融合处理，得到第一录音信号；或者，可以先通过降噪模块对这两个语音增强信号进行融合处理，得到一个融合信号，再对这个融合信号进行降噪处理，得到第一录音信号。

可选的，本申请实施例提供了多种降噪处理方法：

第一种方法为，电子设备根据摄像头的视场角和拍摄方向，对第一融合信号进行降噪处理，以消除来自拍摄范围之外的噪声，从而得到第一录音信号。可以参照下述实施例的具体描述，此处不再赘述。

第二种方法为，电子设备设置有至少3个麦克风，这3个麦克风可以形成麦克风阵列，根据基于高分辨率谱估计的定向技术、基于可控波束形成技术等多声源定位算法，可以对各个声源进行定位，从而获取各个声源的位置信息，进而消除声源方位外的噪声信息。其中，该位置信息可以理解为声源信号距离耳机的距离信息以及相对于耳机的方位信息。

当然，可以理解的是，电子设备还可以采用其他降噪处理方法对融合信号进行降噪处理，以得到第一录音信号，可以根据实际使用需求确定，本申请实施例不作限定。

本申请实施例提供一种电子设备的录音方法，由于当声源与电子设备之间的距离发生改变时，电子设备的摄像头的拍摄焦距也会发生变化，因此，通过将与第i个麦克风的连接的第一语音通路设定为固定增益，将与第i个麦克风连接的第二语音通路设定为随拍摄焦距变化的可变增益，从而使得拍摄焦距变大时该第二语音通路的增益变大以录制更远距离的信号，拍摄焦距变小时该第二语音通路增益较小以录制更近距离的信号，进而通过比较两路信号的差异对语音信号做增强处理，从而改善了最终融合得到的语音信号的质量，并且提高了视频的拍摄效果。

可选的，在对从M个麦克风得到的M个语音增强信号进行融合处理之后，可以先对融合信号进行降噪处理，再得到最终的录音信号。示例性的，结合图2，如图3所示，上述S204具体可以通过下述的S204A至S204C实现。

S204A、电子设备对M个语音增强信号进行信号融合处理，得到第一融合信号。

S204B、电子设备获取摄像头的视场角和拍摄方向。

在电子设备处于视频拍摄过程之中，当摄像头的拍摄焦距发生变化时，摄像头的视场角也会发生变化，例如当拍摄焦距增大时视场角减小，当拍摄焦距减小时视场角增大；当电子设备出现转向时，例如沿着水平线从左向右移动或者沿着垂直线从上向下移动，摄像头的拍摄方向会发生变化。

由于当摄像头的视场角和拍摄方向发生变化时，声源位置均有可能会发生变化，那么存在着有来自拍摄范围内的主音频，还有来自拍摄范围外的噪声，因此，为了更为准确地对语音信号降噪，本申请实施例可以获取摄像头的视场角和拍摄方向，以根据摄像头的视场角和拍摄方向，消除来自拍摄范围之外的噪声。

S204C、电子设备根据摄像头的视场角和拍摄方向，对第一融合信号进行降噪处理，得到第一录音信号。

其中，上述降噪处理用于消除来自拍摄范围之外的噪声，即消除来自实际取景区域之外的声音。

如图4所示，当用户手持水平放置的手机朝向用户的正前方时，若手机的摄像头的拍摄焦距为×4(即4倍焦距)，摄像头的视场角(也称为广角)可以为α。由于融合信号包括了拍摄范围内的录音信号和拍摄范围外的录音信号，因此，在手机根据摄像头的视场角和拍摄方向，确定拍摄范围之后，手机可以根据该拍摄范围，采用预设算法，将融合信号中的拍摄范围外的录音信号消除或抵消，从而得到拍摄范围内的录音信号，即第一录音信号。

本申请实施例提供的录音方法，可以根据摄像头的视场角和拍摄方向，对融合信号进行降噪处理，以消除来自拍摄范围之外的噪声，从而可以提高最终得到的录音信号的录音质量。

可选的，由于在摄像头的视场角和拍摄方向发生变化时，声源与电子设备的相对位置有可能会发生变化，因此，为了更为准确地对语音信号降噪，本申请实施例可以周期性地获取摄像头的视场角和拍摄方向，以确定摄像头的视场角和拍摄方向是否发生变化。示例性的，在S204C之后，本申请实施例提供的录音方法还可以包括下述的S205至S207。

S205、电子设备重新获取摄像头的拍摄焦距，以得到第二融合信号。

在电子设备按照预设周期重新获取摄像头的拍摄焦距之后，该拍摄焦距相对于上次获取的拍摄焦距可能没有发生变化，也可能发生了变化。

如果拍摄焦距没有发生变化，那么无需对第二语音通路的增益进行调整，并直接对比较第一语音通路输出的语音信号和第二语音通路输出的语音信号，得到一个语音增强信号，即第二融合信号。

如果拍摄焦距发生了变化，那么需要重新对第二语音通路的增益进行调整；之后，根据初始焦距、调整后的焦距和初始增益，确定待调整增益，并将第二语音通路的增益调整为该待调整增益；再之后，比较第一语音通路输出的语音信号和第二语音通路输出的语音信号，得到一个语音增强信号，即第二融合信号。具体可以参照上述实施例S201至S204相关描述，此处不再赘述。

S206、电子设备重新获取摄像头的视场角和拍摄方向。

S207、在目标对象发生变化的情况下，电子设备根据变化后的目标对象，对第二融合信号进行降噪处理，得到第二录音信号。

其中，上述目标对象包括视场角和拍摄方向中的至少一项。

电子设备可以按照预设周期，周期性获取摄像头的视场角和拍摄方向，以检测摄像头的视场角和拍摄方向是否发生了变化。如果摄像头的视场角和拍摄方向中的至少一项发生了变化，那么电子设备需要根据变化后的视场角和拍摄方向，重新确定降噪方向，并对新的融合信号进行降噪处理。例如，如果用户转动电子设备，且声源位置保持不变，由于声源和麦克风的相对位置发生了变化，拍摄方向也发生了变化，因此，在这种情况下，电子设备需要根据变化后的拍摄方向，重新确定拍摄范围，之后根据该拍摄范围，采用预设算法，将第二融合信号中的拍摄范围外的录音信号消除或抵消，从而得到拍摄范围内的录音信号，即第二录音信号。

本申请实施例提供的录音方法，在摄像头的视场角和拍摄方向发生变化的情况下，声源与电子设备的相对位置有可能会发生变化，因此，通过周期性地获取摄像头的视场角和拍摄方向，能够准确确定拍摄范围，并更为准确地对语音信号降噪。

需要说明的是，本申请实施例提供的录音方法，执行主体可以为电子设备，录音装置，或者该录音装置中的用于执行录音方法的控制模块。本申请实施例中以录音装置执行录音方法为例，说明本申请实施例提供的录音装置。

如图5所示，本申请实施例提供一种录音装置500。该录音装置包括M个麦克风，且每个麦克风与一个第一语音通路和一个第二语音通路连接，M为大于或等于2的整数。该录音装置500包括获取模块501、确定模块502和处理模块503。

获取模块501，可以用于在处于视频拍摄状态的情况下，获取摄像头的拍摄焦距。确定模块502，可以用于若获取模块501获取的拍摄焦距由初始焦距变化为目标焦距，则根据该初始焦距、该目标焦距和初始增益，确定目标增益，该初始增益为与第i个麦克风连接的第一语音通路的增益。处理模块503，可以用于将与第i个麦克风连接的第二语音通路的增益调整为确定模块502确定的目标增益；并对与第i个麦克风连接的第一语音通路输出的语音信号和与第i个麦克风连接的第二语音通路输出的语音信号进行信号增强处理，得到第i 个语音增强信号；以及对M个语音增强信号进行信号融合处理，得到第一录音信号。其中，i依次取值为1、2……M。

可选的，确定模块502，具体可以用于：若目标焦距大于初始焦距，则将初始增益与第一增益之和，作为目标增益；或者，若目标焦距小于初始焦距，则将初始增益与第一增益之差，作为目标增益。其中，该第一增益为目标值和预设值的乘积，该目标值为该目标焦距与该初始焦距的差值的绝对值。

可选的，处理模块503，具体可以用于对M个语音增强信号进行信号融合处理，得到第一融合信号。获取模块501，还可以用于获取摄像头的视场角和拍摄方向。处理模块503，具体可以用于根据获取模块501获取的摄像头的视场角和拍摄方向，对第一融合信号进行降噪处理，得到第一录音信号，该降噪处理用于消除来自拍摄范围之外的噪声。

可选的，获取模块501，可以用于在得到第一录音信号之后，重新获取摄像头的拍摄焦距，以得到第二融合信号；以及重新获取摄像头的视场角和拍摄方向。处理模块503，还可以用于在目标对象发生变化的情况下，根据变化后的目标对象，对第二融合信号进行降噪处理，得到第二录音信号，其中，该目标对象包括视场角和拍摄方向中的至少一项。

可选的，处理模块503，还可以用于在获取摄像头的拍摄焦距之前，运行相机应用程序。处理模块503，还可以用于将摄像头的拍摄焦距设置为初始焦距，并将摄像头的视场角设置为初始视场角，以及将每个语音通路的增益设置为初始增益。

本申请实施例提供一种录音装置，由于当声源与电子设备的距离发生改变时，摄像头的拍摄焦距也会发生变化，因此，录音装置通过将与第i个麦克风的连接的第一语音通路设定为固定增益，将与第i个麦克风连接的第二语音通路设定为随拍摄焦距变化的可变增益，从而使得拍摄焦距变大时该第二语音通路的增益变大以录制更远距离的信号，拍摄焦距变小时该第二语音通路增益较小以录制更近距离的信号，进而录音装置通过比较两路信号的差异对语音信号做增强处理，从而改善了最终融合得到的语音信号的质量，并提高了视频的拍摄效果。

本申请实施例中的录音装置可以是装置，也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备，也可以为非移动电子设备。示例性的，移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本或者个人数字助理(personal digital assistant，PDA)等，非移动电子设备可以为服务器、网络附属存储器(network attached storage，NAS)、个人计算机(personal computer，PC)、电视机(television，TV)、柜员机或者自助机等，本申请实施例不作具体限定。

本申请实施例中的录音装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统，可以为ios操作系统，还可以为其他可能的操作系统，本申请实施例不作具体限定。

本申请实施例提供的录音装置能够实现图1至图4的方法实施例实现的各个过程，为避免重复，这里不再赘述。

可选的，如图6所示，本申请实施例还提供一种电子设备600，包括处理器601，存储器602，存储在存储器602上并可在处理器601上运行的程序或指令，该程序或指令被处理器601执行时实现上述录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

需要说明的是，本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。

图7为实现本申请实施例的一种电子设备的硬件结构示意图。

该电子设备700包括但不限于：射频单元701、网络模块702、音频输出单元703、输入单元704、传感器705、显示单元706、用户输入单元707、接口单元708、存储器709、以及处理器710等部件。

本领域技术人员可以理解，电子设备700还可以包括给各个部件供电的电源(比如电池)，电源可以通过电源管理系统与处理器710逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。该电子设备包括 M个麦克风，且每个麦克风与一个第一语音通路和一个第二语音通路连接，M为大于或等于2的整数。图7中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置，在此不再赘述。

处理器710，可以用于在处于视频拍摄状态的情况下，获取摄像头的拍摄焦距。处理器710，还可以用于若处理器710获取的拍摄焦距由初始焦距变化为目标焦距，则根据该初始焦距、该目标焦距和初始增益，确定目标增益，该初始增益为与第i个麦克风连接的第一语音通路的增益。处理器710，还可以用于将与第i个麦克风连接的第二语音通路的增益调整为目标增益；并对与第i个麦克风连接的第一语音通路输出的语音信号和与第i个麦克风连接的第二语音通路输出的语音信号进行信号增强处理，得到第i个语音增强信号；以及对M个语音增强信号进行信号融合处理，得到第一录音信号。其中，i依次取值为1、2……M。

可选的，处理器710，具体可以用于：若目标焦距大于初始焦距，则将初始增益与第一增益之和，作为目标增益；或者，若目标焦距小于初始焦距，则将初始增益与第一增益之差，作为目标增益。其中，第一增益为目标值和预设值的乘积，该目标值为目标焦距与初始焦距的差值的绝对值。

可选的，处理器710，具体可以用于：对M个语音增强信号进行信号融合处理，得到第一融合信号；并获取摄像头的视场角和拍摄方向；以及根据摄像头的视场角和拍摄方向，对第一融合信号进行降噪处理，得到第一录音信号，该降噪处理用于消除来自拍摄范围之外的噪声。

可选的，处理器710，可以用于在得到第一录音信号之后，重新获取摄像头的拍摄焦距，以得到第二融合信号；以及重新获取摄像头的视场角和拍摄方向；在目标对象发生变化的情况下，根据变化后的目标对象，对第二融合信号进行降噪处理，得到第二录音信号。其中，该目标对象包括视场角和拍摄方向中的至少一项。

可选的，处理器710，还可以用于在获取摄像头的拍摄焦距之前，运行相机应用程序；将摄像头的拍摄焦距设置为初始焦距，并将摄像头的视场角设置为初始视场角，以及将每个语音通路的增益设置为初始增益。

本申请实施例提供一种电子设备，由于当声源与电子设备之间的距离发生改变时，电子设备的摄像头的拍摄焦距也会发生变化，因此，电子设备通过将与第i个麦克风的连接的第一语音通路设定为固定增益，将与第i个麦克风连接的第二语音通路设定为随拍摄焦距变化的可变增益，从而使得拍摄焦距变大时该第二语音通路的增益变大以录制更远距离的信号，拍摄焦距变小时该第二语音通路增益较小以录制更近距离的信号，进而电子设备通过比较两路信号的差异对语音信号做增强处理，从而改善了最终融合得到的语音信号的质量，并提高了视频的拍摄效果。

应理解的是，本申请实施例中，输入单元704可以包括图形处理器(graphics processing unit，GPU)7041和麦克风7042，图形处理器7041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元706可包括显示面板7061，可以采用液晶显示器、有机发光二极管等形式来配置显示面板7061。用户输入单元707包括触控面板7071以及其他输入设备7072。触控面板7071，也称为触摸屏。触控面板7071可包括触摸检测装置和触摸控制器两个部分。其他输入设备7072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。存储器709可用于存储软件程序以及各种数据，包括但不限于应用程序和操作系统。处理器710可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器710中。

本申请实施例还提供一种可读存储介质，该可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，处理器为上述实施例中的电子设备中的处理器。可读存储介质，包括计算机可读存储介质，如计算机只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等。

本申请实施例另提供了一种芯片，该芯片包括处理器和通信接口，该通信接口和该处理器耦合，该处理器用于运行程序或指令，实现上述录音方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

应理解，本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例中的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

一种电子设备的录音方法，所述电子设备包括M个麦克风，且每个麦克风与一个第一语音通路和一个第二语音通路连接，M为大于或等于2的整数，所述方法包括：

在处于视频拍摄状态的情况下，获取摄像头的拍摄焦距；

若所述摄像头的拍摄焦距由初始焦距变化为目标焦距，则根据所述初始焦距、所述目标焦距和初始增益，确定目标增益，并将与第i个麦克风连接的第二语音通路的增益调整为目标增益，所述初始增益为与第i个麦克风连接的第一语音通路的增益，i依次取值为1、2……M；

对与第i个麦克风连接的第一语音通路输出的语音信号和与第i个麦克风连接的第二语音通路输出的语音信号进行信号增强处理，得到第i个语音增强信号；

对M个语音增强信号进行信号融合处理，得到第一录音信号。
根据权利要求1所述的方法，其中，所述根据所述初始焦距、所述目标焦距和初始增益，确定目标增益，包括：

若所述目标焦距大于所述初始焦距，则将所述初始增益与第一增益之和，作为所述目标增益；或者，

若所述目标焦距小于所述初始焦距，则将所述初始增益与第一增益之差，作为所述目标增益；

其中，所述第一增益为目标值和预设值的乘积，所述目标值为所述目标焦距与所述初始焦距的差值的绝对值。
根据权利要求1或2所述的方法，其中，所述对M个语音增强信号进行信号融合处理，得到第一录音信号，包括：

对所述M个语音增强信号进行信号融合处理，得到第一融合信号；

获取所述摄像头的视场角和拍摄方向；

根据所述摄像头的视场角和拍摄方向，对所述第一融合信号进行降噪处理，得到所述第一录音信号，所述降噪处理用于消除来自拍摄范围之外的噪声。
根据权利要求3所述的方法，其中，所述根据所述摄像头的视场角和拍摄方向，对所述第一融合信号进行降噪处理，得到所述第一录音信号之后，所述方法还包括：

重新获取所述摄像头的拍摄焦距，以得到第二融合信号；

重新获取所述摄像头的视场角和拍摄方向；

在目标对象发生变化的情况下，根据变化后的目标对象，对所述第二融合信号进行降噪处理，得到第二录音信号，其中，所述目标对象包括视场角和拍摄方向中的至少一项。
根据权利要求1或2所述的方法，其中，所述在处于视频拍摄状态的情况下，获取摄像头的拍摄焦距之前，所述方法还包括：

运行相机应用程序；

将所述摄像头的拍摄焦距设置为初始焦距，并将所述摄像头的视场角设置为初始视场角，以及将每个语音通路的增益设置为所述初始增益。
一种录音装置，其中，所述录音装置包括M个麦克风，且每个麦克风与一个第一语音通路和一个第二语音通路连接，M为大于或等于2的整数，所述录音装置包括获取模块、确定模块和处理模块；

所述获取模块，用于在处于视频拍摄状态的情况下，获取摄像头的拍摄焦距；

所述确定模块，用于若所述获取模块获取的所述拍摄焦距由初始焦距变化为目标焦距，则根据所述初始焦距、所述目标焦距和初始增益，确定目标增益，所述初始增益为与第i个麦克风连接的所述第一语音通路的增益；

所述处理模块，用于将与第i个麦克风连接的第二语音通路的增益调整为所述确定模块确定的所述目标增益；并对与第i个麦克风连接的第一语音通路输出的语音信号和与第i个麦克风连接的第二语音通路输出的语音信号进行信号增强处理，得到第i个语音增强信号；以及对M个语音增强信号进行信号融合处理，得到第一录音信号；

其中，i依次取值为1、2……M。
根据权利要求6所述的录音装置，其中，所述确定模块，具体用于：

若所述目标焦距大于所述初始焦距，则将所述初始增益与第一增益之和，作为所述目标增益；或者，

若所述目标焦距小于所述初始焦距，则将所述初始增益与第一增益之差，作为所述目标增益；

其中，所述第一增益为目标值和预设值的乘积，所述目标值为所述目标焦距与所述初始焦距的差值的绝对值。
根据权利要求6或7所述的录音装置，其中，所述处理模块，具体用于对所述M个语音增强信号进行信号融合处理，得到第一融合信号；

所述获取模块，还用于获取所述摄像头的视场角和拍摄方向；

所述处理模块，具体用于根据所述获取模块获取的所述摄像头的视场角和拍摄方向，对所述第一融合信号进行降噪处理，得到所述第一录音信号，所述降噪处理用于消除来自拍摄范围之外的噪声。
根据权利要求8所述的录音装置，其中，所述获取模块，用于在得到所述第一录音信号之后，重新获取所述摄像头的拍摄焦距，以得到第二融合信号；以及重新获取所述摄像头的视场角和拍摄方向；

所述处理模块，还用于在目标对象发生变化的情况下，根据变化后的目标对象，对所述第二融合信号进行降噪处理，得到第二录音信号，其中，所述目标对象包括视场角和拍摄方向中的至少一项。
根据权利要求6或7所述的录音装置，其中，所述处理模块，还用于在获取摄像头的拍摄焦距之前，运行相机应用程序；

所述处理模块，还用于将所述摄像头的拍摄焦距设置为初始焦距，并将所述摄像头的视场角设置为初始视场角，以及将每个语音通路的增益设置为所述初始增益。
一种电子设备，其中，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的录音方法的步骤。
一种电子设备，被配置成用于执行如权利要求1至5中任一项所述的录音方法。
一种可读存储介质，其中，所述可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的录音方法的步骤。