CN105763956B

CN105763956B - 视频聊天中录音的方法和终端

Info

Publication number: CN105763956B
Application number: CN201410779109.XA
Authority: CN
Inventors: 康俊腾
Original assignee: Huawei Device Dongguan Co Ltd
Current assignee: Huawei Device Co Ltd
Priority date: 2014-12-15
Filing date: 2014-12-15
Publication date: 2018-12-14
Anticipated expiration: 2034-12-15
Also published as: US20170330581A1; JP2018506243A; KR101946434B1; JP6368055B2; WO2016095773A1; KR20170094440A; EP3226574B1; US10152985B2; EP3226574A4; EP3226574A1; CN105763956A

Abstract

本发明实施例公开了视频聊天中录音的方法和终端，用于降低视频聊天过程中的背景噪声和多人嘈杂声，提高视频聊天的语音质量。第一终端将视频通话界面划分为多个角域，确定各角域的波束配置信息后，将第一终端的选定角域的波束配置信息发送给第二终端，第二终端根据该波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减。

Description

视频聊天中录音的方法和终端

技术领域

本发明涉及通信技术领域，尤其涉及视频聊天中录音的方法和终端。

背景技术

网络的发展促进了通讯手段的变化，传统的交流方式已经不能满足人们的要求。从E-mai到视频电话，网络带来了通讯速度的提升，更降低了通讯成本。而随着宽带网络的普及，人们对网络通讯也有了进一步的要求。宽带网络的发展，改变了传统网络通讯的质量和形式，使交流不再只是局限于普通语言文字，利用视频聊天让天各一方的朋友能够彼此相见，或者进行多人会议等已经成为一种普及的方式。

在视频聊天中，有多个终端，称当前拾取声音(或称录音)并发送出去的终端为第二终端，称当前等待接收该第二终端发送的声音的终端为第一终端，在视频聊天场景中，特别是在多人会议中，第二终端前参与视频聊天的人员可能是多个，第二终端为了能拾取到该第二终端前每个人的声音，一般采用全指向录音，即声音从0至360度进入麦克风而输出不会有明显的变化。

然而在实际应用中，采用全指向录音，一方面第二终端会拾取到过多的背景噪声，另一方面，当第一终端前参与视频聊天的人员需要与第二终端前参与视频聊天的多人中的其中一个进行聊天时，第二终端也会同时拾取其他人发出的嘈杂的声音，严重影响了视频聊天的语音质量。

发明内容

本发明实施例提供了视频聊天中录音的方法和终端，用于降低视频聊天过程中的背景噪声和多人嘈杂声，提高视频聊天的语音质量。

本发明实施例第一方面提供了一种视频聊天中录音的方法，包括：

第一终端将视频通话界面划分成多个角域，所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面；

所述第一终端根据各角域在所述视频通话界面中的位置，确定各角域对应的波束配置信息，所述波束配置为波束赋形技术的输入参数；

当所述第一终端确定选定角域时，所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端，所述选定角域包括所述多个角域中的至少一个角域；

所述第二终端接收所述第一终端发送的所述选定角域对应的波束配置信息；

所述第二终端根据所述波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，得到处理后的声音信号；

所述第二终端将所述处理后的声音信号传输给所述第一终端。

结合本发明实施例的第一方面，本发明实施例第一方面的第一种实现方式中，所述第二终端中包括至少两个麦克风；

所述第二终端根据所述波束配置信息，对录取到的声音信号进行波束赋形处理具体包括：

所述第二终端根据所述波束配置信息，调整每个麦克风采集的声音信号的参数，使得所述第二终端中各麦克风采集到的声音信号合成后，仅存在所述选定角域的声音信号。

结合本发明实施例的第一方面，本发明实施例第一方面的第二种实现方式中，所述第一终端将视频通话界面划分成多个角域包括：

所述第一终端根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域，使得每个参与人员占据一块区域；

或，

所述第一终端将所述视频通话界面等分成多个角域。

结合本发明实施例的第一方面至第一方面的第二种实现方式，本发明实施例第一方面的第三种实现方式中，，所述波束配置信息包括声源方位角度，波束方向和波束宽度；

所述第一终端根据各角域在所述视频通话界面中的位置，确定所述各角域对应的波束配置信息包括：

所述第一终端根据各角域在所述视频通话界面中的位置，计算所述各角域对应的声源方位角度，波束方向和波束宽度；

或，

所述第一终端根据各角域在所述视频通话界面中的位置和预置配置信息，匹配得到所述所述各角域对应的声源方位角度，波束方向和波束宽度。

本发明实施例第二方面提供了一种视频聊天中录音的方法，包括：

当所述第一终端确定选定角域时，所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端，使得所述第二终端根据所述选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，增强所述选定角域的声音信号的信号强度，衰减其他角域的声音信号的信号强度，所述选定角域包括所述多个角域中的至少一个角域。

结合本发明实施例的第二方面，本发明实施例第二方面的第一种实现方式中，所述第一终端将视频通话界面划分成多个角域包括：

或，

所述第一终端将所述视频通话界面等分成多个角域。

结合本发明实施例的第二方面或第二方面的第一种实现方式，本发明实施例第二方面的第二种实现方式中，所述波束配置信息包括声源方位角度，波束方向和波束宽度；

或，

结合本发明实施例的第二方面至第二方面的第二种实现方式，本发明实施例第二方面的第三种实现方式中，所述当所述第一终端确定选定角域时的步骤之前还包括：

所述第一终端接收用户选择所述多块角域中至少一块角域的信息，确定被选择的角域为所述选定角域。

本发明实施例第三方面提供了一种视频聊天中录音的方法，包括：

第二终端接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息，所述波束配置信息为波束赋形技术的输入参数，所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面，所述选定角域包括所述视频通话界面中多个角域中的至少一个角域；

结合本发明实施例的第三方面，本发明实施例第三方面的第一种实现方式中，所述波束配置信息包括声源方位角度，波束方向和波束宽度；

所述第二终端中包括至少两个麦克风；

本发明实施例第四方面提供了一种终端，作为第一终端使用，用于在视频聊天中录音，包括：

划分模块，用于将视频通话界面划分成多个角域，所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面；

配置确定模块，用于根据各角域在所述视频通话界面中的位置，确定各角域对应的波束配置信息，所述波束配置为波束赋形技术的输入参数；

配置发送模块，用于当确定选定角域时，将所述选定角域对应的波束配置信息发送给所述第二终端，使得所述第二终端根据所述选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，增强所述选定角域的声音信号的信号强度，衰减其他角域的声音信号的信号强度，所述选定角域包括所述多个角域中的至少一个角域。

结合本发明实施例的第四方面，本发明实施例第四方面的第一种实现方式中，划分模块具体用于，根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域，使得每个参与人员占据一块区域，或，将所述视频通话界面等分成多个角域。

结合本发明实施例的第四方面或第四方面的第一种实现方式，本发明实施例第四方面的第二种实现方式中，所述波束配置信息包括声源方位角度，波束方向和波束宽度；

所述配置确定模块具体用于，根据各角域在所述视频通话界面中的位置，计算所述各角域对应的声源方位角度，波束方向和波束宽度，或，根据各角域在所述视频通话界面中的位置和预置配置信息，匹配得到所述所述各角域对应的声源方位角度，波束方向和波束宽度。

结合本发明实施例的第四方面或第四方面的第二种实现方式中任一种实现方式，本发明实施例第四方面的第三种实现方式中，所述终端还包括：

角域接收模块，用于接收用户选择所述多块角域中至少一块角域的信息；

角域确定模块，用于根据所述角域接收模块接收到的信息，确定被选择的角域为所述选定角域。

本发明实施例第五方面提供了一种终端，作为第二终端使用，用于在视频聊天中录音，包括：

配置接收模块，用于接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息，所述波束配置信息为波束赋形技术的输入参数，所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面，所述选定角域包括所述视频通话界面中多个角域中的至少一个角域；

处理模块，用于根据所述波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，得到处理后的声音信号；

传输模块，用于将所述处理模块处理后的声音信号传输给所述第一终端。

结合本发明实施例的第五方面，本发明实施例第五方面的第一种实现方式中，所述波束配置信息包括声源方位角度，波束方向和波束宽度；

所述终端中包括至少两个麦克风；

所述处理模块具体用于，根据所述波束配置信息，调整每个麦克风采集的声音信号的参数，使得所述第二终端中各麦克风采集到的声音信号合成后，仅存在所述选定角域的声音信号，得到处理后的声音信号。

从以上技术方案可以看出，本发明实施例具有以下优点：本发明实施例中，第一终端将视频通话界面划分为多个角域，确定各角域的波束配置信息后，将第一终端的选定角域的波束配置信息发送给第二终端，第二终端根据该波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，避免了其它角域的声音对选定角域的声音的影响，降低了视频聊天过程中的背景噪声和多人嘈杂声，提高了视频聊天的语音质量。

附图说明

图1为本发明实施例中视频聊天中录音的方法一个流程示意图；

图2为本发明实施例中视频聊天中录音的方法另一个流程示意图；

图3为本发明实施例中视频聊天中录音的方法另一个流程示意图；

图4为本发明实施例中视频聊天中录音的方法另一个流程示意图；

图5为本发明实施例中视频聊天中录音的方法另一个流程示意图；

图6为本发明实施例中视频聊天中录音的方法另一个流程示意图；

图7为本发明实施例中终端一个结构示意图；

图8为本发明实施例中终端另一个结构示意图；

图9为本发明实施例中终端另一个结构示意图；

图10为本发明实施例中终端另一个结构示意图；

图11为本发明实施例中录音系统一个结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，尽管在本发明实施例中可能采用术语第一、第二等来描述各个终端，但终端不应限于这些术语。这些术语仅用来将终端彼此区分开。例如，在不脱离本发明实施例范围的情况下，第一终端也可以被称为第二终端，类似地，第二终端也可以被称为第一终端；同样的，第二终端也可以被称为第三终端等等，本发明实施例对此不做限制。

术语“波束赋形”又可称为空域滤波，是一种使用传感器阵列定向发送和接收信号的信号处理技术。波束赋形技术通过调整相位阵列的基本单元的参数，使得某些角度的信号获得相长干涉，而另一些角度的信号获得相消干涉。波束赋形既可以用于信号发射端，又可以用于信号接收端。在发射端，波束赋形器控制每一个发射装置的相位和信号幅度，从而在发射出的信号波阵中获得需要相长和相消干涉模式。在接收端，不同接收器接收到的信号被以一种恰当的方式组合起来，从而获得期盼中的信号辐射模式。

可以理解的是，视频聊天中录音的方法包括两类执行主体，设定其中一类是用于控制录音方位的第一终端，另一类是用于录音的第二终端。

请参阅图1，本发明实施例中视频聊天中录音的方法一个实施例包括：

101、第一终端将视频通话界面划分成多个角域；

当第一终端与第二终端进行视频通话时，该第一终端将视频通话界面划分成多个角域，该视频通话界面为该第一终端上显示的与该第二终端前参与人员进行视频聊天的界面。

102、所述第一终端根据各角域在所述视频通话界面中的位置，确定各角域对应的波束配置信息；

第一终端将视频通话界面划分成多个角域后，根据各角域在该视频通话界面中的位置，确定各角域对应的波束配置信息，该波束配置信息为波束赋形技术的输入参数。

103、当所述第一终端确定选定角域时，所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端；

在视频通话过程中，第一终端可以在该多个角域中确定选定角域，当该第一终端确定选定角域时，该第一终端将该选定角域对应的波束配置信息发送给第二终端，该选定角域可以包括多个角域中的至少一个角域。

104、第二终端接收所述第一终端发送的所述选定角域对应的波束配置信息；

第一终端将选定角域对应的波束配置信息发送给第二终端时，第二终端接收该第一终端发送的选定角域对应的波束配置信息。

105、第二终端根据所述波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，得到处理后的声音信号；

第二终端接收到该波束配置信息后，根据该波束配置信息，对录取到的声音信号进行波束赋形处理，使得该选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，得到处理后的声音信号；

106、第二终端将所述处理后的声音信号传输给所述第一终端。

第二终端得到该处理后的声音信号后，将该处理后的声音信号传输给第一终端，则第一终端得到了选定角域的声音信号的信号轻度被增强，其他角域的声音信号的信号强度被衰减的声音信号。

本发明实施例中，第一终端将视频通话界面划分为多个角域，确定各角域的波束配置信息后，将第一终端的选定角域的波束配置信息发送给第二终端，第二终端根据该波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，避免了其它角域的声音对选定角域的声音的影响，降低了视频聊天过程中的背景噪声和多人嘈杂声，提高了视频聊天的语音质量。

下面对本发明实施例中视频聊天中录音的方法进行详细描述，请参阅图2，本发明实施例中视频聊天中录音的方法另一个实施例包括：

201、第一终端将视频通话界面划分成多个角域；

可以理解的是，该第一终端将该视频通话界面划分成多个角域的方式有很多，例如，第一终端可以根据视频通话界面中参与人员的位置，将该视频通话界面划分成多块区域，使得每个参与人员占据一块区域，这样可以更准确的控制录音得到各个参与人员对应方位的声音；此外，第一终端也可以将该视频通话界面等分成多个角域，等分的份数可以根据参与人员的数目也可以根据视频通话界面的分辨率等，这样更方便对各个角域的波束配置信息的计算，还可以有其他的划分方式，此处不作限定。

202、所述第一终端根据各角域在所述视频通话界面中的位置，确定各角域对应的波束配置信息；

该波束配置信息包括声源方位角域，波束方向和波束宽度，进一步的，该波束配置信息中还可以包括采样率，麦克风间距，最大降噪量等参数，此处不作限定。

可以理解的是，确定各角域对应的波束配置信息的方式可以有很多种，得到各角域在该视频通话界面中的位置后，该第一终端可以根据各角域在该视频通话界面终端的位置，计算得到各角域对应的声源方位角域，波束方向和波束宽度；在实际应用中，还可以存在预置配置信息，该预置配置信息中存储有视频通话界面中各位置与波束配置信息之间的对应关系，该第一终端可以直接根据各角域在该视频通话界面中的位置和预置配置信息，匹配得到各角域对应的声源方位角域，波束方向和波束宽度，等其他波束配置信息中的参数，还可以有另外的确定各角域对应的波束配置信息的方式，此处不作限定。

203、所述第一终端接收用户选择所述多块角域中至少一块角域的信息，确定被选择的角域为所述选定角域；

用户可以选择视频通话界面中划分出的至少一块角域，此时，该第一终端接收用户选择该多块角域中至少一块角域的信息，确定被选择的角域为选定角域。

可以理解的是，选择角域时，可以通过手指触控，也可以通过按键输入，还可以通过悬浮触控等，此处不作限定。

204、当所述第一终端确定选定角域时，所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端；

当该第一终端确定选定角域时，该第一终端将该选定角域对应的波束配置信息发送给第二终端。

205、第二终端接收第一终端发送的所述选定角域对应的波束配置信息；

在视频通话过程中，该第二终端接收第一终端发送的选定角域对应的波束配置信息。

206、所述第二终端根据所述波束配置信息，调整每个麦克风采集的声音信号的参数，使得所述第二终端中各麦克风采集到的声音信号合成后，仅存在所述选定角域的声音信号，得到处理后的声音信号；

该第二终端中包括至少两个麦克风，该第二终端接收到波束配置信息后，根据该波束配置信息，调整每个麦克风采集的声音信号的参数，使得所述第二终端中各麦克风采集到的声音信号合成后，仅存在所述选定角域的声音信号，得到处理后的声音信号。

可以理解的是，该处理后的声音信号中仅存在该选定角域的声音信号，其他角域的声音信号都被衰减到一定阈值以下，可以认为不存在。

207、第二终端将所述处理后的声音信号传输给所述第一终端。

第二终端得到该处理后的声音信号后，将该处理后的声音信号传输给第一终端，则第一终端得到了选定角域的声音信号，其他角域的声音信号均为衰减到难以辨别。

本发明实施例中，第一终端可以根据视频通话界面中参与人员的位置，将该视频通话界面划分成多块区域，使得每个参与人员占据一块区域，这样可以更准确的得到参与人员对应方位的波束配置信息，将其发送给第二终端，从而可以更准确的得到各参与人员对应方位的声音，进一步的降低了视频聊天过程中的背景噪声和多人嘈杂声，提高了视频聊天的语音质量。

为便于理解，下面以一具体应用场景对本发明实施例中视频聊天中录音的方法进行具体描述：

终端A前面试官通过该终端A，对终端B前的三个求职者(按从左至右顺序为：求职者1，求职者2，求职者3)进行面试，

终端A与终端B之间接通视频聊天，终端A的视频通话界面上显示有三个求职者的画面；

终端A根据三个求职者在画面中的位置，将该视频通话界面划分成3个角域，每个求职者占据其中一个角域；

终端A根据划分出的三个角域的信息，计算出三个角域对应的波束配置信息；

用户用鼠标点击中间的一个角域，终端A接收到该操作，将被点击的这个角域确定为选定角域，将该选定角域对应的波束配置信息发送到终端B；

终端B根据该波束配置信息，调整麦克风采集的声音信号的参数，使得终端B录取的声音合成后，最终仅存在该选定角域的声音，终端B将处理后的声音传输到终端A；

此时终端A仅会接收到该选定角域所在方位(即求职者2)发出的声音。下面分别从第一终端和第二终端这两类执行主体的角度对本发明实施例中视频聊天中录音的方法进行描述。

一、从第一终端的角度对本发明实施例视频聊天中录音的方法进行描述。

请参阅图3，本发明实施例中视频聊天中录音的方法一个实施例包括：

301、第一终端将视频通话界面划分成多个角域；

302、所述第一终端根据各角域在所述视频通话界面中的位置，确定各角域对应的波束配置信息；

303、当所述第一终端确定选定角域时，所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端，使得所述第二终端根据所述选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，增强所述选定角域的声音信号的信号强度，衰减其他角域的声音信号的信号强度，所述选定角域包括所述多个角域中的至少一个角域。

在视频通话过程中，第一终端可以在该多个角域中确定选定角域，当该第一终端确定选定角域时，该第一终端将该选定角域对应的波束配置信息发送给第二终端，使得该第二终端根据该选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，增强所述选定角域的声音信号的信号强度，衰减其他角域的声音信号的信号强度。

本发明实施例中，第一终端将视频通话界面划分为多个角域，确定各角域的波束配置信息后，将第一终端的选定角域的波束配置信息发送给第二终端，使得第二终端根据该选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，增强所述选定角域的声音信号的信号强度，衰减其他角域的声音信号的信号强度，避免了其它角域的声音对选定角域的声音的影响，降低了视频聊天过程中的背景噪声和多人嘈杂声，提高了视频聊天的语音质量。

下面对本发明实施例中视频聊天中录音的方法进行具体描述，请参阅图4，本发明实施例中视频聊天中录音的方法另一个实施例包括：

201、第一终端将视频通话界面划分成多个角域；

404、当所述第一终端确定选定角域时，所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端，使得所述第二终端根据所述选定角域对应的波束配置信息，调整每个麦克风采集的声音信号的参数，将各麦克风采集到的声音信号合成后，仅存在所述选定角域的声音信号。

二、从第二终端的角度对本发明实施例视频聊天中录音的方法进行描述。

请参阅图5，本发明实施例中视频聊天中录音的方法另一个实施例包括：

501、第二终端接收第一终端发送的选定角域对应的波束配置信息；

502、第二终端根据所述波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，得到处理后的声音信号；

503、第二终端将所述处理后的声音信号传输给所述第一终端。

上述步骤501至503与步骤104至106类似，此处不作赘述。

本发明实施例中，第二终端根据接收到的第一终端发送选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，降低了视频聊天过程中的背景噪声和多人嘈杂声，提高了视频聊天的语音质量。

下面对本发明实施例中视频聊天中录音的方法进行具体描述，请参阅图6，本发明实施例中视频聊天中录音的方法另一个实施例包括：

601、第二终端接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息；

602、第二终端根据所述波束配置信息，调整每个麦克风采集的声音信号的参数，使得所述第二终端中各麦克风采集到的声音信号合成后，仅存在所述选定角域的声音信号，得到处理后的声音信号；

603、第二终端将所述处理后的声音信号传输给所述第一终端。

上述步骤601至603与步骤205至步骤207类似，此处不作赘述。

本发明实施例中，该第二终端能根据波束配置信息，利用波束赋形技术调整每个麦克风采集声音信号的参数，使得该第二终端中各麦克风录取到的声音信号合成后，使得所述第二终端中各麦克风采集到的声音信号合成后，仅存在所述选定角域的声音信号，准确的实现了降低了视频聊天过程中的背景噪声和多人嘈杂声，提高了视频聊天的语音质量的效果。

下面对本发明实施例中作为第一终端使用的终端进行描述。

请参阅图7，本发明实施例中终端一个实施例包括：

划分模块701，用于将视频通话界面划分成多个角域，所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面；

配置确定模块702，用于根据各角域在所述视频通话界面中的位置，确定各角域对应的波束配置信息，所述波束配置为波束赋形技术的输入参数；

配置发送模块703，用于当确定选定角域时，将所述选定角域对应的波束配置信息发送给所述第二终端，使得所述第二终端根据所述选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，增强所述选定角域的声音信号的信号强度，衰减其他角域的声音信号的信号强度，所述选定角域包括所述多个角域中的至少一个角域。

本发明实施例中，划分模块701将视频通话界面划分为多个角域，配置确定模块702确定各角域的波束配置信息后配置发送模块703将第一终端的选定角域的波束配置信息发送给第二终端，使得第二终端根据所述选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，增强所述选定角域的声音信号的信号强度，衰减其他角域的声音信号的信号强度，避免了其它角域的声音对选定角域的声音的影响，降低了视频聊天过程中的背景噪声和多人嘈杂声，提高了视频聊天的语音质量。

上面实施例中，划分模块701将视频通话界面划分为多个角域，在实际应用中，划分模块701将视频通话界面划分为多个角域的方式有很多：

可选的，作为本发明终端的另一个实施例，上述终端中划分模块701具体可以用于，根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域，使得每个参与人员占据一块区域。

本实施例中，划分模块701按照参与人员的位置对视频通话界面进行划分，可以使得最终录音选定的方位对应于参与人员的实际位置，能更好的达到降低视频聊天过程中的背景噪声和多人嘈杂声，提高了视频聊天的语音质量的效果。

可选的，作为本发明终端的另一个实施例，上述终端中划分模块701具体可以用于，将所述视频通话界面等分成多个角域。

本实施例中，划分模块701将视频通话界面等分，可以减少终端需要进行的计算量，提高终端的处理效率。

可以理解的是，划分模块701还可以采用其他的方式对该视频通话界面进行划分，此处不作限定。

上面实施例中，配置确定模块702确定各角域对应的波束配置信息，在实际应用中，该波束配置信息包括声源方位角域，波束方向和波束宽度，进一步的，该波束配置信息中还可以包括采样率，麦克风间距，最大降噪量等参数，此处不作限定。

配置确定模块702确定波束配置信息的方式也有很多种：

可选的，作为本发明终端的另一个实施例，上述终端中配置确定模块702具体可以用于，根据各角域在所述视频通话界面中的位置，计算所述各角域对应的声源方位角度，波束方向和波束宽度。

本实施例中，配置确定模块702直接根据角域的位置，计算波束配置信息，能使得到的波束配置信息更加准确。

可选的，作为本发明终端的另一个实施例，上述终端中配置确定模块702具体可以用于，根据各角域在所述视频通话界面中的位置和预置配置信息，匹配得到所述所述各角域对应的声源方位角度，波束方向和波束宽度。

本实施例中，配置确定模块702根据各角域的位置和预置配置信息，匹配得到各角域的波束配置信息，进一步的减少终端需要进行的计算量，提高终端的处理效率。

上面实施例中，当确定选定角域时，配置发送模块703将配置确定模块702确定的选定角域对应的波束配置信息发送给所述第二终端，在实际应用中，该移动终端还可以接受用户选择角域的信息，请参阅图8，作为本发明另一个实施例，上述终端中还包括：

角域接收模块801，用于接收用户选择所述多块角域中至少一块角域的信息；

角域确定模块802，用于根据所述角域接收模块801接收到的信息，确定被选择的角域为所述选定角域。

本实施例中，角域接收模块801可以接收用户选择角域的信息，角域确定模块802确定其为选定角域，这样可以根据用户需求，仅录取用户需求角域对应方位的声音。

可以理解的是，在实际应用中，角域接收模块801还可以用于接收第二终端发送的选定信息，该选定信息中包含需要被录音的方位的角域信息，再由角域确定模块802确定该角域为选定角域，还可以有其它确定选定角域的方式，此处不作限定。

下面对本发明实施例中作为第二终端使用的终端进行描述。

请参阅图9，本发明实施例中终端另一个实施例包括：

配置接收模块901，用于接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息，所述波束配置信息为波束赋形技术的输入参数，所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面，所述选定角域包括所述视频通话界面中多个角域中的至少一个角域；

处理模块902，用于根据所述波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，得到处理后的声音信号；

传输模块903，用于将所述处理模块902处理后的声音信号传输给所述第一终端。

本发明实施例中，处理模块902根据配置接收模块901接收到的第一终端发送的视频通话界面上选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，降低了视频聊天过程中的背景噪声和多人嘈杂声，提高了视频聊天的语音质量。

上面实施例中，配置接收模块901接收波束配置信息，在实际应用中，该波束配置信息包括声源方位角域，波束方向和波束宽度，进一步的，该波束配置信息中还可以包括采样率，麦克风间距，最大降噪量等参数，此处不作限定。

上面实施例中，处理模块902对录取到的声音信号进行波束赋形处理，在实际应用中，具体的处理方式可以有多种。

可选的，作为本发明终端的另一个实施例，该终端中可以包含有至少两个麦克风，该处理模块902具体用于，根据所述波束配置信息，调整每个麦克风采集的声音信号的参数，使得所述第二终端中各麦克风采集到的声音信号合成后，仅存在所述选定角域的声音信号，得到处理后的声音信号。

本实施例中，处理模块902能根据波束配置信息，调整每个麦克风采集的声音信号的参数，使得所述第二终端中各麦克风采集到的声音信号合成后，仅存在所述选定角域的声音信号，准确的实现了降低了视频聊天过程中的背景噪声和多人嘈杂声，提高了视频聊天的语音质量的效果。

可以理解的是，本发明中的第一终端与第二终端可以为相同的终端，也可以为不同的终端，即一个终端中可以同时包含有上述第一终端与第二终端中的所有模块，两个该终端在不同的应用场景或应用需求下分别作为第一终端和第二终端使用。

请参阅图10，为本发明实施例中终端1000另一个结构示意图，包括：

输入装置1001、输出装置1002、处理器1003和存储器1004(其中终端1000中的处理器1003的数量可以一个或多个，图10中以一个处理器1003为例)。在本发明的一些实施例中，输入装置1001、输出装置1002、处理器1003和存储器1004可通过总线或其它方式连接，其中，图8中以通过总线连接为例。

可以理解的是，该终端1000既可以作为第一终端使用，也可以作为第二终端使用。

结合图10所示终端1000，作为本发明实施例中终端另一个实施例，当其作为第一终端使用时，通过调用存储器1004存储的操作指令，处理器1003，用于执行如下步骤：

将视频通话界面划分成多个角域，所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面；

根据各角域在所述视频通话界面中的位置，确定各角域对应的波束配置信息，所述波束配置为波束赋形技术的输入参数；

当确定选定角域时，将所述选定角域对应的波束配置信息发送给所述第二终端，使得所述第二终端根据所述选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，增强所述选定角域的声音信号的信号强度，衰减其他角域的声音信号的信号强度，所述选定角域包括所述多个角域中的至少一个角域；

本发明的一些实施例中，该处理器1003具体用于执行如下步骤：

根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域，使得每个参与人员占据一块区域，或，将所述视频通话界面等分成多个角域；

本发明的一些实施例中，所述波束配置信息包括声源方位角度，波束方向和波束宽度；

该处理器1003具体用于执行如下步骤：

根据各角域在所述视频通话界面中的位置，计算所述各角域对应的声源方位角度，波束方向和波束宽度，或，根据各角域在所述视频通话界面中的位置和预置配置信息，匹配得到所述所述各角域对应的声源方位角度，波束方向和波束宽度；

本发明的一些实施例中，该处理器1003还用于执行如下步骤：

接收用户选择所述多块角域中至少一块角域的信息，确定被选择的角域为所述选定角域。

结合图10所示终端1000，作为本发明实施例中终端另一个实施例，当其作为第二终端使用时，通过调用存储器1004存储的操作指令，处理器1003，用于执行如下步骤：

接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息，所述波束配置信息为波束赋形技术的输入参数，所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面，所述选定角域包括所述视频通话界面中多个角域中的至少一个角域；

根据所述波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，得到处理后的声音信号；

将所述处理模块处理后的声音信号传输给所述第一终端；

本发明的一些实施例中，所述输入装置1001中包括至少两个麦克风；

该处理器1003具体用于执行如下步骤：

根据所述波束配置信息，调整每个麦克风采集的声音信号的参数，使得所述第二终端中各麦克风采集到的声音信号合成后，仅存在所述选定角域的声音信号，得到处理后的声音信号。

如图11所示，本发明实施例还提供了一种录音系统，用于在视频聊天中录音，包括：

图7、图8或图10对应实施例中作为第一终端1101使用的终端，和图9或图10对应实施例中作为第二终端1102使用的终端。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种视频聊天中录音的方法，其特征在于，包括：

第一终端与第二终端视频通话；

所述第一终端将视频通话界面划分成多个角域，所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面；

所述第一终端根据各角域在所述视频通话界面中的位置，确定各角域对应的波束配置信息，所述波束配置为波束赋形技术的输入参数；其中，所述波束配置信息包括声源方位角度，波束方向和波束宽度；所述第一终端根据各角域在所述视频通话界面中的位置，确定所述各角域对应的波束配置信息包括：所述第一终端根据各角域在所述视频通话界面中的位置，计算所述各角域对应的声源方位角度，波束方向和波束宽度；

2.根据权利要求1所述的方法，其特征在于，所述第二终端中包括至少两个麦克风；

3.根据权利要求1所述的方法，其特征在于，所述第一终端将视频通话界面划分成多个角域包括：

所述第一终端根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域，使得每个参与人员占据一块区域。

4.一种视频聊天中录音的方法，其特征在于，包括：

第一终端与第二终端视频通话；

所述第一终端根据各角域在所述视频通话界面中的位置，确定各角域对应的波束配置信息，所述波束配置为波束赋形技术的输入参数；其中，所述波束配置信息包括声源方位角度，波束方向和波束宽度；所述第一终端根据各角域在所述视频通话界面中的位置，确定所述各角域对应的波束配置信息包括：所述第一终端根据各角域在所述视频通话界面中的位置，计算所述各角域对应的声源方位角度，波束方向和波束宽度；当所述第一终端确定选定角域时，所述第一终端将所述选定角域对应的波束配置信息发送给所述第二终端，使得所述第二终端根据所述选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，增强所述选定角域的声音信号的信号强度，衰减其他角域的声音信号的信号强度，所述选定角域包括所述多个角域中的至少一个角域。

5.根据权利要求4所述的方法，其特征在于，所述第一终端将视频通话界面划分成多个角域包括：

6.根据权利要求4或5所述的方法，其特征在于，所述当所述第一终端确定选定角域时的步骤之前还包括：

7.一种视频聊天中录音的方法，其特征在于，包括：

第一终端与第二终端视频通话；

所述第二终端接收所述第一终端发送的视频通话界面上的选定角域对应的波束配置信息，所述波束配置信息为波束赋形技术的输入参数，所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面，所述选定角域包括所述视频通话界面中多个角域中的至少一个角域；

所述第二终端根据所述波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，得到处理后的声音信号；其中，所述波束配置信息包括声源方位角度，波束方向和波束宽度；所述波束配置信息是所述第一终端根据各角域在所述视频通话界面中的位置进行计算得到的；

8.根据权利要求7所述的方法，其特征在于，所述第二终端中包括至少两个麦克风；

9.一种终端，作为第一终端使用，用于在视频聊天中录音，其特征在于，包括：

划分模块，用于将视频通话界面划分成多个角域，所述视频通话界面为所述第一终端上显示的与第二终端前参与人员进行视频聊天的界面，所述第一终端与所述第二终端视频通话；

配置确定模块，用于根据各角域在所述视频通话界面中的位置，确定各角域对应的波束配置信息，所述波束配置为波束赋形技术的输入参数；其中，所述波束配置信息包括声源方位角度，波束方向和波束宽度；所述第一终端根据各角域在所述视频通话界面中的位置，确定所述各角域对应的波束配置信息包括：所述第一终端根据各角域在所述视频通话界面中的位置，计算所述各角域对应的声源方位角度，波束方向和波束宽度；配置发送模块，用于当确定选定角域时，将所述选定角域对应的波束配置信息发送给所述第二终端，使得所述第二终端根据所述选定角域对应的波束配置信息，对录取到的声音信号进行波束赋形处理，增强所述选定角域的声音信号的信号强度，衰减其他角域的声音信号的信号强度，所述选定角域包括所述多个角域中的至少一个角域。

10.根据权利要求9所述的终端，其特征在于，划分模块具体用于，根据所述视频通话界面中参与人员的位置将所述视频通话界面划分成多块区域，使得每个参与人员占据一块区域。

11.根据权利要求9或10所述的终端，其特征在于，所述终端还包括：

12.一种终端，作为第二终端使用，用于在视频聊天中录音，其特征在于，包括：

配置接收模块，用于接收第一终端发送的视频通话界面上的选定角域对应的波束配置信息，所述波束配置信息为波束赋形技术的输入参数，所述视频通话界面为所述第一终端上显示的与所述第二终端前参与人员进行视频聊天的界面，所述选定角域包括所述视频通话界面中多个角域中的至少一个角域；所述第一终端与所述第二终端视频通话；

处理模块，用于根据所述波束配置信息，对录取到的声音信号进行波束赋形处理，使得所述选定角域的声音信号的信号强度被增强，其他角域的声音信号的信号强度被衰减，得到处理后的声音信号；其中，所述波束配置信息包括声源方位角度，波束方向和波束宽度；所述波束配置信息是所述第一终端根据各角域在所述视频通话界面中的位置进行计算得到的；

13.根据权利要求12所述的终端，其特征在于，所述终端中包括至少两个麦克风；