CN113452854A

CN113452854A - 一种基于四麦阵列的多方会议通话系统及方法

Info

Publication number: CN113452854A
Application number: CN202110654919.2A
Authority: CN
Inventors: 胡程远
Original assignee: Shenzhen Boluosi Technology Co ltd
Current assignee: Shenzhen Boluosi Technology Co ltd
Priority date: 2021-06-11
Filing date: 2021-06-11
Publication date: 2021-09-28

Abstract

本发明公开了一种基于四麦阵列的多方会议通话系统及方法，系统包括：麦克风模块：用于收集声源的声音；仿真处理模块：用于对所述声源的声音进行仿真处理，生成四个音区，所述音区包括音频信号，所述音频信号用于区分声源方位；其中，所述麦克风模块包括由四个麦克风组成的麦克风阵列，所述四个麦克风分别位于四个不同方向。本发明通过将空间划分为四个音区，根据音区的音频信号区分声源方位，实现会议设备多方说话且可以区分方位的功能，同时有效提升了语音通话的质量。

Description

一种基于四麦阵列的多方会议通话系统及方法

技术领域

本发明涉及会议通话技术领域，具体涉及一种基于四麦阵列的多方会议通话系统及方法。

背景技术

全球化经济快速发展的过程中，远程会议的使用越来越普遍，传统单麦克风的电话会议系统在拾音质量、回声以及环境噪声抑制方面已经难以满足需求，传统麦克风阵列的电话会议系统通过采用多通道去混响和回声消除技术，大大的提高了语音通话质量。

随着科技的不断进步，会议设备进行多方通话的需求也越来越多，要求设备可以支持多人同时对话且可以区分不同方位的说话人，虽然传统多麦克风阵列通过空域滤波特性和多通道去混响技术有效提升了语音质量，但仍难以实现会议设备多方说话且可以区分方位的功能。

发明内容

针对现有技术中的缺陷，本发明提供一种基于四麦阵列的多方会议通话系统及方法。

第一方面，一种基于四麦阵列的多方会议通话系统，包括：

麦克风模块：用于收集声源的声音；

仿真处理模块：用于对所述声源的声音进行仿真处理，生成四个音区，所述音区包括音频信号，所述音频信号用于区分声源方位；

其中，所述麦克风模块包括由四个麦克风组成的麦克风阵列，所述四个麦克风分别位于四个不同方向。

进一步地，所述四个方向形成对称关系。

进一步地，所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。

进一步地，所述回声消除包括线性回声消除和非线性回声消除。

进一步地，所述四个音区包括0～90度，90～180度，180～270度以及270～360度四个音区范围，所述四个音区之间相互隔离，每个音区只接收本音区内的音频信号。

第二方面，一种基于四麦阵列的多方会议通话方法，包括以下步骤：

接收麦克风阵列收集的不同方位声源的声音；

对声源的声音进行仿真处理，并生成四个音区，所述音区包括音频信号，所述音频信号用于区分声源方位。

其中，所述麦克风阵列包括四个麦克风，所述四个麦克风分别位于四个不同方向。

进一步地，所述四个方向形成对称关系。

进一步地，所述四个音区包括0～90度，90～180度，180～270度以及270～360度四个音区范围，所述四个音区相互隔离，每个音区只接收本音区内的音频信号。

本发明的有益效果体现在：在四个对称的位置添加四个麦克风，形成四麦阵列，对麦克风收集到不同方位声源的声音进行仿真，生成四个音区，四个音区包括了用于区分声源方位的音频信号，且彼此隔离，通过将空间划分为四个音区，根据音区的音频信号区分声源方位，实现会议设备多方说话且可以区分方位的功能，同时有效提升了语音通话的质量。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中，类似的元件或部分一般由类似的附图标记标识。附图中，各元件或部分并不一定按照实际的比例绘制。

图1为实施例一提供的一种基于四麦阵列的多方会议通话系统的模块框图；

图2为实施例一提供的一种基于四麦阵列的多方会议通话系统的结构原理图；

图3为实施例二提供的一种基于四麦阵列的多方会议通话方法的流程图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案，因此只作为示例，而不能以此来限制本发明的保护范围。

需要注意的是，除非另有说明，本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

实施例一

如图1所示，一种基于四麦阵列的多方会议通话系统，包括麦克风模块和仿真处理模块，麦克风模块包括麦克风阵列，麦克风阵列由位于四个不同方向的四个麦克风组成，四个方向形成对称关系，麦克风模块用于通过四个麦克风对不同方位声源的声音进行收集，仿真处理模块用于通过波束形成、回声消除以及深度神经网络计算模型对收集到声源的声音进行仿真处理，如图2所示，生成0～90度、90～180度、180～270度以及270～360度四个音区，并输出四个音区的音频，从而得到不同方位说话人的实时音频。

具体地，麦克风模块包括了由四个麦克风组成的麦克风阵列，四个麦克风分别位于四个不同的方向，四个方向在空间上形成一种对称关系，麦克风模块通过四个麦克风对不同方位声源的声音进行收集，将收集到声源的声音通过仿真处理模块进行波束形成，仿真出0～90度、90～180度、180～270度以及270～360度四个音区范围的音频波束，将本波束的声音放大，其他波束的声音得到抑制，但无法完全抑制，且此时声音中仍存在一些回声，影响语音质量，因此需要对音区的声音进行优化处理，先对音频波束进行回声消除，包括线性回声消除和非线性回声消除，拾取得到不同方位消除回声后的音频，然后再通过深度神经网络计算模型对回声残留进行二次处理，最终生成0～90度、90～180度、180～270度以及270～360度四个音区，音区里包括了音频信号，每个音区只能接收本音区内的音频信号，通过输出四个音区的音频，从而获得不同方位说话人的实时音频。

实施例二

如图3所示，一种基于四麦阵列的多方会议通话方法，包括以下步骤：

S1：接收麦克风阵列收集的不同方位声源的声音；

具体地，麦克风阵列由四个麦克风组成，四个麦克风分别位于四个不同的方向，四个方向在空间上构成对称关系，通过四个麦克风对不同方位声源的声音进行收集。

S2：对声源的声音进行仿真处理，并生成四个音区，所述音区包括音频信号，所述音频信号用于区分声源方位。

具体地，对收集到不同方位声源的声音进行波束形成，仿真出0～90度、90～180度、180～270度以及270～360度四个音区范围的音频波束，将本波束的声音放大，其他波束的声音得到抑制，但无法完全抑制，且此时声音中仍存在一些回声，影响语音质量，因此需要对音区的声音进行优化处理，先对音频波束进行回声消除，包括线性回声消除和非线性回声消除，拾取得到不同方位消除回声后的音频，然后再通过深度神经网络计算模型对回声残留进行二次处理，最终生成0～90度、90～180度、180～270度以及270～360度四个音区，音区里包括了音频信号，每个音区只能接收本音区内的音频信号，通过输出四个音区的音频，从而获得不同方位说话人的实时音频。

本发明在四个对称的位置添加四个麦克风，形成四麦阵列，对麦克风收集到不同方位声源的声音进行仿真，生成四个音区，四个音区包括了用于区分声源方位的音频信号，且彼此隔离，通过将空间划分为四个音区，根据音区的音频信号区分声源方位，实现会议设备多方说话且可以区分方位的功能，同时有效提升了语音通话的质量。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims

1.一种基于四麦阵列的多方会议通话系统，其特征在于，包括：

麦克风模块：用于收集声源的声音；

2.根据权利要求1所述的一种基于四麦阵列的多方会议通话系统，其特征在于，所述四个方向形成对称关系。

3.根据权利要求1所述的一种基于四麦阵列的多方会议通话系统，其特征在于，所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。

4.根据权利要求3所述的一种基于四麦阵列的多方会议通话系统，其特征在于，所述回声消除包括线性回声消除和非线性回声消除。

5.根据权利要求1所述的一种基于四麦阵列的多方会议通话系统，其特征在于，所述四个音区包括0～90度，90～180度，180～270度以及270～360度四个音区范围，所述四个音区之间相互隔离，每个音区只接收本音区内的音频信号。

6.一种基于四麦阵列的多方会议通话方法，其特征在于，包括以下步骤：

接收麦克风阵列收集的不同方位声源的声音；

对声源的声音进行仿真处理，并生成四个音区，所述音区包括音频信号，所述音频信号用于区分声源方位；

7.根据权利要求6所述的一种基于四麦阵列的多方会议通话方法，其特征在于，所述四个方向形成对称关系。

8.根据权利要求6所述的一种基于四麦阵列的多方会议通话方法，其特征在于，所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。

9.根据权利要求8所述的一种基于四麦阵列的多方会议通话方法，其特征在于，所述回声消除包括线性回声消除和非线性回声消除。

10.根据权利要求6所述的一种基于四麦阵列的多方会议通话方法，其特征在于，所述四个音区包括0～90度，90～180度，180～270度以及270～360度四个音区范围，所述四个音区相互隔离，每个音区只接收本音区内的音频信号。