CN113573212B

CN113573212B - 扩声系统、及麦克风通道数据选择方法

Info

Publication number: CN113573212B
Application number: CN202110623761.2A
Authority: CN
Inventors: 吴道远; 迟景立
Original assignee: Chengdu Qianli Intelligent Technology Co ltd
Current assignee: Chengdu Qianli Intelligent Technology Co ltd
Priority date: 2021-06-04
Filing date: 2021-06-04
Publication date: 2023-04-25
Anticipated expiration: 2041-06-04
Also published as: CN113573212A

Abstract

本发明涉及音频数据处理领域，具体涉及一种扩声系统、及麦克风通道数据选择方法，极大地降低混响以及噪声的影响同时还有利于扩大覆盖范围，保证了扩声质量。本发明麦克风通道数据选择方法，包括：配置每个麦克风通道采集数据的采样率以及采样位数；根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号，并将所述数字信号发送给音频处理模块；音频处理模块对数字信号进行处理，根据处理结果选择对应麦克风通道数据，并将对应麦克风通道数据发送给音频输出模块；音频输出模块将处理后的数字信号转换为模拟信号后发送至音响设备进行输出。本发明适用于对教室、会议室、报告厅等场地的声音扩大。

Description

扩声系统、及麦克风通道数据选择方法

技术领域

本发明涉及音频数据处理领域，具体涉及一种扩声系统、及麦克风通道数据选择方法。

背景技术

现有扩音系统中，在多只麦克风进行数据采集时，由于远距离麦克风的这种特性，在采集需要的语音数据时，同时也将多路麦克风的噪音都采集进来了，导致在融合输出时的噪音增大，同时也会因为多只麦克风采集的数据存在时间差和方位差导致融合后的声音数据混响很大。

现有的解决方案是采用类似麦克风阵列等技术，基于麦克风阵列算法或者将多路麦克风数据直接融合输出。

但基于麦克风阵列的方式，其覆盖范围有限，受硬件阵列影响，不利于扩大覆盖范围；并且将多路麦克风直接融合，不仅不能消除混响，相反带来了噪声增加、混响加重，导致扩声效果比单路使用时更差。

发明内容

本发明的目的是提供一种扩声系统、及麦克风通道数据选择方法，极大地降低混响以及噪声的影响同时还有利于扩大覆盖范围，保证了扩声质量。

本发明采取如下技术方案实现上述目的，扩声系统，用于对场地中发言人的声音进行扩大，包括多个麦克风及音响设备，所述多个麦克风安装在场地各处，用于采集发言人的声音信号并将声音信号发送至音响设备进行输出，还包括音频配置模块、音频采集模块、音频处理模块以及音频输出模块；

所述音频配置模块用于配置每个麦克风通道采集数据的采样率以及采样位数；

所述音频采集模块用于根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号，并将所述数字信号发送给音频处理模块；

所述音频处理模块用于对数字信号进行处理，根据处理结果选择相应麦克风通道数据，并将对应麦克风通道数据发送给音频输出模块；

所述音频输出模块将对应麦克风通道数据的数字信号转换为模拟信号后发送至音响设备进行输出。

进一步的是，所述音频处理模块对数字信号的处理包括：

音频处理模块对每帧数字信号进行数字运算，获得每帧信号的信噪比SNR，并对每帧信号进行人声VAD检查，得到判断当前帧数据是人声数据的可信度SCR；

及计算每个麦克风通道N帧内的人声可信度SCR大于设置阈值的帧数，并将大于设置阈值的帧数记为VN，N大于0；

并计算每个麦克风通道N帧内判定为人声的帧数比V，V＝VN/N；

根据每个麦克风通道N帧内的平均信噪比SNR以及帧数比V计算得到每个麦克风通道的权值，权值记为K，并选取最大权值对应的麦克风通道数据作为当前输出数据。

进一步的是，所述权值K的计算公式为：K＝(SNR*Ws+V*Wv)*P，Ws为信噪比的权重，Wv为人声信号的权重，P为麦克风的数据优先级。

进一步的是，所述音频处理模块还用于对当前输出数据进行音效处理，音效处理完成之后将当前输出数据发送至音频输出模块。

进一步的是，所述音效处理包括降噪、EQ、回声抑制以及增益调节。

麦克风通道数据选择方法，应用于上述所述的扩声系统，包括：

步骤1、配置每个麦克风通道采集数据的采样率以及采样位数；

步骤2、根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号，并将所述数字信号发送给音频处理模块；

步骤3、音频处理模块对数字信号进行处理，根据处理结果选择相应麦克风通道数据，并将对应麦克风通道数据发送给音频输出模块；

步骤4、音频输出模块将对应麦克风通道数据的数字信号转换为模拟信号后发送至音响设备进行输出。

进一步的是，步骤3中，音频处理模块对数字信号进行处理的具体方法包括：

音频处理模块对数字信号进行数字运算，获得每帧信号的信噪比SNR，并对每帧信号进行人声VAD检查，得到判断当前帧数据是人声数据的可信度SCR；

及计算每个麦克风通道N帧内的人声可信度SCR大于设置阈值的帧数，并将大于设置阈值的帧数记为VN；

并计算每个麦克风通道N帧内判定为人声的帧数比V，V＝VN/N，N大于0；

根据每个麦克风通道N帧内的平均信噪比SNR以及帧数比V计算得到每个麦克风通道的

权值，权值记为K，并选取最大权值对应的麦克风通道数据作为当前输出数据。

本发明不再直接将多路麦克风数据进行融合处理，直接降低了对噪声数据融合的概率；并在数据采集之前配置了每个麦克风通道采集数据的采样率以及采样位数，根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号，并将所述数字信号帧发送给音频处理模块，音频处理模块根据人声数据可信度、每个麦克风通道N帧内平均信噪比以及每个麦克风通道N帧内人声的帧数比计算得到每个麦克风通道的权值，权值较大，表示人声的概率大；因此选择权值最大的麦克风通道数据作为输出数据，进一步降低了噪声数据来源；并且本发明并未采取麦克风阵列的技术，因此极大地降低混响以及噪声的影响同时还有利于扩大覆盖范围，保证了扩声质量。

附图说明

图1是本发明的方法流程图。

具体实施方式

本发明扩声系统，用于对场地中发言人的声音进行扩大，包括多个麦克风及音响设备，所述多个麦克风安装在场地各处，用于采集发言人的声音信号并将声音信号发送至音响设备进行输出，还包括音频配置模块、音频采集模块、音频处理模块以及音频输出模块；

例如，可以用于教室、会议室、报告厅等的声音扩大，可以在教室、会议室、报告厅等场地各处安装设置麦克风；发言人不需要手持麦克风或者佩戴扩音器或者只能站在固定位置发言。

音频配置模块用于配置每个麦克风通道采集数据的采样率以及采样位数；

音频采集模块用于根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号，并将所述数字信号发送给音频处理模块；

音频输出模块将对应麦克风通道数据的数字信号转换为模拟信号后发送至音响设备进行输出。

其中音频处理模块对数字信号帧的处理包括：

音频处理模块对每帧数字信号进行数字运算，获得每帧信号的信噪比SNR，并对每帧信号进行人声VAD(VoiceActivityDetection，即语音活动检测)检查，得到判断当前帧数据是人声数据的可信度SCR；

阈值可以设置为0.5；

并计算每个麦克风通道N帧内判定为人声的帧数比V，V＝VN/N；

其中权值K的计算公式为：K＝(SNR*Ws+V*Wv)*P，Ws为信噪比的权重，Wv为人声信号的权重，P为麦克风的数据优先级。

音频处理模块还用于对当前输出数据进行音效处理，音效处理完成之后将当前输出数据发送至音频输出模块。

音效处理包括降噪、EQ(Equaliser)、回声抑制以及增益调节。

EQ的基本作用是通过对声音某一个或多个频段进行增益或衰减，从而达到调整音色的目的。

EQ通常包括以下三个参数：Frequency，频率――这是用于设定你要进行调整的频率点的参数；Gain，增益――用于调整在你设定好的F值上进行增益或衰减的参数；Quantize――用于设定你要进行增益或衰减的频段“宽度”的参数。在这里，要注意是：当你设定的Q值越小的时候，你所处理的频段就越宽，而当你设定的Q值越大的时候，你所处理的频段就越窄。

麦克风通道数据选择方法，其方法流程图如图1所示，包括：

步骤101、配置每个麦克风通道采集数据的采样率以及采样位数；

步骤102、根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号，并将所述数字信号发送给音频处理模块；

步骤103、音频处理模块对数字信号进行处理，根据处理结果选择相应麦克风通道数据，并将对应麦克风通道数据发送给音频输出模块；

步骤104、音频输出模块将对应麦克风通道数据的数字信号转换为模拟信号后发送至音响

设备进行输出。

步骤103中，音频处理模块对数字信号进行处理的具体方法包括：

并计算每个麦克风通道N帧内的平均信噪比N为数据帧数；以及计算每个麦克风通道N帧内的人声可信度SCR大于设置阈值的帧数，并将大于设置阈值的帧数记为VN；

根据每个麦克风通道N帧内的平均信噪比以及帧数比V计算得到每个麦克风通道的权值，权值记为K，并选取最大权值对应的麦克风通道数据作为当前输出数据。

权值K的计算公式为：Ws为信噪比的权重，Wv为人声信号的权重，P为麦克风的数据优先级。

音频处理模块还用于对当前输出数据进行音效处理，音效处理完成之后将当前输出数据发送至音频输出模块，音效处理包括降噪、EQ、回声抑制以及增益调节。

本发明未采用麦克风阵列的技术，避免了覆盖方法的缩小，不再直接将多路麦克风数据进行融合处理，就直接降低了对噪声数据融合的概率；并且音频处理模块根据人声数据可信度、每个麦克风通道N帧内平均信噪比以及每个麦克风通道N帧内人声的帧数比计算得到每个麦克风通道的权值，权值越大，表示为人声的概率越大；因此选择权值最大的麦克风通道数据作为输出数据，进一步降低了噪声数据来源。

综上所述，本发明极大地降低混响以及噪声的影响同时还有利于扩大覆盖范围，保证了扩声质量。