CN113573212B - 扩声系统、及麦克风通道数据选择方法 - Google Patents
扩声系统、及麦克风通道数据选择方法 Download PDFInfo
- Publication number
- CN113573212B CN113573212B CN202110623761.2A CN202110623761A CN113573212B CN 113573212 B CN113573212 B CN 113573212B CN 202110623761 A CN202110623761 A CN 202110623761A CN 113573212 B CN113573212 B CN 113573212B
- Authority
- CN
- China
- Prior art keywords
- data
- microphone channel
- microphone
- audio
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及音频数据处理领域,具体涉及一种扩声系统、及麦克风通道数据选择方法,极大地降低混响以及噪声的影响同时还有利于扩大覆盖范围,保证了扩声质量。本发明麦克风通道数据选择方法,包括:配置每个麦克风通道采集数据的采样率以及采样位数;根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号,并将所述数字信号发送给音频处理模块;音频处理模块对数字信号进行处理,根据处理结果选择对应麦克风通道数据,并将对应麦克风通道数据发送给音频输出模块;音频输出模块将处理后的数字信号转换为模拟信号后发送至音响设备进行输出。本发明适用于对教室、会议室、报告厅等场地的声音扩大。
Description
技术领域
本发明涉及音频数据处理领域,具体涉及一种扩声系统、及麦克风通道数据选择方法。
背景技术
现有扩音系统中,在多只麦克风进行数据采集时,由于远距离麦克风的这种特性,在采集需要的语音数据时,同时也将多路麦克风的噪音都采集进来了,导致在融合输出时的噪音增大,同时也会因为多只麦克风采集的数据存在时间差和方位差导致融合后的声音数据混响很大。
现有的解决方案是采用类似麦克风阵列等技术,基于麦克风阵列算法或者将多路麦克风数据直接融合输出。
但基于麦克风阵列的方式,其覆盖范围有限,受硬件阵列影响,不利于扩大覆盖范围;并且将多路麦克风直接融合,不仅不能消除混响,相反带来了噪声增加、混响加重,导致扩声效果比单路使用时更差。
发明内容
本发明的目的是提供一种扩声系统、及麦克风通道数据选择方法,极大地降低混响以及噪声的影响同时还有利于扩大覆盖范围,保证了扩声质量。
本发明采取如下技术方案实现上述目的,扩声系统,用于对场地中发言人的声音进行扩大,包括多个麦克风及音响设备,所述多个麦克风安装在场地各处,用于采集发言人的声音信号并将声音信号发送至音响设备进行输出,还包括音频配置模块、音频采集模块、音频处理模块以及音频输出模块;
所述音频配置模块用于配置每个麦克风通道采集数据的采样率以及采样位数;
所述音频采集模块用于根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号,并将所述数字信号发送给音频处理模块;
所述音频处理模块用于对数字信号进行处理,根据处理结果选择相应麦克风通道数据,并将对应麦克风通道数据发送给音频输出模块;
所述音频输出模块将对应麦克风通道数据的数字信号转换为模拟信号后发送至音响设备进行输出。
进一步的是,所述音频处理模块对数字信号的处理包括:
音频处理模块对每帧数字信号进行数字运算,获得每帧信号的信噪比SNR,并对每帧信号进行人声VAD检查,得到判断当前帧数据是人声数据的可信度SCR;
及计算每个麦克风通道N帧内的人声可信度SCR大于设置阈值的帧数,并将大于设置阈值的帧数记为VN,N大于0;
并计算每个麦克风通道N帧内判定为人声的帧数比V,V=VN/N;
根据每个麦克风通道N帧内的平均信噪比SNR以及帧数比V计算得到每个麦克风通道的权值,权值记为K,并选取最大权值对应的麦克风通道数据作为当前输出数据。
进一步的是,所述权值K的计算公式为:K=(SNR*Ws+V*Wv)*P,Ws为信噪比的权重,Wv为人声信号的权重,P为麦克风的数据优先级。
进一步的是,所述音频处理模块还用于对当前输出数据进行音效处理,音效处理完成之后将当前输出数据发送至音频输出模块。
进一步的是,所述音效处理包括降噪、EQ、回声抑制以及增益调节。
麦克风通道数据选择方法,应用于上述所述的扩声系统,包括:
步骤1、配置每个麦克风通道采集数据的采样率以及采样位数;
步骤2、根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号,并将所述数字信号发送给音频处理模块;
步骤3、音频处理模块对数字信号进行处理,根据处理结果选择相应麦克风通道数据,并将对应麦克风通道数据发送给音频输出模块;
步骤4、音频输出模块将对应麦克风通道数据的数字信号转换为模拟信号后发送至音响设备进行输出。
进一步的是,步骤3中,音频处理模块对数字信号进行处理的具体方法包括:
音频处理模块对数字信号进行数字运算,获得每帧信号的信噪比SNR,并对每帧信号进行人声VAD检查,得到判断当前帧数据是人声数据的可信度SCR;
及计算每个麦克风通道N帧内的人声可信度SCR大于设置阈值的帧数,并将大于设置阈值的帧数记为VN;
并计算每个麦克风通道N帧内判定为人声的帧数比V,V=VN/N,N大于0;
根据每个麦克风通道N帧内的平均信噪比SNR以及帧数比V计算得到每个麦克风通道的
权值,权值记为K,并选取最大权值对应的麦克风通道数据作为当前输出数据。
进一步的是,所述权值K的计算公式为:K=(SNR*Ws+V*Wv)*P,Ws为信噪比的权重,Wv为人声信号的权重,P为麦克风的数据优先级。
进一步的是,所述音频处理模块还用于对当前输出数据进行音效处理,音效处理完成之后将当前输出数据发送至音频输出模块。
进一步的是,所述音效处理包括降噪、EQ、回声抑制以及增益调节。
本发明不再直接将多路麦克风数据进行融合处理,直接降低了对噪声数据融合的概率;并在数据采集之前配置了每个麦克风通道采集数据的采样率以及采样位数,根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号,并将所述数字信号帧发送给音频处理模块,音频处理模块根据人声数据可信度、每个麦克风通道N帧内平均信噪比以及每个麦克风通道N帧内人声的帧数比计算得到每个麦克风通道的权值,权值较大,表示人声的概率大;因此选择权值最大的麦克风通道数据作为输出数据,进一步降低了噪声数据来源;并且本发明并未采取麦克风阵列的技术,因此极大地降低混响以及噪声的影响同时还有利于扩大覆盖范围,保证了扩声质量。
附图说明
图1是本发明的方法流程图。
具体实施方式
本发明扩声系统,用于对场地中发言人的声音进行扩大,包括多个麦克风及音响设备,所述多个麦克风安装在场地各处,用于采集发言人的声音信号并将声音信号发送至音响设备进行输出,还包括音频配置模块、音频采集模块、音频处理模块以及音频输出模块;
例如,可以用于教室、会议室、报告厅等的声音扩大,可以在教室、会议室、报告厅等场地各处安装设置麦克风;发言人不需要手持麦克风或者佩戴扩音器或者只能站在固定位置发言。
音频配置模块用于配置每个麦克风通道采集数据的采样率以及采样位数;
音频采集模块用于根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号,并将所述数字信号发送给音频处理模块;
所述音频处理模块用于对数字信号进行处理,根据处理结果选择相应麦克风通道数据,并将对应麦克风通道数据发送给音频输出模块;
音频输出模块将对应麦克风通道数据的数字信号转换为模拟信号后发送至音响设备进行输出。
其中音频处理模块对数字信号帧的处理包括:
音频处理模块对每帧数字信号进行数字运算,获得每帧信号的信噪比SNR,并对每帧信号进行人声VAD(VoiceActivityDetection,即语音活动检测)检查,得到判断当前帧数据是人声数据的可信度SCR;
及计算每个麦克风通道N帧内的人声可信度SCR大于设置阈值的帧数,并将大于设置阈值的帧数记为VN,N大于0;
阈值可以设置为0.5;
并计算每个麦克风通道N帧内判定为人声的帧数比V,V=VN/N;
根据每个麦克风通道N帧内的平均信噪比SNR以及帧数比V计算得到每个麦克风通道的权值,权值记为K,并选取最大权值对应的麦克风通道数据作为当前输出数据。
其中权值K的计算公式为:K=(SNR*Ws+V*Wv)*P,Ws为信噪比的权重,Wv为人声信号的权重,P为麦克风的数据优先级。
音频处理模块还用于对当前输出数据进行音效处理,音效处理完成之后将当前输出数据发送至音频输出模块。
音效处理包括降噪、EQ(Equaliser)、回声抑制以及增益调节。
EQ的基本作用是通过对声音某一个或多个频段进行增益或衰减,从而达到调整音色的目的。
EQ通常包括以下三个参数:Frequency,频率――这是用于设定你要进行调整的频率点的参数;Gain,增益――用于调整在你设定好的F值上进行增益或衰减的参数;Quantize――用于设定你要进行增益或衰减的频段“宽度”的参数。在这里,要注意是:当你设定的Q值越小的时候,你所处理的频段就越宽,而当你设定的Q值越大的时候,你所处理的频段就越窄。
麦克风通道数据选择方法,其方法流程图如图1所示,包括:
步骤101、配置每个麦克风通道采集数据的采样率以及采样位数;
步骤102、根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号,并将所述数字信号发送给音频处理模块;
步骤103、音频处理模块对数字信号进行处理,根据处理结果选择相应麦克风通道数据,并将对应麦克风通道数据发送给音频输出模块;
步骤104、音频输出模块将对应麦克风通道数据的数字信号转换为模拟信号后发送至音响
设备进行输出。
步骤103中,音频处理模块对数字信号进行处理的具体方法包括:
音频处理模块对数字信号进行数字运算,获得每帧信号的信噪比SNR,并对每帧信号进行人声VAD检查,得到判断当前帧数据是人声数据的可信度SCR;
并计算每个麦克风通道N帧内的平均信噪比N为数据帧数;以及计算每个麦克风通道N帧内的人声可信度SCR大于设置阈值的帧数,并将大于设置阈值的帧数记为VN;
并计算每个麦克风通道N帧内判定为人声的帧数比V,V=VN/N,N大于0;
根据每个麦克风通道N帧内的平均信噪比以及帧数比V计算得到每个麦克风通道的权值,权值记为K,并选取最大权值对应的麦克风通道数据作为当前输出数据。
权值K的计算公式为:Ws为信噪比的权重,Wv为人声信号的权重,P为麦克风的数据优先级。
音频处理模块还用于对当前输出数据进行音效处理,音效处理完成之后将当前输出数据发送至音频输出模块,音效处理包括降噪、EQ、回声抑制以及增益调节。
本发明未采用麦克风阵列的技术,避免了覆盖方法的缩小,不再直接将多路麦克风数据进行融合处理,就直接降低了对噪声数据融合的概率;并且音频处理模块根据人声数据可信度、每个麦克风通道N帧内平均信噪比以及每个麦克风通道N帧内人声的帧数比计算得到每个麦克风通道的权值,权值越大,表示为人声的概率越大;因此选择权值最大的麦克风通道数据作为输出数据,进一步降低了噪声数据来源。
综上所述,本发明极大地降低混响以及噪声的影响同时还有利于扩大覆盖范围,保证了扩声质量。
Claims (6)
1.扩声系统,用于对场地中发言人的声音进行扩大,包括多个麦克风及音响设备,所述多个麦克风安装在场地各处,用于采集发言人的声音信号并将声音信号发送至音响设备进行输出,其特征在于,还包括音频配置模块、音频采集模块、音频处理模块以及音频输出模块;
所述音频配置模块用于配置每个麦克风通道采集数据的采样率以及采样位数;
所述音频采集模块用于根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号,并将所述数字信号发送给音频处理模块;
所述音频处理模块用于对数字信号进行处理,根据处理结果选择相应麦克风通道数据,并将对应麦克风通道数据发送给音频输出模块;
所述音频输出模块将对应麦克风通道数据的数字信号转换为模拟信号后发送至音响设备进行输出;
音频处理模块对数字信号的处理包括:
音频处理模块对数字信号进行数字运算,获得每帧信号的信噪比SNR,并对每帧信号进行人声VAD检查,得到判断当前帧数据是人声数据的可信度SCR;
并计算每个麦克风通道N帧内判定为人声的帧数比V,V=VN/N,N大于0;
2.根据权利要求1所述的扩声系统,其特征在于,所述音频处理模块还用于对当前输出数据进行音效处理,音效处理完成之后将当前输出数据发送至音频输出模块。
3.根据权利要求2所述的扩声系统,其特征在于,所述音效处理包括降噪、EQ、回声抑制以及增益调节。
4.麦克风通道数据选择方法,应用于如权利要求1-3任意一项所述的扩声系统,其特征在于,包括:
步骤1、配置每个麦克风通道采集数据的采样率以及采样位数;
步骤2、根据配置的采样率以及采样位数将各个麦克风采集的模拟信号转换为数字信号,并将所述数字信号发送给音频处理模块;
步骤3、音频处理模块对数字信号进行处理,根据处理结果选择相应麦克风通道数据,并将对应麦克风通道数据发送给音频输出模块;
步骤4、音频输出模块将对应麦克风通道数据的数字信号转换为模拟信号后发送至音响设备进行输出;
步骤3中,音频处理模块对数字信号进行处理的具体方法包括:
音频处理模块对数字信号进行数字运算,获得每帧信号的信噪比SNR,并对每帧信号进行人声VAD检查,得到判断当前帧数据是人声数据的可信度SCR;
并计算每个麦克风通道N帧内判定为人声的帧数比V,V=VN/N,N大于0;
5.根据权利要求4所述的麦克风通道数据选择方法,其特征在于,所述音频处理模块还用于对当前输出数据进行音效处理,音效处理完成之后将当前输出数据发送至音频输出模块。
6.根据权利要求5所述的麦克风通道数据选择方法,其特征在于,所述音效处理包括降噪、EQ、回声抑制以及增益调节。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110623761.2A CN113573212B (zh) | 2021-06-04 | 2021-06-04 | 扩声系统、及麦克风通道数据选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110623761.2A CN113573212B (zh) | 2021-06-04 | 2021-06-04 | 扩声系统、及麦克风通道数据选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113573212A CN113573212A (zh) | 2021-10-29 |
CN113573212B true CN113573212B (zh) | 2023-04-25 |
Family
ID=78161796
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110623761.2A Active CN113573212B (zh) | 2021-06-04 | 2021-06-04 | 扩声系统、及麦克风通道数据选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113573212B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114501238B (zh) * | 2022-03-28 | 2022-09-13 | 广州迈聆信息科技有限公司 | 一种麦克风通道确定方法、装置、会议终端及介质 |
CN115410593A (zh) * | 2022-08-01 | 2022-11-29 | 钉钉(中国)信息技术有限公司 | 音频信道的选择方法、装置、设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102074236B (zh) * | 2010-11-29 | 2012-06-06 | 清华大学 | 一种分布式麦克风的说话人聚类方法 |
WO2017146970A1 (en) * | 2016-02-23 | 2017-08-31 | Dolby Laboratories Licensing Corporation | Auxiliary signal for detecting microphone impairment |
CN107592600B (zh) * | 2016-07-06 | 2024-04-02 | 深圳市三诺声智联股份有限公司 | 一种基于分布式麦克风的拾音筛选方法及拾音装置 |
AU2020323929A1 (en) * | 2019-07-30 | 2022-03-10 | Dolby International Ab | Acoustic echo cancellation control for distributed audio devices |
CN110706717B (zh) * | 2019-09-06 | 2021-11-09 | 西安合谱声学科技有限公司 | 一种基于麦克风阵列板的人声检测定向方法 |
-
2021
- 2021-06-04 CN CN202110623761.2A patent/CN113573212B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113573212A (zh) | 2021-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI713844B (zh) | 用於語音處理的方法及積體電路 | |
CN113573212B (zh) | 扩声系统、及麦克风通道数据选择方法 | |
CN104254029B (zh) | 一种具有麦克风的耳机、及改善耳机的音频灵敏度的方法 | |
JP4701944B2 (ja) | 音場制御機器 | |
WO2011158506A1 (ja) | 補聴器、信号処理方法及びプログラム | |
CN108235181B (zh) | 在音频处理装置中降噪的方法 | |
DK2835986T3 (en) | Hearing aid with input transducer and wireless receiver | |
JP5246120B2 (ja) | 収音装置、利得制御方法、およびプログラム | |
CN103124165A (zh) | 自动增益控制 | |
CN110875056B (zh) | 语音转录设备、系统、方法、及电子设备 | |
JPH09140000A (ja) | 会議用拡聴器 | |
JP2001309483A (ja) | 収音方法および収音装置 | |
US9532138B1 (en) | Systems and methods for suppressing audio noise in a communication system | |
EP2617127B2 (en) | Method and system for providing hearing assistance to a user | |
CN111429939A (zh) | 一种双声源的声音信号分离方法和拾音器 | |
CN103797816A (zh) | 语音增强系统和方法 | |
CN112804610B (zh) | TWS蓝牙耳机控制PC上微软Teams的方法 | |
CN111586527A (zh) | 智慧语音处理系统 | |
CN112349291A (zh) | 基于ai降噪模型的扩声系统及方法 | |
WO2023051622A1 (zh) | 提升远场语音交互性能的方法和远场语音交互系统 | |
CN112637438B (zh) | 一种基于单线传输的门禁双端对讲方法和系统 | |
CN109218917B (zh) | 一种实时通信系统中的自动声反馈监测与消除方法 | |
TW202203663A (zh) | 指向助聽裝置及其方法 | |
CN112911461A (zh) | 一种用于舞台表演的音箱系统高保真控制方法及系统 | |
CN108257607B (zh) | 一种多通道语音信号处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |