CN117479063A - 基于多领麦自适应降噪会议系统 - Google Patents
基于多领麦自适应降噪会议系统 Download PDFInfo
- Publication number
- CN117479063A CN117479063A CN202311491129.2A CN202311491129A CN117479063A CN 117479063 A CN117479063 A CN 117479063A CN 202311491129 A CN202311491129 A CN 202311491129A CN 117479063 A CN117479063 A CN 117479063A
- Authority
- CN
- China
- Prior art keywords
- collar
- audio
- noise reduction
- signal
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000209140 Triticum Species 0.000 title claims abstract description 21
- 235000021307 Triticum Nutrition 0.000 title claims abstract description 21
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 18
- 230000005236 sound signal Effects 0.000 claims abstract description 62
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000001228 spectrum Methods 0.000 claims description 17
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000011426 transformation method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/01—Input selection or mixing for amplifiers or loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了基于多领麦自适应降噪会议系统,属于音频处理系统领域。该系统包括:领麦,用于音频信号的采集;选择模块,用于对提取采集到的音频信号进行信号预处理并提取特征值,并根据特征值计算各领麦的加权值,以确定最佳领麦或领麦组合;降噪模块,用于对最佳领麦或领麦组合采集到的音频信号进行协同降噪处理;混合模块,用于对协同降噪后的音频信号进行混合,生成整体的会议音频输出。本发明通过多领麦协同降噪的方法,能够有效抑制背景噪声和干扰声源,提供清晰且准确的会议音频;自适应性和灵活性:系统能够根据不同会议场景和参与者的变化,自适应地调整麦克风选择和降噪算法,以适应不同的环境和需求。
Description
技术领域
本发明涉及音频处理系统领域,特别涉及基于多领麦自适应降噪会议系统。
背景技术
在大型会议场景中,由于不同麦克风之间的相互干扰和环境噪声的存在,会议音频质量可能会受到严重影响。现有技术一般多采用降噪处理算法,对音频数据进行优化处理。
在大多数的会议降噪算法中,都是采用声源定位,该方法由诸多局限性,如采用矩阵麦克风采集音频信号,只适用于小型会议场景,对于大型会议场景,无法获取到每个发言者声音;对于发言者的位置要求严苛,若发言者处于移动状态,拾音效果会大打折扣;无法同时获取多个发言者的声音等。
发明内容
本发明提供基于多领麦自适应降噪会议系统,通过对每个发音人的声音进行识别和分离,以及利用多领麦协同降噪的方法,提供清晰且准确的会议音频。
基于多领麦自适应降噪会议系统,包括:
领麦,用于音频信号的采集;
选择模块,用于对提取采集到的音频信号进行信号预处理并提取特征值,并根据所述特征值计算各领麦的加权值,以确定最佳领麦或领麦组合;
降噪模块,用于对所述最佳领麦或领麦组合采集到的音频信号进行协同降噪处理;
混合模块,用于对协同降噪后的音频信号进行混合,生成整体的会议音频输出。
更优地,所述信号预处理至少包括去底噪、降低回声和均衡化,以减少噪声和提高信号的平衡性。
更优地,所述特征值包括时域特征和频域特征。
更优地,所述根据所述特征值计算各领麦的加权值,通过如下公式计算:
Y为该麦克风加权值,W为能量/功率均值,S为信噪比,α为相位差,A、B、C分别为能量权重、相位权重和信噪比权重;
其中,当存在多个音频信号时,将多个音频信号进行分离,并分别进行上述步骤。
更优地,所述协同降噪包括:
信号对齐,通过延迟估计算法对音频信号进行时间对齐,使音频信号在时间上保持一致;
噪声估计,将对齐后的若干音频信号使用小波变换法估算出噪声模型,并通过对若干音频信号的自相关和/或互相关计算出噪声的频谱;
目标信号估计,基于谱减法对若干音频信号进行分析和处理,得到目标信号:
Y(jω)=X(jω)-T(jω)………(2)
其中,Y(jω)为目标信号的频谱,X(jω)为音频信号的频谱,T(jω)为噪声信号频谱;
信号混合和抑制,对所述目标信号,利用自适应滤波的最小均方误差算法进行加权和混合操作。
更优地,所述自适应滤波的最小均方误差算法包括:
S1,获取包含噪声的输入信号x(n)和期望信号d(n);
S2,预设最大迭代次数N,N为大于0的自然数;
S3,设置初始滤波器系数ω(0);
S4,计算滤波器的输出信号:
计算滤波器的误差信号:
更新滤波器的系数向量:
ω(n)=ω(n-1)+μ·e(n)·x(n)..........(5)
其中,μ为步长参数,n和i为自然数,μ的取值范围如下:
重复S4,直至满足最大迭代次数或误差收敛。
更优地,所述对协同降噪后的音频信号进行混合,包括:
音量平衡,调整协同降噪后的音频信号的音量,使其在混合音频中达到平衡;
交叠混合,将相邻的音频剪辑的重叠部分进行混合,逐步过渡到下一个剪辑,得到混合音频;
均衡和调音,对混合音频进行均衡和调音,以确保各个音频信号在频谱上的平衡和协调;
音频编码,将混合后的音频编码成无损的WAV格式并输出。
本发明提供基于多领麦自适应降噪会议系统,能够至少实现如下效果之一:
降噪效果优异:通过多领麦协同降噪的方法,能够有效抑制背景噪声和干扰声源,提供清晰且准确的会议音频;
自适应性和灵活性:系统能够根据不同会议场景和参与者的变化,自适应地调整麦克风选择和降噪算法,以适应不同的环境和需求。
附图说明
图1为本发明提供的基于多领麦自适应降噪会议系统的系统原理图。
具体实施方式
下面结合附图,对本发明的一个具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
如图1所示,基于多领麦自适应降噪会议系统,包括:
领麦,用于音频信号的采集。会议参与者佩戴领麦,每个领麦都配备一个麦克风,用于捕捉发音人的声音。领麦应具备良好的音频采集性能,以确保高质量的音频输入。领夹麦通过无线方式连接到一个客户端,无线连接方式可以为蓝牙连接或无线局域网(WLAN)等技术。客户端包括选择模块、降噪模块和混合模块。客户端是一个中央控制单元,用于接收和处理来自各个领麦的音频信号。客户端应具备较高的处理性能和存储容量,以确保对多个发音人的同时处理和存储。
选择模块,用于对提取采集到的音频信号进行信号预处理并提取特征值,并根据特征值计算各领麦的加权值,以确定最佳领麦或领麦组合。选择模块根据音频信号的特征值,动态选择合适的麦克风进行放大和采集。通过算法和实时信号处理,可以实现自动选择最佳麦克风和多个麦克风的最佳组合。
降噪模块,用于对最佳领麦或领麦组合采集到的音频信号进行协同降噪处理;通过合理的信号融合和优化算法,提高降噪效果,避免不同麦克风之间的互相干扰,并最大程度地保留感兴趣的声源信号。
混合模块,用于对协同降噪后的音频信号进行混合,生成整体的会议音频输出。混合模块对来自不同麦克风的音频信号进行混合,生成整体的会议音频输出。混合过程应考虑到不同发音人的音量平衡和音频质量的保持。
进一步的,信号预处理至少包括去底噪、降低回声和均衡化,以减少噪声和提高信号的平衡性。
具体的,音频信号的特征值包括时域特征和频域特征。这些特征可以反映声音信号的能量分布、频谱特性等信息。
使用提取的特征值计算各个麦克风的加权值,可以确定最佳麦克风或麦克风组合,以平衡各个麦克风的贡献。
根据特征值计算各领麦的加权值:
①基于时移的选择:声音的时移特性表现的麦克风与声源实际距离,在频谱中通过相位差反映,尽可能的选择相位差最小的麦克风最为主麦克风。
②基于能量或功率的选择:根据各个麦克风的能量或功率特征,选择具有较高能量或功率的麦克风作为主导麦克风。
③基于信噪比的选择:通过比较各个麦克风信号的信噪比(SNR),选择具有较高SNR的麦克风作为主导麦克风。
具体计算公式如下:
Y为该麦克风加权值,W为能量/功率均值,S为信噪比,α为相位差,A、B、C分别为能量权重、相位权重和信噪比权重;
其中,当存在多个音频信号时,将多个音频信号进行分离,并分别进行上述步骤。
具体的,协同降噪包括:
信号对齐,通过延迟估计算法对音频信号进行时间对齐,使音频信号在时间上保持一致。由于多个麦克风位置不同,信号在录制时可能存在时间上的偏移。因此,在进行协同降噪时,需要使用延迟估计算法对麦克风信号进行时间对齐,使它们在时间上保持一致。
噪声估计,将对齐后的若干音频信号使用小波变换法估算出噪声模型,并通过对若干音频信号的自相关和/或互相关计算出噪声的频谱。通过对多个麦克风信号进行分析,使用小波变换法估算出噪声模型,并通过对多个麦克风信号的自相关、互相关方法计算出噪声的统计特性。
目标信号估计,在协同降噪中,需要估计目标信号的特征。基于频谱减法的目标信号估计,可以通过对多通道信号进行分析和处理得到。
基于谱减法对若干音频信号进行分析和处理,得到目标信号:
Y(jω)=X(jω)-T(jω)………(2)
其中,Y(jω)为目标信号的频谱,X(jω)为音频信号的频谱,T(jω)为噪声信号频谱。
信号混合和抑制,对目标信号,利用自适应滤波的最小均方误差算法进行加权和混合操作。根据计算得到的加权系数所确定的最佳麦克风或麦克风组合,对每个麦克风的目标信号进行加权和混合操作(当为麦克风组合时),这将抑制噪声并增强目标信号。信号混合和抑制使用到的算法为于自适应滤波的最小均方误差(LMS)算法。
具体的,自适应滤波的最小均方误差算法包括:
S1,获取包含噪声的输入信号x(n)和期望信号d(n);
S2,预设最大迭代次数N,N为大于0的自然数;
S3,设置初始滤波器系数ω(0);
S4,计算滤波器的输出信号:
计算滤波器的误差信号:
更新滤波器的系数向量:
ω(n)=ω(n-1)+μ·e(n)·x(n)..........(5)
其中,μ为步长参数,n和i为自然数,μ是步长参数,控制滤波器系数的调整速度。较小的步长可以提高收敛性,但可能导致较慢的调整速度;较大的步长可能导致不稳定或发散。因此,μ的取值范围如下:
重复S4,直至满足最大迭代次数或误差收敛。
具体的,对协同降噪后的音频信号进行混合,具体指将多个音频信号合并为一个单一的混合音频信号的过程,包括:
音量平衡,调整协同降噪后的音频信号的音量,使其在混合音频中达到平衡。通过调整不同发音人的音量,使其在混合音频中达到平衡,可以通过对每个音频信号进行音量增益或降低来实现。
交叠混合,将相邻的音频剪辑的重叠部分进行混合,逐步过渡到下一个剪辑,得到混合音频。在音频剪辑之间应用交叠混合技术,以平滑过渡。这可以通过将相邻音频剪辑的重叠部分进行混合,逐渐过渡到下一个剪辑来实现。
均衡和调音,对混合音频进行均衡和调音,以确保各个音频信号在频谱上的平衡和协调。对混合音频进行均衡和调音,以确保各个音频信号在频谱上的平衡和协调。
音频编码,将混合后的音频编码成无损的WAV格式并输出。混合后的音频为PCM格式,PCM格式的音频不能作为最终的输出音频,需要编码成无损的WAV格式,WAV音频可直接输出到扬声器、录音设备或其他音频处理系统中,也可以根据用户需求,将PCM音频同步编码成MP3等格式存储或导出。
以上公开的仅为本发明的几个具体实施例,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
Claims (7)
1.基于多领麦自适应降噪会议系统,其特征在于,包括:
领麦,用于音频信号的采集;
选择模块,用于对提取采集到的音频信号进行信号预处理并提取特征值,并根据所述特征值计算各领麦的加权值,以确定最佳领麦或领麦组合;
降噪模块,用于对所述最佳领麦或领麦组合采集到的音频信号进行协同降噪处理;
混合模块,用于对协同降噪后的音频信号进行混合,生成整体的会议音频输出。
2.如权利要求1所述的基于多领麦自适应降噪会议系统,其特征在于,所述信号预处理至少包括去底噪、降低回声和均衡化,以减少噪声和提高信号的平衡性。
3.如权利要求2所述的基于多领麦自适应降噪会议系统,其特征在于,所述特征值包括时域特征和频域特征。
4.如权利要求3所述的基于多领麦自适应降噪会议系统,其特征在于,所述根据所述特征值计算各领麦的加权值,通过如下公式计算:
Y为该麦克风加权值,W为能量/功率均值,S为信噪比,α为相位差,A、B、C分别为能量权重、相位权重和信噪比权重;
其中,当存在多个音频信号时,将多个音频信号进行分离,并分别进行上述步骤。
5.如权利要求4所述的基于多领麦自适应降噪会议系统,其特征在于,所述协同降噪包括:
信号对齐,通过延迟估计算法对音频信号进行时间对齐,使音频信号在时间上保持一致;
噪声估计,将对齐后的若干音频信号使用小波变换法估算出噪声模型,并通过对若干音频信号的自相关和/或互相关计算出噪声的频谱;
目标信号估计,基于谱减法对若干音频信号进行分析和处理,得到目标信号:
Y(jω)=X(jω)-T(jω)...........(2)
其中,Y(jω)为目标信号的频谱,X(jω)为音频信号的频谱,T(jω)为噪声信号频谱;
信号混合和抑制,对所述目标信号,利用自适应滤波的最小均方误差算法进行加权和混合操作。
6.如权利要求5所述的基于多领麦自适应降噪会议系统,其特征在于,所述自适应滤波的最小均方误差算法包括:
S1,获取包含噪声的输入信号x(n)和期望信号d(n);
S2,预设最大迭代次数N,N为大于0的自然数;
S3,设置初始滤波器系数ω(0);
S4,计算滤波器的输出信号:
计算滤波器的误差信号:
更新滤波器的系数向量:
ω(n)=ω(n-1)+μ·e(n)·x(n)...........(5)
其中,μ为步长参数,n和i为自然数,μ的取值范围如下:
重复S4,直至满足最大迭代次数或误差收敛。
7.如权利要求1所述的基于多领麦自适应降噪会议系统,其特征在于,所述对协同降噪后的音频信号进行混合,包括:
音量平衡,调整协同降噪后的音频信号的音量,使其在混合音频中达到平衡;
交叠混合,将相邻的音频剪辑的重叠部分进行混合,逐步过渡到下一个剪辑,得到混合音频;
均衡和调音,对混合音频进行均衡和调音,以确保各个音频信号在频谱上的平衡和协调;
音频编码,将混合后的音频编码成无损的WAV格式并输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311491129.2A CN117479063A (zh) | 2023-11-07 | 2023-11-07 | 基于多领麦自适应降噪会议系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311491129.2A CN117479063A (zh) | 2023-11-07 | 2023-11-07 | 基于多领麦自适应降噪会议系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117479063A true CN117479063A (zh) | 2024-01-30 |
Family
ID=89630952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311491129.2A Pending CN117479063A (zh) | 2023-11-07 | 2023-11-07 | 基于多领麦自适应降噪会议系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117479063A (zh) |
-
2023
- 2023-11-07 CN CN202311491129.2A patent/CN117479063A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108900943B (zh) | 一种场景自适应主动降噪方法及耳机 | |
CN111161751A (zh) | 复杂场景下的分布式麦克风拾音系统及方法 | |
US10327088B2 (en) | Spatial audio processor and a method for providing spatial parameters based on an acoustic input signal | |
RU2456701C2 (ru) | Повышение разборчивости речи с использованием нескольких микрофонов на нескольких устройствах | |
JP3654470B2 (ja) | サブバンド多チャネル音声通信会議用反響消去方法 | |
CN102204281B (zh) | 用于产生定向输出信号的系统和方法 | |
CN103907152B (zh) | 用于音频信号噪声抑制的方法和系统 | |
CN110473564B (zh) | 一种基于深度波束形成的多通道语音增强方法 | |
KR20040044982A (ko) | 선택적인 사운드 증강 | |
EP1843635A1 (en) | Method for automatically equalizing a sound system | |
US8682006B1 (en) | Noise suppression based on null coherence | |
JP2005503698A (ja) | 所望のゼロ点を有するカーディオイド・ビームに基づく音響装置、システム及び方法 | |
US9378754B1 (en) | Adaptive spatial classifier for multi-microphone systems | |
CN102739886A (zh) | 基于回声频谱估计和语音存在概率的立体声回声抵消方法 | |
CN112363112B (zh) | 一种基于线性麦克风阵列的声源定位方法及装置 | |
CN108886650A (zh) | 用于音频再现的子带空间和串扰消除 | |
JP2001309483A (ja) | 収音方法および収音装置 | |
CN115359804B (zh) | 一种基于麦克风阵列的定向音频拾取方法和系统 | |
JP4974262B2 (ja) | マルチセンサアンテナ用受信システム | |
CN114339539A (zh) | 一种采用麦克风阵列拾音的多通道语音增强方法 | |
CN112201276B (zh) | 基于TC-ResNet网络的麦克风阵列语音分离方法 | |
US11153695B2 (en) | Hearing devices and related methods | |
CN105957536A (zh) | 基于通道聚合度频域回声消除方法 | |
CN113744752A (zh) | 语音处理方法及装置 | |
EP1843636A1 (en) | Method for automatically equalizing a sound system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |