CN113452854A - 一种基于四麦阵列的多方会议通话系统及方法 - Google Patents
一种基于四麦阵列的多方会议通话系统及方法 Download PDFInfo
- Publication number
- CN113452854A CN113452854A CN202110654919.2A CN202110654919A CN113452854A CN 113452854 A CN113452854 A CN 113452854A CN 202110654919 A CN202110654919 A CN 202110654919A CN 113452854 A CN113452854 A CN 113452854A
- Authority
- CN
- China
- Prior art keywords
- sound
- degrees
- microphone array
- echo cancellation
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 25
- 230000005236 sound signal Effects 0.000 claims abstract description 21
- 238000004088 simulation Methods 0.000 claims abstract description 17
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000005094 computer simulation Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 abstract description 3
- 238000002592 echocardiography Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Otolaryngology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于四麦阵列的多方会议通话系统及方法,系统包括:麦克风模块:用于收集声源的声音;仿真处理模块:用于对所述声源的声音进行仿真处理,生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位;其中,所述麦克风模块包括由四个麦克风组成的麦克风阵列,所述四个麦克风分别位于四个不同方向。本发明通过将空间划分为四个音区,根据音区的音频信号区分声源方位,实现会议设备多方说话且可以区分方位的功能,同时有效提升了语音通话的质量。
Description
技术领域
本发明涉及会议通话技术领域,具体涉及一种基于四麦阵列的多方会议通话系统及方法。
背景技术
全球化经济快速发展的过程中,远程会议的使用越来越普遍,传统单麦克风的电话会议系统在拾音质量、回声以及环境噪声抑制方面已经难以满足需求,传统麦克风阵列的电话会议系统通过采用多通道去混响和回声消除技术,大大的提高了语音通话质量。
随着科技的不断进步,会议设备进行多方通话的需求也越来越多,要求设备可以支持多人同时对话且可以区分不同方位的说话人,虽然传统多麦克风阵列通过空域滤波特性和多通道去混响技术有效提升了语音质量,但仍难以实现会议设备多方说话且可以区分方位的功能。
发明内容
针对现有技术中的缺陷,本发明提供一种基于四麦阵列的多方会议通话系统及方法。
第一方面,一种基于四麦阵列的多方会议通话系统,包括:
麦克风模块:用于收集声源的声音;
仿真处理模块:用于对所述声源的声音进行仿真处理,生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位;
其中,所述麦克风模块包括由四个麦克风组成的麦克风阵列,所述四个麦克风分别位于四个不同方向。
进一步地,所述四个方向形成对称关系。
进一步地,所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。
进一步地,所述回声消除包括线性回声消除和非线性回声消除。
进一步地,所述四个音区包括0~90度,90~180度,180~270度以及270~360度四个音区范围,所述四个音区之间相互隔离,每个音区只接收本音区内的音频信号。
第二方面,一种基于四麦阵列的多方会议通话方法,包括以下步骤:
接收麦克风阵列收集的不同方位声源的声音;
对声源的声音进行仿真处理,并生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位。
其中,所述麦克风阵列包括四个麦克风,所述四个麦克风分别位于四个不同方向。
进一步地,所述四个方向形成对称关系。
进一步地,所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。
进一步地,所述回声消除包括线性回声消除和非线性回声消除。
进一步地,所述四个音区包括0~90度,90~180度,180~270度以及270~360度四个音区范围,所述四个音区相互隔离,每个音区只接收本音区内的音频信号。
本发明的有益效果体现在:在四个对称的位置添加四个麦克风,形成四麦阵列,对麦克风收集到不同方位声源的声音进行仿真,生成四个音区,四个音区包括了用于区分声源方位的音频信号,且彼此隔离,通过将空间划分为四个音区,根据音区的音频信号区分声源方位,实现会议设备多方说话且可以区分方位的功能,同时有效提升了语音通话的质量。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为实施例一提供的一种基于四麦阵列的多方会议通话系统的模块框图;
图2为实施例一提供的一种基于四麦阵列的多方会议通话系统的结构原理图;
图3为实施例二提供的一种基于四麦阵列的多方会议通话方法的流程图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
实施例一
如图1所示,一种基于四麦阵列的多方会议通话系统,包括麦克风模块和仿真处理模块,麦克风模块包括麦克风阵列,麦克风阵列由位于四个不同方向的四个麦克风组成,四个方向形成对称关系,麦克风模块用于通过四个麦克风对不同方位声源的声音进行收集,仿真处理模块用于通过波束形成、回声消除以及深度神经网络计算模型对收集到声源的声音进行仿真处理,如图2所示,生成0~90度、90~180度、180~270度以及270~360度四个音区,并输出四个音区的音频,从而得到不同方位说话人的实时音频。
具体地,麦克风模块包括了由四个麦克风组成的麦克风阵列,四个麦克风分别位于四个不同的方向,四个方向在空间上形成一种对称关系,麦克风模块通过四个麦克风对不同方位声源的声音进行收集,将收集到声源的声音通过仿真处理模块进行波束形成,仿真出0~90度、90~180度、180~270度以及270~360度四个音区范围的音频波束,将本波束的声音放大,其他波束的声音得到抑制,但无法完全抑制,且此时声音中仍存在一些回声,影响语音质量,因此需要对音区的声音进行优化处理,先对音频波束进行回声消除,包括线性回声消除和非线性回声消除,拾取得到不同方位消除回声后的音频,然后再通过深度神经网络计算模型对回声残留进行二次处理,最终生成0~90度、90~180度、180~270度以及270~360度四个音区,音区里包括了音频信号,每个音区只能接收本音区内的音频信号,通过输出四个音区的音频,从而获得不同方位说话人的实时音频。
实施例二
如图3所示,一种基于四麦阵列的多方会议通话方法,包括以下步骤:
S1:接收麦克风阵列收集的不同方位声源的声音;
具体地,麦克风阵列由四个麦克风组成,四个麦克风分别位于四个不同的方向,四个方向在空间上构成对称关系,通过四个麦克风对不同方位声源的声音进行收集。
S2:对声源的声音进行仿真处理,并生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位。
具体地,对收集到不同方位声源的声音进行波束形成,仿真出0~90度、90~180度、180~270度以及270~360度四个音区范围的音频波束,将本波束的声音放大,其他波束的声音得到抑制,但无法完全抑制,且此时声音中仍存在一些回声,影响语音质量,因此需要对音区的声音进行优化处理,先对音频波束进行回声消除,包括线性回声消除和非线性回声消除,拾取得到不同方位消除回声后的音频,然后再通过深度神经网络计算模型对回声残留进行二次处理,最终生成0~90度、90~180度、180~270度以及270~360度四个音区,音区里包括了音频信号,每个音区只能接收本音区内的音频信号,通过输出四个音区的音频,从而获得不同方位说话人的实时音频。
本发明在四个对称的位置添加四个麦克风,形成四麦阵列,对麦克风收集到不同方位声源的声音进行仿真,生成四个音区,四个音区包括了用于区分声源方位的音频信号,且彼此隔离,通过将空间划分为四个音区,根据音区的音频信号区分声源方位,实现会议设备多方说话且可以区分方位的功能,同时有效提升了语音通话的质量。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
Claims (10)
1.一种基于四麦阵列的多方会议通话系统,其特征在于,包括:
麦克风模块:用于收集声源的声音;
仿真处理模块:用于对所述声源的声音进行仿真处理,生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位;
其中,所述麦克风模块包括由四个麦克风组成的麦克风阵列,所述四个麦克风分别位于四个不同方向。
2.根据权利要求1所述的一种基于四麦阵列的多方会议通话系统,其特征在于,所述四个方向形成对称关系。
3.根据权利要求1所述的一种基于四麦阵列的多方会议通话系统,其特征在于,所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。
4.根据权利要求3所述的一种基于四麦阵列的多方会议通话系统,其特征在于,所述回声消除包括线性回声消除和非线性回声消除。
5.根据权利要求1所述的一种基于四麦阵列的多方会议通话系统,其特征在于,所述四个音区包括0~90度,90~180度,180~270度以及270~360度四个音区范围,所述四个音区之间相互隔离,每个音区只接收本音区内的音频信号。
6.一种基于四麦阵列的多方会议通话方法,其特征在于,包括以下步骤:
接收麦克风阵列收集的不同方位声源的声音;
对声源的声音进行仿真处理,并生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位;
其中,所述麦克风阵列包括四个麦克风,所述四个麦克风分别位于四个不同方向。
7.根据权利要求6所述的一种基于四麦阵列的多方会议通话方法,其特征在于,所述四个方向形成对称关系。
8.根据权利要求6所述的一种基于四麦阵列的多方会议通话方法,其特征在于,所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。
9.根据权利要求8所述的一种基于四麦阵列的多方会议通话方法,其特征在于,所述回声消除包括线性回声消除和非线性回声消除。
10.根据权利要求6所述的一种基于四麦阵列的多方会议通话方法,其特征在于,所述四个音区包括0~90度,90~180度,180~270度以及270~360度四个音区范围,所述四个音区相互隔离,每个音区只接收本音区内的音频信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110654919.2A CN113452854A (zh) | 2021-06-11 | 2021-06-11 | 一种基于四麦阵列的多方会议通话系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110654919.2A CN113452854A (zh) | 2021-06-11 | 2021-06-11 | 一种基于四麦阵列的多方会议通话系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113452854A true CN113452854A (zh) | 2021-09-28 |
Family
ID=77811305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110654919.2A Pending CN113452854A (zh) | 2021-06-11 | 2021-06-11 | 一种基于四麦阵列的多方会议通话系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113452854A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108962272A (zh) * | 2018-06-21 | 2018-12-07 | 湖南优浪语音科技有限公司 | 拾音方法和系统 |
CN109545230A (zh) * | 2018-12-05 | 2019-03-29 | 百度在线网络技术(北京)有限公司 | 车辆内的音频信号处理方法和装置 |
CN109817240A (zh) * | 2019-03-21 | 2019-05-28 | 北京儒博科技有限公司 | 信号分离方法、装置、设备及存储介质 |
-
2021
- 2021-06-11 CN CN202110654919.2A patent/CN113452854A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108962272A (zh) * | 2018-06-21 | 2018-12-07 | 湖南优浪语音科技有限公司 | 拾音方法和系统 |
CN109545230A (zh) * | 2018-12-05 | 2019-03-29 | 百度在线网络技术(北京)有限公司 | 车辆内的音频信号处理方法和装置 |
CN109817240A (zh) * | 2019-03-21 | 2019-05-28 | 北京儒博科技有限公司 | 信号分离方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106448722A (zh) | 录音方法、装置和系统 | |
CN103152500B (zh) | 多方通话中回音消除方法 | |
CN108447496B (zh) | 一种基于麦克风阵列的语音增强方法及装置 | |
JP4074656B2 (ja) | 騒音除去装置 | |
KR20040028933A (ko) | 기대했던 소리의 널의 카디오이드 빔에 기초한 소리장치,시스템 및 방법 | |
US20220301577A1 (en) | Echo cancellation method and apparatus | |
Mitchell et al. | Signal processing for a cocktail party effect | |
CN110322892B (zh) | 一种基于麦克风阵列的语音拾取系统和方法 | |
CN111078185A (zh) | 录制声音的方法及设备 | |
Zhang et al. | Neural cascade architecture for multi-channel acoustic echo suppression | |
WO2018158558A1 (en) | Device for capturing and outputting audio | |
CN110769352A (zh) | 一种信号处理方法、装置以及计算机存储介质 | |
CN113409810B (zh) | 一种联合去混响的回声消除方法 | |
US12039993B2 (en) | Speech processing device and speech processing method | |
CN108650593B (zh) | 一种用于电话会议的三麦克阵列远场拾音方法 | |
Yang et al. | Guided speech enhancement network | |
CN113452854A (zh) | 一种基于四麦阵列的多方会议通话系统及方法 | |
Arote et al. | Multichannel speech dereverberation using generalized sidelobe canceller and post filter | |
CN112565531B (zh) | 一种应用于多人语音会议的录音方法和设备 | |
Zhang et al. | Advancing acoustic howling suppression through recursive training of neural networks | |
Yang et al. | Binaural Angular Separation Network | |
Deshpande et al. | Multi-microphone speech dereverberation using spatial filtering | |
Konforti et al. | Multichannel Acoustic Echo Cancellation With Beamforming in Dynamic Environments | |
US20240249742A1 (en) | Partially adaptive audio beamforming systems and methods | |
Meng et al. | Deep Kronecker Product Beamforming for Large-scale Microphone Arrays |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210928 |
|
RJ01 | Rejection of invention patent application after publication |