CN113452854A - 一种基于四麦阵列的多方会议通话系统及方法 - Google Patents

一种基于四麦阵列的多方会议通话系统及方法 Download PDF

Info

Publication number
CN113452854A
CN113452854A CN202110654919.2A CN202110654919A CN113452854A CN 113452854 A CN113452854 A CN 113452854A CN 202110654919 A CN202110654919 A CN 202110654919A CN 113452854 A CN113452854 A CN 113452854A
Authority
CN
China
Prior art keywords
sound
degrees
microphone array
echo cancellation
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110654919.2A
Other languages
English (en)
Inventor
胡程远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Boluosi Technology Co ltd
Original Assignee
Shenzhen Boluosi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Boluosi Technology Co ltd filed Critical Shenzhen Boluosi Technology Co ltd
Priority to CN202110654919.2A priority Critical patent/CN113452854A/zh
Publication of CN113452854A publication Critical patent/CN113452854A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Otolaryngology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于四麦阵列的多方会议通话系统及方法,系统包括:麦克风模块:用于收集声源的声音;仿真处理模块:用于对所述声源的声音进行仿真处理,生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位;其中,所述麦克风模块包括由四个麦克风组成的麦克风阵列,所述四个麦克风分别位于四个不同方向。本发明通过将空间划分为四个音区,根据音区的音频信号区分声源方位,实现会议设备多方说话且可以区分方位的功能,同时有效提升了语音通话的质量。

Description

一种基于四麦阵列的多方会议通话系统及方法
技术领域
本发明涉及会议通话技术领域,具体涉及一种基于四麦阵列的多方会议通话系统及方法。
背景技术
全球化经济快速发展的过程中,远程会议的使用越来越普遍,传统单麦克风的电话会议系统在拾音质量、回声以及环境噪声抑制方面已经难以满足需求,传统麦克风阵列的电话会议系统通过采用多通道去混响和回声消除技术,大大的提高了语音通话质量。
随着科技的不断进步,会议设备进行多方通话的需求也越来越多,要求设备可以支持多人同时对话且可以区分不同方位的说话人,虽然传统多麦克风阵列通过空域滤波特性和多通道去混响技术有效提升了语音质量,但仍难以实现会议设备多方说话且可以区分方位的功能。
发明内容
针对现有技术中的缺陷,本发明提供一种基于四麦阵列的多方会议通话系统及方法。
第一方面,一种基于四麦阵列的多方会议通话系统,包括:
麦克风模块:用于收集声源的声音;
仿真处理模块:用于对所述声源的声音进行仿真处理,生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位;
其中,所述麦克风模块包括由四个麦克风组成的麦克风阵列,所述四个麦克风分别位于四个不同方向。
进一步地,所述四个方向形成对称关系。
进一步地,所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。
进一步地,所述回声消除包括线性回声消除和非线性回声消除。
进一步地,所述四个音区包括0~90度,90~180度,180~270度以及270~360度四个音区范围,所述四个音区之间相互隔离,每个音区只接收本音区内的音频信号。
第二方面,一种基于四麦阵列的多方会议通话方法,包括以下步骤:
接收麦克风阵列收集的不同方位声源的声音;
对声源的声音进行仿真处理,并生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位。
其中,所述麦克风阵列包括四个麦克风,所述四个麦克风分别位于四个不同方向。
进一步地,所述四个方向形成对称关系。
进一步地,所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。
进一步地,所述回声消除包括线性回声消除和非线性回声消除。
进一步地,所述四个音区包括0~90度,90~180度,180~270度以及270~360度四个音区范围,所述四个音区相互隔离,每个音区只接收本音区内的音频信号。
本发明的有益效果体现在:在四个对称的位置添加四个麦克风,形成四麦阵列,对麦克风收集到不同方位声源的声音进行仿真,生成四个音区,四个音区包括了用于区分声源方位的音频信号,且彼此隔离,通过将空间划分为四个音区,根据音区的音频信号区分声源方位,实现会议设备多方说话且可以区分方位的功能,同时有效提升了语音通话的质量。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为实施例一提供的一种基于四麦阵列的多方会议通话系统的模块框图;
图2为实施例一提供的一种基于四麦阵列的多方会议通话系统的结构原理图;
图3为实施例二提供的一种基于四麦阵列的多方会议通话方法的流程图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
实施例一
如图1所示,一种基于四麦阵列的多方会议通话系统,包括麦克风模块和仿真处理模块,麦克风模块包括麦克风阵列,麦克风阵列由位于四个不同方向的四个麦克风组成,四个方向形成对称关系,麦克风模块用于通过四个麦克风对不同方位声源的声音进行收集,仿真处理模块用于通过波束形成、回声消除以及深度神经网络计算模型对收集到声源的声音进行仿真处理,如图2所示,生成0~90度、90~180度、180~270度以及270~360度四个音区,并输出四个音区的音频,从而得到不同方位说话人的实时音频。
具体地,麦克风模块包括了由四个麦克风组成的麦克风阵列,四个麦克风分别位于四个不同的方向,四个方向在空间上形成一种对称关系,麦克风模块通过四个麦克风对不同方位声源的声音进行收集,将收集到声源的声音通过仿真处理模块进行波束形成,仿真出0~90度、90~180度、180~270度以及270~360度四个音区范围的音频波束,将本波束的声音放大,其他波束的声音得到抑制,但无法完全抑制,且此时声音中仍存在一些回声,影响语音质量,因此需要对音区的声音进行优化处理,先对音频波束进行回声消除,包括线性回声消除和非线性回声消除,拾取得到不同方位消除回声后的音频,然后再通过深度神经网络计算模型对回声残留进行二次处理,最终生成0~90度、90~180度、180~270度以及270~360度四个音区,音区里包括了音频信号,每个音区只能接收本音区内的音频信号,通过输出四个音区的音频,从而获得不同方位说话人的实时音频。
实施例二
如图3所示,一种基于四麦阵列的多方会议通话方法,包括以下步骤:
S1:接收麦克风阵列收集的不同方位声源的声音;
具体地,麦克风阵列由四个麦克风组成,四个麦克风分别位于四个不同的方向,四个方向在空间上构成对称关系,通过四个麦克风对不同方位声源的声音进行收集。
S2:对声源的声音进行仿真处理,并生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位。
具体地,对收集到不同方位声源的声音进行波束形成,仿真出0~90度、90~180度、180~270度以及270~360度四个音区范围的音频波束,将本波束的声音放大,其他波束的声音得到抑制,但无法完全抑制,且此时声音中仍存在一些回声,影响语音质量,因此需要对音区的声音进行优化处理,先对音频波束进行回声消除,包括线性回声消除和非线性回声消除,拾取得到不同方位消除回声后的音频,然后再通过深度神经网络计算模型对回声残留进行二次处理,最终生成0~90度、90~180度、180~270度以及270~360度四个音区,音区里包括了音频信号,每个音区只能接收本音区内的音频信号,通过输出四个音区的音频,从而获得不同方位说话人的实时音频。
本发明在四个对称的位置添加四个麦克风,形成四麦阵列,对麦克风收集到不同方位声源的声音进行仿真,生成四个音区,四个音区包括了用于区分声源方位的音频信号,且彼此隔离,通过将空间划分为四个音区,根据音区的音频信号区分声源方位,实现会议设备多方说话且可以区分方位的功能,同时有效提升了语音通话的质量。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (10)

1.一种基于四麦阵列的多方会议通话系统,其特征在于,包括:
麦克风模块:用于收集声源的声音;
仿真处理模块:用于对所述声源的声音进行仿真处理,生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位;
其中,所述麦克风模块包括由四个麦克风组成的麦克风阵列,所述四个麦克风分别位于四个不同方向。
2.根据权利要求1所述的一种基于四麦阵列的多方会议通话系统,其特征在于,所述四个方向形成对称关系。
3.根据权利要求1所述的一种基于四麦阵列的多方会议通话系统,其特征在于,所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。
4.根据权利要求3所述的一种基于四麦阵列的多方会议通话系统,其特征在于,所述回声消除包括线性回声消除和非线性回声消除。
5.根据权利要求1所述的一种基于四麦阵列的多方会议通话系统,其特征在于,所述四个音区包括0~90度,90~180度,180~270度以及270~360度四个音区范围,所述四个音区之间相互隔离,每个音区只接收本音区内的音频信号。
6.一种基于四麦阵列的多方会议通话方法,其特征在于,包括以下步骤:
接收麦克风阵列收集的不同方位声源的声音;
对声源的声音进行仿真处理,并生成四个音区,所述音区包括音频信号,所述音频信号用于区分声源方位;
其中,所述麦克风阵列包括四个麦克风,所述四个麦克风分别位于四个不同方向。
7.根据权利要求6所述的一种基于四麦阵列的多方会议通话方法,其特征在于,所述四个方向形成对称关系。
8.根据权利要求6所述的一种基于四麦阵列的多方会议通话方法,其特征在于,所述仿真处理包括波束形成、回声消除以及深度神经网络计算模型处理。
9.根据权利要求8所述的一种基于四麦阵列的多方会议通话方法,其特征在于,所述回声消除包括线性回声消除和非线性回声消除。
10.根据权利要求6所述的一种基于四麦阵列的多方会议通话方法,其特征在于,所述四个音区包括0~90度,90~180度,180~270度以及270~360度四个音区范围,所述四个音区相互隔离,每个音区只接收本音区内的音频信号。
CN202110654919.2A 2021-06-11 2021-06-11 一种基于四麦阵列的多方会议通话系统及方法 Pending CN113452854A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110654919.2A CN113452854A (zh) 2021-06-11 2021-06-11 一种基于四麦阵列的多方会议通话系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110654919.2A CN113452854A (zh) 2021-06-11 2021-06-11 一种基于四麦阵列的多方会议通话系统及方法

Publications (1)

Publication Number Publication Date
CN113452854A true CN113452854A (zh) 2021-09-28

Family

ID=77811305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110654919.2A Pending CN113452854A (zh) 2021-06-11 2021-06-11 一种基于四麦阵列的多方会议通话系统及方法

Country Status (1)

Country Link
CN (1) CN113452854A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108962272A (zh) * 2018-06-21 2018-12-07 湖南优浪语音科技有限公司 拾音方法和系统
CN109545230A (zh) * 2018-12-05 2019-03-29 百度在线网络技术(北京)有限公司 车辆内的音频信号处理方法和装置
CN109817240A (zh) * 2019-03-21 2019-05-28 北京儒博科技有限公司 信号分离方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108962272A (zh) * 2018-06-21 2018-12-07 湖南优浪语音科技有限公司 拾音方法和系统
CN109545230A (zh) * 2018-12-05 2019-03-29 百度在线网络技术(北京)有限公司 车辆内的音频信号处理方法和装置
CN109817240A (zh) * 2019-03-21 2019-05-28 北京儒博科技有限公司 信号分离方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN106448722A (zh) 录音方法、装置和系统
CN103152500B (zh) 多方通话中回音消除方法
CN108447496B (zh) 一种基于麦克风阵列的语音增强方法及装置
JP4074656B2 (ja) 騒音除去装置
KR20040028933A (ko) 기대했던 소리의 널의 카디오이드 빔에 기초한 소리장치,시스템 및 방법
US20220301577A1 (en) Echo cancellation method and apparatus
Mitchell et al. Signal processing for a cocktail party effect
CN110322892B (zh) 一种基于麦克风阵列的语音拾取系统和方法
CN111078185A (zh) 录制声音的方法及设备
Zhang et al. Neural cascade architecture for multi-channel acoustic echo suppression
WO2018158558A1 (en) Device for capturing and outputting audio
CN110769352A (zh) 一种信号处理方法、装置以及计算机存储介质
CN113409810B (zh) 一种联合去混响的回声消除方法
US12039993B2 (en) Speech processing device and speech processing method
CN108650593B (zh) 一种用于电话会议的三麦克阵列远场拾音方法
Yang et al. Guided speech enhancement network
CN113452854A (zh) 一种基于四麦阵列的多方会议通话系统及方法
Arote et al. Multichannel speech dereverberation using generalized sidelobe canceller and post filter
CN112565531B (zh) 一种应用于多人语音会议的录音方法和设备
Zhang et al. Advancing acoustic howling suppression through recursive training of neural networks
Yang et al. Binaural Angular Separation Network
Deshpande et al. Multi-microphone speech dereverberation using spatial filtering
Konforti et al. Multichannel Acoustic Echo Cancellation With Beamforming in Dynamic Environments
US20240249742A1 (en) Partially adaptive audio beamforming systems and methods
Meng et al. Deep Kronecker Product Beamforming for Large-scale Microphone Arrays

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210928

RJ01 Rejection of invention patent application after publication