CN117676405A - 基于全向阵列麦克风的拾音方法、系统和电子设备 - Google Patents

基于全向阵列麦克风的拾音方法、系统和电子设备 Download PDF

Info

Publication number
CN117676405A
CN117676405A CN202311707588.XA CN202311707588A CN117676405A CN 117676405 A CN117676405 A CN 117676405A CN 202311707588 A CN202311707588 A CN 202311707588A CN 117676405 A CN117676405 A CN 117676405A
Authority
CN
China
Prior art keywords
audio
scene
local
remote
pickup
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311707588.XA
Other languages
English (en)
Inventor
宋洪博
张华兵
潘建林
宋成飞
王艳龙
陈永波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sipic Technology Co Ltd
Original Assignee
Sipic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sipic Technology Co Ltd filed Critical Sipic Technology Co Ltd
Priority to CN202311707588.XA priority Critical patent/CN117676405A/zh
Publication of CN117676405A publication Critical patent/CN117676405A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例提供一种基于全向阵列麦克风的拾音方法、系统和电子设备。该方法包括:将音频数据通过回采通道发送至全向阵列麦克风;基于全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对音频数据进行自适应反馈抑制,得到第一场景的本地扩声音频以及第二场景的远程增强音频;将本地扩声音频通过本地扬声器播放,将远程增强音频发送至远程设备进行播放。本发明实施例将全向阵列麦克风采用自适应反馈抑制算法,对本地扩声的音频进行处理,分两路输出音频,可以针对场景输出最合适的音频,使本地扩声能高度还原人声,并防止啸叫。并且能够在复杂的混合会议中,使本地与远程设备都能够针对对应的场景清晰播放,提升参会人员的收听体验。

Description

基于全向阵列麦克风的拾音方法、系统和电子设备
技术领域
本发明涉及麦克风领域,尤其涉及一种基于全向阵列麦克风的拾音方法、系统和电子设备。
背景技术
虽然智能移动设备具有麦克风,但为了保障声音的清晰稳定,在线下大型会议、无限移动电话会议等场景中会使用全向阵列麦克风作为拾音装置。全向阵列麦克风可以简称为全向麦,其包含了超过100个全向麦克单元,通过特定阵列排布的方式,能够实现对音频方向的判断和拾音效果的增强。例如,在大型会议场景中,讲话人向全向阵列麦克风说话,为了让远处的参会人员听清,就需要将讲话人的声音扩声播放出来。
然而,全向阵列麦克风的拾音半径相对较大,它不单单是拾取一个人的声音,而是周围的多个人的声音,这就使得全向阵列麦克风本身不支持本地扩声(或称为人声提升)功能,因为扩声讲话人的声音同时也会拾取会议中周围大家说话人的声音,同时也会拾取麦克风本身自身外扩的声音,不可避免的会产生声音反馈(啸叫)的问题。
现有技术如果要让全向阵列麦克风实现扩声系统功能,需要将音频通过有反馈抑制功能的音频处理器(或反馈抑制器),通过反馈抑制器后,声音再给到喇叭进行扩声,来解决啸叫的问题。
在实现本发明过程中,发明人发现相关技术中至少存在如下问题:
1、反馈抑制器体积通常较大,需要使用机柜进行安装,需要专业人员进行配置调试,使用门槛相对较高;
2、传统的反馈抑制器,采用传统的信号处理算法,如:陷波法、移频法等算法,对扩声音质损伤较大,扩声效果不佳;
3、现有方式不但要购买麦克风(鹅颈麦、手持麦、全向麦)等拾音设备,还要额外单独购买反馈抑制器,这会增加成本。
发明内容
为了至少解决现有技术中抑制全向阵列麦克风存在的上述问题。第一方面,本发明实施例提供一种基于全向阵列麦克风的拾音方法,包括:
将音频数据通过回采通道发送至全向阵列麦克风,其中,所述音频数据包括:在预设拾音场景采集的本地音频;
基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述音频数据进行自适应反馈抑制,得到第一场景的本地扩声音频以及第二场景的远程增强音频;
将所述本地扩声音频通过本地扬声器播放,将所述远程增强音频发送至远程设备进行播放。
第二方面,本发明实施例提供一种基于全向阵列麦克风的拾音系统,包括:
回采模块,用于将音频数据通过回采通道发送至全向阵列麦克风,其中,所述音频数据包括:在预设拾音场景采集的本地音频;
自适应模块,用于基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述音频数据进行自适应反馈抑制,得到第一场景的本地扩声音频以及第二场景的远程增强音频;
播放模块,用于将所述本地扩声音频通过本地扬声器播放,将所述远程增强音频发送至远程设备进行播放。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的基于全向阵列麦克风的拾音方法的步骤。
第四方面,本发明实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本发明任一实施例的基于全向阵列麦克风的拾音方法的步骤。
本发明实施例的有益效果在于:将全向阵列麦克风采用自适应反馈抑制算法,对本地扩声的音频进行处理,分两路输出音频,可以针对场景输出最合适的音频,使本地扩声能高度还原人声,并防止啸叫。并且能够在复杂的混合会议中,使本地与远程设备都能够针对对应的场景清晰播放,提升参会人员的收听体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种基于全向阵列麦克风的拾音方法的流程图;
图2是本发明一实施例提供的一种基于全向阵列麦克风的拾音方法的全向阵列麦内部的音频数据流示意图;
图3是本发明一实施例提供的一种基于全向阵列麦克风的拾音系统的结构示意图;
图4为本发明一实施例提供的一种基于全向阵列麦克风的拾音的电子设备的实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示为本发明一实施例提供的一种基于全向阵列麦克风的拾音方法的流程图,包括如下步骤:
S11:将音频数据通过回采通道发送至全向阵列麦克风,其中,所述音频数据包括:在预设拾音场景采集的本地音频;
S12:基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述音频数据进行自适应反馈抑制,得到第一场景的本地扩声音频以及第二场景的远程增强音频;
S13:将所述本地扩声音频通过本地扬声器播放,将所述远程增强音频发送至远程设备进行播放。
在本实施方式中,本方法可以应用于带有全向阵列麦克风的智能设备(例如,智能会议机、智能音响等),将带有全向阵列麦克风的智能设备安置在各种场景。其中,场景包括本地会议场景、远程会议场景以及本地会议场景与远程会议场景同时存在的混合会议场景。要说明的是,本方法的全向阵列麦克风包含超过100个全向麦克单元,通过预设出不同阵列排布的方式,能够实现对各类场景下各方位的拾音,且可以确定音频方向的判断和拾音效果的增强。
对于步骤S11,本方法以更加复杂的混合会议场景为例,例如在室内会议开始前,将带有全向阵列麦克风的智能设备配置在会议主讲人的周围,由于会议中主讲人的位置一般不会发生改变,主讲人相对于带有全向阵列麦克风的智能设备的位置相对固定。可以给全向阵列麦克风设置对应的拾音区域。针对于不同的会议场景,可以配置不同的拾音区域。会议开始时,不同位置的主讲人说话,全向阵列麦克风在预设配置的拾音区域内实时的采集到了来自各个通路的音频数据,也就是在预设拾音场景采集的本地音频。
在得到音频数据作为参考音频,远程会议的时候,远端参会者讲话,本地喇叭会进行播放,该音频如果被全向麦再采集回去,回传给远端,就会导致远端参会者听到自己讲话,为解决这个问题需要将远端参会者的声音给到全向麦,用来消除拾取到音频,这个远程参会者的声音称为全向麦的参考音,通过回采通道将该音频数据发送至全向阵列麦克风,以用于后续步骤的处理。
对于步骤S12,由于混合会议场景需要进行更复杂的处理,要根据全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对音频数据进行自适应反馈抑制。
作为一种实施方式,所述预设拾音场景包括:确定全向阵列麦克风在启用预设拾音通道以及预设拾音区域的本地会议场景,所述第一场景为本地会议场景,所述第二场景为远程会议场景;
所述基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述音频数据进行自适应反馈抑制,得到第一场景的本地扩声音频以及第二场景的远程增强音频包括:
基于所述全向阵列麦克风所处拾音场景的预设拾音通道以及预设拾音区域,对所述本地会议场景采集的本地音频进行不同通道的延时处理以及自适应反馈抑制处理,得到本地会议场景保真输出的本地扩声音频;
对所述本地会议场景采集的本地音频进行回声消除处理,得到用于远程会议场景的远程增强音频。
在本实施方式中,混合会议场景既包括了本地会议场景,又包括了远程会议场景。在本地会议场景中包括了:在主席台的几个主讲人以及众多听众的讲演型会议,多个参会人员坐在一圈共同讲话的商讨型会议。上述讲演型会议中,几个主讲人落座的位置相对较近,例如这几个主讲人坐在一排,可以将全向阵列麦克风配置在几个主讲人中间的位置,主讲人说话,麦克风拾音后得到本地的音频;上述的商讨型会议,由多个参会人员共同围绕在全桌进行会议,每个人都有可能发言,可以将全向阵列麦克风配置在多个参会人员的中心位置,不同位置的参会人员说话,全向阵列麦克风的各个通道收到对应的本地的音频。远程会议场景中,例如通过某某会议软件进行开会,全向阵列麦克风将本地的音频通过网络传输给其他参会人员,其他参会人员收到经由网络远端传输的音频。其他参会人员可以是每个人观看各自的显示器,通过显示器播放传输来的音频,也可以是其他参会人员共同在一个会议室内,共同看一个大屏幕,大屏幕播放传输来的音频。
在本方法主要解决混合会议场景中,将本地会议场景的音频除了要本地扩音播放外,还要将音频发送至远程会议场景的设备中,远程会议场景的参会人员可能也会讲话,本地会议场景的智能设备再接收远程会议场景发送的音频进行播放。但这样会出现新的问题,就是由于本地会议场景与远程会议场景的环境不同(参会人员落座的位置不同,带有全向阵列麦克风的智能设备不同),因此,如果使用同样扩音方式播放,可能会出现本地场景播放的音频不清晰,而远程会议场景又会出现回声泄露的问题,因此就需要能够给予全向阵列麦克风所处拾音场景的拾音通道以及拾音区域进行自适应反馈抑制。在实施中,将本方法的反馈抑制应用于吸顶麦类型的全向阵列麦克风,将其配置在顶棚上,这样也就解决了不同场景下麦克风的摆放。进一步地,可以针对某个通道优化延时(如扩声通道),扩声场景对声音延时(指的是说话人声音和通过扩声系统放大的音频之间的延时)比较敏感。由于拾音区域不同,需要支持本地扩声的区域可能只有主席台区域,而给远程参会者的音频可能需要覆盖整个会议室,这样就需要分两路输出不同的音频给到对应接收方。
还可以针对场景输出最适合的音质。比如本地扩声需要使用反馈抑制算法防止啸叫,而且要保证声音低中高频的保真输出,使音频听起来更饱满耐听,远程会议的音频则不需要经过反馈抑制算法,但需要通过回声消除算法将远程参会者的声音消除,防止回声泄露;而且要保证近远端参会者双讲时,两端的音频都能让对方听清。
总的来说,抑制啸叫的方法有很多种,如移频、自适应反馈抑制、陷波等。其中移频和陷波对声音有比较大的损伤。本方法提出了先进的自适应声反馈抵消技术,有效地突破传统的声反馈抑制的局限,具有操作简单、声音失真小、传声增益提高明显等优点。本方法的自适应反馈抑制算法可以独立称为自适应声反馈抑制系统,其是一个具有两个输入端的自适应滤波器,它将本地传声器的输出信号作为一个基准信号,而将本地扬声器的输出信号作为一个参考信号。(这就是为什么要音频数据通过回采通道发送至全向阵列麦克风)。自适应滤波器不同于具有固定参数的一般滤波器,它是由滤波器和调整滤波器结构的自适应算法组成,它能够实时拾取变化信号(例如上述已举例说明的拾音通道以及拾音区域),通过自适应算法自动调整滤波器参数,以达到最优的滤波效果。经过自适应干扰抵消处理后,能够将本地传声器输出经室内声场馈至传声器的电声反馈有效地抑制,也就实现了自适应声反馈抑制。
对于步骤S13,将本地扩声音频通过本地扬声器播放,将远程增强音频发送至远程设备进行播放。
作为一种实施方式,将所述本地扩声音频混音处理后通过本地扬声器播放,将所述远程增强音频发送至远程设备,以使所述音频数据同时在所述第一场景以及所述第二场景中清晰播放。
在本实施方式中,参考音与本地扩声音频,通过麦克风进行混音后,直接通过麦克风的输出通道给到喇叭进行扩声,避免了对反馈抑制器(或音频处理器)的依赖,使整体方案的成本得到降低。全向阵列麦具备混音的功能,将远端音频通过回采通道给到全向麦,全向麦可以将本地拾取到的音频和需要播放的远端音频进行混音后输出,该音频可以给喇叭进行播放,同时给全向麦作为参考音,以实现反馈抑制和回声消除。
作为另一种实施方式,远程设备将音频数据通过回采通道发送至所述远程设备自身的全向阵列麦克风,其中,所述音频数据包括:收到的远程增强音频;
基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述远程增强音频进行自适应增强,得到自适应增强远程音频;
将所述自适应增强远程音频通过远程设备的扬声器播放。
本实施方式就是以远程设备为主视角,远程设备收到了本地设备发送的远程增强音频,针对远程设备所处的场景进行自适应增强处理(也就是上述步骤S12中举例的自适应处理),得到自适应增强远程音频,并利用远程设备的扬声器播放出来。
如图2为本方法的全向阵列麦内部的音频数据流图,简单的说,本方法为本地设备将扬声器播放的音频数据(包含要本地扩音的音频和远程会议远端传来的音频),通过回采通道给到全向阵列麦,该音频给到alg(算法模块)作为参考音。全向阵列麦使用的音频,经过不同的算法处理,分为两路音频输出:分别用于本地扩声的音频和送给远程会议(如各种会议软件)的远程参会者的音频。
RX1的音频内容为,通过全向阵列麦采集到的本地说话人的音频。通过混音模块,音频内容为本地说话人的内容和远程参会人传过来的音频内容,该音频通过喇叭进行播放,同时通过回采通道传递给alg模块。
TX2通道的音频,为通过alg模块处理后的音频(经过AI降噪、去混响处理等),该音频通过远程会议程序(如各种会议软件)传输给远端参会者。
通过该实施方式可以看出,将全向阵列麦克风采用自适应反馈抑制算法,对本地扩声的音频进行处理,分两路输出音频,可以针对场景输出最合适的音频,使本地扩声能高度还原人声,并防止啸叫。并且能够在复杂的混合会议中,使本地与远程设备都能够针对对应的场景清晰播放,提升参会人员的收听体验。
如图3所示为本发明一实施例提供的一种基于全向阵列麦克风的拾音系统的结构示意图,该系统可执行上述任意实施例所述的基于全向阵列麦克风的拾音方法,并配置在终端中。
本实施例提供的一种基于全向阵列麦克风的拾音系统10包括:回采模块11,自适应模块12和播放模块13。
其中,回采模块11用于将音频数据通过回采通道发送至全向阵列麦克风,其中,所述音频数据包括:在预设拾音场景采集的本地音频;自适应模块12用于基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述音频数据进行自适应反馈抑制,得到第一场景的本地扩声音频以及第二场景的远程增强音频;播放模块13用于将所述本地扩声音频通过本地扬声器播放,将所述远程增强音频发送至远程设备进行播放。
本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于全向阵列麦克风的拾音方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
将音频数据通过回采通道发送至全向阵列麦克风,其中,所述音频数据包括:在预设拾音场景采集的本地音频;
基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述音频数据进行自适应反馈抑制,得到第一场景的本地扩声音频以及第二场景的远程增强音频;
将所述本地扩声音频通过本地扬声器播放,将所述远程增强音频发送至远程设备进行播放。
作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的方法对应的程序指令/模块。一个或者多个程序指令存储在非易失性计算机可读存储介质中,当被处理器执行时,执行上述任意方法实施例中的基于全向阵列麦克风的拾音方法。
图4是本申请另一实施例提供的基于全向阵列麦克风的拾音方法的电子设备的硬件结构示意图,如图4所示,该设备包括:
一个或多个处理器410以及存储器420,图4中以一个处理器410为例。基于全向阵列麦克风的拾音方法的设备还可以包括:输入装置430和输出装置440。
处理器410、存储器420、输入装置430和输出装置440可以通过总线或者其他方式连接,图4中以通过总线连接为例。
存储器420作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的基于全向阵列麦克风的拾音方法对应的程序指令/模块。处理器410通过运行存储在存储器420中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例基于全向阵列麦克风的拾音方法。
存储器420可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器420可选包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至移动装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可接收输入的数字或字符信息。输出装置440可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器420中,当被所述一个或者多个处理器410执行时,执行上述任意方法实施例中的基于全向阵列麦克风的拾音方法。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的基于全向阵列麦克风的拾音方法的步骤。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如平板电脑。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器,掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)其他具有数据处理功能的电子装置。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于全向阵列麦克风的拾音方法,包括:
将音频数据通过回采通道发送至全向阵列麦克风,其中,所述音频数据包括:在预设拾音场景采集的本地音频;
基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述音频数据进行自适应反馈抑制,得到第一场景的本地扩声音频以及第二场景的远程增强音频;
将所述本地扩声音频通过本地扬声器播放,将所述远程增强音频发送至远程设备进行播放。
2.根据权利要求1所述的方法,其中,所述预设拾音场景包括:确定全向阵列麦克风在启用预设拾音通道以及预设拾音区域的本地会议场景,所述第一场景为本地会议场景,所述第二场景为远程会议场景;
所述基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述音频数据进行自适应反馈抑制,得到第一场景的本地扩声音频以及第二场景的远程增强音频包括:
基于所述全向阵列麦克风所处拾音场景的预设拾音通道以及预设拾音区域,对所述本地会议场景采集的本地音频进行不同通道的延时处理以及自适应反馈抑制处理,得到本地会议场景保真输出的本地扩声音频;
对所述本地会议场景采集的本地音频进行回声消除处理,得到用于远程会议场景的远程增强音频。
3.根据权利要求1所述的方法,其中,所述将所述本地扩声音频通过本地扬声器播放,将所述远程增强音频发送至远程设备进行播放包括:
将所述本地扩声音频混音处理后通过本地扬声器播放,将所述远程增强音频发送至远程设备,以使所述音频数据同时在所述第一场景以及所述第二场景中清晰播放。
4.根据权利要求1所述的方法,其中,所述方法还包括:
远程设备将音频数据通过回采通道发送至所述远程设备自身的全向阵列麦克风,其中,所述音频数据包括:收到的远程增强音频;
基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述远程增强音频进行自适应增强,得到自适应增强远程音频;
将所述自适应增强远程音频通过远程设备的扬声器播放。
5.一种基于全向阵列麦克风的拾音系统,包括:
回采模块,用于将音频数据通过回采通道发送至全向阵列麦克风,其中,所述音频数据包括:在预设拾音场景采集的本地音频;
自适应模块,用于基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述音频数据进行自适应反馈抑制,得到第一场景的本地扩声音频以及第二场景的远程增强音频;
播放模块,用于将所述本地扩声音频通过本地扬声器播放,将所述远程增强音频发送至远程设备进行播放。
6.根据权利要求5所述的系统,其中,所述预设拾音场景包括:确定全向阵列麦克风在启用预设拾音通道以及预设拾音区域的本地会议场景,所述第一场景为本地会议场景,所述第二场景为远程会议场景;
所述自适应抑制模块用于:
基于所述全向阵列麦克风所处拾音场景的预设拾音通道以及预设拾音区域,对所述本地会议场景采集的本地音频进行不同通道的延时处理以及自适应反馈抑制处理,得到本地会议场景保真输出的本地扩声音频;
对所述本地会议场景采集的本地音频进行回声消除处理,得到用于远程会议场景的远程增强音频。
7.根据权利要求5所述的系统,其中,所述播放模块用于:
将所述本地扩声音频混音处理后通过本地扬声器播放,将所述远程增强音频发送至远程设备,以使所述音频数据同时在所述第一场景以及所述第二场景中清晰播放。
8.根据权利要求5所述的系统,其中,所述回采模块,用于远程设备将音频数据通过回采通道发送至所述远程设备自身的全向阵列麦克风,其中,所述音频数据包括:收到的远程增强音频;
自适应模块,用于基于所述全向阵列麦克风所处拾音场景的拾音通道以及拾音区域,对所述远程增强音频进行自适应增强,得到自适应增强远程音频;
播放模块,用于将所述自适应增强远程音频通过远程设备的扬声器播放。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。
CN202311707588.XA 2023-12-13 2023-12-13 基于全向阵列麦克风的拾音方法、系统和电子设备 Pending CN117676405A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311707588.XA CN117676405A (zh) 2023-12-13 2023-12-13 基于全向阵列麦克风的拾音方法、系统和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311707588.XA CN117676405A (zh) 2023-12-13 2023-12-13 基于全向阵列麦克风的拾音方法、系统和电子设备

Publications (1)

Publication Number Publication Date
CN117676405A true CN117676405A (zh) 2024-03-08

Family

ID=90063910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311707588.XA Pending CN117676405A (zh) 2023-12-13 2023-12-13 基于全向阵列麦克风的拾音方法、系统和电子设备

Country Status (1)

Country Link
CN (1) CN117676405A (zh)

Similar Documents

Publication Publication Date Title
US11282532B1 (en) Participant-individualized audio volume control and host-customized audio volume control of streaming audio for a plurality of participants who are each receiving the streaming audio from a host within a videoconferencing platform, and who are also simultaneously engaged in remote audio communications with each other within the same videoconferencing platform
EP2772070B1 (en) Processing audio signals
US8606249B1 (en) Methods and systems for enhancing audio quality during teleconferencing
US8503655B2 (en) Methods and arrangements for group sound telecommunication
US9749474B2 (en) Matching reverberation in teleconferencing environments
US8774399B2 (en) System for reducing speakerphone echo
EP1700465B1 (en) System and method for enchanced subjective stereo audio
US11521636B1 (en) Method and apparatus for using a test audio pattern to generate an audio signal transform for use in performing acoustic echo cancellation
US20190221226A1 (en) Electronic apparatus and echo cancellation method applied to electronic apparatus
US6771779B1 (en) System, apparatus, and method for improving speech quality in multi-party devices
JP5213584B2 (ja) 通話システム
CN117676405A (zh) 基于全向阵列麦克风的拾音方法、系统和电子设备
US11804237B2 (en) Conference terminal and echo cancellation method for conference
US20120150542A1 (en) Telephone or other device with speaker-based or location-based sound field processing
CN113129915B (zh) 音频共享方法、装置、设备、存储介质及程序产品
EP3944633A1 (en) A method for optimizing speech pickup in a speakerphone system
TWI778524B (zh) 偵測雙邊發話及消除回音的方法、通訊裝置及通訊系統
CN107124494B (zh) 听筒降噪方法及装置
CN115705848A (zh) 一种降噪方法、设备及存储介质
CN115798495A (zh) 会议终端及用于会议的回声消除方法
GB2591557A (en) Audio conferencing in a room
CN116036591A (zh) 音效优化方法、装置、设备及存储介质
CN116684785A (zh) 音频信号处理方法、可读介质和电子设备
CN116367066A (zh) 具有音频质量检测的音频设备及相关方法
JP2008311848A (ja) 音声信号処理装置、音声信号処理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination