CN108702424B - 用于声学回声消除的方法、存储介质及电子设备 - Google Patents
用于声学回声消除的方法、存储介质及电子设备 Download PDFInfo
- Publication number
- CN108702424B CN108702424B CN201780012942.3A CN201780012942A CN108702424B CN 108702424 B CN108702424 B CN 108702424B CN 201780012942 A CN201780012942 A CN 201780012942A CN 108702424 B CN108702424 B CN 108702424B
- Authority
- CN
- China
- Prior art keywords
- input signal
- signal
- audio signal
- impulse response
- amplitude
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000005236 sound signal Effects 0.000 claims abstract description 161
- 238000005316 response function Methods 0.000 claims abstract description 89
- 238000001914 filtration Methods 0.000 claims abstract description 61
- 238000012886 linear function Methods 0.000 claims abstract description 33
- 230000015654 memory Effects 0.000 claims description 63
- 230000004044 response Effects 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 13
- 238000005070 sampling Methods 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 24
- 238000004590 computer program Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 238000002592 echocardiography Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/001—Monitoring arrangements; Testing arrangements for loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N29/00—Investigating or analysing materials by the use of ultrasonic, sonic or infrasonic waves; Visualisation of the interior of objects by transmitting ultrasonic or sonic waves through the object
- G01N29/44—Processing the detected response signal, e.g. electronic circuits specially adapted therefor
- G01N29/4409—Processing the detected response signal, e.g. electronic circuits specially adapted therefor by comparison
- G01N29/4427—Processing the detected response signal, e.g. electronic circuits specially adapted therefor by comparison with stored values, e.g. threshold values
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/20—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
- H04B3/23—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
- H04B3/237—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers using two adaptive filters, e.g. for near end and for end echo cancelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Signal Processing (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Life Sciences & Earth Sciences (AREA)
- Acoustics & Sound (AREA)
- Otolaryngology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
执行声学回声消除的技术涉及提供双幅度滤波操作,所述双幅度滤波操作在要从扩音器输出的传入音频信号的幅度小于指定阈值时执行第一滤波操作,而在所述传入音频信号的幅度大于所述阈值时执行第二滤波操作。所述第一滤波操作可以采取所述传入音频信号与第一脉冲响应函数之间的卷积的形式。所述第二滤波操作可以采取所述传入音频信号的非线性函数与第二脉冲响应函数之间的卷积的形式。对于这种卷积,所述双幅度滤波操作涉及提供所述传入音频信号在指定时间窗口之上的样本作为所述传入音频信号。可以根据输入到麦克风中的输入信号来确定所述第一和第二脉冲响应函数。
Description
相关申请的交叉引用
本申请要求于2016年6月30日提交的美国临时申请No. 62/356,766的优先权,其公开内容通过引用整体地并入在本文中。
技术领域
本说明书涉及移动装置中的声学回声消除。
背景技术
在一些语音通信系统中,当扩音器和麦克风耦合时发生声学回声。这种语音通信系统的示例是Web实时通信(WebRTC),它是支持Web 浏览器的通信系统。这种支持web浏览器的通信系统提供基于软件的声学回声消除(AEC)操作以减少或者消除声学回声。常规AEC操作包括使用自适应滤波器来识别从扩音器输出的音频中的回声的回声路径,合成回声的副本,以及输入到麦克风中的音频减去回声的副本。
发明内容
在一个一般方面中,方法可包括由被配置成减少包括扩音器和麦克风的音频系统中的声学回声的处理电路在所述音频系统的扩音器处接收来自远离所述音频系统的源位置的音频信号。所述方法也可包括由所述处理电路对所述音频信号的幅度和阈值幅度执行比较操作以产生比较结果。所述方法还可以包括,响应于所述比较结果指示所述音频信号的幅度小于所述阈值幅度,由所述处理电路对输入到所述音频系统的麦克风中的输入信号执行第一滤波操作以产生第一滤波的输入信号;以及由所述处理电路将所述第一滤波的输入信号发送到所述源位置。所述方法还可包括,响应于所述比较结果指示所述音频信号的幅度大于所述阈值幅度,由所述处理电路对输入到所述音频系统的麦克风中的所述输入信号执行第二滤波操作以产生第二滤波的输入信号,所述第二滤波的输入信号与所述第一滤波的输入信号不同;以及由所述处理电路将所述第二滤波的输入信号发送到所述源位置。
在下面的附图和描述中阐述了一个或多个实施方式的细节。其它特征根据说明书和附图并根据权利要求书将是显而易见的。
附图说明
图1是图示用于实现本文中所描述的改进技术的示例电子环境的图。
图2是图示在图1中所示的电子环境内执行改进技术的示例方法的流程图。
图3是图示在图1中所示的电子环境内执行改进技术的示例方法的示意图。
图4图示可与这里所描述的电路一起使用的计算机装置和移动计算机装置的示例。
具体实施方式
上述的常规声学回声消除(AEC)操作假定回声路径是线性的。虽然这种假定适用于连接到桌面型和膝上型计算机的音频系统,但是对于其输入和输出紧靠在一起的具有低质量音频分量的移动装置来说并非如此。对于移动装置来说,回声路径可以是非线性的。在这种情况下,常规AEC操作可能在从音频输入中去除回声时无效。
依照本文中所描述的实施方式并且与上述的常规AEC操作对比,执行AEC操作的改进技术涉及提供双幅度滤波操作,所述双幅度滤波操作在要从扩音器输出的传入音频信号的幅度小于指定阈值时执行第一滤波操作,而在传入音频信号的幅度大于阈值时执行第二滤波操作。例如,第一滤波操作可以采取传入音频信号与第一脉冲响应函数之间的卷积的形式。在一个示例中,第一脉冲响应函数可以是优化残差信号的功率、例如使残差信号的功率最小化的通用脉冲响应函数。在此示例中,第二滤波操作可以采取传入音频信号的非线性函数与第二脉冲响应函数之间的卷积的形式。对于这种卷积,双幅度滤波操作涉及提供传入音频信号在指定时间窗口之上的样本作为传入音频信号。可以根据输入到麦克风中的输入信号来确定第一脉冲响应函数和第二脉冲响应函数。在一些实施方式中,这些脉冲响应函数中的每一个是根据输入信号与卷积的相应输出之间的残差的功率的最小化来计算的。
有利地,第一滤波操作与第二滤波操作之间的上述幅度相关切换提供用来在移动装置中处理基于软件的通信系统中的非线性回声路径的简单框架。
图1是图示可以在其中实现上述的改进技术的示例电子环境100 的图。如所示,在图1中,示例电子环境100包括移动装置120和网络190。在一些实施方式中,移动装置120采取智能电话、平板计算机等的形式。
移动装置120被配置成提供声学回声消除。移动装置120包括扩音器110、网络接口122、一个或多个处理单元124、存储器126、音频接口128和麦克风180。网络接口122包括例如以太网适配器、令牌环适配器等,以用于将从网络170接收到的电子和/或光学信号转换成电子形式以供由点云压缩计算机120使用。该处理单元的集合124包括一个或多个处理芯片和/或部件。存储器126包括易失性存储器(例如, RAM)和非易失性存储器两者,诸如一个或多个ROM、磁盘驱动器、固态驱动器等。该处理单元的集合124和存储器126一起形成控制电路,所述控制电路被配置且布置成执行如本文中所描述的各种方法和功能。
在一些实施例中,移动装置120的组件中的一个或多个可以是或者可包括被配置成处理存储在存储器126中的指令的处理器(例如,处理单元124)。如图1中所描绘的此类指令的示例包括传入音频信号管理器130、幅度比较管理器136、小幅度滤波管理器140、大幅度滤波管理器150、功率最小化管理器160和周期性管理器170。另外,如图 1中所图示,存储器126被配置成存储相对于使用这种数据的相应管理器来描述的各种数据。
传入音频信号管理器130被配置成通过网络接口122从远离移动装置120的音频源、例如在WebRTC会话的远端的一方接收传入音频信号数据132。传入音频信号管理器130在接收音频信号数据时,被配置成以某个频率例如每秒200个样本或更多或更少对通过网络190接收到的音频信号进行采样。另外,传入音频信号管理器130被配置成在时间窗口数据134中指定的指定时间窗口期间存储音频信号的结果样本。在这种时间窗口期间存储音频信号产生加窗音频信号作为传入音频信号数据132。在一些实施方式中,时间窗口134被指定为固定时间,例如200毫秒或更多或更少。在某些情况下时间窗口134被指定为固定数目的样本,例如,每窗口40个样本或更多或更少。在一些实施方式中,传入音频信号管理器130以指定频率例如每200毫秒一次或更频繁或更不频繁地更新加窗音频信号。
幅度比较管理器134被配置成将加窗音频信号132的幅度与幅度比较数据138中指定的阈值幅度相比较以产生比较结果144。幅度比较管理器134也被配置成选择小幅度滤波管理器140或大幅度滤波管理器150中的一个以用于根据比较结果144对加窗音频信号132执行滤波操作。例如,如果比较结果144指示幅度小于阈值138,则幅度比较管理器134被配置成选择小幅度滤波管理器140。在此示例中,如果比较结果144指示幅度大于阈值138,则幅度比较管理器134被配置成选择大幅度滤波管理器150。
在一些实施方式中,幅度比较管理器134被配置成生成加窗音频信号132的样本的幅度的绝对值的最大值(即,L∞范数)作为加窗音频信号132的幅度。在一些实施方式中,幅度比较管理器134被配置成生成加窗音频信号132的样本的幅度的平方和(即,L2范数)作为加窗音频信号132的幅度。
小幅度滤波管理器140被配置成利用小幅度脉冲响应数据142对加窗音频信号132执行卷积运算。在一些实施方式中,小幅度脉冲响应数据142的样本的数目等于加窗音频信号132的样本的数目。在一些实施方式中,小幅度脉冲响应数据142的样本的数目不等于加窗音频信号132的样本的数目。在这种实施方式中,小幅度滤波管理器140 被配置成使用来自加窗音频信号132和小幅度脉冲响应数据142的最小数目的样本。
大幅度滤波管理器150被配置成利用大幅度脉冲响应数据154对加窗音频信号132的非线性函数执行卷积运算。在一些实施方式中,大幅度脉冲响应数据154的样本的数目等于加窗音频信号132的样本的数目。在一些实施方式中,大幅度脉冲响应数据154的样本的数目不等于加窗音频信号132的样本的数目。在这种实施方式中,大幅度滤波管理器150被配置成使用来自加窗音频信号132和大幅度脉冲响应数据150的最小数目的样本。
另外,大幅度滤波管理器150被配置成根据非线性函数数据152 对加窗音频信号132的样本中的每一个执行非线性函数评估。非线性函数数据152指定要由大幅度滤波管理器150响应于比较结果144指示幅度大于阈值138而执行的非线性函数评估。例如,非线性函数数据152可以经由数字指示符、文本描述符指示这种非线性函数。大幅度滤波管理器150被配置成解释这种指示符或描述符并且根据该解释执行非线性函数评估。在一些实施方式中,非线性函数数据152中指定的非线性函数可以采取加窗音频信号132的样本的值的幂的形式,例如,样本的平方。在一些实施方式中,这种非线性函数可以采取绝对值、绝对值的平方或样本的绝对值的任何幂的形式。
功率最小化管理器160被配置成基于通过音频接口128从麦克风 180接收到的输入信号数据156产生小幅度脉冲响应数据142或大幅度脉冲响应数据154。在一些实施方式中,功率最小化管理器160被配置成形成残差作为输入信号数据156与卷积输出之间的差。卷积输出是未知权重和加窗音频信号132的线性组合。功率最小化管理器160然后被配置成通过在未知权重之上对未知残差信号的样本的值的幂或平方和执行最小化操作来确定小幅度脉冲响应数据142或大幅度脉冲响应数据154。功率最小化管理器160根据最小化操作确定的权重产生小幅度脉冲响应数据142或大幅度脉冲响应数据154和残差数据162。在一些实施方式中,功率最小化管理器160被配置成对未知残差的绝对值或未知残差的绝对值的幂执行最小化操作,以产生权重。
周期性管理器170被配置成使功率最小化管理器160根据周期性数据172中指定的周期来周期性地更新小幅度脉冲响应数据142或大幅度脉冲响应数据154。可按绝对时间间隔例如1秒或更多或更少或者按时间窗口的数目例如1个或多个时间窗口表达周期性数据172中指定的周期。
网络190被配置且布置成在移动装置120与任何远程音频源之间提供网络连接。网络190可以实现通常用于通过因特网或其它网络进行通信的各种协议和拓扑中的任一种。另外,网络190可以包括在此类通信中使用的各种组件例如电缆、交换机/路由器、网关/桥接器等。
在一些实施方式中,存储器126可以是任何类型的存储器,诸如随机存取存储器、磁盘驱动存储器、闪速存储器等。在一些实施方式中,存储器126可被实现为与用户装置120的组件相关联的多于一个存储器组件(例如,多于一个RAM组件或磁盘驱动存储器)。在一些实施方式中,存储器126可以是数据库存储器。在一些实施方式中,存储器126可以是或者可包括非本地存储器。例如,存储器126可以是或者可包括由多个装置(未示出)共享的存储器。在一些实施方式中,存储器126可与网络内的服务器装置(未示出)相关联并且被配置成为用户装置120的组件服务。
移动装置120的组件(例如,模块、处理单元124)可被配置成基于可包括一种或多种类型的硬件、软件、固件、操作系统、运行时库等的一个或多个平台(例如,一个或多个类似或不同的平台)来操作。在一些实施方式中,移动装置120的组件可被配置成在装置的集群(例如,服务器场)内操作。在这种实施方式中,可将移动装置120的组件的功能性和处理分发到装置的集群的若干装置。
移动装置120的组件可以是或者可包括被配置成处理属性的任何类型的硬件和/或软件。在一些实施方式中,在图1中的移动装置120 的组件中示出的组件的一个或多个部分可以是或者可包括基于硬件的模块(例如,数字信号处理器(DSP)、现场可编程门阵列(FPGA)、存储器)、固件模块和/或基于软件的模块(例如,计算机代码的模块、可在计算机处执行的计算机可读指令的集合)。例如,在一些实施方式中,移动装置120的组件的一个或多个部分可以是或者可包括被配置用于由至少一个处理器(未示出)执行的软件模块。在一些实施方式中,组件的功能性可被包括在与图1中所示的那些组件不同的模块和/或不同的组件中。
尽管未示出,然而在一些实施方式中,移动装置120的组件(或其部分)可被配置成在例如数据中心(例如,云计算环境)、计算机系统、一个或多个服务器/主机装置等内操作。在一些实施方式中,移动装置 120的组件(或其部分)可被配置成在网络内操作。因此,移动装置120 的组件(或其部分)可被配置成在可包括一个或多个装置和/或一个或多个服务器装置的各种类型的网络环境内起作用。例如,网络可以是或者可包括局域网(LAN)、广域网(WAN)等。网络可以是或者可包括使用例如网关装置、桥接器、交换机等实现的无线网络和/或无线网络。网络可包括一个或多个分段并且/或者可具有基于诸如网际协议(IP)和/或专有协议的各种协议的部分。网络可包括因特网的至少一部分。
在一些实施例中,移动装置120的组件中的一个或多个可以是或者可包括被配置成处理存储在存储器中的指令的处理器。例如,传入音频信号管理器130(和/或其一部分)、幅度比较管理器136(和/或其一部分)、小幅度滤波管理器140(和/或其一部分)、大幅度滤波管理器 150(和/或其一部分)、功率最小化管理器160(和/或其一部分)以及周期性管理器170(和/或其一部分)可以是被配置成执行与实现一个或多个功能的过程有关的指令的处理器和存储器的组合。
图2是图示执行回声消除的示例方法200的流程图。方法200可以由关于图1所描述的软件构造来执行,所述软件构造驻留在移动装置120的存储器126中并且由该处理单元的集合124运行。
在202处,移动装置120从远离音频系统的源位置接收音频信号,在所述音频系统中移动装置120被配置成减少声学回声。在一些布置例如图1中所图示的布置中,音频系统被包括在移动装置120中。在一些布置中,音频信号被表达为音频信号在一时间窗口之上的离散数目的均匀隔开的样本。
在204处,移动装置120对音频信号的幅度和阈值幅度执行比较操作以产生比较结果,例如,比较结果144。在一些布置中,幅度比较管理器136根据L∞范数例如样本在时间窗口之上的最大绝对值来计算音频信号的幅度。在一些配置中,幅度比较管理器136根据L2范数例如样本在时间窗口之上的绝对值的平方和来计算音频信号的幅度。
在206处,响应于比较结果指示音频信号的幅度小于阈值幅度,移动装置120对输入到音频系统的麦克风中的输入信号执行第一滤波操作以产生第一滤波的输入信号。在一些布置中,移动装置120使小幅度滤波管理器140从事于对加窗音频信号例如音频信号数据132和小幅度脉冲响应数据142执行卷积运算。在一些布置中,随后产生的第一滤波的输入信号是等于输入信号与卷积运算的输出之间的差的残差信号。在208处,移动装置120将第一滤波的输入信号发送到源位置。
在210处,响应于比较结果指示音频信号的幅度大于阈值幅度,移动装置120对输入到音频系统的麦克风中的输入信号执行第二滤波操作以产生第二滤波的输入信号。在一些布置中,移动装置120使大幅度滤波管理器150从事于对加窗音频信号例如音频信号数据132的非线性函数和大幅度脉冲响应数据152执行卷积运算。在一些布置中,随后产生的第二滤波的输入信号是等于输入信号与卷积运算的输出之间的差的残差信号。在212处,移动装置120将第二滤波的输入信号发送到源位置。
图3是图示示例音频系统300的示意图。如此图中所图示,音频信号x(n)的样本在一个时刻从远程位置310到达音频系统300。音频系统300内的电路将音频信号x(n)引导到音频系统300的扩音器302,其由用户306听到。
当除了来自用户306的语音输入之外来自扩音器302的输出被麦克风304拾取以形成输入信号y(n)时发生声学回声。音频系统300中的电路被配置成将输出信号e(n)提供回给远程位置310,这类似于用户已经提供给麦克风306的东西并且滤出来自扩音器302的输出。
由于声学回声的固有非线性(例如,由于移动装置例如移动装置 120中的扩音器302和麦克风306的接近和质量),音频系统300中的电路被配置成执行取决于传入音频信号x(n)的幅度的滤波操作。如图3 中所示,音频系统300根据L∞范数来计算传入音频信号x(n)的幅度,范数即
其中x(i)是n个样本的时间窗口内的音频信号的第i个样本。
一旦在已经接收到加窗信号x(n)之后的某个时刻已经生成输入音频信号的幅度||x||∞,音频系统300在开关320处将此幅度与阈值T相比较。音频系统300然后根据当||x||∞<T时的电路的小幅度分支340和当 ||x||∞>T时的大幅度分支350中的一个来执行滤波操作。
小幅度分支340涉及执行线性滤波操作。此线性滤波操作涉及将输入信号y(n)减去加窗音频信号x(n)与脉冲响应函数h2(n)之间的卷积以形成残差信号e2(n)。例如,此残差信号可能具有数学形式
大幅度滤波操作350涉及执行非线性滤波操作。此非线性滤波操作涉及将输入信号y(n)减去加窗音频信号的非线性函数g1即g1[x(n)]与脉冲响应函数h1(n)之间的卷积以形成残差信号e1(n)。在一些实施方式中,非线性函数可采取形式g1(z)=z2。例如,此残差信号可能具有数学形式
音频系统300通过使相应的残差信号e1(n)和e2(n)的功率最小化来导出脉冲响应函数h1(n)和h2(n)中的每一个。例如,音频系统可以通过找到数字c1、c2、...、cn使得通过以下表达式给出的残差信号功率P最小来对于残差信号e2(n)执行这种最小化
在一些实施方式中,脉冲响应函数采取加权谐波和即系数乘谐波例如正弦或余弦项)之和的形式,每个谐波具有频率为基频的倍数的频率。在此类实施方式中,音频系统200的电路然后可以应用傅立叶分析的标准技术来生成未知权重。
类似地,大幅度分支350中的功率的表达式是
在一些实施方式中,音频系统300周期性地例如根据固定的指定周期更新脉冲响应函数h1和h2。在一些实施方式中,周期等于时间窗口的大小。
在一些实施方式中,小幅度分支350涉及在卷积之前对加窗音频信号应用非线性函数g2,其中g2不同于g1。
在一些实施方式中,在开关320处可以存在多于两个分支。在此类情况下,将存在多于一个阈值,即,在k个分支情况下,将存在k-1 个阈值T1、T2、...、Tk-1。沿着这些线,如果幅度小于T1,则音频系统将根据第一分支提供第一滤波器(即,第一非线性函数和第一脉冲响应函数);如果幅度大于T1且小于T2,则音频系统将根据第二分支提供第二滤波器,依此类推。
图4图示可以与这里所描述的技术一起使用的通用计算机装置 400和通用移动计算机装置450的示例。
如图4中所示,计算装置400旨在表示各种形式的数字计算机,诸如膝上型计算机、桌面型计算机、工作站、个人数字助理、服务器、刀片服务器、大型机和其它适当的计算机。计算装置450旨在表示各种形式的移动装置,诸如个人数字助理、蜂窝电话、智能电话和其它类似的计算装置。这里示出的组件、它们的连接和关系以及它们的功能仅意在为示例性的,而不意在限制在本文档中描述和/或要求保护的发明的实施方式。
计算装置400包括处理器402、存储器404、存储装置406、连接到存储器404和高速扩展端口410的高速接口408以及连接到低速总线414和存储装置406的低速接口412。组件402、404、406、408、 410和412中的每一个均使用各种总线来互连,并且可以被酌情安装在公共母板上或者以其它方式安装。处理器402可处理在计算装置400 内执行的指令,包括存储在存储器404中或在存储装置406上以在外部输入/输出装置诸如耦合到高速接口408的显示器416上显示GUI的图形信息的指令。在其它实施方式中,可以酌情使用多个处理器和/或多个总线以及多个存储器和多种类型的存储器。另外,可以连接多个计算装置400,其中每个装置提供必要操作的部分(例如,作为服务器组、一组刀片服务器或多处理器系统)。
存储器404存储计算装置400内的信息。在一个实施方式中,存储器404是一个或多个易失性存储器单元。在另一实施方式中,存储器404是一个或多个非易失性存储器单元。存储器404也可以是另一形式的计算机可读介质,诸如磁盘或光盘。
存储装置406能够为计算装置400提供大容量存储。在一个实施方式中,存储装置406可以是或者包含计算机可读介质,诸如软盘装置、硬盘装置、光盘装置或磁带装置、闪速存储器或其它类似的固态存储装置或装置的阵列,包括存储区域网络或其它配置中的装置。计算机程序产品可被有形地具体实现在信息载体中。计算机程序产品也可以包含指令,所述指令当被执行时,执行一个或多个方法,诸如上述的那些方法。信息载体是计算机或机器可读介质,诸如存储器404、存储装置406或处理器402上的存储器。
高速控制器408管理计算装置400的带宽密集操作,然而低速控制器412管理较低带宽密集操作。功能的这种分配仅是示例性的。在一个实施方式中,高速控制器408耦合到存储器404、显示器416(例如,通过图形处理器或加速器),并且耦合到高速扩展端口410,所述高速扩展端口410可以接受各种扩展卡(未示出)。在该实施方式中,低速控制器412耦合到存储装置406和低速扩展端口414。可以包括各种通信端口(例如,USB、蓝牙、以太网、无线以太网)的低速扩展端口可以例如通过网络适配器耦合到一个或多个输入/输出装置,诸如键盘、指点装置、扫描仪或诸如交换机或路由器的联网装置。
如图中所示,可以以许多不同的形式实现计算装置400。例如,它可以作为标准服务器420被实现,或者在一组此类服务器中被实现多次。它也可以作为机架服务器系统424的一部分被实现。此外,它可以被实现在诸如膝上型计算机422的个人计算机中。可替选地,来自计算装置400的组件可以与移动装置(未示出)诸如装置450中的其它组件组合。此类装置中的每一个可以包含计算装置400、450中的一个或多个,并且整个系统可以由彼此通信的多个计算装置400、450组成。
计算装置450包括处理器452、存储器464、诸如显示器454的输入/输出装置、通信接口466和收发器468及其它组件。装置450也可以被提供有存储装置,诸如微驱动器或其它装置,以提供附加存储。组件450、452、464、454、466和468中的每一个均使用各种总线来互连,并且若干组件可以被酌情安装在公共母板上或者以其它方式安装。
处理器452可执行计算装置450内的指令,包括存储在存储器464 中的指令。处理器可以作为芯片的芯片组被实现,所述芯片包括单独的且多个模拟和数字处理器。处理器可以提供例如用于装置450的其它组件的协调,诸如对用户界面、由装置450运行的应用和由装置450 进行的无线通信的控制。
处理器452可以通过耦合到显示器454的控制接口458和显示接口456来与用户进行通信。显示器454可以是例如TFT LCD(薄膜晶体管液晶显示器)或OLED(有机发光二极管)显示器或其它适当的显示技术。显示接口456可以包括用于驱动显示器454以向用户呈现图形和其它信息的适当电路。控制接口458可以从用户接收命令并且对它们进行转换以便提交给处理器452。此外,可以提供与处理器452通信的外部接口462,以便使得装置450能够与其它装置进行近区域通信。外部接口462可以在一些实施方式中提供例如用于有线通信,或者在其它实施方式中提供用于无线通信,并且也可以使用多个接口。
存储器464存储计算装置450内的信息。存储器464可作为一个或多个计算机可读介质、一个或多个易失性存储器单元或者一个或多个非易失性存储器单元中的一个或多个被实现。也可以提供扩展存储器474,并且扩展存储器474通过扩展接口472连接到装置450,所述扩展接口472可以包括例如SIMM(单列直插存储器模块)卡接口。这种扩展存储器474可以为装置450提供额外的存储空间,或者也可以为装置450存储应用或其它信息。具体地,扩展存储器474可以包括用于执行或者补充上述的过程的指令,并且也可以包括安全信息。因此,例如,扩展存储器474可以作为用于装置450的安全模块被提供,并且可以被编程有允许安全地使用装置450的指令。此外,可以经由 SIMM卡连同附加信息一起提供安全应用,诸如以不可破解的方式将识别信息放置在SIMM卡上。
如下所述,存储器可以包括例如闪速存储器和/或NVRAM存储器。在一个实施方式中,计算机程序产品被有形地具体实现在信息载体中。计算机程序产品包含指令,所述指令当被执行时,执行一个或多个方法,诸如上述的那些方法。信息载体是可以例如通过收发器468或外部接口462接收的计算机或机器可读介质,诸如存储器464、扩展存储器474或处理器452上的存储器。
装置450可以通过通信接口466以无线方式通信,所述通信接口 466必要时可以包括数字信号处理电路。通信接口466可以提供用于在各种模式或协议下通信,所述各种模式或协议诸如GSM语音呼叫、 SMS、EMS或MMS消息传送、CDMA、TDMA、PDC、WCDMA、 CDMA2000或GPRS等。这种通信可以例如通过射频收发器468而发生。此外,短距离通信可以例如使用蓝牙、WiFi或其它这种收发器(未示出)来发生。此外,GPS(全球定位系统)接收器模块470可以向装置 450提供附加导航和位置相关无线数据,其可以由在装置450上运行的应用酌情使用。
装置450也可以使用音频编解码器460来可听地通信,所述音频编解码器460可以从用户接收语音信息并且将它转换为可用数字信息。音频编解码器460可以诸如通过扬声器例如在装置450的头戴式耳机中同样地为用户生成可听声音。这种声音可以包括来自语音电话呼叫的声音,可以包括记录的声音(例如,语音消息、音乐文件等)并且也可以包括由在装置450上操作的应用生成的声音。
如图中所示,可以以许多不同的形式实现计算装置450。例如,它可以作为蜂窝电话480被实现。它也可以作为智能电话482、个人数字助理或其它类似的移动装置的一部分被实现。
这里描述的系统和技术的各种实施方式可用数字电子电路、集成电路、专门设计的ASIC(专用集成电路)、计算机硬件、固件、软件和/ 或其组合加以实现。这些各种实施方式可包括在可编程系统上可执行和/或可解释的一个或多个计算机程序中的实施方式,所述可编程系统包括至少一个可编程处理器,所述可编程处理器可以是专用的或通用的,耦合以从存储系统、至少一个输入装置和至少一个输出装置接收数据和指令,并且向存储系统、至少一个输入装置和至少一个输出装置发送数据和指令。
这些计算机程序(也称为程序、软件、软件应用或代码)包括用于可编程处理器的机器指令,并且可用高级过程和/或面向对象编程语言和/ 或用汇编/机器语言加以实现。如本文中所使用的,术语“机器可读介质”、“计算机可读介质”指代用于向可编程处理器提供机器指令和/ 或数据的任何计算机程序产品、设备和/或装置(例如,磁盘、光盘、存储器、可编程逻辑器件(PLD)),包括接收机器指令作为机器可读信号的机器可读介质。术语“机器可读信号”指代用于向可编程处理器提供机器指令和/或数据的任何信号。
为了提供与用户的交互,可在计算机上实现这里描述的系统和技术,所述计算机具有用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或LCD(液晶显示器)监视器)以及用户可用来向该计算机提供输入的键盘和指点装置(例如,鼠标或轨迹球)。其它种类的装置也可用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感觉反馈(例如,视觉反馈、听觉反馈或触觉反馈);并且可以任何形式接收来自用户的输入,包括声学、语音或触觉输入。
可在计算系统中实现这里描述的系统和技术,所述计算系统包括后端组件(例如,作为数据服务器),或者包括中间件组件(例如,应用服务器),或者包括前端组件(例如,具有用户可用来与这里描述的系统和技术的实施方式交互的图形用户界面或Web浏览器的客户端计算机),或者包括此类后端、中间件或前端组件的任何组合。系统的组件可通过任何形式或介质的数字数据通信(例如,通信网络)来互连。通信网络的示例包括局域网(“LAN”)、广域网(“WAN”)和因特网。
计算系统可包括客户端和服务器。客户端和服务器一般地彼此远离并且通常通过通信网络来交互。客户端和服务器的关系借助于在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序而产生。
已经描述了许多实施例。然而,应理解的是,可在不脱离本说明书的精神和范围的情况下作出各种修改。
也应理解的是,当一个元件被称为位于另一元件上、连接到、电连接到、耦合到或者电耦合到另一元件时,它可以直接地位于另一元件上,连接或者耦合到另一元件,或者可以存在一个或多个中间元件。相比之下,当一个元件被称为直接地位于另一元件上、直接地连接到或者直接地耦合到另一元件时,不存在中间元件。尽管可以不在整个详细描述中使用术语直接地位于…上、直接地连接到或直接地耦合到,然而被示出为直接地位于…上、直接地连接或直接地耦合的元件可被称为像这样的。可以修正本申请的权利要求以叙述说明书中描述的或图中示出的示例性关系。
虽然已经像本文中所描述的那样图示了所描述的实施方式的某些特征,然而本领域的技术人员现在将想到许多修改、替换、改变和等同物。因此,应当理解的是,所附权利要求旨在涵盖如落入实施方式的范围内的所有此类修改和改变。应该理解的是,它们已经仅作为示例而非限制被呈现,并且可以作出形式和细节上的各种改变。除了互斥组合之外,本文中所描述的设备和/或方法的任何部分可以按照任何组合进行组合。本文中所描述的实施方式可包括所描述的不同实施方式的功能、组件和/或特征的各种组合和/或子组合。
在以下示例中概括另外的实施方式:示例1:一种方法,包括:由被配置成减少包括扩音器和麦克风的音频系统中的声学回声的处理电路在所述音频系统的扩音器处接收来自远离所述音频系统的源位置的音频信号;由所述处理电路对所述音频信号的幅度和阈值幅度执行比较操作以产生比较结果;响应于所述比较结果指示所述音频信号的幅度小于所述阈值幅度:由所述处理电路对输入到所述音频系统的麦克风中的输入信号执行第一滤波操作以产生第一滤波的输入信号;以及由所述处理电路将所述第一滤波的输入信号发送到所述源位置;响应于所述比较结果指示所述音频信号的幅度大于所述阈值幅度:由所述处理电路对输入到所述音频系统的麦克风中的所述输入信号执行第二滤波操作以产生第二滤波的输入信号,所述第二滤波的输入信号与所述第一滤波的输入信号不同;以及由所述处理电路将所述第二滤波的输入信号发送到所述源位置。
示例2:根据示例1所述的方法,其中,执行所述第一滤波操作包括:在指定时间窗口之上对所述音频信号进行采样以产生加窗音频信号;基于输入到所述麦克风中的所述输入信号生成第一脉冲响应函数;以及生成所述加窗音频信号和所述第一脉冲响应函数的卷积以产生第一滤波的传入信号。
示例3:根据示例2所述的方法,其中,基于输入到所述麦克风中的所述输入信号生成所述第一脉冲响应函数包括产生优化残差信号的功率的通用脉冲响应函数作为所述第一脉冲响应函数,所述残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号和所述通用脉冲响应函数的卷积之间的差,并且其中,将所述第一滤波的输入信号发送到所述源位置包括发送功率优化的残差信号作为所述第一滤波的输入信号,所述功率优化的残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号和所述第一脉冲响应函数的卷积之间的差。
示例4:根据示例2或3所述的方法,其中,所述第一脉冲响应函数是谐波的加权和,所述谐波中的每一个具有等于基频的倍数的频率。
示例5:根据示例2至4中的一个所述的方法,其中,执行所述第一滤波操作还包括:在生成所述第一脉冲响应函数之后的指定时间量之后,生成另一第一脉冲响应函数。
示例6:根据示例2至5中的一个所述的方法,其中,所述加窗音频信号包括所述音频信号的多个样本,所述多个样本中的每一个是所述音频信号在出现在所述指定时间窗口内时的值,并且其中,对所述音频信号的幅度和阈值幅度执行所述比较操作包括:生成所述音频信号的多个样本中的每一个的绝对值以产生多个绝对值;以及产生所述多个绝对值中的最大者作为所述音频信号的幅度。
示例7:根据示例1至6中的一个所述的方法,其中,执行所述第二滤波操作包括:生成所述加窗音频信号的非线性函数;基于输入到所述麦克风中的所述输入信号生成第二脉冲响应函数;以及生成i) 所述加窗音频信号的非线性函数和(ii)所述第一脉冲响应函数的卷积以产生第一滤波的传入信号。
示例8:根据示例7所述的方法,其中,生成所述加窗音频信号的非线性函数包括对所述加窗音频信号的幅度求平方。
示例9:根据示例7或8所述的方法,其中,基于输入到所述麦克风中的所述输入信号生成所述第二脉冲响应函数包括产生优化残差信号的功率的通用脉冲响应函数作为所述第二脉冲响应函数,所述残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号的非线性函数和所述通用脉冲响应函数的卷积之间的差,并且其中,将所述第二滤波的输入信号发送到所述源位置包括发送功率优化的残差信号作为所述第二滤波的输入信号,所述功率优化的残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号的非线性函数和所述第二脉冲响应函数的卷积之间的差。
示例10:根据示例6至9中的一个所述的方法,其中,执行所述第二滤波操作还包括:在生成所述第二脉冲响应函数之后的指定时间量之后,生成另一第二脉冲响应函数。
示例11:一种包括非暂时性存储介质的计算机程序产品,所述计算机程序产品包括代码,所述代码当由被配置成减少包括扩音器和麦克风的音频系统中的声学回声的处理电路执行时,使所述处理电路执行一种方法,所述方法包括:在所述音频系统的扩音器处接收来自远离所述音频系统的源位置的音频信号;对所述音频信号的幅度和阈值幅度执行比较操作以产生比较结果;响应于所述比较结果指示所述音频信号的幅度小于所述阈值幅度:对输入到所述音频系统的麦克风中的输入信号执行第一滤波操作以产生第一滤波的输入信号;以及将所述第一滤波的输入信号发送到所述源位置;响应于所述比较结果指示所述音频信号的幅度大于所述阈值幅度:对输入到所述音频系统的麦克风中的所述输入信号执行第二滤波操作以产生第二滤波的输入信号,所述第二滤波的输入信号与所述第一滤波的输入信号不同;以及将所述第二滤波的输入信号发送到所述源位置。
示例12:根据示例11所述的计算机程序产品,其中,执行所述第一滤波操作包括:在指定时间窗口之上对所述音频信号进行采样以产生加窗音频信号;基于输入到所述麦克风中的所述输入信号生成第一脉冲响应函数;以及产生所述加窗音频信号和所述第一脉冲响应函数的卷积以产生第一滤波的传入信号。
示例13:根据示例12所述的计算机程序产品,其中,基于输入到所述麦克风中的所述输入信号生成所述第一脉冲响应函数包括产生优化残差信号的功率的通用脉冲响应函数作为所述第一脉冲响应函数,所述残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号和所述通用脉冲响应函数的卷积之间的差,并且其中,将所述第一滤波的输入信号发送到所述源位置包括发送功率优化的残差信号作为所述第一滤波的输入信号,所述功率优化的残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号和所述第一脉冲响应函数的卷积之间的差。
示例14:根据示例12或13所述的计算机程序产品,其中,执行所述第一滤波操作还包括:在生成所述第一脉冲响应函数之后的指定时间量之后,生成另一第一脉冲响应函数。
示例15:根据示例12至14中的一个所述的计算机程序产品,其中,所述加窗音频信号包括所述音频信号的多个样本,所述多个样本中的每一个是所述音频信号在出现在所述指定时间窗口内时的值,并且其中,对所述音频信号的幅度和阈值幅度执行所述比较操作包括:生成所述音频信号的多个样本中的每一个的绝对值以产生多个绝对值;以及产生所述多个绝对值中的最大者作为所述音频信号的幅度。
示例16:根据示例11至15中的一个所述的计算机程序产品,其中,执行所述第二滤波操作包括:生成所述加窗音频信号的非线性函数;基于输入到所述麦克风中的所述输入信号生成第二脉冲响应函数;以及生成(i)所述加窗音频信号的非线性函数和(ii)所述第一脉冲响应函数的卷积以产生第一滤波的传入信号。
示例17:根据示例16中所述的计算机程序产品,其中,生成所述加窗音频信号的非线性函数包括对所述加窗音频信号的幅度求平方。
示例18:根据示例16或17中所述的计算机程序产品,其中,基于输入到所述麦克风中的所述输入信号生成所述第二脉冲响应函数包括产生优化残差信号的功率的通用脉冲响应函数作为所述第二脉冲响应函数,所述残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号的非线性函数和所述通用脉冲响应函数的卷积之间的差,并且其中,将所述第二滤波的输入信号发送到所述源位置包括发送功率优化的残差信号作为所述第二滤波的输入信号,所述功率优化的残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号的非线性函数和所述第二脉冲响应函数的卷积之间的差。
示例19:根据示例16至18中的一个所述的计算机程序产品,其中,执行所述第二滤波操作还包括:在生成所述第二脉冲响应函数之后的指定时间量之后,生成另一第二脉冲响应函数。
示例20:一种被配置成减少包括扩音器和麦克风的音频系统中的声学回声的电子设备,所述电子设备包括:存储器;以及耦合到所述存储器的控制电路,所述控制电路被配置成:在所述音频系统的扩音器处接收来自远离所述音频系统的源位置的音频信号;对所述音频信号的幅度和阈值幅度执行比较操作以产生比较结果;响应于所述比较结果指示所述音频信号的幅度小于阈值幅度:对输入到所述音频系统的麦克风中的输入信号执行第一滤波操作以产生第一滤波的输入信号;并且将所述第一滤波的输入信号发送到所述源位置;响应于所述比较结果指示所述音频信号的幅度大于阈值幅度:对输入到所述音频系统的麦克风中的所述输入信号执行第二滤波操作以产生第二滤波的输入信号,所述第二滤波的输入信号与所述第一滤波的输入信号不同;并且将所述第二滤波的输入信号发送到所述源位置。
此外,图中描绘的逻辑流程不要求所示特定次序或顺序次序来实现所希望的结果。此外,可以提供其它步骤,或者可以从所描述的流程中消除步骤,并且可以向所描述的系统添加或者从所描述的系统中去除其它组件。因此,其它实施例在以下权利要求的范围内。
Claims (20)
1.一种用于声学回声消除的方法,所述方法包括:
由被配置成减少包括扩音器和麦克风的音频系统中的声学回声的处理电路,在所述音频系统的所述扩音器处接收来自远离所述音频系统的源位置的音频信号;
由所述处理电路对所述音频信号的幅度和阈值幅度执行比较操作以产生比较结果;
响应于所述比较结果指示所述音频信号的所述幅度小于所述阈值幅度:
由所述处理电路对到所述音频系统的所述麦克风中的输入信号执行第一滤波操作,以产生第一滤波输入信号;以及
由所述处理电路将所述第一滤波输入信号发送到所述源位置;
响应于所述比较结果指示所述音频信号的所述幅度大于所述阈值幅度:
由所述处理电路对到所述音频系统的所述麦克风中的所述输入信号执行第二滤波操作以产生第二滤波输入信号,所述第二滤波输入信号与所述第一滤波输入信号不同;以及
由所述处理电路将所述第二滤波输入信号发送到所述源位置。
2.根据权利要求1所述的方法,其中,执行所述第一滤波操作包括:
在指定时间窗口之上对所述音频信号进行采样,以产生加窗音频信号;
基于输入到所述麦克风中的所述输入信号生成第一脉冲响应函数;以及
生成所述加窗音频信号和所述第一脉冲响应函数的卷积,以产生第一滤波传入信号。
3.根据权利要求2所述的方法,其中,基于输入到所述麦克风中的所述输入信号生成所述第一脉冲响应函数包括:产生优化残差信号的功率的脉冲响应函数作为所述第一脉冲响应函数,所述残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号和所述通用脉冲响应函数的卷积之间的差,并且
其中,将所述第一滤波输入信号发送到所述源位置包括:发送功率优化的残差信号作为所述第一滤波输入信号,所述功率优化的残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号和所述第一脉冲响应函数的卷积之间的差。
4.根据权利要求2所述的方法,其中,所述第一脉冲响应函数是谐波的加权和,所述谐波中的每一个具有等于基频的倍数的频率。
5.根据权利要求2所述的方法,其中,执行所述第一滤波操作还包括:
在生成所述第一脉冲响应函数之后的指定时间量之后,生成另一第一脉冲响应函数。
6.根据权利要求2所述的方法,
其中,所述加窗音频信号包括所述音频信号的多个样本,所述多个样本中的每一个是所述音频信号在出现在所述指定时间窗口内时的值,并且
其中,对所述音频信号的幅度和阈值幅度执行所述比较操作包括:
生成所述音频信号的多个样本中的每一个样本的绝对值以产生多个绝对值;以及
产生所述多个绝对值中的最大者作为所述音频信号的所述幅度。
7.根据权利要求2所述的方法,其中,执行所述第二滤波操作包括:
生成所述加窗音频信号的非线性函数;
基于输入到所述麦克风中的所述输入信号生成第二脉冲响应函数;以及
生成(i)所述加窗音频信号的非线性函数和(ii)所述第一脉冲响应函数的卷积,以产生第一滤波传入信号。
8.根据权利要求7所述的方法,其中,生成所述加窗音频信号的非线性函数包括:对所述加窗音频信号的幅度求平方。
9.根据权利要求7所述的方法,其中,基于输入到所述麦克风中的所述输入信号生成所述第二脉冲响应函数包括:产生优化残差信号的功率的通用脉冲响应函数作为所述第二脉冲响应函数,所述残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号的所述非线性函数和所述通用脉冲响应函数的卷积之间的差,并且
其中,将所述第二滤波输入信号发送到所述源位置包括:发送功率优化的残差信号作为所述第二滤波输入信号,所述功率优化的残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号的所述非线性函数和所述第二脉冲响应函数的卷积之间的差。
10.根据权利要求7所述的方法,其中,执行所述第一滤波操作包括:
生成所述加窗音频信号的第一非线性函数,所述第一非线性函数与所述非线性函数不同;
基于输入到所述麦克风中的所述输入信号生成第一脉冲响应函数;以及
生成(i)所述加窗音频信号的所述第一非线性函数和(ii)所述第一脉冲响应函数的卷积,以产生第一滤波传入信号。
11.根据权利要求6所述的方法,其中,执行所述第二滤波操作还包括:
在生成所述第二脉冲响应函数之后的指定时间量之后,生成另一第三脉冲响应函数。
12.根据权利要求1所述的方法,其中,所述方法还包括:
响应于所述比较结果指示所述音频信号的所述幅度大于所述阈值幅度并且大于第二阈值幅度:
由所述处理电路对到所述音频系统的所述麦克风中的所述输入信号执行第三滤波操作以产生第二滤波输入信号,所述第三滤波的输入信号与所述第一滤波输入信号和所述第二滤波输入信号不同;以及
由所述处理电路将所述第三滤波输入信号发送到所述源位置。
13.一种存储指令的非暂时性计算机可读存储介质,所述指令当由被配置成减少包括扩音器和麦克风的音频系统中的声学回声的处理电路执行时,使所述处理电路执行一种方法,所述方法包括:
在所述音频系统的所述扩音器处接收来自远离所述音频系统的源位置的音频信号;
对所述音频信号的幅度和阈值幅度执行比较操作以产生比较结果;
响应于所述比较结果指示所述音频信号的所述幅度小于所述阈值幅度:
对到所述音频系统的所述麦克风中的输入信号执行第一滤波操作,以产生第一滤波输入信号;以及
将所述第一滤波输入信号发送到所述源位置;
响应于所述比较结果指示所述音频信号的所述幅度大于所述阈值幅度:
对到所述音频系统的所述麦克风中的所述输入信号执行第二滤波操作以产生第二滤波输入信号,所述第二滤波输入信号与所述第一滤波输入信号不同;以及
将所述第二滤波输入信号发送到所述源位置。
14.根据权利要求13所述的非暂时性计算机可读存储介质,其中,执行所述第一滤波操作包括:
在指定时间窗口之上对所述音频信号进行采样,以产生加窗音频信号;
基于输入到所述麦克风中的所述输入信号生成第一脉冲响应函数;以及
产生所述加窗音频信号和所述第一脉冲响应函数的卷积,以产生第一滤波传入信号。
15.根据权利要求14所述的非暂时性计算机可读存储介质,其中,基于输入到所述麦克风中的所述输入信号生成所述第一脉冲响应函数包括:产生优化残差信号的功率的脉冲响应函数作为所述第一脉冲响应函数,所述残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号和所述通用脉冲响应函数的卷积之间的差,并且
其中,将所述第一滤波输入信号发送到所述源位置包括:发送功率优化的残差信号作为所述第一滤波输入信号,所述功率优化的残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号和所述第一脉冲响应函数的卷积之间的差。
16.根据权利要求14所述的非暂时性计算机可读存储介质,
其中,所述加窗音频信号包括所述音频信号的多个样本,所述多个样本中的每一个是所述音频信号在出现在所述指定时间窗口内时的值,并且
其中,对所述音频信号的幅度和阈值幅度执行所述比较操作包括:
生成所述音频信号的多个样本中的每一个的绝对值以产生多个绝对值;以及
产生所述多个绝对值中的最大者作为所述音频信号的所述幅度。
17.根据权利要求14所述的非暂时性计算机可读存储介质,其中,执行所述第二滤波操作包括:
生成所述加窗音频信号的非线性函数;
基于输入到所述麦克风中的所述输入信号生成第二脉冲响应函数;以及
生成(i)所述加窗音频信号的非线性函数和(ii)所述第一脉冲响应函数的卷积,以产生第一滤波传入信号。
18.根据权利要求17所述的非暂时性计算机可读存储介质,其中,基于输入到所述麦克风中的所述输入信号生成所述第二脉冲响应函数包括:产生优化残差信号的功率的通用脉冲响应函数作为所述第二脉冲响应函数,所述残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号的非线性函数和所述通用脉冲响应函数的卷积之间的差,并且
其中,将所述第二滤波输入信号发送到所述源位置包括:发送功率优化的残差信号作为所述第二滤波输入信号,所述功率优化的残差信号等于输入到所述麦克风中的所述输入信号与所述加窗音频信号的非线性函数和所述第二脉冲响应函数的卷积之间的差。
19.根据权利要求17所述的非暂时性计算机可读存储介质,其中,执行所述第二滤波操作还包括:
在生成所述第二脉冲响应函数之后的指定时间量之后,生成另一第三脉冲响应函数。
20.一种被配置成减少包括扩音器和麦克风的音频系统中的声学回声的电子设备,所述电子设备包括:
存储器;以及
耦合到所述存储器的控制电路,所述控制电路被配置成:
在所述音频系统的所述扩音器处接收来自远离所述音频系统的源位置的音频信号;
对所述音频信号的幅度和阈值幅度执行比较操作以产生比较结果;
响应于所述比较结果指示所述音频信号的所述幅度小于阈值幅度:
对到所述音频系统的所述麦克风中的输入信号执行第一滤波操作以产生第一滤波输入信号;以及
将所述第一滤波输入信号发送到所述源位置;
响应于所述比较结果指示所述音频信号的所述幅度大于阈值幅度:
对到所述音频系统的所述麦克风中的所述输入信号执行第二滤波操作以产生第二滤波输入信号,所述第二滤波输入信号与所述第一滤波输入信号不同;以及
将所述第二滤波输入信号发送到所述源位置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662356766P | 2016-06-30 | 2016-06-30 | |
US62/356,766 | 2016-06-30 | ||
PCT/US2017/040313 WO2018005979A1 (en) | 2016-06-30 | 2017-06-30 | Bi-magnitude processing framework for nonlinear echo cancellation in mobile devices |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108702424A CN108702424A (zh) | 2018-10-23 |
CN108702424B true CN108702424B (zh) | 2021-04-20 |
Family
ID=59325691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780012942.3A Active CN108702424B (zh) | 2016-06-30 | 2017-06-30 | 用于声学回声消除的方法、存储介质及电子设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10045137B2 (zh) |
EP (1) | EP3414889B1 (zh) |
JP (1) | JP6670014B2 (zh) |
KR (1) | KR102146816B1 (zh) |
CN (1) | CN108702424B (zh) |
WO (1) | WO2018005979A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7187183B2 (ja) * | 2018-06-14 | 2022-12-12 | 株式会社トランストロン | エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム |
CN113556652B (zh) * | 2020-04-24 | 2022-08-09 | 阿里巴巴集团控股有限公司 | 语音处理方法、装置、设备及系统 |
US11501791B1 (en) * | 2021-11-22 | 2022-11-15 | Hopin Ltd | Loopback audio channels for echo cancellation in web browsers |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000138618A (ja) * | 1998-10-30 | 2000-05-16 | Oki Electric Ind Co Ltd | 反響消去装置 |
JP2006128758A (ja) * | 2004-10-26 | 2006-05-18 | Matsushita Electric Ind Co Ltd | 適応フィルタおよびそれを用いた音響エコーキャンセラ装置並びにハンズフリー電話、および適応フィルタ方法およびそれを用いた音響エコーキャンセラ方法 |
CN1780167A (zh) * | 2004-11-24 | 2006-05-31 | 北京三星通信技术研究有限公司 | 快速收敛的回波消除装置 |
CN102118530A (zh) * | 2010-01-06 | 2011-07-06 | 杭州华三通信技术有限公司 | 一种回声消除的方法和装置 |
JP2013017192A (ja) * | 2012-08-15 | 2013-01-24 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去装置、反響消去方法、反響消去プログラム |
CN104969537A (zh) * | 2012-12-21 | 2015-10-07 | 微软技术许可有限责任公司 | 回声抑制 |
CN105391879A (zh) * | 2015-12-09 | 2016-03-09 | 天津大学 | 一种无回声残留双端通话鲁棒的声学回声消除方法 |
US9336767B1 (en) * | 2014-03-28 | 2016-05-10 | Amazon Technologies, Inc. | Detecting device proximities |
CN105794190A (zh) * | 2013-12-12 | 2016-07-20 | 皇家飞利浦有限公司 | 回声消除 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1827002A1 (en) * | 2006-02-22 | 2007-08-29 | Alcatel Lucent | Method of controlling an adaptation of a filter |
JP5394373B2 (ja) * | 2007-06-21 | 2014-01-22 | コーニンクレッカ フィリップス エヌ ヴェ | オーディオ信号を処理する装置及び方法 |
US7809129B2 (en) * | 2007-08-31 | 2010-10-05 | Motorola, Inc. | Acoustic echo cancellation based on noise environment |
US8433061B2 (en) * | 2007-12-10 | 2013-04-30 | Microsoft Corporation | Reducing echo |
US8204210B2 (en) * | 2010-02-09 | 2012-06-19 | Nxp B.V. | Method and system for nonlinear acoustic echo cancellation in hands-free telecommunication devices |
US9143862B2 (en) * | 2012-12-17 | 2015-09-22 | Microsoft Corporation | Correlation based filter adaptation |
CN203104592U (zh) * | 2012-12-20 | 2013-07-31 | 歌尔声学股份有限公司 | 一种用于小型免提语音通讯系统中的回声消除装置 |
KR102112018B1 (ko) * | 2013-11-08 | 2020-05-18 | 한국전자통신연구원 | 영상 회의 시스템에서의 음향 반향 제거 장치 및 방법 |
GB2515592B (en) * | 2013-12-23 | 2016-11-30 | Imagination Tech Ltd | Echo path change detector |
KR20150079237A (ko) * | 2013-12-31 | 2015-07-08 | 한국전자통신연구원 | 음향 반향 제거 장치 및 방법 |
GB2519392B (en) * | 2014-04-02 | 2016-02-24 | Imagination Tech Ltd | Auto-tuning of an acoustic echo canceller |
GB2525051B (en) * | 2014-09-30 | 2016-04-13 | Imagination Tech Ltd | Detection of acoustic echo cancellation |
US20160127827A1 (en) * | 2014-10-29 | 2016-05-05 | GM Global Technology Operations LLC | Systems and methods for selecting audio filtering schemes |
CN104980337B (zh) * | 2015-05-12 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 一种音频处理的性能提升方法及装置 |
US10123141B2 (en) * | 2015-11-13 | 2018-11-06 | Bose Corporation | Double-talk detection for acoustic echo cancellation |
US10225395B2 (en) * | 2015-12-09 | 2019-03-05 | Whatsapp Inc. | Techniques to dynamically engage echo cancellation |
-
2017
- 2017-06-30 CN CN201780012942.3A patent/CN108702424B/zh active Active
- 2017-06-30 WO PCT/US2017/040313 patent/WO2018005979A1/en active Application Filing
- 2017-06-30 JP JP2018548021A patent/JP6670014B2/ja active Active
- 2017-06-30 EP EP17739447.5A patent/EP3414889B1/en active Active
- 2017-06-30 US US15/639,263 patent/US10045137B2/en active Active
- 2017-06-30 KR KR1020187026759A patent/KR102146816B1/ko active IP Right Grant
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000138618A (ja) * | 1998-10-30 | 2000-05-16 | Oki Electric Ind Co Ltd | 反響消去装置 |
JP3457896B2 (ja) * | 1998-10-30 | 2003-10-20 | 沖電気工業株式会社 | 反響消去装置 |
JP2006128758A (ja) * | 2004-10-26 | 2006-05-18 | Matsushita Electric Ind Co Ltd | 適応フィルタおよびそれを用いた音響エコーキャンセラ装置並びにハンズフリー電話、および適応フィルタ方法およびそれを用いた音響エコーキャンセラ方法 |
CN1780167A (zh) * | 2004-11-24 | 2006-05-31 | 北京三星通信技术研究有限公司 | 快速收敛的回波消除装置 |
CN102118530A (zh) * | 2010-01-06 | 2011-07-06 | 杭州华三通信技术有限公司 | 一种回声消除的方法和装置 |
JP2013017192A (ja) * | 2012-08-15 | 2013-01-24 | Nippon Telegr & Teleph Corp <Ntt> | 反響消去装置、反響消去方法、反響消去プログラム |
CN104969537A (zh) * | 2012-12-21 | 2015-10-07 | 微软技术许可有限责任公司 | 回声抑制 |
CN105794190A (zh) * | 2013-12-12 | 2016-07-20 | 皇家飞利浦有限公司 | 回声消除 |
US9336767B1 (en) * | 2014-03-28 | 2016-05-10 | Amazon Technologies, Inc. | Detecting device proximities |
CN105391879A (zh) * | 2015-12-09 | 2016-03-09 | 天津大学 | 一种无回声残留双端通话鲁棒的声学回声消除方法 |
Non-Patent Citations (1)
Title |
---|
《语音系统中的子带自适应回声消除技术》;蔡宇,洪缨,原建平,侯朝焕,郝程鹏;《仪器仪表学报》;20130731;第34卷(第7期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
EP3414889B1 (en) | 2019-12-04 |
KR102146816B1 (ko) | 2020-08-21 |
US10045137B2 (en) | 2018-08-07 |
JP6670014B2 (ja) | 2020-03-18 |
CN108702424A (zh) | 2018-10-23 |
JP2019512947A (ja) | 2019-05-16 |
US20180007482A1 (en) | 2018-01-04 |
WO2018005979A1 (en) | 2018-01-04 |
EP3414889A1 (en) | 2018-12-19 |
KR20180113586A (ko) | 2018-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10861479B2 (en) | Echo cancellation for keyword spotting | |
US20150039751A1 (en) | Dynamic parallel coordinates visualization of network flows | |
CN108702424B (zh) | 用于声学回声消除的方法、存储介质及电子设备 | |
CN106165015B (zh) | 用于促进基于加水印的回声管理的装置和方法 | |
US10896664B1 (en) | Providing adversarial protection of speech in audio signals | |
JP6706633B2 (ja) | 通話音質改善のためのシステムおよび方法 | |
AU2015271580B2 (en) | Method for processing speech/audio signal and apparatus | |
US11164591B2 (en) | Speech enhancement method and apparatus | |
US20230395091A1 (en) | Neural-echo: an unified deep neural network model for acoustic echo cancellation and residual echo suppression | |
KR102258710B1 (ko) | 제스처로 활성화되는 원격 제어기 | |
US20150249884A1 (en) | Post-processed reference path for acoustic echo cancellation | |
TWI650706B (zh) | 電腦實施方法、系統及非暫時性電腦儲存媒體 | |
US10168988B2 (en) | Identifying user preferences and changing settings of a device based on natural language processing | |
US9508343B2 (en) | Voice focus enabled by predetermined triggers | |
CN111145776B (zh) | 音频处理方法和装置 | |
JP2023517071A (ja) | キーワードスポッティングのためのマルチルック強化モデリングおよびアプリケーション | |
CN109671444A (zh) | 一种语音处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |