CN109391811B - 运行时延敏感音频信号处理的系统上的抖动的测量和补偿的系统和方法 - Google Patents

运行时延敏感音频信号处理的系统上的抖动的测量和补偿的系统和方法 Download PDF

Info

Publication number
CN109391811B
CN109391811B CN201810896756.7A CN201810896756A CN109391811B CN 109391811 B CN109391811 B CN 109391811B CN 201810896756 A CN201810896756 A CN 201810896756A CN 109391811 B CN109391811 B CN 109391811B
Authority
CN
China
Prior art keywords
delay
playback
capture
audio path
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810896756.7A
Other languages
English (en)
Other versions
CN109391811A (zh
Inventor
马克·罗伯特·埃夫里
利昂娜·阿琳·诺伊费尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BlackBerry Ltd
Original Assignee
BlackBerry Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BlackBerry Ltd filed Critical BlackBerry Ltd
Publication of CN109391811A publication Critical patent/CN109391811A/zh
Application granted granted Critical
Publication of CN109391811B publication Critical patent/CN109391811B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • H04L43/087Jitter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17813Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the acoustic paths, e.g. estimating, calibrating or testing of transfer functions or cross-terms
    • G10K11/17817Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the acoustic paths, e.g. estimating, calibrating or testing of transfer functions or cross-terms between the output signals and the error signals, i.e. secondary path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1787General system configurations
    • G10K11/17879General system configurations using both a reference signal and an error signal
    • G10K11/17881General system configurations using both a reference signal and an error signal the reference signal being an acoustic signal, e.g. recorded with a microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/01Correction of time axis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/28Flow control; Congestion control in relation to timing considerations
    • H04L47/283Flow control; Congestion control in relation to timing considerations in response to processing delays, e.g. caused by jitter or round trip time [RTT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/002Applications of echo suppressors or cancellers in telephonic connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/26Arrangements for supervision, monitoring or testing with means for applying test signals or for measuring
    • H04M3/28Automatic routine testing ; Fault testing; Installation testing; Test methods, test equipment or test arrangements therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K2210/00Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
    • G10K2210/50Miscellaneous
    • G10K2210/504Calibration
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Environmental & Geological Engineering (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Stereophonic System (AREA)

Abstract

一种系统和方法,接收通过捕捉音频路径的一个或多个所捕捉信号,并且产生通过回放音频路径的一个或多个回放信号。该系统和方法执行一个或多个信号处理功能,并且在一个或多个信号处理功能的操作期间测量回放音频路径和捕捉音频路径内的延迟。该系统和方法将测量到的延迟存储在存储器中,并且针对一个或多个信号处理功能补偿回放延迟和捕捉延迟。

Description

运行时延敏感音频信号处理的系统上的抖动的测量和补偿的 系统和方法
技术领域
本公开涉及系统级架构,并且具体地,涉及测量和/或补偿时延。
背景技术
在实时信号处理系统中,存在与音频信号的捕捉和回放相关联的延迟。这些延迟可以是固定的,或者可以在每次系统运行时发生改变。如果变化量很小,系统不会受到影响。然而,当变化量变得显著时,“时延敏感”系统会受到影响。
附图说明
参考以下附图和描述以更好地理解本公开。附图中的元素不一定是按比例绘制的,而是将重点放在了说明本公开的原理上。此外,在附图中,类似的附图标记在全部不同视图中表示对应的部分。
图1是延迟测量和补偿系统的框图。
图2示出了在反馈通道上呈现的冲激(impulse)响应测试信号的测量到的延迟。
图3是用于测量回放和捕捉延迟的过程。
图4是用于测量回放和捕捉延迟的第二过程。
图5是具有延迟测量和补偿系统的载运工具。
具体实施方式
数字音频处理系统使用数字信号处理器、图形处理器、微处理器、现场可编程门阵列和其他处理器来接收和呈现音频内容。信息娱乐系统、放大器和移动电话常常处理音频内容。这些系统通过批处理(batch process)、实时处理或近实时处理来处理内容。实时操作系统可以在这些系统上运行,并且可以调度竞争系统计算资源的许多并行和非相关操作。
当处理由麦克风或传感器(其将诸如声音之类的物理刺激转换为电信号)捕捉的信号时,一些系统会经受处理延迟。类似地,当从扬声器呈现数字回放信号时发生处理延迟。例如,这些延迟可能是由模拟和数字信号转换、采样、滤波和传输转换(例如,通过无线介质,如蓝牙或以太网连接)引起的。它们也发生在不与公共时钟同步的系统中。一些过程执行非确定性算法,该非确定性算法在不同运行时间表现出不同的行为。由于许多原因,这些算法的执行方式不同,这些原因包括:响应非受控事件所需的时间的差异和不同的中断序列。在音频处理中,因缓冲器访问时间的差异、捕捉音频信号的差异、重复音频样本所消耗的处理时间的差异等而引起变化。
当捕捉延迟和回放延迟既不固定又不可知时,一些信号处理应用无法有效地运行。这些系统可能是时间敏感的,并且当操作条件意外地改变时可能容易出错。声学回声消除(AEC)、车载通信(ICC)系统、主动噪声控制(ANC)系统和反馈控制系统是时延敏感音频信号处理应用。关于从载运工具中的扬声器播放的下行链路语音信号与在麦克风处捕捉的回声之间的相对延迟,AEC可以作出假设。如果错误地假设该延迟,则回声路径冲激响应的估计模型可能无法正确地捕捉实际回声路径的开始(早期反射)或结束(回声拖尾)。AEC还将假设回声路径仅随时间缓慢改变。在这些情况中的任何一种情况下,如果错误地估计回放延迟或捕捉延迟,则可能导致回声泄漏,例如使得呼叫中的远端讲话者以一定延迟听到他们自己的语音。另一方面,如果AEC算法知道系统在处理样本(不包括声学延迟)时加上了某个回放延迟加捕捉延迟,则可以确定回声冲激响应的第一样本为零。换言之,AEC系统不需要估计第一样本,并且保留系统处理能力。此后,可以使用足够长的固定回声拖尾长度来估计冲激响应的剩余样本,该长度足以覆盖载运工具舱室的已知声学混响时间,从而允许AEC完全消除回声。备选地,如果回放延迟或捕捉延迟实时改变并且其改变的量是已知的,则AEC可以调整其回声路径冲激响应的内部估计并保持一致的回声消除性能。估计该系统中的回声路径的一些自适应滤波算法包括归一化最小均方(NLMS)过程、递归最小均方(RLS)过程和仿射投影。当时延已知时,无论该时延是在启动时测量的还是连续地测量的,AEC系统都能以更高的质量、每秒更少的指令来更有效地执行。
另一种时延敏感的音频信号处理应用是ICC系统,其中在前麦克风处拾取驾驶员的语音,经处理以形成强化信号,并且通过载运工具中的后扬声器播放(从前到后强化)以使后面的乘客更清楚地听到驾驶员说话。由于反馈路径从后扬声器到前麦克风而存在,因此通常需要反馈消除器以防止啸叫或反馈的非受控累积。与AEC类似,反馈消除器可以将反馈路径建模为冲激响应(例如,时间序列或单独地在子带内),并且得益于已知实际的系统延迟。例如,已知的系统延迟可以帮助反馈消除算法区分麦克风处的反馈分量与从驾驶员到麦克风的直接声学路径,因此有效地执行反馈消除而不降低强化信号的语音质量。
另一种时延敏感的音频信号处理应用通过添加另一信号来减少不需要的声音,该音频信号处理应用也称为ANC。ANC依靠精确的定时来主动消除或抑制不需要的声音。在ANC中,二次路径是给定扬声器和麦克风之间的传递函数,例如,表示为冲激响应或频率响应。二次路径延迟是从ANC应用发送的输出信号在输入到ANC应用的麦克风处可被检测到所需的时间。二次路径延迟是捕捉延迟、回放延迟和声学延迟(例如,当信号从扬声器传播到麦克风时发生的声学延迟)的总和,这些延迟可以发生在诸如载运工具舱室之类的壳体内。校准是对从所有扬声器到所有麦克风的二次路径进行测量的过程,并且通常在系统正常操作之前的调谐阶段执行。许多ANC系统仅在其当前操作环境与其校准环境类似时才有效地运行。诸如FxLMS(滤波-x最小均方)和归一化FxLMS之类的ANC算法对抖动具有有限的容限。例如,如果在以给定频率进行校准时二次路径的相位相对于其值的变化超过大约45度,则ANC系统可能变得不稳定并且可能增加载运工具舱室中的噪声水平。在100Hz(周期T=10ms),45度相当于(45/360)×10ms=1.25ms的延迟。
为了测量时延,本公开的系统测量实时系统上的回放延迟和捕捉延迟。在音频捕捉事件期间,通过捕捉路径以块或片段的形式移动数据。传送的定时取决于启动捕捉事件的中断。类似地,由回放事件产生的中断来控制通过回放音频路径进行的数据块移动。同步时钟的使用保证了在给定时间段内捕捉的音频样本的数量等于在同一时间段内回放的音频样本的数量,但不保证捕捉块中断与回放块中断之间的对准。将音频提供给捕捉硬件和回放硬件的组件、存储延迟、有效负载差异等可能会导致变化。对捕捉中断和回放中断之间的时间差进行测量的一种方法依赖于称为同步点的同步时间。当捕捉事件和回放事件两者的启动序列完成时,会发生同步点。当建立同步点时,变化测量计算共同样本经历捕捉事件的位置相对于相同共同样本经历回放事件的位置,以确定定时的差。该测量可以导致对捕捉音频路径和回放音频路径中的音频缓冲器和/或音频样本的数量进行计数。
捕捉过程中的同步样本位置测量硬件和声学处理算法输入之间的中间过程块以及捕捉硬件内的数据块的粒度位置(granular position)。因此,针对捕捉应用的同步样本位置可以在I/O缓冲、ADC、解码、数据复制、采样率转换、滤波和其他数据传输中的一些或所有中考虑过程块的位置。类似地,针对回放应用,同步样本位置包括硬件和声学处理算法输出之间的中间过程块以及回放硬件内的数据块的粒度位置。针对回放应用的同步样本位置可以在IO缓冲、DAC、编码、数据复制、采样率转换、滤波和其他数据传输中的一些或所有中考虑过程块的位置。针对捕捉应用和回放应用两者,如果硬件和声学处理算法之间的任何中间过程块的样本长度是确定性的(例如,意味着它们在启动序列之间不变),则不需要在备选系统中的捕捉应用和回放应用两者中对那些中间过程块进行测量。在这些备选系统中,仅测量样本长度非确定性的数据块的位置,这是因为确定性过程块不随时间变化。确定性过程块针对每个启动序列产生相同的测量结果。
为了确保在启动序列之后保持回放事件和捕捉之间的时延,可以在每个捕捉中断和每个回放中断的同步点处测量完整块的数量(不是这些块内的粒度位置)。如果在同步点之间处理的完整数据块的数量改变,则可以将数据块或其部分添加到或舍弃捕捉音频路径以保持对准并补偿时延的变化。在一些信号处理应用中,应用可以向信号处理应用的二次冲激响应加上或减去分数延迟。
用于测量时延敏感系统(例如,AEC、ICC、反馈控制和ANC)上的回放延迟和捕捉延迟(例如,求和)的备选系统利用反馈通道,该反馈通道同步地通过捕捉音频路径和回放音频路径的一些或所有组件。这些系统通过反馈通道产生并播放已知的测试信号,测量所捕捉的输入通道处的响应,并计算两者之间的延迟。例如,在图1中,ANC系统在实时操作系统内运行;它被配置有单麦克风输入102和单扬声器输出通道104。在该系统中,实时操作系统(RTOS)106、直接存储器存取(DMA)110、数模转换设备(DAC)112和模数转换(ADC)设备114是潜在的抖动源。在备选系统中也监测其他抖动源。在图1中,反馈通道116将输入和输出连接到延迟测量模块118,该延迟测量模块118可以是ANC应用的单独部分或集成部分。反馈通道同步地通过RTOS输出缓冲器108、DMA 110、DAC 112、ADC 114、DMA 110和RTOS输入缓冲器120。反馈信号不通过物理换能器,因此在诸如载运工具舱室之类的壳体内不可听见,然而它通过引入抖动的系统的一些或所有组件。在每个阶段,与其他音频通道同步地处理反馈信号,以确保反馈信号延迟相同的量。当在反馈通道上播放测试信号(例如,冲激信号、正弦扫频信号或随机噪声信号)时,在运行期间连续地和/或在启动时测量反馈路径的延迟。
在操作中,如图2所示,在反馈通道上播放冲激,并且在18ms相对点处,在延迟模块118的输入处捕捉到冲激。通过测量两个波形的最大值之间的延迟、测量与两个信号的互相关的最大值相对应的滞后、或者通过其他过程,延迟模块118测量时延。
为了补偿抖动,延迟测量模块(例如,图1中所示的延迟测量模块118)测量样本中dcalib的回放加捕捉延迟。延迟模块118通知信号处理应用(例如,ANC、AEC、ICC、反馈消除)当前延迟是什么,和/或计算当前延迟与所存储的在某个参考时间点测量的延迟之间的差。样本中的dcalib可以与校准数据一起存储在存储器中。在图1的ANC系统中,校准数据包括从每个扬声器到每个麦克风的冲激响应测量结果或相关的测量结果,例如对从扬声器到麦克风的传递函数的频域表示。
在等式1中,IRcalib_kj[n]是样本“n”中作为时间的函数从扬声器k到麦克风j的校准时测量的冲激响应。在稍后阶段,例如在启动之后和/或在运行期间,延迟测量模块118将不同的测量到的延迟“d”传递给ANC应用122。这里,IR_kj[n]是适应ANC控制滤波器的ANC算法处理的冲激响应。在ANC算法(例如,滤波-x最小均方算法)中,通过冲激响应对参考信号(例如,从RPM驱除发动机级次的正弦音调)进行滤波以呈现经滤波的x项(“Fx”项)。可以通过等式1计算IR_kj[n]。
IR_kj[n]=IRcalib_kj[n+(dcalib-d)] 等式1
如果二次路径传递函数备选地存储在频域中,则Hcalib_kj[f]将表示在校准时测量的某个频率“f”(以Hz为单位)下测量的从扬声器“k”到麦克风“j”的复频率响应,并且“fs”是采样率。在运行时计算的相应频率响应(H_kj[f])可以用等式2表示:
H_kj[f]=Hcalib_kj[f]exp(i 2 pi(dcalib-d)f/fs) 等式2
在一些系统中,ANC以比调用它的主机应用更低的采样率(fsANC)运行。主机应用可能正在运行媒体回放、语音处理等。如果在“fs”下测量回放/捕捉延迟“d”,但将该延迟应用于以较低采样率fsANC存储的ANC中的冲激响应,则可以应用冲激响应的分数采样延迟。在这种系统中,可以通过内插滤波器来实现时间序列的分数延迟。
在操作中,过程可以测量实时系统上的回放延迟和捕捉延迟,如图3和图4所示。在图3中,对捕捉块中断和回放块中断之间的时间差进行测量涉及在302处,首先确定在启动时何时捕捉事件和回放事件完成。然后在304处建立同步点。在306处,过程监测在启动序列之间不变的硬件和声学处理算法之间的任何中间过程块的样本长度。这些中间过程块可以被排除在计算之外,并且仅将随时间变化的块的位置用于启动序列时间差的计算中。在308处,该过程计算当前相对于当前在该同步点处播放的块中的样本位置所捕捉的块中的确切样本位置,以测量如上所述的时延或抖动。在310处,该过程通知一个或多个信号处理应用(例如,ANC、AEC、ICC、反馈消除)当前延迟是什么,或者备选地计算当前延迟与所存储的在某个参考时间测量的延迟之间的差。在可选步骤312处,在一些应用中,响应于当前延迟,调整对从扬声器到麦克风的二次路径的估计,在一些应用中,响应于当前延迟,应用二次路径冲激响应的整数或分数采样延迟,在一些应用中,当前延迟建立回声路径中的初始延迟。在其他信号处理应用中,在312处,数据块被舍弃或加到捕捉音频路径中以补偿时延,或者调整二次路径的相位响应。
图4是可以测量实时系统上的回放延迟和捕捉延迟的备选过程。在图4中,在402处建立反馈通道,该反馈通道将输入和输出连接到延迟测量过程,该延迟测量过程可以是一个或多个信号处理应用(例如,ANC、AEC、ICC、反馈消除)的一部分或单独的软件模块。在404处,产生测试信号(例如,冲激信号、正弦扫频信号或随机噪声信号),该测试信号与呈现声音的其他音频通道同步地进行处理。反馈信号同步地通过捕捉路径和反馈路径的一些或所有组件,但不通过物理换能器。通过该结构,测试信号在诸如载运工具舱室之类的壳体内是不可听见的;然而,它通过了引入抖动的被测试音频路径的所有组件。在406处,发送信号,并且在408处,通过如上所述的过程计算延迟。在310处,该过程通知一个或多个信号处理应用(例如,ANC、AEC、ICC、反馈消除)当前延迟是什么,或者备选地计算当前延迟与所存储的在某个参考时间测量的延迟之间的差。在可选步骤312处,如上所述进行补偿。
图5是测量和补偿抖动的载运工具的框图。该系统包括处理器502、非暂时性介质(例如,存储器)504(其内容可由处理器502访问)和输入/输出(I/O)接口506。I/O接口506连接设备和本地和/或远程应用,例如附加麦克风、音频换能器或扬声器,以及一个或多个信号处理应用(例如,ANC、AEC、ICC、反馈消除)。存储器504可以存储指令,当由处理器502执行时,所述指令使系统呈现与测量和/或补偿抖动相关联的一些或所有功能。例如,存储器504可以存储指令,当由处理器502执行时,所述指令使系统呈现与测量或计算ANC、AEC、ICC、反馈消除等的抖动510和补偿512该抖动相关联的功能。
处理器502可以包括单个处理器或多个处理器,该多个处理器可以被布置在单个芯片上、布置在多个设备上或分布在一个以上的系统上。处理器502可以是执行体现在存储器504或其它存储器中的计算机可执行指令或计算机代码以执行本文描述的系统的一个或多个特征的硬件。处理器502可以包括中央处理单元(CPU)、图形处理单元(GPU)、专用集成电路(ASIC)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、数字电路、模拟电路、微控制器、任何其它类型的处理器或其任何组合。
所公开的存储器504和/或存储装置可以保留用于实现上述功能的可执行指令的有序列表。机器可读介质可以选择性地但不限于是电子、磁性、光学、电磁、红外或半导体介质。机器可读介质的示例的非穷尽列表包括:便携式磁盘或光盘、易失性存储器、诸如随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)或数据库管理系统。存储器504可以包括单个设备或多个设备,该多个设备可以布置在一个或多个专用存储器设备或者处理器或其他类似设备上。当功能或步骤被称为“响应性地”或“响应于”功能或过程而发生时,设备功能或步骤必然作为功能或消息的结果而发生。功能或动作仅仅跟随或发生在另一个之后是不充分的。此外,当功能指示发生自动回声消除时,通过从所发送或接收到的信号中减去所估计的回声来消除回声。
存储器504还可以存储可由处理器502执行的非暂时性计算机代码。计算机代码可以用诸如C、C++、汇编语言、通道程序代码之类的任何计算机语言和/或计算机语言的任何组合来编写。存储器504可以将信息存储在数据结构中,例如包括多频带压缩器/限制器可调参数,其包括一个或多个交叉频率、幅度阈值、压缩率、时间常数、起音和释放时间、预测参数等。
也可以响应于存储在非暂时性计算机可读介质中或之上的一个或多个逻辑集或指令集来执行附图中示出或所描述的功能、动作或任务。功能、动作或任务独立于特定类型的指令集、存储介质、处理器或处理策略,并且可以由单独或组合操作的软件、硬件、集成电路、固件、微代码等来执行。在一个实施例中,指令存储在可移除介质设备上以供本地或远程系统读取。在其他实施例中,逻辑或指令存储在远程位置以便通过计算机网络或通过无线或有形电话或通信线传送。在其他实施例中,逻辑或指令可以存储在给定的计算机内,例如CPU。
系统和过程强化并增强音频信号处理。系统自动测量实时操作系统中的抖动,并补偿一个或多个音频信号处理应用内的延迟,以保持质量。该系统可以在载运工具系统(例如,信息娱乐处理器和数字信号处理器或DSP)中实现,并与其他系统软件共存和通信。载运工具可以包括但不限于汽车、公共汽车、卡车、拖拉机、摩托车、自行车、三轮车、四轮车或其他轮车、大船、潜艇、小船或其他船舶、直升机、无人机、飞机或其他飞行器、火车、电车或其他有轨载运工具、太空飞船或其他航天器,以及任何其他类型的载运工具,无论是当前存在还是在本公开之后出现。换言之,它包括用于运送人或物的设备或结构。该系统容易并快速地适应不同的载运工具和舱室类型以及不同的声学环境配置。
在仔细阅读附图和详细描述后,其他系统、方法、特征和优点对于本领域技术人员将是或将变得显而易见。旨在所有这样的附加系统、方法、特征和优点被包括在本描述中,被包括在本公开的范围中,并且由所附权利要求来保护。

Claims (19)

1.一种用于实时音频信号处理的系统,所述系统接收通过捕捉音频路径的一个或多个所捕捉信号,并产生通过回放音频路径的一个或多个回放信号,并执行一个或多个信号处理功能,所述系统包括:
处理器,被配置为在所述一个或多个信号处理功能的操作期间测量与所述回放音频路径的延迟相对应的回放延迟和与所述捕捉音频路径的延迟相对应的捕捉延迟,其中,测量所述回放延迟和所述捕捉延迟包括对播放和通过反馈通道接收的测试信号的延迟进行测量,其中,所述反馈通道通过所述回放音频路径和所述捕捉音频路径的组件;以及
存储器,用于存储测量到的延迟;
其中,所述处理器还被配置为针对所述一个或多个信号处理功能补偿回放延迟和捕捉延迟。
2.根据权利要求1所述的系统,其中,当所述处理器首次启动时测量所述回放延迟和所述捕捉延迟。
3.根据权利要求2所述的系统,其中,在所述一个或多个信号处理功能的操作期间连续地测量所述回放延迟和所述捕捉延迟。
4.根据权利要求1所述的系统,其中,对所述回放延迟和所述捕捉延迟的测量能够确定同步时间、回放事件和捕捉事件的启动何时完成。
5.根据权利要求1所述的系统,其中,所述处理器还被配置为将测量到的回放延迟和捕捉延迟与存储在存储器中的回放延迟和捕捉延迟的先前测量结果进行比较。
6.根据权利要求5所述的系统,其中,所述处理器被配置为:当所述测量到的回放延迟和捕捉延迟相对于先前测量结果发生改变时,修改所述一个或多个信号处理功能。
7.根据权利要求5所述的系统,其中,通过将样本舍弃或添加到所述捕捉音频路径和/或所述回放音频路径,所比较的测量结果之间的时间差调整所述捕捉音频路径和/或所述回放音频路径的延迟。
8.根据权利要求1所述的系统,其中,对所述回放延迟和所述捕捉延迟的测量包括对所述捕捉音频路径和所述回放音频路径中的音频样本和/或音频缓冲器的数量进行计数。
9.根据权利要求1所述的系统,其中,所述一个或多个信号处理功能包括主动噪声控制。
10.根据权利要求9所述的系统,其中,所述回放延迟和所述捕捉延迟调整对从扬声器到麦克风的二次路径的离线估计。
11.根据权利要求10所述的系统,其中,调整所述二次路径的估计包括二次路径冲激响应的整数或分数采样延迟。
12.根据权利要求10所述的系统,其中,调整所述二次路径的估计包括修改所述二次路径的相位响应。
13.根据权利要求1所述的系统,其中,所述一个或多个信号处理功能包括回声消除和反馈消除。
14.根据权利要求13所述的系统,其中,响应于测量到的回放延迟和捕捉延迟,调整所估计的回声路径。
15.根据权利要求1所述的系统,其中,所述系统包括载运工具。
16.一种方法,用于接收通过捕捉音频路径的一个或多个所捕捉信号,并产生通过回放音频路径的一个或多个回放信号,并执行一个或多个信号处理功能,所述方法包括:
在所述一个或多个信号处理功能的操作期间,测量与所述回放音频路径的延迟相对应的回放延迟和与所述捕捉音频路径的延迟相对应的捕捉延迟,其中,测量所述回放延迟和所述捕捉延迟包括对播放和通过反馈通道接收的测试信号的延迟进行测量,其中,所述反馈通道通过所述回放音频路径和所述捕捉音频路径的组件;
将测量到的延迟存储在存储器中;以及
针对所述一个或多个信号处理功能补偿回放延迟和捕捉延迟。
17.根据权利要求16所述的方法,其中,在首次启动时测量所述回放延迟和所述捕捉延迟。
18.根据权利要求16所述的方法,其中,在所述一个或多个信号处理功能的操作期间连续地测量所述回放延迟和所述捕捉延迟。
19.一种编码有机器可执行指令的非暂时性机器可读介质,所述机器可执行指令用于接收通过捕捉音频路径的一个或多个所捕捉信号,并产生通过回放音频路径的一个或多个回放信号,其中,对所述机器可执行指令的执行用于:
在一个或多个信号处理功能的操作期间,测量与回放音频路径的延迟相对应的回放延迟和与捕捉音频路径的延迟相对应的捕捉延迟,其中,测量所述回放延迟和所述捕捉延迟包括对播放和通过反馈通道接收的测试信号的延迟进行测量,其中,所述反馈通道通过所述回放音频路径和所述捕捉音频路径的组件;
将测量到的延迟存储在存储器中;以及
针对所述一个或多个信号处理功能补偿回放延迟和捕捉延迟。
CN201810896756.7A 2017-08-11 2018-08-08 运行时延敏感音频信号处理的系统上的抖动的测量和补偿的系统和方法 Active CN109391811B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/675,359 US10313218B2 (en) 2017-08-11 2017-08-11 Measuring and compensating for jitter on systems running latency-sensitive audio signal processing
US15/675,359 2017-08-11

Publications (2)

Publication Number Publication Date
CN109391811A CN109391811A (zh) 2019-02-26
CN109391811B true CN109391811B (zh) 2022-03-01

Family

ID=63452354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810896756.7A Active CN109391811B (zh) 2017-08-11 2018-08-08 运行时延敏感音频信号处理的系统上的抖动的测量和补偿的系统和方法

Country Status (4)

Country Link
US (1) US10313218B2 (zh)
EP (1) EP3441968B1 (zh)
CN (1) CN109391811B (zh)
CA (1) CA3012774A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113539289A (zh) * 2020-04-14 2021-10-22 阿里巴巴集团控股有限公司 音频信号的处理方法、装置及设备
CN112489679B (zh) * 2020-11-20 2023-08-08 广州华多网络科技有限公司 声学回声消除算法的评估方法、装置及终端设备
CN112489680B (zh) * 2020-11-20 2023-08-08 广州华多网络科技有限公司 声学回声消除算法的评估方法、装置及终端设备
CN113409808B (zh) * 2021-06-18 2024-05-03 上海盈方微电子有限公司 一种回声消除时延估算方法及回声消除方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103905128A (zh) * 2012-12-27 2014-07-02 英特尔移动通信有限责任公司 具有绝对延迟量和方向估计的信号延迟估计器
CN105450882A (zh) * 2015-11-13 2016-03-30 公安部第三研究所 一种音频转换特性测试方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7281053B2 (en) 2000-10-13 2007-10-09 Aol Llc Method and system for dynamic latency management and drift correction
US7162418B2 (en) 2001-11-15 2007-01-09 Microsoft Corporation Presentation-quality buffering process for real-time audio
US9113240B2 (en) 2008-03-18 2015-08-18 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
KR101853818B1 (ko) * 2011-07-29 2018-06-15 삼성전자주식회사 오디오 신호 처리 방법 및 그에 따른 오디오 신호 처리 장치
US9275625B2 (en) 2013-03-06 2016-03-01 Qualcomm Incorporated Content based noise suppression
US9246545B1 (en) 2014-04-11 2016-01-26 Amazon Technologies, Inc. Adaptive estimation of delay in audio systems
US10013229B2 (en) * 2015-04-30 2018-07-03 Intel Corporation Signal synchronization and latency jitter compensation for audio transmission systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103905128A (zh) * 2012-12-27 2014-07-02 英特尔移动通信有限责任公司 具有绝对延迟量和方向估计的信号延迟估计器
CN105450882A (zh) * 2015-11-13 2016-03-30 公安部第三研究所 一种音频转换特性测试方法

Also Published As

Publication number Publication date
CA3012774A1 (en) 2019-02-11
EP3441968B1 (en) 2021-10-06
US10313218B2 (en) 2019-06-04
US20190052555A1 (en) 2019-02-14
EP3441968A1 (en) 2019-02-13
CN109391811A (zh) 2019-02-26

Similar Documents

Publication Publication Date Title
CN109391811B (zh) 运行时延敏感音频信号处理的系统上的抖动的测量和补偿的系统和方法
JP5496418B2 (ja) 適応等化器、音響エコーキャンセラ装置および能動騒音制御装置
US9591123B2 (en) Echo cancellation
EP2235928B1 (en) A method and system for clock drift compensation
EP2982101B1 (en) Noise reduction
KR102111185B1 (ko) 에코 제거
KR102194165B1 (ko) 에코 제거기
JPWO2009028349A1 (ja) 特定信号消去方法、特定信号消去装置、適応フィルタ係数更新方法、適応フィルタ係数更新装置及びコンピュータプログラム
US10009477B2 (en) Pure delay estimation
GB2515593A (en) Acoustic echo suppression
KR102190833B1 (ko) 에코 억제
CN102047689A (zh) 音响回波消除器和音响回波消除方法
JP2011166484A (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置、多チャネルエコー消去プログラム及びその記録媒体
JP2013507804A (ja) 時間領域・周波数領域統合反響消去装置及び方法
JP5469564B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置及びそのプログラム
KR20150096423A (ko) 에코 억제 기법
CN111312268B (zh) 声学回声消除装置和声学回声消除方法以及记录介质
JP6180689B1 (ja) エコーキャンセラ装置、エコー消去方法、及びエコー消去プログラム
JP6369192B2 (ja) エコー抑圧装置、エコー抑圧プログラム、エコー抑圧方法及び通信端末
JP2015201787A (ja) エコー消去装置、その方法及びプログラム
US11967304B2 (en) Sound pick-up device, sound pick-up method and non-transitory computer-readable recording medium recording sound pick-up program

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20200525

Address after: Voight, Ontario, Canada

Applicant after: BlackBerry Ltd.

Address before: Rika Univ.

Applicant before: 2236008 Ontario Inc.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant