CN111462771A - 一种啸叫处理方法 - Google Patents

一种啸叫处理方法 Download PDF

Info

Publication number
CN111462771A
CN111462771A CN202010257871.7A CN202010257871A CN111462771A CN 111462771 A CN111462771 A CN 111462771A CN 202010257871 A CN202010257871 A CN 202010257871A CN 111462771 A CN111462771 A CN 111462771A
Authority
CN
China
Prior art keywords
signal
frequency domain
echo
original
howling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010257871.7A
Other languages
English (en)
Other versions
CN111462771B (zh
Inventor
夏翔
钱晓炯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Juphoon Corp
Original Assignee
Juphoon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Juphoon Corp filed Critical Juphoon Corp
Priority to CN202010257871.7A priority Critical patent/CN111462771B/zh
Publication of CN111462771A publication Critical patent/CN111462771A/zh
Application granted granted Critical
Publication of CN111462771B publication Critical patent/CN111462771B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17813Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the acoustic paths, e.g. estimating, calibrating or testing of transfer functions or cross-terms
    • G10K11/17819Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the acoustic paths, e.g. estimating, calibrating or testing of transfer functions or cross-terms between the output signals and the reference signals, e.g. to prevent howling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明涉及一种啸叫处理方法,其特征在于包括如下步骤:步骤1、分别将采集的原始近端信号和参考他端信号进行交叠分段、加窗和快速傅里叶变换转换为频域信号,从而得到原始近端频域信号和参考他端频域信号;步骤2、找出原始频域信号共振峰频率序列数组和参考频域信号共振峰频率序列数组;步骤3、计算近端回声延时D1;步骤4、计算他端回声延时D2;步骤5、利用回声消除模块,避免啸叫产生。与现有技术相比,本发明在多音频设备共同使用的场景下,及时发现可能形成啸叫的声学回路,实现啸叫的预测,通过复用回声消除模块算法,以极少的计算量实现了回路音频的消除,避免了啸叫的产生。

Description

一种啸叫处理方法
技术领域
本发明涉及一种啸叫处理方法。
背景技术
啸叫是音频通信系统中声学反馈效应导致的一种极端现象,会对音频通信系统的用户体验造成极大的损害。为了减轻啸叫造成的负面影响,传统上,一方面使用回声消除技术尽量消除声学反馈,另一方面通常还会引入啸叫检测的方法,当检测到有啸叫产生时,及时采取静默、增益衰减等方式进行处理。
传统的啸叫处理机制主要是对音频通信系统中单端音频设备进行的。单端音频设备的声学反馈效应存在于设备的麦克风采集到设备自身扬声器形成的声学回路中。
然而,在远程会议等应用场景中,存在更复杂的情况。同一室内环境中,可能会有多个参与通信的音频设备同时开启。此时,设备的麦克风采集到的信号中不仅与该设备自身扬声器的输出相关,也和其他邻近音频设备扬声器的输出相关,而这些输出往往又来自该设备麦克风采集的历史信号。
在音频通信系统中,传统的回声消除方法是在单端设备的他端信号与近端信号之间寻找关联,确定时延,再利用自适应滤波器等方法在近端信号中消除他端历史信号产生的回声。然而,在上述复杂场景下,近端信号中不仅包含了他端历史信号,也包含了近端自身的历史信号。因此,传统回声消除方法无法消除上述邻近设备扬声器造成的回声,依然会产生啸叫信号。
如果不对近端自身的历史信号进行消除,而直接依赖于传统的啸叫检测与抑制方法,室内环境多音频通信设备的场景下将会频繁触发啸叫的检测与抑制,从而导致扬声器播放的声音出现断续,语音通信无法正常进行。
发明内容
本发明所要解决的技术问题是针对上述现有技术提供一种能以较少的计算量实现了回路音频的消除、进而避免啸叫产生的啸叫处理方法。
本发明解决上述技术问题所采用的技术方案为:一种啸叫处理方法,其特征在于包括如下步骤:
步骤1、分别将采集的原始近端信号和参考他端信号进行交叠分段、加窗和快速傅里叶变换转换为频域信号,从而得到原始近端频域信号和参考他端频域信号;将采集的原始近端信号标记为Sk,将采集的参考他端信号标记为Fk,将得到的原始频域信号标记为Sf,其中f代表不同频率,Sf为频率为f时原始近端信号的能量和相位,是一个复数,将得到的参考频域信号标记为Cf,Cf频率为f时参考他端信号的能量和相位;具体转换过程为:
1-1、分别对采集的原始近端信号和参考他端信号进行交叠分段处理,每一分段时间为t1,交叠时间为t2,t2小于t1大于零;
1-2、分别对交叠分段处理后的分段原始近端信号和分段参考他端信号分别进行加窗处理,去除分段造成的谱泄露;
1-3、分别对加窗处理后的分段原始近端信号和分段参考他端信号进行快速傅里叶变换转换,得到由多个分段原始频域信号组成的一组原始频域信号和多个分段参考频域信号组成的一组参考频域信号;
步骤2、找出所有分段的原始频域信号中能量最高的n个峰值所对应的频率值,n为大于等于2的自然数,并将这些频率值按照分段的先后顺序依次记录下来形成一个原始频域信号共振峰频率序列数组,记为fs;相同方法,找出时间单元T内、所有分段的参考频域信号中能量最高的至少两个峰值所对应的频率值,并将这些频率值按照分段的先后顺序依次记录下来形成一个参考频域信号共振峰频率序列数组,记为fC
步骤3、基于特征比对,计算近端回声延时D1,具体方法为:
从原始频域信号共振峰频率序列数组fs的当前位置提取出时长为T的数据,记分段的步长为step,那么共有
Figure BDA0002438102190000021
组数据;而对于fc,以当前位置为基准向前移动d毫秒后提取时长为T的数据,同样有L组数据;对两个集合的数据按对应位置比较,记录相同数据的个数,得到matchd;对于不同的d,就可以得到不同的matchd值,取matchd值最大时对应的d值即为当前要查找的近端回声延时D1
步骤4、基于特征比对,计算他端回声延时D2,具体方法为:
从原始频域信号共振峰频率序列数组fs的当前位置提取出时长为T的数据,记分段时步长为step,那么共有
Figure BDA0002438102190000022
组数据;
对于原始频域信号共振峰频率序列数组fs,以当前为基准,向前移动t毫秒后再从fs中提取时长为T的数据,同样得到L组数据;
对两个集合的数据按对应位置比较,记录相同数据的个数,得到matcht;对于不同的t,就可以得到不同的matcht,取matcht的最大值;
当matcht的最大值大于等于预设值时,才认为fs序列中存在显著的延时特性,后续有产生啸叫的可能,此时将matcht的最大值对应的t值作为当前要查找的他端回声延时D2;如果matcht的最大值小于预设值,将D2的值输出为0;
步骤5、利用回声消除模块,避免啸叫产生,具体方法为:
将采集的参考他端信号Fk的历史信号保存一个数组中,将回声消除模块处理后的近端历史信号保存在另一个数组中,记为S′k
如果采集的原始近端信号为S0,利用步骤3得到的近端回声延时D1,在Fk中找到与近端回声延时D1对应的信号,记为近端回声源信号
Figure BDA0002438102190000031
当他端回声延时D2的值不等于0时,在S′k中找到与他端回声延时D2对应的信号,记为他端回声源信号
Figure BDA0002438102190000032
然后将原始近端信号为S0作为回声消除模块的输入信号,将近端回声源
Figure BDA0002438102190000033
和其他端回声源
Figure BDA0002438102190000034
直接相加,作为回声消除模块的输入参考信号,实现音频回路回声信号的消除,避免啸叫的产生;
当他端回声延时D2的值等于0时,将原始近端信号为S0作为回声消除模块的输入信号,将近端回声源
Figure BDA0002438102190000035
作为回声消除模块的输入参考信号,实现音频回路回声信号的消除,避免啸叫的产生。
再改进,所述步骤3中,至少连续计算近端回声延时D1连续3次,且每次计算的近端回声延时D1均相同,则将这三次计算得到的近端回声延时D1作为最终输出值。
与现有技术相比,本发明的优点在于:本发明基于音频通信设备近端信号的分析,实现对声学回路的高效率高精度的搜索,在多音频设备共同使用的场景下,及时发现可能形成啸叫的声学回路,实现啸叫的预测,通过复用回声消除模块算法,以极少的计算量实现了回路音频的消除,避免了啸叫的产生,显著提升了该应用场景下的用户体验。
附图说明
图1为本发明实施例中啸叫处理方法流程图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本发明提供的啸叫处理方法,包括如下步骤:
步骤1、分别将采集的原始近端信号和参考他端信号进行交叠分段、加窗和快速傅里叶变换转换为频域信号,从而得到原始近端频域信号和参考他端频域信号;将采集的原始近端信号标记为Sk,k=0,1,2,3…,由于在采集原始近端信号和参考他端信号时,是根据固定时间间隔来进行采集的,如每毫秒采集一次数据,如果当前时刻采集的原始近端信号数据用S0表示,那么距离当前时刻1毫秒之前采集的原始近端信号数据用S1表示,距离当前时刻2毫秒之前采集的原始近端信号数据用S2表示,距离当前时刻3毫秒之前采集的原始近端信号数据用S3表示……;同理,将采集的参考他端信号标记为Fk,k=0,1,2,3…,将得到的原始频域信号标记为Sf,其中f代表不同频率,Sf为频率为f时原始近端信号的能量和相位,是一个复数,将得到的参考频域信号标记为Cf,Cf频率为f时参考他端信号的能量和相位;具体转换过程为:
1-1、分别对采集的原始近端信号和参考他端信号进行交叠分段处理,每一分段时间为t1,交叠时间为t2,t2小于t1大于零;
交叠分段处理的处理方式为常规技术;分段的大小影响时间分辨率和频域分辨率,分段越小时间分辨率越高,但频域分辨率越低,无论声音信号的采样率是多大(一般的为8Khz~48KHz),我们选取t1为10ms~20ms中的任意一个数值作为一个分段的大小,因为人声的基频一般是100Hz~400Hz,10ms刚好可以表达一个最低的基频周期,因此不宜再小;而自然声音是时变的,我们只能假设在短时间内按时不变的方法进行频域分析,因此最大不要超过20ms,即可保证两种分辨率的平衡,以下假定每段时间长度为t1为10ms,按照常规的做法,我们对每个分段至少保证50%的交叠,本实施例,将t2定为5ms,即每次向前移动5ms,那么,第一分段的数据为0~10ms的数据,第二分段的数据为5ms~15ms的数据,第三分段的数据为15m~25ms的数据,第四分段的数据为20ms~30ms的数据……,即后一分段数据和前一分段的数据会有t2时间的交叠部分;
1-2、分别对交叠分段处理后的分段原始近端信号和分段参考他端信号分别进行加窗处理,去除分段造成的谱泄露;对信号进行加窗处理也为常规技术,可以采用Hamming窗或其他矩形窗,本方案中,采用Hamming窗效果较好;
1-3、分别对加窗处理后的分段原始近端信号和分段参考他端信号进行快速傅里叶变换转换,得到由多个分段原始频域信号组成的一组原始频域信号和多个分段参考频域信号组成的一组参考频域信号;快速傅里叶变换转换也是常规技术,得到由多个分段原始频域信号组成的一组原始频域信号和多个分段参考频域信号组成的一组参考频域信号;
步骤2、找出所有分段的原始频域信号中能量最高的n个峰值所对应的频率值,n为大于等于2的自然数,并将这些频率值按照分段的先后顺序依次记录下来形成一个原始频域信号共振峰频率序列数组,记为fs;相同方法,找出时间单元T内、所有分段的参考频域信号中能量最高的至少两个峰值所对应的频率值,并将这些频率值按照分段的先后顺序依次记录下来形成一个参考频域信号共振峰频率序列数组,记为fC
步骤3、基于特征比对,计算近端回声延时D1,具体方法为:
从原始频域信号共振峰频率序列数组fs的当前位置提取出时长为T的数据,记分段的步长为step,那么共有
Figure BDA0002438102190000051
组数据;而对于fc,以当前位置为基准向前移动d毫秒后提取时长为T的数据,同样有L组数据;对两个集合的数据按对应位置比较,记录相同数据的个数,得到matchd;对于不同的d,就可以得到不同的matchd值,取matchd值最大时对应的d值即为当前要查找的近端回声延时D1
本步骤中,为了提高精确性,至少连续计算近端回声延时D1连续3次,且每次计算的近端回声延时D1均相同,则将这三次计算得到的近端回声延时D1作为最终输出值;
步骤4、基于特征比对,计算他端回声延时D2,具体方法为:
从原始频域信号共振峰频率序列数组fs的当前位置提取出时长为T的数据,记分段时步长为step,那么共有
Figure BDA0002438102190000052
组数据;
对于原始频域信号共振峰频率序列数组fs,以当前为基准,向前移动t毫秒后再从fs中提取时长为T的数据,同样得到L组数据;
对两个集合的数据按对应位置比较,记录相同数据的个数,得到matcht;对于不同的t,就可以得到不同的matcht,取matcht的最大值;
当matcht的最大值大于等于预设值时,才认为fs序列中存在显著的延时特性,后续有产生啸叫的可能,此时将matcht的最大值对应的t值作为当前要查找的他端回声延时D2;如果matcht的最大值小于预设值,将D2的值输出为0;
步骤5、利用回声消除模块,避免啸叫产生,具体方法参加图1所示,
将采集的参考他端信号Fk,k=0,1,2,3…的历史信号保存一个数组中,将回声消除模块处理后的近端历史信号保存在另一个数组中,记为S′k,k=0,1,2,3…;
如果当前处理的原始近端信号为S0,利用步骤3得到的近端回声延时D1,在Fk中找到与近端回声延时D1对应的信号,记为近端回声源信号
Figure BDA0002438102190000053
附图1中,假设D1=3毫秒;
当他端回声延时D2的值不等于0时,才认为fs序列中存在显著的延时特性,后续有产生啸叫的可能,此时,利用步骤4得到的他端回声延时D2,在S′k中找到与他端回声延时D2对应的信号,记为他端回声源信号
Figure BDA0002438102190000054
附图1中,假设D2=4毫秒,然后将近端回声源F3和其他端回声源S′4直接相加,作为回声消除模块的输入参考信号,原始近端信号为S0作为回声消除模块的输入信号,实现音频回路回声信号的消除;如果他端回声延时D2的值等于0,将原始近端信号为S0作为回声消除模块的输入信号,将近端回声源
Figure BDA0002438102190000061
作为回声消除模块的输入参考信号,实现音频回路回声信号的消除,避免啸叫的产生。

Claims (2)

1.一种啸叫处理方法,其特征在于包括如下步骤:
步骤1、分别将采集的原始近端信号和参考他端信号进行交叠分段、加窗和快速傅里叶变换转换为频域信号,从而得到原始近端频域信号和参考他端频域信号;将采集的原始近端信号标记为Sk,将采集的参考他端信号标记为Fk,将得到的原始频域信号标记为Sf,其中f代表不同频率,Sf为频率为f时原始近端信号的能量和相位,是一个复数,将得到的参考频域信号标记为Cf,Cf频率为f时参考他端信号的能量和相位;具体转换过程为:
1-1、分别对采集的原始近端信号和参考他端信号进行交叠分段处理,每一分段时间为t1,交叠时间为t2,t2小于t1大于零;
1-2、分别对交叠分段处理后的分段原始近端信号和分段参考他端信号分别进行加窗处理,去除分段造成的谱泄露;
1-3、分别对加窗处理后的分段原始近端信号和分段参考他端信号进行快速傅里叶变换转换,得到由多个分段原始频域信号组成的一组原始频域信号和多个分段参考频域信号组成的一组参考频域信号;
步骤2、找出所有分段的原始频域信号中能量最高的n个峰值所对应的频率值,n为大于等于2的自然数,并将这些频率值按照分段的先后顺序依次记录下来形成一个原始频域信号共振峰频率序列数组,记为fs;相同方法,找出时间单元T内、所有分段的参考频域信号中能量最高的至少两个峰值所对应的频率值,并将这些频率值按照分段的先后顺序依次记录下来形成一个参考频域信号共振峰频率序列数组,记为fC
步骤3、基于特征比对,计算近端回声延时D1,具体方法为:
从原始频域信号共振峰频率序列数组fs的当前位置提取出时长为T的数据,记分段的步长为step,那么共有
Figure FDA0002438102180000011
组数据;而对于fc,以当前位置为基准向前移动d毫秒后提取时长为T的数据,同样有L组数据;对两个集合的数据按对应位置比较,记录相同数据的个数,得到matchd;对于不同的d,就可以得到不同的matchd值,取matchd值最大时对应的d值即为当前要查找的近端回声延时D1
步骤4、基于特征比对,计算他端回声延时D2,具体方法为:
从原始频域信号共振峰频率序列数组fs的当前位置提取出时长为T的数据,记分段时步长为step,那么共有
Figure FDA0002438102180000012
组数据;
对于原始频域信号共振峰频率序列数组fs,以当前为基准,向前移动t毫秒后再从fs中提取时长为T的数据,同样得到L组数据;
对两个集合的数据按对应位置比较,记录相同数据的个数,得到matcht;对于不同的t,就可以得到不同的matcht,取matcht的最大值;
当matcht的最大值大于等于预设值时,才认为fs序列中存在显著的延时特性,后续有产生啸叫的可能,此时将matcht的最大值对应的t值作为当前要查找的他端回声延时D2;如果matcht的最大值小于预设值,将D2的值输出为0;
步骤5、利用回声消除模块,避免啸叫产生,具体方法为:
将采集的参考他端信号Fk的历史信号保存一个数组中,将回声消除模块处理后的近端历史信号保存在另一个数组中,记为S′k
如果采集的原始近端信号为S0,利用步骤3得到的近端回声延时D1,在Fk中找到与近端回声延时D1对应的信号,记为近端回声源信号
Figure FDA0002438102180000021
当他端回声延时D2的值不等于0时,在S′k中找到与他端回声延时D2对应的信号,记为他端回声源信号
Figure FDA0002438102180000022
然后将原始近端信号为S0作为回声消除模块的输入信号,将近端回声源
Figure FDA0002438102180000023
和其他端回声源
Figure FDA0002438102180000024
直接相加,作为回声消除模块的输入参考信号,实现音频回路回声信号的消除,避免啸叫的产生;
当他端回声延时D2的值等于0时,将原始近端信号为S0作为回声消除模块的输入信号,将近端回声源
Figure FDA0002438102180000025
作为回声消除模块的输入参考信号,实现音频回路回声信号的消除,避免啸叫的产生。
2.根据权利要求1所述的啸叫处理方法,其特征在于:所述步骤3中,至少连续计算近端回声延时D1连续3次,且每次计算的近端回声延时D1均相同,则将这三次计算得到的近端回声延时D1作为最终输出值。
CN202010257871.7A 2020-04-03 2020-04-03 一种啸叫处理方法 Active CN111462771B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010257871.7A CN111462771B (zh) 2020-04-03 2020-04-03 一种啸叫处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010257871.7A CN111462771B (zh) 2020-04-03 2020-04-03 一种啸叫处理方法

Publications (2)

Publication Number Publication Date
CN111462771A true CN111462771A (zh) 2020-07-28
CN111462771B CN111462771B (zh) 2022-04-12

Family

ID=71678792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010257871.7A Active CN111462771B (zh) 2020-04-03 2020-04-03 一种啸叫处理方法

Country Status (1)

Country Link
CN (1) CN111462771B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6442272B1 (en) * 1998-05-26 2002-08-27 Tellabs, Inc. Voice conferencing system having local sound amplification
CN103152500A (zh) * 2013-02-21 2013-06-12 中国对外翻译出版有限公司 多方通话中回音消除方法
CN103700374A (zh) * 2013-12-25 2014-04-02 宁波菊风系统软件有限公司 确定声学回声消除中系统延时的方法及声学回声消除方法
CN106157964A (zh) * 2016-07-14 2016-11-23 西安元智系统技术有限责任公司 一种确定回声消除中系统延时的方法
US20180132038A1 (en) * 2016-11-04 2018-05-10 Dolby Laboratories Licensing Corporation Intrinsically Safe Audio System Management for Conference Rooms
CN109068012A (zh) * 2018-07-06 2018-12-21 南京时保联信息科技有限公司 一种用于音频会议系统的双端通话检测方法
CN110197669A (zh) * 2018-02-27 2019-09-03 上海富瀚微电子股份有限公司 一种语音信号处理方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6442272B1 (en) * 1998-05-26 2002-08-27 Tellabs, Inc. Voice conferencing system having local sound amplification
CN103152500A (zh) * 2013-02-21 2013-06-12 中国对外翻译出版有限公司 多方通话中回音消除方法
CN103700374A (zh) * 2013-12-25 2014-04-02 宁波菊风系统软件有限公司 确定声学回声消除中系统延时的方法及声学回声消除方法
CN106157964A (zh) * 2016-07-14 2016-11-23 西安元智系统技术有限责任公司 一种确定回声消除中系统延时的方法
US20180132038A1 (en) * 2016-11-04 2018-05-10 Dolby Laboratories Licensing Corporation Intrinsically Safe Audio System Management for Conference Rooms
CN110197669A (zh) * 2018-02-27 2019-09-03 上海富瀚微电子股份有限公司 一种语音信号处理方法及装置
CN109068012A (zh) * 2018-07-06 2018-12-21 南京时保联信息科技有限公司 一种用于音频会议系统的双端通话检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JEAN-MARC VALIN: "PERCEPTUALLY-MOTIVATED NONLINEAR CHANNEL DECORRELATION FOR STEREO ACOUSTIC ECHO CANCELLATION", 《2008 HANDS-FREE SPEECH COMMUNICATION AND MICROPHONE ARRAYS》 *
潘晓东: "声学回声消除技术(AEC)在会议扩声系统的应用", 《声频工程》 *
王国政等: "带有啸叫抑制的地铁对讲系统声学回声控制算法及应用", 《控制理论与应用》 *

Also Published As

Publication number Publication date
CN111462771B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
CN109817209B (zh) 一种基于双麦克风阵列的智能语音交互系统
US8880396B1 (en) Spectrum reconstruction for automatic speech recognition
US20160358602A1 (en) Robust speech recognition in the presence of echo and noise using multiple signals for discrimination
WO2019133765A1 (en) Direction of arrival estimation for multiple audio content streams
CN111429939B (zh) 一种双声源的声音信号分离方法和拾音器
KR20130117750A (ko) 컴퓨테이셔널 청각 장면 분석에 기초한 단청 노이즈 억제
CN110610718B (zh) 一种提取期望声源语音信号的方法及装置
CN111696567B (zh) 用于远场通话的噪声估计方法及系统
CN110047478B (zh) 基于空间特征补偿的多通道语音识别声学建模方法及装置
Park et al. Acoustic interference cancellation for a voice-driven interface in smart TVs
US10937418B1 (en) Echo cancellation by acoustic playback estimation
JP2010054728A (ja) 音源抽出装置
EP3757993A1 (en) Pre-processing for automatic speech recognition
Olvera et al. Foreground-background ambient sound scene separation
Yu et al. NeuralEcho: A self-attentive recurrent neural network for unified acoustic echo suppression and speech enhancement
CN112363112B (zh) 一种基于线性麦克风阵列的声源定位方法及装置
US11415658B2 (en) Detection device and method for audio direction orientation and audio processing system
CN111462771B (zh) 一种啸叫处理方法
CN115359804B (zh) 一种基于麦克风阵列的定向音频拾取方法和系统
Lee et al. Improved Mask-Based Neural Beamforming for Multichannel Speech Enhancement by Snapshot Matching Masking
CN114827363A (zh) 用于通话过程中消除回声的方法、设备和可读存储介质
Kundegorski et al. Two-Microphone dereverberation for automatic speech recognition of Polish
US11392639B2 (en) Method and apparatus for automatic speaker diarization
KR101022457B1 (ko) Casa 및 소프트 마스크 알고리즘을 이용한 단일채널 음성 분리방법
CN112165558A (zh) 一种双讲状态检测方法、装置、存储介质及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant