ES2664348T3 - Estimación de ruido de fondo en señales de audio - Google Patents

Estimación de ruido de fondo en señales de audio Download PDF

Info

Publication number
ES2664348T3
ES2664348T3 ES15739357.0T ES15739357T ES2664348T3 ES 2664348 T3 ES2664348 T3 ES 2664348T3 ES 15739357 T ES15739357 T ES 15739357T ES 2664348 T3 ES2664348 T3 ES 2664348T3
Authority
ES
Spain
Prior art keywords
audio signal
linear prediction
background noise
segment
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15739357.0T
Other languages
English (en)
Inventor
Martin Sehlstedt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2664348T3 publication Critical patent/ES2664348T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Abstract

Un método para un estimador de ruido de fondo para estimación de ruido de fondo en una señal de audio, en el que la señal de audio comprende una pluralidad de segmentos de señal de audio, comprendiendo el método: - obtener (201) al menos un parámetro asociado con un segmento de señal de audio, basándose en: - una primera ganancia de predicción lineal calculada como un cociente entre una señal residual (E(0)) de una predicción lineal de orden 0 y una señal residual (E(2)) de una predicción lineal de 2º orden para el segmento de señal de audio; y - una segunda ganancia de predicción lineal calculada como un cociente entre una señal residual (E(2)) de una predicción lineal de 2º orden y una señal residual (E(16)) de una predicción lineal de 16º orden para el segmento de señal de audio; - determinar (202) si el segmento de señal de audio comprende una pausa, es decir, está libre de contenido activo tal como voz y música, basándose al menos en al menos dicho parámetro obtenido; y - cuando el segmento de señal de audio comprende una pausa, actualizar (203) una estimación de ruido de fondo basándose en el segmento de señal de audio.

Description

imagen1
imagen2
imagen3
imagen4
imagen5
imagen6
imagen7
imagen8
Para la mayoría de los tipos de señales de fondo, tanto G1_2_16 como G2_2_16 estarán cerca de 0, pero tendrán diferentes respuestas al contenido donde se necesita la predicción lineal de 16º orden, que típicamente es para voz y otro contenido activo. La primera estimación a largo plazo, G1_2_16 generalmente será más alta que la segunda
5 estimación a largo plazo G2_2_16. Esta diferencia entre las características a largo plazo se mide de acuerdo con:
Gd_2_16 = G1_2_16 -G2_2_16 (Ec. 9)
El parámetro Gd_2_16 podría alternativamente denominarse como epsP_2_16_dlp o gad_2_16.
10 Gd_2_16 se puede usar como una entrada a un filtro que crea una tercera característica a largo plazo de acuerdo con:
Gad_2_16 = (1-c) Gad_2_16 + c Gd_2_16 (Ec. 10)
donde si Gd_2_16 < Gad_2_16 entonces c = 0,02 si no c = 0,05
15 Este filtro aplica diferentes coeficientes de filtro dependiendo de si la tercera señal de largo plazo debe ser aumentada o no. El parámetro Gad_2_16 puede alternativamente denominarse por ejemplo epsP_2_16_dlp_lp2 o
imagen9ad_2_16. Además, la señal a largo plazo Gad_2_16 se puede combinar con la señal de entrada del filtro Gd_2_16 para evitar que el filtrado enmascare las altas entradas ocasionales para la trama actual. El parámetro final es 20 entonces el máximo de la trama o segmento y la versión a largo plazo de la característica
Gmax_2_16 = max (Gad_2_16, Gd_2_16) (Ec. 11)
El parámetro Gmax_2_16 podría alternativamente denominarse, por ejemplo epsP_2_16_dlp_max o gmax_0_2.
25 Cercanía espectral/medida de diferencia
Una característica de cercanía espectral usa el análisis de frecuencia de la trama o segmento de entrada actual donde se calcula la energía de la subbanda y se compara con la estimación de fondo de la subbanda. Un parámetro
o característica de cercanía espectral se puede usar en combinación con un parámetro relacionado con las
30 ganancias de predicción lineal descritas anteriormente, por ejemplo para asegurarse de que el segmento o trama actual está relativamente cerca, o al menos no muy lejos, de una estimación previa de fondo.
La figura 5 muestra un diagrama de bloques del cálculo de una cercanía espectral o medida de diferencia. Durante el período de inicialización, por ejemplo las 150 primeras tramas, la comparación se realiza con una constante
35 correspondiente a la estimación de fondo inicial. Después de la inicialización pasa al funcionamiento normal y se compara con la estimación de fondo. Obsérvese que, si bien el análisis espectral produce energías de subbanda para 20 subbandas, el cálculo de nonstaB aquí solo usa subbandas i = 2, ... 16, ya que es principalmente en estas bandas donde se ubica la energía de voz. Aquí nonstaB refleja la no estacionariedad.
40 Entonces, durante la inicialización, nonstaB se calcula usando un Emin, que aquí se establece en Emin = 0,0035 como:
nonstaB = sum (abs (log (Ecb (i) +1) -log (Emin + 1))) (Ec. 12)
donde la suma se hace sobre i = 2 ... 16.
45 Esto se hace para reducir el efecto de los errores de decisión en la estimación de ruido de fondo durante la inicialización. Después del período de inicialización, el cálculo se realiza usando la estimación de ruido de fondo actual de la subbanda respectiva, de acuerdo con:
nonstaB = suma (abs (log (Ecb (i) +1) -log (Ncb (i) +1))) (Ec. 13) 50 donde la suma se hace sobre i = 2 ... 16.
La adición de la constante 1 a cada energía de subbanda antes del logaritmo reduce la sensibilidad para la diferencia espectral para tramas de baja energía. El parámetro nonstaB podría alternativamente denominarse por 55 ejemplo non_staB o nonstatB.
En la figura 6 se muestra un diagrama de bloques que ilustra una realización ejemplar de un estimador de fondo. La realización en la figura 6 comprende un bloque para el entramado 601 de entrada, que divide la señal de audio de
10
imagen10
imagen11
imagen12
imagen13
imagen14
recibirse, a través de la interfaz de E/S desde un codificador de señal de audio que realiza una codificación predictiva lineal.
La circuitería 1101 de procesamiento podría, como se ilustra en la figura 11b, comprender medios de procesamiento,
5 tales como un procesador 1103, por ejemplo una CPU y una memoria 1104 para almacenar o retener instrucciones. La memoria entonces comprendería instrucciones, por ejemplo en forma de un programa informático 1105, que cuando es ejecutado por los medios 1103 de procesamiento hace que el codificador 1100 realice las acciones descritas anteriormente.
Una implementación alternativa de la circuitería 1101 de procesamiento se muestra en la figura 11c. La circuitería de procesamiento aquí comprende una unidad o módulo 1106 de obtención o determinación, configurada para hacer que el estimador 1100 de ruido de fondo obtenga, por ejemplo, determine o calcule, al menos un parámetro, por ejemplo NEW_POS_BG, basándose en una primera ganancia de predicción lineal calculada como un cociente entre una señal residual de una predicción lineal de orden 0 y una señal residual de una predicción lineal de 2º orden para
15 el segmento de señal de audio; y una segunda ganancia de predicción lineal calculada como un cociente entre una señal residual de una predicción lineal de 2º orden y una señal residual de una predicción lineal de 16º orden para el segmento de señal de audio. El circuito de procesamiento comprende además una unidad o módulo 1107 de determinación, configurada para hacer que el estimador 1100 de ruido de fondo determine si el segmento de señal de audio comprende una pausa, es decir, está libre de contenido activo como voz y música, basándose al menos en al menos dicho parámetro La circuitería 1101 de procesamiento comprende además una unidad o módulo 1110 de actualización o estimación, configurada para hacer que el estimador de ruido de fondo actualice una estimación de ruido de fondo basándose en el segmento de señal de audio cuando el segmento de señal de audio comprende una pausa.
25 La circuitería 1101 de procesamiento podría comprender más unidades, tales como una unidad o módulo de filtro configurada para hacer que el estimador de ruido de fondo filtre de paso bajo a las ganancias de predicción lineal, creando así una o más estimaciones a largo plazo de las ganancias de predicción lineal. Acciones como el filtrado de paso bajo pueden realizarse de otro modo, por ejemplo por la unidad o módulo 1107 de determinación.
Las realizaciones de un estimador de ruido de fondo descrito anteriormente podrían configurarse para las diferentes realizaciones de método descritas en el presente documento, tales como limitar y filtrar de paso bajo las ganancias de predicción lineal; determinar una diferencia entre las ganancias de predicción lineal y las estimaciones a largo plazo y entre las estimaciones a largo plazo; y/o obtener y usar una medida de cercanía espectral, etc.
35 Puede suponerse que el estimador 1100 de ruido de fondo comprende una funcionalidad adicional, para llevar a cabo una estimación de ruido de fondo, tal como por ejemplo la funcionalidad ejemplificada en el Apéndice A.
La figura 12 ilustra un estimador 1200 de fondo de acuerdo con una realización ejemplar. El estimador 1200 de fondo comprende una unidad de entrada, por ejemplo para recibir energías residuales para los órdenes 0, 2 y 16 de modelo. El estimador de fondo comprende además un procesador y una memoria, conteniendo dicha memoria instrucciones ejecutables por dicho procesador, por lo que dicho estimador de fondo es operativo para: realizar un método de acuerdo con una realización descrita en el presente documento.
Por consiguiente, el estimador de fondo puede comprender, como se ilustra en la figura 13, una unidad 1301de
45 entrada/salida, un calculador 1302 para calcular los primeros dos conjuntos de características de las energías residuales para los órdenes 0, 2 y 16 de modelo y un analizador 1303 de frecuencia para calcular la característica de cercanía espectral.
Un estimador de ruido de fondo como los descritos anteriormente puede estar comprendido, por ejemplo en un VAD
o SAD, un codificador y/o un decodificador, es decir, un códec, y/o en un dispositivo, tal como un dispositivo de comunicación. El dispositivo de comunicación puede ser un equipo de usuario (UE) en forma de teléfono móvil, cámara de video, grabadora de sonido, tableta, ordenador de escritorio, ordenador portátil, decodificador de televisión o servidor doméstico/puerta de enlace doméstica/punto de acceso doméstico/enrutador doméstico. El dispositivo de comunicación puede ser en algunas realizaciones un dispositivo de red de comunicaciones adaptado
55 para codificar y/o transcodificar señales de audio. Ejemplos de tales dispositivos de red de comunicaciones son servidores, tales como servidores de medios, servidores de aplicaciones, enrutadores, pasarelas y estaciones base de radio. El dispositivo de comunicación también puede estar adaptado para colocarse, es decir, estar integrado en, un buque, tal como un barco, dron volador, avión y un vehículo de carretera, tal como un automóvil, autobús o camión. Tal dispositivo integrado típicamente pertenecería a una unidad telemática de vehículo o sistema de infoentretenimiento de vehículo.
Los pasos, funciones, procedimientos, módulos, unidades y/o bloques descritos en el presente documento pueden implementarse en hardware que use cualquier tecnología convencional, tal como tecnología de circuito discreto o de circuito integrado, que incluye circuitería electrónica de propósito general y circuitería específica de aplicación.
65 Los ejemplos particulares incluyen uno o más procesadores de señal digital configurados adecuadamente y otros
16
imagen15
imagen16
imagen17
imagen18
imagen19
imagen20
imagen21

Claims (1)

  1. imagen1
    imagen2
ES15739357.0T 2014-07-29 2015-07-01 Estimación de ruido de fondo en señales de audio Active ES2664348T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462030121P 2014-07-29 2014-07-29
US201462030121P 2014-07-29
PCT/SE2015/050770 WO2016018186A1 (en) 2014-07-29 2015-07-01 Estimation of background noise in audio signals

Publications (1)

Publication Number Publication Date
ES2664348T3 true ES2664348T3 (es) 2018-04-19

Family

ID=53682771

Family Applications (3)

Application Number Title Priority Date Filing Date
ES15739357.0T Active ES2664348T3 (es) 2014-07-29 2015-07-01 Estimación de ruido de fondo en señales de audio
ES17202308T Active ES2758517T3 (es) 2014-07-29 2015-07-01 Estimación del ruido de fondo en las señales de audio
ES19179575T Active ES2869141T3 (es) 2014-07-29 2015-07-01 Estimación de ruido de fondo en señales de audio

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES17202308T Active ES2758517T3 (es) 2014-07-29 2015-07-01 Estimación del ruido de fondo en las señales de audio
ES19179575T Active ES2869141T3 (es) 2014-07-29 2015-07-01 Estimación de ruido de fondo en señales de audio

Country Status (19)

Country Link
US (5) US9870780B2 (es)
EP (3) EP3175458B1 (es)
JP (3) JP6208377B2 (es)
KR (3) KR102267986B1 (es)
CN (3) CN112927725A (es)
BR (1) BR112017001643B1 (es)
CA (1) CA2956531C (es)
DK (1) DK3582221T3 (es)
ES (3) ES2664348T3 (es)
HU (1) HUE037050T2 (es)
MX (3) MX365694B (es)
MY (1) MY178131A (es)
NZ (1) NZ728080A (es)
PH (1) PH12017500031A1 (es)
PL (2) PL3309784T3 (es)
PT (1) PT3309784T (es)
RU (3) RU2713852C2 (es)
WO (1) WO2016018186A1 (es)
ZA (2) ZA201708141B (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112016014104B1 (pt) 2013-12-19 2020-12-29 Telefonaktiebolaget Lm Ericsson (Publ) método de estimativa de ruído de fundo, estimador de ruído de fundo, detector de atividade de som, codec, dispositivo sem fio, nó de rede, meio de armazenamento legível por computador
CN105261375B (zh) * 2014-07-18 2018-08-31 中兴通讯股份有限公司 激活音检测的方法及装置
CA2956531C (en) * 2014-07-29 2020-03-24 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of background noise in audio signals
KR102446392B1 (ko) * 2015-09-23 2022-09-23 삼성전자주식회사 음성 인식이 가능한 전자 장치 및 방법
CN105897455A (zh) * 2015-11-16 2016-08-24 乐视云计算有限公司 用于检测功能管理配置服务器运营的方法、合法客户端、cdn节点及系统
DE102018206689A1 (de) * 2018-04-30 2019-10-31 Sivantos Pte. Ltd. Verfahren zur Rauschunterdrückung in einem Audiosignal
US10991379B2 (en) * 2018-06-22 2021-04-27 Babblelabs Llc Data driven audio enhancement
CN110110437B (zh) * 2019-05-07 2023-08-29 中汽研(天津)汽车工程研究院有限公司 一种基于相关区间不确定性理论的汽车高频噪声预测方法
CN111863016B (zh) * 2020-06-15 2022-09-02 云南国土资源职业学院 一种天文时序信号的噪声估计方法

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297213A (en) * 1992-04-06 1994-03-22 Holden Thomas W System and method for reducing noise
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
JP3685812B2 (ja) * 1993-06-29 2005-08-24 ソニー株式会社 音声信号送受信装置
FR2715784B1 (fr) * 1994-02-02 1996-03-29 Jacques Prado Procédé et dispositif d'analyse d'un signal de retour et annuleur d'écho adaptatif en comportant application.
FR2720850B1 (fr) * 1994-06-03 1996-08-14 Matra Communication Procédé de codage de parole à prédiction linéaire.
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US6782361B1 (en) * 1999-06-18 2004-08-24 Mcgill University Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
JP2001236085A (ja) * 2000-02-25 2001-08-31 Matsushita Electric Ind Co Ltd 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置
DE10026872A1 (de) * 2000-04-28 2001-10-31 Deutsche Telekom Ag Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector)
WO2001084536A1 (de) * 2000-04-28 2001-11-08 Deutsche Telekom Ag Verfahren zur berechnung einer sprachaktivitätsentscheidung (voice activity detector)
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
JP2002258897A (ja) * 2001-02-27 2002-09-11 Fujitsu Ltd 雑音抑圧装置
KR100399057B1 (ko) * 2001-08-07 2003-09-26 한국전자통신연구원 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법
FR2833103B1 (fr) * 2001-12-05 2004-07-09 France Telecom Systeme de detection de parole dans le bruit
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
US7065486B1 (en) 2002-04-11 2006-06-20 Mindspeed Technologies, Inc. Linear prediction based noise suppression
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
US7454010B1 (en) * 2004-11-03 2008-11-18 Acoustic Technologies, Inc. Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
JP4551817B2 (ja) * 2005-05-20 2010-09-29 Okiセミコンダクタ株式会社 ノイズレベル推定方法及びその装置
US20070078645A1 (en) * 2005-09-30 2007-04-05 Nokia Corporation Filterbank-based processing of speech signals
RU2317595C1 (ru) * 2006-10-30 2008-02-20 ГОУ ВПО "Белгородский государственный университет" Способ обнаружения пауз в речевых сигналах и устройство его реализующее
RU2417459C2 (ru) * 2006-11-15 2011-04-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования аудиосигнала
US9318117B2 (en) * 2007-03-05 2016-04-19 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for controlling smoothing of stationary background noise
WO2009000073A1 (en) * 2007-06-22 2008-12-31 Voiceage Corporation Method and device for sound activity detection and sound signal classification
US8489396B2 (en) * 2007-07-25 2013-07-16 Qnx Software Systems Limited Noise reduction with integrated tonal noise reduction
KR101230183B1 (ko) * 2008-07-14 2013-02-15 광운대학교 산학협력단 오디오 신호의 상태결정 장치
JP5513138B2 (ja) * 2009-01-28 2014-06-04 矢崎総業株式会社 基板
US8244523B1 (en) * 2009-04-08 2012-08-14 Rockwell Collins, Inc. Systems and methods for noise reduction
JP5460709B2 (ja) * 2009-06-04 2014-04-02 パナソニック株式会社 音響信号処理装置および方法
DE102009034238A1 (de) 2009-07-22 2011-02-17 Daimler Ag Statorsegment und Stator eines Hybrid- oder Elektrofahrzeuges
DE102009034235A1 (de) 2009-07-22 2011-02-17 Daimler Ag Stator eines Hybrid- oder Elektrofahrzeuges, Statorträger
JP2013508773A (ja) 2009-10-19 2013-03-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声エンコーダの方法およびボイス活動検出器
CA2778342C (en) * 2009-10-19 2017-08-22 Martin Sehlstedt Method and background estimator for voice activity detection
CN102136271B (zh) * 2011-02-09 2012-07-04 华为技术有限公司 舒适噪声生成器、方法及回声抵消装置
CA2903681C (en) * 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
BR112015002826B1 (pt) * 2012-09-11 2021-05-04 Telefonaktiebolaget L M Ericsson (Publ) método, meio de armazenamento legível por computador, e, controlador de ruído de conforto para gerar parâmetros de controle de ruído de conforto
CN103050121A (zh) * 2012-12-31 2013-04-17 北京迅光达通信技术有限公司 线性预测语音编码方法及语音合成方法
CN106409313B (zh) * 2013-08-06 2021-04-20 华为技术有限公司 一种音频信号分类方法和装置
CN103440871B (zh) * 2013-08-21 2016-04-13 大连理工大学 一种语音中瞬态噪声抑制的方法
CA2956531C (en) * 2014-07-29 2020-03-24 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of background noise in audio signals

Also Published As

Publication number Publication date
CA2956531A1 (en) 2016-02-04
KR102267986B1 (ko) 2021-06-22
KR101895391B1 (ko) 2018-09-07
JP6208377B2 (ja) 2017-10-04
PL3582221T3 (pl) 2021-07-26
KR20170026545A (ko) 2017-03-08
ES2869141T3 (es) 2021-10-25
RU2665916C2 (ru) 2018-09-04
JP6788086B2 (ja) 2020-11-18
US20170069331A1 (en) 2017-03-09
RU2020100879A (ru) 2021-07-14
ZA201903140B (en) 2020-09-30
MY178131A (en) 2020-10-05
CA2956531C (en) 2020-03-24
HUE037050T2 (hu) 2018-08-28
JP2018041083A (ja) 2018-03-15
PH12017500031A1 (en) 2017-05-15
NZ728080A (en) 2018-08-31
MX2019005799A (es) 2019-08-12
NZ743390A (en) 2021-03-26
MX2021010373A (es) 2023-01-18
CN106575511A (zh) 2017-04-19
PL3309784T3 (pl) 2020-02-28
BR112017001643A2 (pt) 2018-01-30
CN112927725A (zh) 2021-06-08
KR20180100452A (ko) 2018-09-10
RU2760346C2 (ru) 2021-11-24
RU2018129139A (ru) 2019-03-14
US20190267017A1 (en) 2019-08-29
JP2017515138A (ja) 2017-06-08
EP3175458B1 (en) 2017-12-27
US20180158465A1 (en) 2018-06-07
ZA201708141B (en) 2019-09-25
CN112927724B (zh) 2024-03-22
ES2758517T3 (es) 2020-05-05
DK3582221T3 (da) 2021-04-19
CN106575511B (zh) 2021-02-23
US10347265B2 (en) 2019-07-09
EP3582221B1 (en) 2021-02-24
EP3309784B1 (en) 2019-09-04
RU2020100879A3 (es) 2021-10-13
US11114105B2 (en) 2021-09-07
RU2018129139A3 (es) 2019-12-20
RU2017106163A3 (es) 2018-08-28
EP3309784A1 (en) 2018-04-18
WO2016018186A1 (en) 2016-02-04
EP3582221A1 (en) 2019-12-18
MX365694B (es) 2019-06-11
KR102012325B1 (ko) 2019-08-20
EP3175458A1 (en) 2017-06-07
BR112017001643B1 (pt) 2021-01-12
MX2017000805A (es) 2017-05-04
CN112927724A (zh) 2021-06-08
JP2020024435A (ja) 2020-02-13
PT3309784T (pt) 2019-11-21
RU2713852C2 (ru) 2020-02-07
US20230215447A1 (en) 2023-07-06
US20210366496A1 (en) 2021-11-25
US11636865B2 (en) 2023-04-25
KR20190097321A (ko) 2019-08-20
JP6600337B2 (ja) 2019-10-30
US9870780B2 (en) 2018-01-16
RU2017106163A (ru) 2018-08-28

Similar Documents

Publication Publication Date Title
ES2664348T3 (es) Estimación de ruido de fondo en señales de audio
US10096088B2 (en) Robust regression method for image-space denoising
ES2387869T3 (es) Reconstrucción de datos de audio multicanal
US20220130400A1 (en) Frame error concealment
US9602128B2 (en) Split gain shape vector coding
US11206483B2 (en) Audio signal processing method and device, terminal and storage medium
US20140358527A1 (en) Inactive Sound Signal Parameter Estimation Method and Comfort Noise Generation Method and System
US20180174598A1 (en) Echo cancellation for keyword spotting
CN104978966B (zh) 音频流中的丢帧补偿实现方法和装置
ES2819032T3 (es) Estimación de ruido de fondo en señales de audio
KR101941619B1 (ko) 음성/오디오 비트스트림 디코딩 방법 및 장치
Choi et al. Adaptive combination of affine projection and NLMS algorithms
US20210329340A1 (en) Streaming systems and methods of providing interactive streaming service
CN111630594B (zh) 基音增强装置、其方法以及记录介质
WO2018120290A1 (zh) 一种基于模板匹配的预测方法及装置
CN117116279A (zh) 音频降噪方法、服务器和计算机可读存储介质