ES2664348T3 - Estimación de ruido de fondo en señales de audio - Google Patents
Estimación de ruido de fondo en señales de audio Download PDFInfo
- Publication number
- ES2664348T3 ES2664348T3 ES15739357.0T ES15739357T ES2664348T3 ES 2664348 T3 ES2664348 T3 ES 2664348T3 ES 15739357 T ES15739357 T ES 15739357T ES 2664348 T3 ES2664348 T3 ES 2664348T3
- Authority
- ES
- Spain
- Prior art keywords
- audio signal
- linear prediction
- background noise
- segment
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Abstract
Un método para un estimador de ruido de fondo para estimación de ruido de fondo en una señal de audio, en el que la señal de audio comprende una pluralidad de segmentos de señal de audio, comprendiendo el método: - obtener (201) al menos un parámetro asociado con un segmento de señal de audio, basándose en: - una primera ganancia de predicción lineal calculada como un cociente entre una señal residual (E(0)) de una predicción lineal de orden 0 y una señal residual (E(2)) de una predicción lineal de 2º orden para el segmento de señal de audio; y - una segunda ganancia de predicción lineal calculada como un cociente entre una señal residual (E(2)) de una predicción lineal de 2º orden y una señal residual (E(16)) de una predicción lineal de 16º orden para el segmento de señal de audio; - determinar (202) si el segmento de señal de audio comprende una pausa, es decir, está libre de contenido activo tal como voz y música, basándose al menos en al menos dicho parámetro obtenido; y - cuando el segmento de señal de audio comprende una pausa, actualizar (203) una estimación de ruido de fondo basándose en el segmento de señal de audio.
Description
Para la mayoría de los tipos de señales de fondo, tanto G1_2_16 como G2_2_16 estarán cerca de 0, pero tendrán diferentes respuestas al contenido donde se necesita la predicción lineal de 16º orden, que típicamente es para voz y otro contenido activo. La primera estimación a largo plazo, G1_2_16 generalmente será más alta que la segunda
5 estimación a largo plazo G2_2_16. Esta diferencia entre las características a largo plazo se mide de acuerdo con:
Gd_2_16 = G1_2_16 -G2_2_16 (Ec. 9)
El parámetro Gd_2_16 podría alternativamente denominarse como epsP_2_16_dlp o gad_2_16.
10 Gd_2_16 se puede usar como una entrada a un filtro que crea una tercera característica a largo plazo de acuerdo con:
Gad_2_16 = (1-c) Gad_2_16 + c Gd_2_16 (Ec. 10)
donde si Gd_2_16 < Gad_2_16 entonces c = 0,02 si no c = 0,05
15 Este filtro aplica diferentes coeficientes de filtro dependiendo de si la tercera señal de largo plazo debe ser aumentada o no. El parámetro Gad_2_16 puede alternativamente denominarse por ejemplo epsP_2_16_dlp_lp2 o
Gmax_2_16 = max (Gad_2_16, Gd_2_16) (Ec. 11)
El parámetro Gmax_2_16 podría alternativamente denominarse, por ejemplo epsP_2_16_dlp_max o gmax_0_2.
25 Cercanía espectral/medida de diferencia
Una característica de cercanía espectral usa el análisis de frecuencia de la trama o segmento de entrada actual donde se calcula la energía de la subbanda y se compara con la estimación de fondo de la subbanda. Un parámetro
o característica de cercanía espectral se puede usar en combinación con un parámetro relacionado con las
30 ganancias de predicción lineal descritas anteriormente, por ejemplo para asegurarse de que el segmento o trama actual está relativamente cerca, o al menos no muy lejos, de una estimación previa de fondo.
La figura 5 muestra un diagrama de bloques del cálculo de una cercanía espectral o medida de diferencia. Durante el período de inicialización, por ejemplo las 150 primeras tramas, la comparación se realiza con una constante
35 correspondiente a la estimación de fondo inicial. Después de la inicialización pasa al funcionamiento normal y se compara con la estimación de fondo. Obsérvese que, si bien el análisis espectral produce energías de subbanda para 20 subbandas, el cálculo de nonstaB aquí solo usa subbandas i = 2, ... 16, ya que es principalmente en estas bandas donde se ubica la energía de voz. Aquí nonstaB refleja la no estacionariedad.
40 Entonces, durante la inicialización, nonstaB se calcula usando un Emin, que aquí se establece en Emin = 0,0035 como:
nonstaB = sum (abs (log (Ecb (i) +1) -log (Emin + 1))) (Ec. 12)
donde la suma se hace sobre i = 2 ... 16.
45 Esto se hace para reducir el efecto de los errores de decisión en la estimación de ruido de fondo durante la inicialización. Después del período de inicialización, el cálculo se realiza usando la estimación de ruido de fondo actual de la subbanda respectiva, de acuerdo con:
nonstaB = suma (abs (log (Ecb (i) +1) -log (Ncb (i) +1))) (Ec. 13) 50 donde la suma se hace sobre i = 2 ... 16.
La adición de la constante 1 a cada energía de subbanda antes del logaritmo reduce la sensibilidad para la diferencia espectral para tramas de baja energía. El parámetro nonstaB podría alternativamente denominarse por 55 ejemplo non_staB o nonstatB.
En la figura 6 se muestra un diagrama de bloques que ilustra una realización ejemplar de un estimador de fondo. La realización en la figura 6 comprende un bloque para el entramado 601 de entrada, que divide la señal de audio de
10
recibirse, a través de la interfaz de E/S desde un codificador de señal de audio que realiza una codificación predictiva lineal.
La circuitería 1101 de procesamiento podría, como se ilustra en la figura 11b, comprender medios de procesamiento,
5 tales como un procesador 1103, por ejemplo una CPU y una memoria 1104 para almacenar o retener instrucciones. La memoria entonces comprendería instrucciones, por ejemplo en forma de un programa informático 1105, que cuando es ejecutado por los medios 1103 de procesamiento hace que el codificador 1100 realice las acciones descritas anteriormente.
Una implementación alternativa de la circuitería 1101 de procesamiento se muestra en la figura 11c. La circuitería de procesamiento aquí comprende una unidad o módulo 1106 de obtención o determinación, configurada para hacer que el estimador 1100 de ruido de fondo obtenga, por ejemplo, determine o calcule, al menos un parámetro, por ejemplo NEW_POS_BG, basándose en una primera ganancia de predicción lineal calculada como un cociente entre una señal residual de una predicción lineal de orden 0 y una señal residual de una predicción lineal de 2º orden para
15 el segmento de señal de audio; y una segunda ganancia de predicción lineal calculada como un cociente entre una señal residual de una predicción lineal de 2º orden y una señal residual de una predicción lineal de 16º orden para el segmento de señal de audio. El circuito de procesamiento comprende además una unidad o módulo 1107 de determinación, configurada para hacer que el estimador 1100 de ruido de fondo determine si el segmento de señal de audio comprende una pausa, es decir, está libre de contenido activo como voz y música, basándose al menos en al menos dicho parámetro La circuitería 1101 de procesamiento comprende además una unidad o módulo 1110 de actualización o estimación, configurada para hacer que el estimador de ruido de fondo actualice una estimación de ruido de fondo basándose en el segmento de señal de audio cuando el segmento de señal de audio comprende una pausa.
25 La circuitería 1101 de procesamiento podría comprender más unidades, tales como una unidad o módulo de filtro configurada para hacer que el estimador de ruido de fondo filtre de paso bajo a las ganancias de predicción lineal, creando así una o más estimaciones a largo plazo de las ganancias de predicción lineal. Acciones como el filtrado de paso bajo pueden realizarse de otro modo, por ejemplo por la unidad o módulo 1107 de determinación.
Las realizaciones de un estimador de ruido de fondo descrito anteriormente podrían configurarse para las diferentes realizaciones de método descritas en el presente documento, tales como limitar y filtrar de paso bajo las ganancias de predicción lineal; determinar una diferencia entre las ganancias de predicción lineal y las estimaciones a largo plazo y entre las estimaciones a largo plazo; y/o obtener y usar una medida de cercanía espectral, etc.
35 Puede suponerse que el estimador 1100 de ruido de fondo comprende una funcionalidad adicional, para llevar a cabo una estimación de ruido de fondo, tal como por ejemplo la funcionalidad ejemplificada en el Apéndice A.
La figura 12 ilustra un estimador 1200 de fondo de acuerdo con una realización ejemplar. El estimador 1200 de fondo comprende una unidad de entrada, por ejemplo para recibir energías residuales para los órdenes 0, 2 y 16 de modelo. El estimador de fondo comprende además un procesador y una memoria, conteniendo dicha memoria instrucciones ejecutables por dicho procesador, por lo que dicho estimador de fondo es operativo para: realizar un método de acuerdo con una realización descrita en el presente documento.
Por consiguiente, el estimador de fondo puede comprender, como se ilustra en la figura 13, una unidad 1301de
45 entrada/salida, un calculador 1302 para calcular los primeros dos conjuntos de características de las energías residuales para los órdenes 0, 2 y 16 de modelo y un analizador 1303 de frecuencia para calcular la característica de cercanía espectral.
Un estimador de ruido de fondo como los descritos anteriormente puede estar comprendido, por ejemplo en un VAD
o SAD, un codificador y/o un decodificador, es decir, un códec, y/o en un dispositivo, tal como un dispositivo de comunicación. El dispositivo de comunicación puede ser un equipo de usuario (UE) en forma de teléfono móvil, cámara de video, grabadora de sonido, tableta, ordenador de escritorio, ordenador portátil, decodificador de televisión o servidor doméstico/puerta de enlace doméstica/punto de acceso doméstico/enrutador doméstico. El dispositivo de comunicación puede ser en algunas realizaciones un dispositivo de red de comunicaciones adaptado
55 para codificar y/o transcodificar señales de audio. Ejemplos de tales dispositivos de red de comunicaciones son servidores, tales como servidores de medios, servidores de aplicaciones, enrutadores, pasarelas y estaciones base de radio. El dispositivo de comunicación también puede estar adaptado para colocarse, es decir, estar integrado en, un buque, tal como un barco, dron volador, avión y un vehículo de carretera, tal como un automóvil, autobús o camión. Tal dispositivo integrado típicamente pertenecería a una unidad telemática de vehículo o sistema de infoentretenimiento de vehículo.
Los pasos, funciones, procedimientos, módulos, unidades y/o bloques descritos en el presente documento pueden implementarse en hardware que use cualquier tecnología convencional, tal como tecnología de circuito discreto o de circuito integrado, que incluye circuitería electrónica de propósito general y circuitería específica de aplicación.
65 Los ejemplos particulares incluyen uno o más procesadores de señal digital configurados adecuadamente y otros
16
Claims (1)
-
imagen1 imagen2
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462030121P | 2014-07-29 | 2014-07-29 | |
US201462030121P | 2014-07-29 | ||
PCT/SE2015/050770 WO2016018186A1 (en) | 2014-07-29 | 2015-07-01 | Estimation of background noise in audio signals |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2664348T3 true ES2664348T3 (es) | 2018-04-19 |
Family
ID=53682771
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15739357.0T Active ES2664348T3 (es) | 2014-07-29 | 2015-07-01 | Estimación de ruido de fondo en señales de audio |
ES17202308T Active ES2758517T3 (es) | 2014-07-29 | 2015-07-01 | Estimación del ruido de fondo en las señales de audio |
ES19179575T Active ES2869141T3 (es) | 2014-07-29 | 2015-07-01 | Estimación de ruido de fondo en señales de audio |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES17202308T Active ES2758517T3 (es) | 2014-07-29 | 2015-07-01 | Estimación del ruido de fondo en las señales de audio |
ES19179575T Active ES2869141T3 (es) | 2014-07-29 | 2015-07-01 | Estimación de ruido de fondo en señales de audio |
Country Status (19)
Country | Link |
---|---|
US (5) | US9870780B2 (es) |
EP (3) | EP3175458B1 (es) |
JP (3) | JP6208377B2 (es) |
KR (3) | KR102267986B1 (es) |
CN (3) | CN112927725A (es) |
BR (1) | BR112017001643B1 (es) |
CA (1) | CA2956531C (es) |
DK (1) | DK3582221T3 (es) |
ES (3) | ES2664348T3 (es) |
HU (1) | HUE037050T2 (es) |
MX (3) | MX365694B (es) |
MY (1) | MY178131A (es) |
NZ (1) | NZ728080A (es) |
PH (1) | PH12017500031A1 (es) |
PL (2) | PL3309784T3 (es) |
PT (1) | PT3309784T (es) |
RU (3) | RU2713852C2 (es) |
WO (1) | WO2016018186A1 (es) |
ZA (2) | ZA201708141B (es) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR112016014104B1 (pt) | 2013-12-19 | 2020-12-29 | Telefonaktiebolaget Lm Ericsson (Publ) | método de estimativa de ruído de fundo, estimador de ruído de fundo, detector de atividade de som, codec, dispositivo sem fio, nó de rede, meio de armazenamento legível por computador |
CN105261375B (zh) * | 2014-07-18 | 2018-08-31 | 中兴通讯股份有限公司 | 激活音检测的方法及装置 |
CA2956531C (en) * | 2014-07-29 | 2020-03-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimation of background noise in audio signals |
KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
CN105897455A (zh) * | 2015-11-16 | 2016-08-24 | 乐视云计算有限公司 | 用于检测功能管理配置服务器运营的方法、合法客户端、cdn节点及系统 |
DE102018206689A1 (de) * | 2018-04-30 | 2019-10-31 | Sivantos Pte. Ltd. | Verfahren zur Rauschunterdrückung in einem Audiosignal |
US10991379B2 (en) * | 2018-06-22 | 2021-04-27 | Babblelabs Llc | Data driven audio enhancement |
CN110110437B (zh) * | 2019-05-07 | 2023-08-29 | 中汽研(天津)汽车工程研究院有限公司 | 一种基于相关区间不确定性理论的汽车高频噪声预测方法 |
CN111863016B (zh) * | 2020-06-15 | 2022-09-02 | 云南国土资源职业学院 | 一种天文时序信号的噪声估计方法 |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297213A (en) * | 1992-04-06 | 1994-03-22 | Holden Thomas W | System and method for reducing noise |
IT1257065B (it) * | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
JP3685812B2 (ja) * | 1993-06-29 | 2005-08-24 | ソニー株式会社 | 音声信号送受信装置 |
FR2715784B1 (fr) * | 1994-02-02 | 1996-03-29 | Jacques Prado | Procédé et dispositif d'analyse d'un signal de retour et annuleur d'écho adaptatif en comportant application. |
FR2720850B1 (fr) * | 1994-06-03 | 1996-08-14 | Matra Communication | Procédé de codage de parole à prédiction linéaire. |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
US6782361B1 (en) * | 1999-06-18 | 2004-08-24 | Mcgill University | Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system |
US6691082B1 (en) * | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
JP2001236085A (ja) * | 2000-02-25 | 2001-08-31 | Matsushita Electric Ind Co Ltd | 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置 |
DE10026872A1 (de) * | 2000-04-28 | 2001-10-31 | Deutsche Telekom Ag | Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector) |
WO2001084536A1 (de) * | 2000-04-28 | 2001-11-08 | Deutsche Telekom Ag | Verfahren zur berechnung einer sprachaktivitätsentscheidung (voice activity detector) |
US7136810B2 (en) * | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
JP2002258897A (ja) * | 2001-02-27 | 2002-09-11 | Fujitsu Ltd | 雑音抑圧装置 |
KR100399057B1 (ko) * | 2001-08-07 | 2003-09-26 | 한국전자통신연구원 | 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법 |
FR2833103B1 (fr) * | 2001-12-05 | 2004-07-09 | France Telecom | Systeme de detection de parole dans le bruit |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US7065486B1 (en) | 2002-04-11 | 2006-06-20 | Mindspeed Technologies, Inc. | Linear prediction based noise suppression |
CA2454296A1 (en) | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US7454010B1 (en) * | 2004-11-03 | 2008-11-18 | Acoustic Technologies, Inc. | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation |
JP4551817B2 (ja) * | 2005-05-20 | 2010-09-29 | Okiセミコンダクタ株式会社 | ノイズレベル推定方法及びその装置 |
US20070078645A1 (en) * | 2005-09-30 | 2007-04-05 | Nokia Corporation | Filterbank-based processing of speech signals |
RU2317595C1 (ru) * | 2006-10-30 | 2008-02-20 | ГОУ ВПО "Белгородский государственный университет" | Способ обнаружения пауз в речевых сигналах и устройство его реализующее |
RU2417459C2 (ru) * | 2006-11-15 | 2011-04-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для декодирования аудиосигнала |
US9318117B2 (en) * | 2007-03-05 | 2016-04-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and arrangement for controlling smoothing of stationary background noise |
WO2009000073A1 (en) * | 2007-06-22 | 2008-12-31 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
US8489396B2 (en) * | 2007-07-25 | 2013-07-16 | Qnx Software Systems Limited | Noise reduction with integrated tonal noise reduction |
KR101230183B1 (ko) * | 2008-07-14 | 2013-02-15 | 광운대학교 산학협력단 | 오디오 신호의 상태결정 장치 |
JP5513138B2 (ja) * | 2009-01-28 | 2014-06-04 | 矢崎総業株式会社 | 基板 |
US8244523B1 (en) * | 2009-04-08 | 2012-08-14 | Rockwell Collins, Inc. | Systems and methods for noise reduction |
JP5460709B2 (ja) * | 2009-06-04 | 2014-04-02 | パナソニック株式会社 | 音響信号処理装置および方法 |
DE102009034238A1 (de) | 2009-07-22 | 2011-02-17 | Daimler Ag | Statorsegment und Stator eines Hybrid- oder Elektrofahrzeuges |
DE102009034235A1 (de) | 2009-07-22 | 2011-02-17 | Daimler Ag | Stator eines Hybrid- oder Elektrofahrzeuges, Statorträger |
JP2013508773A (ja) | 2009-10-19 | 2013-03-07 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | 音声エンコーダの方法およびボイス活動検出器 |
CA2778342C (en) * | 2009-10-19 | 2017-08-22 | Martin Sehlstedt | Method and background estimator for voice activity detection |
CN102136271B (zh) * | 2011-02-09 | 2012-07-04 | 华为技术有限公司 | 舒适噪声生成器、方法及回声抵消装置 |
CA2903681C (en) * | 2011-02-14 | 2017-03-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio codec using noise synthesis during inactive phases |
BR112015002826B1 (pt) * | 2012-09-11 | 2021-05-04 | Telefonaktiebolaget L M Ericsson (Publ) | método, meio de armazenamento legível por computador, e, controlador de ruído de conforto para gerar parâmetros de controle de ruído de conforto |
CN103050121A (zh) * | 2012-12-31 | 2013-04-17 | 北京迅光达通信技术有限公司 | 线性预测语音编码方法及语音合成方法 |
CN106409313B (zh) * | 2013-08-06 | 2021-04-20 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
CN103440871B (zh) * | 2013-08-21 | 2016-04-13 | 大连理工大学 | 一种语音中瞬态噪声抑制的方法 |
CA2956531C (en) * | 2014-07-29 | 2020-03-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimation of background noise in audio signals |
-
2015
- 2015-07-01 CA CA2956531A patent/CA2956531C/en active Active
- 2015-07-01 RU RU2018129139A patent/RU2713852C2/ru active
- 2015-07-01 ES ES15739357.0T patent/ES2664348T3/es active Active
- 2015-07-01 WO PCT/SE2015/050770 patent/WO2016018186A1/en active Application Filing
- 2015-07-01 CN CN202110082923.6A patent/CN112927725A/zh active Pending
- 2015-07-01 EP EP15739357.0A patent/EP3175458B1/en active Active
- 2015-07-01 RU RU2017106163A patent/RU2665916C2/ru active
- 2015-07-01 NZ NZ728080A patent/NZ728080A/en unknown
- 2015-07-01 MY MYPI2017700095A patent/MY178131A/en unknown
- 2015-07-01 KR KR1020197023763A patent/KR102267986B1/ko active IP Right Grant
- 2015-07-01 KR KR1020177002593A patent/KR101895391B1/ko not_active Application Discontinuation
- 2015-07-01 EP EP17202308.7A patent/EP3309784B1/en active Active
- 2015-07-01 KR KR1020187025077A patent/KR102012325B1/ko active IP Right Grant
- 2015-07-01 BR BR112017001643-5A patent/BR112017001643B1/pt active IP Right Grant
- 2015-07-01 PL PL17202308T patent/PL3309784T3/pl unknown
- 2015-07-01 EP EP19179575.6A patent/EP3582221B1/en active Active
- 2015-07-01 PL PL19179575T patent/PL3582221T3/pl unknown
- 2015-07-01 ES ES17202308T patent/ES2758517T3/es active Active
- 2015-07-01 DK DK19179575.6T patent/DK3582221T3/da active
- 2015-07-01 ES ES19179575T patent/ES2869141T3/es active Active
- 2015-07-01 PT PT172023087T patent/PT3309784T/pt unknown
- 2015-07-01 MX MX2017000805A patent/MX365694B/es active IP Right Grant
- 2015-07-01 US US15/119,956 patent/US9870780B2/en active Active
- 2015-07-01 CN CN202110082903.9A patent/CN112927724B/zh active Active
- 2015-07-01 MX MX2021010373A patent/MX2021010373A/es unknown
- 2015-07-01 CN CN201580040591.8A patent/CN106575511B/zh active Active
- 2015-07-01 HU HUE15739357A patent/HUE037050T2/hu unknown
- 2015-07-01 JP JP2016552887A patent/JP6208377B2/ja active Active
-
2017
- 2017-01-05 PH PH12017500031A patent/PH12017500031A1/en unknown
- 2017-01-18 MX MX2019005799A patent/MX2019005799A/es unknown
- 2017-09-06 JP JP2017171326A patent/JP6600337B2/ja active Active
- 2017-11-21 US US15/818,848 patent/US10347265B2/en active Active
- 2017-11-30 ZA ZA2017/08141A patent/ZA201708141B/en unknown
-
2019
- 2019-05-10 US US16/408,848 patent/US11114105B2/en active Active
- 2019-05-20 ZA ZA2019/03140A patent/ZA201903140B/en unknown
- 2019-10-04 JP JP2019184033A patent/JP6788086B2/ja active Active
-
2020
- 2020-01-14 RU RU2020100879A patent/RU2760346C2/ru active
-
2021
- 2021-08-03 US US17/392,908 patent/US11636865B2/en active Active
-
2023
- 2023-03-13 US US18/120,483 patent/US20230215447A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2664348T3 (es) | Estimación de ruido de fondo en señales de audio | |
US10096088B2 (en) | Robust regression method for image-space denoising | |
ES2387869T3 (es) | Reconstrucción de datos de audio multicanal | |
US20220130400A1 (en) | Frame error concealment | |
US9602128B2 (en) | Split gain shape vector coding | |
US11206483B2 (en) | Audio signal processing method and device, terminal and storage medium | |
US20140358527A1 (en) | Inactive Sound Signal Parameter Estimation Method and Comfort Noise Generation Method and System | |
US20180174598A1 (en) | Echo cancellation for keyword spotting | |
CN104978966B (zh) | 音频流中的丢帧补偿实现方法和装置 | |
ES2819032T3 (es) | Estimación de ruido de fondo en señales de audio | |
KR101941619B1 (ko) | 음성/오디오 비트스트림 디코딩 방법 및 장치 | |
Choi et al. | Adaptive combination of affine projection and NLMS algorithms | |
US20210329340A1 (en) | Streaming systems and methods of providing interactive streaming service | |
CN111630594B (zh) | 基音增强装置、其方法以及记录介质 | |
WO2018120290A1 (zh) | 一种基于模板匹配的预测方法及装置 | |
CN117116279A (zh) | 音频降噪方法、服务器和计算机可读存储介质 |