ES2664348T3 - Estimación de ruido de fondo en señales de audio - Google Patents
Estimación de ruido de fondo en señales de audio Download PDFInfo
- Publication number
- ES2664348T3 ES2664348T3 ES15739357.0T ES15739357T ES2664348T3 ES 2664348 T3 ES2664348 T3 ES 2664348T3 ES 15739357 T ES15739357 T ES 15739357T ES 2664348 T3 ES2664348 T3 ES 2664348T3
- Authority
- ES
- Spain
- Prior art keywords
- audio signal
- linear prediction
- background noise
- segment
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title abstract description 18
- 238000000034 method Methods 0.000 abstract description 5
- 230000007774 longterm Effects 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Un método para un estimador de ruido de fondo para estimación de ruido de fondo en una señal de audio, en el que la señal de audio comprende una pluralidad de segmentos de señal de audio, comprendiendo el método: - obtener (201) al menos un parámetro asociado con un segmento de señal de audio, basándose en: - una primera ganancia de predicción lineal calculada como un cociente entre una señal residual (E(0)) de una predicción lineal de orden 0 y una señal residual (E(2)) de una predicción lineal de 2º orden para el segmento de señal de audio; y - una segunda ganancia de predicción lineal calculada como un cociente entre una señal residual (E(2)) de una predicción lineal de 2º orden y una señal residual (E(16)) de una predicción lineal de 16º orden para el segmento de señal de audio; - determinar (202) si el segmento de señal de audio comprende una pausa, es decir, está libre de contenido activo tal como voz y música, basándose al menos en al menos dicho parámetro obtenido; y - cuando el segmento de señal de audio comprende una pausa, actualizar (203) una estimación de ruido de fondo basándose en el segmento de señal de audio.
Description
Para la mayoría de los tipos de señales de fondo, tanto G1_2_16 como G2_2_16 estarán cerca de 0, pero tendrán diferentes respuestas al contenido donde se necesita la predicción lineal de 16º orden, que típicamente es para voz y otro contenido activo. La primera estimación a largo plazo, G1_2_16 generalmente será más alta que la segunda
5 estimación a largo plazo G2_2_16. Esta diferencia entre las características a largo plazo se mide de acuerdo con:
Gd_2_16 = G1_2_16 -G2_2_16 (Ec. 9)
El parámetro Gd_2_16 podría alternativamente denominarse como epsP_2_16_dlp o gad_2_16.
10 Gd_2_16 se puede usar como una entrada a un filtro que crea una tercera característica a largo plazo de acuerdo con:
Gad_2_16 = (1-c) Gad_2_16 + c Gd_2_16 (Ec. 10)
donde si Gd_2_16 < Gad_2_16 entonces c = 0,02 si no c = 0,05
15 Este filtro aplica diferentes coeficientes de filtro dependiendo de si la tercera señal de largo plazo debe ser aumentada o no. El parámetro Gad_2_16 puede alternativamente denominarse por ejemplo epsP_2_16_dlp_lp2 o
Gmax_2_16 = max (Gad_2_16, Gd_2_16) (Ec. 11)
El parámetro Gmax_2_16 podría alternativamente denominarse, por ejemplo epsP_2_16_dlp_max o gmax_0_2.
25 Cercanía espectral/medida de diferencia
Una característica de cercanía espectral usa el análisis de frecuencia de la trama o segmento de entrada actual donde se calcula la energía de la subbanda y se compara con la estimación de fondo de la subbanda. Un parámetro
o característica de cercanía espectral se puede usar en combinación con un parámetro relacionado con las
30 ganancias de predicción lineal descritas anteriormente, por ejemplo para asegurarse de que el segmento o trama actual está relativamente cerca, o al menos no muy lejos, de una estimación previa de fondo.
La figura 5 muestra un diagrama de bloques del cálculo de una cercanía espectral o medida de diferencia. Durante el período de inicialización, por ejemplo las 150 primeras tramas, la comparación se realiza con una constante
35 correspondiente a la estimación de fondo inicial. Después de la inicialización pasa al funcionamiento normal y se compara con la estimación de fondo. Obsérvese que, si bien el análisis espectral produce energías de subbanda para 20 subbandas, el cálculo de nonstaB aquí solo usa subbandas i = 2, ... 16, ya que es principalmente en estas bandas donde se ubica la energía de voz. Aquí nonstaB refleja la no estacionariedad.
40 Entonces, durante la inicialización, nonstaB se calcula usando un Emin, que aquí se establece en Emin = 0,0035 como:
nonstaB = sum (abs (log (Ecb (i) +1) -log (Emin + 1))) (Ec. 12)
donde la suma se hace sobre i = 2 ... 16.
45 Esto se hace para reducir el efecto de los errores de decisión en la estimación de ruido de fondo durante la inicialización. Después del período de inicialización, el cálculo se realiza usando la estimación de ruido de fondo actual de la subbanda respectiva, de acuerdo con:
nonstaB = suma (abs (log (Ecb (i) +1) -log (Ncb (i) +1))) (Ec. 13) 50 donde la suma se hace sobre i = 2 ... 16.
La adición de la constante 1 a cada energía de subbanda antes del logaritmo reduce la sensibilidad para la diferencia espectral para tramas de baja energía. El parámetro nonstaB podría alternativamente denominarse por 55 ejemplo non_staB o nonstatB.
En la figura 6 se muestra un diagrama de bloques que ilustra una realización ejemplar de un estimador de fondo. La realización en la figura 6 comprende un bloque para el entramado 601 de entrada, que divide la señal de audio de
10
recibirse, a través de la interfaz de E/S desde un codificador de señal de audio que realiza una codificación predictiva lineal.
La circuitería 1101 de procesamiento podría, como se ilustra en la figura 11b, comprender medios de procesamiento,
5 tales como un procesador 1103, por ejemplo una CPU y una memoria 1104 para almacenar o retener instrucciones. La memoria entonces comprendería instrucciones, por ejemplo en forma de un programa informático 1105, que cuando es ejecutado por los medios 1103 de procesamiento hace que el codificador 1100 realice las acciones descritas anteriormente.
Una implementación alternativa de la circuitería 1101 de procesamiento se muestra en la figura 11c. La circuitería de procesamiento aquí comprende una unidad o módulo 1106 de obtención o determinación, configurada para hacer que el estimador 1100 de ruido de fondo obtenga, por ejemplo, determine o calcule, al menos un parámetro, por ejemplo NEW_POS_BG, basándose en una primera ganancia de predicción lineal calculada como un cociente entre una señal residual de una predicción lineal de orden 0 y una señal residual de una predicción lineal de 2º orden para
15 el segmento de señal de audio; y una segunda ganancia de predicción lineal calculada como un cociente entre una señal residual de una predicción lineal de 2º orden y una señal residual de una predicción lineal de 16º orden para el segmento de señal de audio. El circuito de procesamiento comprende además una unidad o módulo 1107 de determinación, configurada para hacer que el estimador 1100 de ruido de fondo determine si el segmento de señal de audio comprende una pausa, es decir, está libre de contenido activo como voz y música, basándose al menos en al menos dicho parámetro La circuitería 1101 de procesamiento comprende además una unidad o módulo 1110 de actualización o estimación, configurada para hacer que el estimador de ruido de fondo actualice una estimación de ruido de fondo basándose en el segmento de señal de audio cuando el segmento de señal de audio comprende una pausa.
25 La circuitería 1101 de procesamiento podría comprender más unidades, tales como una unidad o módulo de filtro configurada para hacer que el estimador de ruido de fondo filtre de paso bajo a las ganancias de predicción lineal, creando así una o más estimaciones a largo plazo de las ganancias de predicción lineal. Acciones como el filtrado de paso bajo pueden realizarse de otro modo, por ejemplo por la unidad o módulo 1107 de determinación.
Las realizaciones de un estimador de ruido de fondo descrito anteriormente podrían configurarse para las diferentes realizaciones de método descritas en el presente documento, tales como limitar y filtrar de paso bajo las ganancias de predicción lineal; determinar una diferencia entre las ganancias de predicción lineal y las estimaciones a largo plazo y entre las estimaciones a largo plazo; y/o obtener y usar una medida de cercanía espectral, etc.
35 Puede suponerse que el estimador 1100 de ruido de fondo comprende una funcionalidad adicional, para llevar a cabo una estimación de ruido de fondo, tal como por ejemplo la funcionalidad ejemplificada en el Apéndice A.
La figura 12 ilustra un estimador 1200 de fondo de acuerdo con una realización ejemplar. El estimador 1200 de fondo comprende una unidad de entrada, por ejemplo para recibir energías residuales para los órdenes 0, 2 y 16 de modelo. El estimador de fondo comprende además un procesador y una memoria, conteniendo dicha memoria instrucciones ejecutables por dicho procesador, por lo que dicho estimador de fondo es operativo para: realizar un método de acuerdo con una realización descrita en el presente documento.
Por consiguiente, el estimador de fondo puede comprender, como se ilustra en la figura 13, una unidad 1301de
45 entrada/salida, un calculador 1302 para calcular los primeros dos conjuntos de características de las energías residuales para los órdenes 0, 2 y 16 de modelo y un analizador 1303 de frecuencia para calcular la característica de cercanía espectral.
Un estimador de ruido de fondo como los descritos anteriormente puede estar comprendido, por ejemplo en un VAD
o SAD, un codificador y/o un decodificador, es decir, un códec, y/o en un dispositivo, tal como un dispositivo de comunicación. El dispositivo de comunicación puede ser un equipo de usuario (UE) en forma de teléfono móvil, cámara de video, grabadora de sonido, tableta, ordenador de escritorio, ordenador portátil, decodificador de televisión o servidor doméstico/puerta de enlace doméstica/punto de acceso doméstico/enrutador doméstico. El dispositivo de comunicación puede ser en algunas realizaciones un dispositivo de red de comunicaciones adaptado
55 para codificar y/o transcodificar señales de audio. Ejemplos de tales dispositivos de red de comunicaciones son servidores, tales como servidores de medios, servidores de aplicaciones, enrutadores, pasarelas y estaciones base de radio. El dispositivo de comunicación también puede estar adaptado para colocarse, es decir, estar integrado en, un buque, tal como un barco, dron volador, avión y un vehículo de carretera, tal como un automóvil, autobús o camión. Tal dispositivo integrado típicamente pertenecería a una unidad telemática de vehículo o sistema de infoentretenimiento de vehículo.
Los pasos, funciones, procedimientos, módulos, unidades y/o bloques descritos en el presente documento pueden implementarse en hardware que use cualquier tecnología convencional, tal como tecnología de circuito discreto o de circuito integrado, que incluye circuitería electrónica de propósito general y circuitería específica de aplicación.
65 Los ejemplos particulares incluyen uno o más procesadores de señal digital configurados adecuadamente y otros
16
Claims (1)
-
imagen1 imagen2
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462030121P | 2014-07-29 | 2014-07-29 | |
US201462030121P | 2014-07-29 | ||
PCT/SE2015/050770 WO2016018186A1 (en) | 2014-07-29 | 2015-07-01 | Estimation of background noise in audio signals |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2664348T3 true ES2664348T3 (es) | 2018-04-19 |
Family
ID=53682771
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15739357.0T Active ES2664348T3 (es) | 2014-07-29 | 2015-07-01 | Estimación de ruido de fondo en señales de audio |
ES17202308T Active ES2758517T3 (es) | 2014-07-29 | 2015-07-01 | Estimación del ruido de fondo en las señales de audio |
ES19179575T Active ES2869141T3 (es) | 2014-07-29 | 2015-07-01 | Estimación de ruido de fondo en señales de audio |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES17202308T Active ES2758517T3 (es) | 2014-07-29 | 2015-07-01 | Estimación del ruido de fondo en las señales de audio |
ES19179575T Active ES2869141T3 (es) | 2014-07-29 | 2015-07-01 | Estimación de ruido de fondo en señales de audio |
Country Status (19)
Country | Link |
---|---|
US (5) | US9870780B2 (es) |
EP (3) | EP3582221B1 (es) |
JP (3) | JP6208377B2 (es) |
KR (3) | KR101895391B1 (es) |
CN (3) | CN112927725A (es) |
BR (1) | BR112017001643B1 (es) |
CA (1) | CA2956531C (es) |
DK (1) | DK3582221T3 (es) |
ES (3) | ES2664348T3 (es) |
HU (1) | HUE037050T2 (es) |
MX (3) | MX2021010373A (es) |
MY (1) | MY178131A (es) |
NZ (1) | NZ728080A (es) |
PH (1) | PH12017500031A1 (es) |
PL (2) | PL3582221T3 (es) |
PT (1) | PT3309784T (es) |
RU (3) | RU2713852C2 (es) |
WO (1) | WO2016018186A1 (es) |
ZA (2) | ZA201708141B (es) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2941782T3 (es) | 2013-12-19 | 2023-05-25 | Ericsson Telefon Ab L M | Estimación de ruido de fondo en señales de audio |
CN105261375B (zh) * | 2014-07-18 | 2018-08-31 | 中兴通讯股份有限公司 | 激活音检测的方法及装置 |
ES2664348T3 (es) * | 2014-07-29 | 2018-04-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimación de ruido de fondo en señales de audio |
KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
CN105897455A (zh) * | 2015-11-16 | 2016-08-24 | 乐视云计算有限公司 | 用于检测功能管理配置服务器运营的方法、合法客户端、cdn节点及系统 |
DE102018206689A1 (de) * | 2018-04-30 | 2019-10-31 | Sivantos Pte. Ltd. | Verfahren zur Rauschunterdrückung in einem Audiosignal |
US10991379B2 (en) * | 2018-06-22 | 2021-04-27 | Babblelabs Llc | Data driven audio enhancement |
CN110110437B (zh) * | 2019-05-07 | 2023-08-29 | 中汽研(天津)汽车工程研究院有限公司 | 一种基于相关区间不确定性理论的汽车高频噪声预测方法 |
CN111863016B (zh) * | 2020-06-15 | 2022-09-02 | 云南国土资源职业学院 | 一种天文时序信号的噪声估计方法 |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5297213A (en) * | 1992-04-06 | 1994-03-22 | Holden Thomas W | System and method for reducing noise |
IT1257065B (it) * | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
JP3685812B2 (ja) * | 1993-06-29 | 2005-08-24 | ソニー株式会社 | 音声信号送受信装置 |
FR2715784B1 (fr) * | 1994-02-02 | 1996-03-29 | Jacques Prado | Procédé et dispositif d'analyse d'un signal de retour et annuleur d'écho adaptatif en comportant application. |
FR2720850B1 (fr) * | 1994-06-03 | 1996-08-14 | Matra Communication | Procédé de codage de parole à prédiction linéaire. |
US5742734A (en) * | 1994-08-10 | 1998-04-21 | Qualcomm Incorporated | Encoding rate selection in a variable rate vocoder |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
US6782361B1 (en) * | 1999-06-18 | 2004-08-24 | Mcgill University | Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system |
US6691082B1 (en) * | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
JP2001236085A (ja) * | 2000-02-25 | 2001-08-31 | Matsushita Electric Ind Co Ltd | 音声区間検出装置、定常雑音区間検出装置、非定常雑音区間検出装置、及び雑音区間検出装置 |
DE10026904A1 (de) * | 2000-04-28 | 2002-01-03 | Deutsche Telekom Ag | Verfahren zur Berechnung des die Lautstärke mitbestimmenden Verstärkungsfaktors für ein codiert übertragenes Sprachsignal |
US7254532B2 (en) * | 2000-04-28 | 2007-08-07 | Deutsche Telekom Ag | Method for making a voice activity decision |
US7136810B2 (en) * | 2000-05-22 | 2006-11-14 | Texas Instruments Incorporated | Wideband speech coding system and method |
JP2002258897A (ja) * | 2001-02-27 | 2002-09-11 | Fujitsu Ltd | 雑音抑圧装置 |
KR100399057B1 (ko) * | 2001-08-07 | 2003-09-26 | 한국전자통신연구원 | 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법 |
FR2833103B1 (fr) * | 2001-12-05 | 2004-07-09 | France Telecom | Systeme de detection de parole dans le bruit |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US7065486B1 (en) * | 2002-04-11 | 2006-06-20 | Mindspeed Technologies, Inc. | Linear prediction based noise suppression |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US7454010B1 (en) | 2004-11-03 | 2008-11-18 | Acoustic Technologies, Inc. | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation |
JP4551817B2 (ja) * | 2005-05-20 | 2010-09-29 | Okiセミコンダクタ株式会社 | ノイズレベル推定方法及びその装置 |
US20070078645A1 (en) * | 2005-09-30 | 2007-04-05 | Nokia Corporation | Filterbank-based processing of speech signals |
RU2317595C1 (ru) * | 2006-10-30 | 2008-02-20 | ГОУ ВПО "Белгородский государственный университет" | Способ обнаружения пауз в речевых сигналах и устройство его реализующее |
RU2417459C2 (ru) * | 2006-11-15 | 2011-04-27 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для декодирования аудиосигнала |
PL2118889T3 (pl) * | 2007-03-05 | 2013-03-29 | Ericsson Telefon Ab L M | Sposób i sterownik do wygładzania stacjonarnego szumu tła |
CA2690433C (en) * | 2007-06-22 | 2016-01-19 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
US8489396B2 (en) * | 2007-07-25 | 2013-07-16 | Qnx Software Systems Limited | Noise reduction with integrated tonal noise reduction |
KR101230183B1 (ko) * | 2008-07-14 | 2013-02-15 | 광운대학교 산학협력단 | 오디오 신호의 상태결정 장치 |
JP5513138B2 (ja) * | 2009-01-28 | 2014-06-04 | 矢崎総業株式会社 | 基板 |
US8244523B1 (en) * | 2009-04-08 | 2012-08-14 | Rockwell Collins, Inc. | Systems and methods for noise reduction |
US8886528B2 (en) * | 2009-06-04 | 2014-11-11 | Panasonic Corporation | Audio signal processing device and method |
DE102009034238A1 (de) | 2009-07-22 | 2011-02-17 | Daimler Ag | Statorsegment und Stator eines Hybrid- oder Elektrofahrzeuges |
DE102009034235A1 (de) | 2009-07-22 | 2011-02-17 | Daimler Ag | Stator eines Hybrid- oder Elektrofahrzeuges, Statorträger |
CN102667927B (zh) * | 2009-10-19 | 2013-05-08 | 瑞典爱立信有限公司 | 语音活动检测的方法和背景估计器 |
CA2778343A1 (en) * | 2009-10-19 | 2011-04-28 | Martin Sehlstedt | Method and voice activity detector for a speech encoder |
CN102136271B (zh) * | 2011-02-09 | 2012-07-04 | 华为技术有限公司 | 舒适噪声生成器、方法及回声抵消装置 |
JP5969513B2 (ja) * | 2011-02-14 | 2016-08-17 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 不活性相の間のノイズ合成を用いるオーディオコーデック |
AP2015008251A0 (en) * | 2012-09-11 | 2015-02-28 | Telefonaktiebogalet Lm Ericsson Publ | Generation of comfort noise |
CN103050121A (zh) * | 2012-12-31 | 2013-04-17 | 北京迅光达通信技术有限公司 | 线性预测语音编码方法及语音合成方法 |
CN106409313B (zh) * | 2013-08-06 | 2021-04-20 | 华为技术有限公司 | 一种音频信号分类方法和装置 |
CN103440871B (zh) * | 2013-08-21 | 2016-04-13 | 大连理工大学 | 一种语音中瞬态噪声抑制的方法 |
ES2664348T3 (es) * | 2014-07-29 | 2018-04-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimación de ruido de fondo en señales de audio |
US11114104B2 (en) * | 2019-06-18 | 2021-09-07 | International Business Machines Corporation | Preventing adversarial audio attacks on digital assistants |
KR20230103130A (ko) * | 2021-12-31 | 2023-07-07 | 에스케이하이닉스 주식회사 | 메모리 컨트롤러 및 그 동작 방법 |
-
2015
- 2015-07-01 ES ES15739357.0T patent/ES2664348T3/es active Active
- 2015-07-01 EP EP19179575.6A patent/EP3582221B1/en active Active
- 2015-07-01 KR KR1020177002593A patent/KR101895391B1/ko not_active Application Discontinuation
- 2015-07-01 MX MX2021010373A patent/MX2021010373A/es unknown
- 2015-07-01 EP EP15739357.0A patent/EP3175458B1/en active Active
- 2015-07-01 KR KR1020187025077A patent/KR102012325B1/ko active IP Right Grant
- 2015-07-01 CA CA2956531A patent/CA2956531C/en active Active
- 2015-07-01 ES ES17202308T patent/ES2758517T3/es active Active
- 2015-07-01 WO PCT/SE2015/050770 patent/WO2016018186A1/en active Application Filing
- 2015-07-01 DK DK19179575.6T patent/DK3582221T3/da active
- 2015-07-01 CN CN202110082923.6A patent/CN112927725A/zh active Pending
- 2015-07-01 KR KR1020197023763A patent/KR102267986B1/ko active IP Right Grant
- 2015-07-01 RU RU2018129139A patent/RU2713852C2/ru active
- 2015-07-01 US US15/119,956 patent/US9870780B2/en active Active
- 2015-07-01 RU RU2017106163A patent/RU2665916C2/ru active
- 2015-07-01 MY MYPI2017700095A patent/MY178131A/en unknown
- 2015-07-01 PT PT172023087T patent/PT3309784T/pt unknown
- 2015-07-01 EP EP17202308.7A patent/EP3309784B1/en active Active
- 2015-07-01 JP JP2016552887A patent/JP6208377B2/ja active Active
- 2015-07-01 CN CN201580040591.8A patent/CN106575511B/zh active Active
- 2015-07-01 MX MX2017000805A patent/MX365694B/es active IP Right Grant
- 2015-07-01 PL PL19179575T patent/PL3582221T3/pl unknown
- 2015-07-01 BR BR112017001643-5A patent/BR112017001643B1/pt active IP Right Grant
- 2015-07-01 PL PL17202308T patent/PL3309784T3/pl unknown
- 2015-07-01 NZ NZ728080A patent/NZ728080A/en unknown
- 2015-07-01 HU HUE15739357A patent/HUE037050T2/hu unknown
- 2015-07-01 ES ES19179575T patent/ES2869141T3/es active Active
- 2015-07-01 CN CN202110082903.9A patent/CN112927724B/zh active Active
-
2017
- 2017-01-05 PH PH12017500031A patent/PH12017500031A1/en unknown
- 2017-01-18 MX MX2019005799A patent/MX2019005799A/es unknown
- 2017-09-06 JP JP2017171326A patent/JP6600337B2/ja active Active
- 2017-11-21 US US15/818,848 patent/US10347265B2/en active Active
- 2017-11-30 ZA ZA2017/08141A patent/ZA201708141B/en unknown
-
2019
- 2019-05-10 US US16/408,848 patent/US11114105B2/en active Active
- 2019-05-20 ZA ZA2019/03140A patent/ZA201903140B/en unknown
- 2019-10-04 JP JP2019184033A patent/JP6788086B2/ja active Active
-
2020
- 2020-01-14 RU RU2020100879A patent/RU2760346C2/ru active
-
2021
- 2021-08-03 US US17/392,908 patent/US11636865B2/en active Active
-
2023
- 2023-03-13 US US18/120,483 patent/US20230215447A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2664348T3 (es) | Estimación de ruido de fondo en señales de audio | |
US10096088B2 (en) | Robust regression method for image-space denoising | |
ES2387869T3 (es) | Reconstrucción de datos de audio multicanal | |
US20220130400A1 (en) | Frame error concealment | |
ES2819032T3 (es) | Estimación de ruido de fondo en señales de audio | |
US9602128B2 (en) | Split gain shape vector coding | |
US10490203B2 (en) | Echo cancellation for keyword spotting | |
US20140358527A1 (en) | Inactive Sound Signal Parameter Estimation Method and Comfort Noise Generation Method and System | |
CN111009257A (zh) | 一种音频信号处理方法、装置、终端及存储介质 | |
CN104978966B (zh) | 音频流中的丢帧补偿实现方法和装置 | |
ES2969736T3 (es) | Dispositivo de decodificación y método de decodificación | |
KR101941619B1 (ko) | 음성/오디오 비트스트림 디코딩 방법 및 장치 | |
US11514615B2 (en) | Streaming systems and methods of providing interactive streaming service | |
CN111630594B (zh) | 基音增强装置、其方法以及记录介质 | |
WO2018120290A1 (zh) | 一种基于模板匹配的预测方法及装置 | |
CN118155650A (zh) | 音频丢包恢复方法、装置、电子设备及存储介质 | |
TW201639311A (zh) | 疊代式解碼裝置、疊代式訊號檢驗裝置與資訊更新方法 | |
Tanaka et al. | Special Section on Smart Multimedia & Communication Systems |