MX2015003060A - Generacion de confort acustico. - Google Patents

Generacion de confort acustico.

Info

Publication number
MX2015003060A
MX2015003060A MX2015003060A MX2015003060A MX2015003060A MX 2015003060 A MX2015003060 A MX 2015003060A MX 2015003060 A MX2015003060 A MX 2015003060A MX 2015003060 A MX2015003060 A MX 2015003060A MX 2015003060 A MX2015003060 A MX 2015003060A
Authority
MX
Mexico
Prior art keywords
parameters
frames
subset
sid
active
Prior art date
Application number
MX2015003060A
Other languages
English (en)
Other versions
MX340634B (es
Inventor
Tomas Jansson Toftgård
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Publication of MX2015003060A publication Critical patent/MX2015003060A/es
Publication of MX340634B publication Critical patent/MX340634B/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Mobile Radio Communication Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Se describe un controlador de confort acústico (50) para generar parámetros de control CN (confort acústico). Una memoria intermedia 200 de un tamaño predeterminado se configura para almacenar parámetros CN para tramas SID (descriptor de inserción de silencios) y tramas de persistencia de eco activas. Un selector de subconjuntos (50A) se configura para determinar un subconjunto de parámetros CN pertinentes para tramas SID en función de la antigüedad de los parámetros CN almacenados y en las energías residuales. Un extractor de parámetros de control de confort acústico (50B) se configura para usar el subconjunto de parámetros CN determinados para determinar los parámetros de control CN para una primera trama SID después de una trama de señal activa.

Description

GENERACIÓN DE CONFORT ACÚSTICO CAMPO TÉCNICO La teenología propuesta por lo general se refiere a la generación de confort acústico (CN), y en particular a la generación de parámetros de control de confort acústico.
ESTADO DE LA TÉCNICA En los sistemas de codificación utilizados para voz conversacional es común utilizar la transmisión discontinua (DTX) para aumentar la eficacia de la codificación. Esto es motivado por la gran cantidad de pausas en la voz conversacional, por ejemplo cuando una persona está hablando mientras la otra escucha. Mediante el uso de la DTX, el codificador de voz sólo puede estar activo alrededor de 50 por ciento del tiempo en promedio. Ejemplos de codificado res -decodificadores que tienen esta característica son los codificadores-decodificadores de compresión de banda estrecha de tasa múltiple adaptativa 3GPP (AMR NB) y el codificador ITU-T G.718.
En DTX las tramas activas en operación se codifican en modos de codificación-decodificación normales, mientras que los periodos inactivos de señal entre las regiones activas se representan con confort acústico. Los parámetros de descripción de señal se extraen y se codifican en el codificador y se transmiten en el decodificador en tramas de descripción de inserción de silencios (SID). Las tramas SID se transmiten a una velocidad de cuadros reducida y una velocidad de bits menor que la utilizada para el/los modo(s) de codificación de voz activa. Entre las tramas SID no se transmite información sobre las características de la señal.
Debido a la baja velocidad de SID el confort acústico sólo puede representar propiedades relativamente fijas en comparación con la codificación de tramas de señal activa. En el decodificador, los parámetros recibidos son decodificados y se utilizan para caracterizar el confort acústico. 5 Para la operación de DTX de alta calidad, es decir, sin disminución de la calidad de voz, es importante detectar los períodos de voz en la señal de entrada. Esto se realiza mediante el uso de un detector de actividad de voz (VAD) o un detector de actividad de sonido (SAD). La figura 1 muestra un diagrama en bloque de un VAD general, que analiza la señal de entrada en cuadros de datos (de 5-30 ío ms, dependiendo de la implementación) y produce una decisión de actividad para cada cuadro.
Una decisión de actividad preliminar (decisión de VAD primaria) se hace en un detector de voz primario 12 mediante comparación de las características de la trama actual estimadas mediante un extractor de características 10 y 15 características de fondo calculadas a partir de tramas de entrada anteriores mediante un bloque de cálculo de fondo 14. Una diferencia mayor que un umbral determinado ocasiona la decisión primaria activa. Además en el bloque de adición de persistencia de eco 16 la decisión primaria se extiende con base en decisiones primarias pasadas para formar la decisión de actividad final (decisión VAD final). La 20 principal razón para usar la persistencia de eco es para reducir el riesgo de mutilación media y de fondo en segmentos de voz.
Para codificadores-decodificadores de voz basados en predicción lineal (LP), p. ej. , G.718, es razonable modelarla energía de envolvente y de tramas utilizando una representación similar a la de las tramas activas. Esto es beneficioso 25 ya que los requisitos de memoria y la complejidad para el codificador-decodificador pueden reducirse por la funcionalidad común entre los distintos modos en la operación DTX.
Para tales codificadores-decodificadores el confort acústico puede representarse por sus coeficientes LP (tambien conocidos coeficientes autorregresivos (AR)) y la energía del LP residual, es decir, la señal que como entrada al modelo LP da el segmento de audio de referencia. En el decodificador, una señal residual se genera en el generador de excitación como ruido aleatorio, que se conforma por los parámetros CN para formar el confort acústico.
Los coeficientes LP generalmente se obtienen al calcular las autocorrelaciones r[k] e los segmentos de audio en ventanas x[n], n = 0,... ,N - 1 de acuerdo con lo siguiente: - -donde P es el orden del modelo predefinido. A continuación, los coeficientes LP ai< se obtienen a partir de la secuencia de autocorrelación utilizando, por ejemplo, el algoritmo Levinson-Durbin.
En un sistema de comunicación donde se utiliza dicho codificador-decodificador, los coeficientes LP deben transmitirse eficazmente del codificador al decodificador. Por esta razón se utilizan comúnmente representaciones más compactas que pueden ser menos sensibles al ruido de cuantización. Por ejemplo, los coeficientes LP pueden transformarse en pares espectrales lineales (LSP). En implementaciones alternativas, los coeficientes LP se pueden convertir a su vez a los pares de espectro de imitancia (ISP), frecuencias de espectro lineales (LSF) o frecuencias de espectro de imitancia (ISF).
El residual LP se obtiene mediante el filtrado de la señal de referencia a traves de un filtro de síntesis LP inverso A[z] definido por: La señal residual filtrada s[n] por lo tanto se da mediante: n = 0,...,N-l (3) I para lo cual la energía se define como: (4) Debido a la baja velocidad de transmisión de las tramas SID, los parámetros CN deben evolucionar lentamente con el fin de no cambiar las características del ruido con rapidez. Por ejemplo, el codificador-decodificador G.718 limita el cambio de energía entre tramas SID e interpola los coeficientes LSP para manejar esto.
Para encontrar parámetros CN representativos en las tramas SID, los coeficientes LSP y energía residual se calculan para cada trama, incluso sin tramas de datos (por lo tanto, para tramas sin datos los parámetros mencionados se determinan pero no se transmiten). En la trama SID los coeficientes LSP medios y energía residual promedio se calculan, codifican y transmiten al decodificador. A fin de que el confort acústico no sea estático artificialmente, las variaciones al azar pueden añadirse a los parámetros de confort acústico, por ejemplo, una variación de la energía residual. Esta téenica se utiliza, por ejemplo en codificador-decodificador G.718.
Además, las características de confort acústico no siempre coinciden bien con el ruido de fondo de referencia y una ligera atenuación del confort acústico puede reducir la atención del oyente hacia éste. La calidad de audio percibida puede ser entonces superior. Además, el ruido codificado en tramas de señal activa podría tener menor energía que el ruido de referencia sin codificar. Por lo tanto, la atenuación también puede ser conveniente para el mejor aprovechamiento de la energía de la representación del ruido en tramas activas e inactivas. La atenuación típicamente está en el rango de 0 a 5 dB, y puede ser fija o depender de la velocidad de bits del/los modo(s) de codificación activos.
En sistemas DTX de alta eficiencia se podría usar un VAD más agresivo y en consecuencias las partes con mayor energía de la señal (en relación con el nivel de ruido de fondo) pueden representarse mediante confort acústico. En este caso, limitar el cambio de energía entre las tramas SID podría causar una degradación perceptual. Para manejar mejor los segmentos con alta energía, el sistema puede permitir mayores cambios inmediatos de los parámetros CN para estas circunstancias.
El filtrado de paso bajo o interpolación de los parámetros CN se realiza en las tramas inactivas a fin de obtener una buena dinámica de confort acústico natural y sin alteraciones. Para la primera trama SID siguiendo una o varias tramas activas (a partir de ahora sólo denominadas el "primer SID"), la mejor base para la interpolación LSP y la nivelación de energía serían los parámetros CN de tramas inactivas previas, es decir, antes del segmento de señal activa.
Para cada trama inactiva, SID o sin datos, el vector LSP vector q, se puede interpolar de coeficientes previos de LSP en función de: donde / es el número de tramas inactivas, a e [0, i] es el factor de nivelación y son los coeficientes medios de LSP calculados con parámetros del SID actual y todas las tramas sin datos desde la trama SID previa. Para el codificador-decodificador G.718 se usa un factor de nivelación a = 0.1.
La energía residual E¡ se interpola de forma similar en las tramas SID o sin datos en función de: donde b e [Od] es el factor de nivelación y ESID es la energía promediada para las tramas actuales SID y sin datos desde la trama SID previa. Para el codificador-decodificador G.718 se usa un factor de nivelación b = 0.3.
Un problema con la interpolación descrita es que para el primer SID las memorias de interpolación (E y q ) pueden relacionarse con tramas de alta energía previas, por ejemplo tramas de habla sin voz, que el VAD clasifica como inactivas. En ese caso, la primera interpolación SID sería iniciar desde las características de ruido que no son representativas para el ruido codificado en las tramas de persistencia de eco en modo activo más cercanas. Se produce el mismo problema si las características del ruido de fondo cambian en segmentos de señal activa, por ejemplo segmentos de una señal de voz.
Un ejemplo de los problemas relacionados con las teenologías del estado de técnica se muestra en la figura 2. El espectrograma de una señal de voz ruidosa codificada en una operación DTX muestra dos segmentos de confort acústico antes y después de un segmento de audio codificado activo (como la voz). Se puede observar que cuando las características de ruido desde el primer segmento CN se utilizan para la interpolación en el primer SID, hay un cambio brusco de las características de ruido. Después de un tiempo el confort acústico coincide con el final del audio codificado activo de mejor manera, pero la mala transición provoca una clara degradación de la calidad de audio percibida.
Con factores de nivelación mayores a y b se enfocarían los parámetros CN a las características del SID actual, pero esto aún podría causar problemas. Puesto que los parámetros en el primer SID no pueden promediarse durante un período de ruido, ya que las tramas SID siguientes pueden hacerlo, los parámetros CN sólo se basan en las propiedades de la señal en la trama actual. Estos parámetros podrían representar el ruido de fondo en la trama actual mejor que la característica a largo plazo en las memorias de interpolación. No obstante, es posible que estos parámetros de SID sean valores atípicos, y no representan las características de ruido a largo plazo. Esto, por ejemplo daría como resultado, cambios rápidos no naturales de las características de ruido, y una menor calidad de audio percibida.
BREVE DESCRIPCIÓN DE LA INVENCIÓN Un objeto de la teenología propuesta es superar, al menos uno de los problemas anteriormente mencionados.
Un primer aspecto de la tecnología propuesta implica un metodo de generar parámetros de control CN. El método incluye los pasos siguientes: • Almacenar los parámetros CN para tramas SID y tramas de persistencia de eco en una memoria intermedia de un tamaño predeterminado.
• Determinar un subconjunto de parámetros CN pertinentes para tramas SID en función de la antigüedad de los parámetros CN almacenados y en las energías residuales.
Usar el subconjunto de parámetros CN determinados para determinar los parámetros de control CN para una primera trama SID después de una trama de señal activa.
Un segundo aspecto de la tecnología propuesta implica un programa de cómputo para generar parámetros de control CN. El programa de cómputo comprende unidades de código legibles por computadora que cuando se ejecutan en una computadora hacen que la computadora: • Almacenar los parámetros CN para tramas SID y tramas de persistencia de eco en una memoria intermedia de un tamaño predeterminado.
• Determinar un subconjunto de parámetros CN pertinentes para tramas SID en función de la antigüedad de los parámetros CN almacenados y en las energías residuales.
• Usar el subconjunto de parámetros CN determinados para determinar los parámetros de control CN para una primera trama SID ("primer SID") después de una trama de señal activa.
Un tercer aspecto de la teenología propuesta implica un producto de programa de cómputo, que comprende un medio legible por computadora y un programa de cómputo de acuerdo con el segundo aspecto almacenado en el medio legible por computadora.
Un cuarto aspecto de la tecnología propuesta implica un controlador de confort acústico para generar parámetros de control CN. El aparato incluye: Una memoria intermedia de un tamaño predeterminado configurada para almacenar parámetros CN para tramas SID y tramas de persistencia de eco activas.
· Un selector de subconjuntos configurado para determinar un subconjunto de parámetros CN pertinentes para tramas SID en función de la antigüedad de los parámetros CN almacenados y en las energías residuales.
Un extractor de parámetros de control de confort acústico configurado para usar el subconjunto de parámetros CN determinados para determinar los parámetros de control CN para una primera trama SID despues de una trama de señal activa.
Un quinto aspecto de la tecnología propuesta implica un decodificador inclusive un controlador de confort acústico de acuerdo con el cuarto aspecto.
Un sexto aspecto de la tecnología propuesta implica un nodo de red incluyendo un decodificador de acuerdo con el quinto aspecto.
Un séptimo aspecto de la tecnología propuesta implica un nodo de red incluyendo un controlador de confort acústico de acuerdo con el cuarto aspecto.
Una ventaja de la tecnología propuesta es que mejora la calidad de audio para conmutación entre modos de codificación activos e inactivos para codificadores-decodificadores que operan en el modo DTX. La energía de envolvente y de señal del confort acústico se cotejan con características de señal anteriores de energías semejantes en tramas de persistencia de eco SID y VAD.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La teenología propuesta, juntos con objetos y ventajas adicionales de la misma, pueden comprenderse mejor al hacer referencia a la descripción siguiente tomada juntas con los dibujos adjuntos, en los cuales: La figura 1 es un diagrama de bloques de un VAD generico; La figura 2 es un ejemplo de un espectrograma de una señal de voz ruidosa que ha sido decodificada de acuerdo con soluciones del estado de la técnica para DTX; La figura 3 es un diagrama de bloques de un sistema codificador en un codificador-decodificador; La figura 4 es un diagrama de bloques de una modalidad de ejemplo de un decodificador que implemente el método de generar confort acústico de acuerdo con la tecnología propuesta; La figura 5 es un ejemplo de un espectrograma de una señal de voz ruidosa que ha sido decodificada de acuerdo con la tecnología propuesta; La figura 6 es un diagrama de flujo que ilustra una modalidad de ejemplo del método de acuerdo con la tecnología propuesta; La figura 7 es un diagrama de flujo que ilustra otra modalidad de ejemplo del método de acuerdo con la tecnología propuesta; La figura 8 es un diagrama de bloques que ilustra una modalidad de ejemplo del controlador de confort acústico de acuerdo con la tecnología propuesta; La figura 9 es un diagrama de bloques que ilustra otra modalidad de ejemplo del controlador de confort acústico de acuerdo con la tecnología propuesta; La figura 10 es un diagrama de bloques que ilustra otra modalidad de ejemplo del controlador de confort acústico de acuerdo con la tecnología propuesta; La figura 11 es un diagrama esquemático que muestra algunos componentes de una modalidad de ejemplo de un decodificador, en donde la funcionalidad del decodificador se implementa mediante una computadora; y La figura 12 es un diagrama de bloques que ilustra un nodo de red que 5 incluye un controlador de confort acústico de acuerdo con la teenología propuesta.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN Las modalidades descritas a continuación se relacionan con un ío sistema de codificador y decodificador de audio pensado principalmente para aplicaciones de comunicación de voz utilizando DTX con confort acústico para la representación de la señal inactiva. El sistema que se considera utiliza LP para la codificación de ambas tramas de señal activas e inactivas, donde un VAD se utiliza para decisiones de actividad. 15 En el codificador ¡lustrado en la figura 3, un VAD 18 genera una decisión de actividad que se utiliza para la codificación por parte de un codificador 20 Además, la decisión de la persistencia de eco de VAD se ingresa en el flujo de bits mediante un multiplexor de flujo de bits (MUX) 22 y transmitida al decodificador junto con los parámetros codificados de tramas activas (tramas de persistencia de 20 eco y sin persistencia de eco) y tramas SID.
Las modalidades reveladas forman parte de un decodificador de audio. Tal decodificador 100 se ¡lustra esquemáticamente en la figura 4. Un desmultiplexor de flujo de bits (DEMUX) 24 desmultiplexa el flujo de bits recibido en parámetros codificados y decisiones de persistencia de eco VAD. Las señales desmultiplexadas 25 son reenviadas a un selector de modo 26. Los parámetros codificados recibidos son decodificados en un decodificador de parámetros 28. Los parámetros decodificados son utilizados por un decodificador de tramas activas 30 para decodificar tramas activas del selector de modo 26.
El decodificador 100 tambien incluyen una memoria intermedia 200 de un tamaño predeterminado M y configurada para recibir y almacenar parámetros CN para tramas SID y de persistencia de eco en modo activo, una unidad 300 configurada para determinar cuál de los parámetros CN almacenados que son pertinentes para el SID con base en la antigüedad de los parámetros CN almacenados, una unidad 400 configurada para determinar cuál de los parámetros CN determinados que sean pertinentes para SID con base en mediciones de energía residual, y una unidad 500 configurada para utilizar los parámetros CN determinados que son pertinentes para SID para la primera trama SID tras una(s) trama(s) de señal activa.
Los parámetros en las memorias intermedias se restringen para estar en un orden reciente y pertinente. Con ello, el tamaño de las memorias intermedias utilizadas para la selección de subconjuntos de memorias intermedias pertinentes se reduce durante períodos más largos de codificación activa. Adicionalmente los parámetros almacenados son reemplazados por valores más nuevos durante tramas SID y de persistencia de eco codificadas activamente.
Utilizando memorias intermedias circulares, la complejidad y requerimiento de memoria para el manejo de la memoria intermedia pueden reducirse. En tal implementación, los elementos ya almacenados no tienen que ser movidos cuando se añade un nuevo elemento. La posición del último parámetro agregado, o conjunto de parámetros, se utiliza junto con el tamaño de la memoria intermedia para colocar nuevos elementos. Cuando se agregan nuevos elementos, los elementos antiguos podrían sobrescribirse.
Ya que las memorias intermedias guardan parámetros de tramas SID y de persistencia de eco más antiguas, describen características de señal de tramas de audio que probablemente, pero no necesariamente, contienen ruido de fondo. El número de parámetros que se considera pertinente se define por el tamaño de la memoria intermedia y por el tiempo, o por el número correspondiente de tramas, transcurrido desde que la información fue almacenada.
La teenología revelada aquí puede ser descrita en varios pasos algorítmicos, por ejemplo realizados en el lado del decodificador ilustrado en la figura 4. Estos pasos son: 1a. Paso 1a (realizado por la unidad denominada paso 1a en la figura 4) - actualización de la memoria intermedia para tramas SID y de persistencia de eco: | Para cada trama SID y de persistencia de eco el vector de coeficiente LSP cuantificado q y energía residual cuantificada correspondiente É se almacenan (en la memoria intermedia 200) en las memorias intermedias Qw = { ,- y El índice de posición de memoria intermedia / e [ 0,M - 1] aumenta en uno previo a cada actualización de la memoria intermedia y se restablece si el Índice supera el tamaño de la memoria intermedia M, es decir j 0 if i > M - 1 (8) Como se describirá a continuación, los subconjuntos QK y EK de los últimos elementos almacenados de Ko en QM y EM, respectivamente, definen los conjuntos de parámetros almacenados. 1b. Paso 1b (realizado por la unidad denominada paso 1b en la figura 4) - actualización de la memoria intermedia para tramas activas que no son de persistencia de eco: Durante la decodificación de tramas activas, el tamaño de los subconjuntos QK y EK disminuye en una relación de y1 elementos por trama según: (9) - donde 0 es el número de elementos almacenados en tramas SID y de persistencia de eco previas, h e * y pA es el número tramas activas no consecutivas que no son de persistencia de eco. La tasa de decremento se relaciona con el tiempo, donde y = 25 es factible para tramas de 20 ms. Esto corresponde a una disminución por un elemento cada medio segundo al decodificar tramas activas. La constante de tasa de decremento g puede definirse potencialmente como cualquier valor g e 1+ pero debe elegirse de manera que las características de ruido antiguas que probablemente no representen el ruido de fondo actual sean excluidas de los subconjuntos QK y EK. El valor podría escogerse por ejemplo con base en la dinámica esperada del ruido de fondo. Además, la duración natural de las ráfagas de voz y el comportamiento del VAD pueden ser considerados, ya que son improbables secuencias largas de tramas activas consecutivas. Típicamente la constante estaría en la gama g £ 500 para tramas de 20 ms, que corresponde a menos de 10 segundos. Como alternativa se puede hacer la ecuación (9) de una forma más compacta como: K = K0 -h para h ·g £ pL <(h + \)-y (10) donde Ko es el número de parámetros CN para tramas SID y tramas de persistencia de eco activas almacenadas en la memoria intermedia 200, y es una constante predeterminada, h es un entero no negativo. 2. Paso 2 ( realizado por la unidad denominada paso 2 en la figura) -Selección de elementos de memoria intermedia pertinentes En el primer SID despues de tramas activas un subconjunto de la memoria intermedia EK se selecciona con base en las energías residuales. El subconjunto Ey , E¡ , } c EK de tamaño L se define como: \ - i donde es la última energía residual almacenada, Yi e g2 son límites inferior y superior predeterminados, respectivamente, para energías residuales consideradas como representativas de ruido en una transición de tramas activas a inactivas (por ejemplo gi = 200 e g2 = 20), k0,...,kK , se clasifican de manera que ko corresponda al parámetro CN más reciente y /ÍK-I al parámetro CN más antiguo almacenado.
Típicamente, g2 se selecciona de la gama y, e [q,?qq] ya que valores más grandes incluirían energías residuales mayores comparadas con la última energía residual almacenada . Esto podría causar un avance de la energía de confort acústico que causaría una degradación audible. También es deseable excluir características de la señal de tramas de voz, que tienen generalmente más energía, ya que estas características generalmente no representan el ruido de fondo de manera correcta gi puede ser seleccionado ligeramente mayor que g2, por ejemplo de la gama i e [50,500] ; ya que una reducción en energía es generalmente menos molesta. Además, la probabilidad de incluir características de señal de la voz es por lo general menor para tramas con una energía residual menor que E^ de lo que es para las tramas con una energía residual superior a £ .
Cabe señalar que las energías E^ pueden también representarse, como en un dominio lineal, en un dominio logarítmico, por ejemplo dB. Con energías en el dominio logarítmico la selección de los elementos de memoria intermedia relevantes, tal como se especifica en la ecuación (11), se describe como equivalente con las energías en el dominio lineal como: | , _ donde iog(-7, ) = -y, y log(y2) = y2. Límites adecuados que especifiquen el subconjunto de la memoria intermedia EK se dan por ejemplo mediante 7 - 0.7 v y, = 1.03 o y, e[0.5,0.9] y y, e [l .0,1.25] .
Los vectores correspondientes en la memoria intermedia LSP Q definen el subconjunto 3. Paso 3 (realizado por la unidad denominada paso 3 en la figura 4) -Determinación de los parámetros representativos de confort acústico Para encontrar una energía residual representativa la media ponderada del subconjunto Esse calcula como: donde Wks son los elementos en el subconjunto de ponderaciones: para y/ E e E Para un tamaño máximo de memoria intermedia M = 8 un conjunto adecuado de ponderaciones es: w'w = {0.2, 0.16, 0.128, 0.1024, 0.08192, 0.065536, 0.0524288, 0.01048576} Esto significa que las energías recientes tienen más peso en la media de energía residual E, que hace que la transición de energía entre tramas activas e inactivas sea más uniforme.
Entre vectores LSP en el subconjunto Qs, el vector promedio LSP se selecciona al calcular las distancias entre todos los vectores LCP en la memoria intermedia del subconjunto Es según: - donde <l] m son los elementos en el vector q) Para cada vector LSP, la distancia a los demás vectores se suman, es decir La mediana del vector LSP se da por el vector con la distancia menor a los otros vectores en la memoria intermedia del subconjunto, es decir | - Si varios vectores tienen la misma distancia total, la mediana puede elegirse arbitrariamente entre esos vectores.
Como alternativa, un vector LSP representativo puede determinarse como el vector promedio del subconjunto Qs. 4. Paso 4 (realizado por la unidad denominada paso 4 en la figura 4) -Interpolación de los parámetros de confort acústico para la primera trama SID La mediana de LSP o vector mediano q y la energía residual promedio £ se utilizan en la interpolación de parámetros CN en la primera trama SID como se describe en la ecuación (5) y (6) con: Los valores de q.... £,//;, se obtienen a partir del decodificador de parámetros 28. Los factores de nivelación a e [q,?] v b <= [q,?] pueden ser diferentes para la primera trama SID de los factores utilizados en el SID siguiente y la interpolación de tramas sin datos de parámetros CN. Además, los factores podrían depender por ejemplo de una medida que describa con más detalle la fiabilidad de los parámetros determinados, q y ? por ejemplo el tamaño de los subconjuntos Qs y Es. Valores adecuados son por ejemplo a = 0.2 y b = 0.2 y b = 0.05. Los parámetros de confort acústico para la primera trama SID son utilizados a continuación por un generador de confort acústico 32 para controlar el llenado de tramas sin datos del selector de modo 26 con ruido con base en excitaciones de generador de excitación 34.
Si los subconjuntos Qs y Es están vacíos, los últimos parámetros SID extraídos pueden usarse directamente sin interpolación de parámetros de ruido más antiguos.
El vector LSP transmitido ¾.v® usado en la interpolación está en el codificador obtenido por lo general directamente del análisis LP de la trama actual, es decir no se consideran tramas previas. La energía residual transmitida EW preferentemente se obtiene mediante parámetros LP correspondientes a los parámetros LSP utilizados para la síntesis de señal en el decodificador. Estos parámetros LSP pueden obtenerse en el codificador al realizar los pasos 1 -4 con una memoria intermedia correspondiente del lado del codificador. Operar el codificador de este modo implica que la energía del decodificador de salida se puede cotejar con la energía de la señal de entrada mediante el control de la energía residual codificada y transmitida ya que los parámetros LP de síntesis del decodificador se conocen en el codificador.
La figura 5 es un ejemplo de un espectrograma de una señal de voz ruidosa que ha sido decodificada de acuerdo con la teenología propuesta. El espectrograma corresponde al espectrograma de la figura 2, es decir, se basa en la misma señal de entrada del lado del codificador. Al comparar los espectrogramas del estado de la tecnica (figura 2) y la solución propuesta (figura 5), se observa claramente que la transición entre el audio codificado activamente y la segunda región de confort acústico es más uniforme para el segundo. En este ejemplo, un subconjunto de las características de señal en las tramas de persistencia de eco VAD se usa para obtener la transición uniforme. Para otras señales con segmentos más cortos de tramas activas las memorias intermedias de parámetros también podrían contener parámetros de cierre en tramas SID de tiempo.
Si bien es cierto que sólo habrá una primera trama SID después de una trama de señal activa, indirectamente afectará los parámetros CN al seguir las tramas SID debido a la nivelación/interpolación.
La figura 6 es un diagrama de flujo que ilustra una modalidad de ejemplo del método de acuerdo con la teenología propuesta. El paso S1 almacena los parámetros CN para tramas SID y tramas de persistencia de eco en una memoria intermedia de un tamaño predeterminado. El paso S2 determina un subconjunto de parámetros CN pertinentes para tramas SID en función de la antigüedad de los parámetros CN almacenados y en las energías residuales. El paso S3 utiliza el subconjunto de parámetros CN determinado para determinar los parámetros de control CN para una primera trama SID tras una trama de señal activa (en otras palabras, determina los parámetros de control CN para una primera trama SID tras una trama de señal activa con base en el subconjunto de parámetros CN determinado).
La figura 7 es un diagrama de flujo que ilustra otra modalidad de ejemplo del método de acuerdo con la tecnología propuesta. La figura ilustra los pasos del método realizados para cada trama. Diferentes partes de la memoria intermedia (como 200 en la figura 4) se actualizan en función de si la trama es una trama activa sin persistencia de eco o una trama SID/de persistencia de trama (decidido en el paso A, que corresponde al selector de modo 26 de la figura 4). Si la trama es una trama SID o de persistencia de eco, el paso 1a (corresponde a la unidad que se indica como paso 1a en la figura 4) actualiza la memoria intermedia con nuevos parámetros CN, por ejemplo, tal como se describe en la subsección 1a arriba. Si la trama es una trama activa sin persistencia de eco, el paso 1b (corresponde a la unidad que se indica como paso 1b en la figura 4) actualiza el tamaño de un subconjunto restringido por la antigüedad de los parámetros CN almacenados con base en el número de tramas activas sin persistencia de eco, por ejemplo, tal como se describe en la subsección 1b anterior. El paso 2 (corresponde a la unidad que se indica como paso 2 en la figura 4) selecciona el subconjunto de parámetros CN del subconjunto restringido por la antigüedad con base en energías residuales, por ejemplo, tal como se describe en la subsección 2 anterior. El paso 3 (corresponde a la unidad que se indica como paso 3 en la figura 4) determina los parámetros CN representativos del subconjunto de parámetros CN, por ejemplo, tal como se describe en la subsección 3 anterior. El paso 4 (corresponde a la unidad que se indica como paso 4 en la figura 4) interpola los parámetros CN representativos con parámetros CN decodificados, por ejemplo, tal como se describe en la subsección 4 anterior. El paso B reemplaza la trama actual con la siguiente trama, y a continuación se repite el procedimiento con esa trama.
La figura 8 es un diagrama de bloques que ilustra una modalidad de ejemplo del controlador de confort acústico 50 de acuerdo con la teenología propuesta. Una memoria intermedia 200 de un tamaño predeterminado se configura para almacenar parámetros CN para tramas SID y tramas de persistencia de eco activas. Un selector de subconjuntos 50A se configura para determinar un subconjunto de parámetros CN pertinentes para tramas SID en función de la antigüedad de los parámetros CN almacenados y en las energías residuales. Un extractor de parámetros de control de confort acústico 50B se configura para usar el subconjunto de parámetros CN determinados para determinar los parámetros de control CN para una primera trama SID ("primer SID") después de una trama de señal activa.
La figura 9 es un diagrama de bloques que ilustra otra modalidad de ejemplo del controlador de confort acústico 50 de acuerdo con la tecnología propuesta. Un actualizador de memoria intermedia para la trama SID y de persistencia de eco 52 se configura para actualizar tramas SID y tramas de persistencia de eco activas, la memoria intermedia 200 con nuevos parámetros CN q,£ por ejemplo, como se describe en la subsección 1a arriba. Un actualizador de memoria intermedia para trama activa sin persistencia de eco 54 se configura para actualizar, para tramas no activas sin persistencia de eco, el tamaño K de un subconjunto restringido por antigüedad QK, EK de los parámetros CN almacenados con base en el número PA de tramas activas sin persistencia de eco consecutivas, por ejemplo, tal como se describe en la subsección 1b anterior. Un selector de elemento de memoria intermedia 300 se configura para seleccionar el subconjunto de parámetros CN Qs, Es del subconjunto restringido por antigüedad QK, EK con base en energías residuales, por ejemplo, tal como se describe en la subsección 2 arriba. Un calculador de parámetros de confort acústico 400 se configura para determinar parámetros CN representativos q,£ del subconjunto de parámetros CN Qs, Es, por ejemplo como se describe bajo la subsección 3. Un interpolador de parámetros de confort acústico 500 se configura para interpolar los parámetros CN representativos q,E con parámetros CN decodificados qsrp,Esm por ejemplo, como se describe en la subsección 4 arriba. Los parámetros de control de confort acústico para la primera trama SID son utilizados a continuación por un generador de confort acústico 32 para controlar el llenado de tramas sin datos con ruido con base en excitaciones del generador de excitación 34.
Los pasos, funciones, procedimientos y/o bloques descritos en este documento pueden implementarse en hardware utilizando cualquier teenología convencional, tales como circuitos discretos o tecnología de circuitos integrados, incluyendo circuitos electrónicos de propósito general y circuitos para aplicaciones específicas.
Como alternativa, al menos algunos de los pasos, funciones, procedimientos y/o bloques descritos aquí pueden implementarse en software para su ejecución en un equipo de procesamiento adecuado. Este equipo puede incluir, por ejemplo, uno o varios microprocesadores, uno o varios procesadores de señal digital (DSP), uno o varios circuitos integrados de aplicación específica (ASIC), aceleración por hardware para video o uno o más dispositivos adecuados de lógica programable, como matrices de compuerta programadles in situ (FPGA). Las combinaciones de estos elementos de procesamiento también son factibles.
También se debe entender que puede ser posible volver a usar las capacidades de procesamiento generales ya presentes en un nodo de red, como una terminal móvil o computadora. Esto puede conseguirse, por ejemplo, al reprogramar el software existente o mediante la adición de nuevos componentes de software.
La figura 10 es un diagrama de bloques que ilustra otra modalidad de 5 ejemplo de un controlador de confort acústico 50 de acuerdo con la teenología propuesta. Esta modalidad se basa en un procesador 62, por ejemplo, un microprocesador que ejecuta un programa de cómputo para generar parámetros de control CN. El programa se almacena en la memoria 64. El programa incluye una unidad de código 66 para almacenar los parámetros CN para tramas SID y tramas ío activas de persistencia de eco en una memoria intermedia de un tamaño predeterminado, una unidad de código 68 para determinar un subconjunto de parámetros CN pertinentes para tramas SID en función de la antigüedad de los parámetros CN almacenados y de las energías residuales, y una unidad de código 70 para usar el subconjunto de parámetros CN determinado para determinar los 15 parámetros de control CN para una primera trama SID tras una trama de señal activa. El procesador 62 se comunica con la memoria 64 sobre un bus del sistema. Las entradas son recibidas por un controlador de entrada/salida (l/O) 72 que controla un bus de l/O, al cual están conectados el procesador 62 y la memoria 64. Los parámetros de control CN q , E / obtenidos del programa se 20 generan desde la memoria 64 mediante el controlador de l/O S 72 sobre el bus de l/O.
De acuerdo con un aspecto de las modalidades, se proporciona un decodificador para generar confort acústico que representa una señal inactiva. El decodificador puede funcionar en modo DTX y puede ser ejecutado en una terminal móvil y por un programa de cómputo que puede ser implementado en la terminal móvil o computadora. El producto de programa de cómputo se puede descargar desde un servidor a la terminal móvil.
La figura 11 es un diagrama esquemático que muestra algunos componentes de una modalidad de ejemplo de un decodificador, en donde la funcionalidad del decodificador se implementa mediante una computadora. El equipo consta de un procesador 62, que es capaz de ejecutar instrucciones de software contenidas en un programa de cómputo almacenado en un producto de programa de cómputo. Además, la computadora comprende al menos un producto de programa de cómputo en forma de una memoria no volátil 64 o memoria volátil, por ejemplo, una memoria EEPROM (memoria de sólo lectura programable y borrable electricamente), una memoria flash, una unidad de disco o memoria RAM (memoria de acceso aleatorio). El programa de cómputo permite almacenar parámetros CN para tramas SID y de persistencia de eco en modo activo en una memoria intermedia de un tamaño predeterminado, determinar cuál de los parámetros CN almacenados son pertinentes para el SID en función de la antigüedad de los parámetros CN almacenados y las mediciones de energía residual, y utilizar los parámetros CN determinados que son relevantes para SID para calcular los parámetros CN en la primera trama SID tras una(s) señal(es) activa(s).
La figura 12 es un diagrama de bloques que ilustra un nodo de red 80 que incluye un controlador de confort acústico 50 de acuerdo con la teenología propuesta. El nodo de red 80 comúnmente es un equipo de usuario (UE), como una terminal móvil o una computadora. El controlador de confort acústico 50 puede ser proporcionado en un decodificador 100, como se indica por las líneas de puntos. Como alternativa, puede proporcionarse en un codificador, como se ha señalado anteriormente.
En las modalidades de la tecnología propuesta descritas anteriormente, los coeficientes LP ak se transforman a un dominio LSP. Sin embargo, los mismos principios pueden aplicarse también a coeficientes LP que se transforman a un dominio LSF, ISP o ISF.
Para codificadores-decodificadores con atenuación del confort acústico puede ser benéfico atenuar gradualmente la señal codificada activamente durante las tramas de persistencia de eco VAD. La energía para el confort acústico sería mejor coincidencia para la última trama codificada activa, lo que mejora aún más la calidad de audio percibida. Un factor de atenuación l puede calcularse y aplicarse al residual LP para cada trama de persistencia de eco mediante: f] = l·f] (18) con /. = max i 0.6. (19) 1 + 0.1 pm ) donde PHO es el número de tramas de persistencia de eco VAD consecutivas. Como alternativa l puede calcularse como: donde L = 0.6 y o = 6 controlan la máxima atenuación y la tasa de atenuación. La máxima atenuación puede seleccionarse típicamente en la escala L = [0.5,1 ) y el parámetro de control de velocidad Lo por ejemplo se puede seleccionar de manera que ¿0 donde pU 1 es el número de tramas necesarias para máxima ~ atenuación. p™J podría por ejemplo fijarse al promedio o el número máximo de tramas de persistencia de eco VAD consecutivas de lo posible (debido a la adición de persistencia de eco en el VAD). Por lo general esto estaría en la escala de PH = jl,...,15} tramas.
Debe entenderse que la teenología descrita aquí puede cooperar con otras soluciones que manejan las primeras tramas CN tras segmentos de señal activos. Por ejemplo, puede complementar un algoritmo donde un cambio grande en parámetros de CN está permitido para tramas de alta energía (con respeto al nivel del ruido de fondo). Para estas tramas las características de ruido anteriores podrían no afectar mucho la actualización en la trama SID actual. La tecnología descrita entonces puede ser utilizada para tramas que no son detectadas como tramas de alta energía.
Los expertos en la teenica entenderán que pueden hacerse varias modificaciones y cambios a la tecnología propuesta sin desviarse del alcance de la misma, que se define por las reivindicaciones anexas.
Abreviaturas ACELP Predicción lineal excitada por código algebraico AMR Tasa múltiple adaptativa AMR NB Banda estrecha de AMR AR Auto rreg resi vo ASIC Circuitos integrados de aplicación específica CN Confort acústico DFT Transformada discreta de Fourier DSP Procesadores de señal digital DTX Transmisión discontinua EEPROM Memoria de sólo lectura programable y borrable eléctricamente FPGA Matrices de compuerta programables in situ ISF Frecuencias de espectro de imitancia ISP Pares de espectro de imitancia LP Predicción lineal LSF Frecuencias de espectro lineal LSP Pares de espectro lineal MDCT Transformada de coseno discreta modificada RAM Memoria de acceso aleatorio SAD Detector de actividad de sonido SID Descriptor de inserción de silencio UE Equipo de usuario VAD Detector de actividad de voz

Claims (17)

REIVINDICACIONES
1. Un metodo para generar confort acústico, CN, parámetros de control, caracterizado por: almacenar (S1 ; 1a) parámetros ( para el descriptor de inserción de silencio, SID, tramas y tramas de persistencia de eco en una memoria intermedia (200) de un tamaño predeterminado ( M)\ determinar (S2; 1b, 2) un subconjunto de parámetros CN (Qs, Es) pertinentes para tramas SID en función de la antigüedad de los parámetros CN almacenados y en las energías residuales; usar (S3, 3, 4) el subconjunto de parámetros CN determinados (Qs, Es) para determinar los parámetros de control CN para una primera trama SID ("primer SID") después de una trama de señal activa.
2. El método de la reivindicación 1, caracterizado por: actualizar (1a), para tramas de SID y tramas de persistencia de eco activas, la memoria intermedia (200) con nuevos parámetros CN ; actualizar (1b), para tramas activas sin persistencia de eco, el tamaño K de un subconjunto restringido por la antigüedad (QK, EK) de los parámetros CN almacenados con base en el número PA de tramas activas sin persistencia de eco consecutivas; seleccionar (2) el subconjunto de parámetros CN (Qs, Es) del subconjunto restringido por la antigüedad (QK, EK) con base en energías residuales; determinar (3) parámetros CN representativos (q,£) del subconjunto de parámetros CN (Qs, Es); interpolar los parámetros CN representativos (q,£) con parámetros CN decodificados (qSü,£TO) .
3. El metodo de la reivindicación 2, caracterizado por actualizar (1b), para tramas no activas sin persistencia de eco, el tamaño K del subconjunto restringido por la antigüedad (QK, EK) de acuerdo con: E = K0 - h para h ·g £ pA < {h + 1) ·g donde Ko es el número de parámetros CN para tramas SID y tramas de persistencia de eco activas almacenadas en la memoria intermedia 200, g es una constante predeterminada, h es un entero no negativo.
4. El método de la reivindicación 2 ó 3, caracterizado por seleccionar (2) el subconjunto de parámetros CN (Qs, Es) del subconjunto restringido por la antigüedad (QK, EK) al incluir sólo parámetros CN para los cuales: - _ donde Ekt, es la última energía residual almacenada, Yi e g2 son límites superior e inferior predeterminados, respectivamente, para energías residuales consideradas representativas de ruido en una transición de tramas activas a inactivas, ko . kK- 1 se clasifican de manera que ko corresponde al último parámetro CN almacenado y /o<-i al parámetro CN más antiguo almacenado.
5. El método de la reivindicación 2, 3 ó 4, caracterizado por determinar (3) parámetros CN representativos q, E del subconjunto de parámetros CN (Qs, Es), donde q es el vector medio de un conjunto Qs de vectores en el subconjunto de parámetros CN (Qs, Es) que representan autorregresivo, AR, coeficientes y £ es una energía residual promedio ponderada de un conjunto E5 de energías residuales en el subconjunto de parámetros CN seleccionado (Qs, Es).
6. El método de la reivindicación 5, caracterizado en que el vector medio q representa los coeficientes AR como pares espectrales lineales.
7. Un programa de cómputo para generar confort acústico, CN, parámetros de control, que comprende unidades de código legibles por computadora que, cuando se ejecutan en una computadora (60) hacen que la computadora: almacene (66; S1 ; 1a) parámetros CN ) para el descriptor de inserción de silencio, SID, tramas y tramas de persistencia de eco en una memoria intermedia (200) de un tamaño predeterminado ( M) determine (68; S2; 1b, 2) un subconjunto de parámetros CN (Qs, Es) pertinentes para tramas SID en función de la antigüedad de los parámetros CN almacenados y en las energías residuales; use (68; S3, 3, 4) el subconjunto de parámetros CN determinados (Qs, Es) para determinar los parámetros de control CN (V,,-E,) para una primera trama SID ("primer SID") después de una trama de señal activa.
8. Un producto de programa de cómputo, que comprende un medio legible por computadora y un programa de cómputo de acuerdo con la reivindicación 7 almacenado en el medio legible por computadora.
9. Un controlador de confort acústico (50) para generar confort acústico, CN, parámetros de control, caracterizado por: una memoria intermedia (200) de un tamaño predeterminado ( M ) configurada para almacenar parámetros CN para tramas SID y tramas de persistencia de eco activas; un selector de subconjuntos (50A; 54, 300) configurado para determinar un subconjunto de parámetros CN (Qs, Es) relevantes para el descriptor de inserción de silencios, SID, tramas basadas en la antigüedad de los parámetros CN almacenados y en energías residuales; un extractor de parámetros de control de confort acústico (50B; 400, 500) configurado para usar el subconjunto de parámetros CN determinados (Qs, Es) para determinar los parámetros de control CN (q/,£'í) para una primera trama SID ("primer SID") despues de una trama de señal activa.
10. El controlador (50) de la reivindicación 9, caracterizado por: un actualizador de memoria intermedia para la trama SID y de persistencia de eco (52) configurada para actualizar para tramas SID y tramas de persistencia de eco activas, la memoria intermedia (200) con nuevos parámetros CN ; un actualizador de memoria intermedia para trama sin persistencia de eco (54) configurada para actualizar, para tramas sin persistencia de eco activas, el tamaño K de un subconjunto restringido por la antigüedad ( QK , EK) de los parámetros CN almacenados con base en el número PA de tramas sin persistencia de eco activas consecutivas; un selector de elemento de memoria intermedia (300) configurado para seleccionar el subconjunto de parámetros CN (Qs, Es) del subconjunto restringido por la antigüedad (QK, EK) con base en energías residuales; un calculador de parámetros de confort acústico (400) configurado para determinar (3) parámetros CN representativos CN del subconjunto de parámetros CN (Qs , Es ); un interpolador de parámetros de confort acústico (500) configurado para interpolar los parámetros CN representativos (q,£) con parámetros CN decodificados
11. El controlador (50) de la reivindicación 10, caracterizado en que el selector de elemento de memoria intermedia (300) se configura para actualizar (1 b), para tramas no activas sin persistencia de eco, el tamaño K del subconjunto restringido por la antigüedad (QK, EK) de acuerdo con: K = K0 -h para h ·g < pL < (h + l) g donde Ko es el número de parámetros CN para tramas SID y tramas de persistencia de eco activas almacenadas en la memoria intermedia 200, Y es una constante predeterminada, h es un entero no negativo.
12. El controlador (50) de la reivindicación 10 u 11 , caracterizado en que el selector de elemento de memoria intermedia (300) está configurado para seleccionar el subconjunto de parámetros CN (Qs, Es) del subconjunto restringido por la antigüedad (QK, EK) al incluir sólo parámetros CN en los que: Ei ~Yl < Ek < -¾ + y 2 Para k = kQ ..., kK donde Ek„ es la última energía residual almacenada, Yi e g2 son límites superior e inferior predeterminados, respectivamente, para energías residuales consideradas representativas de ruido en una transición de tramas activas a inactivas, ko . kKA se clasifican de manera que ko corresponde al último parámetro CN almacenado y k«-i al parámetro CN más antiguo almacenado.
13. El controlador (50) de la reivindicación 10, 11 ó 12, caracterizado en que el calculador de parámetros de confort acústico (400) está configurado para determinar parámetros CN representativos q, £del subconjunto de parámetros CN (Qs, Es), donde q es el vector medio de un conjunto Qs de vectores en el subconjunto de parámetros CN (Qs, Es) que representan autorregresivo, AR, coeficientes y É es una energía residual promedio ponderada de un conjunto E de energías residuales en el subconjunto de parámetros CN seleccionado (Qs, Es).
14. Un decodificador (100), que incluye un controlador de confort acústico (50) de conformidad con cualquiera de las reivindicaciones anteriores 9-13.
15. Un nodo de red (80) que incluye un decodificador (100) de acuerdo con la reivindicación 14.
16. Un decodificador (80) que incluye un controlador de confort acústico (50) de conformidad con cualquiera de las reivindicaciones anteriores 9-13.
17. El nodo de la red (80) de cualquiera de las reivindicaciones precedentes 14-16, en donde el nodo de red es una terminal móvil. RESUMEN DE LA INVENCIÓN Se describe un controlador de confort acústico (50) para generar parámetros de control CN (confort acústico). Una memoria intermedia 200 de un tamaño predeterminado se configura para almacenar parámetros CN para tramas SID (descriptor de inserción de silencios) y tramas de persistencia de eco activas. Un selector de subconjuntos (50A) se configura para determinar un subconjunto de parámetros CN pertinentes para tramas SID en función de la antigüedad de los parámetros CN almacenados y en las energías residuales. Un extractor de parámetros de control de confort acústico (50B) se configura para usar el subconjunto de parámetros CN determinados para determinar los parámetros de control CN para una primera trama SID despues de una trama de señal activa.
MX2015003060A 2012-09-11 2013-05-07 Generacion de confort acustico. MX340634B (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261699448P 2012-09-11 2012-09-11
PCT/EP2013/059514 WO2014040763A1 (en) 2012-09-11 2013-05-07 Generation of comfort noise

Publications (2)

Publication Number Publication Date
MX2015003060A true MX2015003060A (es) 2015-07-14
MX340634B MX340634B (es) 2016-07-19

Family

ID=48289221

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2015003060A MX340634B (es) 2012-09-11 2013-05-07 Generacion de confort acustico.

Country Status (24)

Country Link
US (5) US9443526B2 (es)
EP (2) EP2823479B1 (es)
JP (1) JP5793636B2 (es)
KR (1) KR101648290B1 (es)
CN (1) CN104584120B (es)
AP (1) AP2015008251A0 (es)
AU (1) AU2013314636B2 (es)
BR (1) BR112015002826B1 (es)
CA (1) CA2884471C (es)
CL (1) CL2015000540A1 (es)
DK (1) DK2823479T3 (es)
ES (2) ES2547457T3 (es)
HK (1) HK1206861A1 (es)
HU (1) HUE027963T2 (es)
IN (1) IN2014DN08789A (es)
MA (1) MA37890B1 (es)
MX (1) MX340634B (es)
MY (1) MY185490A (es)
PH (1) PH12014502232A1 (es)
PL (2) PL2823479T3 (es)
PT (1) PT2823479E (es)
RU (2) RU2658544C1 (es)
SG (1) SG11201500595TA (es)
WO (1) WO2014040763A1 (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX340634B (es) * 2012-09-11 2016-07-19 Ericsson Telefon Ab L M Generacion de confort acustico.
PL3550562T3 (pl) * 2013-02-22 2021-05-31 Telefonaktiebolaget Lm Ericsson (Publ) Sposoby i urządzenia dla zawieszenia DTX w kodowaniu audio
CN104217723B (zh) * 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
US9775110B2 (en) * 2014-05-30 2017-09-26 Apple Inc. Power save for volte during silence periods
CN106575511B (zh) 2014-07-29 2021-02-23 瑞典爱立信有限公司 用于估计背景噪声的方法和背景噪声估计器
GB2532041B (en) * 2014-11-06 2019-05-29 Imagination Tech Ltd Comfort noise generation
EP3815082B1 (en) * 2018-06-28 2023-08-02 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive comfort noise parameter determination
US10805191B2 (en) 2018-12-14 2020-10-13 At&T Intellectual Property I, L.P. Systems and methods for analyzing performance silence packets
CN116348951A (zh) * 2020-07-30 2023-06-27 弗劳恩霍夫应用研究促进协会 用于编码音频信号或用于解码经编码音频场景的设备、方法及计算机程序
WO2024056701A1 (en) * 2022-09-13 2024-03-21 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive stereo parameter synthesis

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5630016A (en) * 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
AU1352999A (en) 1998-12-07 2000-06-26 Mitsubishi Denki Kabushiki Kaisha Sound decoding device and sound decoding method
GB2356538A (en) * 1999-11-22 2001-05-23 Mitel Corp Comfort noise generation for open discontinuous transmission systems
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US20100106490A1 (en) * 2007-03-29 2010-04-29 Jonas Svedberg Method and Speech Encoder with Length Adjustment of DTX Hangover Period
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
EP4243017A3 (en) * 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
AU2012218778B2 (en) * 2011-02-15 2016-10-20 Voiceage Evs Llc Device and method for quantizing the gains of the adaptive and fixed contributions of the excitation in a celp codec
MX340634B (es) * 2012-09-11 2016-07-19 Ericsson Telefon Ab L M Generacion de confort acustico.

Also Published As

Publication number Publication date
US20160293170A1 (en) 2016-10-06
US10381014B2 (en) 2019-08-13
US10891964B2 (en) 2021-01-12
PT2823479E (pt) 2015-10-08
US20170352354A1 (en) 2017-12-07
PL2823479T3 (pl) 2015-10-30
HUE027963T2 (en) 2016-11-28
CA2884471A1 (en) 2014-03-20
PH12014502232B1 (en) 2014-12-15
JP2015525896A (ja) 2015-09-07
EP2927905B1 (en) 2017-07-12
ES2547457T3 (es) 2015-10-06
MY185490A (en) 2021-05-19
RU2658544C1 (ru) 2018-06-22
EP2823479A1 (en) 2015-01-14
EP2823479B1 (en) 2015-07-08
US9779741B2 (en) 2017-10-03
JP5793636B2 (ja) 2015-10-14
US11621004B2 (en) 2023-04-04
US20190318752A1 (en) 2019-10-17
KR101648290B1 (ko) 2016-08-12
US9443526B2 (en) 2016-09-13
WO2014040763A1 (en) 2014-03-20
MA37890B1 (fr) 2017-11-30
DK2823479T3 (en) 2015-10-12
MA37890A1 (fr) 2016-12-30
IN2014DN08789A (es) 2015-05-22
AU2013314636B2 (en) 2016-02-25
ES2642574T3 (es) 2017-11-16
RU2609080C2 (ru) 2017-01-30
SG11201500595TA (en) 2015-04-29
CL2015000540A1 (es) 2015-07-31
RU2014150326A (ru) 2016-07-10
BR112015002826A2 (pt) 2018-05-22
HK1206861A1 (zh) 2016-01-15
AU2013314636A1 (en) 2015-03-19
AP2015008251A0 (en) 2015-02-28
BR112015002826B1 (pt) 2021-05-04
CA2884471C (en) 2016-12-20
CN104584120A (zh) 2015-04-29
PL2927905T3 (pl) 2017-12-29
CN104584120B (zh) 2016-08-31
US20150235648A1 (en) 2015-08-20
MX340634B (es) 2016-07-19
KR20150054716A (ko) 2015-05-20
US20210166704A1 (en) 2021-06-03
PH12014502232A1 (en) 2014-12-15
EP2927905A1 (en) 2015-10-07

Similar Documents

Publication Publication Date Title
US10891964B2 (en) Generation of comfort noise
KR101941978B1 (ko) 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
KR101957905B1 (ko) 시간 도메인 여기 신호를 기초로 하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
CN107818789A (zh) 解码方法和解码装置
JP6584431B2 (ja) 音声情報を用いる改善されたフレーム消失補正
RU2707144C2 (ru) Аудиокодер и способ для кодирования аудиосигнала
TWI728277B (zh) 音調滯後選擇技術

Legal Events

Date Code Title Description
FG Grant or registration