ES2559307T3

ES2559307T3 - Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable

Info

Publication number: ES2559307T3
Application number: ES07725316.9T
Authority: ES
Inventors: Juergen Herre; Bernhard Grill; Markus Multrus; Stefan Bayer; Ulrich Kraemer; Jens Hirschfeld; Stefan Wabnik; Gerald Schuller
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2006-06-30
Filing date: 2007-05-16
Publication date: 2016-02-11
Anticipated expiration: 2027-05-16
Also published as: PL2038879T3; AR061696A1; IL195983A0; MY142675A; NO340436B1; AU2011200461A1; EP2038879B1; AU2007264175A1; KR20090025304A; KR101145578B1; CA2656423C; CA2656423A1; EP2038879A1; HK1128811A1; BRPI0712625A2; MX2008016163A; JP2009541802A; BRPI0712625B1; RU2009103010A; TW200809771A

Abstract

Codificador de audio para codificar una senal de audio, que comprende: un pre-filtro (12) para generar una senal de audio pre-filtrada, teniendo el pre-filtro una caracteristica de deformacion de frecuencia variable, siendo la caracteristica de deformacion de frecuencia controlable en respuesta a una senal de control que varia en el tiempo, indicando la senal de control una caracteristica de deformacion de frecuencia pequena o ninguna o una caracteristica de deformacion de frecuencia comparativamente alta; un controlador (18) para proporcionar la senal de control que varia en el tiempo, dependiendo la senal de control que varia en el tiempo de la senal de audio; y un procesador de codificacion controlable (22) para procesar la senal de audio pre-filtrada para obtener una senal de audio codificada, en el que el procesador de codificacion se controla para procesar la senal de audio pre-filtrada de acuerdo con un primer algoritmo de codificacion (22a) adaptado a un patron de senal del habla, o de acuerdo con un segundo algoritmo de codificacion (22b) diferente adecuado para codificar una senal de musica.

Description

imagen1

imagen2

imagen3

imagen4

imagen5

imagen6

imagen7

imagen8

imagen9

modo que, después del prefiltrado, las porciones psicoacústicamente más importantes se amplifican con respecto a las porciones psicoacústicamente menos importantes. En el lado del decodificador, el postfiltro se implementa como un filtro para regenerar una situación similar a una situación antes de prefiltrado, es decir, un filtro inverso que amplifica porciones menos importantes con respecto a porciones más importantes de modo que la señal después

5 del postfiltrado es al margen de los errores de codificación similar a la señal de audio original introducida en el codificador.

Los coeficientes de filtro para el prefiltro anteriormente descrito se transmiten también preferentemente mediante información secundaria desde el codificador al decodificador.

10 Típicamente, el prefiltro así como el postfiltro se implementarán como un filtro FIR deformado, una estructura del cual se ilustra en la Figura 4, o como un filtro digital IIR deformado. El filtro de la Figura 4 se describe en detalle en [KHL 97]. Ejemplos de filtros IIR deformados se muestran también en [KHL 97]. Todos estos filtros digitales tienen en común que tienen elementos de retardo deformados 60 y coeficientes de ponderación o elementos de ponderación

15 indicados mediante β0, . β1, β2 .,.... Una estructura de filtro se transforma a un filtro deformado, cuando un elemento de retardo en una estructura de filtro sin deformar (no mostrado en este punto) se sustituye por un filtro paso todo, tal como un filtro paso todo de primer orden D(z), como se ilustra en ambos lados de las estructuras de filtro en la Figura 4. Una implementación computacionalmente eficaz de la estructura izquierda se muestra a la derecha de la Figura 4, donde se muestra el uso explícito del factor de deformación λ y la implementación de la misma.

20 Por lo tanto, la estructura de filtro a la derecha de la Figura 4 puede implementarse fácilmente en el prefiltro así como en el postfiltro, en el que el factor de deformación se controla mediante el parámetro λ, mientras la característica de filtro, es decir, los coeficientes de filtro del análisis/síntesis de LPC o prefiltrado o postfiltrado para amplificar/amortiguar porciones psicoacústicamente más importantes se controla estableciendo los parámetros de

25 ponderación β0, β1, β2,.... a valores apropiados.

La Figura 5 ilustra la dependencia de la característica de deformación de frecuencia en el factor de deformación λ para λ entre 0,8 y +0,8. No se obtendrá deformación en absoluto, cuando λ se establece a 0,0. Se obtiene una deformación piscoacústicamente a escala completa estableciendo λ entre 0,3 y 0,4. En general, el factor de

30 deformación óptimo depende de la tasa de muestreo elegida y tiene un valor de entre aproximadamente 0,3 y 0,4 para tasas de muestreo entre 32 y 48 kHz. La resolución de frecuencia no uniforme obtenida entonces usando el filtro deformado es similar a la escala BARK o ERB. Pueden implementarse características de deformación sustancialmente más fuertes, pero estas son únicamente útiles en ciertas situaciones, que pueden ocurrir cuando el controlador determina que estos factores de deformación superiores son útiles.

35 Por lo tanto, el prefiltro en el lado del codificador tendrá preferentemente factores de deformación positivos λ para aumentar la resolución de frecuencia en el intervalo de baja frecuencia y para reducir la resolución de frecuencia en el intervalo de alta frecuencia. Por lo tanto, el postfiltro en el lado del decodificador tendrá también los factores de deformación positivos. Por lo tanto, se muestra un filtro de deformación que varía en el tiempo inventivo preferido en

40 la Figura 6 en 70 como una parte del procesador de audio. El filtro inventivo es, preferentemente, un filtro lineal, que se implementa como un prefiltro o un postfiltro para filtrar para amplificar o amortiguar porciones psicoacústicamente más/menos importantes o que se implementa como un filtro de análisis/síntesis de LPC que depende de la señal de control del sistema. Se ha de observar en este punto que el filtro deformado es un filtro lineal y no cambia la frecuencia de un componente tal como una onda seno introducida en el filtro. Sin embargo, cuando se

45 supone que el filtro antes de la deformación es un filtro paso bajo, el diagrama de la Figura 5 se ha de interpretar como se expone a continuación.

Cuando la onda seno de ejemplo tiene una frecuencia original normalizada de 0,6, entonces el filtro aplicaría para un factor de deformación igual a 0,0 la ponderación de fase y amplitud definida mediante la respuesta de impulso

50 de filtro de este filtro no deformado.

Cuando se establece un factor de deformación de 0,8 para este filtro paso bajo (ahora el filtro se hace un filtro deformado), la onda seno que tiene una frecuencia normalizada de 0,6 se filtrará de manera que la salida se pondera mediante la ponderación de fase y amplitud que el filtro no deformado tiene para una frecuencia

55 normalizada de 0,97 en la Figura 5. Puesto que este filtro es un filtro lineal, la frecuencia de la onda seno no cambia.

Dependiendo de la situación, cuando el filtro 70 está únicamente deformado, entonces tiene que aplicarse un factor de deformación o, generalmente, el control de deformación 16, o 46. Los coeficientes de filtro βi se deducen a partir del umbral de enmascaramiento. Estos coeficientes de filtro pueden ser coeficientes de preo postfiltro, o

60 coeficientes de filtro de análisis/síntesis de LPC, o cualquier otro coeficiente de filtro útil en relación con cualquier primer o segundo algoritmos de codificación.

Por lo tanto, un procesador de audio incluye, además del filtro que tiene características de deformación variables, el controlador 18 de la Figura 1 o el controlador implementado como el detector de algoritmo de codificación 32 de la

11

imagen10

imagen11

imagen12

imagen13

Claims

imagen1

imagen2

imagen3