ES2237706T3

ES2237706T3 - Reconstruccion de componentes de alta frecuencia.

Info

Publication number: ES2237706T3
Application number: ES02787866T
Authority: ES
Inventors: Kristofer Kjorling; Per Ekstrand; Holger Horich
Original assignee: Coding Technologies Sweden AB
Current assignee: Coding Technologies Sweden AB
Priority date: 2001-11-29
Filing date: 2002-11-28
Publication date: 2005-08-01
Anticipated expiration: 2022-11-28
Also published as: US9812142B2; US7469206B2; DE60202881D1; JP2005510772A; US20170178654A1; US9761234B2; US8019612B2; WO2003046891A1; US20170178647A1; AU2002352182A1; US20160232912A1; US20170178657A1; US9761236B2; DE60202881T2; US9431020B2; US8112284B2; US20090132261A1; US11238876B2; CN1571993A; US20050096917A1

Abstract

Codificador para codificar una señal de audio para obtener una señal codificada, destinándose la señal codificada a la decodificación utilizando una técnica de regeneración de altas frecuencias que es conveniente para generar componentes de frecuencia por encima de una frecuencia predeterminada basándose en las componentes de frecuencia por debajo de la frecuencia predeterminada, comprendiendo el codificador: un medio (702) para proporcionar una señal de entrada codificada, que es una representación codificada de una señal de entrada, codificándose la señal de entrada utilizando un algoritmo de codificación y representando un contenido de frecuencia de la señal de audio por debajo de la frecuencia predeterminada; un regenerador (703c) de altas frecuencias sirve para realizar la técnica de regeneración de altas frecuencias sobre la señal de entrada, o sobre una versión codificada y decodificada de la misma, para obtener una señal regenerada que tiene componentes de frecuencia por encima de la frecuencia predeterminada; un detector (703a) para detectar diferencias entre la señal regenerada y la señal de audio, que se encuentran por encima un umbral de significación; un descriptor (703b) para describir diferencias para obtener información adicional; y un combinador (705) para combinar la señal de entrada codificada y la información adicional para producir una señal codificada.

Description

Reconstrucción de componentes de alta frecuencia.

Campo técnico

La presente invención se refiere a sistemas de codificación de fuentes que utilizan la reconstrucción de altas frecuencias (HFR - High Frequency Reconstruction) tal como la Replicación de la Banda Espectral (Spectral Band Replication), o SBR [WO 98/57436], o métodos relacionados. Mejora el rendimiento de los métodos de alta calidad (SBR), así como de los métodos de copia de baja calidad [patente estadounidense 5.127.054]. Es aplicable a sistemas tanto de codificación de voz como de codificación de audio natural.

Antecedentes de la invención

La reconstrucción de altas frecuencias (HFR) es una tecnología relativamente nueva para la mejora de la calidad de algoritmos de codificación de audio y voz. Hasta la fecha, se ha introducido para el uso en codecs de voz, tales como el codificador AMR de banda ancha para sistemas celulares de 3ª generación, y codificadores de audio, tales como de mp3 o AAC, en la que los codecs de forma de onda tradicionales se complementan con el algoritmo SBR de reconstrucción de altas frecuencias (lo que da como resultado el mp3PRO o el AAC+SBR).

La reconstrucción de altas frecuencias es un método muy eficaz para codificar altas frecuencias de señales de audio y de voz. Puesto que no puede realizar la codificación por su cuenta, siempre se usa en combinación con un codificador de audio normal basado en formas de onda (por ejemplo, AAC, mp3) o un codificador de voz. Éstos son responsables de codificar las frecuencias más bajas del espectro. La idea básica de la reconstrucción de altas frecuencias consiste en que las frecuencias más altas no se codifican y transmiten, sino que se reconstruyen en el decodificador basándose en el espectro más bajo con ayuda de algunos parámetros adicionales (principalmente, datos que describen la envolvente espectral de alta frecuencia de la señal de audio) que se transmiten en un flujo de bits de baja velocidad binaria (véase, por ejemplo, Valin J. et al: "Bandwidth extension of narrowband speech for low bit-rate wideband coding", Proc. Taller IEEE sobre codificación de voz, 17-20 septiembre, 2000, páginas 130-132), el cual puede transmitirse por separado o como datos auxiliares del codificador base. Los parámetros adicionales podrían también omitirse, pero a fecha de hoy, la calidad alcanzable por un enfoque así será peor en comparación con un sistema que utilice parámetros adicionales.

Especialmente para la codificación de audio, la HFR mejora significativamente la eficiencia de la codificación, especialmente en el intervalo de calidad de "suena bien, pero no es transparente". Esto es así por dos motivos:

\bullet Los codecs de forma de onda tradicionales, tales como de mp3, necesitan recudir el ancho de banda de audio para velocidades binarias muy bajas, ya que si no, el nivel de artefactos en el espectro se vuelve demasiado alto. La HFR regenera esas altas frecuencias a un coste muy reducido y con buena calidad. Puesto que la HFR permite una manera de bajo coste de crear componentes de alta frecuencia, el ancho de banda de audio codificado por el codificador de audio puede reducirse adicionalmente, lo que tiene como resultado menos artefactos y un mejor comportamiento en el caso más desfavorable de todo el sistema.

\bullet La HFR puede emplearse en combinación con un submuestreo en el codificador / sobremuestreo en el decodificador. En este escenario frecuentemente utilizado, el codificador HFR analiza las señales de audio de ancho de banda completo, pero la señal introducida en el codificador de audio se submuestrea a una velocidad de muestreo menor. Un ejemplo típico es una velocidad HFR de 44,1 kHz y una velocidad del codificador de audio de 22,05 kHz. Hacer funcionar el codificador de audio a una velocidad de muestreo baja es una ventaja porque normalmente es más eficiente a la velocidad de muestreo más reducida. En el lado de decodificación, la señal de audio decodificada de baja velocidad de muestreo se sobremuestrea y se añade la parte de la HFR - por tanto, pueden generare frecuencias hasta la frecuencia de Nyquist original, aunque el codificador de audio funciona a, por ejemplo, la mitad de la velocidad de muestreo.

Un parámetro básico para un sistema que emplee al HFR es la denominada frecuencia de cruce (COF - Cross Over Frequency), es decir, la frecuencia en la que se detiene la codificación normal de formas de onda y comienza el intervalo de frecuencias de HFR. La disposición más sencilla es tener la COF a una frecuencia constante. Una solución más avanzada, la cual ya se ha introducido, consiste en ajustar dinámicamente la COF a las características de la señal a codificar.

Un problema importante de la HFR es que una señal de audio puede contener componentes en frecuencias más elevadas que sean difíciles de reconstruir con el método HFR actual, pero que podrían reconstruirse más fácilmente por otros medios, por ejemplo, métodos de codificación de formas de onda o por generación sintética de señales. Un ejemplo sencillo es codificar una señal que únicamente conste de una onda senoidal por encima de la COF, figura 1. Aquí, la COF es de 5,5 kHz. Puesto que ninguna señal útil se encuentra disponible en las frecuencias bajas, el método HFR, basado en la extrapolación de la banda baja para obtener una banda alta, no generará ninguna señal.

Por consiguiente, la señal de onda senoidal no puede reconstruirse. Se precisan otros medios para codificar esta señal de una manera útil. En este caso sencillo, los sistemas HFR que proporcionan un ajuste flexible de la COF, ya pueden resolver el problema hasta cierto punto. Si la COF se fija por encima de la frecuencia de la onda senoidal, la señal puede codificarse muy eficientemente empleando el codificador central. Sin embargo, esto presupone que resulta posible hacerlo, lo que no siempre puede ser el caso. Tal como se ha mencionado anteriormente, una de las ventajas principales de combinar la HFR con la codificación de audio es el hecho de que el codificador central puede funcionar a mitad de la velocidad de muestreo (proporcionando una eficiencia de compresión más elevada). En un escenario realista, tal como un sistema a 44,1 kHz con el núcleo funcionando a 22,05 kHz, un codificador central así sólo puede codificar señales de hasta aproximadamente 10,5 kHz. Sin embargo, aparte de eso, el problema se vuelve significativamente más complicado, incluso para partes del espectro dentro del alcance del codificador central, cuando se consideran señales más complejas. Las señales del mundo real pueden, por ejemplo, contener componentes audibles semejantes a ondas senoidales a altas frecuencias dentro de un espectro complejo (por ejemplo, campanas pequeñas), figura 2. El ajuste de la COF no supone una solución en este caso, ya que la mayor parte de la ganancia conseguida por el método HFR disminuiría al usar el codificador central para una parte mucho más grande del espectro.

Sumario de la invención

Por tanto, una solución a los problemas esbozados más arriba, y el asunto de la presente invención, es la idea de un sistema HFR muy flexible que no sólo permita cambiar la COF, sino que permita una composición mucho más flexible del espectro decodificado/reconstruido por una composición selectiva en frecuencia de distintos métodos.

La base de la invención es un mecanismo en el sistema HFR que permite una selección dependiente de la frecuencia de distintos métodos de codificación o reconstrucción. Por ejemplo, esto podría realizarse con el sistema de análisis/síntesis con banco de 64 filtros de banda empleado en la SBR. Un complejo banco de filtros que proporcione funciones de ecualización libres de alias puede ser especialmente útil.

La actividad inventiva principal es que el banco de filtros se utiliza ahora no sólo para servir como filtro para la COF y el siguiente ajuste de envolvente. También se empleó, de manera muy flexible, para seleccionar la entrada para cada uno de los canales del banco de filtros que sale de las siguientes fuentes:

codificación de formas de onda (utilizando el codificador central);

transposición (con el siguiente ajuste de envolvente);

codificación de formas de onda (utilizando una codificación adicional más allá de Nyquist);

codificación paramétrica;

cualquier otro método de codificación/reconstrucción aplicable en ciertas partes del espectro;

o cualquier combinación de los mismos.

Por tanto, la codificación de formas de onda, otros métodos de codificación y la reconstrucción HFR pueden utilizarse ahora en cualquier disposición espectral arbitraria para conseguir la calidad y la ganancia de codificación más altas posibles. Sin embargo, debería resultar evidente que la invención no se limita al uso de un banco de filtros en subbandas, sino que, por supuesto, puede emplearse con un filtrado selectivo en frecuencia arbitrario.

La presente invención comprende las siguientes características:

un método HFR que utiliza la banda baja disponible en dicho decodificador para extrapolar una banda alta;

en el lado del codificador, usar el método HFR para evaluar, dentro de diferentes regiones de frecuencia, dónde el método HFR, basándose en el intervalo de frecuencias por debajo de la COF, no genera correctamente una línea espectral o líneas espectrales similares a la línea espectral o líneas espectrales de la señal original;

codificar la línea espectral o líneas espectrales para las diferentes regiones de frecuencia;

transmitir la línea espectral o líneas espectrales codificadas para las diferentes regiones de frecuencia del codificador al decodificador;

decodificar la línea espectral o líneas espectrales;

añadir la línea espectral o líneas espectrales decodificadas a las diferentes regiones de frecuencia de la salida del método HFR en el decodificador;

la codificación es una codificación paramétrica de dicha línea espectral o líneas espectrales;

la codificación es una codificación de formas de onda de dicha línea espectral o líneas espectrales;

la línea espectral o líneas espectrales, codificadas paramétricamente, se sintetizan empleando un banco de filtros en subbandas;

la codificación de formas de onda de la línea espectral o líneas espectrales es realizada por el codificador central subyacente del sistema de codificación de fuentes;

la codificación de formas de onda de la línea espectral o líneas espectrales es realizada por un codificador de formas de onda arbitrario.

Breve descripción de los dibujos

La presente invención se describirá ahora por medio de ejemplos ilustrativos, los cuales no limitan el alcance o espíritu de la invención, con referencia a los dibujos adjuntos, en los que:

La figura 1 ilustra el espectro de una señal original con sólo un seno por encima de una COF de 5,5 kHz;

la figura 2 ilustra el espectro de una señal original que contiene campanillas en música pop;

la figura 3 ilustra la detección de los armónicos que faltan utilizando la ganancia de predicción;

la figura 4 ilustra el espectro de una señal original;

la figura 5 ilustra el espectro sin la presente invención;

la figura 6 ilustra el espectro de salida sin la presente invención;

la figura 7 ilustra una posible implementación de un codificador de la presente invención;

la figura 8 ilustra una posible implementación de un decodificador de la presente invención;

la figura 9 ilustra un diagrama esquemático de un codificador inventivo;

la figura 10 ilustra un diagrama esquemático de un decodificador inventivo;

la figura 11 es un diagrama que muestra la organización del intervalo espectral en bandas y canales de factores de escala en relación con la frecuencia de corte y la frecuencia de muestreo, y

la figura 12 es el diagrama esquemático para el decodificador inventivo en relación con un método de transposición HFR basado en un enfoque de banco de filtros.

Descripción de las realizaciones preferidas

Las realizaciones descritas más abajo son meramente ilustrativas para los principios de la presente invención, para la mejora de sistemas de reconstrucción de altas frecuencias. Se entiende que las modificaciones y variaciones de las disposiciones y los detalles descritos en la presente memoria les resultarán evidentes a otros expertos en la técnica. Por tanto, la intención es que esté limitada únicamente por el alcance de las inminentes reivindicaciones de patente y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en la presente memoria.

La figura 9 ilustra un codificador inventivo. El codificador incluye un codificador 702 central. Cabe indicarse aquí que el método inventivo también puede emplearse como un denominado módulo de ampliación para un codificador central existente. En este caso, el codificador inventivo incluye una entrada para recibir una señal codificada de entrada producida por un codificador 702 central permanente distinto.

El codificador inventivo de la figura 9 incluye adicionalmente un bloque 703c de regeneración de altas frecuencias, un detector 703a de diferencias, un bloque 703b de descripción de diferencias, así como un combinador 705.

En lo sucesivo, se describirá la interdependencia funcional de los medios a los que se ha hecho referencia más arriba.

En particular, el codificador inventivo es para codificar una entrada de señal de audio en una entrada 900 de señales de audio para obtener una señal codificada. La señal codificada está dirigida a la decodificación utilizando una técnica de regeneración de altas frecuencias que es conveniente para generar componentes de frecuencia por encima de una frecuencia predeterminada, la cual se llama también frecuencia de corte, basándose en las componentes de frecuencia por debajo de la frecuencia predeterminada.

Cabe indicarse aquí que puede emplearse, como técnica de regeneración de altas frecuencias, una amplia variedad de aquellas técnicas que se han dado a conocer recientemente. A este respecto, el término "componente de frecuencia" ha de entenderse en sentido amplio. Este término incluye al menos coeficientes espectrales obtenidos por medio de una transformada en dominio del tiempo/dominio de la frecuencia, tal como una FFT, una MDCT u otra. Adicionalmente, el término "componente de frecuencia" también incluye señales de paso de banda, es decir, señales obtenidas a la salida de filtros selectivos en frecuencia tales como un filtro paso bajo, un filtro pasabanda o un filtro paso
alto.

Independientemente del hecho de si el codificador 702 central forma parte del codificador inventivo o si el codificador inventivo se emplea como módulo de ampliación para un codificador central existente, el codificador incluye medios para proporcionar una señal de entrada codificada, que es una representación codificada de una señal de entrada y que se codifica empleando un algoritmo de codificación. A este respecto, cabe observarse que la señal de entrada representa un contenido de frecuencia de la señal de audio por debajo de una frecuencia predeterminada, es decir, por debajo de la denominada frecuencia de corte. Para ilustrar el hecho de que el contenido de frecuencia de la señal de entrada sólo incluye una parte de banda baja de la señal de audio, en la figura 9 se muestra un filtro 902 paso bajo. El codificador inventivo puede tener, en efecto, un filtro paso bajo así. Alternativamente, un filtro paso bajo así puede incluirse en el codificador 702 central. Alternativamente, un codificador central puede realizar la función de desechar una banda de frecuencia de la señal de audio mediante cualquier otro medio conocido.

A la salida del codificador 702 central, se encuentra presente una señal de entrada codificada que, con respecto a este contenido de frecuencia, es similar a la señal de entrada, pero es diferente de la señal de audio porque la señal de entrada codificada no incluye ningún componente de frecuencia por encima de la frecuencia predetermina-
da.

El bloque 703c de regeneración de altas frecuencias sirve para realizar la técnica de regeneración de altas frecuencias sobre la señal de entrada, es decir, la señal de entrada introducida en el codificador 702 central, o sobre una versión codificada y decodificada de nuevo de la misma. En caso de que se seleccione esta alternativa, el codificador inventivo incluye también un decodificador 903 central que recibe la señal de entrada codificada del codificador central y decodifica esta señal para que se tenga exactamente la misma situación que se da en el lado del decodificador/receptor, en la que ha de realizarse una técnica de regeneración de altas frecuencias para mejorar el ancho de banda de audio para señales codificadas que se han transmitido utilizando una velocidad binaria baja.

El bloque 702 HFR produce a una señal regenerada que tiene componentes de frecuencia por encima de la frecuencia predeterminada.

Tal como se muestra en la figura 9, la señal regenerada por el bloque 703c HFR se introduce en un medio 703a de detección de diferencias. Por otra parte, el medio de detección de diferencias también recibe la entrada de señal original de audio en la entrada 900 de señales de audio. El medio para detectar diferencias entre la señal regenerada procedente del bloque 703c HFR y la señal de audio procedente de la entrada 900 se dispone para detectar una diferencia entre esas señales, que se encuentran por encima de un umbral de significación predeterminado. Posteriormente se describen varios ejemplos de umbrales preferidos que funcionan como umbrales de significación.

La salida del detector de diferencias está conectada a una entrada de un bloque 703b de descripción de diferencias. El bloque 703b de descripción de diferencias sirve para describir diferencias detectadas de una cierta manera para obtener información adicional sobre las diferencias detectadas. Esta información adicional es apropiada para introducirse en un medio 705 de combinación que combina la señal de entrada codificada, la información adicional y varias otras señales que pueden producirse para obtener una señal codificada a transmitirse a un receptor o almacenarse en un medio de almacenamiento. Un ejemplo destacado de información adicional es una información de envolventes espectrales producida por un estimador 704 de envolventes espectrales. El estimador 704 de envolventes espectrales está dispuesto para proporcionar una información de envolventes espectrales de la señal de audio por encima de la frecuencia predeterminada, es decir, por encima de la frecuencia de corte. Esta información de envolventes espectrales se utiliza en un módulo HFR en el lado del decodificador para sintetizar componentes espectrales de una señal de audio decodificada por encima de la frecuencia predeterminada.

En una realización preferida de la presente invención, el estimador 704 de envolventes espectrales está dispuesto para proporcionar únicamente una representación de baja resolución de la envolvente espectral. En particular, se prefiere proporcionar sólo un valor de envolvente espectral para cada banda de factor de escala. Los expertos en la técnica conocen el uso de bandas de factor de escala. En relación con los codificadores de transformada, tales como de MP3 o MPEG-AAC, una banda de factor de escala incluye varias líneas MDCT. La organización detallada acerca de qué líneas espectrales pertenecen a qué banda de factor de escala está estandarizada, pero puede variar. Generalmente, una banda de factor de escala incluye varias líneas espectrales (por ejemplo, líneas MDCT, en las que MDCT significa transformada modificada discreta del coseno), o señales de paso de banda, cuyo número varía de banda de factor de escala a banda de factor de escala. Generalmente, una banda de factor de escala incluye al menos más de dos, y normalmente más de diez o veinte líneas espectrales o señales de paso de banda.

De acuerdo con una realización preferida de la presente invención, el codificador inventivo incluye adicionalmente una frecuencia variable de corte. El control de la frecuencia de corte lo realiza el detector 703a de diferencias inventivo. El control está dispuesto de manera que, cuando el detector de diferencias llega a la conclusión de que una frecuencia de corte más alta contribuiría mucho a reducir artefactos que se producirían mediante una HFR pura, el detector de diferencias puede ordenarle al filtro 902 paso bajo y al estimador 704 de envolventes espectrales, así como al codificador 702 central, que coloquen la frecuencia de corte en frecuencias más altas para ampliar el ancho de banda de la señal de entrada codificada.

Por otra parte, el detector de diferencias también puede disponerse para reducir la frecuencia de corte en caso de que descubra que un cierto ancho de banda por debajo de la frecuencia de corte no es importante acústicamente y por tanto puede producirse fácilmente mediante una síntesis HFR en el decodificador en vez de tener que ser codificado directamente por el codificador central.

Por otra parte, los bits que se ahorran al reducir la frecuencia de corte pueden utilizarse para el caso en el que haya que aumentar la frecuencia de corte para que pueda obtenerse un tipo de opción ahorradora de bits que se conozca para un método de codificador psicoacústica. En estos métodos muchos componentes tonales que son difíciles de codificar, es decir, que precisan muchos bits para codificarse sin artefactos, pueden consumir más bits cuando, por otro lado, en la señal también se encuentran presentes partes de señal de ruido blanco que son fáciles de codificar, es decir, que sólo necesitan un pequeño número de bits para codificarse sin artefactos, y son reconocidas por un cierto control de ahorro de bits.

En resumen, el control de la frecuencia de corte está dispuesto para aumentar o reducir la frecuencia predeterminada, es decir, la frecuencia de corte, en respuesta a hallazgos hechos por el detector de diferencias, el cual, en general, calcula la efectividad y el rendimiento del bloque 703c HFR en simular la situación real en un diferencia de fase.

Preferiblemente, el detector 703a de diferencias se dispone para detectar líneas espectrales en la señal de audio que no se incluyan en la señal regenerada. Para hacer esto, el detector de diferencias incluye preferiblemente un predictor para realizar operaciones de predicción sobre la señal regenerada y la señal de audio y medios para determinar una diferencia en las ganancias de predicción obtenidas para la señal regenerada y la señal de audio. En particular, se determinan partes relacionadas con la frecuencia en la señal regenerada o en la señal de audio, en las que una diferencia en ganancias de predicción es mayor que el umbral de ganancia que es el umbral de significación en esta realización preferida.

Cabe indicarse aquí que el detector 703a de diferencias funciona preferiblemente como un elemento selectivo en frecuencia porque calcula bandas de frecuencia en la señal regenerada, por una parte, y en la señal de audio, por la otra. Con este fin, el detector de diferencias puede incluir elementos de conversión tiempo-frecuencia para convertir la señal de audio y la señal regenerada. En caso de que la señal regenerada producida por el bloque 703c HFR ya se encuentre presente como una representación relacionada con la frecuencia, lo cual es el caso en el método de regeneración de altas frecuencias preferido aplicado para la presente invención, no son necesarios tales medios de conversión en dominio del tiempo/dominio de la frecuencia.

En caso de que haya que usar un elemento de conversión en dominio del tiempo/dominio de la frecuencia, tal como para convertir la señal de audio, que normalmente es una señal en dominio del tiempo, se prefiere un enfoque de banco de filtros. Un banco de filtros de análisis incluye banco de filtros pasabanda adyacentes, adecuadamente dimensionados, en el que cada filtro pasabanda produce una señal pasabanda que tiene un ancho de banda definido por el ancho de banda del filtro pasabanda respectivo. La señal de filtro pasabanda puede interpretarse como una señal en dominio del tiempo que tiene un ancho de banda restringido en comparación con la señal a partir de la cual se ha obtenido. La frecuencia central de una señal pasabanda está definida por la ubicación del filtro pasabanda respectivo en el banco de filtros de análisis, tal como se conoce en la técnica.

Tal como se describirá más adelante, el método preferido para determinar diferencias por encima de un umbral de significación es una determinación basada en medidas de la tonalidad y en particular en una relación tonal a ruido, puesto que tales métodos son convenientes para descubrir líneas espectrales en señales o descubrir partes semejantes a ruido en señales de una manera robusta y eficiente.

Detección de líneas espectrales a codificar

A fin de poder codificar las líneas espectrales que faltarán en la salida decodificada tras la HFR, resulta esencial detectarlas en el codificador. Para llevar esto a cabo, es necesario realizar en el codificador una síntesis adecuada de la posteriormente HFR del decodificador. Esto no implica que la síntesis necesite ser una señal de salida en dominio del tiempo similar a la del decodificador. Basta con observar y sintetizar una representación espectral absoluta de la HFR en el decodificador. Esto puede llevarse a cabo empleando una predicción en un banco de filtros QMF con un posteriormente escogimiento de picos de la diferencia en la ganancia de predicción entre la original y una homóloga de HFR. En vez del escogimiento de picos de la diferencia en la ganancia de predicción, también pueden emplearse diferencias del espectro absoluto. Para ambos métodos, la ganancia de predicción dependiente de la frecuencia o el espectro absoluto de la HFR se sintetizan cambiando simplemente la distribución de frecuencias de las componentes, parecido a los que la HFR hará en el decodificador.

Una vez que se obtienen las dos representaciones, la señal original y la señal HFR sintetizada, la detección puede realizarse de varias maneras.

En un banco de filtros QMF, puede llevarse a cabo una predicción lineal de bajo orden, por ejemplo, LPC de orden 2, para los distintos canales. Dada la energía de la señal predicha y la energía total de la señal, la relación tonal a ruido puede definirse según

q-\frac{\Psi - E}{E}

donde

\Psi=|x(0)|^{2} + |x(1)|^{2} + ....+|x(N-1)|^{2}

es la energía del bloque de señales y E es la energía del bloque de errores de predicción para un canal de banco de filtros dado. Esta puede calcularse para la señal original, y dado esto, una representación de cómo puede obtenerse la relación tonal/ruido para distintas bandas de frecuencia en la salida de HFR en el decodificador. Por tanto, puede calcularse la diferencia entre las dos sobre una base selectiva en frecuencia arbitraria (mayor que la resolución en frecuencia del QMF). Este vector de diferencia que representa la diferencia de relaciones tonal a ruido entre la señal original y la salida esperada de la HFR en el decodificador se utiliza posteriormente para determinar dónde se requiere un método de codificación adicional a fin de compensar las deficiencias de la técnica de HFR dada, figura 3. Aquí, la relación tonal a ruido correspondiente al intervalo de frecuencias entre las bandas 15 - 41 del banco de filtros en subbandas se representa para la señal original y una salida sintetizada de HFR. La rejilla representa las bandas de factor de escala del intervalo de frecuencias agrupadas a modo de escala Bark. Para cada banda de factor de escala, la diferencia entre las componentes más grandes de la señal original y la salida de HFR se calcula y se representa en el tercer gráfico.

La detección anterior también puede realizarse empleando una representación espectral arbitraria de la señal original y de una salida sintetizada de HFR, por ejemplo, escogiendo picos en un espectro absoluto ["Extraction of spectral peak parameters using a short time Fourier transform modeling [sic] and no sidelobe windows." Ph Depalle, T Hélie, IRCAM] o métodos similares, y comparando luego las componentes tonales detectadas en la señal original y las componentes detectadas en la salida sintetizada de HFR.

Cuando se ha juzgado que falta una línea espectral de la salida de HFR, necesita codificarse eficientemente, transmitirse al decodificador y añadirse a la salida de HFR. Pueden utilizarse varios enfoques; la codificación de formas de onda entrelazadas o, por ejemplo, la codificación paramétrica de la línea espectral.

Banco de filtros QMF/híbrido, codificación de formas de onda entrelazadas

Si la línea espectral a codificar se encuentra situada por debajo de FS/2 del codificador central, puede ser codificada por el mismo. Esto significa que el codificador central codifica el intervalo de frecuencias completo hasta la COF y también un intervalo de frecuencias definido, que rodea a la componente tonal, que no se reproducirá mediante la HFR en el decodificador. Alternativamente, la componente tonal puede ser codificada por un codificador de formas de onda arbitrario, con este enfoque, el sistema no se ve limitado por la FS/2 del codificador central, sino que puede funcionar en todo el intervalo de frecuencias de la señal original.

Con este fin, en el codificador inventivo se proporciona la unidad 910 de control del codificador central. En caso de que el detector 703a de diferencias determine un pico significativo por encima de la frecuencia predeterminada, pero por debajo de la mitad del valor de la frecuencia de muestreo (FS/2), éste ordena al codificador 702 central que codifique centralmente una señal pasabanda obtenida de la señal de audio, en el que la banda de frecuencia de la señal pasabanda incluye la frecuencia donde se ha detectado la línea espectral y, dependiendo de la implementación real, también una banda de frecuencia específica que intercala la línea espectral detectada. Con este fin, el propio codificador 702 central, o un filtro pasabanda controlable dentro del codificador central, filtra la parte relevante de la señal de audio, que se envía directamente al codificador central, tal como se muestra mediante una línea 912 disconti-
nua.

En este caso, el codificador 702 central funciona como el descriptor 703b de diferencias porque codifica la línea espectral por encima de la frecuencia de corte que ha detectado el detector de diferencias. Por tanto, la información adicional obtenida por el descriptor 703b de diferencias corresponde a la señal codificada producida por el codificador 702 central que está relacionada con la cierta banda de la señal de audio por encima de la frecuencia predeterminada, pero por debajo del valor de la frecuencia de muestreo (FS/2).

Para ilustrar mejor la planificación de frecuencias anteriormente mencionada, se hace referencia a la figura 11. La figura 11 muestra la escala de frecuencias que comienza en una frecuencia 0 y se extiende hacia la derecha en la figura 11. En un cierto valor de frecuencia, puede observarse la frecuencia 1100 predeterminada, que también se llama frecuencia de corte. Por debajo de esta frecuencia, el codificador 702 central de la figura 9 se encuentra activo para producir la señal de entrada codificada. Por encima de la frecuencia predeterminada, sólo se encuentra activo el estimador 704 de envolventes espectrales para obtener, por ejemplo, una envolvente espectral para cada banda de factor de escala. Por la figura 11, se hace evidente que una banda de factor de escala incluye varios canales que, en el caso los codificadores por transformada conocidos, corresponden a coeficientes de frecuencia o señales pasabanda. La figura 11 también es útil para mostrar los canales de banco de filtros de síntesis del banco de filtros de síntesis de la figura 12 que se describirán posteriormente. Adicionalmente, se hace referencia a la mitad del valor de la frecuencia FS/2 de muestreo que, en el caso de la figura 11, se encuentra por encima de la frecuencia predetermina-
da.

En caso de que una línea espectral detectada se encuentre por encima de FS/2, el codificador 702 central no puede funcionar como el descriptor 703b de diferencias. En este caso, tal como se esboza más arriba, en el descriptor de diferencias han de aplicarse algoritmos de codificación completamente diferentes para codificar/obtener información adicional sobre líneas espectrales en la señal de audio que no se reproducirán mediante una técnica de HFR ordinaria.

En lo sucesivo, se hace referencia a la figura 10 para ilustrar un decodificador inventivo para decodificar una señal codificada. La señal codificada se introduce por una entrada 1000 en un demultiplexor 801 de flujos de datos. En particular, la señal codificada incluye una señal de entrada codificada (producida por el codificador 702 central en la figura 9) que representa un contenido de frecuencia de una señal original de audio (introducida en la entrada 1000 desde la figura 9) por debajo de una frecuencia predeterminada. La codificación de la señal original se realizó en el codificador 702 central empleando un cierto algoritmo de codificación conocido. La señal codificada en la entrada 1000 incluye información adicional que describe diferencias detectadas entre una señal regenerada y la señal original de audio, generándose la señal regenerada mediante una técnica de regeneración de altas frecuencias (implementada en el bloque 703c HFR en la figura 9) a partir de la señal de entrada o de una versión codificada y decodificada de la misma (realización con el codificador 903 central en la figura 9).

En particular, el decodificador inventivo incluye un medio para obtener una señal de entrada decodificada, que se produce decodificando la señal de entrada codificada de acuerdo con el algoritmo de codificación. Con este fin, el decodificador inventivo puede incluir un decodificador 803 central, tal como se muestra en la figura 10. Alternativamente, el decodificador inventivo también puede utilizarse como módulo de ampliación para un decodificador central existente de manera que los medios para obtener una señal de entrada decodificada puedan implementarse empleando una cierta entrada de un bloque 804 HFR colocado subsiguientemente, tal como se muestra en la figura 10. El decodificador inventivo también incluye un reconstructor para reconstruir basándose en la información adicional diferencias detectadas que han sido producidas por el descriptor 703b de diferencias que se muestra en la figura 9.

Como componente esencial, el decodificador inventivo incluye adicionalmente un medio de regeneración de altas frecuencias para realizar una técnica de regeneración de altas frecuencias similar a la técnica de regeneración de altas frecuencias que ha sido implementada por el bloque 703c HFR, tal como se muestra en la figura 9. El bloque de regeneración de altas frecuencias produce una señal regenerada que, en un decodificador HFR normal, se utilizaría para sintetizar la parte espectral de la señal de audio que se ha desechado en el codificador.

De acuerdo con la presente invención, se proporciona un productor que incluye las funcionalidades de los bloques 806 y 807, de manera que la señal de audio producida por el productor no sólo incluye un parte reconstruida de alta frecuencia, sino que también incluye cualquier diferencia detectada, preferiblemente una línea espectral, que no puede ser sintetizada por el bloque 804 HFR pero que se encontraba presente en la señal original de audio.

Tal como se esbozará mas adelante, el productor 806, 807 puede usar la señal regenerada producida por el bloque 804 HFR y simplemente combinarla con la señal decodificada de banda baja producida por el decodificador 803 central y luego insertar líneas espectrales basándose en la información adicional. Alternativa y preferiblemente, el productor también realiza alguna manipulación de las líneas espectrales generadas por HFR, tal como se explicará con respecto a la figura 12. Generalmente, el productor no sólo simplemente inserta una línea espectral en el espectro HFR en una cierta posición de frecuencia, sino que también da cuentas de la energía de la línea espectral insertada en la atenuación de las líneas espectrales regeneradas por HFR en los alrededores de la línea espectral insertada.

Las medidas anteriores se basan en una estimación de parámetros de envolvente espectral realizada en el codificador. En una banda espectral por encima de la frecuencia predeterminada, es decir, la frecuencia de corte, en la que está colocada una línea espectral, el estimador de envolventes espectrales estima la energía de esta banda. Una banda así es, por ejemplo, una banda de factor de escala. Puesto que el estimador de envolventes espectrales acumula la energía en esta banda independientemente del hecho de si la energía procede de líneas espectrales ruidosas o de ciertos picos notables, es decir, líneas espectrales tonales, la estimación de la envolvente espectral para la banda de factor de escala dada incluye la energía de la línea espectral, así como la energía de las líneas espectrales "ruidosas" en la banda de factor de escala dada.

Para usar la información de estimación de la energía espectral transmitida en relación con la señal codificada de manera tan precisa como sea posible, el decodificador inventivo da cuenta del método de acumulación de energía en el codificador ajustando la línea espectral insertada, así como las líneas espectrales "ruidosas" vecinas en la banda de factor de escala dada para que la energía total, es decir, la energía de todas las líneas en esta banda, corresponda a la energía dictada por la estimación de envolvente espectral transmitida para esta banda de factor de escala.

La figura 12 muestra un diagrama esquemático para la reconstrucción HFR preferida basada en un banco 1200 de filtros de análisis y un banco 1202 de filtros de síntesis. El banco de filtros de análisis así como el banco de filtros de síntesis constan de varios canales de banco de filtros, que también se ilustran en la figura 11 con respecto a una banda de factor de escala y la frecuencia predeterminada. Los canales de banco de filtros por encima de la frecuencia predeterminada, que se indica como 1204 en la figura 12, han de reconstruirse por medio de señales de banco de filtros, es decir, los canales de banco de filtros por debajo de la frecuencia predeterminada, tal como se indica en la figura 12 mediante las líneas 1206. Cabe indicarse aquí que en cada canal de banco de filtros, se encuentra presente una señal pasabanda que tiene muestras complejas de señal pasabanda. El bloque 804 de reconstrucción de altas frecuencias en la figura 10 y también el bloque 703c HFR de la figura 9 incluyen un módulo 1208 de transposición/ajuste de envolvente que está dispuesto para llevar a cabo la HFR con respecto a ciertos algoritmos HFR. Cabe indicarse que el bloque en el lado del codificador no tiene porqué incluir necesariamente un módulo de ajuste de envolvente. Se prefiere estimar una medida de la tonalidad como función de la frecuencia. Entonces, cuando la tonalidad difiere demasiado, la diferencia en la envolvente espectral absoluta es irrelevante.

El algoritmo HFR puede ser un algoritmo HFR armónico puro o armónico aproximado o puede ser un algoritmo HFR de complejidad reducida que incluya la transposición de varios canales de banco de filtros consecutivos por debajo de la frecuencia predeterminada en ciertos canales de banco de filtros consecutivos por encima de la frecuencia predeterminada. Adicionalmente, el bloque 1208 incluye preferiblemente una función de ajuste de envolvente para que las magnitudes de las líneas espectrales transpuestas se ajusten de manera que la energía acumulada de las líneas espectrales ajustadas en una banda de factor de escala, por ejemplo, corresponda al valor de envolvente espectral para la banda de factor de escala.

Por la figura 12, se hace evidente que una banda de factor de escala incluye varios canales de banco de filtros. Una banda de factor de escala ejemplar se extiende desde un canal l_{inf} de banco de filtros hasta un canal l_{sup} de banco de filtros.

Con respecto al posterior método de adaptación/inserción de senos, cabe indicarse aquí que esta adaptación o "manipulación" es realizada por el productor 806, 807 en la figura 10, el cual incluye un manipulador 1210 para manipular señales pasabanda producidas por HFR. Como entrada, este manipulador 1210 recibe, del reconstructor 805 en la figura 10, al menos la posición de la línea, es decir, preferiblemente el número l_{s}, en la que ha de colocarse el seno sintetizado. Adicionalmente, el manipulador 1210 recibe preferiblemente un nivel adecuado para esta línea espectral (onda senoidal) y preferiblemente también información sobre una energía total de la banda 1212 de factores de escala sfb dada.

Cabe indicarse aquí que un cierto canal l_{s} en el que ha de insertarse la señal senoidal sintética se trata de manera diferente a los otros canales en la banda 1212 de factores de escala dada, tal como se esbozará más abajo. Tal como se ha explicado más arriba, este "tratamiento" de las señales de canal regeneradas por HFR, tal como son producidas por el bloque 1208, lo realiza el manipulador 1210, que forma parte del productor 806, 807 de la figura 10.

Codificación paramétrica de líneas espectrales

A continuación, se explica un ejemplo de sistema basado en bancos de filtros que utiliza la codificación paramétrica de líneas espectrales que faltan.

Cuando se emplea un método HFR en el que el sistema utiliza la adición de ruido de fondo adaptativo [según el documento PCT/SE00/00159], sólo es necesario codificar la posición frecuencial de la línea espectral que falta, puesto que el nivel de la línea espectral viene dado implícitamente por los datos de envolvente y los datos de ruido de fondo. La energía total de una banda de factor de escala dada viene dada por los datos de energía, y la relación de energía tonal/ruido viene dada por los datos de nivel de ruido de fondo. Además, en el dominio de alta frecuencia, la posición exacta de la línea espectral es de menor importancia, ya que la resolución en frecuencia del sistema auditivo humano es bastante baja a frecuencias más elevadas. Esto implica que las líneas espectrales pueden codificarse con gran eficiencia, esencialmente con un vector que indica para cada banda de factor de escala si debería añadirse un seno en esa banda particular en el decodificador.

Las líneas espectrales pueden generarse en el decodificador de varias maneras. Un enfoque emplea el banco de filtros QMF ya utilizado para el ajuste de envolvente de la señal HFR. Este es muy eficaz, ya que resulta muy sencillo generar ondas senoidales en un banco de filtros en subbandas, siempre y cuando se coloquen en el centro de un canal de filtro a fin de no generar un solapamiento en canales adyacentes. Esto no constituye una restricción severa puesto que la posición frecuencial de la línea espectral se cuantifica normalmente de manera bastante basta.

Si los datos de envolvente espectral enviados desde el codificador al decodificador se representan por energías de banco de filtros en subbandas agrupadas, en tiempo y frecuencia, el vector envolvente espectral puede representarse en cualquier instante mediante:

\overline{e}=[e(1), e(2).....e(M)]

y el vector nivel de ruido de fondo puede describirse según:

\overline{q}=[q(1), q(2).....q(M)]

Aquí, las energías y los datos de ruido de fondo se promedian en las bandas de banco de filtros QMF descritos por un vector

\overline{v}=[bfb......bfa]

que contiene la entradas de banda QMF, de la banda QMF más baja utilizada (bfb) a la más alta (bfa), cuya longitud es M + 1, y donde los límites de cada banda de factor de escala (en bandas QMF) vienen dados por:

1

donde l_{b} es el límite inferior y l_{a} es el límite superior de la banda n de factores de escala. En lo anterior, el vector \overline{q} de datos de nivel de ruido de fondo se ha representado a la misma resolución en frecuencia que la de los datos \overline{e}.

Si en un canal de banco de filtros se genera un seno sintético, éste debe considerarse para todos los canales de banco de filtros en subbandas incluidos en esa banda de factor de escala particular. Puesto que ésta es la mayor resolución en frecuencia de la envolvente espectral en este intervalo de frecuencias. Si esta resolución en frecuencia se utiliza también para señalizar la posición frecuencial de las líneas espectrales que faltan de la HFR y necesita añadirse a la salida, la generación y compensación para estos senos sintéticos puede realizarse según lo que viene a continuación.

En primer lugar, es necesario ajustar todos los canales de subbanda dentro de la banda de factor de escala actual para que se mantenga energía media para la banda según:

2

donde l_{b} y l_{a} son los límites para la banda de factor de escala en la que se añadirá un seno sintético, x_{re} y x_{im} son las muestras de subbanda real e imaginaria, l es el índice de canal y

g_{hfr}(n)=\sqrt{\frac{\overline{q}(n)}{1 + \overline{q}(n)}}

es el factor de ajuste de la ganancia, donde n es la banda de factor de escala actual. Cabe mencionarse aquí que la ecuación anterior no es válida para la línea espectral / señal pasabanda del canal de banco de filtros en el que se colocará el seno.

Cabe indicarse aquí que la anterior ecuación sólo es válida para los canales en la banda de factor de escala dada que se extienden de l_{inf} a l_{sup}, excepto la señal pasabanda en el canal que tiene el número l_{s}. Esta señal se trata por medio del siguiente grupo de ecuaciones.

El manipulador 1210 calcula la siguiente ecuación para el canal que tiene el número l_{s} de canal, es decir, modula la señal pasabanda en el canal l_{s} por medio de la señal compleja de modulación que representa una onda senoidal sintética. Adicionalmente, el manipulador 1210 realiza una ponderación de la línea espectral producida por el bloque 1208 HFR, así como la determinación del nivel del seno sintético por medio del factor g_{seno} de ajuste de senos sintéticos. Por tanto, la siguiente ecuación es válida únicamente para un canal l_{s} de banco de filtros en el que se colocará un seno.

Por consiguiente, el seno se coloca en el canal l_{s} QMF, donde l_{b} \leq l_{s} < l_{u}, según:

y_{re}(l_{s}) - x_{re}(l_{s})\cdot g_{hfr}(l_{s}) + g_{sen}(l_{s})\cdot\overline{\varphi}_{re}(k)

y_{lm}(l_{s}) - x_{lm}(l_{s})\cdot g_{hfr}(l_{s}) + g_{sen}(l_{s})\cdot(-l)^{l_{a}}\cdot\overline{\varphi}_{lm}(k)

donde k es el índice del vector modulación (0 \leq k < 4) y (-l) ^{l}_{s} da el conjugado complejo para un canal sí y otro no. Esto es necesario puesto que un canal sí y otro no en el banco de filtros tiene la frecuencia invertida. El vector modulación para colocar un seno en el centro de una banda compleja de banco de filtros en subbandas es:

3

y el nivel del seno sintético viene dado por:

g_{seno}(n) = \sqrt{\overline{e}(n)}

Lo anterior se representa en las figuras 4-6, en las que en la figura 4 se representa un espectro de la señal original, y en las figuras 5-6 se representa el espectro de la salida con y sin lo anterior. En la figura 5, el tono en el entorno de 8 kHz se sustituye por ruido de banda ancha. En la figura 6, un seno está insertado en el centro de la banda de factor de escala en el entorno de 8 kHz, y la energía para la banda de factor de escala entera está ajustada para que retenga la energía media correcta para esa banda de factor de escala.

Implementaciones prácticas

La presente invención puede implementarse tanto en chips de hardware como en DSP (procesador digital de señales), para varios tipos sistemas, para el almacenamiento o transmisión de señales, analógicas o digitales, utilizando codecs arbitrarios. En la figura 7 se representa una posible implementación de codificador de la presente invención. La señal analógica de entrada se convierte 701 en una homóloga digital y se suministra al codificador 702 central, así como al módulo de extracción de parámetros para la HFR 704. Se realiza 703 un análisis para determinar qué líneas espectrales faltarán tras una reconstrucción de altas frecuencias en el decodificador. Estas líneas espectrales se codifican de manera adecuada y se multiplexan 705 en el flujo de bits junto con el resto de los datos codificados. La figura 8 representa una posible implementación de decodificador de la presente invención. El flujo de bits se demultiplexa 801 y la banda baja es decodificada por el decodificador 803 central, la banda alta se reconstruye utilizando una unidad 804 HFR adecuada y la información adicional de las líneas espectrales que faltan después de que la HFR se decodifique 805 y se emplea para regenerar 806 las componentes que faltan. La envolvente espectral de la banda alta se decodifica 802 y se utiliza para ajustar 807 la envolvente espectral de la banda alta reconstruida. La banda baja se retarda 808 a fin de garantizar una sincronización temporal correcta con la banda alta reconstruida, y las dos se añaden juntas. La señal digital de banda ancha se convierte 809 en una señal analógica de banda ancha.

Dependiendo de los detalles de implementación, los métodos inventivos de codificación o de decodificación pueden implementarse en hardware o en software. La implementación puede tener lugar en un soporte de almacenamiento digital, en particular, un disco, un CD con señales de control legibles electrónicamente, que puede cooperar con un sistema informático programable para que se realice el método correspondiente. Generalmente, la presente invención también se refiere a un producto de programa de ordenador con un código de programa almacenado en un soporte legible por máquina para llevar a cabo los métodos inventivos cuando el programa de ordenador se ejecute en un ordenador. En otras palabras, la presente invención es por tanto un programa de ordenador con un código de programa para realizar el método inventivo de codificación o de decodificación cuando el programa de ordenador se ejecuta en un ordenador.

Cabe indicarse que la descripción anterior se refiere a un sistema complejo. Sin embargo, la implementación inventiva de decodificador también funciona en un sistema de valores reales. En este caso, las ecuaciones calculadas por el manipulador 1210 sólo incluyen las ecuaciones para la parte real.

Claims

1. Codificador para codificar una señal de audio para obtener una señal codificada, destinándose la señal codificada a la decodificación utilizando una técnica de regeneración de altas frecuencias que es conveniente para generar componentes de frecuencia por encima de una frecuencia predeterminada basándose en las componentes de frecuencia por debajo de la frecuencia predeterminada, comprendiendo el codificador:

un medio (702) para proporcionar una señal de entrada codificada, que es una representación codificada de una señal de entrada, codificándose la señal de entrada utilizando un algoritmo de codificación y representando un contenido de frecuencia de la señal de audio por debajo de la frecuencia predeterminada;

un regenerador (703c) de altas frecuencias sirve para realizar la técnica de regeneración de altas frecuencias sobre la señal de entrada, o sobre una versión codificada y decodificada de la misma, para obtener una señal regenerada que tiene componentes de frecuencia por encima de la frecuencia predeterminada;

un detector (703a) para detectar diferencias entre la señal regenerada y la señal de audio, que se encuentran por encima un umbral de significación;

un descriptor (703b) para describir diferencias para obtener información adicional; y

un combinador (705) para combinar la señal de entrada codificada y la información adicional para producir una señal codificada.

2. Codificador según la reivindicación 1, en el que las diferencias detectadas son líneas espectrales en la señal de audio que no están incluidas en la señal regenerada.

3. Codificador según la reivindicación 1 ó 2, en el que la frecuencia predeterminada es una frecuencia de corte que determina una frecuencia hasta la cual el algoritmo de codificación codifica la señal de entrada.

4. Codificador según una de las reivindicaciones anteriores, en el que el detector (703a) está dispuesto para usar una pluralidad de bandas de frecuencia para la señal regenerada y la señal de audio, en el que las diferencias se detectan basándose en bandas de frecuencia de la señal regenerada y en las mismas bandas de frecuencia de la señal de audio.

5. Codificador según una de las reivindicaciones anteriores, en el que el detector (703a) y/o el regenerador de altas frecuencias incluyen un convertidor del dominio del tiempo al dominio de la frecuencia.

6. Codificador según la reivindicación 5, en el que el convertidor del dominio del tiempo al dominio de la frecuencia es una transformada o un banco de filtros.

7. Codificador según una de las reivindicaciones anteriores, en el que el detector (703) comprende:

un predictor para realizar predicciones sobre la señal regenerada y la señal de audio; y

un detector para detectar una diferencia en unas ganancias de predicción obtenidas por el predictor que es mayor que un umbral de ganancia que forma el umbral de significación.

8. Codificador según una de las reivindicaciones anteriores, en el que el detector (703a) está dispuesto para detectar una diferencia en el espectro absoluto de la señal de audio y de la señal regenerada que es superior a un umbral de diferencia predeterminado que forma el umbral de significación.

9. Codificador según una de las reivindicaciones anteriores, en el que el detector (703a) para detectar está dispuesto para determinar una medida de la tonalidad dependiente de la frecuencia para la señal de audio y la señal regenerada, en el que se detecta una banda de frecuencia en la que las medidas de la tonalidad difieren en más de un umbral de diferencia que forma el umbral de significación.

10. Codificador según la reivindicación 9, en el que la medida de la tonalidad es una relación tonal a ruido.

11. Codificador según una de las reivindicaciones anteriores,

en el que la señal de audio es una señal de audio discreta muestreada utilizando una frecuencia de muestreo;

en el que la frecuencia predeterminada es menor que la mitad del valor de la frecuencia de muestreo;

en el que el detector (703a) está dispuesto para determinar una diferencia para una banda de frecuencia específica por encima de la banda de frecuencia predeterminada, siendo una frecuencia central de la banda de frecuencia específica menor que la mitad del valor de la frecuencia de muestreo, comprendiendo además el codificador:

un controlador (910) para controlar a un codificador que produce la señal de entrada codificada, para codificar adicionalmente la señal de audio con respecto a la banda de frecuencia específica, según el algoritmo de codificación, a fin de describir la diferencia determinada, en el que una salida del codificador (702) para la banda de frecuencia específica sirve como la información adicional.

12. Codificador según una de las reivindicaciones 1 a 10, en el que el descriptor (703b) incluye un filtro pasabanda para filtrar por paso de banda la señal de audio, fijándose el filtro pasabanda en una banda de frecuencia específica que incluye una diferencia detectada, y en el que el descriptor (703b) incluye un codificador para codificar una salida del filtro pasabanda para obtener la señal adicional, utilizando el codificador un algoritmo de codificación distinto del algoritmo de codificación por medio del cual se codifica la señal de entrada codificada.

13. Codificador según una de las reivindicaciones 1 a 11, en el que el detector para detectar diferencias está dispuesto para detectar líneas espectrales, y en el que el descriptor está dispuesto para producir información sobre la posición frecuencial de la línea espectral detectada.

14. Codificador según la reivindicación 13, en el que la información sobre la posición frecuencial incluye un vector que indica, para una banda de factor de escala, si se ha añadido una línea espectral en la banda de factor de escala específica cuando se ha decodificado la señal codificada.

15. Codificador según una de las reivindicaciones anteriores, en el que la señal de audio se procesa en cuanto a tramas, y en el que la frecuencia determinada es variable de trama a trama.

16. Codificador según la reivindicación 15, en el que el detector (703a) de diferencias comprende además un controlador de la frecuencia de corte para variar la frecuencia predeterminada basándose en una diferencia detectada.

17. Codificador según una de las reivindicaciones anteriores, en el que la técnica HFR está dispuesta para producir valores espectrales por encima de la frecuencia predeterminada a partir de valores espectrales por debajo de la frecuencia predeterminada.

18. Codificador según una de las reivindicaciones anteriores, en el que la técnica HFR está dispuesta para transponer un grupo de valores espectrales o señales pasabanda que están relacionadas con frecuencias consecutivas en un grupo de valores espectrales o señales pasabanda por encima de la frecuencia predeterminada que corresponden a frecuencias consecutivas.

19. Codificador según la reivindicación 17 ó 18, que comprende además un estimador (704) de envolventes espectrales para determinar una envolvente espectral de la señal de audio, estando relacionada la envolvente espectral con una parte espectral de la señal de audio por encima de la frecuencia predeterminada.

20. Codificador según la reivindicación 19, en el que los datos de envolvente espectral incluyen un número de puntos de datos de envolvente que es menor que un número de valores espectrales, en el que se proporciona un punto de datos para una banda de factor de escala.

21. Codificador según una de las reivindicaciones anteriores, en el que las componentes espectrales son coeficientes de transformada complejas o señales pasabanda complejas.

22. Decodificador inventivo para decodificar una señal codificada, incluyendo la señal codificada una señal de entrada codificada que representa un contenido de frecuencia de una señal original de audio por debajo de una frecuencia predeterminada, realizándose la codificación utilizando un algoritmo de codificación, e información adicional que describe diferencias detectadas entre una señal regenerada y la señal original de audio, generándose la señal regenerada mediante una técnica de regeneración de altas frecuencias a partir de la señal de entrada o de una versión codificada y decodificada de la misma, comprendiendo el decodificador:

un medio (803) para obtener una señal de entrada decodificada, que se produce decodificando la señal de entrada codificada de acuerdo con el algoritmo de codificación;

un reconstructor (805) para reconstruir diferencias detectadas basándose en la información adicional;

un regenerador (804) de altas frecuencias para llevar a cabo una técnica de regeneración de altas frecuencias, similar a la técnica de regeneración de altas frecuencias para obtener las diferencias detectadas, para obtener la señal regenerada;

un productor (806, 807) para producir una señal de audio regenerada de alta frecuencia basándose en la señal de entrada decodificada, las diferencias reconstruidas y la señal regenerada.

23. Decodificador según la reivindicación 22, en el que una diferencia detectada incluye líneas espectrales en una región de frecuencias específica y la información adicional está relacionada con la región de frecuencias específica, en el que el reconstructor (805) está dispuesto para generar una línea espectral en la región específica en respuesta a la información adicional.

24. Decodificador según la reivindicación 22 ó 23, en el que la información adicional especifica una banda de factor de escala en la que ha de reconstruirse una línea espectral, en el que la señal codificada comprende además datos de envolvente espectral para describir una parte espectral de la señal de audio por encima de la frecuencia predeterminada, en el que el productor (806, 807) está dispuesto para generar una línea espectral en la banda de factor de escala y en el que el productor (806, 807) está dispuesto adicionalmente para ajustar líneas espectrales en la banda de factor de escala para que se mantenga una energía dada para la banda de factor de escala que incluye la línea espectral generada.

25. Decodificador según una de las reivindicaciones 22 a 24, en el que el regenerador (804) de altas frecuencias incluye un banco (1203) de filtros de síntesis que tiene canales de banco de filtros de síntesis en el que una banda de factor de escala incluye más de un canal de banco de filtros, en el que la señal codificada incluye además un vector envolvente espectral y un vector nivel de ruido de fondo y en el que el reconstructor (805) está dispuesto para calcular un nivel de la línea espectral reconstruida basándose en el vector envolvente espectral.

26. Decodificador según la reivindicación 25, en el que el productor (806, 807) está dispuesto para determinar señales pasabanda para canales de banco de filtros, en los que no ha de insertarse ningún seno, en una banda de factor de escala de acuerdo con la siguiente ecuación

4

en la que l es un número de canal de banco de filtros, en la que l_{b} es el número de canal de banco de filtros más bajo para la banda de factor de escala, en la que l_{a} es el canal de banco de filtros más alto para la banda de factor de escala, en la que x_{re} es la parte real de una muestra de señal pasabanda producida por el bloque (804) HFR, en la que x_{im} es una parte imaginaria de la muestra de señal pasabanda producida por el bloque (804) HFR, en el que y_{re} e y_{im} son la parte real y la parte imaginaria de una señal pasabanda ajustada para un canal de banco de filtros y en la que g_{hfr} es un factor de ajuste de la ganancia obtenido del vector nivel de ruido de fondo.

27. Decodificador según la reivindicación 25 ó 26, en el que el reconstructor (805) está dispuesto para determinar una cierta banda l_{s} de factor de escala en la que ha de insertarse un seno sintético y en el que un nivel de un seno sintético a insertar se define como sigue:

g_{seno}(n) = \sqrt{\overline{e}(n)}

en la que n es un número de la banda de factor de escala dada y e es el vector envolvente espectral, y en el que el productor está dispuesto para determinar una señal pasabanda para el canal en el que ha de colocarse el seño sintético de acuerdo con la siguiente ecuación:

en la que l es un número de canal de banco de filtros, en el que ha de insertarse un seno, en la que l_{b} es el número de canal de banco de filtros más bajo para la banda de factor de escala, en la que l_{a} es el canal de banco de filtros más alto para la banda de factor de escala, en la que x_{re} es la parte real de una muestra de señal pasabanda producida por el bloque (804) HFR, en la que x_{im} es una parte imaginaria de la muestra de señal pasabanda producida por el bloque (804) HFR, y en el que y_{re} e y_{im} son la parte real y la parte imaginaria de una señal pasabanda ajustada para un canal de banco de filtros y en la que g_{hfr} es un factor de ajuste de la ganancia obtenido del vector nivel de ruido de fondo, en la que \varphi_{re} y \varphi_{im} forman un vector modulación complejo para colocar un seno en una señal pasabanda y en la que k es un índice de vector modulación que oscila entre 0 y 4.

28. Método para codificar una señal de audio para obtener una señal codificada, destinándose la señal codificada a la decodificación utilizando una técnica de regeneración de altas frecuencias que es conveniente para generar componentes de frecuencia por encima de una frecuencia predeterminada basándose en las componentes de frecuencia por debajo de la frecuencia predeterminada, comprendiendo el método las siguientes etapas:

proporcionar una señal de entrada codificada, que es una representación codificada de una señal de entrada, codificándose la señal de entrada utilizando un algoritmo de codificación y representando un contenido de frecuencia de la señal de audio por debajo de la frecuencia predeterminada;

realizar la técnica de regeneración de altas frecuencias sobre la señal de entrada, o sobre una versión codificada y decodificada de la misma, para obtener una señal regenerada que tiene componentes de frecuencia por encima de la frecuencia predeterminada;

detectar (703c) diferencias entre la señal regenerada y la señal de audio, que se encuentran por encima de un umbral de significación;

describir (703b) diferencias para obtener información adicional; y

combinar la señal de entrada codificada y la información adicional para producir una señal codificada.

29. Método para decodificar una señal codificada, incluyendo la señal codificada una señal de entrada codificada que representa un contenido de frecuencia de una señal original de audio por debajo de una frecuencia predeterminada, realizándose la codificación utilizando un algoritmo de codificación, e información adicional que describe diferencias detectadas entre una señal regenerada y la señal original de audio, generándose la señal regenerada mediante una técnica de regeneración de altas frecuencias a partir de la señal de entrada o de una versión codificada y decodificada de la misma, comprendiendo el método las siguientes etapas:

obtener una señal de entrada decodificada, que se produce decodificando la señal de entrada codificada de acuerdo con el algoritmo de codificación;

reconstruir diferencias detectadas basándose en la información adicional;

llevar a cabo una técnica de regeneración de altas frecuencias, similar a la técnica de regeneración de altas frecuencias para obtener las diferencias detectadas, para obtener la señal regenerada;

producir una señal de audio regenerada de alta frecuencia basándose en la señal de entrada decodificada, las diferencias reconstruidas y la señal regenerada.

30. Programa de ordenador que tiene un código de programa para realizar el método de codificación según la reivindicación 21 o el método de decodificación según la reivindicación 22 cuando el programa de ordenador se ejecuta en un ordenador.