ES2593072T3

ES2593072T3 - Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada y programa de ordenador correspondiente

Info

Publication number: ES2593072T3
Application number: ES13756417.5T
Authority: ES
Inventors: Sascha Disch; Benjamin SCHUBERT; Markus Multrus; Christian Helmrich; Konstantin Schmidt
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2012-08-27
Filing date: 2013-08-27
Publication date: 2016-12-05
Anticipated expiration: 2033-08-27
Also published as: MX2015002509A; JP6229957B2; EP2704142B1; CA2882775A1; EP2704142A1; BR112015004556A2; EP2888737A1; TW201419269A; WO2014033131A1; RU2015110702A; RU2607262C2; JP2015526769A; PL2888737T3; ES2549953T3; CA2882775C; TWI523004B; KR20150047607A; EP2888737B1; CN104603872B; BR112015004556B1

Abstract

Un aparato para la reproducción de una señal de audio sobre la base de primera información (120; 321; 705) que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y segunda información (126; 322; 708) que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, donde dicho dispositivo comprende: un primer reproductor (100) configurado para reproducir la primera porción (777) de la señal de audio sobre la base de la primera información (120; 321; 705); un proveedor (102; 200, 202a) configurado para proporcionar una señal de parche (122; 204) en la segunda banda de frecuencia, donde la señal de parche (122; 204) está al menos parcialmente no correlacionada con respecto a la primera porción (777) de la señal de audio, o es al menos parcialmente una versión descorrelacionada de la primera porción (777) de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia; un segundo reproductor (106) (106) que representa un post-procesador y que está configurado para reproducir la segunda porción de la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información (126; 322; 708) y la señal de parche (122; 204); en el que una envolvente espectral de la segunda porción de la señal de audio, un piso de ruido en la segunda porción de la señal de audio, una medida de tonalidad para cada banda parcial en la segunda porción de la señal de audio, y una codificación explícita de porciones senoidales prominentes en la segunda porción de la señal de audio representan información lateral representada por la segunda información; y una combinadora (104) configurada para la combinación de la primera porción reproducida (777) de la señal de audio y la señal de parche (122; 204) antes de que la segunda porción de la señal de audio es reproducida por el segundo reproductor, o para la combinación de la primera porción reproducida (777) de la señal de audio y la segunda porción reproducida de la señal de audio.

Description

Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada y programa de ordenador correspondiente

La presente invención se refiere a un aparato, un método y un programa de ordenador para la reproducción de una señal de audio, y, en particular, a un aparato, un método y un programa de ordenador para la reproducción de una señal de audio en situaciones en las cuales la tasa de datos disponible es reducida. Además, la presente invención se refiere a un aparato, un método y un programa de ordenador para la generación de una señal de audio codificada.

La codificación perceptualmente adaptada de señales de audio, para el eficiente almacenamiento y transmisión de estas señales de reducida tasa de datos, ha ganado aceptación en muchos campos. Se conocen algoritmos de codificación, en particular, como MPEG–1/2 [MPEG: Moving Pictures Experts Group, grupo de trabajo de expertos para el establecimiento de estándares para el audio y la transmisión de video], capa 3 “MP3”, MPEG–2/4 Codificación de Audio Avanzada (AAC, según su sigla en inglés) o MPEG–H Codificación de Audio y Discurso Unificados (USAC según su sigla en inglés). Las técnicas de codificación subyacentes, en particular, cuando se logran las menores tasas de bits, conducen a una reducción de la calidad del audio. El deterioro con frecuencia es producido principalmente por una limitación del lado del codificador, del ancho de banda de la señal de audio por ser transmitida.

En dicha situación, es estado del arte conocido el sometimiento de la señal de audio a una limitación de banda del lado del codificador, y la codificación de solo una banda inferior de la señal de audio por medio de un codificador de audio de alta calidad. La banda superior, sin embargo, solo es caracterizada muy groseramente por un conjunto de parámetros, que proporcionan, por ejemplo, la envolvente espectral de la banda superior. Del lado del decodificador, la banda superior es luego sintetizada mediante el emparche de la señal de banda inferior decodificada, en la banda superior de otra forma vacía, y la realización de subsiguientes ajustes con control de parámetros.

Los métodos convencionales para una extensión de ancho de banda de señales de audio con limitación de banda utilizan una función de copiado de porciones de señal de baja frecuencia (LF, según su sigla en inglés) hacia el rango de alta frecuencia (HF, según su sigla en inglés), a fin de aproximarse a la información faltante debido a la limitación de banda. En principio, dicha función de copiado es técnicamente equivalente a un desplazamiento espectral computado en el dominio de tiempo por medio de la modulación en banda lateral única (SSB, según su sigla en inglés), si bien computacionalmente mucho menos compleja. Dichos métodos, como la Replicación de Banda Espectral (SBR, según su sigla en inglés), se describen en la referencia de M. Dietz, L. Liljeryd, K. Kjörling y

O. Kunz, "Spectral Band Replication, a novel approach in audio coding", en la 112th AES Convention, Munich, May 2002; S. Meltzer, R. Böhm y F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)", 112th AES Convention, Munich, May 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm", en la 112th AES Convention, Munich, May 2002; Norma Internacional ISO/IEC 14496–3:2001/FPDAM l, "Extensión de ancho de banda ", ISO/IEC, 2002, o "Speech bandwidth extension method and apparatus" (Método y aparato de extensión de ancho de banda de discurso), Vasu Iyengar et al. Patente de los Estados Unidos Nro. 5,455,888.

En estos métodos, no se realiza transposición armónica, si bien se introducen sucesivas señales de paso banda de la banda inferior, en sucesivos canales de banco de filtro de la banda superior. De este modo, se logra una aproximación grosera de la banda superior de la señal de audio. Esta aproximación grosera de la señal es luego aproximada, en una etapa posterior, a la original, por medio de un procesamiento posterior usando información de control obtenida de la señal original. Aquí, por ejemplo, los factores de escala sirven para adaptar la envolvente espectral, una filtración inversa y la adición de un piso de ruido para adaptar la tonalidad y una suplementación por porciones de señal sinusoidal, como se describe además en la Norma MPEG–4.

Se sabe, por las técnicas de extensiones de ancho de banda armónico descriptas en las referencias de Nagel, F.; Disch, S. A Harmonic Bandwidth Extension Method for Audio Codecs, IEEE Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP), 2009; Nagel, F.; Disch, S.; Rettelbach, N. A Phase Vocoder Driven Bandwidth Extension Method with Novel Transient Handling for Audio Codecs, 126th AES Convention, 2009; Zhong, H.; Villemoes, L.; Ekstrand, P. et al. QMF Based Harmonic Spectral Band Replication, 131st Audio Engineering Society Convention, 2011; Villemoes, L.; Ekstrand, P.; Hedelin, P. Methods for enhanced harmonic transposition, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, (WASPAA), 2011, que, en la síntesis de la banda superior, podría introducirse indeseada aspereza auditiva en la señal. Una causa (de muchas) de dicha aspereza es la mala alineación espectral del parche y/o los efectos de disonancia en las regiones de transición entre la banda inferior y el primer parche, o entre parches consecutivos. Las técnicas de extensiones de ancho de banda armónico son diseñadas de manera de mejorar estos dos aspectos, no obstante, a expensas de la complejidad computacional.

Los cálculos de banco de filtro y el emparche en el dominio de banco de filtro, en especial, en la extensión de ancho de banda armónico, pueden convertirse, de hecho, en un alto esfuerzo computacional. En la Solicitud WO 98/57436, se describe una técnica de emparche avanzada que puede, hasta cierto alcance limitado, evitar los efectos de disonancia mediante la introducción de las así denominadas bandas de guardia entre diferentes parches espectrales, y la realización de un emparchado modificado de copia de respaldo a fin de disminuir la mala alineación espectral y, a la vez, mantener la moderada complejidad computacional.

Además, existen otros métodos tales como la así denominada “extensión de ancho de banda ciega”, que se describe en la referencia de E. Larsen, R. M. Aarts, y M. Danessis, “Efficient high–frequency bandwidth extension of music and speech”, en AES 112th Convention, Munich, Germany, May 2002, donde no se usa información sobre el rango HF original. Aun más, existe también el método de la así denominada “extensión de ancho de banda artificial”, que se describe en la referencia de K. Käyhkö, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.

En la referencia de J. Mäkinen et al.: AMR–WB+: a new audio coding standard for 3rd generation mobile audio services Broadcasts, IEEE, ICASSP ’05, se describe un método para la extensión de ancho de banda, donde la operación de copiado de la extensión de ancho de banda con un copiado de respaldo de sucesivas señales de paso banda de acuerdo con la tecnología SBR es reemplazada por el espejado, por ejemplo, por el muestreado ascendente.

Otras tecnologías para la extensión de ancho de banda se describen en los siguientes documentos. R. M. Aarts, E. Larsen, y O. Ouweltjes, “A unified approach to low– and high frequency bandwidth extension”, AES 115th Convention, New York, USA, October 2003; E. Larsen y R. M. Aarts, “Audio Bandwidth Extension – Application to psychoacoustics, Signal Processing and Loudspeaker Design”, John Wiley & Sons, Ltd., 2004; E. Larsen, R. M. Aarts, y M. Danessis, “Efficient high–frequency bandwidth extension of music and speech”, AES 112th Convention, Munich, May 2002; J. Makhoul, “Spectral Analysis of Speech by Linear Prediction”, IEEE Transactions on Audio and Electroacoustics, AU–21(3), June 1973; Solicitud de Patente de los Estados Unidos Nro. 08/951.029; Patente de los Estados Unidos Nro. 6,895,375.

Los métodos conocidos de extensión de banda armónica muestran una alta complejidad. Por otra parte, los métodos de extensión de ancho de banda con reducida complejidad muestran pérdidas de calidad. En particular con una baja tasa de bits y en combinación con un bajo ancho de banda del rango LF, pueden producirse artefactos tales como aspereza y un timbre percibido como desagradable. Una razón para esto es principalmente el hecho de que la porción HF aproximada se sustenta en una o más operaciones de copia directa o espejo de la porción LF del espectro.

Es el objeto de la invención proporcionar un aparato y un método para la reproducción de una señal de audio de una manera mejorada. Además, es un objeto de la invención proporcionar un aparato y un método para la generación de una señal de audio codificada que puede ser reproducida de manera mejorada. Es un objeto adicional de la invención proporcionar un correspondiente programa de ordenador y una correspondiente señal de audio codificada.

Este objeto es logrado por un aparato para la reproducción de una señal de audio de acuerdo con la reivindicación 1, un método para la reproducción de una señal de audio de acuerdo con la reivindicación 11, un aparato para la generación de una señal de audio codificada de acuerdo con la reivindicación 12, un método para la generación de una señal de audio codificada de acuerdo con la reivindicación 13 y un programa de ordenador de acuerdo con la reivindicación 14.

Por lo tanto, las formas de realización de la invención permiten la generación de una señal de audio codificada de modo tal que permite la decodificación de la señal de audio codificada de manera apropiada usando un grado apropiado de descorrelación. El grado apropiado de descorrelación puede ser determinado del lado del codificador, sobre la base de las propiedades de la primera porción y/o la segunda porción de la señal de audio.

En lo que sigue, las formas de realización de la presente invención se explican en más detalle, con referencia a los dibujos adjuntos, en los cuales:

la Fig. 1a muestra un diagrama de bloques de una forma de realización de un aparato para la reproducción de una señal de audio;

la Fig. 1b muestra un diagrama de bloques de otra forma de realización de un aparato para la reproducción de una señal de audio;

la Fig. 2 muestra un diagrama de bloques de una forma de realización adicional de un aparato para la reproducción de una señal de audio;

la Fig. 3 muestra un diagrama de bloques de una forma de realización de un aparato para la generación de una señal de audio codificada;

la Fig. 4a muestra una ilustración esquemática de un lado del codificador en el contexto de las formas de realización de la invención;

la Fig. 4b muestra una ilustración esquemática de un lateral de decodificador en el contexto de las formas de realización de la invención;

las Figs. 5a y 5b muestran diagramas que ilustran las ventajas de las formas de realización de la invención;

la Fig. 6 muestra un diagrama de bloques de un aparato para la reproducción de una señal de audio a partir de la cual se inicia la invención; y

las Fig. 7a a 7d muestran diagramas de señal útiles en la explicación de la operación del aparato que se muestra en la Fig. 6.

Antes de la explicación de las formas de realización de la invención en detalle, se considera de valor la breve descripción de los conceptos teóricos que sustentan la invención.

Como se explica con anterioridad, las extensiones de ancho de banda sobre la base de operaciones de copia (u operaciones de espejo), tales como SBR (SBR = replicación de banda espectral, según su sigla en inglés), copian grandes partes de un espectro LF directamente en el rango HF.

Un ejemplo de un aparato SBR se describe con referencia a las Figs. 6 y 7. La envolvente de una señal de audio 2 se muestra en la Fig. 7a. La señal de audio 2 comprende una porción de baja frecuencia (o banda de baja frecuencia) 4 y una porción de alta frecuencia (o banda de alta frecuencia) 6. Usualmente, en la codificación perceptual de señales de audio, la porción de baja frecuencia 4 es codificada por medio de un codificador de audio de alta calidad, tal como un codificador PCM (PCM = modulación por impulsos codificados, según su sigla en inglés), mientras que la banda superior solo es muy groseramente caracterizada por la información lateral. La información que representa la porción de baja frecuencia codificada y la información que representa la información lateral son transmitidas usando un correspondiente códec núcleo. La Fig. 6 muestra una señal de banda base 8 de un códec núcleo, que representa la porción de baja frecuencia 4 que se muestra en la Fig. 7b. Esta señal 8 se aplica a una unidad de modulación de banda lateral única/copia de respaldo, en la cual la señal 8 es desplazada al rango de frecuencia de la porción de alta frecuencia 6. Esta señal desplazada se muestra como la señal 10 en la Fig. 7c. La señal desplazada 10 y la señal 8 se aplican a una unidad de emparche 12, en la cual ambas señales son combinadas (añadidas) para obtener el espectro que se muestra en la Fig. 7c. La porción de señal 8 puede ser desplazada hacia p diferentes rangos de frecuencia más altos, donde p ≥ 1. Por lo tanto, puede tener lugar una combinación de una o más señales desplazadas (p) y la señal 8 en la unidad de emparche 12.

La señal de salida de la unidad de emparche 12 se aplica a una unidad de posprocesamiento 14, que además recibe información lateral 16 que representa la señal de audio en la porción de alta frecuencia 6. Por lo tanto, la porción de alta frecuencia 10’ de la señal de audio 6 es reproducida sobre la base de la información lateral 16 y la señal de audio de la porción de baja frecuencia 4. La señal de audio resultante se muestra en la Fig. 7d. La unidad de posprocesamiento 14 da salida a la salida de banda completa que cubre los rangos de frecuencia de la porción de baja frecuencia 4 y la porción de alta frecuencia 6.

En consecuencia, las extensiones de ancho de banda sobre la base de operaciones de copia (u operaciones de espejo), tales como SBR, copian grandes partes de un espectro de baja frecuencia directamente en el rango de alta frecuencia. Esto puede lograrse mediante el empleo de una modulación de banda lateral única de la representación de dominio de tiempo de la señal de audio, o mediante un proceso de copia directo (copia de respaldo) en la representación espectral de la señal de audio. Esta etapa de procesamiento habitualmente se denomina “emparche”.

Generalmente, puede haber una pluralidad de parches copiados en diferentes bandas de alta frecuencia. Las respectivas bandas de frecuencia pueden superponerse o no superponerse. Cada uno de los correspondientes parches de HF, de este modo, se correlaciona por completo con el rango de baja frecuencia del cual se he extraído. Los inventores reconocieron que, de esta manera, pueden producirse modulaciones de envolventes temporales mediante la superposición de ambas señales con una frecuencia que depende de la distancia espectral entre la banda LF y la ubicación espectral del respectivo parche HF.

Desde el punto de vista teórico del sistema, este fenómeno debe considerarse dual con respecto a la operación de un filtro peine de respuesta de impulso finito (FIR, según su sigla en inglés) que comprende un retardo de n muestras, con Fs como frecuencia de muestra. Ese filtro tiene una respuesta de frecuencia de magnitud con un ancho de peine (distancia espectral entre dos máximas de la respuesta de frecuencia de magnitud) de 1/n*Fs. Por lo tanto, la dualidad teórica del sistema tiene las siguientes correspondencias directas:

retardo de tiempo <–> traducción de frecuencia

respuesta de frecuencia de magnitud <–> envolvente temporal.

Los inventores reconocieron que las modulaciones temporales que resultan de allí son audibles de una manera alterante, y pueden hacerse visibles en la función de autocorrelación de la magnitud de forma de onda en la forma de máximas laterales de repetición periódica. Dichas máximas laterales de repetición periódica en la secuencia de autocorrelación de una envolvente de señal de ruido para SBR de copia de respaldo se muestran en la Fig. 5a. La Fig. 5a muestra la función de autocorrelación de la envolvente de magnitud de ruido blanco, donde el ancho de banda es extendido con tres parches de copia de respaldo directos que están completamente correlacionados entre sí, y con la banda LF.

Solo cuando la señal LF y la señal HF muestran la misma amplitud, se logra una máxima profundidad de modulación. En la práctica, el efecto de modulación, por lo tanto, con frecuencia es levemente menor, ya que, habitualmente, el rango HF es notablemente más silencioso (menos ruido) que el rango LF. Las señales de tipo ruido o señales cuasiestacionarias con una pronunciada estructura de sobretono deben considerarse particularmente decisivas con respecto a los artefactos de modulación.

Para la presencia de varios parches (p en la Fig. 6) que se correlacionan enteramente entre sí, naturalmente, es válida también la dualidad mencionada con anterioridad. Aparece una modulación temporal de la envolvente de magnitud que es dual con respecto a la respuesta de frecuencia de magnitud de un correspondiente filtro FIR.

Por lo tanto, de acuerdo con las formas de realización de la invención, el parche o los parches son descorrelacionados entre sí y con respecto a la banda LF. En las formas de realización de la invención, se usan uno

o más descorrelacionadores que descorrelacionan la señal derivada de los componentes de señal de baja frecuencia, respectivamente, antes de la inserción en los rangos de frecuencia más alta y, según el caso, posteriormente al procesamiento.

Las formas de realización de la invención evitan los problemas explicados que se producen debido a una operación de copia o una operación de espejo, mediante el uso de parches mutuamente descorrelacionados. En las formas de realización de la invención, los respectivos parches HF son descorrelacionados de la banda LF de un modo individual usando descorrelacionadores, por ejemplo, por medio de filtros paso todo u otros métodos de descorrelación conocidos, o de manera de crear los parches sintéticamente de una manera naturalmente descorrelacionada directamente.

En las formas de realización de la invención, el grado de descorrelación puede ser determinado fijamente o puede ser ajustado del lado del decodificador, o puede transmitirse como un parámetro desde el codificador hasta el decodificador. Además, el parche entero puede ser descorrelacionado, o solo porciones específicas del parche. Las porciones del parche por descorrelacionar también pueden ser transmitidas como un parámetro desde el codificador hasta el decodificador como parte de la correspondiente información añadida a la señal de audio codificada.

El enfoque de la invención es beneficioso en comparación con los enfoques convencionales para la extensión de ancho de banda, ya que las distorsiones y las coloraciones de sonido por las modulaciones de envolvente parasitarias o de alteración, tal como existen con los métodos actuales sobre la base de la modulación de banda lateral única/copia de respaldo de la banda LF, son inherentemente evitadas con el enfoque de la invención. Esto se logra mediante el uso de parches HF que son versiones descorrelacionadas de la porción de señal LF, o que son completamente no correlacionadas con respecto a la porción de señal LF.

Un escenario en el cual las formas de realización de la invención pueden implementarse se describe ahora con referencia a las Figs. 4a y 4b.

Un lado del codificador se muestra en la Fig. 4a, y un lado del decodificador se muestra en la Fig. 4b. Se alimenta una señal de audio en una combinación de bajo paso/alto paso en una entrada 700. La combinación de bajo paso/alto paso, por una parte, incluye un bajo paso (LP, según su sigla en inglés), para generar una versión filtrada de bajo paso de la señal de audio, ilustrado en 703 en la Fig. 7a. Esta señal de audio filtrada de bajo paso es codificada con un codificador de audio 704. El codificador de audio es, por ejemplo, un codificador de MP3 (MPEG– 1/2 capa 3) o un codificador de AAC, descripto en la norma MPEG–2/4. Pueden usarse codificadores de audio alternativos que proporcionen una representación transparente o, de modo conveniente, perceptualmente transparente de la señal de audio con limitación de banda 703, en el codificador 704, para generar una señal de audio completamente codificada o perceptualmente codificada y perceptualmente transparentemente codificada 705, respectivamente. La banda superior de la señal de audio sale en una salida 706 por la porción de paso alto del filtro 702, designada por “HP”. La porción de paso alto de la señal de audio, es decir, la banda superior o banda HF, también designada como la porción HF, es suministrada a un calculador de parámetros 707 que se implementa para

calcular los diferentes parámetros (que representan información lateral que representa la porción de alta frecuencia de la señal de audio). Estos parámetros son, por ejemplo, la envolvente espectral de la banda superior 706 en una resolución relativamente grosera, por ejemplo, por representación de un factor de escala para cada grupo de frecuencia sobre una escala perceptualmente adaptada (bandas críticas), por ejemplo, para cada banda Bark en la escala de Bark. Un parámetro adicional que puede ser calculado por el calculador de parámetros 707 es el piso de ruido en la banda superior, cuya energía por banda puede relacionarse con la energía de la envolvente en esta banda. Otros parámetros que puede ser calculados por el calculador de parámetros 707 incluyen una medida de tonalidad para cada banda parcial de la banda superior, que indica la manera en que la energía espectral está distribuida en una banda, es decir, si la energía espectral en la banda se distribuye de manera relativamente uniforme, donde, entonces, existe una señal no tonal en esta banda, o si la energía en esta banda está concentrada en forma relativamente fuerte en una cierta ubicación en la banda, donde, entonces, existe en cambio una señal tonal para esta banda. Otros parámetros consisten en picos explícitamente codificadores que sobresalen en forma relativamente fuerte en la banda superior con respecto a su altura y su frecuencia, ya que el concepto de extensión de ancho de banda, en la reconstrucción sin dicha codificación explícita de porciones sinusoidales prominentes en la banda superior, solo hará una recuperación en forma muy rudimentaria, o en forma totalmente nula.

En cualquier caso, el calculador de parámetros 707 se implementa para generar solamente los parámetros 708 para la banda superior, que puede someterse a etapas de reducción de entropía similares como también pueden efectuarse en el codificador de audio 704 para valores espectrales cuantificados, tales como la codificación diferencial, la predicción o la codificación Huffman, etc. La representación de parámetros 708 y la señal de audio 705 entonces se suministran a un formateador de corriente de datos 709, que se implementa para proporcionar una corriente de datos lateral de salida 710, que, típicamente, es una corriente de bits de acuerdo con un cierto formato, como, por ejemplo, es normalizado en la norma MPEG4.

El lado del decodificador, como puede ser adecuado para la presente invención, se muestra en la Fig. 7b. La corriente de datos 710 entre en un interpretador de corriente de datos 711, que se implementa para separar la porción de parámetros 708 de la porción de señal de audio 705. La porción de parámetro 708 es decodificada por un decodificador de parámetros 712, a fin de obtener parámetros decodificados 713. En forma paralela, la porción de señal de audio 705 es decodificada por un decodificador de audio 714, de manera de obtener la señal de audio 777 que se ilustra, por ejemplo, en 8 en la Fig. 6.

De acuerdo con la implementación, la señal de audio 777 puede salir por medio de una primera salida 715. En la salida 715, puede obtenerse entonces una señal de audio con un ancho de banda pequeño y, en consecuencia, además, con una baja calidad. Sin embargo, para un mejoramiento de la calidad, puede efectuarse la extensión de ancho de banda 720 haciendo uso del enfoque de la invención como se describe en lo que sigue con referencia a las Figs. 1a, 1b y 2, a fin de obtener la señal de audio 112 del lado de la salida con un ancho de banda extendido o alto, respectivamente, y una alta calidad.

Una forma de realización de un aparato de la invención para la reproducción de una señal de audio y, por lo tanto, la extensión de su ancho de banda, se muestra en la Fig. 1a. El aparato comprende un primer reproductor 100, un proveedor 102, una combinadora 104 y un segundo reproductor 106. Opcionalmente, puede proporcionarse un detector de transición 108. El primer reproductor 100 recibe, en una de sus entradas, primera información 120 que representa una versión codificada de una primera porción de información de audio en una primera banda de frecuencia. Por ejemplo, la primera información 120 puede corresponder a la porción de señal de audio 705 que se muestra en la Fig. 4b. El primer reproductor 100 reproduce la señal de audio en la primera banda de frecuencia sobre la base de la primera información 120. Por ejemplo, el primer reproductor 100 puede estar formado por el decodificador de audio 714 expuesto en la Fig. 4b. El primer reproductor 110 da salida a la señal de audio en la primera banda de frecuencia, que puede corresponder a la señal de audio 777 que se muestra en la Fig. 4b. La señal de audio 777 se aplica al proveedor 102, que provee una señal de parche 122 en la segunda banda de frecuencia. La señal de parche 122 está al menos parcialmente no correlacionada con respecto a la primera porción de la señal de audio 777, o es al menos parcialmente una versión descorrelacionada de la primera porción de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia. La señal de audio 777 y la señal de parche 122 se combinan, por ejemplo, se añaden, en la combinadora 104. La señal combinada 124 sale y se aplica al segundo reproductor 106. El segundo reproductor 106 recibe la señal combinada 124 y la segunda información 126 que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia. Por ejemplo, la segunda información 126 puede corresponder a parámetros decodificados 713 descriptos con anterioridad con respecto a la Fig. 4b. El segundo reproductor 106 reproduce la señal de audio en la segunda banda de frecuencia sobre la base de la señal de parche (dentro de la señal combinada 124) y sobre la base de la segunda información 126.

En las formas de realización de la invención, la primera banda de frecuencia puede corresponder al rango de frecuencia asociado con la primera porción de la señal de audio que se muestra en la Fig. 7a, y la segunda banda de frecuencia puede corresponder al rango de frecuencia asociado con la segunda porción de la señal de audio que se muestra en la Fig. 7a.

De acuerdo con la forma de realización que se muestra en la Fig. 1a, el segundo reproductor 106 da salida a una señal de audio reproducida 128 con un alto ancho de banda.

En la forma de realización alternativa que se muestra en la Fig. 1b, la salida del proveedor 102 se acopla con el segundo reproductor 106, y la salida del segundo reproductor 106 se acopla a la combinadora 104. Por lo tanto, de acuerdo con la forma de realización que se muestra en la Fig. 1b, una señal de audio 130 en la segunda banda de frecuencia es reproducida desde la señal de parche provista por el proveedor 102 antes de la combinación de la señal de parche con la primera porción 777 de la señal de audio. Nuevamente, el segundo reproductor reproduce la señal de audio 130 en la segunda banda de frecuencia, sobre la base de la segunda información 126 y la señal de parche 122. De acuerdo con la forma de realización que se muestra en la Fig. 1b, la combinadora 104 da salida a la señal de audio reproducida 128.

En las formas de realización de la invención, el proveedor comprende una unidad de desplazamiento y un descorrelacionador, que están configurados para generar la señal de parche como una versión descorrelacionada de la primera porción de la señal de audio desplazada hacia la segunda banda de frecuencia. En las formas de realización de la invención, el proveedor está configurado para proporcionar una señal de parche sintética que está no correlacionada con respecto a la primera porción de la señal de audio. En las formas de realización de la invención, el proveedor está configurado para proporcionar una pluralidad de señales de parche para una pluralidad de bandas de frecuencia más alta. En dichas formas de realización, el segundo reproductor y la segunda combinadora se adaptan para reproducir una pluralidad de segundas porciones de señal y para combinar la pluralidad de porciones de señal en la señal de audio reproducida.

Una forma de realización de un aparato para la reproducción de una señal de audio usando extensión de ancho de banda, que utiliza señales de audio de sub–banda descorrelacionadas, se muestra en la Fig. 2. El aparato recibe una señal de banda base desde el códec núcleo, que puede ser la señal 777 que se muestra en la Fig. 4b. La señal 777 se aplica a una unidad de desplazamiento 200. La unidad de desplazamiento 200 está configurada para desplazar la señal 777 desde el rango de baja frecuencia hasta un rango de alta frecuencia, tal como un rango de frecuencia asociado con la porción de baja frecuencia 4 en la Fig. 7a al rango de frecuencia asociado con la porción de alta frecuencia 6 en la Fig. 7a.

La unidad de desplazamiento 200 puede estar configurada para simplemente copiar en forma de respaldo la porción de señal 777 al rango de alta frecuencia en el dominio de frecuencia. Alternativamente, la unidad de desplazamiento 200 puede implementarse como una unidad de modulación de banda lateral única configurada para realizar una modulación de banda lateral única en el dominio de tiempo a fin de desplazar la primera porción de la señal de audio desde la primera banda de frecuencia hasta la segunda banda de frecuencia.

La primera porción desplazada de la señal de audio se aplica a una unidad de descorrelación 202a. La primera porción descorrelacionada desplazada de la señal de audio sale de la unidad de descorrelación 202a como una señal de parche 204. La señal de parche 204 se aplica a una unidad de emparche 206, en la cual la señal de parche 204 se combina con la primera porción 777 de la señal de audio. Por ejemplo, la señal de parche y la primera porción de la señal de audio son concatenadas o añadidas en la unidad de emparche 206. La señal combinada sale de la unidad de emparche 206 y se aplica a una unidad de posprocesamiento 210.

La unidad de posprocesamiento 210 recibe la segunda información 212 y representa un segundo reproductor configurado para reproducir la segunda porción de la señal de audio en una segunda banda de frecuencia sobre la base de la segunda información 212 y la señal de parche 204 (que se incluye en la señal combinada 208). Nuevamente, la segunda información 212 representa información lateral, y puede corresponder a parámetros decodificados 713 explicados con anterioridad con respecto a la Fig. 4b. Una salida de banda completa 214 de la unidad de posprocesamiento 210 representa la señal de audio reproducida.

En la forma de realización que se muestra en la Fig. 2, la unidad de desplazamiento 200 y la unidad de descorrelación 202a representan un proveedor configurado para proporcionar una señal de parche 204.

En las formas de realización de la invención, la unidad de desplazamiento 200 puede estar configurada para desplazar la primera porción 777 de la señal de audio en una pluralidad de p diferentes bandas de frecuencia. Una unidad de descorrelación 202a–202p puede proporcionarse para cada versión desplazada, a fin de proporcionar p señales de parche. En el caso de usar más de un parche (tal como p parches), los p parches deben estar no correlacionados entre sí y la banda LF. Luego, las versiones desplazadas asociadas con cada banda de frecuencia se combinan dentro de la unidad de emparche 206. Una segunda información que representa información lateral para cada una de las bandas de frecuencia más alta puede proporcionarse a la unidad de posprocesamiento 210, de modo que una pluralidad de porciones de frecuencia más alta de la señal de audio son reproducidas en la unidad de posprocesamiento 210.

En las formas de realización de la invención, la primera y segunda bandas de frecuencia (y las bandas de frecuencia adicionales opcionales) pueden superponerse, o pueden no superponerse en la dirección de frecuencia.

Por lo tanto, en las formas de realización de la invención, el proveedor comprende una unidad de desplazamiento configurada para desplazar una primera porción de una señal de audio en una primera banda de frecuencia a una segunda banda de frecuencia o a una pluralidad de diferentes segundas bandas de frecuencia, y un descorrelacionador para descorrelacionar la versión desplazada de la primera porción de la señal de audio, de la primera porción de la señal de audio. En las formas de realización de la invención, el descorrelacionador puede tener las mismas propiedades que aquellas conocidas, por ejemplo, de la descorrelación de codificación de audio espacial. En las formas de realización de la invención, el descorrelacionador puede proporcionar una descorrelación suficiente para evitar las distorsiones de señal y los artefactos típicos de extensiones de ancho de banda convencionales usando la replicación de banda espectral. El descorrelacionador puede proporcionar una preservación de la envolvente espectral de la primera porción de la señal de audio, y/o puede proporcionar una preservación de la envolvente temporal, es decir, los transitorios, de la primera porción de la señal de audio. El diseño de un descorrelacionador apropiado, en consecuencia, podría involucrar típicamente un trueque por realizar entre la preservación de transitorio y la descorrelación.

En las formas de realización de la invención, el descorrelacionador puede implementarse como un filtro IIR (IIR= respuesta de impulso infinito) en el dominio de tiempo o el dominio de tiempo de sub–banda, por ejemplo, un filtro paso todo, donde la descorrelación se logra por medio de variaciones de retardo de grupo. En las formas de realización de la invención, el descorrelacionador puede configurarse de manera de proporcionar la aleatorización de fase de los coeficientes espectrales en una compleja (sobremuestreada) representación transformada/banco de filtro (representación DFT, QMF) (DFT = transformada Fourier discreta; QMF = filtro espejo de cuadratura). En las formas de realización de la invención, el descorrelacionador puede configurarse a fin de proporcionar una aplicación de un retardo de tiempo dependiente de la frecuencia, en una representación de banco de filtro.

Las formas de realización de la invención pueden comprender un descorrelacionador adaptador de señal, que varía el grado de descorrelación a fin de preservar transitorios. Puede proporcionarse una alta descorrelación para señales cuasiestacionarias, y puede proporcionarse una baja descorrelación para señales transitorios. En consecuencia, en las formas de realización de la invención, el proveedor para la provisión de la señal de parche puede ser desplazable entre diferentes grados de descorrelación.

En las formas de realización, el proveedor para la provisión de la señal de parche puede ser desplazable entre diferentes grados de descorrelación, según si la primera porción de señal comprende un indicador para una fuerte correlación entre la primera porción de la señal de audio y la segunda porción de señal de audio. Las formas de realización para dicho indicador son un transitorio en la primera porción de la señal de audio, discurso de voz que consiste en trenes de pulsos en la primera porción de la señal de audio y/o el sonido de instrumentos de viento metal en la primera porción de la señal de audio. En lo que sigue, se describen las formas de realización, en las cuales el indicador es un transitorio en la primera porción de la señal de audio.

En las formas de realización de la invención, el aparato puede comprender un detector configurado para detecta si la primera porción de la señal de audio comprende un transitorio. Dicho detector 108 se muestra esquemáticamente en las Figs. 1a y 1b. De acuerdo con la señal de salida del detector 108, el proveedor 102 puede configurarse de manera de proporcionar la señal de parche con una alta descorrelación para señales cuasiestacionarias, es decir, cuando la primera porción de la señal de audio no tiene un transitorio), y una baja descorrelación, si la primera porción de la señal de audio tiene señales transitorios.

En formas de realización alternativas de la invención, el aparato puede comprender un descorrelacionador adaptador de señal que es activado para señales cuasiestacionarias y desactivado para porciones de señales transitorios. En otras palabras, el proveedor puede estar configurado para dar salida a la primera porción de señal desplazada sin su descorrelación, en el caso de que la primera porción de señal comprenda porciones de señal transitorio, y para dar salida a la señal de parche descorrelacionada solamente, en el caso de que la primera porción de señal no comprenda transitorios o porciones de señal transitorio. En dichas formas de realización, el segundo reproductor está configurado para reproducir la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información y la señal de parche, si la primera porción de la señal de audio no comprende un transitorio, y está configurado para reproducir la señal de audio en una segunda banda de frecuencia sobre la base de la segunda información y una versión de la primera porción de la señal de audio que se ha desplazado hacia la segunda banda de frecuencia y que no se ha descorrelacionado, si la primera porción de la señal de audio comprende un transitorio.

Puede considerarse que un transitorio o porciones de transitorios consisten en el hecho de que la señal de audio cambia mucho en total, es decir, que, por ejemplo, la energía de la señal de audio cambia más del 50% desde una porción temporal hacia la siguiente porción temporal, es decir, incrementa o disminuye. El umbral de 50% es solo un ejemplo; sin embargo, también puede ser valores menores o mayores. Alternativamente, para una detección de transitorio, el cambio de distribución de energía también puede considerarse, por ejemplo, en la transición de una vocal a una sibilante.

En las formas de realización de la invención, el proveedor puede estar configurado para proporcionar una señal de parche sintético que está no correlacionada con respecto a la primera porción de la señal de audio. En otras

palabras, el emparche con una señal de parche sintético no correlacionada (tal como ruido sintético) ya podría ser suficiente si el procesamiento posterior paramétrico es granular fino (escenario de códec de alta tasa de bits) o si la banda HF de la señal, de todos modos, es de tipo ruidosa.

En las formas de realización de la invención, una correlación de la banda LF y la banda HF dentro de una extensión de ancho de banda (como SBR), sin embargo, es útil para mejorar una cuadrícula de tiempo demasiado gruesa de procesamiento posterior paramétrico (por ejemplo, debido a un escenario de códec de baja tasa de bits), una reproducción exacta de transitorios, y una preservación de tonos que tienen una rica estructura de sobretono (habitualmente, la tonalidad no es afectada por la descorrelación, y en consecuencia, la preservación de la tonalidad no presenta un problema en el diseño de un descorrelacionador).

En términos de los descorrelacionadores conocidos, por ejemplo, de la descorrelación de codificación de audio espacial, se hace referencia, por ejemplo, a la Solicitud Internacional WO 2007/118583 A1.

En las formas de realización de la invención, el proveedor 102 puede comprender un descorrelacionador adaptador, que ajusta la descorrelación de los parches HF sobre la base de un parámetro transmitido desde un codificador hacia el decodificador. En dichas formas de realización, el aparato está configurado para la reproducción de una señal de audio sobre la base de la primera información, la segunda información y tercera información que comprende información sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción es reproducida cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada. Dicha tercera información puede ser añadida a la información de audio codificada en el lado del codificador, tal como por medio de un añadidor de información de descorrelación 300 que se muestra en la Fig. 3 de la presente solicitud. El aparato que se muestra en la Fig. 3 corresponde al aparato que se muestra en la Fig. 4a, excepto el añadidor de información de descorrelación.

El añadidor de información de descorrelación 300 recibe la salida del filtro de paso bajo 702, y puede detectar propiedades de la señal de salida del filtro de bajo paso 702. Por ejemplo, el añadidor de información de descorrelación puede detectar transitorios en la señal de salida del filtro de bajo paso 702. De acuerdo con las propiedades de la salida del filtro de bajo paso 702, el añadidor de información de descorrelación añade a la señal de audio codificada 710 información sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción es reproducida cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada. Por ejemplo, la información de descorrelación puede instruir al proveedor del lado del decodificador, para la realización de una baja descorrelación,

o para la no realización de ninguna descorrelación, en el caso de que haya porciones transitorios en la porción de baja frecuencia de la señal de audio.

En las formas de realización de la invención, el añadidor de información de descorrelación además puede recibir la porción de alta frecuencia 706 de la señal de audio, y puede estar configurado para derivar propiedades desde allí. Por ejemplo, en el caso de que el añadidor de información de descorrelación detecta que la banda HF es de tipo ruido, puede advertir al proveedor del lado del decodificador que proporcione la señal de parche sobre la base de una señal de ruido sintético.

En dichas formas de realización, la señal de audio codificada 320 representada por la corriente de datos 710 comprende primera información 321 que representa una versión codificada de una primera porción de una señal de audio; segunda información 322 que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia; e información 323 sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción es reproducida cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada.

Por consiguiente, las formas de realización de la invención proporcionan un enfoque mejorado para la reproducción de una señal de audio, es decir, para una extensión, del lado del decodificador, del ancho de banda de la señal de audio. En otras formas de realización, la invención provee un aparato para la generación de una señal de audio codificada. En aun otras formas de realización, la invención se refiere a dichas señales de audio codificadas.

El efecto conveniente logrado por el enfoque de la invención puede hacerse visible mediante una comparación de la secuencia de autocorrelación de la envolvente de señal de ruido para SBR de copia de respaldo (que se muestra en la Fig. 5a), con la secuencia de autocorrelación de la envolvente de señal de ruido de parches descorrelacionados como se muestra en la Fig. 5b de la presente solicitud. La Fig. 5b es la función de autocorrelación de la envolvente de magnitud de ruido blanco, donde el ancho de banda es extendido con tres parches no correlacionados entre sí y con la banda LF. La Fig. 5b muestra claramente la desaparición de las máximas laterales indeseadas que se muestran en la Fig. 5a.

La presente solicitud es aplicable o adecuada para todas las aplicaciones de audio en las cuales el ancho de banda completo no está disponible. El enfoque de la invención puede hallar uso en la distribución o transmisión de contenido de audio, por ejemplo, con aplicaciones de radio digital, lectura en continuo (streaming) de Internet y

comunicación de audio. Las formas de realización de la invención se refieren a una extensión de ancho de banda usando señales de audio de sub–banda descorrelacionadas.

Si bien algunos aspectos se han descripto en el contexto de un aparato, es claro que estos aspectos también representan una descripción del correspondiente método, donde un bloque o dispositivo corresponde a una etapa de método o un rasgo de una etapa de método. En forma análoga, los aspectos descriptos en el contexto de una etapa de método también representan una descripción de un correspondiente bloque, ítem o rasgo de un correspondiente aparato.

De acuerdo con ciertos requerimientos de implementación, las formas de realización de la invención pueden implementarse en soporte físico o en soporte lógico. La implementación puede realizarse usando un medio de almacenamiento digital, por ejemplo, un disquete, un DVD (disco versátil digital, según su sigla en inglés), un CD (disco compacto, según su sigla en inglés), una ROM (memoria de solo lectura, según su sigla en inglés), una PROM (memoria de solo lectura programable, según su sigla en inglés), una EPROM (memoria de solo lectura programable borrable, según su sigla en inglés), una EEPROM (memoria de solo lectura programable y borrable eléctricamente, según su sigla en inglés) o una memoria FLASH, con señales de control legibles electrónicamente allí almacenadas, que cooperan (o son capaces de cooperar) con un sistema de ordenador programable de modo tal que se lleva a cabo el respectivo método.

Algunas formas de realización de acuerdo con la invención comprenden un portador de datos que tiene señales de control legibles electrónicamente, que son capaces de cooperar con un sistema de ordenador programable, de manera tal que se lleva a cabo uno de los métodos descriptos en la presente solicitud.

Generalmente, las formas de realización de la presente invención pueden implementarse como un producto de programa de ordenador con un código de programa, donde el código de programa es operativo para la realización de uno de los métodos cuando el producto de programa de ordenador se ejecuta en un ordenador. El código de programa, por ejemplo, puede ser almacenado en un portador legible por una máquina tangible.

Otras formas de realización comprenden el programa de ordenador para la realización de uno de los métodos descriptos en esta solicitud, almacenado en un portador legible por una máquina, o en un medio de almacenamiento no transitorio.

En otras palabras, una forma de realización del método de la invención, por lo tanto, es un programa de ordenador que tiene un código de programa para la realización de uno de los métodos descriptos en esta solicitud, cuando el programa de ordenador se ejecuta en un ordenador.

Una forma de realización adicional de los métodos de la invención, por lo tanto, es un portador de datos (o un medio de almacenamiento digital, o un medio de lectura por ordenador) que comprende, allí grabado, el programa de ordenador para la realización de uno de los métodos descriptos en esta solicitud.

Otra forma de realización del método de la invención es, por lo tanto, una corriente de datos o una secuencia de señales que representan el programa de ordenador para la realización de uno de los métodos descriptos en esta solicitud. La corriente de datos o la secuencia de señales, por ejemplo, puede configurarse para ser transferida por medio de una conexión de comunicación de datos, por ejemplo, por medio de la Internet.

Una forma de realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador, o un dispositivo lógico programable, configurado o adaptado para llevar a cabo uno de los métodos descriptos en esta solicitud.

Otra forma de realización comprende un ordenador que tiene instalado el programa de ordenador para la realización de uno de los métodos descriptos en esta solicitud.

En algunas formas de realización, un dispositivo lógico programable (por ejemplo, una matriz de puertas programable de campo) puede usarse para realizar algunas o la totalidad de las funcionalidades de los métodos descriptos en esta solicitud. En algunas formas de realización, una matriz de puertas programable de campo puede cooperar con un microprocesador a fin de llevar a cabo uno de los métodos que se describen en la presente solicitud. En general, los métodos son realizados, preferentemente, por cualquier aparato de soporte físico.

Las formas de realización descriptas con anterioridad son meramente ilustrativas de los principios de la presente invención. Debe entenderse que las modificaciones y variaciones de las disposiciones y los detalles que se describen en la presente solicitud serán evidentes para los expertos en la técnica. Por lo tanto, se tiene la intención de limitación solo por el alcance de las reivindicaciones de patente inminentes, y no por los detalles específicos presentados a modo de descripción y explicación de las formas de realización de esta solicitud.

Claims

REIVINDICACIONES

1. Un aparato para la reproducción de una señal de audio sobre la base de primera información (120; 321; 705) que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y segunda información (126; 322; 708) que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, donde dicho dispositivo comprende:

un primer reproductor (100) configurado para reproducir la primera porción (777) de la señal de audio sobre la base de la primera información (120; 321; 705);

un proveedor (102; 200, 202a) configurado para proporcionar una señal de parche (122; 204) en la segunda banda de frecuencia, donde la señal de parche (122; 204) está al menos parcialmente no correlacionada con respecto a la primera porción (777) de la señal de audio, o es al menos parcialmente una versión descorrelacionada de la primera porción (777) de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia;

un segundo reproductor (106) (106) que representa un post-procesador y que está configurado para reproducir la segunda porción de la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información (126; 322; 708) y la señal de parche (122; 204); en el que una envolvente espectral de la segunda porción de la señal de audio, un piso de ruido en la segunda porción de la señal de audio, una medida de tonalidad para cada banda parcial en la segunda porción de la señal de audio, y una codificación explícita de porciones senoidales prominentes en la segunda porción de la señal de audio representan información lateral representada por la segunda información; y

una combinadora (104) configurada para la combinación de la primera porción reproducida (777) de la señal de audio y la señal de parche (122; 204) antes de que la segunda porción de la señal de audio es reproducida por el segundo reproductor, o para la combinación de la primera porción reproducida (777) de la señal de audio y la segunda porción reproducida de la señal de audio.
2. El aparato de la reivindicación 1, donde el segundo reproductor (106) está configurado para reproducir la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información (126; 322; 708) y la señal de parche (122; 204), si la primera porción (777) de la señal de audio no comprende un transitorio, discurso de voz que consiste en trenes de pulsos y/o el sonido de instrumentos de viento-metal y donde el segundo reproductor

(106) está configurado para reproducir la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información (126; 322; 708) y una versión de la primera porción de la señal de audio que se ha desplazado hacia la segunda banda de frecuencia y que no se ha descorrelacionado, si la primera porción (777) de la señal de audio comprende un transitorio, discurso de voz que consiste en trenes de pulsos y/o el sonido de instrumentos de viento-metal.
3.

El aparato de la reivindicación 1 o 2, donde el proveedor (102) está configurado para proporcionar una señal de parche sintético que está no correlacionada con respecto a la primera porción de la señal de audio.
4.

El aparato de la reivindicación 3, donde la señal de parche sintético es una señal de ruido.
5.

El aparato de la reivindicación 1 o 2, donde el proveedor (102) comprende a unidad de desplazamiento

(200) y un descorrelacionador (202a …. 202p), que están configurados para generar la señal de parche (122; 204) como una versión descorrelacionada de la primera porción (777) de la señal de audio desplazada hacia la segunda banda de frecuencia.
6. El aparato de la reivindicación 5, donde el descorrelacionador (202a … 202p) está configurado para preservar por lo menos una de una envolvente espectral de la primera porción

(777) de la señal de audio y una envolvente temporal de la primera porción (777) de la señal de audio.
7. El aparato de la reivindicación 5 o 6, donde el descorrelacionador (202a … 202p) comprende uno de:

un filtro paso todo configurado para causar variaciones de retardo de grupo en la primera porción de la señal de audio;

un aleatorizador de fase configurado para causar la aleatorización de fase de coeficientes espectrales de la primera porción de la señal de audio; y

un aplicador configurado para aplicar un retardo de tiempo dependiente de la frecuencia a subporciones de la primera porción de la señal de audio.
8.

El aparato de una de las reivindicaciones 5 a 7, donde el descorrelacionador (202a … 202p) comprende un descorrelacionador adaptador de señal configurado para variar el grado de descorrelación a fin de aplicar una descorrelación más alta si la primera porción (777) de la señal de audio no comprende un transitorio, discurso de voz que consiste en trenes de pulsos y/o el sonido de instrumentos de viento-metal y para aplicar una menor descorrelación o no aplicar una descorrelación si la primera porción (777) de la señal de audio comprende un transitorio, discurso de voz que consiste en trenes de pulsos y/o el sonido de instrumentos de viento-metal.
9.

El aparato de una de las reivindicaciones 2 a 8, que comprende un detector (108) configurado para detectar si la primera porción de señal (777) de la señal de audio comprende un transitorio, discurso de voz que consiste en trenes de pulsos y/o el sonido de instrumentos de viento-metal.
10.

El aparato de una de las reivindicaciones 1 a 9, donde el proveedor (200, 202a … 202p) está configurado para proporcionar una segunda señal de parche en una tercera banda de frecuencia, donde la segunda señal de parche está no correlacionada con respecto a la primera porción de la señal de audio o es una versión descorrelacionada de la primera porción de la señal de audio, que se ha desplazado hacia la tercera banda de frecuencia, donde la segunda señal de parche está no correlacionada o está descorrelacionada con respecto a la primera señal de parche, donde el aparato comprende un tercer reproductor, donde el tercer reproductor está configurado para reproducir una tercera porción de la señal de audio sobre la base de la segunda señal de parche y la tercera información que representa información lateral sobre la tercera porción de la señal de audio en la tercera banda de frecuencia, donde la tercera banda de frecuencia comprende frecuencias superiores a la segunda banda de frecuencia.
11.

Un método para la reproducción de una señal de audio sobre la base de primera información (120; 321; 705) que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y segunda información (126; 322; 708) que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, donde dicho método comprende:

la reproducción de la señal de audio (777) en la primera banda de frecuencia sobre la base de la primera información (120; 321; 705);

la provisión de una señal de parche (122; 204) en la segunda banda de frecuencia, donde la señal de parche (122; 204) está al menos parcialmente no correlacionada con respecto a la primera porción (777) de la señal de audio o es al menos parcialmente una versión descorrelacionada de la primera porción (777) de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia;

la reproducción de la segunda porción de la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información (126; 322; 708) y la señal de parche (122; 204) por medio de un post-procesador, donde una envolvente espectral de la segunda porción de la señal de audio, un piso de ruido en la segunda porción de la señal de audio, una medida de tonalidad para cada banda parcial en la segunda porción de la señal de audio, y una codificación explícita de porciones senoidales prominentes en la segunda porción de la señal de audio representan información lateral representada por la segunda información; y

la combinación de la primera porción reproducida (777) de la señal de audio y la señal de parche (122; 204) antes de que la segunda porción de la señal de audio es reproducida, o la combinación de la primera porción reproducida

(777) de la señal de audio y la segunda porción reproducida de la señal de audio.
12. Un aparato para la generación de una señal de audio codificada (320), donde la señal de audio codificada

(320) comprende primera información (321) que representa una versión codificada de una primera porción (703) de la señal de audio en una primera banda de frecuencia, y segunda información (322) que representa información lateral sobre una segunda porción (706) de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, que comprende:

un añadidor de información de descorrelación (300) configurado para añadir a la señal de audio codificada (320) adicionalmente a la primera información (321) y a la segunda información (322) información (323) sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción de la señal de audio es reproducida por medio de un post-procesador cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada, donde una envolvente espectral de la segunda porción de la señal de audio, un piso de ruido en la segunda porción de la señal de audio, una medida de tonalidad para cada banda parcial en la segunda porción de la señal de audio, y una codificación explícita de porciones senoidales prominentes en la segunda porción de la señal de audio representan información lateral representada por la segunda información.
13. Un método para la generación de una señal de audio codificada (320), donde la señal de audio codificada

(320) comprende primera información (321) que representa una versión codificada de una primera porción (703) de la señal de audio en una primera banda de frecuencia, y segunda información (322) que representa información lateral sobre una segunda porción (706) de la señal de audio en una segunda banda de frecuencia, donde la

5 segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, que comprende:

la añadidura a la señal de audio codificada (320) adicionalmente a la primera información (321) y a la segunda información (322) de información (323) sobre un grado de descorrelación para ser usado entre la primera porción de 10 la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción de la señal de audio es reproducida por medio de un post-procesador cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada (320), donde una envolvente espectral de la segunda porción de la señal de audio, un piso de ruido en la segunda porción de la señal de audio, una medida de tonalidad para cada banda parcial en la segunda porción de la señal de audio, y una codificación explícita de porciones senoidales prominentes en la segunda porción

15 de la señal de audio representan información lateral representada por la segunda información.
14. Un programa de ordenador que comprende código de programa adaptado para la realización de un método de acuerdo con la reivindicación 11 o 13, cuando el programa de ordenador se ejecuta en un ordenador.

DIBUJOS