ES2545053T3 - Aparato y método para codificación y decodificación de audio que emplea sustitución sinusoidal - Google Patents

Aparato y método para codificación y decodificación de audio que emplea sustitución sinusoidal Download PDF

Info

Publication number
ES2545053T3
ES2545053T3 ES12818512.1T ES12818512T ES2545053T3 ES 2545053 T3 ES2545053 T3 ES 2545053T3 ES 12818512 T ES12818512 T ES 12818512T ES 2545053 T3 ES2545053 T3 ES 2545053T3
Authority
ES
Spain
Prior art keywords
spectral
coefficients
value
spectrum
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12818512.1T
Other languages
English (en)
Inventor
Sascha Disch
Benjamin SCHUBERT
Ralf Geiger
Martin Dietz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2545053T3 publication Critical patent/ES2545053T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un aparato para generar una señal de salida de audio basándose en un espectro de señal de audio codificado, en el que el aparato comprende: una unidad de procesamiento (110) para procesar el espectro de señal de audio codificado para obtener un espectro de señal de audio decodificado comprendiendo el espectro de señal de audio decodificado una pluralidad de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de señal de audio codificado y un valor espectral, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de señal de audio codificado de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales, un determinador de pseudo coeficientes (120) para determinar uno o más pseudo coeficientes del espectro de señal de audio decodificado, teniendo cada uno de los pseudo coeficientes una localización espectral y un valor espectral, una unidad de modificación de espectro (130) para ajustar el uno o más pseudo coeficientes a un valor predefinido para obtener un espectro de señal de audio modificado, una unidad de conversión de espectro-tiempo (140) para convertir el espectro de señal de audio modificado a un dominio de tiempo para obtener una señal de conversión de dominio de tiempo, un oscilador controlable (150) para generar una señal de oscilador de dominio de tiempo, estando controlado el oscilador controlable (150) mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes, y un mezclador (160) para mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo para obtener la señal de salida de audio.

Description

Aparato y método para codificación y decodificación de audio que emplea sustitución sinusoidal
5 La presente invención se refiere a codificación, decodificación y procesamiento de señal de audio, y, en particular, a codificación y decodificación de audio que emplea sustitución sinusoidal.
El procesamiento de las señales de audio se hace más y más importante. Surgen desafíos, ya que se requieren códec de audio perceptuales de módem para suministrar satisfactoriamente calidad de audio a tasas de bits cada
10 vez más bajas. Adicionalmente, en ocasiones la latencia permisible es también muy baja, por ejemplo, para aplicaciones de comunicación bidireccional o juego distribuido, etc.
Los códec de audio de módem, como por ejemplo USAC (Codificación Unificada de Audio y Habla), a menudo cambian entre codificación predictiva de dominio de tiempo y codificación en el dominio de la transformada,
15 independientemente del contenido de música se codifica aún predominantemente en el dominio de la transformada. A bajas tasas de bits, por ejemplo < 14 kbit/s, los componentes tonales en elementos de música a menudo suenan mal cuando se codifican a través de codificadores de transformada, que hace la tarea de codificar audio a suficiente calidad incluso más desafiante.
20 Adicionalmente, las restricciones de bajo retardo conducen generalmente a una respuesta de frecuencia subóptima del banco de filtros del codificador de transformada (debido a la forma de ventana y/o a longitud de transformada optimizadas a bajo retardo) y por lo tanto compromete adicionalmente la calidad perceptual de tales códec.
De acuerdo con el modelo psicoacústico clásico, se definen prerequisitos para transparencia con respecto a la
25 cuantificación de ruido. A altas tasas de bits, esto se refiere a una distribución de tiempo/frecuencia óptima perceptualmente adaptada de ruido de cuantificación que cumple los niveles de enmascaramiento auditivos humanos. A bajas tasas de bits, sin embargo, no puede alcanzarse la transparencia. Por lo tanto, puede emplearse una estrategia de reducción de requisitos de nivel de enmascaramiento a bajas tasas de bits.
30 Ya se han proporcionado códec de ranura superior para contenido de música, en particular, codificadores de transformada basándose en la Transformada Modificada Discreta del Coseno (MDCT), que cuantifican y transmiten coeficientes espectrales en el dominio de frecuencia. Sin embargo, a velocidades de datos muy bajas, únicamente pueden codificarse muy pocas líneas espectrales de cada trama de tiempo mediante los bits disponibles para esa trama. Como una consecuencia, son inevitables los artefactos de modulación temporal y los denominados artefactos
35 de tipo trino (warbling) introducidos en la señal codificada.
Más importante, estos tipos de artefactos se perciben en componentes tonales cuasiestacionarios. Esto ocurre especialmente si, debido a restricciones de retardo, se ha de elegir una forma de ventana de transformada que introduce diafonía significativa entre coeficientes espectrales adyacentes (ensanchamiento espectral) debido al
40 efecto de filtración bien conocido. Sin embargo, no obstante, normalmente únicamente uno o pocos de estos coeficientes espectrales adyacentes permanecen distintos de cero después de la cuantificación aproximada mediante el codificador de baja tasa de bits.
Como se ha indicado anteriormente, en la técnica anterior, de acuerdo con un enfoque, se emplean codificadores de
45 transformada. Los códec de audio de alta relación de compresión actuales que son bien adecuados para codificación de contenido de música se basan todos en codificación de transformada. Los ejemplos más importantes son MPEG2/4 Codificación de Audio Avanzada (AAC) y MPEGD Codificación Unificada de Audio y Habla (USAC). USAC tiene un núcleo conmutado que consiste en un módulo de Predicción Lineal con Excitación por Código Algebraico (ACELP) más un módulo Excitación Codificada de Transformada (TCX) (véase [5]) pretendida
50 principalmente para codificación de habla y, como alternativa, AAC pretendida principalmente para codificación de música. Como AAC, también TCX es un método de codificación basado en transformada. A configuraciones de baja tasa de bits, estos esquemas de codificación son propensos a mostrar artefactos de tipo trino, especialmente si los esquemas de codificación subyacentes están basados en la Transformada Modificada Discreta del Coseno (MDCT) (véase [1]).
55 Para reproducción de música, los codificadores de transformada son la técnica preferida para compresión de datos de audio. Sin embargo, a bajas tasas de bits, los codificadores de transformada tradicionales muestran intensos artefactos de trino y desigualdad. La mayoría de los artefactos se originan desde demasiados componentes espectrales tonales escasamente codificados. Esto ocurre especialmente si estos están espectralmente extendidos
60 mediante una función de transferencia espectral subóptima (efecto de filtración) que está principalmente diseñada para cumplir estrictas restricciones de retardo.
De acuerdo con otro enfoque en la técnica anterior, los esquemas de codificación son completamente paramétricos para transitorios, sinusoides y ruido. En particular, para tasas de bits medias y bajas, se han normalizado los códec
de audio completamente paramétricos, los más importantes de los que son MPEG4 Parte 3, Subparte 7 Armónicos y Líneas Individuales más Ruido (HILN) (véase [2]) y MPEG4 Parte 3, Subparte 8 Codificación Sinusoidal (SSC) (véase [3]). Los codificadores paramétricos, sin embargo, sufren de un sonido desagradablemente artificial y, con tasas de bits crecientes, no escalan bien hacia la transparencia perceptual.
5 Un enfoque adicional proporciona codificación de forma de onda y paramétrica híbrida. En [4], se propone un híbrido de codificación de forma de onda basada en transformada y MPEG 4SSC (parte sinusoidal únicamente). En un proceso iterativo, las sinusoides se extraen y restan de la señal para formar una señal residual a codificar mediante técnicas de codificación de transformada. Las sinusoides extraídas se codifican mediante un conjunto de parámetros
10 y se transmiten junto con el residuo. En [6], se proporciona un enfoque de codificación híbrida que codifica sinusoides y residuo por separado. En [7], en el denominado códec de Transformación Superpuesta de Energía Restringida (CELT) / página web fantasma, se presenta la idea de utilizar un banco de osciladores para codificación híbrida.
15 A tasas de bits medias o superiores, los codificadores de transformada son bien adecuados para codificación de música debido a su sonido natural. Ahí, los requisitos de transparencia del modelo psicoacústico subyacente se cumplen completa o casi completamente. Sin embargo, a bajas tasas de bits, los codificadores tienen que infringir seriamente los requisitos del modelo psicoacústico y en una situación de este tipo los codificadores de transformada son propensos a artefactos de trino, desigualdad y de ruido musical.
20 Aunque los códec de audio completamente paramétricos son muy adecuados para tasas de bits más bajas, son conocidos, sin embargo, por sonido desagradablemente artificial. Además, estos códec no escalan sin problemas a la transparencia perceptual, puesto que un refinamiento gradual del modelo paramétrico bastante aproximado no es factible.
25 La forma de onda híbrida y la codificación paramétrica podrían potencialmente superar los límites de los enfoques individuales y podrían potencialmente beneficiarse de las propiedades ortogonales mutuas de ambas técnicas. Sin embargo, se ven obstaculizadas, en el estado actual de la técnica, por una carencia de interacción entre la parte de codificación de transformada y la parte paramétrica del códec híbrido. Los problemas se refieren a la división de
30 señal entre la parte de códec paramétrico y de la transformada, presupuesto de bits que se dirigen entre la parte de transformada y la paramétrica, técnicas de señalización de parámetros y unión sin problemas de la salida del códec paramétrico y de transformación.
El objeto de la presente invención es proporcionar conceptos mejorados para codificación y decodificación de audio
35 híbrida. El objeto de la presente invención se resuelve mediante un aparato de acuerdo con la reivindicación 1, un aparato de acuerdo con la reivindicación 12, mediante un método de acuerdo con la reivindicación 29, mediante un método de acuerdo con la reivindicación 30 y mediante un programa informático de acuerdo con la reivindicación 31.
Se proporciona un aparato para generar una señal de salida de audio basándose en un espectro de señal de audio 40 codificado.
El aparato comprende una unidad de procesamiento para procesar el espectro de señal de audio codificado para obtener un espectro de señal de audio decodificado. El espectro de señal de audio decodificado comprende una pluralidad de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene una localización
45 espectral en el espectro de señal de audio codificado y un valor espectral, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de señal de audio codificado de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales.
Además, el aparato comprende un determinador de pseudo coeficientes para determinar uno o más pseudo
50 coeficientes del espectro de señal de audio decodificado, teniendo cada uno de los pseudo coeficientes una localización espectral y un valor espectral.
Adicionalmente, el aparato comprende una unidad de modificación de espectro para ajustar el uno o más pseudo coeficientes a un valor predefinido para obtener un espectro de señal de audio modificado.
55 Además, el aparato comprende una unidad de conversión de espectrotiempo para convertir el espectro de señal de audio modificado a un dominio de tiempo para obtener una señal de conversión de dominio de tiempo.
Adicionalmente, el aparato comprende un oscilador controlable para generar una señal de oscilador de dominio de
60 tiempo, estando controlado el oscilador controlable mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes.
Además, el aparato comprende un mezclador para mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo para obtener la señal de salida de audio.
Los conceptos propuestos mejoran la calidad perceptual de los códec de transformada basados en bloques convencionales a bajas tasas de bits. Se propone sustituir las regiones tonales locales en espectros de señal de audio, que abarca el mínimo local vecino, que incluye un máximo local, mediante pseudolíneas (denominadas
5 también como pseudo coeficientes) que tienen, en algunas realizaciones, una energía o nivel similar que dichas regiones a sustituir.
De acuerdo con las realizaciones, se proporciona codificación de audio de bajo retardo y baja tasa de bits. Algunas realizaciones están basadas en un nuevo e inventivo concepto denominado como rellenado de tonos (ToneFilling)
10 (TF). La expresión rellenado de tonos indica una técnica de codificación, en la que los tonos naturales peor codificados de otra manera se sustituyen mediante tonos de senos puros aún perceptualmente similares. De esta manera, se evitan artefactos de modulación de amplitud a una cierta tasa, dependiente de la posición espectral de la sinusoide con respecto a localización espectral del componente de la MDCT más cercano (conocido como “trino”).
15 De acuerdo con las realizaciones, se pondera un grado de peso de todos los artefactos concebibles. Esto se refiere a aspectos perceptuales como por ejemplo el tono, armonicidad, modulación y a la estacionariedad de artefactos. Todos los aspectos se evalúan en un Modelo de Peso de Percepción de Sonido (SPAM). Dirigidos mediante un modelo de este tipo, el rellenado de tonos proporciona ventajas significativas. Se pondera un error de tono y modulación que se introduce sustituyendo un tono natural con un tono de seno puro, frente a un impacto de ruido
20 aditivo y estacionariedad pobre (“trino”) producida mediante un tono natural cuantificado aproximadamente.
El rellenado de tonos proporciona diferencias significativas a códec de sinusoides más ruido. Por ejemplo, el TF sustituye tonos por senos, en lugar de una resta de sinusoides. Los tonos perceptualmente similares tienen los mismos Centros de Gravedad (COG) locales que el componente de sonido original a sustituir. De acuerdo con las
25 realizaciones, los tonos originales se borran en el espectro de audio (base de izquierda a derecha función COG). Típicamente, la resolución de frecuencia de la sinusoide usada para la sustitución es tan aproximada como sea posible para minimizar la información lateral, mientras que, al mismo tiempo, tiene en cuenta requisitos perceptuales para evitar una sensación de desafinación.
30 En algunas realizaciones, el rellenado de tonos puede realizarse por encima de una frecuencia de corte inferior debido a dichos requisitos perceptuales, pero no por debajo de la frecuencia de corte inferior. Cuando se realiza el rellenado de tonos, los tonos se representan mediante pseudolíneas espectrales en un codificador de transformada. Sin embargo, en un codificador equipado con rellenado de tonos, las pseudolíneas se someten al procesamiento normal controlado mediante el modelo psicoacústico clásico. Por lo tanto, cuando se realiza rellenado de tonos, no
35 existe necesidad de restricciones apriori de la parte paramétrica (a tasa de bits x, y los componentes tonales se sustituyen). Como tal, se consigue una integración estricta en un códec de transformación.
La funcionalidad del rellenado de tonos puede emplearse en el codificador, detectando los COG locales (estimaciones suavizadas; medidas de calidad pico), eliminando componentes tonales, generando pseudolíneas
40 sustituidas (por ejemplo pseudo coeficientes) que llevan una información de nivel mediante la amplitud de las pseudolíneas, una información de frecuencia mediante la posición espectral de las pseudolíneas y una información de frecuencia fina (medio desplazamiento de componente) mediante el signo de las pseudolíneas. Los pseudo coeficientes (pseudolíneas) se manejan mediante una unidad cuantificadora posterior del códec simplemente como cualquier coeficiente espectral normal (línea espectral).
45 El rellenado de tonos puede emplearse además en el decodificador detectando líneas espectrales aisladas, en las que pueden marcarse pseudo coeficientes verdaderos (pseudolíneas) mediante un conjunto de bandera (por ejemplo un campo de bits). El decodificado puede vincular información de pseudolínea para crear pistas sinusoidales. Un esquema de nacimiento/continuación/muerte puede emplearse para sintetizar pistas continuas.
50 Para decodificar, pueden marcarse pseudo coeficientes (pseudolíneas) como tal mediante un conjunto de bandera transmitido en la información lateral. Una resolución de frecuencia de medio componente de las pseudolíneas puede señalizarse mediante el signo de los pseudo coeficientes (pseudolíneas). En el decodificador, las pseudolíneas pueden borrarse del espectro antes de la unidad de transformada inversa y sintetizarse por separado
55 mediante un banco de osciladores. Con el tiempo, pueden vincularse pares de osciladores y emplearse interpolación de parámetros para asegurar una salida de oscilador que se desarrolla suavemente.
Los inicios y los desplazamientos de los osciladores accionados por parámetros pueden conformarse de manera que corresponden estrechamente a las características temporales de la operación de ventanas del códec de
60 transformada asegurando por lo tanto la transición sin problemas entre las partes generadas del códec de transformada y las partes generadas del oscilador de la señal de salida.
Los conceptos proporcionados se integran muy bien y sin esfuerzos en esquemas de codificación de transformada existentes como AAC, TCX o configuraciones similares. La dirección de la precisión de la cuantificación de
parámetros puede realizarse implícitamente mediante el control de velocidad existente del códec.
De acuerdo con una realización, cada uno de los coeficientes espectrales puede tener al menos uno de un predecesor inmediato y un sucesor inmediato, en el que el predecesor inmediato de dicho coeficiente espectral 5 puede ser uno de los coeficientes espectrales que precede inmediatamente a dicho coeficiente espectral en la secuencia, en el que el sucesor inmediato de dicho coeficiente espectral puede ser uno de los coeficientes espectrales que sucede inmediatamente a dicho coeficiente espectral en la secuencia. El determinador de pseudo coeficientes puede configurarse para determinar el uno o más pseudo coeficientes del espectro de señal de audio decodificado determinando al menos un coeficiente espectral de la secuencia que tiene un valor espectral que es
10 diferente del valor predefinido, que tiene un predecesor inmediato el valor espectral del cual es igual al valor predefinido, y que tiene un sucesor inmediato el valor espectral del cual es igual al valor predefinido.
En una realización, el valor predefinido puede ser cero.
15 De acuerdo con una realización, el determinador de pseudo coeficientes puede configurarse para determinar el uno
o más pseudo coeficientes del espectro de señal de audio decodificado determinando el al menos un coeficiente espectral de la secuencia como un pseudo coeficiente candidato, que tiene un predecesor inmediato, el valor espectral del cual es igual al valor predefinido, y que tiene un sucesor inmediato, el valor espectral del cual es igual al valor predefinido. El determinador de pseudo coeficientes puede configurarse para determinar si el pseudo
20 coeficiente candidato es un pseudo coeficiente determinando si la información lateral indica que dicho pseudo coeficiente candidato es un pseudo coeficiente.
En una realización, el oscilador controlable puede configurarse para generar la señal de oscilador de dominio de tiempo que tiene una frecuencia de señal de oscilador de modo que la frecuencia de señal del oscilador de la señal
25 del oscilador depende de la localización espectral de uno del uno o más pseudo coeficientes.
En algunas realizaciones, la frecuencia de señal de la señal del oscilador se genera realizando una interpolación entre la localización espectral de dos o más pseudo coeficientes temporalmente consecutivos.
30 De acuerdo con una realización, los pseudo coeficientes son valores con signo, comprendiendo cada uno un componente de signo. El oscilador controlable puede configurarse para generar la señal de oscilador de dominio de tiempo de modo que la frecuencia de señal del oscilador de la señal del oscilador depende adicionalmente del componente de signo de uno del uno o más pseudo coeficientes de modo que la frecuencia de señal del oscilador tiene un primer valor de frecuencia, cuando el componente de signo tiene un primer valor de signo, y de modo que la
35 frecuencia de señal del oscilador tiene un segundo valor de frecuencia diferente, cuando el componente de signo tiene un segundo valor diferente.
En una realización, el oscilador controlable puede configurarse para generar la señal de oscilador de dominio de tiempo en el que la amplitud de la señal del oscilador puede depender del valor espectral de uno del uno o más
40 pseudo coeficientes, de modo que la amplitud de la señal del oscilador tiene un primer valor de amplitud cuando el valor espectral tiene un tercer valor, y de modo que la amplitud de la señal del oscilador tiene un segundo valor de amplitud diferente cuando el valor espectral tiene un cuarto valor diferente, siendo el segundo valor de amplitud mayor que el primer valor de amplitud, cuando el cuarto valor es mayor que el tercer valor.
45 De acuerdo con algunas realizaciones, el valor de amplitud de la señal del oscilador se genera realizando una interpolación entre los valores espectrales de dos o más pseudo coeficientes temporalmente consecutivos. Por ejemplo, en algunas realizaciones, la amplitud de la señal del oscilador se genera realizando una interpolación entre los puntos en el tiempo durante los que se transmite un valor.
50 En una realización, el oscilador controlable puede controlarse también adicionalmente a través de parámetros extrapolados obtenidos desde el pseudo coeficiente de la trama precedente para por ejemplo ocultar una pérdida de trama de datos durante la transmisión, o para suavizar un comportamiento inestable del control del oscilador.
De acuerdo con algunas realizaciones, el valor de amplitud de la señal del oscilador se genera realizando una
55 interpolación entre los valores espectrales de dos o más pseudo coeficientes. Por ejemplo, en algunas realizaciones, la amplitud de la señal del oscilador se genera realizando una interpolación entre los puntos en el tiempo durante los que se transmite un valor.
De acuerdo con una realización, el espectro de señal de audio modificado puede ser un espectro de MDCT, que
60 comprende coeficientes de MDCT. La unidad de conversión de espectrotiempo puede configurarse para convertir el espectro de MDCT desde un dominio de MDCT al dominio de tiempo convirtiendo al menos algunos de los coeficientes del espectro de señal de audio decodificado al dominio de tiempo.
En una realización, el mezclador puede configurarse para mezclar la señal de conversión de dominio de tiempo y la
señal de oscilador de dominio de tiempo añadiendo la señal de conversión de dominio de tiempo a la señal de oscilador de dominio de tiempo en el dominio de tiempo.
Además, se proporciona un aparato para codificar un espectro de entrada de señal de audio. El espectro de entrada
5 de señal de audio comprende una pluralidad de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de entrada de señal de audio y un valor espectral. Los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de entrada de señal de audio de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales. Cada uno de los coeficientes espectrales tiene al menos uno de uno o más predecesores y tiene al
10 menos uno de uno o más sucesores, en el que cada uno de los predecesores de dicho coeficiente espectral es uno de los coeficientes espectrales que precede a dicho coeficiente espectral en la secuencia. Cada uno de los sucesores de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede a dicho coeficiente espectral en la secuencia.
15 El aparato comprende un determinador de extremos para determinar un extremo o más extremos, preferentemente en una resolución espectral superior como se proporciona mediante la transformada de tiempofrecuencia subyacente.
Por ejemplo el espectro de entrada de señal de audio puede ser un espectro de MDCT que tiene una pluralidad de 20 coeficientes de MDCT.
El determinador de extremos puede determinar el extremo o los extremos en un espectro de comparación, en el que un valor de comparación de un coeficiente del espectro de comparación se asigna a cada uno de los coeficientes de MDCT del espectro de MDCT. Sin embargo, el espectro de comparación puede tener una resolución espectral 25 superior que el espectro de entrada de señal de audio. Por ejemplo, el espectro de comparación puede ser un espectro de la Transformada Discreta de Fourier (DFT) (DFT apilada de manera par o impar) que tiene dos veces la resolución espectral que el espectro de entrada de señal de audio de MDCT. Mediante esto, únicamente cada segundo valor espectral del espectro de DFT se asigna a continuación a un valor espectral del espectro de MDCT. Sin embargo, los otros coeficientes del espectro de comparación pueden tenerse en cuenta cuando se determina el 30 extremo o los extremos del espectro de comparación. Mediante esto, puede determinarse un coeficiente del espectro de comparación como un extremo que no está asignado a un coeficiente espectral del espectro de entrada de señal de audio, sino que tiene un predecesor inmediato y un sucesor inmediato, que se asignan a un coeficiente espectral del espectro de entrada de señal de audio y al sucesor inmediato de ese coeficiente espectral del espectro de entrada de señal de audio, respectivamente. Por lo tanto, puede considerarse que dicho extremo del espectro de
35 comparación (por ejemplo, del espectro de DFT de alta resolución) se asigna a una localización espectral en el espectro de entrada de señal de audio (MDCT) que está localizado entre dicho coeficiente espectral del espectro de entrada de señal de audio (MDCT) y dicho sucesor inmediato de dicho coeficiente espectral del espectro de entrada de señal de audio (MDCT). Una situación de este tipo puede codificarse eligiendo un valor de signo apropiado del pseudo coeficiente como se explica más adelante. Mediante esto, se consigue la resolución de subcomponente.
40 Además, el aparato comprende un modificador de espectro para modificar el espectro de entrada de señal de audio para obtener un espectro de señal de audio modificado ajustando el valor espectral de al menos uno de los predecesores o el al menos uno de los sucesores de al menos uno de los coeficientes de extremo a un valor predefinido. Además, el modificador de espectro está configurado para no establecer los valores espectrales del uno
45 o más coeficientes de extremo al valor predefinido, o está configurado para sustituir al menos uno del uno o más coeficientes de extremo mediante un pseudo coeficiente, en el que el valor espectral del pseudo coeficiente es diferente del valor predefinido.
Adicionalmente, el aparato comprende una unidad de procesamiento para procesar el espectro de señal de audio 50 modificado para obtener un espectro de señal de audio codificado.
Además, el aparato comprende un generador de información lateral para generar y transmitir información lateral, en el que el generador de información lateral está configurado para localizar uno o más pseudo coeficientes candidatos en el espectro de entrada de señal de audio modificado generado mediante el modificador de espectro, en el que el
55 generador de información lateral está configurado para seleccionar al menos uno de los pseudo coeficientes candidatos como candidatos seleccionados, y en el que el generador de información lateral está configurado para generar la información lateral de modo que la información lateral indica los candidatos seleccionados como los pseudo coeficientes.
60 El determinador de extremos está configurado para determinar el uno o más coeficientes de extremo, preferentemente en una resolución espectral superior como se proporciona mediante la transformada de tiempofrecuencia subyacente, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor espectral del cual es mayor que el valor espectral de al menos uno de sus predecesores y el valor espectral del cual es mayor que el valor espectral de al menos uno de sus sucesores. O, cada uno de los coeficientes
espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, y el determinador de extremos está configurado para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor de comparación del cual es mayor que el valor de comparación de al menos uno de sus predecesores y el valor de comparación del cual es mayor que el valor de
5 comparación de al menos uno de sus sucesores.
De acuerdo con las realizaciones, la información lateral generada mediante el generador de información lateral puede ser de un tamaño predefinido estático, o su tamaño puede estimarse iterativamente de una manera de señaladaptiva. En este caso, el tamaño real de la información lateral se transmite al decodificador también. Por lo que, de
10 acuerdo con una realización, el generador 440 de información lateral está configurado para transmitir el tamaño de la información lateral.
En una realización, el modificador de espectro está configurado para modificar el espectro de entrada de señal de audio de modo que los valores espectrales de al menos algunos de los coeficientes espectrales del espectro de
15 entrada de señal de audio se dejan sin modificar en el espectro de señal de audio modificado.
De acuerdo con una realización, cada uno de los coeficientes espectrales tiene al menos uno de un predecesor inmediato como uno de sus predecesores y un sucesor inmediato como uno de sus sucesores, en el que el predecesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que precede
20 inmediatamente a dicho coeficiente espectral en la secuencia, en el que el sucesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede inmediatamente a dicho coeficiente espectral en la secuencia.
El modificador de espectro puede configurarse para modificar el espectro de entrada de señal de audio para obtener
25 el espectro de señal de audio modificado ajustando el valor espectral del predecesor inmediato o el sucesor inmediato de al menos uno de los coeficientes de extremo al valor predefinido, en el que el modificador de espectro puede configurarse para no establecer los valores espectrales del uno o más coeficientes de extremo al valor predefinido, o puede configurarse para sustituir al menos uno del uno o más coeficientes de extremo mediante un pseudo coeficiente, en el que el valor espectral del pseudo coeficiente es diferente del valor predefinido. Debería
30 observarse que, cuando el determinador de extremos determina los coeficientes de extremo basándose en un extremo de comparación (por ejemplo, un espectro de potencia), los coeficientes espectrales, que pueden ser, por ejemplo, un máximo local del espectro de comparación (por ejemplo, el espectro de potencia) no tienen que ser un máximo local del espectro de entrada de señal de audio (por ejemplo, el espectro de MDCT).
35 El determinador de extremos puede configurarse para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor espectral del cual es mayor que el valor espectral de su predecesor inmediato y el valor espectral del cual es mayor que el valor espectral de su sucesor inmediato. O cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, y el determinador de extremos puede configurarse para determinar el uno o más
40 coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor de comparación del cual es mayor que el valor de comparación de su predecesor inmediato y el valor de comparación del cual es mayor que el valor de comparación de su sucesor inmediato.
De acuerdo con una realización, el determinador de extremos puede configurarse para determinar uno o más
45 coeficientes mínimos, de modo que cada uno del uno o más coeficientes mínimos es uno de los coeficientes espectrales el valor espectral del cual es más pequeño que el valor espectral de uno de sus predecesores y el valor espectral del cual es más pequeño que el valor espectral de uno de sus sucesores, o en el que cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, en el que el determinador de extremos está configurado para determinar el uno o más coeficientes mínimos, de modo que cada
50 uno de los coeficientes mínimos es uno de los coeficientes espectrales el valor de comparación del cual es más pequeño que el valor de comparación de uno de sus predecesores y el valor de comparación del cual es más pequeño que el valor de comparación de uno de sus sucesores. En una realización de este tipo, el modificador de espectro puede configurarse para determinar un valor de representación basándose en los valores espectrales o valores de comparación de uno o más de los coeficientes de extremo y uno o más de los coeficientes mínimos, de
55 modo que el valor de representación es diferente del valor predefinido. Adicionalmente, el modificador de espectro puede configurarse para cambiar el valor espectral de uno de los coeficientes de la secuencia de entrada de señal de audio ajustando dicho valor espectral al valor de representación.
De acuerdo con una realización, el modificador de espectro puede configurarse para determinar si una diferencia de
60 valor entre uno del valor de comparación o el valor espectral de uno de los coeficientes de extremo es más pequeño que un valor umbral. Además, el modificador de espectro puede configurarse para modificar el espectro de entrada de señal de audio de modo que los valores espectrales de al menos algunos de los coeficientes espectrales del espectro de entrada de señal de audio se dejan sin modificar en el espectro de señal de audio modificado dependiendo de si la diferencia de valor es más pequeña que el valor umbral.
En una realización, el determinador de extremos puede configurarse para determinar una o más subsecuencias de la secuencia de valores espectrales, de modo que cada una de las subsecuencias comprende una pluralidad de coeficientes espectrales posteriores al espectro de entrada de señal de audio. Los coeficientes espectrales 5 posteriores pueden ordenarse secuencialmente en la subsecuencia de acuerdo con su posición espectral. Cada una de las subsecuencias puede tener un primer elemento que es el primero en dicha subsecuencia secuencialmente ordenada y un último elemento que es el último en dicha subsecuencia secuencialmente ordenada. Además, cada una de las subsecuencias puede comprender exactamente dos de los coeficientes mínimos y exactamente uno de los coeficientes de extremo, siendo uno de los coeficientes mínimos el primer
10 elemento de la subsecuencia, siendo el otro de los coeficientes mínimos el último elemento de la subsecuencia. En una realización de este tipo, el modificador de espectro puede configurarse para determinar el valor de representación basándose en los valores espectrales o los valores de comparación de los coeficientes de una de las subsecuencias. El modificador de espectro puede configurarse para cambiar el valor espectral de uno de los coeficientes de dicha subsecuencia ajustando dicho valor espectral al valor de representación.
15 De acuerdo con una realización, el determinador de extremos puede configurarse para determinar un coeficiente de centro de gravedad determinando el producto del valor de comparación y el valor de localización para cada coeficiente espectral de la subsecuencia para obtener una pluralidad de coeficientes ponderados, totalizando los coeficientes ponderados para obtener una primera suma, totalizando los valores de comparación de todos los
20 coeficientes espectrales de la subsecuencia para obtener una segunda suma; dividiendo la primera suma por la segunda suma para obtener un resultado intermedio; y aplicando redondeo al redondeo más cercano en el resultado intermedio para obtener el coeficiente del centro de gravedad, y en el que el modificador de espectro está configurado para establecer los valores espectrales de todos los coeficientes espectrales de la subsecuencia, que no son el coeficiente del centro de gravedad al valor predefinido. O, el determinador de extremos puede configurarse
25 para determinar un coeficiente de centro de gravedad determinando el producto del valor espectral y el valor de localización para cada coeficiente espectral de la subsecuencia para obtener una pluralidad de coeficientes ponderados, totalizando los coeficientes ponderados para obtener una primera suma, totalizando los valores espectrales de todos los coeficientes espectrales de la subsecuencia para obtener una segunda suma; dividiendo la primera suma por la segunda suma para obtener un resultado intermedio; y aplicando redondeo al redondeo más
30 cercano en el resultado intermedio para obtener el coeficiente del centro de gravedad, y en el que el modificador de espectro está configurado para establecer los valores espectrales de todos los coeficientes espectrales de la subsecuencia, que no son el coeficiente del centro de gravedad al valor predefinido.
En una realización, el valor predefinido es cero.
35 De acuerdo con una realización, el valor de comparación de cada coeficiente espectral es un valor cuadrado de un coeficiente adicional de un espectro adicional resultando de una transformación de conservación de energía de la señal de audio.
40 En una realización, en la que el valor de comparación de cada coeficiente espectral es un valor de amplitud de un coeficiente adicional de un espectro adicional resultando de una transformación de conservación de energía de la señal de audio.
De acuerdo con una realización, el espectro adicional es un espectro de la Transformada Discreta de Fourier (DFT)
45 y en el que la transformación de conservación de energía es una Transformada Discreta de Fourier (DFT apilada de manera par o impar).
De acuerdo con otra realización, el espectro adicional es un espectro de Transformada Modificada Discreta del Coseno Compleja (CMDCT) y en el que la transformación de conservación de energía es una CMDCT.
50 De acuerdo con una realización, el modificador de espectro puede configurarse para recibir información de ajuste fino. Los coeficientes del espectro de entrada de señal de audio pueden ser valores con signo, comprendiendo cada uno un componente de signo. El modificador de espectro puede configurarse para establecer el componente de signo a uno del uno o más coeficientes de extremo o del pseudo coeficiente a un primer valor de signo, cuando la
55 información de ajuste fino está en un primer estado de ajuste fino. Y el modificador de espectro puede configurarse para establecer el componente de signo a uno del uno o más coeficientes de extremo o del pseudo coeficiente a un segundo valor de signo diferente, cuando la información de ajuste fino está en un segundo estado de ajuste fino diferente.
60 En una realización, el espectro de entrada de señal de audio puede ser un espectro de MDCT que comprende coeficientes de MDCT.
De acuerdo con una realización, la unidad de procesamiento puede configurarse para cuantificar el espectro de señal de audio modificado para obtener un espectro de señal de audio cuantificado. La unidad de procesamiento
puede configurarse adicionalmente para procesar el espectro de señal de audio cuantificado para obtener un espectro de señal de audio codificado. Además, la unidad de procesamiento puede configurarse adicionalmente para generar información lateral que indica únicamente aquellos coeficientes espectrales del espectro de señal de audio cuantificado que tienen un predecesor inmediato el valor espectral del cual es igual al valor predefinido y un
5 sucesor inmediato, el valor espectral del cual es igual al valor predefinido, si dicho coeficiente es uno de los coeficientes de extremo. El predecesor inmediato de dicho coeficiente espectral es otro coeficiente espectral que precede inmediatamente a dicho coeficiente espectral en el espectro de señal de audio cuantificado, y en el que el sucesor inmediato de dicho coeficiente espectral es otro coeficiente espectral que sucede inmediatamente a dicho coeficiente espectral en el espectro de señal de audio cuantificado.
10 Además, se proporciona un método para generar una señal de salida de audio basándose en un espectro de señal de audio codificado. Cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de señal de audio codificado y un valor espectral. Los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de señal de audio codificado de modo que los coeficientes
15 espectrales forman una secuencia de coeficientes espectrales. El método para generar una señal de salida de audio comprende:
Procesar el espectro de señal de audio codificado para obtener un espectro de señal de audio decodificado comprendiendo el espectro de señal de audio decodificado una pluralidad de coeficientes espectrales. 20 Determinar uno o más pseudo coeficientes del espectro de señal de audio decodificado, teniendo cada uno de los pseudo coeficientes una localización espectral y un valor espectral.
Ajustar el uno o más pseudo coeficientes a un valor predefinido para obtener un espectro de señal de audio 25 modificado.
Convertir el espectro de señal de audio modificado a un dominio de tiempo para obtener una señal de conversión de dominio de tiempo.
30 Generar una señal de oscilador de dominio de tiempo mediante un oscilador controlable estando controlado mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes. Y:
Mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo para obtener la señal de salida de audio.
35 Adicionalmente, se proporciona un método para codificar un espectro de entrada de señal de audio. El espectro de entrada de señal de audio comprende una pluralidad de coeficientes espectrales. Cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de entrada de señal de audio y un valor espectral. Los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro
40 de entrada de señal de audio de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales. Cada uno de los coeficientes espectrales tiene al menos uno de uno o más predecesores y tiene al menos uno de uno o más sucesores. Cada predecesor de dicho coeficiente espectral es uno de los coeficientes espectrales que precede a dicho coeficiente espectral en la secuencia. Cada sucesor de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede a dicho coeficiente espectral en la secuencia. El método para
45 codificar un espectro de entrada de señal de audio comprende:
Determinar uno o más coeficientes de extremo.
Modificar el espectro de entrada de señal de audio para obtener un espectro de señal de audio modificado
50 ajustando el valor espectral de al menos uno de los predecesores o al menos uno de los sucesores de al menos uno de los coeficientes de extremo a un valor predefinido, en el que modificar el espectro de entrada de señal de audio se realiza no ajustando los valores espectrales del uno o más coeficientes de extremo al valor predefinido,
o sustituyendo al menos uno del uno o más coeficientes de extremo mediante un pseudo coeficiente, en el que el valor espectral del pseudo coeficiente es diferente del valor predefinido.
55 Procesar el espectro de señal de audio modificado para obtener un espectro de señal de audio codificado. Y:
Generar y transmitir información lateral, en el que la información lateral se genera localizando uno o más pseudo coeficientes candidatos en el espectro de entrada de señal de audio modificado, en el que la información lateral
60 se genera seleccionando al menos uno de los pseudo coeficientes candidatos como candidatos seleccionados, y en el que la información lateral se genera de modo que la información lateral indica los candidatos seleccionados como los pseudo coeficientes.
Se determinan el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno
de los coeficientes espectrales el valor espectral del cual es mayor que el valor espectral de uno de sus predecesores y el valor espectral del cual es mayor que el valor espectral de uno de sus sucesores. O, cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, en el que se determina el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de
5 los coeficientes espectrales el valor de comparación del cual es mayor que el valor de comparación de al menos uno de sus predecesores y el valor de comparación del cual es mayor que el valor de comparación de al menos uno de sus sucesores.
Además, se proporciona un programa informático para implementar los métodos anteriormente descritos cuando se 10 ejecutan en un ordenador o procesador de señal.
Se proporciona un codificador de audio, decodificador de audio, métodos y programas relacionados o señal de audio codificada. Además, se proporcionan conceptos para sustitución sinusoidal para codificadores de forma de onda.
15 A bajas tasas de bits, la presente invención proporciona conceptos de cómo integrar estrictamente codificación de forma de onda y codificación paramétrica para obtener una calidad perceptualmente mejorada y un escalado mejorado de calidad perceptual frente a tasa de bits a través de las técnicas únicas.
En algunas realizaciones, las áreas con picos (que abarcan el mínimo local vecino, que incluye un máximo local) de
20 los espectros pueden sustituirse completamente mediante una única sinusoide cada una; a diferencia de los codificadores sinusoidales que restan iterativamente sinusoides sintetizadas del residuo. Las áreas con picos adecuadas se extraen en una representación espectral suavizada y ligeramente blanqueada y se seleccionan con respecto a ciertas características (altura de pico, forma de pico).
25 De acuerdo con algunas realizaciones, estas sinusoides de sustitución pueden representarse como pseudolíneas (pseudo coeficientes) en el espectro a codificar y reflejan la amplitud o energía completa de la sinusoide (a diferencia de, por ejemplo líneas de MDCT normales que corresponden a la proyección real del valor verdadero).
En algunas realizaciones, las pseudolíneas (pseudo coeficientes) pueden manejarse mediante el cuantificador de
30 códec existente como cualquier línea espectral normal; a diferencia de la señalización separada de parámetros sinusoidales.
De acuerdo con algunas realizaciones, las pseudolíneas (pseudo coeficientes) pueden marcarse como tal mediante el conjunto de bandera de información lateral.
35 En algunas realizaciones, la elección de signo de las pseudolíneas puede indicar resolución de frecuencia de semi subbanda.
De acuerdo con algunas realizaciones, puede ser aconsejable una frecuencia de corte inferior para sustitución 40 sinusoidal debido a la resolución de frecuencia limitada (por ejemplo semisubbanda).
En algunas realizaciones, en el decodificador, las pseudolíneas pueden borrarse del espectro normal; la síntesis de la pseudolínea se consigue mediante un banco de osciladores de interpolación.
45 En algunas realizaciones, puede emplearse una fase de inicio opcionalmente medida de una pista sinusoidal obtenida a partir de la extrapolación de espectros precedentes.
De acuerdo con algunas realizaciones, puede emplearse una técnica Cancelación de Solapamiento de Dominio de Tiempo (TDAC) opcional mediante el modelado de los solapamientos en el inicio/desplazamiento de una pista
50 sinusoidal.
De acuerdo con algunas realizaciones, puede emplearse una cancelación de solapamiento opcional TDAC mediante el modelado de los solapamientos en el inicio/desplazamiento.
55 A continuación, se describen realizaciones de la presente invención en más detalle con referencia a las figuras, en las que:
La Figura 1 ilustra un aparato para generar una señal de salida de audio basándose en un espectro de señal de audio codificado de acuerdo con una realización, 60 La Figura 2 representa un aparato para generar una señal de salida de audio basándose en un espectro de señal de audio codificado de acuerdo con otra realización,
La Figura 3 muestra dos diagramas que comparan las sinusoides originales y las sinusoides después de
procesarse mediante una cadena de MDCT / MDCT inversa,
La Figura 4 ilustra un aparato para codificar un espectro de entrada de señal de audio de acuerdo con una realización, 5 La Figura 5 representa un espectro de entrada de señal de audio, un espectro de potencia correspondiente y un espectro de señal de audio modificado (sustituido), y
La Figura 6 ilustra otro espectro de potencia, otro espectro de señal de audio modificado (sustituido), y un
10 espectro de señal de audio cuantificado, en el que el espectro de señal de audio cuantificado generado en un lado del codificador puede, en algunas realizaciones, corresponder al espectro de señal de audio decodificado decodificado en un lado de decodificación.
La Figura 4 ilustra un aparato para codificar un espectro de entrada de señal de audio de acuerdo con una 15 realización. El aparato para codificar comprende un determinador de extremos 410, un modificador de espectro 420, una unidad de procesamiento 430 y un generador 440 de información lateral.
Antes de considerar el aparato de la Figura 4 en más detalle, se considera el espectro de entrada de señal de audio que está codificado mediante el aparato de la Figura 4 en más detalle.
20 En principio cualquier tipo de espectro de señal de audio puede codificarse mediante el aparato de la Figura 4. El espectro de entrada de señal de audio puede ser, por ejemplo, un espectro de MDCT (Transformada Modificada Discreta del Coseno), un espectro de magnitud de DFT (Transformada Discreta de Fourier) o un espectro de MDST (Transformada Modificada Discreta del Seno).
25 La Figura 5 ilustra un ejemplo de un espectro de entrada 510 de señal de audio. En la Figura 5, el espectro de entrada 510 de señal de audio es un espectro de MDCT.
El espectro de entrada de señal de audio comprende una pluralidad de coeficientes espectrales. Cada uno de los 30 coeficientes espectrales tiene una localización espectral en el espectro de entrada de señal de audio y un valor espectral.
Considerando el ejemplo de la Figura 5, donde el espectro de entrada de señal de audio resulta de una transformada de MDCT de la señal de audio, por ejemplo, un banco de filtros que ha transformado la señal de audio
35 para obtener el espectro de entrada de señal de audio, puede usar, por ejemplo, 1024 canales. A continuación, cada uno de los coeficientes espectrales se asocia con uno de los 1024 canales y puede considerarse el número de canal (por ejemplo, un número entre 0 y 1023) como la localización espectral de dichos coeficientes espectrales. En la Figura 5, la abscisa 511 se refiere a la localización espectral de los coeficientes espectrales. Para mejor ilustración, únicamente se ilustran los coeficientes con localizaciones espectrales entre 52 y 148 mediante la Figura 5.
40 En la Figura 5, la ordenada 512 ayuda a determinar el valor espectral de los coeficientes espectrales. En el ejemplo de la Figura 5 que representa un espectro de MDCT, allí, los valores espectrales de los coeficientes espectrales del espectro de entrada de señal de audio, la abscisa 512 se refiere los valores espectrales de los coeficientes espectrales. Debería observarse que los coeficientes espectrales de un espectro de entrada de señal de audio de
45 MDCT pueden tener números reales positivos así como negativos como valores espectrales.
Otros espectros de entrada de señal de audio, sin embargo, pueden tener únicamente coeficientes espectrales con valores espectrales que son positivos o cero. Por ejemplo, el espectro de entrada de señal de audio puede ser un espectro de magnitud de DFT, con coeficientes espectrales que tienen valores espectrales que representan las
50 magnitudes de los coeficientes que resultan de la Transformada Discreta de Fourier. Estos valores espectrales pueden ser únicamente positivos o cero.
En realizaciones adicionales, el espectro de entrada de señal de audio comprende coeficientes espectrales con valores espectrales que son números complejos. Por ejemplo, un espectro de DFT que indica información de 55 magnitud y fase puede comprender coeficientes espectrales que tienen valores espectrales que son números complejos.
Como se muestra ejemplarmente en la Figura 5, los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de entrada de señal de audio de modo que los coeficientes 60 espectrales forman una secuencia de coeficientes espectrales. Cada uno de los coeficientes espectrales tiene al menos uno de uno o más predecesores y uno o más sucesores, en el que cada predecesor de dicho coeficiente espectral es uno de los coeficientes espectrales que precede a dicho coeficiente espectral en la secuencia. Cada sucesor de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede a dicho coeficiente espectral en la secuencia. Por ejemplo, en la Figura 5, un coeficiente espectral que tiene la localización espectral 81,
82 o 83 (y así sucesivamente) es un sucesor para el coeficiente espectral con la localización espectral 80. Un coeficiente espectral que tiene la localización espectral 79, 78 o 77 (y así sucesivamente) es un predecesor para el coeficiente espectral con la localización espectral 80. Para el ejemplo de un espectro de MDCT, la localización espectral de un coeficiente espectral puede ser el canal de la transformada de MDCT, el coeficiente espectral se
5 refiere a (por ejemplo, un número de canal entre, por ejemplo 0 y 1023). De nuevo debería observarse que, por fines ilustrativos, el espectro 510 de MDCT de la Figura 5 ilustra únicamente coeficientes espectrales con localizaciones espectrales entre 52 y 148.
Volviendo a la Figura 4, el determinador de extremos 410 se describe ahora en más detalle. El determinador de 10 extremos 410 está configurado para determinar uno o más coeficientes de extremo.
En general, el determinador de extremos 410 examina el espectro de entrada de señal de audio o un espectro que está relacionado con el espectro de entrada de señal de audio para coeficientes de extremo. El fin de determinar los coeficientes de extremo es, que más tarde, una o más regiones tonales locales deberá sustituirse en el espectro de
15 señal de audio mediante pseudo coeficientes, por ejemplo, mediante un único pseudo coeficiente para cada región tonal.
En general, las áreas con picos en un espectro de potencia de la señal de audio, la que está relacionada con el espectro de entrada de señal de audio, indican regiones tonales. Puede preferirse por lo tanto identificar áreas con
20 picos en un espectro de potencia de la señal de audio a la que relaciona el espectro de entrada de señal de audio. El determinador de extremos 410 puede, por ejemplo, examinar un espectro de potencia, que comprende coeficientes, que pueden denominarse como coeficientes de comparación (ya que sus valores espectrales se comparan a nivel de par mediante el determinador de extremos), de modo que cada uno de los coeficientes espectrales del espectro de entrada de señal de audio tiene un valor de comparación asociado a él.
25 En la Figura 5, se ilustra un espectro de potencia 520. El espectro de potencia 520 y el espectro de entrada 510 de señal de audio de MDCT se refieren a la misma señal de audio. El espectro de potencia 520 comprende coeficientes denominados como coeficientes de comparación. Cada coeficiente espectral comprende una localización espectral que relaciona la abscisa 521 y un valor de comparación. Cada coeficiente espectral del espectro de entrada de señal
30 de audio tiene un coeficiente de comparación asociado con él y por lo tanto, además tiene el valor de comparación de su coeficiente de comparación asociado con él. Por ejemplo, el valor de comparación asociado con un valor espectral del espectro de entrada de señal de audio puede ser el valor de comparación del coeficiente de comparación con la misma posición espectral que el coeficiente espectral considerado del espectro de entrada de señal de audio. La asociación entre tres de los coeficientes espectrales del espectro de entrada 510 de señal de
35 audio y tres de los coeficientes de comparación (y por lo tanto la asociación con los valores de comparación de estos coeficientes de comparación) del espectro de potencia 520 se indica mediante las líneas discontinuas 513, 514, 515 que indican una asociación de los respectivos coeficientes de comparación (o sus valores de comparación) y los respectivos coeficientes espectrales del espectro de entrada 510 de señal de audio.
40 El determinador de extremos 410 puede configurarse para determinar uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor de comparación del cual es mayor que el valor de comparación de uno de sus predecesores y el valor de comparación del cual es mayor que el valor de comparación de uno de sus sucesores.
45 Por ejemplo, el determinador de extremos 410 puede determinar los valores máximos locales del espectro de potencia. En otras palabras, el determinador de extremos 410 puede configurarse para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor de comparación del cual es mayor que el valor de comparación de su predecesor inmediato y el valor de comparación del cual es mayor que el valor de comparación de su sucesor inmediato. En este punto, el
50 predecesor inmediato de un coeficiente espectral es el uno de los coeficientes espectrales que precede inmediatamente a dicho coeficiente espectral en el espectro de potencia. El sucesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede inmediatamente a dicho coeficiente espectral en el espectro de potencia.
55 Sin embargo, otras realizaciones no requieren que el determinador de extremos 410 determine todos los máximos locales. Por ejemplo, en algunas realizaciones, el determinador de extremos puede examinar únicamente ciertas porciones del espectro de potencia, por ejemplo, en relación con únicamente un cierto intervalo de frecuencia.
En otras realizaciones, el determinador de extremos 410 está configurado para únicamente aquellos coeficientes
60 como coeficientes de extremo, donde una diferencia entre el valor de comparación del máximo local considerado y el valor de comparación del mínimo local posterior y/o el mínimo local precedente es mayor que un valor umbral.
El determinador de extremos 410 puede determinar el extremo o los extremos en un espectro de comparación, en el que un valor de comparación de un coeficiente del espectro de comparación se asigna a cada uno de los
coeficientes de MDCT del espectro de MDCT. Sin embargo, el espectro de comparación puede tener una resolución espectral superior que el espectro de entrada de señal de audio. Por ejemplo, el espectro de comparación puede ser un espectro de DFT que tiene dos veces la resolución espectral que el espectro de entrada de señal de audio de MDCT. Mediante esto, únicamente cada segundo valor espectral del espectro de DFT se asigna a continuación a un 5 valor espectral del espectro de MDCT. Sin embargo, los otros coeficientes del espectro de comparación pueden tenerse en cuenta cuándo se determina el extremo o los extremos del espectro de comparación. Mediante esto, un coeficiente del espectro de comparación puede determinarse como un extremo que no está asignado a un coeficiente espectral del espectro de entrada de señal de audio, pero que tiene un predecesor inmediato y un sucesor inmediato, que se asignan a un coeficiente espectral del espectro de entrada de señal de audio y al sucesor 10 inmediato de ese coeficiente espectral del espectro de entrada de señal de audio, respectivamente. Por lo tanto, puede considerarse que dicho extremo del espectro de comparación (por ejemplo, del espectro de DFT de alta resolución) se asigna a una localización espectral en el espectro de entrada de señal de audio (MDCT) que está localizada entre dicho coeficiente espectral del espectro de entrada de señal de audio (MDCT) y dicho sucesor inmediato de dicho coeficiente espectral del espectro de entrada de señal de audio (MDCT). Una situación de este
15 tipo puede codificarse eligiendo un valor de signo apropiado del pseudo coeficiente como se explica más adelante. Mediante esto, se consigue la resolución de subcomponente.
Debería observarse que en algunas realizaciones, un coeficiente de extremo no tiene que cumplir el requisito que su valor de comparación sea mayor que el valor de comparación de su predecesor inmediato y el valor de comparación
20 de su sucesor inmediato. En su lugar, en estas realizaciones, puede ser suficiente que el valor de comparación del coeficiente de extremo sea mayor que uno de sus predecesores y uno de sus sucesores. Considérese por ejemplo la situación, donde:
Tabla 1
Localización espectral
212 213 214 215 216
Valor de comparación
0,02 0,84 0,83 0,85 0,01
25 En la situación descrita mediante la Tabla 1, el determinador de extremos 410 puede considerar razonablemente el coeficiente espectral en la localización espectral 214 como un coeficiente de extremo. El valor de comparación del coeficiente espectral 214 no es mayor que el de su predecesor inmediato 213 (0,83 < 0,84) y no es mayor que el de su sucesor inmediato 215 (0,83 < 0,85), pero es (significativamente) mayor que el valor de comparación de uno otro
30 de sus predecesores, el predecesor 212 (0,83 > 0,02), y es (significativamente) mayor que el valor de comparación de uno otro de sus sucesores, el sucesor 216 (0,83 > 0,01). Parece además razonable considerar el coeficiente espectral 214 como el extremo de esta “área con picos”, ya que el coeficiente espectral está localizado en el medio de los tres coeficientes 213, 214, 215 que tienen valores de comparación relativamente grandes en comparación con los valores de comparación de los coeficientes 212 y 216.
35 Por ejemplo, el determinador de extremos 410 puede configurarse para determinar formar algunos o todos los coeficientes de comparación, si el valor de comparación de dicho coeficiente de comparación es mayor que al menos uno de los valores de comparación de los tres predecesores que están más cerca de la localización espectral de dicho coeficiente de comparación. Y/o, el determinador de extremos 410 puede configurarse para determinar
40 formar algunos o todos los coeficientes de comparación, si el valor de comparación de dicho coeficiente de comparación es mayor que al menos uno de los valores de comparación de los tres sucesores que están más cerca de la localización espectral de dicho coeficiente de comparación. El determinador de extremos 410 puede a continuación decidir si seleccionar dicho coeficiente de comparación dependiendo del resultado de dichas determinaciones.
45 En algunas realizaciones, el valor de comparación de cada coeficiente espectral es un valor cuadrado de un coeficiente adicional de un espectro adicional (un espectro de comparación) que resulta de una transformación de conservación de energía de la señal de audio.
50 En realizaciones adicionales, el valor de comparación de cada coeficiente espectral es un valor de amplitud de un coeficiente adicional de un espectro adicional que resulta de una transformación de conservación de energía de la señal de audio.
De acuerdo con una realización, el espectro adicional es un espectro de la Transformada Discreta de Fourier y en el 55 que la transformación de conservación de energía es una Transformada Discreta de Fourier.
De acuerdo con una realización adicional, el espectro adicional es un espectro de la Transformada Modificada Discreta del Coseno Compleja (CMDCT), y en el que la transformación de conservación de energía es una CMDCT.
60 En otra realización, el determinador de extremos 410 puede no examinar un espectro de comparación, pero en su lugar, puede examinar el propio espectro de entrada de señal de audio. Esto puede ser razonable, por ejemplo,
cuando el propio espectro de entrada de señal de audio resulta de una transformación de conservación de energía, por ejemplo, cuando el espectro de entrada de señal de audio es un espectro de magnitud de la Transformada Discreta de Fourier.
5 Por ejemplo, el determinador de extremos 410 puede configurarse para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor espectral del cual es mayor que el valor espectral de uno de sus predecesores y el valor espectral del cual es mayor que el valor espectral de uno de sus sucesores.
10 En una realización, el determinador de extremos 410 puede configurarse para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor espectral del cual es mayor que el valor espectral de su predecesor inmediato y el valor espectral del cual es mayor que el valor espectral de su sucesor inmediato.
15 Además, el aparato comprende un modificador de espectro 420 para modificar el espectro de entrada de señal de audio para obtener un espectro de señal de audio modificado ajustando el valor espectral del predecesor o del sucesor de al menos uno de los coeficientes de extremo a un valor predefinido. El modificador de espectro 420 está configurado para no establecer los valores espectrales del uno o más coeficientes de extremo al valor predefinido, o está configurado para sustituir al menos uno del uno o más coeficientes de extremo mediante un pseudo coeficiente,
20 en el que el valor espectral del pseudo coeficiente es diferente del valor predefinido.
Preferentemente, el valor predefinido puede ser cero. Por ejemplo, en el espectro de señal 530 de audio modificado (sustituido) de la Figura 5, los valores espectrales de una gran cantidad de coeficientes espectrales se han establecido a cero mediante el modificador de espectro 420.
25 En otras palabras, para obtener el espectro de señal de audio modificado, el modificador de espectro 420 se establecerá a al menos el valor espectral de un predecesor o un sucesor de uno de los coeficientes de extremo a un valor predefinido. El valor predefinido puede por ejemplo ser, por ejemplo, cero. El valor de comparación de un predecesor o sucesor de este tipo es más pequeño que el valor de comparación de dicho valor de extremo.
30 Además, en relación con los propios coeficientes de extremo, el modificador de espectro 420 continuará como sigue:
El modificador de espectro 420 no establecerá los coeficientes de extremo al valor predefinido, o:
35 El modificador de espectro 420 sustituirá al menos uno de los coeficientes de extremo mediante un pseudo coeficiente, en el que el valor espectral del pseudo coeficiente es diferente del valor predefinido. Esto significa que el valor espectral de al menos uno de los coeficientes de extremo se establece al valor predefinido, y el valor espectral de uno otro de los coeficientes espectrales se establece a un valor que es diferente del valor predefinido. Un valor de este tipo puede obtenerse, por ejemplo, a partir del valor espectral de dicho coeficiente
40 de extremo, de uno de los predecesores de dicho coeficiente de extremo o de uno de los sucesores de dicho coeficiente de extremo. O, un valor de este tipo puede obtenerse, por ejemplo, a partir del valor de comparación de dicho coeficiente de extremo, de uno de los predecesores de dicho coeficiente de extremo o de uno de los sucesores de dicho coeficiente de extremo.
45 El modificador de espectro 420 puede configurarse, por ejemplo, para sustituir uno de los coeficientes de extremos mediante un pseudo coeficiente que tiene un valor espectral obtenido a partir del valor espectral o del valor de comparación de dicho coeficiente de extremo, a partir del valor espectral o del valor de comparación de uno de los predecesores de dicho coeficiente de extremo o a partir del valor espectral o del valor de comparación de uno de los sucesores de dicho coeficiente de extremo.
50 Adicionalmente, el aparato comprende una unidad de procesamiento 430 para procesar el espectro de señal de audio modificado para obtener un espectro de señal de audio codificado.
Por ejemplo, la unidad de procesamiento 430 puede ser cualquier tipo de codificador de audio, por ejemplo, un
55 codificador de audio de MP3 (MPEG1 Capa de Audio III o MPEG2 Capa de Audio III; MPEG = Grupo de Expertos en Imágenes en Movimiento), un codificador de audio para WMA (Windows Media Audio), un codificador de audio para ficheros WAVE o un codificador de audio MPEG2/4 AAC (Codificación de Audio Avanzada) o un codificador MPEGD USAC (Codificación Unificada de Audio y Habla).
60 La unidad de procesamiento 430 puede ser, por ejemplo, un codificador de audio como se describe en [8] (ISO/IEC 144963: 2005 Information technology Coding of audiovisual objects Parte 3: Audio, Subparte 4) o como se describe en [9] (ISO/IEC 144963: 2005 Information technology Coding of audiovisual objects Parte 3: Audio, Subparte 4). Por ejemplo, la unidad de procesamiento 430 puede comprender un cuantificador y/o una herramienta de conformación de ruido temporal como, por ejemplo, la descrita en [8] y/o la unidad de procesamiento 430 puede
comprender una herramienta de sustitución de ruido perceptual como, por ejemplo, la descrita en [8].
Además, el aparato comprende un generador 440 de información lateral para generar y transmitir información lateral. El generador 440 de información lateral está configurado para localizar uno o más pseudo coeficientes candidatos
5 en el espectro de entrada de señal de audio modificado generado mediante el modificador de espectro 420. Adicionalmente, el generador 440 de información lateral está configurado para seleccionar al menos uno de los pseudo coeficientes candidatos como candidatos seleccionados. Además, el generador 440 de información lateral está configurado para generar la información lateral de modo que la información lateral indica los candidatos seleccionados como los pseudo coeficientes.
10 En la realización ilustrada mediante la Figura 4, el generador 440 de información lateral está configurado para recibir las posiciones de los pseudo coeficientes (por ejemplo, la posición de cada uno de los pseudo coeficientes) mediante el modificador de espectro 420. Además, en la realización de la Figura 4, el generador 440 de información lateral está configurado para recibir las posiciones de los pseudo coeficientes candidatos (por ejemplo, la posición de
15 cada uno de los pseudo coeficientes candidatos).
Por ejemplo, en algunas realizaciones, la unidad de procesamiento 430 puede configurarse para determinar los pseudo coeficientes candidatos basándose en un espectro de señal de audio cuantificado. En una realización, la unidad de procesamiento 430 puede haber generado el espectro de señal de audio cuantificado cuantificando el
20 espectro de señal de audio modificado. Por ejemplo, la unidad de procesamiento 430 puede determinar el al menos un coeficiente espectral del espectro de señal de audio cuantificado como un pseudo coeficiente candidato, que tiene un predecesor inmediato, el valor espectral del cual es igual al valor predefinido (por ejemplo, igual a 0), y que tiene un sucesor inmediato, el valor espectral del cual es igual al valor predefinido. Como alternativa, en otras realizaciones, la unidad de procesamiento 430 puede pasar el espectro de señal de audio
25 cuantificado al generador 440 de información lateral y el generador 440 de información lateral puede por sí mismo determinar los pseudo coeficientes candidatos basándose en el espectro de señal de audio cuantificado. De acuerdo con otras realizaciones, los pseudo coeficientes candidatos se determinan de una manera alternativa basándose en el espectro de señal de audio modificado.
30 La información lateral generada mediante el generador de información lateral puede ser de un tamaño predefinido estático, o su tamaño puede estimarse iterativamente de una manera adaptiva a la señal. En este caso, el tamaño real de la información lateral se transmite al decodificador también. Por lo que, de acuerdo con una realización, el generador 440 de información lateral está configurado para transmitir el tamaño de la información lateral.
35 De acuerdo con una realización, el determinador de extremos 410 está configurado para examinar los coeficientes de comparación, por ejemplo, los coeficientes del espectro de potencia 520 en la Figura 5, y está configurado para determinar el uno o más coeficientes mínimos, de modo que cada uno de los coeficientes mínimos es uno de los coeficientes espectrales el valor de comparación del cual es más pequeño que el valor de comparación de uno de sus predecesores y el valor de comparación del cual es más pequeño que el valor de comparación de uno de sus
40 sucesores. En una realización de este tipo, el modificador de espectro 420 puede configurarse para determinar un valor de representación basándose en los valores de comparación de uno o más de los coeficientes de extremo y de uno o más de los coeficientes mínimos, de modo que el valor de representación es diferente del valor predefinido. Adicionalmente, el modificador de espectro 420 puede configurarse para cambiar el valor espectral de uno de los coeficientes del espectro de entrada de señal de audio ajustando dicho valor espectral al valor de representación.
45 En una realización específica, el determinador de extremos está configurado para examinar los coeficientes de comparación, por ejemplo, los coeficientes del espectro de potencia 520 en la Figura 5, y está configurado para determinar el uno o más coeficientes mínimos, de modo que cada uno de los coeficientes mínimos es uno de los coeficientes espectrales el valor de comparación del cual es más pequeño que el valor de comparación de su
50 predecesor inmediato y el valor de comparación del cual es más pequeño que el valor de comparación de su sucesor inmediato.
Como alternativa, el determinador de extremos 410 está configurado para examinar el propio espectro de entrada 510 de señal de audio y está configurado para determinar uno o más coeficientes mínimos, de modo que cada uno
55 del uno o más coeficientes mínimos es uno de los coeficientes espectrales el valor espectral del cual es más pequeño que el valor espectral de uno de sus predecesores y el valor espectral del cual es más pequeño que el valor espectral de uno de sus sucesores. En una realización de este tipo, el modificador de espectro 420 puede configurarse para determinar un valor de representación basándose en los valores espectrales de uno o más de los coeficientes de extremo y de uno o más de los coeficientes mínimos, de modo que el valor de representación es
60 diferente del valor predefinido. Además, el modificador de espectro 420 puede configurarse para cambiar el valor espectral de uno de los coeficientes del espectro de entrada de señal de audio ajustando dicho valor espectral al valor de representación.
En una realización específica, el determinador de extremos 410 está configurado para examinar el propio espectro
de entrada 510 de señal de audio y está configurado para determinar uno o más coeficientes mínimos, de modo que cada uno del uno o más coeficientes mínimos es uno de los coeficientes espectrales el valor espectral del cual es más pequeño que el valor espectral de su predecesor inmediato y el valor espectral del cual es más pequeño que el valor espectral de su sucesor inmediato.
5 En ambas realizaciones, el modificador de espectro 420 tiene en cuenta el coeficiente de extremo y uno o más de los coeficientes mínimos, en particular sus valores de comparación asociados o sus valores espectrales, para determinar el valor de representación. A continuación, el valor espectral de uno de los coeficientes espectrales del espectro de entrada de señal de audio se establece al valor de representación. Para el coeficiente espectral, el valor
10 espectral del cual se establece al valor de representación puede ser, por ejemplo, el propio coeficiente de extremo, o el coeficiente espectral, el valor espectral del cual se establece al valor de representación puede ser el pseudo coeficiente que sustituye el coeficiente de extremo.
En una realización, el determinador de extremos 410 puede configurarse para determinar una o más subsecuencias
15 de la secuencia de valores espectrales, de modo que cada una de las subsecuencias comprende una pluralidad de coeficientes espectrales posteriores del espectro de entrada de señal de audio. Los coeficientes espectrales posteriores están ordenados secuencialmente en la subsecuencia de acuerdo con su posición espectral. Cada una de las subsecuencias tiene un primer elemento que es el primero en dicha subsecuencia secuencialmente ordenada y un último elemento que es el último en dicha subsecuencia secuencialmente ordenada.
20 En una realización específica, cada una de las subsecuencias puede comprender, por ejemplo, exactamente dos de los coeficientes mínimos y exactamente uno de los coeficientes de extremo, siendo uno de los coeficientes mínimos el primer elemento de la subsecuencia, siendo el otro de los coeficientes mínimos el último elemento de la subsecuencia.
25 En una realización, el modificador de espectro 420 puede configurarse para determinar el valor de representación basándose en los valores espectrales o los valores de comparación de los coeficientes de una de las subsecuencias. Por ejemplo, si el determinador de extremos 410 ha examinado los coeficientes de comparación del espectro de comparación, por ejemplo del espectro de potencia 520, el modificador de espectro 420 puede
30 configurarse para determinar el valor de representación basándose en los valores de comparación de los coeficientes de una de las subsecuencias. Si, sin embargo, el determinador de extremos 410 ha examinado los coeficientes espectrales del espectro de entrada 510 de señal de audio, el modificador de espectro 420 puede configurarse para determinar el valor de representación basándose en los valores espectrales de los coeficientes de una de las subsecuencias.
35 El modificador de espectro 420 está configurado para cambiar el valor espectral de uno de los coeficientes de dicha subsecuencia ajustando dicho valor espectral al valor de representación.
La Tabla 2 proporciona un ejemplo con cinco coeficientes espectrales en las localizaciones espectrales 252 a 258. 40 Tabla 2
Localización espectral
252 253 254 255 256 257 258
Valor de comparación
0,12 0,05 0,48 0,73 0,45 0,03 0,18
El determinador de extremos 410 puede determinar que el coeficiente espectral 255 (el coeficiente espectral con la localización espectral 255) es un coeficiente de extremo, ya que su valor de comparación (0,73) es mayor que el 45 valor de comparación (0,48) de su (en este punto: inmediato) predecesor 254, y ya que su valor de comparación (0,73) es mayor que el valor de comparación (0,45) de su (en este punto: inmediato) sucesor 256.
Además, el determinador de extremos 410 puede determinar que el coeficiente espectral 253 (es un coeficiente mínimo, ya que su valor de comparación (0,05) es más pequeño que el valor de comparación (0,12) de su (en este 50 punto: inmediato) predecesor 252, y ya que su valor de comparación (0,05) es más pequeño que el valor de comparación (0,48) de su (en este punto: inmediato) sucesor 254.
Adicionalmente, el determinador de extremos 410 puede determinar que el coeficiente espectral 257 es un coeficiente mínimo ya que su valor de comparación (0,03) es más pequeño que el valor de comparación (0,45) de su 55 (en este punto: inmediato) predecesor 256 y ya que su valor de comparación (0,03) es más pequeño que el valor de comparación (0,18) de su (en este punto: inmediato) sucesor 258.
El determinador de extremos 410 puede por lo tanto determinar una subsecuencia que comprende los coeficientes espectrales 253 a 257, determinando que el coeficiente espectral 255 es un coeficiente de extremo, determinando el 60 coeficiente espectral 253 como el coeficiente mínimo que es el coeficiente mínimo precedente más cercano al coeficiente de extremo 255, y determinando el coeficiente espectral 257 como el coeficiente mínimo que es el
coeficiente mínimo sucesor más cercano al coeficiente de extremo 255.
El modificador de espectro 420 puede ahora determinar un valor de representación para la subsecuencia 253 257 basándose en los valores de comparación de todos los coeficientes espectrales 253 257.
5 Por ejemplo, el modificador de espectro 420 puede configurarse para totalizar los valores de comparación de todos los coeficientes espectrales de la subsecuencia. (Por ejemplo, para la Tabla 2, el valor de representación para la subsecuencia 253 257 entonces se totaliza a: 0,05 + 0,48 + 0,73 + 0,45 + 0,03 = 1,74).
10 O, por ejemplo, el modificador de espectro 420 puede configurarse para totalizar los cuadrados de los valores de comparación de todos los coeficientes espectrales de la subsecuencia. (Por ejemplo, para la Tabla 2, el valor de representación para la subsecuencia 253 257 entonces se totaliza a: (0,05)2 + (0,48)2 + (0,73)2 + (0,45)2 + (0,03)2 = 0,9692).
15 O, por ejemplo, el modificador de espectro 420 puede configurarse para realizar la raíz cuadrada de la suma de los cuadrados de los valores de comparación de todos los coeficientes espectrales de la subsecuencia 253 257. (Por ejemplo, para la Tabla 2, el valor de representación es entonces 0,98448).
De acuerdo con algunas realizaciones, el modificador de espectro 420 establecerá el valor espectral del coeficiente 20 de extremo (en la Tabla al valor espectral del coeficiente espectral 253) al valor predefinido.
Otras realizaciones, sin embargo, usan un enfoque de centro de gravedad. La Tabla 3 ilustra una subsecuencia que comprende los coeficientes espectrales 282 288:
25 Tabla 3
Localización espectral
281 282 283 284 285 286 287 288 289
Valor de comparación
0,12 0,04 0,10 0,20 0,93 0,92 0,90 0,05 0,15
Aunque el coeficiente de extremo está localizado en la localización espectral 285, de acuerdo con el enfoque de centro de gravedad, el centro de gravedad está localizado en una localización espectral diferente. Para determinar la
30 localización espectral del centro de gravedad, el determinador de extremos 410 totaliza localizaciones espectrales ponderadas de todos los coeficientes espectrales de la subsecuencia y divide el resultado por la suma de los valores de comparación de los coeficientes espectrales de la subsecuencia. Puede emplearse a continuación redondeo comercial en el resultado de la división para determinar el centro de gravedad. La localización espectral ponderada de un coeficiente espectral es el producto de su localización espectral y sus valores de comparación.
35 En resumen: el determinador de extremos puede obtener el centro de gravedad:
1) Determinando el producto del valor de comparación y localización espectral para cada coeficiente espectral de la subsecuencia.
40 2) Totalizando los productos determinados en 1) para obtener una primera suma
3) Totalizando los valores de comparación de todos los coeficientes espectrales de la subsecuencia para obtener una segunda suma
45 4) Dividiendo la primera suma por la segunda suma para generar un resultado intermedio; y
5) Aplicar redondeo al redondeo más cercano en el resultado intermedio para obtener el centro de gravedad (redondeo al redondeo más cercano: 8,49 se redondea a 8; 8,5 se redondea a 9) 50 Por lo tanto, para el ejemplo de la Tabla 3, el centro de gravedad se obtiene mediante:
(0,04 ⋅ 282 + 0,10 ⋅ 283 + 0,20 ⋅ 284 + 0,93 ⋅ 285 + 0,92 ⋅ 286 + 0,90 ⋅ 287 + 0,05 ⋅ 288) / / (0,04 + 0,10 + 0,20 + 0,93 + 0,92 + 0,90 + 0,05) = 897,25 / 3,14 = 285,75 = 286.
55 Por lo tanto, en el ejemplo de la Tabla 3, el determinador de extremos 410 se configuraría para determinar la localización espectral 286 como el centro de gravedad.
En algunas realizaciones, el determinador de extremos 410 no examina el espectro de comparación completo (por
60 ejemplo, el espectro de potencia 520) o no examina el espectro de entrada de señal de audio completo. En su lugar, el determinador de extremos 410 puede examinar únicamente de manera parcial el espectro de comparación o el
espectro de entrada de señal de audio.
La Figura 6 ilustra un ejemplo de este tipo. Ahí, el espectro de potencia 620 (como un espectro de comparación) se ha examinado mediante un determinador de extremos 410 que empieza en el coeficiente 55. Los coeficientes en las
5 localizaciones espectrales más pequeños de 55 no se han examinado. Por lo tanto, los coeficientes espectrales en las localizaciones espectrales más pequeños de 55 permanecen sin modificar en el espectro 630 de MDCT sustituido. En contraste, la Figura 5 ilustra un espectro 530 de MDCT sustituido donde todas las líneas espectrales de MDCT se han modificado por el modificador de espectro 420.
10 Por lo tanto, el modificador de espectro 420 puede configurarse para modificar el espectro de entrada de señal de audio de modo que los valores espectrales de al menos algunos de los coeficientes espectrales del espectro de entrada de señal de audio se dejan sin modificar.
En algunas realizaciones, el modificador de espectro 420 está configurado para determinar, si una diferencia de
15 valor entre uno del valor de comparación o el valor espectral de uno de los coeficientes de extremo es más pequeño que un valor umbral. En tales realizaciones, el modificador de espectro 420 está configurado para modificar el espectro de entrada de señal de audio de modo que los valores espectrales de al menos algunos de los coeficientes espectrales del espectro de entrada de señal de audio se dejan sin modificar en el espectro de señal de audios modificados dependiendo de si la diferencia de valor es más pequeña que el valor umbral.
20 Por ejemplo, en una realización, el modificador de espectro 420 puede configurarse para no modificar o sustituir todos, sino en lugar de modificar o sustituir únicamente algunos de los coeficientes de extremo. Por ejemplo, cuando al diferencia entre el valor de comparación del coeficiente de extremo (por ejemplo, un máximo local) y el valor de comparación del valor mínimo posterior y/o precedente es más pequeño que un valor umbral, el modificador de
25 espectro puede determinarse para no modificar estos valores espectrales (y por ejemplo los valores espectrales de los coeficientes espectrales entre ellos), pero en su lugar dejar estos valores espectrales sin modificar en el espectro 630 de MDCT modificado (sustituido). En el espectro 630 de MDCT modificado de la Figura 6, los valores espectrales de los coeficientes espectrales 100 a 112 y los valores espectrales de los coeficientes espectrales 124 a 136 se han dejado sin modificar mediante el modificador espectral en el espectro 630 sin modificar (sustituido).
30 La unidad de procesamiento puede configurarse adicionalmente para cuantificar coeficientes del espectro 630 de MDCT modificado (sustituido) para obtener un espectro 635 de MDCT cuantificado.
De acuerdo con una realización, el modificador de espectro 420 puede configurarse para recibir información de
35 ajuste fino. Los valores espectrales de los coeficientes espectrales del espectro de entrada de señal de audio pueden ser valores con signo, comprendiendo cada uno un componente de signo. El modificador de espectro puede configurarse para establecer el componente de signo de uno del uno o más coeficientes de extremo o del pseudo coeficiente a un primer valor de signo, cuando la información de ajuste fino está en un primer estado de ajuste fino. Y el modificador de espectro puede configurarse para establecer el componente de signo del valor espectral de uno
40 del uno o más coeficientes de extremo o del pseudo coeficiente a un segundo valor de signo diferente, cuando la información de ajuste fino está en un segundo estado de ajuste fino diferente.
Por ejemplo, en la Tabla 4,
45 Tabla 4
Localización espectral
291 301 321 329 342 362 388 397 405
Valor espectral
+0,88 0,91 +0,79 0,82 +0,93 0,92 0,90 +0,95 0,92
Estado de ajuste fino
1º 2º 1º 2º 1º 2º 2º 1º 2º
los valores espectrales de los coeficientes espectrales indican que el coeficiente espectral 291 está en un primer estado de ajuste fino, el coeficiente espectral 301 está en un segundo estado de ajuste fino, el coeficiente espectral 321 está en el primer estado de ajuste fino, etc.
50 Por ejemplo, volviendo a la determinación del centro de gravedad anteriormente explicada, si el centro de gravedad está (por ejemplo, aproximadamente en el medio) entre dos localizaciones espectrales, el modificador espectral puede establecer el signo de modo que se indica el segundo estado de ajuste fino.
55 De acuerdo con una realización, la unidad de procesamiento 430 puede configurarse para cuantificar el espectro de señal de audio modificado para obtener un espectro de señal de audio cuantificado. La unidad de procesamiento 430 puede configurarse adicionalmente para procesar el espectro de señal de audio cuantificado para obtener un espectro de señal de audio codificado.
Además, la unidad de procesamiento 430 puede configurarse adicionalmente para generar información lateral que indica únicamente aquellos coeficientes espectrales del espectro de señal de audio cuantificado que tienen un predecesor inmediato el valor espectral del cual es igual al valor predefinido y un sucesor inmediato, el valor espectral del cual es igual al valor predefinido, si dicho coeficiente es uno de los coeficientes de extremo.
5 Tal información puede proporcionarse mediante el determinador de extremos 410 a la unidad de procesamiento 430.
Por ejemplo, una información de este tipo puede almacenarse mediante la unidad de procesamiento 430 en un campo de bits, que indica para cada uno de los coeficientes espectrales del espectro de señal de audio cuantificado 10 que tiene un predecesor inmediato al valor espectral del cual es igual al valor predefinido y un sucesor inmediato, el valor espectral del cual es igual al valor predefinido, si dicho coeficiente es uno de los coeficientes de extremo (por ejemplo, mediante un valor de bit 1) o si dicho coeficiente no es uno de los coeficientes de extremo (por ejemplo, mediante un valor de bit 0). En una realización, un decodificador puede más tarde usar esta información para restaurar el espectro de entrada de señal de audio. El campo de bits puede tener una longitud fija o una señal de
15 longitud elegida de manera adaptiva. En el último caso, la longitud del campo de bit puede transportarse adicionalmente al decodificador.
Por ejemplo, un campo de bits [000111111] generado mediante la unidad de procesamiento 430 puede indicar, que los primeros tres coeficientes “independientes” (su valor espectral no es igual al valor predefinido, pero los valores 20 espectrales de su predecesor y de su sucesor son iguales al valor predefinido) que aparecen en el espectro de señal de audio (ordenados secuencialmente) (cuantificados) no son coeficientes de extremo, pero los siguientes seis coeficientes “independientes” son coeficientes de extremo. El campo de bits describe la situación que puede observarse en el espectro 635 de MDCT cuantificado en la Figura 6, donde los primeros tres coeficientes “independientes” 5, 8, 25 no son coeficientes de extremo, pero los siguientes seis coeficientes “independientes” 59,
25 71, 83, 94, 116, 141 son coeficientes de extremo.
De nuevo, el predecesor inmediato de dicho coeficiente espectral es otro coeficiente espectral que precede inmediatamente a dicho coeficiente espectral en el espectro de señal de audio cuantificado, y el sucesor inmediato de dicho coeficiente espectral es otro coeficiente espectral que sucede inmediatamente a dicho coeficiente espectral
30 en el espectro de señal de audio cuantificado.
A continuación, se describe un aparato para generar una señal de salida de audio basándose en un espectro de señal de audio codificado de acuerdo con una realización.
35 La Figura 1 ilustra un aparato de este tipo para generar una señal de salida de audio basándose en un espectro de señal de audio codificado de acuerdo con una realización.
El aparato comprende una unidad de procesamiento 110 para procesar el espectro de señal de audio codificado para obtener un espectro de señal de audio decodificado. El espectro de señal de audio decodificado comprende
40 una pluralidad de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de señal de audio codificado y un valor espectral, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de señal de audio codificado de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales.
45 Además, el aparato comprende un determinador de pseudo coeficientes 120 para determinar uno o más pseudo coeficientes del espectro de señal de audio decodificado usando información lateral (información lateral), teniendo cada uno de los pseudo coeficientes una localización espectral y un valor espectral.
Adicionalmente, el aparato comprende una unidad de modificación de espectro 130 para ajustar el uno o más 50 pseudo coeficientes a un valor predefinido para obtener un espectro de señal de audio modificado.
Además, el aparato comprende una unidad de conversión de espectrotiempo 140 para convertir el espectro de señal de audio modificado a un dominio de tiempo para obtener una señal de conversión de dominio de tiempo.
55 Adicionalmente, el aparato comprende un oscilador controlable 150 para generar una señal de oscilador de dominio de tiempo, estando controlado el oscilador controlable mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes.
Además, el aparato comprende un mezclador 160 para mezclar la señal de conversión de dominio de tiempo y la 60 señal de oscilador de dominio de tiempo para obtener la señal de salida de audio.
En una realización, el mezclador puede configurarse para mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo añadiendo la señal de conversión de dominio de tiempo a la señal de oscilador de dominio de tiempo en el dominio de tiempo.
La unidad de procesamiento 110 puede ser, por ejemplo, cualquier tipo de decodificador de audio, por ejemplo, un decodificador de audio de MP3, un decodificador de audio para WMA, un decodificador de audio para ficheros WAVE, un decodificador de audio de AAC o un decodificador de audio de USAC.
5 La unidad de procesamiento 110 puede ser, por ejemplo, un decodificador de audio como se describe en [8] (ISO/IEC 144963: 2005 Information technology Coding of audiovisual objects Parte 3: Audio, Subparte 4) o como se describe en [9] (ISO/IEC 144963: 2005 Information technology Coding of audiovisual objects Parte 3: Audio, Subparte 4). Por ejemplo, la unidad de procesamiento 430 puede comprender un reescalado de valores
10 cuantificados (“decuantificación”), y/o una herramienta de conformación de ruido temporal, como, por ejemplo, se describe en [8] y/o la unidad de procesamiento 430 puede comprender una herramienta de sustitución de ruido perceptual, como, por ejemplo, se describe en [8].
De acuerdo con una realización, cada uno de los coeficientes espectrales puede tener al menos uno de un
15 predecesor inmediato y un sucesor inmediato, en el que el predecesor inmediato de dicho coeficiente espectral puede ser uno de los coeficientes espectrales que precede inmediatamente a dicho coeficiente espectral en la secuencia, en el que el sucesor inmediato de dicho coeficiente espectral puede ser uno de los coeficientes espectrales que sucede inmediatamente a dicho coeficiente espectral en la secuencia.
20 El determinador de pseudo coeficientes 120 puede configurarse para determinar el uno o más pseudo coeficientes del espectro de señal de audio decodificado determinando al menos un coeficiente espectral de la secuencia, que tiene un valor espectral que es diferente del valor predefinido, que tiene un predecesor inmediato al valor espectral del cual es igual al valor predefinido, y que tiene un sucesor inmediato el valor espectral del cual es igual al valor predefinido. En una realización, el valor predefinido puede ser cero y el valor predefinido puede ser cero.
25 En otras palabras: el determinador de pseudo coeficientes 120 determina para algunos o todos los coeficientes del espectro de señal de audio decodificado si el coeficiente respectivamente considerado es diferente del valor predefinido (preferentemente: diferente de 0), si el valor espectral del coeficiente precedente es igual al valor predefinido (preferentemente: igual a 0) y si el valor espectral del coeficiente sucesivo es igual al valor predefinido
30 (preferentemente: igual a 0).
En algunas realizaciones, un coeficiente determinado de este tipo es (siempre) un pseudo coeficiente.
En otras realizaciones, sin embargo, un coeficiente determinado de este tipo es (únicamente) un pseudo coeficiente
35 candidato y puede o puede no ser un pseudo coeficiente. En estas realizaciones, el determinador de pseudo coeficientes 120 está configurado para determinar el al menos un pseudo coeficiente candidato, que tiene un valor espectral que es diferente del valor predefinido, que tiene un predecesor inmediato, el valor espectral del cual es igual al valor predefinido, y que puede tener un sucesor inmediato, el valor espectral del cual es igual al valor predefinido.
40 El determinador de pseudo coeficientes 120 está configurado entonces para determinar si el pseudo coeficiente candidato es un pseudo coeficiente determinando si la información lateral indica que dicho pseudo coeficiente candidato es un pseudo coeficiente.
45 Por ejemplo, tal información lateral puede recibirse mediante el determinador de pseudo coeficientes 120 en un campo de bits, que indica para cada uno de los coeficientes espectrales del espectro de señal de audio cuantificado que tiene un predecesor inmediato el valor espectral del cual es igual al valor predefinido y un sucesor inmediato, el valor espectral del cual es igual al valor predefinido, si dicho coeficiente es uno de los coeficientes de extremo (por ejemplo, mediante un valor de bit 1) o si dicho coeficiente no es uno de los coeficientes de extremo (por ejemplo,
50 mediante un valor de bit 0).
Por ejemplo, un campo de bits [000111111] puede indicar, que los primeros tres coeficientes “independientes” (su valor espectral no es igual al valor predefinido, pero los valores espectrales se su predecesor y de su sucesor son iguales al valor predefinido) que aparecen en el espectro de señal de audio (secuencialmente ordenado)
55 (cuantificado) no son coeficientes de extremo, pero los siguientes seis coeficientes “independientes” son coeficientes de extremo. Este campo de bits describe la situación que puede observarse en el espectro 635 de MDCT cuantificado en la Figura 6, donde los primeros tres coeficientes “independientes” 5, 8, 25 no son coeficientes de extremo, pero los siguientes seis coeficientes “independientes” 59, 71, 83, 94, 116, 141 son coeficientes de extremo.
60 La unidad de modificación de espectro 130 puede configurarse para “borrar” los pseudo coeficientes del espectro de señal de audio decodificado. De hecho, la unidad de modificación de espectro establece el valor espectral de los pseudo coeficientes del espectro de señal de audio decodificado al valor predefinido (preferentemente a 0). Esto es razonable, ya que los pseudo coeficientes (al menos uno) necesitarán únicamente controlar el (al menos uno) oscilador controlable 150. Por lo tanto, considérese, por ejemplo, el espectro 635 de MDCT cuantificado en la Figura
6. Si se considera el espectro 635 como el espectro de señal de audio decodificado, la unidad de modificación de espectro 130 establecería los valores espectrales de los coeficientes de extremo 59, 71, 83, 94, 116 y 141 para obtener el espectro de señal de audio modificado y dejaría los otros coeficientes del espectro sin modificar.
5 La unidad de conversión de espectrotiempo 140 convierte el espectro de señal de audio modificado desde un dominio espectral a un dominio de tiempo. Por ejemplo, el espectro de señal de audio modificado puede ser un espectro de MDCT, y la unidad de conversión de espectrotiempo 140 puede ser un banco de filtros de la Transformada Modificada Discreta del Coseno Inversa (IMDCT). En otras realizaciones, el espectro puede ser un espectro de MDST y la unidad de conversión de espectrotiempo 140 puede ser un banco de filtros de la
10 Transformada Modificada Discreta del Seno Inversa (IMDST). O, en realizaciones adicionales, el espectro puede ser un espectro de DFT y la unidad de conversión de espectrotiempo 140 puede ser un banco de filtros de la Transformada Discreta de Fourier Inversa (IDFT).
El oscilador controlable 150 puede configurarse para generar la señal de oscilador de dominio de tiempo que tiene
15 una frecuencia de señal de oscilador de modo que la frecuencia de señal del oscilador de la señal del oscilador puede depender de la localización espectral de uno del uno o más pseudo coeficientes. La señal del oscilador generada mediante el oscilador puede ser una señal de seno de dominio en el tiempo. El oscilador controlable 150 puede configurarse para controlar la amplitud de la señal de seno de dominio de tiempo dependiendo del valor espectral de uno del uno o más pseudo coeficientes.
20 De acuerdo con una realización, los pseudo coeficientes son valores con signo, comprendiendo cada uno un componente de signo. El oscilador controlable 150 puede configurarse para generar la señal de oscilador de dominio de tiempo de modo que la frecuencia de señal del oscilador de la señal del oscilador adicionalmente puede depender del componente de signo de uno del uno o más pseudo coeficientes de modo que la frecuencia de señal
25 del oscilador puede tener un primer valor de frecuencia, cuando el componente de signo tiene un primer valor de signo, y de modo que la frecuencia de señal del oscilador puede tener un segundo valor de frecuencia diferente, cuando el componente de signo tiene un segundo valor diferente.
Por ejemplo, considérese el pseudo coeficiente en la localización espectral 59 en el espectro 635 de MDCT de la
30 Figura 6. Si se asignara la frecuencia 8200 Hz a la localización espectral 59 y si se asignara la frecuencia 8400 Hz a la localización espectral 60, entonces, el oscilador controlable puede configurarse, por ejemplo, para establecer la frecuencia del oscilador a 8200 Hz, si el signo del valor espectral del pseudo coeficiente es positivo, y puede configurarse, por ejemplo, para establecer la frecuencia del oscilador a 8300 Hz, si el signo del valor espectral del pseudo coeficiente es negativo.
35 Por lo tanto, el signo del valor espectral del pseudo coeficiente puede usarse para controlar, si el oscilador controlable establece la frecuencia del oscilador a una frecuencia (por ejemplo 8200 Hz) asignada a la localización espectral del pseudo coeficiente (por ejemplo, la localización espectral 59) o a una frecuencia (por ejemplo, 8300 Hz) entre la frecuencia (por ejemplo, 8200 Hz) asignada a la localización espectral del pseudo coeficiente (por ejemplo,
40 la localización espectral 59) y la frecuencia (por ejemplo, 8400 Hz) asignada a la localización espectral que sigue inmediatamente la localización espectral del pseudo coeficiente (por ejemplo. la localización espectral 60).
En una realización, el oscilador controlable 150 se controla adicionalmente mediante uno o más parámetros extrapolados obtenidos de un pseudo coeficiente de una trama precedente. Por ejemplo, el oscilador controlable 150 45 puede controlarse también adicionalmente a través de parámetros extrapolados obtenidos desde el pseudo coeficiente de la trama precedente para, por ejemplo, ocultar una pérdida de trama de datos durante la transmisión,
o para suavizar un comportamiento del control del oscilador. Unos parámetros extrapolados pueden ser, por ejemplo, una localización espectral o un valor espectral. Por ejemplo, cuando se consideran coeficientes espectrales de un dominio de tiempofrecuencia, los coeficientes espectrales en relación con el instante de tiempo t1 pueden
50 estar comprendidos mediante una primera trama, y los coeficientes espectrales en relación con el instante de tiempo t pueden asignarse a una segunda trama. Por ejemplo, el valor espectral y/o la localización espectral de un pseudo coeficiente en relación con el instante de tiempo t1 pueden copiarse para obtener un parámetro extrapolado para una trama actual en relación con el instante de tiempo t.
55 La Figura 2 ilustra una realización, en la que el aparato comprende adicionalmente osciladores controlables 252, 254, 256 para generar señales de oscilador de dominio de tiempo adicionales controladas mediante las localizaciones espectrales y los valores espectrales de pseudo coeficientes adicionales del uno o más pseudo coeficientes.
60 Los osciladores controlables adicionales 252, 254, 256 generan cada uno una de las señales de oscilador de dominio de tiempo adicionales. Cada uno de los osciladores controlables 252, 254, 256 está configurado para dirigir la frecuencia de señal del oscilador basándose en la localización espectral de uno de los pseudo coeficientes. Y/o cada uno de los osciladores controlables 252, 254, 256 está configurado para dirigir la amplitud de la señal del oscilador basándose en el valor espectral de uno de los pseudo coeficientes.
El mezclador 160 de la Figura 1 y de la Figura 2 está configurado para mezclar la señal de conversión de dominio de tiempo generada mediante la unidad de conversión de espectrotiempo 140 y la una o más señales de oscilador de dominio de tiempo generadas mediante el uno o más osciladores controlables 150, 252, 254, 256 para obtener la
5 señal de salida de audio. El mezclador 160 puede generar la señal de salida de audio mediante una superposición de la señal de conversión de dominio de tiempo y la una o más señales de oscilador de dominio de tiempo.
La Figura 3 ilustra dos diagramas que comparan las sinusoides originales (izquierda) y sinusoides después de procesarse mediante una cadena de MDCT/IMDCT (derecha). Después de procesarse mediante la cadena
10 MDCT/IMDCT, la sinusoide comprende artefactos de trino. Los conceptos anteriormente proporcionados evitan que se procesen las sinusoides mediante la cadena de MDCT/IMDCT, pero en su lugar, la información sinusoidal se codifica mediante un pseudo coeficiente y/o la sinusoide se reproduce mediante un oscilador controlable.
Aunque se han descrito algunos aspectos en el contexto de un aparato, es evidente que estos aspectos representan
15 también una descripción del método correspondiente, donde un bloque o dispositivo corresponde a una etapa de método o una característica de una etapa de método. Análogamente, los aspectos descritos en el contexto de una etapa de método representan también una descripción de un bloque o elemento o característica correspondiente de un aparato correspondiente.
20 La señal descompuesta inventiva puede almacenarse en un medio de almacenamiento digital o puede transmitirse en un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión cableado tal como internet.
Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden implementarse en
25 hardware o en software. La implementación puede realizarse usando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene señales de control electrónicamente legibles almacenadas en la misma, que cooperan (o pueden cooperar) con un sistema informático programable de manera que se realiza el método respectivo.
30 Algunas realizaciones de acuerdo con la invención comprenden una portadora de datos no transitorios que tiene señales de control electrónicamente legibles, que son capaces de cooperar con un sistema informático programable, de manera que se realiza uno de los métodos descritos en el presente documento. En general, las realizaciones de la presente invención pueden implementarse como un producto de programa informático con un código de programa, siendo el código de programa operativo para realizar uno de los métodos
35 cuando el producto de programa informático se ejecuta en un ordenador. El código de programa puede almacenarse, por ejemplo, en una portadora legible por máquina.
Otras realizaciones comprenden el programa informático para realizar uno de los métodos descritos en este documento, almacenados en una portadora legible por máquina.
40 En otras palabras, una realización del método inventivo es, por lo tanto, un programa informático que tiene un código de programa para realizar uno de los métodos descritos en el presente documento, cuando el programa informático se ejecuta en un ordenador.
45 Una realización adicional del método inventivo es, por lo tanto, una portadora de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para realizar uno de los métodos descritos en el presente documento.
Una realización adicional del método inventivo es, por lo tanto, un flujo de datos o una secuencia de señales que
50 representan el programa informático para realizar uno de los métodos descritos en el presente documento. El flujo de datos o la secuencia de señales pueden configurarse, por ejemplo, para transferirse mediante una conexión de comunicación de datos, por ejemplo, mediante Internet.
Una realización adicional comprende unos medios de procesamiento, por ejemplo un ordenador, o un dispositivo de
55 lógica programable, configurados para o adaptados para realizar uno de los métodos descritos en el presente documento.
Una realización adicional comprende un ordenador que tiene instalado en el mismo el programa informático para realizar uno de los métodos descritos en el presente documento.
60 En algunas realizaciones, un dispositivo de lógica programable (por ejemplo un campo de matriz de puertas programables) puede usarse para realizar algunas o todas las funcionalidades de los métodos descritos en el presente documento. En algunas realizaciones, un campo de matriz de puertas programables puede cooperar con un microprocesador para realizar uno de los métodos descritos en el presente documento. En general, los métodos
se realizan preferentemente mediante cualquier aparato de hardware.
Las realizaciones anteriormente descritas son meramente ilustrativas para los principios de la presente invención. Se entiende que serán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en el
5 presente documento para los expertos en la materia. Es la intención, por lo tanto, limitar únicamente mediante el alcance de las reivindicaciones de patente inminentes y no mediante los detalles específicos presentados a modo de descripción y explicación de las realizaciones en el presente documento.
Referencias
[1] Daudet, L.; Sandler, M.; , “MDCT analysis of sinusoids: exact results y applications to coding artifacts reduction,” Speech y Audio Processing, IEEE Transactions on, vol. 12, nº 3, págs. 302312, mayo de 2004
[2] Purnhagen, H.; Meine, N.;, “HILNthe MPEG4 parametric audio coding tools,” Circuits y System, 2000.
15 Proceedings. ISCAS 2000 Geneva. The 2000 IEEE International Symposium an, vol. 3, nº., págs.. 201204 vol. 3, 2000
[3] Oomen, Werner; Schuijers, Erik; den Brinker, Bert; Breebaart, Jeroen:, “Advances in Parametrie Coding for
HighQuality Audio,” Audio Engineering Society Convention 114, preimpreso, Ámsterdam/NL, marzo de 2003 20
[4] van Schijndel, N.H. ; van de Par, S.; , “Ratedistortion optimized hybrid sound coding,” Applications of Signal Processing to Audio y Acoustics, 2005. IEEE Workshop on, vol., nº, págs. 235238, 1619 de octubre de 2005
[5] Bessette, 8.; Lefebvre, R.; Salami, R. ; , “Universal speech/audio coding using hybrid ACELP/TCX
25 techniques,” Acoustics, Speech, y Signal Processing, 2005. Proceedings. (ICASSP ’05). IEEE International Conference on, vol. 3, nº, págs. iii/301iii/304 Val. 3, 1823 de marzo de 2005
[6] Ferreira, A.J.S. “Combined spectral envelope normalization y subtraction of sinusoidal components in the
ODFT y MDCT frequency domains,” Applications of Signal Processing to Audio y Acoustics, 2001 IEEE 30 Workshop on the, vol., nº, págs. 5154, 2001
[7] http://people.xiph.org/~xiphmont/demo/ghost/demo.html El sitio web archive.org correspondiente está almacenado en: http://web.archive.org/web/20110121141149/http://people.xiph.org/~xiphmont /demo/ghost/demo.html
35 [8] ISO/IEC 144963: 2005(E) Information technology Coding of audiovisual objects Parte 3: Audio, Subparte 4
[9] ISO/IEC 144963: 2009(E) Information technology Coding of audiovisual objects Parte 3: Audio, Subparte
4 40

Claims (26)

  1. REIVINDICACIONES
    1. Un aparato para generar una señal de salida de audio basándose en un espectro de señal de audio codificado, en el que el aparato comprende:
    5 una unidad de procesamiento (110) para procesar el espectro de señal de audio codificado para obtener un espectro de señal de audio decodificado comprendiendo el espectro de señal de audio decodificado una pluralidad de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de señal de audio codificado y un valor espectral, en el que los coeficientes espectrales
    10 están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de señal de audio codificado de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales, un determinador de pseudo coeficientes (120) para determinar uno o más pseudo coeficientes del espectro de señal de audio decodificado, teniendo cada uno de los pseudo coeficientes una localización espectral y un valor espectral,
    15 una unidad de modificación de espectro (130) para ajustar el uno o más pseudo coeficientes a un valor predefinido para obtener un espectro de señal de audio modificado, una unidad de conversión de espectrotiempo (140) para convertir el espectro de señal de audio modificado a un dominio de tiempo para obtener una señal de conversión de dominio de tiempo, un oscilador controlable (150) para generar una señal de oscilador de dominio de tiempo, estando controlado el
    20 oscilador controlable (150) mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes, y un mezclador (160) para mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo para obtener la señal de salida de audio.
    25 2. Un aparato de acuerdo con la reivindicación 1, en el que cada uno de los coeficientes espectrales tiene al menos uno de un predecesor inmediato y un sucesor inmediato, en el que el predecesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que precede inmediatamente a dicho coeficiente espectral en la secuencia de coeficientes espectrales, en el que el sucesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede inmediatamente
    30 a dicho coeficiente espectral en la secuencia, en el que el determinador de pseudo coeficientes (120) está configurado para determinar el uno o más pseudo coeficientes del espectro de señal de audio decodificado determinando al menos un coeficiente espectral de la secuencia que tiene un valor espectral que es diferente del valor predefinido, que tiene un predecesor inmediato el valor espectral del cual es igual al valor predefinido, y que tiene un sucesor inmediato el valor espectral del cual es igual al valor predefinido.
  2. 3.
    Un aparato de acuerdo con la reivindicación 2, en el que el valor predefinido es cero.
  3. 4.
    Un aparato de acuerdo con la reivindicación 2 o 3, en el que el determinador de pseudo coeficientes (120) está configurado para determinar el uno o más pseudo
    40 coeficientes del espectro de señal de audio decodificado determinando el al menos un coeficiente espectral de la secuencia como un pseudo coeficiente candidato, que tiene un predecesor inmediato, el valor espectral del cual es igual al valor predefinido, y que tiene un sucesor inmediato, el valor espectral del cual es igual al valor predefinido, y en el que el determinador de pseudo coeficientes (120) está configurado para determinar si el pseudo coeficiente candidato es un pseudo coeficiente determinando si la información lateral indica que dicho pseudo coeficiente
    45 candidato es un pseudo coeficiente.
  4. 5. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el oscilador controlable (150) está configurado para generar la señal de oscilador de dominio de tiempo que tiene una frecuencia de señal de oscilador de modo que la frecuencia de señal del oscilador de la señal del oscilador depende de la localización espectral de
    50 uno del uno o más pseudo coeficientes.
  5. 6. Un aparato de acuerdo con la reivindicación 5, en el que los pseudo coeficientes son valores con signo, comprendiendo cada uno un componente de signo, y en el que el oscilador controlable (150) está configurado para generar la señal de oscilador de dominio de tiempo de
    55 modo que la frecuencia de señal del oscilador de la señal del oscilador depende adicionalmente del componente de signo de uno del uno o más pseudo coeficientes de modo que la frecuencia de señal del oscilador tiene un primer valor de frecuencia, cuando el componente de signo tiene un primer valor de signo, y de modo que la frecuencia de señal del oscilador tiene un segundo valor de frecuencia diferente, cuando el componente de signo tiene un segundo valor diferente.
  6. 7. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el oscilador controlable (150) está configurado para generar la señal de oscilador de dominio de tiempo, en el que la amplitud de la señal del oscilador depende del valor espectral de uno del uno o más pseudo coeficientes, de modo que la amplitud de la señal del oscilador tiene un primer valor de amplitud cuando el valor espectral tiene un tercer valor, y de modo que la amplitud
    de la señal del oscilador tiene un segundo valor de amplitud diferente cuando el valor espectral tiene un cuarto valor diferente, siendo el segundo valor de amplitud mayor que el primer valor de amplitud, cuando el cuarto valor es mayor que el tercer valor.
    5 8. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el oscilador controlable (150) está controlado adicionalmente mediante uno o más parámetros extrapolados obtenidos desde un pseudo coeficiente de una trama anterior.
  7. 9. Un aparato de acuerdo con una de las reivindicaciones anteriores,
    10 en el que el espectro de señal de audio modificado es un espectro de MDCT, que comprende coeficientes de MDCT, y en el que en la unidad de conversión de espectrotiempo (140) está configurada para convertir el espectro de MDCT desde un dominio de MDCT al dominio de tiempo convirtiendo al menos algunos de los coeficientes del espectro de señal de audio decodificado al dominio de tiempo.
  8. 10. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que el mezclador (160) está configurado para mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo añadiendo la señal de conversión de dominio de tiempo a la señal de oscilador de dominio de tiempo en el dominio de tiempo.
    20 11. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que la señal de oscilador de dominio de tiempo generada mediante el oscilador controlable (150) es una primera señal de oscilador de dominio de tiempo, en el que el aparato comprende adicionalmente uno o más osciladores controlables (252, 254, 256) adicionales para generar una o más señales de oscilador de dominio de tiempo adicionales, en el que cada uno del uno o más
    25 osciladores controlables (252, 254, 256) adicionales está configurado para generar una de la una o más señales de oscilador de dominio de tiempo adicionales, en el que cada uno de los osciladores controlables (252, 254, 256) adicionales está controlado mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes, y en el que el mezclador (160) está configurado para mezclar la primera señal de oscilador de dominio de tiempo, la
    30 una o más señales de oscilador de dominio de tiempo adicionales y la señal de conversión de dominio de tiempo para obtener la señal de salida de audio.
  9. 12. Un aparato para codificar un espectro de entrada de señal de audio de una señal de audio, comprendiendo el espectro de entrada de señal de audio una pluralidad de coeficientes espectrales, en el que cada uno de los
    35 coeficientes espectrales tiene una localización espectral en el espectro de entrada de señal de audio, un valor espectral, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de entrada de señal de audio de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene al menos uno de uno
    o más predecesores y uno o más sucesores, en el que cada uno de los predecesores de dicho coeficiente espectral
    40 es uno de los coeficientes espectrales que precede a dicho coeficiente espectral en la secuencia, en el que cada uno de los sucesores de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede a dicho coeficiente espectral en la secuencia, y en el que el aparato comprende:
    un determinador de extremos (410) para determinar uno o más coeficientes de extremo,
    45 un modificador de espectro (420) para modificar el espectro de entrada de señal de audio para obtener un espectro de señal de audio modificado ajustando el valor espectral de al menos uno de los predecesores o al menos uno de los sucesores de al menos uno de los coeficientes de extremo a un valor predefinido, en el que el modificador de espectro (420) está configurado para no establecer los valores espectrales del uno o más coeficientes de extremo al valor predefinido, o está configurado para sustituir al menos uno del uno o más
    50 coeficientes de extremo mediante un pseudo coeficiente, en el que el valor espectral del pseudo coeficiente es diferente del valor predefinido, una unidad de procesamiento (430) para procesar el espectro de señal de audio modificado para obtener un espectro de señal de audio codificado, y un generador de información lateral (440) para generar y transmitir información lateral, en el que el generador de
    55 información lateral (440) está configurado para localizar uno o más pseudo coeficientes candidatos en el espectro de entrada de señal de audio modificado generado mediante el modificador de espectro (420), en el que el generador de información lateral (440) está configurado para seleccionar al menos uno de los pseudo coeficientes candidatos como candidatos seleccionados, y en el que el generador de información lateral (440) está configurado para generar la información lateral de modo que la información lateral indica los candidatos
    60 seleccionados como los pseudo coeficientes, en el que el determinador de extremos (410) está configurado para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor espectral del cual es mayor que el valor espectral de al menos uno de sus predecesores y el valor espectral del cual es mayor que el valor espectral de al menos uno de sus sucesores, o
    en el que cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, en el que el determinador de extremos (410) está configurado para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor de comparación del cual es mayor que el valor de comparación de al menos uno de sus
    5 predecesores y el valor de comparación del cual es mayor que el valor de comparación de al menos uno de sus sucesores.
  10. 13. Un aparato de acuerdo con la reivindicación 12, en el que el generador de información lateral (440) está
    configurado para transmitir el tamaño de la información lateral. 10
  11. 14. Un aparato de acuerdo con la reivindicación 12 o 13, en el que el modificador de espectro (420) está configurado para modificar el espectro de entrada de señal de audio de modo que los valores espectrales de al menos algunos de los coeficientes espectrales del espectro de entrada de señal de audio se dejan sin modificar en el espectro de señal de audio modificado.
  12. 15. Un aparato de acuerdo con una de las reivindicaciones 12 a 14, en el que cada uno de los coeficientes espectrales tiene al menos uno de un predecesor inmediato como uno de sus predecesores y un sucesor inmediato como uno de sus sucesores, en el que el predecesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que precede inmediatamente a dicho coeficiente
    20 espectral en la secuencia, en el que el sucesor inmediato de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede inmediatamente a dicho coeficiente espectral en la secuencia, en el que el modificador de espectro (420) está configurado para modificar el espectro de entrada de señal de audio para obtener el espectro de señal de audio modificado ajustando el valor espectral del predecesor inmediato o el sucesor inmediato de al menos uno de los coeficientes de extremo al valor predefinido, en el que el modificador de
    25 espectro (420) está configurado para no establecer los valores espectrales del uno o más coeficientes de extremo al valor predefinido, o está configurado para sustituir al menos uno del uno o más coeficientes de extremo mediante un pseudo coeficiente, en el que el valor espectral del pseudo coeficiente es diferente del valor predefinido, y en el que el determinador de extremos (410) está configurado para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor espectral del
    30 cual es mayor que el valor espectral de su predecesor inmediato y el valor espectral del cual es mayor que el valor espectral de su sucesor inmediato, o en el que cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, en el que el determinador de extremos (410) está configurado para determinar el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor de comparación del cual es mayor que el valor de comparación de su
    35 predecesor inmediato y el valor de comparación del cual es mayor que el valor de comparación de su sucesor inmediato.
  13. 16. Un aparato de acuerdo con la reivindicación 15, en el que el determinador de extremos (410) está configurado para determinar uno o más coeficientes mínimos, de
    40 modo que cada uno del uno o más coeficientes mínimos es uno de los coeficientes espectrales el valor espectral del cual es más pequeño que el valor espectral de uno de sus predecesores y el valor espectral del cual es más pequeño que el valor espectral de uno de sus sucesores, o en el que cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, en el que el determinador de extremos (410) está configurado para determinar el uno o más coeficientes mínimos, de modo que cada uno de los coeficientes mínimos
    45 es uno de los coeficientes espectrales el valor de comparación del cual es más pequeño que el valor de comparación de uno de sus predecesores y el valor de comparación del cual es más pequeño que el valor de comparación de uno de sus sucesores, y en el que el modificador de espectro (420) está configurado para determinar un valor de representación basándose en los valores espectrales o los valores de comparación de uno o más de los coeficientes de extremos y uno o más
    50 de los coeficientes mínimos, de modo que el valor de representación es diferente del valor predefinido, y en el que el modificador de espectro (420) está configurado para cambiar el valor espectral de uno de los coeficientes del espectro de entrada de señal de audio ajustando dicho valor espectral al valor de representación.
  14. 17. Un aparato de acuerdo con la reivindicación 16,
    55 en el que el modificador de espectro (420) está configurado para determinar, si una diferencia de valor entre uno del valor de comparación o del valor espectral de uno de los coeficientes de extremo es más pequeño que un valor umbral, y en el que el modificador de espectro (420) está configurado para modificar el espectro de entrada de señal de audio de modo que los valores espectrales de al menos algunos de los coeficientes espectrales del espectro de entrada de
    60 señal de audio se dejan sin modificar en el espectro de señal de audio modificado dependiendo de si la diferencia de valor es más pequeña que el valor umbral.
  15. 18. Un aparato de acuerdo con la reivindicación 16 o 17, en el que el determinador de extremos (410) está configurado para determinar una o más subsecuencias de la
    secuencia de valores espectrales, de modo que cada una de las subsecuencias comprende una pluralidad de coeficientes espectrales posteriores al espectro de entrada de señal de audio, estando secuencialmente ordenados los coeficientes espectrales posteriores en la subsecuencia de acuerdo con su posición espectral, en el que cada una de las subsecuencias tiene un primer elemento que es el primero en dicha subsecuencia secuencialmente
    5 ordenada y un último elemento que es el último en dicha subsecuencia secuencialmente ordenada, en el que cada una de las subsecuencias comprende exactamente dos de los coeficientes mínimos y exactamente uno de los coeficientes de extremo, siendo uno de los coeficientes mínimos el primer elemento de la subsecuencia, siendo el otro de los coeficientes mínimos el último elemento de la subsecuencia, y en el que el modificador de espectro (420) está configurado para determinar el valor de representación basándose
    10 en los valores espectrales o los valores de comparación de los coeficientes de una de las subsecuencias, y en el que el modificador de espectro (420) está configurado para cambiar el valor espectral de uno de los coeficientes de dicha subsecuencia ajustando dicho valor espectral al valor de representación.
  16. 19. Un aparato de acuerdo con la reivindicación 18, en el que el modificador de espectro (420) está configurado para
    15 determinar el valor de representación determinando una suma de los cuadrados de los valores de comparación de los coeficientes de dicha una de la subsecuencias.
  17. 20. Un aparato de acuerdo con la reivindicación 18 o 19, en el que el determinador de extremos (410) está configurado para determinar un coeficiente de centro de gravedad
    20 determinando el producto del valor de comparación y el valor de localización para cada coeficiente espectral de la subsecuencia para obtener una pluralidad de coeficientes ponderados, totalizando los coeficientes ponderados para obtener una primera suma, totalizando los valores de comparación de todos los coeficientes espectrales de la subsecuencia para obtener una segunda suma; dividiendo la primera suma por la segunda suma para obtener un resultado intermedio; y aplicando redondeo al redondeo más cercano en el resultado intermedio para obtener el
    25 coeficiente del centro de gravedad, y en el que el modificador de espectro (420) está configurado para establecer los valores espectrales de todos los coeficientes espectrales de la subsecuencia, que no son el coeficiente del centro de gravedad al valor predefinido, o en el que el determinador de extremos (410) está configurado para determinar un coeficiente de centro de gravedad determinando el producto del valor espectral y el valor de localización para cada coeficiente espectral de la sub
    30 secuencia para obtener una pluralidad de coeficientes ponderados, totalizando los coeficientes ponderados para obtener una primera suma, totalizando los valores espectrales de todos los coeficientes espectrales de la subsecuencia para obtener una segunda suma; dividiendo la primera suma por la segunda suma para obtener un resultado intermedio; y aplicando redondeo al redondeo más cercano en el resultado intermedio para obtener el coeficiente del centro de gravedad, y en el que el modificador de espectro (420) está configurado para establecer los
    35 valores espectrales de todos los coeficientes espectrales de la subsecuencia, que no son el coeficiente del centro de gravedad al valor predefinido.
  18. 21. Un aparato de acuerdo con una de las reivindicaciones 12 a 20, en el que el valor predefinido es cero.
    40 22. Un aparato de acuerdo con una de las reivindicaciones 12 a 21, en el que el valor de comparación de cada coeficiente espectral es un valor cuadrado de un coeficiente adicional de un espectro adicional que resulta de una transformación de conservación de energía de la señal de audio.
  19. 23. Un aparato de acuerdo con una de las reivindicaciones 12 a 22, en el que el valor de comparación de cada
    45 coeficiente espectral es un valor de amplitud de un coeficiente adicional de un espectro adicional que resulta de una transformación de conservación de energía de la señal de audio.
  20. 24. Un aparato de acuerdo con una de las reivindicaciones 12 a 23, en el que el espectro adicional es un espectro
    de la Transformada Modificada Discreta del Coseno Compleja, y en el que la transformación de conservación de 50 energía es una Transformada Modificada Discreta del Coseno Compleja.
  21. 25. Un aparato de acuerdo con una de las reivindicaciones 12 a 24, en el que el modificador de espectro (420) está configurado para recibir información de ajuste fino, en el que los coeficientes espectrales del espectro de entrada de señal de audio son valores con signo, comprendiendo cada uno
    55 un componente de signo, en el que el modificador de espectro (420) está configurado para establecer el componente de signo del valor espectral de uno del uno o más coeficientes de extremo o del pseudo coeficiente a un primer valor de signo, cuando la información de ajuste fino está en un primer estado de ajuste fino para obtener el espectro de señal de audio modificado, y
    60 en el que el modificador de espectro (420) está configurado para establecer el componente de signo del valor espectral de uno del uno o más coeficientes de extremo o del pseudo coeficiente a un segundo valor de signo diferente, cuando la información de ajuste fino está en un segundo estado de ajuste fino diferente para obtener el espectro de señal de audio modificado.
  22. 26.
    Un aparato de acuerdo con una de las reivindicaciones 12 a 25, en el que el espectro de entrada de señal de audio es un espectro de MDCT que comprende coeficientes de MDCT.
  23. 27.
    Un aparato de acuerdo con una de las reivindicaciones 12 a 26,
    5 en el que la unidad de procesamiento (430) está configurada para cuantificar el espectro de señal de audio modificado para obtener un espectro de señal de audio cuantificado, en el que la unidad de procesamiento (430) está configurada adicionalmente para procesar el espectro de señal de audio cuantificado para obtener un espectro de señal de audio codificado, en el que la unidad de procesamiento (430) está configurada adicionalmente para generar información lateral que
    10 indica únicamente aquellos coeficientes espectrales del espectro de señal de audio cuantificado que tienen un predecesor inmediato el valor espectral del cual es igual al valor predefinido y un sucesor inmediato, el valor espectral del cual es igual al valor predefinido, si dicho coeficiente es uno de los coeficientes de extremo, en el que el predecesor inmediato de dicho coeficiente espectral es otro coeficiente espectral que precede inmediatamente a dicho coeficiente espectral en el espectro de señal de audio cuantificado, y en el que el sucesor
    15 inmediato de dicho coeficiente espectral es otro coeficiente espectral que sucede inmediatamente a dicho coeficiente espectral en el espectro de señal de audio cuantificado.
  24. 28. Un aparato de acuerdo con una de las reivindicaciones 12 a 27, en el que el modificador de espectro (420) está configurado para sustituir uno de los coeficientes de extremo mediante un pseudo coeficiente que tiene un valor
    20 espectral obtenido desde el valor espectral o el valor de comparación de dicho coeficiente de extremo, desde el valor espectral o el valor de comparación de dicho coeficiente de extremo de uno de los predecesores de dicho coeficiente de extremo o desde el valor espectral o el valor de comparación de dicho coeficiente de extremo de uno de los sucesores de dicho coeficiente de extremo.
    25 29. Un método para generar una señal de salida de audio basándose en un espectro de señal de audio codificado, en el que cada uno de los coeficientes espectrales tiene una localización espectral en el espectro de señal de audio codificado y un valor espectral, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de señal de audio codificado de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales, y en el que el método comprende:
    30 procesar el espectro de señal de audio codificado para obtener un espectro de señal de audio decodificado comprendiendo el espectro de señal de audio decodificado una pluralidad de coeficientes espectrales, determinar uno o más pseudo coeficientes del espectro de señal de audio decodificado, teniendo cada uno de los pseudo coeficientes una localización espectral y un valor espectral,
    35 ajustar el uno o más pseudo coeficientes a un valor predefinido para obtener un espectro de señal de audio modificado, convertir el espectro de señal de audio modificado a un dominio de tiempo para obtener una señal de conversión de dominio de tiempo, generar una señal de oscilador de dominio de tiempo mediante un oscilador controlable que está controlado mediante la localización espectral y el valor espectral de al menos uno del uno o más pseudo coeficientes, y
    40 mezclar la señal de conversión de dominio de tiempo y la señal de oscilador de dominio de tiempo para obtener la señal de salida de audio.
  25. 30. Un método para codificar un espectro de entrada de señal de audio, comprendiendo el espectro de entrada de señal de audio una pluralidad de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene 45 una localización espectral en el espectro de entrada de señal de audio, un valor espectral y un valor de comparación, en el que los coeficientes espectrales están ordenados secuencialmente de acuerdo con su localización espectral en el espectro de entrada de señal de audio de modo que los coeficientes espectrales forman una secuencia de coeficientes espectrales, en el que cada uno de los coeficientes espectrales tiene al menos uno de uno o más predecesores y uno o más sucesores, en el que cada uno de los predecesores de dicho coeficiente
    50 espectral es uno de los coeficientes espectrales que precede a dicho coeficiente espectral en la secuencia, en el que cada uno de los sucesores de dicho coeficiente espectral es uno de los coeficientes espectrales que sucede a dicho coeficiente espectral en la secuencia, y en el que el método comprende:
    determinar uno o más coeficientes de extremo,
    55 modificar el espectro de entrada de señal de audio para obtener un espectro de señal de audio modificado ajustando el valor espectral de al menos uno de los predecesores o al menos uno de los sucesores de al menos uno de los coeficientes de extremo a un valor predefinido, en el que modificar el espectro de entrada de señal de audio se realiza no ajustando los valores espectrales del uno o más coeficientes de extremo al valor predefinido,
    o sustituyendo al menos uno del uno o más coeficientes de extremo mediante un pseudo coeficiente, en el que el
    60 valor espectral del pseudo coeficiente es diferente del valor predefinido, procesar el espectro de señal de audio modificado para obtener un espectro de señal de audio codificado, y generar y transmitir información lateral, en el que la información lateral se genera localizando uno o más pseudo coeficientes candidatos en el espectro de entrada de señal de audio modificado, en el que la información lateral se genera seleccionando al menos uno de los pseudo coeficientes candidatos como candidatos seleccionados, y
    en el que la información lateral se genera de modo que la información lateral indica los candidatos seleccionados como los pseudo coeficientes, en el que se determinan el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor espectral del cual es mayor que el valor espectral de al
    5 menos uno de sus predecesores y el valor espectral del cual es mayor que el valor espectral de al menos uno de sus sucesores, o en el que cada uno de los coeficientes espectrales tiene un valor de comparación asociado con dicho coeficiente espectral, en el que se determinan el uno o más coeficientes de extremo, de modo que cada uno de los coeficientes de extremo es uno de los coeficientes espectrales el valor de comparación del cual es mayor que el
    10 valor de comparación de al menos uno de sus predecesores y el valor de comparación del cual es mayor que el valor de comparación de al menos uno de sus sucesores.
  26. 31. Un programa informático para implementar el método de la reivindicación 29 o 30 cuando se ejecuta en un
    ordenador o procesador de señal. 15
ES12818512.1T 2012-01-20 2012-12-21 Aparato y método para codificación y decodificación de audio que emplea sustitución sinusoidal Active ES2545053T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261588998P 2012-01-20 2012-01-20
US201261588998P 2012-01-20
PCT/EP2012/076746 WO2013107602A1 (en) 2012-01-20 2012-12-21 Apparatus and method for audio encoding and decoding employing sinusoidal substitution

Publications (1)

Publication Number Publication Date
ES2545053T3 true ES2545053T3 (es) 2015-09-08

Family

ID=47603553

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12818512.1T Active ES2545053T3 (es) 2012-01-20 2012-12-21 Aparato y método para codificación y decodificación de audio que emplea sustitución sinusoidal

Country Status (19)

Country Link
US (1) US9343074B2 (es)
EP (1) EP2673776B1 (es)
JP (1) JP5600822B2 (es)
KR (1) KR101672025B1 (es)
CN (1) CN103493130B (es)
AR (1) AR089772A1 (es)
AU (1) AU2012366843B2 (es)
BR (1) BR112013026452B1 (es)
CA (2) CA2848275C (es)
ES (1) ES2545053T3 (es)
HK (1) HK1192640A1 (es)
MX (1) MX350686B (es)
MY (1) MY157163A (es)
PL (1) PL2673776T3 (es)
RU (1) RU2562383C2 (es)
SG (1) SG194706A1 (es)
TW (1) TWI503815B (es)
WO (1) WO2013107602A1 (es)
ZA (1) ZA201308073B (es)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105122357B (zh) * 2013-01-29 2019-04-23 弗劳恩霍夫应用研究促进协会 频域中基于lpc进行编码的低频增强
KR101757338B1 (ko) 2013-06-21 2017-07-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 신호의 대체 프레임에 대한 스펙트럼 계수들을 획득하기 위한 방법과 장치, 오디오 디코더, 오디오 수신기 및 오디오 신호들의 전송을 위한 시스템
CN104934032B (zh) * 2014-03-17 2019-04-05 华为技术有限公司 根据频域能量对语音信号进行处理的方法和装置
US9672843B2 (en) 2014-05-29 2017-06-06 Apple Inc. Apparatus and method for improving an audio signal in the spectral domain
EP3067889A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
CN107924683B (zh) * 2015-10-15 2021-03-30 华为技术有限公司 正弦编码和解码的方法和装置
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019195269A1 (en) * 2018-04-04 2019-10-10 Harman International Industries, Incorporated Dynamic audio upmixer parameters for simulating natural spatial variations
US11031024B2 (en) 2019-03-14 2021-06-08 Boomcloud 360, Inc. Spatially aware multiband compression system with priority
TWI789577B (zh) * 2020-04-01 2023-01-11 同響科技股份有限公司 音訊資料重建方法及系統

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0215915A4 (en) * 1985-03-18 1987-11-25 Massachusetts Inst Technology TREATMENT OF ACOUSTIC WAVE SHAPES.
US4703357A (en) * 1985-12-24 1987-10-27 Rca Corporation Adaptive television deghosting system
US4686570A (en) * 1985-12-24 1987-08-11 Rca Corporation Analog-to-digital converter as for an adaptive television deghosting system
DE8706928U1 (es) * 1987-05-14 1987-08-06 Ant Nachrichtentechnik Gmbh, 7150 Backnang, De
CA2066851C (en) * 1991-06-13 1996-08-06 Edwin A. Kelley Multiple user digital receiver apparatus and method with combined multiple frequency channels
JP3241098B2 (ja) * 1992-06-12 2001-12-25 株式会社東芝 多方式対応の受信装置
EP0638869B1 (de) * 1993-08-13 1995-06-07 Siemens Aktiengesellschaft Verfahren zur hochauflösenden Spektralanalyse bei mehrkanaligen Beobachtungen
US5640416A (en) * 1995-06-07 1997-06-17 Comsat Corporation Digital downconverter/despreader for direct sequence spread spectrum communications system
US6356555B1 (en) * 1995-08-25 2002-03-12 Terayon Communications Systems, Inc. Apparatus and method for digital data transmission using orthogonal codes
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
US6606129B1 (en) * 1998-12-04 2003-08-12 Samsung Electronics Co., Ltd. Digital filtering of DTV I-F signal to avoid low-end boost of the baseband signal resulting from in-phase synchrodyne
US6665638B1 (en) * 2000-04-17 2003-12-16 At&T Corp. Adaptive short-term post-filters for speech coders
JP2002182695A (ja) * 2000-12-14 2002-06-26 Matsushita Electric Ind Co Ltd 高能率符号化方法及び装置
KR100448892B1 (ko) * 2002-06-04 2004-09-18 한국전자통신연구원 고전력 증폭기의 비선형 왜곡 보상을 위한 전치 왜곡 장치및 그 방법
KR20050021484A (ko) * 2002-07-16 2005-03-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
EP1527442B1 (en) * 2002-08-01 2006-04-05 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and audio decoding method based on spectral band replication
US20040083110A1 (en) * 2002-10-23 2004-04-29 Nokia Corporation Packet loss recovery based on music signal classification and mixing
KR100467617B1 (ko) * 2002-10-30 2005-01-24 삼성전자주식회사 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
CN100349207C (zh) * 2003-01-14 2007-11-14 北京阜国数字技术有限公司 高频耦合的伪小波5声道音频编/解码方法
DE10345995B4 (de) * 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
JP2006311353A (ja) * 2005-04-28 2006-11-09 Samsung Electronics Co Ltd ダウンコンバータおよびアップコンバータ
JP5032314B2 (ja) * 2005-06-23 2012-09-26 パナソニック株式会社 オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
JP2009524101A (ja) * 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
JP4454604B2 (ja) * 2006-06-19 2010-04-21 シャープ株式会社 信号処理方法、信号処理装置及びプログラム
KR101299155B1 (ko) * 2006-12-29 2013-08-22 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법
JP4594942B2 (ja) 2007-01-16 2010-12-08 コベルコ建機株式会社 建設機械の冷却構造
WO2008114075A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation An encoder
ES2358786T3 (es) 2007-06-08 2011-05-13 Dolby Laboratories Licensing Corporation Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial.
BRPI0816557B1 (pt) * 2007-10-17 2020-02-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Codificação de áudio usando upmix
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
CA2821035A1 (en) * 2008-03-10 2009-09-17 Sascha Disch Device and method for manipulating an audio signal having a transient event
EP3296992B1 (en) * 2008-03-20 2021-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for modifying a parameterized representation
KR101613975B1 (ko) 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5587061B2 (ja) 2009-09-30 2014-09-10 三洋電機株式会社 抵抗溶接用通電ブロック、この通電ブロックを用いた密閉電池の製造方法及び密閉電池
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US20120212375A1 (en) * 2011-02-22 2012-08-23 Depree Iv William Frederick Quantum broadband antenna

Also Published As

Publication number Publication date
RU2562383C2 (ru) 2015-09-10
JP5600822B2 (ja) 2014-10-08
TW201346891A (zh) 2013-11-16
WO2013107602A1 (en) 2013-07-25
US20140074486A1 (en) 2014-03-13
EP2673776B1 (en) 2015-06-17
KR20130137235A (ko) 2013-12-16
US9343074B2 (en) 2016-05-17
CN103493130B (zh) 2016-05-18
AU2012366843A1 (en) 2013-10-10
MX350686B (es) 2017-09-13
AR089772A1 (es) 2014-09-17
ZA201308073B (en) 2015-01-28
AU2012366843B2 (en) 2015-08-06
KR101672025B1 (ko) 2016-11-02
CA2831176C (en) 2014-12-09
JP2014517932A (ja) 2014-07-24
RU2013148123A (ru) 2015-05-10
SG194706A1 (en) 2013-12-30
CN103493130A (zh) 2014-01-01
CA2831176A1 (en) 2013-07-25
TWI503815B (zh) 2015-10-11
HK1192640A1 (en) 2014-08-22
PL2673776T3 (pl) 2015-12-31
BR112013026452A2 (pt) 2017-06-27
BR112013026452B1 (pt) 2021-02-17
MY157163A (en) 2016-05-13
EP2673776A1 (en) 2013-12-18
CA2848275C (en) 2016-03-08
MX2013012409A (es) 2013-12-06
CA2848275A1 (en) 2014-04-03

Similar Documents

Publication Publication Date Title
ES2545053T3 (es) Aparato y método para codificación y decodificación de audio que emplea sustitución sinusoidal
AU2018250490B2 (en) Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
ES2960089T3 (es) Procedimiento y aparato para la ocultación de errores de trama y procedimiento y aparato para la decodificación de audio
WO2014115225A1 (ja) 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法
US9489962B2 (en) Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method