ES2748939T3 - Codificador y descodificador de audio - Google Patents

Codificador y descodificador de audio Download PDF

Info

Publication number
ES2748939T3
ES2748939T3 ES16203268T ES16203268T ES2748939T3 ES 2748939 T3 ES2748939 T3 ES 2748939T3 ES 16203268 T ES16203268 T ES 16203268T ES 16203268 T ES16203268 T ES 16203268T ES 2748939 T3 ES2748939 T3 ES 2748939T3
Authority
ES
Spain
Prior art keywords
signals
frequency
encoded
interleaving
upmix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16203268T
Other languages
English (en)
Inventor
Kristofer Kjoerling
Heiko Purnhagen
Harald Mundt
Karl Jonas Roeden
Leif Sehlstrom
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2748939T3 publication Critical patent/ES2748939T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)

Abstract

Un procedimiento en un descodificador de un sistema de procesamiento de audio multicanal, que comprende las etapas de: recibir M señales (404) de mezcla ascendente que comprenden coeficientes espectrales correspondientes a las frecuencias superiores a una primera frecuencias de cruce ky, en el que las M señales de mezcla ascendente son el resultado de una mezcla ascendente de N señales de mezcla descendente extendidas en frecuencia en M señales de mezcla ascendente, correspondiendo cada una de las M señales de mezcla ascendente a uno respectivo de M canales codificados, en donde 1 < N < M; recibir una señal (710) codificada en forma de onda que comprende coeficientes espectrales correspondientes a un intervalo de frecuencias que parte de la primera frecuencia de cruce ky; recibir M señales (210) codificadas en forma de onda que comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce, correspondiendo cada una de las M señales codificadas en forma de onda a uno respectivo de los M canales codificados; y entrelazar la señal (710) codificada en forma de onda con una de las M señales de mezcla ascendente de tal manera que se obtiene una versión entrelazada de dicha una de las M señales de mezcla ascendente, caracterizado por que comprende además: recibir una señal de control que indica teselas de tiempo/frecuencia para las cuales la señal codificada en forma de onda se ha de entrelazar con una de las M señales de mezcla ascendente, en el que la señal de control comprende un primer vector que indica intervalos de frecuencias de las teselas de tiempo/frecuencia, y un segundo vector que indica intervalos de tiempo de las teselas de tiempo/frecuencia, y en el que el entrelazado es realizado bajo el control de la señal de control de tal manera que el entrelazado se realiza en las teselas de tiempo/frecuencia indicadas por la señal de control; y combinar las M señales codificadas en forma de onda con las M señales de mezcla ascendente antes del entrelazado, después del entrelazado o en una etapa combinada con el entrelazado.

Description

DESCRIPCIÓN
Codificador y descodificador de audio
Campo técnico
La descripción de la presente memoria se refiere, en general, a codificación de audio multicanal. En particular, se refiere a un codificador y un descodificador para codificación híbrida, que comprende codificación paramétrica y codificación multicanal discreta.
Antecedentes
En la codificación de audio multicanal convencional, los posibles esquemas de codificación incluyen codificación multicanal discreta o codificación paramétrica, tal como MPEG Surround. El esquema utilizado depende del ancho de banda del sistema de audio. Es sabido que los procedimientos de codificación paramétrica son escalables y eficientes en términos de calidad de escucha, lo que los hace particularmente atractivos en aplicaciones de baja tasa de bits. En aplicaciones de alta tasa de bits, se utiliza a menudo codificación multicanal discreta. Los formatos existentes de distribución o procesamiento y las técnicas de codificación asociadas se pueden mejorar desde el punto de vista de su eficiencia de ancho de banda, especialmente en aplicaciones con una tasa de bits comprendida entre una tasa de bits baja y una tasa de bits alta.
La memoria US7292901 (Kroon et al.) se refiere a un procedimiento de codificación híbrida en el que se forma una señal de audio híbrida a partir de, por lo menos, un componente espectral sometido a mezcla descendente y por lo menos un componente espectral no mezclado. El procedimiento presentado en esta solicitud puede aumentar la capacidad de una aplicación que tiene una determinada tasa de bits, pero pueden ser necesarias otras mejoras para aumentar adicionalmente la eficiencia de un sistema de procesamiento de audio.
Un ejemplo de la técnica anterior se puede encontrar en el documento titulado “Text of ISO/IEC 23003-1:200x MPEG Surround” procedente de la reunión 74 de MPEG de 2005 (número N7530), que describe un descodificador de audio espacial en el que señales de mezcla descendente recibidas, son procesadas para formar señales de salida basadas en parámetros espaciales. El procesamiento está definido por dos multiplicaciones de matriz, formando la primera la entrada para unidades de descorrelación y formando la segunda las señales de salida basadas en las señales de mezcla descendente y la salida desde los descorrelacionadores. La salida desde los descorrelacionadores es opcionalmente sustituida por señales residuales para ciertas regiones de frecuencia.
Breve descripción de los dibujos
Se describirán a continuación realizaciones a modo de ejemplo haciendo referencia a los dibujos adjuntos, en los cuales:
la figura 1 es un diagrama de bloques generalizado de un sistema de descodificación de acuerdo con una realización a modo de ejemplo;
la figura 2 muestra una primera parte del sistema de descodificación de la figura 1;
la figura 3 muestra una segunda parte del sistema de descodificación de la figura 1;
la figura 4 muestra una tercera parte del sistema de descodificación de la figura 1;
la figura 5 es un diagrama de bloques generalizado de un sistema de codificación de acuerdo con una realización a modo de ejemplo;
la figura 6 es un diagrama de bloques generalizado de un sistema de descodificación de acuerdo con una realización a modo de ejemplo;
la figura 7 muestra una tercera parte del sistema de descodificación de la figura 6; y
la figura 8 es un diagrama de bloques generalizado de un sistema de codificación de acuerdo con una realización a modo de ejemplo.
Todas las figuras son esquemáticas y generalmente muestran solo partes que son necesarias para explicar la descripción, mientras que otras partes pueden estar omitidas o simplemente propuestas. Salvo que se indique lo contrario, los numerales de referencia similares se refieren a partes similares en las diferentes figuras.
Todas las apariciones que siguen de la palabra “realización(es)”, si se refieren a combinaciones de características diferentes de las definidas por las reivindicaciones independientes, se refieren a ejemplos que fueron originalmente presentados, pero que no representan realizaciones de la invención que ahora se reivindica; estos ejemplos todavía se muestran solo con fines ilustrativos.
Descripción detallada
Visión general - Descodificador
Tal como se utiliza en la presente memoria, una señal de audio puede ser una señal de audio pura, una parte de audio de una señal audiovisual o una señal multimedia, o cualquiera de estas en combinación con metadatos.
Tal como se utiliza en la presente memoria, una mezcla descendente de una serie de señales significa combinar la serie de señales, por ejemplo formando combinaciones lineales, de tal modo que se obtiene un número menor de señales. La operación inversa a la mezcla descendente se denomina mezcla ascendente, es decir, llevar a cabo una operación sobre un número menor de señales para obtener un número mayor de señales.
De acuerdo con un primer aspecto, las realizaciones a modo de ejemplo proponen procedimientos, dispositivos y productos de programa informático, para reconstruir una señal de audio multicanal en base una señal de entrada. Los procedimientos, dispositivos y productos de programa informático propuestos pueden tener, en general, las mismas características y ventajas.
De acuerdo con realizaciones a modo de ejemplo, se proporciona un descodificador para un sistema de procesamiento de audio multicanal para la reconstrucción de M canales codificados, siendo M > 2, El descodificador comprende una primera fase de recepción configurada para recibir N señales de mezcla descendente codificadas en forma de onda que comprenden coeficientes espectrales correspondientes a frecuencias entre una primera y una segunda frecuencias de cruce, en donde 1< N < M.
El descodificador comprende además una segunda fase de recepción configurada para recibir M señales codificadas en forma de onda que comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce, correspondiendo cada una de las M señales codificadas en forma de onda a uno respectivo de los M canales codificados.
El descodificador comprende además una fase de mezcla descendente aguas abajo de la segunda fase de recepción, configurada para la mezcla descendente de las M señales codificadas en forma de onda en N señales de mezcla descendente que comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce.
El descodificador comprende además una primera fase de combinación aguas abajo de la primera fase de recepción y la fase de mezcla descendente configurada para combinar cada una de las N señales de mezcla descendente recibidas por la primera fase de recepción con una correspondiente de las N señales de mezcla descendente desde la fase de mezcla descendente en N señales de mezcla descendente combinadas.
El descodificador comprende además una fase de reconstrucción de alta frecuencia aguas abajo de la primera fase de combinación, configurada para extender cada una de las N señales de mezcla descendente combinadas desde la fase de combinación a un intervalo de frecuencias por encima de la segunda frecuencia de cruce realizando reconstrucción de alta frecuencia.
El descodificador comprende además una fase de mezcla ascendente aguas abajo de la fase de reconstrucción de alta frecuencia, configurada para realizar una mezcla ascendente paramétrica de las N señales extendidas en frecuencia de la fase de reconstrucción de alta frecuencia en M señales de mezcla ascendente que comprenden coeficientes espectrales correspondientes a frecuencias por encima de la primera frecuencia de cruce, correspondiendo cada una de las M señales de mezcla ascendente a uno de los M canales codificados.
El descodificador comprende además una segunda fase de combinación aguas abajo de la fase de mezcla ascendente y la segunda fase de recepción configurada para combinar las M señales de mezcla ascendente de la fase de mezcla ascendente con las M señales codificadas en forma de onda, recibidas por la segunda fase de recepción.
Las M señales codificadas en forma de onda son puramente señales codificadas en forma de onda sin señales paramétricas mezcladas, es decir, son una representación discreta sin mezcla descendente, de la señal de audio multicanal procesada. Una ventaja de tener las frecuencias menores representadas en estas señales codificadas en forma de onda puede ser que el oído humano es más sensible a la parte de la señal de audio que tiene bajas frecuencias. Al codificar esta parte con una calidad mejor, puede aumentar la apreciación global del audio descodificado.
Una ventaja de tener por lo menos dos señales de mezcla descendente es que esta realización proporciona una mayor dimensionalidad de las señales de mezcla descendente comparada con sistemas con solamente un canal de mezcla descendente. De acuerdo con esta realización, se puede proporcionar por lo tanto una mejor calidad del audio descodificado, que puede superar la ganancia en tasa de bits proporcionada por un sistema de señales de mezcla descendente.
Una ventaja de utilizar codificación híbrida que comprende codificación de mezcla descendente paramétrica y multicanal discreta es que esto puede mejorar la calidad de la señal de audio descodificada para ciertas tasas de bits en comparación con utilizar un enfoque de codificación paramétrica convencional, es decir MPEG Surround con HE-AAC. A tasas de bits en torno a 72 kilobits por segundo (kbps), el modelo de codificación paramétrica convencional se puede saturar, es decir, la calidad de la señal de audio descodificada está limitada por las deficiencias del modelo paramétrico y no por la falta de bits para codificar. Por consiguiente, para tasas de bits a partir de aproximadamente 72 kbps, puede ser más beneficioso utilizar bits en la codificación en forma de onda de frecuencias menores de manera discreta. Al mismo tiempo, el enfoque híbrido de utilización de una codificación de mezcla descendente paramétrica y multicanal discreta es que puede mejorar la calidad del audio descodificado para ciertas tasas de bits, por ejemplo a 128 kbps o menos, en comparación con utilizar un enfoque en el que se utilicen todos los bits en la codificación en forma de onda de frecuencias menores, y con utilizar replicación de banda espectral (SBR, spectral band replication) para las frecuencias restantes.
Una ventaja de tener N señales de mezcla descendente codificadas en forma de onda que comprenden solamente datos espectrales correspondientes a frecuencias entre la primera frecuencia de cruce y una segunda frecuencia de cruce, es que se puede reducir la tasa de transmisión de bits requerida para el sistema de procesamiento de señales de audio. Alternativamente, los bits preservados al tener una señal de mezcla descendente filtrada en paso banda pueden ser utilizados en codificación en forma de onda de frecuencias menores, por ejemplo, puede ser mayor la frecuencia de muestreo para esas frecuencias o se puede aumentar la primera frecuencia de cruce.
Dado que, tal como se ha mencionado anteriormente, el oído humano es más sensible a la parte de la señal de audio que tiene frecuencias bajas, las frecuencias altas, como la parte de la señal de audio que tiene frecuencias por encima de la segunda frecuencia de cruce, se pueden recrear mediante la reconstrucción de alta frecuencia sin reducir la calidad del audio percibida de la señal de audio descodificada.
Una ventaja adicional de la presente realización puede ser que, dado que la mezcla ascendente paramétrica llevada a cabo en la fase de mezcla ascendente opera solamente sobre coeficientes espectrales correspondientes a frecuencias que están por encima de la primera frecuencia de cruce, se reduce la complejidad de la mezcla ascendente.
De acuerdo con otra realización, la combinación llevada a cabo en la primera fase de combinación, en la que cada una de las N señales de mezcla descendente codificadas en forma de onda que comprenden coeficientes espectrales correspondientes a las frecuencias entre una primera y una segunda frecuencias de cruce se combinan con una correspondiente de las N señales de mezcla descendente que comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce en N mezclas descendentes combinadas, se lleva a cabo en un dominio de frecuencias.
Una ventaja de esta realización puede ser que las M señales codificadas en forma de onda y las N señales de mezcla descendente codificadas en forma de onda se pueden codificar mediante un codificador de forma de onda utilizando transformadas de ventana en solapamiento con formación de ventanas independiente para las M señales codificadas en forma de onda y las N señales de mezcla descendente codificadas en forma de onda, respectivamente, y seguir siendo descodificables por el descodificador.
De acuerdo con otra realización, la extensión de cada una de las N señales de mezcla descendente combinadas a un intervalo de frecuencias por encima de la segunda frecuencia de cruce en la fase de reconstrucción de alta frecuencia se realiza en un dominio de frecuencias.
De acuerdo con una realización más, la combinación realizada en la segunda fase de combinación, es decir la combinación de las M señales de mezcla ascendente que comprenden coeficientes espectrales correspondientes a frecuencias superiores a la primera frecuencia de cruce, comprendiendo las M señales codificadas en forma de onda coeficientes espectrales correspondientes a frecuentas hasta la primera frecuencia de cruce, se realiza en un dominio de frecuencias. Como se ha mencionado anteriormente, una ventaja de combinar las señales en el dominio de QMF es que se puede usar la formación de ventanas independiente de las transformadas de ventana en solapamiento usadas para codificar las señales en el dominio de MDCT.
De acuerdo con otra realización, la mezcla ascendente paramétrica realizada de las N señales de mezcla descendente combinadas, extendidas en frecuencia, en M señales de mezcla ascendente en la etapa de mezcla ascendente, se realiza en un dominio de frecuencias.
De acuerdo todavía con otra realización, la mezcla descendente de las M señales codificadas en forma de onda en N señales de mezcla descendente que comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce, se realiza en un dominio de frecuencias.
De acuerdo con una realización, el dominio de frecuencias es un dominio de Filtros Especulares en Cuadratura, QMF (Quadrature Mirror Filters).
De acuerdo con otra realización, la mezcla descendente realizada en la fase de mezcla descendente, en la que las M señales codificadas en forma de onda están mezcladas en descenso en N señales de mezcla descendente que comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce, se realiza en el dominio de tiempo.
De acuerdo con aún otra realización, la primera frecuencia de cruce depende de una tasa de transmisión de bits del sistema de procesamiento de audio multicanal. Esto puede dar lugar a que el ancho de banda disponible sea utilizado para mejorar la calidad de la señal de audio descodificada, ya que la parte de la señal de audio que tiene frecuencias inferiores a la primera frecuencia de cruce es puramente codificada en forma de onda.
De acuerdo con otra realización, la extensión de cada una de las N señales de mezcla descendente combinadas a un intervalo de frecuencias superior a la segunda frecuencia de cruce realizando reconstrucción de alta frecuencia en la fase de reconstrucciones de alta frecuencia, se realiza usando parámetros de reconstrucción de alta frecuencia. Los parámetros de reconstrucción de alta frecuencia pueden ser recibidos por el descodificador, por ejemplo en la fase de recepción y después enviados a una etapa de reconstrucción de alta frecuencia. La reconstrucción de alta frecuencia puede, por ejemplo, comprender la realización de replicación de banda espectral, SBR (Spectral Band Replication).
De acuerdo con otra realización, la mezcla ascendente paramétrica en la fase de mezcla ascendente se hace con el uso de parámetros de mezcla ascendente. Los parámetros de mezcla ascendente son recibidos por el descodificador, por ejemplo en la fase de recepción, y enviados a la fase de mezcla ascendente. Se genera una versión descorrelacionada de las N señales de mezcla descendente combinadas, extendidas en frecuencia, y la versión descorrelacionada de las N señales de mezcla descendente combinadas, extendidas en frecuencia, se someten a una operación de matriz. Los parámetros de la operación de matriz son proporcionados por los parámetros de mezcla ascendente.
De acuerdo con otra realización, las N señales de mezcla descendente codificadas en forma de onda recibidas en la primera fase de recepción y las M señales recibidas codificadas en forma de onda en la segunda fase de recepción se codifican utilizando transformadas de ventana en solapamiento, con formación de ventanas independiente para las N señales de mezcla descendente codificadas en forma de onda y las M señales codificadas en forma de onda, respectivamente.
Una ventaja de esto puede ser que esto permite mejorar la calidad de la codificación y por lo tanto mejorar la calidad de la señal de audio multicanal descodificada. Por ejemplo, si se detecta un transitorio en las bandas de frecuencias superiores en un cierto instante temporal, el codificador de formas de onda puede codificar esta trama temporal particular con una secuencia de ventanas más corta, mientras que para la banda de frecuencia menor se puede mantener la secuencia de ventanas por defecto.
De acuerdo con las realizaciones, el descodificador puede comprender una tercera fase de recepción configurada para recibir otra señal codificada en forma de onda que comprenda coeficientes espectrales correspondientes a un subconjunto de las frecuencias por encima de la primera frecuencia de cruce. El descodificador puede comprender además una fase de entrelazado aguas abajo de la fase de mezcla ascendente. La fase de entrelazado puede estar configurada para entrelazar la otra señal codificada en forma de onda con una de las M señales de mezcla ascendente. La tercera fase de recepción puede estar configurada además para recibir una serie de otras señales codificadas en forma de onda, y la fase de entrelazado puede estar configurada además para entrelazar la serie de otras señales codificadas en forma de onda con una serie de las M señales de mezcla ascendente.
Esto es ventajoso porque ciertas partes del intervalo de frecuencias por encima de la primera frecuencia de cruce, que son difíciles de reconstruir paramétricamente a partir de las señales de mezcla descendente, se pueden proporcionar en forma codificada en forma de onda para el entrelazado con las señales de mezcla ascendente reconstruidas paramétricamente.
En una realización a modo de ejemplo, el entrelazado se realiza añadiendo la otra señal codificada en forma de onda con una de las M señales de mezcla ascendente. De acuerdo con otra realización a modo de ejemplo, la etapa de entrelazar la otra señal codificada en forma de onda con una de las M señales de mezcla ascendente comprende sustituir una de las M señales de mezcla ascendente con la otra señal codificada en forma de onda en el subconjunto de las frecuencias por encima de la primera frecuencia de cruce correspondiente a los coeficientes espectrales de la otra señal codificada en forma de onda.
De acuerdo con realizaciones a modo de ejemplo, el descodificador puede estar configurado además para recibir una señal de control, por ejemplo mediante la tercera fase de recepción. La señal de control puede indicar cómo entrelazar la otra señal codificada en forma de onda con una de las M señales de mezcla ascendente, en donde la etapa de entrelazar la otra señal codificada en forma de onda con una de las M señales de mezcla ascendente está basada en la señal de control. Específicamente, la señal de control puede indicar un intervalo de frecuencias y un intervalo de tiempo, tal como una o más teselas de tiempo/frecuencia en un dominio QMF, para los que la otra señal codificada en forma de onda se tiene que entrelazar con una de las M señales de mezcla ascendente. Por consiguiente, el entrelazado se puede producir en tiempo y frecuencia dentro de un canal.
Una ventaja de esto es que se pueden seleccionar intervalos de tiempo e intervalos de frecuencias que no acusan problemas de superposición o de aparición/desvanecimiento de la transformada de ventana en solapamiento utilizada para codificar las señales codificadas en forma de onda.
Visión general - Codificador
De acuerdo con un segundo aspecto, las realizaciones a modo de ejemplo proponen procedimientos, dispositivos y productos de programa informático para codificar una señal de audio multicanal en base a una señal de entrada.
Los procedimientos, dispositivos y productos de programa informático propuestos pueden tener, en general, las mismas características y ventajas.
Las ventajas relativas a características y configuraciones presentadas en la visión general del descodificador anterior pueden, en general, ser válidas para las características y configuraciones correspondientes para el codificador.
De acuerdo con las realizaciones de ejemplo, se proporciona un sistema de procesamiento de audio multicanal para codificar M canales, en donde M > 2.
El codificador comprende una fase de recepción configurada para recibir M señales correspondientes a los M canales que se han de codificar.
El codificador comprende además una primera fase de codificación en forma de onda configurada para recibir las M señales de la fase de recepción y para generar M señales codificadas en forma de onda codificando individuamente en forma de onda las M señales para un intervalo de frecuencias correspondiente a frecuencias hasta la primera frecuencia de cruce, con lo que las M señales codificadas en forma de onda comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce.
El codificador comprende además una fase de mezcla descendente configurada para recibir las M señales de la fase de recepción y para la mezcla descendente de las M señales en N señales de mezcla descendente, en donde 1 < N < M.
El codificador comprende además una fase de codificación de reconstrucción de alta frecuencia configurada para recibir las N señales de mezcla descendente desde la fase de mezcla descendente y para someter las N señales de mezcla descendente a codificación de reconstrucción de alta frecuencia, con lo que la fase de codificación de reconstrucción de alta frecuencia se configura para extraer parámetros de reconstrucción de alta frecuencia que permiten la reconstrucción de alta frecuencia de las N señales de mezcla descendente por encima de una segunda frecuencia de cruce.
El codificador comprende además una fase de codificación paramétrica configurada para recibir las M señales de la fase de recepción y las N señales de mezcla descendente desde la fase de mezcla descendente, y para someter las M señales a codificación paramétrica para el intervalo de frecuencias correspondiente a frecuencias por encima de la primera frecuencia de cruce, con lo que la fase de codificación paramétrica se configura para extraer parámetros de mezcla ascendente que permiten la mezcla ascendente de las N señales de mezcla descendente en M señales reconstruidas correspondientes a los M canales para el intervalo de frecuencias superiores a la primera frecuencia de cruce.
El codificador comprende además una segunda fase de codificación en forma de onda configurada para recibir las N señales de mezcla descendente desde la fase de mezcla descendente y para generar N señales de mezcla descendente codificadas en forma de onda codificando en forma de onda las N señales de mezcla descendente para un intervalo de frecuencias correspondiente a las frecuencias entre la primera y la segunda frecuencias de cruce, con lo que las N señales de mezcla descendente codificadas en forma de onda comprenden coeficientes espectrales correspondientes a frecuencias entre la primera frecuencia de cruce y la segunda frecuencia de cruce.
De acuerdo con una realización, el sometimiento de las N señales de mezcla descendente a codificación de reconstrucción de alta frecuencia que codifica en la fase de codificación de reconstrucción de alta frecuencia se realiza en un dominio de frecuencias, preferiblemente un dominio de Filtros Especulares en Cuadratura, QMF.
De acuerdo con otra realización, el sometimiento de las M señales a codificación paramétrica en la fase de codificación paramétrica se realiza en un dominio de frecuencias, preferiblemente en un dominio de Filtro Especulares en Cuadratura, QMF.
De acuerdo con otra realización más, la generación de M señales codificadas en forma de onda codificando en forma de onda individualmente las M señales en la primera fase de codificación en forma de onda comprende aplicar una transformada de ventana en solapamiento a las M señales, en la que se utilizan diferentes secuencias de ventanas de solapamiento para al menos dos de las M señales.
De acuerdo con realizaciones, el codificador puede comprender además una tercera fase de codificación en forma de onda configurada para generar otra señal codificada en forma de onda mediante la codificación en forma de onda de una de las M señales para un intervalo de frecuencias correspondiente a un subconjunto del intervalo de frecuencias por encima de la primera frecuencia de cruce.
De acuerdo con algunas realizaciones, el codificador puede comprender una fase de generación de señal de control. La fase de generación de señal de control está configurada para generar una señal de control que indica cómo entrelazar la otra señal codificada en forma de onda con una reconstrucción paramétrica de una de las M señales en un descodificador. Por ejemplo, la señal de control puede indicar un intervalo de frecuencias y un intervalo de tiempo para los cuales la otra señal codificada en forma de onda se ha de entrelazar con una de las M señales de mezcla ascendente.
Realizaciones a modo de ejemplo
La figura 1 es un diagrama de bloques generalizado de un descodificador 100 en un sistema de procesamiento de audio multicanal para reconstruir M canales codificados. El descodificador 100 comprende tres partes conceptuales 200, 300, 400 que se explicaran en mayor detalle junto con las figuras 2-4 siguientes. En una primera parte conceptual 200, el descodificador recibe N señales de mezcla descendente codificadas en forma de onda y M señales codificadas en forma de onda que representan la señal de audio multicanal que se tiene que descodificar, donde 1 < N < M. En el ejemplo mostrado, N se ajusta a 2. En la segunda parte conceptual 300, las M señales codificadas en forma de onda se someten a mezcla descendente y se combinan con las N señales de mezcla descendente codificadas en forma de onda. A continuación se lleva a cabo reconstrucción de alta frecuencia (HFR, high frequency reconstruction) para las señales de mezcla descendente combinadas. En la tercera parte conceptual 400, las señales reconstruidas de alta frecuencia se someten a mezcla ascendente, y las M señales codificadas en forma de onda se combinan con las señales de mezcla ascendente para reconstruir M canales codificados.
En la realización a modo de ejemplo descrita con las figuras 2-4, se describe la reconstrucción de un sonido envolvente 5.1 codificado. Se debe observar que la señal de efectos de baja frecuencia no se menciona en las realizaciones descritas ni en los dibujos. Esto no significa que se ignoren los efectos de baja frecuencia. Los efectos de baja frecuencia (Lfe, low frequency effects) se añaden a los 5 canales reconstruidos de cualquier manera adecuada bien conocida por un experto en la materia. Cabe señalar asimismo que el descodificador descrito es igualmente adecuado para otros tipos de sonido envolvente codificado, tal como sonido envolvente 7.1 o 9.1.
La figura 2 muestra la primera parte conceptual 200 del descodificador 100 de la figura 1. El descodificador comprende dos fases de recepción 212, 214. En la primera fase de recepción 212, un flujo de bits 202 es descodificado y descuantificado en dos señales de mezcla descendente codificadas en forma de onda 208a-b. Cada una de las dos señales de mezcla descendente codificadas en forma de onda 208a-b comprende coeficientes espectrales que corresponden a frecuencias entre una primera frecuencia de cruce ky y una segunda frecuencia de cruce kx.
En la segunda fase de recepción 212, el flujo de bits 202 es descodificado y descuantificado en cinco señales codificadas en forma de onda 210a-e. Cada una de las cinco señales de mezcla descendente codificadas en forma de onda 208a-e comprende coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce kx
A modo de ejemplo, las señales 210a-e comprenden dos elementos de un par de canales y elemento de un solo canal para el centro. Los elementos de un par de canales pueden ser, por ejemplo, una combinación de las señales frontal izquierda y envolvente izquierda, y una combinación de las señales frontal derecha y envolvente derecha. Otro ejemplo es una combinación de las señales frontal izquierda y frontal derecha, y una combinación de las señales envolvente izquierda y envolvente derecha. Estos elementos de pares de canales pueden estar codificados, por ejemplo, en un formato de suma y diferencia. La totalidad de las cinco señales 210a-e se pueden codificar utilizando transformadas de ventana en solapamiento, con formación de ventanas independiente, y seguir siendo descodificable por el descodificador. Esto puede permitir una calidad mejorada de la codificación y, por lo tanto, una calidad mejorada de la descodificada.
A modo de ejemplo, la primera frecuencia de cruce ky es de 1,1 kHz. A modo de ejemplo, la segunda frecuencia de cruce kx queda dentro del intervalo de 5,6-8 kHz. Se debe observar que la primera frecuencia de cruce ky puede variar, incluso por señal individual, es decir, el descodificador puede detectar que un componente de la señal en una señal de salida especifica puede no ser reproducido fielmente por las señales de mezcla descendente estéreo 208a-b y puede, para ese caso temporal particular, aumentar el ancho de banda, es decir, la primera frecuencia de cruce ky , de la señal relevante codificada en forma de onda, es decir 210a-e, para realizar una codificación apropiada en forma de onda del componente de señal.
Tal como se describirá más adelante en esta descripción, las fases restantes del descodificador 100 funcionan habitualmente en el dominio de filtros especulares en cuadratura (QMF, Quadrature Mirror Filters). Por esta razón, cada una de las señales 208a-b, 210a-e recibidas por la primera y la segunda fases de recepción 212, 214, que se reciben en forma de transformada de coseno discreta modificada (MDCT, modified discrete cosine transform), se transforman al dominio de tiempo mediante la aplicación de una MDCT inversa 216. A continuación, cada señal se transforma de nuevo al dominio de frecuencias aplicando una transformada QMF 218.
En la figura 3, las cinco señales codificadas en forma de onda 210 se mezclan de manera descendente en dos señales de mezcla descendente 310, 312 que comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce ky, en una fase de mezcla descendente 308. Estas señales de mezcla descendente 310, 312 se pueden formar llevando a cabo una mezcla descendente sobre las señales multicanal de paso bajo 210a-e utilizando el mismo esquema de mezcla descendente que se utilizó en un codificador para crear las dos señales de mezcla descendente 208a-b mostradas en la figura 2.
Las dos nuevas señales de mezcla descendente 310, 312 se combinan a continuación en una primera fase de combinación 320, 322 con la correspondiente señal de mezcla descendente 208a-b para formar señales de mezcla descendente combinadas 302a-b. Cada una de las señales de mezcla descendente combinadas 302a-b comprende por lo tanto coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce ky que se originan a partir de las señales de mezcla descendente 310, 312 y coeficientes espectrales correspondientes a las frecuencias entre la primera frecuencia de cruce ky y la segunda frecuencia de cruce kx que se originan a partir de las dos señales de mezcla descendente codificadas en forma de onda 208a-b recibidas en la primera fase de recepción 212 (mostrada en la figura 2).
El descodificador comprende además una fase de reconstrucción de alta frecuencia (HFR) 314. La fase de HFR está configurada para extender cada una de las dos señales de mezcla descendente combinadas 302a-b desde la fase de combinación hasta un intervalo de frecuencias por encima de la segunda frecuencia de cruce kx , mediante la realización de una reconstrucción de alta frecuencia. Según algunas realizaciones, la reconstrucción de alta frecuencia llevada a cabo puede comprender la realización de replicación de banda espectral, SBR. La reconstrucción de alta frecuencia se puede realizar utilizando parámetros de reconstrucción de alta frecuencia que se pueden recibir mediante la fase HFR 314 de cualquier manera adecuada.
Las salida de la fase de reconstrucción de alta frecuencia 314 consiste en dos señales 304a-b que comprenden las señales de mezcla descendente 208a-b con la extensión HFR 316, 318 aplicada. Tal como se ha descrito anteriormente, la fase HFR 314 es la realización de una reconstrucción de alta frecuencia en base a las frecuencias presentes en la señal de entrada 210a-e de la segunda fase de recepción 214 (mostrada en la figura 2) combinadas con las dos señales de mezcla descendente 208a-b. Un tanto simplificado, el intervalo HFR 316, 318 comprende partes de los coeficientes espectrales de las señales de mezcla descendente 310, 312 que se han copiado al intervalo HFR 316, 318. Por consiguiente, las partes de las cinco señales codificadas en forma de onda 210a-e aparecerán en el intervalo HFR 316, 318 de la salida 304 de la fase HFR 314.
Se debe observar que la mezcla descendente en la fase de mezcla descendente 308 y la combinación en la primera fase de combinación 320, 322 anterior a la fase de reconstrucción de alta frecuencia 314, se pueden realizar en el dominio de tiempo, es decir, después de que cada señal haya sido transformada al dominio de tiempo aplicando una transformada de coseno discreta modificada (MDCT) inversa 216 (mostrada en la figura 2). Sin embargo, dado que las señales codificadas en forma de onda 210a-e y las señales de mezcla descendente codificadas en forma de onda 208a-b se pueden codificar mediante un codificador de formas de onda utilizando transformadas de ventana en solapamiento con formación de ventanas independiente, las señales 210a-e y 208a-b no se pueden combinar sin problemas en un dominio de tiempo. Por lo tanto, se obtiene un escenario más controlado si por lo menos la combinación en la primera fase de combinación 320, 322 se realiza en el dominio QMF.
La figura 4 muestra la parte conceptual tercera y final 400 del descodificador 100. La salida 304 de la fase HFR 314 constituye la entrada a una fase de mezcla ascendente 402. La fase de mezcla ascendente 402 crea una salida de cinco señales 404a-e llevando a cabo una mezcla ascendente paramétrica sobre las señales extendidas en frecuencia 304a-b. Cada una de las cinco señales de mezcla ascendente 404a-e corresponde a uno de los cinco canales codificados en el sonido envolvente codificado 5.1 para frecuencias por encima de la primera frecuencia de cruce ky . De acuerdo con un procedimiento de mezcla ascendente paramétrica a modo de ejemplo, la fase de mezcla ascendente 402 recibe en primer lugar parámetros de mezcla paramétrica. La fase de mezcla ascendente 402 genera además versiones descorrelacionadas de las dos señales de mezcla descendente combinadas extendidas en frecuencia 304a-b. La fase de mezcla ascendente 402 somete además las dos señales de mezcla descendente combinadas extendidas en frecuencia 304a-b y las versiones descorrelacionadas de las dos señales de mezcla descendente combinadas extendidas en frecuencia 304a-b a una operación matricial, en la que los parámetros de la operación matricial están dados por los parámetros de mezcla ascendente. Alternativamente, se puede aplicar cualquier otro procedimiento de mezcla ascendente paramétrica conocido en la técnica. Se describen procedimientos aplicables de mezcla ascendente paramétrica, por ejemplo, en el documento "MPEG Surround-The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding" (Herre et al., Journal of the Audio Engineering Society, volumen 56, n.° 11, noviembre de 2008).
La salida 404a-e de la fase de mezcla ascendente 402 no comprende por lo tanto frecuencias por debajo de la primera frecuencia de cruce ky. Los restantes coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce ky existen en las cinco señales codificadas en forma de onda 210a-e que han sido retardadas por una fase de retardo 412 para corresponderse con la temporización de las señales de mezcla ascendente 404.
El descodificador 100 comprende además una segunda fase de combinación 416, 418. La segunda fase de combinación 416, 418 está configurada para combinar las cinco señales de mezcla ascendente 404a-e con las cinco señales codificadas en forma de onda 210a-e que fueron recibidas por la segunda fase de recepción 214 (mostrada en la figura 2).
Puede observarse que cualquier señal Lfe presente se puede añadir como una señal independiente a la señal combinada resultante 422. Cada una de las señales 422 se transforma a continuación al dominio de tiempo aplicando una transformada QMF inversa 420. La salida de la transformada QMF inversa 414 es, por lo tanto, la señal de audio de canal 5.1 totalmente descodificada.
La figura 6 muestra un sistema de descodificación 100' que es una modificación del sistema de descodificación 100 de la figura 1. El sistema de descodificación 100' tiene partes conceptuales 200', 300' y 400' correspondientes a las partes conceptuales 100, 200 y 300 de la figura 1. La diferencia entre el sistema de descodificación 100' de la figura 6 y el sistema de descodificación de la figura 1 es que hay una tercera fase de recepción 616 en la parte conceptual 200' y una fase de entrelazado 714 en la tercera parte conceptual 400'.
La tercera fase de recepción 616 está configurada para recibir otra señal codificada en forma de onda. La otra señal codificada en forma de onda comprende coeficientes espectrales correspondientes a un subconjunto de las frecuencias por encima de la primera frecuencia de cruce. La otra señal codificada en forma de onda se puede transformar al dominio de tiempo aplicando una MDCT inversa 216. A continuación se puede transformar de nuevo al dominio de frecuencias aplicando una transformada QMF 218.
Se debe entender que la otra señal codificada en forma de onda se puede recibir como una señal independiente. Sin embargo, la otra señal codificada en forma de onda puede asimismo formar parte de una o más de las cinco señales codificadas en forma de onda 210a-e. En otras palabras, la otra señal codificada en forma de onda se puede codificar conjuntamente con una o más de las cinco señales codificadas en forma de onda 201a-e, por ejemplo, utilizando la misma transformada MDCT. En ese caso, la tercera fase de recepción 616 corresponde a la segunda fase de recepción, es decir, la otra señal codificada en forma de onda se recibe junto con las cinco señales codificadas en forma de onda 210a-e por medio de la segunda fase de recepción 214.
La figura 7 muestra en mayor detalle la tercera parte conceptual 300' del descodificador 100' de la figura 6. La otra señal codificada en forma de onda 710 se introduce en la tercera parte conceptual 400' además de las señales de mezcla descendente extendidas en alta frecuencia 304a-b y las cinco señales codificadas en forma de onda 210a-e. En el ejemplo mostrado, la otra señal codificada en forma de onda 710 corresponde al tercer canal de los cinco canales. La otra señal codificada en forma de onda 710 comprende además coeficientes espectrales correspondientes a un intervalo de frecuencias que se inicia a partir de la primera frecuencia de cruce ky. Sin embargo, la forma del subconjunto del intervalo de frecuencias por encima de la primera frecuencia de cruce cubierta por la otra señal codificada en forma de onda 710 puede por supuesto variar en diferentes realizaciones. Se debe observar asimismo que se pueden recibir una serie de señales codificadas en forma de onda 710a-e, en donde las diferentes señales codificadas en forma de onda pueden corresponder a diferentes canales de salida. El subconjunto del intervalo de frecuencias cubierto por dicha serie de otras señales codificadas en forma de onda 710a-e puede variar entre diferentes señales de la serie de otras señales codificadas en forma de onda 710a-e.
La otra señal codificada en forma de onda 710 se puede retardar mediante una fase de retardo 712 para corresponderse a la temporización de las señales de mezcla ascendente 404 que son emitidas desde la fase de mezcla ascendente 402. Las señales de mezcla ascendente 404 y la otra señal codificada en forma de onda 710 se introducen a continuación en una fase de entrelazado 714. La fase de entrelazado 714 entrelaza, es decir, combina las señales de mezcla ascendente 404 con la otra señal codificada en forma de onda 710 para generar una señal entrelazada 704. En el presente ejemplo, la fase de entrelazado 714 entrelaza por lo tanto la tercera señal de mezcla ascendente 404c con la otra señal codificada en forma de onda 710. El entrelazado se puede llevar a cabo sumando juntas las dos señales. Sin embargo, habitualmente, el entrelazado se lleva a cabo sustituyendo las señales de mezcla ascendente 404 con la otra señal codificada en forma de onda 710 en el intervalo de frecuencias y el intervalo de tiempo en que las señales solapan.
La señal entrelazada 704 se introduce a continuación a la segunda fase de combinación 416, 418, donde se combina con las señales codificadas en forma de onda 201a-e para generar una señal de salida 722, del mismo modo que se ha descrito haciendo referencia a la figura 4. Se debe observar que el orden de la fase de entrelazado 714 y la segunda fase de combinación 416, 418 se puede invertir, de tal modo que la combinación se lleve a cabo antes del entrelazado.
Asimismo, en la situación en la que la otra señal codificada en forma de onda 710 forma parte de una o más de las cinco señales codificadas en forma de onda 210a-e, la segunda fase de combinación 416, 418 y la fase de entrelazado 714 se pueden combinar en una única fase. Específicamente, dicha fase combinada utilizaría el contenido espectral de las cinco señales codificadas en forma de onda 210a-e para frecuencias hasta la primera frecuencia de cruce ky. Para frecuencias por encima de la primera frecuencia de cruce, la fase combinada utilizaría las señales de mezcla ascendente 404 entrelazadas con la otra señal codificada en forma de onda 710.
La fase de entrelazado 714 puede funcionar bajo el control de una señal de control. Para este propósito, el descodificador 100' puede recibir, por ejemplo por medio de la tercera fase de recepción 616, una señal de control que indica cómo entrelazar la otra señal codificada en forma de onda con una de las M señales de mezcla ascendente. Por ejemplo, la señal de control puede indicar el intervalo de frecuencias y el intervalo de tiempo para los que la otra señal codificada en forma de onda 710 se tiene que entrelazar con una de las señales de mezcla ascendente 404. Por ejemplo, el intervalo de frecuencias y el intervalo de tiempo se pueden expresar en términos de teselas de tiempo/frecuencia para las que se tiene que realizar el entrelazado. Las teselas de tiempo/frecuencia pueden ser teselas de tiempo/frecuencia con respecto al enrejado de tiempo/frecuencia del dominio QMF en el que tiene lugar el entrelazado.
La señal de control puede utilizar vectores, tales como vectores binarios, para indicar las teselas de tiempo/frecuencia para las que se tiene que realizar el entrelazado. Específicamente, puede haber un primer vector relacionado con una dirección de frecuencia, que indica las frecuencias para las que se tiene que llevar a cabo el entrelazado. La indicación se puede realizar, por ejemplo, indicando un uno lógico para el correspondiente intervalo de frecuencia en el primer vector. Puede haber asimismo un segundo vector relacionado con una dirección de tiempo, que indica los intervalos de tiempo para los que se tiene que llevar a cabo el entrelazado. La indicación se puede realizar, por ejemplo, indicando un uno lógico para el correspondiente intervalo de tiempo en el segundo vector. Para este propósito, una trama se divide habitualmente en una serie de segmentos de tiempo, de tal modo que la indicación de tiempo se puede realizar basándose en subtramas. Cruzando el primer y el segundo vectores, se puede construir una matriz de tiempo/frecuencia. Por ejemplo, la matriz de tiempo/frecuencia puede ser una matriz binaria que comprende un uno lógico para cada tesela de tiempo/frecuencia para la que el primer y el segundo vectores indican un uno lógico. La fase de entrelazado 714 puede utilizar a continuación la matriz de tiempo/frecuencia tras llevar a cabo el entrelazado, por ejemplo de tal modo que una o más de las señales de mezcla ascendente 704 son sustituidas por la otra señal codificada en forma de onda 710 para las teselas de tiempo/frecuencia que se indican, tal como mediante un uno lógico, en la matriz de tiempo/frecuencia.
Se observa que los vectores pueden utilizar otros esquemas diferentes a un esquema binario, para indicar las teselas de tiempo/frecuencia para las que se tiene que realizar el entrelazado. Por ejemplo, los vectores podrían indicar por medio de un primer valor, tal como cero, que no se tiene que realizar entrelazado, y por medio de un segundo valor, que se tiene que realizar el entrelazado, con respecto a un determinado canal identificado por el segundo valor.
La figura 5 muestra, a modo de ejemplo, un diagrama de bloques generalizado de un sistema de codificación 500 para un sistema de procesamiento de audio multicanal para codificar M canales, de acuerdo con una realización.
En la realización a modo de ejemplo descrita en la figura 5, se describe la codificación de un sonido envolvente 5.1. Por lo tanto, en el ejemplo mostrado, M se ajusta a cinco. Se puede observar que la señal de efectos de baja frecuencia no se menciona en la realización descrita ni en los dibujos. Esto no significa que se ignoren los efectos de baja frecuencia. Los efectos de baja frecuencia (Lfe) se añaden al flujo de bits 552 de cualquier manera adecuada conocida por un experto en la materia. Puede observarse asimismo que el codificador descrito es igualmente adecuado para codificar otros tipos de sonido envolvente, tal como sonido envolvente 7.1 o 9.1. En el codificador 500, se reciben cinco señales 502, 504 en una fase de recepción (no mostrada). El codificador 500 comprende una primera fase de codificación en forma de onda 506 configurada para recibir las cinco señales 502, 504 desde la fase de recepción y para generar cinco señales codificadas en forma de onda 518 codificando individualmente en forma de onda las cinco señales 502, 504. La fase de codificación en forma de onda 506 puede, por ejemplo, someter cada una de las cinco señales recibidas 502, 504 a una transformada MDCT. Tal como se ha discutido con respecto al descodificador, el codificador puede elegir codificar cada una de las cinco señales recibidas 502, 504 utilizando una transformada MDCT con formación de ventanas independiente. Esto puede permitir una calidad mejorada de la codificación y, por lo tanto, una calidad mejorada de la señal descodificada.
Las cinco señales codificadas en forma de onda 518 se codifican en forma de onda para un intervalo de frecuencias correspondiente a frecuencias hasta una primera frecuencia de cruce. Por lo tanto, las cinco señales codificadas en forma de onda 518 comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce. Esto se puede conseguir sometiendo cada una de las cinco señales codificadas en forma de onda 518 a un filtro de paso bajo. Las cinco señales codificadas en forma de onda 518 se cuantifican 520 a continuación, de acuerdo con un modelo psicoacústico. El modelo psicoacústico se configura con la mayor precisión posible, considerando la tasa de bits disponible en el sistema de procesamiento de audio multicanal, reproduciendo las señales codificadas según son percibidas por un oyente cuando se descodifican en un lado del descodificador del sistema.
Tal como se ha discutido anteriormente, el codificador 500 lleva a cabo codificación híbrida que comprende codificación multicanal discreta y codificación paramétrica. La codificación multicanal discreta se lleva a cabo en la fase de codificación en forma de onda 506 sobre cada una de las señales de entrada 502, 504 para frecuencias hasta la primera frecuencia de cruce, tal como se ha descrito anteriormente. La codificación paramétrica se lleva a cabo para poder reconstruir, en un lado del descodificador, las cinco señales de entrada 502, 504 a partir de N señales de mezcla descendente para frecuencias por encima de la primera frecuencia de cruce. En el ejemplo mostrado en la figura 5, N se ajusta a 2. La mezcla descendente de las cinco señales de entrada 502, 504 se lleva a cabo en una fase de mezcla descendente 534. La fase de mezcla descendente 534 funciona ventajosamente en un dominio QMF. Por lo tanto, antes de ser introducidas en la fase de mezcla descendente 534, las cinco señales 502, 504 son transformadas a un dominio QMF mediante una fase de análisis QMF 526. La fase de mezcla descendente lleva a cabo una operación de mezcla descendente lineal sobre las cinco señales 502, 504 y entrega dos señales de mezcla descendente 544, 546.
Estas dos señales de mezcla descendente 544, 546 son recibidas por una segunda fase de codificación en forma de onda 508 después de haber sido transformadas de nuevo al dominio de tiempo al ser sometidas a una transformada QMF inversa 554. La segunda fase de codificación en forma de onda 508 está generando dos señales de mezcla descendente codificadas en forma de onda mediante codificación en forma de onda de las dos señales de mezcla descendente 544, 546 para un intervalo de frecuencias correspondiente a frecuencias entre la primera y la segunda frecuencias de cruce. La fase de codificación en forma de onda 508 puede, por ejemplo, someter cada una de las dos señales de mezcla descendente a una transformada MDCT. Las dos señales de mezcla descendente codificadas en forma de onda comprenden, por lo tanto, coeficientes espectrales correspondientes a frecuencias entre la primera frecuencia de cruce y la segunda frecuencia de cruce. Las dos señales de mezcla descendente codificadas en forma de onda se cuantifican 522 a continuación, de acuerdo con el modelo psicoacústico.
Para poder reconstruir las frecuencias por encima de la segunda frecuencia de cruce en un lado del descodificador, se extraen parámetros de reconstrucción de alta frecuencia, HFR, 538 a partir de las dos señales de mezcla descendente 544, 546. Estos parámetros son extraídos en una fase de codificación HFR 532.
Para poder reconstruir las cinco señales a partir de las dos señales de mezcla descendente 544, 546 en un lado del descodificador, las cinco señales de entrada 502, 504 son recibidas por la fase de codificación paramétrica 530. Las cinco señales 502, 504 son sometidas a codificación paramétrica para el intervalo de frecuencias correspondiente a frecuencias por encima de la primera frecuencia de cruce. La fase de codificación paramétrica 530 está configurada entonces para extraer parámetros de mezcla ascendente 536 que permiten la mezcla ascendente de las dos señales de mezcla descendente 544, 546 en cinco señales reconstruidas correspondientes a las cinco señales de entrada 502, 504 (es decir, los cinco canales en el sonido envolvente 5.1 codificado) para el intervalo de frecuencias por encima de la primera frecuencia de cruce. Se puede observar que los parámetros de mezcla ascendente 536 son extraídos solamente para frecuencias por encima de la primera frecuencia de cruce. Esto puede reducir la complejidad de la fase de codificación paramétrica 530, y la tasa de bits de los datos paramétricos correspondientes.
Puede observarse que la mezcla descendente 534 se puede realizar en el dominio de tiempo. En tal caso, la fase de análisis QMF 526 debería estar situada aguas abajo de la fase de mezcla descendente 534 antes de la fase de codificación HFR 532, dado que la fase de codificación HRF 532 funciona habitualmente en el dominio QMF. En este caso, se puede omitir la fase de QMF inversa 554.
El codificador 500 comprende además una fase de generación de flujos de bits, es decir un multiplexor de flujos de bits 524. De acuerdo con la realización a modo de ejemplo del codificador 500, la fase de generación de flujos de bits está configurada para recibir las cinco señales codificadas y cuantificadas 548, las dos señales de parámetros 536, 538 y las dos señales de mezcla descendente codificadas y cuantificadas 550. Estas son transformadas en un flujo de bits 552 mediante la fase de generación de flujos de bits 524, para ser además distribuidas en el sistema de audio multicanal.
En el sistema descrito de audio multicanal, existe a menudo una tasa de bits máxima disponible, por ejemplo cuando se produce una transmisión continua de audio sobre internet. Dado que las características de cada trama de tiempo de las señales de entrada 502, 504 difiere, no se puede utilizar exactamente la misma asignación de bits entre las cinco señales codificadas en forma de onda 548 y las dos señales codificadas en forma de onda de mezcla descendente 550. Además, cada señal individual 548 y 550 puede requerir más o menos bits asignados para que las señales puedan ser reconstruidas en función del modelo psicoacústico. De acuerdo con una realización a modo de ejemplo, la primera y la segunda fases de codificación en forma de onda 506, 508 comparten un depósito de bits común. Los bits disponibles por trama codificada se distribuyen en primer lugar entre la primera y la segunda fases de codificación en forma de onda 506, 508, en función de las características de las señales que se tienen que codificar y del modelo psicoacústico presente. Los bits son distribuidos a continuación entre las señales individuales 548, 550, tal como se ha descrito anteriormente. Por supuesto, el número de bits utilizados para los parámetros 538 de la reconstrucción de alta frecuencia y los parámetros 536 de mezcla ascendente se tiene en cuenta cuando se distribuyen los bits disponibles. Se tiene cuidado de ajustar el modelo psicoacústico para la primera y la segunda fases de codificación en forma de onda 506, 508 para una transición suave perceptualmente en torno a la primera frecuencia de cruce, con respecto al número de bits asignados en la trama de tiempo particular.
La figura 8 muestra una realización alternativa de un sistema de codificación 800. La diferencia entre el sistema de codificación 800 de la figura 8 y el sistema de codificación 500 de la figura 5 es que el codificador 800 está dispuesto para generar otra señal codificada en forma de onda mediante codificación en forma de onda de una o más de las señales de entrada 502, 504 para un intervalo de frecuencias correspondiente a un subconjunto de intervalo de frecuencias por encima de la primera frecuencia de cruce.
Para este propósito, el codificador 800 comprende una fase de detección de entrelazado 802. La fase de detección de entrelazado 802 está configurada para identificar partes de las señales de entrada 502, 504 que no están bien reconstruidas mediante la reconstrucción paramétrica, codificadas por la fase de codificación paramétrica 530 y la fase de codificación de reconstrucción de alta frecuencia 532. Por ejemplo, la fase de detección de entrelazado 802 puede comparar las señales de entrada 502, 504 con una reconstrucción paramétrica de la señal de entrada 502, 504 definida mediante la fase de codificación paramétrica 530 y la fase de codificación de reconstrucción de alta frecuencia 532. En base a la comparación, la fase de detección de entrelazado 802 puede identificar un subconjunto 804 del intervalo de frecuencias por encima de la primera frecuencia de cruce que se tiene que codificar en forma de onda. La fase de detección de entrelazado 802 puede identificar asimismo el intervalo de tiempo durante el cual el subconjunto identificado 804 del intervalo de frecuencias por encima de la primera frecuencia de cruce se tiene que codificar en forma de onda. Los subconjuntos de tiempo y frecuencia identificados 804, 806 se pueden introducir en la primera fase de codificación en forma de onda 506. En base a los subconjuntos de frecuencia y tiempo recibidos 804 y 806, la primera fase de codificación en forma de onda 506 genera otra señal codificada en forma de onda 808 codificando en forma de onda una o más de las señales de entrada 502, 504 para los intervalos de tiempo y frecuencia identificados por los subconjuntos 804, 806. La otra señal codificada en forma de onda 808 puede a continuación ser codificada y cuantificada mediante la fase 520, y añadida al flujo de bits 846.
La fase de detección de entrelazado 802 puede comprender además una fase de generación de señales de control. La fase de generación de señales de control está configurada para generar una señal de control 810 que indica cómo entrelazar la otra señal codificada en forma de onda con una reconstrucción paramétrica de una de las señales de entrada 502, 504 en un descodificador. Por ejemplo, la señal de control puede indicar un intervalo de frecuencias y un intervalo de tiempo para los que la otra señal codificada en forma de onda se tiene que entrelazar con una reconstrucción paramétrica según se describe haciendo referencia a la figura 7. La señal de control se puede añadir al flujo de bits 846.
Equivalentes, extensiones, alternativas y miscelánea
Después de estudiar la descripción anterior, resultarán evidentes para un experto en la materia otras realizaciones de la presente memoria descriptiva. Aunque la presente descripción y los dibujos dan a conocer realizaciones y ejemplos, la memoria descriptiva no se limita a estos ejemplos específicos. Se pueden realizar numerosas modificaciones y variaciones sin apartarse del alcance de la presente memoria descriptiva, que se define en las reivindicaciones adjuntas. Cualesquiera signos de referencia que aparezcan en las reivindicaciones no se deben entender como limitando su alcance.
Adicionalmente, en la práctica de la memoria descriptiva un experto en la materia puede comprender y llevar a cabo variaciones sobre las realizaciones dadas a conocer, a partir de un estudio de los dibujos, de la memoria descriptiva y de las reivindicaciones adjuntas. En las reivindicaciones, la expresión "que comprende" no excluye otros elementos o etapas, y el articulo indefinido "un" o "una" no excluye una pluralidad. El mero hecho de que ciertas disposiciones se expongan en reivindicaciones dependientes diferentes entre sí no indica que no se pueda utilizar ventajosamente una combinación de estas disposiciones.
Los sistemas y procedimientos dados a conocer en lo anterior se pueden implementar como software, software inalterable, hardware o una combinación de los mismos. En una implementación en hardware, la división de tareas entre unidades funcionales mencionada en la descripción anterior no se corresponde necesariamente con la división en unidades físicas; por el contrario, un componente físico puede tener múltiples funcionalidades, y una tarea se puede llevar a cabo mediante varios componentes físicos en cooperación. Ciertos componentes o la totalidad de componentes se pueden implementar como software ejecutado por un microprocesador o procesador de señal digital, o se pueden implementar como hardware o como un circuito integrado de aplicación específica. Tal software se puede distribuir en un medio legible por ordenador, que puede comprender medios de almacenamiento informático (o medios no transitorios) y medios de comunicación (o medios transitorios). Tal como es bien sabido por un experto en la materia, el termino medios de almacenamiento informático incluye medios volátiles y no volátiles, extraíbles y no extraíbles, implementados en cualquier procedimiento o tecnología para el almacenamiento de información, tal como instrucciones legibles por ordenador, estructuras de datos, módulos de programa u otros datos. Los medios de almacenamiento informático incluyen, pero no se limitan a, RAM, ROM, EEPROM, memoria flash u otra tecnología de memoria, CD-ROM, discos versátiles digitales (DVD, digital versatile disks) u otro almacenamiento en disco óptico, casetes magnéticos, cinta magnética, almacenamiento en disco magnético u otros dispositivos de almacenamiento magnético, o cualquier otro medio que pueda ser utilizado para almacenar la información deseada y al que pueda tener acceso un ordenador. Además, es bien sabido por un experto en la materia que los medios de comunicación incorporan habitualmente instrucciones legibles por ordenador, estructuras de datos, módulos de programa u otros datos en una señal de datos modulada, tal como una onda portadora u otro mecanismo de transporte, e incluyen cualquier medio de distribución de información.

Claims (9)

REIVINDICACIONES
1. Un procedimiento en un descodificador de un sistema de procesamiento de audio multicanal, que comprende las etapas de:
recibir M señales (404) de mezcla ascendente que comprenden coeficientes espectrales correspondientes a las frecuencias superiores a una primera frecuencias de cruce ky , en el que las M señales de mezcla ascendente son el resultado de una mezcla ascendente de N señales de mezcla descendente extendidas en frecuencia en M señales de mezcla ascendente, correspondiendo cada una de las M señales de mezcla ascendente a uno respectivo de M canales codificados, en donde 1 < N < M;
recibir una señal (710) codificada en forma de onda que comprende coeficientes espectrales correspondientes a un intervalo de frecuencias que parte de la primera frecuencia de cruce ky;
recibir M señales (210) codificadas en forma de onda que comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce, correspondiendo cada una de las M señales codificadas en forma de onda a uno respectivo de los M canales codificados; y
entrelazar la señal (710) codificada en forma de onda con una de las M señales de mezcla ascendente de tal manera que se obtiene una versión entrelazada de dicha una de las M señales de mezcla ascendente,
caracterizado por que comprende además:
recibir una señal de control que indica teselas de tiempo/frecuencia para las cuales la señal codificada en forma de onda se ha de entrelazar con una de las M señales de mezcla ascendente, en el que la señal de control comprende un primer vector que indica intervalos de frecuencias de las teselas de tiempo/frecuencia, y un segundo vector que indica intervalos de tiempo de las teselas de tiempo/frecuencia, y en el que el entrelazado es realizado bajo el control de la señal de control de tal manera que el entrelazado se realiza en las teselas de tiempo/frecuencia indicadas por la señal de control; y
combinar las M señales codificadas en forma de onda con las M señales de mezcla ascendente antes del entrelazado, después del entrelazado o en una etapa combinada con el entrelazado.
2. El procedimiento de la reivindicación 1, en el que las teselas de tiempo/frecuencia son teselas con respecto a un enrejado de tiempo/frecuencia de un dominio de QMF donde tiene lugar el entrelazado.
3. El procedimiento de la reivindicación 1, en el que el primer vector es un vector binario que indica un uno lógico para intervalos de frecuencia del primer vector correspondientes a los intervalos de frecuencias de las teselas de tiempo/frecuencia.
4. El procedimiento de la reivindicación 3, en el que el segundo vector es un vector binario que indica un uno lógico para intervalos de tiempo del segundo vector correspondientes a intervalos de tiempo de las teselas de tiempo/frecuencia.
5. El procedimiento de la reivindicación 1, en el que las señales son recibidas en tramas de tiempo, en el que cada trama de tiempo se divide en una pluralidad de segmentos de tiempo, de tal manera que la indicación de intervalos de tiempo se efectúa basándose en subtramas.
6. El procedimiento de la reivindicación 1, en el que mediante intersección de los vectores primero y segundo se construye una matriz de tiempo/frecuencia, en el que la matriz de tiempo/frecuencia es una matriz binaria que comprende un uno lógico para la tesela de tiempo/frecuencia para la cual los vectores primero y segundo indican un uno lógico.
7. El procedimiento de la reivindicación 1, en el que cada uno de los vectores primero y segundo indica, por medio de un primer valor, que no se tiene que hacer entrelazado y, mediante un segundo valor, que el entrelazado se ha de hacer con respecto a una determinada de las M señales de mezcla ascendente identificadas por el segundo valor.
8. Un descodificador para su uso en un sistema de procesamiento de audio multicanal, que comprende:
una primera fase de recepción configurada para recibir M señales (404) de mezcla ascendente que comprenden coeficientes espectrales correspondientes a frecuencias superiores a una primera frecuencia de cruce ky, en el que las M señales de mezcla ascendente son el resultado de una mezcla ascendente de N señales de mezcla descendente extendidas en frecuencia en M señales de mezcla ascendente, correspondiendo cada una de las M señales de mezcla ascendente a uno respectivo de M canales codificados, en donde 1 < N < M;
una segunda fase de recepción configurada para recibir una señal (710) codificada en forma de onda, que comprende coeficientes espectrales correspondientes a un intervalo de frecuencias que parte de la primera frecuencia de cruce ky ; y
una fase de entrelazado (714) configurada para entrelazar la señal (710) codificada en forma de onda con una de las M señales de mezcla ascendente de tal manera que se obtiene una versión entrelazada de la citada una de las M señales de mezcla ascendente,
en el que el descodificador está configurado para recibir M señales (210) codificadas en forma de onda que comprenden coeficientes espectrales correspondientes a frecuencias hasta la primera frecuencia de cruce, correspondiendo cada una de las M señales codificadas en forma de onda a uno respectivo de los M canales codificados, en el que la segunda fase de recepción está configurada para recibir las M señales codificadas en forma de onda junto con la señal codificada en forma de onda o en el que el descodificador comprende una tercera fase de recepción configurada para recibir las M señales codificadas en forma de onda,
caracterizado porque:
la etapa de entrelazado (714) está configurada para recibir una señal de control que indica teselas de tiempo/frecuencia para las cuales la señal codificada en forma de onda se ha de entrelazar con una de las M señales de mezcla ascendente, en el que la señal de control comprende un primer vector que indica intervalos de frecuencias de las teselas de tiempo/frecuencia, y un segundo vector que indica intervalos de tiempo de las teselas de tiempo/frecuencia; la fase de entrelazado está configurada para realizar el entrelazado bajo control de la señal de control de tal manera que el entrelazado es realizado en las teselas de tiempo/frecuencia indicadas por la señal de control; y
el descodificador comprende una fase de combinación (416, 418) configurada para combinar las M señales codificadas en forma de onda con las M señales de mezcla ascendente antes del entrelazado, después del entrelazado o en una etapa combinada con el entrelazado.
9. Un producto de programa informático que comprende un medio legible por ordenador con instrucciones para llevar a cabo el procedimiento según una cualquiera de las reivindicaciones 1-7, cuando dicho producto de programa es ejecutado en un ordenador.
ES16203268T 2013-04-05 2014-04-04 Codificador y descodificador de audio Active ES2748939T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201361808680P 2013-04-05 2013-04-05

Publications (1)

Publication Number Publication Date
ES2748939T3 true ES2748939T3 (es) 2020-03-18

Family

ID=50439393

Family Applications (2)

Application Number Title Priority Date Filing Date
ES16203268T Active ES2748939T3 (es) 2013-04-05 2014-04-04 Codificador y descodificador de audio
ES14715308.4T Active ES2619117T3 (es) 2013-04-05 2014-04-04 Codificador y descodificador de audio

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES14715308.4T Active ES2619117T3 (es) 2013-04-05 2014-04-04 Codificador y descodificador de audio

Country Status (21)

Country Link
US (6) US9489957B2 (es)
EP (3) EP3171361B1 (es)
JP (7) JP6031201B2 (es)
KR (7) KR20240038819A (es)
CN (2) CN109410966B (es)
AU (1) AU2014247001B2 (es)
BR (7) BR112015019711B1 (es)
CA (1) CA2900743C (es)
DK (1) DK2954519T3 (es)
ES (2) ES2748939T3 (es)
HK (1) HK1213080A1 (es)
HU (1) HUE031660T2 (es)
IL (1) IL240117A0 (es)
MX (4) MX369023B (es)
MY (3) MY185848A (es)
PL (1) PL2954519T3 (es)
RU (2) RU2641265C1 (es)
SG (1) SG11201506139YA (es)
TW (1) TWI546799B (es)
UA (1) UA113117C2 (es)
WO (1) WO2014161992A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
WO2015007774A1 (de) 2013-07-18 2015-01-22 Basf Se Vereinzelung einer polyarylenetherlösung
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
KR20240050483A (ko) 2015-06-17 2024-04-18 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
PL3405949T3 (pl) 2016-01-22 2020-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób szacowania międzykanałowej różnicy czasowej
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
US10354667B2 (en) 2017-03-22 2019-07-16 Immersion Networks, Inc. System and method for processing audio data
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5459B2 (es) 1973-12-20 1979-01-05
IT1044736B (it) * 1975-04-23 1980-04-21 Cselt Centro Studi Lab Telecom Sistema numerico per la trasmissione dei canali di due fasci modulati a impulsi codificati alla velocita di un solo fascio
JP2000122679A (ja) * 1998-10-15 2000-04-28 Sony Corp 音声帯域拡張方法及び装置、音声合成方法及び装置
JP3677185B2 (ja) * 1999-11-29 2005-07-27 株式会社東芝 符号分割多重伝送方式と送信装置及び受信装置
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US20030220800A1 (en) 2002-05-21 2003-11-27 Budnikov Dmitry N. Coding multichannel audio signals
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
WO2005098824A1 (en) 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
DE602005011439D1 (de) 2004-06-21 2009-01-15 Koninkl Philips Electronics Nv Verfahren und vorrichtung zum kodieren und dekodieren von mehrkanaltonsignalen
US7756713B2 (en) * 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
CN101151660B (zh) 2005-03-30 2011-10-19 皇家飞利浦电子股份有限公司 多通道音频编码器、解码器以及相应方法
JP2006323037A (ja) * 2005-05-18 2006-11-30 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
WO2007046659A1 (en) * 2005-10-20 2007-04-26 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
WO2008031458A1 (en) * 2006-09-13 2008-03-20 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for a speech/audio sender and receiver
KR101435893B1 (ko) * 2006-09-22 2014-09-02 삼성전자주식회사 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
KR101405972B1 (ko) 2007-07-02 2014-06-12 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
RU2443075C2 (ru) 2007-10-09 2012-02-20 Конинклейке Филипс Электроникс Н.В. Способ и устройство для генерации бинаурального аудиосигнала
WO2009068087A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation Multichannel audio coding
AU2008339211B2 (en) 2007-12-18 2011-06-23 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2009084916A1 (en) * 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2260487B1 (en) * 2008-03-04 2019-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Mixing of input data streams and generation of an output data stream therefrom
MX2011000370A (es) * 2008-07-11 2011-03-15 Fraunhofer Ges Forschung Un aparato y un metodo para decodificar una señal de audio codificada.
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
TWI413109B (zh) * 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
WO2010097748A1 (en) 2009-02-27 2010-09-02 Koninklijke Philips Electronics N.V. Parametric stereo encoding and decoding
US20100223061A1 (en) 2009-02-27 2010-09-02 Nokia Corporation Method and Apparatus for Audio Coding
BR122019023924B1 (pt) * 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
BRPI1004215B1 (pt) 2009-04-08 2021-08-17 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para upmixagem de sinal de áudio downmix utilizando uma atenuação de valor de fase
KR20110018107A (ko) 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
ES2644520T3 (es) * 2009-09-29 2017-11-29 Dolby International Ab Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia
MX2012004648A (es) * 2009-10-20 2012-05-29 Fraunhofer Ges Forschung Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing.
US9026236B2 (en) * 2009-10-21 2015-05-05 Panasonic Intellectual Property Corporation Of America Audio signal processing apparatus, audio coding apparatus, and audio decoding apparatus
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
RU2683175C2 (ru) * 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
PL3779979T3 (pl) 2010-04-13 2024-01-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji
RU2573774C2 (ru) 2010-08-25 2016-01-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство для декодирования сигнала, содержащего переходные процессы, используя блок объединения и микшер
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
FR2973551A1 (fr) 2011-03-29 2012-10-05 France Telecom Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique
EP2702589B1 (en) 2011-04-28 2017-04-05 Dolby International AB Efficient content classification and loudness estimation
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
US9166864B1 (en) * 2012-01-18 2015-10-20 Google Inc. Adaptive streaming for legacy media frameworks
KR20230020553A (ko) * 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830061A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device

Also Published As

Publication number Publication date
JP6377110B2 (ja) 2018-08-22
BR122022004786A8 (pt) 2022-09-06
PL2954519T3 (pl) 2017-06-30
US9728199B2 (en) 2017-08-08
BR122020017065B1 (pt) 2022-03-22
US11830510B2 (en) 2023-11-28
BR112015019711A2 (pt) 2017-07-18
US20240153517A1 (en) 2024-05-09
RU2602988C1 (ru) 2016-11-20
DK2954519T3 (en) 2017-03-20
EP3171361B1 (en) 2019-07-24
BR122021004537B1 (pt) 2022-03-22
BR122022004787A8 (pt) 2022-09-06
KR102142837B1 (ko) 2020-08-28
US9489957B2 (en) 2016-11-08
EP3171361A1 (en) 2017-05-24
JP6808781B2 (ja) 2021-01-06
CN105308680A (zh) 2016-02-03
MX2019012711A (es) 2019-12-16
BR122022004784B1 (pt) 2022-06-07
BR122022004786A2 (es) 2017-07-18
EP2954519B1 (en) 2017-02-01
KR20150113976A (ko) 2015-10-08
MY185848A (en) 2021-06-14
JP7033182B2 (ja) 2022-03-09
JP2018185536A (ja) 2018-11-22
MX2022004397A (es) 2022-06-16
CA2900743C (en) 2016-08-16
KR20200033988A (ko) 2020-03-30
UA113117C2 (xx) 2016-12-12
CN109410966B (zh) 2023-08-29
BR122022004787B1 (pt) 2022-10-18
US20160343383A1 (en) 2016-11-24
WO2014161992A1 (en) 2014-10-09
BR112015019711B1 (pt) 2022-04-26
BR122017006819B1 (pt) 2022-07-26
AU2014247001A1 (en) 2015-08-13
JP2016513287A (ja) 2016-05-12
MY183360A (en) 2021-02-18
JP2021047450A (ja) 2021-03-25
KR20220044609A (ko) 2022-04-08
KR20200096328A (ko) 2020-08-11
JP7413418B2 (ja) 2024-01-15
CA2900743A1 (en) 2014-10-09
KR101763129B1 (ko) 2017-07-31
US20170301362A1 (en) 2017-10-19
KR102094129B1 (ko) 2020-03-30
US20220059110A1 (en) 2022-02-24
CN109410966A (zh) 2019-03-01
AU2014247001B2 (en) 2015-08-27
KR20170087529A (ko) 2017-07-28
KR20210005315A (ko) 2021-01-13
BR122017006819A2 (pt) 2019-09-03
HK1213080A1 (zh) 2016-06-24
RU2641265C1 (ru) 2018-01-16
ES2619117T3 (es) 2017-06-23
IL240117A0 (en) 2015-09-24
BR122022004786B1 (pt) 2022-10-04
JP2022068353A (ja) 2022-05-09
KR102201951B1 (ko) 2021-01-12
CN105308680B (zh) 2019-03-19
US11114107B2 (en) 2021-09-07
JP6537683B2 (ja) 2019-07-03
KR102380370B1 (ko) 2022-04-01
MX2015011145A (es) 2016-01-12
BR122022004784B8 (pt) 2022-09-13
TW201505024A (zh) 2015-02-01
JP2024038139A (ja) 2024-03-19
EP2954519A1 (en) 2015-12-16
US10438602B2 (en) 2019-10-08
KR20240038819A (ko) 2024-03-25
US20160012825A1 (en) 2016-01-14
JP2019191596A (ja) 2019-10-31
JP6031201B2 (ja) 2016-11-24
SG11201506139YA (en) 2015-09-29
TWI546799B (zh) 2016-08-21
MY196084A (en) 2023-03-14
BR122022004787A2 (es) 2017-07-18
MX369023B (es) 2019-10-25
EP3627506A1 (en) 2020-03-25
JP2017078858A (ja) 2017-04-27
MX347936B (es) 2017-05-19
US20200098381A1 (en) 2020-03-26
HUE031660T2 (en) 2017-07-28

Similar Documents

Publication Publication Date Title
ES2748939T3 (es) Codificador y descodificador de audio