ES2644370T3

ES2644370T3 - Decodificador de audio, aparato para generar datos de salida de audio codificados y procedimientos que permiten inicializar un decodificador

Info

Publication number: ES2644370T3
Application number: ES14784448.4T
Authority: ES
Inventors: Daniel Fischer; Bernd Czelhan; Max Neuendorf; Nikolaus Rettelbach; Ingo Hofmann; Harald Fuchs; Stefan DÖHLA; Nikolaus FÄRBER
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2013-10-18
Filing date: 2014-10-14
Publication date: 2017-11-28
Anticipated expiration: 2034-10-14
Also published as: RU2651190C2; TW201523587A; US20240212697A1; US10614824B2; US20200234726A1; EP2863386A1; EP3044782A1; PL3044782T3; US9928845B2; US12080309B2; BR122021004494B1; JP6214765B2; MX2016004845A; CN110444218B; ZA201603154B; US20240203432A1; CA2925653C; MY177213A; US20190156844A1; CN105745704B

Description

DESCRIPCION

Decodificador de audio, aparato para generar datos de salida de audio codificados y procedimientos que permiten inicializar un decodificador 5

[0001] La presente invencion esta relacionada con la codificacion/decodificacion de audio y, en

particular, con una estrategia de codificacion y decodificacion de datos, que permite inicializar un decodificador como el que puede ser necesario al conmutar entre diferentes configuraciones de codecs.

10 [0002] Las realizaciones de la invencion pueden aplicarse a escenarios, en los que las propiedades de

los canales de transmision pueden variar ampliamente en funcion de la tecnologfa de acceso, como DSL, WiFi, 3G, LTE y similares. La recepcion del telefono movil puede debilitarse en interiores o en zonas rurales. La calidad de las conexiones de Internet inalambricas depende en gran medida de la distancia a la estacion base y la tecnologfa de acceso, lo que provoca fluctuaciones en la velocidad de transferencia de bits. La velocidad 15 de transferencia de bits disponible por usuario tambien puede cambiar con el numero de clientes conectados a una estacion base.

[0003] El documento WO 2010/003563 A1 describe un codificador de audio para codificar muestras de audio, que permite conmutar entre dos dominios de codificacion. Un primer dominio de codificacion puede ser

20 AAC y un segundo dominio de codificacion puede ser ACELP. Antes de conmutar de AAC a ACELP, un controlador modifica el encuadre de la ACELp de manera que una primera supertrama comprende cinco tramas en lugar de cuatro.

[0004] El documento EP 2 581 902 A1 muestra un decodificador de audio hfbrido y un nuevo codificador 25 de audio hfbrido que tiene conmutacion de bloques para senales de voz y senales de audio. Si la conmutacion

tiene lugar entre AAC y ACELP, la segunda mitad de la trama anterior i-1 se concatena para formar una trama extendida.

[0005] El documento WO 2010/005224 A2 describe un aparato para procesar una senal de audio. Al 30 conmutar entre diferentes esquemas de codificacion, se incluye adicionalmente una senal de salida de cada

esquema de codificacion antes y despues de la conmutacion para generar una parte en la que las senales de dos esquemas de codificacion se superponen entre si.

[0006] El documento EP 1 396 843 A1 A ensena un esquema de compresion de audio unificado con 35 perdidas y sin perdidas que combina compresion de audio con perdidas y sin perdidas dentro de una misma

senal de audio. La compresion mixta sin perdidas codifica una trama de transicion entre tramas de codificacion con perdidas y sin perdidas para producir transiciones sin fisuras. La codificacion mixta sin perdidas ejecuta una transformada con superposicion y una transformada con superposicion inversa para producir una trama debidamente segmentada en ventanas y doblada en el dominio del pseudotiempo que puede ser 40 posteriormente codificada sin perdidas. La codificacion mixta sin perdidas tambien puede aplicarse a tramas que presentan un mal resultado de compresion con perdidas.

[0007] El objetivo de la invencion es proporcionar un concepto que permita suministrar contenido de audio de una manera flexible.

45

[0008] Segun la invencion, este objetivo se consigue mediante un decodificador de audio segun la reivindicacion 1, un aparato para generar datos de salida de audio codificados segun la reivindicacion 7, un procedimiento de decodificacion datos de entrada de audio segun la reivindicacion 15, un procedimiento para generar datos de audio codificados segun la reivindicacion 18 y un programa informatico segun la

50 reivindicacion 20.

[0009] Las realizaciones de la invencion proporcionan un decodificador de audio para decodificar una corriente de bits de datos de audio codificados, en el que la corriente de bits de datos de audio codificado representa una secuencia de valores de muestra de audio y comprende una pluralidad de tramas, en el que

55 cada trama incluye valores de muestra de audio codificados asociados, el decodificador de audio que comprende:

un determinador configurado para determinar si una trama de los datos de audio codificados es una trama especial que comprende valores de muestra de audio codificados asociados con la trama especial e

informacion adicional, en la que la informacion adicional comprende valores de muestra de audio codificados de un numero de tramas que preceden a la trama especial, en el que los valores de la muestra de audio codificados de las tramas precedentes estan codificados utilizando la misma configuracion de codec que la trama especial, en el que el numero de tramas precedentes, correspondiente a las tramas prerrodadas, se 5 corresponde con el numero de tramas que el decodificador necesita para construir la serial completa durante la puesta en marcha del decodificador de modo que este en posicion de decodificar los valores de muestra de audio asociados con la trama especial si la trama especial es la primera trama despues de la puesta en marcha del decodificador; y

10 un inicializador configurado para inicializar el decodificador si el determinador determina que la trama es una trama especial, en el que inicializar el decodificador comprende decodificar los valores de muestra de audio codificados incluidos en la informacion adicional antes de decodificar los valores de muestra de audio codificados asociados con la trama especial,

15 en el que el inicializador esta configurado para conmutar el decodificador de audio desde una configuracion de codec actual a una configuracion de codec diferente si el determinador determina que la trama es una trama especial y si los valores de muestra de audio de la trama especial se han codificado utilizando la configuracion de codec diferente, y

20 en el que el decodificador esta configurado para decodificar la trama especial utilizando la configuracion de codec actual y descartar la informacion adicional si el determinador determina que la trama es una trama especial y si los valores de muestra de audio de la trama especial se han codificado utilizando la configuracion de codec actual.

25 [0010] Las realizaciones de la invencion proporcionan un aparato para generar una corriente de bits de

datos de audio codificados, que representa una secuencia de valores de muestra de audio de una serial de audio, en el que la corriente de bits de datos de audio codificado comprende una pluralidad de tramas en la que cada trama incluye valores de muestra de audio codificados asociados, en el que el aparato comprende:

30 un proveedor de trama especial configurado para proporcionar al menos una de las tramas como una trama especial, la trama especial que comprende valores de muestra de audio codificados asociados con la trama especial e informacion adicional, en el que la informacion adicional comprende valores de muestra de audio codificados de un numero de tramas que preceden a la trama especial, en el que los valores de la muestra de audio codificada de las tramas precedentes estan codificados utilizando la misma configuracion de codec que 35 la trama especial, y en el que el numero de tramas precedentes, correspondiente a tramas prerrodadas, se corresponde con el numero de tramas que necesita un decodificador para construir la serial completa durante la puesta en marcha del decodificador de modo que este en posicion de decodificar los valores de muestra de audio asociados con la trama especial si la trama especial es la primera trama despues de la puesta en marcha del decodificador, y 40

una salida configurada para emitir la corriente de bits de datos de audio codificados,

en el que los datos de audio codificados comprenden una pluralidad de segmentos, en el que cada segmento esta asociado con una de una pluralidad de partes de la secuencia de valores de muestra de audio y 45 comprende una pluralidad de tramas, en el que el sumador de tramas especial esta configurado para anadir una trama especial en el comienzo de cada segmento independientemente de si la configuracion del codec cambia o no.

[0011] Las realizaciones de la invencion proporcionan un procedimiento de decodificacion una corriente

50 de bits de datos de audio codificados, en el que la corriente de bits de datos de audio codificados representa una secuencia de valores de muestra de audio y comprende una pluralidad de tramas, en la que cada trama incluye valores de muestra de audio codificados asociados, que comprende:

determinar si una trama de los datos de audio codificados es una trama especial que comprende valores de 55 muestra de audio codificados asociados con la trama especial e informacion adicional, en la que la informacion adicional comprende valores de muestra de audio codificados de un numero de tramas que preceden a la trama especial, en la que los valores de muestra de las tramas precedentes se codifican utilizando la misma configuracion de codec que la trama especial, en la que el numero de tramas precedentes, correspondiente a las tramas prerrodadas, se corresponde con el numero de tramas que necesita un decodificador para construir

la serial completa durante la puesta en marcha del decodificador de modo que este en posicion de decodificar los valores de muestra de audio asociados con la trama especial si la trama especial es la primera trama despues de la puesta en marcha del decodificador;

5 inicializar el decodificador si se determina que la trama es una trama especial, en el que la inicializacion comprende decodificar los valores de muestra de audio codificados incluidos en la informacion adicional antes de decodificar los valores de muestra de audio codificados asociados con la trama especial;

conmutar el decodificador de audio desde una configuracion de codec actual a una configuracion de codec 10 diferente si se determina que la trama es una trama especial y si los valores de muestra de audio de la trama especial se han codificado utilizando la configuracion de codec diferente; y

decodificar la trama especial utilizando la configuracion de codec actual y descartar la informacion adicional si se determina que la trama es una trama especial y si los valores de muestra de audio de la trama especial se 15 han codificado utilizando la configuracion de codec actual.

[0012] Las realizaciones de la invencion proporcionan un procedimiento para generar una corriente de bits de datos de audio codificados que representan una secuencia de valores de muestra de audio de una serial de audio, en el que la corriente de bits de datos de audio codificados comprende una pluralidad de

20 tramas, en el que cada trama incluye valores de muestra de audio codificados asociados, que comprende:

proporcionar al menos una de las tramas como una trama especial, la trama especial que comprende valores de muestra de audio codificados asociados con la trama especial e informacion adicional, en la que la informacion adicional comprende valores de muestra de audio codificados de un numero de tramas que 25 preceden a la trama especial, en la que los valores de la muestra de audio codificada de las tramas precedentes estan codificados utilizando la misma configuracion de codec que la trama especial, y en el que el numero de tramas precedentes, correspondiente a tramas prerrodadas, se corresponde con el numero de tramas que necesita el decodificador para construir la serial completa durante la puesta en marcha del decodificador de modo que este en posicion de decodificar los valores de muestra de audio asociados con la 30 trama especial si la trama especial es la primera trama despues de la puesta en marcha del decodificador, y

generar la corriente de bits concatenando la trama especial y las otras tramas de la pluralidad de tramas,

en el que los datos de audio codificados comprenden una pluralidad de segmentos, en el que cada segmento 35 esta asociado con una de una pluralidad de partes de la secuencia de valores de muestra de audio y comprende una pluralidad de tramas, en el que se anade una trama especial al comienzo de cada segmento independientemente de si la configuracion del codec cambia o no.

[0013] Las realizaciones de la invencion se basan en el hallazgo de que se puede conseguir la 40 reproduccion inmediata de una corriente de bits de datos de audio codificados, que representan una secuencia

de valores de muestra de audio de una senal de audio y que comprende una pluralidad de tramas, si una de las tramas se proporciona como una trama especial que incluye valores de muestra de audio codificados asociados con las tramas precedentes, que son necesarios para iniciar un decodificador que este en posicion de decodificar los valores de muestra de audio codificados asociados con la trama especial. Por consiguiente, 45 el numero de tramas necesarios para iniciar el decodificador depende de la configuracion de codec utilizada y es conocido por las configuraciones de codecs. Las realizaciones de la invencion se basan en el hallazgo de que la conmutacion entre diferentes configuraciones de codecs se puede conseguir de una manera beneficiosa si dicha trama especial esta dispuesta en una posicion en la cual tendra lugar la conmutacion entre las configuraciones de codificacion. La trama especial no solo puede incluir valores de muestra de audio 50 codificados asociados con la trama especial, sino tambien informacion adicional que permite una conmutacion entre configuraciones de codecs y una reproduccion inmediata despues de la conmutacion. En las realizaciones de la invencion, el aparato y el procedimiento para generar datos de salida de audio codificados y el codificador de audio estan configurados para preparar datos de audio codificados de tal manera que puede tener lugar una respuesta inmediata en el lado del decodificador al conmutar entre configuraciones de codecs. 55 En las realizaciones de la invencion, dichos datos de audio generados y emitidos en el lado del codificador se reciben como datos de entrada de audio en el lado del decodificador y permiten una reproduccion inmediata en el lado del decodificador. En las realizaciones de la invencion, se permite la repeticion inmediata en el lado del decodificador al conmutar entre diferentes configuraciones de codecs en el lado del decodificador.

[0014] En las realizaciones de la invencion, la informacion adicional comprende informacion sobre la configuracion de codec utilizada para codificar los valores de muestra de audio asociados con la trama especial, en el que el determinador esta configurado para determinar si la configuracion de codec de la informacion adicional es diferente de la configuracion de codec actual.

5

[0015] En las realizaciones de la invencion, el decodificador de audio comprende un desvanecedor cruzado configurado para ejecutar un desvanecimiento cruzado entre una pluralidad de valores de muestra de salida obtenidos utilizando la configuracion de codec actual y una pluralidad de valores de muestra de salida obtenidos mediante la decodificacion de los valores de muestra de audio codificados asociados con la trama

10 especial. En las realizaciones de la invencion, el desvanecedor cruzado esta configurado para ejecutar el desvanecimiento cruzado de valores de muestra de salida obtenidos mediante el vaciamiento del decodificador en la configuracion de codec actual y valores de muestra de salida obtenidos mediante la decodificacion de los valores de muestra de audio codificados asociados con la trama especial.

15 [0016] En las realizaciones de la invencion, una primera trama del numero de tramas comprendidas en

la informacion adicional no esta codificada de manera diferencial en el tiempo o codificada por entropfa en relacion con ninguna trama anterior a la trama mas temprana y en la que la trama especial no esta codificada de manera diferencial en el tiempo o codificada por entropfa en relacion con cualquier trama anterior a la primera trama del numero de tramas que preceden a la trama especial o en relacion con cualquier trama

20 anterior a la trama especial.

[0017] En las realizaciones de la invencion, la trama especial comprende la informacion adicional como una carga de extension y en la que el determinador esta configurado para evaluar la carga de extension de la trama especial. En las realizaciones de la invencion, la informacion adicional comprende informacion sobre la

25 configuracion de codec utilizada para codificar los valores de muestra de audio asociados con la trama especial.

[0018] En las realizaciones de la invencion, los datos de audio codificados comprenden una pluralidad de segmentos, en los que cada segmento esta asociado con una de una pluralidad de partes de la secuencia

30 de valores de muestra de audio y comprende una pluralidad de tramas, en los que el sumador de tramas especiales esta configurado para sumar una trama especial al comienzo de cada segmento.

[0019] En la realizacion de la invencion, los datos de audio codificados comprenden una pluralidad de segmentos, en los que cada segmento esta asociado con una de una pluralidad de partes de la secuencia de

35 valores de muestra de audio y comprende una pluralidad de las tramas, en los que el aparato para generar un bit de datos de audio codificados comprende un proveedor de segmentos configurado para proporcionar segmentos asociados con diferentes partes de la secuencia de valores de muestra de audio y codificados por diferentes configuraciones de codec, en los que el proveedor de tramas especiales esta configurado para proporcionar una primera trama, de al menos uno de los segmentos, como la trama especial; y un generador

40 configurado para generar los datos de salida de audio disponiendo al menos uno de los segmentos despues de otro de los segmentos. En las realizaciones de la invencion, el proveedor de segmentos esta configurado para seleccionar una configuracion de codec para cada segmento basado en una serial de control. En las realizaciones de la invencion, el proveedor de segmentos esta configurado para proporcionar m versiones codificadas de la secuencia de valores de muestra de audio, con m > 2, en el que las m versiones codificadas

45 se codifican utilizando diferentes configuraciones de codec, en el que cada version codificada comprende una pluralidad de segmentos que representa la pluralidad de partes de la secuencia de valores de muestra de audio, en el que el proveedor de tramas especiales esta configurado para proporcionar una trama especial en el comienzo de cada uno de los segmentos.

50 [0020] En las realizaciones de la invencion, el proveedor de segmentos comprende una pluralidad de codificadores, cada uno configurado para codificar, al menos en parte, la serial de audio segun una de la pluralidad de configuraciones de codecs diferentes. En las realizaciones de la invencion, el proveedor de segmentos comprende una memoria que almacena las m versiones codificadas de la secuencia de valores de muestra de audio.

55

[0021] En las realizaciones de la invencion, la informacion adicional esta en forma de una carga de extension de la trama especial.

[0022] En las realizaciones de la invencion, la corriente de bits de datos de audio codificados comprende

un primer numero de tramas codificadas que utiliza una primera configuracion de codec y un segundo numero de tramas que sigue al primer numero de tramas y codificadas utilizando una segunda configuracion de codec, en el que la primera trama del segundo numero de tramas es la trama especial.

5 [0023] En las realizaciones de la invencion, la informacion adicional comprende informacion sobre la configuracion de codec utilizada para codificar los valores de muestra de audio asociados con la trama especial y el procedimiento comprende determinar si la configuracion de codec de la informacion adicional es diferente de la configuracion de codec actual que utiliza los valores de muestra de audio codificados en la corriente de bits, que preceden a la trama especial, que estan codificados.

10

[0024] Por lo tanto, en las realizaciones de la invencion, se realiza el desvanecimiento cruzado para permitir la conmutacion sin fisuras entre diferentes configuraciones de codec. En las realizaciones de la invencion, la informacion adicional de la trama especial comprende las tramas prerrodadas necesarias con el fin de inicializar un decodificador para que este en posicion de decodificar la trama especial. En otras palabras,

15 en las realizaciones de la invencion, la informacion adicional comprende una copia de dichas tramas de valores de muestra de audio codificados que preceden a la trama especial y se codifican utilizando la misma configuracion de codec que los valores de muestra de audio codificados representados por la trama especial necesaria para inicializar el decodificador y ponerlo en posicion de decodificar los valores de muestra de audio asociados con la trama especial.

20

[0025] En las realizaciones de la invencion, se introducen tramas especiales en los datos de audio codificados a intervalos de tiempo regulares, es decir, de una manera periodica. En las realizaciones de la invencion, una primera trama de cada segmento de los datos de audio codificados es una trama especial. En realizaciones, el decodificador de audio esta configurado para decodificar las tramas especiales y las tramas

25 siguientes utilizando la configuracion de codec indicada en la trama especial hasta que se encuentre una trama especial adicional que indique una configuracion de codec diferente.

[0026] En las realizaciones de la invencion, el decodificador y el procedimiento de decodificacion estan configurados para realizar un desvanecimiento cruzado cuando cambian de una configuracion de codec a otra

30 configuracion de codec, con el fin de permitir la conmutacion sin fisuras entre multiples representaciones de audio comprimidas.

[0027] En las realizaciones de la invencion, las diferentes configuraciones de codecs son diferentes configuraciones de codecs segun la norma AAC (Advanced Audio Coding), es decir, diferentes configuraciones

35 de codecs de los codecs de la familia AAC. Las realizaciones de la invencion pueden estar dirigidas a conmutar entre configuraciones de codecs de los codecs de la familia AAC y configuraciones de codecs de los codecs de la familia AMR (Adaptive Multiple Rate).

[0028] De este modo, las realizaciones de la invencion permiten la reproduccion inmediata en el lado del 40 decodificador y la conmutacion entre diferentes configuraciones de codecs, de modo que la manera en que se

suministra el contenido de audio puede adaptarse a las condiciones ambientales, como un canal de transmision con una velocidad de transferencia de bits variable. De este modo, realizaciones de la invencion permiten proporcionar al consumidor la mejor calidad de audio posible para un estado de la red dado.

45 [0029] A continuacion, se analizan las realizaciones de la invencion con respecto a los dibujos adjuntos

en los que:

La Fig. 1 muestra una vista esquematica de una realizacion de un aparato para generar datos de salida de audio codificados;

50 La Fig. 2 muestra una vista esquematica para explicar una realizacion de una trama especial;

La Fig. 3 muestra una vista esquematica de diferentes representaciones de una serial de audio;

La Fig. 4a y 4b muestran vistas esquematicas de aparatos para generar datos de salida de audio codificados;

La Fig. 5 muestra una vista esquematica de un decodificador de audio;

La Fig. 6 muestra un diagrama de bloques esquematico para explicar una realizacion de un decodificador de 55 audio y un procedimiento de decodificacion;

La Fig. 7 muestra un diagrama de bloques esquematico para explicar la conmutacion de un decodificador de audio entre diferentes configuraciones de codecs;

La Fig. 8 muestra un diagrama esquematico para explicar el comportamiento del decodificador AAC (Advanced Audio Coding);

La Fig. 9 muestra la conmutacion de una primera corriente 1 a una segunda corriente 2; y La Fig. 10 muestra un elemento de sintaxis ejemplar que proporciona informacion adicional.

[0030] En general, las realizaciones de la invencion tienen como objetivo el suministro de contenido de 5 audio, posiblemente combinado con el suministro de video, a traves de un canal de transmision con una velocidad de transferencia de bits variable. El objetivo puede ser proporcionar al consumidor la mejor calidad de audio posible para un estado de la red determinado. Las realizaciones de la invencion se centran en la implementacion de codecs de la familia AAC en un entorno de transmision adaptativa.

10 [0031] En las realizaciones de la invencion, como las que se utilizan en la presente memoria, los valores de muestra de audio que no estan codificados representan valores de muestra de audio en el dominio del tiempo, como muestras PCM (modulacion por codigo de impulsos). En las realizaciones de la invencion, el termino valor de muestra de audio codificado se refiere a valores de muestra en el dominio de la frecuencia obtenidos despues de codificar los valores de muestra de audio en el dominio del tiempo. En las realizaciones 15 de la invencion, los valores de muestras o muestras de audio codificados se obtienen mediante la conversion de las muestras en el dominio del tiempo en una representacion espectral, por ejemplo, mediante una MDCT (transformada discreta del coseno modificada) y codificando el resultado, por ejemplo, mediante cuantificacion y codificacion Huffman. De acuerdo con ello, en la realizacion de la invencion, codificar significa obtener las muestras en el dominio de la frecuencia de las muestras en el dominio del tiempo y decodificar significa 20 obtener las muestras en el dominio del tiempo de las muestras en el dominio de la frecuencia. Los valores de muestra (muestras) obtenidos, mediante la decodificacion de los datos de audio codificados, a veces en este documento se denominan valores de muestra de salida (muestras).

[0032] La Fig. 1 muestra una realizacion de un aparato para generar datos de salida de audio 25 codificados. La Fig. 1 muestra un escenario tfpico de transmision de audio adaptativa, en la cual se pueden

aplicar las realizaciones de la invencion. Una serial de entrada de audio 10 esta codificada por varios codificadores de audio 12, 14, 16 y 18, es decir, codificadores 1 a m. Los codificadores 1 a m se pueden configurar para codificar la serial de entrada de audio 10 simultaneamente. Normalmente, los codificadores 1 a m pueden configurarse de tal manera que se pueda lograr un amplio intervalo de tasa de bits. Los 30 codificadores generan diferentes representaciones, es decir, versiones codificadas 22, 24, 26 y 28 de la serial de entrada de audio 10, es decir, representaciones 1 a m. Cada representacion incluye una pluralidad de segmentos 1 a k, en el que el segundo segmento de la primera representacion ha recibido el numero de referencia 30, unicamente con fines ejemplares. Cada segmento comprende una pluralidad de tramas (unidades de acceso) designadas con las letras AU y un fndice respectivo 1 a n que indica la posicion de la 35 trama en la representacion respectiva. La octava trama de la primera representacion recibe el numero de referencia 40 solo con fines ejemplares.

[0033] Los codificadores 12, 14, 16 y 18 estan configurados para insertar puntos de acceso a la corriente (SAP) 42 a intervalos de tiempo regulares, que definen los tamanos de los segmentos. De este modo, un

40 segmento, como el segmento 30, consiste en multiples tramas, como AU5, AU6, AU7 y AU8, en el que la primera trama, AU5, representa un SAP 42. En la Fig. 1, los SAP se indican con un sombreado. Cada representacion 1 a m representa una representacion de audio comprimida (CAR) para la senal de entrada de audio 10 y consiste en k de dichos segmentos. La conmutacion entre diferentes cAr puede tener lugar en los lfmites de segmento.

45

[0034] En el lado del decodificador, un cliente puede solicitar una de las representaciones que mejor se ajuste a una situacion dada, por ejemplo, para estados de la red determinados. Si por alguna razon el estado cambia, el cliente debe poder solicitar un CAR diferente, el aparato para generar los datos de salida codificados debe ser capaz de conmutar entre diferentes CAR en cada lfmite de segmento, y el decodificador

50 debe ser capaz de conmutar para decodificar el CAR diferente en cada lfmite de segmento. Por lo tanto, el cliente estaria en una posicion de adaptar el promedio de tasa de bits a la tasa de bits disponible en el canal con el fin de maximizar la calidad al mismo tiempo que se minimiza el bufer bajo ejecuciones ("re-buffering"). Si se utiliza HTTP (Hyper Text Transfer Protocol) para descargar los segmentos, dicha arquitectura de transmision puede denominarse como transmision adaptativa sobre HTTP. Las implementaciones actuales 55 incluyen Apple HTTP Live Streaming (HLS), Microsoft Smooth Streaming y Adobe Dynamic Streaming, que siguen el principio basico. Recientemente, MPEG ha lanzado un estandar abierto: Dynamic Adaptive Streaming sobre HTTP (MpEG DASH), vease "Guidelines for Implementation: DASH-AVC/264 Interoperability Points",
http://dashif.org/w/2013/08/DASH-AVC-264- v2.00-hd-mca.pdf. HTTP normalmente utiliza TCp/IP (Protocolo de control de transmision/Protocolo de Internet) como el protocolo de red subyacente. Las realizaciones de la

invencion se pueden aplicar a todos los desarrollos actuales.

[0035] Una conmutacion entre representaciones (versiones codificadas) debe ser con las minimas fisuras posible. En otras palabras, no debe haber ningun defecto o clic audible durante la conmutacion. Sin

5 otras medidas previstas por las realizaciones de la invencion, este requisito solo puede conseguirse con determinadas limitaciones y si se toma especial cuidado durante el procedimiento de codificacion.

[0036] En la Fig. 1, el respectivo codificador del que procede un segmento se indica mediante una marca respectiva colocada dentro de un cfrculo. La Fig. 1 muestra ademas un motor de decision 50, que decide que

10 representacion hay que descargar para cada segmento. Un generador 52 genera datos de salida de audio codificados 54 a partir de los segmentos seleccionados que reciben los numeros de referencia 44, 46 y 48 en la Fig. 1 concatenando los segmentos seleccionados. Los datos de salida de audio codificados 54 pueden ser suministrados a un decodificador 60 configurado para decodificar los datos de salida de audio codificados en una serial de salida de audio 62 que comprende las muestras de salida de audio.

15

[0037] En la realizacion que se muestra en la Fig. 1, los segmentos y, por lo tanto, las tramas, procedentes de diferentes codificadores, se introducen en el mismo decodificador 60, por ejemplo, AU4 desde el codificador 2 y AU5 desde el codificador 3 en el ejemplo de la Fig. 1. En el caso de que se use la misma instancia de decodificador para decodificar estas AU es necesario que ambos codificadores sean compatibles

20 entre si. En particular, sin medidas adicionales, esta estrategia no puede funcionar si los dos codificadores proceden de una familia de codecs completamente diferente, por ejemplo, AMR para el codificador 2 y G.711 para el codificador 3. Sin embargo, incluso cuando se utiliza el mismo codec en todas las representaciones, se debe tener especial cuidado en restringir el procedimiento de codificacion. Esto se debe a que un codec de audio moderno, como Advanced Audio Coding (AAC), son algoritmos flexibles que pueden funcionar en

25 diversas configuraciones utilizando diversas herramientas y modos de codificacion. Ejemplos de dichas herramientas de codificacion en AAC son Spectral Band Replication (SBR) o Short Blocks (SB). Otros parametros de configuracion importantes son la frecuencia de muestreo (fs, por ejemplo, 48 kHz) o la configuracion del canal (mono, estereo, envolvente). Con el fin de decodificar correctamente las tramas (AU), el decodificador debe saber que herramientas se utilizan y como se configuran (por ejemplo, fs o frecuencia de

30 cruce doble SBR). Por lo tanto, en general, la informacion requerida se codifica en una cadena de configuracion corta y se pone a disposicion del decodificador antes de la decodificacion. Estos parametros de configuracion pueden denominarse como configuracion de codec. En el caso de AAC, esta configuracion se conoce como la configuracion especffica de audio (ASC).

35 [0038] Hasta ahora, a fin de lograr una conmutacion sin fisuras, era necesario restringir la configuracion del codec para que fuera compatible entre las representaciones (versiones codificadas). Por ejemplo, la frecuencia de muestreo o las herramientas de codificacion normalmente deben ser identicas en todas las representaciones. Si se utilizan configuraciones de codecs incompatibles entre representaciones, entonces el decodificador tiene que ser reconfigurado. Esto significa basicamente que el decodificador viejo tiene que

40 cerrarse y el decodificador nuevo tiene que iniciarse con una nueva configuracion. Sin embargo, este procedimiento de reconfiguracion no es transparente en todas las circunstancias y puede causar un defecto. Una posible explicacion es que el decodificador nuevo no puede producir muestras validas inmediatamente, sino que requiere varias AU prerrodadas para construir la intensidad de la serial completa. Este comportamiento de puesta en marcha es tfpico de los codecs que tienen un estado del decodificador, es decir,

45 en los casos en que la decodificacion de la AU actual no es completamente independiente de la decodificacion de AU anteriores.

[0039] Como resultado de este comportamiento, normalmente se requerfa que la configuracion del codec fuera constante en todas las representaciones y el unico parametro cambiante era la tasa de bits. Este

50 es, por ejemplo, el caso del perfil DASH-AVC/264 tal como se define por el DASH Industry Forum.

[0040] Esta restriccion limito la flexibilidad del codec y, por lo tanto, la eficacia de la codificacion en el intervalo completo de tasa de bits. Por ejemplo, SBR es una valiosa herramienta de codificacion para velocidades de transferencia de bits muy bajas, pero limita la calidad de audio a velocidades de transferencia

55 de bits altas. Por lo tanto, si se requiere que la configuracion codificada sea constante, es decir, con o sin SBR, se tenia que llegar a una solucion de compromiso sobre una velocidad de transferencia de bits alta o baja. Del mismo modo, la eficacia de la codificacion podrfa beneficiarse de cambiar la frecuencia de muestreo a traves de las representaciones, pero tendrfa que mantenerse constante debido a las limitaciones antes mencionadas para una conmutacion sin fisuras.

[0041] Las realizaciones de la presente invencion estan dirigidas a una estrategia novedosa que permite la conmutacion de audio sin fisuras en un entorno de transmision adaptativo y, en particular, que permite una conmutacion de audio sin fisuras para codecs de audio de la familia AAC en un entorno de transmision

5 adaptativo. La estrategia de la invencion esta disenada para solucionar todas las deficiencias resultantes de las restricciones sobre la configuracion del codec tal como se ha descrito anteriormente. El objetivo general es tener mas flexibilidad en la configuracion a traves de las representaciones (versiones codificadas), tales como las herramientas de codificacion o la frecuencia de muestreo, al mismo tiempo que se habilita o se garantiza una conmutacion sin fisuras.

10

[0042] Las realizaciones de la invencion se basan en el hallazgo de que pueden superarse las restricciones explicadas anteriormente y se puede conseguir una mayor flexibilidad anadiendo una trama especial que transporta informacion adicional ademas de valores de muestra de audio codificados asociados con la trama especial entre otras tramas de datos de audio codificados como una representacion de audio

15 comprimido (CAR). Una representacion de audio comprimido puede considerarse como una pieza de material de audio (musica, voz, ...) despues de la compresion mediante un codificador de audio con perdidas o sin perdidas, por ejemplo, un codificador de audio de la familia AAC (AAC, HE-AAC, MPEG-D USAC, ...) con una velocidad de transferencia de bits global constante. En particular, la informacion adicional en la trama especial esta disenada para permitir una reproduccion instantanea en el lado del decodificador incluso en el caso de 20 una conmutacion entre diferentes configuraciones de codecs. Por lo tanto, la trama especial puede denominarse trama de reproduccion instantanea (IPF). La IPF esta configurado para compensar el retardo de la puesta en marcha del decodificador y se utiliza para transmitir informacion de audio en tramas anteriores junto con los datos de la trama actual.

25 [0043] Un ejemplo de dicha IPF 80 se muestra en la Fig. 2. La Fig. 2 muestra una serie de tramas (unidades de acceso) 40, numeradas de n-4 a n+3. Cada trama incluye valores de muestra de audio codificados asociados, es decir, valores de muestra de audio codificados de un numero especffico de valores de muestra de audio en el dominio del tiempo de una secuencia de valores de muestra de audio en el dominio del tiempo que representan una senal de audio, tal como la senal de entrada de audio 10. Por ejemplo, cada 30 trama puede comprender valores de muestra de audio codificados que representan 1024 valores de muestra de audio en el dominio del tiempo, es decir, valores de muestra de audio de una senal de audio no codificada. En la Fig. 2, la trama n dispuesta entre la trama anterior n-1 y la trama siguiente n+1 representa la trama especial o IPF 80. La trama especial 80 incluye informacion adicional 82. La informacion adicional 82 incluye informacion 84 sobre la configuracion del codec, es decir, informacion sobre la configuracion del codec 35 utilizada para codificar la corriente de datos que incluye las tramas n-4 a n+3 y, por lo tanto, informacion sobre la configuracion del codec utilizada para codificar valores de muestra de audio asociados con la trama especial.

[0044] En la realizacion que se muestra en la Fig. 2, se supone que un retardo introducido por un decodificador de audio es de tres tramas, es decir, se supone que se necesitan tres tramas denominadas

40 prerrodadas para construir la senal completa durante la puesta en marcha del decodificador de audio. Por lo tanto, suponiendo que la configuracion de la corriente (configuracion del codec) es conocida por el decodificador, normalmente el decodificador tendrfa que comenzar a decodificar en la trama n-3 para producir muestras validas en la trama n. De este modo, para proporcionar la informacion necesaria al decodificador, la informacion adicional 82 comprende un numero de tramas de valores de muestra de audio codificados que 45 preceden a la trama especial 80 y se codifican utilizando la configuracion de codec 84 indicada en la informacion adicional 82. Este numero de tramas se indica mediante el numero de referencia 86 en la Fig. 2. Este numero de tramas 86 es necesario para inicializar el decodificador en una posicion para decodificar los valores de muestra de audio asociados con la trama especial n. Por consiguiente, la informacion de la trama 86 se duplica y se transporta como parte de la trama especial 80. Por lo tanto, esta informacion esta disponible 50 para el decodificador inmediatamente despues de conmutar a la corriente de datos que se muestra en la Fig 2 en la trama n. Sin esta informacion adicional en la trama n, ni la configuracion de codec 84 ni las tramas n-3 a n-1 estarfan disponibles para el decodificador despues de una conmutacion. Al anadir esta informacion a la trama especial 80 permite inicializar inmediatamente el decodificador y, por lo tanto, la reproduccion inmediata al conmutar a una corriente de datos que comprende la trama especial. El decodificador esta configurado de tal 55 manera que dicha inicializacion y decodificacion de la trama n se pueden realizar dentro de la ventana de tiempo disponible hasta que las muestras de salida obtenidas por la trama de decodificacion n tienen que ser emitidas.

[0045] Durante la decodificacion normal, es decir, sin conmutar a una configuracion de codec diferente,

solo se decodifica la trama n y se ignoran las tramas n-3 a n-1 incluidas en la informacion adicional. Sin embargo, despues de conmutar a una configuracion de codec diferente, se extrae toda la informacion en la trama especial 80 y se inicializa el decodificador basandose en la configuracion de codec incluida y basandose en la decodificacion de las tramas prerrodadas (n-3 a n-1) antes de decodificar finalmente y reproducir la trama 5 actual n. La decodificacion de las tramas prerrodadas tiene lugar antes de que la trama actual se decodifique y se reproduzca. Las tramas prerrodadas no se vuelven a reproducir, pero el decodificador esta configurado para decodificar las tramas prerrodadas dentro de la ventana de tiempo disponible antes de la reproduccion de la trama actual n.

10 [0046] El termino "configuracion del codec" hace referencia a la configuracion del codec utilizada para codificar datos de audio o tramas de datos de audio. Por lo tanto, la configuracion de la codificacion puede indicar diferentes herramientas de codificacion y modos utilizados, en la que las herramientas de codificacion ejemplares utilizadas en AAC son una replicacion de la banda espectral (SBR) o bloques cortos (SB). Un parametro de configuracion puede ser la frecuencia de cruce doble SBR. Otros parametros de configuracion 15 pueden ser la frecuencia de muestreo o la configuracion del canal. Diferentes configuraciones de codecs difieren en uno o mas de estos parametros de configuracion. En las realizaciones de la invencion, diferentes configuraciones de codecs pueden comprender tambien codecs completamente diferentes, tales como AAC, AMR o G.711.

20 [0047] Por consiguiente, en el ejemplo que se ilustra en la Fig. 2, son necesarias tres tramas, es decir, n- 3 a n-1 para compensar el retardo de puesta en marcha del decodificador. Los datos de tramas adicionales pueden ser transmitidos mediante un mecanismo de carga de extension dentro de la corriente de bits de audio. Por ejemplo, el mecanismo de carga de extension USAC (UsacExtElement) puede utilizarse para transportar la informacion adicional. Ademas, el campo "config" puede utilizarse para transmitir la configuracion de la 25 corriente 94. Esto puede ser util en caso de conmutacion de corrientes de bits o adaptacion de la velocidad de transferencia de bits. Ambos, la primera AU prerrodada (n-3) y la propia IPF (n) pueden ser una trama decodificable de manera independiente. En el contexto de USAC, los codificadores pueden establecer un indicador (usacIndependencyFlag) a "1" para esas tramas. Implementando la estructura de trama como se muestra en la Fig. 2 es posible acceder a la corriente de bits en cada IPF y reproducir muestras PCM validas 30 de forma inmediata. El procedimiento de decodificacion de una IPF puede incluir las siguientes etapas. Decodificar todas las AU "prerrodadas" (n-3 ... n-1) y descartar las muestras PCM de salida resultantes. Los estados del decodificador interno y los buferes se inicializan completamente despues de esta etapa. Decodificar la trama n e iniciar la reproduccion regular. Continuar decodificando de la forma habitual con la trama n+1. La IPF puede utilizarse como un punto de acceso a la corriente de audio (SAP). La reproduccion 35 inmediata de muestras PCM validas es posible en cada IPF.

[0048] Las tramas especiales tal como se definen en el presente documento pueden implementarse en cualquier codec que permita la multiplexion y la transmision de datos auxiliares o datos de extension o elementos de corriente de datos o mecanismos similares para transmitir datos externos de codecs de audio. 40 Las realizaciones de la invencion se refieren a la implementacion de un entramado de codecs USAC. Las realizaciones de la invencion pueden implementarse en relacion con codificadores y decodificadores de audio USAC. USAC significa codificacion unificada de voz y audio y se hace referencia a la norma ISO/IEC 23003-3: 2012. En las realizaciones de la invencion, la informacion adicional esta contenida en una carga de extension de la trama correspondiente, tal como la trama n en la Fig. 2. Por ejemplo, la norma USAC permite la adicion 45 de una carga de extension arbitraria a datos de audio codificados. La existencia de una carga de extension es conmutable sobre una base de trama a trama. Por consiguiente, la informacion adicional puede ser implementada como un nuevo tipo de carga de extension definido para transportar informacion de audio adicional de tramas anteriores.

50 [0049] Como se ha explicado anteriormente, la trama de reproduccion instantanea 80 esta disenada de tal manera que las muestras de salida validas asociadas con una determinada marca de tiempo (trama n) se pueden generar inmediatamente, es decir, sin tener que esperar el numero especffico de tramas segun el retardo del codec de audio. Dicho de otro modo, el retardo del codec de audio puede ser compensado. En la realizacion que se muestra en la Fig. 2, el retardo del codec de audio es de tres tramas. Ademas, la IPF esta 55 disenada de tal manera que se puede decodificar completa e independientemente, es decir, sin ningun conocimiento adicional de la corriente de audio anterior. A este respecto, el primer numero de tramas anadidas a la trama especial (es decir, la trama n-3 en la Fig. 2) no esta codificado por tiempo diferencial o codificado por entropfa en relacion con ninguna trama anterior. Asf mismo, la trama especial no esta codificada por tiempo diferencial o codificada por entropfa en relacion con ninguna trama anterior al primer numero de tramas

contenidas en la informacion adicional o cualquier trama anterior. Dicho de otro modo, en las tramas n-3 y n de la Fig. 2 pueden eliminarse todas las dependencias con las tramas anteriores, por ejemplo, la codificacion diferencial en el tiempo de ciertos parametros o restablecer la codificacion por entropfa. Por lo tanto, estas tramas independientes permiten una correcta decodificacion y analisis de todos los sfmbolos, pero no son 5 suficientes en si mismos para obtener muestras PCM validas instantaneamente. Mientras que dichas tramas independientes ya estan disponibles en codecs de audio comunes, tales como AAC o USAC, dichos codecs de audio no proporcionan tramas especiales, como la trama IPF 80.

[0050] En las realizaciones de la invencion, se proporciona una trama especial en cada punto de acceso 10 a la corriente de las representaciones que se muestran en la Fig. 1. En la Fig. 1, los puntos de acceso a la

corriente son la primera trama en cada segmento y estan sombreados. Por consiguiente, la Fig. 1 muestra una realizacion especffica de un aparato para generar datos de salida de audio codificados segun la presente invencion. Ademas, cada uno de los codificadores 1 a m ilustrados en la Fig. 1 representa una realizacion de un codificador de audio segun la invencion. Segun la Fig. 1, los codificadores 12 a 18 representan proveedores 15 configurados para proporcionar segmentos asociados con diferentes partes de la serial de entrada de audio 10 y codificados mediante diferentes configuraciones de codecs. A este respecto, cada uno de los codificadores 12 a 18 utiliza una configuracion de codec diferente. La unidad de decision 50 esta configurada para decidir que representacion descargar para cada segmento. De este modo, la unidad de decision 50 esta configurada para seleccionar una configuracion de codec (asociada con la representacion respectiva) para cada segmento 20 sobre la base de una serial de control. Por ejemplo, la serial de control puede recibirse de un cliente que solicita la representacion que mejor se adapta a una situacion determinada.

[0051] En base a la decision de la unidad de decision 50, el bloque 52 genera los datos de salida de audio 54 disponiendo los segmentos uno tras otro, tal como el segmento 46 (segmento 2 de la representacion

25 3) despues del segmento 44 (segmento 1 de la representacion 2). Asf, la trama especial AU5 al comienzo del segmento 2 permite conmutar a la representacion 3 y la reproduccion inmediata en el lfmite entre los segmentos 44 y 46 en el lado del decodificador.

[0052] De este modo, en la realizacion que se muestra en la Fig. 1, un proveedor (que comprende los 30 codificadores 1 a m) esta configurado para proporcionar m versiones codificadas de la entrada de audio 10,

con m > 2, en el que las m versiones codificadas (representaciones) se codifican utilizando diferentes configuraciones de codecs, en el que cada version codificada incluye una pluralidad de segmentos que representan la pluralidad de partes de la secuencia de valores de muestra de audio, en el que cada uno de los segmentos comprende una trama especial en el comienzo del mismo.

35

[0053] En otras realizaciones de la invencion, se pueden almacenar en una memoria representaciones diferentes de la misma entrada de audio, como las representaciones 22 a 28 en la Fig. 1, y se puede acceder a ellas si un usuario solicita el contenido de medios correspondiente.

40 [0054] Los ejemplos de codificador 1 a m que muestran en la Fig. 1 pueden producir un retardo de codificador diferente en funcion de la configuracion del codificador y/o la activacion de herramientas en los ejemplos de codificador. En estos casos, se pueden tomar medidas para asegurar que los retardos del codificador se compensen para conseguir una alineacion en el tiempo de las m corrientes de salida, es decir, las m representaciones. Esto se puede implementar, por ejemplo, anadiendo en el extremo una cantidad de 45 muestras a la entrada del codificador con el fin de compensar los retardos diferentes del codificador. En otras palabras, los segmentos en las diferentes representaciones tendran la misma duracion con el fin de permitir una conmutacion sin fisuras entre representaciones en los lfmites del segmento. Las duraciones de los segmentos teoricos dependen de las frecuencias de muestreo empleadas y de los tamanos de trama. La Fig. 3 muestra un ejemplo de una posible insercion de IPF en representaciones con diferente encuadre, tal vez 50 debido a diferentes frecuencias de muestreo y/o tamanos de trama. Se pueden anadir muestras cero a segmentos mas cortos en una posicion apropiada de manera que todas las tramas especiales esten alineadas en el tiempo, como puede verse en la Fig. 3.

[0055] La Fig. 4a muestra una vista esquematica de un aparato 90 para generar datos de salida de 55 audio codificados 102; El aparato 90 comprende un proveedor 92 configurado para proporcionar al menos una trama 80 de una pluralidad de tramas 40 como una trama especial tal como se ha definido en este documento. En las realizaciones de la invencion, el proveedor 92 puede implementarse como parte de un codificador para codificar valores de muestra de audio, que proporciona las tramas 40 y anade la informacion adicional a, al menos una, de las tramas al fin de generar la trama especial. Por ejemplo, el proveedor 92 puede configurarse

para anadir la informacion adicional como una extension de la carga a una de las tramas 40 a fin de generar la trama especial 80. Las tramas 40, 80 que representan la corriente de bits de datos de audio codificados 102 se emiten a traves de una salida 112.

5 [0056] La Fig. 4b muestra una vista esquematica de un aparato 100 para generar datos de salida de audio codificados 102; El aparato comprende un proveedor 104 configurado para proporcionar segmentos 106, 108 asociados con diferentes partes de una secuencia de valores de muestra de audio. Una primera trama de, al menos uno, de los segmentos es una trama especial tal como se ha explicado anteriormente. Un generador 110 esta configurado para generar los datos de salida de audio disponiendo, al menos uno, de los segmentos

10 106, 108 despues de otro de los segmentos 106, 108. El generador 110 entrega los datos de salida de audio a la salida 112 configurada para emitir los datos de audio codificados 102.

[0057] La Fig. 5 muestra una vista esquematica de una realizacion del decodificador de audio 60 para decodificar los datos de entrada de audio 122. Los datos de entrada de audio pueden ser la salida del bloque

15 52 que se muestra en la Fig. 1. El decodificador de audio 60 comprende un determinador 130, un inicializador 132 y un nucleo de decodificador 134. El determinador 130 esta configurado para determinar si una trama de datos 122 de entrada de audio es una trama especial. El inicializador 132 se configura para inicializar el nucleo del decodificador 134 si la trama es una trama especial y la inicializacion es necesaria o deseada. La inicializacion comprende decodificar las tramas precedentes incluidas en la informacion adicional. El nucleo del

20 decodificador 134 esta configurado para decodificar tramas de valores de muestra de audio codificados utilizando la configuracion de codec con la que se inicializa.

[0058] En el caso de que la trama no sea una trama especial, se suministra directamente al nucleo 134 del decodificador, flecha 136. En el caso de que la trama sea una trama especial y no se requiera la

25 inicializacion del nucleo 134 del decodificador, el determinador 130 puede descartar la informacion adicional y solo entregar los valores de la muestra de audio codificada de la trama especial (sin las tramas en la informacion adicional) a el decodificador 134. El determinador 130 puede configurarse para determinar si es necesario inicializar el nucleo del decodificador 134 basandose en la informacion incluida en la informacion adicional o basandose en informacion externa. La informacion incluida en la informacion adicional puede ser

30 informacion sobre la configuracion de codec utilizada para codificar la trama especial, en la que el determinador puede decidir que la inicializacion es necesaria si esta informacion indica que las tramas anteriores estan codificadas utilizando una configuracion de codec diferente como la trama especial. La informacion externa puede indicar que el nucleo del decodificador 134 debe ser inicializado o reinicializado al recibir la trama especial siguiente.

35

[0059] En las realizaciones de la invencion, el decodificador 60 esta configurado para iniciar el nucleo del decodificador 134 en una de las diferentes configuraciones de codecs. Por ejemplo, pueden iniciarse diferentes ejemplos de un nucleo de decodificador de software utilizando diferentes configuraciones de codec, es decir, diferentes parametros de configuracion de codec como se ha explicado anteriormente. En las

40 realizaciones de la invencion, la inicializacion del decodificador (nucleo) puede comprender cerrar una instancia de decodificador actual y abrir una nueva instancia de decodificador utilizando los parametros de configuracion de codec incluidos en la informacion adicional (es decir, dentro de la corriente de bits recibida) o suministrados externamente, por ejemplo, externos a la secuencia de bits recibida. El decodificador 60 puede conmutarse a diferentes configuraciones de codecs en funcion de las configuraciones de codecs utilizadas para codificar los

45 segmentos respectivos de los datos de audio codificados recibidos.

[0060] El decodificador 60 puede configurarse para conmutar desde una configuracion del codec actual, es decir, la configuracion del codec del decodificador de audio antes de encontrar la trama especial, a una configuracion de codec diferente si la informacion adicional indica una configuracion de codec diferente de la

50 configuracion del codec actual.

[0061] Otros detalles de una realizacion de un decodificador de audio que tiene el comportamiento de un decodificador AAC se explican haciendo referencia a las Figs. 6 a 8. La Fig. 8 muestra esquematicamente el comportamiento de un decodificador AAC. Se hace referencia a la norma ISO/IEC DTR 14496-24, "Audio and

55 Systems Interaction".

[0062] La Fig. 8 muestra el comportamiento del decodificador en un numero de estados, un primer estado 200 correspondiente a una o mas tramas prerrodadas, un estado asociado con cada una de las tramas AU1, AU2 y AU3, y un estado de "vaciamiento" 202.

[0063] Para generar muestras de salida validas para AU1, tanto la o la(s) trama(s) prerrodada(s) y la trama AU1 tienen que ser decodificadas. Las muestras generadas por la o la(s) trama(s) prerrodada(s) se descartan, es decir, se utilizan solamente para inicializar el decodificador y no se reproducen. Sin embargo, la

5 decodificacion de la o la(s) trama(s) prerrodada(s) es obligatoria para configurar los estados internos del decodificador. En las realizaciones de la invencion, la informacion adicional de las tramas especiales incluye la o la(s) trama(s) prerrodada(s). De este modo, el decodificador esta en una posicion para decodificar la o la(s) trama(s) prerrodada(s) y configurar los estados internos del decodificador de modo que la trama especial pueda ser decodificada y pueda tener lugar la reproduccion inmediata de las muestras de salida validas de la 10 trama especial. El numero real de AU (tramas) "prerrodadas" depende del retardo de puesta en marcha del decodificador, en el ejemplo de la Fig. 8 una AU.

[0064] En general, para la reproduccion de archivos, la reproduccion inmediata tal como se ha descrito haciendo referencia a la Fig. 8 se implementa a nivel del sistema. Hasta ahora, solo tiene lugar en la puesta en

15 marcha del decodificador. Sin embargo, una trama especial (IPF) siempre transporta suficiente informacion para inicializar completamente los estados internos del decodificador y llenar los buferes internos. Por lo tanto, la insercion de tramas especiales permite la reproduccion inmediata en posiciones de corriente aleatorias.

[0065] El estado de vaciamiento 202 en la Fig. 8 muestra el comportamiento del decodificador si el 20 vaciamiento se realiza despues de decodificar la ultima trama AU3. El vaciamiento significa introducir una

hipotetica trama de cerso en el descodificador, es decir, una hipotetica trama compuesta por todas las muestras de entrada de “ceros digitales". Debido a la suma de superposicion de la familia AAC, el vaciamiento da como resultado una salida valida que se logra sin consumir una nueva trama de entrada. Esto es posible puesto que la ultima trama AU3 incluye informacion de prediccion sobre los valores de la muestra de salida que 25 se obtendrfan al decodificar una trama siguiente despues de la trama AU3, ya que las tramas se superponen sobre un numero de valores de la muestra en el dominio del tiempo. En general, la primera mitad de una trama se superpone con una trama precedente y una segunda mitad de una trama se superpone con una trama siguiente. De este modo, la segunda mitad de los valores de la muestra de salida obtenidos al decodificar una primera trama incluye informacion sobre la primera mitad de los valores de la muestra de salida obtenida al 30 decodificar una segunda trama despues de la primera trama. Esta caracterfstica se puede explotar cuando se implementa un desvanecimiento cruzado como se explicara a continuacion.

[0066] A continuacion, se describen detalles adicionales de una realizacion de un decodificador de audio y un procedimiento de decodificacion de datos de entrada de audio, haciendo referencia a la Fig. 6, en la que el

35 decodificador de audio esta configurado para llevar a cabo el procedimiento descrito de las Figs. 6 y 7. El procedimiento comienza en 300. El decodificador escanea las tramas entrantes (AU) para una IPF y determina si una trama entrante es una IPF, 302. Si la trama entrante no es una IPF, la trama se decodifica, 304, y el procedimiento salta a la siguiente trama, 306. Si no hay siguiente trama, el procedimiento termina. Las muestras de PCM decodificadas se emiten, como se indica mediante el bloque 308, que puede representar un 40 bufer de salida. Si se determina en 302 que la trama es una IPF, se evalua la configuracion del codec, 310. Por ejemplo, se evalua el campo "config" que se muestra en la Fig. 2. Se realiza una determinacion de si la configuracion del codec (configuracion de la corriente) ha cambiado, 312. Si la configuracion de codec no ha cambiado, es decir, si la informacion adicional indica una configuracion de codec identica a la configuracion del codec actual, la informacion adicional, por ejemplo, la carga de extension, se omite y el procedimiento salta a 45 304, en cuyo caso la decodificacion continua de la forma habitual.

[0067] Si la configuracion del codec ha cambiado, se aplican las etapas siguientes. El decodificador se vacfa, 314. Las muestras de salida resultantes del vaciamiento del decodificador se almacenan en un bufer de vaciamiento, 316. Estas muestras de salida (o al menos una parte de estas muestras de salida) son una

50 primera entrada a un procedimiento de desvanecimiento cruzado 318. A continuacion, el decodificador se reinicializa utilizando la nueva configuracion de codec indicada en la informacion adicional, por ejemplo, en el campo "config" de la Fig. 2, y utilizando las tramas precedentes comprendidas en la trama especial. Tras la reinicializacion, el decodificador es capaz de decodificar la trama especial, es decir, los valores de muestra de audio codificados asociados con la trama especial. La trama especial se decodifica, 322. Las muestras de 55 salida (muestras PCM) obtenidas con la decodificacion de la trama especial se almacenan como una segunda entrada para el procedimiento de desvanecimiento cruzado 318. Por ejemplo, las muestras de salida de PCM correspondientes pueden almacenarse en un bufer, 324, que puede denominarse bufer IPF. En el procedimiento de desvanecimiento cruzado 318, se calcula un desvanecimiento cruzado basado en las dos senales de entrada procedentes del bufer de vaciamiento y del bufer IPF. El resultado del desvanecimiento

cruzado se emite como muestras de salida PCM, bloque 308. A continuacion, el procedimiento salta a la trama siguiente 306 y el procedimiento se repite para la trama siguiente. En caso de que la trama actual sea la ultima, el procedimiento finaliza.

5 [0068] A continuacion, se explican mas detalles de las etapas realizadas tras detectar un cambio de configuracion en 312, haciendo referencia a la Fig. 7. La configuracion de codec se recupera de la informacion adicional de la IPF, 330 y se proporciona para la reinicializacion del decodificador 332. Antes de reinicializar el decodificador, el decodificador se vacfa, 314, y las muestras de salida resultantes se almacenan en el bufer de vaciamiento, 316. La reinicializacion del decodificador puede incluir el cierre de la instancia del decodificador 10 actual y la apertura de la nueva instancia del decodificador con la configuracion nueva. Al volver a abrir la nueva instancia del decodificador, se utiliza la informacion sobre la configuracion de codec contenida en la IPF. Despues de abrir la nueva instancia del decodificador, se inicializa decodificando las tramas prerrodadas incluidas en la IPF. Se supone que el numero de tramas prerrodadas contenidas en la IPF es m, como se indica en el bloque 334. Se determina si m > 0, 336. Si m > 0, se decodifica la trama prerrodada n-m, 338, en la 15 que n indica la IPF. Las muestras PCM de salida obtenidas se descartan 340. m se reduce en uno y el procedimiento salta al bloque 336. Repitiendo las etapas 336 a 342 para todas las tramas prerrodadas contenidas en la IPF, se realiza un procedimiento de llenado de los estados decodificadores del decodificador despues de volver a abrir el mismo, 344. Si todas las tramas prerrodadas han sido decodificadas, el procedimiento salta al bloque 332, en cuyo caso se decodifica la IPF. Las muestras PCM resultantes se 20 suministran al bufer PCM 342. El desvanecimiento cruzado 318 se realiza en base a las salidas de los bufers PCM 316 y 324 y la salida del procedimiento de desvanecimiento cruzado 318 se suministra al bufer PCM de salida 308.

[0069] En la realizacion descrita anteriormente, la reinicializacion del decodificador incluye cerrar la 25 instancia del decodificador actual y abrir una nueva instancia del decodificador. En realizaciones alternativas, el

decodificador puede incluir una pluralidad de instancias del decodificador en paralelo, de manera que la reinicializacion del decodificador puede incluir la conmutacion entre diferentes instancias del decodificador. Ademas, la reinicializacion del decodificador incluye llenar estados de decodificador decodificando tramas prerrodadas incluidas en la informacion adicional de la trama especial.

30

[0070] Como se ha explicado anteriormente, aprovechando los estados de memoria interna y los buferes (suma de superposicion, estados de filtro) en un decodificador AAC, es posible obtener muestras de salida sin pasar la nueva entrada mediante el procedimiento de vaciamiento. La serial de salida del vaciamiento se parece mucho a la "serial original" para, al menos una parte, de los valores de muestra de salida obtenidos, en

35 particular la primera parte, vease el estado 202 en la Fig. 8. Los valores obtenidos de la muestra de salida obtenidos con el procedimiento de vaciamiento se utilizan en el procedimiento de desvanecimiento cruzado descrito en detalle a continuacion.

[0071] Como puede verse en el estado 202 en la Fig. 8, la energfa en el bufer de vaciamiento resultante 40 disminuira con el tiempo en funcion de la ventana de transformacion y de las herramientas habilitadas de la

configuracion del codec actual. Por lo tanto, el desvanecimiento cruzado debe aplicarse en la primera parte del bufer de vaciamiento, donde la serial de salida puede considerarse como energfa casi completa. Aprovechar el hecho de que los codecs de audio modernos se pueden vaciar para obtener muestras validas para un desvanecimiento cruzado sucesivo ayuda significativamente a obtener valores de conmutacion sin fisuras. De 45 acuerdo con esto, en realizaciones de la invencion, el desvanecimiento cruzado esta configurado para realizar el desvanecimiento cruzado entre los valores de salida obtenidos con un procedimiento de vaciamiento de la configuracion de codec actual y los valores de muestra de salida obtenidos decodificando la trama especial utilizando la configuracion de codec indicada en la informacion adicional.

50 [0072] A continuacion, se describe una realizacion especffica del procedimiento de desvanecimiento cruzado. El desvanecimiento cruzado se aplica a las senales de audio tal como se ha descrito anteriormente con el fin de evitar artefactos audibles durante la conmutacion de CAR. Un artefacto tfpico es una cafda en la energfa de senal de salida. Como se ha explicado anteriormente, la energfa de la senal vaciada disminuira en funcion de la configuracion. Por lo tanto, la longitud del desvanecimiento cruzado debe elegirse con cuidado en 55 funcion de la configuracion para evitar artefactos. Si la ventana de desvanecimiento cruzado es demasiado corta, entonces el procedimiento de conmutacion puede introducir artefactos audibles debido a la diferencia en la forma de onda de audio. Si la ventana de desvanecimiento cruzado es demasiado larga, las muestras de audio vaciadas ya han perdido energfa y provocaran una cafda en la energfa de la senal de salida. En una configuracion de codec AAC que utiliza ventanas de transformacion cortas de 256 muestras, se puede aplicar

un desvanecimiento cruzado lineal con una longitud de n = 128 muestras (por canal). En otras realizaciones, se puede aplicar un desvanecimiento cruzado lineal con una longitud de, por ejemplo, 64 muestras (por canal).

[0073] A continuacion, se describe un ejemplo de un procedimiento de desvanecimiento cruzado lineal

5 que utiliza 128 muestras:

10

El procedimiento de desvanecimiento cruzado puede utilizar las primeras 128 muestras del bufer de vaciamiento. El bufer de vaciamiento se segmenta en ventanas multiplicando las primeras 128 muestras del

bufer de vaciamiento Sf = Sro, Sn27 por dj. _ Ltiss el indice de la muestra actual.

1 28’

El resultado puede almacenarse en un bufer interno del desvanecimiento cruzado, es decir

imagen1

Ademas, el bufer IPF Sd se segmenta en. ventanas, donde las primeras 128 muestras de salida IPF

15 decodificadas se multiplican por el facte 1-

,e i es el indice de la muestra actual. El resultado puede

almacenarse en un bufer interno del desvanecimiento cruzado, es decir

>dr

128

- —1^127'1< ■■■!•£,

dn-

20 [0074] Se anaden las primeras 128 muestras de los buferes internos: So = Sdo + Sfo,...,Sd'i27 + Sr,Sd'128,... Sd'ny los valores resultantes se envian al bufer de muestras de salida PCM 308.

[0075] De este modo, se consigue el desvanecimiento cruzado lineal sobre los primeros 128 valores de muestra de salida del bufer de vaciamiento y los primeros 128 valores de muestra del bufer IPF.

25

[0076] En general, el desvanecedor cruzado puede ser configurado para ejecutar un desvanecimiento cruzado entre una pluralidad de valores de muestra de salida obtenidos utilizando la configuracion de codec actual y una pluralidad de valores de muestra de salida obtenidos mediante la decodificacion de los valores de muestra de audio codificados asociados con la trama especial. En general, en codecs de audio, como los

30 codecs de la familia AAC y los codecs de la familia AMR, los valores de muestra de audio codificados de una trama precedente comprenden implicitamente informacion sobre la senal de audio codificada en una trama siguiente. Esta propiedad se puede utilizar en la implementacion de desvanecimiento cruzado al conmutar entre diferentes configuraciones de codecs. Por ejemplo, si la configuracion de codec actual es una configuracion de codec AMR, los valores de muestra de salida utilizados en el desvanecimiento cruzado 35 pueden obtenerse basandose en una respuesta a un impulso de cero, es decir, basandose en la respuesta obtenida cuando se aplica una trama cero al nucleo del decodificador despues de la ultima trama de la configuracion del codec actual. En las realizaciones de la invencion, se pueden utilizar mecanismos adicionales utilizados en la codificacion y decodificacion de audio en el desvanecimiento cruzado. Por ejemplo, los filtros internos utilizados en SBR (Spectral Band Replication) comprenden retardos y, por lo tanto, tiempos de 40 establecimiento largos que pueden utilizarse en el desvanecimiento cruzado. Por lo tanto, las realizaciones de la invencion no se limitan a ningun desvanecimiento cruzado especifico con el fin de lograr una conmutacion sin fisuras entre configuraciones de codecs. Por ejemplo, el desvanecimiento cruzado puede configurarse para aplicar pesos crecientes a un primer numero de valores de muestra de salida de la trama especial y para aplicar pesos decrecientes a un numero de valores de muestra de salida obtenidos basandose en la 45 decodificacion que utiliza la configuracion de codec actual, en el que los pesos pueden aumentar y disminuir linealmente o pueden aumentar y disminuir de manera no lineal.

[0077] En las realizaciones de la invencion, la inicializacion del decodificador comprende inicializar estados de decodificador internos y bufers que utilizan la informacion adicional de la(s) trama(s) especial(es).

50 En las realizaciones de la invencion, la inicializacion del decodificador tiene lugar si cambia la configuracion del codec. En otras realizaciones de la invencion, la trama especial puede utilizarse para inicializar el decodificador sin cambiar la configuracion del codec. Por ejemplo, en las realizaciones de la invencion, el decodificador puede configurarse para la reproduccion inmediata, en el que los estados internos y los bufers de un decodificador se llenan sin cambiar una configuracion de codec, en el que se puede realizar el 55 desvanecimiento cruzado con muestras cero. De este modo, la reproduccion inmediata de muestras validas es posible. En otras realizaciones, puede implementarse una funcion de avance rapido, en la que la trama especial puede ser decodificada en intervalos predeterminados en funcion de la velocidad de avance rapido

deseada. En las realizaciones de la invencion, se puede tomar la decision de si se llevara a cabo la inicializacion utilizando la trama especial, es decir, es necesario o deseado, se puede tomar en base a una serial de control externa proporcionada al decodificador de audio.

5 [0078] Como se ha explicado anteriormente, la trama especial (como, por ejemplo, la IPF 80 que se muestra en la Fig. 2) se puede utilizar para la adaptacion de la velocidad de transferencia de bits y la conmutacion de la corriente de bits, respectivamente. Las siguientes restricciones pueden aplicarse: todas las representaciones (por ejemplo, diferentes velocidades de transferencia de bits, diferentes usos de las herramientas de codificacion) estan alineadas en el tiempo, las IPFs se insertan en cada representacion, las 10 IPFs estan sincronizadas y el campo IPF "config" de la Fig. 2 contiene la configuracion de la corriente, es decir, la activacion de herramientas, etc. La Fig. 9 muestra un ejemplo de adopcion de la velocidad de transferencia de bits por conmutacion de la corriente de bits en un entorno de transmision adaptativo. La logica de control (como el sistema que se muestra en la Fig. 1), que a veces se denomina entramado, divide a los datos de audio en segmentos. Un segmento comprende multiples AU. La configuracion de la corriente de audio puede 15 cambiar en cada lfmite de segmento. El decodificador de audio no es consciente de la segmentacion, solo esta provisto de UA simples mediante la logica de control. Para habilitar la conmutacion de corriente de bits de audio en cada lfmite de segmento, la primera AU de cada segmento puede ser una IPF como se ha explicado anteriormente. En la Fig. 9, un lfmite de segmento 400 esta indicado por la lfnea discontinua. En el escenario que se ilustra en la Fig. 9, el decodificador de audio esta provisto de AU 40 (AU1 a AU3) de "Corriente 1". La 20 logica de control decide cambiar a "Corriente 2" en el siguiente lfmite de segmento, es decir, lfmite 400. Despues de decodificar la AU3 de la "Corriente 1", la logica de control puede pasar la AU4 de la "Corriente 2" al decodificador de audio sin mas aviso. La AU4 es una trama especial (IPF) y, por lo tanto, la reproduccion inmediata puede tener lugar despues de cambiar a la corriente2.

25 [0079] Haciendo referencia al escenario que se muestra en la Fig. 9, la conmutacion puede tener lugar de la siguiente manera: En AU1 a AU3 de la corriente1, no se detecta IPF y el procedimiento de decodificacion se lleva a cabo de la forma habitual. Se detecta una IPF en la AU4 de la corriente2. Ademas, se detecta un cambio en la configuracion de la corriente. El decodificador de audio inicializa el procedimiento de vaciamiento, 402 en la Fig. 9. Las muestras de salida PCM resultantes se almacenan en un bufer temporal (bufer de 30 vaciamiento) para un uso posterior. El decodificador de audio se reinicializa con la configuracion de corriente transportada con la IPF. La carga de IPF ("prerrodada") se decodifica. Se descartan las muestras PCM de salida resultantes. En este punto, los estados internos del decodificador y los buferes se inicializan completamente. AU4 se decodifica. Para evitar la conmutacion de artefactos se aplica un desvanecimiento cruzado. Las muestras PCM almacenadas en el bufer de vaciamiento se atenuan mientras que, las muestras 35 PCM resultantes de la decodificacion de AU4 y almacenadas en el bufer de salida PCM, se resaltan. Se reproduce el resultado del desvanecimiento cruzado.

[0080] Por consiguiente, la IPF se puede utilizar para habilitar la conmutacion de representaciones de audio comprimidas. El decodificador puede recibir UA simples como entrada, por lo que no se necesita ninguna

40 logica de control adicional.

[0081] Los detalles de una realizacion especffica en el contexto de MPEG-D USAC se describen ahora, en el que la sintaxis de la corriente de bits puede ser de la siguiente manera:

45 El elemento de sintaxis AudioPreRoll () se utiliza para transmitir informacion de audio de tramas anteriores junto con los datos de la trama actual. Los datos de audio adicionales se pueden utilizar para compensar el retardo de la puesta en marcha del decodificador (prerrodado), facilitando de este modo el acceso aleatorio en los puntos de acceso a la corriente que hacen uso de AudioPreRoll (). Un UsacExtElement () se puede utilizar para transmitir el AudioPreRoll (). Para ello se utilizara un nuevo identificador de carga:

50

Tabla 1: Identificador de carga para AudioPreRoll ()

Nombre: Valor

ID EXT ELE AUDIOPREROLL: 4

55

[0082] La sintaxis de AudioPreRoll () se muestra en la Fig. 10 y se explica a continuacion:

configLen tamano del elemento de sintaxis de configuracion en bytes.

Config () el elemento de sintaxis de configuracion del decodificador. En

el contexto de MPEG-D USAC esta es el Usac-Config() tal como se define en ISO/IEC 23003-3: 2012. El campo Config() se puede transmitir para poder responder a cambios en la configuracion de audio (conmutacion de corrientes).

numPreRollFrames el numero de unidades de acceso prerrodadas (AU) transmitidas como datos de audio prerrodados. El numero razonable de AU depende del retardo de la puesta en marcha del decodificador.

AuLen longitud de AU en bytes.

AccessUnit () la(s) AU(s) prerrodada(s).

[0083] Los datos prerrodados transportados en el elemento de extension se pueden transmitir "fuera de banda", es decir, los requisitos de bufer pueden no ser satisfechos

5 [0084] Para usar AudioPreRoll () tanto en el acceso aleatorio como en la adaptacion de la velocidad de

transferencia de bits, se aplican las siguientes restricciones:

- El primer elemento de cada trama es un elemento de extension (UsacExtElement) de tipo ID_EXT_ELE_AUDIOPREROLL.

10 - El UsacExtElement () correspondiente sera configurado como se describe en la Tabla 2.

- Por consiguiente, si hay datos prerrodados, el UsacFrame() comenzara con la secuencia de bits siguiente:

"1": usaclndependencyFlag.

"1": usacExtElementPresent (en referencia al elemento de extension de audio prerrodado).

15 "0": usacExtElementUseDefaultLength (en referencia al elemento de extension de audio prerrodado).

- Si no se transmiten datos prerrodados, la carga de extension no estara presente (usacExtElementPresent = 0).

- Las tramas prerrodadas con fndice "0" y "numPreRollFrames-1" deberan ser decodificables

20 independientemente, es decir, usacIndepend-encyFlag se establecera en "1".

Tabla 2: Configuracion de UsacExtElement () para AudioPreRoll ()

usacExtElementType: ID EXT ELE AUDIOPREROLL

usacExtElementConfigLength: 0

usacExtElementDefaultLengthPresent: 0

usacExtElementPayloadFrag: 0

25 [0085] El acceso aleatorio y la reproduccion inmediata son posibles en cada trama que utiliza la

estructura de AudioPreRoll () descrita. El siguiente pseudocodigo describe el procedimiento de decodificacion:

if(usacIndependencyFlag == 1) { if(usacExtElementPresent == 1{

30 /* In this case usacExtElementUseDefaultLength must be 0! */

if(usacExtElementUseDefaultLength != 0) goto error;

/* Check for presence of config and reinitialize if necessary */

35 int configLen = getConfigLen(); if(configLen > 0) { config c =

getConfig(configLen);

ReConfigureDecoder(c);

40 }

/* Get pre-roll AUs and decode, discard output samples */

int numPreRollFrames = getNumPreRollFrames(); for(auIdx = 0; auldx < numPreRollFrames; auIdx++)

45 int auLen = getAuLen();

AU nextAU = getPreRollAU(auLen);

DecodeAU(nextAU);

}

5 }

}

/* Decoder states are initialized at this point. Continue normal decoding */

10 [0086] La adaptacion de la velocidad de transferencia de bits puede utilizarse conmutando entre

diferentes representaciones codificadas del mismo contenido de audio. La estructura de AudioPreRoll () descrita puede ser usada para ese proposito. El procedimiento de decodificacion en caso de adaptacion de la velocidad de transferencia de bits se describe mediante el siguiente pseudocodigo:

15 if (usacIndependencyFlag == 1) { if(usacExtElementPresent == 1{

/* In this case usacExtElementUseDefaultLength must be 0! */

if (usacExtElementUseDefaultLength != 0) goto error;

20 int configLen = getConfigLen(); if(configLen > 0) {

config newConfig = getConfig(configLen);

/* Configuration did not change, skip AudioPreRoll and continue decoding as normal */

25 if(newConfig == currentConfig) {

SkipAudioPreRoll () ; goto finish;

}

30 /* Configuration changed, prepare for bitstream switching*/ config c =

getConfig(configLen); outSamplesFlush =

35 FlushDecoder () ;

ReConfigureDecoder(c);

/* Get pre-roll AUs and decode, discard output samples */

int numPreRollFrames = getNumPreRollFrames () ;

40 for(auIdx = 0; auldx < numPreRollFrames; auIdx++) int auLen = getAuLen () ;

AU nextAU = getPreRollAU(auLen);

DecodeAU(nextAU);

45 }

/* Get "regular" AU and decode */

AU au = UsacFrame () ; outSamplesFrame = Decode(au);

/* Apply crossfade */

50 for(i = 0; i < 128; i++) {

outSamples[i] = outSamplesFlush[i] * (1-i/127) + outSamplesFrame[i] * (i/127)

}

for(i = 128; i < outputFrameLength; i++) {

55 outSamples [i] = outSamplesFrame [i] ;

}

} else { goto error;

}

[0087] Aunque se han descrito algunos aspectos en el contexto de un aparato, es evidente que estos 5 aspectos tambien representan una descripcion del procedimiento correspondiente, donde un bloque o dispositivo se corresponde con una etapa del procedimiento o una caracterfstica de una etapa del procedimiento. De forma analoga, los aspectos que se describen en el contexto de una etapa del procedimiento tambien representan una descripcion de un bloque correspondiente o un punto o caracterfstica del aparato correspondiente. Algunas o todas las etapas del procedimiento se pueden ejecutar con (o 10 utilizando) un aparato de hardware, como, por ejemplo, un microprocesador, un ordenador programable o un circuito electronico. En algunas realizaciones, una o mas de las etapas mas importantes del procedimiento se pueden ejecutar con dicho aparato. En las realizaciones de la invencion, los procedimientos descritos en este documento se implementan con un procesador o se implementan con un ordenador.

15 [0088] En funcion de ciertos requisitos de implementacion, las realizaciones de la invencion se pueden

implementar en hardware o en software. La implementacion puede realizarse utilizando un medio de almacenamiento no transitorio como un medio de almacenamiento digital, por ejemplo, un disquete, un DVD, un Blu-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene senales de control legibles electronicamente y almacenadas en el mismo, que coopera (o es capaz de 20 cooperar) con un sistema informatico programable de manera que se lleve a cabo el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible mediante ordenador.

[0089] Algunas realizaciones segun la invencion comprenden un soporte de datos que tiene senales de control legibles electronicamente y que son capaces de cooperar con un sistema informatico programable, de

25 tal manera que se lleve a cabo uno de los procedimientos descritos en este documento.

[0090] En general las realizaciones de la presente invencion se pueden implementar como un producto de programa informatico con un codigo de programa, siendo el codigo de programa operativo para llevar a cabo uno de los procedimientos cuando el producto de programa informatico se ejecuta en un ordenador. El

30 codigo de programa se puede almacenar, por ejemplo, en un soporte legible por maquina.

[0091] Otras realizaciones comprenden el programa de ordenador para llevar a cabo uno de los procedimientos descritos en este documento, almacenado en un soporte legible por maquina.

35 [0092] En otras palabras, una realizacion del procedimiento de la invencion es, por lo tanto, un programa

informatico que tiene un codigo de programa para realizar uno de los procedimientos descritos en este

documento cuando el programa informatico se ejecuta en un ordenador.

[0093] Una realizacion adicional del procedimiento de la invencion es, por lo tanto, un soporte de datos 40 (o un medio de almacenamiento digital o un medio legible por ordenador) que comprende, grabado en el mismo, el programa informatico para llevar a cabo uno de los procedimientos descritos en este documento. El soporte de datos, el medio de almacenamiento digital o el medio grabado normalmente son tangibles y/o no transitorios.

45 [0094] Una realizacion adicional del procedimiento de la invencion es, por lo tanto, un corriente de datos

o una secuencia de senales que representan el programa informatico para llevar a cabo uno de los

procedimientos descritos en este documento. El corriente de datos o la secuencia de senales pueden, por ejemplo, estar configurados para ser transferidos a traves de una conexion de comunicacion de datos, por ejemplo, a traves de Internet.

50

[0095] Una realizacion adicional comprende ademas un medio de procesamiento, por ejemplo, un ordenador o un dispositivo logico programable, programado, configurado o adaptado para llevar a cabo uno de los procedimientos descritos en este documento.

55 [0096] Una realizacion adicional comprende un ordenador que tiene instalado en el mismo el programa informatico para llevar a cabo uno de los procedimientos descritos en este documento.

[0097] Una realizacion adicional segun la invencion comprende un aparato o un sistema configurado para transferir (por ejemplo, electronicamente u opticamente) un programa informatico con el fin de llevar a

cabo uno de los procedimientos descritos en el presente documento a un receptor. El receptor puede ser, por ejemplo, un ordenador, un dispositivo movil, un dispositivo de memoria o algo similar. El aparato o sistema puede, por ejemplo, comprender un servidor de archivos para transferir el programa informatico al receptor.

5 [0098] En algunas realizaciones se puede utilizar un dispositivo logico programable (por ejemplo, una matriz de puertas programables por campo) para llevar a cabo algunas o todas las funcionalidades de los procedimientos descritos en este documento. En algunas realizaciones un campo de matriz de puertas programables podra cooperar con un microprocesador para llevar a cabo uno de los procedimientos descritos en este documento. En general los procedimientos se llevan a cabo, preferentemente, por cualquier aparato de 10 hardware.

Claims

REIVINDICACIONES

1. Un decodificador de audio (60) para decodificar una corriente de bits de datos de audio codificados, en el que la corriente de bits de datos de audio codificado representa una secuencia de valores de

5 muestra de audio y comprende una pluralidad de tramas (40), en el que cada trama (40) incluye valores de muestra de audio codificados asociados, el decodificador de audio (60) que comprende:

un determinador (130) configurado para determinar si una trama de los datos de audio codificados es una trama especial (42, 80) que comprende valores de muestra de audio codificados asociados con la trama 10 especial (42, 80) e informacion adicional (82), en la que la informacion adicional (82) comprende valores de muestra de audio codificados de un numero de tramas (86) que preceden a la trama especial, en el que los valores de la muestra de audio codificados de las tramas precedentes estan codificados utilizando la misma configuracion de codec que la trama especial, en el que el numero de tramas precedentes, correspondiente a las tramas prerrodadas, se corresponde con el numero de tramas que el decodificador (60) necesita para 15 construir la serial completa durante la puesta en marcha del decodificador de modo que este en posicion de decodificar los valores de muestra de audio asociados con la trama especial (42, 80) si la trama especial es la primera trama despues de la puesta en marcha del decodificador; y

un inicializador configurado para inicializar el decodificador (60) si el determinador determina que la trama es 20 una trama especial, en el que inicializar el decodificador comprende decodificar los valores de muestra de audio codificados incluidos en la informacion adicional antes de decodificar los valores de muestra de audio codificados asociados con la trama especial (42, 80),

en el que el inicializador esta configurado para conmutar el decodificador de audio (60) desde una 25 configuracion de codec actual a una configuracion de codec (84) diferente si el determinador (130) determina que la trama es una trama especial (42, 80) y si los valores de muestra de audio de la trama especial se han codificado utilizando la configuracion de codec diferente, y

en el que el decodificador esta configurado para decodificar la trama especial (42, 80) utilizando la 30 configuracion de codec actual y descartar la informacion adicional si el determinador determina (130) que la trama es una trama especial (42, 80) y si los valores de muestra de audio de la trama especial se han codificado utilizando la configuracion de codec actual.
2. Decodificador de audio de la reivindicacion 1, en el que la informacion adicional comprende 35 informacion sobre la configuracion de codec (84) utilizada para codificar los valores de muestra de audio

asociados con la trama especial (42, 80), en el que el determinador esta configurado para determinar si la configuracion de codec de la informacion adicional es diferente de la configuracion de codec actual.
3. Decodificador de audio (60) segun una de las reivindicaciones 1 y 2, que comprende un

40 desvanecedor cruzado (318) configurado para ejecutar un desvanecimiento cruzado entre una pluralidad de valores de muestra de salida obtenidos utilizando la configuracion de codec actual y una pluralidad de valores de muestra de salida obtenidos mediante la decodificacion de los valores de muestra de audio codificados asociados con la trama especial (42, 80).

45 4. Decodificador de audio segun la reivindicacion 3, en el que el desvanecimiento cruzado (318)

esta configurado para ejecutar el desvanecimiento cruzado de los valores de muestra de salida obtenidos mediante el vaciamiento del decodificador (60) en la configuracion de codec actual y valores de muestra de salida obtenidos mediante la decodificacion de los valores de muestra de audio codificados asociados con la trama especial (42, 80).

50
5. Decodificador de audio de una de las reivindicaciones 1 a 4, en el que una primera trama del numero de tramas (86) comprendidas en la informacion adicional (82) no esta codificada de manera diferencial en el tiempo o codificada por entropfa en relacion con ninguna trama anterior a la trama mas temprana y en la que la trama especial (42, 80) no esta codificada de manera diferencial en el tiempo o codificada por entropfa

55 en relacion con cualquier trama anterior a la primera trama del numero de tramas que preceden a la trama especial (42, 80) o en relacion con cualquier trama anterior a la trama especial (42, 80).
6. Decodificador de audio de una de las reivindicaciones 1 a 5, en el que la trama especial (42, 80) comprende la informacion adicional como una carga de extension y en el que el determinador esta configurado

para evaluar la carga de extension de la trama especial (42, 80).
7. Aparato (100; 12, 14, 16, 18) para generar una corriente de bits de datos de audio codificados que representan una secuencia de valores de muestra de audio de una serial de audio (10), en el que la

5 corriente de bits de datos de audio codificados comprende una pluralidad de tramas, en el que cada trama incluye valores de muestra de audio codificados asociados, en el que el aparato (100; 12, 14, 16, 18) comprende:

un proveedor de trama especial configurado para proporcionar al menos una de las tramas de una trama 10 especial (42, 80), la trama especial (42, 80) que comprende valores de muestra de audio codificados asociados con la trama especial (42, 80) e informacion adicional (82), en el que la informacion adicional (82) comprende valores de muestra de audio codificados de un numero de tramas (86) que preceden a la trama especial, en el que los valores de la muestra de audio codificados de las tramas precedentes estan codificados utilizando la misma configuracion de codec que la trama especial, y en el que el numero de tramas precedentes, 15 correspondiente a las tramas prerrodadas, se corresponde con el numero de tramas que el decodificador (60) necesita para construir la serial completa durante la puesta en marcha del decodificador de modo que este en posicion de decodificar los valores de muestra de audio asociados con la trama especial (42, 80) si la trama especial es la primera trama despues de la puesta en marcha del decodificador; y una salida (112) configurada para emitir la corriente de bits de datos de audio codificados (54, 102),

20

en el que los datos de audio codificados comprenden una pluralidad de segmentos (30), en el que cada segmento esta asociado con una de una pluralidad de partes de la secuencia de valores de muestra de audio y comprende una pluralidad de tramas (40), en el que el sumador de tramas especial esta configurado para anadir una trama especial (42, 80) en el comienzo de cada segmento (30) independientemente de si la 25 configuracion del codec cambia o no.
8. Aparato (100; 12, 14, 16, 18) segun la reivindicacion 7, en el que la informacion adicional comprende informacion sobre la configuracion del codec (84) utilizada para codificar los valores de muestra de audio asociados con la trama especial (42, 80).

30
9. Aparato (100) segun una de las reivindicaciones 7 u 8, el aparato (100) que comprende:

un proveedor de segmentos (104) configurado para proporcionar segmentos (44, 46, 48) asociados con diferentes partes de la secuencia de valores de muestra de audio y codificado por diferentes configuraciones 35 de codec, en el que el proveedor de trama especial esta configurado para proporcionar una primera trama (42, 80) de, al menos uno, de los segmentos como la trama especial (42, 80); y

un generador (52, 110) configurado para generar los datos de salida de audio disponiendo, al menos uno, de los segmentos (44, 46, 48) despues de otro de los segmentos (44, 46, 48).

40
10. Aparato de la reivindicacion 11, en el que el proveedor de segmentos (100) esta configurado para seleccionar una configuracion de codec para cada segmento basandose en una senal de control.
11. Aparato de la reivindicacion 9 o 10, en el que el proveedor de segmentos (100) esta configurado 45 para proporcionar m versiones codificadas (22, 24, 26, 28) de la secuencia de valores de muestra de audio, con

m > 2, en el que las m versiones codificadas se codifican utilizando diferentes configuraciones de codec, en el que cada version codificada comprende una pluralidad de segmentos (30) que representa la pluralidad de partes de la secuencia de valores de muestra de audio, en el que el proveedor de tramas especiales esta configurado para proporcionar una trama especial (42, 80) en el comienzo de cada uno de los segmentos.

50
12. Aparato segun la reivindicacion 11, en el que el proveedor de segmentos (100) comprende una pluralidad de codificadores (12, 14, 16, 18), cada uno configurado para codificar, al menos en parte, la senal de audio segun una de la pluralidad de configuraciones de codecs diferentes.

55 13. Aparato de la reivindicacion 12, en el que el proveedor de segmentos comprende una memoria

que almacena las m versiones codificadas de la secuencia de valores de muestra de audio.
14. Aparato segun una de las reivindicaciones 9 a 13, en el que el proveedor de trama especial (100)

esta configurado para proporcionar la informacion adicional como una carga de extension de la trama especial

(42, 80).
15. Procedimiento para decodificar una corriente de bits de datos de audio codificados, en el que la corriente de bits de datos de audio codificados representa una secuencia de valores de muestra de audio y

5 comprende una pluralidad de tramas (40), en el que cada trama (40) incluye valores de muestra de audio codificados asociados, y que comprende:

determinar si una trama de los datos de audio codificados es una trama especial (42, 80) que comprende valores de muestra de audio codificados asociados con la trama especial (42, 80) e informacion adicional (82), 10 en el que la informacion adicional (82) comprende valores de muestra de audio codificados de un numero de tramas (86) que preceden a la trama especial, en el que los valores de la muestra de audio codificados de las tramas precedentes estan codificados utilizando la misma configuracion de codec que la trama especial, en el que el numero de tramas precedentes, correspondiente a las tramas prerrodadas, se corresponde con el numero de tramas que el decodificador (60) necesita para construir la serial completa durante la puesta en 15 marcha del decodificador de modo que este en posicion de decodificar los valores de muestra de audio asociados con la trama especial (42, 80) si la trama especial es la primera trama despues de la puesta en marcha del decodificador.

inicializar el decodificador (60) si se determina que la trama es una trama especial, en el que la inicializacion 20 comprende decodificar los valores de muestra de audio codificados incluidos en la informacion adicional antes de decodificar los valores de muestra de audio codificados asociados con la trama especial (42, 80);

conmutar el decodificador de audio (60) de una configuracion de codec actual a una configuracion de codec diferente (84) si se determina que la trama es una trama especial (42, 80) y si los valores de muestra de audio 25 de la trama especial han sido codificados utilizando la configuracion de codec diferente; y

decodificar la trama especial (42, 80) utilizando la configuracion de codec actual y descartar la informacion adicional si se determina que la trama es una trama especial (42, 80) y si los valores de muestra de audio de la trama especial se han codificado utilizando la configuracion de codec actual.

30
16. Procedimiento segun la reivindicacion 15, en el que la corriente de bits de datos de audio comprende un primer numero de tramas codificadas utilizando una primera configuracion de codec y un segundo numero de tramas despues del primer numero de tramas y codificadas utilizando una segunda configuracion de codec, en el que la primera trama del segundo numero de tramas es la trama especial.

35
17. Procedimiento segun una de las reivindicaciones 15 o 16, en el que la informacion adicional comprende informacion sobre la configuracion de codec (84) utilizada para codificar los valores de muestra de audio asociados con la trama especial (42, 80), el procedimiento que comprende determinar si la configuracion de codec de la informacion adicional es diferente de la configuracion de codec actual que utiliza los valores de

40 muestra de audio codificados en la corriente de bits, que preceden a la trama especial, que estan codificados.
18. Procedimiento para generar una corriente de bits de datos de audio codificados que representan una secuencia de valores de muestra de audio de una serial de audio (10), en el que la corriente de bits de datos de audio codificados comprende una pluralidad de tramas, en el que cada trama incluye valores de

45 muestra de audio codificados asociados, que comprende:

proporcionar, al menos una, de las tramas como una trama especial (42, 80), la trama especial (42, 80) que comprende valores de muestra de audio codificados asociados con la trama especial (42, 80) e informacion adicional (82), en la que la informacion adicional (82) comprende valores de muestra de audio codificados de 50 un numero de tramas (86) que preceden a la trama especial, en la que los valores de la muestra de audio codificados de las tramas precedentes estan codificados utilizando la misma configuracion de codec que la trama especial, en la que el numero de tramas precedentes, correspondiente a las tramas prerrodadas, se corresponde con el numero de tramas que el decodificador (60) necesita para construir la serial completa durante la puesta en marcha del decodificador de modo que este en posicion de decodificar los valores de 55 muestra de audio asociados con la trama especial (42, 80) si la trama especial es la primera trama despues de la puesta en marcha del decodificador; y

generar la corriente de bits concatenando la trama especial (42, 80) y las otras tramas de la pluralidad de tramas,

en el que los datos de audio codificados comprenden una pluralidad de segmentos (30), en el que cada segmento esta asociado con una de una pluralidad de partes de la secuencia de valores de muestra de audio y comprende una pluralidad de tramas (40), en el que se anade una trama especial (42, 80) al comienzo de cada 5 segmento (30) independientemente de si la configuracion del codec cambia o no.
19. Procedimiento segun la reivindicacion 18, en el que la informacion adicional comprende informacion sobre la configuracion de codec (84) utilizada para codificar los valores de muestra de audio asociados con la trama especial (42, 80).

10
20. Programa informatico para realizar, cuando se ejecuta en un ordenador o un procesador, el procedimiento de una de las reivindicaciones 15 a 19.