ES2365433T3 - Codificación de una señal de información. - Google Patents

Codificación de una señal de información. Download PDF

Info

Publication number
ES2365433T3
ES2365433T3 ES07818607T ES07818607T ES2365433T3 ES 2365433 T3 ES2365433 T3 ES 2365433T3 ES 07818607 T ES07818607 T ES 07818607T ES 07818607 T ES07818607 T ES 07818607T ES 2365433 T3 ES2365433 T3 ES 2365433T3
Authority
ES
Spain
Prior art keywords
grid
frame
audio signal
frames
frequency component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07818607T
Other languages
English (en)
Inventor
Markus Schnell
Michael Schuldt
Manfred Lutzky
Manuel Jander
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=38657988&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2365433(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2365433T3 publication Critical patent/ES2365433T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Circuits Of Receivers In General (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Codificador con un dispositivo (104, 106) para codificar una componente de baja frecuencia de una señal de audio en unidades de tramas (902) de la señal de audio; un dispositivo (118) para localizar transitorios en la señal de audio; un dispositivo (116) para, en función de la localización, asignar un respectivo modo de reconstrucción de entre al menos dos posibles modos de reconstrucción a las tramas de la señal de audio, y, para tramas, a las que se ha asignado un primero de los al menos dos posibles modos de reconstrucción, asignar una respectiva indicación de posición de transitorio a estas tramas; y un dispositivo (110, 112, 114) para generar una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de los al menos dos posibles modos de reconstrucción, los límites (902a, 902b) de trama de estas tramas (902) coinciden con límites de cuadrícula de la cuadrícula (222a, 220, 222b), y los límites de cuadrícula de la cuadrícula en el interior de estas tramas dependen de la indicación de posición de transitorio; y un dispositivo (108) para agrupar la componente de baja frecuencia codificada, la representación de la envolvente espectral e información sobre los modos de reconstrucción asignados y las indicaciones de posición de transitorio en una señal de audio codificada.

Description

La presente invención se refiere a la codificación de audio y en este caso en particular a la codificación SBR (Spectral Band Replication; replicación de la banda espectral).
En aplicaciones con una tasa de transmisión de bits disponible muy baja se conoce, en conexión con la codificación de señales de audio, utilizar una técnica SBR para la codificación. A este respecto sólo se codifica totalmente la componente de baja frecuencia, es decir en resolución temporal y espacial razonable. Para la componente de alta frecuencia sólo se detecta y codifica la envolvente espectral (spectral envolvente) o la envolvente del desarrollo temporal espectral de la señal de audio. En el lado del decodificador se recupera la componente de baja frecuencia a partir de la señal codificada y a continuación se recurre a ella, para reconstruir o “recrear” a partir de ella la componente de alta frecuencia. Sin embargo, para adaptar a este respecto la energía de la componente de alta frecuencia así reconstruida provisionalmente a la energía real en la componente de alta frecuencia de la señal de audio original, en el lado del decodificador se usa la envolvente espectral transmitida para la ponderación espectral de la componente de alta frecuencia reconstruida provisionalmente.
Para que el esfuerzo anterior merezca la pena, es importante naturalmente que el número de bits empleado para la transmisión de la envolvente espectral sea lo más bajo posible. Por eso es deseable que la cuadrícula temporal, en la que se codifica la envolvente espectral, sea lo más basta posible. Por otro lado, una cuadrícula demasiado basta conduce sin embargo a artefactos audibles, lo que se hace notar en particular en el caso de transitorios, es decir puntos, en los que no predominan, como es habitual, las componentes de baja frecuencia, sino más bien sobre todo las componentes de alta frecuencia, o en los que está presente al menos una subida rápida de la amplitud de las componentes de alta frecuencia. En señales de audio, tales transitorios corresponden por ejemplo a inicios de notas, como por ejemplo el toque de una cuerda de piano o similar. Si la cuadrícula es demasiado basta más allá del periodo de un transitorio, entonces esto puede llevar, en la reconstrucción en el lado del decodificador de la señal de audio completa, a artefactos audibles, porque en el lado del decodificador se reconstruye en realidad la señal de alta frecuencia a partir de la componente de baja frecuencia, normalizando dentro de una zona de cuadrícula la energía espectral de la componente de baja frecuencia decodificada y después adaptándola mediante ponderación a la envolvente espectral transmitida. Dicho de otro modo, dentro de la zona de cuadrícula se realiza simplemente una ponderación espectral, para reproducir la componente de alta frecuencia a partir de la componente de baja frecuencia. Sin embargo, si la zona de cuadrícula alrededor del transitorio es demasiado grande, entonces se pone dentro de esta zona de cuadrícula además de la energía del transitorio mucha energía en la parte de fondo o de acorde en la componente de baja frecuencia, a la que se recurre para la reproducción de la componente de altafrecuencia. Ésta se intensifica conjuntamente por el factor de ponderación, a pesar de que no lleva a una buena estimación de la componente de alta frecuencia. Esto lleva, más allá de toda la zona de cuadrícula, a un artefacto audible, que empieza además temporalmente aún antes del verdadero transitorio. Este problema puede denominarse también “pre-eco”.
El problema se resolvería si la zona de cuadrícula fuese suficientemente estrecha alrededor del transitorio, de modo que mejorara la relación transitorio-fondo de la parte de la componente de baja frecuencia dentro de esta zona de cuadrícula. Zonas de cuadrícula pequeñas o distancias límite de cuadrícula pequeñas van, sin embargo, en contra del deseo anteriormente esbozado de un consumo de bits bajo para la codificación de la envolvente espectral.
El documento WO-A1-01/26095 da a conocer un procedimiento para la codificación con una tasa de transmisión de datos baja: límites de segmento y resoluciones de frecuencia se señalizan implícitamente mediante las indicaciones “presencia de transitorios” y “posición de transitorio”.
En la norma ISO/IEC 14496-3 (en lo sucesivo denominada simplemente “la norma”) se describe una codificación SBR en conexión con el codificador AAC. El codificador AAC codifica a este respecto la componente de baja frecuencia trama por trama. Para cada trama SBR de este tipo se define la resolución de tiempo y de frecuencia anteriormente explicada, en la que se codifica la envolvente espectral de la componente de alta frecuencia en esta trama. Para abordar el problema de que puedan encontrarse transitorios también en los límites de trama SBR, la norma autoriza que la cuadrícula temporal pueda definirse provisionalmente de modo que los límites de cuadrícula no coincidan en absoluto con los límites de trama. Más bien el codificador transmite, en esta norma, al decodificador por cada trama un elemento de sintaxis bs_frame_class, que indica por cada trama, si la cuadrícula temporal de la rejilla de envolvente espectral para la respectiva trama se define exactamente entre los dos límites de trama o entre límites, que están desplazados de los límites de trama, y concretamente hacia delante y/o hacia atrás. En total hay cuatro clases diferentes de tramas SBR, concretamente FIXFIX, FIXVAR, VARFIX y VARVAR. La sintaxis, que el codificador utiliza para ello en la norma, por cada trama SBR para definir la cuadrícula se muestra en la figura 12 en una representación de pseudocódigo. En particular, en la representación de la figura 12 está expresados los elementos de sintaxis que realmente se codifican o transmiten por el codificador, en negrita en la figura 12, indicándose el número de bits empleados para la transmisión o codificación en la segunda columna desde la derecha en la respectiva fila. Tal como puede verse, en primer lugar para cada trama SBR se transmite el elemento de sintaxis que acaba de mencionarse bs_frame_class. En función de éste siguen otros elementos de sintaxis, que, tal como también se esboza, definen la resolución temporal o rejilla. Si por ejemplo el elemento de sintaxis de 2 bits bs_frame_class indica que se trata de una trama SBR FIXFIX, entonces como segundo elemento de sintaxis se transmite el elemento de sintaxis tmp, que define el número de zonas de cuadrícula en esta trama SBR o el número de “envolventes” (“envelopes”) como 2tmp. El elemento de sintaxis bs_amp_res, que utiliza el tamaño de paso de cuantificación para la codificación de la envolvente espectral en la trama SBR actual, se ajusta automáticamente en función de bs_num_env y no se codifica o transmite. Finalmente, para una trama FIXFIX se transmite también un bit para la determinación de la resolución de frecuencia de la cuadrícula bs_freq_res. Las tramas FIXFIX están definidas con precisión para una trama, es decir los límites de cuadrícula coinciden con los límites de trama, según se define por el codificador AAC.
Esto es diferente para las otras tres clases. Para tramas FIXVAR, VARFIX y VARVAR, se transmiten los elementos de sintaxis bs_var_bord_1 y/o bs_bar_bod_0, para indicar cuántas ranuras de tiempo, es decir las unidades de tiempo en las que funciona el banco de filtros para la descomposición espectral de la señal de audio, están desplazadas con respecto a los límites de trama normales. Según esto se transmiten entonces también elementos de sintaxis bs_num_rel_1 y un tmp correspondiente al mismo y/o bs_num_rel_0 y un tmp correspondiente al mismo, para definir un número de zonas de cuadrícula o envolventes y el tamaño de las mismas a partir del límite de trama desplazado. Finalmente se transmite en las tramas SBR variables aún un elemento de sintaxis bs_pointer, que apunta a una de las envolventes definidas y sirve para definir una o dos envolventes de ruido para la determinación de la componente de ruido en la trama en función de la rejilla de envolvente espectral, lo que no se comentará sin embargo a continuación para mayor simplificación de la representación. Finalmente se determina también para todas las zonas de cuadrícula o envolventes en las respectivas tramas variables la respectiva resolución de frecuencia, concretamente mediante un respectivo elemento de sintaxis de un bit bs_freq_res por cada envolvente.
La figura 13a representa a modo de ejemplo una trama FIXFIX, en la que el elemento de sintaxis tmp 1 es tal que el número de envolventes bs_num_env asciende a 21=2. En la figura 13a se supone que el eje temporal discurre en horizontal desde la izquierda hacia la derecha. Una trama SBR, es decir una de las tramas, en la que el codificador AAC realiza la codificación de la componente de baja frecuencia, está indicado en la figura 13a con el número de referencia 902. Tal como puede verse, la trama 902 SBR tiene una longitud de 16 ranuras QMF, siendo las ranuras QMF tal como se ha mencionado las ranuras de tiempo en cuyas unidades trabaja el banco de filtros de análisis, estando indicadas las ranuras QMF en la figura 13a mediante casillas 904. En tramas FIXFIX, las envolventes o zonas 906a y 906b de cuadrícula, en este caso por tanto dos, ocupan la misma longitud dentro de la trama 902 SBR, de modo que un límite 908 de cuadrícula temporal o envolvente se define con precisión en el centro de la trama 902 SBR. De esta manera, la trama FIXFIX de ejemplo de la figura 13a define que, a partir de los valores espectrales del banco de filtros de análisis se determina en el tiempo una distribución espectral para la zona de cuadrícula o la envolvente 906a y otra más para la envolvente 906. Las envolventes o zonas 906a y 906b de cuadrícula establecen por tanto la cuadrícula, en la que se codifica o transmite la envolvente espectral.
La figura 13b muestra, como comparación, una trama VARVAR. La trama 902 SBR y las ranuras 904 QMF correspondientes están indicadas de nuevo. Para esta trama SBR se ha definido no obstante mediante los elementos de sintaxis bs_var_bord_0 ó bs_var_bord_1, que las envolventes 906a’, 906b’ y 906c’ pertenecientes a ésta no deben empezar en el inicio 902a de trama SBR ni terminar en el final 902b de trama SBR. Más bien puede observarse en la figura 13b, que ya la trama SBR anterior (que no puede verse en la figura 13b) se ha prolongado dos ranuras QMF más allá del inicio 902a de trama SBR de la trama SBR actual, de modo que la última envolvente 910 de la trama SBR anterior se extiende todavía en la trama 902 SBR actual. La última envolvente 906c’ de la trama actual también se extiende más allá del final de trama SBR de la trama 902 SBR actual, concretamente en este caso a modo de ejemplo también dos ranuras QMF. En este caso a modo de ejemplo también se ve que los elementos de sintaxis de la trama VARVAR bs_ num_rel_0 y bs_num_rel_1 están ajustados en cada caso a 1, con la información adicional de que las envolventes así definidas al principio y al final de la trama 902 SBR, concretamente 906a’ y 906b’, tienen, según tmp = 1, una longitud de cuatro ranuras QMF, para extenderse por tanto este número de ranuras más allá de los límites de trama en la trama 902 SBR. El espacio que queda de la trama 902 SBR es ocupado entonces por la envolvente que queda, en este caso la tercera envolvente 906b’.
En la figura 13b se indica con T en una de las ranuras 904 QMF también a modo de ejemplo el motivo por el que en este caso se ha definido una trama VARVAR, concretamente porque la posición T de transitorio se encuentra cerca del final 902b de trama SBR, y también en la trama SBR delante de la actual era un transitorio (no visible).
La versión normalizada según ISO/ICE 14496-3 incluye por tanto un solapamiento de dos tramas SBR sucesivas. Esto posibilita una colocación variable de los límites de envolvente, independientemente de los verdaderos límites de trama SBR según el desarrollo de la señal. Los transitorios pueden envolverse así mediante envolventes propias y su energía aislarse del resto de la señal. Un solapamiento incluye sin embargo también un retardo de sistema adicional, tal como se expuso anteriormente. En particular en la norma se usan, para la señalización, cuatro clases de trama. En la clase FIXFIX los límites de las envolventes SBR, tal como se muestra en la figura 13a, coinciden con los límites de la trama principal. La clase FIXFIX se usa cuando no se encuentra ningún transitorio en esta trama. El número de envolventes establece su distribución equidistante dentro de la trama. La clase FIXVAR está prevista cuando se encuentra un transitorio en la trama actual. En este caso empieza por tanto el respectivo conjunto de envolventes en el límite de trama SBR y termina de manera variable en el intervalo de transmisión SBR. La clase VARFIX está prevista para el caso en el que no se encuentra un transitorio en la trama actual pero sí en la anterior. La serie de envolventes a partir de la última trama continúa en este caso mediante un nuevo conjunto de envolventes, que termina en el límite de trama SBR. La clase VARVAR está prevista para el caso en el que se encuentra un transitorio tanto en la última trama como en la actual. En este caso continúa una serie variable de envolventes mediante una serie variable adicional. Tal como se describió anteriormente, a este respecto los límites de las envolventes variables se transmiten unos en relación con otros.
A pesar del número de ranuras QMF que pueden desplazarse los límites mediante los elementos de sintaxis bs_var_bord_0 y bs_var_bord_1 con respecto a los límites de trama fijos, esta posibilidad genera, debido a la aparición de envolventes, que se extienden más allá de los límites de trama SBR y por tanto hacen necesaria la formación o promediación de energías de señal espectral más allá de los límites de trama SBR, un retardo en el lado del decodificador. Este retraso en el tiempo no es tolerable sin embargo en algunas aplicaciones, como por ejemplo en aplicaciones en el ámbito de la telefonía u otras aplicaciones en tiempo real, en las que es importante que el retardo en el tiempo debido a la codificación y decodificación sea bajo. Aunque se evita por tanto la aparición de preecos, la solución no es adecuada para aplicaciones que requieren un tiempo de retardo corto. Además, el número de bits, necesarios para la transmisión de las tramas SBR en la norma anteriormente descrita, es relativamente alto.
El objetivo de la presente invención consiste en crear un esquema de codificación que permita, abordando suficientemente el problema de los transitorios o del pre-eco, con una tasa de transmisión de bits moderada o incluso baja, tiempos de retardo más bajos o, abordando suficientemente el problema de los transitorios o del preeco, un tiempo de retardo reducido con pérdidas moderadas de tasa de transmisión de bits.
Este objetivo se soluciona mediante un codificador según la reivindicación 1 ó 32, un decodificador según la reivindicación 12, 26 ó 36, una señal de audio codificada según la reivindicación 23 ó 39 así como mediante un procedimiento según la reivindicación 24, 25, 31, 33, 37 ó 38.
Un reconocimiento de la presente invención consiste en que el problema de los transitorios se aborda suficientemente y para ello puede reducirse un retardo adicional en el lado de la decodificación, si se usa una nueva clase de trama SBR, en la que los límites de trama no se desplazan, es decir los límites de cuadrícula siempre están todavía sincronizados con los límites de trama, pero en la que además se usa una indicación de posición de transitorio como elemento de sintaxis, para utilizarse en el lado del codificador y del decodificador dentro de las tramas de esta nueva clase de trama para la determinación de los límites de cuadrícula dentro de estas tramas.
Según un ejemplo de realización de la presente invención la indicación de posición de transitorio se usa de modo que alrededor de la posición de transitorio está definida una zona de cuadrícula relativamente corta, en lo sucesivo designada como envolvente de transitorio, mientras que en la parte restante delante y/o detrás en la trama sólo se extiende una envolvente de la envolvente de transitorio hasta el inicio o el final de la trama. El número de bits que deben transmitirse o codificarse para la nueva clase de tramas es por tanto también muy bajo. Por otro lado, pueden abordarse suficientemente los transitorios o problemas de pre-eco asociados a los mismos. Las tramas SBR variables, tales como FIXVAR, VARFIX y VARVAR, ya no son por tanto necesarias, de modo que ya no son necesarios retardos para la compensación de envolventes, que se extienden más allá de los límites de trama SBR. Según un ejemplo de realización de la presente invención se admite por consiguiente también únicamente dos clases de trama, concretamente una clase FIXFIX y esta clase que acaba de describirse, que en lo sucesivo se denominará clase LD_TRAN.
Según otro ejemplo de realización de la presente invención no siempre se transmiten para cada zona de cuadrícula en las tramas de las clase LD_TRAN uno o varios valores de envolvente espectral o de energía espectral o se insertan en la señal de información codificada, concretamente cuando la envolvente de transitorio establecida en su posición dentro de la trama mediante la indicación de posición de transitorio se encuentra cerca del límite de trama anterior en el tiempo, de modo que la envolvente que se encuentra el límite de trama anterior en el tiempo y la envolvente de transitorio de esta trama LD_TRAN sólo se extiende más allá durante un corto periodo de tiempo, lo que sin embargo no está justificado desde el punto de vista de la eficacia de codificación, ya que efectivamente el hecho de que esta envolvente sea corta no está condicionado por un transitorio sino más bien por la casual proximidad en el tiempo del límite de trama y del transitorio. Según este ejemplo de realización alternativo, se adoptan por tanto para esta envolvente en cuestión el o los valores de energía espectral y la correspondiente resolución de frecuencia de la envolvente anterior, al igual que por ejemplo la componente de ruido. Una transmisión no puede tener lugar por tanto, debido a que aumenta la tasa de compresión. En cambio las pérdidas de calidad de audición son sólo reducidas, ya que en este punto no existe problema alguno de transitorios. Además en el lado del decodificador tampoco aparece ningún retardo, ya que para todas las envolventes implicadas, es decir la envolvente de la trama previa, la envolvente de transitorio y la envolvente que se encuentra en medio, es posible directamente el uso de reconstrucción de alta frecuencia.
Según otro ejemplo de realización la problemática de una cantidad de datos alta no deseada cuando aparece un transitorio al final de una trama LD_TRAN se trata acordando entre el codificador y el decodificador cuánto deberá penetrar virtualmente la envolvente de transitorio que se encuentra junto al límite de trama posterior de la trama LD_TRAN actual en la siguiente trama. La decisión se toma por ejemplo igualmente por medio de acceso a tablas en el codificador y el decodificador. Según se acuerde, se acorta entonces la primera envolvente de la siguiente trama, como por ejemplo la única envolvente de una trama FIXFIX, para no empezar hasta el final de la envolvente que se extiende virtualmente. El codificador calcula el o los valores de energía espectrales para la envolvente virtual durante
5
15
25
35
45
toda la duración de esta envolvente virtual y en cambio transmite el resultado aparentemente sólo para la envolvente de transitorio, dado el caso de una manera reproducida en función de la relación de la componente temporal de las envolventes virtuales en la trama anterior y posterior. En el lado del decodificador se usan el o los valores de energía espectrales de la envolvente de transitorio que se encuentra al final tanto para la reconstrucción de alta frecuencia en esta envolvente de transitorio como, por separado, para la reconstrucción de alta frecuencia en la zona de extensión inicial en la siguiente trama, deduciendo uno o varios valores de energía espectral para esta zona a partir del o de los de la envolvente de transitorio. Se evita de este modo un “sobremuestreo” de transitorios que se encuentran junto a límites de trama.
Según otro aspecto de la presente invención un reconocimiento de la presente invención consiste en que la problemática de los transitorios descrita en la introducción de la descripción se aborda suficientemente y puede reducirse un retardo en el lado de la decodificación, si se usa ciertamente una división de envolvente o zona de cuadrícula, según la cual si bien las envolventes pueden extenderse más allá de los límites de trama, para solaparse con dos tramas adyacentes, sin embargo a este respecto estas envolventes se subdividen de nuevo por el decodificador en el límite de trama y la reconstrucción de alta frecuencia se realiza en la cuadrícula así subdividida que coincide con los límites de trama. Para las subzonas de cuadrícula así obtenidas de las zonas de cuadrícula que se solapan se obtienen en el lado del decodificador en cada caso uno o una pluralidad de valores de energía espectrales a partir del uno o la pluralidad de valores de energía espectrales, tal como se han transmitido para la envolvente que se extiende más allá del límite de trama.
Según otro aspecto más de la presente invención un reconocimiento de la presente invención consiste en que puede obtenerse un retardo en el lado de la decodificación mediante la reducción del tamaño de trama o el número de valores de muestreo contenidos en la misma y el efecto de la tasa de transmisión de bits aumentada asociado a ello puede reducirse, si para tramas con modos de reconstrucción, según los cuales los límites de cuadrícula coinciden con los límites de trama de estas tramas, como por ejemplo las tramas FIXFIX, o para el modo de reconstrucción correspondiente, se introduce un nuevo indicador (flag) o se introduce una nueva indicación de ausencia de transitorio. Concretamente, si no se encuentra ningún transitorio en una trama acortada de este tipo, y tampoco se encuentra ningún transitorio en la proximidad de esta trama, de modo que la señal de información en este punto es estacionaria, entonces puede usarse la indicación de ausencia de transitorio, para no incorporar a la primera zona de cuadrícula de una trama de este tipo ningún valor que describa la envolvente espectral en la señal de información codificada, sino más bien derivarla u obtenerla en el lado del decodificador a partir del o de los valores que representan la envolvente espectral, que están presentes en la señal de información codificada para la última zona de cuadrícula o la última envolvente de la trama anterior en el tiempo. De esta manera es posible un acortamiento de las tramas con una repercusión reducida sobre la tasa de transmisión de bits, acortamiento que por un lado posibilita tiempos de retardo más bajos y por otro lado posibilita la problemática de los transitorios debido a las unidades de trama más pequeñas.
Ejemplos de realización preferidos de la presente invención se explicarán a continuación más detalladamente haciendo referencia a los dibujos adjuntos. Muestran:
la figura 1, un diagrama de bloques de un codificador según un ejemplo de realización de la presente invención;
la figura 2, un pseudocódigo para describir la sintaxis de los elementos de sintaxis, que usa el codificador según la figura 1 para definir la división de cuadrícula de tramas SBR;
la figura 3, una tabla, que puede definirse en el lado del codificador y del decodificador, para obtener a partir del elemento de sintaxis bs_transient_position en la figura 2 la información sobre el número de envolventes o zonas de cuadrícula y las posiciones de los límites de zona de cuadrícula dentro de una trama LD_TRAN;
la figura 4a, una representación esquemática para ilustrar una trama LD_TRAN;
la figura 4b, una representación esquemática para ilustrar la interacción del banco de filtros de análisis y del calculador de datos de envolvente en la figura 1;
la figura 5, un diagrama de bloques de un decodificador según un ejemplo de realización de la presente invención;
la figura 6a, una representación esquemática para ilustrar una trama LD_TRAN con envolvente de transitorio que se encuentra más delante para ilustrar la problemática que surge en este caso;
la figura 6b, una representación esquemática para ilustrar un caso en el que se encuentra un transitorio entre dos tramas, para ilustrar la correspondiente problemática en cuanto al elevado esfuerzo de codificación en este caso;
la figura 7a, una representación esquemática para ilustrar una codificación de envolvente según un ejemplo de realización para superar la problemática según la figura 6a;
la figura 7a, una representación esquemática para ilustrar una codificación de envolvente según un ejemplo de realización para superar la problemática según la figura 6b;
la figura 8, una representación esquemática para ilustrar una trama LD_TRAN con posición de transitorio TranPos = 1 según la tabla de la figura 3;
la figura 9, una tabla, que puede definirse en el lado del codificador y del decodificador, para obtener a partir del elemento de sintaxis bs_transient_position en la figura 2 la información sobre el número de envolventes o zonas de cuadrícula y las posiciones del (de los) límite(s) de zona de cuadrícula dentro de una trama LD_TRAN así como la información sobre la transferencia de datos desde la trama previa según la figura 7a y la extensión de datos en la trama siguiente según la figura 7b;
la figura 10, una representación esquemática de una secuencia FIXVAR-VARFIX para ilustrar una señalización de envolvente con envolventes que se extienden más allá de límites de trama;
la figura 11, una representación esquemática de una decodificación, que posibilita un tiempo de retardo más bajo a pesar de una señalización de envolvente según la figura 10, según otro ejemplo de realización de la presente invención;
la figura 12, un pseudocódigo de la sintaxis para la división de envolventes de trama SBR según la norma ISO/IEC 14496-3; y
las figuras 13a y 13b, representaciones esquemáticas de una trama FIXFIX y VARVAR.
La figura 1 muestra la estructura de un codificador según un ejemplo de realización de la presente invención. El codificador de la figura 1 es a modo de ejemplo un codificador de audio, que se indica en general con el número de referencia 100. Comprende una entrada 102 para la señal de audio que va a codificarse y una salida 104 para la señal de audio codificada. A continuación se supondrá que la señal de audio en la entrada 102 es una señal de audio muestreada, como por ejemplo una señal codificada por PCM. No obstante también es posible otra implementación del codificador de la figura 1.
El codificador de la figura 1 comprende además un muestreador descendente o downsampler 104 así como un codificador 106 de audio, que están conectados en el orden mencionado entre la entrada 102 y una primera entrada de un formateador 108, cuya salida está unida a su vez con la salida 104 del codificador 100. Mediante la interconexión de los componentes 104 y 106 se produce en la salida del codificador 106 de audio una codificación de señal 102 de audio muestreada en sentido descendente, lo que corresponde a su vez a una codificación de la componente de baja frecuencia de la señal 102 de audio. El codificador 106 de audio es un codificador que funciona por tramas, en el sentido de que el resultado de codificación, que aparece en la salida del codificador 106 de audio, sólo puede decodificarse en unidades de estas tramas. A modo de ejemplo se supondrá a continuación que el codificador 106 de audio es un codificador compatible con AAC-LD conforme a la norma según ISO/IEC 14496-3.
Entre la entrada 102 y una entrada adicional del formateador 108 están conectados un banco 110 de filtros de análisis, un calculador 112 de datos de envolvente así como un codificador 114 de datos de envolvente en el orden mencionado. Adicionalmente el codificador 100 comprende un control 116 de tramas SBR, entre cuya entrada y la entrada 102 está conectado un detector 118 de transitorios. Las salidas del control 116 de tramas SBR están unidas tanto con una entrada del calculador 112 de datos de envolvente como con una entrada adicional del formateador
108.
Tras haber descrito anteriormente la escritura del codificador de la figura 1, se describe a continuación su modo de funcionamiento. Tal como ya se ha mencionado, en la primera entrada del formateador 108 aparece una versión codificada de la componente de baja frecuencia de la señal 102 de audio, de modo que el codificador 106 de audio codifica la versión muestreada en sentido descendente de la señal 102 de audio, en la que sólo se retransmite por ejemplo cada segundo valor de muestreo de la señal de audio original. El banco 110 de filtros de análisis genera una descomposición espectral de la señal 102 de audio con una cierta resolución temporal. A modo de ejemplo se supone que el banco 110 de filtros de análisis es un banco de filtros QMF (QMF = quadrature mirror filter; filtro espejo en cuadratura). El banco 110 de filtros de análisis genera, por cada ranura de tiempo QMF, M valores de subbanda, comprendiendo las ranuras de tiempo QMF por ejemplo en cada caso 64 valores de muestreo de audio. Para reducir la tasa de transmisión de datos, el calculador 112 de datos de envolvente forma, a partir de la información espectral de alta resolución temporal y espectral del banco 110 de filtros de análisis, una representación de la envolvente espectral de la señal 102 de audio con una resolución más baja adecuada, es decir en una cuadrícula de tiempo y frecuencia adecuada. A este respecto la cuadrícula de tiempo y frecuencia se ajusta mediante el control 116 de tramas SBR por cada trama, es decir por cada trama de las tramas, según se definan por el codificador 106 de audio. El control 116 de tramas SBR lleva a cabo a su vez este control en función de transitorios detectados o localizados, según se detecten o localicen por el detector 118 de transitorios. Para la detección de transitorios o instantes de inicio de notas, el detector 118 de transitorios lleva a cabo un análisis estadístico adecuado de la señal 102 de audio. El análisis puede realizarse, a este respecto, en el dominio de tiempo
o en el rango espectral. El detector 118 de transitorios puede evaluar por ejemplo la curva envolvente temporal de la señal de audio, como por ejemplo la evaluación del incremento de la curva envolvente temporal. Tal como se describirá a continuación aún más detalladamente, el control 116 de tramas SBR asigna a cada trama o trama SBR una de dos posibles clases de trama SBR, concretamente o bien la clase FIXFIX o bien la clase LD_TRAN. En particular, el control 116 de tramas SBR asigna a cada trama, en la que no se encuentra ningún transitorio, la clase FIXFIX, mientras el control de tramas asigna a cada trama, en la que se encuentra un transitorio, la clase LD_TRAN. El calculador 112 de datos de envolvente ajusta la cuadrícula temporal según las clases de trama SBR, según se hayan asignado a las tramas por el control 116 de tramas SBR. Independientemente de la asignación exacta, todoslos límites de trama coinciden siempre con límites de cuadrícula. Únicamente los límites de cuadrícula dentro de las tramas se ven afectados por la asignación de clases. Tal como se explicará aún más detalladamente más adelante, el control de tramas SBR ajusta también, según la clase de trama asignada, otros elementos de sintaxis, y los entrega al formateador 108. Aunque en la figura 1 no se representa explícitamente, los elementos de sintaxis pueden someterse a este respecto naturalmente a una codificación.
El calculador 112 de datos de envolvente entrega por tanto una representación de la envolvente espectral en una resolución, que corresponde a la cuadrícula temporal y espectral, predefinida por el control 116 de tramas SBR, concretamente mediante un valor espectral por cada zona de cuadrícula. Estos valores espectrales se codifican por el codificador 114 de datos de envolvente y se retransmiten al formateador 108. Dado el caso el codificador 114 de datos de envolvente también puede omitirse. El formateador 108 agrupa la información obtenida en el flujo 104 de datos de audio codificado o la señal de audio codificada y la entrega a la salida 104.
A continuación se describirá el modo de funcionamiento del codificador de la figura 1 de manera algo más precisa por medio de las figuras 2 a 4b con respecto a la retícula temporal, que se ajusta mediante el control 116 de tramas SBR y a la que recurre el calculador 112 de datos de envolvente, con el fin de determinar, a partir de la señal de salida del banco de filtros de análisis, la envolvente de señal en la retícula predefinida.
La figura 2 muestra en primer lugar mediante un pseudocódigo, a través de qué elementos de sintaxis predefine el control 116 de tramas SBR la retícula, que deberá utilizar el calculador 112 de datos de envolvente. Al igual que en el caso de la figura 12, en la figura 2 los elementos de sintaxis, que se retransmiten realmente desde el control 116 de tramas SBR al formateador 108 para la codificación o para la transmisión, están representados en negrita, indicándose en la columna 202 en las respectivas filas el número de bits, que se usa para la representación del respectivo elemento de sintaxis. Tal como puede verse, en primer lugar se determina para la trama SBR mediante el elemento de sintaxis bs_frame_class, si la trama SBR es una trama FIXFIX o una trama LD_TRAN. En función de esto (204) se realiza la transmisión de los diferentes elementos de sintaxis. En el caso de la clase FIXFIX (206) se ajusta en primer lugar, mediante el elemento de sintaxis de 2 bits tmp, el elemento de sintaxis bs_num_env[ch] de la
2tmp
trama SBR actual ch a (208). En función del número bs_nüm_env[ch] se deja el elemento de sintaxis bs_amp_res en un valor de 1 ajustado previamente de manera predefinida o se ajusta a cero (210), indicando el elemento de sintaxis bs_amp_res la precisión de cuantificación, con la que los valores de envolvente espectral obtenidos en la rejilla predefinida por el calculador 112 se retransmiten, codificados por el codificador 114, al formateador 108. Las zonas de cuadrícula o envolventes predefinidas en cuanto a su número por bs_num_env[ch] se ajustan en cuanto a su resolución de frecuencia, a la que debe recurrir en las mismas el calculador 112 de datos de envolvente, para determinar en las mismas la envolvente espectral, mediante un elemento de sintaxis bs_freq_res[ch] común (211), que se retransmite con un bit desde el control 116 de tramas SBR al formateador 108 (212).
Por medio de la figura 13a se describirá a continuación una vez más el modo de funcionamiento del calculador 112 de datos de envolvente, cuando por medio del control 116 de tramas SBR se predefine que una trama 902 SBR actual es una trama FIXFIXFIX. En este caso, el calculador 112 de datos de envolvente subdivide la trama 902 actual, que consiste en este caso a modo de ejemplo en N = 16 ranuras 904 de tiempo del banco de filtros de análisis, de manera uniforme en zonas de cuadrícula o envolventes 906a y 906b, de modo que en este caso ambas zonas de cuadrícula o ambas envolventes 906a, 906b tienen una longitud de N/bs_num_inv[ch] ranuras 904 de tiempo y por tanto caben varias ranuras de tiempo entre los límites 902a y 902b de trama SBR. Dicho de otro modo, el calculador 112 de datos de envolvente, en el caso de tramas FIXFIX, ordena los límites 908 de cuadrícula dentro de estas tramas SBR distribuidas de manera equidistante, de manera uniforme entre los límites 902a, 902b de trama SBR. Tal como ya se ha mencionado, el banco 110 de filtros de análisis entrega por cada ranura 904 de tiempo valores espectrales de subbanda. El calculador 112 de datos de envolvente agrupa ahora temporalmente los valores de subbanda por envolvente y suma la suma de sus cuadrados para obtener las energías de subbanda en resolución de envolvente. Según el elemento de sintaxis bs_freq_res[ch], el calculador 112 de datos de envolvente agrupa además en dirección espectral algunas subbandas, para reducir la resolución de frecuencia. De esta manera el calculador 112 de datos de envolvente entrega por cada envolvente 906a, 906b un muestreo de energía de envolvente espectral con una resolución de frecuencia, que depende de bs_freq_res[ch]. Estos valores se codifican entonces con una cuantificación por el codificador 114, que depende a su vez de bs_amp_res.
La descripción anterior se refería hasta ahora al caso de que el control 116 de tramas SBR asigna a una trama determinada la clase FIXFIX, lo que, tal como se describió anteriormente, es el caso cuando no se encuentra ningún transitorio en esta trama. La siguiente descripción se refiere sin embargo a la otra clase, concretamente la clase LDN-TRAN, que se asigna a una trama, cuando se encuentra en la misma un transitorio, según se indica mediante el detector 118. Si por tanto el elemento de sintaxis bs_frame_class indica que esta trama es una trama LDN-TRAN (214), entonces el control 116 de tramas SBR determina y transmite con cuatro bits un elemento de sintaxis bs_transient_position, para indicar en unidades de ranuras 904 de tiempo, por ejemplo con respecto al inicio 902a de trama o alternativamente con respecto al final 902b de trama, la posición del transitorio, según se haya localizado por el detector 118 de transitorios (216). Para ello basta con que estén presentes cuatro bits. Un caso a modo de ejemplo se representa en la figura 4a. La figura 4a muestra de nuevo la trama 902 SBR que comprende las 16 ranuras 904 de tiempo. En la sexta ranura 904 de tiempo desde el inicio 902a de trama SBR se encuentra un transitorio T, lo que correspondería a bs_tränsient_position = 5 (la primera ranura de tiempo es la ranura de tiempo cero). Tal como se indica ahora mediante 218 en la figura 2, la siguiente sintaxis para el ajuste de cuadrícula de una trama LD_TRAN depende de bs_transient_position, lo que debe tenerse en cuenta en el lado del decodificador durante el análisis sintáctico realizado por un correspondiente demultiplexor. En 218 puede explicarse sin embargo también el modo de funcionamiento del calculador 112 de datos de envolvente en cuanto a la obtención del elemento de sintaxis bs_transient_position por el control 116 de tramas SBR, que es el siguiente. El calculador 112 consulta por medio de la indicación de posición de transitorio bs_transient_position en una tabla, de la que se muestra un ejemplo en la figura 3. Tal como expone a continuación más detalladamente haciendo referencia a la tabla de la figura 3, el calculador 112 ajusta por medio de la tabla una subdivisión de envolvente dentro de la trama SBR, de modo que una envolvente de transitorio corta está dispuesta alrededor de la posición de transitorio T, mientras que una o dos envolventes 222a y 222b ocupan la parte restante de la trama 902 SBR, concretamente la parte de la envolvente 220 de transitorios hasta el inicio 902a de trama SBR o la parte de la envolvente 220 de transitorio hasta el final 902b de trama SBR.
La tabla mostrada en la figura 3 y usada por el calculador 112 comprende ahora cinco columnas. En la primera columna están introducidas las posibles posiciones de transitorio, que se extienden en el presente ejemplo desde cero hasta 15. En la segunda columna se indica el número de envolventes o zonas 220, 222a o 222b de cuadrícula, que se obtienen en la respectiva posición de transitorio. Tal como puede observarse, los posibles números se sitúan en 2 ó 3, según si la posición de transitorio se encuentra cerca del inicio de trama SBR o del final de trama SBR, 902a, 902b, en cuyo caso sólo están presentes dos envolventes. En la tercera columna se indica la posición del primer límite de envolvente dentro de la trama, es decir el límite de las dos primeras envolventes adyacentes en unidades de ranuras 904 de tiempo, y en sentido estricto la posición del inicio de la segunda envolvente, indicando la posición = cero la primera ranura de tiempo en la trama SBR. En la cuarta columna se indica de manera correspondiente la posición del segundo límite de envolvente, es decir el límite entre la segunda y la tercera envolvente, estando definida naturalmente esta indicación sólo para las posiciones de transitorio, para las que están previstas tres envolventes. En caso contrario, en estas columnas los valores introducidos no son importantes, lo que en la figura 3 se indica con “-”. Tal como puede verse a modo de ejemplo en la tabla de la figura 3, sólo existe por ejemplo la envolvente 220 de transitorio y la siguiente envolvente 222b para el caso en el que la posición de transitorio T se sitúa en una de las dos primeras ranuras 904 de tiempo desde el inicio 902a de trama SBR. Sólo cuando la posición de transitorio se sitúa en la tercera ranura de tiempo desde el inicio 902a de trama SBR, existen tres envolventes 222a, 220, 222b, comprendiendo la envolvente 222a las dos primeras ranuras de tiempo, la envolvente 220 de transitorio la tercera y cuarta ranura de tiempo, y la envolvente 222b el resto de ranuras de tiempo, es decir a partir de la quinta. En la última columna en la tabla de la figura 3 se indica para cada posibilidad de posición de transitorio, que corresponde la mayoría de las veces a dos o tres envolventes, aquélla en la que se encuentra el transitorio o la posición de transitorio, siendo evidentemente esta información redundante y por tanto no debe mantenerse obligatoriamente en forma de tabla. La información en la última columna sirve sin embargo para establecer, de una manera que se describirá a continuación más detalladamente, el límite entre dos envolventes de ruido, dentro de las cuales el calculador 112 determina un valor que indica la altura de la componente de ruido dentro de estas envolventes de ruido. La manera en que el calculador 112 determina el límite entre estas envolventes de ruido o zonas de cuadrícula, se conoce en el lado del decodificador, y se realiza en el lado del decodificador de la misma manera, tal como se presenta en la tabla de la figura 3 también en el lado del decodificador, concretamente para el análisis sintáctico y para la retícula.
Volviendo a la figura 2, el calculador 112 también puede determinar el número de envolventes o zonas de cuadrícula en las tramas LD_TRAN a partir de la tabla 2 de la figura 3, indicando el control (116) de tramas SBR para cada una de estas dos o tres envolventes la resolución de frecuencia mediante un correspondiente elemento de sintaxis de 1 bit bs_freq_res[ch] por cada envolvente (220). El control 116 transmite asimismo los valores de sintaxis que ajustan la resolución de frecuencia bs_freq_res[ch] al formateador 108 (220).
El calculador 112 calcula por tanto para todas las tramas LD_TRAN valores de energía de envolvente espectral como valores medios temporales durante la duración de las envolventes 222a, 220, 222b individuales, agrupando a este respecto en la resolución de frecuencia en función de bs_freq_res de la respectiva envolvente muchas subbandas diferentes.
La descripción anterior trataba preferentemente del modo de funcionamiento del codificador en cuanto al cálculo de las energías de señal para la representación de la envolvente espectral en la cuadrícula de tiempo/frecuencia, establecida por el control de tramas SBR. Adicionalmente, sin embargo, el codificador de la figura 1 también transmite para cada zona de cuadrícula de una cuadrícula de ruido un valor de ruido, que indica para esta zona de cuadrícula de ruido temporal, la altura de la componente de ruido en la componente de alta frecuencia de la señal de audio. Por medio de estos valores de ruido, en el lado del decodificador puede realizarse una reproducción aún mejor de la componente de alta frecuencia a partir de la componente de baja frecuencia decodificada, tal como se describirá mejor a continuación. Tal como se deduce de la figura 2, el número bs_num_noise de envolventes de ruido para tramas LD_TRAN asciende siempre a dos, mientras que el número para tramas FIXFIX con bs_num_env igual a 1 también puede ascender a uno.
La división de las tramas SBR LD_TRAN en las dos envolventes de ruido, aunque también de las tramas FIXFIX en una o dos envolventes de ruido, puede realizarse a este respecto por ejemplo del mismo modo que se describe en la norma anteriormente mencionada en el capítulo 4.6.18.3.3, al que se remite a este respecto, e incorporándose este pasaje a este respecto también en la descripción de la presente solicitud como referencia. En particular, por ejemplo mediante el calculador 112 de datos de envolvente para tramas LD_TRAN se establece el límite entre las dos envolventes de ruido sobre el mismo límite que el límite de envolvente entre la envolvente 220a y la envolvente 220 de transitorio, cuando existe la envolvente 220a, y, en caso de que la envolvente 222 no exista, el límite de envolvente entre la envolvente 220 de transitorio y la envolvente 222b.
Antes de continuar con la descripción de un decodificador, que pueda decodificar la señal de audio codificada en la salida 104 del codificador 100 de la figura 1, se comentará a continuación haciendo referencia a la figura 4b más detalladamente la interacción entre el banco 110 de filtros de análisis y el calculador 112 de datos de envolvente. En la figura 4b, los valores de subbanda individuales que entrega el banco 110 de filtros de análisis, se representan a modo de ejemplo mediante casillas 250. En la figura 4b se supone que el eje temporal t discurre de nuevo en horizontal desde la izquierda hacia la derecha. Una columna de casillas en dirección vertical corresponde por tanto a los valores de subbanda, obtenidos por el banco 110 de filtros de análisis en una determinada ranura de tiempo, debiendo indicarse mediante un eje f que la frecuencia aumenta hacia arriba. En la figura 4b se muestran a modo de ejemplo 16 ranuras de tiempo sucesivas, que pertenecen a una trama 902 SBR. En la figura 4b se supone que se trata en este caso de una trama LD_TRAN, y la posición de transitorio que es igual que la indicada a modo de ejemplo en la figura 4. La retícula que se obtiene dentro de la trama 902 o las envolventes que se obtienen, se ilustran también en la figura 4b. Asimismo en la figura 4b se indican las envolventes de ruido, concretamente mediante 252 y 254. Mediante el cálculo de la suma de los cuadrados determina ahora el calculador 112 de datos de envolvente energías de señal medias en la cuadrícula temporal y espectral, tal como se indica en la figura 4b mediante las líneas discontinuas 260. En el ejemplo de realización de la figura 4b, el calculador 112 de datos de envolvente determina por tanto para la envolvente 222a y la envolvente 222b sólo la mitad de valores de energía espectral para la representación de la envolvente espectral que para la envolvente 220 de transitorio. Sin embargo, tal como puede observarse también, los valores de energía espectral para la representación de la envolvente espectral sólo se forman sobre los valores 250 de subbanda, que se encuentran en las subbandas 1 a 32 de frecuencia más alta, mientras que las subbandas 33 a 64 de baja frecuencia se ignoran, ya que la componente de baja frecuencia se codifica efectivamente por el codificador 106 de audio. A este respecto se indica únicamente por si acaso que el número de subbandas es en este caso naturalmente sólo a modo de ejemplo, al igual que la concentración de subbandas dentro de las envolventes individuales en grupos de cuatro o de dos, tal como se indica en la figura 4b. Para permanecer en el ejemplo de la figura 4b, el calculador 112 de datos de envolvente en el ejemplo de la figura 4b calcula en total 32 valores de energía espectral para la representación de la envolvente espectral, cuya precisión de cualificación para la codificación se lleva a cabo de nuevo en función de bs_amp_res, tal como se describió anteriormente. Además, el calculador 112 de datos de envolvente determina en cada caso un valor de ruido para la envolvente 252 ó 254 de ruido basándose en los valores de subbanda de las subbandas 1 a 32 dentro de la correspondiente envolvente 252 ó 254.
Tras haber descrito anteriormente el codificador, se describe a continuación un decodificador según un ejemplo de realización de la presente invención, que es adecuado para decodificar la señal de audio codificada en la salida 103, comentándose en este caso también las ventajas que conlleva la clase LD_TRAN descrita con respecto a la tasa de transmisión de bits y retardo.
El decodificador de la figura 5, que se indica en general con 300, comprende una entrada 302 de datos para recibir la señal de audio codificada así como una salida 304 para entregar una señal de audio decodificada. Con la entrada 302 se conecta la entrada de un demultiplexor 306, que tiene tres salidas. Entre una primera de estas salidas y la salida 304 está conectado un decodificador 308 de audio, un banco 310 de filtros de análisis, un adaptador 312 de subbanda, un banco de filtros de síntesis 314 así como un sumador 316 en el orden mencionado. La salida del decodificador 308 de audio está unida además con una entrada adicional del sumador 316. Tal como se describirá mejor a continuación, en lugar del sumador 316 con su entrada adicional también puede estar prevista una unión de las salidas del banco 310 de filtros de análisis con una entrada adicional del banco 314 de filtros de síntesis. La salida del banco 310 de filtros de análisis está unida en cada caso además con una entrada de un calculador 318 de valores de amplificación, cuya salida está unida con una entrada adicional del adaptador 312 de subbanda, y que presenta también una segunda y una tercera entrada, de las que la segunda está unida con una salida adicional del demultiplexor, y de las que la tercera entrada está unida, a través de un decodificador 320 de datos de envolvente con la tercera salida del demultiplexor 306.
El modo de funcionamiento del decodificador 300 es como sigue. El demultiplexor 306 divide la señal de audio codificada que llega a la entrada 302 por medio de análisis sintáctico en primer lugar. Y concretamente el demultiplexor 306 entrega la señal de audio que se refiere a la componente de baja frecuencia codificada, generada por el codificador 106 de audio, al decodificador 308 de audio, que está configurado de tal manera que puede obtener, a partir de la información obtenida una versión decodificada de la componente de baja frecuencia de la señal de audio y entregarla en su salida. El decodificador 300 tiene por tanto conocimiento ya de la componente de baja frecuencia de la señal de audio que va a decodificarse. Sin embargo, el decodificador 300 no obtiene información directa sobre la componente de alta frecuencia. Más bien la señal de salida del decodificador 308 sirve también al mismo tiempo como señal de componente de alta frecuencia provisional o al menos como muestra o base para la reproducción de la componente de alta frecuencia de la señal de audio en el decodificador 300. Los componentes 310, 312, 314, 318 y 320 del decodificador 300 sirven para usar esta muestra, con el fin de reproducir
o reconstruir a partir de la misma la componente de alta frecuencia definitiva, combinándose esta componente de alta frecuencia así reconstruida entonces mediante el sumador 316 de nuevo con la componente de baja frecuencia decodificada, para obtener finalmente la señal 304 de audio decodificada. A este respecto únicamente se indica para mayor exhaustividad que la señal de baja frecuencia decodificada procedente del decodificador 308 también podría someterse a procesamientos preparatorios adicionales, antes de introducirla en el banco 310 de filtros de análisis, aunque esto no se muestra en la figura 5.
En el banco 310 de filtros de análisis, la señal de baja frecuencia decodificada se somete a su vez a una descomposición espectral con una resolución temporal fija y una resolución de frecuencia que corresponde esencialmente a la del banco de filtros de análisis del codificador 110. Para permanecer en el ejemplo de la figura 4b, el banco 310 de filtros de análisis entregaría por ejemplo por cada ranura de tiempo 32 valores de subbanda, que corresponden a las 32 subbandas de baja frecuencia (33-64 en la figura 4b). Es posible que los valores de subbanda, entregados por el banco 310 de filtros de análisis, se reinterpreten ya en la salida de este banco de filtros
o antes de la entrada del adaptador 312 de subbanda como los valores de subbanda de la componente de alta frecuencia, es decir que prácticamente se copien en la componente de alta frecuencia. Sin embargo, es posible además que en el adaptador 312 de subbanda a los valores de subbanda de baja frecuencia obtenidas por el banco 310 de filtros de análisis se añadan valores de subbanda de alta frecuencia en primer lugar, copiando todos o parte de los valores de subbanda de baja frecuencia en la componente de frecuencia más alta, como por ejemplo los valores de subbanda de las subbandas 33 a 64, obtenidos por el banco 310 de filtros de análisis, en las subbandas 1 a 32.
Para llevar a cabo ahora la adaptación a la envolvente espectral, codificada en el lado del codificador en la señal 104 de audio codificada, el demultiplexor 306 retransmite en primer lugar la parte de la señal 302 de audio codificada que se refiere a la codificación de la representación de la envolvente espectral, generada por el codificador 114 en el lado del codificador, al decodificador 320 de datos de envolvente, que retransmite a su vez la representación decodificada de esta envolvente espectral al calculador 318 de valores de amplificación. Además el demultiplexor 306 retransmite la parte de la señal de audio codificada que se refiere a los elementos de sintaxis para la retícula, según se hayan incorporado por el control 116 de tramas SBR en la señal de audio codificada, al calculador 318 de valores de amplificación. El calculador 318 de valores de amplificación asigna ahora, con la misma sincronización que el control 116 de tramas SBR en el lado del codificador, los elementos de sintaxis de la figura 2 a las tramas del decodificador 308 de audio. Para la trama a modo de ejemplo considerada en la figura 4b, el calculador 318 de valores de amplificación obtiene por ejemplo, para cada zona de tiempo/frecuencia de la cuadrícula 260 en línea discontinua, del decodificador 320 de datos de envolvente un valor de energía que representan juntos la envolvente espectral.
En la misma cuadrícula 260, el calculador 318 de valores de amplificación calcula también la energía en la componente de alta frecuencia previamente reproducida, para normalizar la componente de alta frecuencia reproducida en esta cuadrícula y poder ponderarla con los valores de energía correspondientes, que ha obtenido del decodificador 320 de datos de envolvente, con lo cual la componente de alta frecuencia previamente reproducida está adaptada espectralmente a la envolvente espectral de la señal de audio original. A este respecto, el calculador de valores de amplificación tiene en cuenta los valores de ruido obtenidos también del decodificador 320 de datos de envolvente por cada envolvente de ruido, para corregir los valores de ponderación para los valores de subbanda individuales dentro de esta trama de ruido. En la salida del adaptador 312 de subbanda se retransmiten por tanto subbandas con valores de subbanda que están adaptados con valores de ponderación corregidos a la envolvente espectral de la señal original en la componente de alta frecuencia. El banco 314 de filtros de síntesis compone entonces gracias a estos valores espectrales de nuevo la componente de alta frecuencia así reproducida en el dominio de tiempo, tras lo cual el sumador 316 combina esta componente de alta frecuencia con la componente de baja frecuencia procedente del decodificador 308 de audio para dar la señal de audio decodificada definitiva en la salida 304. Tal como se indica con la línea discontinua en la figura 5, alternativamente es posible que el banco 314 de filtros de síntesis para la síntesis no sólo utilice las subbandas de alta frecuencia, adaptadas mediante el adaptador 312 de subbanda, sino además las subbandas de baja frecuencia, según correspondan directamente a la entrega del banco 310 de filtros de análisis. De esta manera el resultado del banco 314 de filtros de síntesis correspondería directamente a la señal de salida decodificada, que podría entregarse entonces a la salida 304.
Algo común en los ejemplos de realización anteriores era que las tramas SBR presentan una zona de solapamiento. Dicho de otro modo la división temporal de las envolventes se adaptaba a la división temporal de las tramas, de modo que no se solapa ninguna envolvente con dos tramas adyacentes, para lo cual se realizaba una correspondiente señalización de la cuadrícula de envolvente-tiempo, concretamente por medio de las clases LD_TRAN y FIXFIX. Sin embargo surgen ahora problemas cuando aparecen transitorios en los bordes de los bloques o tramas. En este caso son necesarias desmesuradamente muchas envolventes, para codificar los datos espectrales que comprenden los valores de energía espectral o los valores de envolvente espectral y los valores de resolución de frecuencia. Dicho de otro modo se necesitan más bits de lo que sería necesario en el caso de los transitorios. En principio pueden distinguirse dos casos “desfavorables” de este tipo, que se ilustran en las figuras 6a y 6b.
La primera situación desfavorable surge cuando el transitorio, establecido por el detector 118 de transitorios, se sitúa casi en un inicio de trama de una tramas 404, tal como se ilustra en la figura 6a. La figura 6a muestra un caso a modo de ejemplo, en el que una trama 406 de la clase FIXFIX con una única envolvente 408 que se extiende por todas las 16 ranuras QMF precede a la trama 404, en cuyo inicio se ha detectado un transitorio por el detector 118 de transitorios, por lo que el control 116 de tramas SBR ha asignado a la trama 404 una clase LD_TRAN con una posición de transitorio, que apunta a la tercera ranura QMF de la trama 404, de modo que la trama 404 está dividida en tres envolventes 410, 412 y 414, de las que la envolvente 412 representa la envolvente de transitorio y las otras envolventes 410 y 414 rodean a ésta y se extienden hasta los límites 416b y 416c de trama de la respectiva trama
404. Sólo para evitar confusiones se indica que, para la figura 6a, se supone que se ha empleado una tabla distinta de la de la figura 3.
Tal como se indica ahora con la flecha 418, que apunta a la primera envolvente 410 en la trama 404 LD_TRAN, la transmisión propiamente dicha de valores de energía espectrales o valor de resolución de frecuencia así como valor de ruido para el correspondiente dominio de tiempo, es decir ranura QMF 0 y 1, en realidad no está justificada, ya que la zona no corresponde efectivamente a ningún transitorio pero a la inversa en el tiempo es muy pequeña. Esta envolvente “cara” está destacada en la figura 6a por tanto mediante sombreado.
Un problema similar surge cuando está presente un transitorio entre dos tramas o se ha reconocido por el detector 118 de transitorios. Este caso está representado en la figura 6b. La figura 6b muestra dos tramas 502 y 504 sucesivas, que tienen una longitud en cada caso de 16 tramas QMF, habiéndose detectado por el detector 118 de transitorios entre las dos tramas 502 y 504 o en la proximidad del límite de trama entre estas dos tramas 502 y 504 SBR un transitorio, de modo que mediante el control 116 de tramas SBR a ambas tramas 502 y 504 se les ha asignado una clase LD TRAN, ambas con sólo dos envolventes 502a, 502b ó 504a y 504b, de tal manera que las envolventes 502b de transitorio de la trama 502 anterior y la envolvente 504b de transitorio de la siguiente trama 504 limitan con el límite de trama SBR. Tal como puede observarse, la envolvente 502b de transitorio de la primera trama 502 es extremadamente corta y sólo se extiende por una ranura QMF. Incluso para la presencia de un transitorio esto significa un esfuerzo desmesuradamente grande para la codificación de envolvente, ya que efectivamente también para la siguiente envolvente 504b de transitorio vuelven a codificarse datos espectrales, tal como se describió anteriormente. En la figura 6b están resaltadas por tanto ambas envolventes 502b y 504b de transitorio mediante sombreado.
Los dos casos esbozados anteriormente en referencia a las figuras 6a y 6b tienen por tanto en común que en cada caso son necesarias envolventes (superficies sombreadas), que describen un periodo relativamente pequeño y por consiguiente cuestan demasiados o relativamente muchos bits. Estas envolventes contienen un conjunto de datos espectrales, que podría describir igualmente una trama completa. La división temporal precisa es necesaria sin embargo para aislar la energía alrededor de los transitorios, ya que de lo contrario aparecen pre-ecos, tal como se ha descrito efectivamente en la introducción de la descripción de la presente solicitud.
A continuación se describe por tanto un modo de funcionamiento alternativo del codificador o decodificador, mediante el cual se aborda la problemática anterior de las figuras 6a y 6b, o sea que no tienen que transmitirse en el lado del codificador conjuntos de datos que describen un periodo demasiado pequeño.
Si se considera por ejemplo el caso de la figura 6a, según el cual el detector 118 de transitorios indica la presencia de un transitorio en la proximidad del inicio de la trama 404, entonces según el ejemplo de realización que se describe ahora el control 116 de tramas SBR asigna a esta trama ciertamente todavía la clase LD_TRAN con la misma indicación de posición de transitorio, pero el calculador 112 de datos de envolvente y el codificador 114 de datos de envolvente no generan para la envolvente 410 factores de escala o valores de energía espectral ni ninguna componente de ruido o el control 116 de tramas SBR no retransmite para esta envolvente 410 ninguna indicación de resolución de frecuencia al formateador 108, lo que está indicado en la figura 7a, que corresponde a la situación de la figura 6a, porque la línea de la envolvente 410 está indicada de manera discontinua, y las correspondientes ranuras QMF están sombreadas, para indicar que para ello en el flujo de datos procedente del formateador 108 en la salida 104 no están contenidos en realidad datos para la reconstrucción de alta frecuencia. En el lado del decodificador este “hueco de datos” 418 se rellena porque todos los datos necesarios, tales como factores de escala, componente de ruido y resolución de frecuencia, se obtienen a partir de los correspondientes datos de la envolvente 408 previa. Expresado con mayor exactitud y tal como se explicará más delante de manera más detallada en referencia a la figura 9, el decodificador 320 de datos de envolvente deduce a partir de la indicación de posición de transitorio para la trama 404, que está presente un caso según la figura 6a, de modo que para la primera envolvente en la trama 404 no se espera ningún dato de envolvente. Para simbolizar este modo de funcionamiento alternativo, en la figura 5 está indicado con una flecha discontinua, que el decodificador 320 de datos de envolvente depende en su modo de funcionamiento o análisis sintáctico también de los elementos de sintaxis escritos en negrita en la figura 2, en este caso en particular del elemento de sintaxis bs_transient_position. El decodificador 320 de datos de envolvente llena ahora el hueco 418 de datos copiando los datos correspondientes de la envolvente 408 previa para la envolvente 410. Con ello el conjunto de datos de la envolvente 408 de la trama 406 previa se amplían prácticamente a las primeras ranuras QMF (sombreadas) de la segunda trama 404. Con ello se reconstruye de nuevo la cuadrícula de tiempo de la envolvente 410 que falta en el decodificador 300 y se copian los conjuntos de datos correspondientes. La cuadrícula de tiempo de la figura 7a corresponde por tanto de nuevo a la de la figura 6a en cuanto a la trama 404.
El modo de proceder según la figura 7a ofrece una ventaja adicional con respecto al modo de proceder descrito anteriormente en referencia a la figura 3, ya que de esta manera es posible señalizar con precisión el inicio de transitorio siempre en la ranura QMF. Los transitorios, captados por el detector 118 de transitorios, pueden representarse de este modo de manera más nítida. Para ilustrar esto más detalladamente, la figura 8 muestra el caso en el que según la figura 3 a una trama 602 FIXFIX con una envolvente 604 le sigue una trama LD_TRAN 606 con dos envolventes, concretamente una envolvente 608 de transitorio y una envolvente 610 subsiguiente, apuntando la indicación de posición de transitorio a la segunda ranura QMF. Tal como puede observarse en la figura 8, la envolvente 608 de transitorio empieza con la primera ranura QMF de la trama 606, tal como sería el caso en el caso de una indicación de posición de transitorio que apunta a la primera ranura QMF, tal como puede observarse en la figura 3. El motivo de este modo de proceder consiste en que, por motivos de eficiencia de codificación es menos útil prever, en el desplazamiento de la indicación de posición de transitorio de TRANS-POS = 0 a TRANSPOS = 1, una tercera envolvente al inicio de la trama 606, ya que para ello deberían transmitirse explícitamente de nuevo datos de envolvente. Según el modo de proceder de la figura 7a esto no supone ningún problema, ya que efectivamente para la envolvente 410 inicial no tiene que transmitirse de todas maneras ningún dato de envolvente. Por este motivo es posible una alineación precisa de ranuras QMF de la envolvente de transitorio en función de la indicación de posición de transitorio en clases LD_TRAN según el modo de proceder de la figura 7a de manera efectiva, para lo cual se representa un posible ejemplo de realización en la tabla de la figura 9. La tabla de la figura 9 representa una posible tabla, tal como puede utilizarse en el codificador de la figura 1 y en el decodificador de la figura 5 de manera alternativa a la tabla de la figura 3 en el marco del modo de proceder alternativo de la figura 7a. La tabla comprende siete columnas, de las que los encabezados de las primeras cinco corresponden a las primeras cinco columnas en la figura 3, es decir desde la primera hasta la quinta columna se enumeran la indicación de posición de transitorio así como para esta indicación de posición de transitorio el número de envolventes previstas en la trama, la posición del primer límite de envolvente, la posición del segundo límite de envolvente y el índice de transitorio, que apunta a la envolvente en la que se encuentra el transitorio. La sexta columna indica, para qué indicación de posición de transitorio está previsto un hueco 418 de datos según la figura 7a. Según se indica mediante un uno, éste es el caso para indicaciones de posición de transitorio que se sitúa entre uno y cinco (en cada caso inclusive). Para el resto de indicaciones de posición de transitorio en esta columna se introduce un cero. La última columna se comentará a continuación en referencia a la figura 7b.
Si se considera el caso de la figura 6b, según un modo de proceder previsto alternativamente o adicionalmente a la modificación según la figura 7a, se impide una división desfavorable de la zona de transitorio en las envolventes 502b y 50.4b de transitorio porque se usa una envolvente 502 que se extiende virtualmente a través de las ranuras QMF de ambas envolventes 502b y 504b de transitorio, los factores de escala contenidos más allá de esta envolvente 402 se transmiten junto con la componente de ruido y la resolución de frecuencia pero sólo para la envolvente 502b de transitorio de la trama 502 y se emplean simplemente también para las ranuras QMF al inicio de la trama siguiente, tal como se indica en la figura 7b, que por lo demás corresponde a la figura 6b, mediante el sombreado simple de la envolvente 502b, la indicación de la envolvente 504b de transitorio mediante una línea discontinua y el sombreado de las ranuras QMF al inicio de la segunda trama 504.
Expresado de manera más precisa, el codificador 100 en el caso de la aparición de un transitorio entre las tramas 502 y 504 según la figura 7b actúa de la siguiente manera. El detector 118 de transitorios indica la aparición del transitorio. Entonces el control 116 de tramas SBR selecciona para la trama 502, como en el caso de la figura 6b, la clase LD_TRAN con una indicación de posición de transitorio que apunta a la última ranura QMF. Dado que la indicación de posición de transitorio apunta al final de la trama 502, el calculador 112 de datos de envolvente calcula sin embargo a partir de los valores de salida QMF los factores de escala o valores de energía espectral pero no sólo más allá de la ranura QMF de la envolvente 502b de transitorio, sino más bien a través de todas las ranuras QMF de la envolvente 702 virtual, que comprende adicionalmente las tres ranuras QMF directamente subsiguientes de la siguiente trama 504. Un retardo no está asociado por tanto a la salida 104 del codificador 100, ya que efectivamente el codificador 106 de audio puede retransmitir la trama 504 de todos modos ya en el final de trama al formateador
108. En otras palabras, el calculador 112 de datos de envolvente calcula los factores de escala mediante promediado de los valores QMF de las ranuras QMF de la envolvente 702 virtual en una resolución de frecuencia predeterminada, codificándose los factores de escala así obtenidos por el codificador 114 de datos de envolvente para la envolvente 502b de transitorio de la primera trama 502 y entregándose al formateador 108, retransmitiendo el control 116 de tramas SBR el correspondiente valor de resolución de frecuencia para esta envolvente 502b de transitorio. Independientemente de la decisión en cuanto a la clase de la trama 502, el control 116 de tramas SBR toma la decisión acerca de la pertenencia de clase de la trama 504. En el presente caso ya no se encuentra, a modo de ejemplo, ningún transitorio en la proximidad de la trama 504 o en la trama 504, de modo que el control 116 de tramas SBR en este caso a modo de ejemplo de la figura 7b elige una clase FIXFIX para la trama 504 con sólo una envolvente 504a’. La correspondiente decisión la entrega el control 116 de tramas SBR al formateador 108 así como al calculador 112 de datos de envolvente. La decisión se interpreta no obstante de manera distinta a lo habitual. El calculador 112 de datos de envolvente concretamente “se ha dado cuenta” de que la envolvente 702 virtual se ha introducido en la trama 504 actual, y acorta por consiguiente la envolvente 504a’ inmediatamente subsiguiente de la trama 504 el número correspondiente de ranuras QMF, para determinar los correspondientes valores de escala sólo más allá de este número reducido de ranuras QMF y entregarlos al codificador 114 de datos de envolvente. A través de las primeras tres ranuras QMF aparece por tanto un hueco 704 de datos en el flujo de datos en la salida 104. Dicho de otro modo, según el modo de proceder de la figura 7b en el lado del codificador se calcula en primer lugar el conjunto de datos completo para la envolvente 702, para lo cual se recurre también a datos de las ranuras QMF futuras desde el punto de vista de la trama 502 al inicio de la trama 504, con lo cual la envolvente espectral se calcula en la envolvente virtual. Este conjunto de datos se transmite entonces al decodificador, como perteneciente a la envolvente 502b.
En el decodificador, el decodificador 320 de datos de envolvente genera, a partir de sus datos de entrada, los factores de escala para la envolvente 702 virtual, con lo cual el calculador 318 de valores de amplificación tiene para la última ranura QMF de la trama 502 o la última envolvente 502b toda la información necesaria para llevar a cabo la reconstrucción también en esta trama. El decodificador 320 de datos de envolvente obtiene también factores de escala para la envolvente o las envolventes de la trama 504 siguiente y los retransmite al calculador 318 de valores de amplificación. No obstante, éste sabe, debido al hecho de que la indicación de posición de transitorio de la trama LD_TRAN previa apunta a la terminación de esta trama 502, que los datos de envolvente transmitidos para la envolvente 502b de transitorio de terminación de esta trama 502 también se refieren a las ranuras QMF al inicio de la trama 504, que pertenecen a la envolvente 702 virtual, por lo que para estas ranuras QMF inserta o dispone una envolvente 504b’ propia, y para esta envolvente 504b’ dispuesta se basa en factores de escala, componente de ruido y resolución de frecuencia, que el calculador 112 de datos de envolvente obtiene a partir de los datos de envolvente correspondientes de la envolvente 502b previa, con el fin de calcular para esta envolvente 504b’ los valores de ponderación espectrales para la reconstrucción en el módulo 312. Los datos de envolvente obtenidos por el decodificador 320 de datos de envolvente para la verdadera envolvente 504a’ siguiente, los aplica el calculador 318 de valores de amplificación entonces sólo para las subsiguientes ranuras QMF, que siguen a la envolvente 702 virtual, y retransmiten valores de amplificación o ponderación calculados de manera correspondiente al adaptador 312 de subbandas para la reconstrucción de alta frecuencia. Dicho de otro modo, en el lado del decodificador se aplica en primer lugar el conjunto de datos para la envolvente 702 virtual sólo a la última ranura QMF o las últimas ranuras QMF de la tramas 502 actual y se reconstruye por tanto la trama 502 actual sin retardo. El conjunto de datos de la segunda trama 504 siguiente contiene un hueco 704 de datos, es decir los nuevos datos de envolvente transmitidos sólo son válidos a partir de la siguiente, en el ejemplo a modo de ejemplo de la figura 7b, la tercera ranura QMF. Por tanto en el caso de la figura 7b sólo se transmite una única envolvente. La envolvente 504b’ que falta se reconstruye de nuevo, como en el primer caso, y se rellena con los datos de la envolvente 502b previa. El hueco 704 de datos se cierra por tanto y la trama 504 puede reproducirse.
En el caso a modo de ejemplo de la figura 7b, la segunda trama 504 se ha señalizado con una clase FIXFIX, en la que la(s) envolvente(s) abarcan realmente toda la trama. Sin embargo, tal como acaba de describirse, debido a la trama 502 previa o a su pertenencia a la clase LD_TRAN con una indicación de posición de transitorio más alta, la envolvente 504a’ se restringe en el decodificador y la validez del conjunto de datos no empieza en el tiempo hasta algunas ranuras QMF después. A este respecto la figura 7b trata el caso en el que la tasa de transitorios es delgada. Sin embargo, si en varias tramas sucesivas aparecen transitorios en cada caso en los bordes, la posición de transitorio en cada caso se transmite con la clase LDN-TRAN y se expande de manera correspondiente en las tramas siguientes, tal como se describió anteriormente en referencia a la figura 7b. La primera envolvente en cada caso se reduce conforme a la expansión o se restringe en su inicio, tal como se describió anteriormente en referencia a la envolvente 504a’ en referencia a una clase FIXFIX a modo de ejemplo.
Tal como se describió anteriormente, entre el codificador y el decodificador se conoce en qué medida se expande una envolvente de transitorio al final de una trama LD_TRAN en la siguiente trama, mostrándose un posible acuerdo para ello también en el ejemplo de realización de la figura 9 o en la tabla representada en la misma, que representa por tanto un ejemplo que combina ambos modos de proceder modificados según las figuras 7a y 7b. La tabla 9 se usa en este ejemplo de realización por el codificador y el decodificador. Para la señalización de la cuadrícula de tiempo de las envolventes se usa a su vez sólo el índice de transitorio bs_transient_position. En el caso de posiciones de transitorio al inicio de la trama se evita una transmisión de una envolvente (figura 7a), tal como se describió anteriormente y se deduce de la penúltima columna de la tabla de la figura 9. En la última columna de la figura 9 está establecido a este respecto además, con qué factor de expansión o cuántas ranuras QMF más allá debe expandirse una envolvente de transitorio al final de la trama en la siguiente trama (véase la figura 7b). Una diferencia en la señalización según la figura 9 con respecto al primer caso (figura 7a) y el segundo caso (figura 7b) consiste en el momento de la señalización. En el primer caso, la señalización tiene lugar en la trama actual, es decir no existe ninguna dependencia con respecto a la trama previa. Únicamente es decisiva la posición de transitorio. Para qué casos no se transmitirá la primera envolvente de una trama, puede deducirse de manera correspondiente en el lado del decodificador a partir de una tabla como la de la figura 9 con entradas para todas las posiciones de transitorio.
En el segundo caso, la decisión se toma sin embargo en la trama previa y se transmite a la siguiente. Con ayuda de la última columna de la tabla en la figura 9 se establece concretamente un factor de expansión, en qué posición de transitorio de la trama previa, cuánto debe expandirse la envolvente de transitorio de la trama previa en la siguiente trama. Esto significa que, cuando en una trama se establece una posición de transitorio al final de la trama actual (según la figura 9 en la última o penúltima ranura QMF), el factor de expansión situado en la última columna de la figura 9 para la siguiente trama se almacena, con lo cual se fija o establece de este modo la cuadrícula de tiempo para la siguiente trama.
Antes de comentar a continuación un siguiente ejemplo de realización de la presente invención, debe mencionarse previamente aún que, de manera similar al modo de proceder para la generación de los datos de envolvente para la envolvente virtual según la figura 7b, la generación de los datos de envolvente para la envolvente 408 en el ejemplo de la figura 7a también pueden determinarse más allá de un periodo de tiempo ampliado, concretamente en las dos ranuras QMF de la envolvente 410 “ahorrada”, de modo que los valores de salida QMF del banco 110 de filtros de análisis para estas ranuras QMF también se encuentran en los correspondientes datos de envolvente de la envolvente 408. Sin embargo, también es posible el modo de proceder alternativo, según el cual los datos de envolvente para la envolvente 408 sólo se determinan a través de ranuras QMF pertenecientes a la misma.
Los ejemplos de realización anteriores evitan un gran retardo al utilizar la clase LD_TRAN. A continuación se describe un ejemplo de realización, según el cual esta evitación se consigue por medio de una división de cuadrícula
o envolvente, en la que las envolventes pueden extenderse también más allá de los límites de trama. En particular se supondrá a continuación que el codificador de la figura 1 genera un flujo de datos en su salida 104, en el que las tramas están divididas en cuatro clases de trama, concretamente una clase FIXFIX, una FIXVAR, una VARFIX y una VARVAR, tal como se establece en la norma MPEG4-SBR anteriormente mencionada.
Tal como se describió en la introducción de la descripción de la presente solicitud, el control 116 de tramas SBR divide por tanto la sucesión de tramas en envolventes, que pueden extenderse también a través de límites de trama. A este respecto están previstos elementos de sintaxis bs_num_rel_#, que establecen para las clases de trama FIXVAR, VARFIX y VARVAR entre otras cosas, en qué posición con respecto al límite de trama anterior o posterior de la trama empieza la primera envolvente o termina la última envolvente de esta trama. El calculador 112 de datos de envolvente calcula los valores espectrales o factores de escala para la cuadrícula establecida por las envolventes con la resolución de frecuencia establecida por el control 116 de tramas SBR. Mediante estas clases pueden distribuirse en consecuencia para el control 116 de tramas SBR límites de envolvente de cualquier manera a través de las tramas y una zona de solapamiento. El codificador según la figura 1 puede realizar la señalización con las cuatro clases distintas de modo que se produzca una zona de solapamiento máxima de una trama, lo que corresponde al retardo del codificador 106 CORE y por tanto también al intervalo de tiempo, que puede almacenarse de manera intermedia, sin provocar un retardo adicional. Con ello se garantiza que siempre estén disponibles suficientes valores “futuros” para el calculador 112 de datos de envolvente, para calcular y enviar de antemano datos de envolvente, aunque éstos en su mayor parte no sean válidos hasta tramas posteriores.
Según el presente ejemplo de realización, el decodificador de la figura 5 procesa ahora sin embargo un flujo de datos de este tipo con las cuatro clases SBR de manera que lleva a una latencia reducida al compactar simultáneamente los datos espectrales. Esto se consigue mediante huecos de datos en el flujo de bits. Para ello se hace referencia en primer lugar a la figura 10, que muestra dos tramas incluyendo su división, obtenida por el codificador de la figura 1 según el ejemplo de realización, siendo en este caso a modo de ejemplo la primera trama una trama FIXVAR y la segunda trama una trama VARFIX. En el caso a modo de ejemplo de la figura 10, las dos tramas 802 y 804 sucesivas comprenden dos o una envolvente, concretamente las envolventes 802a y 802b o las envolventes 804a, extendiéndose la segunda envolvente de la trama 802 FIXVAR tres ranuras QMF en la trama 804 y no situándose el inicio de la envolvente 804a de la trama 804 VARFIX hasta la tercera ranura QMF. Para cada envolvente 802a, 802b y 804a, el flujo de datos contiene en la salida 104 valores de factor de escala, que el calculador 112 de datos de envolvente ha determinado mediante promediado de la señal de salida QMF del banco 110 de filtros de análisis más allá de las correspondientes ranuras QMF. Para determinar los datos de envolvente para la envolvente 802b, el calculador 112, tal como se mencionó anteriormente, recurre a datos “futuros” del banco 110 de filtros de análisis, para lo cual está disponible una zona de solapamiento virtual del tamaño de una trama, tal como se indica mediante sombreado en la figura 10.
Para reconstruir la componente de alta frecuencia para la envolvente 802b, el decodificador debería esperar la recepción de la componente de baja frecuencia reconstruida desde el banco 310 de filtros de análisis, lo que llevaría, tal como ya se mencionó anteriormente, a un retardo del tamaño de una trama. Este retardo puede evitarse si el decodificador según la figura 5 funciona de la manera siguiente. El decodificador 320 de datos de envolvente entrega los datos de envolvente y en particular los factores de escala para las envolventes 802a, 802b y 804a alcalculador 318 de valores de amplificación. Éste usa no obstante los datos de envolvente para la envolvente 802b que se extiende en la siguiente trama 804, aunque para empezar sólo para una primera parte de la ranura QMF, a través de la que se extiende esta envolvente 802b, concretamente a través de la parte que va hasta el límite de trama SBR entre las dos tramas 802 y 804. El calculador 318 de valores de amplificación interpreta por consiguiente la división de envolvente con respecto a la división que previó el codificador de la figura 1 en la codificación, y usa los datos de envolvente en primer lugar sólo para la parte de la envolvente 802b de solapamiento, que se encuentra en la trama 802 actual. Esta parte se ilustra en la figura 11, que corresponde a la situación de la figura 10, como envolvente 802b1. De esta manera el calculador 318 de valores de amplificación y el adaptador 312 de subbandas pueden reconstruir la componente de alta frecuencia para esta envolvente 802b1 sin retardo.
Mediante esta reinterpretación, al flujo de datos en la entrada 302 le faltan naturalmente datos de envolvente para la parte restante de la envolvente 802b de solapamiento. Este problema lo resuelve el calculador 318 de valores de amplificación de manera similar al ejemplo de realización de la figura 7b, es decir emplea datos de envolvente, que se derivan de aquéllos para la envolvente 802b1, para, basándose en los mismos, reconstruir junto con el adaptador 312 de subbandas la componente de alta frecuencia en la envolvente 802b2, que se extiende a través de las primeras ranuras QMF de la segunda trama 804, que corresponden a la parte restante de la envolvente 802b de solapamiento. El hueco 806 de datos se rellena de este modo.
Tras los ejemplos de realización anteriores, en los que se abordó el problema de los transitorios de distintas maneras en cuanto a efectividad de la tasa de transmisión de bits, a continuación se describirá un ejemplo de realización, según el cual se configura una clase FIXFIX modificada como ejemplo de una clase con concordancia de límites de trama y de cuadrícula en su sintaxis de tal manera que presenta un indicador o una indicación de ausencia de transitorio, mediante lo cual es posible reducir con pérdidas de tasa de transmisión de bits el tamaño de trama, pero a este respecto reducir también las pérdidas en su envergadura, ya que partes estacionarias de la señal de información o de audio pueden codificarse con mayor eficacia de tasa de transmisión de bits. A este respecto este ejemplo de realización puede utilizarse tanto adicionalmente en cada caso en los ejemplos de realización anteriormente descritos como independientemente de los otros ejemplos de realización en conexión con una división de clases de trama con clases FIXFIX, FIXVAR, VARFIX y VARVAR, tal como se describió en la introducción de la descripción de la presente solicitud, pero incluso con modificación de la clase FIXFIX, tal como se describirá a continuación. Y concretamente según este ejemplo de realización, la descripción de sintaxis de una clase FIXFIX, tal como se describió anteriormente también en referencia a la figura 2, se completa con un elemento de sintaxis adicional, tal como por ejemplo un indicador de un bit, activándose el indicador en el lado del codificador mediante el control 116 de tramas SBR en función de la posición de los transitorios detectados por el detector 118 de transitorios, para indicar que la señal de información es o no estacionaria en la zona de la trama FIXFIX correspondiente. En el primer caso, como por ejemplo con el indicador de ausencia de transitorio activado, en el flujo 104 de datos codificado para la envolvente de la correspondiente trama FIXFIX o la primera envolvente en el tiempo en esta trama FIXFIX en caso de que ésta presente varias envolventes, no tiene lugar ninguna señalización de datos de envolvente ni ninguna transmisión de valores de energía de ruido y factores de escala así como valores de resolución de frecuencia, sino que esta información que falta se obtiene en el lado del decodificador a partir de los correspondientes datos de envolvente para la envolvente directamente anterior en el tiempo de la trama previa, que puede ser también por ejemplo una trama FIXFIX aunque también otra trama, que están contenidos en la señal de información codificada. De esta manera puede lograrse por tanto una reducción de la tasa de transmisión de bits para una variante de la codificación SBR con bajo retardo, o una combinación de aumento de la tasa de transmisión de bits en una variante de bajo retardo de este tipo debido a la tasa de repetición aumentada o duplicada. En combinación con los ejemplos de realización anteriormente descritos, una señalización de este tipo proporciona una completación en cuanto a la reducción de la tasa de transmisión de bits, ya que no sólo pueden transmitirse o codificarse señales transitorias, sino también señales estacionarias, con una reducción de la tasa de transmisión de bits. Con respecto a la obtención o derivación de la información de datos de envolvente que falta se remite a la descripción en relación a los ejemplos de realización anteriores en particular en relación a las figuras 12 y 7b.
Con respecto a las explicaciones de la figura 6a a 11 se remite también a lo siguiente. En estas figuras se toman como base tablas en parte diferentes a las de la figura 3. Tales diferencias pueden referirse naturalmente también a la definición de las envolventes de ruido. Las envolventes de ruido pueden extenderse, en clases LD_TRAN, por ejemplo siempre a través de toda la trama. En el caso de las figuras 7a y 7b el decodificador recurriría entonces por ejemplo para las primeras ranuras QMF, en las mismas a modo de ejemplo 2 ó 3, a los valores de ruido de la trama previa o de la envolvente previa para la reconstrucción de alta frecuencia y se acortaría de manera correspondiente la verdadera envolvente de ruido.
Además se indica, con respecto al modo de proceder según las figuras 7b y 11, que existen numerosas posibilidades de cómo transmitir los datos de envolvente o los factores de escala para la envolvente 702 ó 802b virtual. Tal como se ha descrito, los factores de escala para la envolvente virtual se determinan a través de las ranuras QMF, en la figura 7b a modo de ejemplo cuatro y en la figura 11 a modo de ejemplo seis, concretamente mediante promediado tal como se describió anteriormente. En el flujo de datos pueden transmitirse ahora los factores de escala determinados a través de las correspondientes ranuras QMF para la envolvente 502b de transitorio o la envolvente 502b1. En este caso, dado el caso en el lado del decodificador el calculador 318 tendría en cuenta que los factores de escala o valores de energía espectrales se han determinado sin embargo a través de toda la zona para cuatro o seis ranuras QMF, y dividiría por tanto la magnitud de estos valores para una relación, que corresponde por ejemplo a la relación entre las ranuras QMF pertenecientes a la primera trama 502 ó 802 y las pertenecientes a la segunda trama 504 ó 804, en las dos envolventes 502b ó 504b’ o 802b1 y 802-b2 parciales, con el fin de recurrir a las componentes así divididas de los factores de escala transmitidos para el control de la conformación espectral en el adaptador 312 de subbanda. No obstante, también sería posible que el codificador transmita igual tales factores de escala, que pueden aplicarse en el lado del decodificador para la primera envolvente 502b ó 802b1 parcial en primer lugar directamente, y que para la siguiente envolvente 504b’ ó 804b’ o 802b2 parcial se ajustan a escala de manera correspondiente según el solapamiento de la envolvente 702 ó 802b virtual con la segunda trama 504 ó 804. Como la división de la energía se realiza en las dos envolventes parciales, a este respecto puede establecerse de cualquier manera entre el codificador y el decodificador. Dicho de otro modo, el codificador puede transmitir igual tales factores de escala, que pueden aplicarse en el lado del decodificador directamente para la primera envolvente 502b o 502b1 parcial, porque los factores de escala sólo se han promediado a través de estas envolventes parciales o las correspondientes ranuras QMF. Este caso puede ilustrarse a modo de ejemplo de la siguiente manera. En el caso de una envolvente prácticamente solapada, consistiendo la primera parte en dos unidades de tiempo o ranuras QMF, y la segunda en tres unidades de tiempo, se calcula en el lado del codificador sólo la primera parte correctamente o se realiza el promediado de los valores de energía sólo en esta parte y se entregan los factores de escala correspondientes. De esta manera, los datos de envolvente se adaptan exactamente a la correspondiente sección de tiempo en la primera parte. Los factores de escala para la segunda parte se obtienen no obstante de la primera parte y se ajustan a escala de manera correspondiente a la relación de tamaños en comparación con la primera parte, por tanto en este caso 3/2 veces los factores de escala de la primera parte. En estas circunstancias ha de indicarse que anteriormente el concepto energía se ha utilizado como sinónimo de factor de escala, obteniéndose la energía o factor de escala a partir de la suma de todos los valores de energía de una banda SBR a lo largo de un intervalo de tiempo de una envolvente. En el ejemplo que acaba de describirse, los factores de escala auxiliares describen en cada caso la suma de las energías de las dos unidades de tiempo en la primera parte de la envolvente prácticamente solapada para la respectiva banda SBR.
Además, también puede estar previsto naturalmente sin embargo, que los valores de envolvente espectral o de escala se transmitan en los ejemplos de realización anteriores siempre de una manera normalizada al número de ranuras QMF al que se recurre para la determinación del respectivo valor, como por ejemplo como la energía cuadrática media, es decir normalizada al número de ranuras QMF participantes y el número de bandas espectrales QMF, dentro de cada zona de cuadrícula de frecuencia/tiempo. En este caso, no son necesarias las medidas que acaban de describirse para la división de los factores de escala en el lado del codificador o del decodificador para las envolventes virtuales en las respectivas secciones parciales.
Haciendo referencia a la descripción anterior, se indican además también diferencias. Aunque por ejemplo en la figura 1 se ha descrito que por medio del banco 110 de filtros de análisis se realiza una descomposición espectral con una resolución temporal fija, que se adapta entonces por el calculador 112 de datos de envolvente a la cuadrícula de tiempo/frecuencia ajustada por el control 116, también pueden concebirse modos de proceder alternativos, según los cuales en la resolución de tiempo/frecuencia, adaptada a la configuración por el control 316, se calcula la envolvente espectral directamente en esta resolución, sin las dos fases mostradas en la figura 1. El codificador 114 de datos de envolvente de la figura 1 puede omitirse. Por otro lado, el tipo de codificación de las energías de señal que representan la envolvente espectral puede realizarse por ejemplo por medio de codificación diferencial, pudiendo realizarse la codificación diferencial en la dirección de tiempo o frecuencia o mezclada, como por ejemplo por trama o envolvente en la dirección de tiempo y/o frecuencia. Haciendo referencia a la figura 5 se indica que por ejemplo no es importante, en qué orden el calculador de valores de amplificación realiza la normalización con las energías de señal obtenidas en la componente de alta frecuencia reproducida provisionalmente y la ponderación con las energías de señal transmitidas por el codificador para la señalización de la envolvente espectral. Algo similar sucede naturalmente para la corrección para tener en cuenta los valores de la componente de ruido por cada envolvente de ruido. Se indica además que la presente invención no se limita a descomposiciones espectrales por medio de bancos de filtros. Más bien podrían emplearse naturalmente también una transformada de Fourier o transformada de Fourier inversa o transformaciones tiempo/frecuencia similares, en las que por ejemplo la ventana de transformación respectiva se desplaza el número de valores de audio que debe corresponder a una ranura de tiempo. Además se indica que puede estar previsto que el codificador no determine, codifique e incorpore en la señal de audio codificada la envolvente espectral con respecto a todas las subbandas en la componente de alta frecuencia en la cuadrícula de tiempo/frecuencia. Más bien el codificador también podría determinar aquellas componentes de la componente de alta frecuencia para las que no merece la pena realizar en el lado del decodificador una reproducción. En este caso, el codificador transmite al decodificador por ejemplo las secciones de la componente de alta frecuencia o las zonas de subbandas en la componente de alta frecuencia, para las que debe realizarse la reproducción. Además también son posibles diferentes modificaciones con respecto al ajuste de la cuadrícula en la dirección de frecuencia. Por ejemplo podría no estar previsto que no se realice ningún ajuste de la cuadrícula de frecuencia, en cuyo caso los elementos de sintaxis bs_freq_res podrían omitirse y por ejemplo utilizarse siempre toda la resolución. Además podría omitirse una ajustabilidad de los pasos de cuantificación de las energías de señal para la representación de la envolvente espectral, es decir el elemento de sintaxis bs_amp_res podría omitirse. Además, en lugar de un muestreo descendente cada dos valores de audio en el muestreador descendente de la figura 1, también podría realizarse otro muestreo descendente, de modo que la componente de alta y baja frecuencia espectral posean diferente extensión. Además, la dependencia basada en tablas de la división de cuadrícula de las tramas LD_TRAN respecto de bs_transient_position sólo es a modo de ejemplo y también sería concebible una dependencia analítica de las extensiones de envolvente y de la resolución de frecuencia.
En cualquier caso los ejemplos anteriormente descritos posibilitan para codificador y decodificador utilizar la tecnología SBR también para el esquema de codificación AAC-LD de la norma anteriormente citada. El gran retardo de AAC + SBR, que va en contra del objetivo de AAC-LD con un retardo algorítmico corto de aproximadamente 20 ms a 48 kHz y una longitud de bloque de 480, puede superarse con los ejemplos de realización anteriores. A este respecto también se superaría la desventaja de un entrelazado de AAC-LD con el SBR definido hasta ahora en la norma, que se sitúa de manera justificada en la longitud de trama más corta del AAC-LD 480 ó 512 frente a 960 ó 1024 en AAC-LC, que haría que la tasa de transmisión de datos para un elemento SBR inalterado, según se define en la norma, fuese el doble de alta frente a HE AAC. Los ejemplos de realización anteriores posibilitan por consiguiente la reducción del retardo de AAC-LD + SBR y una reducción simultánea de la tasa de transmisión de datos para la información secundaria.
En particular en los ejemplos de realización anteriores, para la reducción del sistema se eliminaron los retardos para una variante LD del módulo SBR de la zona de solapamiento de las tramas SBR. Con ello se suprime la posibilidad de poder colocar límites de envolvente o límites de cuadrícula independientemente del límite de trama SBR. El tratamiento de los transitorios se asume entonces no obstante por la nueva clase de trama LD_TRAN, de modo que los ejemplos de realización anteriores también requieren todavía únicamente un bit para la señalización, para indicar si la trama SBR en ese momento es de una clase FIXFIX o de una clase LD_TRAN.
A este respecto en los ejemplos de realización anteriores se ha descrito la clase LD_TRAN de tal manera que siempre tiene límites de envolvente sincronizados respecto a la trama SBR en los bordes y límites variables en el interior de la trama. La distribución interior se determinó por la posición de los transitorios en la cuadrícula de tramas QMF o cuadrícula de ranuras de tiempo. Alrededor de la posición del transitorio se distribuyó una envolvente estrecha, que aísla la energía del transitorio. Las zonas restantes se rellenaron hasta los bordes con envolventes hacia delante y hacia atrás. Para ello se empleó por el calculador 312 de datos de envolvente en el lado del codificador y por el calculador 318 de valores de amplificación en el lado del decodificador la tabla de la figura 3, en la que está almacenada según la posición de transitorio una cuadrícula de envolvente predefinida, siendo la naturaleza de la tabla de la figura 3 naturalmente sólo a modo de ejemplo, y pudiendo variarse en los detalles naturalmente también en función del caso de aplicación.
En particular la clase LD_TRAN de los ejemplos de realización anteriores posibilita por tanto una señalización compacta y una adaptación de la necesidad de bits a un entorno LD con tasa de tramas duplicada, que requiere por tanto también una tasa de transmisión de datos duplicada para la información de rejilla o cuadrícula. Por tanto, los ejemplos de realización anteriores evitan desventajas de la señalización de envolvente SBR hasta la fecha según la norma, que consistían en que para clases VARVAR, VARFIX y FIXVAR la necesidad de bits para la transmisión de los elementos de sintaxis o información secundaria era demasiado alta, y para la clase FIXFIX no era posible una adaptación temporal precisa de las envolventes a transitorios dentro del bloque. Por el contrario, los ejemplos de realización anteriores posibilitan que tenga lugar una optimización del retardo en el lado del decodificador, y en sentido estricto una optimización del retardo en seis ranuras de tiempo QMF o 384 valores de muestreo de audio en la zona original de la señal de audio, lo que corresponde en aproximadamente 8 ms a 48 kHz de muestreo de la señal de audio. Además la omisión de las clases de trama VARVAR, VARFIX y FIXVAR posibilita un ahorro de tasa de transmisión de datos para la transmisión de la envolvente espectral, de lo que resulta la posibilidad de mayores tasas de transmisión de datos para la codificación de baja frecuencia o core y por tanto también una mejor calidad de audio. Los ejemplos de realización anteriores crean de manera efectiva una envolvente de los transitorios dentro de las tramas de clase LD_TRAN sincronizadas con los límites de trama SBR.
En particular se indica que, a diferencia de la tabla anterior a modo de ejemplo de la figura 3, la longitud de envolvente de transitorio también puede comprender más de sólo 2 ranuras de tiempo QMF, aunque sin embargo de manera preferida la longitud de envolvente de transitorio es menor de 1/3 la longitud de trama.
Además, haciendo referencia a la descripción anterior, se indica que la presente invención no se limita a señales de audio. Más bien los ejemplos de realización anteriores pueden encontrar aplicación naturalmente también en la codificación de vídeo.
Con respecto a los ejemplos de realización anteriores se indica además que los bloques individuales en las figura 1 y 5 por ejemplo pueden implementarse tanto en hardware como en software, como por ejemplo como partes de un ASIC o como rutinas de programa de un programa informático.
A este respecto se indica además que, en función de las circunstancias el esquema según la invención también puede implementarse en software. La implementación puede realizarse en un medio de almacenamiento digital, en particular un disquete o un CD con señales de control legibles electrónicamente, que pueden actuar conjuntamente con un sistema informático programable de modo que se ejecute el procedimiento correspondiente. En general, la invención consiste por tanto también en un producto de programa informático, con código de programa almacenado en un soporte legible por máquina, para la realización del procedimiento según la invención, cuando el producto de programa informático se ejecuta en un ordenador. Dicho de otro modo, la invención puede realizarse por tanto como un programa informático con un código de programa para la realización del procedimiento, cuando el programa informático se ejecuta en un ordenador. Además, con respecto a los ejemplos de realización explicados anteriormente, se indica que las señales de información codificadas generadas en los mismos pueden almacenarse por ejemplo en un medio de almacenamiento, como por ejemplo en un medio de almacenamiento electrónico.
5
10
15
20
25
30
35
40
45
50
55

Claims (40)

  1. REIVINDICACIONES
    1. Codificador con
    un dispositivo (104, 106) para codificar una componente de baja frecuencia de una señal de audio en unidades de tramas (902) de la señal de audio;
    un dispositivo (118) para localizar transitorios en la señal de audio;
    un dispositivo (116) para, en función de la localización, asignar un respectivo modo de reconstrucción de entre al menos dos posibles modos de reconstrucción a las tramas de la señal de audio, y, para tramas, a las que se ha asignado un primero de los al menos dos posibles modos de reconstrucción, asignar una respectiva indicación de posición de transitorio a estas tramas; y
    un dispositivo (110, 112, 114) para generar una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de los al menos dos posibles modos de reconstrucción, los límites (902a, 902b) de trama de estas tramas (902) coinciden con límites de cuadrícula de la cuadrícula (222a, 220, 222b), y los límites de cuadrícula de la cuadrícula en el interior de estas tramas dependen de la indicación de posición de transitorio; y
    un dispositivo (108) para agrupar la componente de baja frecuencia codificada, la representación de la envolvente espectral e información sobre los modos de reconstrucción asignados y las indicaciones de posición de transitorio en una señal de audio codificada.
  2. 2.
    Codificador según la reivindicación 1, en el que el dispositivo de generación está configurado de tal manera que los límites de cuadrícula en el interior de las tramas, a las que se ha asignado el primero de los al menos dos posibles modos de reconstrucción, están situados de tal manera que establecen al menos una primera zona (220) de cuadrícula, cuya posición dentro de la respectiva trama depende de la indicación de posición de transitorio y cuya extensión temporal es menor que 1/3 de una longitud de las tramas, así como una segunda y/o tercera zona (222a, 222b) de cuadrícula, que ocupa(n) la parte restante de la respectiva trama desde la primera zona de cuadrícula hasta el límite (902a, 902b) de trama anterior en el tiempo o posterior en el tiempo de la respectiva trama.
  3. 3.
    Codificador según la reivindicación 2, en el que el dispositivo de generación y el dispositivo de agrupación están configurados para incorporar, para una trama (404), a la que se ha asignado el primer modo de reconstrucción, que presenta tres zonas (410, 412, 414) de cuadrícula, y en la que la primera zona
    (412) de cuadrícula de entre las tres zonas de cuadrícula se sitúa más cerca que un valor predeterminado a una trama previa, sólo para la primera y tercera zona (412, 414) de cuadrícula uno o varios valores de envolvente espectral, que describe(n) la envolvente espectral con una respectiva resolución de frecuencia, en la señal de audio codificada, y para la segunda zona (410) de cuadrícula de esta trama (404) no incorporar ningún valor de envolvente espectral en la señal de audio codificada.
  4. 4.
    Codificador según la reivindicación 2 ó 3, en el que el dispositivo de generación y el dispositivo de agrupación están configurados para incorporar, para una trama (502), a la que se ha asignado el primer modo de reconstrucción, que sólo presenta dos zonas (502a, 502b) de cuadrícula, y en la que la primera zona (502b) de cuadrícula limita con el límite de trama posterior en el tiempo, para ambas zonas de cuadrícula uno o varios valores de envolvente espectral, que describe(n) la envolvente espectral con una respectiva resolución de frecuencia, en la señal de audio codificada, y utilizar para la determinación del o de los valores de envolvente espectral para la primera zona (502b) de cuadrícula también partes de la señal de audio que se encuentran en una zona (504b’) de cuadrícula de extensión en la siguiente trama (504), que limita con el límite de trama posterior, y acortar de manera correspondiente una zona (504a’) de cuadrícula anterior en el tiempo de la siguiente trama (504), determinada por el modo de reconstrucción de la siguiente trama, para empezar justo en la zona (504b’) de cuadrícula de extensión.
  5. 5.
    Codificador según la reivindicación 3 ó 4, en el que el dispositivo de generación y el dispositivo de agrupación están configurados para incorporar, para una trama, a la que se ha asignado el segundo modo de reconstrucción, o a la que se ha asignado el primer modo de reconstrucción, pero para la que ni se cumple la condición de que presenta tres zonas de cuadrícula y a este respecto la primera zona de cuadrícula de entre las tres zonas de cuadrícula se sitúa más cerca que el valor predeterminado a la trama previa, ni la condición de que sólo presenta dos zonas de cuadrícula y a este respecto la primera zona de cuadrícula limita con el límite de trama posterior en el tiempo, para cada zona de cuadrícula de esta trama uno o varios valores de envolvente espectral en la señal de audio codificada.
  6. 6.
    Codificador según la reivindicación 2, en el que el dispositivo de generación está configurado de tal manera que la primera zona (220) de cuadrícula limita con el límite (902a) de trama anterior en el tiempo de la respectiva trama, si no existe una segunda zona (222a) de cuadrícula, y la primera zona (220) de
    cuadrícula limita con el límite (902b) de trama posterior en el tiempo de la respectiva trama, si no existe una tercera zona (222b) de cuadrícula.
  7. 7.
    Codificador según una de las reivindicaciones anteriores, en el que el dispositivo de generación está configurado de tal manera que los límites de cuadrícula en el interior de las tramas, a las que está asignado el segundo de los al menos dos posibles modos de reconstrucción, están dispuestos distribuidos uniformemente en el tiempo, de modo que estas tramas sólo presentan una zona de cuadrícula o están divididas en zonas (906a, 906b) de cuadrícula del mismo tamaño.
  8. 8.
    Codificador según una de las reivindicaciones anteriores, en el que el dispositivo de asignación está configurado para asignar a cada trama, a la que se ha asignado el segundo de los al menos dos posibles modos de reconstrucción, una indicación de número de subdivisiones de trama, estando el dispositivo de generación configurado de tal manera que los límites de cuadrícula en el interior de estas tramas subdividen estas tramas en un número de zonas de cuadrícula, que depende de la respectiva indicación de número de subdivisiones de trama.
  9. 9.
    Codificador según una de las reivindicaciones anteriores, en el que el dispositivo de generación está configurado de tal manera que, independientemente de los posibles modos de reconstrucción, que están asignados a las tramas, los límites de trama de las tramas coinciden siempre con límites de cuadrícula de la cuadrícula.
  10. 10.
    Codificador según una de las reivindicaciones anteriores, en el que el dispositivo de generación presenta un banco (110) de filtros de análisis, que genera por cada ranura (904) de tiempo del banco de filtros de la señal de audio un conjunto de valores (250) espectrales, teniendo cada trama (902) una longitud de varias ranuras de tiempo del banco de filtros, y presentando el dispositivo (112) de generación además un dispositivo para promediar los valores espectrales de energía en la resolución de la cuadrícula.
  11. 11.
    Codificador según la reivindicación 10, en el que la indicación de posición de transitorio está definida en unidades de ranuras (904) de tiempo del banco de filtros.
  12. 12.
    Decodificador con
    un dispositivo (306) para extraer una componente de baja frecuencia codificada de una señal de audio, una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio, información sobre modos de reconstrucción, que están asignados a las tramas de la señal de audio y corresponden en cada caso a uno de los al menos dos modos de reconstrucción, e indicaciones de posición de transitorio, que están asignadas en cada caso a tramas, a las que está asignado un primero de los al menos dos modos de reconstrucción, a partir de la señal de audio codificada;
    un dispositivo (308) para decodificar la componente de baja frecuencia codificada de la señal de audio en unidades de tramas de la señal de audio;
    un dispositivo (310) para proporcionar una señal de componente de alta frecuencia provisional basándose en la componente de baja frecuencia decodificada; y
    un dispositivo (318, 312, 314) para la adaptación espectral de la señal de componente de alta de frecuencia provisional a la envolvente espectral mediante ponderación espectral de la señal de componente de alta de frecuencia provisional en función de la representación de la envolvente espectral en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de los al menos dos posibles modos de reconstrucción, los límites de trama de estas tramas coinciden con límites de cuadrícula de la cuadrícula, y los límites de cuadrícula de la cuadrícula en el interior de estas tramas dependen de la indicación de posición de transitorio.
  13. 13.
    Decodificador según la reivindicación 12, en el que el dispositivo para la adaptación espectral está configurado de tal manera que el (los) límite(s) de cuadrícula en el interior de una trama, a la que se ha asignado el primero de los al menos dos posibles modos de reconstrucción, está(n) situado(s) de tal manera que establece(n) al menos una primera zona (220) de cuadrícula, cuya posición dentro de la respectiva trama depende de la indicación de posición de transitorio y cuya extensión temporal es menor que 1/3 de una longitud de las tramas, así como una segunda y/o tercera zona (222a, 222b) de cuadrícula, que ocupa(n) la parte restante de la respectiva trama desde la primera zona de cuadrícula hasta el límite (902a, 902b) de trama anterior en el tiempo o posterior en el tiempo de la respectiva trama.
  14. 14.
    Decodificador según la reivindicación 13, en el que el dispositivo de extracción está configurado para esperar, para una trama (404), a la que se ha asignado el primer modo de reconstrucción, que presenta tres zonas (410, 412, 414) de cuadrícula, y en la que la primera zona (412) de cuadrícula de entre las tres zonas de cuadrícula se sitúa más cerca que un valor predeterminado a una trama previa (406), sólo para la primera y tercera zona (412, 414) de cuadrícula uno o varios valores de envolvente espectral en la
    señal de audio codificada y extraerlos de la señal de audio codificada, que describe(n) la envolvente espectral con una respectiva resolución de frecuencia, y obtener para la segunda zona (410) de cuadrícula uno o varios valores de envolvente espectral para la representación de la envolvente espectral a partir de la última zona (408) de cuadrícula en el tiempo de la trama (406) previa.
  15. 15.
    Decodificador según la reivindicación 13 ó 14, en el que el dispositivo de extracción está configurado para esperar, para una trama (502), a la que se ha asignado el primer modo de reconstrucción, que presenta dos zonas (502a, 502b) de cuadrícula, y en la que la primera zona (502b) de cuadrícula limita con el límite de trama posterior en el tiempo de la trama (502), para ambas zonas de cuadrícula uno o varios valores de envolvente espectral en la señal de audio codificada y extraerlos de la señal de audio codificada, que describe(n) la envolvente espectral con una respectiva resolución de frecuencia, y obtener a partir del (de los) valores de envolvente espectral para la primera zona (502b) de cuadrícula uno o varios valores de envolvente espectral para una zona (504b’) de cuadrícula de complementación en la siguiente trama (504), que limita con el límite de trama posterior, y acortar de manera correspondiente una zona (504a’) de cuadrícula anterior en el tiempo de la siguiente trama (504), establecida por el modo de reconstrucción de las siguientes tramas, para empezar justo en la zona (504b’) de cuadrícula de complementación, con lo cual la cuadrícula temporal en la siguiente trama (504) se subdivide, y estando el dispositivo para la adaptación espectral configurado para realizar la adaptación en la cuadrícula temporal subdividida.
  16. 16.
    Decodificador según la reivindicación 14 ó 15, en el que el dispositivo de extracción está configurado para esperar, para una trama, a la que se ha asignado el segundo modo de reconstrucción, o a la que se ha asignado el primer modo de reconstrucción, pero para la que ni se cumple la condición de que presenta tres zonas de cuadrícula y a este respecto la primera zona de cuadrícula de entre las tres zonas de cuadrícula se sitúa más cerca que el valor predeterminado a la trama previa, ni la condición de que sólo presenta dos zonas de cuadrícula y a este respecto la primera zona de cuadrícula limita con el límite de trama posterior en el tiempo, para cada zona de cuadrícula de esta trama uno o varios valores de envolvente espectral en la señal de audio codificada y extraerlos de la señal de audio codificada.
  17. 17.
    Decodificador según la reivindicación 16, en el que el dispositivo para la adaptación espectral está configurado de tal manera que la primera zona (220) de cuadrícula limita con el límite (902a) de trama anterior en el tiempo de la respectiva trama, si no existe una segunda zona (222a) de cuadrícula, y la primera zona (220) de cuadrícula limita con el límite (902b) de trama posterior en el tiempo de la respectiva trama, si no existe una tercera zona (222b) de cuadrícula.
  18. 18.
    Decodificador según una de las reivindicaciones 12 a 17, en el que el dispositivo para la adaptación espectral está configurado de tal manera que los límites de cuadrícula en el interior de las tramas, a las que está asignado el segundo de los al menos dos posibles modos de reconstrucción, están dispuestos distribuidos uniformemente en el tiempo, de modo que estas tramas sólo presentan una zona de cuadrícula o están divididas en zonas (906a, 906b) de cuadrícula del mismo tamaño.
  19. 19.
    Decodificador según una de las reivindicaciones 12 a 18, en el que el dispositivo de extracción está configurado para extraer, a partir de la señal de audio codificada, también una indicación de número de subdivisiones de trama, que están asociadas en cada caso a tramas, a las que se ha asignado el segundo de los posibles modos de reconstrucción, estando el dispositivo para la adaptación espectral configurado de tal manera que los límites de cuadrícula en el interior de estas tramas están subdivididos en un número de zonas de cuadrícula que depende de la respectiva indicación de número de subdivisiones de trama.
  20. 20.
    Decodificador según una de las reivindicaciones 12 a 19, en el que el dispositivo para la adaptación espectral está configurado de tal manera que, independientemente de los posibles modos de reconstrucción, que están asignados a las tramas, los límites de trama de las tramas coinciden siempre con límites de cuadrícula de la cuadrícula.
  21. 21.
    Decodificador según una de las reivindicaciones 12 a 20, en el que el dispositivo para la adaptación espectral presenta un banco (310) de filtros de análisis, que genera por cada ranura de tiempo del banco de filtros de la señal de audio decodificada un conjunto de valores espectrales, teniendo cada trama una longitud de varias ranuras de tiempo del banco de filtros, y presentando el dispositivo para la adaptación espectral además un dispositivo (318) para determinar la energía de los valores espectrales en la resolución de la cuadrícula.
  22. 22.
    Decodificador según la reivindicación 21, en el que la indicación de posición de transitorio está definida en unidades de ranuras de tiempo del banco de filtros.
  23. 23.
    Señal de audio codificada con
    una componente de baja frecuencia codificada de una señal de audio; una representación de una envolvente espectral de una componente de alta frecuencia de una señal de audio; e
    información sobre modos de reconstrucción, que están asignados a las tramas de la señal de audio y corresponden en cada caso a uno de al menos dos modos de reconstrucción, e indicaciones de posición de transitorio, que están asignadas en cada caso a tramas, a las que se ha asignado un primero de los al menos dos modos de reconstrucción, de tal manera que a partir de la señal de audio codificada mediante las siguientes etapas puede obtenerse la señal de audio:
    decodificar la componente de baja frecuencia codificada de la señal de audio en unidades de tramas de la señal de audio;
    proporcionar una señal de componente de alta frecuencia provisional basándose en la componente de baja frecuencia decodificada; y
    adaptar espectralmente la señal de componente de alta de frecuencia provisional a la envolvente espectral mediante ponderación espectral de la señal de componente de alta de frecuencia provisional en función de la representación de la envolvente espectral en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de los al menos dos posibles modos de reconstrucción, los límites de trama de estas tramas coinciden con límites de cuadrícula de la cuadrícula, y los límites de cuadrícula de la cuadrícula en el interior de estas tramas dependen de la indicación de posición de transitorio.
  24. 24. Procedimiento de codificación que presenta las siguientes etapas:
    codificar una componente de baja frecuencia de una señal de audio en unidades de tramas (902) de la señal de audio;
    localizar transitorios en la señal de audio;
    en función de la localización, asignar un respectivo modo de reconstrucción de entre al menos dos posibles modos de reconstrucción a las tramas de la señal de audio, y, para tramas, a las que se ha asignado un primero de los al menos dos posibles modos de reconstrucción, asignar una respectiva indicación de posición de transitorio a estas tramas; y
    generar una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de los al menos dos posibles modos de reconstrucción, los límites de trama (902a, 902b) de estas tramas (902) coinciden con límites de cuadrícula de la cuadrícula (222a, 220, 222b), y los límites de cuadrícula de la cuadrícula en el interior de estas tramas dependen de la indicación de posición de transitorio; y
    agrupar la componente de baja frecuencia codificada, la representación de la envolvente espectral e información sobre los modos de reconstrucción asignados y las indicaciones de posición de transitorio, en una señal de audio codificada.
  25. 25. Procedimiento de decodificación que presenta las siguientes etapas:
    extraer una componente de baja frecuencia codificada de una señal de audio, una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio e información sobre modos de reconstrucción, que están asignados a las tramas de la señal de audio y corresponden en cada caso a uno de al menos dos modos de reconstrucción, e indicaciones de posición de transitorio, que están asignadas en cada caso a tramas, a las que se ha asignado un primero de los al menos dos modos de reconstrucción, a partir de la señal de audio codificada;
    decodificar la componente de baja frecuencia codificada de la señal de audio en unidades de tramas de la señal de audio;
    proporcionar una señal de componente de alta frecuencia provisional basándose en la componente de baja frecuencia decodificada; y
    adaptar espectralmente la señal de componente de alta de frecuencia provisional a la envolvente espectral mediante ponderación espectral de la señal de componente de alta de frecuencia provisional en función de la representación de la envolvente espectral en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de los al menos dos posibles modos de reconstrucción, los límites de trama de estas tramas coinciden con límites de cuadrícula de la cuadrícula, y los límites de cuadrícula de la cuadrícula en el interior de estas tramas dependen de la indicación de posición de transitorio.
  26. 26. Decodificador con
    un dispositivo (306) de extracción de una componente de baja frecuencia codificada de una señal de audio, de información, que establece una cuadrícula (802a, 802b, 804a) temporal, de tal manera que al menos una zona (802b) de cuadrícula se extiende más allá de un límite de trama de dos tramas (802, 804) adyacentes de la señal de audio, para solaparse con las dos tramas adyacentes, y de una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio, a partir de una señal de audio codificada;
    un dispositivo (308) para decodificar la componente de baja frecuencia codificada de la señal de audio en unidades de tramas (802, 804) de la señal de audio;
    un dispositivo (310) para determinar una señal de componente de alta frecuencia provisional basándose en la componente de baja frecuencia decodificada; y
    un dispositivo (318, 312, 314) para la adaptación espectral de la señal de componente de alta de frecuencia provisional a la envolvente espectral mediante ponderación espectral de la señal de componente de alta de frecuencia provisional por medio de derivación, a partir de la representación de la envolvente espectral en la cuadrícula (802a, 802b, 804a) temporal, de una representación de la envolvente espectral en una cuadrícula (802a, 802b1, 802b2, 804a) temporal subdividida, en la que la zona (802b) de cuadrícula que se solapa con las dos tramas adyacentes está subdividida en una primera subzona (802b1) de cuadrícula y una segunda subzona (802b2) de cuadrícula, que limitan entre sí con el límite de trama, y por medio de la realización de la adaptación de la señal de componente de alta de frecuencia provisional a la señal de componente de alta de frecuencia provisional a la envolvente espectral mediante ponderación espectral de la señal de componente de alta de frecuencia provisional en la cuadrícula temporal subdividida.
  27. 27.
    Decodificador según la reivindicación 26, en el que el dispositivo de extracción está configurado para extraer, a partir de la señal de audio codificada, información sobre los modos de reconstrucción, que se han asignado a las tramas de la señal de audio, como la información que establece la cuadrícula temporal, estableciendo los modos de reconstrucción en cada caso zonas de cuadrícula de la cuadrícula temporal y correspondiendo en cada caso a una pluralidad de posibles modos de reconstrucción, y estando el dispositivo de extracción configurado para extraer, para tramas, a las que se ha asignado un modo predeterminado de los posibles modos de reconstrucción, también una indicación a partir de la señal de audio codificada, que indique, cómo debe estar orientado un límite de cuadrícula exterior de una zona (802b) de cuadrícula exterior de la trama (802), que se solapa con la trama (802), en el tiempo con respecto a un límite de trama de la trama, y extraer para cada zona (802a,b,c) de cuadrícula de la cuadrícula temporal uno o varios valores de envolvente espectral a partir de la señal de audio codificada.
  28. 28.
    Decodificador según la reivindicación 27, en el que el dispositivo para la adaptación espectral está configurado para obtener, a partir del uno o varios valores de envolvente espectral de la zona (802b) de cuadrícula que se solapa con las dos tramas (802, 804) adyacentes, un primer o varios primeros valores de envolvente espectral para la primera subzona (802b1) de cuadrícula y un segundo o varios segundos valores de envolvente espectral para la segunda subzona (802b2) de cuadrícula.
  29. 29.
    Decodificador según la reivindicación 28, en el que el dispositivo para la adaptación espectral está configurado de tal manera que cada valor de envolvente espectral de la zona (802b) de cuadrícula que se solapa con las dos tramas (802, 804) adyacentes se divide, en función de una relación de un tamaño de la primera subzona (802b1) de cuadrícula y de un tamaño de la segunda subzona (802b2) de cuadrícula, en un respectivo primer y segundo valor de envolvente espectral.
  30. 30.
    Decodificador según una de las reivindicaciones 26 a 29, en el que el dispositivo para la adaptación espectral presenta un banco de filtros de análisis, que genera por cada ranura del banco de filtros de la señal de audio decodificada un conjunto de valores espectrales, teniendo cada trama una longitud de varias ranuras de tiempo del banco de filtros, y presentando el dispositivo para la adaptación espectral un dispositivo para determinar una energía de los valores espectrales en la resolución de la cuadrícula temporal subdividida.
  31. 31.
    Procedimiento de decodificación con las siguientes etapas:
    extraer una componente de baja frecuencia codificada de una señal de audio, información, que establece una cuadrícula (802a, 802b, 804a) temporal, de tal manera que al menos una zona (802b) de cuadrícula se extiende más allá de un límite de trama de dos tramas (802, 804) adyacentes de la señal de audio, para solaparse con las dos tramas adyacentes, y una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio, a partir de una señal de audio codificada;
    decodificar la componente de baja frecuencia codificada de la señal de audio en unidades de tramas (802, 804) de la señal de audio;
    determinar una señal de componente de alta frecuencia provisional basándose en la componente de baja frecuencia decodificada; y
    adaptar espectralmente la señal de componente de alta de frecuencia provisional a la envolvente espectral mediante ponderación espectral de la señal de componente de alta de frecuencia provisional por medio de derivación, a partir de la representación de la envolvente espectral en la cuadrícula (802a, 802b, 804a) temporal, de una representación de la envolvente espectral en una cuadrícula (802a, 802b1, 802b2, 804a) temporal subdividida, en la que la zona (802b) de cuadrícula que se solapa con las dos tramas adyacentes está subdivida en una primera subzona (802b1) de cuadrícula y una segunda subzona (802b2) de cuadrícula, que limitan entre sí con el límite de trama, y por medio de la realización de la adaptación de la señal de componente de alta de frecuencia provisional a la envolvente espectral mediante ponderación espectral de la señal de componente de alta de frecuencia provisional en la cuadrícula temporal subdividida.
  32. 32. Codificador con
    un dispositivo (104, 106) para codificar una componente de baja frecuencia de una señal de audio en unidades de tramas (902) de la señal de audio;
    un dispositivo (118,116) para establecer una cuadrícula (802a, 802b, 804a) temporal, de tal manera que al menos una zona (802b) de cuadrícula se extiende más allá de un límite de trama de dos tramas (802, 804) adyacentes de la señal de audio, para solaparse con las dos tramas adyacentes; y
    un dispositivo (110, 112, 114) para generar una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio en la cuadrícula temporal; y
    un dispositivo (108) para agrupar la componente de baja frecuencia codificada, la representación de la envolvente espectral e información sobre la cuadrícula temporal, en una señal de audio codificada, estando el dispositivo de generación y el dispositivo de agrupación configurados de tal manera que la representación de la envolvente espectral en la zona de cuadrícula que se extiende más allá del límite de trama de las dos tramas (802, 804) adyacentes de la señal de audio depende de una relación de una componente (802b1) de esta zona de cuadrícula que se solapa con una de las dos tramas adyacentes y de una componente (802b2) de esta zona de cuadrícula que se solapa con la otra de las dos tramas adyacentes.
  33. 33. Procedimiento de codificación con las siguientes etapas:
    codificar una componente de baja frecuencia de una señal de audio en unidades de tramas (902) de la señal de audio;
    establecer una cuadrícula (802a, 802b, 804a) temporal, de tal manera que al menos una zona (802b) de cuadrícula se extiende más allá de un límite de trama de dos tramas (802, 804) adyacentes de la señal de audio, para solaparse con las dos tramas adyacentes; y
    generar una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio en la cuadrícula temporal; y
    agrupar la componente de baja frecuencia codificada, la representación de la envolvente espectral e información sobre la cuadrícula temporal, en una señal de audio codificada, realizándose la etapa de generación y la etapa de agrupación de tal manera que la representación de la envolvente espectral en la zona de cuadrícula que se extiende más allá del límite de trama de las dos tramas (802, 804) adyacentes de la señal de audio depende de una relación de una componente (802b1) de esta zona de cuadrícula que se solapa con una de las dos tramas adyacentes y de una componente (802b2) de esta zona de cuadrícula que se solapa con la otra de las dos tramas adyacentes.
  34. 34. Codificador con
    un dispositivo (104, 106) para codificar una componente de baja frecuencia de una señal de audio en unidades de tramas (902) de la señal de audio;
    un dispositivo (118) para localizar transitorios en la señal de audio;
    un dispositivo (116) para, en función de la localización, asignar un respectivo modo de reconstrucción de entre una pluralidad de posibles modos de reconstrucción a las tramas de la señal de audio, y, para tramas, a las que se ha asignado un primero de la pluralidad de modos de reconstrucción, asignar una respectiva indicación de ausencia de transitorio a estas tramas; y
    un dispositivo (110, 112, 114) de generación de una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de la pluralidad de posibles modos de reconstrucción, los límites de trama (902a, 902b) de estas tramas (902) coinciden con límites de cuadrícula de la cuadrícula (222a, 220, 222b); y
    un dispositivo (108) para agrupar la componente de baja frecuencia codificada, la representación de la envolvente espectral e información sobre los modos de reconstrucción asignados y la indicación de ausencia de transitorio, en una señal de audio codificada, estando el dispositivo de generación y el dispositivo de agrupación configurados para incorporar, para una trama (404), a la que se ha asignado el primer modo de reconstrucción, para la primera zona de cuadrícula en el tiempo de esta trama, en función de la indicación de ausencia de transitorio, o bien ninguno o bien uno o varios valores de envolvente espectral, que describe(n) la envolvente espectral con una respectiva resolución de frecuencia, como parte de la representación de la envolvente espectral en la señal de audio codificada.
  35. 35.
    Codificador según la reivindicación 34, en el que el dispositivo de generación está configurado de tal manera que los límites de cuadrícula en el interior de las tramas, a las que está asignado el segundo de los al menos dos posibles modos de reconstrucción, están dispuestos distribuidos uniformemente en el tiempo, de modo que estas tramas sólo presentan una zona de cuadrícula o están divididas en zonas (906a, 906b) de cuadrícula de igual tamaño.
  36. 36.
    Decodificador con
    un dispositivo (306) para extraer una componente de baja frecuencia codificada de una señal de audio, una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio, información sobre modos de reconstrucción, que están asignados a tramas de la señal de audio y corresponden en cada caso a uno de una pluralidad de modos de reconstrucción, e indicaciones de ausencia de transitorio, que están asignadas en cada caso a tramas, a las que se ha asignado un primero de la pluralidad de modos de reconstrucción, a partir de la señal de audio codificada;
    un dispositivo (308) para decodificar la componente de baja frecuencia codificada de la señal de audio en unidades de tramas (802, 804) de la señal de audio;
    un dispositivo (310) para determinar una señal de componente de alta frecuencia provisional basándose en la componente de baja frecuencia decodificada; y
    un dispositivo (318, 312, 314) para la adaptación espectral de la señal de componente de alta de frecuencia provisional a la envolvente espectral mediante ponderación espectral de la señal de componente de alta de frecuencia provisional en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de la pluralidad de posibles modos de reconstrucción, los límites de trama (902a, 902b) de estas tramas (902) coinciden con límites de cuadrícula de la cuadrícula (222a, 220, 222b), y el dispositivo para la adaptación espectral deriva uno o varios valores de envolvente espectral por cada zona de cuadrícula dentro de estas tramas para la representación de la envolvente espectral, estando el dispositivo de extracción configurado para o bien extraer, para una trama (404), a la que se ha asignado el primer modo de reconstrucción, para la primera zona de cuadrícula en el tiempo de esta trama, en función de la indicación de ausencia de transitorio, uno o varios valores de envolvente espectral, que describe(n) la envolvente espectral con una respectiva resolución de frecuencia, como parte de la representación de la envolvente espectral a partir de la señal de audio codificada, o bien obtenerlos a partir de uno o varios valores de envolvente espectral de una zona de cuadrícula adyacente a la primera zona de cuadrícula en el tiempo de la trama previa en el tiempo.
  37. 37. Procedimiento de codificación con las siguientes etapas:
    codificar una componente de baja frecuencia de una señal de audio en unidades de tramas (902) de la señal de audio;
    localizar transitorios en la señal de audio;
    en función de la localización, asignar un respectivo modo de reconstrucción de entre una pluralidad de posibles modos de reconstrucción a las tramas de la señal de audio, y, para tramas, a las que se ha asignado un primero de la pluralidad de modos de reconstrucción, asignar una respectiva indicación de ausencia de transitorio a estas tramas;
    generar una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de la pluralidad de posibles modos de reconstrucción, los límites de trama (902a, 902b) de estas tramas (902) coinciden con límites de cuadrícula de la cuadrícula (222a, 220, 222b); y
    agrupar la componente de baja frecuencia codificada, la representación de la envolvente espectral e información sobre los modos de reconstrucción asignados y la indicación de ausencia de transitorio, en una señal de audio codificada, realizándose la generación y la agrupación de tal manera que, para una trama (404), a la que se ha asignado el primer modo de reconstrucción, para la primera zona de cuadrícula en el tiempo de esta trama, en función de la indicación de ausencia de transitorio, se incorpora o bien ninguno o bien uno o varios valores de envolvente espectral, que describe(n) la envolvente espectral con una respectiva resolución de frecuencia, como parte de la representación de la envolvente espectral en la señal de audio codificada.
  38. 38. Procedimiento de decodificación con las siguientes etapas:
    extraer una componente de baja frecuencia codificada de una señal de audio, una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio, información sobre modos de reconstrucción, que están asignados a tramas de la señal de audio y corresponden en cada caso a uno de una pluralidad de modos de reconstrucción, e indicaciones de ausencia de transitorio, que están asignadas en cada caso a tramas, a las que se ha asignado un primero de la pluralidad de modos de reconstrucción, a partir de la señal de audio codificada;
    decodificar la componente de baja frecuencia codificada de la señal de audio en unidades de tramas (802, 804) de la señal de audio;
    determinar una señal de componente de alta frecuencia provisional basándose en la componente de baja frecuencia decodificada; y
    adaptar espectralmente la señal de componente de alta de frecuencia provisional a la envolvente espectral mediante ponderación espectral de la señal de componente de alta de frecuencia provisional en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de la pluralidad de posibles modos de reconstrucción, los límites de trama (902a, 902b) de estas tramas (902) coinciden con límites de cuadrícula de la cuadrícula (222a, 220, 222b), y el dispositivo para la adaptación espectral deriva uno o varios valores de envolvente espectral por cada zona de cuadrícula dentro de estas tramas para la representación de la envolvente espectral,
    realizándose la extracción de modo que, para una trama (404), a la que se ha asignado el primer modo de reconstrucción, para la primera zona de cuadrícula en el tiempo de esta trama, en función de la indicación de ausencia de transitorio, o bien se extrae uno o bien varios valores de envolvente espectral, que describe(n) la envolvente espectral con una respectiva resolución de frecuencia, como parte de la representación de la envolvente espectral a partir de la señal de audio codificada, o bien se obtiene a partir de uno o varios valores de envolvente espectral de una zona de cuadrícula adyacente a la primera zona de cuadrícula en el tiempo de la trama previa en el tiempo.
  39. 39. Señal de audio codificada con
    una componente de baja frecuencia codificada de una señal de audio;
    una representación de una envolvente espectral de una componente de alta frecuencia de la señal de audio;
    información sobre modos de reconstrucción, que están asignados a las tramas de la señal de audio y corresponden en cada caso a uno de una pluralidad de modos de reconstrucción, e indicaciones de ausencia de transitorio, que están asignadas en cada caso a tramas, a las que se ha asignado un primero de la pluralidad de modos de reconstrucción,
    de tal manera que, la señal de audio puede obtenerse a partir de la señal de audio codificada mediante las siguientes etapas:
    decodificar la componente de baja frecuencia codificada de la señal de audio en unidades de tramas (802, 804) de la señal de audio;
    determinar una señal de componente de alta frecuencia provisional basándose en la componente de baja frecuencia decodificada; y
    adaptar espectralmente la señal de componente de alta frecuencia provisional a la envolvente espectral mediante ponderación espectral de la señal de componente de alta de frecuencia provisional en una cuadrícula temporal, que depende de los modos de reconstrucción asignados a las tramas, de tal manera que para tramas, a las que se ha asignado el primero de la pluralidad de posibles modos de reconstrucción, los límites de trama (902a, 902b) de estas tramas (902) coinciden con límites de cuadrícula de la cuadrícula (222a, 220, 222b), y el dispositivo para la adaptación espectral deriva uno o varios valores de envolvente espectral por cada zona de cuadrícula dentro de estas tramas para la representación de la envolvente espectral, realizándose la extracción de modo que, para una trama (404), a la que se ha asignado el primer modo de reconstrucción, para la primera zona de cuadrícula en el tiempo de esta trama, en función de la indicación de ausencia de transitorio, o bien se extrae uno o varios valores de envolvente espectral, que
    5 describe(n) la envolvente espectral con una respectiva resolución de frecuencia, como parte de la representación de la envolvente espectral a partir de la señal de audio codificada o bien se obtiene a partir de uno o varios valores de envolvente espectral de una zona de cuadrícula adyacente a la primera zona de cuadrícula en el tiempo de la trama previa en el tiempo.
  40. 40. Programa informático con un código de programa para la realización del procedimiento según una 10 de las reivindicaciones 24, 25, 31, 33, 37 y 38, cuando el programa informático se ejecuta en un ordenador.
ES07818607T 2006-10-18 2007-10-01 Codificación de una señal de información. Active ES2365433T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102006049154 2006-10-18
DE102006049154A DE102006049154B4 (de) 2006-10-18 2006-10-18 Kodierung eines Informationssignals

Publications (1)

Publication Number Publication Date
ES2365433T3 true ES2365433T3 (es) 2011-10-05

Family

ID=38657988

Family Applications (1)

Application Number Title Priority Date Filing Date
ES07818607T Active ES2365433T3 (es) 2006-10-18 2007-10-01 Codificación de una señal de información.

Country Status (20)

Country Link
EP (1) EP2057625B1 (es)
JP (1) JP5266234B2 (es)
KR (1) KR101183962B1 (es)
CN (1) CN101529503B (es)
AT (1) ATE507554T1 (es)
AU (1) AU2007312667B2 (es)
BR (1) BRPI0715555B1 (es)
CA (1) CA2664466C (es)
DE (2) DE102006049154B4 (es)
ES (1) ES2365433T3 (es)
HK (1) HK1126567A1 (es)
IL (1) IL197561A (es)
MX (1) MX2009004045A (es)
MY (1) MY147067A (es)
NO (1) NO341258B1 (es)
PL (1) PL2057625T3 (es)
RU (1) RU2413312C2 (es)
TW (1) TWI355648B (es)
WO (1) WO2008046505A1 (es)
ZA (1) ZA200810394B (es)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI559680B (zh) 2009-02-18 2016-11-21 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN103854651B (zh) * 2009-12-16 2017-04-12 杜比国际公司 Sbr比特流参数缩混
US9338523B2 (en) 2009-12-21 2016-05-10 Echostar Technologies L.L.C. Audio splitting with codec-enforced frame sizes
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
KR101424372B1 (ko) * 2011-02-14 2014-08-01 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 랩핑 변환을 이용한 정보 신호 표현
PT3239978T (pt) 2011-02-14 2019-04-02 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
BR112013020324B8 (pt) 2011-02-14 2022-02-08 Fraunhofer Ges Forschung Aparelho e método para supressão de erro em fala unificada de baixo atraso e codificação de áudio
AR085794A1 (es) 2011-02-14 2013-10-30 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral
PT2676270T (pt) 2011-02-14 2017-05-02 Fraunhofer Ges Forschung Codificação de uma parte de um sinal de áudio utilizando uma deteção de transiente e um resultado de qualidade
MY160265A (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
JP5969513B2 (ja) 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
KR101748760B1 (ko) * 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
JP5807453B2 (ja) 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
WO2013128832A1 (ja) * 2012-03-02 2013-09-06 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置および画像符号化復号装置
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
KR20230020553A (ko) * 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
PT3008726T (pt) 2013-06-10 2017-11-24 Fraunhofer Ges Forschung Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição
SG11201510164RA (en) 2013-06-10 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
PL3405949T3 (pl) 2016-01-22 2020-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób szacowania międzykanałowej różnicy czasowej
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3531178B2 (ja) * 1993-05-27 2004-05-24 ソニー株式会社 ディジタル信号処理装置及び方法
JP3277677B2 (ja) * 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
EP1340317A1 (en) * 2000-11-03 2003-09-03 Koninklijke Philips Electronics N.V. Parametric coding of audio signals
DE60225130T2 (de) * 2001-05-10 2009-02-26 Dolby Laboratories Licensing Corp., San Francisco Verbesserung der transientenleistung bei kodierern mit niedriger bitrate durch unterdrückung des vorgeräusches
EP1399917B1 (en) * 2001-06-08 2005-09-21 Philips Electronics N.V. Editing of audio signals
WO2004008806A1 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR20060083202A (ko) * 2003-09-05 2006-07-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 낮은 비트율 오디오 인코딩
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
JP4822697B2 (ja) * 2004-12-01 2011-11-24 シャープ株式会社 ディジタル信号符号化装置およびディジタル信号記録装置

Also Published As

Publication number Publication date
BRPI0715555A8 (pt) 2019-01-15
KR101183962B1 (ko) 2012-09-18
NO341258B1 (no) 2017-09-25
DE502007007077D1 (de) 2011-06-09
BRPI0715555B1 (pt) 2020-09-15
DE102006049154B4 (de) 2009-07-09
CN101529503B (zh) 2012-05-09
EP2057625A1 (de) 2009-05-13
HK1126567A1 (en) 2009-09-04
DE102006049154A1 (de) 2008-04-24
RU2009118384A (ru) 2010-11-27
KR20090073172A (ko) 2009-07-02
CA2664466A1 (en) 2008-04-24
JP2010507113A (ja) 2010-03-04
WO2008046505A1 (de) 2008-04-24
AU2007312667A1 (en) 2008-04-24
IL197561A (en) 2013-02-28
CA2664466C (en) 2015-03-17
ZA200810394B (en) 2009-08-26
PL2057625T3 (pl) 2011-09-30
CN101529503A (zh) 2009-09-09
MX2009004045A (es) 2009-05-28
TWI355648B (en) 2012-01-01
JP5266234B2 (ja) 2013-08-21
AU2007312667B2 (en) 2010-09-09
NO20083755L (no) 2008-09-01
TW200830277A (en) 2008-07-16
IL197561A0 (en) 2009-12-24
BRPI0715555A2 (pt) 2014-03-18
EP2057625B1 (de) 2011-04-27
ATE507554T1 (de) 2011-05-15
RU2413312C2 (ru) 2011-02-27
MY147067A (en) 2012-10-15

Similar Documents

Publication Publication Date Title
ES2365433T3 (es) Codificación de una señal de información.
ES2362920T3 (es) Método mejorado para la conformación de señales en reconstrucción de audio multicanal.
ES2314706T3 (es) Metodo y dispositivo para generar señal multicanal o conjunto de datos de parametros.
ES2770146T3 (es) Conformación temporal y espacial de señales de audio multicanal
ES2952871T3 (es) Concepto para puentear el espacio entre codificación parámetrica de audio multicanal y codificación multicanal envolvente matricial
ES2398573T3 (es) Número reducido de decodificación de canales
ES2281795T3 (es) Sintesis de señal de audio.
ES2413807T3 (es) Método y aparato para procesar una señal de audio
ES2662671T3 (es) Procesamiento avanzado basado en un banco de filtros modulado exponencialmente complejo y procedimientos de señalización de tiempos adaptativos
ES2293578T3 (es) Aparato y metodo para generar un parametro de nivel y aparato y metodo para generar una representacion multicanal.
ES2880883T3 (es) Codificador, decodificador y métodos para la adaptación dinámica compatible inversamente de resolución de tiempo/frecuencia en la codificación de objetos de audio espacial
ES2658942T3 (es) Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable
ES2278348T3 (es) Codificacion/decodificacion multicanal compatible.
ES2307188T3 (es) Sintetizador multicanal y procedimiento para generar una señal de salida multicanal.
ES2703327T3 (es) Codificador, decodificador y métodos para codificación espacial de objetos de audio de multirresolución retrocompatible
ES2261974T3 (es) Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral.
ES2650715T3 (es) Receptor y método para decodificar flujo de datos codificado estéreofónico paramétrico
ES2238798T3 (es) Metodo para codificar y descodificar datos de tipo audio.
US8417532B2 (en) Encoding an information signal
ES2430414T3 (es) Cálculo de máscara de escalado selectivo basado en detección de pico
EP3252761B1 (en) Noise filling in multichannel audio coding
ES2772173T3 (es) Dispositivo de decodificación de audio, dispositivo de codificación de audio, método de decodificación de audio, método de codificación de audio, programa de decodificación de audio y programa de codificación de audio
ES2278192T3 (es) Codificacion de una señal de audio.
ES2969117T3 (es) Dispositivo de codificación de audio de voz, y procedimiento de codificación de audio de voz
ES2748939T3 (es) Codificador y descodificador de audio