ES2940783T3 - Procesador, procedimiento y programa informático para el tratamiento de una señal de audio mediante el uso de las partes de superposición truncadas de ventanas de análisis o síntesis - Google Patents

Procesador, procedimiento y programa informático para el tratamiento de una señal de audio mediante el uso de las partes de superposición truncadas de ventanas de análisis o síntesis Download PDF

Info

Publication number
ES2940783T3
ES2940783T3 ES19189446T ES19189446T ES2940783T3 ES 2940783 T3 ES2940783 T3 ES 2940783T3 ES 19189446 T ES19189446 T ES 19189446T ES 19189446 T ES19189446 T ES 19189446T ES 2940783 T3 ES2940783 T3 ES 2940783T3
Authority
ES
Spain
Prior art keywords
window
overlap
asymmetric
length
truncated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19189446T
Other languages
English (en)
Inventor
Guillaume Fuchs
Markus Multrus
Matthias Neusinger
Andreas Niedermeier
Markus Schnell
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2940783T3 publication Critical patent/ES2940783T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

Un procesador para procesar una señal de audio (200), comprende: un analizador (202) para derivar una señal de control de ventana (204) a partir de la señal de audio (200) que indica un cambio de una primera ventana asimétrica (1400) a una segunda ventana (1402), o indicando un cambio de una tercera ventana (1450) a una cuarta ventana asimétrica (1452), donde la segunda ventana (1402) es más corta que la primera ventana (1400), o donde la tercera ventana (1450) es más corta que la cuarta ventana (1452); un constructor de ventanas (206) para construir la segunda ventana (1402) utilizando una primera parte superpuesta (800) de la primera ventana asimétrica (1400), en el que el constructor de ventanas (206) está configurado para determinar una primera parte superpuesta (1000) de la segunda ventana (1402) utilizando una primera parte superpuesta truncada de la primera ventana asimétrica, o en el que el constructor de ventanas está configurado para calcular una segunda parte superpuesta (1330) de la tercera ventana (1450) usando una segunda parte superpuesta truncada (814) de la cuarta ventana asimétrica (1452); y un controlador de ventanas (208) para aplicar las ventanas primera y segunda o las ventanas tercera y cuarta para obtener porciones de señal de audio divididas en ventanas (210). (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Procesador, procedimiento y programa informático para el tratamiento de una señal de audio mediante el uso de las partes de superposición truncadas de ventanas de análisis o síntesis
[0001] La presente invención se refiere al tratamiento de audio y, en particular, al tratamiento de audio con ventanas de superposición para un lado de análisis o un lado de síntesis de una cadena de tratamiento de señal de audio.
[0002] La mayoría de los codificadores de audio de dominio de la frecuencia contemporáneos basados en transformadas de superposición como la MDCT emplean algún tipo de conmutación de tamaño de transformada para adaptar la resolución en el tiempo y la frecuencia a las propiedades de la señal actual. Se han desarrollado diferentes enfoques para manejar la conmutación entre los tamaños de transformada disponibles y sus correspondientes formas de ventana. Algunos enfoques insertan una ventana de transición entre tramas codificadas mediante el uso de diferentes longitudes de transformada, por ejemplo, MPEG-4 (HE-)AAC [1]. La desventaja de las ventanas de transición es la necesidad de una mayor anticipación de codificador, por lo que es inadecuado para aplicaciones de bajo retardo. Otros emplean una superposición de ventana baja fija para todos los tamaños de transformada para evitar la necesidad de ventanas de transiciones, por ejemplo, CELT [2]. Sin embargo, la baja superposición reduce la separación de frecuencias, lo que degrada la eficiencia de codificación para señales tonales. En el punto [3] se presenta un enfoque de conmutación mejorada de efecto inmediato que emplea diferentes longitudes de transformada y superposición para superposiciones simétricas. La Fig. 16 muestra un ejemplo para una conmutación de efecto inmediato entre diferentes longitudes de transformada mediante el uso de ventanas sinusoidales de baja superposición.
[0003] Por otro lado, los codificadores de audio de bajo retardo a menudo emplean ventanas MDCT asimétricas, ya que presentan un buen compromiso entre separación de retardo y de frecuencia. En el lado del codificador se usa una superposición acortada con la trama posterior para reducir el retardo de anticipación, mientras que se usa una superposición larga con la trama anterior para mejorar la separación de frecuencia. En el lado del decodificador se usa una versión en espejo de la ventana del codificador. En las Fig. 8a a 8c se representa la ventanización asimétrica para análisis y síntesis.
[0004] El documento US 2014/0142930 A1 describe un procedimiento y un dispositivo para codificar o decodificar una señal de audio digital mediante una transformada que usa ventanas de ponderación de análisis o de síntesis aplicadas a tramas de muestra. El procedimiento incluye un muestreo irregular de una ventana inicial proporcionada para una transformada de tamaño inicial dado con el fin de aplicar una transformada secundaria de un tamaño M diferente.
[0005] Un objeto de la presente invención es estipular un concepto mejorado para el tratamiento de una señal de audio.
[0006] Este objeto se logra por medio de un procesador para el tratamiento de una señal de audio según la reivindicación 1, un procedimiento de tratamiento de una señal de audio según la reivindicación 16 o un programa informático según la reivindicación 17.
[0007] La presente invención se basa en el hallazgo de que las ventanas de transformada asimétricas son útiles para lograr una buena eficiencia de codificación para señales estacionarias en un retardo reducido. Por otro lado, con el fin de tener una estrategia de conmutación de tamaño de transformada flexible, las ventanas de análisis o síntesis para una transición de un tamaño del bloque a un tamaño del bloque diferente permiten el uso de partes de superposición truncadas de ventanas asimétricas como bordes de ventana o como base para los bordes de ventana sin alterar la propiedad de reconstrucción perfecta.
[0008] Por lo tanto, las partes truncadas de una ventana asimétrica tal como la parte de superposición larga de la ventana asimétrica se pueden usar dentro de la ventana de transición. Sin embargo, con el fin de cumplir con la longitud necesaria de la ventana de transición, esta parte de superposición o borde de ventana asimétrica o flanco se trunca a una longitud permisible dentro de las limitaciones de la ventana de transición. Esto, sin embargo, no viola la propiedad de reconstrucción perfecta. Por lo tanto, este truncamiento de partes de superposición de ventana de ventanas asimétricas permite ventanas de transición de conmutación cortas y de efecto inmediato sin penalización desde el punto de vista de la reconstrucción perfecta.
[0009] En otras realizaciones, se prefiere no usar la parte superpuesta truncada directamente, sino para suavizar o producir una aparición o un desvanecimiento graduales de la discontinuidad en que se incurre al truncar la parte de la ventana de superposición asimétrica en consideración.
[0010] Otras realizaciones se basan en una aplicación de gran ahorro de memoria, debido al hecho de que solo una cantidad mínima de bordes de ventana o flancos de ventana se almacenan en la memoria e incluso para la aparición o el desvanecimiento graduales, se usa un cierto borde de ventana. Estas implementaciones de memoria eficiente construyen además bordes de ventana descendentes a partir de un borde de ventana ascendente almacenado, o a la inversa, por medio de operaciones lógicas o aritméticas, de manera que debe almacenarse solo un borde individual, ya sea un borde ascendente o descendente, y el otro puede deducirse sobre la marcha.
[0011] Una realización según la presente invención comprende un procesador, como se establece en la reivindicación independiente 1, un procedimiento para procesar una señal de audio, como se establece en la reivindicación independiente 16, o un programa informático, como se establece en la reivindicación independiente 17.
[0012] Como es sabido, la ventanización para análisis tiene lugar al principio de un codificador de audio, en el que un tren de muestras de señal de audio de tiempo discreto y de tiempo posteriores se ventanizan mediante secuencias de ventana y, por ejemplo, se aplica un conmutador desde una ventana larga a una ventana corta cuando el analizador detecta realmente un transitorio en la señal de audio. A continuación, después de la ventanización, se lleva a cabo una conversión desde el dominio del tiempo al dominio de la frecuencia y, en realizaciones preferidas, esta conversión se realiza con el uso de la transformada de coseno discreta modificada (MDCT). La MDCT usa una operación de plegado y una transformada DCT IV posterior para generar, a partir de un conjunto de 2N muestras de dominio del tiempo, un conjunto de N muestras en el dominio de la frecuencia, y estos valores de dominio de la frecuencia se tratan a continuación de forma adicional.
[0013] En el lado de síntesis, el analizador no lleva a cabo un análisis de la señal real de la señal de audio, sino que el analizador deduce la señal de control de la ventana a partir de una información conexa a la señal de audio codificada que indica una cierta secuencia de ventana determinada por un analizador del lado del codificador y transmitida a la aplicación del procesador del lado del decodificador. La ventanización de síntesis se lleva a cabo al final del tratamiento del lado del decodificador, es decir, después de una conversión de frecuencia-tiempo y una operación de despliegue que genera, a partir de un conjunto de N valores espectrales de un conjunto de 2N valores de dominio del tiempo, que a continuación se ventanizan y, después de la ventanización de síntesis mediante el uso de los bordes de ventana truncados de la invención, una superposición y suma según se necesite. Preferentemente, se aplica una superposición del 50% para la colocación de las ventanas de análisis y para la superposición y suma real posterior a la ventanización de síntesis mediante el uso de las ventanas de síntesis.
[0014] Por lo tanto, las ventajas de la presente invención son que la presente invención se basa en ventanas de transformada asimétricas, que tienen buena eficacia de codificación para señales estacionarias con un retardo reducido. Por otro lado, la presente invención permite una estrategia de conmutación de tamaño de transformada flexible para una codificación eficiente de señales transitorias, que no aumenta el retardo total del codificador. Por lo tanto, la presente invención se basa en una combinación de ventanas asimétricas para transformadas largas y un concepto de conmutación flexible de longitud de transformada/superposición para intervalos de superposición simétricos de ventanas cortas. Las ventanas cortas pueden ser totalmente simétricas con la misma superposición simétrica en los dos lados, o pueden ser asimétricas con una primera superposición simétrica con una ventana anterior y una segunda superposición simétrica diferente con una ventana posterior.
[0015] La presente invención es ventajosa específicamente porque, mediante el uso de la parte de superposición truncada de la ventana larga asimétrica, cualquier retardo de codificador o anticipación de codificador requerido no se incrementan por el hecho de que cualquier transición a partir de ventanas con diferentes tamaños de bloque no requiere la inserción de ninguna ventana de transición larga adicional.
[0016] A continuación se exponen las realizaciones preferidas de la presente invención con respecto a los dibujos adjuntos, en los que:
La Fig. 1a ilustra un aspecto para la codificación en el contexto de partes de superposición truncadas;
La Fig. 1b ilustra un aparato para la decodificación en el contexto del uso de partes de superposición truncadas; La Fig. 1c ilustra una ilustración más detallada del lado de síntesis;
La Fig.1d ilustra una implementación de un dispositivo móvil que tiene un codificador, un decodificador y una memoria;
La Fig. 2 ilustra una realización preferida de la presente invención para el lado de análisis (caso A) o el lado de síntesis (caso B);
La Fig. 3 ilustra una implementación preferida del constructor de ventanas;
La Fig. 4 ilustra una ilustración esquemática del contenido de la memoria de la Fig. 3;
La Fig. 5 ilustra un procedimiento preferido para la determinación de la primera parte de superposición y la segunda parte de superposición de una ventana de transición de análisis;
La Fig. 6 ilustra un procedimiento preferido para determinar una ventana de transición de síntesis;
La Fig. 7 ilustra un procedimiento adicional con un truncamiento menor que la longitud máxima;
La Fig. 8a ilustra una ventana de análisis asimétrica;
La Fig. 8b ilustra una ventana de síntesis asimétrica;
La Fig. 8c ilustra una ventana de análisis asimétrica con partes de plegado;
La Fig. 9a ilustra una ventana de análisis/síntesis simétrica;
La Fig. 9b ilustra una ventana de análisis/síntesis simétrica, con partes de superposición simétricas, pero diferentes; La Fig. 9c ilustra una ventana adicional con partes de superposición simétricas que tienen diferentes longitudes; La Fig. 10a ilustra una ventana de transición de análisis tal como la segunda ventana con una primera parte de superposición truncada;
La Fig. 10b ilustra una segunda ventana con una primera parte de superposición truncada y de aparición gradual; La Fig. 10c ilustra la segunda ventana de la Fig. 10a en el contexto de las correspondientes partes de superposición de las ventanas anteriores y posteriores;
La Fig. 10d ilustra la situación de la Fig. 10c, pero con una primera parte de superposición de aparición gradual; La Fig. 11a ilustra una ventana de transición diferente con una aparición gradual para el lado de análisis;
La Fig. 11b ilustra una ventana de transición de análisis adicional con un truncamiento más alto que el necesario y una modificación adicional correspondiente;
Las Fig. 12a, 12b ilustran ventanas de transición de análisis para una transición desde un tamaño pequeño a un tamaño de bloque alto;
Las Fig. 13a, 13b ilustran ventanas de transición de síntesis desde un tamaño de bloque alto a un tamaño de bloque bajo;
La Fig. 13c ilustra una ventana de transición de síntesis con una segunda parte de superposición truncada tal como la tercera ventana;
La Fig. 13d ilustra la ventana de la Fig. 13c, pero sin el desvanecimiento;
La Fig. 14a ilustra una cierta secuencia de ventanas de análisis;
La Fig. 14b ilustra una secuencia de ventanas de síntesis correspondiente;
La Fig. 15a ilustra una cierta secuencia de ventanas de análisis;
La Fig. 15b ilustra una secuencia de ventanas de síntesis correspondiente a la de la Fig. 15a; y
La Fig. 16 ilustra un ejemplo para el cambio de efecto inmediato entre diferentes longitudes de transformada mediante el uso de superposición simétrica solamente.
[0017] Las realizaciones se refieren a conceptos para conmutar con efecto inmediato de una transformada de MDCT larga mediante el uso de una ventana asimétrica a una transformada más corta con ventanas de superposición simétricamente, sin necesidad de insertar una trama intermedia.
[0018] Durante la construcción de la forma de la ventana para la primera trama que emplea una menor longitud de la transformada, deben abordarse dos restricciones:
• La parte de superposición de la izquierda de la ventana debe coincidir con la forma de la ventana asimétrica anterior de una manera de manera que se consiga una reconstrucción perfecta o casi perfecta.
• La longitud de las partes de superposición se ve limitada debido a la longitud más corta de transformada.
[0019] La parte de superposición de la izquierda de la ventana asimétrica larga satisfaría la primera condición, pero es demasiado larga para las transformadas más cortas, que suelen tener la mitad o menos del tamaño de la transformada larga. Por lo tanto, tiene que elegirse una forma de ventana más corta.
[0020] En esta situación se supone que las ventanas de análisis y síntesis asimétricas son simétricas entre sí, es decir, la ventana de síntesis es una versión en espejo de la ventana de análisis. En este caso la ventana w tiene que cumplir la siguiente ecuación para la reconstrucción perfecta:
Figure imgf000004_0001
_
en la que L representa la longitud de la transformada y n el índice de muestra.
[0021] Para la reducción de retardo la superposición del lado derecho de la ventana de análisis larga asimétrica se ha acortado, lo que significa que todas las muestras más a la derecha de la ventana tienen un valor cero. A partir de la ecuación anterior se puede ver que si una muestra de ventana Wn tiene un valor cero, puede
elegirse un valor arbitrario para la muestra simétrica W2i_j_n . Si las muestras m más a la derecha de la ventana son cero, las muestras m más a la izquierda, por lo tanto, pueden sustituirse también por ceros sin perder la reconstrucción perfecta, es decir, la parte de superposición de la izquierda se puede truncar hasta la longitud de la parte de superposición de la derecha.
[0022] Si la longitud de superposición truncada es suficientemente corta, de manera que se conserva suficiente longitud de superposición para la parte derecha de la primera ventana de transformada corta, se obtiene una solución para la primera forma de la ventana de transformada corta, lo que cumple las dos condiciones anteriores. El extremo izquierdo de la parte de superposición de la ventana asimétrica se trunca y se combina con la superposición simétrica usada para las ventanas cortas posteriores. En la Fig. 10c se representa un ejemplo de la forma de la ventana resultante.
[0023] El uso de una versión truncada de la ventana de superposición larga existente evita la necesidad de diseñar una forma de ventana totalmente nueva para la transición. También reduce la demanda de ROM/RAM en el hardware en que se implementa el algoritmo, ya que no se requiere ninguna tabla de ventana adicional para la transición.
[0024] Para ventanización de síntesis en el lado del decodificador se usa un enfoque simétrico. La ventana de síntesis asimétrica tiene la superposición larga en el lado derecho. Por lo tanto, se usa una versión truncada de la parte de superposición de la derecha para la parte de la ventana de la derecha de la última transformada corta antes de cambiar de nuevo a las transformadas largas con ventanas asimétricas, según se representa en la Fig. 13d.
[0025] Según se muestra anteriormente el uso de una versión truncada de la ventana larga permite la reconstrucción perfecta de la señal en el dominio del tiempo si los datos espectrales no se modifican entre la transformada de análisis y de síntesis. Sin embargo, en un codificador de audio se aplica cuantificación a los datos espectrales. En la transformada de síntesis el ruido de cuantificación resultante es conformado por la ventana de síntesis. Como el truncamiento de la ventana larga introduce una etapa en la forma de la ventana, pueden producirse discontinuidades en el ruido de cuantificación de la señal de salida. Estas discontinuidades pueden escucharse en forma de artefactos similares a un clic.
[0026] Para evitar este tipo de artefactos, se puede aplicar un desvanecimiento al final de la ventana truncada para suavizar la transición a cero. El desvanecimiento se puede hacer de varias maneras diferentes, por ejemplo, podría ser lineal o tener forma de seno o de coseno. La longitud del desvanecimiento debe elegirse suficientemente larga para que no se produzcan artefactos audibles. La longitud máxima disponible para el desvanecimiento sin perder reconstrucción perfecta se determina por la longitud de la transformada corta y la longitud de las superposiciones de ventana. En algunos casos, la longitud disponible puede ser cero o demasiado pequeña para suprimir los artefactos. En estos casos puede ser beneficioso extender la longitud de desvanecimiento y aceptar pequeños errores de reconstrucción, ya que estos son a menudo menos perturbadores que las discontinuidades en el ruido de cuantificación. La sintonización minuciosa de la longitud de desvanecimiento permite encontrar un equilibrio entre errores de reconstrucción y discontinuidades de errores de cuantificación, con el fin de lograr la mejor calidad de audio.
[0027] La Fig. 10d representa un ejemplo para una superposición truncada con un desvanecimiento corto multiplicando el extremo truncado de la ventana por una función seno.
[0028] A continuación se expone la Fig. 2 para describir un procesador para el tratamiento de una señal de audio según las realizaciones de la presente invención. La señal de audio se proporciona en una entrada 200 en un analizador 202. El analizador está configurado para deducir una señal de control de la ventana 204 de la señal de audio en la entrada 200, en la que la señal de control de la ventana indica un cambio de una primera ventana asimétrica a una segunda ventana tal como se ilustra, por ejemplo, mediante la primera ventana 1400 o 1500 en la Fig. 14a o la Fig. 15a, en las que la segunda ventana, en esta realización, es la ventana 1402 en la Fig. 14a o 1502 en la Fig. 15a. La señal de control de la ventana 204 de nuevo, de forma alternativa, y con respecto a una operación en un lado de síntesis a modo de ejemplo indica un cambio de una tercera ventana tal como 1450 en la Fig. 14b o 1550 en la Fig. 15b a una tercera ventana tal como 1452 en la Fig. 14b o 1552 en la Fig. 15b. Según se ilustra, la segunda ventana tal como 1402 es más corta que la primera ventana 1400 o la tercera ventana tal como 1450 o 1550 es más corta que la cuarta ventana tal como 1452 o 1552.
[0029] El procesador comprende además un constructor de ventanas 206 para la construcción de la segunda ventana mediante el uso de una primera parte de superposición de una primera ventana asimétrica, en el que este constructor de ventanas está configurado para determinar una primera parte de superposición de la segunda ventana mediante el uso de una primera parte de superposición truncada de la primera ventana asimétrica para el lado de síntesis, es decir, el caso B en la Fig. 2. El constructor de ventanas está configurado para calcular una segunda parte de superposición de la tercera ventana tal como 1502 o 1550 mediante el uso de una segunda parte de superposición truncada de la primera ventana, es decir, la ventana asimétrica.
[0030] Estas ventanas, tal como la segunda ventana en el lado de análisis o la tercera ventana en el lado de síntesis y, por supuesto, las ventanas anteriores y/o posteriores se transmiten desde el constructor de ventanas 206 a un divisor de ventanas 208. El divisor de ventanas 208 aplica la primera y la segunda ventana o la tercera y la cuarta ventana a una señal de audio con el fin de obtener las partes de la señal en una salida 210.
[0031] El Caso A está relacionado con el lado de análisis. En esta situación, la entrada es una señal de audio y el analizador real 202 lleva a cabo un análisis de la señal de audio real, tal como un análisis de transitorios, etc. La primera y la segunda ventana son ventanas de análisis y la señal ventanizada es procesada en el lado del codificador tal como se expondrá más adelante con respecto a la Fig. 1a.
[0032] Por lo tanto, se sortea un procesador decodificador 214 ilustrado en la Fig. 2 o en realidad no está presente en el caso A.
[0033] En el Caso B, es decir, cuando se aplica el tratamiento de la invención en un lado de síntesis, la entrada es la señal de audio codificada, tal como un tren de bits que tiene información de la señal de audio y la información conexa, y el analizador 202 lleva a cabo un análisis del tren de bits o un muestreo del tren de bits o una señal de análisis codificada con el fin de recuperar, desde la señal de audio codificada, una señal de control de la ventana que indica la secuencia de ventana aplicada por el codificador, a partir de la cual se puede deducir la secuencia de ventana para su aplicación por el decodificador.
[0034] A continuación, la tercera y la cuarta ventana son ventanas de síntesis y la señal ventanizada se somete a un tratamiento de superposición y suma para una síntesis de señal de audio como se ilustra en la Fig. 1b o 1c.
[0035] La Fig. 1a ilustra un aparato para codificar una señal de audio 100. El aparato para codificar una señal de audio comprende un divisor de ventanas controlable 102 para ventanización de la señal de audio 100 con el fin de proporcionar una secuencia de bloques de muestras ventanizadas en 103. El codificador comprende además un convertidor 104 para la conversión la secuencia de bloques de muestras ventanizadas 103 en una representación espectral que comprende una secuencia de tramas de valores espectrales indicada en 105. Por otra parte, se proporciona un detector de localización de transitorios 106. El detector está configurado para identificar la localización de un transitorio dentro de una región de anticipación de transitorios de una trama. Por otra parte, un controlador 108 para controlar el divisor de ventanas controlable está configurado para aplicar una ventana específica que tiene una longitud de superposición especificada a la señal de audio 100 en respuesta a una localización identificada del transitorio que se ilustra en 107. Por otra parte, en una realización el controlador 108 está configurado para proporcionar información de la ventana 112 no solo al divisor de ventanas controlable 102, sino también a una interfaz de salida 114 que proporciona, en su salida, la señal de audio codificada 115. La representación espectral que comprende la secuencia de tramas de valores espectrales 105 se introduce en un procesador de codificación 110, que puede llevar a cabo cualquier tipo de operación de codificación, tal como una operación de predicción, una operación de conformado de ruido temporal, una operación de cuantificación preferentemente con respecto a un modelo psicoacústico o al menos con respecto a los principios psicoacústicos o puede comprender una operación de codificación de reducción de redundancia, tal como una operación de codificación Huffman o una operación de codificación aritmética. La salida del procesador 110 de codificación se reenvía a la interfaz de salida 114 y la interfaz de salida 114, finalmente, proporciona la señal de audio codificada que tiene asociada, para cada trama codificada, una cierta información de la ventana 112.
[0036] El controlador 108 está configurado para seleccionar la ventana específica de un grupo de al menos tres ventanas. El grupo comprende una primera ventana que tiene una primera longitud de superposición, una segunda ventana que tiene una segunda longitud de superposición y una tercera ventana que tiene una tercera longitud de superposición o ninguna superposición. La primera longitud de superposición es mayor que la segunda longitud de superposición y la segunda longitud de superposición es mayor que una superposición cero. La ventana específica se selecciona por medio del divisor de ventanas controlable 102 basándose en la localización de transitorios de manera que una de las dos ventanas de tiempo de superposición adyacentes tiene primeros coeficientes de ventana en la localización del transitorio y la otra de las dos ventanas de superposición de tiempo adyacente tiene segundos coeficientes de ventana en la localización del transitorio y los segundos coeficientes de ventana son al menos nueve veces mayores que los primeros coeficientes. Así se asegura que el transitorio se suprime sustancialmente por la primera ventana que tiene los primeros (pequeños) coeficientes y el transitorio se ve poco afectado por la segunda ventana que tiene los segundos coeficientes de ventana. Preferentemente, los primeros coeficientes de ventana son iguales a 1 dentro de una tolerancia de más/menos el 5%, tal como entre 0,95 y 1,05, y los segundos coeficientes de ventana preferentemente son iguales a 0 o al menos menores que 0,05. Los coeficientes de ventana también pueden ser negativos y, en este caso, las relaciones y las cantidades de los coeficientes de ventana están relacionadas con la magnitud absoluta.
[0037] Por otra parte, de forma alternativa o adicional, el controlador 108 comprende las funcionalidades del constructor de ventanas 206 tal como se expone en el contexto de la Fig. 2 y como se expondrá más adelante. Por otra parte, el detector de localización de transitorios 106 puede ser implementado y tener las funcionalidades del analizador 202 de la Fig. 2 para el caso A, es decir, para la aplicación de las ventanas en el lado de análisis.
[0038] Por otra parte, los bloques 104 y 110 ilustran el tratamiento que será realizado por la señal de audio ventanizada 210, que corresponde a la señal de audio ventanizada 103 en la Fig. 1a. Por otra parte, el constructor de ventanas 206, si bien no se indica de forma específica en la Fig. 2, proporciona la información de la ventana 112 de la Fig. 1a a la interfaz de salida 114, que a continuación puede ser recuperada a partir de la señal codificada por el analizador 202 que opera en el lado del decodificador, es decir, para el caso B.
[0039] Según se sabe en la técnica del tratamiento de MDCT, por lo general, el tratamiento mediante el uso de una transformada de introducción de distorsión de muestreo, esta transformada de introducción de distorsión de muestreo se puede separar en una etapa de plegado y una etapa de transformada posterior mediante el uso de una transformada de introducción de ausencia distorsión de muestreo. En un ejemplo, las secciones se pliegan en otras secciones y el resultado de la operación de plegado se transforma a continuación al dominio espectral, usando una transformada tal como una transformada DCT. En el caso de una MDCT, se aplica una transformada DCT IV.
[0040] A continuación se ilustra este aspecto con referencia a la MDCT, si bien otras transformadas de superposición de introducción pueden tratarse de una manera similar y análoga. Como una transformada superpuesta, la MDCT es un poco inusual en comparación con otras transformadas de tipo Fourier ya que tiene la mitad de salidas que de entradas (y no la misma cantidad). En concreto, se trata de una función lineal
R —> R ' (en la que R denota el conjunto de números reales). Los 2N números reales x0,..., X2N-1 se transforman en los N números reales X0,..., XN-1 según la fórmula:
Figure imgf000007_0001
[0041] (El coeficiente de normalización frente a esta transformada, en este caso la unidad, es una convención arbitraria y difiere según los tratamientos. En lo sucesivo solo se ve limitado el producto de las normalizaciones de MDCT e IMDCT).
[0042] La MDCT inversa se conoce como IMDCT. Como existe un número diferente de entradas y salidas, a primera vista podría parecer que la MDCT no podría invertirse. Sin embargo, la invertibilidad perfecta se logra sumando las IMDCT de bloques de superposición adyacentes en el tiempo, lo que provoca que los errores se cancelen y los datos originales sean recuperados; esta técnica se conoce como cancelación de distorsión de muestreo en el dominio del tiempo (TDAC).
[0043] La IMDCT transforma N números reales X0,..., XN-1 en 2N números reales y0,..., y2n-1 según la fórmula:
Figure imgf000008_0001
(Al igual que para la DCT-IV, una transformada ortogonal, la inversa tiene la misma forma que la transformada directa).
[0044] En el caso de una MDCT ventanizada con la ventana de normalización habitual (véase más adelante), el coeficiente de normalización frente a la IMDCT se debe multiplicar por 2 (es decir, para convertirse en 2/N).
[0045] En aplicaciones típicas de compresión de señales, las propiedades de transformada se han mejorado aún más usando una función de ventana wn (n = 0,..., 2N-1) que se multiplica por xn e yn en las fórmulas MDCT y IMDCT, anteriores, con el fin de evitar discontinuidades en los límites n = 0 y 2N haciendo que la función en estos puntos vaya suavemente a cero. (Es decir, se ventanizan los datos antes de la MDCT y después de la IMDCT). En principio, x e y podrían tener diferentes funciones de ventana, y la función de ventana también podría cambiar de un bloque a otro (sobre todo para el caso en que se combinan bloques de datos de diferentes tamaños), pero por sencillez se considera el caso común de funciones de ventana idénticas para bloques de igual tamaño.
[0046] La transformada sigue pudiendo invertirse (es decir, TDAC funciona), para una ventana simétrica wn = w2N-1-n, siempre y cuando w cumpla la condición de Princen-Bradley:
Figure imgf000008_0002
se usan diversas funciones de ventana. Una ventana que produce una forma conocida como transformada de superposición modulada viene dada por
Figure imgf000008_0003
y se usa para MP3 y MPEG-2 AAC, y
Figure imgf000008_0004
para Vorbis. AC-3 usa una ventana derivada de Kaiser-Bessel (KBD), y MPEG-4 AAC también puede usar una ventana KBD.
[0047] Se debe tener en cuenta que las ventanas aplicadas a la MDCT son diferentes de las ventanas que se usan para algunos otros tipos de análisis de la señal, ya que deben cumplir con la condición de Princen-Bradley. Una de las razones para esta diferencia es que las ventanas MDCT se aplican dos veces, tanto para la MDCT (análisis) como para la IMDCT (síntesis).
[0048] Como puede verse inspeccionando las definiciones, para un número N par MDCT es esencialmente equivalente a una DCT-IV, en la que la entrada está desplazada N/2 y dos bloques de datos N se transforman a la vez. Si se analiza esta equivalencia con más detenimiento se pueden deducir con facilidad propiedades importantes como TDAC.
[0049] Para definir la relación precisa con la DCT-IV, se debe tener en cuenta que la DCT-IV corresponde a las condiciones de límite de alternancia par/impar: par en su límite izquierdo (alrededor de n = -1/2), impar en su límite derecho (alrededor de n = N-1/2), y así sucesivamente (en lugar de límites periódicos como en una DFT). Así, de las identidades se desprende que:
Figure imgf000009_0001
[0050] Por lo tanto, si sus entradas son un conjunto x de longitud N, puede imaginarse que esta matriz se extiende a (x, -XR, -x, xR,...) y así sucesivamente, en la que xR denota x en orden inverso.
[0051] Considérese una MDCT con 2N entradas y N salidas, en la que las entradas se dividen en cuatro bloques (a, b, c, d) cada uno de tamaño N/2. Si se desplazan estos bloques a la derecha N/2 (desde el término N/2 en la definición de MDCT), entonces (b, c, d) se extienden más allá del final de las entradas N DCT-IV, por lo que hay que "plegarlos" de nuevo según las condiciones de contorno descritas con anterioridad.
[0052] Por lo tanto, la MDCT de 2N entradas (a, b, c, d) es exactamente equivalente a una DCT-IV de N entradas: (-cR-d, a-bR), en la que denota inversión como anteriormente.
[0053] (De esta manera, cualquier algoritmo para calcular la DCT-IV se puede aplicar de manera trivial a la MDCT). Análogamente, la fórmula de IMDCT anterior es precisamente la mitad de la DCT-IV (que es su propia inversa), en la que la salida se extiende (a través de las condiciones de contorno) a una longitud 2N y se desplaza de nuevo a la izquierda N/2. La DCT-IV inversa simplemente devolvería las entradas (-cR-d, a-bR) a los valores anteriores. Cuando esto se extiende a través de las condiciones de contorno y se desplaza, se obtiene:
IMDCT(MDCT{a. b, c, d)) = (a-bR, b-aR, c+dR, d+cR) i 2
[0054] Por lo tanto, la mitad de las salidas IMDCT son redundantes, por ejemplo b-aR = -(a-bR)R, y lo mismo sucede para los dos últimos términos. Si se agrupa la entrada en bloques más grandes A,B de tamaño N, en los que A = (a, b) y B = (c, d), se puede escribir este resultado de una manera más sencilla:
IMDCT(MDCT(A, B)) = (A-AR, B+BR) / 2
[0055] Ahora se puede entender cómo funciona la TDAC. Supóngase que se calcula la MDCT del bloque 2N (B,C) adyacente en el tiempo con un 50% de superposición. La IMDCT producirá a continuación, de forma análoga a lo anterior: (B-BR, C+CR) / 2. Cuando este valor se suma al resultado de IMDCT anterior en la mitad de superposición, los términos invertidos se anulan y se obtiene simplemente B, con lo que se recuperan los datos originales.
[0056] El origen del término "cancelación de distorsión de muestreo en el dominio del tiempo" ahora está claro. El uso de los datos de entrada que se extienden más allá de los límites de la lógica DCT-IV hace que los datos se analicen de la misma manera que las frecuencias más allá de la frecuencia de Nyquist que se analizan a frecuencias más bajas, con la salvedad de que esta distorsión de muestreo se produce en el dominio del tiempo y no en el dominio de la frecuencia: no es posible distinguir las contribuciones de a y de bR para la MDCT de (a, b, c, d), o, de forma equivalente, con el resultado de IMDCT (MDCT (a, b, c, d)) = (a-BR, b-AR, c dR, d CR) / 2. Las combinaciones c-dR y así sucesivamente tienen precisamente las señales correctas para que las combinaciones se cancelen cuando se suman.
[0057] Para los números N impares (que rara vez se usan en la práctica), N/2 no es un número entero por lo que la MDCT no es simplemente una permutación de cambio de una DCT-IV. En este caso, el desplazamiento adicional por medio de una muestra significa que la MDCT/IMDCT se hace equivalente a la DCT-III/II, y el análisis es análogo al anterior.
[0058] Se ha visto antes que la MDCT de 2N entradas (a, b, c, d) es equivalente a una DCT-IV de N entradas (-cR-d, a-BR). La DCT-IV está diseñada para el caso en que la función en el límite derecho es impar, y por lo tanto los valores cerca del límite derecho están cerca de 0. Si la señal de entrada es suave, sucede que los componentes más a la derecha de a y bR son consecutivos en la secuencia de entrada (a, b, c, d), y por lo tanto su diferencia es pequeña. Obsérvese la mitad del intervalo: si se reescribe la expresión anterior como (-cR-d, a-bR) = (-d, a) -(b, c) R, el segundo término, (b, c) R, produce una transición suave en el medio. Sin embargo, en el primer término, (-d, a), existe una posible discontinuidad en el extremo derecho de -d que se une con el extremo izquierdo de a. Esta es la razón por la que se usa una función de ventana que reduce los componentes cerca de los límites de la secuencia de entrada (a, b, c, d) hacia 0.
[0059] Con anterioridad, la propiedad de TDAC se probó para la MDCT normal, y demostró que la suma de IMDCT de bloques de tiempo adyacentes en su mitad de superposición recupera los datos originales. La deducción de esta propiedad inversa para la MDCT ventanizada es solo un poco más complicada.
[0060] Considérense dos conjuntos de superposición consecutivos de 2N entradas (A, B) y (B, C), para los bloques A, B, C de tamaño N. A partir de lo expuesto anteriormente recuérdese que cuando (A , B ) y (B, C ) se pasan por MDCT, IMDCT, y se suman en su mitad de superposición, se obtiene (B B r ) / 2 + (B — B r ) / 2 = B , los datos originales. Supóngase a continuación que se multiplican tanto las entradas de MDCT como las salidas de IMDCT por una función de ventana de longitud 2N. Al igual que antes, se supone una función de ventana simétrica, que tiene por lo tanto la forma (W ,W R) en la que W es un vector de longitud N y R denota una inversión como antes. Entonces la condición de Princen-Bradley se puede escribir como
W WR = (1 ,1,...) , con los cuadrados y las sumas realizados elemento por elemento.
[0061] Por lo tanto, en lugar de usar MDCT (A,B), ahora se usa MDCT (WA,WrB) con todas las multiplicaciones realizadas elemento por elemento. Cuando se usa IMDCT y se multiplica de nuevo (elemento por elemento) por la función de la ventana, la última mitad de N se convierte en:
Wfí (W„B+{WpB)r)^Wr:(WrB+WBr)=wr b + w w rb r
(Obsérvese que ya no existe multiplicación por 1/2, porque la normalización de IMDCT difiere en un factor de 2 en el caso de ventanización).
[0062] Del mismo modo, la MDCT y la IMDCT (B,C) ventanizadas producen en su primera mitad de N:
W -(W B — WrBr ) = W 2 B — WWrB r
[0063] Cuando se añaden estas dos mitades, se recuperan los datos originales.
[0064] La exposición de MDCT anterior describe ventanas de análisis/síntesis idénticas. Para las ventanas asimétricas, las ventanas de análisis/síntesis son diferentes, pero preferentemente simétricas entre sí; en ese caso, la condición de Princen-Bradley cambia a la ecuación más general:
Figure imgf000010_0001
[0065] La Fig. 1b ilustra una implementación de decodificador que tiene una entrada 150 para una señal codificada, una interfaz de entrada 152 que proporciona una señal de audio 154 que por un lado está en forma codificada y por otro lado proporciona información conexa al analizador 202. El analizador 202 extrae la información de la ventana 160 de la señal codificada 150 y proporciona esta información de la ventana al constructor de ventanas 206. Por otra parte, la señal de audio codificada 154 es introducida en un decodificador o un procesador de decodificación 156, que corresponde al procesador decodificador 214 en la Fig. 2 y el constructor de ventanas 206 proporciona las ventanas al convertidor controlable 158 que está configurado para llevar a cabo una IMDCT o una IMDST o cualquier otra transformada inversa a la transformada directa de introducción de distorsión de muestreo.
[0066] La Fig. 1c ilustra una implementación preferida en el lado del decodificador del convertidor controlable 158. En particular, el convertidor controlable 158 comprende un convertidor de frecuencia-tiempo 170, un divisor de ventanas de síntesis conectado posteriormente 172 y un elemento de suma y superposición final 174. De forma específica, el convertidor de frecuencia-tiempo lleva a cabo la transformada tal como una transformada DCT-IV y una operación de plegado posterior para que la salida del convertidor de frecuencia-tiempo 170 tenga, para una primera ventana o ventana larga, 2N muestras mientras que la entrada en el convertidor de frecuencia-tiempo era, a modo de ejemplo, de N valores espectrales. Por otro lado, cuando la entrada en el convertidor de frecuencia-tiempo es de N/8 valores espectrales, entonces la salida es de N/4 valores de dominio del tiempo para una operación de MDCT, a modo de ejemplo.
[0067] A continuación, la salida del convertidor de frecuencia-tiempo 170 se introduce en un divisor de ventanas de síntesis que aplica la ventana de síntesis que preferentemente es simétrica a la ventana del lado del codificador. Por lo tanto, cada muestra, antes de llevar a cabo una superposición y suma, se ventaniza con dos ventanas de manera que la "ventanización total" resultante es el producto de los coeficientes de ventana de análisis y los coeficientes de ventana de síntesis de manera que se ha cumplido la condición de Princen-Bradley según se expuso anteriormente.
[0068] Finalmente, el elemento de suma y superposición 174 lleva a cabo la superposición y suma correctas correspondientes con el fin de obtener finalmente la señal de audio decodificada en la salida 175.
[0069] La Fig. 1d ilustra una realización adicional de la presente invención implementada con un dispositivo móvil, en la que el dispositivo móvil comprende, por un lado, un codificador 195 y por otro lado un decodificador 196. Por otra parte, según una realización preferida de la presente invención, tanto el codificador 105 como el decodificador 106 recuperan la misma información de ventana de solo una memoria individual 197, ya que las ventanas usadas en el codificador 195 y las ventanas usadas en el decodificador 196 son simétricas entre sí. Por lo tanto, el decodificador tiene una memoria de solo lectura 197 o una memoria de acceso aleatorio o en general cualquier memoria 197 en la que un solo conjunto de secuencias de la ventana o ventanas se almacena para el uso tanto en el codificador como en el decodificador. Esto resulta ventajoso debido al hecho de que los diferentes coeficientes de ventana para las diferentes ventanas no tienen que ser almacenados dos veces, con un conjunto para el codificador y un conjunto para el decodificador. En lugar de ello, dado que, según la presente invención, se usan ventanas y secuencias de ventana idénticas en el codificador y el decodificador, solo tiene que almacenarse un único conjunto de coeficientes de ventana. Por lo tanto, el uso de la memoria del dispositivo móvil de la invención que se ilustra en la Fig. 1d se reduce sustancialmente con respecto a un concepto diferente en el que el codificador y el decodificador tienen distintas ventanas o en el que se lleva a cabo un cierto postratamiento con el tratamiento distinto de las operaciones de ventanización.
[0070] A continuación se expone una ventana preferida con respecto a la Fig. 8a. Tiene una primera parte de superposición 800, una segunda parte de superposición 802, una parte adicional 804 con valores altos y una parte adicional 806 con valores bajos. Los valores altos de la parte 804 son valores de 1,0 o al menos mayores que 0,95, y los valores bajos en la parte baja 806 son iguales a 0,0 y preferentemente son inferiores a 0,1. En la realización, la longitud de la ventana de análisis asimétrica es de 40 ms y esto se traduce en un tamaño del bloque de 20 ms debido al hecho de que se usa preferentemente un 50% de superposición y suma. Sin embargo, también se pueden usar otras proporciones de superposición, etc.
[0071] En esta implementación específica, la primera parte de superposición 800 es mayor que la segunda parte de superposición 802 lo que permite una implementación de bajo retardo y, de forma adicional, en el contexto del hecho de que la parte baja 806 precede a la segunda parte de superposición, la ventana de análisis asimétrica ilustrada en la Fig. 8a permite una filtración de retardo bajo debido a la parte de cero y la segunda parte de superposición corta 802 y, además, tiene una muy buena separación debido a la primera parte de superposición larga 800. Esta superposición larga, sin embargo, no provoca ningún retardo adicional debido al hecho de que la parte de superposición es larga en la primera mitad de la ventana de análisis asimétrica. En la realización específica, la primera parte de superposición 800 es igual a 14,375 ms, la segunda parte que no se superpone o la parte alta es igual a 11,25 ms, la tercera parte o la segunda parte de superposición 802 es igual a 8,75 ms y la cuarta parte final o parte baja es igual a 5,625 ms.
[0072] La Fig. 8b ilustra una ventana de síntesis asimétrica correspondiente que tiene ahora, como primera parte 810, la parte baja o cero, que tiene a continuación la primera parte de superposición 812, la segunda parte de superposición 814 y la parte constante o alta 816 se indica entre la primera parte de superposición 812 y la segunda parte de superposición 814.
[0073] La longitud de ejemplo de las partes correspondientes está indicada aunque por lo general se prefiere que la primera parte de superposición 812 sea más corta que la segunda parte de superposición 814 y se prefiere además que la longitud de la parte constante o alta 816 esté entre la longitud de la primera parte de superposición y la segunda parte de superposición y se prefiere además que la longitud de la primera parte 810 o la parte cero sea menor que la longitud de la primera parte de superposición 812.
[0074] Como se ilustra en la Fig. 8a, se prefiere que la longitud de la primera parte de superposición 800 sea mayor que la longitud de la segunda parte de superposición 802, y la longitud de la parte alta 804 está entre la longitud de la segunda parte de superposición 802 y la primera parte de superposición 800 y la longitud de la cuarta parte 806 es menor que la longitud de la segunda parte de superposición 802.
[0075] La Fig. 8a y la Fig. 8b ilustran además la superposición con una ventana de análisis asimétrica anterior 807 y con una ventana de análisis posterior 808 para el caso en que se usan solo los bloques largos y cualquier conmutación no está indicada por la señal de control de la ventana 204 de la Fig. 2.
[0076] De forma análoga, la Fig. 8b ilustra la síntesis de una secuencia correspondiente con una ventana de síntesis anterior 819 y una ventana de síntesis posterior 820.
[0077] Por otra parte, la Fig. 8c ilustra la misma ventana de análisis de la Fig. 8a, pero ahora con partes plegadas 821, 822, que se pliegan en la operación de plegado en el lado del codificador o que están "desplegadas" en el desplegable en el lado del decodificador. Puede considerarse que estos plegados 821, 822 tienen lugar a lo largo de líneas de plegado 823 y 824 y estas líneas también se ilustran en la Fig. 8a, 8b y parece que las líneas de plegado no coinciden directamente con los puntos de intersección de las ventanas en la Fig. 8a y 8b. Esto se debe a la característica asimétrica de la ventana de análisis en la Fig. 8a o a la ventana de síntesis en la Fig. 8b.
[0078] La Fig. 9a ilustra una ventana de análisis/síntesis simétrica con una superposición de 3,75 ms para una longitud de bloque de 10 ms. La ventana de análisis simétrica comprende una primera parte baja o cero 900, una primera parte de superposición 902, una segunda parte de superposición 904, una parte alta o constante 906 y una parte adicional baja o cero 908. Por otra parte, la Fig. 9a ilustra las líneas de plegado 910, 911, en las que se lleva a cabo la operación de plegado requerida por la distorsión de muestreo que introduce una transformada tal como la MDCT o MDST. En particular, se lleva a cabo una operación de plegado en el tratamiento del lado del codificador y se lleva a cabo un tratamiento de desplegado en el tratamiento de audio del lado del decodificador. Por lo tanto, las líneas 912, 913 ilustran las partes plegables, que tienen la parte decreciente y una parte posterior cero correspondiente a las partes 900 con respecto al lado izquierdo y 908 con respecto al lado derecho. Por lo tanto, el marcador 915 ilustra el límite entre la parte plegable de la izquierda 912 y la parte plegable de la derecha 913.
[0079] En este contexto, se destaca que la Fig. 9a ilustra una ventana de análisis o síntesis verdaderamente simétrica, ya que la parte de superposición de la izquierda y la parte de superposición de la derecha son simétricas entre sí, es decir, tienen la misma longitud de superposición, en esta realización, 3,75 ms. Por lo general, se prefiere tener las partes cero 900, 908 más pequeñas que las partes de superposición 902, 904 y, en consecuencia, la parte alta 906 tiene dos veces la longitud de una sola parte cero, cuando las dos partes cero 900, 908 tienen la misma longitud.
[0080] La Fig. 9b ilustra una ventana con una superposición simétrica que, sin embargo, es diferente en el lado izquierdo y en el lado derecho. En particular, esta ventana tiene, en analogía con la Fig. 9a, una parte cero 920, una primera parte de superposición 922, una parte constante o alta 924, una segunda parte de superposición 926 y una segunda parte cero o baja 928. Una vez más, las líneas de plegado 910 y 911 están indicadas y, de nuevo, el marcador 915 indica el límite entre el pliegue en la parte izquierda 929 y el pliegue en la parte derecha 930. Según se ilustra, la parte de superposición de la izquierda 922 es para una superposición corta tal como 1,25 ms y la parte de superposición de la derecha 926 es para una superposición más larga tal como 3,75 ms. Por lo tanto, esta ventana es una ventana de transición de ventanización de una ventana de superposición corta a una ventana de superposición más larga, pero estas dos ventanas son ventanas con superposiciones simétricas.
[0081] La Fig. 9c ilustra una ventana adicional, pero con un tamaño del bloque de 5 ms correspondiente a una duración de tiempo de 10 ms, según se indica. Esta ventana es análoga a la Fig. 9b pero con longitudes de tiempo sustancialmente diferentes y, por lo tanto, la ventana en la Fig. 9c tiene una duración más corta pero una vez más tiene una secuencia de una parte cero, una parte de superposición de la izquierda con una superposición corta, una parte alta, una segunda parte de superposición posterior y una parte cero final. Por otra parte, las líneas de plegado y las partes plegables, etc., se indican de nuevo en la Fig. 9c.
[0082] Por lo general, la mayoría de las ventanas de las figuras de la Fig. 8a a 15b tienen líneas de plegado indicadas como 910 y 911 de la Fig. 9a y, además, tienen las partes de ventana exteriores plegables como 912 y 913 en la Fig. 9a.
[0083] Por otra parte, se destaca que la longitud de la transformación correspondiente corresponde a la distancia entre los puntos de plegado. Por ejemplo, cuando se considera la Fig. 9a, se hace evidente que la longitud de la transformada corresponde a 10 ms que tiene la diferencia entre 15 ms y 5 ms. Por lo tanto, la longitud de la transformación corresponde a la notación de un "bloque" en la Fig. 9a y las otras figuras. Sin embargo, por otro lado, la parte de tiempo realmente ventanizada es dos veces la longitud de bloque o transformada tal como 20 ms en la realización de la Fig. 9a.
[0084] En correspondencia, la ventana en la Fig. 9c tiene una longitud de transformada de 5 ms que corresponde a una longitud de la parte de tiempo de la ventana de 10 ms, según se ilustra en la Fig. 9c.
[0085] En el caso asimétrico que se ilustra en la Fig. 8a, la longitud de la transformada o el tamaño del bloque es de nuevo la distancia entre las líneas de plegado tales como 823 y 824 y es, por lo tanto, 20 ms y la longitud de la parte de tiempo de la ventana es de 40 ms.
[0086] Para una reconstrucción perfecta es necesario mantener la línea de plegado o el punto de plegado cuando se trunca la parte de superposición larga o el borde de ventana de la ventana asimétrica, tal como 800 o 814 (para el lado de síntesis).
[0087] Por otra parte, según se describe de forma específica con respecto a la Fig. 4, la presente realización usa seis velocidades de muestreo diferentes y la longitud de los bordes de ventana o flancos de ventana se selecciona de manera que la longitud corresponda a un número entero de valores de muestreo para cada una de las velocidades de muestreo.
[0088] Por otra parte, se destaca que para las transformadas de 10 ms se usan superposiciones de 3,75 ms o superposiciones de 1,25 ms. Por lo tanto, son posibles y útiles más combinaciones incluso que las ilustradas en las figuras de la ventana de la Fig. 8a a la Fig. 15b y pueden ser señaladas por la señal de control de la ventana con el fin de asegurarse de que se selecciona una secuencia de ventana óptima para una cierta señal de audio que tiene partes transitorias en partes específicas.
[0089] La Fig. 10a ilustra esta ventana de transición o segunda ventana después de una primera ventana más larga. En la Fig. 10a, el lado izquierdo se ha truncado a una longitud de 8,75 ms de la longitud original del borde largo de la ventana de análisis asimétrica 800 que era de 14,375 ms. Por lo tanto, la Fig. 10a ilustra una primera parte de superposición 1000 obtenida por medio de un truncamiento de la primera parte de superposición 800 de la primera ventana asimétrica. Por otra parte, la Fig. 10a con la ventana de transición de análisis comprende de forma adicional una parte de superposición de la derecha 1,25 ms, es decir, una parte de superposición corta 1002. La ventana tiene un tamaño del bloque de 5 ms que corresponde a una longitud de ventana de 10 ms. Las líneas de plegado se indican en 4,375 ms, es decir, 1004 y 9,375 ms ilustrada en 1006. Por otra parte, se ilustran las partes de plegado 1008 de la línea de plegado de la izquierda 1004 y 1010 para la línea de plegado de la derecha 1006.
[0090] La Fig. 10b ilustra una implementación de una realización preferida en la que se usa una aparición gradual. Por lo tanto, la primera parte de superposición tiene una primera parte diferente 1012 y una segunda parte no modificada 1014 que corresponde a la primera parte de superposición 1000 de la Fig. 10a. La ventana no es diferente con respecto a la Fig. 10a. Preferentemente, con el fin de calcular la primera parte de la primera parte de superposición que se indica en 1012 en la Fig. 10b se usa una parte de superposición sinusoidal de 1,25 ms, es decir, por ejemplo, la parte que se indica en 922 en la Fig. 9b. De este modo, se obtiene una muy buena característica de aparición gradual en la que la primera parte de superposición 922 para la ventana corta está, en cierto sentido, "reciclada". Por lo tanto, esta parte de ventana no solo se usa para la ventanización como en el caso de la Fig. 9b sino, de forma adicional, para un cálculo real de la ventana de transición de análisis con el fin de reducir los artefactos introducidos por el truncamiento. Si bien la propiedad de reconstrucción perfecta solo se obtiene cuando se usa la primera parte de superposición realmente truncada 1000 de la Fig. 10a, se ha encontrado que la calidad de audio, sin embargo, se puede aumentar mediante el uso de la ventana de transición en la Fig. 10b que tiene la parte de aparición gradual. Esta parte de aparición gradual, aunque viola la propiedad de reconstrucción perfecta, da lugar sin embargo a una mejor calidad de audio en comparación con la realización de la Fig. 10a debido al hecho de que la discontinuidad en el lado izquierdo de la parte de superposición de la izquierda 1000 en la Fig. 10a se elimina. Sin embargo, se pueden usar otras características de aparición gradual o desvanecimiento (con respecto al lado de síntesis) diferentes a partir de una función seno si está disponible y es útil.
[0091] La Fig. 10c ilustra una representación de la ventana de la Fig. 10a pero ahora en una situación de superposición que indica la parte de superposición de la derecha 1020 de la ventana anterior y la parte de superposición de la izquierda de la ventana posterior en 1022. Normalmente, la parte de superposición de la derecha 1020 es la parte de la derecha 802 de la ventana de análisis asimétrica de la Fig. 8a y 1022 de la ventana siguiente o posterior es la primera parte de superposición de una ventana o es la parte de superposición de la izquierda de una ventana de transición adicional, como podría suceder.
[0092] La Fig. 10d ilustra una situación similar a la Fig. 10b pero de nuevo con la segunda parte de superposición 1020 de la ventana anterior y la primera parte de superposición 1022 de la siguiente ventana indicada.
[0093] La Fig. 11a ilustra una ventana de transición de análisis adicional, pero, a diferencia de la Fig. 10a, en la que se indica una transición desde un bloque de 20 ms a un bloque de 5 ms, para una transición desde un bloque de 20 ms a un bloque de 10 ms. Por lo general, el bloque de 20 ms se puede considerar un bloque largo, el bloque de 5 ms se puede considerar un bloque corto y el bloque de 10 ms se puede considerar un bloque intermedio. La primera parte de superposición 1100 se ha truncado pero solo una cantidad corta y el truncamiento está indicado por 1150. Sin embargo, con el fin de mejorar aún más la calidad de audio y se ha aplicado ya la aparición gradual obtenida multiplicando por un borde sinusoidal de 1,25 ms y la aparición gradual está indicada por la línea continua. Por otra parte, la ventana tiene una parte alta 1101 y una segunda parte de superposición 1102, que es, en este caso, una parte larga de superposición con 3,75 ms. Por lo tanto, la Fig. 11a ilustra una ventana de transición de análisis óptima correspondiente a la "segunda ventana" de la Fig. 2 de una longitud de transformada de 20 ms a una longitud de transformada de 10 ms en la que la parte de superposición de la izquierda 1100 se obtiene por medio de un truncamiento tan pequeño como sea posible del borde largo 800 de la ventana asimétrica y en la que, además, se lleva a cabo una aparición gradual multiplicando el borde truncado 1050 por el borde sinusoidal de 1,25 ms. Según se indica, la superposición de la derecha es 3,75 ms.
[0094] La Fig. 11b ilustra una ventana de transición de análisis alternativa para una transición de una longitud de transformada de 20 ms a una longitud de transformada de 10 ms, es decir, por lo general de una longitud de transformada larga a la longitud de transformada corta. La superposición de la izquierda, sin embargo, es solo de 8.75 ms al truncar el borde izquierdo de la ventana asimétrica y, además, al aplicar una aparición gradual por medio de la multiplicación usando el borde sinusoidal de 1,25 ms. Por lo tanto, la superposición o la parte de superposición de la izquierda 1130 tiene ahora 8,75 ms como en el caso de la Fig. 10a. Con el fin de aplicar esta ventana, se llevan a cabo modificaciones adicionales. Estas modificaciones son la primera parte baja o nula 1131, la segunda parte alta o constante 1132 y la tercera parte o baja 1133 y la segunda parte de superposición 1134 es similar a la parte correspondiente 1102 en la Fig. 11a pero desplazada a la izquierda debido a la cuarta parte cero o baja 1133. Por otra parte, se indican las líneas de plegado 1104, 1106 y las partes plegadas en las que el marcador 1135 indica el límite entre la parte plegada de la izquierda 1136 y la parte plegada de la derecha 1137. Las longitudes de las partes 1131, 1132, 1133 están determinadas por el hecho de que el truncamiento se lleva a cabo más allá que el mínimo posible como en la Fig. 11a. A modo de ejemplo, la parte 1131 se podría establecer en cero y la longitud de 1132 y 1133 se podría aumentar de forma correspondiente. Por otro lado, la longitud de 1133 se podría establecer en cero y, por lo tanto, la longitud de 1131 se podría aumentar de forma correspondiente o todas las partes 1131, 1132, 1133 son diferentes de cero, pero las longitudes correspondientes son diferentes de la realización de la Fig. 11b. En todas estas diferentes implementaciones de ventana, se debe asegurar que el plegado a través de las líneas de plegado 1104, 1106 sea posible de forma correspondiente y b tiene la ventaja con respecto a la Fig. 11a deque el cálculo de la primera parte de superposición 1130 es similar al cálculo de la parte de la izquierda 1014, 1012 de la Fig. 10b y facilita la aplicación práctica. Sin embargo, cuando estas cuestiones no son tan llamativas se podría usar la ventana de la Fig. 11a ya que la superposición más larga de la primera parte de superposición lleva a cabo una mejor característica de reconstrucción y está aún más cerca de la ley de propiedad de reconstrucción perfecta.
[0095] Las Fig. 12a y 12b ilustran ventanas de transición de análisis adicionales de longitudes de ventana más cortas a longitudes de ventana más largas. En la Fig. 12a se ilustra una de estas ventanas de transición de análisis para una transición de 5 ms a 20 ms. La parte de superposición de la izquierda 1200 es para una superposición corta de, por ejemplo, 1,25 ms y la parte de superposición de la derecha es para una superposición larga tal como 8.75 ms y se ilustra en 1202. La Fig. 12b ilustra una ventana de transición de análisis adicional de un bloque de 10 ms a un bloque de 20 ms. La parte de superposición de la izquierda se indica en 1210 y la parte de superposición de la derecha se indica en 1212. La parte de superposición de la izquierda es para la superposición media de 3,75 ms y la parte de superposición de la derecha es para una superposición larga o alta de 8,75 ms. Una vez más, se ilustran las líneas de plegado y las partes plegadas. La Fig. 12b deja claro que la ventana de transición de análisis de 10 a 20 ms tiene, además de las partes de superposición 1210, 1212, una parte baja o cero de la izquierda 1214, una parte alta o constante del medio 1216 y una parte baja o cero de la derecha 1218.
[0096] La parte de superposición de la derecha 1202 de la Fig. 12a y la parte de superposición de la derecha 1212 en la Fig. 12b corresponden al borde corto de la ventana de análisis asimétrica indicada en 802 en la Fig. 8a.
[0097] Las Fig. 13a, 13b, 13c y 13d ilustran una situación en el lado de síntesis, es decir, ilustran la construcción de una tercera ventana en los términos de la Fig. 2 o el Caso B. Por otra parte, la situación en la Fig. 13a es análoga a la situación en la Fig. 12a. La situación en la Fig. 13b es análoga a la situación en la Fig. 12b. La situación en la Fig. 13c es análoga a la Fig. 10b y la situación en la Fig. 13d es análoga a la Fig. 10c.
[0098] En particular, la Fig. 13a ilustra una ventana de transición de síntesis a partir de un bloque de tiempo para un bloque corto que tiene una parte de superposición larga de la izquierda 1300 y una parte de superposición de la derecha 1302 y líneas de plegado y partes de plegado correspondientes según se indica.
[0099] La Fig. 13b ilustra una ventana de transición de síntesis a partir de un bloque de 20 ms a un bloque de 10 ms, en el que la superposición de la izquierda es una vez más una superposición larga indicada en 1310 y la superposición de la derecha es 1312 y, de forma adicional, se proporciona una primera parte baja 1314, una segunda parte alta 1316 y una tercera parte baja 1318 según lo necesario.
[00100] La Fig. 13c ilustra una tercera ventana de síntesis según se ilustra en el contexto de la Fig. 2, Caso B, en el que se indica la segunda parte de superposición 1330. Se ha truncado para una longitud de 8,75, es decir, a la longitud de la parte de superposición de la derecha o segunda de la ventana de síntesis asimétrica de la Fig. 8b, es decir, la parte de superposición de la derecha 814 se ha truncado para obtener la parte de superposición de la derecha 1330 de la ventana de transición de síntesis y, en la situación de la Fig. 13c, se ha llevado a cabo un desvanecimiento adicional básicamente similar a lo que se ha expuesto en el lado de análisis con respecto a la Fig. 10b. Esto ilustra la situación de la segunda parte de superposición 1330 de la tercera ventana en los términos de la Fig. 2, Caso B, pero solo con el truncamiento en lugar de cualquier desvanecimiento. Por lo tanto, la primera parte 1331 en la Fig. 13c es similar a la primera parte correspondiente de la Fig. 13d pero la segunda parte 1332 es diferente debido a la multiplicación del desvanecimiento de un borde sinusoidal de 1,25 ms descendente por la ventana truncada de la Fig. 13d.
[00101] Por otra parte, la Fig. 13d ilustra la primera parte de superposición 1340 de la siguiente ventana de síntesis correspondiente a la "cuarta ventana" en el contexto de la Fig. 2 y, además, la Fig. 13d ilustra la segunda parte de superposición 1342 de la ventana anterior, es decir, la ventana anterior a la tercera ventana que consiste en la segunda parte de superposición 1330 y una primera parte de superposición 1331 correspondiente a una superposición corta de 1,25 ms por ejemplo.
[00102] Si bien no se ilustra, es útil una ventana de síntesis correspondiente a la situación en las Fig. 11a, 11b, es decir, una ventana de síntesis que tiene un truncamiento mínimo con o sin aparición gradual en analogía con la Fig. 11a o una ventana de síntesis que tiene el mismo tipo de truncamiento que en la Fig. 13d pero ahora con las partes primera y segunda bajas o cero y una parte constante intermedia.
[00103] La Fig. 14a ilustra una secuencia de ventana de análisis con ventanas con tamaños de bloque largo, largo, corto, corto, intermedio, largo y las correspondientes secuencias de ventana de síntesis ilustradas en la Fig. 14b. La segunda ventana en los términos de la Fig. 2 se indica en 1402 y esta ventana corresponde a la ventana que se ilustra en la Fig. 10b. De forma correspondiente, la ventana de síntesis equivalente correspondiente a la tercera función de ventana 1450 de la Fig. 14b en los términos de la Fig. 2 es la función de síntesis que no se ilustra en la figura específica sino en la función de análisis de la Fig. 11b.
[00104] Por otra parte, en la Fig. 15a, 1502 se ilustra de forma específica en la Fig. 11b y la tercera función de ventana 1550 de la Fig. 15b corresponde a la función de ventana de síntesis de la Fig. 13c.
[00105] Por lo tanto, la Fig. 14a ilustra una transición de una primera ventana asimétrica muy larga con 20 ms indicada en 1406 a la primera función de ventana asimétrica 1400 en la que, de forma específica, también se ilustra la parte cero 806 de la Fig. 8a. En la Fig. 14a sigue entonces la ventana asimétrica larga 1400 y, posteriormente, se ilustra la segunda función de ventana con la primera parte de superposición truncada 1402. La siguiente ventana 1408 es similar a la ventana en la Fig. 9b y la ventana siguiente 1410 corresponde a la ventana de la Fig. 9c y, por último, la ventana 1412 es una vez más la ventana de análisis asimétrica de la Fig. 8a.
[00106] La Fig. 14b ilustra una ventana de síntesis larga 1454 correspondiente a la Fig. 8b y una ventana de síntesis asimétrica 1456 adicional que corresponde nuevamente a la Fig. 8b y a continuación se ilustra una ventana de transición corta 1458, que corresponde a la Fig. 13a. La siguiente ventana 1460 también es una ventana corta que tiene un tamaño del bloque de 5 ms que corresponde a la Fig. 9c.
[00107] Las Fig. 15a y 15b ilustran una secuencia de ventana similar, pero con una transición desde una ventana larga a una ventana intermedia que tiene una longitud de 10 ms y la transición opuesta correspondiente. Las ventanas 1504 y 1500 corresponden a la Fig. 8a. Le sigue la ventana truncada y de aparición gradual 1502 de la invención, que es seguida por la ventana 1506, 1508 y 1510 en el orden ilustrado. La ventana 1506 corresponde a la ventana en la Fig. 9b pero con el tiempo de superposición del lado izquierdo y la superposición corta del lado derecho. La ventana 1508 corresponde a la ventana de la Fig. 12a y la ventana 1510 es una vez más la ventana asimétrica larga.
[00108] En cuanto a la secuencia de ventana de síntesis en la Fig. 15b, hay ventanas 1554, 1556, 1558 y 1560. La ventana 1554 corresponde a la ventana de síntesis de la Fig. 8b y sucede lo mismo para la ventana 1556. La ventana 1558 es una transición de 20 a 10 y corresponde a la Fig. 13b. La ventana 1560 es una transición de 10 a 5 y corresponde a la Fig. 9b pero, una vez más, con la superposición larga del lado izquierdo superpuesto al lado derecho. Le sigue la ventana truncada de desvanecimiento 1550 de la invención que es seguida de nuevo por la ventana de síntesis asimétrica larga.
[00109] A continuación se expone una implementación preferida del constructor de ventanas 206 en el contexto de la Fig. 3. En particular, el constructor de ventanas comprende preferentemente una memoria 300, un truncador de la parte de ventana 302 y un atenuador 304. Dependiendo de la información de control de ventana que se ilustra en el elemento 310 que indica una transición, por ejemplo, de la primera ventana a la segunda ventana o de la tercera ventana a la cuarta ventana, se activa el truncador de la parte de ventana 302. El truncador accede a la memoria con el fin de recuperar la parte 800 de la ventana asimétrica o para la recuperación de la segunda parte de superposición 814 de la cuarta ventana. La parte es recuperada por la línea de recuperación 308 de la memoria 300 al truncador de la parte de ventana. El truncador de la parte de ventana 302 lleva a cabo un truncamiento a una cierta longitud como la longitud máxima de truncamiento según lo expuesto o más corta que la longitud máxima. La parte de superposición o borde de ventana truncada 316 se reenvía al atenuador 304. A continuación el atenuador lleva a cabo una operación de aparición gradual o de desvanecimiento, es decir, la operación para llegar a la ventana de la Fig. 10b, por ejemplo de la ventana en la Fig. 10c que ilustra la ventana truncada sin aparición gradual. Con este fin, el atenuador accede a la memoria a través de la línea de acceso 314 de la memoria de la parte de superposición corta a través de la línea de recuperación 312. A continuación el atenuador 304 lleva a cabo la operación de aparición gradual o desvanecimiento con la parte de la ventana truncada de la línea 316, por ejemplo por medio de la multiplicación de la parte truncada con la parte de superposición. La salida es la parte truncada y con desvanecimiento en la línea de salida 318.
[00110] La Fig. 4 ilustra una implementación preferida de la memoria 300, la construcción de la ventana por medio del constructor de ventanas y las diferentes formas y posibilidades de las ventanas están optimizadas para tener un uso mínimo de memoria. Una realización preferida de la presente invención permite el uso de seis velocidades de muestreo de 48 kHz, 32 kHz, 25,6 kHz, 16 kHz, 12,8 kHz u 8 kHz. Para cada velocidad de muestreo se almacena un conjunto de coeficientes de ventana o partes de ventana. Esta es una primera parte de la ventana asimétrica de 20 ms, la segunda parte de la ventana asimétrica de 20 ms, una sola parte de la ventana simétrica de 10 ms tal como la parte de superposición de 3,75 ms y la parte individual de la ventana simétrica de 5 ms tal como la parte de superposición de 1,25 ms. Normalmente, la parte individual de la ventana simétrica de 10 ms puede ser el borde ascendente de la ventana y, a continuación, por medio de una operación aritmética o lógica sencilla tal como la duplicación, puede calcularse la parte descendente. De forma alternativa, cuando la parte descendente se almacena en la memoria 300 como la parte individual entonces la parte ascendente se puede calcular por medio de la duplicación o, por lo general, por medio de operaciones aritméticas o lógicas. Sucede lo mismo para la parte individual de la ventana simétrica de 5 ms. Naturalmente, debido al hecho de que todas las ventanas tienen longitudes de 5 o 190 ms pueden tener en cada lado ya sea la parte de superposición del medio tal como 3,75 ms o la parte de superposición corta que tiene por ejemplo, una longitud de 1,25 ms.
[00111] Por otra parte, el constructor de ventanas está configurado para determinar, por sí solo, según las correspondientes reglas predefinidas, la longitud y la posición de las partes bajas o cero y las partes altas o individuales de las ventanas específicas según se ilustra en los gráficos de las Fig. 8a a 15b.
[00112] Por lo tanto, se necesita solo una cantidad mínima de los requisitos de memoria para implementar un codificador y un decodificador. Por lo tanto, aparte del hecho de que el codificador y el decodificador se basan en una y la misma memoria 300, incluso una cantidad de residuos de diferentes ventanas y ventanas de transición, etc., solo se pueden implementar por medio del almacenamiento de cuatro conjuntos de coeficientes de ventana para cada velocidad de muestreo.
[00113] La conmutación de la ventana de transformada señalada con anterioridad fue implementada en un sistema de codificación de audio con ventanas asimétricas para transformadas largas y ventanas sinusoidales de baja superposición para transformadas cortas. La longitud del bloque es de 20 ms para los bloques largos y de 10 ms o 5 ms para los bloques cortos. La superposición de la izquierda de la ventana de análisis asimétrica tiene una longitud de 14,375 ms, la longitud de superposición de la derecha es de 8,75 ms. Las ventanas cortas usan superposiciones de 3,75 ms y 1,25 ms. Para la transición de longitud de la transformada de 20 ms a 10 ms o 5 ms en el lado del codificador de la parte de superposición de la izquierda de la ventana de análisis asimétrica se trunca a 8,75 ms y se usa para la parte de la ventana izquierda de la primera transformada corta. Una aparición gradual de forma sinusoidal de 1,25 ms se aplica por medio de la multiplicación del extremo izquierdo de la ventana truncado por la superposición de la ventana corta ascendente de 1,25 ms. La reutilización de la forma de la ventana de superposición de 1,25 ms para la aparición gradual evita la necesidad de una tabla de ROM/RAM adicional, así como también la complejidad para la computación sobre la marcha de la forma de aparición gradual. La Fig. 14a representa la secuencia de la ventana resultante para un ejemplo con la longitud de la transformada de la secuencia de 20 ms, 5 ms, 5 ms, 10 ms, 20 ms.
[00114] En el lado del decodificador para la transición de la longitud de la transformada de 10 ms o 5 ms a 20 ms la parte de superposición de la derecha de la ventana de síntesis asimétrica se trunca a 8,75 ms y se usa para la parte de la ventana de la derecha de la última transformada corta. Se aplica un desvanecimiento en forma de seno de 1,25 ms similar al desvanecimiento en el lado del codificador al extremo truncado de la ventana. La secuencia de ventana del decodificador para el ejemplo anterior se ilustra en la Fig. 14b.
[00115] La Fig. 5 ilustra el diagrama de flujo de una realización adicional para la determinación de la segunda ventana, es decir, una ventana de transición de análisis para el Caso A de la Fig. 2. En la etapa 500 se recupera la primera y la segunda parte de la ventana asimétrica. En la etapa 502 se construye la primera ventana de análisis asimétrica. Por lo tanto, se genera la ventana de análisis 1400 de la Fig. 14a o 1500 de la Fig. 15a. En la etapa 504, la primera parte de la ventana asimétrica es recuperada por una línea de recuperación, por ejemplo se ilustra en la Fig. 3 en 308. En la etapa 506, la longitud de truncamiento se determina y el truncamiento se lleva a cabo por ejemplo por medio del truncador de la parte de ventana 302 en la Fig. 3. En la etapa 508, una parte individual de la ventana simétrica de 5 ms se recupera como el elemento 401 almacenado en la memoria 300. En la etapa 510, se calcula la aparición gradual de la parte truncada, por ejemplo, por medio del funcionamiento del atenuador 304 en la Fig. 3. Ahora, se ha completado la primera parte de la superposición. En la etapa 512, se recupera la parte individual de la ventana simétrica de 5 ms, por ejemplo, para una transición desde una ventana larga a una ventana corta o se recupera la parte individual de una ventana simétrica de 10 ms para una transición de una ventana larga a una ventana intermedia. Por último, la segunda parte está determinada por medio de operaciones lógicas o aritméticas a partir de los datos recuperados en la etapa 512 como se indica en la etapa 514. Sin embargo, se debe observar que la etapa 514 no se requiere cuando la parte individual de la ventana simétrica correspondiente recuperada por la etapa 512 de la memoria 300 en la Fig. 4 ya se puede usar como la segunda parte, es decir, como el borde de ventana descendente.
[00116] Si bien no se ilustra de forma explícita en la Fig. 5, se requiere una etapa más para realizar otras transiciones tales como la transición que se ilustra en la Fig. 15a. En esta situación, la primera parte cero, la segunda parte cero y la parte alta intermedia tienen que insertarse de forma adicional por medio del constructor de ventanas, si bien esta inserción se puede hacer antes o después de la determinación de la primera y la segunda parte de superposición de la segunda ventana.
[00117] La Fig. 6 ilustra una implementación preferida del procedimiento para la construcción de una ventana de transición de síntesis correspondiente, tal como la tercera ventana. Para este fin, se puede llevar a cabo el procedimiento de las etapas de la Fig. 6. En la etapa 600, una primera parte de superposición de la tercera ventana se recupera de la memoria o, si no está disponible de forma específica en esta forma, se calcula por medio de operaciones aritméticas o lógicas a partir de los datos de la memoria y esto se hace basándose en la ventana anterior desde que la primera parte de superposición de la ventana de síntesis ya está fijada por la superposición de la ventana anterior. Se recupera la segunda parte de la ventana asimétrica, es decir, la parte larga de la ventana de síntesis asimétrica y, en la etapa 604, se determina una longitud de truncamiento. En la etapa 606, esta primera parte, si es necesario, se refleja y a continuación el truncamiento se lleva a cabo mediante el uso de la longitud de truncamiento determinada. En la etapa 608, la parte individual de la parte de superposición de 5 ms se recupera de la ventana simétrica y, posteriormente a la etapa 608, se lleva a cabo el desvanecimiento de la parte truncada, según se ilustra en la etapa 610. La segunda parte de superposición de la tercera ventana se ha completado y, posteriormente, la segunda y la cuarta parte de la cuarta función de ventana asimétrica se recuperan y se aplican para obtener finalmente la cuarta ventana según se indica mediante la etapa 612.
[00118] La Fig. 7 ilustra un procedimiento preferido para determinar la longitud de truncamiento. Según se indica antes con respecto a las Fig. 10b y 11b, se pueden llevar a cabo diferentes longitudes de truncamiento. Puede haber un truncamiento a la longitud máxima de truncamiento, es decir, la situación en la Fig. 11a, o un truncamiento a una longitud menor que la longitud máxima de truncamiento según se ilustra en la Fig. 11b para la misma situación. Para este fin, el procedimiento en la Fig. 7 comienza con una indicación de la longitud de la ventana de transición que se ilustra en la etapa 700. Por lo tanto, la etapa 700 proporciona la información si la ventana de transición es para un tamaño del bloque de 10 ms, es decir, con una longitud de 20 ms o es más corta, es decir, una ventana para una longitud de 10 ms para un tamaño del bloque de 5 ms.
[00119] A continuación, en la etapa 702 se determina la longitud de la parte de superposición simétrica de la ventana. Para el lado de análisis, esto significa que se determina la longitud de la segunda parte de superposición mientras que, para el lado de síntesis, esto significa que se determina la longitud de la primera parte de superposición. La etapa 702 se asegura de que la situación "fija" de la ventana de transición sea reconocida, es decir, que la ventana de transición tenga una superposición simétrica. Ahora, en la etapa 704, se determina el segundo borde de ventana o la otra parte de superposición de la ventana. Básicamente, la longitud máxima de truncamiento es la diferencia entre la longitud de la ventana de transición y la longitud de la parte de superposición simétrica. Cuando esta longitud es mayor que la longitud del borde largo de la ventana asimétrica entonces no se necesita ningún truncamiento en absoluto. Sin embargo, cuando esta diferencia es menor que el borde largo de la ventana asimétrica entonces se lleva a cabo un truncamiento. La longitud máxima de truncamiento, es decir, la longitud por la cual se obtiene un truncamiento mínimo es igual a esta diferencia. Cuando sea necesario se puede llevar a cabo un truncamiento a esta longitud máxima, es decir, un truncamiento mínimo, y se puede aplicar una cierta aparición gradual según se ilustra en la Fig. 11a o 10b. Según se ilustra en la Fig. 11a, se requiere un cierto número de unos con el fin de asegurarse de que el plegado a lo largo de las líneas de plegado 1104, 1106 sea posible debido al hecho de que estas líneas de plegado no se deben cambiar en ciertas realizaciones. Por lo tanto, según se indica en 1101 en la Fig. 11a es necesario un cierto número de unos para la ventana de transición de análisis de 20 a 10 ms pero estos no son necesarios para la ventana de transición de 20 a 5 ms de la Fig. 10b.
[00120] Sin embargo, la etapa 704 puede omitirse según se ilustra en 708. A continuación se lleva a cabo un truncamiento a una longitud menor que la máxima, en la etapa 710 que lleva a la situación de la Fig. 11b. La parte de ventana restante tiene que rellenarse con ceros y unos y, en particular, ha de tenerse en cuenta por medio de la inserción de ceros al principio y al final de la ventana indicada en las partes 1131 y 1133 en la etapa 712. Por otra parte, la inserción de un número de unos correspondiente para obtener la parte alta 1132 tiene que realizarse según se indica en 714, con el fin de asegurarse de que el plegado en torno a los puntos de plegado 1104 y 1106 funcione correctamente según se ilustra en la Fig. 11b.
[00121] Por lo tanto, el número de ceros de la parte 1131 es igual a un número de ceros inmediatamente cercano a la primera parte de superposición 1130, y un número de ceros en la parte 1133 de la Fig. 11b corresponde a un número de ceros inmediatamente adyacentes a la segunda parte de superposición 1134 de la Fig. 11b. A continuación el plegado con el marcador 1135 alrededor de las líneas de plegado 1104 y 1106 funciona de forma correcta.
[00122] Si bien las realizaciones preferidas se han descrito con una longitud de ventana de 40 ms y una longitud de la transformada de 20 ms como una ventana larga, un tamaño del bloque de 10 ms para las ventanas intermedias y un tamaño del bloque de 5 ms para una ventana corta, se ha de destacar que se puede aplicar un bloque o tamaño de ventana diferente. Por otra parte, se debe destacar que además la presente invención es útil para solo dos tamaños del bloque diferentes aunque se prefieren tres tamaños de bloque diferentes para tener una muy buena colocación de funciones de ventana cortas con respecto a un transitorio según lo expuesto, por ejemplo, en detalle en la patente PCT/EP2014/053287 que expone de forma adicional partes de múltiples superposiciones, es decir, una superposición entre más de dos ventanas que se producen en las secuencias en las Fig. 15a y 15b o 14a y 14b.
[00123] Si bien la presente invención se ha descrito en el contexto de los diagramas de bloques, en los que los bloques representan componentes reales o lógicos de hardware, la presente invención también puede implementarse mediante un procedimiento implementado por ordenador. En este caso, los bloques representan etapas del procedimiento correspondientes, en el que se destacan las siguientes etapas para las funciones realizadas por los bloques de hardware lógicos o físicos correspondientes.
[00124] Si bien se han descrito algunos aspectos en el contexto de un aparato, es evidente que estos aspectos también representan una descripción del procedimiento correspondiente, en el que un bloque o dispositivo corresponde a una etapa del procedimiento o a una característica de una etapa del procedimiento. De forma análoga, los aspectos descritos en el contexto de una etapa del procedimiento también representan una descripción de un bloque correspondiente o un elemento o característica de un aparato correspondiente. Algunas o todas las etapas del procedimiento se pueden realizar por medio de (o usando) un aparato de hardware, como por ejemplo, un microprocesador, un ordenador programable o un circuito electrónico. En algunas realizaciones, una o más de las etapas más importantes del procedimiento pueden ser realizadas por dicho aparato.
[00125] La señal transmitida o codificada de la invención se puede almacenar en un medio de almacenamiento digital o se puede transmitir en un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión por cable como, por ejemplo, Internet.
[00126] Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención se pueden implementar en hardware o en software. La aplicación se puede llevar a cabo mediante el uso de un medio de almacenamiento digital, por ejemplo un disquete, un DVD, un Blu-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene señales de control legibles electrónicamente almacenadas en las mismas, que cooperan (o son capaces de cooperar) con un sistema informático programable de manera que se lleva a cabo el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.
[00127] Algunas realizaciones según la invención comprenden un soporte de datos que tiene señales de control legibles electrónicamente, que son capaces de cooperar con un sistema informático programable, de manera que se lleve a cabo uno de los procedimientos descritos en la presente memoria.
[00128] Por lo general, las realizaciones de la presente invención se pueden implementar como un producto de programa informático con un código de programa, siendo el código de programa operativo para llevar a cabo uno de los procedimientos cuando el producto de programa informático se ejecuta en un ordenador. El código de programa se puede almacenar, por ejemplo, en un soporte legible por máquina.
[00129] Otras realizaciones comprenden el programa informático para llevar a cabo uno de los procedimientos descritos en la presente memoria, almacenado en un soporte legible por máquina.
[00130] En otras palabras, una realización del procedimiento de la invención es, por lo tanto, un programa informático que tiene un código de programa para llevar a cabo uno de los procedimientos descritos en la presente memoria, cuando el programa informático se ejecuta en un ordenador.
[00131] Una realización adicional del procedimiento de la invención es, por lo tanto, un soporte de datos (o un medio de almacenamiento no transitorio tal como un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para llevar a cabo uno de los procedimientos descritos en la presente memoria. El soporte de datos, el medio de almacenamiento digital o el medio grabado son normalmente tangibles y/o no transitorios.
[00132] Una realización adicional del procedimiento de la invención es, por lo tanto, un tren de datos o una secuencia de señales que representan el programa informático para llevar a cabo uno de los procedimientos descritos en la presente memoria. El tren de datos o la secuencia de señales pueden, por ejemplo, estar configurados para transferirse a través de una conexión de comunicación de datos, por ejemplo, a través de internet.
[00133] Una realización adicional comprende un medio de tratamiento, por ejemplo, un ordenador o un dispositivo lógico programable, configurado para, o adaptado para, llevar a cabo uno de los procedimientos descritos en la presente memoria.
[00134] Una realización adicional comprende un ordenador que tiene instalado en ella el programa informático para llevar a cabo uno de los procedimientos descritos en la presente memoria.
[00135] Una realización adicional según la invención comprende un aparato o un sistema configurado para transferir (por ejemplo, de forma electrónica u óptica) un programa informático con el fin de llevar a cabo uno de los procedimientos descritos en la presente memoria a un receptor. El receptor puede ser, por ejemplo, un ordenador, un dispositivo móvil, un dispositivo de memoria o similares. El aparato o sistema puede comprender, por ejemplo, un servidor de archivos para transferir el programa informático al receptor.
[00136] En algunas realizaciones, se puede usar un dispositivo lógico programable (por ejemplo, una matriz de puertas programable por campo) para llevar a cabo algunas o todas de las funcionalidades de los procedimientos descritos en la presente memoria. En algunas realizaciones, una matriz de puertas programable por campo puede cooperar con un microprocesador para llevar a cabo uno de los procedimientos descritos en la presente memoria. Por lo general, los procedimientos se llevan a cabo preferentemente por medio de cualquier aparato de hardware.
[00137] Las realizaciones descritas con anterioridad son meramente ilustrativas para los principios de la presente invención. Se comprende que para los expertos en la materia serán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en la presente memoria. Por lo tanto, se pretende estar limitados únicamente por el alcance de las reivindicaciones de la patente en curso y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en la presente memoria.
Referencias
[00138]
[1] International Organization for Standardization, ISO/IEC 14496-3, "Information Technology - Coding of audiovisual objects - Part 3: Audio," Geneva, Switzerland, Aug. 2009.
[2] Internet Engineering Task Force (IETF), RFC 6716, "Definition of the Opus Audio Codec," Sep. 2012.
[3] C. R. Helmrich, G. Markovic and B. Edler, "Improved Low-Delay MDCT-Based Coding of Both Stationary and Transient Audio Signals," in Proceedings of the IEEE 2014 Int. Conference on Acoustics, Speech and Signal Processing (ICASSP), 2014 or PCT/EP2014/053287.

Claims (17)

REIVINDICACIONES
1. Procesador para el tratamiento de una señal de audio (200), que comprende:
un analizador (202) para deducir una señal de control de ventana (204) de la señal de audio (200),
de manera que la señal de control de ventana (204) indica un cambio de una primera ventana asimétrica (1400) a una segunda ventana (1402), donde la segunda ventana (1402) es más corta que la primera ventana asimétrica (1400), o
la señal de control de ventana (204) indica un cambio de una tercera ventana (1450) a una cuarta ventana asimétrica (1452), donde la tercera ventana (1450) es más corta que la cuarta ventana asimétrica (1452); un constructor de ventanas (206)
para la construcción de la segunda ventana (1402) usando una primera parte de superposición (800) de la primera ventana asimétrica (1400), en la que el constructor de ventanas (206) está configurado para determinar una primera parte de superposición (1000) de la segunda ventana (1402) usando una primera parte de superposición truncada de la primera ventana asimétrica (1400), y para determinar una segunda parte de superposición (1002) de la segunda ventana (1402) correspondiente a la primera parte de superposición (1022) de una ventana posterior (1408) después de la segunda ventana (1402) o
para la construcción de la tercera ventana (1450) usando una segunda parte de superposición (1330) de la cuarta ventana asimétrica (1452), donde el constructor de ventanas (206) está configurado para determinar la primera parte de superposición (1331) de la tercera ventana (1450) correspondiente a la segunda parte de superposición (1342) de una ventana posterior (1460) después de la tercera ventana (1450) y para calcular una segunda parte de superposición (1330) de la tercera ventana (1450) usando una segunda parte de superposición truncada (814) de la cuarta ventana asimétrica (1452); y
un divisor de ventanas (208) para la aplicación de la primera ventana asimétrica (1400) y la segunda ventana (1402) o la tercera ventana (1450) y la cuarta ventana asimétrica (1452) para obtener partes de la señal de audio ventanizadas (210).
2. Procesador de la reivindicación 1,
en el que la primera ventana asimétrica (1400) y la segunda ventana (1402) son ventanas de análisis o la tercera ventana (1450) y la cuarta ventana asimétrica (1452) son ventanas de síntesis,
en el que el procesador comprende además un codificador de audio (110) para el tratamiento adicional de muestras ventanizadas por la primera ventana asimétrica (1400) y la segunda ventana (1402), o en el que el procesador comprende además un elemento de suma y superposición (174) para la suma y superposición de muestras ventanizadas por la tercera ventana (1450) y la cuarta ventana asimétrica (1452).
3. Procesador de la reivindicación 1 o 2,
en el que el constructor de ventanas (206) está configurado para deducir la primera parte de superposición (1000) de la segunda ventana (1402) por truncamiento de la primera parte de superposición (800) de la primera ventana asimétrica (1400) para obtener la primera parte de superposición truncada y por aparición gradual de la primera parte de superposición truncada, o
en el que el constructor de ventanas (206) está configurado para derivar la segunda parte de superposición (1330) de la tercera ventana (1450) truncando la segunda parte de superposición (1330) de la cuarta ventana asimétrica (1452) para obtener la segunda parte de superposición truncada y por desaparición gradual de la segunda parte de superposición truncada.
4. Procesador de la reivindicación 3,
en el que el constructor de ventanas (206) está configurado para llevar a cabo la aparición gradual o el desvanecimiento usando una función sinusoidal de aparición gradual o una función sinusoidal de desvanecimiento.
5. Procesador de la reivindicación 3 o 4,
en el que el constructor de ventanas (206) está configurado para calcular la aparición gradual o el desvanecimiento usando una parte de superposición de cualquier otra ventana usada por el procesador.
6. Procesador de la reivindicación 5,
en el que el constructor de ventanas (206) está configurado para calcular la aparición gradual o el desvanecimiento (304) usando la parte de superposición más corta (401) de todas las partes de superposición usadas.
7. Procesador de una de las reivindicaciones anteriores, que comprende además una memoria (300) que tiene almacenadas en la misma, para una cierta velocidad de muestreo, la primera parte de superposición (800) de la primera ventana asimétrica (1400), una segunda parte de superposición (802) de la primera ventana asimétrica (1400) y una tercera parte de superposición para otra ventana más corta que la primera ventana asimétrica (1400), en el que el constructor de ventana (206) está configurado
para recuperar (308) la primera parte de superposición (800) de la primera ventana asimétrica (1400) de la memoria (300),
para truncar (302) la primera parte de superposición (800) de la primera ventana asimétrica (1400) a una longitud más corta que la longitud de la primera parte de superposición (800) de la primera ventana asimétrica (1400) para obtener la primera parte truncada de superposición,
para recuperar (312) la tercera parte de superposición, y
para la multiplicación (304) de la primera parte de superposición truncada por la tercera parte de superposición para generar la primera parte de superposición (1000) de la segunda ventana (1402); o en el que el constructor de ventanas (206) está configurado
para la recuperación de la segunda parte de superposición (1330) de la cuarta ventana asimétrica (1452) desde la memoria (300),
para el truncamiento de la segunda parte de superposición (1330) de la cuarta ventana asimétrica (1452) recuperada a una longitud más corta que la longitud de la segunda parte de superposición (302) de la cuarta ventana asimétrica (1452) para obtener la segunda parte de superopsición truncada,
para la recuperación de la tercera parte de superposición (312); y
para la multiplicación de la segunda parte de superposición truncada por la tercera parte de superposición para generar la segunda parte de superposición (1330) de la tercera ventana (1450).
8. Procesador de la reivindicación 7,
en el que la memoria (300) tiene almacenada además una cuarta parte de superposición (402) de una ventana aún más adicional, teniendo la ventana aún más adicional una longitud entre una longitud de la primera ventana asimétrica (1400) y una longitud de otra ventana.
9. Procesador de la reivindicación 8,
en el que el constructor de ventanas (206) está configurado para construir, dependiendo de la señal de control de ventana (204), una secuencia que comprende la primera ventana asimétrica (1400), la segunda ventana (1402), la ventana adicional (1408) construida usando la tercera parte de superposición y la cuarta parte de superposición o para usar solo la tercera parte de superposición, y una ventana adicional más (1410) usando la tercera parte de superposición y la segunda parte de superposición (802) de la primera ventana asimétrica (1400).
10. Procesador de una de las reivindicaciones anteriores,
en el que el constructor de ventanas (206) está configurado para determinar la primera parte de superposición (1000) de la segunda ventana (1402) usando la primera parte de superposición truncada de la primera ventana asimétrica (1400) que se trunca a una longitud de una segunda parte de superposición (802) de la primera ventana asimétrica (1400), o
para determinar la segunda parte de superposición (1330) de la tercera ventana (1450) usando una segunda parte de superposición (1330) de la cuarta ventana asimétrica (1452) truncada a una longitud de la primera parte de superposición (812) de la cuarta ventana asimétrica (1452).
11. Procesador de una de las reivindicaciones anteriores, en el que el constructor de ventanas (206) está configurado
para truncar la primera parte de superposición (800) de la primera ventana asimétrica (1400) a una longitud truncada que es más corta o igual a la longitud de ventana de la segunda ventana (1402) menos una longitud de la primera parte de superposición de la ventana adicional (1408) posterior a la segunda ventana (1402), o para truncar la segunda parte de superposición (1330) de la cuarta ventana asimétrica (1452) a una longitud truncada que es más corta o igual a una longitud de ventana de la tercera ventana (1450) menos un a longitud de una segunda parte de superposición de la ventana adicional (1460) anterior a la tercera ventana (1450).
12. Procesador de la reivindicación 11,
en el que, cuando la longitud de truncamiento es menor que la longitud de ventana menos la longitud de la primera parte de superposición de la ventana adicional (1408), el constructor de ventanas (206) está configurado para insertar (712) ceros (1131, 1133) antes o después de la primera parte de superposición y la segunda parte de superposición de la segunda ventana (1402), y en el que el constructor de ventanas (206) está configurado además para insertar una serie de valores "1" (714; 1132) entre la primera parte de superposición y la segunda parte de superposición de la segunda ventana (1402), o
en el que, cuando la longitud de truncamiento es menor que la longitud de ventana menos la longitud de la segunda parte de superposición de la ventana adicional (1460), el constructor de ventanas (206) está configurado para insertar (712) ceros (1131, 1133) antes o después de la primera y segunda partes de superposición de la tercera ventana (1450), y donde el constructor de ventanas (206) está configurado además para insertar varios valores "1" (714; 1132) entre la primera parte de superposición y la segunda parte de superposición de la tercera ventana (1450).
13. Procesador de una de las reivindicaciones 1 a 3,
en el que la primera ventana asimétrica (1400) tiene una primera parte de superposición (800), una según da parte de superposición (802), una primera parte de alto valor entre la primera parte de superposición (800) de la primera ventana asimétrica (1400) y la segunda parte de superposición (802) de la primera ventana asimétrica (1400) y una segunda parte de bajo valor posterior a la segunda parte de superposición (802) de la primera ventana asimétrica (1400), en el que los valores en la parte de alto valor son mayores que 0,9 y los valores en la parte de bajo valor son menores que 0,1, y
en el que la longitud de la segunda parte de superposición (802) de la primera ventana asimétrica (1400) es menor que una longitud de la primera parte de superposición (800) de la primera ventana asimétrica (1400).
14. Procesador de una de las reivindicaciones anteriores, que está configurado para funcionar a una pluralidad de velocidades de muestreo diferentes, y
en el que el procesador está configurado para almacenar, para cada velocidad de muestreo, la primera parte de superposición (403, 800) y la segunda parte de superposición (404, 802) de la primera ventana asimétrica (1400) o la cuarta ventana asimétrica (1452), una parte de superposición simétrica (402) de una ventana adicional, y una parte de superposición simétrica adicional (401) de una ventana aún más corta que es más corta que la ventana adicional; y
en el que la parte de superposición simétrica (402) y la parte de superposición simétrica adicional (401) se almacenan solo como una parte ascendente o una parte descendente, y en el que el constructor de ventanas (206) está configurado para deducir una parte descendente o una parte ascendente de la parte ascendente o descendente almacenada mediante operaciones aritméticas o lógicas.
15. Procesador de una de las reivindicaciones anteriores,
en el que la primera ventana asimétrica (1400) está configurada para una longitud de transformada de 20 ms, en el que el constructor de ventanas (206) está configurado para usar además ventanas adicionales para una longitud de transformada de 10 ms o una longitud de transformada de 5 ms, y en el que la segunda ventana (1402) es una ventana de transición de la longitud de transformada de 20 ms a la longitud de transformada de 10 ms a la longitud de transformada de 5 ms, o
en el que la cuarta ventana asimétrica (1452) está configurada para la longitud de transformada de 20 ms, y en el que la tercera ventana (1450) es una ventana de transición de longitud de transformada de 5 ms a la longitud de transformada de 20 ms o de la longitud de transformada de 10 ms a la longitud de transformada de 20 ms.
16. Procedimiento de tratamiento de una señal de audio (200), que comprende:
la deducción (202) de una señal de control de ventana (204) de la señal de audio (200), la señal de control de ventana que indica un cambio de una primera ventana asimétrica (1400) a una segunda ventana (1402), en la que la segunda ventana (1402) es más corta que la primera ventana asimétrica (1400), o
la primera señal de control de ventana que indica un cambio de una tercera ventana (1450) a una cuarta ventana asimétrica (1452), en la que la tercera ventana (1450) es más corta que la cuarta ventana asimétrica (1452); la construcción (206) de la segunda ventana (1402) usando una primera parte de superposición (800) de la primera ventana asimétrica (1400), en la que la construcción (206) comprende la determinación de una primera parte de superposición (1000) de la segunda ventana (1402) usando una primera parte de superposición truncada de la primera ventana asimétrica (1400) y determinar una segunda parte de superposición (1002) de la segunda ventana (1402) correspondiente a una primera parte de superposición (1022) de una ventana adicional (1408) siguiendo la segunda ventana (1402), o
la construcción de la tercera ventana (1450) usando una segunda parte de superposición (814) de la cuarta ventana asimétrica (1452), en la que la construcción (206) comprende determinar una primera parte de superposición (1331) de la tercera ventana (1450) correspondiente a una segunda parte de superposición (1342) de una ventana adicional (1460) que precede a la tercera ventana (1450) y el cálculo de una segunda parte de superposición (1330) de la tercera ventana (1450) usando una segunda parte de superposición truncada (814) de la cuarta ventana asimétrica (1452); y
la aplicación (208) de la primera ventana asimétrica (1400) y la segunda ventana (1402) o la tercera ventana (1450) y la cuarta ventana asimétrica (1452) para obtener partes de la señal de audio ventanizada (210).
17. Programa informático que comprende instrucciones que, cuando el programa es ejecutado por un ordenador o procesador, hacen que el ordenador o procesador lleve a cabo el procedimiento de la reivindicación 16.
ES19189446T 2014-07-28 2015-07-24 Procesador, procedimiento y programa informático para el tratamiento de una señal de audio mediante el uso de las partes de superposición truncadas de ventanas de análisis o síntesis Active ES2940783T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP14178774.7A EP2980791A1 (en) 2014-07-28 2014-07-28 Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions

Publications (1)

Publication Number Publication Date
ES2940783T3 true ES2940783T3 (es) 2023-05-11

Family

ID=51224864

Family Applications (2)

Application Number Title Priority Date Filing Date
ES15742237T Active ES2751275T3 (es) 2014-07-28 2015-07-24 Procesador, procedimiento y programa informático para el tratamiento de una señal de audio mediante el uso de las partes de superposición truncadas de ventanas de análisis y de síntesis
ES19189446T Active ES2940783T3 (es) 2014-07-28 2015-07-24 Procesador, procedimiento y programa informático para el tratamiento de una señal de audio mediante el uso de las partes de superposición truncadas de ventanas de análisis o síntesis

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES15742237T Active ES2751275T3 (es) 2014-07-28 2015-07-24 Procesador, procedimiento y programa informático para el tratamiento de una señal de audio mediante el uso de las partes de superposición truncadas de ventanas de análisis y de síntesis

Country Status (18)

Country Link
US (3) US10262666B2 (es)
EP (4) EP2980791A1 (es)
JP (3) JP6612846B2 (es)
KR (1) KR102006897B1 (es)
CN (2) CN113990333A (es)
AR (1) AR102037A1 (es)
AU (1) AU2015295602B2 (es)
CA (1) CA2956010C (es)
ES (2) ES2751275T3 (es)
FI (1) FI3584792T3 (es)
MX (1) MX369755B (es)
MY (1) MY192272A (es)
PL (2) PL3175448T3 (es)
PT (2) PT3584792T (es)
RU (1) RU2677385C2 (es)
SG (1) SG11201700694PA (es)
TW (1) TWI581252B (es)
WO (1) WO2016016120A1 (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2980791A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
US9959877B2 (en) 2016-03-18 2018-05-01 Qualcomm Incorporated Multi channel coding
JP6976277B2 (ja) * 2016-06-22 2021-12-08 ドルビー・インターナショナル・アーベー 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
EP3483879A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
CN108847258B (zh) * 2018-06-10 2021-06-04 北京酷我科技有限公司 一种截取音频控件的实现方法
CN111402917B (zh) * 2020-03-13 2023-08-04 北京小米松果电子有限公司 音频信号处理方法及装置、存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JP3518737B2 (ja) * 1999-10-25 2004-04-12 日本ビクター株式会社 オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
CN101035527A (zh) * 2004-09-13 2007-09-12 伊利舍医药品公司 治疗疾病的方法
US8744862B2 (en) * 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2345030A2 (en) * 2008-10-08 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-resolution switched audio encoding/decoding scheme
US9384748B2 (en) * 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
EP2382625B1 (en) 2009-01-28 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program
EP4358082A1 (en) * 2009-10-20 2024-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
JP5345737B2 (ja) * 2009-10-21 2013-11-20 ドルビー インターナショナル アーベー 結合されたトランスポーザーフィルターバンクにおけるオーバーサンプリング
EP2372705A1 (en) * 2010-03-24 2011-10-05 Thomson Licensing Method and apparatus for encoding and decoding excitation patterns from which the masking levels for an audio signal encoding and decoding are determined
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
EP2619758B1 (en) * 2010-10-15 2015-08-19 Huawei Technologies Co., Ltd. Audio signal transformer and inverse transformer, methods for audio signal analysis and synthesis
FR2977969A1 (fr) * 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
JP6434411B2 (ja) 2012-09-24 2018-12-05 サムスン エレクトロニクス カンパニー リミテッド フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
US9305559B2 (en) 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
CN110232929B (zh) * 2013-02-20 2023-06-13 弗劳恩霍夫应用研究促进协会 用于对音频信号进行译码的译码器和方法
FR3004876A1 (fr) 2013-04-18 2014-10-24 France Telecom Correction de perte de trame par injection de bruit pondere.
US9431987B2 (en) 2013-06-04 2016-08-30 Sony Interactive Entertainment America Llc Sound synthesis with fixed partition size convolution of audio signals
EP2980791A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions

Also Published As

Publication number Publication date
MX369755B (es) 2019-11-20
EP3175448B1 (en) 2019-09-04
US20190198030A1 (en) 2019-06-27
US10262666B2 (en) 2019-04-16
US20210134308A1 (en) 2021-05-06
AU2015295602A1 (en) 2017-03-16
FI3584792T3 (fi) 2023-04-04
US10902861B2 (en) 2021-01-26
JP2017526005A (ja) 2017-09-07
CN107077854A (zh) 2017-08-18
EP3584792A1 (en) 2019-12-25
TW201618082A (zh) 2016-05-16
US20170140768A1 (en) 2017-05-18
AR102037A1 (es) 2017-02-01
KR20170033883A (ko) 2017-03-27
EP2980791A1 (en) 2016-02-03
PT3584792T (pt) 2023-04-17
JP6612846B2 (ja) 2019-11-27
SG11201700694PA (en) 2017-02-27
PT3175448T (pt) 2019-12-09
EP3584792B1 (en) 2023-01-11
PL3175448T3 (pl) 2020-03-31
JP7043113B2 (ja) 2022-03-29
JP2020046671A (ja) 2020-03-26
CA2956010C (en) 2020-03-24
EP3175448A1 (en) 2017-06-07
CA2956010A1 (en) 2016-02-04
US11664036B2 (en) 2023-05-30
JP7420848B2 (ja) 2024-01-23
WO2016016120A1 (en) 2016-02-04
MX2017001239A (es) 2017-07-07
PL3584792T3 (pl) 2023-05-08
RU2017106179A (ru) 2018-08-28
BR112017001630A2 (pt) 2017-11-21
RU2677385C2 (ru) 2019-01-16
RU2017106179A3 (es) 2018-08-28
CN113990333A (zh) 2022-01-28
MY192272A (en) 2022-08-15
CN107077854B (zh) 2021-06-22
ES2751275T3 (es) 2020-03-31
TWI581252B (zh) 2017-05-01
KR102006897B1 (ko) 2019-08-02
EP4191582A1 (en) 2023-06-07
JP2022091803A (ja) 2022-06-21
AU2015295602B2 (en) 2018-08-16

Similar Documents

Publication Publication Date Title
ES2940783T3 (es) Procesador, procedimiento y programa informático para el tratamiento de una señal de audio mediante el uso de las partes de superposición truncadas de ventanas de análisis o síntesis
ES2950286T3 (es) Decodificador para decodificar una señal de audio codificada y codificador para codificar una señal de audio
ES2953085T3 (es) Decodificador de audio y métodos relacionados para procesar señales de audio multicanal usando una dirección de predicción variable
ES2634621T3 (es) Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple
ES2958535T3 (es) Codificador de audio para la codificación de una señal de múltiples canales y un decodificador de audio para la decodificación de una señal de audio codificada
ES2564400T3 (es) Codificador y descodificador de audio para codificar y descodificar muestras de audio
BR112017001630B1 (pt) Processador e método para processamento de um sinal de áudio utilizando análise truncada ou partes de sobreposição da janela de síntese
BR112017019179B1 (pt) Decodificador para decodificar um sinal de áudio codificado e codificador para codificar um sinal de áudio