ES2531568T3 - Banco de filtro de análisis, banco de filtro de síntesis, codificador, decodificador, mezclador y sistema de conferencia - Google Patents

Banco de filtro de análisis, banco de filtro de síntesis, codificador, decodificador, mezclador y sistema de conferencia Download PDF

Info

Publication number
ES2531568T3
ES2531568T3 ES11173652.6T ES11173652T ES2531568T3 ES 2531568 T3 ES2531568 T3 ES 2531568T3 ES 11173652 T ES11173652 T ES 11173652T ES 2531568 T3 ES2531568 T3 ES 2531568T3
Authority
ES
Spain
Prior art keywords
window
input
samples
filter bank
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11173652.6T
Other languages
English (en)
Inventor
Bernhard Grill
Markus Schnell
Ralf Geiger
Gerald Schuller
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2531568T3 publication Critical patent/ES2531568T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Facsimile Transmission Control (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Complex Calculations (AREA)
  • Image Processing (AREA)
  • Noise Elimination (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Un banco de filtros de análisis para filtrar unapluralidad de cuadros de entrada de dominio de tiempo, cada cuadro de entrada comprendiendo un número de muestras de entrada ordenadas, respecyivamente, que comprende: un formador de ventanas configurado para generar una pluralidad de cuadros de ventana, un cuadro de ventana comprendiendo una pluralidad de muestras de ventana, en donde el formador de ventanas está configurado para el procesamiento de la pluralidad de cuadros de entrada de manera superpuesta utilizando un valor por adelantado de la muestra, en donde el valor por adelantado de la muestra es menor que el número de muestras de entrada ordenadas de un cuadro de entrada dividido por 2; en donde el formador de ventanas está configurado para generar consecutivamente dos cuadros de ventana en base a dos cuadros de entrada al, para cada cuadro de entrada, ponderar por lo menos una pluralidad de muestras de entrada del cuadro de entrada respectivo con una función de ventana, con los dos cuadros de entada solapamdo en un número de muestras de entrda ordenadas que es mayor que la mitad del número de muestras de entrada ordenadas de los cuadros de entrada, y en donde el formador de ventanas está configurado para generar la pluralidad de cuadros de ventana de tal manera que las mismas muestras de entrada ordenadas de los dos cuadros de entrada, en los cuales los dos cuadros de ventana generados consecutivamente están basados, son desplazadas con respecto al orden de las muestras de entrada del cuadro de entrada por el valor por adelantado de la muestra y un convertidor de tiempo/frecuencia configurado para proporcionar un cuadro de salida que comprende un número de valores de salida, un cuadro de salida siendo una representación espectral de un cuadro de ventana.

Description

5
15
25
35
45
55
65 E11173652
26-02-2015
DESCRIPCIÓN
Banco de filtro de análisis, banco de filtro de síntesis, codificador, decodificador, mezclador y sistema de conferencia
Antecedentes de la invención
[0001] La presente invención es concerniente con un banco de filtro de análisis, un banco de filtro de síntesis y sistemas que comprenden cualquiera de los bancos de filtros mencionados anteriormente que pueden por ejemplo ser implementados en el campo de codificación de audio moderna, descodificación de audio u otras aplicaciones relacionadas con la transmisión de audio. Además, la presente invención también es concerniente con un mezclador y un sistema de conferencia.
[0002] El procesamiento de audio digital moderno está basado comúnmente en esquemas de esquemas de codificación que permiten una reducción significativa en términos de velocidades de bits, anchos de banda de transmisión y espacio de almacenamiento, en comparación con la transmisión directa o almacenamiento de los respectivos datos de audio. Esto se obtiene al codificar los datos de audio en el sitio de remitente y descodificar los datos codificados en el sitio de receptor antes de por ejemplo proporcionar los datos de audio descodificados a un radioescucha.
[0003] Tales sistemas de procesamiento de audio digital pueden ser implementados con respecto a un amplio intervalo de parámetros que comprenden un espacio de almacenamiento típico para una corriente potencialmente estandarizada típica de datos de audio, velocidad de bits, complejidad computacional especialmente en términos de eficiencia de implementación, calidades obtenibles apropiadas para diferentes aplicaciones y en términos del retardo provocado tanto durante la codificación como de la descodificación de los datos de audio y los datos de audio codificados, respectivamente. En otras palabras, los sistemas de audio digitales pueden ser aplicados en muchos campos o aplicaciones diferentes que fluctúan desde una transmisión de ultra-baja calidad a una transmisión de extremo alto y almacenamiento de datos de audio (por ejemplo, para una experiencia de escuchar música de alta calidad).
[0004] Sin embargo, en muchos casos se tienen que tomar soluciones intermedias en términos de los diferentes parámetros tales como la velocidad de bits, la complejidad computacional, calidad y retardo. Por ejemplo, un sistema de audio digital que comprende un bajo retraso puede requerir una velocidad de bits más alta de un ancho de banda transmisión en comparación con un sistema de audio con un retardo más alto a un nivel de calidad comparable.
[0005] El documento WO 98/02971 A1 se refiere a un método para señales de codificación y decodificación de audio. El método de codificación de señales de audio de tiempo discreto comprende las etapas de ponderación de la señal de audio de tiempo discreto por medio de funciones de ventana que se solapan entre sí para formar bloques, las funciones de ventana produciendo bloques de una primera longitud para señales que varían débilmente con el tiempo y bloques de una segunda longitud para señales que varían fuertemente con el tiempo. Una secuencia ventana de inicio se selecciona para la transición de enventanado con bloques de la primera longitud a enventanado con bloques de la segunda longitud, mientras que se selecciona una secuencia de ventana única para la transición opuesta. La secuencia ventana de inicio se selecciona entre al menos dos secuencias de ventana de inicio diferentes que tienen diferentes longitudes, mientras que una secuencia de ventana de parada se selecciona de al menos dos secuencias de ventana de parada diferentes que tienen longitudes diferentes. El método de decodificación de bloques de señales de audio codificadas selecciona una transformación inversa adecuada, así como una ventana de síntesis adecuada como una reacción a información secundaria asociada con cada bloque.
[0006] El documento Recomendación UIT-T G. 729 divulga un codificador CELP que tiene ventanas de análisis que se solapan en más de un 50% para el procesamiento LPC.
Descripción de la invención
[0007] Una modalidad de un banco de filtros de análisis según la reivindicación 1 para filtrar una pluralidad de cuadros de entrada de dominio de tiempo, en donde un cuadro de entrada comprende un número de muestras de entrada ordenadas, comprende un formador de ventanas configurado para generar una pluralidad de cuadros de ventana, en donde un cuadro de ventana comprende una pluralidad de muestras de ventana, en donde el formador de ventanas está configurado para el procesamiento de la pluralidad de cuadros de entrada de manera traslapante utilizando un valor por adelantado de la muestra, en donde el valor por adelantado de la muestra es menor que el número de muestras de entrada ordenadas de un cuadro de entrada divididas por dos y un convertidor de tiempo/frecuencia configurado para proporcionar un cuadro de salida que comprende un número de valores de salida, en donde un cuadro de salida es una representación espectral de un cuadro de ventana.
Breve descripción de las figuras
[0008] Las modalidades de la presente invención son descritas posteriormente en la presente haciendo referencia a las figuras adjuntas.
5
15
25
35
45
55
65 E11173652
26-02-2015
La Figura 1 muestra un diagrama de bloques de un banco de filtros de análisis; La Figura 2 muestra una representación esquemática de cuadros de entrada siendo procesados por una modalidad de un banco de filtros de análisis; La Figura 3 muestra un diagrama de bloques de una modalidad de un banco de filtros de síntesis; La Figura 4 muestra una representación esquemática de cuadros de salida en el marco de ser procesado por una modalidad de un banco de filtros de síntesis; La Figura 5 muestra una representación esquemática de una función de ventana de análisis y una función de ventana de síntesis de una modalidad de un banco de filtros de análisis y de un banco de filtros de síntesis; La Figura 6 muestra una comparación de una función de ventana de análisis y una función de ventana de síntesis en comparación con una función de ventana de señal: La Figura 7 muestra una comparación adicional de diferentes funciones de ventana; La Figura 8 muestra una comparación del comportamiento de pre-eco para las tres funciones de ventana diferentes mostradas en la figura 7; La Figura 9 muestra esquemáticamente la propiedad de enmascaramiento temporal general del oído humano; La Figura 10 muestra una comparación de la respuesta de frecuencia de una ventana de señal y una ventana de bajo retardo; La Figura 11 muestra una comparación de una respuesta de frecuencia de una ventana de seno y una ventana de traslape bajo; La Figura 12 muestra una modalidad de un codificador; La Figura 13 muestra una modalidad de un descodificador; La Figura 14a muestra un sistema que comprende un codificador y un descodificador; La Figura 14b muestra fuentes diferentes para retardos comprendidos en el sistema mostrado en la figura 14a; La Figura 15 muestra una tabla que comprende una comparación de retardos; La Figura 16 muestra una modalidad de un sistema de conferencia que comprende una modalidad de un mezclador; La Figura 17 muestra una modalidad adicional de un sistema de conferencia como un servidor o una unidad de control de medios; La Figura 18 muestra un diagrama de bloques de una unidad de control de medios; La Figura 19 muestra una modalidad de un banco de filtros de síntesis como una implementación eficiente; La Figura 20 muestra una tabla que comprende una evaluación de la eficiencia computacional de una modalidad de un banco de filtros de síntesis o un banco de filtros de análisis (codec AAC ELD); La Figura 21 muestra una tabla que comprende una evaluación de la eficiencia computacional de un codec AAC LD; La Figura 22 muestra una tabla que comprende una evaluación de la complejidad computacional de un codec AAC LC; Las Figuras 23a y 23b muestran tablas que comprenden una comparación de la evaluación de eficiencia de memoria de RAM y ROM para tres codecs diferentes; y La Figura 24 muestra una tabla que comprende una lista de codec usados para una prueba de MUSHRA.
Descripción detallada de la invención
[0009] Las Figuras 1 a 24 muestran diagramas de bloques y diagramas adicionales que describen las propiedades funcionales y elementos de modalidades diferentes de un banco de filtros de análisis, un banco de filtros de síntesis, un codificador, un descodificador, un mezclador, un sistema de conferencia y otras modalidades de la presente invención. Sin embargo, antes de describir una modalidad de un banco de filtro de síntesis con respecto a las Figuras 1 y 2, una modalidad de un banco de filtros de análisis y una representación esquemática de cuadros de entrada siendo procesados por una modalidad de un banco de filtros de análisis será descrita en más detalle.
[00010] La Figura 1 muestra una primera modalidad de un banco de filtros de análisis 100 que comprende un formador de ventanas 110 y el convertidor de tiempo/frecuencia 120. Para ser más precisos, el formador de ventanas 110 está configurado para recibir una pluralidad de cuadros de entrada de dominio de tiempo, cada cuadro de entrada comprende un número de muestras de entrada ordenadas en una entrada 110i. El formador de ventanas 110 está adaptado además para generar una pluralidad de cuadros de ventana, que son provistas por el formador de ventanas en la salida ll0o del formador de ventanas 110. Cada uno de los cuadros de ventana comprende una pluralidad de muestras de ventana, en donde el formador de ventanas 110 está configurado además para el procesamiento de la pluralidad de cuadros de ventana de manera traslapante utilizando un valor por adelantado de la muestra como se explicará en más detalle en el contexto de la Figura 2.
[00011] El convertidor de tiempo/frecuencia 120 es apto de recibir los cuadros de ventana tal como son enviados por el formador de ventanas 110 y configurado para proporcionar un cuadro de salida que comprende un número de valores de salida, de tal manera que un cuadro de salida es una representación espectral de un cuadro de ventana.
[00012] Con el fin de ilustrar y bosquejar las propiedades funcionales y elementos de una modalidad de un banco de filtros de análisis 100, la Figura 2 muestra una representación esquemática de cinco cuadros de entrada 130-(k-3), 130-(k-2), 130-(k-1), 130-k y 130-(k+1) como función del tiempo, tal como se indica por la flecha 140 en el fondo de la Figura 2.
[00013] En lo siguiente, la operación de una modalidad de un banco de filtros de análisis 100 será descrita en más
5
15
25
35
45
55
65 E11173652
26-02-2015
detalle con referencia al cuadro de entrada 130-k, tal como se indica por la línea discontinua en la Figura 2. Con respecto a este cuadro de entrada 130-k, el cuadro de entrada 130-(k+1) es un cuadro de entrada futuro, mientras que los tres cuadros de entrada 130-(k-1), 130-(k-2) y 130-(k-3) son cuadros de entrada del pasado. En otras palabras, k es un número entero que indica un índice de cuadro, de tal manera que mientras más grande es el índice de cuadro, más lejos está el cuadro de entrada respectivo ubicado “en el futuro”. Así, mientras más pequeño es el índice k, más lejos está el cuadro de entrada ubicado “en el pasado”.
[00014] Cada uno de los cuadros de entrada 130 comprende por lo menos dos subsecciones 150, que son igualmente largas. Para ser más precisos, en el caso de una modalidad de un banco de filtros de análisis 100, en los cuales la representación esquemática mostrada en la Figura 2 está basada, el cuadro de entrada 130-k también como los otros cuadros de entrada 130 comprende subsecciones 150-2, 150-3 y 150-4 que son iguales en longitud en términos de muestras de entrada. Cada una de estas subsecciones 150 del cuadro de entrada 130 comprende M muestras de entrada, en donde M es un número entero positivo. Además, el cuadro de entrada 130 también comprende una primera subsección 150-1 que puede comprender también M cuadros de entrada. En este caso, la primera subsección 150-1 comprende una sección inicial 160 del cuadro de entrada 130, que puede comprender muestras de entrada u otros valores, como se explicará en más detalle en una etapa posterior. Sin embargo, dependiendo de la implementación concreta de la modalidad de un banco de filtros de análisis, la primera subsección 150-1 no es requerida que comprenda una sección inicial 160. En otras palabras, la primera subsección 150-1 puede en principio comprender un número más bajo de muestras de entrada en comparación con las otras subsecciones 150-2, 150-3, 150-4. Ejemplos para este caso también serán ilustrados más tarde.
[00015] Opcionalmente, aparte de la primera subsección 150-1, las otras subsecciones 150-2, 150-3, 150-4 comprenden comúnmente el mismo número de muestras de entrada M, que es igual al llamado valor por adelantado de muestra 170, que indica un número de muestras de entrada mediante por las cuales dos cuadros de entrada consecutivos 130 son movidos entre sí con respecto al tiempo. En otra palabras, a medida que el valor por adelantado de la muestra M, tal como se indica por una flecha 170, en el caso de una modalidad de un banco de filtros de análisis 100, como se ilustra en las Figuras 1 y 2 es igual a la longitud de las subsecciones 150-2, 150-3, 150-4, los cuadros de entrada 130 son generados y procesados por el formador de ventanas 110 de manera traslapante. Además, el valor por adelantado de la muestra M (flecha 170) es también idéntico con la longitud de las subsecciones 150-2 a 150-4.
[00016] La cuadros de entrada 130-k y 130-(k+1) son, de aquí, en términos de un número significativo de muestras de entrada, iguales en el sentido de que ambos cuadros de entrada comprenden estas muestras de entrada, en tanto que están desplazadas con respecto a las subsecciones individuales 150 de los dos cuadros de entrada 130. Para ser más precisos, la tercera subsección 150-3 del cuadro de entrada 130-k es igual a la cuarta subsección 1504 del cuadro de entrada 130-(k+1). Así, la segunda subsección 150-2 del cuadro de entrada 130-k es idéntica a la tercera subsección 150-3 del cuadro de entrada 130-(k+1).
[00017] En todavía otras palabras, los dos cuadros de entrada 130-k, 130-(k+1) correspondientes a los índices de cuadro k y (k+1) son en términos de dos subsecciones 150 en el caso de las modalidades mostradas en la Figura 2, idénticos, aparte del hecho de que en términos del cuadro de entrada con el cuadro de índice (k+1), las muestras son movidas.
[00018] Los dos cuadros de entrada mencionados anteriormente 130-k y 130-(k+1) comparten además por lo menos una muestra de la primera subsección 150-1 del cuadro de entrada 130-k. Para ser más precisos, en el caso de la modalidad mostrada en la Figura 2, todas las muestras de entrada en la primera subsección 150-1 del cuadro de entrada 130-k, que no son parte de la sección inicial 160, aparecen como parte de la segunda subsección 150-2 del cuadro de entrada 130-(k+1). Sin embargo, la muestras de entrada de la segunda subsección 150-2 correspondientes a la sección inicial 160 del cuadro de entrada 130-k antes pueden o pueden no estar basados en los valores de entrada o muestras de entrada de la sección inicial 160 del cuadro de entrada respectivo 130, dependiendo de la implementación concreta de una modalidad de un banco de filtros de análisis.
[00019] En el caso de la sección inicial 160 existente de tal manera que el número de cuadros de entrada en la primera subsección 150-1 es igual al número de muestras de entrada en las otras subsecciones 150-2 a 150-4, en principio dos casos diferentes tienen que ser considerados, aunque también además casos entre estos dos “extremos”, que serán explicados, son posibles.
[00020] Si la sección inicial 160 comprende muestras de entrada codificadas “significativas” en el sentido de que las muestras de entrada en la sección inicial 160 representan una señal de audio, en el dominio de tiempo, estas muestras de entrada también serán parte de la subsección 150-2 del siguiente cuadro de entrada 130-(k+1). Este caso, es sin embargo, en muchas aplicaciones de una modalidad de un banco de filtros de análisis, no una implementación óptima, ya que esta opción podría provocar retardo adicional.
[00021] Sin embargo, en el caso de que la sección inicial 160 no comprenda muestras de entrada “significativas”, que en este caso pueden también ser denominadas como valores de entrada, los valores de entrada correspondientes de la sección inicial 160 pueden comprender valores aleatorios, un valor adaptable predeterminado
5
15
25
35
45
55
65 E11173652
26-02-2015
fijo o programable, que puede por ejemplo ser provisto en términos de un cálculo algorítmico, determinación u otra fijación por una unidad o módulo, que puede ser acoplado a la entrada 110i del formador de ventanas 110 de la modalidad del banco de filtros de análisis. En este caso, sin embargo, este módulo es comúnmente requerido para proporcionar como el cuadro de entrada 130-(k+1), un cuadro de entrada que comprende en la segunda subsección 150-2 en el área correspondiente a la sección inicial 160 del cuadro de entrada antes de muestras de entrada “significativas”, que corresponden a la señal de audio correspondiente. Además, la unidad o módulo acoplado a la entrada 110i del formador de ventanas 110 es también comúnmente requerido para proporcionar muestras de entrada significativas correspondientes a la señal de audio en la estructura de la primera subsección 150-1 del cuadro de entrada 130-(k+1).
[00022] En otras palabras, en este caso, el cuadro de entrada 130-k correspondiente al índice de cuadro k es provisto a la modalidad de un banco de filtros de análisis 100 después de que suficientes muestras de entrada son recolectadas, de tal manera que la subsección 150-1 de este cuadro de entrada puede ser llenada con estas muestras de entrada. El resto de la primera subsección 150-1, es decir la sección inicial 160 es luego llenada con muestras de entrada o valores de entrada, que pueden comprender valores aleatorios o cualquier otros valores tales como un valor predeterminado, fijo, adaptable o programable o cualquier otra combinación de valores. Ya que esto se puede hacer en principio a una velocidad muy alta en comparación con una frecuencia de toma de muestras típica, el proporcionar la sección inicial 160 del cuadro de entrada 130-k con tales muestras de entrada “sin significado”, no requiere un período de tiempo significativo en la escala presentada por una frecuencia de toma de muestras típica, tal como una frecuencia de toma de muestras en el intervalo de entre unos pocos kHz y hasta varios cientos de kHz.
[00023] Sin embargo, la unidad o módulo continúa recolectando muestras de entrada en base a la señal de audio para incorporar estas muestras de entrada al siguiente cuadro de entrada 130-(k+1) correspondiente al índice de cuadro k+1. En otras palabras, aunque el módulo o unidad no terminó de recolectar suficientes muestras de entrada para proporcionar el cuadro de entrada 130-k en términos de la primera subsección 150-1 con suficientes muestras de entrada para llenar completamente la primera subsección 150-1 de este cuadro de entrada, sino que proporciona este cuadro de entrada a la modalidad del banco de filtros de análisis 100 tan pronto como suficientes muestras de entrada están disponibles, de tal manera que la primera subsección 150-1 puede ser llenada con las muestras de entrada sin la sección inicial 160.
[00024] Las siguientes muestras de entrada serán usadas para llenar las muestras de entrada restantes de la segunda subsección 150-2 del siguiente cuadro de entrada 130-(k+1) hasta que suficientes muestras de entrada son recolectadas, de tal manera que la primera subsección 150-1 de este siguiente cuadro de entrada puede también ser llenada hasta que la sección inicial 160 de este cuadro comienza. Enseguida, una vez más, la sección inicial 160 será llenada con números aleatorios u otras muestras de entrada “sin significado” o valores de entrada.
[00025] Como consecuencia, aunque el valor por adelantado de la muestra 170, que es igual a la longitud de la subsección 150-2 a 150-4 en el caso de la modalidad mostrada en la Figura 2 es indicada en la Figura 2 y el error que representa el valor por adelantado de la muestra 170 es mostrada en la Figura 2 desde el comienzo de la sección inicial 160 del cuadro de entrada 130-k hasta el comienzo de la sección inicial 160 del siguiente cuadro de entrada 130-(k+1).
[00026] Como consecuencia adicional, una muestra de entrada correspondiente a un evento en la señal de audio correspondiente a la sección inicial 160 no estará presente en los últimos casos en los cuadros de entrada respectivos 130-k, sino en el siguiente cuadro de entrada 130-(k+1) en la estructura de la segunda subsección 150
2.
[00027] En otras palabras, muchas modalidades de un banco de filtros de análisis 100 pueden proporcionar un cuadro de salida con un retardo reducido ya que las muestras de entrada correspondientes a la sección inicial 160 no son parte del cuadro de entrada respectivo 130-k sino que solamente influenciarán el último cuadro de entrada 130-(k+1). En otras palabras, una modalidad de un banco de filtros de análisis puede ofrecer en muchas aplicaciones e implementaciones la ventaja de proporcionar el cuadro de salida en base al cuadro de entrada más pronto, ya que no se requiere que la primera subsección 150-1 comprenda el mismo número de muestras de entrada como la otra subsección 150-2 a 150-4. Sin embargo, la información comprendida en la “sección faltante” está comprendida en el siguiente cuadro de entrada 130 en la estructura de la segunda subsección 150-2 de aquel cuadro de entrada respectivo 130.
[00028] Sin embargo, como se indica anteriormente, también puede existir el caso, en el cual ninguno de los cuadros de entrada 130 comprende la sección inicial 160. En este caso, la longitud de cada uno de la cuadros de entrada 130 ya no es un múltiplo entero del valor por adelantado de la muestra 170 o la longitud de la subsección 150-2 a 150-4. Para ser más preciso, en este caso, la longitud de cada uno de la cuadros de entrada 130 difiere de los múltiples enteros correspondientes del valor por adelantado de la muestra por el número de muestras de entrada, que el módulo o unidad que proporciona el formador de ventanas 110 con los cuadros de entrada respectivos se detiene de proporcionar a la plena primera subsección 150-1. En otras palabras, la longitud global de tal cuadro de entrada 130 difiere del número entero respectivo de valores por adelantado de la muestra por la
5
15
25
35
45
55
65 E11173652
26-02-2015
diferencia entre las longitudes de la primera subsección 150-1 en comparación con la longitud de las otras subsecciones 150-2 a 150-4.
[00029] Sin embargo, en los últimos dos casos mencionados, el módulo o unidad, que puede por ejemplo comprender un tomador de muestras, una etapa de muestra y retención, un tomador de muestras y portador o un cuantificador, puede iniciar a proporcionar el cuadro de entrada correspondiente 130 brevemente después de un número predeterminado de muestras de entrada, de tal manera que cada uno de la cuadros de entrada 130 pueden ser provistos a la modalidad de un banco de filtros de análisis 100 con un retardo más corto en comparación con el caso en el cual la primera subsección completa 150-1 está llena con muestras de entrada correspondientes.
[00030] Como ya se indicó, tal unidad o módulo que puede ser acoplada a la entrada 110i del formador de ventanas 110 puede por ejemplo comprender un tomador de muestras y/o cuantificador tal como un convertidor análogo/digital (convertidor A/D). Sin embargo, dependiendo de la implementación concreta, tal módulo o unidad puede comprender además algo de memoria o registradores para almacenar las muestras de entrada correspondientes a la señal de audio.
[00031] Además, tal unidad o módulo puede proporcionar cada uno de los cuadros de entrada de manera traslapante, en base a un valor por adelantado de la muestra M. En otras palabras, un cuadro de entrada comprende más de dos veces el número de muestras de entrada en comparación con el número de muestras recolectada por cuadro o bloque. Tal unidad o módulo está en muchas modalidades adaptado de tal manera que dos cuadros de entrada generados consecutivamente están basados en una pluralidad de muestras que están desplazadas con respecto al tiempo por el valor por adelantado de la muestra. En este caso, el último cuadro de entrada de los dos cuadros de entrada generados consecutivamente está basado en por lo menos una muestra de salida nueva ya que la muestra de salida más anterior y la pluralidad mencionada anteriormente de muestras está desplazada más tarde por el valor por adelantado de la muestra en el cuadro de entrada más anterior de los dos cuadros de entrada.
[00032] Aunque, hasta ahora una modalidad de un banco de filtros de análisis 100 ha sido descrito en términos de cada cuadro de entrada 130 que comprende cuatro subsecciones 150, en donde la primera subsección 150 no se requiere que comprenda el mismo número de muestras de entrada como las otras subsecciones, no se requiere que sea igual a cuatro como en el caso mostrado en la Figura 2. Para ser más preciso, un cuadro de entrada 130 puede comprender en principio, un número arbitrario de muestras de entrada, que es mayor de dos veces el tamaño del valor por adelantado de la muestra M (flecha 170), en donde el número de valores de entrada de la sección inicial 160, si está presente, son requeridos para ser incluidos en este número, ya que podría ser útil considerar algunas implementaciones de una modalidad basada en un sistema que utiliza cuadros, en donde cada cuadro comprende un número de muestras que es idéntico al valor por adelantado de la muestra. En otras palabras, cualquier número de subsecciones, cada una que tiene una longitud idéntica al valor por adelantado de la muestra M (flecha 170) puede ser usada en la estructura de una modalidad de un banco de filtros de análisis 100, que es mayor o igual a tres en el caso de un sistema a base de cuadros. Si este no es el caso, en principio, cualquier número de muestras de entrada por cuadro de entrada 130 puede ser utilizado siendo mayor de dos veces el valor por adelantado de la muestra.
[00033] El formador de ventanas 110 de una modalidad de un banco de filtros de análisis 100, como se muestra en la Figura 1, está configurado para generar una pluralidad de cuadros de ventana en base a los correspondientes cuadros de entrada 130 en base al valor por adelantado de la muestra M (flecha 170) de manera traslapante como se explica previamente. Para ser más preciso, dependiendo de la implementación concreta de un formador de ventanas 110, el formador de ventanas 110 está configurado para generar el cuadro de ventana, en base a la función de ponderación o densificación, que puede por ejemplo comprender una dependencia logarítmica para modelar las características de audición del oído humano. Sin embargo, otras funciones de ponderación o densificación pueden también ser implementados, tales como un modelado de función de ponderación, las características psico-acústicas del oído humano. Sin embargo, la función de formador de ventana es implementada en una modalidad de un banco de filtros de análisis, puede también por ejemplo ser implementada de tal manera que cada una de las muestras de entrada de un cuadro de entrada sea multiplicada por una función de formación de ventana en tiempo real que comprende coeficientes de ventana específicos de muestra de valor real.
[00034] Un ejemplo para tal implementación es mostrado en la Figura 2. Para ser más precisos, la Figura 2 muestra una representación cruda esquemática de una función de ventana posible o una función de formación de ventana 180, mediante la cual el formador de ventana 110, como se muestra en la Figura 1 genera los cuadros de ventana, basados en los cuadros de entrada correspondientes 130. Dependiendo de la implementación concreta de un banco de filtros de análisis 100, el formador de ventanas 110 puede proporcionar además cuadros de ventana al convertidor de tiempo/frecuencia 120 de manera diferente.
[00035] En base a cada uno de los cuadros de entrada 130, el formador de ventanas 110 está configurado para generar un cuadro de ventana, en donde cada uno de los cuadros de ventana comprende una pluralidad de muestras de ventana. Para ser más precisos, el formador de ventana 110 puede estar configurado de maneras diferentes. Dependiendo de la longitud de un cuadro de entrada 130 y dependiendo de la longitud del cuadro de ventana a ser provisto al proveedor de tiempo/frecuencia 120, varias posibilidades de cómo el formador de ventana
5
15
25
35
45
55
65 E11173652
26-02-2015
110 es implementado para generar los cuadros de ventana pueden ser realizadas.
[00036] Si, por ejemplo, un cuadro de entrada 130 comprende una sección inicial 160, de tal manera que en el caso de la modalidad mostrada en la Figura 2 la primera subsección 150-1 de cada uno de los cuadros de entrada 130 comprende tantos valores de entrada o muestras de entrada como las otras subsecciones 150-2 a 150-4, el formador de ventana 110 puede por ejemplo estar configurado de tal manera que el cuadro de ventana también comprende el mismo número de muestras de ventana ya que el cuadro de entrada 130 comprende muestras de entrada de valores de entrada. En este caso, debido a la estructura de los cuadros de entrada 130, como se describe anteriormente, todas las muestras de entrada del cuadro de entrada aparte de los valores de entrada de los cuadros de entrada 130 en la sección inicial 160 pueden ser procesados por el formador de ventanas 110 en base a la función de formación de ventanas o la función de ventana como se describe previamente. Los valores de entrada de la sección inicial 160 pueden en este caso, ser ajustados a un valor predeterminado o a por lo menos un valor en un intervalo predeterminado.
[00037] El valor predeterminado puede por ejemplo ser una modalidad de algún banco de filtros de análisis 100 igual al valor 0 (cero), mientras que en otras modalidades, diferentes valores pueden ser deseables. Por ejemplo, es posible usar, en principio, cualquier valor con respecto a la sección inicial 160 de los cuadros de entrada 130, que indica que los valores correspondientes no son de significado en términos de la señal de audio. Por ejemplo, el valor predeterminado puede ser un valor que está fuera de un intervalo típico de muestras de entrada de una señal de audio. Por ejemplo, muestras de ventana al interior de una sección del cuadro de ventana correspondiente a la sección inicial 160 del cuadro de entrada 130 pueden ser ajustadas a un valor de dos veces o más la amplitud máxima de una señal de audio de entrada indicando que estos valores no corresponden a señales a ser procesadas adicionalmente. Otro valores, por ejemplo valores negativos de un valor absoluto específico de la implementación pueden también ser usados.
[00038] Además, en modalidades de un banco de filtros de análisis 100, las muestras de ventana de los cuadros de ventana correspondientes a la sección inicial 160 de un cuadro de entrada 130 puede también ser ajustadas a uno o más valores en un intervalo predeterminado. En principio, tal intervalo predeterminado, puede por ejemplo ser un intervalo de valores pequeños, que son en términos de una experiencia audible sin significado, de tal manera que el resultado es audiblemente indistinguible o de tal manera que la experiencia de escucha no es alterada significativamente. En este caso, el intervalo predeterminado puede por ejemplo ser expresado como un conjunto de valores que tienen un valor absoluto, que es menor o igual a un umbral máximo predeterminado, programable, adaptable o fijo. Tal umbral puede por ejemplo ser expresado como una potencia de 10 o una potencia de dos como 10s o 2s, en donde el s es un valor entero dependiendo de la implementación concreta.
[00039] Sin embargo, en principio el intervalo predeterminado puede también comprender valores que son mayores que algunos valores significativos. Para ser más preciso, el intervalo predeterminado puede también comprender valores, que comprenden un valor absoluto que es mayor o igual a un umbral mínimo programable, predeterminado
o fijo. Tal umbral mínimo puede en principio ser expresado otra vez en términos de una potencia de dos o una potencia de diez, como 2s o 10s, en donde s es una vez más un número entero dependiendo de la implementación concreta de una modalidad de un banco de filtros de análisis.
[00040] En el caso de una implementación digital, el intervalo predeterminado puede por ejemplo comprender valores que son expresables al ajustar o no ajustar el bit significativo mínimo o pluralidad de bits significativos mínimos en el caso de un intervalo predeterminado que comprende valores pequeños. En el caso de que el intervalo predeterminado comprenda valores más grandes, como se explica previamente, el intervalo predeterminado puede comprender valores, representables al ajustar o no ajustar el bit más significativo o una pluralidad de bits más significativos. Sin embargo, el valor predeterminado también como los intervalos predeterminados pueden también comprender otros valores, que pueden por ejemplo ser creados en base a los valores mencionados anteriormente y umbrales al multiplicar estos con un factor.
[00041] Dependiendo de la implementación concreta de una modalidad del banco de filtros de análisis 100, el formador de ventanas 110 puede también ser adaptado de tal manera que los cuadros de ventana provistos en la salida 110o no comprenden muestras de ventana correspondientes a cuadros de entrada de las secciones iniciales 160 de los cuadros de entrada 130. En este caso, la longitud del cuadro de ventana y la longitud de los cuadros de entrada correspondientes 130, puede por ejemplo diferir por la longitud de la sección inicial 160. En otras palabras, en este caso, el formador de ventanas 110 puede ser configurado o adaptado para omitir por lo menos una última muestra de entrada de acuerdo con el orden de las muestras de entrada como se describe previamente en términos de tiempo. En otras palabras, en algunas modalidades de un banco de filtros de análisis 100, el formador de ventanas 110 puede estar configurado de tal manera que uno o más o aún todos los valores de entrada o muestras de entrada de la sección inicial 160 de un cuadro de entrada 130 son omitidos. En este caso, la longitud del cuadro de ventana es igual a la diferencia entre las longitudes del cuadro de entrada 130 y la longitud de la sección inicial 160 del cuadro de entrada 130.
[00042] Como una opción adicional, cada uno de los cuadros de entrada 130 pueden no comprender una sección inicial 160, como se indica anteriormente. En este caso, la primera subsección 150-1 difiere en términos de la
5
10
15
20
25
30
35
40
45
50
55
60
65 E11173652
26-02-2015
longitud de la subsección respectiva 150 o en términos del número de muestras de entrada de las otras subsecciones 150-2 a 150-4. En este caso, el cuadro de ventana, puede comprender o no muestras de ventana o valores de ventana de tal manera que una primera subsección similar del cuadro de ventana correspondiente a la primera subsección 150-1 del cuadro de entrada 130 comprende el mismo número como muestras de ventana o valores de ventana como las otras subsecciones correspondientes a las subsecciones 150 del cuadro de entrada
130. En este caso, las muestras de ventana adicionales o valores de ventana pueden ser ajustados a un valor predeterminado o por lo menos un valor en el intervalo predeterminado, como se indica anteriormente.
[00043] Además, el formador de ventanas 110 puede estar configurado en modalidades de un banco de filtros de análisis 100 de tal manera que tanto el cuadro de entrada 130 y el cuadro de ventana resultante comprenden el mismo número de valores o muestras y en donde ambos, el cuadro de entrada 130 y los cuadros de ventana resultantes no comprenden la sección inicial 160 o muestras correspondientes a la sección inicial 160. En este caso, la primera subsección 150-1 del cuadro de entrada 130 también como la subsección correspondiente del cuadro de ventana comprenden menos valores de muestras en comparación con las otras subsecciones 150-2 a 150-4 del cuadro de entrada 130 de las subsecciones correspondientes del cuadro de ventana.
[00044] Se debe notar que, en principio, no se requiere que el cuadro de ventana corresponda ya sea a una longitud de un cuadro de entrada 130 que comprende una sección inicial 160 o a un cuadro de entrada 130 que no comprende una sección inicial 160. En principio, el formador de ventanas 110 puede también estar adaptado de tal manera que el cuadro de ventana comprende uno o más valores o muestras correspondientes a valores de la sección inicial 160 de un cuadro de entrada 130.
[00045] En este contexto, también se deben notar que en algunas modalidades de un banco de filtros de análisis 100, la sección inicial 160 representa o por lo menos comprende un subconjunto unido de índices de muestra n correspondientes a un subconjunto unido de valores de entrada o muestras de entrada de un cuadro de entrada 130. De aquí, si es aplicable, también los cuadros de ventana que comprenden una sección inicial correspondiente comprenden un subconjunto conectado de índices de muestra n de muestras de ventana correspondientes a la sección inicial respectiva del cuadro de ventana, que es también referido como la sección de partida o sección de inicio del cuadro de ventana. El resto del cuadro de ventana sin la sección inicial o sección de partida, que es algunas veces también denominada como la sección restante.
[00046] Como ya se indicó previamente, el formador de ventanas 110 puede en modalidades de un banco de filtros de análisis 100 ser adaptado para generar las muestras de ventana de valores de ventana de un cuadro de ventana no correspondiente a la sección inicial 160 de un cuadro de entrada 130, si está presente, en base a una función de ventana que puede incorporar modelos psico-acústicos, por ejemplo, en términos de generar las muestras de ventana en base a un cálculo logarítmico basado en las muestras de entrada correspondientes. Sin embargo, el formador de ventanas 110 puede también ser adaptado en modalidades diferentes de un banco de filtros de análisis 100, de tal manera que cada una de las muestras de ventana es generada al multiplicar una muestra de entrada correspondiente con un coeficiente de ventana específico de muestra de la función de ventana definida sobre un conjunto de definición.
[00047] En muchas modalidades de un banco de filtros de análisis 100, el formador de ventanas correspondiente 110 está adaptado de tal manera que la función de ventana, como por ejemplo, descrita por los coeficientes de ventana, es asimétrica sobre el conjunto de definición con respecto a un punto medio del conjunto de definición. Además, en muchas modalidades de un banco de filtros de análisis 100, los coeficientes de ventana de la función de ventana comprenden un valor absoluto de más de 10%, 20% o 30%, 50% de un valor absoluto máximo de todos los coeficientes de ventana de la función de ventana en la primera mitad del conjunto de definición con respecto al punto medio, en donde la función de ventana comprende menos coeficientes de ventana que tienen un valor absoluto de más del porcentaje mencionado anteriormente del valor absoluto máximo de los coeficientes de ventana en la segunda mitad del conjunto de definición, con respecto al punto medio. Tal función de ventana es mostrada esquemáticamente en el contexto de cada uno de los cuadros de entrada 130 en la Figura 2 como la función de ventana 180. Más ejemplos de funciones de ventana serán descritos en el contexto de las Figuras 5 a 11, incluyendo una breve discusión de propiedad espectrales y otras propiedades y oportunidades ofrecidas por algunas modalidades de un banco de filtros de análisis, también como un banco de filtros de síntesis que implementan funciones de ventana como se muestra en estas figuras y se describe en pasajes.
[00048] Aparte del formador de ventanas 110, una modalidad de un banco de filtros de análisis 100 también comprende el convertidor de tiempo/frecuencia 120, que es provisto con los cuadros de ventana del formador de ventanas 110. El convertidor de tiempo/frecuencia 120 está a su vez adaptado para generar un cuadro de salida o una pluralidad de cuadros de salida para cada uno de los cuadros de ventana, de tal manera que el cuadro de salida es una representación espectral del cuadro de ventana correspondiente. Como se explicará en más detalle posteriormente en la presente, el convertidor de tiempo/frecuencia 120 está adaptado de tal manera que el cuadro de salida comprende menos de la mitad del número de valores de salida en comparación con el número de muestras de entrada del cuadro de entrada o en comparación con la mitad del número de muestras de ventana de un cuadro de ventana.
5
15
25
35
45
55
65 E11173652
26-02-2015
[00049] Además, el convertidor de tiempo/frecuencia 120 puede ser implementado de tal manera que está basado en una transformada de coseno discreta y/o una transformada de seno discreta, de tal manera que el número de salida muestras de un cuadro de salida es menor de la mitad del número de muestras de entrada de un cuadro de entrada. Sin embargo, más detalles de implementación de modalidades posibles de un banco de filtros de análisis 100 serán bosquejadas brevemente.
[00050] En algunas modalidades de un banco de filtros de análisis, el convertidor de tiempo/frecuencia 120 está configurado de tal manera que emite un número de muestras de salida, que es igual al número de muestras de entrada de una sección de partida 150-2, 150-3, 150-4, que no es la sección de partida de la primera subsección 150-1 del cuadro de entrada 130 o que es idéntica al valor por adelantado de muestra 170. En otras palabras, en muchas modalidades de un banco de filtros de análisis 100, el número de muestras de salida es igual al número entero M que presenta el valor por adelantado de la muestra de una longitud de la subsección mencionada anteriormente 150 del cuadro de entrada 130. Valores típicos del valor por adelantado de muestra o M son en muchas modalidades 480 ó 512. Sin embargo, se debe notar que también números enteros diferentes M pueden fácilmente ser implementados en modalidades de un banco de filtros de análisis, tal como M = 360.
[00051] Además, se debe notar que en algunas modalidades de un banco de filtros de análisis la sección inicial 160 de un cuadro de entrada 130 o la diferencia entre el número de muestras en las otras subsecciones 150-2, 150-3, 150-4 y la primera subsección 150-1 de un cuadro de entrada 130 es igual a M/4. En otras palabras, en el caso de una modalidad de un banco de filtros de análisis 100 en los cuales M = 480, la longitud de la sección inicial 160 o la diferencia mencionada anteriormente es igual a 120 (=M/4) muestras, mientras que en el caso de M = 512, la longitud de la sección inicial 160 de la diferencia mencionada anteriormente es igual a 128 (=M/4) en algunas modalidades de un banco de filtros de análisis 100. Sin embargo, se debe notar que también en este caso, diferentes longitudes pueden también ser implementadas y no representan un límite en términos de una modalidad del banco de filtros de análisis 100.
[00052] Como también se indica anteriormente, ya que el convertidor de tiempo/frecuencia 120 puede por ejemplo estar basado en una transformada de coseno discreta o una transformada de seno discreta, modalidades de un banco de filtros de análisis son algunas veces también discutidas y explicadas en términos del parámetro N = 2M representa una longitud de un cuadro de entrada de un convertidor de transformada de coseno discreta modificado (MDCT). En las modalidades mencionadas anteriormente de un banco de filtros de análisis 100, el parámetro N es de aquí igual a 960 (M = 480) y 1024 (M = 512).
[00053] Como se explicará en más detalle posteriormente en la presente, modalidades de un banco de filtros de análisis 100 puede ofrecer como ventaja un retardo más bajo de un procesamiento de audio digital sin reducir la calidad de audio o un tanto significativamente. En otras palabras, una modalidad de un banco de filtros de análisis ofrece la oportunidad de implementar un modo de codificación de bajo retardo mejorado, por ejemplo en la estructura de un codec (audio) (codec = codificador/descodificador o codificación/decodificación), que ofrece un retardo más bajo, que tiene por lo menos una frecuencia de respuesta comparable y un comportamiento de pre-eco mejorado en comparación con muchos codecs disponibles. Además, como se explicará en el contexto de las modalidades de un sistema de conferencia en más detalle, solo una sola función de ventana para todas las clases de señales es capaz de obtener los beneficios mencionados anteriormente en algunas modalidades de un banco de filtros de análisis y modalidades de sistemas que comprenden una modalidad de un banco de filtros de análisis 100.
[00054] Para enfatizar, los cuadros de entrada de modalidades de un banco de filtros de análisis 100 no se requiere que comprendan las cuatro subsecciones 150-1 a 150-4 como se ilustra en la Figura 2. Esto representa solamente una posibilidad que ha sido escogida por propósitos de simplicidad. Así, también el formador de ventanas no es requerido que sea adaptado de tal manera que los cuadros de ventana también comprendan cuatro subsecciones correspondientes o que el convertidor de tiempo/frecuencia 120 sea adaptado de tal manera que es capaz de proporcionar el cuadro de salida en base a un cuadro de ventana que comprende cuatro subsecciones. Esto ha simplemente sido escogido en el contexto de la Figura 2 para ser capaz de explicar algunas modalidades de un banco de filtros de análisis 100 de una manera concisa y clara. Sin embargo, las afirmaciones en el contexto del cuadro de entrada en términos de la longitud del cuadro de entrada 130 pueden también ser transferidas a la longitud de los cuadros de ventana como se explica en el contexto de las diferentes opciones concernientes con la sección inicial 160 y su presencia en los cuadros de entrada 130.
[00055] En lo siguiente, una implementación posible de una modalidad de un banco de filtros de análisis en vista de una implementación de bajo retardo de codec de audio avanzada resiliente de error (ER AAC LD) será explicada con respecto a modificaciones con el fin de adaptar el banco de filtros de análisis del ER AAC LD para llegar a una modalidad de un banco de filtros de análisis 100 que es también algunas veces denominado como de bajo retardo (banco de filtros de análisis). En otras palabras, con el fin de llegar a un retardo suficientemente reducido o bajo, algunas modificaciones a un codificador estándar en el caso de un ER AAC LD podrían ser útiles, como se definen en lo siguiente.
[00056] En este caso, el formador de ventanas 110 de una modalidad de un banco de filtros de análisis 100 está configurado para generar las muestras de ventana Zin, en base a la ecuación o expresión
5
15
25
35
45
55
65 E11173652
26-02-2015
zi,n = w(N-1-n)-x'i,n, (1)
en donde i es un número entero que indica un índice de cuadro o un índice de bloque de un cuadro de ventana y/o de un cuadro de entrada, y en donde n es el número entero que indica un índice de muestra en el intervalo entre -N y N-1.
[00057] En otras palabras, en modalidades que comprenden una secuencia inicial 160 en la estructura de los cuadros de salida 130, la formación de ventana es extendida al paso al implementar la expresión o ecuación anterior para los índices de muestra n = -N,..., N-1, en donde w(n) es un coeficiente de ventana correspondiente a una función de ventana como se explicará en más detalle en el contexto de las Figuras 5 a 11. En el contexto de una modalidad del banco de filtros de análisis 100, la función de ventana de síntesis w es usada como la función de ventana de análisis al invertir el orden, como se puede ver al comparar el argumento de la función de ventana w(n-1n). La función de ventana para una modalidad de un banco de filtros de síntesis, como se resume en el contexto de las Figuras 3 y 4, puede ser construida o generada basada en la función de ventana de análisis al reflejar (por ejemplo, con respecto al punto medio del conjunto de definición) para obtener una versión reflejada. En otras palabras, la Figura 5 muestra una gráfica de las funciones de ventana de bajo retardo, en donde la ventana de análisis es simplemente una réplica inversa en el tiempo de la ventana de síntesis. En este contexto, también se debe notar que x'i,n representa una muestra de entrada o valor de entrada correspondiente al índice de bloque i y el índice de muestra n.
[00058] En otras palabras, en comparación con la implementación de ER AAC LD mencionada anteriormente (por ejemplo, en forma de un codec), que está basada en una longitud de ventana N de valores de 1024 ó 960 en base a la ventana de seno, la longitud de ventana de la ventana de retardo de tiempo comprendida en la ventana 110 de la modalidad del banco de filtros de análisis 100 es 2N(=4M), al extender la formación de ventana al pasado.
[00059] Como se explicará en más detalle en el contexto de las Figuras 5 a 11, los coeficientes de ventana w(n) para n=0,...,2N-l puede obedecer a las relaciones dadas en la Tabla 1 en el anexo y tabla 3 en el anexo para N=960 y N=1024 en algunas modalidades, respectivamente. Además, los coeficientes de ventana pueden comprender los valores dados en las Tablas 2 y 4 en el anexo para N=960 y N=1024 en el caso de algunas modalidades, respectivamente.
[00060] En términos del convertidor de tiempo/frecuencia 120, el algoritmo MDCT central (MDCT = Transformada de Coseno Discreta Modificada) como es implementada en la estructura del codec ER AAC LD está en su mayoría sin cambiar, pero comprende la ventana más grande como se explica, de tal manera que n está ahora corriendo de -N a N-1 en lugar de correr de cero a N-. Los coeficientes espectrales o valores de salida del cuadro de salida Xi,k son generados en base a la siguiente ecuación o expresión
imagen1(2)
para en donde zi,n es una muestra de ventana de un cuadro de ventana o una secuencia de entrada de ventana de un convertidor de tiempo/frecuencia 120 correspondiente al índice de muestra n y el índice de bloque i como se explica previamente. Además, k es un número entero que indica el índice de coeficiente espectral y N es un número entero que indica dos veces el número de valores de salida de un cuadro de salida o como se explica previamente, la longitud de ventana de una ventana de transformada en base al valor de secuencia de ventana como es implementado en el codec de ER AAC LD. El número entero no es un valor desplazado y dado por
imagen2
[00061] Dependiendo de la longitud concreta de un cuadro de entrada 130 como se explica en el contexto de la Figura 2, el convertidor de tiempo/frecuencia puede ser implementado en base a un cuadro de ventana que comprende muestras de ventana correspondientes a la sección inicial 160 de los cuadros de entrada 130. En otras palabras, en el caso de M=480 ó N=960, las ecuaciones anteriores están basadas en cuadros de ventana que comprenden una longitud de 1920 muestras de ventana. En el caso de una modalidad de un banco de filtros de análisis 100 en el cual los cuadros de ventana no comprenden muestras de ventana correspondientes a la sección inicial 160 de los cuadros de entrada, 130, los cuadros de ventana comprenden la longitud de 1800 muestras de ventana en el caso mencionado anteriormente de M=480. En este caso, las ecuaciones dadas anteriormente pueden ser adaptadas de tal manera que las ecuaciones correspondientes se lleven a cabo. En el caso del formador de ventanas 110, este puede por ejemplo conducir al índice de muestra n que corre de -N,..., 7N/8-1 en el caso de M/4 = N/8 muestras de ventana faltantes en la primera subsección, en comparación con las otras subsecciones del cuadro de ventana como se explica previamente.
[00062] Así, en el caso de un convertidor de tiempo/frecuencia 120, la ecuación dada anteriormente puede ser
5
10
15
20
25
30
35
40
45
50
55
60
65 E11173652
26-02-2015
adaptada fácilmente al modificar los índices de suma de conformidad para no incorporar las muestras de ventana de la sección inicial o sección de partida del cuadro de ventana. Por supuesto, modificaciones adicionales pueden ser obtenidas fácilmente de conformidad en el caso de una longitud diferente de la sección inicial 160 de los cuadros de entrada 130 o en el caso de la diferencia entre la longitud de la primera subsección y las otras subsecciones del cuadro de ventana, como también se explica previamente.
[00063] En otras palabras, dependiendo de la implementación concreta de una modalidad del banco de filtros de análisis 100, no se requiere que todos los cálculos como se indica por las expresiones y ecuaciones anteriores se lleven a cabo. Modalidades adicionales de un banco de filtros de análisis pueden también comprender una implementación en la cual el número de cálculos puede ser aún más reducido, en principio, conduciendo a una eficiencia computacional más alta. Un ejemplo en el caso del banco de filtro de síntesis será descrito en el contexto de la Figura 19.
[00064] En particular, como también se explicará en el contexto de una modalidad de un banco de filtros de síntesis, una modalidad de un banco de filtros de análisis 100 puede ser implementada en la estructura del llamado bajo retardo mejorado de codec de audio avanzado resiliente de error (ER AAC ELD) que es derivado del codec ER AAC LD mencionado anteriormente. Como se describe, el banco de filtros de análisis del codec ER AAC LD es modificado para llegar a una modalidad del banco de filtros de análisis 100 con el fin de adoptar el banco de filtros de bajo retardo como una modalidad de un banco de filtros de análisis 100. Como se explicará en más detalle, el codec ER AAC ELD que comprende una modalidad de un banco de filtros de análisis 100 y/o una modalidad de un banco de filtros de síntesis, que será explicado en más detalle posteriormente, proporciona la habilidad de extender el uso de codificación de audio de baja velocidad de bits genérica a aplicaciones que requieren un retardo muy bajo de la cadena de codificación/decodificación. Ejemplos vienen por ejemplo del campo de comunicaciones en tiempo real plenamente dúplex, en las cuales diferentes modalidades pueden ser incorporadas, tales como modalidades de un banco de filtros de análisis, banco de filtros de síntesis, un descodificador y codificador, un mezclador y un sistema de conferencia.
[00065] Antes de describir modalidades adicionales de la presente invención en más detalle, se debe notar que objetos, estructuras y componentes con la misma propiedad funcional o propiedad funcional similar son denotados con los mismos signos de referencia. A no ser que se indique explícitamente de otra manera, la descripción con respecto a objetos, estructuras y componentes con propiedades funcionales similares o propiedades funcionales iguales y elementos similares o iguales pueden ser intercambiados entre sí. Además, en lo siguiente signos de referencia en resumen para objetos, estructuras o componentes que son idénticos o similares en una modalidad o en una estructura mostrados en una de las Figuras, serán usados, a no ser que las propiedades o elementos de un objeto, estructura o componente específico sean discutidos. Como un ejemplo, en el contexto de los cuadros de entrada 130 que resumen signos de referencia ya se han incorporado. En la descripción concerniente a los cuadros de entrada en la Figura 2, si un cuadro de entrada específico se hizo referencia, el sino de referencia específico de aquel cuadro de entrada, por ejemplo 130-k fue usado, mientras que en el caso de todos los cuadros de entrada o un cuadro de entrada, que no es distinguido específicamente de los otros a los que se hace referencia, los signos de referencia de resumen 130 han sido usados. El uso de signos de referencia resumidos permiten mediante esto una recepción más compacta y más clara de modalidades de la presente invención.
[00066] Además, en este contexto se debe notar que en la estructura de la presente solicitud, un primer componente que está acoplado a un segundo componente puede estar unido directamente o unido vía circuitos adicionales o componentes adicionales al segundo componente. En otras palabras, en la estructura de la presente solicitud, dos componentes que son cercanos entre sí comprenden las dos alternativas de los componentes siendo unidos directamente entre sí o vía circuitos adicionales de un componente adicional.
[00067] La Figura 3 muestra una modalidad de un banco de filtros de síntesis 200 para filtrar una pluralidad de cuadros de entrada, en donde cada cuadro de entrada comprende un número de valores de entrada ordenados. La modalidad del banco de filtro de síntesis 200 comprende un convertidor de frecuencia/tiempo 210, un formador de ventanas 220 y un traslapador/sumador 230 acoplados en serie.
[00068] Una pluralidad de cuadros de entrada provisto a la modalidad del banco de filtros de síntesis 200 serán procesados primero por el convertidor de frecuencia/tiempo 210. Es capaz de generar una pluralidad de cuadros de salida en base a los cuadros de entrada, de tal manera que cada cuadro de salida es una representación temporal del cuadro de entrada correspondiente. En otras palabras, el convertidor de frecuencia/tiempo 210 efectúa una transición para cada cuadro de entrada del dominio de frecuencia al dominio de tiempo.
[00069] El formador de ventanas 220, que es acoplado al convertidor de frecuencia/tiempo 210, es luego capaz de procesar cada cuadro de salida tal como es provisto por el convertidor de frecuencia/tiempo 210 para generar un cuadro de ventana en base a este cuadro de salida. En algunas modalidades de un banco de filtros de síntesis 200, el formador de ventanas 220 es capaz de generar los cuadros de ventana al procesar cada una de las muestras de salida de cada uno de los cuadros de salida, en donde cada cuadro de ventana comprende una pluralidad de muestras de ventana.
5
15
25
35
45
55
65 E11173652
26-02-2015
[00070] Dependiendo de la implementación concreta de la modalidad del banco de filtros de síntesis 200, el formador de ventanas 220 es apto de generar los cuadros de ventana en base a los cuadros de salida al ponderar las muestras de salida en base a una función de ponderación o densificación. Como se explica previamente en el contexto del formador de ventanas 110 de la Figura 1, la función de ponderación o densificación puede por ejemplo estar basada en un modelo psico-acústico que incorpora las capacidades o propiedades de audición del oído humano, tal como la dependencia logarítmica del volumen de una señal de audio.
[00071] Adicional o alternativamente, el formador de ventanas 220 puede también generar el cuadro de ventana en base al cuadro de salida al multiplicar cada muestra de salida de un cuadro de salida con un valor específico de muestra de una ventana, función de formación de ventana o función de ventana. Estos valores también son denominados como coeficientes de ventana o coeficientes de formación de ventana. En otras palabras, el formador de ventanas 220 puede estar adaptado en por lo menos algunas modalidades de un banco de filtros de síntesis 200 para generar las muestras de ventana de un cuadro de ventana al multiplicar estos con una función de ventana que atribuye un coeficiente de ventana de valor real a cada uno de un conjunto de elementos de un conjunto de definición.
[00072] Ejemplos de tales funciones de ventana serán discutidos en más detalle en el contexto de las Figuras 5 a
11. Además, se debe notar que esta función de ventana puede ser asimétrica o no asimétrica con respecto a un punto medio del conjunto de definición, que no se requiere que sea un elemento del conjunto de definición mismo.
[00073] Además, el formador de ventanas 220 genera la pluralidad de muestras de ventana para un procesamiento adicional de manera traslapante, en base a un valor por adelantado de la muestra por el traslapador/sumador 230, como se explicará en más detalle en el contexto de la Figura 4. En otras palabras, cada uno de los cuadros de ventana comprende más de dos veces el número de muestras de ventana en comparación con un número de muestras agregadas como se proporciona por el traslapador/sumador 230 acoplado a una salida del formador de ventanas 220. Como consecuencia, el traslapador/sumador es luego capaz de generar un cuadro agregado de manera traslapante al agregar por lo menos tres muestras de ventana de por lo menos tres cuadros de ventana diferentes para por lo menos algunas de las muestras agregadas en modalidades de un banco de filtros de síntesis
200.
[00074] El traslapador/sumador 230 acoplado al formador de ventanas 220 es luego capaz de generar o proporcionar un cuadro agregado para cada cuadro de ventana recién recibido. Sin embargo, como se menciona previamente, el traslapador/sumador 230 opera los cuadros de ventana de manera traslapante para generar un solo cuadro agregado.
[00075] Cada cuadro agregado comprende una sección de partida y una sección restante, como se explicará en más detalle en el contexto de la Figura 4 y comprende además una pluralidad de muestras agregadas al agregar por lo menos tres muestras de ventana de por lo menos tres cuadros de ventana diferentes para un agregado en la sección restante de un cuadro agregado y al agregar por lo menos dos muestras de ventana de por lo menos dos cuadros de ventana diferentes para muestras agregadas en la sección de partida. Dependiendo de la implementación, el número de muestras de ventana agregadas para obtener una muestra agregada en la sección restante puede ser por lo menos una muestra más alta en comparación con el número de muestras de ventana agregadas para obtener una muestra agregada en la sección de partida.
[00076] Alternativa o adicionalmente y dependiendo de la implementación concreta de una modalidad del banco de filtros de síntesis 200, el formador de ventanas 220 puede también estar configurado para omitir el valor de salida más anterior de acuerdo con el orden de las muestras de salida ordenadas, para ajustar las muestras de ventana correspondientes a un valor predeterminado o a por lo menos un valor en el intervalo predeterminado para cada cuadro de ventana de la pluralidad de cuadros de ventana. Además, el traslapador/sumador 230 puede en este caso ser capaz de proporcionar la muestra agregada en la sección restante de un cuadro agregado, en base a por lo menos tres muestras de ventana de por lo menos tres cuadros de ventana diferentes y una muestra agregada en la sección de partida en base a por lo menos dos muestras de ventana de por lo menos dos cuadros de ventana diferentes, como se explicará en el contexto de la Figura 4.
[00077] La Figura 4 muestra una representación esquemática de cinco cuadros de salida 240 correspondientes a los índices de cuadro k, k-1, k-2, k-3 y k+1, que son marcados de conformidad. Similar a la representación esquemática mostrada en la Figura 2, los cinco cuadros de salida 240 mostrados en la Figura 4 están dispuestos de acuerdo con su orden con respecto al tiempo como se indica por la flecha 250. Con referencia al cuadro de salida 240-k, los cuadros de salida 240-(k-1), 240-(k-2) y 240-(k-3) se refieren a cuadros de salida del pasado 240. Así, el cuadro de salida 240-(k+1) es con respecto al cuadro de salida 240-k un cuadro de salida siguiente o futuro.
[00078] Como ya se discutió en el contexto de los cuadros de entrada 130 de la Figura 2, también los cuadros de salida 240 mostrados en la Figura 4 comprende, en el caso de la modalidad mostrada en la Figura 4, cuatro subconjuntos 260-1, 260-2, 260-3 y 260-4 cada uno. Dependiendo de la implementación concreta de la modalidad de un banco de filtros de síntesis 200, la primera subsección 260-1 de cada uno de los cuadros de salida 240, puede comprender o no una sección inicial 270, como ya se discutió en la estructura de la Figura 2 en el contexto de la
5
15
25
35
45
55
65 E11173652
26-02-2015
sección inicial 160 de los cuadros de entrada 130. Como consecuencia, la primera subsección 260-1 puede ser más corta en comparación con las otras subsecciones 260-2, 260-3 y 260-4 en la modalidad ilustrada en la Figura 4. Las otras subsecciones 260-2, 260-3 y 260-4, sin embargo, comprenden cada una un número de muestras de salida igual al valor por adelantado de la muestra mencionada anteriormente M.
[00079] Como se describe en el contexto de la Figura 3, el convertidor de frecuencia/tiempo 210 está en la modalidad mostrada en la Figura 3 provisto con una pluralidad de cuadros de entrada en base de los cuales el convertidor de frecuencia/tiempo 210 genera una pluralidad de cuadros de salida. En algunas modalidades de un banco de filtros de síntesis 200, la longitud de cada uno de los cuadros de entrada es idéntica al valor por adelantado de la muestra M, en donde M es una vez más un número entero positivo. Los cuadros de salida generados por el convertidor de frecuencia/tiempo 210 comprenden sin embargo por lo menos más de dos veces el número de valores de entrada de un cuadro de entrada. Para ser más precisos, en una modalidad de acuerdo con la situación mostrada en la Figura 4, los cuadros de salida 240 comprenden aún más de tres veces el número de muestras de salida en comparación con el número de valores de entrada, cada uno de los cuales también comprende en modalidades relacionadas con la situación mostrada M valores de entrada. Como consecuencia, los cuadros de salida pueden ser divididos en subsecciones 260, en donde cada una de las subsecciones 260 de los cuadros de salida 240 (opcionalmente sin la primera subsección 260-1, como se discute anteriormente) comprende M muestras de salida. Además, la sección inicial 270 puede en algunas modalidades comprender M/4 muestras. En otras palabras, en el caso de M = 480 o M = 512, la sección inicial 270, si está presente, puede comprender 120 ó 128 muestras o valores.
[00080] En todavía otras palabras, como se explica en el contexto de las modalidades del banco de filtros de análisis 100 anterior, el valor por adelantado de la muestra M es también idéntico a las longitudes de las subsecciones 2602, 260-3 y 260-4 de los cuadros de salida 240. Dependiendo de la implementación concreta de una modalidad de un banco de filtros de síntesis 200, también la primera subsección 260-1 del cuadro de salida 240 puede comprender M muestras de salida. Sin embargo, si la sección inicial 270 del cuadro de salida 240 no existe, la primera subsección 260-1 de cada uno de los cuadros de salida 240 es más corta que las subsecciones restantes 260-2 a 260-4 de los cuadros de salida 240.
[00081] Como se menciona previamente, el convertidor de frecuencia/tiempo 210 proporciona al formador de ventanas 220 una pluralidad de los cuadros de salida 240, en donde cada uno de los cuadros de salida comprende un número de muestras de salida que es más grande que dos veces el valor por adelantado de la muestra M. El formador de ventanas 220 es luego capaz de generar cuadros de ventana, en base al cuadro de salida actual 240, tal como es provisto por el convertidor de frecuencia/tiempo 210. Más explícitamente, cada uno de los cuadros de ventana correspondientes a un cuadro de salida 240 es generado en base a la función de ponderación o función de densificación, como se menciona previamente. En una modalidad basada en la situación mostrada en la Figura 4, la función de ponderación está a su vez basada en una función de ventana 280, que es mostrada esquemáticamente sobre cada uno de los cuadros de salida 240. En este contexto, también de debe notar que la función de ventana 280 no produce ninguna contribución para muestras de salida en la sección inicial 270 del cuadro de salida 240, si está presente.
[00082] Sin embargo, como consecuencia, dependiendo de las implementaciones concretas de diferentes modalidades del banco de filtro de síntesis 200, diferentes casos tienen que ser considerados una vez más. Dependiendo del convertidor de frecuencia/tiempo 210, el formador de ventanas 220 puede estar adaptado o configurado bastante diferentemente.
[00083] Si, por ejemplo, por una parte, la sección inicial 270 de los cuadros de salida 240 está presente de tal manera que también las primeras subsecciones 260-1 de los cuadros de salida 240 comprenden M muestras de salida, el formador de ventanas 220 puede estar adaptado de tal manera que puede o puede no generar cuadros de ventana en base a los cuadros de salida que comprenden el mismo número de muestras de ventana. En otras palabras, el formador de ventanas 220 puede ser implementado de tal manera que genera cuadros de ventana que también comprenden una sección inicial 270, que puede ser implementada, por ejemplo, al ajustar las muestras de ventana correspondientes a un valor predeterminado (por ejemplo, cero, dos veces una amplitud de señal permisible máxima, etc.) o a por lo menos un valor en un intervalo predeterminado, como se discute previamente en el contexto de las Figuras 1 y 2.
[00084] En este caso, tanto el cuadro de salida 240 también como el cuadro de ventana en base al cuadro de salida 240, puede comprender el mismo número de muestras o valores. Sin embargo, las muestras de ventana en la sección inicial 270 del cuadro de ventana no dependen necesariamente de las muestras de salida correspondientes del cuadro de salida 240. La primera subsección 260-1 del cuadro de ventana está, sin embargo, con respecto a las muestras no en la sección inicial 270 basada en el cuadro de salida 240 como se proporciona por el convertidor de frecuencia/tiempo 210.
[00085] Para resumir, si por lo menos un muestra de salida de la sección inicial 270 de un cuadro de salida 240 está presente, la muestra de ventana correspondiente puede ser ajustada a un valor predeterminado o a un valor en un intervalo predeterminado, como se explicó en el contexto de una modalidad de un banco de filtros de análisis
5
15
25
35
45
55
65 E11173652
26-02-2015
ilustrado en las Figuras 1 y 2. En el caso de que la sección inicial 270 comprenda más de una muestra de ventana, lo mismo puede también ser cierto para esta o estas otras muestras o valores de ventana de la sección inicial 270.
[00086] Además, el formador de ventanas 220 puede ser adaptado de tal manera que los cuadros de ventana no comprenden una sección inicial 270. En el caso de tal modalidad del banco de filtros de síntesis 200, el formador de ventanas 220 puede estar configurado para omitir las muestras de salida de los cuadros de salida 240 en la sección inicial 270 del cuadro de salida 240.
[00087] En cualquiera de estos casos, dependiendo de la implementación concreta de tal modalidad, la primera subsección 260-1 de un cuadro de ventana puede o puede no comprender la sección inicial 270. Si una sección inicial del cuadro de ventana existe, las muestras de ventana o valores de esta sección no son requeridas para depender de las muestras de salida correspondientes del cuadro de salida respectivo.
[00088] Por otra parte, si el cuadro de salida 240 no comprende la sección inicial 270, el formador de ventanas 220 puede también estar configurado para generar un cuadro de ventana en base al cuadro de salida 240 que comprende o no comprende una sección inicial 270 por sí mismo. Si el número de muestras de salida de la primera subsección 260-1 es menor que el valor por adelantado de la muestra M, el formador de ventanas 220 puede en algunas modalidades de un banco de filtros de síntesis 200 ser capaz de ajustar las muestras de ventana correspondientes a las “muestras de salida faltantes” de la sección inicial 270 del cuadro de ventana al valor predeterminado o a por lo menos un valor en el intervalo predeterminado. En otras palabras, el formador de ventanas 220 puede en este caso ser capaz de llenar el cuadro de ventana con el valor predeterminado o por lo menos un valor en el intervalo predeterminado, de tal manera que el cuadro de ventana resultante comprende un número de muestras de ventana, que es un múltiplo entero del valor por adelantado de la muestra M, el tamaño de un cuadro de entrada o la longitud de un cuadro agregado.
[00089] Sin embargo, como una opción adicional, que podría ser implementada, ambos de los cuadros de salida 240 y los cuadros de ventana podrían no comprender una sección inicial 270. En este caso, el formador de ventanas 220 puede estar configurado para simplemente ponderar por lo menos algunas de las muestras de salida del cuadro de salida para obtener el cuadro de ventana. Adicional o alternativamente, el formador de ventanas 220 podría emplear una función de ventana 280 o los semejantes.
[00090] Como se explica previamente en el contexto de la modalidad del banco de filtros de análisis 100 mostrada en las Figuras 1 y 2, la sección inicial 270 de los cuadros de salida 240 corresponde a las muestras más anteriores en el cuadro de salida 250 en el sentido de que estos valores corresponden a las muestras “más nuevas” que tienen el índice de muestra más pequeño. En otras palabras, considerando todas las muestras de salida del cuadro de salida 240, estas muestras se refieren a muestras correspondiente a una cantidad más pequeña de tiempo que habrá transcurrido cuando se reproduce una muestra agregada correspondiente tal como es provista por el traslapador/sumador 230 en comparación con las otras muestras de salida del cuadro de salida 240. En otras palabras, al interior del cuadro de salida 240 y al interior de cada una de las subsecciones 260 del cuadro de salida, las muestras de salida corresponde más nuevas corresponden a una posición dejada en el cuadro de salida respectivo 240 o subsección 260. En todavía otras palabras, el tiempo como se indica por la flecha 250 corresponde a la secuencia de cuadros de salida 240 y no a la secuencia de muestras de salida al interior de cada uno de los cuadros de salida 240.
[00091] Sin embargo, antes de recibir el procesamiento de los cuadros de ventana 240 por el traslapador/sumador 230 en más detalle, se debe notar que en muchas modalidades del banco de filtro de síntesis 200, el convertidor de frecuencia/tiempo 210 y/o el formador de ventanas 220 están adaptados de tal manera que la sección inicial 270 del cuadro de salida 240 y el cuadro de ventana están ya sea completamente presentes o no presentes. En el primer caso, el número de muestras de salida o muestras de ventana en la primera subsección 260-1 es así igual al número de muestras de salida en un cuadro de salida, que es igual a M. Sin embargo, modalidades de un banco de filtros de síntesis 200 pueden también ser implementadas, en los cuales ya sea uno u otro o ambos del convertidor de frecuencia/tiempo 210 y el formador de ventanas 220 pueden estar configurados de tal manera que la sección inicial 270 está presente, pero el número de muestras en la primera subsección 260-1 es todavía más pequeño que el número de muestras de salida en un cuadro de salida de un convertidor de frecuencia/tiempo 210. Además, se debe notar que en muchas modalidades todas las muestras o valores de cualquiera de los cuadros son tratados como tal, aunque por supuesto solo uno o una fracción de los valores o muestras correspondientes pueden ser utilizados.
[00092] El traslapador/sumador 230 acoplado al formador de ventanas 220 es capaz de proporcionar un cuadro agregado 290, como se indica en la parte inferior de la Figura 4, que comprende una sección de partida 300 y una sección restante 310. Dependiendo de la implementación concreta de una modalidad de un banco de filtros de síntesis 200, el traslapador/sumador 230 puede ser implementado de tal manera que una muestra agregada como está comprendida en el cuadro agregado en la sección de partida es obtenida al agregar por lo menos dos muestras de ventana de por lo menos dos cuadros de ventana diferentes. Para ser más precisos, ya que las modalidades mostradas en la Figura 4 están basadas en cuatro subsecciones 260-1 a 260-4 en el caso de cada uno de los cuadros de salida 240 y los cuadros de ventana correspondientes, una muestra agregada en la sección de partida 300 está basada en tres o cuatro muestras o valores de ventana de por lo menos tres o cuatro cuadros de ventana
5
10
15
20
25
30
35
40
45
50
55
60
65 E11173652
26-02-2015
diferentes, respectivamente, como se indica por la flecha 320. La pregunta, de si tres o cuatro muestras de ventana serán usada en el caso de la modalidad usada en la Figura 4 depende de la implementación concreta de la modalidad en términos de la sección inicial 270 del cuadro de ventana basado en el cuadro de salida correspondiente 240-k.
[00093] En lo siguiente, con referencia a la Figura 4, se podría pensar de los cuadros de salida 240 como se muestra en la Figura 4 como los cuadros de ventana provistos por el formador de ventanas 220 en base a los cuadros de salida respectivos 240, ya que los cuadros de ventana son obtenidos en la situación ilustrada en la Figura 4 al multiplicar por lo menos las muestras de salida de los cuadros de salida 240 al exterior de la sección inicial 270 con valores derivados de la función de ventana 280. De aquí, en lo siguiente con respecto al traslapador/sumador 230, el signo de referencia 240 puede también ser usado para un cuadro de ventana.
[00094] En el caso del formador de ventanas 220 que es adaptado de tal manera que las muestras de ventana en una sección inicial existente 270 es ajustado a un valor predeterminado o a un valor en el intervalo predeterminado, la muestra de ventana o valor de ventana en la sección inicial 270 puede ser utilizado al sumar las tres muestras agregadas restantes de la segunda subsección del cuadro de ventana 240-(k-1) (correspondiente al cuadro de salida 240-(k-1)), la tercera subsección del cuadro de ventana 240-(k-2) (correspondiente al cuadro de salida 240-(k-2)) y la cuarta subsección del cuadro de ventana 240-(k-3) (correspondiente al cuadro de salida 240-(k-3)), si el valor predeterminado o el intervalo predeterminado son de tal manera que la suma de la muestra de ventana de la sección inicial 270 del cuadro de ventana 240-k (correspondiente al cuadro de salida 240-k) no altera o perturba significativamente el resultado.
[00095] En el caso de que el formador de ventanas 220 esté adaptado de tal manera que una sección inicial 270 no existe en el caso de un cuadro de ventana, la muestra agregada correspondiente en la sección de inicio 300 es obtenida normalmente al agregar las por lo menos dos muestras de ventana del por lo menos dos cuadros de ventana. Sin embargo, ya que la modalidad mostrada en la Figura 4 está basada en un cuadro de ventana que comprende cuatro subsecciones 260 cada uno, en este caso, la muestra agregada en la sección de partida del cuadro agregado 290 es obtenida al sumar las tres muestras de ventana mencionadas anteriormente de los cuadros de ventana 240-(k-1), 240-U-2) y 240-(k-3).
[00096] Este caso puede, por ejemplo, ser provocada por el formador de ventanas 220 que es adaptado de tal manera que una muestra de salida correspondiente de un cuadro de salida es omitido por el formador de ventanas
220. Sin embargo, se debe notar que si el valor predeterminado o el intervalo predeterminado comprende valores, que conducirían a una alteración de la muestra agregada, el traslapador/sumador 230 pueden ser configurados de tal manera que la muestra de ventana correspondiente no es tomada en consideración para agregar la muestra de ventana respectiva para obtener la muestra agregada. En este caso, las muestras de ventana en la sección inicial 270 pueden también ser consideradas para ser omitidas por el traslapador/sumador, ya que las muestras de ventana correspondientes no serán usadas para obtener la muestra agregada en la sección de partida 300.
[00097] En términos de una muestra agregada en la sección restante 310, como se indica por la flecha 330 en la Figura 4, el traslapador/sumador 230 está adaptado para agregar por lo menos tres muestras de ventana de por lo menos tres cuadros de ventana diferentes 240 (correspondientes a tres cuadros de salida diferentes 240). Una vez más, debido al hecho de que un cuadro de ventana 240 en la modalidad mostrada en la Figura 4 comprende cuatro subsecciones 260, una muestra agregada en la sección restante 310 será generada por el traslapador/sumador 230 al agregar hasta cuatro muestras de ventana de cuatro cuadros de ventana diferentes 240. Para ser más precisos, una muestra agregada en la sección restante 310 del cuadro agregado 290 es obtenida por el traslapador/sumador 230 al agregar la muestra de ventana correspondiente de la primera sección 260-1 del cuadro de ventana 240-k, de la segunda subsección 260-2 del cuadro de ventana 240-(k-1) de la tercera subsección 260-3 del cuadro de ventana 240-(k-2) y de la cuarta subsección 260-4 del cuadro de ventana 240-(k-3).
[00098] Como consecuencia del traslape/suma descritos como se menciona, el cuadro agregado 290 comprende M = N/2 muestras agregadas. En otras palabras, el valor por adelantado de la muestra M es igual a la longitud del cuadro agregado 290. Además, por lo menos en términos de algunas modalidades de un banco de filtros de síntesis 200, también la longitud de un cuadro de entrada es, como se menciona anteriormente, igual al valor por adelantado de la muestra M.
[00099] El hecho de que en la modalidad mostrada en la Figura 4, por lo menos tres o cuatro muestras de ventana son utilizadas para obtener una muestra agregada en la sección de partida 300 y la sección restante 310 del cuadro agregado, respectivamente, se ha escogido para propósitos de simplicidad solamente. En la modalidad mostrada en la Figura 4, cada uno de los cuadros de salida/ventana 240 comprende cuatro secciones de partida 260-1 a 260-4. Sin embargo, en principio, una modalidad del banco de filtros de síntesis puede fácilmente ser implementada en la cual una cuadro de salida o cuadro de ventana solamente comprende una muestra de ventana más de dos veces el número de muestras agregadas de un cuadro agregado 290. En otras palabras, una modalidad del banco de filtros de síntesis 200 puede ser adaptada de tal manera que cada cuadro de ventana solamente comprende 2M+1 muestras de ventana.
E11173652
26-02-2015
[000100] Como se explica en el contexto de una modalidad de un banco de filtros de análisis 100, una modalidad de un banco de filtros de síntesis 200 puede también ser incorporada a la estructura de un codec de ER AAC ELD (codec = codificador / descodificador) mediante una modificación de un codec ER AAC LD. Por consiguiente, una modalidad de un filtro de síntesis 200 puede ser usada en el contexto de un codec AAC LD con el fin de definir un
5 sistema de codificación/decodificación de audio de baja velocidad de bits y bajo retardo. Por ejemplo, una modalidad de un banco de filtros de síntesis puede consistir de un descodificador para el codec de ER AAC ELD junto con una herramienta de SOBRE opcional (SBR = Replicación de Banco Espectral). Sin embargo, con el fin de obtener un retardo suficientemente bajo, algunas modificaciones podrían ser recomendables para implementar en comparación con un codec de ER AAC LD para llegar a una implementación de una modalidad el banco de filtros de síntesis 200.
10 [000101] El banco de filtro de síntesis de los codecs mencionados anteriormente puede ser modificado con el fin de adaptar una modalidad de un banco de filtros bajo (síntesis), en donde el algoritmo de IMDCT de núcleo (IMDCT = Transformada de Coseno Discreta Modificada Inversa) puede permanecer en su mayoría sin cambiar en términos del convertidor de frecuencia/tiempo 210. Sin embargo, en comparación con un convertidor de frecuencia/tiempo de
15 IMDCT, el convertidor de frecuencia/tiempo 210 puede ser implementado con una función de ventana más larga, de tal manera que el índice de muestra n está ahora corriendo hasta 2N-1, en lugar de hasta N-1.
[000102] Para ser más precisos, el convertidor de frecuencia/tiempo 210 puede ser implementado de tal manera que esté configurado para proporciona valores de salida Xi,n basaos en la expresión
imagen3
25 para 0≤n<2N en donde n es, como se menciona previamente, un número entero que indica un índice de muestra, i es un número entero que indica un índice de ventana, k es un índice de coeficiente espectral, N es una longitud de ventana basada en el parámetro windows_secuencia de una implementación de codec de ER AAC LD de tal manera que el número entero N es dos veces el número de muestras agregadas de un cuadro agregado 290. Además, n0 es un valor
30 desplazado dado por
imagen4
en donde spec[i][k] es una valor de entrada correspondiente al índice de coeficiente espectral k y el índice de
35 ventana I del cuadro de entrada. En algunas modalidades de un banco de filtros de síntesis 200, el parámetro N es igual a 960 ó 1024. Sin embargo, en principio, el parámetro N puede también adquirir cualquier valor. En otras palabras, modalidades adicionales de un banco de filtros de síntesis 200 puede operar en base a un parámetro N=360 u otros valores.
40 [000103] El formador de ventanas 220 y el traslapador/sumador 230 puede también ser modificados en comparación con la formación de ventana y traslape/sumas implementados en la estructura de un codec ER AAC LD. Para ser más precisos, en comparación con el codec mencionado anteriormente, la longitud N de una función de ventana es reemplazada por una longitud 2N función de ventana con más superposición o traslape en el pasado y menos superposición o traslape en el futuro. Como será explicará en el contexto de las siguientes Figuras 5 a 11, en
45 modalidades de un banco de filtros de síntesis 200, las funciones de ventana que comprenden M/4 = N/8 valores o coeficientes de ventana pueden realmente ser ajustados a cero. Como consecuencia, estos coeficientes de ventana corresponden a las secciones iniciales 160, 270 de los cuadros respectivos. Como se explica previamente, no se requiere que esta sección sea implementada. Como una alternativa posible, los módulos correspondientes (por ejemplo, los formadores de ventana 110, 220) pueden ser construidos de tal manera que no se requiere la
50 multiplicación con un valor cero. Como se explica anteriormente, las muestras de ventana pueden ser ajustadas a cero u omitidas, para mencionar solamente dos diferencias relacionadas con la implementación de modalidades.
[000104] Así, la formación de ventana efectuada por el formador de ventanas 220 en el caso de tal modalidad de un banco de filtros de síntesis que comprende tal función de ventana de bajo retardo puede ser implementada de
55 acuerdo con
imagen5
en donde la función de ventana con coeficientes de ventana w(n) tiene ahora una longitud de 2N coeficientes de
60 ventana. De aquí, el índice de muestra corre de N = 0 a N = 2N-2, en donde relaciones también como valores de los coeficientes de ventana de diferentes funciones de ventana están comprendidas en las tablas 1 a 4 en el anexo para diferentes modalidades de un banco de filtros de síntesis.
[000105] Además, el traslapador/sumador 230 puede además ser implementado de acuerdo con o en basado en la 65 expresión o ecuación
5
15
25
35
45
55
65 E11173652
26-02-2015
imagen6
para
en donde las expresiones y las ecuaciones dadas anteriormente podrían ser ligeramente alteradas dependiendo de la implementación concreta de una modalidad de un banco de filtros de síntesis 200. En otras palabras, dependiendo de la implementación concreta, especialmente en vista del hecho de que un cuadro de ventana no comprende necesariamente una sección inicial, las ecuaciones y expresiones dadas anteriormente podrían por ejemplo ser alteradas en términos de las fronteras de los índices de suma para excluir muestras de ventana de la sección inicial en el caso de que una sección inicial no esté presente o comprenda muestras de ventana triviales (por ejemplo, muestras de valor cero). En otras palabras, al implementar por lo menos una de una modalidad de un banco de filtros de análisis 100 o de un banco de filtros de síntesis 200, un codec ER AAC LD opcionalmente con una herramienta de SBR apropiada puede ser implementado para obtener un codec ER AAC ELD, que puede por ejemplo ser usado para obtener un sistema de codificación y descodificación de audio de baja velocidad de bits y/o bajo retardo. Una vista general de un codificador del extremo y un descodificador serán dados en la estructura de las Figuras 12 y 13, respectivamente.
[000106] Como ya se indicó varias veces, ambas modalidades de un banco de filtros de análisis 100 y de un banco de filtros de síntesis 200 pueden ofrecer la ventaja de habilitar un modo de codificación de bajo retardo mejorado al implementar una función de ventana de bajo retardo en la estructura de un banco de filtros de análisis/síntesis 100, 200 también como en la estructura de modalidades de un codificador y descodificador. Al implementar una modalidad de un banco de filtros de análisis o un banco de filtros de síntesis, que puede comprender una de la funciones de ventana, que serán descritas en más detalle en el contexto de las Figuras 5 a 11, varias ventajas pueden ser obtenidas dependiendo de la implementación concreta de una modalidad de un banco de filtros que comprende una función de ventana de bajo retardo. Refiriéndose al contexto de la Figura 2, una implementación de una modalidad de un banco de filtros puede ser capaz de producir el retardo en comparación con el codec basado en ventanas ortogonales, que son usadas en un codec completamente del estado del arte. Por ejemplo, en el caso del sistema basado en el parámetro N=960, la reducción de retardo de 960 muestras, que es igual a un retardo de 20 ms a una frecuencia de toma de muestras de 48 kHz, a 700 muestras puede ser realizada, que es igual a un retardo de 15 ms a la misma frecuencia de toma de muestras. Además, como se mostrará, la respuesta de frecuencia de una modalidad de un banco de filtros de síntesis y/o de un banco de filtros de análisis es muy similar al banco de filtros que utiliza una ventana de señal. En comparación con un banco de filtros que emplea la llamada ventana de baja superposición, la respuesta de frecuencia es aún mucho mejor. Además, el comportamiento de preeco es similar a la ventana de baja superposición, de tal manera que una modalidad de un banco de filtros de síntesis y/o de un banco de filtros de análisis puede representar una solución intermedia excelente entre calidad y bajo retardo dependiendo de la implementación concreta de una modalidad de los bancos de filtros. Como una ventana adicional que puede por ejemplo ser empleada en la estructura de una modalidad de un sistema de conferencia, es que solamente una función de ventana puede ser usada para procesar todas las clases de señales.
[000107] La Figura 5 muestra una representación gráfica de una función de ventana posible, que puede por ejemplo ser empleada en la estructura de un formador de ventana 110, 220 en el caso de una modalidad de un banco de filtros de análisis 100 y en el caso de un banco de filtros de síntesis 200. Para ser más precisos, las funciones de ventana mostradas en la Figura 5 corresponden a una función de ventana de análisis para M=480 bandas o un número de muestras de salida en el caso de una modalidad de un banco de filtros de análisis en la gráfica superior. La gráfica inferior de la Figura 5 muestra la función de ventana de síntesis correspondiente para una modalidad de un banco de filtros de síntesis. Ya que ambas funciones de ventana mostradas en la Figura 5 corresponde a M=480 bandas o muestras de un cuadro de salida (banco de filtros de análisis) y un cuadro agregado (banco de filtro de síntesis), las funciones de ventana mostradas en la Figura 5 comprenden el conjunto de definición de 1920 valores cada uno con índices n=0,... 1919.
[000108] Además, como las dos gráficas en la Figura 5 muestran claramente, con respecto a un punto medio del conjunto de definición, que es en el caso en la presente no parte del conjunto de definición mismo, ya que el punto medio cae entre los índices N=959 y N=960, ambas funciones de ventana comprenden un número más alto significativo de coeficientes de ventana en una mitad del conjunto de definición con respecto al punto medio mencionado anteriormente que tiene valores absolutos de los coeficientes de ventana, que son mayores de 10%, 20%, 30% o 50% del valor absoluto máximo de todos los coeficientes de ventana. En el caso de la función de ventana de análisis en la gráfica superior de la Figura 5, la mitad respectiva del conjunto de definición es el conjunto de definición que comprende los índices N=960,... 1919, mientras en el caso de la función de ventana de síntesis en la gráfica inferior de la Figura 5, la mitad respectiva del conjunto de definición con respecto al punto medio comprende los índices N=0,..., 959. Como consecuencia, con respecto al punto medio, tanto la función de ventana de análisis como la función de ventana de síntesis son fuertemente asimétricas.
[000109] Como ya se mostró en el contexto tanto del formador de ventanas 110 de una modalidad del banco de filtros de análisis también como en el caso del formador de ventanas 220 de la modalidad del banco de filtro de
5
15
25
35
45
55
65 E11173652
26-02-2015
síntesis, la función de ventana de análisis y la función de ventana de síntesis son en términos de los índices un inverso entre sí.
[000110] Un aspecto importante con respecto a la función de ventana mostrada en las dos gráficas en la Figura 5 es que en el caso de la ventana de análisis mostrada en la gráfica superior, los últimos 120 coeficientes de formación de ventana y en el caso de la función de ventana de síntesis en la gráfica inferior en la Figura 5, los primeros 120 coeficientes de ventana son ajustados a cero o comprenden un valor absoluto de tal manera que pueden ser considerados iguales a 0 dentro de una exactitud razonable. En otras palabras, los coeficientes de formación de ventanas 120 mencionados anteriormente de las dos funciones de ventana pueden por consiguiente ser considerados que provocan un número apropiado de muestras sean ajustadas a por lo menos un valor en un intervalo predeterminado al multiplicar los 120 coeficientes de ventana con las muestras respectivas. En otras palabras, dependiendo de la implementación concreta de modalidades de un banco de filtros de análisis 100 o un banco de filtros de síntesis 200, los 120 coeficientes de ventana de valor cero darán como resultado la creación de la sección inicial 160, 270 de los cuadros de ventana en modalidades de un banco de filtros de análisis y un banco de filtros de síntesis, si es aplicable, como se explica previamente. Sin embargo, aún si las secciones iniciales 160, 270 no están presentes, los 120 coeficientes de ventana de valor cero pueden ser interpretados por el formador de ventanas 110 por el convertidor de tiempo/frecuencia 120, por el formador de ventanas 220 y por el traslapador/sumador 230 en modalidades de un banco de filtros de análisis 100 y un banco de filtro de síntesis 200 para tratar o procesar los diferentes cuadros de conformidad, aún en el caso de que las secciones iniciales 160, 270 de los cuadros apropiados no están presentes.
[000111] Al implementar una función de ventana de análisis o una función de ventana de síntesis como se muestra en la Figura 5 que comprende 120 coeficientes de formación de ventana de valor cero en el caso de M=480 (N=960), modalidades apropiadas de un banco de filtros de análisis 100 y un banco de filtros de síntesis 200 serán establecidas en las cuales las secciones iniciales 160, 270 de los cuadros correspondientes comprenden M/4 muestras de las primeras subsecciones correspondientes 150-1, 260-1 comprenden M/4 valores o muestras menos que las otras subsecciones, para ponerlo en términos más generales.
[000112] Como se menciona previamente, la función de ventana de análisis mostrada en la gráfica superior de la Figura 5 y la función de ventana de síntesis mostrada en la gráfica inferior de la Figura 5 representan funciones de ventana de bajo retardo tanto para el banco de filtros de análisis y el banco de filtros de síntesis. Además, tanto la función de ventana de análisis como la función de ventana de síntesis como se muestran en la Figura 5 son versiones reflejadas entre sí con respecto al punto medio mencionado anteriormente del conjunto de definición del cual ambas funciones de ventana son definidas.
[000113] Se debe notar que el uso de la ventana de hoja de retardo y/o que emplea una modalidad de un banco de filtros de análisis o un banco de filtros de síntesis en muchos casos no da como resultado ningún incremento notable en complejidad computacional y solamente un incremento marginal en requerimientos de almacenamiento, como será resumido más tarde durante el análisis de complejidad.
[000114] Las funciones de ventana mostradas en la Figura 5 comprenden los valores dados en la Tabla 2 en el anexo, que ha sido resumido por propósitos de simplicidad solamente. Sin embargo, hasta ahora, no es necesario que una modalidad de un banco de filtros de análisis o un banco de filtros de síntesis opere en un parámetro M=480 para comprender los valores exactos dados en la Tabla 2 en el anexo. Naturalmente, la implementación concreta de una modalidad de un banco de filtros de análisis o un banco de filtros de síntesis puede fácilmente emplear coeficientes de ventana variables en la estructura de funciones de ventana apropiadas, de tal manera que, en muchos casos, el empleo de coeficientes de ventana será suficiente, que emplea, en el caso de M=480, las relaciones dadas en la Tabla 1 en el anexo.
[000115] Además, en muchas modalidades que tienen coeficientes de filtro, los coeficientes de ventana también como coeficientes de elevación, que serán introducidos subsecuentemente, las figuras dadas no se requiere que sean implementadas como son dadas precisamente. En otras palabras, en otras modalidades de un banco de filtros de análisis también como un banco de filtros de síntesis y modalidades relacionadas de la presente invención, también otras funciones de ventana pueden ser implementados, que son coeficientes de filtro, coeficientes de ventana y otros coeficientes, tales como el coeficiente de elevación, que son diferentes de los coeficientes dados a continuación en el anexo, en tanto que las variaciones estén dentro del tercer dígito enseguida de la coma o en los dígitos superiores, tal como los cuartos, quintos, etc. dígitos.
[000116] Considerando la función de ventana de síntesis en la gráfica inferior de la Figura 5, como se menciona previamente, los primeros M/4=120 coeficientes de ventana son ajustados a cero. Después de esto, aproximadamente hasta el índice 350, la función de ventana comprende una elevación empinada, que es seguida por una elevación más moderada hasta un índice de aproximadamente 600. En este contexto, se debe notar que alrededor de un índice de 480 (=M), la función de ventana se vuelve mayor que la unidad o mayor de uno. Enseguida del índice 600 hasta aproximadamente la muestra 1100, la función de ventana cae de regreso de su valor máximo a un nivel de menos de 0.1. En el resto del conjunto de definición, la función de ventana comprende ligeras oscilaciones alrededor del valor 0.
5
15
25
35
45
55
65 E11173652
26-02-2015
[000117] La Figura 6 muestra una comparación de la función de ventana como se muestra en la Figura 5 en el caso de una función de ventana de análisis en la gráfica superior de la Figura 6 y en el caso de una función de ventana de síntesis en la gráfica inferior de la Figura 6. Además, como una línea discontinua, dos gráficas también comprenden la llamada función de ventana seno, que es por ejemplo empleada en los codecs ER AAC y AAC LC y AAC LD mencionados anteriormente. La comparación directa de la ventana seno y la función de ventana de bajo retardo como se muestra en las dos gráficas de la Figura 6 ilustra los diferentes objetos de tiempo de la ventana de tiempo tal como se explica en el contexto de la Figura 5. Aparte del hecho de que la ventana de seno es solamente definida en 960 muestras, la diferencia más sorprendente entre las dos funciones de ventana mostradas en el caso de una modalidad de un banco de filtros de análisis (gráfica superior) y en el caso de un banco de filtros de síntesis (gráfica inferior) es que la función de cuadro de ventana seno es dividida alrededor de su punto medio respectivo del conjunto de definición acortado y comprende en los primeros 120 elementos del conjunto de definición (en su mayoría) coeficientes de ventana que son mayores de cero. En contraste, como se explica previamente, la ventana de bajo retardo comprende 120 (idealmente) coeficientes de ventana de valor cero y es significativamente asimétrica con respecto a su punto medio respectivo del conjunto de definición prolongado en comparación con el conjunto de definición de la ventana de seno.
[000118] Hay una diferencia adicional, que distingue la ventana de bajo retardo de la ventana de seno, en tanto que ambas ventanas adquieren aproximadamente un valor de aproximadamente 1 y un índice de muestra de 480 (=M), la función de ventana de bajo retardo llega a un máximo de más de uno aproximadamente 120 muestras después de volverse mayor de 1 y un índice de muestra de aproximadamente 600 (= M + M/4; M = 480), en tanto que la ventana seno simétrica disminuye simétricamente hasta 0. En otras palabras, las muestras las cuales serán tratadas, por ejemplo al multiplicar con cero en un primer cuadro serán multiplicadas en el siguiente cuadro con valores mayores de 1 debido al modo de operación de traslape y el valor por adelantado de la muestra de M=480 en estos casos.
[000119] Una descripción adicional de ventanas de bajo retardos adicionales, será dada, que puede por ejemplo ser empleada en otras modalidades de un banco de filtros de análisis o un banco de filtros de síntesis 200, el concepto de la reducción de retardo que es obtenible con las funciones de ventana mostradas en las Figuras 5 y 6 será explicado con referencia al parámetro M=480, N=960 que tiene M/4 = 120 valores de cero o valores suficientemente bajos. En la ventana de análisis mostrada en la gráfica superior de la Figura 6, las partes que acceden a valores de entrada futuro (índices de muestra 1800 a 1920) es reducida por 120 muestras. Correspondientemente, en la ventana de síntesis en la gráfica inferior de la Figura 6, la superposición con muestras de salida del pasado, que requerirían un retardo correspondiente en el caso de un banco de filtros de síntesis es reducida por otras 120 muestras. En otras palabras, en el caso de una ventana de síntesis la superposición con las muestras de salida del pasado, que es necesario para completar la operación de traslape/suma o para terminar el traslape/suma junto con la reducción de 120 muestras en el caso de una ventana de análisis darán como resultado una reducción de retardo global de 240 muestras en el caso de un sistema que comprende ambas modalidades de un banco de filtro de análisis y un banco de filtros de síntesis.
[000120] La superposición extendida, sin embargo, no da como resultado ningún retardo adicional ya que solamente involucra agregar valores del pasado, que pueden fácilmente ser almacenados sin provocar retardo adicional, por lo menos en la escala de la frecuencia de toma de muestras. Una comparación del tiempo de conjuntos de la ventana seno tradicional y la ventana de bajo retardo mostradas en las Figuras 5 y 6 ilustran esto.
[000121] La Figura 7 comprende tres gráficas, tres funciones de ventana diferentes. Para ser más preciso, la gráfica superior de la Figura 7 muestra la ventana seno mencionada anteriormente, mientras que la gráfica media muestra la llamada ventana de baja superposición y la gráfica inferior muestra la ventana de bajo retardo. Sin embargo, las tres ventanas mostradas en la Figura 7 corresponden a un valor por adelantado de la muestra o parámetro M = 512 (N = 2M =1024). Una vez más, la ventana de seno, también como la ventana de baja superposición en las dos gráficas superiores en la Figura 7 son definidas solamente sobre conjuntos de definición limitados o acortados que comprenden 1024 índices de muestra en comparación con la función de ventana de bajo retardo como se muestra en la gráfica inferior de la Figura 7, que es definida sobre 2048 índices de muestra.
[000122] Las gráficas de las formas de ventana de una ventana de seno, la ventana de baja superposición y la ventana de bajo retardo en la Figura 7 comprenden más o menos las mismas características como se discute previamente en términos de la ventana seno y la ventana de bajo retardo. Para ser más precisos, la ventana de seno (gráfica superior en la Figura 7) es una vez más simétrica con respecto al punto medio apropiado del conjunto de definición que cae entre los índices 511 y 512. La ventana seno adquiere un valor máximo a aproximadamente el valor M = 512 y cae del valor máximo de regreso a cero otra vez en la frontera del conjunto de definición.
[000123] En el caso de la ventana de bajo retardo mostrada en la gráfica inferior de la Figura 7, esta ventana de bajo retardo comprende 128 coeficientes de ventana de valor cero, que es una vez más un cuarto del valor por adelantado de la muestra M. Además, la ventana de bajo retardo adquiere un valor de aproximadamente 1 a un índice de muestra M, mientras que el valor máximo de los coeficientes de ventana es adquirido aproximadamente 128 índices de muestra n después de volverse más grande que uno en términos de un índice incrementado (alrededor del índice 640). También con respecto a los otros elementos de la gráfica de la función de ventana, la
5
15
25
35
45
55
65 E11173652
26-02-2015
función de ventana para M =512 en la gráfica inferior de la Figura 7 no difiere significativamente de las ventanas de bajo retardo para M = 480 mostradas en las Figuras 5 y 6, aparte de un desplazamiento opcional debido a los conjuntos de definición más largos (2048 índices en comparación con 1920 índices). La ventana de bajo retardo mostrada en la gráfica inferior de la Figura 7 comprende los valores dados en la Tabla 4 en el anexo.
[000124] Sin embargo, como se explica previamente, no es necesario que modalidades de un banco de filtros de síntesis o un banco de filtros de análisis implementen la función de ventana con los valores precisos como se dan en la Tabla 4. En otras palabras, los coeficientes de ventana pueden diferir de los valores dados en la Tabla 4, en tanto que mantengan las relaciones dadas en la Tabla 3 en el anexo. Además, en modalidades de la presente invención también variaciones con respecto a los coeficientes de ventana pueden fácilmente ser implementados, en tanto que las variaciones estén dentro del tercer dígito enseguida del punto o en dígitos superiores tales como el cuarto, quinto, etc. dígitos como se explica previamente.
[000125] En la gráfica media de la Figura 7 la ventana de baja superposición no ha sido descrito hasta ahora. Como se menciona previamente, la ventana de bajo retardo también comprende un conjunto de definición que comprende 1024 elementos. Además, la ventana de baja superposición también comprende en el comienzo de un conjunto de definición y al final de un conjunto de definición, un subconjunto conectado en el cual la ventana de baja superposición se desvanece. Sin embargo, después de este subconjunto conectado en el cual la ventana de baja superposición se desvanece, una elevación empinada o decaimiento sigue, que comprende solamente un poco más de 100 índices de muestra cada uno. Además, la ventana de baja superposición asimétrica no comprende valores mayores de 1 y puede comprender una atenuación de banda de retención menor en comparación con funciones de ventana como se emplea en algunas modalidades.
[000126] En otras palabras, la ventana de baja superposición comprende un conjunto de definición significativamente más bajo en tanto que tienen el mismo valor por adelantado de la muestra, como la ventana de bajo retardo y no adquiere valores mayores de uno. Además, tanto la ventana de seno como la ventana de baja superposición son con respecto a sus puntos medios respectivos del conjunto de definición ortogonales o simétricas, en tanto que la ventana de bajo retardo es asimétrica de la manera descrita con respecto al punto medio de su conjunto de definición.
[000127] La ventana de baja superposición fue introducida con el fin de eliminar los artefactos de pre-eco por transitorios. La superposición más baja evita el esparcimiento del ruido de cuantificación antes del ataque de señal, como se ilustra en la Figura 8. La nueva ventana de bajo retardo, sin embargo, tiene la misma propiedad, pero ofrece una mejor respuesta de frecuencia, como será evidente al comparar la respuesta de frecuencias mostradas en las Figuras 10 y 11. Por consiguiente, la ventana de bajo retardo es capaz de reemplazar ambas ventanas de AAC LD tradicionales, esto es, la ventana de señal en la ventana de baja superposición, de tal manera que no se requiere que sea implementada una adaptación de forma de ventana dinámica.
[000128] La Figura 8 muestra para las mismas funciones de ventana mostradas en la Figura 7 en el mismo orden de gráficas un ejemplo de ruido de cuantificación que se esparce para las diferentes formas de ventana de la ventana seno o la ventana de baja superposición y la ventana de bajo retardo. El comportamiento de pre-eco de la ventana de bajo retardo como se muestra en la gráfica inferior de la Figura 8 es similar al comportamiento de la ventana de baja superposición como se muestra en la gráfica media de la Figura 8, en tanto que el comportamiento de pre-eco de la ventana de seno en la gráfica superior de la Figura 8 comprende constribuciones significativas en las primeras 128 (M = 512) muestras.
[000129] En otras palabras, el empleo de una ventana de bajo retardo en una modalidad de un banco de filtros de síntesis o un banco de filtros de análisis, puede dar como resultado una ventana concerniente con un comportamiento de pre-eco mejorado. En el caso de una ventana de análisis, la trayectoria que accede a valores de entrada futuros y así requeriría un retardo, son reducidas por más de una muestra y preferiblemente por 120/128 muestras en el caso de una longitud de bloque o valor por adelantado de la muestra de 480/512 muestras, de tal manera que reduce el retardo en comparación con la MDCT (Transformada de Coseno Discreta Modificada). Al mismo tiempo mejora los comportamientos de pre-eco, puesto que un ataque posible en la señal, que podría ser en aquellas 120/128 muestras, aparecería solamente un bloque o un cuadro más tarde. Correspondientemente, en la ventana de síntesis la superposición con muestras de salida del pasado para terminar su operación de traslape/suma, que también requeriría un retardo correspondiente, es reducida por otras 120/128 muestras, dando como resultado una reducción de retardo global de 240/256 muestras. Esto también da como resultado un comportamiento de pre-eco mejorado, puesto que aquellas 120/128 muestras contribuirían de otra manera al esparcimiento de ruido al pasado, antes de un ataque posible. En general esto significa, un pre-eco aparece posiblemente un bloque o cuadro más tarde y el pre-eco resultante del lado de síntesis solo es 120/128 muestras más corto.
[000130] Tal reducción, que podría ser obtenible al emplear tal ventana de bajo retardo, como se describe en las Figuras 5 a 7, dependiendo de la implementación concreta de una modalidad de un banco de filtros de síntesis o un banco de filtros de análisis puede ser especialmente útil cuando se consideran las características de audición humanas, especialmente en términos de enmascaramiento. Para ilustrar esto, la Figura 9 muestra un bosquejo
5
15
25
35
45
55
65 E11173652
26-02-2015
esquemático del comportamiento de enmascaramiento del oído humano. Para ser más precisos, la Figura 9 muestra una representación esquemática del nivel de umbral de audición del oído humano, como función de tiempo, cuando un sonido o un tono que tiene una frecuencia específica está presente durante un período de tiempo de aproximadamente 200 ms.
[000131] Sin embargo, brevemente antes de que el sonido o tono mencionado anteriormente esté presente, como se indica por la flecha 350 en la Figura 9, un pre-enmascaramiento está presente por un corto período de tiempo de aproximadamente 20 ms, por consiguiente, la habilitación de una transición uniforme entre ningún enmascaramiento y el enmascaramiento durante la presencia del tono o sonido, que es algunas veces denominado como enmascaramiento simultáneo. Durante el tiempo en el cual el sonido o tono está presente, el enmascaramiento está activado. Sin embargo, cuando el tono o sonido desaparece, como se indica por la flecha 360 en la Figura 9, el enmascaramiento no es levantado inmediatamente, sino durante un período de tiempo de aproximadamente 150 ms, el enmascaramiento es reducido lentamente, que es también algunas veces denominado como postenmascaramiento.
[000132] Esto es, la Figura 9 muestra una propiedad de enmascaramiento temporal general de la audición humana, que comprende una fase de pre-enmascaramiento también como una fase de post-enmascaramiento antes y después de un sonido o tono que está presente. Debido a la reducción del comportamiento de pre-eco al incorporar una ventana de bajo retardo en una modalidad de un banco de filtros de análisis 100 y/o un banco de filtros de síntesis 200, distorsiones audible serán severamente limitadas en muchos casos ya que los pre-ecos audibles caerán, por lo menos a alguna extensión, al período de pre-enmascaramiento del efecto de enmascaramiento temporal del oído humano como se muestra en la Figura 9.
[000133] Además, el empleo de una función de ventana de bajo retardo como se ilustra en las Figuras 5 a 7, descrita en más detalle con respecto a relaciones y valores en las Tablas 1 a 4 en el anexo, ofrece una respuesta de frecuencia, que es similar a aquella de una ventana de seno. Para ilustrar esto, la Figura 10 muestra una comparación de la respuesta de frecuencia entre la ventana de seno (línea discontinua) y un ejemplo de una ventana de bajo retardo (líneas continuas). Como se puede observar al comparar las dos respuestas de frecuencias de las dos ventanas mencionadas anteriormente en la Figura 10, la ventana de bajo retardo es comparable en términos de la selectividad de frecuencia con la ventana de seno. La respuesta de frecuencia de la ventana de bajo retardo es similar o comparable con la respuesta de frecuencia de la ventana de seno y mucho mejor que la respuesta de frecuencia de la ventana de baja superposición, como en comparación con la respuesta de frecuencias mostrada en la Figura 11 ilustran.
[000134] Para ser más precisos, la Figura 11 muestra una comparación de las respuestas de frecuencias entre la ventana de seno (línea discontinua) y la ventana de baja superposición (líneas continuas). Como se puede observar las líneas continuas de la respuesta de la frecuencia de la ventana de baja superposición son significativamente más grandes que la respuesta de frecuencia correspondiente de la ventana de seno. Ya que la ventana de bajo retardo y la ventana de seno muestran respuesta de frecuencia comparable, que pueden ser observadas al comparar las dos respuestas de frecuencias mostradas en la Figura 10, también una comparación entre la ventana de baja superposición y la ventana de bajo retardo puede fácilmente ser trazada, como la gráfica mostrada en las Figuras 10 y 11 ambas muestran la respuesta de frecuencia de la ventana de seno y comprenden las mismas escalas con respecto al eje de frecuencia y el eje de intensidad (db). Así, se puede concluir fácilmente que la ventana de seno que puede fácilmente ser implementada en una modalidad de un banco de filtros de síntesis también como en una modalidad de un banco de filtros de análisis ofrece en comparación con la ventana de baja superposición una respuesta de frecuencia significativamente mejor.
[000135] En cuanto a la comparación del comportamiento de pre-eco mostrado en la Figura 8 es también mostrada en la ventana de bajo retardo ofrece una ventaja considerable en comparación con el comportamiento de pre-eco, en tanto que el comportamiento de pre-eco de la ventana de bajo retardo es comparable con aquel de una ventana de baja superposición, la ventana de bajo retardo representa una solución intermedia excelente entre las dos ventanas mencionadas anteriormente.
[000136] Como consecuencia, la ventana de bajo retardo, que puede ser implementada en la estructura de una modalidad de un banco de filtros de análisis también como una modalidad de un banco de filtro de síntesis y modalidades relacionadas, debido a esta solución intermedia, la misma función de ventana puede ser usada para señales transitorias, también como señales tonales, de tal manera que ningún cambio entre diferentes longitudes de bloque o entre diferentes ventanas es necesario. En otras palabras, modalidades de un banco de filtros de análisis, un banco de filtros de síntesis y modalidades relacionadas ofrecen la posibilidad de construir un codificador, un descodificador y sistemas adicionales que no requieren conmutación o cambio entre diferentes conjuntos de parámetros operacionales, tales como diferentes tamaños de bloque o longitudes de bloque o diferentes ventanas o formas de ventana. En otras palabras, al emplear una modalidad de un banco de filtros de análisis o un banco de filtros de síntesis con la ventana de bajo retardo, la construcción de una modalidad de un codificador, descodificador y sistemas relacionados puede ser considerablemente simplificada. Como una oportunidad adicional, debido al hecho de que no se requiere ningún cambio o conmutación entre diferentes conjuntos de parámetros, señales de diferentes fuentes pueden ser procesadas en el dominio de frecuencia en lugar del dominio de tiempo, que requiere
5
15
25
35
45
55
65 E11173652
26-02-2015
un retardo adicional como se resumirá en las siguientes secciones.
[000137] En todavía otras palabras, el empleo de una modalidad de un banco de filtros de síntesis o un banco de filtros de análisis ofrece la posibilidad de beneficiarse de una ventaja de baja complejidad computacional en algunas modalidades. Para compensar el retardo más bajo en comparación con MDCT con por ejemplo una ventana de seno, una superposición más larga es introducida sin crear un retardo adicional. A pesar de la superposición más larga y correspondientemente, una ventana de aproximadamente dos veces la longitud de la ventana de seno correspondiente con dos veces la cantidad de superposición y así beneficios de la selectividad de frecuencia como se resume anteriormente, se puede obtener una implementación con solamente complejidad adicional menor, debido a un tamaño incrementado posible de multiplicaciones de longitud de bloque y elementos de memoria. Sin embargo, detalles adicionales en cuanto a tal implementación serán explicados en el contexto de las Figuras 19 a
24.
[000138] La Figura 12 muestra un diagrama de bloques esquemático de una modalidad de un codificador 400. El codificador 400 comprende una modalidad de un banco de filtros de análisis 100 y como componente opcional, un codificador de entropía 410, que está configurado para codificar la pluralidad de cuadros de salida provistos por el banco de filtros de análisis 100 y configurado para emitir una pluralidad de cuadros codificados en base a los cuadros de salida. Por ejemplo, el codificador de entropía 410 puede ser implementado como un codificador de Huffman u otro codificador de entropía que utiliza un esquema de codificación eficiente de entropía, tales como el esquema de codificación aritmético.
[000139] Debido al empleo de una modalidad de un banco de filtros de análisis 100 en la estructura de una modalidad de un codificador 400, el codificador ofrece una salida del número de bandas N en tanto que tiene un retardo reconstitucional de menos de 2N o 2N-1. Además, en principio una modalidad de un codificador también representa un filtro, una modalidad de un codificador 400 ofrece una respuesta de impulso finita de más de 2N muestras. Esto es, una modalidad de un codificador 400 representa un codificador que es capaz de procesar datos (audio) de manera eficiente en retardo.
[000140] Dependiendo de la implementación concreta de una modalidad de un codificador 400 como se muestra en la Figura 12, tal modalidad puede también comprender un cuantificador, filtro o componentes adicionales para preprocesar los cuadros de entrada provistos a la modalidad del banco de filtros de análisis 100 o para procesar los cuadros de salida antes de la codificación por entropía de los cuadros respectivos. Como un ejemplo, un cuantificador adicional puede ser provisto a una modalidad de un codificador 400 antes del banco de filtros de análisis 100 para cuantificar los datos o para recuantificar los datos, dependiendo de la implementación concreta y campo de aplicación. Como un ejemplo para el procesamiento detrás del banco de filtros de análisis, una ecualización u otro ajuste de ganancia en términos de los cuadros de salida en el dominio de frecuencia pueden ser implementados.
[000141] La Figura 13 muestra una modalidad de un descodificador 450 que comprende un descodificador de entropía 460 también como una modalidad de un banco de filtros de síntesis 200, como se describe previamente. El descodificador de entropía 460 de la modalidad del descodificador 450 representa una componente opcional, que puede, por ejemplo, ser configurado para descodificar una pluralidad de cuadros codificados, que podrían por ejemplo ser provistos por una modalidad de un codificado 400. Así, la descodificador de entropía 460 podría mediante un descodificador de Huffman o un descodificador algorítmico u otro descodificador de entropía basado en un esquema de codificación/descodificación por entropía, que es apropiado para la aplicación del descodificador 450 a la mano. Además, el descodificador de entropía 460 puede ser configurado para proporcionar una pluralidad de cuadros de entrada al banco de filtros de síntesis 200, que a su vez, proporciona una pluralidad de cuadros agregados en una salida del banco de filtro de síntesis 200 o en una salida del descodificador 450.
[000142] Sin embargo, dependiendo de la implementación concreta, el descodificador 450 puede también comprender componentes adicionales, tales como un descuantificador u otros componentes tal como un ajustador de ganancia. Para ser más precisos, entre el descodificador de entropía 460 y el banco de filtros de síntesis, un ajustador de ganancia puede ser implementado como componente opcional para permitir ajuste de ganancia o ecualización en el dominio de frecuencia antes de que los datos de audio sean transferidos por el banco de filtro de síntesis 200 al dominio de tiempo. Así, un cuantificador adicional puede ser implementado en un descodificador 450 después del banco de filtro de síntesis 200 para ofrecer la oportunidad de recuantificar los cuadros agregados antes de proporcionar los cuadros agregados opcionalmente recuantificados a un componente externo del descodificador
450.
[000143] Modalidades de un codificador 400 como se muestra en la Figura 12 y modalidades de un descodificador 450 como se muestra en la Figura 13 pueden ser aplicados en muchos campos de codificación/descodificación de audio también como procesamiento de audio. Tales modalidades de un codificador 400 y un descodificador 450 puede por ejemplo, ser empleados en el campo de comunicaciones de alta calidad.
[000144] Tanto una modalidad de un codificador o codec también como una modalidad para un descodificador ofrecen la oportunidad de poner en operación dicha modalidad sin tener que implementar un cambio de parámetro
5
15
25
35
45
55
65 E11173652
26-02-2015
tal como conmutar la longitud del bloque o conmutar entre diferentes ventanas. En otras palabras, en comparación con otros codificadores y descodificadores, una modalidad de la presente invención en forma de un banco de filtros de síntesis, un banco de filtros de análisis y modalidades relacionadas es a lo más no requerido para implementar diferentes longitudes de bloque y/o diferentes funciones de ventana.
[000145] Inicialmente definido en la versión 2 de la especificación de audio MPEG-4, un codificador AAC de bajo retardo (AAC LD), con el paso del tiempo, ha incrementado la adaptación tal como un codificador de comunicaciones de alta calidad de pleno ancho de banda, que no está sometido a limitaciones de los codificadores de habla usuales tienen, tales como enfoque en altavoces individuales, material de habla, mal desempeño para señales musicales, y así sucesivamente. Este codec particular es ampliamente usado para video/teleconferencia en otras aplicaciones de comunicaciones, que por ejemplo han disparado la creación de un perfil de AAC de bajo retardo debido a la demanda industrial. No obstante, una mejora en la eficiencia de codificación de los codecs es de amplio interés a la comunidad de usuarios y es el tópico de la contribución, que algunas modalidades de la presente invención son capaces de proporcionar.
[000146] Actualmente, el codec ER AAC LD de MPEG-4 produce buena calidad de audio a un intervalo de velocidad de bits de 64 kbit/s a 48 kbit/s por canal. Con el fin de incrementar la eficiencia de codificación de los codificadores para ser competitivos con codificadores de habla utilizando la herramienta de replicación de banda espectral probada (SBR) es una elección excelente. Una propuesta previa en este tópico, sin embargo, no fue proseguido adicionalmente en el cuadro de la estandarización.
[000147] Con el fin de no perder el retardo de codec bajo que es crucial para muchas aplicaciones, tales como dar servicio a aplicaciones de telecomunicación, se tienen que tomar medidas adicionales. En muchos casos, como un requerimiento para el desarrollo de codificadores respectivos, se definió que tal codificador debe ser apto de proporcionar un retardo algorítmico tan bajo como de 20 ms. Afortunadamente, solo modificaciones menores tienen que ser aplicadas a las especificaciones existentes con el fin de cumplir con este objetivo. Específicamente, solamente dos modificaciones simples se vuelven necesarias de las cuales una es presentada en este documento. Un reemplazo del banco de filtros de codificador AAC LD por una modalidad de un banco de filtros de bajo retardo 100, 200 alivia un incremento de retardo significativo en muchas aplicaciones. La realización de una ligera modificación a la herramienta de SBR reduce el retardo agregado al introducir esto al codificador, tal como la modalidad del codificador 400 como se muestra en la Figura 12.
[000148] Como resultado, el codificador de AAC ELD mejorado o el descodificador de AAC EL que comprenden modalidades de bancos de filtros de bajo retardo, exhiben un retardo comparable a aquel de un codificador AAC LD plano, pero es capaz de ahorrar una cantidad significativa de la velocidad de bits al mismo nivel de calidad, dependiendo de la implementación concreta. Para ser más precisos, un codificador de AAC ELD puede ser capaz de ahorrar hasta 25% o aún hasta 33% de la velocidad de bits al mismo nivel de calidad comparado con un codificador de AAC LD.
[000149] Modalidades de un banco de filtros de síntesis o un banco de filtros de análisis pueden ser implementadas en un llamado codec AAC de bajo retardo mejorado (AAC ELD), que es capaz de extender el intervalo de operación a 24 kbit/s por canal, dependiendo de la implementación concreta y especificación de aplicación. En otras palabras, modalidades de la presente invención pueden ser implementadas en la estructura de una codificación como una extensión del esquema de AAC LD que utiliza herramientas de codificación opcionalmente adicionales. Tal herramienta de codificación opcional es la herramienta de codificación de banda espectral (SBR), que puede ser integrada o adicionalmente ser empleada en la estructura tanto de una modalidad de un codificador también como una modalidad de un descodificador. Específicamente en el campo de codificación de baja velocidad de bits, SBR es una mejora atractiva, ya que permite una implementación de un codificador de velocidad doble, a la cual la frecuencia de toma de muestras para una parte más baja del espectro de frecuencia es codificada con solamente la mitad de la frecuencia de toma de muestras del tomador de muestras original. Al mismo tiempo, SBR es capaz de codificar un intervalo espectral más alto de frecuencias en a la parte inferior, de tal manera que la frecuencia de toma de muestras global puede en principio ser reducida por un factor de 2.
[000150] En otras palabras, el empleo de herramientas de SBR hace una implementación de los componentes optimizados en retardo especialmente atractiva y benéfica, ya que debido a la frecuencia de toma de muestras reducida del codificador de núcleo doble, el retardo ahorrado puede en principio, reducir el retardo global del sistema por un factor de 2 del retardo ahorrado.
[000151] Así, una simple combinación de AAC LD y SBR daría como resultado, sin embargo, un retardo algorítmico total de 60 ms, como se explicará en más detalle posteriormente en la presente. Así, tal combinación volvería al codec resultante no apropiado para aplicaciones de comunicaciones, ya que generalmente hablando, un retardo del sistema para comunicaciones bidireccionales interactivas no deben exceder de 50 ms.
[000152] Al emplear una modalidad de un banco de filtros de análisis y/o de un banco de filtros de síntesis, y por consiguiente, reemplazar el banco de filtros de MDCT por uno de estos bancos de filtro de bajo retardo dedicados puede por consiguiente ser capaz de aliviar el incremento de retardo provocado al implementar un codificador de
5
15
25
35
45
55
65 E11173652
26-02-2015
velocidad doble como se explica previamente. Al emplear las modalidades mencionadas anteriormente, un codificador de AAC ELD puede exhibir el retardo dentro del intervalo aceptable para comunicación bidireccional, en tanto que ahorra hasta 25% al 33% de la velocidad en comparación con un codificador de AAC LD regular, en tanto que mantiene el nivel de calidad de audio.
[000153] Por consiguiente, en términos de sus modalidades de un banco de filtros de síntesis, un banco de filtros de análisis y las otras modalidades relacionadas, la presente solicitud proporciona una descripción de modificaciones técnicas posibles junto con una evaluación de un desempeño de codificador obtenible, por lo menos en términos de algunas de las modalidades de la presente invención. Tal banco de filtros de bajo retardo es apto de obtener una reducción de retardo sustancial al utilizar una función de ventana diferente, como se explica previamente, con múltiples superposiciones en lugar de emplear un MDCT o IMDCT, en tanto que al mismo tiempo ofrece la posibilidad de reconstrucción perfecta, dependiendo de la implementación concreta. Una modalidad de tal banco de filtros de bajo retardo es capaz de reducir el retardo de reconstrucción sin reducir la longitud del filtro, pero todavía mantiene la propiedad de reconstrucción perfecta bajo algunas circunstancias en el caso de algunas modalidades.
[000154] Los bancos de filtros resultantes tienen la misma función de modulación coseno como un MDCT tradicional, pero puede tener funciones de ventana más largas, que pueden ser no simétricas o asimétricas con un retardo generalizado o retardo de baja reconstrucción. Como se explica previamente, una modalidad de tal banco de filtros de bajo retardo nuevo que emplea una nueva ventana de bajo retardo puede ser capaz de reducir el retardo de MDCT de 960 muestras en el caso de un tamaño de cuadro de M = 480 muestras a 720 muestras. En general, una modalidad del banco de filtros puede ser capaz de reducir el retardo de 2M a (2M -M/2) muestras al implementar M/4 coeficientes de ventana de valor cero o al adaptar los componentes apropiados, como se explica previamente, de conformidad de tal manera que las primeras subsecciones 150-1, 260-1 de los cuadros correspondientes comprenden M/4 muestras menos que las otras subsecciones.
[000155] Ejemplos para estas funciones de ventana de bajo retardo han sido mostrados en el contexto de las Figuras 5 a 7, en donde las Figuras 6 y 7 comprenden la comparación con la ventana de señal tradicional también. Sin embargo, se debe notar que la ventana de análisis es simplemente una réplica inversa en el tiempo de la ventana de síntesis como se explica previamente.
[000156] En lo siguiente, una descripción técnica de una combinación de una herramienta de SBR con un codificador de AAC LD con el fin de obtener una baja velocidad de bits y sistema de codificación de audio de bajo retardo será dada. Un sistema de velocidad doble es usado para obtener una ganancia de codificación más alta en comparación con un sistema de una sola velocidad, como se explica anteriormente. Al emplear un sistema de velocidad doble, una codificación más eficiente de energía es posible que tiene menos bandas de frecuencia será provista por el codificador correspondiente, lo que conduce a una reducción de bit en bit debe a alguna extensión, removiendo la información redundante de los cuadros provistos por el codificador. Para ser más precisos, una modalidad de un banco de filtros de bajo retardo como se describe previamente es usado en la estructura del codificador central de AAC LD para llevar a un retardo global que es aceptable para aplicaciones de comunicaciones. En otras palabras, en lo siguiente, el retardo será descrito en términos tanto de núcleo de AAC LD y el codificador central AAC ELD.
[000157] Al emplear una modalidad de un banco de filtros de síntesis o un banco de filtros de análisis, se puede obtener una reducción de retardo al implementar una ventana de MDCT/banco de filtros modificado. Se tiene una reducción de retardo sustancial al utilizar las funciones de ventana mencionadas anteriormente y descritas diferentes con múltiple superposición para extender el MDCT y el IMDCT para obtener un banco de filtros de bajo retardo. La técnica de bancos de filtros de bajo retardo permite la utilización de una ventana no ortogonal con múltiple superposición. De esta manera, es posible obtener un retardo, que es más bajo que la longitud de ventana. De aquí, un bajo retardo con todavía una respuesta de impulso larga que da como resultado una buena selectividad de frecuencia puede ser obtenido.
[000158] La ventana de bajo retardo para un tamaño de cuadro de M = 480 muestras reduce el retardo de MDCT de 960 muestras a 720 muestras, como se explica previamente.
[000159] Para resumir, en contraste con un codec de ER AAC LD de MPEG-4, una modalidad de un codificador y una modalidad de un descodificador 450 pueden bajo ciertas circunstancias ser capaces de producir una buena calidad de audio a un intervalo de bits muy pequeño. En tanto que el codec de ER AAC LD mencionado anteriormente produce una buena calidad de audio como un intervalo de bits de 64 kb/s a 48 kb/s por canal, las modalidades del codificador 400 y el descodificador 450, como se describe en el presente documento, pueden ser capaces de proporcionar un codificador y descodificador de audio, que bajo algunas circunstancias es apto de producir una calidad de audio igual a aún velocidades de bits más bajas de aproximadamente 32 kb/s por canal. Además, modalidades de un codificador y descodificador tienen un retardo algorítmico suficientemente pequeño para ser utilizado para sistemas de comunicación bidireccionales, que pueden ser implementadas en la tecnología existente al utilizar solo modificaciones mínimas.
[000160] Modalidades de la presente invención, especialmente en forma de un codificador 400 y un descodificador
5
15
25
35
45
55
65 E11173652
26-02-2015
450, obtienen esto al combinar la tecnología de audio de MPEG-4 existente con una adaptación de números mínima necesaria para operaciones de bajo retardo para la operación de bajo retardo para llevar a modalidades de la presente invención. Específicamente, el codificador de bajo retardo de ER AAC de MPEG-4 puede ser combinado con una herramienta de replicación de banda espectral (SBR) de MPEG-4 para implementar modalidades de un codificador 400 y un descodificador 450 al considerar las modificaciones descritas. El incremento resultante en retardo algorítmico es aliviado mediante modificaciones menores de la herramienta de SPR, que no serán descritas en la presente solicitud y el uso de una modalidad de un banco de filtros de codificador central de bajo retardo y una modalidad de un banco de filtros de análisis o un banco de filtros de síntesis. Dependiendo de la implementación concreta, tal codificador de AAC LD mejorado es apto de ahorrar hasta 33% de la velocidad de bits al mismo nivel de calidad en comparación con un codificador de ACC LD normal en tanto que retiene un retardo suficientemente bajo para una aplicación de comunicación bidireccional.
[000161] Antes de que un análisis de retardo más detallado sea presentado con referencia a la Figura 14, se describe un sistema de codificación que comprende una herramienta de SBR. En otras palabras, en esta sección, todos los componentes de un sistema de codificación 500 mostrado en la Figura 14a son analizados con respecto a su contribución al retardo del sistema global. La Figura 14a da una vista general detallada del sistema completo, en donde la Figura 14b pone énfasis en las fuentes del retardo.
[000162] El sistema mostrado en la Figura 14a comprende un codificador 500, que a su vez comprende un convertidor de tiempo/frecuencia de MDCT, opera en el procedimiento de velocidad doble como un codificador de velocidad doble. Además, el codificador 500 también comprende un banco de filtros de análisis de QMF 520, que es parte de la herramienta de SBR. Tanto el convertidor de tiempo/frecuencia de MDCT 510 y el banco de filtros de análisis de QMF (QMF = Filtro de Espejo de Cuadratura) son acoplados conjuntamente tanto en términos de sus entradas como de sus salidas. En otras palabras, tanto el convertidor de MDCT 510 también como el banco de filtros de análisis de QMF 520 es provisto con los mismos datos de entrada. Sin embargo, en tanto que el convertidor de MDCT 510 proporciona la información de baja banda, el banco de filtros de análisis de QMF 520 proporciona los datos de SBR. Ambos datos son combinados a una corriente de bits y provistos a un descodificador 530.
[000163] El descodificador 530 comprende un convertidor de frecuencia/tiempo de IMDCT 540, que es capaz de descodificar la corriente de bits para obtener, por lo menos en términos de las partes de banda baja, una señal de dominio de tiempo, que será provista a una salida del descodificador vía un retardador 550. Además, una salida del convertidor de IMDCT 540 es acoplada a un banco de filtros de análisis de QMF adicional 560, que es parte de una herramienta de SBR del descodificador 530. Además, la herramienta de SBR comprende un generador de HF 570, que es acoplado a una salida del banco de filtros de análisis de QMF 560 y capaz de generar los componentes de frecuencia más alta en base a los datos de SBR del banco de filtros de análisis de QMF 520 del codificador 500. Una salida del generador de HF 570 es acoplado a un banco de filtro de síntesis de QMF 580, que transforma las señales en el dominio de QMF de regreso al dominio de tiempo en el cual las señales de banda baja retardadas son combinadas con las señales de banda alta, tal como son provistas por la herramienta de SBR del descodificador
530. Los datos resultantes serán luego provistos como los datos de salida del descodificador 530.
[000164] En comparación con la Figura 14a, la Figura 14b enfatiza las fuentes de retardo del sistema mostrado en la Figura 14a. Para ser aún más precisos, dependiendo de la implementación concreta del codificador 500 y el descodificador 530, la Figura 14b ilustra las fuentes de retardo del sistema de ER AAC LD de MPEG-4 que comprende una herramienta de SBR. El codificador apropiado de este sistema de audio utiliza un banco de filtros de MDCT/IMDCT para una transformación de tiempo/frecuencia/tiempo o conversión de tiempo/frecuencia/tiempo con un tamaño de cuadro de 512 ó 480 muestras. Los resultados en retardos de reconstrucción, por consiguiente, que son iguales a 1024 son 960 muestras, dependiendo de la implementación concreta. En el caso de usar el codec de ER AAC LD de MPEG-4 en combinación con SBR en un modo de velocidad doble, el valor de retardo tiene que ser duplicado debido a la conversión de velocidad de toma de muestras.
[000165] Un análisis de retardo global más detallado y el requerimiento muestra que en el caso de un codec de AAC LD en combinación con una herramienta de SBR, un retardo algorítmico global de 16 ms a una velocidad de toma de muestra de 48 kHz y el tamaño de cuadro del codificador central de 480 muestras serán el resultado. La Figura 15 comprende una tabla, que da una vista general del retardo producido por los diferentes componentes asumiendo una velocidad de toma de muestras de 48 kHz y el tamaño de cuadro del codificador central de 480 muestras, en donde el codificador central corre efectivamente a una velocidad de toma de muestras de 24 kHz debido al procedimiento de velocidad doble.
[000166] La vista general de las fuentes de retardo en la Figura 15 muestra que en el caso de un codec AAC LD junto con una herramienta de SBR, un retardo algorítmico global de 16 ms resultaría, que es sustancialmente más alto que lo que es permisible para aplicaciones de telecomunicaciones. Esta evaluación comprende la combinación estándar del codificador de AAC LD junto con la herramienta de SBR, que incluye las contribuciones de retardo de los componentes de velocidad doble de MDCT/IMDCT, los componentes de QMF y los compuestos de superposición de SBR.
[000167] Sin embargo, utilizando las adaptaciones descritas previamente y al emplear modalidades como se
5
15
25
35
45
55
65 E11173652
26-02-2015
describe anteriormente, un retardo global de solamente 42 ms es obtenible, que incluye las contribuciones de retardo de las modalidades de los bancos de filtros de bajo retardo en el modalidad de velocidad doble (ELD MDCT
+ IMDCT) y los compuestos de QMF.
[000168] Con respecto a algunas fuentes de retardo en la estructura del codificador central de AAC también como con respecto al módulo de SBR, el retardo algorítmico del núcleo de AAC LD puede ser descrito como que es de 2M muestras, en donde una vez más, M es la longitud de cuadro básica del codificador central. En contraste, el banco de filtros de bajo retardo reduce el número de muestras por M/2 debido a introducir las secciones iniciales 160, 270 o al introducir un número apropiado de valores cero u otros valores en la estructura de las funciones de ventana apropiadas. En el caso del uso de un núcleo de AAC en combinación con una herramienta de SBR, el retardo es duplicado debido a la conversión de velocidad de toma de muestras de un sistema de velocidad doble.
[000169] Para aclarar, algunos de los números dados en la tabla en la Figura 15, en la estructura de un descodificador de SBR típico, dos fuentes de retardo pueden ser identificadas. Por una parte, los componentes de QMF comprenden un retardo de reconstrucción del banco de filtros de 640 muestras. Sin embargo, puesto que el retardo de cuadro de 64-1 = 63 muestras ya está introducido por el codificador central mismo, puede ser restado para obtener el valor retardado dado en la tabla en la Figura 15 de 577 muestras.
[000170] Por otra parte, la reconstrucción de HF de SBR provoca un retardo adicional con una herramienta de SBR estándar de 6 ranuras de QMF debido a la rejilla de tiempo variable. Así, el retardo es en el SBR estándar, seis veces 64 muestras de 384 muestras.
[000171] Al implementar modalidades de bancos de filtros también como implementar una herramienta de SBR mejorada, un ahorro de retardo de 18 ms puede ser obtenido al no implementar una combinación directa de un codificador de AAC LD junto con una herramienta de SBR que tiene un retardo global de 60 ms, pero un retardo global de 42 ms es obtenible. Como se menciona previamente, estas cifras están basadas en una velocidad de toma de muestras de 48 kHz y en una longitud de cuadro de M = 480 muestras. En otras palabras, aparte del llamado retardo de cuadro de M = 480 muestras en el ejemplo mencionado anteriormente, el retardo de superposición, que es un segundo aspecto importante en términos de optimización de retardo, puede ser reducido significativamente al introducir una modalidad de un banco de filtros de síntesis o un banco de filtros de análisis para obtener una baja velocidad de bits y un sistema de codificación de audio de bajo retardo.
[000172] Modalidades de la presente invención pueden ser implementadas en muchos campos de aplicación, tal como sistema de conferencias y otros sistemas de comunicaciones bidireccionales. Al tiempo de su concepción alrededor de 1997, los requerimientos retardados ajustados para un esquema de comunicación de audio general de bajo retardo, que conduce al diseño de un codificador de AAC LD, eran para obtener un retardo algorítmico de 20 ms, que es satisfecho por el AAC LD cuando correa a una velocidad de muestra de 48 kHz y un tamaño de cuadro de M = 480. En contraste con esto, muchas aplicaciones prácticas de este codec, tal como teleconferencia, emplean una velocidad de toma de muestras de 32 kHz y así, trabajan con un retardo de 30 ms. Similarmente, debido a la importancia creciente de comunicaciones a base de IP, los requerimientos de retardo del codec de telecomunicación de ITU modernos permiten un retardo de, aproximadamente hablando, 40 ms. Diferentes ejemplos incluyen el codificador anexo G.722.1 reciente con un retardo algorítmico de 40 ms y el codificador G.729.1 con un retardo algorítmico de 48 ms. Así, el retardo global obtenido por un codificador de AAC LD mejorado o codificador de AAC ELD que comprende una modalidad de un banco de filtros de bajo retardo se puede poner en operación para caer plenamente dentro del intervalo de retardo de los codificadores de telecomunicación comunes.
[000173] La Figura 16 muestra un diagrama de bloques de una modalidad de un mezclador 600 para mezclar una pluralidad de cuadros de entrada, en donde cada cuadro de entrada es una representación espectral de un cuadro de dominio de tiempo correspondiente que es provisto de una fuente diferente. Por ejemplo, cada cuadro de entrada para el mezclador 600 puede ser provisto por una modalidad de un codificador 400 u otro sistema o componente apropiado. Se debe notar que en la Figura 16, el mezclador 600 está adaptado para recibir cuadros de entrada de tres fuentes diferentes. Sin embargo, esto no representa ninguna limitación. Para ser más precisos, en principio, una modalidad de un mezclador 600 puede ser adaptada o configurada para procesar y recibir un número arbitrario de cuadros de entrada, cada cuadro de entrada provisto por una fuente diferente, tal como un codificador diferente 400.
[000174] La modalidad del mezclador 600 mostrado en la Figura 16 comprende un descodificador de entropía 610, que es apto de descodificar por entropía la pluralidad de cuadros de entrada provistos por las diferentes fuentes. Dependiendo de la implementación concreta, el descodificador de entropía 610 puede por ejemplo ser implementado como un descodificador de entropía de Huffman o como un descodificador de entropía que emplea otro algoritmo de descodificación por entropía, tal como la llamada Codificación Aritmética, Codificación Unaria, Codificación de Elias Gamma, Codificación de Fibonacci, Codificación de Golomb o Codificación de Rice.
[000175] Los cuadros de entrada descodificados por entropía son luego provistos a un descuantificador opcional 620, que puede estar adaptado de tal manera que los cuadros de entrada descodificados por entropía pueden ser descuantificados para acomodar circunstancias específicas de aplicación, tal como la característica de volumen del oído humano. Los cuadros de entrada descodificados por entropía y opcionalmente descuantificados son luego
5
15
25
35
45
55
65 E11173652
26-02-2015
provistos a un escalador 630, que es capaz de escalar la pluralidad de cuadros de entropía en el dominio de frecuencia. Dependiendo de la implementación concreta de una modalidad de un mezclador 600, el escalador 630 puede por ejemplo, escalar cada uno de los cuadros de entrada descodificados por entropía y opcionalmente descodificados al multiplicar cada uno de los valores por un factor constante 1/P, en donde P es un número entero que indica el número de fuentes diferentes o codificadores 400.
[000176] En otras palabras, el escalador 630 es en este caso capaz de escalar hacia abajo los cuadros provistos por el descuantificador 620 o el descodificador de entropía 610 para escalarlos descendentemente para impedir que las señales correspondientes se vuelvan demasiado grandes con el fin de impedir un desbordamiento u otro error computacional o para impedir distorsiones audibles como chasquidos. Diferentes implementaciones del escalador 630 pueden también ser implementadas, de tal manera que un escalador que es capaz de escalar el cuadro provisto en una manera de ahorro de energía, por ejemplo, evaluar la energía de cada uno de los cuadros de entrada, dependiendo de una o más bandas de frecuencia espectrales. En tal caso, en cada una de estas bandas de frecuencia espectrales, los valores correspondientes en el dominio de frecuencia puede ser multiplicado con un factor constante, de tal manera que la energía global con respecto a todos los intervalos de frecuencia es idéntica. Adicional o alternativamente, el escalador 630 puede también estar adaptado de tal manera que la energía de cada uno de los subgrupos espectrales es idéntica con respecto a todos los cuadros de entrada de todas las fuentes diferentes o que la energía global de cada uno de los cuadros de entrada es constante.
[000177] Luego el escalador 630 es acoplado a un sumador 640, que es capaz de sumar los cuadros provistos por el escalador, que también son denominados como cuadros escalados en el dominio de frecuencia para generar un cuadro agregado también en el dominio de frecuencia. Esto se puede llevar a cabo por ejemplo al sumar todos los valores correspondientes al mismo índice de muestra de todos los cuadros escalados provistos por el escalador 630.
[000178] El sumador 640 es capaz de sumar los cuadros provistos por el escalador 630 en el dominio de frecuencia para obtener un cuadro agregado, que comprende la información de todas las fuentes tal como es provista por el escalador 630. Como un componente opcional adicional, una modalidad de un mezclador 600 puede también comprender un cuantificador 650 al cual el cuadro agregado del sumador 640 puede ser provisto. De acuerdo con los requerimientos específicos de aplicación, el cuantificador opcional 650 puede por ejemplo ser usado para adaptar el cuadro agregado para satisfacer algunas condiciones. Por ejemplo, el cuantificador 650 puede ser adaptado de tal manera que el tacto del descuantificador 620 puede ser invertido. En otras palabras, si por ejemplo, una característica especial radica en los cuadros de entrada tal como son provistos al mezclador, que ha sido removido o alterado por el descuantificador 620, el cuantificador 650 puede luego ser adaptado para proporcionar estos requerimientos o condiciones especiales al cuadro agregado. Como un ejemplo, el cuantificador 650 puede por ejemplo ser adaptado para acomodar las características del oído humano.
[000179] Como un componente adicional, la modalidad del mezclador 600 puede comprender además un codificador de entropía 660, que es capaz de codificar por entropía el cuadro agregado opcionalmente cuantificado y proporcionar un cuadro mezclado a uno o más receptores, por ejemplo, que comprenden una modalidad de un codificador 450. Una vez más, el codificador de entropía 660 puede estar adaptado para codificar por entropía el cuadro agregado en base al algoritmo de Huffman u otro de los algoritmos mencionados anteriormente.
[000180] Al emplear una modalidad de un banco de filtros de análisis, un banco de filtros de síntesis u otra modalidad relacionada en la estructura de un codificador y un descodificador, un mezclador puede ser establecido e implementado que es capaz de mezclar señales en el dominio de frecuencia. En otras palabras, al implementar una modalidad de uno de los codecs de AAC de bajo retardo mejorados descritos previamente, un mezclador puede ser implementado, que es capaz de mezclar directamente una pluralidad de cuadros de entrada en el dominio de frecuencia, sin tener que transformar los cuadros de entrada respectivos al dominio de tiempo para compensar la posible conmutación de parámetros, que son implementados en los codecs del estado del arte para comunicaciones de habla. Como se explica en el contexto de las modalidades de un banco de filtros de análisis y un banco de filtros de síntesis, estas modalidades permiten una operación sin cambiar parámetros, como la conmutación de las longitudes de bloque o conmutación entre ventanas diferentes.
[000181] La Figura 17 muestra una modalidad de un sistema de conferencia 700 en forma de un MCU (Unidad de Control de Medios), que puede por ejemplo ser implementada en la estructura de un servidor. El sistema de conferencia 700 o MCU 700 comprende una pluralidad de corrientes de bits, de los cuales la Figura 17, dos son mostrados. Un descodificador y descuantificador de entropía combinado 610, 620 también como una unidad combinada 630, 640 que son marcados en la Figura 17 como “mezclador”. Además, la salida de la unidad combinada 630, 640 es provista a la unidad combinada que comprende un cuantificador 650 y el codificador de entropía 660, que proporciona como los cuadros mezclados una corriente de bits salientes.
[000182] En otras palabras, la Figura 17 muestra una modalidad de un sistema de conferencia 700 que es capaz de mezclar una pluralidad de corrientes de bits entrantes en el dominio de frecuencia, ya que la corriente de bits entrante también como las corrientes de bits salientes han sido creadas utilizando una ventana de bajo retardo en el lado del codificador, mientras que las corrientes de bits salientes están propuestas y aptas de ser procesadas, en base a la misma ventana de bajo retardo en el lado del descodificador. En otras palabras, la MCU 700 mostrada en
5
15
25
35
45
55
65 E11173652
26-02-2015
la Figura 17 está basada en el uso de la ventana de bajo retardo universal solamente.
[000183] Una modalidad de un mezclador 600 también como una modalidad de un sistema de conferencia 700 es por consiguiente apropiado para ser aplicado en la estructura de modalidades de la presente invención en forma de un banco de filtros de análisis, un banco de filtros de síntesis y las otras modalidades relacionadas. Para ser más preciso, una aplicación técnica de una modalidad de un codec de bajo retardo con solamente una ventana permite la mezcla en el dominio de frecuencia. Por ejemplo, en escenarios de (tele)conferencia con más de dos participantes o fuentes, podría frecuentemente ser deseable recibir varias señales de codec, mezclarlas a una señal y transmitir adicionalmente la señal codificada resultante, al emplear una modalidad de la presente invención en el lado del codificador y el lado del descodificador, en algunas modalidades de un sistema de conferencia 700 y el mezclador 600, el método implementacional puede ser reducido en comparación con una manera directa de descodificar las señales entrantes, mezclar las señales codificadas en el dominio de tiempo y re-codificar la señal mezclada otra vez al dominio de frecuencia.
[000184] La implementación de tal mezclador directo en forma de una MCU es mostrada en la Figura 18 como un sistema de conferencia 750. El sistema de conferencia 750 también comprende un módulo combinado 760 para cada una de las corrientes de bits entrantes que operan en el dominio de frecuencia y aptas de codificación por entropía y descuantificación de la corriente de bits entrantes. Sin embargo, en el sistema de conferencia 750 mostrado en la Figura 18, los módulos 760 son acoplados al convertidor de IMDCT 770 cada uno, de los cuales uno está operando en el modo de operación de ventana seno, mientras que el otro está operando actualmente en el modo de operación de ventana de baja superposición. En otras palabras, los dos convertidores de IMDCT 770 transforman la corriente de bits entrantes del dominio de frecuencia al dominio de tiempo, que es necesario en el caso de un sistema de conferencia 750 ya que las corrientes de bits entrantes están basadas en un codificador, que usa tanto la ventana seno como la ventana de baja superposición, dependiendo de la señal de audio para codificar las señales respectivas.
[000185] El sistema de conferencia 750 comprende además un mezclador 780, que mezcla en el dominio de tiempo las dos señales entrantes de los dos convertidores de IMDCT 770 y proporciona una señal de dominio mezclada a un convertidor de MDCT 790, que transfiere la señal del dominio de tiempo al dominio de frecuencia.
[000186] La señal mezclada en el domicilio de frecuencia tal como es provista por el MDCT 790 es luego provista a un módulo combinado 795, que es luego capaz de cuantificar una codificación de entropía de la señal para formar la corriente de bits saliente.
[000187] Sin embargo, el procedimiento de acuerdo con el sistema de conferencia 750 tiene dos desventajas. Debido a la descodificación y codificación completa por los dos convertidores de IMDCT 770 y el MDCT 790, el alto costo computacional será pagado al implementar el sistema de conferencia 750. Sin embargo, debido a la introducción de la descodificación y codificación, un retardo adicional es introducido que puede ser alto bajo ciertas circunstancias.
[000188] Al emplear en los sitios de descodificador y codificador, modalidades de la presente invención o para ser más precisos, al implementar la nueva ventana de bajo retardo, estas desventajas pueden ser superadas o eliminadas dependiendo de la implementación concreta en el caso de algunas modalidades. Esto se obtiene al hacer la mezcla en el dominio de frecuencia como se explica en el contexto del sistema de conferencia 700 en la Figura
17. Como consecuencia, la modalidad de un sistema de conferencia 700 como se muestra en la Figura 17 no comprende transformadas y/o bancos de filtros que tienen que ser implementados en la estructura del sistema de conferencia 750 para descodificar y codificar las señales con el fin de transformar las señales del dominio de frecuencia al dominio de tiempo y de regreso otra vez. En otras palabras, la mezcla de corriente de bits en el caso de diferentes formas de ventana da como resultado costo adicional de un bloque de retardo adicional debido al convertidor de MDCT/IMDCT 770, 790.
[000189] Como consecuencia, en algunas modalidades del mezclador 600 y en algunas modalidades del sistema de conferencia 700 como ventajas adicionales, costos computacionales costos computacionales más bajos y una limitación con respecto al retardo adicional puede ser implementado, de tal manera que en algunos casos ningún retardo adicional podría ser obtenible.
[000190] La Figura 19 muestra una modalidad de una implementación eficiente de un banco de filtros de bajo retardo. Para ser más precisos, antes del discutir la complejidad computacional y aspectos relacionados con la aplica adicionales, en la estructura de la Figura 19, una modalidad de un banco de filtros de síntesis 800 será descrita en más detalle, que puede por ejemplo ser implementada en una modalidad de un descodificador. La modalidad de un banco de filtros de análisis de bajo retardo 800, de aquí, simboliza un inverso de una modalidad de un banco de filtros de síntesis o un codificador.
[000191] La banco de filtros de síntesis 800 comprende un convertidor de frecuencia/tiempo de transformada de coseno discreta tipo iv inversa 810, que es capaz de proporcionar una pluralidad de cuadros de salida a un módulo combinado 820 que comprende un formador de ventanas y un traslapador/sumador. Para ser más precisos, el
5
15
25
35
45
55
65 E11173652
26-02-2015
tiempo/frecuencia 810 es un convertidor de transformada de coseno discreta tipo iv inverso, que es provisto con un cuadro de entrada que comprende M valores de entrada ordenados yk (0),..., yk (M-1), en donde M es una vez más un número entero positivo y en donde k es un número entero que indica un índice de cuadro. El convertidor de tiempo/frecuencia 810 proporciona 2M muestras de salida ordenadas xk(0),..., xk (2M-1) en base a los valores de entrada y proporciona estas muestras de salida al módulo 820 que a su vez comprende el formador de ventanas y el traslapador/sumador mencionado anteriormente.
[000192] El formador de ventanas del módulo 820 es capaz de generar una pluralidad de cuadros de ventana, en donde cada uno de los cuadros de ventana comprende una pluralidad de muestras de ventana Zk (0),..., Zk(2M-1) en base a la ecuación o expresión
zk(n) = w(n) • xk(n)
para n = 0,...,2M-1, en donde n es una vez más un número entero que indica un índice de muestra y w(n) es un coeficiente de función de ventana de valor real correspondiente al índice de muestra n. El traslapador/sumador también comprendido en el módulo 820, proporciona o genera que en el cuadro intermedio que comprende una pluralidad de muestras intermedias Mk(0),...Mk (M-1) en base a la ecuación o expresión
mk(n) = Zk (n) + zk-1 (n+M)
para n = 0,...,M-l .
[000193] La modalidad del banco de filtro de síntesis 800 comprende además un elevador 850, que produce un cuadro agregado que comprende una pluralidad de muestras agregadas outk(0),...,outk(m-1) en base a la ecuación o expresión
outk(n) = mk(n) + 1(n-M/2) • mk-1(M-1-n)
para n = M/2,...,M-1, y
outk (n) = mk(n) + 1 (M-1-n) • outk-1 (M-1-n)
para n=0,...,M/2-1, en donde 1(M-1-n),..., 1(M-1) son coeficientes de elevación de valor real. En la Figura 19, la modalidad de la implementación computacionalmente eficiente de un banco de filtros de bajo retardo 800 comprende en la estructura del elevador 830, una pluralidad de retardadores y multiplicadores combinados 840 también como una pluralidad de sumadores 850 para llevar a cabo los cálculos mencionados anteriormente en la estructura del elevador 830.
[000194] Dependiendo de la implementación concreta de una modalidad de un banco de filtros de síntesis 800, los coeficientes de ventana o coeficientes de función de ventana w(n) obedecen a las relaciones dadas en la Tabla 5 del anexo en el caso de una modalidad con M = 512 valores de entrada por cuadro de entrada. La Tabla 9 del anexo comprenden un conjunto de relaciones, que los coeficientes de ventana w(n) obedecen, en el caso de M = 480 valores de entrada por cuadro de entrada. Además, las Tablas 6 y 10 comprenden relaciones para los coeficientes de elevación 1 (n) para modalidades con M = 512 y M = 480, respectivamente.
[000195] Sin embargo, en algunas modalidades de un banco de filtros de síntesis 800, los coeficientes de ventana w(n) comprenden los valores dados en la Tabla 7 y 11, para modalidades con M = 512 y M = 480 valores de entrada por cuadro de entrada, respectivamente. Así, las Tablas 8 y 12 en el anexo comprenden los valores para el coeficiente de elevación 1(n) para modalidades con M = 512 y M = 480 muestras de entrada por cuadro de entrada, respectivamente.
[000196] En otras palabras, una modalidad de un banco de filtros de bajo retardo 800 puede ser implementada tan suficientemente como un convertidor de MDCT regular. La estructura general de tal modalidad es ilustrada en la Figura 19. La DCT-IV inversa y el traslapador/sumador de ventana son efectuados de la misma manera como las ventanas tradicionales, sin embargo, empleando los coeficientes de formación de ventana mencionados anteriormente, dependiendo de la implementación concreta de la modalidad. Como en el caso del coeficiente de formación de ventana en la estructura de la modalidad del banco de filtro de síntesis 200, también en este caso M/4 coeficientes de ventana son coeficientes de ventana de valor cero, que así no involucran en principio ninguna operación. Para la superposición prolongada al pasado, solamente M operaciones de multiplicador/suma adicionales son requeridas, como se puede ver en la estructura del elevador 830. Estas operaciones adicionales son también algunas veces denominadas como “matrices de retardo cero”. Algunas veces estas operaciones son también conocidas como “etapas de elevación”.
[000197] La implementación eficiente mostrada en la Figura 19 puede bajo algunas circunstancias ser más eficiente como una implementación directa de un banco de filtros de síntesis 200. Para ser más precisos, dependiendo de la implementación concreta, tal implementación más eficiente podría resultar en ahorrar M operaciones, como en el caso de una implementación directa para M operaciones, podría ser recomendable implementar, como la implementación mostrada en la Figura 19, requiere en principio, 2M operaciones en la estructura del módulo 820 y M operaciones en la estructura del elevador 830.
[000198] En términos de una determinación concerniente con la complejidad de una modalidad de un banco de filtros de bajo retardo, especialmente en términos de la complejidad computacional, la Figura 20 comprende una
5
15
25
35
45
55
65 E11173652
26-02-2015
tabla que ilustra la complejidad aritmética de una modalidad de una implementación de una modalidad de un banco de filtros de síntesis 800 de acuerdo con la Figura 19 en el caso de M = 512 valores de entrada por cuadro de entrada. Para ser más precisos, la tabla en la Figura 20 comprende un valor estimativo del número global resultante de operaciones en el caso de un convertidor de IMDCT (modificado) junto con una formación de ventana en el caso de una función de ventana de bajo retardo. El número de operaciones globales es 9600.
[000199] En comparación, la Figura 21 comprende una tabla de la complejidad aritmética de IMDCT junto con la complejidad requerida para la formación de ventanas en base a la ventana de seno para un parámetro M=512, que da el número total de operaciones para el codec, tal como el codec AAC LD. Para ser más precisos, la complejidad aritmética de este convertidor de IMDCT junto con la formación de ventana para la ventana seno es de 9216 operaciones, que es del mismo orden de magnitud como el número de operaciones globales resultante en el caso de la modalidad del banco de filtro de síntesis 800 mostrado en la Figura 19.
[000200] Como una comparación adicional, la Figura 22 comprende una tabla para un codec de AAC LC, que es también conocido como el codec de audio por adelantado con baja complejidad. La complejidad aritmética de este convertidor de IMDCT, incluyendo las operaciones para superposición de ventanas para el AAC LC (M = 1024) es 19968.
[000201] Una comparación de estas cifras muestra que en resumen, la complejidad del codificador central que comprende una modalidad de un banco de filtros de bajo retardo mejorado es esencialmente comparable a aquel de un codificador central, utilizando un banco de filtro de MDCT-IMDCT regular. Además, el número de operaciones es aproximadamente hablando la mitad del número de operaciones de un codec de AAC LC.
[000202] La Figura 23 comprende dos tablas, en donde la Figura 23a comprende una comparación de los requerimientos de memoria de diferente codecs, mientras que la Figura 23b comprende el mismo valor estimativo con respecto al requerimiento de ROM. Para ser más precisos, las tablas en ambas Figuras 23a y 23b comprenden cada una los codecs mencionados anteriormente AAC LD, AAC ELD e información de AAC LC concernientes con la longitud de cuadro, la memoria intermedia o memoria temporal de trabajo y concerniente con la memoria temporal o memoria intermedia de estado en términos de requerimiento de RAM (Figura 23a) e información concerniente con la longitud de cuadro, el número de coeficientes de ventana y la suma, en términos de los requerimientos de memoria ROM (Figura 23b). Como se menciona previamente en las tablas en las Figuras 23a y 23b, la abreviatura AAC, ELD se refieren a una modalidad de un banco de filtros de síntesis, un banco de filtros de análisis, codificador, descodificador o una modalidad posterior. Para resumir, en comparación con el IMDCT con ventana seno, la implementación eficiente descrita de acuerdo con la Figura 19 de una modalidad del banco de filtros de bajo retardo requiere una memoria de estado adicional de longitud M y M coeficientes adicionales, los coeficientes de elevación 1(0),..., 1 (M-1). Así ya que una longitud de cuadro del AAC LD es la mitad de la longitud de cuadro de AAC LC, el requerimiento de memoria resultante está en el intervalo de aquel del AAC LC.
[000203] En términos de los requerimientos de memoria, las tablas mostradas en la Figura 23a y 23b, de aquí, comparan los requerimientos de RAM y ROM para los tres codecs mencionados anteriormente. Se puede ver que el incremento de memoria para el banco de filtros de bajo retardo es solamente moderado. El requerimiento de memoria global es todavía mucho más bajo en comparación con un codec de AAC LC o implementación de AAC LC.
[000204] La Figura 24 comprende una lista de codecs usados para una prueba de MUSHRA usada en la estructura de una determinación de desempeño. En la tabla mostrada en la Figura 24, la abreviatura AOT significa Tipo de Objeto de Audio, en donde la entrada “X” significa la cinta de objeto de audio ER AAC ELD que puede también ser ajustada a 39. En otras palabras, los AOT, X o AOT 39 identifican una modalidad de un banco de filtros de síntesis o un banco de filtros de análisis. La abreviatura AOT significa en este contexto “tipo de objeto de audio”.
[000205] En la estructura de una prueba de MUSHRA, la influencia de usar una modalidad del banco de filtros de bajo retardo encima del codificador descrito previamente fue probada al llevar a cabo una prueba de escucha para todas las combinaciones en la lista. Para ser más precisos, el resultado de estas pruebas permite las siguientes conclusiones. El descodificador de AAC ELD a 32 kbit/s por canal, se desempeña significativamente mejor que el descodificador de AAC LD original a 32 kb/s. Además, el descodificador de AAC ELD a 32 kb/s por canal se desempeña estadísticamente de manera indistinguible del descodificador de AAC LD original a 48 kb/s por canal. Ya que un codificador de punto de verificación, que se enlaza a AAC LD y el banco de filtro de bajo retardo se desempeña estadísticamente de manera indistinguible de un codificador de AAC LD original ambos corriendo a 48 kb/s. Esto confirma la conveniencia de un banco de filtros de bajo retardo.
[000206] Así, el desempeño del codificador global sigue siendo comparable, en tanto que se obtiene un ahorro significativo en retardo de codec. Además, fue posible retener el desempeño de presión del codificador.
[000207] Como se explica previamente, escenarios de aplicación promisorios o aplicaciones de modalidades de la presente invención, tales como una modalidad de un codec de AAC ELD son video-teleconferencia de alta fidelidad y aplicaciones de voz sobre IP de la siguiente generación. Esto incluye la transmisión de señales de audio arbitrarias, tales como habla o música o en el contexto de una presentación multimedia, a altos niveles de calidad y
5
15
25
35
45
55
65 E11173652
26-02-2015
velocidades de bits competitivas. El retardo algorítmico bajo de una modalidad de la presente invención (AAC ELD) hace este codec una elección excelente para todas las clases de comunicación y aplicaciones.
[000208] Además, el presente documento ha descritos la construcción de un codificador de AAC ELD mejorado que puede opcionalmente ser combinado con una herramienta de replicación de banda espectral (SBR). Con el fin de restringir el incremento asociado en retardo, modificaciones menores en términos de una implementación directa real se pueden hacer necesarios en la herramienta de SBR y los módulos de codificador central. El desempeño de la descodificación de audio de bajo retardo mejorado resultado en base a la tecnología mencionada anteriormente es incrementado significativamente, en comparación con lo que se proporciona actualmente por el estándar de audio de MPEG-4. La complejidad del esquema de codificación central sigue siendo, sin embargo, esencialmente idéntico.
[000209] Además, modalidades de la presente invención comprenden un banco de filtros de análisis o banco de filtro de síntesis que incluyen una ventana de análisis de bajo retardo o un filtro de síntesis de bajo retardo. Además, una modalidad de un método para analizar una señal o sintetizar una señal que tiene una etapa de filtración de análisis de bajo retardo o una etapa de filtración de síntesis de bajo retardo. Modalidades de un filtro de análisis de bajo retardo o filtro de síntesis de bajo retardo son también descritas. Además, programas de computadora que tienen un código de programa para implementar uno de los métodos anteriores cuando corren en una computadora son revelados. Una modalidad de la presente invención comprende también un codificador que tiene un filtro de análisis de bajo retardo o descodificador que tiene un filtro de síntesis de bajo retardo o uno de los métodos correspondientes.
[000210] Dependiendo de ciertos requerimientos de implementación de las modalidades de los métodos de la invención, modalidades de los métodos de la invención pueden ser implementadas en elementos físicos o elementos de programación. La implementación puede ser efectuada utilizando un medio de almacenamiento digital, en particular, un disco, un CD o un DVD que tiene señales de control que se pueden leer electrónicamente almacenados en el mismo, que cooperan con la computadora programable o un procesador, de tal manera que una modalidad de los métodos de la invención es efectuada. En general, una modalidad de la presente invención es por consiguiente un producto de programa de computadora con códigos de programa almacenados en un portador que se puede leer por la máquina, el código de programa es operativo para efectuar una modalidad de los métodos de la invención cuando el producto de programa de computadora corre en la computadora o procesador. En otras palabras, modalidades de los métodos de la invención son por consiguiente, un programa de computadora que tiene un código de programa para efectuar por lo menos una de las modalidades de los métodos de la invención, cuando el programa de computadora corre en la computadora o procesador. En este contexto, procesadores comprenden CPU (Unidad de Procesamiento Central), ASIC (Circuitos Integrados Específicos de Aplicación) o circuitos integrados (IC) adicionales.
[000211] En tanto que lo anterior ha sido mostrado y descrito particularmente con referencia a modalidades particulares de las mismas, se comprenderá por aquellos experimentados en el arte que varios otros cambios en forma y detalles se pueden efectuar sin desviarse del espíritu y alcance de la misma. Por consiguiente, se comprenderá que varios cambios se pueden efectuar al adaptarse a diferentes modalidades sin desviarse del concepto más amplio revelado en la presente y comprendido por las reivindicaciones que siguen.
[000212] En resumen, entre otras, en las modalidades anteriores se describió un banco de filtros de análisis para filtrar una pluralidad de cuadros de entrada de dominio de tiempo, en donde un cuadro de entrada comprende un número de muestras de entrada ordenadas. El banco de filtros de análisis comprende un formador de ventanas configurado para generar una pluralidad de cuadros de ventana, un cuadro de ventana que comprende una pluralidad de muestras de ventana, en donde el formador de ventanas está configurado para el procesamiento de la pluralidad de cuadros de entrada en de manera superpuesta utilizando un valor por adelantado de la muestra, en donde el valor por adelantado de la muestra es menor que el número de muestras de entrada ordenadas de un cuadro de entrada dividido por 2; y un convertidor de tiempo/frecuencia configurado para proporcionar un cuadro de salida que comprende un número de valores de salida, un cuadro de salida es una representación espectral de un cuadro de ventana.
[000213] El banco de filtros de análisis puede estar configurado para generar una muestra de ventana Zi,n en base a la expresión
zi,n = w(N-1-n)-x'i,n en donde i es un número entero que indica un índice de cuadro o un índice de bloque de un cuadro de ventana y/o de un cuadro de entrada, en donde n = -N,..., N-1 es un número entero que indica un índice de muestra, en donde N es un número entero que indica dos veces el número de los valores de salida de un cuadro de salida, en donde w(N1-n) es la función de ventana y en donde x'i,n es una muestra de entrada con un índice de muestra n y el índice de cuadro i.
[000214] En particular, el formador de ventanas puede estar configurado de tal manera que N es igual a 960 y los coeficientes de ventana w(0) a w(2N-l) obedecen las relaciones dadas en la tabla 1 en el anexo.
[000215] El banco de filtros de análisis puede además estar configurado de tal modo que el formador de ventanas
5
15
25
35
45
55
65
E11173652
26-02-2015
está configurado de tal manera que los coeficientes de ventana w(0) a w(2N-1) comprenden los valores dados en la tabla 2 en el anexo.
[000216] Además, N puede ser igual a 1024 y los coeficientes de ventana w(0) a w(2N-l) pueden obedecer las relaciones dadas en la tabla 3 en el anexo.
[000217] Los coeficientes de ventana w(0) a w(2N-l) pueden incluso comprender los valores tal como se dan en la tabla 4 en el anexo.
[000218] El formador de ventanas puede estar configurado para generar un cuadro de ventana en base a un cuadro de entrada al ponderar por lo menos una pluralidad de muestras de entrada del cuadro de entrada con una función de ventana, y el banco de filtros de análisis puede además estar configurado de tal manera que la función de ventana atribuye coeficientes de ventana de valor real a un conjunto de definición. El conjunto de definición comprende por lo menos un número de elementos que es mayor o igual a la diferencia entre el número de las muestras de entrada ordenadas de un cuadro de entrada y el número de muestras de entrada a ser omitidas o el número de muestras de ventana de un cuadro de ventana ajuste al valor predeterminado o ajustado a por lo menos un valor en el intervalo predeterminado por el formador de ventanas o mayor o igual alnúmero de muestras de entrada ordenadas.
[000219] El formador de ventanas puede estar configurado para generar un cuadro de ventana en base a un cuadro de entrada al ponderar por lo menos una pluralidad de muestras de entrada del cuadro de entrada con una función de ventana, y el banco de filtros de análisis puede además ser configurado de modo que el formador de ventanas está configurado de tal manera que la función de ventana es asimétrica con respecto al conjunto de definición con respecto a un punto medio del conjunto de definición. La función de ventana puede comprender más coeficientes de ventana con un valor absoluto de más de 10% de un valor absoluto máximo de los coeficientes de ventana de la función de ventana en una primera mitad del conjunto de definición que en una segunda mitad del conjunto de definición con respecto al punto medio del conjunto de definición, en donde la primera mitad corresponde a la última mitad de las muestras de entrada.
[000220] El formador de ventanas puede estar configurado de tal manera que el valor predeterminado es 0.
[000221] El banco de filtros de análisis puede además estar configurado de tal manera que el formador de ventanas está configurado para omitir o ajustar al valor predeterminado o a un valor en el intervalo predeterminado 128 o 120 muestras de ventana.
[000222] El banco de filtros de análisis puede además estar configurado de tal manera que el convertidor de tiempo/frecuencia está configurado para proporcionar valores de salida Xi,k basados en una expresión
imagen7
para 0 ≤ k < N/2, en donde i es un número entero que indica un índice de bloque o un índice de cuadro, en donde k es un número entero que indica un índice de coeficiente espectral, en donde n es un índice de muestra, en donde N es un número entero que indica dos veces el número de valores de salida de un cuadro de salida, en donde
imagen2
es un valor desplazado, y en donde zi,n es una muestra de ventana correspondiente al coeficiente espectral k y el índice de cuadro i. N puede ser igual a 960 ó 1024.
[000223] El banco de filtros de análisis puede estar comprendido en un codificador. El codificador puede además comprender un codificador de entropía, en donde el codificador de entropía está configurado para codificar la pluralidad de cuadros de salida provistos por el banco de filtros de análisis y en donde el codificador de entropía está configurado para emitir una pluralidad de cuadros codificados en base a los cuadros de salida.
[000224] Además, en las modalidades anteriores se describió entre otros, un banco de filtros de síntesis para filtrar una pluralidad de cuadros de entrada, en donde cada cuadro de entrada comprende un número de valores de entrada ordenados, comprende un convertidor de frecuencia/tiempo configurado para proporcionar una pluralidad de cuadros de salida, un cuadro de salida que comprende un número de muestras de salida ordenadas, un cuadro de salida es una representación temporal de un cuadro de entrada; un formador de ventanas configurado para generar una pluralidad de cuadros de ventana, un cuadro de ventana que comprende una pluralidad de muestras de
5
15
25
35
55
65 E11173652
26-02-2015
ventana; y en donde el formador de ventanas está configurado para proporcionar la pluralidad de muestras de ventana para un procesamiento de manera traslapante en base a un valor por adelantado de la muestra; un traslapador/sumador configurado para proporcionar un cuadro agregado que comprende una sección de partida y una sección restante, un cuadro agregado que comprende una pluralidad de muestras agregadas al agregar por lo menos tres muestras de ventana de por lo menos tres cuadros de ventana para una muestra agregada en la sección restante de un cuadro agregado y al agregar por lo menos dos muestras de ventana de por lo menos dos cuadros de ventana diferentes para una muestra agregada en la sección de partida, en donde el número de muestras de ventana agregadas para obtener una muestra agregada en la sección restante es por lo menos una muestra más alta en comparación con el número de muestras de ventana agregadas para obtener una muestra agregada en la sección de partida o, en donde el formador de ventanas está configurado para omitir por lo menos un valor de salida anterior de acuerdo con el orden de las muestras de salida ordenadas o al ajuste de las muestras de ventana correspondientes a un valor predeterminado o a por lo menos un valor en un intervalo predeterminado para cada cuadro de ventana o la pluralidad de cuadros de ventana; y en donde el traslapador/sumador está configurado para proporcionar la muestra agregada en la sección restante de un cuadro agregado en base a por lo menos tres muestras de ventana de por lo menos tres cuadros de ventana diferentes y una muestra agregada en la sección de partida en base a por lo menos dos muestras de ventana de por lo menos dos cuadros de ventana diferentes.
[000225] El banco de filtros de síntesis puede además estar configurado de tal manera que el traslapador/sumador está configurado de tal manera que una muestra agregada en la sección restante de un cuadro agregado corresponde a muestras de salida que no son omitidas, muestras de ventana ajustadas al valor predeterminado o ajustadas a un valor en el intervalo predeterminado por el formador de ventanas y en donde una muestra agregada en la sección de partida de un cuadro agregado corresponde a una muestra de salida que es omitida o a una muestra de ventana ajustada al valor predeterminado o ajustada a un valor en el intervalo predeterminado por el formador de ventanas.
[000226] El banco de filtros de síntesis puede además estar configurado de tal manera que el convertidor de frecuencia/tiempo está configurado para proporcionar cuadros de salida que comprenden más de dos veces el número de muestras de salida en comparación con el número de valores de entrada de un cuadro de entrada.
[000227] El banco de filtros de síntesis puede además estar configurado de tal manera que el convertidor de frecuencia/tiempo está configurado para proporcionar cuadros de salida que comprenden un número de muestras de salida, que es igual al número de valores de entrada de un cuadro de entrada multiplicado por un número entero número mayor de 2.
[000228] El banco de filtros de síntesis puede además estar configurado de tal manera que el convertidor de frecuencia/tiempo está configurado para proporcionar un cuadro de salida que comprende un número de muestras de salida, que es igual al número de valores de entrada de un cuadro de entrada multiplicado por 4.
[000229] El banco de filtros de síntesis puede además estar configurado de tal manera que el convertidor de frecuencia/tiempo esta basado en por lo menos una de una transformada de coseno discreta y una transformada de seno discreta.
[000230] El banco de filtros de síntesis puede además estar configurado de tal manera que el convertidor de frecuencia/tiempo está configurado para proporcionar muestras de salida Xi,n basadas en la expresión
imagen8
para 0 ≤ n < 2N, en donde i es un número entero que indica un índice de ventana, índice de bloque o índice de cuadro, en donde n es un número entero que indica un índice de muestra, en donde k es un número entero que indica un índice de coeficiente espectral, en donde N es un número entero que indica la mitad del número de muestras de salida de un cuadro de salida, en donde
imagen4
es un valor desplazado, y en donde spec[i][k] es un valor de entrada correspondiente al índice de coeficiente espectral k y el índice de ventana i.
[000231] El banco de filtros de síntesis puede además estar configurado de tal manera que el convertidor de frecuencia/tiempo está configurado de tal manera que N es 10 igual a 960 ó 1024.
[000232] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado para omitir una pluralidad de muestras de salida de un cuadro de salida o ajustar una pluralidad de
E11173652
26-02-2015
muestras de ventana al valor predeterminado o a por lo menos un valor en el intervalo predeterminado.
[000233] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que la pluralidad de muestras de salida omitidas comprende un subconjunto
5 conectado de muestras de salida que comprenden la muestra de salida más anterior de acuerdo con el orden de las muestras de salida ordenadas o en donde la pluralidad de muestras de ventana, que son ajustadas al valor predeterminado o a por lo menos un valor en el intervalo predeterminado, comprende un subconjunto conectado de muestras de ventana que comprende por lo menos una muestra de ventana correspondiente a la muestra de salida más anterior.
10 [000234] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado para generar un cuadro de ventana en base a un cuadro de salida y una función de ponderación al ponderar por lo menos una muestra de salida del cuadro de salida en base a la función de ponderación.
15 [000235] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado para generar un cuadro de ventana basado en un cuadro de salida al multiplicar una muestra de salida del cuadro de salida con un valor basado en una función de ventana.
[000236] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas 20 está configurado para multiplicar por lo menos una pluralidad de muestras de salida del cuadro de salida con un coeficiente de formación de ventana específico de la muestra de salida de una función de ventana.
[000237] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado para multiplicar cada muestra de salida del cuadro de salida con un coeficiente de información de 25 ventana específico de la muestra de salida de la función de ventana.
[000238] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado para generar una muestra de ventana zi,n basada en la expresión zi,n = w(n)· xi,n
30 en donde i es un número entero que indica un índice de cuadro o un índice de bloque de un cuadro de ventana y/o de un cuadro de salida, en donde n = 0,..., 2N-1 es un número entero que indica un índice de muestra, en donde N es un número entero que indica dos veces el número de los valores de entrada de un cuadro de entrada y/o la mitad del número de muestra de salida de un cuadro de salida y/o de las muestras de ventana de un cuadro de ventana, en donde w(n) es la función de ventana y en donde Xi,n es una muestra de salida con un índice de muestra n y el
35 índice de cuadro i.
[000239] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado para generar una muestra de ventana Zi,n basada en la expresión zi,n = w(n)· xi,n
40 en donde i es un número entero que indica un índice de cuadro o un índice de bloque de un cuadro de ventana y/o de un cuadro de salida, en donde n = N/8,..., 2N-1 es un número entero que indica un índice de muestra, en donde N es un número entero que indica dos veces el número de la valores de entrada de un cuadro de entrada y/o la mitad del número de muestras de salida de un cuadro de salida y/o de las muestras de ventana de un cuadro de ventana, en donde w(n) es la función de ventana y en donde Xi,n es una muestra de salida con un índice de muestra n y el
45 índice de cuadro i.
[000240] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que N es igual a 960 y los coeficientes de ventana w(0) a w(2N-l) obedecen las relaciones dadas en la tabla 1 en el anexo.
50 [000241] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que los coeficientes de ventana w(0) a w(2N-l) comprenden los valores dado en la tabla 2 en el anexo.
55 [000242] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que N es igual a 1024 y los coeficientes de ventana w(0) a w(2N-l) obedecen las relaciones dadas en la tabla 3 en el anexo.
[000243] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas 60 está configurado de tal manera que los coeficientes de ventana w(0) a w(2N-l) comprenden los valores dados en la tabla 4 del anexo.
[000244] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que la función de ventana atribuye coeficientes de ventana de valor real a elementos 65 de un conjunto de definición.
5
15
25
35
45
55
65 E11173652
26-02-2015
[000245] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que la función de ventana es asimétrica sobre el conjunto de definición con respecto a un punto medio de un conjunto de definición.
[000246] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que la función de ventana comprende más coeficientes de ventana con un valor absoluto de 10% de un valor absoluto máximo de los coeficientes de ventana de la función de ventana en una primera mitad del conjunto de definición que en la segunda mitad del conjunto de definición con respecto al punto medio del conjunto de definición, en donde la primera mitad corresponde a la mitad más anterior de la valores de salida.
[000247] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que la función de ventana está basada en una variante reflejada de o idéntica con una función de ventana en base a la cual los cuadros de entrada son generados para el banco de filtros de síntesis.
[000248] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que la función de ventana es una función de ventana reflejada con respecto a un punto medio del conjunto de definición de la función de ventana en comparación con una función de ventana en base a la cual los cuadros de entrada son generados para el banco de filtros de síntesis.
[000249] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que el valor predeterminado es 0.
[000250] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado para ajustar una muestra de ventana a un valor en el intervalo predeterminado por al menos uno de ajustar la muestra de ventana correspondiente a un valor que comprende un valor absoluto menos que un umbral mínimo y ajustar la muestra de ventana correspondiente a un valor que comprende un valor absoluto más un umbral máximo.
[000251] El banco de filtros de síntesis puede además estar configurado de tal manera que el umbral mínimo o el umbral máximo es dado por 10s o 2s, en donde s es un número entero.
[000252] El banco de filtros de síntesis puede además estar configurado de tal manera que el umbral mínimo es determinado por un valor absoluto máximo representable por un bit menos significativo o una pluralidad de bits menos significativos o el umbral máximo es determinado por un valor absoluto mínimo representable por un bit más significativo o una pluralidad de bits más significativos en el caso de una representación binaria de por lo menos uno de la valores de entrada, la muestras de salida y las muestras de ventana.
[000253] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que el número de muestras de salida omitidas o el número de muestras de ventana ajustadas al valor predeterminado o a por lo menos un valor en el intervalo predeterminado es mayor o igual al número de muestras de salida de un cuadro de salida dividido por 64.
[000254] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado de tal manera que el número de valores de salida omitidos o el número de muestras de ventana ajustadas al valor predeterminado o a por lo menos un valor en el intervalo predeterminado es mayor o igual al número de muestras agregadas de un cuadro agregado dividido por 16.
[000255] El banco de filtros de síntesis puede además estar configurado de tal manera que el formador de ventanas está configurado para omitir 128 ó 120 o ajustar al valor predeterminado o a por lo menos un valor en el intervalo predeterminado 128 ó 120 muestras de ventana.
[000256] El banco de filtros de síntesis puede además estar configurado de tal manera que el traslapador/sumador está configurado para generar el cuadro agregado en base a por lo menos tres cuadros de ventana generados consecutivamente por el formador de ventanas.
[000257] El banco de filtros de síntesis puede además estar configurado de tal manera que el traslapador/sumador está configurado para generar el cuadro agregado en base a por lo menos tres cuadros de salida generados consecutivamente por el convertidor de frecuencia/tiempo.
[000258] El banco de filtros de síntesis puede además estar configurado de tal manera que el traslapador/sumador está configurado para generar el cuadro agregado que comprende un número de muestras agregadas que es igual al valor por adelantado de la muestra.
[000259] El banco de filtros de síntesis puede además estar configurado de tal manera que el traslapador/sumador está configurado para proporcionar un cuadro agregado que comprende una pluralidad de muestras agregadas en
E11173652
26-02-2015
base a por lo menos 4 muestras de ventana de por lo menos 4 cuadros de ventana diferentes para una muestra agregada correspondiente a una muestra de ventana, que no está basada en una muestra de salida omitida, ajustada al valor predeterminado y a un valor en el intervalo predeterminado por el formador de ventanas y en base a por lo menos 3 muestras de ventana de por lo menos 3 cuadros de ventana diferentes para una muestra agregada
5 correspondiente a una muestra de salida que es omitida o ajustada al valor predeterminado o a un valor en el intervalo predeterminado por el formador de ventanas.
[000260] El banco de filtros de síntesis puede además estar configurado de tal manera que el traslapador/sumador está configurado para proporcionar cuadro agregados que comprenden un número de muestras agregadas que es 10 menor del número de valores de salida de un cuadro de salida dividido por 2.
[000261] El banco de filtros de síntesis puede además estar configurado de tal manera que el traslapador/sumador está configurado para proporcionar cuadros agregados que comprenden un número de muestras agregadas que es igual al número de muestras de salida de un cuadro de salida dividido por un número entero mayor de 2.
15 [000262] El banco de filtros de síntesis puede además estar configurado de tal manera que el traslapador/sumador está configurado para proporcionar cuadros agregados que comprenden un número de muestras agregadas que es igual al número de muestras de salida de un cuadro de salida dividido por 4.
20 [000263] El banco de filtros de síntesis puede además estar configurado de tal manera que el traslapador/sumador está configurado para proporcionar una muestra agregada outi,n basadas en la expresión
imagen9
para 0 ≤ n < N/2, en donde i es un número entero que indica un índice de cuadro o un índice de bloque de un cuadro de ventana y/o
25 de un cuadro agregado, en donde n es un número entero que indica un índice de muestra, en donde N es un número entero que indica mitad del número de la muestras de salida de un cuadro de salida y/o de las muestras de ventana del cuadro de ventana, en donde Zi,n es la muestra de ventana correspondiente a un índice de muestra n y el índice de cuadro i.
30 [000264] El banco de filtros de síntesis puede estar comprendido en un descodificador. El descodificador puede además comprender un descodificador de entropía configurado para descodificar una pluralidad de cuadros codificados y en donde el codificador de entropía está configurado para proporcionar una pluralidad de cuadros de entrada basados en los cuadros codificados al banco de filtros de síntesis.
35 Anexo
[000265]
E11173652
26-02-2015 E11173652
imagen10
26-02-2015 E11173652
imagen11
26-02-2015 E11173652
imagen12
26-02-2015 E11173652
imagen13
26-02-2015 E11173652
imagen14
26-02-2015 E11173652
imagen15
26-02-2015 E11173652
imagen16
26-02-2015 E11173652
imagen17
26-02-2015 E11173652
imagen18
26-02-2015 E11173652
imagen19
26-02-2015 E11173652
imagen20
26-02-2015 E11173652
imagen21
26-02-2015 E11173652
imagen22
26-02-2015 E11173652
imagen23
26-02-2015 E11173652
imagen24
26-02-2015 E11173652
imagen25
26-02-2015 E11173652
imagen26
26-02-2015 E11173652
imagen27
26-02-2015 E11173652
imagen28
26-02-2015 E11173652
imagen29
26-02-2015 E11173652
imagen30
26-02-2015 E11173652
imagen31
26-02-2015 E11173652
imagen32
26-02-2015 E11173652
imagen33
26-02-2015
imagen34
imagen35
imagen36
imagen37
imagen38
imagen39
imagen40
imagen41
imagen42
imagen43
imagen44
imagen45
imagen46
imagen47
imagen48
imagen49
imagen50
imagen51
imagen52
imagen53
imagen54
imagen55
imagen56
imagen57
imagen58
imagen59
imagen60
imagen61
imagen62
imagen63
imagen64
imagen65
imagen66
imagen67
imagen68
imagen69
imagen70
imagen71
imagen72
imagen73
imagen74
imagen75
imagen76
imagen77
imagen78
imagen79
imagen80
imagen81
imagen82
imagen83
imagen84
imagen85
imagen86
imagen87
imagen88
imagen89
imagen90
imagen91
imagen92
imagen93
imagen94
imagen95
imagen96
imagen97
imagen98
imagen99
imagen100
imagen101
imagen102
imagen103
imagen104
imagen105
imagen106
imagen107
imagen108
imagen109
imagen110
imagen111
imagen112
imagen113
imagen114
imagen115
imagen116
imagen117
imagen118
imagen119
imagen120
imagen121
imagen122
imagen123
imagen124
imagen125
imagen126
imagen127
imagen128
imagen129
imagen130
imagen131
imagen132
imagen133
imagen134
imagen135
imagen136
imagen137
imagen138
imagen139
imagen140
imagen141
imagen142
imagen143
imagen144
imagen145
imagen146
imagen147
imagen148

Claims (18)

  1. REIVINDICACIONES
    1.
    Un banco de filtros de análisis para filtrar unapluralidad de cuadros de entrada de dominio de tiempo, cada cuadro de entrada comprendiendo un número de muestras de entrada ordenadas, respecyivamente, que comprende: un formador de ventanas configurado para generar una pluralidad de cuadros de ventana, un cuadro de ventana comprendiendo una pluralidad de muestras de ventana, en donde el formador de ventanas está configurado para el procesamiento de la pluralidad de cuadros de entrada de manera superpuesta utilizando un valor por adelantado de la muestra, en donde el valor por adelantado de la muestra es menor que el número de muestras de entrada ordenadas de un cuadro de entrada dividido por 2; en donde el formador de ventanas está configurado para generar consecutivamente dos cuadros de ventana en base a dos cuadros de entrada al, para cada cuadro de entrada, ponderar por lo menos una pluralidad de muestras de entrada del cuadro de entrada respectivo con una función de ventana, con los dos cuadros de entada solapamdo en un número de muestras de entrda ordenadas que es mayor que la mitad del número de muestras de entrada ordenadas de los cuadros de entrada, y en donde el formador de ventanas está configurado para generar la pluralidad de cuadros de ventana de tal manera que las mismas muestras de entrada ordenadas de los dos cuadros de entrada, en los cuales los dos cuadros de ventana generados consecutivamente están basados, son desplazadas con respecto al orden de las muestras de entrada del cuadro de entrada por el valor por adelantado de la muestra y un convertidor de tiempo/frecuencia configurado para proporcionar un cuadro de salida que comprende un número de valores de salida, un cuadro de salida siendo una representación espectral de un cuadro de ventana.
  2. 2.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado para omitir por lo menos una última muestra de entrada de acuerdo con el orden de las muestras de entrada ordenadas o para ajustar por lo menos una última muestra de ventana correspondiente al orden de las muestras de entrada a cero o a por lo menos un valor en un intervalo predeterminado.
  3. 3.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado para omitir o ajustar una pluralidad de muestras de entrada a cero o a por lo menos un valor en un intervalo predeterminado, en donde la pluralidad de muestras de entrada comprende un subconjunto de muestras de entrada conectadas que comprenden la última muestra de entrada de acuerdo con el orden de las muestras de entrada ordenadas.
  4. 4.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado de tal manera que la ponderación del cuadro de entrada comprende multiplicar por lo menos una pluralidad de muestras de entrada del cuadro de entrada con un coeficiente de formación de ventanas específico de las muestra de entrada de la función de ventana.
  5. 5.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado de tal manera que la ponderación del cuadro de entrada comprende multiplicar cada muestra de entrada del cuadro de entrada con un coeficiente de formación de ventana específico de la muestra de entrada de la función de ventana.
  6. 6.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado para generar una muestra de ventana Zi,n en base a la expresión
    zi,n = w(N-1-n) · x'i,n ,
    en donde i es un número entero que indica un índice de cuadro o un índice de bloque de un cuadro de ventana y/o de un cuadro de entrada, en donde n = -N,..., N-1 es un número entero que indica un índice de muestra, en donde N es un número entero que indica dos veces el número de los valores de salida de un cuadro de salida, en donde w(N1-n) es la función de ventana y en donde x'i,n es una muestra de entrada con un índice de muestra n y el índice de cuadro i.
  7. 7. El banco de filtros de análisis segúnla reivindicación 1, caracterizado porque el formador de ventanas está configurado para generar una muestra de ventana Zi,n en base a la expresión
    zi,n = w(N-1-n) · x'i,n ,
    en donde i es un número entero que indica un índice de cuadro o índice de bloque de un cuadro de ventana y/o de un cuadro de entrada, en donde n = -N,..., 7N/8-1 es un número entero que indica un índice de muestra, en donde N es un número entero que indica dos veces el número de los valores de salida de un cuadro de salida, en donde w(N1-n) es la función de ventana y en donde x'i,n es una muestra de entrada con un índice de muestra n y el índice de cuadro i.
    176
  8. 8.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el formador de ventanas está configurado para ajustar una muestra de ventana a un valor en un intervalo predeterminado al ajustar la muestra de ventana correspondiente a un valor que comprende un valor absoluto menor que un umbral mínimo y/o a un valor que comprende un valor absoluto más de un umbral máximo.
  9. 9.
    El banco de filtros de análisis según la reivindicación 8, caracterizado porque el umbral mínimo y/o el umbral máximo es dado por 10s o 2s, en donde s es un número entero.
  10. 10.
    El banco de filtros de análisis según la reivindicación 8, caracterizado porque el umbral mínimo es determinado por un valor máximo absoluto representable por un bit menos significativo o una pluralidad de bits menos significativos y/o un umbral máximo es determinado por un valor mínimo absoluto representable por un bit más significativo o una pluralidad de bits más significativos en el caso de una representación binaria de las muestras de entrada y/o las muestras de ventana.
  11. 11.
    El banco de filtros de análisis según la reivindicación 2, caracterizado porque el formador de ventanas está configurado de tal manera que el número de muestras de entrada omitidas, el número de muestras de ventana ajustadas a cero o a por lo menos el valor en el intervalo predeterminado es mayor o igual al número de valores de salida de un cuadro de salida dividido por 16.
  12. 12.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el convertidor de tiempo/frecuencia está configurado para proporcionar cuadros de salida que comprenden menos de la mitad del número de valores de salida en comparación con el número de muestras de entrada de un cuadro de entrada.
  13. 13.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el convertidor de tiempo/frecuencia está configurado para proporcionar cuadros de salida que comprenden un número de valores de salida, que es igual al número de muestras de entrada de un cuadro de entrada dividido por un número entero mayor de 2.
  14. 14.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el convertidor de tiempo/frecuencia está configurado para proporcionar un cuadro de salida que comprende un número de valores de salida, que es igual al número de muestras de entrada de un cuadro de entrada dividido por 4.
  15. 15.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el convertidor de tiempo/frecuencia está basado en por lo menos una de una transformada de coseno discreta y una transformada de seno discreta.
  16. 16.
    El banco de filtros de análisis según la reivindicación 1, caracterizado porque el convertidor de tiempo/frecuencia está configurado para proporcionar valores de salida Xi,k basados en una expresión
    imagen1
    para 0 ≤ k<N/2 ,
    en donde i es un número entero que indica un índice de bloque o un índice de cuadro, en donde k es un número entero que indica un índice de coeficiente espectral, en donde n es un índice de muestra, en donde N es un número entero que indica dos veces el número de valores de salida de un cuadro de salida, en donde
    imagen2
    es un valor desplazado, y en donde zi,n es una muestra de ventana correspondiente al coeficiente espectral k y el índice de cuadro i.
  17. 17. Método para filtrar una pluralidad de cuadros de entrada de dominio de tiempo, cada cuadro de entrada comprendiendo un número de muestras de entrada ordenadas, respectivamente, que comprende: generar una pluralidad de cuadros de ventana mediante el procesamiento de la pluralidad de cuadros de entrada de manera traslapante utilizando un valor por adelantado de la muestra; en donde el valor por adelantado de la muestra es menor que el número de muestras de entrada ordenadas de un cuadro de entrada dividido por 2, en donde dos cuadros de ventana generados consecutivamente están basados en dos cuadros de entrada al, para cada cuadro de entrada, ponderar por lo menos una pluralidad de muestras de entrada del cuadro de entrada respectivo con una función de ventana, con los dos cuadros de entada solapamdo en un número de muestras de entrda ordenadas que es mayor que la mitad del número de muestras de entrada ordenadas de los cuadros de entrada, y en donde la generación de la pluralidad de cuadros de ventana comprende generar la pluralidad de cuadros de
    177
    ventana de tal manera que las mismas muestras de entrada ordenadas de los dos cuadros de entrada, en los cuales los dos cuadros de ventana generados consecutivamente están basados, están desplazadas con respecto al orden de las muestras de entrada del cuadro de entrada por el valor por adelantado de la muestra; y proporcionar una pluralidad de cuadros de salida que comprenden un número de valores de salida al efectuar una conversión de tiempo/frecuencia, un cuadro de salida es una representación espectral de un cuadro de ventana.
  18. 18. Programa de computadora para efectuar, cuando se ejecuta en una computadora, el método de conformidad de la reivindicación 17.
    178
ES11173652.6T 2006-10-18 2007-08-29 Banco de filtro de análisis, banco de filtro de síntesis, codificador, decodificador, mezclador y sistema de conferencia Active ES2531568T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US86203206P 2006-10-18 2006-10-18
US862032P 2006-10-18
US744641 2007-05-04
US11/744,641 US8036903B2 (en) 2006-10-18 2007-05-04 Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system

Publications (1)

Publication Number Publication Date
ES2531568T3 true ES2531568T3 (es) 2015-03-17

Family

ID=38904615

Family Applications (5)

Application Number Title Priority Date Filing Date
ES14199155.4T Active ES2592253T3 (es) 2006-10-18 2007-08-29 Banco de filtros de análisis, banco de filtros de síntesis, codificador, descodificador, mezclador y sistema de conferencia
ES09010178T Active ES2374014T3 (es) 2006-10-18 2007-08-29 Banco de filtros de análisis, banco de filtros de síntesis, codificador, descodificador, mezclador y sistema de conferencia.
ES07801974T Active ES2386206T3 (es) 2006-10-18 2007-08-29 Banco de filtros de análisis, banco de filtros de síntesis, codificador, descodificador, mezclador y sistema de conferencia
ES11173652.6T Active ES2531568T3 (es) 2006-10-18 2007-08-29 Banco de filtro de análisis, banco de filtro de síntesis, codificador, decodificador, mezclador y sistema de conferencia
ES09010179T Active ES2380177T3 (es) 2006-10-18 2007-08-29 Banco de filtros de análisis, banco de filtros de síntesis, codificador, descodificador, mezclador y sistema de conferencia

Family Applications Before (3)

Application Number Title Priority Date Filing Date
ES14199155.4T Active ES2592253T3 (es) 2006-10-18 2007-08-29 Banco de filtros de análisis, banco de filtros de síntesis, codificador, descodificador, mezclador y sistema de conferencia
ES09010178T Active ES2374014T3 (es) 2006-10-18 2007-08-29 Banco de filtros de análisis, banco de filtros de síntesis, codificador, descodificador, mezclador y sistema de conferencia.
ES07801974T Active ES2386206T3 (es) 2006-10-18 2007-08-29 Banco de filtros de análisis, banco de filtros de síntesis, codificador, descodificador, mezclador y sistema de conferencia

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES09010179T Active ES2380177T3 (es) 2006-10-18 2007-08-29 Banco de filtros de análisis, banco de filtros de síntesis, codificador, descodificador, mezclador y sistema de conferencia

Country Status (22)

Country Link
US (6) US8036903B2 (es)
EP (5) EP2113910B1 (es)
JP (5) JP5546863B2 (es)
KR (3) KR101209410B1 (es)
CN (4) CN102243874B (es)
AT (3) ATE539432T1 (es)
AU (3) AU2007312696B2 (es)
BR (2) BRPI0716004B1 (es)
CA (3) CA2782476C (es)
ES (5) ES2592253T3 (es)
HK (4) HK1138674A1 (es)
IL (4) IL197757A (es)
MX (1) MX2009004046A (es)
MY (4) MY155487A (es)
NO (5) NO342445B1 (es)
PL (5) PL2884490T3 (es)
PT (1) PT2884490T (es)
RU (1) RU2426178C2 (es)
SG (2) SG174836A1 (es)
TW (1) TWI355647B (es)
WO (1) WO2008046468A2 (es)
ZA (1) ZA200901650B (es)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7422840B2 (en) * 2004-11-12 2008-09-09 E.I. Du Pont De Nemours And Company Apparatus and process for forming a printing form having a cylindrical support
US7916711B2 (en) * 2005-03-24 2011-03-29 Siport, Inc. Systems and methods for saving power in a digital broadcast receiver
GB2439685B (en) 2005-03-24 2010-04-28 Siport Inc Low power digital media broadcast receiver with time division
US7945233B2 (en) * 2005-06-16 2011-05-17 Siport, Inc. Systems and methods for dynamically controlling a tuner
US8335484B1 (en) 2005-07-29 2012-12-18 Siport, Inc. Systems and methods for dynamically controlling an analog-to-digital converter
ES2631906T3 (es) 2006-10-25 2017-09-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la generación de valores de subbanda de audio, aparato y procedimiento para la generación de muestras de audio en el dominio temporal
CN101589623B (zh) 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
US8199769B2 (en) 2007-05-25 2012-06-12 Siport, Inc. Timeslot scheduling in digital audio and hybrid audio radio systems
US20090099844A1 (en) * 2007-10-16 2009-04-16 Qualcomm Incorporated Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders
JP5400059B2 (ja) * 2007-12-18 2014-01-29 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
CN102789782B (zh) * 2008-03-04 2015-10-14 弗劳恩霍夫应用研究促进协会 对输入数据流进行混合以及从中产生输出数据流
EP2410522B1 (en) 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for encoding an audio signal and computer program
TWI496479B (zh) * 2008-09-03 2015-08-11 Dolby Lab Licensing Corp 增進多聲道之再生
JP2012516462A (ja) 2009-01-28 2012-07-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオエンコーダ、オーディオデコーダ、符号化されたオーディオ情報、オーディオ信号を符号化および復号化する方法およびコンピュータ・プログラム
TWI569573B (zh) 2009-02-18 2017-02-01 杜比國際公司 低延遲調變濾波器組及用以設計該低延遲調變濾波器組之方法
US8320823B2 (en) * 2009-05-04 2012-11-27 Siport, Inc. Digital radio broadcast transmission using a table of contents
US8971551B2 (en) 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
US8831318B2 (en) * 2009-07-06 2014-09-09 The Board Of Trustees Of The University Of Illinois Auto-calibrating parallel MRI technique with distortion-optimal image reconstruction
KR101732208B1 (ko) * 2009-10-09 2017-05-02 디티에스, 인코포레이티드 오디오 녹음의 적응적 동적 범위 강화
EP3693963B1 (en) * 2009-10-15 2021-07-21 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
EP2372703A1 (en) * 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
MY156027A (en) * 2010-08-12 2015-12-31 Fraunhofer Ges Forschung Resampling output signals of qmf based audio codecs
US8489053B2 (en) 2011-01-16 2013-07-16 Siport, Inc. Compensation of local oscillator phase jitter
CN103493129B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
AU2012217158B2 (en) * 2011-02-14 2014-02-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
PL2676268T3 (pl) 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
EP3441967A1 (en) * 2011-04-05 2019-02-13 Nippon Telegraph and Telephone Corporation Decoding method, decoder, program, and recording medium
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
WO2014046916A1 (en) * 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
JP5894347B2 (ja) * 2012-10-15 2016-03-30 ドルビー・インターナショナル・アーベー 転移器に基づく仮想ベース・システムにおけるレイテンシーを低減するシステムおよび方法
WO2015036348A1 (en) * 2013-09-12 2015-03-19 Dolby International Ab Time- alignment of qmf based processing data
DE102014214143B4 (de) 2014-03-14 2015-12-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals im Frequenzbereich
EP2980791A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
CN104732979A (zh) * 2015-03-24 2015-06-24 无锡天脉聚源传媒科技有限公司 一种音频数据的处理方法及装置
CN106297813A (zh) 2015-05-28 2017-01-04 杜比实验室特许公司 分离的音频分析和处理
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
US10762911B2 (en) * 2015-12-01 2020-09-01 Ati Technologies Ulc Audio encoding using video information
JP2018101826A (ja) * 2016-12-19 2018-06-28 株式会社Cri・ミドルウェア 音声通話システム、音声通話方法およびプログラム
US11282492B2 (en) 2019-02-18 2022-03-22 Bose Corporation Smart-safe masking and alerting system
US10991355B2 (en) 2019-02-18 2021-04-27 Bose Corporation Dynamic sound masking based on monitoring biosignals and environmental noises
US11071843B2 (en) 2019-02-18 2021-07-27 Bose Corporation Dynamic masking depending on source of snoring

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5869819A (en) * 1994-08-17 1999-02-09 Metrologic Instuments Inc. Internet-based system and method for tracking objects bearing URL-encoded bar code symbols
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
FI935609A (fi) 1992-12-18 1994-06-19 Lonza Ag Dihydrofuroimidatsolijohdannaisten asymmetrinen hydraus
JP3531177B2 (ja) * 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
US5570363A (en) 1994-09-30 1996-10-29 Intel Corporation Transform based scalable audio compression algorithms and low cost audio multi-point conferencing systems
US5867819A (en) 1995-09-29 1999-02-02 Nippon Steel Corporation Audio decoder
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US5946352A (en) 1997-05-02 1999-08-31 Texas Instruments Incorporated Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain
JP4174859B2 (ja) * 1998-07-15 2008-11-05 ヤマハ株式会社 デジタルオーディオ信号のミキシング方法およびミキシング装置
US6226608B1 (en) 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
JP2000267682A (ja) * 1999-03-19 2000-09-29 Victor Co Of Japan Ltd 畳み込み演算装置
US6687663B1 (en) * 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
JP3518737B2 (ja) * 1999-10-25 2004-04-12 日本ビクター株式会社 オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体
JP2001134274A (ja) * 1999-11-04 2001-05-18 Sony Corp ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US6718300B1 (en) 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
US6707869B1 (en) 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
US6963842B2 (en) 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
CN1682281B (zh) * 2002-09-17 2010-05-26 皇家飞利浦电子股份有限公司 在语音合成中用于控制持续时间的方法
JP2004184536A (ja) * 2002-11-29 2004-07-02 Mitsubishi Electric Corp 畳み込み演算装置及び畳み込み演算プログラム
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US6982377B2 (en) * 2003-12-18 2006-01-03 Texas Instruments Incorporated Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
US7639823B2 (en) * 2004-03-03 2009-12-29 Agere Systems Inc. Audio mixing using magnitude equalization
EP1728243A1 (en) * 2004-03-17 2006-12-06 Koninklijke Philips Electronics N.V. Audio coding
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR20070068424A (ko) * 2004-10-26 2007-06-29 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
JP2006243664A (ja) * 2005-03-07 2006-09-14 Nippon Telegr & Teleph Corp <Ntt> 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体
GB2426168B (en) * 2005-05-09 2008-08-27 Sony Comp Entertainment Europe Audio processing

Also Published As

Publication number Publication date
HK1163332A1 (en) 2012-09-07
EP2378516A1 (en) 2011-10-19
EP2113911B1 (en) 2011-12-28
TW200832357A (en) 2008-08-01
NO20170988A1 (no) 2009-05-14
US8036903B2 (en) 2011-10-11
USRE45526E1 (en) 2015-05-19
EP2074615B1 (en) 2012-04-18
ES2386206T3 (es) 2012-08-13
KR20110049886A (ko) 2011-05-12
NO342516B1 (no) 2018-06-04
IL226224A0 (en) 2013-06-27
ATE554480T1 (de) 2012-05-15
AU2011201330A1 (en) 2011-04-14
AU2011201331B2 (en) 2012-02-09
JP2013210656A (ja) 2013-10-10
JP2014059570A (ja) 2014-04-03
JP2013228740A (ja) 2013-11-07
NO342476B1 (no) 2018-05-28
SG174836A1 (en) 2011-10-28
ES2380177T3 (es) 2012-05-09
JP5520994B2 (ja) 2014-06-11
IL226223A (en) 2016-02-29
BRPI0716004A8 (pt) 2019-10-08
NO20170986A1 (no) 2009-05-14
JP5546863B2 (ja) 2014-07-09
CN102243875B (zh) 2013-04-03
EP2113910B1 (en) 2011-09-21
KR101209410B1 (ko) 2012-12-10
NO342445B1 (no) 2018-05-22
USRE45277E1 (en) 2014-12-02
EP2378516B1 (en) 2015-01-07
CN102243874B (zh) 2013-04-24
JP2010507111A (ja) 2010-03-04
NO342515B1 (no) 2018-06-04
BRPI0716004B1 (pt) 2020-11-17
ATE525720T1 (de) 2011-10-15
PT2884490T (pt) 2016-10-13
HK1138674A1 (en) 2010-08-27
USRE45339E1 (en) 2015-01-13
AU2007312696A1 (en) 2008-04-24
JP5700714B2 (ja) 2015-04-15
RU2009109129A (ru) 2010-11-27
KR20110049885A (ko) 2011-05-12
CA2667059A1 (en) 2008-04-24
USRE45294E1 (en) 2014-12-16
CN101529502A (zh) 2009-09-09
NO20170982A1 (no) 2009-05-14
CN102243874A (zh) 2011-11-16
JP5700713B2 (ja) 2015-04-15
IL226225A0 (en) 2013-06-27
NO342514B1 (no) 2018-06-04
CN102243873A (zh) 2011-11-16
NO20091900L (no) 2009-05-14
HK1138423A1 (en) 2010-08-20
RU2426178C2 (ru) 2011-08-10
CA2782476C (en) 2016-02-23
CN102243875A (zh) 2011-11-16
EP2074615A2 (en) 2009-07-01
MY164995A (en) 2018-02-28
WO2008046468A3 (en) 2008-06-26
AU2007312696A8 (en) 2009-05-14
JP2012150507A (ja) 2012-08-09
PL2378516T3 (pl) 2015-06-30
CA2782609A1 (en) 2008-04-24
SG174835A1 (en) 2011-10-28
WO2008046468A2 (en) 2008-04-24
MY155486A (en) 2015-10-30
IL226224A (en) 2016-02-29
CA2782609C (en) 2016-10-04
ES2374014T3 (es) 2012-02-13
ES2592253T3 (es) 2016-11-29
KR101162462B1 (ko) 2012-07-04
EP2884490B1 (en) 2016-06-29
MY153289A (en) 2015-01-29
PL2113910T3 (pl) 2012-02-29
JP5859504B2 (ja) 2016-02-10
BRPI0716004A2 (pt) 2013-07-30
USRE45276E1 (en) 2014-12-02
BR122019020171B1 (pt) 2021-05-25
IL197757A (en) 2014-09-30
AU2007312696B2 (en) 2011-04-21
CA2782476A1 (en) 2008-04-24
EP2884490A1 (en) 2015-06-17
CN102243873B (zh) 2013-04-24
NO20170985A1 (no) 2009-05-14
IL226225A (en) 2016-02-29
CA2667059C (en) 2014-10-21
EP2113911A2 (en) 2009-11-04
TWI355647B (en) 2012-01-01
ZA200901650B (en) 2010-03-31
PL2884490T3 (pl) 2016-12-30
MX2009004046A (es) 2009-04-27
AU2011201330B2 (en) 2011-08-25
KR101162455B1 (ko) 2012-07-04
US20080097764A1 (en) 2008-04-24
CN101529502B (zh) 2012-07-25
PL2113911T3 (pl) 2012-06-29
PL2074615T3 (pl) 2012-10-31
IL226223A0 (en) 2013-06-27
EP2113911A3 (en) 2009-11-18
IL197757A0 (en) 2009-12-24
ATE539432T1 (de) 2012-01-15
EP2113910A1 (en) 2009-11-04
KR20090076924A (ko) 2009-07-13
MY155487A (en) 2015-10-30
HK1128058A1 (en) 2009-10-16
AU2011201331A1 (en) 2011-04-14

Similar Documents

Publication Publication Date Title
ES2531568T3 (es) Banco de filtro de análisis, banco de filtro de síntesis, codificador, decodificador, mezclador y sistema de conferencia
ES2604983T3 (es) Ajuste de nivel en el dominio del tiempo para decodificación o codificación de señales de audio
RU2562375C2 (ru) Аудиокодер и декодер
ES2380591T3 (es) Codificación de señal de información
US8452605B2 (en) Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
TWI840892B (zh) 音頻編碼器、音頻編碼方法、電腦程式及編碼的多聲道音頻信號
USRE50009E1 (en) Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples