ES2218462T3 - Mejora del rendimiento de sistemas de cifrado que usan metodos de reconstruccion de alta frecuencia. - Google Patents

Mejora del rendimiento de sistemas de cifrado que usan metodos de reconstruccion de alta frecuencia.

Info

Publication number
ES2218462T3
ES2218462T3 ES01983888T ES01983888T ES2218462T3 ES 2218462 T3 ES2218462 T3 ES 2218462T3 ES 01983888 T ES01983888 T ES 01983888T ES 01983888 T ES01983888 T ES 01983888T ES 2218462 T3 ES2218462 T3 ES 2218462T3
Authority
ES
Spain
Prior art keywords
frequency
core
signal
crossover frequency
envelope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES01983888T
Other languages
English (en)
Inventor
Fredrik Henn
Andreas Ehret
Michael Schug
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Coding Technologies Sweden AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Application granted granted Critical
Publication of ES2218462T3 publication Critical patent/ES2218462T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Optical Communication System (AREA)
  • Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Transmitters (AREA)

Abstract

Un aparato para codificar una señal de audio para obtener una señal de audio codificada para ser usada por un decodificador que tiene un módulo de reconstrucción de alta frecuencia para realizar una reconstrucción de alta frecuencia para un intervalo de frecuencia por encima de una frecuencia de cruce, comprendiendo el aparato: un codificador (502) de núcleo para codificar una banda de frecuencia más baja de la señal de audio hasta la frecuencia de cruce, en el que la frecuencia de cruce es variable y en el que el codificador de núcleo es accionable fotograma a fotograma en forma de bloques; y un módulo (504) de control de frecuencia de cruce para estimar, dependiendo de una medición del grado de dificultad para codificar la señal de audio mediante el codificador (502) de núcleo y/o dependiendo de una frontera entre un intervalo de frecuencia tonal y en forma de ruido de la señal de audio, una frecuencia de cruce que se ha de seleccionar mediante el codificador (502) de núcleo para un fotograma de una serie de fotogramas subsiguientes, de manera que la frecuencia de cruce es variable adaptativamente a lo largo del tiempo para la serie de fotogramas subsiguientes.

Description

Mejora del rendimiento de sistemas de cifrado que usan métodos de reconstrucción de alta frecuencia.
Campo técnico
La presente invención se refiere a sistemas digitales de cifrado de audio que emplean métodos de reconstrucción de alta frecuencia (HFR). Esto posibilita un rendimiento más consistente de códec de núcleo y se consigue una calidad de audio mejorada del sistema combinado de HFR y códec de núcleo.
Antecedentes de la invención
Las técnicas de cifrado de fuente de audio se pueden dividir en dos clases: cifrado de audio natural y cifrado de voz. El cifrado de audio natural se usa comúnmente para música o señales arbitrarias a tasas medias de transmisión de bites. Los códeces de voz están limitados básicamente a reproducción de voz, pero por otro lado se pueden usar a tasas de transmisión de bites muy bajas. En ambas clases, la señal se separa generalmente en dos componentes mayores de señal, una envolvente espectral y una correspondiente señal residual. Los códeces que hacen uso de tal división explotan el hecho de que la envolvente espectral se puede cifrar mucho más eficientemente que la residual. En sistemas en los que se usan métodos de reconstrucción de alta frecuencia, no se transmite ninguna residual que corresponda a la banda alta. En su lugar, se genera una banda alta en el lado de decodificador a partir de la banda baja cubierta por el códec de núcleo y se da forma hasta obtener la deseada envolvente espectral de banda alta. En sistemas de HFR de dos extremos, tal como se divulga en la solicitud internacional de patente WO98/57436, se transmiten datos de envolvente que corresponden al intervalo superior de frecuencia, mientras que, en sistemas de HFR de un extremo, la envolvente de banda alta se deriva a partir de la banda baja. En cualquier caso, los códeces de audio de la técnica anterior aplican una frecuencia de cruce, invariable en el tiempo, entre el intervalo de frecuencia del códec de núcleo y el intervalo de frecuencia de HFR. De este modo, a una tasa de transmisión de bites dada, la frecuencia de cruce se selecciona de tal manera que se consigue para material típico de programa un buen intercambio entre artefactos introducidos por el códec de núcleo y artefactos introducidos por el sistema de HFR. Claramente, tal ajuste estático puede estar lejos del óptimo para una señal particular: el códec de núcleo o bien está sobrecargado, dando como resultado artefactos de banda baja más altos de lo necesario, lo que inherente al método de HFR también degrada la calidad de banda alta, o bien no está en uso a su pleno potencial, es decir, se emplea un intervalo de frecuencia de HFR más grande de lo necesario. Por consiguiente, el rendimiento máximo del sistema conjunto de cifrado sólo se alcanza ocasionalmente mediante sistemas de la técnica anterior. Además, no se explota la posibilidad de alinear el cruce hasta transiciones entre regiones con propiedades espectrales dispares, tales como regiones tonal y en forma de ruido.
Sumario de la invención
La presente invención proporciona un nuevo método definido por las reivindicaciones independientes 6, 8 y un aparato definido por las reivindicaciones independientes 1, 7 para la mejora de sistemas de cifrado en los que se usan métodos de reconstrucción de alta frecuencia (HFR). La invención parte del uso tradicional de una frecuencia fija de cruce entre la banda baja, en la que se usan esquemas de cifrado convencionales (tales como MPEG Layer-3 o AAC), y la banda alta, en la que se usan esquemas de cifrado de HFR, mediante la continua estimación y aplicación de la frecuencia de cruce que produce el intercambio óptimo entre artefactos introducidos por el códec de banda baja y el sistema de HFR respectivamente. De acuerdo con la invención, la elección se puede basar en una medición del grado de dificultad de codificar una señal con el códec de núcleo, una detección de demanda de bites de corta duración y un análisis espectral de tonalidad o cualquier combinación de los mismos. La medición de dificultad se puede derivar desde la entropía perceptual o la distorsión relevante psicoacústicamente de códec de núcleo. Ya que la elección óptima cambia frecuentemente a lo largo del tiempo, la aplicación de una frecuencia variable de cruce tiene como resultado una calidad de audio sustancialmente mejorada que también es menos dependiente de las características materiales de programa. La invención es aplicable a sistemas de HFR de un extremo y de dos extremos.
Breve descripción de los dibujos
La presente invención se describirá ahora a modo de ejemplos ilustrativos, no limitando el alcance o el espíritu de la invención, con referencia a los dibujos que se acompañan, en los que:
La figura 1 es una gráfica que ilustra los términos banda baja, banda alta y frecuencia de cruce.
La figura 2 es una gráfica que ilustra una medición de carga de trabajo de códec de núcleo.
La figura 3 es una gráfica que ilustra variaciones de demanda de bites de corta duración de un códec de tasa de transmisión de bites constante.
La figura 4 es una gráfica que ilustra la división de una señal en intervalos de frecuencia tonal y en forma de ruido.
La figura 5 es un diagrama de bloques de un codificador basado en HFR, perfeccionado por un módulo de control de frecuencia de cruce.
La figura 6 es un diagrama de bloques, que ilustra en detalle el módulo de control de frecuencia de cruce.
La figura 7 es un diagrama de bloques del correspondiente decodificador basado en HFR.
Descripción de las realizaciones preferidas
Las realizaciones descritas posteriormente son meramente ilustrativas para los principios de la presente invención. Se entiende que para los expertos en la técnica serán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos aquí. Se intenta, por lo tanto, estar limitado sólo por el alcance de las inminentes reivindicaciones de patente y no por los detalles específicos presentados aquí a modo de descripción y explicación de las realizaciones.
En un sistema en el que la banda baja o intervalo de baja frecuencia, 101 como se da en la figura 1, se codifica mediante un códec de núcleo y la banda alta o intervalo de alta frecuencia, 102, se cubre mediante un método de HFR adecuado, la frontera entre los dos intervalos se puede definir como la frecuencia de cruce, 103. Puesto que los esquemas de codificación funcionan fotograma a fotograma, en forma de bloques, uno es libre de cambiar la frecuencia de cruce para cada fotograma procesado. De acuerdo con la presente invención, es posible establecer un algoritmo de detección que adapta la frecuencia de cruce de tal manera que se consigue la calidad óptima para el sistema combinado de cifrado. La implantación del mismo se denomina aquí en lo sucesivo módulo de control de frecuencia de cruce.
Teniendo en cuenta que la calidad de audio del códec de núcleo también es la base para la calidad de la banda alta reconstruida, es obvio que se desea una calidad de audio buena y constante en el intervalo de banda baja. Bajando la frecuencia de cruce, el intervalo de frecuencia con el que tiene que operar el códec de núcleo es más pequeño, y de este modo más fácil de codificar. De este modo, midiendo el grado de dificultad de codificar un fotograma y ajustar la frecuencia de cruce de acuerdo con ello, se puede conseguir una calidad más constante de audio del codificador de núcleo.
Como ejemplo de cómo medir el grado de dificultad, se puede usar la entropía perceptual [ISO/IEC 13818-7, Anexo B.2.1]: aquí se aplica un modelo psicoacústico basado en un análisis espectral. Habitualmente, las líneas espectrales del banco de filtro de análisis están agrupadas en bandas, en las que el número de líneas en una banda depende de la frecuencia central de banda y se escoge de acuerdo con la bien conocida escala de Bark, persiguiendo una resolución de frecuencia perceptualmente constante para todas las bandas. Usando un modelo psicoacústico que explota efectos tales como el enmascaramiento espectral o temporal, se obtienen umbrales de audibilidad para cada banda. La entropía perceptual en una banda está dada entonces por
(Ec. 1)e(b)= \frac{1}{2}\sum\limits^{L(b)-1}_{i=0}log_{2}(r(i))+l
en la que
r(i)=s(i)\frac{L(b)}{t(b)}
e i = índice de línea espectral en banda actual,
s(i) = valor espectral de la línea i,
L(b) = número de líneas en banda actual,
t(b) = umbral psicoacústico para banda actual,
b = índice de banda,
l = número de líneas en banda actual de tal manera que r(i)>1,0;
y sólo se usan en la suma términos tales que r(i)>1,0.
Sumando las entropías perceptuales de todas las bandas que tienen que ser cifradas en el intervalo de frecuencia de banda baja, se obtiene una medición de la dificultad de codificación para el fotograma actual.
Un enfoque similar es calcular la energía de distorsión en el extremo del proceso de codificación de códec de núcleo sumando la energía de distorsión de todas las bandas de acuerdo con
(Ec. 2)n_{tot}=\sum\limits^{B-1}_{b=0}n(b)
en la que
1
y n_{q}(b) = energía de ruido de cuantización,
t(b) = umbral psicoacústico,
b = índice de banda,
B = número de bandas.
Además, la energía de distorsión se puede ponderar mediante una curva de sonoridad, con el fin de ponderar la verdadera distorsión con su relevancia psicoacústica. Como ejemplo, la suma de la ecuación 2 se puede modificar a
(Ec. 3)n'_{tot}=\sum\limits^{B-1}_{b=0}(n(b))^{0,23}
en la que se usa una simplificación de una función de sonoridad de acuerdo con Zwicker ["Psychoacoustics", Eberhard Zwicker y Hugo Fastl, Springer-Verlag, Berlín 1990].
Se puede definir entonces una dificultad de codificación o medición de carga de trabajo en función de la distorsión total. La figura 2 da un ejemplo de la energía de distorsión de un códec perceptual de audio, y una correspondiente medición de carga de trabajo, en el que se ha usado una recurrencia no lineal para calcular la carga de trabajo. Se puede observar que la carga de trabajo muestra desviaciones altas a lo largo del tiempo y es dependiente de las características del material de entrada.
La alta entropía perceptual o la alta energía de distorsión indica que una señal es psicoacústicamente difícil de cifrar con una tasa de transmisión de bites limitada, y es probable que aparezcan artefactos audibles en la banda baja. En este caso, el módulo de control de frecuencia de cruce señalizará el uso de una frecuencia más baja de cruce con el fin de hacer más fácil que el codificador perceptual de audio opere con la señal dada. Simultáneamente, una baja entropía perceptual o una baja energía de distorsión indica una señal fácil de cifrar. De este modo, la frecuencia de cruce se escogerá más alta con el fin de permitir un intervalo más amplio de frecuencia para la banda baja, reduciendo por ello artefactos que es probable que se introduzcan en la banda alta debido a las capacidades limitadas de cualquier método existente de HFR. Ambos enfoques permiten también el uso de un enfoque de análisis-por-síntesis volviendo a codificar el fotograma actual si se ha señalizado en la etapa de análisis un ajuste de la frecuencia de cruce. Sin embargo, puesto que se usan transformadas de solapamiento en la mayoría de códeces de audio del estado de la técnica, el rendimiento del sistema se puede mejorar aplicando un aplanamiento de los parámetros de entrada de análisis a lo largo del tiempo, con el fin de evitar una conmutación demasiado frecuente de la frecuencia de cruce, que causaría efectos de bloqueo. Si la verdadera implantación no necesita ser optimizada en términos de retardo de procesamiento, el algoritmo de detección se puede mejorar adicionalmente usando una visión más adelantada en el tiempo, ofreciendo la posibilidad de encontrar puntos en el tiempo en los que se pueden hacer desplazamientos con un mínimo de artefactos de conmutación. Las aplicaciones que no son en tiempo real representan un caso especial de esto, en el que se puede analizar, si se desea, toda la fila que ha de ser codificada.
En el caso de un códec de audio de tasa de transmisión de bites constante (CBR), se puede usar como parámetro adicional de entrada en la decisión de cruce un análisis de variación de demanda de bites de corta duración: codificadores de audio del estado de la técnica tales como el MPEG Layer-3 o el MPEG-2 AAC usan una técnica de depósito de bites con el fin de compensar desviaciones de demanda de bites de pico de corta duración a partir del número medio de bites disponibles por fotograma. La llenura de tal depósito de bites indica si el codificador de núcleo es capaz o no de operar bien con un fotograma entrante difícil de codificar. Un ejemplo práctico del número de bites usados por fotograma y de la llenura del depósito de bites a lo largo del tiempo se da en la figura 3. De este modo, si la llenura del depósito de bites es alta, el codificador de núcleo será capaz de manejar un fotograma difícil y no hay necesidad de escoger una frecuencia más baja de cruce. Simultáneamente, si la llenura del depósito de bites es baja, la calidad resultante de audio se puede mejorar sustancialmente en los fotogramas siguientes bajando la frecuencia de cruce, con el fin de reducir la demanda de bites del codificador de núcleo, de tal manera que el depósito de bites se puede llenar debido al intervalo más pequeño de frecuencia que se tiene que codificar. De nuevo, una visión muy adelantada puede mejorar el método de detección puesto que el comportamiento de la llenura del depósito de bites se puede predecir con mucha antelación.
Aparte de la dificultad de codificación del fotograma actual, otro parámetro importante en el que basar la elección de la frecuencia de cruce se describe como viene a continuación: un gran número de señales de audio tales como voz o algunos instrumentos de música muestran la propiedad de que el intervalo espectral se puede dividir en un intervalo graduado o tonal y un intervalo en forma de ruido. La figura 4 muestra el espectro de una señal de entrada de audio en la que esta propiedad es claramente evidente. Usando métodos de análisis de ruido y/o de tonalidad en el dominio espectral, se pueden detectar dos intervalos, que se pueden clasificar respectivamente como tonal y en forma de ruido. La tonalidad se puede calcular como se da, por ejemplo, en la norma AAC [ISO/IEC 13818-7: 1997 (E), págs. 96-98, sección B.2.1.4 "Steps in threshold calculation"]. Otros algoritmos bien conocidos de detección de ruido o de tonalidad, tales como la medición de planicie espectral, también son adecuados para este propósito. De este modo, la frecuencia de cruce entre estos intervalos se usa como frecuencia de cruce en el contexto de la presente invención con el fin de separar mejor los intervalos espectrales en forma de ruido y tonal y alimentarlos separadamente al codificador de núcleo y al método de HFR respectivamente. Por consiguiente, la calidad global de audio del sistema combinado de códec se puede mejorar sustancialmente en tales casos.
Claramente, los métodos anteriores son aplicables igualmente a sistemas de HFR de dos extremos y de un extremo. En este último caso, sólo se transmite una banda baja de anchura de banda variable, codificada por el códec de núcleo. El decodificador de HFR extrapola entonces una envolvente a partir de la frecuencia de corte de banda baja y hacia arriba. Además, la presente invención es aplicable a sistemas en los que la banda alta se genera mediante métodos arbitrarios diferentes al que se usa para el cifrado de la banda baja.
Adaptar la frecuencia de inicio de HFR a la anchura de banda variable de la señal de banda baja sería una tarea muy tediosa cuando se aplican métodos convencionales de transposición tales como la traducción de frecuencia. Esos métodos implican generalmente el filtrado de la señal de banda baja para extraer una señal de paso banda o de paso bajo que subsiguientemente se modula en el dominio de tiempo, causando un desplazamiento de frecuencia. De este modo, una adaptación incorporaría la conmutación de filtros de paso banda o de paso bajo y cambios en la frecuencia de modulación. Además, un cambio de filtro causa discontinuidades en la señal de salida, que incita al uso de técnicas de formación de ventanas. Sin embargo, en un sistema basado en bancos de filtro, el filtrado se consigue automáticamente mediante la extracción de señales de sub- banda a partir de un conjunto de bandas de filtro consecutivas. Se obtiene entonces un equivalente a la modulación de dominio de tiempo, por medio del reparcheamiento de las señales de sub-banda extraídas dentro del banco de filtro. El reparcheamiento se adapta fácilmente a la frecuencia de cruce variable y la formación de ventanas antedicha es inherente al dominio de sub-banda, de manera que el cambio de parámetros de traducción se consigue con poca complejidad adicional.
La figura 5 muestra un ejemplo del lado de codificador de un códec basado en HFR, perfeccionado de acuerdo con la presente invención. La señal analógica de entrada se alimenta a un convertidor A/D 501, que forma una señal digital. La señal digital de audio se alimenta a un codificador 502 de núcleo, en el que se realiza un cifrado de fuente. Además, la señal digital se alimenta a un codificador 503 de envolvente de HFR. La salida del codificador de envolvente de HFR representa los datos de envolvente que cubren la banda alta 102 que empieza en la frecuencia 103 de cruce como se ilustra en la figura 1. El número de bites que se necesita para los datos de envolvente en el codificador de envolvente se pasa al codificador de núcleo con el fin de ser restados de los bites disponibles totales para un fotograma dado. El codificador de núcleo codificará entonces el restante intervalo de frecuencia de banda baja hasta la frecuencia de cruce. Como se enseña mediante la presente invención, se añade un módulo 504 de control de frecuencia de cruce al codificador. Una representación de dominio de frecuencia y/o de tiempo de la señal de entrada, así como señales de estado del códec de núcleo, se alimentan al módulo de control de frecuencia de cruce. La salida del módulo 504, en forma de elección óptima de la frecuencia de cruce, se alimenta a los codificadores de envolvente y de núcleo con el fin de señalizar los intervalos de frecuencia que se codificarán. El intervalo de frecuencia para cada uno de los dos esquemas de cifrado también se codifica por ejemplo mediante un eficiente esquema de consulta de tablas. Si el intervalo de frecuencia entre dos fotogramas subsiguientes no cambia, esto se puede señalizar mediante un único bit con el fin de mantener el gasto de tasa de transmisión de bites lo más pequeño posible. Por consiguiente, los intervalos de frecuencia no tienen que ser transmitidos explícitamente en cada fotograma. Los datos codificados de ambos codificadores se alimentan entonces al multiplexor, formando una corriente de bites en serie que se transmite o se almacena.
La figura 6 da un ejemplo de subsistemas dentro del módulo 504 y 601, respectivamente, de control de frecuencia de cruce. Un módulo 602 de análisis de mediciones de carga de trabajo del codificador explora lo difícil que es para el codificador de núcleo codificar el fotograma actual, usando, por ejemplo, el enfoque de energía de distorsión o de entropía perceptual como se describió anteriormente. Siempre que el códec de núcleo emplee un depósito de bites, se puede incluir un módulo 603 de análisis de llenura de memoria intermedia. Un módulo 604 de análisis de tonalidad señaliza una frecuencia objetivo de cruce que corresponde a la frecuencia de transición tonal/ruido cuando sea de aplicación. Todos los parámetros de entrada al módulo conjunto 606 de decisión se combinan y equilibran de acuerdo con la verdadera implantación de los códeces de núcleo y de HFR usados cuando se calcula la frecuencia de cruce a usar, con el fin de obtener el máximo rendimiento global.
El correspondiente lado de decodificador se muestra en la figura 7. El demultiplexor 701 separa las señales de corriente de bites en datos de códec de núcleo, que se alimentan al decodificador 702 de núcleo, y datos de envolvente, que se alimentan al decodificador 703 de envolvente de HFR. El decodificador de núcleo produce una señal que cubre el intervalo de frecuencia de banda baja. Similarmente, el decodificador de envolvente de HFR decodifica los datos en una representación de la envolvente espectral para el intervalo de frecuencia de banda alta. Los datos de envolvente decodificados se alimentan entonces al módulo 704 de control de ganancia. La señal de banda baja procedente del decodificador de núcleo se encamina al módulo 705 de transposición, que, en base a la frecuencia de cruce, genera una señal replicada de banda alta a partir de la banda baja. La señal de banda alta se alimenta al módulo de control de ganancia con el fin de ajustar la envolvente espectral de banda alta a la de la envolvente transmitida. La salida es, de este modo, una señal ajustada de envolvente, de audio de banda alta. Esta señal se suma a la salida procedente de la unidad 706 de retardo, que se alimenta con la señal de audio de banda baja mientras que el retardo compensa el tiempo de procesamiento de la señal de banda alta. Finalmente, la señal digital obtenida de banda ancha se convierte en una señal analógica de audio en el convertidor D/A 707.

Claims (8)

1. Un aparato para codificar una señal de audio para obtener una señal de audio codificada para ser usada por un decodificador que tiene un módulo de reconstrucción de alta frecuencia para realizar una reconstrucción de alta frecuencia para un intervalo de frecuencia por encima de una frecuencia de cruce, comprendiendo el aparato:
un codificador (502) de núcleo para codificar una banda de frecuencia más baja de la señal de audio hasta la frecuencia de cruce, en el que la frecuencia de cruce es variable y en el que el codificador de núcleo es accionable fotograma a fotograma en forma de bloques; y
un módulo (504) de control de frecuencia de cruce para estimar, dependiendo de una medición del grado de dificultad para codificar la señal de audio mediante el codificador (502) de núcleo y/o dependiendo de una frontera entre un intervalo de frecuencia tonal y en forma de ruido de la señal de audio, una frecuencia de cruce que se ha de seleccionar mediante el codificador (502) de núcleo para un fotograma de una serie de fotogramas subsiguientes, de manera que la frecuencia de cruce es variable adaptativamente a lo largo del tiempo para la serie de fotogramas subsiguientes.
2. Un aparato de acuerdo con la reivindicación 1, en el que la medición se basa en una entropía perceptual de la señal de audio.
3. Un aparato de acuerdo con la reivindicación 1, en el que la medición se basa en una energía de distorsión después de codificar con el codificador de núcleo.
4. Un aparato de acuerdo con la reivindicación 1, en el que la medición se basa en un estado de un depósito de bites asociado con el codificador de núcleo.
5. Un aparato de acuerdo con las reivindicaciones 1-4, en el que cualquier combinación de entropía perceptual, distorsión de codificador de núcleo y estado de depósito de bites de codificador de núcleo se usa para obtener la frecuencia de cruce que se ha de seleccionar mediante el codificador (502) de núcleo para un fotograma.
6. Un método para codificar una señal de audio para obtener una señal de audio codificada para ser usada por un decodificador que tiene un módulo de reconstrucción de alta frecuencia para realizar una reconstrucción de alta frecuencia para un intervalo de frecuencia por encima de una frecuencia de cruce, comprendiendo el método los siguientes pasos:
codificar en núcleo una banda de frecuencia más baja de la señal de audio hasta una frecuencia de cruce, en el que la frecuencia de cruce es variable y en el que la codificación de núcleo tiene lugar fotograma a fotograma en forma de bloques; y
estimar, dependiendo de una medición del grado de dificultad para codificar la señal de audio en el paso de codificación de núcleo y/o dependiendo de una frontera entre un intervalo de frecuencia tonal y en forma de ruido de la señal de audio, una frecuencia de cruce que se ha de seleccionar en el paso de codificación de núcleo para un fotograma de una serie de fotogramas subsiguientes, de manera que la frecuencia de cruce se varía adaptativamente a lo largo del tiempo para la serie de fotogramas subsiguientes.
7. Un aparato para decodificar una señal de audio codificada, habiendo sido codificada la señal de audio codificada usando una frecuencia variable de cruce, incluyendo la señal de audio codificada una información sobre una frecuencia de cruce que es variable adaptativamente a lo largo del tiempo, comprendiendo el aparato para decodi-
ficar:
un demultiplexor (701) de corriente de bites para extraer datos de decodificador de núcleo, datos de envolvente y la información sobre la frecuencia variable de cruce;
un decodificador (702) de núcleo para recibir los datos de decodificador de núcleo desde el demultiplexor de corriente de bites y para emitir datos de banda baja que tienen una frecuencia de cruce que varía oportunamente;
un decodificador (703) de envolvente de regeneración de alta frecuencia para recibir los datos de envolvente del demultiplexor (701) de corriente de bites y para producir una salida de envolvente espectral;
un módulo (705) de transposición para recibir la información sobre la frecuencia variable de cruce y para generar una señal replicada de banda alta a partir de los datos de banda baja en base a la información sobre la frecuencia variable de cruce;
un módulo (704) de control de ganancia que responde al decodificador de envolvente de regeneración de alta frecuencia para ajustar la señal replicada de banda alta a una envolvente espectral emitida por el decodificador de envolvente de regeneración de alta frecuencia para obtener una señal ajustada de banda alta de envolvente; y
un sumador para sumar una versión retardada de los datos de banda baja y la señal ajustada de banda alta de envolvente para obtener una señal digital de banda ancha.
8. Un método para decodificar una señal de audio codificada, habiendo sido codificada la señal de audio codificada usando una frecuencia variable de cruce, incluyendo la señal de audio codificada una información sobre una frecuencia de cruce que es variable adaptativamente a lo largo del tiempo, comprendiendo el método para decodificar los siguientes pasos:
extraer (701) datos de decodificador de núcleo, datos de envolvente y la información sobre la frecuencia variable de cruce a partir de la señal de audio codificada;
recibir los datos de decodificador de núcleo desde un demultiplexor de corriente de bites y emitir datos de banda baja que tienen una frecuencia de cruce que varía oportunamente por medio de un decodificador (702) de núcleo;
recibir los datos de envolvente y producir una salida de envolvente espectral por medio de un decodificador (703) de envolvente de regeneración de alta frecuencia;
recibir la información sobre la frecuencia variable de cruce y generar una señal replicada de banda alta a partir de los datos de banda baja en base a la información sobre la frecuencia variable de cruce por medio de un módulo (705) de transposición;
ajustar la señal replicada de banda alta a una envolvente espectral emitida por el decodificador (703) de envolvente de regeneración de alta frecuencia para obtener una señal ajustada de banda alta de envolvente, por medio de un módulo (704) de control de ganancia; y
sumar una versión retardada de los datos de banda baja y la señal ajustada de banda alta de envolvente para obtener una señal digital de banda ancha.
ES01983888T 2000-11-15 2001-11-14 Mejora del rendimiento de sistemas de cifrado que usan metodos de reconstruccion de alta frecuencia. Expired - Lifetime ES2218462T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0004187A SE0004187D0 (sv) 2000-11-15 2000-11-15 Enhancing the performance of coding systems that use high frequency reconstruction methods
SE0004187 2000-11-15

Publications (1)

Publication Number Publication Date
ES2218462T3 true ES2218462T3 (es) 2004-11-16

Family

ID=20281835

Family Applications (1)

Application Number Title Priority Date Filing Date
ES01983888T Expired - Lifetime ES2218462T3 (es) 2000-11-15 2001-11-14 Mejora del rendimiento de sistemas de cifrado que usan metodos de reconstruccion de alta frecuencia.

Country Status (15)

Country Link
US (1) US7050972B2 (es)
EP (1) EP1334484B1 (es)
JP (6) JP3983668B2 (es)
KR (1) KR100551862B1 (es)
CN (1) CN1232950C (es)
AT (1) ATE267445T1 (es)
AU (1) AU2002215282A1 (es)
DE (1) DE60103424T2 (es)
DK (1) DK1334484T3 (es)
ES (1) ES2218462T3 (es)
HK (1) HK1058096A1 (es)
PT (1) PT1334484E (es)
SE (1) SE0004187D0 (es)
TR (1) TR200401631T4 (es)
WO (1) WO2002041302A1 (es)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
KR100605824B1 (ko) 2002-05-13 2006-07-31 삼성전자주식회사 부호분할다중접속 이동통신시스템의 방송서비스 방법
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7318027B2 (en) 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10328777A1 (de) * 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US20050018796A1 (en) * 2003-07-07 2005-01-27 Sande Ravindra Kumar Method of combining an analysis filter bank following a synthesis filter bank and structure therefor
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
DE102004009949B4 (de) 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
BRPI0607646B1 (pt) 2005-04-01 2021-05-25 Qualcomm Incorporated Método e equipamento para encodificação por divisão de banda de sinais de fala
PL1875463T3 (pl) 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
DE602006011600D1 (de) * 2005-04-28 2010-02-25 Panasonic Corp Audiocodierungseinrichtung und audiocodierungsverfahren
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
US8214202B2 (en) * 2006-09-13 2012-07-03 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for a speech/audio sender and receiver
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN101939782B (zh) 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
EP2077551B1 (en) 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
CN101281748B (zh) * 2008-05-14 2011-06-15 武汉大学 用编码索引实现的空缺子带填充方法及编码索引生成方法
BRPI0910511B1 (pt) * 2008-07-11 2021-06-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para decodificar e codificar um sinal de áudio
EP2304719B1 (en) 2008-07-11 2017-07-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, methods for providing an audio stream and computer program
JP5551694B2 (ja) 2008-07-11 2014-07-16 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 多くのスペクトルエンベロープを計算するための装置および方法
MY153562A (en) 2008-07-11 2015-02-27 Fraunhofer Ges Forschung Method and discriminator for classifying different segments of a signal
US8326640B2 (en) * 2008-08-26 2012-12-04 Broadcom Corporation Method and system for multi-band amplitude estimation and gain control in an audio CODEC
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
EP2359366B1 (en) 2008-12-15 2016-11-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and bandwidth extension decoder
JP5446258B2 (ja) * 2008-12-26 2014-03-19 富士通株式会社 オーディオ符号化装置
EP2380172B1 (en) 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
JP4977157B2 (ja) * 2009-03-06 2012-07-18 株式会社エヌ・ティ・ティ・ドコモ 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム
BRPI1009467B1 (pt) 2009-03-17 2020-08-18 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
TWI556227B (zh) 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
WO2011048010A1 (en) 2009-10-19 2011-04-28 Dolby International Ab Metadata time marking information for indicating a section of an audio object
EP2559032B1 (en) * 2010-04-16 2019-01-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
ES2942867T3 (es) 2010-07-19 2023-06-07 Dolby Int Ab Procesamiento de señales de audio durante la reconstrucción de alta frecuencia
EP2466580A1 (en) * 2010-12-14 2012-06-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
CN108831501B (zh) 2012-03-21 2023-01-10 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
JPWO2014068817A1 (ja) * 2012-10-31 2016-09-08 株式会社ソシオネクスト オーディオ信号符号化装置及びオーディオ信号復号装置
AU2014211520B2 (en) 2013-01-29 2017-04-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-frequency emphasis for LPC-based coding in frequency domain
JP6019266B2 (ja) * 2013-04-05 2016-11-02 ドルビー・インターナショナル・アーベー ステレオ・オーディオ・エンコーダおよびデコーダ
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
CN117253498A (zh) * 2013-04-05 2023-12-19 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
SG11201510513WA (en) * 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals
EP3291233B1 (en) 2013-09-12 2019-10-16 Dolby International AB Time-alignment of qmf based processing data
CN104681029B (zh) * 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
US20150194157A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals
CA3016837C (en) * 2016-03-07 2021-09-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Hybrid concealment method: combination of frequency and time domain packet loss concealment in audio codecs
US11997339B2 (en) 2020-01-15 2024-05-28 Dolby International Ab Adaptive streaming of media content with bitrate switching
CN116348951A (zh) * 2020-07-30 2023-06-27 弗劳恩霍夫应用研究促进协会 用于编码音频信号或用于解码经编码音频场景的设备、方法及计算机程序

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4158751A (en) * 1978-02-06 1979-06-19 Bode Harald E W Analog speech encoder and decoder
JPS595297A (ja) * 1982-07-01 1984-01-12 日本電気株式会社 帯域分割型ボコ−ダ
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
JP3297750B2 (ja) * 1992-03-18 2002-07-02 ソニー株式会社 符号化方法
JP3218679B2 (ja) * 1992-04-15 2001-10-15 ソニー株式会社 高能率符号化方法
US5404377A (en) * 1994-04-08 1995-04-04 Moses; Donald W. Simultaneous transmission of data and audio signals by means of perceptual coding
JP3277692B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 情報符号化方法、情報復号化方法及び情報記録媒体
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
US5646961A (en) * 1994-12-30 1997-07-08 Lucent Technologies Inc. Method for noise weighting filtering
JPH09172376A (ja) * 1995-12-20 1997-06-30 Hitachi Ltd 量子化ビット割当て装置
JP3255022B2 (ja) * 1996-07-01 2002-02-12 日本電気株式会社 適応変換符号化方式および適応変換復号方式
US6490562B1 (en) * 1997-04-09 2002-12-03 Matsushita Electric Industrial Co., Ltd. Method and system for analyzing voices
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5928342A (en) * 1997-07-02 1999-07-27 Creative Technology Ltd. Audio effects processor integrated on a single chip with a multiport memory onto which multiple asynchronous digital sound samples can be concurrently loaded
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US6385548B2 (en) * 1997-12-12 2002-05-07 Motorola, Inc. Apparatus and method for detecting and characterizing signals in a communication system
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
AU2001296459A1 (en) * 2000-10-02 2002-04-15 Clarity, L.L.C. Audio visual speech processing

Also Published As

Publication number Publication date
HK1058096A1 (en) 2004-04-30
KR20030076576A (ko) 2003-09-26
JP6592148B2 (ja) 2019-10-16
CN1232950C (zh) 2005-12-21
JP2004514180A (ja) 2004-05-13
CN1475010A (zh) 2004-02-11
TR200401631T4 (tr) 2004-09-21
DE60103424D1 (de) 2004-06-24
WO2002041302A1 (en) 2002-05-23
JP2018185530A (ja) 2018-11-22
US20020103637A1 (en) 2002-08-01
EP1334484A1 (en) 2003-08-13
JP2012093774A (ja) 2012-05-17
DE60103424T2 (de) 2005-06-16
DK1334484T3 (da) 2004-08-09
US7050972B2 (en) 2006-05-23
EP1334484B1 (en) 2004-05-19
JP2016189015A (ja) 2016-11-04
JP2014089472A (ja) 2014-05-15
KR100551862B1 (ko) 2006-02-13
AU2002215282A1 (en) 2002-05-27
JP4991397B2 (ja) 2012-08-01
JP6207404B2 (ja) 2017-10-04
JP6368740B2 (ja) 2018-08-01
SE0004187D0 (sv) 2000-11-15
PT1334484E (pt) 2004-09-30
JP2007293354A (ja) 2007-11-08
JP3983668B2 (ja) 2007-09-26
ATE267445T1 (de) 2004-06-15
JP5933965B2 (ja) 2016-06-15

Similar Documents

Publication Publication Date Title
ES2218462T3 (es) Mejora del rendimiento de sistemas de cifrado que usan metodos de reconstruccion de alta frecuencia.
KR100917464B1 (ko) 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
JP5458189B2 (ja) ノイズ補充と帯域拡張との間の遷移周波数の適合
JP5593419B2 (ja) 可逆マルチチャネル・オーディオ・コーデック
ES2307100T3 (es) Metodos y aparatos de codificacion de audio mediante replicacion de banda espectral y reconstruccion de alta frecuencia que usan adicion adaptativa de un umbral minimo de ruido y limitacion de la sustitucion de ruido.
US20030215013A1 (en) Audio encoder with adaptive short window grouping
EP1419501A1 (en) An encoder programmed to add a data payload to a compressed digital audio frame
JP2002517019A (ja) 信号の量子化変換係数をエントロピーエンコードするシステムと方法
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
US20100121632A1 (en) Stereo audio encoding device, stereo audio decoding device, and their method
US7444289B2 (en) Audio decoding method and apparatus for reconstructing high frequency components with less computation
KR100923301B1 (ko) 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
KR100923300B1 (ko) 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
CN105261373A (zh) 用于带宽扩展编码的自适应栅格构造方法和装置
JPH09146593A (ja) 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置及び音響信号復号化装置
ES2439693T3 (es) Codificación de señales de múltiples canales
JP3352401B2 (ja) オーディオ信号の符号化及び複号化方法及び装置
Jbira et al. Multi-layer scalable LPC audio format