ES2668822T3 - Aparato de codificación y procedimiento de codificación - Google Patents

Aparato de codificación y procedimiento de codificación Download PDF

Info

Publication number
ES2668822T3
ES2668822T3 ES12843823.1T ES12843823T ES2668822T3 ES 2668822 T3 ES2668822 T3 ES 2668822T3 ES 12843823 T ES12843823 T ES 12843823T ES 2668822 T3 ES2668822 T3 ES 2668822T3
Authority
ES
Spain
Prior art keywords
transform coefficients
threshold
band
extension band
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12843823.1T
Other languages
English (en)
Inventor
Takuya Kawashima
Masahiro Oshikiri
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2668822T3 publication Critical patent/ES2668822T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Un aparato de codificación que comprende: una sección de codificación de núcleo configurada para codificar coeficientes de transformada en una banda baja inferior a una frecuencia de referencia de entre coeficientes de transformada de una señal de entrada obtenidos mediante la transformación de una señal de entrada de un dominio temporal a un dominio de frecuencia; y una sección de codificación de banda de extensión configurada para codificar coeficientes de transformada en una banda de extensión utilizando coeficientes de transformada de banda baja codificados y descodificados de núcleo, siendo la banda de extensión una banda superior a la frecuencia de referencia y siendo la señal de entrada una de entre una señal de audio, una señal de audio de habla y una señal de música, en el que la sección de codificación de banda de extensión comprende: una sección de cálculo de umbral configurada para calcular, para cada una de las subbandas de la banda de extensión obtenidas dividiendo la banda de extensión, un umbral basado en estadísticas sobre los coeficientes de transformada incluidos en la subbanda; una sección de extracción de coeficientes de transformada representativos configurada para comparar, para cada una de las subbandas de la banda de extensión, una amplitud de los coeficientes de transformada con el umbral para extraer un coeficiente de transformada con una amplitud mayor que el umbral, como coeficiente de transformada representativo; y una sección de concordancia configurada para calcular, para cada una de las subbandas de la banda de extensión, un valor de correlación entre los coeficientes de transformada representativos y los coeficientes de transformada de banda baja codificados y descodificados de núcleo normalizados y para seleccionar una subbanda de la banda baja con un valor de correlación máximo, en la que: la sección de cálculo de umbral está configurada para actualizar, cuando un número de los coeficientes de transformada representativos extraídos por la sección de extracción de coeficientes de transformada representativos es inferior a un número predeterminado, el umbral de acuerdo con un número de coeficientes de transformada representativos que faltan con respecto al número predeterminado; y la sección de extracción de coeficientes de transformada representativos está configurada para llevar a cabo el proceso para extraer de nuevo un coeficiente de transformada utilizando el umbral actualizado.

Description

DESCRIPCIÓN
Aparato de codificación y procedimiento de codificación 5 Campo técnico
[0001] La presente invención se refiere a un aparato de codificación y un procedimiento de codificación. Antecedentes de la técnica
10
[0002] Los procedimientos descritos en NPL 1 y NPL 2, que han sido estandarizados por la ITU-T, son conocidos por ser esquemas de codificación que permiten la codificación eficiente de datos relacionados con el sonido, tales como datos de habla en la banda superancha (SWB, habitualmente una banda de 0,05 a 14 kHz). En estos procedimientos, se codifican sonidos en una banda de 7 kHz o menos (denominada en lo sucesivo “banda
15 baja”) mediante una sección de codificación y sonidos en una banda de 7 kHz o más (denominada en lo sucesivo “banda de extensión”) mediante una sección de codificación de extensión.
[0003] La sección de codificación de núcleo utiliza una CELP (predicción lineal excitada por código) en el proceso de codificación. La sección de codificación de extensión descodifica una señal de banda baja codificada por
20 la sección de codificación de núcleo, la transforma al dominio de frecuencia mediante la MDCT (transformada de coseno discreta modificada), y utiliza los espectros obtenidos (o coeficientes de transformada; denominados en los sucesivo “coeficientes de transformada”) en la codificación en la banda de extensión.
[0004] La sección de codificación de extensión utiliza la “envolvente” de la potencia espectral para normalizar 25 los coeficientes de transformada de banda baja codificados de núcleo generados por la sección de codificación de
núcleo. En particular, la sección de codificación de extensión calcula la energía de cada subbanda, suaviza la energía de la subbanda para crear una variación suave de la energía en la dirección del dominio de frecuencia, y normaliza los coeficientes de transformada en cada subbanda con la energía suavizada. Los coeficientes de transformada normalizados obtenidos de esta manera se denominarán en lo sucesivo “coeficientes de transformada 30 de banda baja normalizados”.
[0005] La sección de codificación de extensión busca una subbanda con un alto valor de correlación entre los coeficientes de transformada de banda baja normalizados y los coeficientes de transformada de una señal de entrada en la banda de extensión (denominados en lo sucesivo “coeficientes de transformada de banda de
35 extensión”) y codifica información que indica que la subbanda es una información de retardo. La sección de codificación de extensión copia los coeficientes de transformada de banda baja normalizados de la subbanda con un alto valor de correlación en la banda de extensión y utiliza los coeficientes de transformada de banda baja normalizados copiados como estructura fina espectral de la banda de extensión. A continuación, la sección de codificación de extensión calcula una ganancia para ajustar la energía de los coeficientes de transformada de la 40 banda de extensión y codifica la ganancia. Los aparatos de codificación de acuerdo con la técnica relacionada llevan a cabo el proceso descrito anteriormente para generar coeficientes de transformada de la banda de extensión utilizando coeficientes de transformada de la banda baja.
[0006] El valor de correlación entre los coeficientes de transformada de banda baja normalizados y los 45 coeficientes de transformada de banda de extensión se calcula de la siguiente manera en NPL1 y NPL2.
[0007] En primer lugar, la banda de extensión se divide en una pluralidad de subbandas (denominadas en lo sucesivo “subbandas de la banda de extensión”). A continuación, para cada subbanda de la banda de extensión, se calcula un valor de correlación entre los coeficientes de transformada de banda baja normalizados y los coeficientes
50 de transformada de la subbanda de la banda de extensión. Después, se busca una posición de los coeficientes de transformada de banda baja normalizados en la que el valor de correlación con la subbanda de la banda de extensión llega a ser el más alto. No obstante, calculando el valor de correlación de esta manera, surge el problema de que el procedimiento conlleva una gran cantidad de cálculos debido a que para el cálculo se utilizan los coeficientes de transformada de banda baja normalizados y todos los coeficientes de transformada de la subbanda 55 de la banda de extensión.
[0008] Como solución a este problema, en PTL 1 se describe una técnica en la que el valor de correlación se calcula utilizando únicamente coeficientes de transformada grandes en términos de amplitud entre los coeficientes de transformada de banda de extensión. Por consiguiente, la cantidad de cálculos para calcular el valor de
correlación se puede reducir limitando el número de coeficientes de transformada utilizados en el cálculo del valor de correlación.
Listado de citas
5
Bibliografía de patente
[0009] PTL 1
Publicación internacional n.° WO 2011/000408
10
Bibliografía distinta de la de patente
[0010]
15 NPL1
Norma ITU-T G.718, Anexo B, 2008 NPL2
Norma ITU-T G.729.1, Anexo E, 2008 20 Resumen de la invención Problema técnico
[0011] No obstante, la técnica descrita en PTL 1 requiere una gran cantidad de cálculos para extraer 25 coeficientes de transformada, lo cual disminuye el efecto de reducción en la cantidad de cálculos al limitar el número
de coeficientes de transformada. Por ejemplo, si una subbanda de la banda de extensión incluye M coeficientes de transformada, y los mayores N coeficientes de transformada en términos de amplitud se van a extraer entre los M coeficientes de transformada, se debe llevar a cabo un proceso de ramificación al menos M x N veces, lo que da lugar a una gran cantidad de cálculos.
30
[0012] Como otra manera de extraer coeficientes de transformada con una gran amplitud, PTL 1 ilustra una técnica en la que se calcula el valor medio y la desviación estándar de coeficientes de transformada de banda de extensión, se establece un umbral en función de estos parámetros y, después, se extraen los coeficientes de transformada que superan el umbral.
35
[0013] No obstante, debido a que el habla y la música presentan características complejas en una banda alta, se debe establecer un ancho de subbanda estrecho para generar sonido de alta calidad. Por consiguiente, el número de coeficientes de transformada incluidos en una subbanda de la banda de extensión es, inevitablemente, reducido, lo cual dificulta el establecimiento de un umbral estadísticamente fiable. Por este motivo, resulta difícil
40 obtener un umbral que permita la extracción de un número deseado de coeficientes de transformada. Por ejemplo, si el umbral es demasiado alto, el número de coeficientes de transformada extraídos será pequeño, de manera que la precisión del valor de correlación calculado disminuye, lo que hace que ya no sea posible determinar una posición apropiada. Y, al contrario, si el umbral es demasiado bajo, el número de coeficientes de transformada extraídos será grande, de manera que la cantidad de cálculos para calcular un valor de correlación no se puede reducir 45 drásticamente. Además, el número de coeficientes de transformada extraídos alcanza el número predeterminado N en el medio del bucle de extracción, de manera que los coeficientes de transformada con una gran amplitud en el resto del bucle pueden no ser extraídos.
[0014] Un objeto de la presente invención consiste en proporcionar un aparato de codificación y un 50 procedimiento de codificación para extraer un número apropiado de coeficientes de transformada que puede reducir
drásticamente la cantidad de cálculos para extraer los coeficientes de transformada.
Solución al problema
55 [0015] Un aparato de codificación de acuerdo con un aspecto de la presente invención incluye: una sección
de codificación de núcleo que codifica coeficientes de transformada en una banda baja inferior a una frecuencia de referencia de entre coeficientes de transformada de una señal de entrada obtenidos mediante la transformación de una señal de entrada de un dominio temporal a un dominio de frecuencia; y una sección de codificación de banda de extensión que codifica coeficientes de transformada en una banda de extensión utilizando coeficientes de
transformada de banda baja codificados y descodificados de núcleo, siendo la banda de extensión una banda superior a la frecuencia de referencia y siendo la señal de entrada una de entre una señal de audio, una señal de audio de habla y una señal de música, en el que la sección de codificación de la banda de extensión incluye: una sección de cálculo de umbral que calcula, para cada una de las subbandas de la banda de extensión obtenidas 5 dividiendo la banda de extensión, un umbral basado en estadísticas sobre los coeficientes de transformada incluidos en la subbanda; una sección de extracción de coeficientes de transformada representativos que compara, para cada una de las subbandas de la banda de extensión, una amplitud de los coeficientes de transformada con el umbral para extraer un coeficiente de transformada con una amplitud mayor que el umbral, como coeficiente de transformada representativo; y una sección de concordancia que calcula, para cada una de las subbandas de la 10 banda de extensión, un valor de correlación entre los coeficientes de transformada representativos y los coeficientes de transformada de banda baja codificados y descodificados de núcleo normalizados y selecciona una subbanda de la banda baja con el mayor valor de correlación, en la que: cuando un número de los coeficientes de transformada representativos extraídos por la sección de extracción de coeficientes de transformada representativos es inferior a un número predeterminado, la sección de cálculo de umbral actualiza el umbral de acuerdo con un número de los 15 coeficientes de transformada representativos que faltan con respecto al número predeterminado; y la sección de extracción de coeficientes de transformada representativos lleva a cabo el proceso para extraer de nuevo un coeficiente de transformada utilizando el umbral actualizado.
[0016] Un procedimiento de codificación de acuerdo con un aspecto de la presente invención incluye: una 20 etapa de codificación de núcleo en la que se codifican coeficientes de transformada en una banda baja inferior a una
frecuencia de referencia entre coeficientes de transformada de una señal de audio obtenidos mediante la transformación de una señal de entrada de un dominio temporal a un dominio de frecuencia; y una etapa de codificación de banda de extensión en la que se codifican coeficientes de transformada en una banda de extensión utilizando coeficientes de transformada de banda baja codificados y descodificados de núcleo, siendo la banda de 25 extensión una banda superior a la frecuencia de referencia y siendo la señal de entrada una de entre una señal de audio, una señal de audio de habla y una señal de música, en el que la etapa de codificación de la banda de extensión incluye: el cálculo, para cada una de las subbandas de la banda de extensión obtenidas dividiendo la banda de extensión, de un umbral basado en estadísticas sobre los coeficientes de transformada incluidos en la subbanda; la comparación, para cada una de las subbandas de la banda de extensión, de una amplitud de los 30 coeficientes de transformada con el umbral para extraer un coeficiente de transformada con una amplitud mayor que el umbral como coeficiente de transformada representativo; cuando un número de los coeficientes de transformada representativos extraídos es inferior a un número predeterminado, la actualización del umbral de acuerdo con un número de los coeficientes de transformada representativos que faltan con respecto al número predeterminado; la ejecución del proceso para extraer de nuevo un coeficiente de transformada utilizando el umbral actualizado; y el 35 cálculo, para cada una de las subbandas de la banda de extensión, de un valor de correlación entre los coeficientes de transformada representativos y los coeficientes de transformada de banda baja codificados y descodificados de núcleo normalizados, y la selección de una subbanda de la banda baja con un valor máximo de correlación cuando el número de los coeficientes de transformada representativos alcanza el número predeterminado.
40 Efectos ventajosos de la invención
[0017] De acuerdo con la presente invención, el número de bucles necesarios para extraer un número predeterminado N de coeficientes de transformada se puede reducir y, por tanto, también se puede reducir la cantidad de cálculos para extraer los coeficientes de transformada de manera drástica.
45
Breve descripción de los dibujos
[0018]
50 La fig. 1 es un diagrama de bloques que ilustra una configuración de un aparato de codificación de acuerdo con una realización de la presente invención;
la fig. 2 es un diagrama de bloques que ilustra una configuración de una sección de codificación de banda de extensión de acuerdo con la realización de la presente invención;
la fig. 3 ilustra la operación del proceso de extracción de coeficientes de transformada según la técnica de acuerdo 55 con la técnica relacionada;
la fig. 4 ilustra la operación del proceso de extracción de coeficientes de transformada de acuerdo con la realización de la presente invención;
la fig. 5 es un diagrama de bloques que ilustra una configuración de un aparato descodificador; y
la fig. 6 es un diagrama de bloques que ilustra una configuración de una sección de descodificación de banda de
extensión.
Descripción de realizaciones
5 [0019] A continuación, se describirán detalladamente realizaciones de la presente invención haciendo
referencia a los dibujos adjuntos.
[0020] Cuando se extraen N coeficientes de transformada con una gran amplitud de entre los coeficientes de transformada de la banda de extensión, un aparato de codificación de acuerdo con la presente realización calcula
10 estadísticamente un umbral tan alto que el número de coeficientes de transformada extraídos no alcanza N coeficientes de transformada al principio y, después, utiliza el umbral calculado para extraer coeficientes de transformada con una gran amplitud. A continuación, el aparato de codificación rebaja el umbral en función de cuántos coeficientes de transformada más se han de extraer para obtener N coeficientes de transformada y, después, utiliza el umbral recién calculado para extraer coeficientes de transformada con una gran amplitud. El 15 aparato de codificación repite el cálculo del umbral y la extracción de coeficientes de transformada hasta que se extraen N coeficientes de transformada. Así, se puede reducir el número de bucles necesarios para extraer N coeficientes de transformada, lo que da lugar a una reducción considerable en la cantidad de cálculos para extraer coeficientes de transformada. Además, la determinación del grado en que se rebaja el umbral en función de cuántos coeficientes de transformada más se han de extraer para obtener N coeficientes de transformada permite reducir la 20 variación en el número de coeficientes de transformada extraídos, que puede ser muy amplia en el caso en el que los coeficientes de transformada se extraen basándose únicamente en procesos estadísticos, y, por tanto, permite llevar a cabo la codificación sin pérdidas en la calidad de codificación.
[0021] Más adelante, se ofrecerá una descripción de componentes del aparato de codificación de acuerdo 25 con la presente realización. La fig. 1 es un diagrama de bloques que ilustra una configuración del aparato de
codificación de acuerdo con la presente realización.
[0022] Tal como se muestra en la fig. 1, el aparato de codificación 10 incluye principalmente una sección de transformada tiempo-frecuencia 1, una sección de codificación de núcleo 2, una sección de codificación de banda de
30 extensión 3 y una sección de multiplexado 4.
[0023] La sección de transformada tiempo-frecuencia 1 transforma una señal de entrada del dominio temporal al dominio de frecuencia y produce como salida los coeficientes de transformada de la señal de entrada obtenidos para remitirlos a la sección de codificación de núcleo 2 y la sección de codificación de banda de extensión
35 3. Cabe señalar que, aunque la presente realización se describe para el caso en el que se utiliza la transformación MDCT, la presente invención no se limita a la transformación MDCT, sino que se puede utilizar una transformación ortogonal como FFT (transformada rápida de Fourier) y DCT (transformada de coseno discreta) que lleva a cabo la transformada del dominio temporal al dominio de frecuencia.
40 [0024] La sección de codificación de núcleo 2 codifica, entre los coeficientes de transformada de la señal de
entrada, coeficientes de transformada en una banda baja (una banda inferior a una frecuencia de referencia (por ejemplo, 7 kHz)) mediante codificación por transformada y produce como salida los datos codificados para remitirlos a la sección de multiplexado 4 como datos codificados de núcleo. La sección de codificación de núcleo 2 también produce como salida coeficientes de transformada de banda baja codificados de núcleo obtenidos mediante la 45 descodificación de los datos codificados de núcleo para la sección de codificación de banda de extensión 3.
[0025] La sección de codificación de banda de extensión 3 utiliza los coeficientes de transformada de banda
baja codificados de núcleo para llevar a cabo el proceso de codificación con los coeficientes de transformada en una banda de extensión (una banda superior a la frecuencia de referencia) (denominados en lo sucesivo “coeficientes de 50 transformada de banda de extensión”) entre los coeficientes de transformada de la señal de entrada y produce como salida los datos codificados en la banda de extensión obtenidos para remitirlos a la sección de multiplexado 4. La configuración interna de la sección de codificación de banda de extensión 3 se describirá detalladamente más adelante.
55 [0026] La sección de multiplexado 4 genera datos codificados obtenidos mediante el multiplexado de los
datos codificados de núcleo y los datos codificados de banda de extensión.
[0027] Con la configuración descrita anteriormente, el aparato de codificación 10 codifica una señal de
entrada y produce como salida datos codificados.
[0028] A continuación, se describirá la configuración interna de la sección de codificación de banda de extensión 3. Tal como se muestra en la fig. 2, una sección de codificación de banda de extensión 3 incluye principalmente la sección de normalización 30, una sección de análisis de banda de extensión 31, una sección de
5 cálculo de umbral 32, una sección de extracción de coeficientes de transformada representativos 33, una sección de concordancia 34 y una sección de generación/codificación de banda de extensión 35.
[0029] La sección de normalización 30 normaliza los coeficientes de transformada de banda baja codificados de núcleo y produce como salida los coeficientes de transformada de banda baja normalizados para remitirlos a la
10 sección de concordancia 34 y la sección de generación/codificación de la banda de extensión 35. En general, la sección de normalización 30 calcula la envolvente de los coeficientes de transformada de banda baja codificados de núcleo y obtiene los coeficientes de transformada de banda baja normalizados dividiendo los coeficientes de transformada de banda baja codificados de núcleo por la envolvente. Cabe señalar que los coeficientes de transformada de banda baja normalizados también se pueden obtener, por ejemplo, dividiendo los coeficientes de
15 transformada de banda baja codificados de núcleo en subbandas, calculando la energía de las subbandas y dividiendo cada uno de los coeficientes de transformada de cada subbanda por la energía de la subbanda.
[0030] En general, la distribución de energía es muy irregular en la parte de banda baja de los coeficientes de transformada, mientras que la distribución de energía es relativamente uniforme en la parte de banda alta de los
20 coeficientes de transformada. De este modo, la codificación se puede llevar a cabo con mayor eficiencia calculando valores de correlación con los coeficientes de transformada de la banda de extensión tras el proceso de normalización para suavizar la irregularidad en la distribución de energía de los coeficientes de transformada de banda baja codificados de núcleo.
25 [0031] La sección de análisis de banda de extensión 31 analiza los coeficientes de transformada de banda de
extensión y produce como salida las estadísticas resultantes para remitirlas a la sección de cálculo de umbral 32 como parámetros estadísticos de la banda de extensión. Suponiendo que los coeficientes de transformada de banda de extensión siguen la distribución normal, la sección de análisis de banda de extensión 31 calcula el valor medio (denominado en lo sucesivo “media de valores absolutos”) y el valor de desviación estándar de amplitudes en valor
30 absoluto, que son los valores absolutos de las amplitudes, como parámetros estadísticos. La operación de la sección de análisis de banda de extensión 31 se describirá detalladamente más adelante.
[0032] La sección de cálculo de umbral 32 calcula un umbral de extracción de coeficientes de transformada basado en los parámetros estadísticos de la banda de extensión y produce como salida el umbral de extracción de
35 coeficientes de transformada calculado para remitirlo a la sección de extracción de coeficientes de transformada representativos 33. Además, la sección de cálculo de umbral 32 actualiza el umbral de extracción de coeficientes de transformada de acuerdo con el número de coeficientes de transformada que faltan y produce como salida el umbral de extracción de coeficientes de transformada actualizado para remitirlo a la sección de extracción de coeficientes de transformada representativos 33. La operación de la sección de cálculo de umbral 32 se describirá
40 detalladamente más adelante.
[0033] Para cada subbanda de la banda de extensión, la sección de extracción de coeficientes de transformada representativos 33 extrae coeficientes de transformada de la banda de extensión con una amplitud mayor que el umbral de extracción de coeficientes de transformada y produce como salida los coeficientes de
45 transformada de banda de extensión extraídos para remitirlos a la sección concordancia 34 como coeficientes de transformada representativos. La sección de extracción de coeficientes de transformada representativos 33 también produce como salida el número de coeficientes de transformada que faltan para remitirlo a la sección de cálculo de umbral 32 cuando el número de coeficientes de transformada representativos es menor que el número predeterminado N. Más adelante se describirá detalladamente la operación de la sección de extracción de
50 coeficientes de transformada representativos 33.
[0034] La sección de concordancia 34 calcula un valor de correlación entre los coeficientes de transformada representativos y los coeficientes de transformada de banda baja normalizados para cada subbanda de la banda de extensión, selecciona una subbanda con el mayor valor de correlación y produce como salida información que indica
55 la subbanda seleccionada para remitirla a la sección de generación/codificación de la banda de extensión 35 como información de retardo.
[0035] La sección de generación/codificación de la banda de extensión 35 utiliza los coeficientes de transformada de la banda de extensión, la información de retardo y los coeficientes de transformada de banda baja
normalizados para generar datos codificados de banda de extensión y produce como salida los datos codificados de banda de extensión generados. En particular, la sección de generación/codificación de banda de extensión 35 copia los coeficientes de transformada de banda baja normalizados de la subbanda indicada por la información de retardo en la banda de extensión y utiliza los coeficientes de transformada de banda baja normalizados copiados como 5 estructura fina de frecuencia de la banda de extensión. La sección de generación/codificación de banda de extensión 35 codifica la información de retardo utilizada para esta operación de copiado e incluye en los datos codificados de banda de extensión la información de retardo codificada. Además, la sección de generación/codificación de banda de extensión 35 calcula una ganancia, que consiste en una relación de amplitud (la raíz cuadrada de una relación de energía) entre los coeficientes de transformada de banda de extensión obtenidos copiando los coeficientes de 10 transformada de banda baja normalizados y los coeficientes de transformada de la banda de extensión que son coeficientes de transformada en la banda de extensión entre los coeficientes de transformada de la señal de entrada, codifica la ganancia e incluye la ganancia codificada en los datos codificados de banda de extensión. La sección de generación/codificación de banda de extensión 35 multiplica por la ganancia calculada los coeficientes de transformada de la banda de extensión obtenidos copiando los coeficientes de transformada de banda baja 15 normalizados, para obtener los coeficientes de transformada de banda de extensión.
[0036] A continuación, se describirá detalladamente la operación de la sección de análisis de banda de extensión 31, la sección de cálculo de umbral 32 y la sección de extracción de coeficientes de transformada representativos 33. Suponiendo que los coeficientes de transformada de la banda de extensión siguen la distribución
20 normal en la presente realización, se describirá paso a paso cómo establecer el umbral de extracción de coeficientes de transformada (denominado en lo sucesivo “umbral”).
[0037] Cuando se supone que los coeficientes de transformada de la banda de extensión siguen la distribución normal, la sección de análisis de banda de extensión 31 produce como salida el valor absoluto medio y
25 la desviación estándar de amplitudes de los coeficientes de transformada para cada subbanda de la banda de extensión como parámetros estadísticos de la banda de extensión.
[0038] La sección de análisis de banda de extensión 31 calcula el valor absoluto medio mediante la siguiente ecuación 1. En la ecuación 1, j es el índice de una subbanda, M es el número total de coeficientes de transformada
30 incluidos en cada subbanda de la banda de extensión, e i (i= 1 a M) es el índice de un coeficiente de transformada incluido en cada subbanda. Fhavg(j) representa el valor absoluto medio de coeficientes de transformada incluidos en una subbanda j y Fh representa la amplitud de un coeficiente de transformada de la banda de extensión. Es decir, Fh(j, i) representa la amplitud del coeficiente de transformada i-ésimo de la banda de extensión incluido en la subbanda j-ésima. Para explicarlo más fácilmente, se supone que el número de coeficientes de transformada 35 incluidos en cada subbanda de los coeficientes de transformada de la banda de extensión es M.
[1]
M
Fhavg (j) = Y \Fh(j, i |w — (iEcuación1)
i=1
40
A continuación, la sección de análisis de la banda de extensión 31 calcula la desviación estándar para cada subbanda. La desviación estándar se calcula mediante la siguiente ecuación 2. En la ecuación 2, a(i) representa la desviación estándar de una subbanda j.
45 [2]
° (j):
( M
Y Fh( j'i)
i )2 M
- Fhavg(j)2
i=1
... (Ecuación2)
50 [0039] La sección de análisis de banda de extensión 31 produce como salida el valor absoluto medio y la
desviación estándar calculados para remitirlos a la sección de cálculo de umbral 32 como parámetros estadísticos de la banda de extensión.
[0040] La sección de cálculo de umbral 32 lleva a cabo diferentes cálculos en función de si se calcula el
umbral inicial o si se rebaja el umbral existente. Ahora se describirá el cálculo del umbral inicial.
[0041] La sección de cálculo de umbral 32 determina el umbral inicial basándose en parámetros estadísticos de la banda de extensión. Cuando se supone que los coeficientes de transformada de la banda de extensión siguen
5 la distribución normal, la sección de cálculo de umbral 32 calcula el umbral mediante la siguiente ecuación 3. En la ecuación 3, Fhthr(j) es el umbral para una subbanda j y p es una constante para controlar el umbral. Por ejemplo, se establece una p de aproximadamente 1,6 para extraer el 10 % mayor de los coeficientes de transformada de banda de extensión o aproximadamente de 2,0 para extraer el 5 % mayor de los coeficientes de transformada de banda de extensión. El valor establecido de p se puede calcular de acuerdo con la tabla de distribución normal. En este
10 cálculo, la sección de cálculo de umbral 32 extrae un valor relativamente grande de p, de manera que el umbral
inicial sea relativamente elevado para impedir que el umbral sea demasiado bajo, con el resultado de que el número de coeficientes de transformada de la banda de extensión extraídos iguala o supera el número predeterminado. Por ejemplo, para extraer N coeficientes de transformada de banda de extensión de entre M coeficientes de transformada de banda de extensión, se establece un valor de p con el que se esperan extraer N o menos 15 coeficientes de transformada de banda de extensión cuando el proceso de extracción realmente se lleva a cabo, es decir se establece un valor de p con el que se extraerán P coeficientes de transformada de banda de extensión, siendo P menor que N.
[3]
20
Fhthr (j) = Fhavg(j) + o (j )* p ... (Ecuación3)
[0042] Más adelante se describirá la operación de la sección de cálculo de umbral 32 para rebajar el umbral.
25 [0043] Para cada subbanda de la banda de extensión, la sección de extracción de coeficientes de
transformada representativos 33 compara la amplitud de los coeficientes de transformada de banda de extensión con el umbral establecido por la sección de cálculo de umbral 32 para extraer los coeficientes de transformada de banda de extensión con una amplitud mayor que el umbral. La sección de extracción de coeficientes de transformada representativos 33 almacena los coeficientes de transformada de banda de extensión extraídos como 30 los coeficientes de transformada representativos y produce como salida cuántos coeficientes de transformada representativos más se han de extraer para obtener un número predeterminado de coeficientes de transformada para remitir esta información a la sección de cálculo de umbral 32 como el número de coeficientes de transformada que faltan.
35 [0044] Si el número de coeficientes de transformada representativos extraídos alcanza el número
predeterminado, entonces la sección de extracción de coeficientes de transformada representativos 33 detiene el proceso de extracción y produce como salida los coeficientes de transformada representativos extraídos para remitirlos a la sección de concordancia 34. En caso contrario, si el número de coeficientes de transformada representativos extraídos no alcanza el número predeterminado, la sección de extracción de coeficientes de 40 transformada representativos 33 almacena los coeficientes de transformada de banda de extensión extraídos como los coeficientes de transformada representativos. En este punto, la sección de extracción de coeficientes de transformada representativos 33 almacena todos los coeficientes de transformada de la banda de extensión en la subbanda con la amplitud de los coeficientes de transformada de banda de extensión ya extraídos fijada en cero como grupo de coeficientes de transformada candidatos a la extracción. De este modo, se puede evitar que los 45 coeficientes de transformada de banda de extensión ya extraídos sean extraídos de nuevo en el siguiente proceso de extracción.
[0045] Si el número de coeficientes de transformada representativos extraídos no alcanza el número predeterminado, la sección de extracción de coeficientes de transformada representativos 33 lleva a cabo una
50 extracción adicional de coeficientes de transformada. En este caso, la sección de extracción de coeficientes de transformada representativos 33 no lleva a cabo el proceso de extracción en todos los coeficientes de transformada de la banda de extensión incluidos en la subbanda, sino en el grupo de coeficientes de transformada representativos candidatos a la extracción. Los coeficientes de transformada de banda de extensión recién extraídos se añaden a los coeficientes de transformada representativos almacenados y el número de coeficientes de transformada que 55 faltan disminuye en la medida del número de los coeficientes de transformada representativos añadidos.
[0046] En la extracción adicional de coeficientes de transformada representativos mediante este proceso por etapas, cuando el número de coeficientes de transformada representativos extraídos alcanza el número
predeterminado y el proceso de extracción se detiene, puede haber un coeficiente de transformada de banda de extensión con una amplitud mayor que los coeficientes de transformada de banda de extensión recién extraídos en una banda que aún no ha sido explorada en el proceso de extracción adicional. No obstante, debido a que en la etapa inicial (es decir, el proceso de extracción llevado a cabo inicialmente antes de la extracción adicional de 5 coeficientes de transformada), se extraen coeficientes de transformada de banda de extensión con una amplitud mayor que los coeficientes de transformada de banda de extensión en la banda inexplorada, aunque no se puedan extraer coeficientes de transformada de banda de extensión de la banda inexplorada, tiene poca repercusión en la totalidad del proceso de extracción.
10 [0047] El número predeterminado no se limita a un número fijo, sino que se puede establecer en un intervalo
de números. Por ejemplo, el número predeterminado se fija en N como referencia y, cuando el número de coeficientes de transformada de banda de extensión extraídos alcanza un intervalo de entre N-5 y N+5 a consecuencia del proceso de extracción utilizando un umbral calculado, el cálculo de un nuevo umbral puede detenerse y el proceso de extracción de coeficientes de transformada puede finalizar.
15
[0048] A continuación, se describirá detalladamente la operación llevada a cabo cuando el número de
coeficientes de transformada de banda de extensión extraídos por la sección de extracción de coeficientes de transformada representativos 33 es inferior al número predeterminado.
20 [0049] La sección de cálculo de umbral 32 controla el umbral de manera adaptable en función del número de
coeficientes de transformada que faltan producido como salida por la sección de extracción de coeficientes de transformada representativos 33, a fin de extraer más coeficientes de transformada de banda de extensión. En particular, la sección de cálculo de umbral 32 rebaja el umbral en gran medida cuando el número de coeficientes de transformada que faltan es grande y rebaja el umbral ligeramente cuando el número de coeficientes de transformada 25 que faltan es pequeño.
[0050] La actualización del umbral por medio de la multiplicación por un coeficiente de supresión que se calcula en función del número de coeficientes de transformada que faltan se describirá en la presente memoria como un ejemplo de técnicas para adaptar el número de coeficientes de transformada que faltan. En la siguiente ecuación
30 4, Sc(j) representa un coeficiente de supresión en una subbanda j, Nlp(j) representa el número de coeficientes de transformada que faltan de la subbanda j, a representa una cantidad mínima de supresión y b representa una cantidad máxima de supresión. 1,0 > a > b > 0,0 para a y b.
[4]
35
a_b
Sc(j) = —n~ * Nlp(j) + a ... (Ecuación4)
[5]
40 Fhthr (j) = Fhthr (j )* Sc(j) ...(Ecuación5)
[0051] De este modo, el umbral se rebaja de manera adaptable en función del número de coeficientes de transformada que faltan. Por ejemplo, si a = 0,9 y b = 0,5, Fhthr(j) en la ecuación (5) se suprime hasta un intervalo de entre 0,9 veces y 0,5 veces el valor actual de Fhthr(j).
45
[0052] El umbral calculado tal como se describe anteriormente se remite a la sección de extracción de coeficientes de transformada representativos 33. La operación descrita anteriormente de la sección de cálculo de umbral 32 se repite hasta que el número de coeficientes de transformada representativos extraídos por la sección de extracción de coeficientes de transformada representativos 33 alcanza el número predeterminado.
50
[0053] Por ejemplo, si el umbral se actualiza dos veces (si se utilizan tres umbrales, incluido el umbral inicial, para el proceso de extracción) para extraer N, que es el número predeterminado, coeficientes de transformada representativos, cuando el número de coeficientes de transformada en la subbanda es M, el proceso de extracción de acuerdo con la estrategia descrita anteriormente solo requiere la cantidad de cálculos para llevar a cabo el
55 proceso de ramificación M x 3 veces.
[0054] A continuación, se describirá la operación de actualización del umbral de extracción de coeficientes de
transformada tal como se describe anteriormente, haciendo referencia a la fig. 3 y la fig. 4. La fig. 3 ilustra un proceso de extracción de acuerdo con una técnica convencional y la fig. 4 ilustra el proceso de extracción de acuerdo con la presente realización.
5 [0055] El eje horizontal de la fig. 3 y la fig. 4 representa la frecuencia y el eje horizontal de la fig. 3 y la fig. 4
representa la amplitud de valores absolutos que indica coeficientes de transformada de banda de extensión en una subbanda j. Como ejemplo ilustrativo, el número de coeficientes de transformada incluidos en la subbanda M = 25 y el numero predeterminado N = 10. Los coeficientes de transformada de banda de extensión se designan como f1, f2, f3 desde una banda baja a una banda alta y un coeficiente de transformada de banda de extensión correspondiente 10 a la frecuencia más alta se designa como f25.
[0056] Se describirá haciendo referencia a la fig. 3 un ejemplo de la operación del proceso de extracción en la técnica de acuerdo con la técnica relacionada. En esta técnica, debido a que los coeficientes de transformada de banda de extensión se extraen en orden descendente de amplitud de valores absolutos, se extraen diez coeficientes
15 de transformada de banda de extensión f15, f22, f9, f3, f17, f21, f6, f14, f12 y f7, en este orden. Este proceso de extracción debe llevar a cabo el proceso de ramificación M x 10 veces.
[0057] A continuación, se describirá la operación de extracción de acuerdo con la presente realización haciendo referencia a la fig. 4. La sección de análisis de banda de extensión 31 calcula la media de valores
20 absolutos y la desviación estándar de f1 a 125, y la sección de cálculo de umbral 32 calcula un umbral de extracción de coeficientes de transformada. Este umbral de extracción de coeficientes de transformada se designa como umbral1 en la fig. 4.
[0058] En este punto, se extraen tres coeficientes de transformada de banda de extensión f15, f22 y f9 y el 25 número de coeficientes de transformada que faltan es 10 - 3 = 7. Si a = 0,9 y b = 0,5, un coeficiente de supresión
Sc(j) = 0,62 de acuerdo con la anterior ecuación 4. Por consiguiente, el umbral de extracción de coeficientes de transformada se actualiza con 0,62 x umbral1. Este nuevo umbral de extracción de coeficientes de transformada se designa como umbral2.
30 [0059] La extracción con el uso de umbral2 proporciona tres coeficientes de transformada de banda de
extensión extraídos de manera adicional f3, f17, f21, y el número de coeficientes de transformada que faltan es 7 - 3 = 4. Por consiguiente, el coeficiente de supresión Sc(j) pasa a ser 0,78 y el umbral de extracción de coeficientes de transformada se actualiza con 0,78 x umbral2. Este nuevo umbral de extracción de coeficientes de transformada se designa como umbral3.
35
[0060] La extracción con el uso de umbral3 proporciona tres coeficientes de transformada de banda de
extensión extraídos de manera adicional f6, f14, f12, y el número de coeficientes de transformada que faltan es 4 - 3 = 1. El número de coeficientes de transformada de banda de extensión extraídos es nueve, que es inferior a diez, pero se supone que está en un intervalo admisible para detener el proceso de extracción.
40
[0061] En el ejemplo anterior, los coeficientes de transformada se pueden extraer llevando a cabo el proceso de extracción tres veces (proceso de ramificación M x 3 veces) con el umbral de extracción de coeficientes de transformada fijado inicialmente una vez y actualizado dos veces. En este ejemplo ilustrativo, 17, que se extrae mediante el procedimiento de acuerdo con la técnica relacionada, no se puede extraer, de acuerdo con la presente
45 realización. No obstante, debido a que f7 presenta una amplitud de valores absolutos menor que la de los nueve coeficientes de transformada extraídos, aunque no se pueda extraer f7, influye poco en la precisión del cálculo de un valor de correlación.
[0062] La configuración y la operación descritas anteriormente permiten que la sección de codificación de 50 banda de extensión 3 extraiga un número apropiado de coeficientes de transformada representativos de entre
coeficientes de transformada de banda de extensión con una pequeña cantidad de cálculos cuando se calcula un valor de correlación entre los coeficientes de transformada de banda de extensión y los coeficientes de transformada de banda baja normalizados. Esto permite obtener un aparato de codificación con una cantidad de cálculos reducida y sin degradación en el rendimiento.
55
[0063] Tal como se describe anteriormente, el aparato de codificación de acuerdo con la presente realización calcula un umbral basándose en estadísticas sobre los coeficientes de transformada de banda de extensión, en primer lugar, y después extrae coeficientes de transformada de banda de extensión con una gran amplitud utilizando el umbral. Si el número de coeficientes de transformada de banda de extensión extraídos es inferior a un número
predeterminado, el aparato de codificación determina cuánto se rebaja el umbral en función del número de coeficientes de transformada que faltan y actualiza el umbral. El aparato de codificación repite la actualización del umbral y la extracción de coeficientes de transformada de banda de extensión hasta que el número de coeficientes de transformada de banda de extensión extraídos alcanza el número predeterminado. De este modo, el aparato de 5 codificación puede extraer un número requerido de coeficientes de transformada representativos de las características de una banda de extensión con una menor cantidad de cálculos. Dicho de otro modo, la cantidad de cálculos para extraer coeficientes de transformada se puede reducir de manera considerable reduciendo el número de bucles necesarios para extraer un numero predeterminado N de coeficientes de transformada de banda de extensión.
10
[0064] El aparato de codificación de acuerdo con la presente realización establece el umbral de manera que el número de los coeficientes de transformada de banda de extensión extraídos en primer lugar es inferior al número predeterminado. El aparato de codificación actualiza el umbral en función de cuántos coeficientes de transformada de banda de extensión más se han de extraer para obtener un número predeterminado de coeficientes de
15 transformada de banda de extensión, y añade coeficientes de transformada de banda de extensión extraídos utilizando el umbral actualizado a un grupo de coeficientes de transformada de banda de extensión extraídos utilizando el umbral anterior a la actualización. El aparato de codificación detiene el proceso de extracción una vez que el número de coeficientes de transformada de banda de extensión extraídos durante el proceso de extracción alcanza el número predeterminado. Este proceso de extracción de coeficientes de transformada de banda de
20 extensión puede extraer de manera fiable coeficientes de transformada de banda de extensión con una gran amplitud.
[0065] El aparato de codificación de acuerdo con la presente realización puede limitar a un número fijo el número de veces que se actualiza el umbral y detener el proceso de extracción si el número de veces que se
25 actualiza el umbral alcanza el límite (número fijo). De este modo, se puede reducir aún más la cantidad de cálculos en el peor de los casos.
[0066] A continuación, se describirá un aparato de descodificación de acuerdo con un ejemplo. La fig. 5 es un diagrama de bloques que ilustra una configuración del aparato de descodificación.
30
[0067] El aparato de descodificación 20 incluye principalmente una sección de desmultiplexado 5, una sección de descodificación de núcleo 6, una sección de descodificación de banda de extensión 7 y una sección de transformada de frecuencia-tiempo 8.
35 [0068] La sección de desmultiplexado 5 recibe datos codificados producidos como salida por el aparato de
codificación 10, divide los datos codificados en datos codificados de núcleo y datos codificados de banda de extensión, produce como salida los datos codificados de núcleo para remitirlos la sección de descodificación de núcleo 6, y produce como salida los datos codificados de banda de extensión para remitirlos a la sección de descodificación de banda de extensión 7.
40
[0069] La sección de descodificación de núcleo 7 descodifica los datos codificados de núcleo y produce como
salida los coeficientes de transformada de banda baja codificados de núcleo para remitirlos a la sección de descodificación de banda de extensión 7 y la sección de transformada de frecuencia-tiempo 8.
45 [0070] La sección de descodificación de banda de extensión 7 descodifica los datos codificados de la banda
de extensión, utiliza los datos codificados y coeficientes de transformada de banda baja codificados de núcleo resultantes para calcular coeficientes de transformada de banda de extensión, y produce como salida los coeficientes de transformada de banda de extensión calculados para remitirlos a la sección de transformada de frecuencia-tiempo 8. Más adelante, se describirá detalladamente la configuración interna de la sección de
50 descodificación de la banda de extensión 7.
[0071] La sección de transformada de frecuencia-tiempo 8 combina los coeficientes de transformada de banda baja codificados de núcleo y los coeficientes de transformada de banda de extensión para generar coeficientes de transformada descodificados, transforma los coeficientes de transformada descodificados al dominio
55 temporal, por ejemplo, mediante una transformada ortogonal para generar una señal de salida, y genera la señal de salida.
[0072] A continuación, se describirá detalladamente la configuración interna de la sección de descodificación de banda de extensión 7. Tal como se ilustra en la fig. 6, la sección de descodificación de banda de extensión 7
incluye principalmente una sección de normalización 70 y una sección de generación/descodificación de banda de extensión 71.
[0073] La sección de normalización 70 normaliza los coeficientes de transformada de banda baja codificados 5 de núcleo y produce como salida los coeficientes de transformada de banda baja normalizados. La sección de
normalización 70 lleva a cabo el mismo proceso que la sección de normalización 30 ilustrada en la fig. 2 y, por tanto, no se describe de manera detallada.
[0074] La sección de generación/descodificación de banda de extensión 71 genera los coeficientes de 10 transformada de banda de extensión utilizando los coeficientes de transformada de banda baja normalizados y los
datos codificados de banda de extensión. En particular, la sección de generación/descodificación de banda de extensión 71 descodifica, en primer lugar, información de retardo y una ganancia a partir de los datos codificados de banda de extensión. A continuación, la sección de generación/descodificación de banda de extensión 71 copia los coeficientes de transformada de banda baja normalizados en la banda de extensión como una estructura fina de 15 frecuencia de acuerdo con la información de retardo. Después, la sección de generación/descodificación de banda de extensión 71 multiplica por la ganancia descodificada los coeficientes de transformada de banda de extensión copiados de los coeficientes de transformada de banda baja normalizados, para generar los coeficientes de transformada de banda de extensión.
20 [0075] La configuración y la operación descritas anteriormente permiten que el aparato de descodificación 20
de acuerdo con el presente ejemplo descodifique datos codificados generados por el aparato de codificación 10.
[0076] Anteriormente se han descrito el aparato de codificación de acuerdo con la presente realización y un aparato de descodificación ejemplar. Cabe señalar que la anterior descripción de la presente realización constituye
25 un ejemplo de aplicación de la presente invención y que la presente invención no se limita a este ejemplo.
[0077] Por ejemplo, aunque la presente realización se describe anteriormente utilizando un ejemplo en el que la sección de cálculo de umbral 32 y la sección de extracción de coeficientes de transformada representativos 33 llevan a cabo repetidas operaciones hasta que el número de coeficientes de transformada extraídos alcanza un
30 número requerido, la presente invención no se limita a este ejemplo. La sección de extracción de coeficientes de transformada representativos 33, por ejemplo, puede determinar que no es necesaria la extracción de más coeficientes de transformada cuando la extracción se repite un número fijo de veces, y finalizar el proceso de extracción tras producir como salida los coeficientes de transformada representativos ya extraídos.
35 [0078] En la presente realización mencionada anteriormente, se describe el cálculo de coeficientes de
transformada de banda de extensión utilizando un ejemplo en el que el umbral de extracción de coeficientes de transformada se actualiza de la misma manera en todas las subbandas, pero, en la presente invención, el umbral de extracción de coeficientes de transformada se puede actualizar hasta un grado que varía para cada subbanda. Por ejemplo, la probabilidad de extraer coeficientes de transformada se puede reducir en una banda superior haciendo 40 que al menos uno de entre los a y b de la anterior ecuación 4 sea mayor en una banda superior. Esta estrategia permite una mayor reducción en la cantidad de cálculos al aprovechar el hecho de que la estructura fina de coeficientes de transformada tiene una menor influencia en una banda superior.
[0079] En la presente invención, a medida que aumenta el número de bucles para actualizar el umbral tal
45 como se describe anteriormente, el umbral se puede establecer de diferentes maneras. Por ejemplo, a medida que aumenta el número de bucles, se reduce al menos una de entre las a y b de la anterior ecuación 4 para rebajar el umbral, lo que permite extraer más coeficientes de transformada para alcanzar el número predeterminado y resolver la falta de coeficientes de transformada.
50 [0080] Anteriormente se describe la presente realización para el caso en el que se supone que los
coeficientes de transformada de banda de extensión siguen la distribución normal y la sección de cálculo de umbral 32 ilustrada en la fig. 2 calcula el umbral a partir de una media de valores absolutos y una desviación estándar. No obstante, en la presente invención, se puede suponer que los coeficientes de transformada de banda de extensión siguen una distribución distinta de la distribución normal y que el umbral se puede establecer de acuerdo con la 55 distribución. Además, en la presente invención, se puede utilizar como umbral el valor absoluto de la mayor amplitud de coeficientes de transformada incluidos en una subbanda que se multiplica por un índice fijo inferior a 1,0.
[0081] Aunque en la presente realización se describe una técnica para actualizar el umbral mediante la
sección de cálculo de umbral 32 ilustrada en la fig. 2, en la que el umbral se actualiza multiplicando el umbral por un
coeficiente de supresión calculado en función del número de coeficientes de transformada que faltan, en la presente invención, se puede utilizar otra técnica para actualizar el umbral. Por ejemplo, el umbral se puede actualizar restando 0,2 al umbral cuando el número de coeficientes de transformada que faltan es grande y restando 0,1 al umbral cuando el número de coeficientes de transformada que faltan es pequeño, o restando 0,5 a p cuando el 5 número de coeficientes de transformada que faltan es grande y restando 0,1 a p cuando el número de coeficientes de transformada que faltan es pequeño.
[0082] Si el número de coeficientes de transformada extraídos es mayor que el número predeterminado cuando la sección de extracción de coeficientes de transformada representativos 33 ilustrada en la fig. 2 lleva a cabo
10 el proceso de extracción utilizando el umbral calculado en función de parámetros estadísticos de la banda de extensión en la sección de análisis de banda de extensión 31, la sección de extracción de coeficientes de transformada representativos 33 puede cancelar la extracción de coeficientes de transformada y remitir una instrucción a la sección de cálculo de umbral 32 para aumentar el umbral. En este caso, la sección de cálculo de umbral 32 actualiza el umbral para aumentarlo y la sección de extracción de coeficientes de transformada 15 representativos 33 puede llevar a cabo de nuevo el proceso de extracción utilizando el umbral actualizado para extraer un número predeterminado de coeficientes de transformada o menos coeficientes de transformada.
[0083] Aunque la presente realización se describe anteriormente utilizando un ejemplo en el que la sección de cálculo de umbral 32 ilustrada en la fig. 2 establece un umbral relativamente grande, de manera que el número de
20 coeficientes de transformada extraídos en primer lugar es igual o menor que el número predeterminado, en la presente invención, la sección de cálculo de umbral 32 puede establecer un umbral de manera que el número de coeficientes de transformada extraídos en primer lugar sea igual al número predeterminado. En este caso, el número de los coeficientes de transformada extraídos en primer lugar puede superar a menudo el número predeterminado. En dichos casos, cuando el número de coeficientes de transformada extraídos supera el número predeterminado, la 25 sección de extracción de coeficientes de transformada representativos 33 remite una instrucción a la sección de cálculo de umbral 32 para aumentar el umbral y lleva a cabo de nuevo el proceso de extracción utilizando el umbral actualizado. Este proceso se repite hasta que el número de coeficientes de transformada extraídos acaba siendo igual o inferior al número predeterminado.
30 [0084] Aunque la presente realización se describe anteriormente utilizando un ejemplo en el que se calcula
un valor de correlación entre coeficientes de transformada representativos de entre coeficientes de transformada de banda de extensión y coeficientes de transformada de banda baja normalizados, en la presente invención, se pueden utilizar coeficientes de transformada de banda de extensión modificados. Por ejemplo, se pueden utilizar coeficientes de transformada de banda de extensión filtrados teniendo en cuenta influencias de enmascaramiento 35 auditivo y similares.
[0085] La presente invención también se puede aplicar en casos en los que se registra un programa de procesamiento de señales y se escribe en un medio de registro legible por máquina, tal como una memoria, disco, cinta, CD y DVD, y se ejecuta, y se pueden obtener en este caso operaciones y efectos similares a los de cada una
40 de las realizaciones mencionadas anteriormente.
[0086] Además, pese a que se han descrito casos con la realización anterior como ejemplos en los que la presente invención se configura por hardware, la presente invención también se puede aplicar por medio de un software.
45
[0087] Cada bloque de función empleado en la descripción de la realización mencionada anteriormente se puede aplicar normalmente como una LSI (integración a gran escala) constituida por un circuito integrado. Estos bloques funcionales pueden ser chips individuales o estar contenidos de manera parcial o total en un único chip. En la presente memoria se adopta el término “LSI”, pero también se puede referir a “CI”, “sistema LSI”, “súper-LSI” o
50 “ultra-LSI” dependiendo de los distintos grados de integración.
[0088] Además, el procedimiento de integración de circuitos no se limita a la LSI, sino que también es posible la aplicación utilizando una circuitería específica o procesadores de uso general. Tras la fabricación de la LSI, también es posible la utilización de una FPGA programable (matriz de puertas programable in situ) o un procesador
55 reconfigurable en el que se pueden reconfigurar las conexiones y ajustes de las celdas del circuito dentro de una LSI.
[0089] Además, si una tecnología de circuitos integrados llega a sustituir la LSI a consecuencia del avance de la tecnología de semiconductores o una tecnología derivada de la tecnología de semiconductores, también es
posible, como es natural, llevar a cabo una integración de bloques de función utilizando esta tecnología. También es posible la aplicación de biotecnología.
Aplicabilidad industrial
5
[0090] El aparato de codificación de acuerdo con la presente invención resulta adecuado para codificar datos
relacionados con el sonido tales como datos de habla, datos de música y datos de audio.
Lista de signos de referencia
10
[0091]
1 Sección de
2 Sección de
15
3 Sección de
4 Sección de
5 Sección de
6 Sección de
7 Sección de
20
8 Sección de
10 Aparato de
20 Aparato de
30 Sección de
31 Sección de
25
32 Sección de
33 Sección de
34 Sección de
35 Sección de
70 Sección de
30
71 Sección de
transformada de tiempo-frecuencia
codificación de núcleo
codificación de banda de extensión
multiplexado
desmultiplexado
descodificación de núcleo
descodificación de banda de extensión
transformada de frecuencia-tiempo
codificación
descodificación
normalización
análisis de banda de extensión cálculo de umbral
extracción de coeficientes de transformada representativos concordancia
generación/codificación de banda de extensión normalización
generación/descodificación de banda de extensión

Claims (5)

  1. REIVINDICACIONES
    1. Un aparato de codificación que comprende:
    5 una sección de codificación de núcleo configurada para codificar coeficientes de transformada en una banda baja inferior a una frecuencia de referencia de entre coeficientes de transformada de una señal de entrada obtenidos mediante la transformación de una señal de entrada de un dominio temporal a un dominio de frecuencia; y
    una sección de codificación de banda de extensión configurada para codificar coeficientes de transformada en una 10 banda de extensión utilizando coeficientes de transformada de banda baja codificados y descodificados de núcleo, siendo la banda de extensión una banda superior a la frecuencia de referencia y siendo la señal de entrada una de entre una señal de audio, una señal de audio de habla y una señal de música, en el que la sección de codificación de banda de extensión comprende:
    15 una sección de cálculo de umbral configurada para calcular, para cada una de las subbandas de la banda de extensión obtenidas dividiendo la banda de extensión, un umbral basado en estadísticas sobre los coeficientes de transformada incluidos en la subbanda; una sección de extracción de coeficientes de transformada representativos configurada para comparar, para cada una de las subbandas de la banda de extensión, una amplitud de los coeficientes de transformada con el umbral para extraer un coeficiente de transformada con una amplitud mayor que 20 el umbral, como coeficiente de transformada representativo; y una sección de concordancia configurada para calcular, para cada una de las subbandas de la banda de extensión, un valor de correlación entre los coeficientes de transformada representativos y los coeficientes de transformada de banda baja codificados y descodificados de núcleo normalizados y para seleccionar una subbanda de la banda baja con un valor de correlación máximo, en la que:
    25
    la sección de cálculo de umbral está configurada para actualizar, cuando un número de los coeficientes de transformada representativos extraídos por la sección de extracción de coeficientes de transformada representativos es inferior a un número predeterminado, el umbral de acuerdo con un número de coeficientes de transformada representativos que faltan con respecto al número predeterminado; y 30
    la sección de extracción de coeficientes de transformada representativos está configurada para llevar a cabo el proceso para extraer de nuevo un coeficiente de transformada utilizando el umbral actualizado.
  2. 2. El aparato de codificación de acuerdo con la reivindicación 1, en el que la sección de cálculo de 35 umbral está configurada para actualizar el umbral de tal manera que se establece un umbral más pequeño para un
    mayor número de los coeficientes de transformada representativos que faltan con respecto al número predeterminado.
  3. 3. El aparato de codificación de acuerdo con la reivindicación 1, en el que la sección de cálculo de 40 umbral está configurada para establecer en primer lugar el umbral de tal manera que el umbral es más alto que un
    umbral correspondiente a estadísticas basadas en cuál es el número predeterminado de coeficientes de transformada representativos que se espera extraer.
  4. 4. El aparato de codificación de acuerdo con la reivindicación 1, en el que:
    45
    la sección de cálculo de umbral está configurada para limitar un número de veces que se actualiza el umbral a un número fijo; y
    la sección de extracción de coeficientes de transformada representativos está configurada para detener el proceso 50 para extraer los coeficientes de transformada cuando el número de veces que se actualiza el umbral alcanza el número fijo.
  5. 5. Un procedimiento de codificación que comprende:
    55 una etapa de codificación de núcleo en la que se codifican coeficientes de transformada en una banda baja inferior a una frecuencia de referencia entre coeficientes de transformada de una señal de audio obtenidos mediante la transformación de una señal de entrada de un dominio temporal a un dominio de frecuencia; y
    una etapa de codificación de banda de extensión en la que se codifican coeficientes de transformada en una banda
    de extensión utilizando coeficientes de transformada de banda baja codificados y la banda de extensión una banda superior a la frecuencia de referencia y siendo una señal de audio, una señal de audio de habla y una señal de música, en la que de extensión incluye:
    5
    el cálculo, para cada una de las subbandas de la banda de extensión obtenidas dividiendo la banda de extensión, de un umbral basado en estadísticas sobre los coeficientes de transformada incluidos en la subbanda;
    la comparación, para cada una de las subbandas de la banda de extensión, de una amplitud de los coeficientes de 10 transformada con el umbral para extraer un coeficiente de transformada con una amplitud mayor que el umbral como coeficiente de transformada representativo;
    la actualización, cuando un número de los coeficientes de transformada representativos extraídos es inferior a un número predeterminado, del umbral de acuerdo con un número de los coeficientes de transformada representativos 15 que faltan con respecto al número predeterminado;
    la ejecución del proceso para extraer de nuevo un coeficiente de transformada utilizando el umbral actualizado; y
    el cálculo, para cada una de las subbandas de la banda de extensión, de un valor de correlación entre los 20 coeficientes de transformada representativos y los coeficientes de transformada de banda baja codificados y descodificados de núcleo normalizados, y la selección de una subbanda de la banda baja con un valor máximo de correlación cuando el número de los coeficientes de transformada representativos alcanza el número predeterminado.
    descodificados de núcleo, siendo la señal de entrada una de entre la etapa de codificación de banda
ES12843823.1T 2011-10-28 2012-10-12 Aparato de codificación y procedimiento de codificación Active ES2668822T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011237818 2011-10-28
JP2011237818 2011-10-28
PCT/JP2012/006541 WO2013061530A1 (ja) 2011-10-28 2012-10-12 符号化装置および符号化方法

Publications (1)

Publication Number Publication Date
ES2668822T3 true ES2668822T3 (es) 2018-05-22

Family

ID=48167386

Family Applications (3)

Application Number Title Priority Date Filing Date
ES17209671T Active ES2771104T3 (es) 2011-10-28 2012-10-12 Aparato de codificación y procedimiento de codificación
ES19205679T Active ES2914499T3 (es) 2011-10-28 2012-10-12 Aparato de codificación y procedimiento de codificación
ES12843823.1T Active ES2668822T3 (es) 2011-10-28 2012-10-12 Aparato de codificación y procedimiento de codificación

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES17209671T Active ES2771104T3 (es) 2011-10-28 2012-10-12 Aparato de codificación y procedimiento de codificación
ES19205679T Active ES2914499T3 (es) 2011-10-28 2012-10-12 Aparato de codificación y procedimiento de codificación

Country Status (8)

Country Link
US (4) US9336787B2 (es)
EP (3) EP2772913B1 (es)
JP (3) JP6062370B2 (es)
ES (3) ES2771104T3 (es)
HK (1) HK1254975A1 (es)
PL (3) PL3624119T3 (es)
PT (3) PT3624119T (es)
WO (1) WO2013061530A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013057895A1 (ja) * 2011-10-19 2013-04-25 パナソニック株式会社 符号化装置及び符号化方法
WO2013061530A1 (ja) * 2011-10-28 2013-05-02 パナソニック株式会社 符号化装置および符号化方法
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4212339A1 (de) * 1991-08-12 1993-02-18 Standard Elektrik Lorenz Ag Codierverfahren fuer audiosignale mit 32 kbit/s
JP3283413B2 (ja) * 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
JP2778567B2 (ja) * 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法
JP5199407B2 (ja) 2003-09-29 2013-05-15 オリンパス株式会社 顕微鏡システム及び観察方法
KR101220621B1 (ko) * 2004-11-05 2013-01-18 파나소닉 주식회사 부호화 장치 및 부호화 방법
KR100657916B1 (ko) 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
KR100958144B1 (ko) * 2005-11-04 2010-05-18 노키아 코포레이션 오디오 압축
CN102460574A (zh) * 2009-05-19 2012-05-16 韩国电子通信研究院 用于使用层级正弦脉冲编码对音频信号进行编码和解码的方法和设备
WO2011000408A1 (en) 2009-06-30 2011-01-06 Nokia Corporation Audio coding
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
EP2767977A4 (en) * 2011-10-21 2015-04-29 Samsung Electronics Co Ltd METHOD AND DEVICE FOR LOSS-FREE ENERGY CODING, AUDIO CODING METHOD AND DEVICE, METHOD AND APPARATUS FOR LOSS-FREE ENERGY DECODING AND AUDIO CODING METHOD AND DEVICE
WO2013061530A1 (ja) * 2011-10-28 2013-05-02 パナソニック株式会社 符号化装置および符号化方法

Also Published As

Publication number Publication date
JP6768026B2 (ja) 2020-10-14
US20140257825A1 (en) 2014-09-11
US10607617B2 (en) 2020-03-31
PL3624119T3 (pl) 2022-06-20
EP2772913A1 (en) 2014-09-03
PT2772913T (pt) 2018-05-10
EP3624119A1 (en) 2020-03-18
PT3321931T (pt) 2020-02-25
EP3321931A1 (en) 2018-05-16
JP2018132776A (ja) 2018-08-23
HK1254975A1 (zh) 2019-08-02
EP2772913A4 (en) 2015-05-06
ES2771104T3 (es) 2020-07-06
JP6332707B2 (ja) 2018-05-30
US10134410B2 (en) 2018-11-20
EP2772913B1 (en) 2018-02-14
US20160379654A1 (en) 2016-12-29
EP3624119B1 (en) 2022-02-23
JPWO2013061530A1 (ja) 2015-04-02
US9336787B2 (en) 2016-05-10
US20190130924A1 (en) 2019-05-02
PL3321931T3 (pl) 2020-06-01
WO2013061530A1 (ja) 2013-05-02
US9472200B2 (en) 2016-10-18
PT3624119T (pt) 2022-05-16
PL2772913T3 (pl) 2018-08-31
EP3321931B1 (en) 2019-12-04
US20160203825A1 (en) 2016-07-14
ES2914499T3 (es) 2022-06-13
JP6062370B2 (ja) 2017-01-18
JP2017049620A (ja) 2017-03-09

Similar Documents

Publication Publication Date Title
ES2599007T3 (es) Aparato y método para codificar y decodificar una señal de audio codificada utilizando modelado de ruido/parche temporal
ES2908348T3 (es) Procesamiento de señales de audio durante la reconstrucción de alta frecuencia
ES2398627T3 (es) Aparato y procedimiento para calcular una cantidad de envolventes espectrales
JP2022172286A (ja) パラメトリック・マルチチャネル・エンコードのための方法
RU2449387C2 (ru) Способ и устройство для обработки сигнала
ES2237706T3 (es) Reconstruccion de componentes de alta frecuencia.
ES2732952T3 (es) Decodificador de audio y procedimiento para proporcionar una información de audio decodificada usando un ocultamiento de error basado en una señal de excitación en el dominio del tiempo
ES2453098T3 (es) Códec multimodo de audio
ES2582475T3 (es) Generación de una extensión de banda ancha de una señal de audio de ancho de banda extendido
JP7106711B2 (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
ES2430414T3 (es) Cálculo de máscara de escalado selectivo basado en detección de pico
ES2668822T3 (es) Aparato de codificación y procedimiento de codificación
ES2970676T3 (es) Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento decodificación de audio vocal, y procedimiento de decodificación de audio vocal
BR112012014856B1 (pt) Método para fundir conjuntos de fonte de parâmetros de sbr a conjuntos-alvo de parâmetros de sbr, meio de armazenamento não transitório e unidade de fusão de parâmetros de sbr
BR112015010954B1 (pt) Método de codificação de um sinal de áudio.
KR101854298B1 (ko) 낮은 계산 자원들로 인코딩된 오디오 신호를 디코딩하기 위한 장치 및 방법
BR112012022898B1 (pt) procesador de sinal, provedor de janela, sinal de mídia codificado, método para processar um sinal e método para prover uma janela
ES2922975T3 (es) Codificador, decodificador y procedimientos para la conmutación de señal adaptable de la relación de superposición en la codificación por transformada de audio
ES2646021T3 (es) Método y aparato para codificación, procesamiento y decodificación de envolvente de señal de audio mediante modelado de una representación de suma acumulativa que emplea cuantificación de distribución y codificación
BR112021007516A2 (pt) codificador de áudio, processador de áudio e método para processar um sinal de áudio
Wang et al. The perceptual and statistics characteristic of spatial cues and its application
ES2627410T3 (es) Aparato para codificar una señal de voz/sonido
Yu et al. Context adaptive training with factorized decision trees for HMM-based speech synthesis.