ES2770704T3 - Codificación de una señal acústica - Google Patents

Codificación de una señal acústica Download PDF

Info

Publication number
ES2770704T3
ES2770704T3 ES15826810T ES15826810T ES2770704T3 ES 2770704 T3 ES2770704 T3 ES 2770704T3 ES 15826810 T ES15826810 T ES 15826810T ES 15826810 T ES15826810 T ES 15826810T ES 2770704 T3 ES2770704 T3 ES 2770704T3
Authority
ES
Spain
Prior art keywords
encoding
coefficients
acoustic signal
unit
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15826810T
Other languages
English (en)
Inventor
Takehiro Moriya
Yutaka Kamamoto
Noboru Harada
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Application granted granted Critical
Publication of ES2770704T3 publication Critical patent/ES2770704T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectroscopy & Molecular Physics (AREA)

Abstract

Un procedimiento de codificación para codificar una señal acústica de entrada trama por trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado a partir de una primera etapa de codificación y una segunda etapa de codificación del procesamiento de codificación, comprendiendo el procedimiento de codificación: una etapa de selección para determinar si se permite el procesamiento de la codificación de conmutación de una trama anterior a una trama actual si al menos una de las magnitudes de energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama anterior y la magnitud de energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama actual es menor que o igual al valor de un umbral predeterminado; en caso contrario, no se permite la conmutación; donde la etapa de selección selecciona además codificar la trama actual en la segunda etapa de codificación en un caso donde la señal acústica de entrada de la trama anterior se codificó en la primera etapa de codificación y un índice que indica que las subidas y bajadas de un espectro de la señal acústica de entrada de la trama actual son pronunciadas o que un cierto grado de concentración del espectro sea alto es menor que un valor de umbral determinado de antemano, de casos donde se hace posible el cambio del procesamiento de codificación desde la trama anterior a la trama actual, donde la primera etapa de codificación es una etapa de codificación de una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal acústica de entrada; y la segunda etapa de codificación es una etapa de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada, que implica una codificación de longitud variable que se realiza sobre un diferencial entre un valor logarítmico de la energía media de los coeficientes en cada una de las regiones parciales, obtenidas mediante la división de la secuencia de coeficientes del dominio de la frecuencia correspondiente a la señal acústica de entrada en una pluralidad de regiones parciales, y el valor logarítmico de la energía media de un dominio de la frecuencia adyacente.

Description

DESCRIPCIÓN
Codificación de una señal acústica
[CAMPO TÉCNICO]
La presente invención se refiere a una tecnología de codificación de señales acústicas. Más particularmente, la presente invención se refiere a una tecnología de codificación para codificar una señal acústica, convirtiendo la señal acústica en el dominio de la frecuencia.
[ANTECEDENTES DE LA TÉCNICA]
En la codificación de señales acústicas como el habla y la música, se utiliza ampliamente un procedimiento de codificación de una señal acústica de entrada en el dominio de la frecuencia. Como procedimiento de codificación de una señal acústica en el dominio de la frecuencia, existen, por ejemplo, los procedimientos de la bibliografía no patentada 1 y de la bibliografía no patentada 2.
El procedimiento de codificación descrito en la bibliografía no patentada 1 es un procedimiento que realiza el procesamiento de codificación utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal. Específicamente, el procedimiento de codificación descrito en la bibliografía no patentada 1 es un procedimiento que obtiene un código de coeficientes de predicción lineal mediante codificando coeficientes que se obtienen de una señal acústica de entrada y son convertibles en coeficientes de predicción lineal y obtiene un código de coeficientes normalizados codificando una secuencia de coeficientes normalizada que se obtiene normalizando una secuencia de coeficientes del dominio de la frecuencia correspondiente a la señal acústica de entrada mediante una secuencia de coeficientes de la envolvente espectral correspondiente a coeficientes que son convertibles en coeficientes de predicción lineal cuantificados correspondientes al código de coeficientes de predicción lineal. Los coeficientes que son convertibles en coeficientes de predicción lineal son, por ejemplo, los mismos coeficientes de predicción lineal, coeficientes PARCOR (coeficientes de autocorrelación parcial), parámetros LSP o similares.
El procedimiento de codificación descrito en la bibliografía no patentada 2 es un procedimiento que realiza un procesamiento de codificación que implica la codificación de longitud variable diferencial obteniendo un diferencial entre el valor logarítmico de la energía media de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía media de un dominio de la frecuencia adyacente. Específicamente, el procedimiento de codificación descrito en la bibliografía no patentada 2 es un procedimiento que divide una secuencia de coeficientes del dominio de la frecuencia correspondiente a una señal acústica de entrada en dominios de frecuencias de modo que, cuanto más bajas son las frecuencias, menor es el número de muestras del dominio de la frecuencia y, cuanto más altas son las frecuencias, mayor es el número de muestras del dominio de la frecuencia, obtiene la energía media de cada dominio de la frecuencia obtenida por división, y cuantifica la energía media en los ejes logarítmicos; realiza una codificación de longitud variable en un diferencial entre el valor obtenido por cuantificación y el valor obtenido cuantificando la energía media de un dominio de la frecuencia adyacente en los ejes logarítmicos de manera similar; y determina adaptativamente, utilizando la energía media, cuál se cuantificó en los ejes logarítmicos, de cada dominio de la frecuencia obtenido por división, un número de bits de cuantificación de cada coeficiente del dominio de la frecuencia y la amplitud de paso de cuantificación de cada coeficiente del dominio de la frecuencia, cuantifica cada coeficiente del dominio de la frecuencia según el mismo, y además realiza la codificación de longitud variable al respecto.
La bibliografía no patentada 1 presenta codificadores de voz y procedimientos de codificación de voz que codifican tramas inactivas a diferentes tasas. Asimismo, se presentan aparatos y procedimientos para el procesamiento de una señal de voz codificada que calculan una trama decodificada basada en la descripción de una envolvente espectral en una primera banda de frecuencias y la descripción de una envolvente espectral en una segunda banda de frecuencias, en la que la descripción para la primera banda de frecuencias se basa en la información procedente de la correspondiente trama codificada y la descripción para la segunda banda de frecuencias se basa en la información procedente de, al menos, una trama codificada anterior. El cálculo de la trama decodificada también puede basarse en una descripción de la información temporal para la segunda banda de frecuencias que se basa en la información procedente de, al menos, una trama codificada anterior.
La bibliografía no patentada 2 se refiere a un procedimiento y dispositivo para mejorar la ocultación del borrado de tramas causado por las tramas de una señal acústica codificada eliminada durante la transmisión desde un codificador a un decodificador, y para acelerar la recuperación del decodificador después de que se hayan recibido tramas de la señal acústica codificada que no hayan sido eliminadas. Para ello, los parámetros de ocultación/recuperación se especifican en el codificador o decodificador. Cuando se especifican en el codificador, los parámetros de ocultación/recuperación se transmiten al decodificador. En el decodificador, la ocultación del borrado de tramas y la recuperación del decodificador se realiza en respuesta a los parámetros de ocultación/recuperación. Los parámetros de ocultación/recuperación pueden seleccionarse del grupo que consiste en: un parámetro de clasificación de la señal, un parámetro de información sobre la energía y un parámetro de información sobre la fase. La determinación de los parámetros de ocultación/recuperación comprende la clasificación de las tramas sucesivas de la señal acústica codificada como sin voz, transición sin voz, transición con voz, con voz o inicio, y esta clasificación se determina sobre la base de, al menos, una parte de los siguientes parámetros: un parámetro de correlación normalizado, un parámetro de inclinación espectral, un parámetro de relación señal/ruido, un parámetro de estabilidad del cabeceo, un parámetro de energía relativa de la trama y un parámetro de paso por cero.
[BIBLIOGRAFÍA DE LA TÉCNICA ANTERIOR]
[BIBLIOGRAFÍA DE PATENTES]
Bibliografía de patentes 1: US 2008/027717 Al.
Bibliografía de patentes 2: US 2005/154584 Al.
[BIBLIOGRAFÍA NO PATENTADA]
Bibliografía no patentada 1: Anthony Vetro, «MPEG Unified Speech and Audio Coding», Industry and Standards, IEEE MultiMedia, abril-junio, 2013.
Bibliografía no patentada 2: M. Bosi y R. E. Goldberg, «Introduction to Digital Audio Coding and Standards», Kluwer Academic Publishers, 2003.
[SUMARIO DE LA INVENCIÓN]
[PROBLEMAS A RESOLVER POR LA INVENCIÓN]
Mediante el procedimiento de codificación de la literatura no patentada 2, dado que es posible reducir la cantidad de código de un código de energía media realizando la codificación de longitud variable sobre un diferencial de energía media si las subidas y bajadas de la envolvente espectral de una señal acústica de entrada no son pronunciadas y si el grado de concentración de un espectro no es alto, es posible codificar la señal acústica de entrada de manera eficiente. Sin embargo, si las subidas y bajadas de una envolvente espectral de una señal acústica de entrada son pronunciadas y el grado de concentración de un espectro es alto, la cantidad de código de un código de energía media que se obtiene realizando una codificación de longitud variable sobre un diferencial de energía media aumenta.
Por otra parte, mediante el procedimiento de codificación de la bibliografía no patentada 1, dado que es posible codificar una envolvente espectral de manera eficiente utilizando coeficientes convertibles en coeficientes de predicción lineal, se puede codificar una señal acústica de entrada con mayor eficiencia que el procedimiento de codificación de la bibliografía no patentada 2 si las subidas y bajadas de una envolvente espectral de la señal acústica de entrada son pronunciadas y el nivel de concentración de un espectro es alto. No obstante, si las subidas y bajadas de una envolvente espectral de una señal acústica de entrada no son pronunciadas y el grado de concentración de un espectro no es alto, no es posible realizar la codificación con la misma eficiencia que el procedimiento de codificación de la bibliografía no patentada 2.
Como se ha descrito anteriormente, los procedimientos de codificación existentes a veces no pueden realizar una codificación eficiente en función de las características de una señal acústica de entrada.
Un objeto de la presente invención es proporcionar un procedimiento de codificación, un dispositivo, un programa y un medio de grabación que puedan realizar una codificación eficiente independientemente de las características de una señal acústica de entrada y obtener una señal acústica decodificada que suene menos artificial para un oyente.
[MEDIOS PARA RESOLVER LOS PROBLEMAS]
A tenor de los problemas anteriores, la presente invención proporciona procedimientos de codificación, dispositivos de codificación, además de los programas y medios de grabación legibles por ordenador correspondientes, con las características de las respectivas reivindicaciones independientes.
Un procedimiento de codificación según un ejemplo que no es reivindicado pero útil para comprender la invención es un procedimiento de codificación que codifica una señal acústica de entrada trama por trama de un segmento de tiempo predeterminado por un procesamiento de codificación seleccionado a partir de una pluralidad de tipos de procesamiento de codificación en el dominio de la frecuencia, incluyendo el procedimiento de codificación: una etapa de selección que permita una selección para seleccionar un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior como procesamiento de codificación de la trama actual si, al menos, una de las magnitudes de la energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama actual es menor que o igual a un valor umbral predeterminado.
Un procedimiento de codificación según otro ejemplo que no es reivindicado pero que es útil para comprender la invención es un procedimiento de codificación que codifica una señal acústica de entrada trama por trama de un segmento de tiempo predeterminado por un procesamiento de codificación seleccionado a partir de una pluralidad de tipos de procesamiento de codificación en el dominio de la frecuencia, incluyendo el procedimiento de codificación: una etapa de selección de hacer posible una selección para seleccionar el procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior como procesamiento de codificación de la trama actual si, al menos, una de las magnitudes de la energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama actual es menor que o igual a un valor umbral predeterminado; de lo contrario, se debe decidir si se hace posible una selección para seleccionar el procesamiento de codificación que sea diferente del procesamiento de codificación de la trama anterior como el procesamiento de codificación de la trama actual o seleccionar el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior como el procesamiento de codificación de la trama actual de conformidad con un estado en el que en las componentes de alta frecuencia de la señal acústica de entrada son dispersas.
Un procedimiento de codificación según otro ejemplo que no es reivindicado pero que es útil para comprender la invención es un procedimiento de codificación que codifica una señal acústica de entrada trama por trama de un segmento de tiempo predeterminado por un procesamiento de codificación seleccionado a partir de una pluralidad de tipos de procesamiento de codificación en el dominio de la frecuencia, incluyendo el procedimiento de codificación: una primera etapa de codificación de una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal acústica de entrada; una segunda etapa de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada, que implica la codificación de longitud variable que se realiza sobre un diferencial entre el valor logarítmico de la energía media de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía media de un dominio de la frecuencia adyacente; y una etapa de selección para hacer posible una selección para codificar la trama actual en la primera etapa de codificación si las subidas y bajadas de un espectro de la señal acústica de entrada de la trama actual son pronunciadas o el grado de concentración del espectro es alto y para hacer posible una selección para codificar la trama actual en la segunda etapa de codificación si las subidas y bajadas del espectro de la señal acústica de entrada de la trama actual son suaves o si el grado de concentración del espectro es bajo.
[EFECTOS DE LA INVENCIÓN]
Con una configuración que permite seleccionar cada uno de una pluralidad de tipos de procesamiento de codificación que realiza la codificación trama por trama en el dominio de la frecuencia, es posible obtener una señal acústica decodificada que suena menos artificial para un oyente.
[BREVE DESCRIPCIÓN DE LOS DIBUJOS]
La figura 1 es un diagrama de bloques que ilustra la configuración de un dispositivo de codificación.
La figura 2 es un diagrama de bloques que ilustra la configuración de un dispositivo de decodificación.
La figura 3 es un diagrama que representa un ejemplo del flujo de procesamiento de un procedimiento de codificación.
La figura 4 es un diagrama que representa un ejemplo del flujo de procesamiento de una unidad de selección 380.
La figura 5 es un diagrama que representa un ejemplo del flujo de procesamiento de una unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382.
La figura 6 es un diagrama que representa un ejemplo del flujo de procesamiento de una unidad de selección de conmutación 383 de una segunda realización.
La figura 7 es un diagrama que representa un ejemplo del flujo de procesamiento de una unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 de una tercera realización.
La figura 8 es un diagrama conceptual del primer procesamiento de codificación y segundo procesamiento de codificación.
[DESCRIPCIÓN DETALLADA DE LAS REALIZACIONES]
[Primera realización]
A continuación, se describirá una primera realización de la presente invención. La primera realización está configurada de tal manera que, en una configuración en la que una secuencia de coeficientes en el dominio de la frecuencia correspondiente a una señal acústica de entrada de cada trama está codificada por cada uno de una pluralidad de diferentes tipos de procesamiento de codificación que realiza el procesamiento de codificación en el dominio de la frecuencia, la conmutación del procesamiento de codificación se lleva a cabo únicamente cuando la energía de las componentes de alta frecuencia de la señal acústica de entrada y/o de una secuencia de coeficientes en el dominio de la frecuencia que corresponde a la señal acústica de entrada es baja. La energía de las componentes de alta frecuencia de una señal acústica de entrada es la magnitud misma de la energía de las componentes de alta frecuencia de una señal acústica de entrada, la magnitud de la energía de las componentes de alta frecuencia de una señal acústica de entrada, o similares.
<Dispositivo de codificación 300>
La configuración de un dispositivo de codificación 300 se representa en la figura 1. El dispositivo de codificación 300 incluye una unidad de conversión del dominio de la frecuencia 110, una unidad de selección 380, una primera unidad de codificación 101 y una segunda unidad de codificación 201. La primera unidad de codificación 101 incluye, por ejemplo, una unidad de codificación del análisis de predicción lineal 120, una unidad de generación de secuencias de coeficientes de la envolvente espectral 130, una unidad de normalización de la envolvente 140 y una unidad de codificación de coeficientes normalizados 150. La segunda unidad de codificación 201 incluye, por ejemplo, una unidad de división de regiones 220, una unidad de codificación de longitud variable diferencial de energía logarítmica media 240, y una unidad de codificación de coeficientes 250. Para el dispositivo de codificación 300, una señal digital acústica de voz (denominada en lo sucesivo señal acústica de entrada) en el dominio del tiempo es introducida trama a trama que es un segmento de tiempo predeterminado, y el siguiente procesamiento se realiza trama a trama. A continuación, el procesamiento específico de cada unidad se describirá en función de la premisa de que la señal de entrada de sonido actual es una f-ésima trama. Se supone que una señal acústica de entrada de la fésima trama es xf(n) (n = 1, ..., Nt). Aquí, Nt representa el número de muestras por trama.
A continuación, se describirá el funcionamiento del dispositivo de codificación 300. Mediante el dispositivo de codificación 300 se realiza el procesamiento en cada etapa de un procedimiento de codificación ilustrado en la figura 3.
<Unidad de conversión del dominio de la frecuencia 110>
La unidad de conversión del dominio de la frecuencia 110 convierte la señal acústica de entrada Xf(n) (n = 1, ..., Nt) en una secuencia de coeficientes en el dominio de la frecuencia, por ejemplo, una secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) en el punto N y produce la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) (etapa S1 10). Sin embargo, N es el número de muestras en el dominio de la frecuencia y es un entero positivo. La conversión al dominio de la frecuencia puede realizarse mediante un procedimiento de conversión conocido públicamente que no es MDCT.
Además, si las secuencias de coeficientes en el dominio de la frecuencia obtenidas en una pluralidad de grados de precisión y por una pluralidad de procedimientos son necesarias en la primera unidad de codificación 101, la segunda unidad de codificación 201 y la unidad de selección 380, es posible obtener secuencias de coeficientes en el dominio de la frecuencia en una pluralidad de grados de precisión y por una pluralidad de procedimientos en la unidad de conversión del dominio de la frecuencia 110. Por ejemplo, cuando la primera unidad de codificación 101 y la segunda unidad de codificación 201 utilizan una secuencia de coeficientes MDCT como secuencia de coeficientes en el dominio de la frecuencia y la unidad de selección 380 utiliza una serie del espectro de potencia como secuencia de coeficientes en el dominio de la frecuencia, la unidad de conversión del dominio de la frecuencia 110 simplemente ha de obtener una secuencia de coeficientes MDCT y una serie del espectro de potencia a partir de una señal acústica de entrada. Por otro lado, por ejemplo, cuando la primera unidad de codificación 101 y la segunda unidad de codificación 201 utilizan una secuencia de coeficiente MDCT como secuencia de coeficientes en el dominio de la frecuencia y la unidad de selección 380 utiliza una serie de energía de cada banda de frecuencias como secuencia de coeficientes en el dominio de la frecuencia, la unidad de conversión del dominio de la frecuencia 110 simplemente ha de obtener una secuencia de coeficientes MDCT y una serie de energía de cada banda de frecuencias a partir de una señal acústica de entrada.
Asimismo, por ejemplo, cuando la primera unidad de codificación 101 y la segunda unidad de codificación 201 utilizan una secuencia de coeficientes MDCT como secuencia de coeficientes en el dominio de la frecuencia, una unidad de toma de decisiones que permite la conmutación 381 de la unidad de selección 380 utiliza una serie de energía de cada banda de frecuencias como una secuencia de coeficientes en el dominio de la frecuencia, y una unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 de la unidad de selección 380 utiliza una serie del espectro de potencia como una secuencia de coeficientes en el dominio de frecuencia, la unidad de evaluación del dominio de la frecuencia 110 simplemente ha de obtener una secuencia de coeficientes MDCT, una serie de energía de cada banda de frecuencias, y una serie del espectro de potencia desde una señal acústica de entrada.
<Unidad de selección 380>
La unidad de selección 380 hace posible seleccionar el procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior como procesamiento de codificación de la trama actual si al menos una de las magnitudes de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama actual es menor que un valor umbral predeterminado (etapa S380).
En otras palabras, la unidad de selección 380 realiza una evaluación según la cual, si al menos la energía de las componentes de alta frecuencia de una señal acústica de entrada es baja, la unidad de selección 380 permite codificar una secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación diferente del procesamiento de codificación mediante el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior; en caso contrario, la unidad de selección 380 no permite codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación diferente del procesamiento de codificación mediante el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior. La unidad 380 de selección realiza entonces el control de la conmutación de manera que la secuencia de coeficientes en el dominio de la frecuencia de la trama actual se codifica según el resultado de la evaluación.
La unidad de selección 380 incluye, por ejemplo, la unidad de toma de decisiones que permite la conmutación 381, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382, una unidad de selección de conmutación 383 y una unidad de conmutación 384. A continuación, se describirá un ejemplo de la unidad de selección 380. La unidad de selección 380 realiza el procesamiento en cada etapa ilustrada en la figura 4.
<Unidad de toma de decisiones que permite la conmutación 381>
La unidad de toma de decisiones que permite la conmutación 381 determina que, si al menos una de las magnitudes de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama actual es menor que un valor umbral predeterminado, se permite la conmutación, es decir, determina que la unidad de toma de decisiones que permite la conmutación 381 hace posible codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación diferente del procesamiento de codificación a través del cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior; de lo contrario, la unidad de toma de decisiones que permite la conmutación 381 evaluará que no se permite la conmutación, es decir, la unidad de toma de decisiones que permite la conmutación 381 no permite que la secuencia de coeficientes en el dominio de la frecuencia de la trama actual se codifique mediante un procesamiento de codificación que es diferente del procesamiento de codificación por el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior; entonces, la unidad de toma de decisiones que permite la conmutación 381 produce el resultado de la evaluación (etapa S381).
A continuación, se describirá un ejemplo del funcionamiento de la unidad de toma de decisiones que permite la conmutación 381. Primero, se describirá un ejemplo en el que se utiliza la energía de alta frecuencia de una secuencia de coeficientes MDCT como la magnitud de la energía de las componentes de alta frecuencia de una señal acústica de entrada.
La unidad de toma de decisiones que permite la conmutación 381 obtiene primero la energía de alta frecuencia Ehf-1 de una secuencia de coeficientes MDCT XM(n) (n = 1, ..., N) de la trama anterior mediante la siguiente fórmula (1) y la frecuencia de energía Ehf de una secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual mediante la siguiente fórmula (2) (etapa S3811). En la fórmula (1) y la fórmula (2), M es un entero positivo predeterminado menor que N.
Figure imgf000006_0001
La unidad de toma de decisiones que permite la conmutación 381 determina que, si al menos una de las energías de alta frecuencia Ehf-1 de la trama anterior y la energía de alta frecuencia Ehf de la trama actual es inferior a un valor umbral predeterminado TH1, es decir, Ehf-1 < TH1 y/o Ehf < TH1, se permite la conmutación; de lo contrario, la unidad de toma de decisiones que permite la conmutación 381 evaluará que no se permite la conmutación; entonces, la unidad de toma de decisiones que permite la conmutación 381 emite información sobre si se permite o no la conmutación (etapa S3812).
Dicho sea de paso, la energía de alta frecuencia Ehf-1 de la trama anterior que se obtiene en la etapa S3811 de la trama actual es la misma que la energía de alta frecuencia Ehf de la trama actual obtenida en la etapa S3811 de la trama anterior. De este modo, al almacenar la energía de alta frecuencia calculada Ehf en la unidad de toma de decisiones que permite la conmutación 381 hasta, por lo menos, una trama inmediatamente posterior a la trama, no es necesario calcular la energía de alta frecuencia Ehf-1 de la trama anterior.
A continuación, se describe un ejemplo en el que se utiliza el cociente entre la energía de alta frecuencia y la energía total de una secuencia de coeficientes MDCT como la magnitud de la energía de las componentes de alta frecuencia de una señal acústica de entrada.
La unidad de toma de decisiones que permite la conmutación 381 obtiene en primer lugar el cociente Ehf-1 de energía de alta frecuencia con respecto a la energía total de una secuencia de coeficientes MDCT XM(n) (n = 1, ..., N) de la trama anterior por medio de la siguiente fórmula (1A), así como la razón Ehf de la energía de alta frecuencia con respecto a la energía total de una secuencia de coeficientes MDCT de la secuencia de coeficientes Xf(n) (n = 1, ..., N) de la trama actual, por medio de la siguiente fórmula (2A) (etapa S3811). En la fórmula (1A) y la fórmula (2A), M es un entero positivo predeterminado.
Figure imgf000007_0001
La unidad de toma de decisiones que permite la conmutación 381 determina que, si al menos uno del cociente Ehf.i de la energía de alta frecuencia con respecto a la energía total de la trama anterior y el cociente Ehf de la energía de alta frecuencia con respecto a la energía total de la trama actual es menor que los valores umbrales predeterminados de TH1, es decir, Ehf-1 < TH1 y/o Ehf < TH1, se permite realizar la conmutación; de lo contrario, la unidad de toma de decisiones que permite la conmutación 381 determinará que no se permite la conmutación; la unidad de toma de decisiones que permite la conmutación 381 emitirá la correspondiente información de autorización sobre si se permite o no la conmutación (etapa S3812).
Dicho sea de paso, el cociente Ehf-1 de energía de alta frecuencia con respecto a la energía total de la trama anterior que se obtiene en la etapa S3811 de la trama actual es el mismo que el cociente Ehf de energía de alta frecuencia con respecto a la energía total de la trama actual obtenido en la etapa S3811 de la trama anterior. De este modo, al almacenar el cociente Ehf de energía de alta frecuencia calculado con respecto a la energía total en la unidad de toma de decisiones que permite la conmutación 381 hasta al menos una trama inmediatamente posterior a la trama, no es necesario calcular el cociente Ehf-1 de energía de alta frecuencia con respecto a la energía total de la trama anterior.
Dicho sea de paso, en los dos ejemplos anteriores, se determina que la conmutación se permite si Ehf-1 < TH1 y/o Ehf < TH1; de lo contrario, se determina que no se permite la conmutación, pero se puede determinar que la conmutación se permite si Ehf-1 < TH1 y Ehf < TH1; de lo contrario, se puede determinar que no se permite la conmutación. En otras palabras, se puede determinar que, si tanto la magnitud de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama anterior como la magnitud de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama actual son menores que un valor umbral predeterminado, se permite la conmutación, es decir, se hace posible la codificación de la secuencia de coeficientes en el dominio de la frecuencia de la trama actual por medio de un proceso de codificación que es diferente del procesamiento de codificación por el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior; de lo contrario, se puede determinar que no se permite la conmutación, es decir, la codificación de la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación que es diferente del procesamiento de codificación a través del cual no se permite el procesamiento de la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior.
Además, en los ejemplos anteriores, la energía de alta frecuencia y el cociente entre la energía de alta frecuencia y la energía total se obtienen utilizando una secuencia de cocientes MDCT, pero la energía de alta frecuencia y el cociente entre la energía de alta frecuencia y la energía total pueden obtenerse mediante el uso de una serie del espectro de potencias o de una serie de energías de cada banda de frecuencias.
<Unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382>
La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina si una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la primera unidad de codificación 101 o el procesamiento de codificación de la segunda unidad de codificación 201 y produce el resultado de la evaluación (etapa S382).
A continuación, se describirá un ejemplo del funcionamiento de la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382. La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 realiza el procesamiento en cada etapa ilustrada en la figura 5. En el ejemplo siguiente, el procesamiento de codificación de la primera unidad de codificación 101 es el procesamiento de codificación que utiliza una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal, lo que se ilustra en la bibliografía no patentada 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es el procesamiento de codificación que incluye una codificación de longitud variable, que se realiza sobre un diferencial entre el valor logarítmico de la energía media de los coeficientes en cada dominio de la frecuencia obtenido mediante división y el valor logarítmico de la energía media de una frecuencia adyacente, lo cual se ilustra en la bibliografía no patentada 2.
En este ejemplo, si las subidas y bajadas de una envolvente espectral de una señal acústica de entrada son pronunciadas y/o el grado de concentración de la envolvente espectral es alto, se determina que una secuencia de coeficientes en el dominio de la frecuencia que corresponde a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de la codificación de la primera unidad de codificación 101; si las subidas y bajadas de una envolvente espectral de una señal acústica de entrada son suaves o/y el grado de concentración de la envolvente espectral es bajo, se determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de la codificación de la segunda unidad de codificación 201. Entonces, se produce el resultado de la evaluación.
Como procedimiento para estimar las subidas y bajadas y el grado de concentración de un espectro, se puede adoptar cualquier procedimiento; en el siguiente ejemplo, se describirá una configuración en la que se describirá la profundidad del valle de un espectro o la envolvente del mismo. En esta configuración, se determina que las subidas y bajadas de un espectro son suaves y que el grado de concentración del espectro es bajo si el valle del espectro o la envolvente del mismo es poco profundo, y que las subidas y bajadas de un espectro son pronunciadas y que el grado de concentración del espectro es alto si el valle del espectro o la envolvente del mismo es profundo. El valle poco profundo de un espectro o la envolvente del mismo se traduce en un ruido de fondo elevado. Asimismo, el valle profundo de un espectro o su envolvente se traduce en un ruido de fondo bajo.
La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 divide primero la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en secuencias de coeficientes parciales XSf(1)(n) (n = 1, ..., P), XSf(2)(n) (n = 1, ..., P), ..., XSf(Q)(n) (n = 1, ..., P), etc., cada una de las cuales tiene muestras de P (etapa S3821). P y Q son enteros positivos que satisfacen la relación P * Q = N. P puede ser 1. Además, aquí se adopta una configuración en la que una secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N), la cual es una secuencia de coeficientes en el dominio de la frecuencia que se va a someter a procesamiento de codificación en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 también se utiliza en la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 pero, en el caso de una secuencia de coeficientes en el dominio de la frecuencia obtenida por conversión en el dominio de la frecuencia con un grado de precisión diferente y mediante un procedimiento diferente de los adoptados para la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N), por ejemplo, puede utilizarse una serie del espectro de potencias como objeto sobre el que el procesamiento debe realizarse mediante la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382.
La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 obtiene entonces una serie AVExS(q) (q = 1, ..., Q) formada por el valor medio de la potencia o el valor logarítmico de la misma de cada una de las secuencias de coeficientes parciales XSf(l)(n) (n = 1, ..., P), XSf(2)(n) (n = 1, ..., P), ..., XSf(Q)(n) (n = 1, ..., P) (etapa S3822). El valor medio de la potencia es AVEXS(q), que se obtiene mediante la fórmula (3). Además, el valor logarítmico del valor medio de la potencia es AVExS(q), que se obtiene mediante la fórmula (3A).
Figure imgf000008_0001
La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 entonces determina, para cada elemento de las series AVExs(I), AVExs(2), ..., AVExs(Q) formado por el valor medio de la potencia o el valor logarítmico del valor medio de la potencia, independientemente de que el elemento sea menor que ambos de los dos elementos adyacentes y que obtenga la cantidad de elementos determinados menores que ambos de los elementos adyacentes (etapa S3823). Es decir, que la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 obtiene el número Vally de q que satisface la fórmula (4).
AVExs(q) - min( A VExs(q-1), AVExs(q+1)) < 0 (4)
La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 obtiene entonces el valor medio Ev de Vally AVEXS(q) correspondiente a q que satisface la fórmula (4), es decir, el valor medio Ev de las regiones parciales del valle (etapa S3824). Si AVEXS(q) es el valor medio de la potencia, el valor de EV obtenido en la etapa S3824 es el valor medio de la potencia de las regiones parciales en una parte del valle. Si AVEXS(q) es el valor logarítmico del valor medio de la potencia, el valor de Ev obtenido en la etapa S3824 es el valor medio del valor logarítmico del valor medio de la potencia de las regiones parciales de una parte del valle. Por otro lado, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 obtiene el valor medio de la potencia o el valor logarítmico del valor medio de la potencia de todas las regiones parciales (etapa S3825). El valor medio de la potencia de todas las regiones parciales es el valor medio de la potencia de la secuencia de coeficientes MCDT Xf(n) (n = 1, ..., N) y es E se obtiene mediante la fórmula (11). El valor logarítmico del valor medio de la potencia de todas las regiones parciales es el valor logarítmico del valor medio de la potencia de la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) y es E se obtiene mediante la fórmula (11A).
Figure imgf000009_0001
La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina entonces que, puesto que se estima que el valle de un espectro es poco profundo y que el espectro es un espectro cuya envolvente espectral tiene subidas y bajadas suaves o cuyo grado de concentración es bajo si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es menor que o igual a un valor umbral TH2 predeterminado, una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201. En cambio, dado que se estima que el valle de un espectro es profundo y que el espectro es un espectro cuya envolvente espectral tiene pronunciadas subidas y bajadas o cuyo grado de concentración es alto si la diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor que el valor umbral TH2, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la primera unidad de codificación 101. La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 emite información sobre qué procesamiento de codificación es adecuado (etapa S3826). La información sobre el procesamiento de codificación adecuado también se denomina información de idoneidad.
Por otra parte, en la etapa S3821, se pueden adoptar diferentes números de muestra para diferentes secuencias de coeficientes parciales. Por ejemplo, la secuencia de coeficientes MCDT Xf(n) (n = 1, ..., N) de la trama actual puede dividirse en secuencias de coeficientes parciales XSf(l)(n) (n = 1, ..., Pi), XSf(2)(n) (n = 1, ..., P2), ..., XSf(Q)(n) (n = 1, ..., Pq). P1, P2>..., Pq son enteros positivos que satisfacen P1+ P2 +... Pq = N. Asimismo, es preferible que P1 P2 , ..., PQ satisfaga P1 < P2 < ... < PQ. Además, Q es un entero positivo.
<Unidad de selección de conmutación 383>
En base a la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 y la información sobre la cual es adecuado el procesamiento de codificación obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382, la unidad de selección de conmutación 383 selecciona si codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 y produce un código de conmutación que es un código mediante el cual se puede identificar el procesamiento de codificación seleccionado (etapa S383). El código de conmutación de salida se introduce en el dispositivo de decodificación 400. Aquí, si no se permite la conmutación, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior, independientemente del procesamiento de codificación para el que sea adecuada la trama actual. Además, si se permite la conmutación, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante el procesamiento de codificación para el cual la trama actual es adecuada independientemente del procesamiento de codificación de la trama anterior. Sin embargo, puede darse el caso de que, incluso cuando se permite la conmutación, la unidad de selección de conmutación 383 seleccione codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante el mismo proceso de codificación que el proceso de codificación de la trama anterior, y no mediante el proceso de codificación para el cual la trama actual es adecuada.
A continuación, se describirá un ejemplo del funcionamiento de la unidad de selección de conmutación 383. En el ejemplo siguiente, el procesamiento de codificación de la primera unidad de codificación 101 es el procesamiento de codificación que utiliza una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal, lo que se ilustra en la bibliografía no patentada 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es el procesamiento de codificación que incluye una codificación de longitud variable, que se realiza o sobre un diferencial entre el valor logarítmico de la energía media de los coeficientes en cada dominio de la frecuencia obtenido mediante división y el valor logarítmico de la energía media de una frecuencia adyacente, lo cual se ilustra en la bibliografía no patentada 2.
Si la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 indica que no se permite la conmutación y/o la información sobre la que es adecuado el procesamiento de la codificación obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 indica que el mismo procesamiento de codificación que se realiza en la secuencia de coeficientes Xf--i(n) (n = 1, ..., N) de la trama anterior, la unidad de selección de conmutación 383 selecciona el mismo procesamiento de codificación que el procesamiento de codificación realizado en la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior como el procesamiento de codificación que se realiza en la secuencia de coeficientes MDCT de la secuencia de coeficientes de Xf(n) (n = 1, ..., N) de la trama actual.
Es decir, si la secuencia de coeficientes Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información sobre si se permite o no la conmutación que se obtuvo mediante unidad de toma de decisiones que permite la conmutación 381 indica que no se permite la conmutación, la unidad de selección de conmutación 383 seleccionará codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual, también en la primera unidad de codificación 101. Asimismo, si la secuencia de coeficientes Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información sobre la cual es adecuado el procesamiento de codificación que se obtuvo mediante la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la primera unidad de codificación 101, la unidad de selección de conmutación 383 también selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual, también en la primera unidad de codificación 101.
Además, si la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información sobre si se permite la conmutación que se obtuvo en la unidad de toma de decisiones que permite la conmutación 381 indica que no se permite la conmutación, la unidad de selección de conmutación 383 seleccionará codificar la secuencia de coeficientes Xf(n) (n = 1, ..., N) de la trama actual, también en la segunda unidad de codificación 201. Además, si la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información sobre la cual es adecuado el procesamiento de codificación que se obtuvo mediante la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 también selecciona codificar la secuencia de coeficientes de la MDCT Xf(n) (n = 1, ..., N) de la trama actual, también en la segunda unidad de codificación 201.
Si la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 indica que se permite la conmutación, y la información sobre la que es adecuado el procesamiento de codificación que se obtuvo por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 pertinente indica un procesamiento de codificación que es diferente del procesamiento de codificación realizado en la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior, la unidad de selección de conmutación 383 selecciona el procesamiento de codificación que es diferente del procesamiento de codificación realizado en la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior como procesamiento de codificación que se realiza en la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual. Es decir, si la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 indica que se permite la conmutación y la información sobre qué procesamiento de codificación es adecuado obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 indica que el procedimiento de codificación de la segunda unidad 201, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en la segunda unidad de codificación 201. Además, si la secuencia de coeficientes MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 indica que se permite la conmutación y la información sobre qué procesamiento de codificación es adecuado obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 pertinente indica el procesamiento de codificación de la primera unidad de codificación 101, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en la primera unidad de codificación 101.
<Unidad de conmutación 384>
La unidad de conmutación 384 realiza el control para introducir la salida de la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) desde la unidad de conversión del dominio de la frecuencia 110 a la primera unidad de codificación 101 o a la segunda unidad de codificación 201 de tal forma que la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual se codifica mediante el proceso de codificación seleccionado por la unidad de selección de conmutación 383 (etapa S384). Por otra parte, si la señal acústica de entrada Xf(n) (n = 1, ..., Nt) de la trama actual también es necesaria para codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual, la unidad de conmutación 384 también introduce la señal acústica de entrada xf(n) (n = 1, ..., Nt) de la trama actual en la primera unidad de codificación 101 y/o en la segunda unidad de codificación 201.
Por ejemplo, si el procesamiento de codificación de la primera unidad de codificación 101 es un procesamiento de codificación que utiliza una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal, como se ilustra en la bibliografía no patentada 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es un procesamiento de codificación que implica una codificación de longitud variable que se realiza sobre un diferencial entre la energía media de los coeficientes de cada dominio de la frecuencia obtenida por división y la energía media de un dominio de la frecuencia adyacente, lo cual se ilustra en la bibliografía no patentada 2, dado que la señal acústica de entrada xf(n) (n = 1, ..., Nt) de la trama actual es necesaria únicamente en la primera unidad de codificación 101, la unidad de conmutación 384 también introduce la señal acústica de entrada Xf(n) (n = 1, ..., Nt) de la trama actual en la primera unidad de codificación 101 al introducir la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) en la primera unidad de codificación 101.
<Primera unidad de codificación 101, segunda unidad de codificación 201>
Tanto la primera unidad de codificación 101 como la segunda unidad de codificación 201 realizan el procesamiento de codificación que codifica una secuencia de coeficientes en el dominio de la frecuencia, pero la primera unidad de codificación 101 y la segunda unidad de codificación 201 realizan diferentes tipos de procesamiento de codificación. Es decir, la primera unidad de codificación 101 codifica una secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la segunda unidad de codificación 201 y produce un primer código que se obtiene de esta forma (etapa S101). Además, la segunda unidad de codificación 201 codifica una secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la primera unidad de codificación 101 y produce un segundo código que se obtiene de esta forma (etapa S201). Por ejemplo, la primera unidad de codificación 101 realiza el procesamiento de codificación utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal, y la segunda unidad de codificación 201 realiza el procesamiento de codificación utilizando la energía media de los coeficientes en cada dominio de la frecuencia obtenido por división.
A continuación, se describirá un ejemplo del funcionamiento de la primera unidad de codificación 101 y la segunda unidad de codificación 201. En el siguiente ejemplo, el procesamiento de codificación de la primera unidad de codificación 101 es el procesamiento de codificación utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal, lo que se ilustra en la bibliografía no patentada 1,
y el procesamiento de codificación de la segunda unidad de codificación 201 es el procesamiento de codificación que implica la codificación de longitud variable que se realiza sobre un diferencial entre la energía media de los coeficientes en cada dominio de la frecuencia obtenido por división y la energía media de un dominio de frecuencia adyacente, lo cual se ilustra en la bibliografía no patentada 2.
En este ejemplo, como se ilustra en la parte izquierda de la figura 8, el primer procesamiento de codificación por la primera unidad de codificación 101 expresa una forma de envolvente espectral en el dominio de la frecuencia mediante coeficientes que son convertibles en coeficientes de predicción lineal. Por otra parte, como se ilustra en el lado derecho de la figura 8, el segundo procesamiento de codificación por la segunda unidad de codificación 201 expresa una forma de envolvente por una banda de factor de escala (división de una secuencia de coeficientes del dominio de la frecuencia en una pluralidad de regiones). Se puede decir que el segundo procesamiento de codificación es muy eficiente si el valor medio cambia suavemente debido a que el segundo procesamiento de codificación usa codificación de longitud variable del valor diferencial de la altura media de cada región.
Sobre la base del resultado de la decisión o selección realizada por la unidad de selección 380, se realiza uno de los procedimientos de la primera unidad de codificación 101 y el procedimiento de la segunda unidad de codificación 201, que son una pluralidad de tipos de procedimiento de codificación en el dominio de la frecuencia.
<Primera unidad de codificación 101>
La primera unidad de codificación 101 incluye la unidad de codificación del análisis de predicción lineal 120, la unidad de generación de secuencias de coeficientes de la envolvente espectral 130, la unidad de normalización de la envolvente 140, y la unidad de codificación de coeficientes normalizados 150. Se introducen en la primera unidad de codificación 101 la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) y la señal acústica de entrada xf(n) (n = 1, ..., Nt) de la trama actual, y se produce un primer código que contiene un código de coeficiente de predicción lineal CLf y un código de coeficiente normalizado CNf. El primer código de salida se introduce en el dispositivo de decodificación 400. Dicho sea de paso, la primera unidad 101 de codificación es la que se obtiene eliminando, del procesamiento de codificación descrito en la biografía no patentada 1, una parte que convierte una señal acústica de entrada en una secuencia de coeficientes en el dominio de la frecuencia. Es decir, el procesamiento de codificación que se realiza en la unidad 110 de conversión del dominio de la frecuencia y la segunda unidad 101 de codificación es similar al procesamiento de codificación descrito en la biografía no patentada 1.
<Unidad de codificación del análisis de predicción lineal 120>
La unidad de codificación del análisis de predicción lineal 120 obtiene coeficientes que son convertibles en coeficientes de predicción lineal mediante la realización de un análisis de predicción lineal en la señal acústica de entrada xf(n) (n = 1, ..., Nt), y obtiene un código de coeficientes de predicción lineal CLf y coeficientes que son convertibles en coeficientes de predicción lineal cuantificados correspondientes al código de coeficiente de predicción lineal CLf codificando los coeficientes que son convertibles en coeficientes de predicción lineal y produce el código de coeficientes de predicción lineal CLf y los coeficientes (etapa S120). Los coeficientes convertibles en coeficientes de predicción lineal son los mismos coeficientes de predicción lineal, coeficientes PARCOR (coeficientes de autocorrelación parcial), parámetros LSP, o similares.
<Unidad de generación de secuencias de coeficientes de la envolvente espectral 130>
La unidad de generación de secuencias de coeficientes de la envolvente espectral 130 obtiene una secuencia de coeficientes de la envolvente espectral de potencias Wf(n) (n = 1, ..., N) correspondiente a los coeficientes que son convertibles en coeficientes de predicción lineal cuantificados obtenidos por la unidad de codificación del análisis de predicción lineal 120, y produce una secuencia de coeficientes de la envolvente espectral de potencias Wf(n) (n = 1, ..., N) (etapa S130).
<Unidad de normalización de la envolvente 140>
La unidad de normalización de la envolvente 140 normaliza cada coeficiente Xf(n) (n = 1, ..., N) de la secuencia de coeficientes MDCT obtenida por la unidad de conversión del dominio de la frecuencia 110 utilizando la secuencia de coeficientes de la envolvente espectral de potencias Wf(n) (n = 1, ..., N), que se obtiene a través de la unidad de generación de secuencias de coeficientes de la envolvente espectral 130 y produce una secuencia de coeficientes MDCT normalizados XNf(n) (n = 1, ..., N) (etapa S140). Es decir, la unidad de normalización de la envolvente 140 obtiene, como la secuencia de coeficientes MDCT normalizados XNf(n) (n = 1, ..., N), una serie de valores obtenidos dividiendo cada coeficiente de la secuencia de coeficientes MDCT X-i(n) (n = 1, ..., N) entre un coeficiente correspondiente contenido en la secuencia de coeficientes de la envolvente espectral de potencias Wf(n) (n = 1, ..., N).
<Unidad de codificación de coeficientes normalizados 150>
La unidad de codificación de coeficientes normalizados 150 obtiene el código de coeficientes normalizados CNf codificando la secuencia de coeficientes MDCT normalizados XNf(n) (n = 1, ..., N) obtenida por la unidad de normalización de la envolvente 140 (etapa S150).
<Segunda unidad de codificación 201>
Además, la segunda unidad de codificación 201 incluye la unidad de división de regiones 220, la unidad de codificación de longitud variable diferencial de energía logarítmica media 240 y la unidad de codificación de coeficientes 250. En la segunda unidad
de codificación 201 se introduce la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual, y de la misma se emite un segundo código que contiene un código de energía media CAf y un código de coeficientes CDf. El segundo código de salida se introduce en el dispositivo de decodificación 400. Dicho sea de paso, la segunda unidad de codificación 201 es lo que se obtiene eliminando, del procesamiento de codificación descrito en la bibliografía no patentada 2, una parte que convierte una señal acústica de entrada en una secuencia de coeficientes en el dominio de la frecuencia. Es decir, el procesamiento de codificación que se realiza en la unidad de conversión del dominio de la frecuencia 110 y la segunda unidad de codificación 201 es similar al procesamiento de codificación descrito en la bibliografía no patentada 2.
<Unidad de división de regiones 220>
La unidad de división de regiones 220 divide la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) obtenida por la unidad de conversión del dominio de la frecuencia 110 en una pluralidad de regiones parciales de tal modo que cuanto más bajas sean las frecuencias de las regiones parciales, menor es el número de muestras de las regiones parciales; y cuanto más altas sean las frecuencias de las regiones parciales, mayor será el número de muestras de las regiones parciales (etapa S220). Si se supone que el número de regiones parciales es R y se supone que el número de muestras contenidas en las regiones parciales es Si .... Sr, cada coeficiente Xf(n) (n = 1,....N) de la secuencia de coeficientes MDCT se divide en regiones parciales de la muestra a la frecuencia más baja en el orden siguiente: XBf(l)(n) (n = 1, ..., S1), XBf(2)(n) (n = 1, ..., S2), ..., XBi(R)(n) (n = 1, ..., Sk). R y S1, ..., Sr son enteros positivos. Se supone que S1, ..., SR satisfacen la relación S1 < S2 < ... < Sr. XBf(l)(n) (n = 1, ..., S,), XBf(2)(n) (n = 1, ..., S2), ..., XBf(R)(n) (n = 1, ..., Sr) se refiere a una secuencia de coeficientes de regiones parciales.
<Unidad de codificación de longitud variable diferencial de energía logarítmica media 240>
La unidad de codificación de longitud variable diferencial de energía logarítmica media 240 obtiene, para cada región parcial obtenida por la unidad de división de regiones 220, la energía media de los coeficientes contenidos en la región parcial, cuantifica cada energía media de la región parcial en los ejes logarítmicos, realiza la codificación de longitud variable en una diferencia en el valor de cuantificación de la energía media en los ejes logarítmicos entre las regiones parciales adyacentes, y obtiene un código de energía media CAf (etapa S240).
La unidad de codificación de longitud variable diferencial de energía logarítmica media 240 obtiene primero la energía media EXB(r) (r = 1, ..., R) de cada región parcial r (r = 1, ..., R) mediante la fórmula (5) (etapa S2401).
Figure imgf000013_0001
La unidad de codificación de longitud variable diferencial de energía logarítmica media 240 realiza entonces una cuantificación escalar de la energía media ExB(r) (r = 1, ..., R) en el dominio logarítmico para cada región parcial y obtiene un valor de cuantificación Q(log(ExB(r))) (r = 1, ..., R) de la energía media en el dominio logarítmico (etapa S2402). La unidad de codificación de longitud variable diferencial de energía logarítmica media 240 obtiene, para cada región parcial, una diferencia DiffExB(r) entre el valor de cuantificación Q(log(ExB(r))) de la energía media en el dominio logarítmico y el valor de cuantificación Q(log(ExB(r- 1))) de la energía media en el dominio logarítmico, la energía media de los coeficientes contenidos en una región parcial adyacente (etapa S2403). Sin embargo, cuando r = 1, el valor de cuantificación escalar Q(log(ExB(r))) del valor logarítmico de la energía media Exb(1) se utiliza como DiffEXB(l). DiffEXB(r) (r= 1, ..., R) se conoce como un diferencial de energía logarítmica media. Es decir, DiffEXB(r) (r = 1, ..., R) se obtiene mediante la fórmula (6). Sin embargo, se supone que Q () es una función de cuantificación escalar y se supone que es una función que genera un valor entero el cual se obtiene al redondear una fracción decimal de un valor obtenido al normalizar (dividir) una entrada por un valor predeterminado.
DiffEXB(r) = Q(log(EXB(r))) - Q(log(EXB(r-l))) (r 2)
DiffEXB(l) = Q(log(EXB(l))) (6)
La unidad de codificación de longitud variable diferencial de energía logarítmica media 240 obtiene un código de energía media Caff mediante la realización de la codificación de longitud variable sobre el diferencial de energía logarítmica media DiffExB(r) (r= 1, ..., R) (etapa S2404). Dicho sea de paso, dado que la frecuencia estadística de aparición es alta cuando el valor absoluto del diferencial de energía logarítmica media DiffExB(r) es bajo, el código de longitud variable se determina con antelación de manera que la cantidad de código se reduce con respecto a la de un caso en el que el valor absoluto es alto. Es decir, cuando las fluctuaciones de la energía logarítmica media en cada región son pequeñas, es decir, las subidas y bajadas de una envolvente espectral son suaves, se observa una tendencia para ser capaz de acortar la longitud del código del código de la energía media CAf si el grado de concentración de la envolvente espectral es bajo.
<Unidad de codificación de coeficientes 250>
La unidad de codificación del coeficientes 250 obtiene un código de coeficientes CDf realizando, por ejemplo, una cuantificación escalar de cada coeficiente de la secuencia de coeficientes de la región parcial XBf(l)(n) (n = 1, ..., S1), XBf(2)(n) (n = 1, ..., S2), ..., XBf(R)(n) (n = 1, ..., Sr) obtenida por la unidad de división de regiones 220 mediante la utilización del valor de cuantificación Q(log(ExB(r))) (r= 1, ..., R) de la energía media en el dominio logarítmico obtenido por la unidad de codificación de longitud variable diferencial de energía logarítmica media 240 (etapa S250). La amplitud del paso de la cuantificación y el número de bit de cuantificación que se utilizan para esta cuantificación escalar se determinan a partir del valor de cuantificación Q(ExB(r)) (r = 1, ..., R) de la energía media para cada secuencia de coeficientes de la región parcial XBf(l)(n) (n = 1, ..., S1), XBf(2)(n) (n = 1, ..., S2), ..., XBf(R)(n) (n = 1, ..., Sr) obtenida por la unidad de división de regiones 220. Dicho sea de paso, el valor de cuantificación Q(EXB(r)) (r = 1, ..., R) de la energía media se obtiene convirtiendo el valor de cuantificación Q(log(EXB(r))) (r = 1, ..., R) de la energía media en el dominio logarítmico en un valor en el dominio lineal mediante la fórmula (7).
Figure imgf000014_0001
La unidad de codificación de coeficientes 250 distribuye en primer lugar el número de bit dado como la cantidad de código del código del coeficiente CDf a los coeficientes de cada secuencia de coeficientes de regiones parciales teniendo en cuenta el valor de cuantificación Q(log(EXB(r))) ( r=1, ..., R) de la energía media en el dominio logarítmico correspondiente a cada región y un valor de una diferencia entre ese valor y el valor logarítmico de la energía a un nivel espectral audiblemente indiscernible que se estima mediante la frecuencia (etapa S2501).
La unidad codificadora de coeficientes 250 determina entonces la amplitud de paso de la cuantificación escalar de cada coeficiente de cada secuencia de coeficientes de cada región parcial a partir del valor de cuantificación Q(EXB(r)) (r = 1, ..., R) de la energía media de cada región parcial y el número de bit distribuido (etapa S2502).
La unidad de codificación de coeficientes 250 obtiene entonces un código de coeficientes CDf cuantificando cada coeficiente de cada secuencia de coeficientes de las regiones parciales por la amplitud de paso así determinado y el número de bit y realizando la codificación de longitud variable en el valor entero de cada coeficiente cuantificado (etapa S2503).
<Dispositivo de decodificación 400>
La configuración del dispositivo de decodificación 400 se muestra en la figura 2.
El dispositivo de decodificación 400 incluye una unidad de conmutación 480, una primera unidad de decodificación 401 y una segunda unidad de decodificación 501. La primera unidad de decodificación 401 incluye, por ejemplo, una unidad de decodificación de predicción lineal 420, una unidad de generación de secuencias de coeficientes de la envolvente espectral 430, una unidad de decodificación de coeficientes normalizados 450 y una unidad de normalización inversa de la envolvente 440. La segunda unidad de decodificación 501 incluye, por ejemplo, una unidad de decodificación de longitud variable diferencial de energía logarítmica media 540 y una unidad de decodificación de coeficientes 550. En el dispositivo de descodificación 400, se introduce un código que contiene un código de conmutación y un código de entrada trama a trama que es un segmento de tiempo predeterminado. En el caso de la trama codificada en la primera unidad de codificación 101, el código de entrada contiene el código del coeficiente de predicción lineal CLf y el código del coeficiente normalizado CNf; en el caso de la trama codificada en la segunda unidad de codificación 201, el código de entrada contiene el código de la energía media CAf y el código del coeficiente CDf. A continuación, el procesamiento específico de cada unidad se describirá partiendo de la premisa de que la trama que se está procesando actualmente es una trama f-ésima.
A continuación se describe el funcionamiento del dispositivo de descodificación 400.
<Unidad de conmutación 480>
La unidad de conmutación 480 selecciona si decodificar el código de entrada de la trama actual en la primera unidad de decodificación 401 o en la segunda unidad de decodificación 501 en función del código de conmutación de entrada, y realiza el control de tal forma que introduce el código de entrada en la primera unidad de decodificación 401 o en la segunda unidad de decodificación 501 de tal forma que se realiza el proceso de decodificación seleccionado (etapa S480).
Específicamente, si el código de conmutación de entrada es un código que especifica el procesamiento de codificación de la primera unidad de codificación 101, es decir, un código que especifica el procesamiento de codificación utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal, la unidad de conmutación 480 realiza el control de tal manera que introduce el código de entrada en la primera unidad de decodificación 401 que realiza el procesamiento de decodificación correspondiente al procesamiento de codificación de la primera unidad de codificación 101. Además, si el código de conmutación de entrada es un código que especifica el procesamiento de codificación de la segunda unidad de codificación 201, es decir, un código que especifica el procesamiento de codificación que implica la codificación de longitud variable que se realiza sobre un diferencial entre la energía media de los coeficientes en cada dominio de la frecuencia obtenida por división y la energía media de un dominio de la frecuencia adyacente, la unidad de conmutación 480 realiza el control de tal manera que se introduce el código de entrada en la segunda unidad de descodificación 501, que realiza el procesamiento de decodificación correspondiente al procesamiento de codificación de la segunda unidad de codificación 201.
<Primera unidad de decodificación 401>
La primera unidad de decodificación 401 incluye la unidad de decodificación de predicción lineal 420, la unidad de generación de secuencia de coeficientes de la envolvente espectral 430, la unidad de decodificación de coeficientes normalizados 450, y la unidad de normalización inversa de la envolvente 440. En la primera unidad de decodificación 401, se introducen el código del coeficiente de predicción lineal CLf y el código de coeficientes normalizados CNf de la trama actual, y se emite una secuencia de coeficientes Xf(n) (n = 1, ..., N) desde el dominio de la frecuencia. <Unidad de decodificación de predicción lineal 420>
La unidad de decodificación de predicción lineal* 420 obtiene coeficientes que son convertibles en coeficientes de predicción lineal decodificados decodificando el código de coeficiente de predicción lineal CLf contenido en el código de entrada. Los coeficientes que son convertibles en coeficientes de predicción lineal decodificados son los mismos que los coeficientes que son convertibles en los coeficientes de predicción lineal cuantificados obtenidos por la unidad de codificación 120 del análisis de predicción lineal del dispositivo de codificación 300. Además, el proceso de decodificación que realiza la unidad de decodificación de predicción lineal 420 corresponde al proceso de codificación que realiza la unidad de codificación de análisis de predicción lineal 120 del dispositivo de codificación 300. Dicho sea de paso, los coeficientes que son convertibles en coeficientes de predicción lineal son los mismos coeficientes de predicción lineal, coeficientes PARCOR (coeficientes de autocorrelación parcial), parámetros LSP, o similares.
<Unidad de generación de secuencias de coeficientes de la envolvente espectral 430>
La unidad de generación de secuencias de coeficientes de la envolvente espectral 430 obtiene una secuencia de coeficientes de la envolvente espectral de potencia Wf(n) (n = 1, ..., N) correspondiente a los coeficientes obtenidos por la unidad de decodificación de predicción lineal 420, que son convertibles en coeficientes de predicción lineal decodificados, y que genera la secuencia de coeficientes de envolvente de la envolvente espectral de potencia Wf(n) (n = 1, ..., N). Sin embargo, N es un número de muestra en el dominio de la frecuencia y es un número entero positivo.
<Unidad de decodificación de coeficientes normalizados 450>
La unidad de decodificación de coeficientes normalizados 450 obtiene una secuencia de coeficientes MDCT decodificados AXNf(n) (n = 1, ..., N) al decodificar el código de coeficientes normalizados de entrada CNf (etapa S450). Aquí, el proceso de decodificación que se realiza mediante la unidad de decodificación de coeficientes normalizados 450 corresponde al procesamiento de codificación que se realiza mediante la unidad de codificación de coeficientes normalizados 150 del dispositivo de codificación 300. Es decir, si el procesamiento de conversión en el dominio de la frecuencia que no es MDCT se realiza en el dispositivo de codificación 300, AXNf(n) (n = 1, ..., N) es una secuencia de coeficientes en el dominio de la frecuencia, la cual no es MDCT, que corresponde al procesamiento de conversión en el dominio de la frecuencia que se lleva a cabo en el dispositivo de codificación 300. Dicho sea de paso, aunque la secuencia del coeficientes MDCT normalizados y decodificados AXNf(n) (n = 1, ..., N) corresponde a la entrada de la secuencia de coeficientes MDCT normalizados XNf(n) (n = 1, ..., N) en la unidad de codificación de coeficientes normalizados 150 del dispositivo de codificación 300, dado que cada coeficiente contiene un error de cuantización, se utiliza AXNf(n) obtenido al añadir «a» a XNf(n).
<Unidad de normalización inversa de la envolvente 440>
La unidad de normalización inversa de la envolvente 440 realiza la normalización inversa en cada coeficiente AXNf(n) (n = 1, ..., N) de la secuencia de coeficientes MDCT normalizados y decodificados obtenida por la unidad de decodificación de coeficientes normalizados 450 mediante el uso de la secuencia de coeficientes de la envolvente espectral de potencia Wf(n) (n = 1, ..., N) obtenida en la unidad de generación de secuencias de coeficientes de la envolvente espectral 430, y produce una secuencia de coeficientes MDCT decodificados AXNf(n) (n = 1, ..., N) (etapa S440). Es decir, la unidad de normalización inversa de la envolvente 440 obtiene una serie formada por valores obtenidos al multiplicar los correspondientes coeficientes de la secuencia de coeficientes MDCT normalizados y decodificados XNf(n) (n = 1, ..., N) y los coeficientes de la secuencia de coeficientes de la envolvente espectral de potencias Wf(n) (n = 1, ..., N) como la secuencia de coeficientes MDCT decodificada AXf(n) (n = 1, ..., N).
<Segunda unidad de decodificación 501>
La segunda unidad de decodificación 501 incluye la unidad de decodificación de longitud variable diferencial de energía logarítmica media 540 y la unidad de decodificación de coeficientes 550. En la segunda unidad de descodificación 501 se introducen el código de energía promedio CAf y el código de coeficientes CDf de la trama actual, desde donde se emite una secuencia de coeficientes Xf(n) (n = 1, ..., N) en el dominio de la frecuencia.
<Unidad de decodificación de longitud variable diferencial de energía logarítmica media 540>
La unidad de decodificación de longitud variable diferencial de energía logarítmica media 540 obtiene una energía promedio decodificada Q(ExB(r)) (r= 1, ..., R) en una región parcial mediante la decodificación del código de energía media de entrada CAf (etapa S540). Dicho sea de paso, dado que la energía media decodificada es la misma que el valor de cuantificación de la energía media obtenida en la unidad de codificación de coeficientes 250 del dispositivo de codificación 300, se utiliza el mismo símbolo Q(ExB(r)).
La unidad de decodificación de longitud variable diferencial de energía logarítmica media 540 obtiene primero una diferencia de energía DiffExB(r) (r=1, ..., R) en el dominio logarítimico de cada región parcial mediante la decodificación del código de energía promedio CAf (etapa S5401). Aquí, el proceso de decodificación que se realiza por la unidad de decodificación de longitud variable diferencial de energía logarítmica media 540 corresponde al proceso de codificación que se realiza por la unidad de codificación de longitud variable diferencial de energía logarítmica media 240 del dispositivo de codificación 300. Dicho sea de paso, puesto que una diferencia de energía en el dominio logarítmico de cada región parcial es igual a una diferencia de energía en el dominio logarítmico de cada región parcial que se obtiene en la unidad de codificación de longitud variable diferencial de energía logarítmica media 240 del dispositivo de codificación 300, se utiliza el mismo símbolo DiffEXB(r).
La unidad de decodificación de longitud variable diferencial de energía logarítmica media 540 obtiene entonces, para cada región parcial, un valor decodificado Q(log(EXB(r))) de la energía media en el dominio logarítmico mediante la suma de la diferencia de la energía DiffEXB(r) (r = 1, ..., R) en el dominio logarítmico a un valor decodificado Q(log(EXB(r-l))) de la energía media en el dominio logarítmico de la región parcial adyacente (etapa S5402). Dicho sea de paso, dado que el valor decodificado de la energía promedio en el dominio logarítmico es el mismo que el valor de cuantización de la energía promedio en el dominio logarítmico que se obtiene en la unidad de codificación de longitud variable diferencial de energía logarítmica media 240 del dispositivo de codificación 300, se utiliza el mismo símbolo Q(log(EXB(r))).
Q(log(EXB(l» ) = D i f f f i x B ( l )
Q(log(EXB(r))) = DifffiXB(r) Q(log(ExB(r-l))) (r > 2) (8)
La unidad de decodificación de longitud variable diferencial de la energía logarítmica media 540 obtiene entonces lo que tiene el valor decodificado Q(log(EXB(r - 1))) (r = 1, ..., R) de la energía promedio en el dominio logarítmico como un valor en el dominio lineal como energía promedio decodificada Q(EXB(r)) (r = 1, ..., R) (etapa S5403).
<Unidad de decodificación de coeficientes 550>
La unidad de decodificación de coeficientes 550 obtiene una secuencia de coeficientes decodificados AXf(n) (n = 1, ..., N) decodificando el código del coeficiente CDf mediante el uso de la energía promedio decodificada Q(Exb(0) (r= 1, ..., R) obtenida en la unidad de decodificación de longitud variable diferencial de energía logarítmica media 540 (etapa S550). Aquí, el proceso de decodificación que realiza la unidad de decodificación de coeficientes 550 corresponde al proceso de codificación que realiza la unidad de codificación de coeficientes 250 del dispositivo de codificación 300. Dado que el código del coeficiente de entrada CDf es el que se obtuvo al realizar la codificación de longitud variable en cada coeficiente de cada secuencia de coeficientes de las regiones parciales en la unidad de codificación de coeficientes 250 del dispositivo de codificación 300, la longitud de código de una parte del código del código del coeficiente CDf correspondiente a cada coeficiente puede reconstituirse automáticamente. Además, la amplitud de paso de cuantificación de cada región se obtiene a partir de la energía media decodificada Q(ExB(r)) obtenida en la unidad de decodificación de longitud variable diferencial de energía logarítmica media 540. Como resultado, es posible obtener la secuencia de coeficientes MDCT decodificados AXf(n) (n = 1, ..., N) en el dominio de la frecuencia a partir del código del coeficiente CDf.
<Unidad de conversión del dominio del tiempo 410>
El dominio del tiempo, la unidad de conversión 410 obtiene una señal acústica decodificada AXf(n) (n = 1, ..., Nt) al convertir una secuencia de coeficientes MDCT decodificados AXf(n) (n = 1, ..., N) en el punto N en el dominio del tiempo, y produce la señal acústica decodificada Axf(.n) (n = 1, ..., Nt) (etapa S410). Sin embargo, Nt es un número de muestra en el dominio del tiempo y es un entero positivo. Si la conversión en el dominio de la frecuencia que no es MDCT se realiza en la unidad de conversión del dominio de la frecuencia 110 del dispositivo de codificación 300, es necesario simplemente realizar el procesamiento de la conversión en el dominio del tiempo correspondiente a ese procesamiento de conversión.
Según la primera realización, dado que la conmutación del procesamiento de codificación y decodificación únicamente puede realizarse cuando la energía de alta frecuencia de una señal acústica de entrada es baja, incluso cuando se instala una pluralidad de tipos de procesamiento de codificación y decodificación que difieren en las características de cuantificación de las componentes de alta frecuencia, es posible obtener una señal acústica decodificada que suene menos artificial para el oyente.
Además, según la primera realización, dado que es posible seleccionar el procesamiento de codificación adecuado para una señal acústica de entrada, sin realizar codificación real, desde el procesamiento de codificación utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal y el procesamiento de codificación utilizando la energía promedio de los coeficientes en cada dominio de la frecuencia obtenida por división, es posible realizar el procesamiento de codificación apropiado para una señal acústica de entrada con una pequeña cantidad de procesado aritmético.
Adicionalmente, según la primera realización, dado que es posible realizar la codificación mediante la selección del procesamiento de codificación a partir del procesamiento de codificación utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal y el procesamiento de codificación utilizando la energía promedio de los coeficientes en cada dominio de la frecuencia obtenida por división, con independencia de si las subidas y bajadas de un espectro de una señal acústica de entrada son pronunciadas y de si el grado de concentración del espectro es alto, se puede realizar el procesado de codificación eficiente con independencia de las características de la señal acústica de entrada.
[Segunda realización]
En la primera realización, una secuencia de coeficientes en el dominio de la frecuencia de la trama actual siempre se codifica mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior cuando la magnitud de la energía de las componentes de alta frecuencia de una señal acústica de entrada es alta; una segunda realización permite que una secuencia de coeficientes en el dominio de la frecuencia de la trama actual se codifique mediante el procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior en función del estado en que las componentes de alta frecuencia de la señal acústica de entrada son dispersas incluso aunque la magnitud de la energía de las componentes de alta frecuencia de la señal acústica de entrada sea alta.
Un dispositivo de codificación de la segunda realización hace posible seleccionar el procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior como el procesamiento de codificación de la trama actual si la energía de las componentes de alta frecuencia de una señal acústica de entrada es baja; de lo contrario, según el estado en el que las componentes de alta frecuencia de la señal acústica de entrada son dispersas, el dispositivo de codificación selecciona si hace posible seleccionar el procesamiento de codificación que es diferente al proceso de codificación de la trama anterior como el proceso de codificación de la trama actual o selecciona el mismo procesamiento de codificación como el procesamiento de codificación de la trama anterior como procedimiento de codificación de la trama actual.
La configuración del dispositivo de codificación de la segunda realización es la figura 1, que es la misma que la de la primera realización. Un dispositivo de codificación 300 de la segunda realización es el mismo que el dispositivo de codificación 300 de la primera realización excepto que el procesamiento de la unidad de toma de decisiones que permite la conmutación 381 y la unidad de selección de conmutación 383 en la unidad de selección 380 es diferente de aquel del dispositivo de codificación 300 de la primera realización. La configuración de un dispositivo de decodificación de la segunda realización es la figura 2, que es la misma que la primera realización, y el procesamiento de cada unidad es también la misma que la del dispositivo de decodificación de la primera realización. A continuación se describen la unidad de toma de decisiones que permite la conmutación 381 y la unidad de selección de la conmutación 383 en la unidad de selección 380, que realizan un procesamiento diferente del procesamiento que se realiza en el dispositivo de codificación 300 de la primera realización.
<Unidad de toma de decisiones que permite la conmutación 381>
La unidad de toma de decisiones que permite la conmutación 381 determina que, si al menos una de las magnitudes de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama actual es menor que un valor umbral predeterminado, se permite la conmutación, es decir, determina que la unidad de toma de decisiones que permite la conmutación 381 hace posible codificar una secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación que es diferente del procesamiento de codificación mediante el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior, y produce el resultado de la evaluación (etapa S381). De lo contrario, la unidad de toma de decisiones que permite la conmutación 381 no realiza ninguna evaluación como si se permite la conmutación o no se permite la conmutación, y proporciona información que indica que cualquier evaluación como si se permite la conmutación o no se permite la conmutación no se ha realizado como resultado de la evaluación, o bien no produce ningún resultado de la evaluación. Se puede utilizar energía de alta frecuencia o el cociente de energía de alta frecuencia con respecto a la energía total como la magnitud de la energía de las componentes de alta frecuencia de una señal acústica de entrada, como es el caso de la primera realización.
<Unidad de selección de conmutación 383>
La unidad de selección de conmutación 383 selecciona si la secuencia de coeficientes en el dominio de la frecuencia de la trama actual se codifica en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 a partir de la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381, la información sobre cual el procesamiento de codificación es adecuado obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382, y el estado, el cual se obtiene a partir de la señal acústica de entrada, que indica si las componentes de alta frecuencia de la señal acústica de entrada son o no dispersas, y que produce un código de conmutación que es un código por el cual puede identificarse el proceso de procesamiento de codificación seleccionado (etapa S383B).
El código de conmutación de salida se introduce en el dispositivo de decodificación 400.
Si la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 indica que se permite la conmutación, es decir, la energía de las componentes de alta frecuencia de la señal acústica de entrada es baja, la unidad de selección de conmutación 383 realiza el mismo procesamiento que la unidad de selección de conmutación 383 de la primera realización. Si la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 indica que no se ha realizado ninguna evaluación como, por ejemplo, si se permite la conmutación o no se permite la conmutación, o si el resultado de la evaluación no se introduce en la unidad de toma de decisiones que permite la conmutación 381, es decir, si la energía de las componentes de alta frecuencia de la señal acústica de entrada es alta, la unidad de selección de conmutación 383 selecciona si permite o no la codificación de la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación diferente del procesamiento de codificación de la trama anterior basado en el estado, que se obtiene a partir de la señal acústica de entrada, que indica si las componentes de alta frecuencia de la señal acústica de entrada son o no dispersas.
A continuación, del funcionamiento de la unidad de selección de conmutación 383, se describirá una diferencia del funcionamiento de la unidad de selección de conmutación 383 de la primera realización, es decir, un ejemplo del funcionamiento de la unidad de selección de conmutación 383 cuando la energía de las componentes de alta frecuencia de la señal de sonido de entrada es alta. En el ejemplo siguiente, como es el caso de la primera realización, el procesamiento de codificación de la primera unidad de codificación 101 es el procesamiento de codificación utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal, lo que se ilustra en la bibliografía no patentada 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es el procesamiento de codificación que implica la codificación de longitud variable que se realiza sobre un diferencial entre el valor logarítmico de la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía promedio de un dominio de la frecuencia adyacente, lo que se ilustra en la bibliografía no patentada 2. La unidad de selección de conmutación 383 realiza el procesamiento de las etapas S3831B a S3836B de la figura 6, por ejemplo.
La unidad de selección de conmutación 383 divide primero la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en secuencias de coeficientes parciales XSf(1)(n) (n = 1, ..., P), XSf(2)(n) (n = 1, ..., P), ..., XSf(Q)(n) (n = 1, ..., P), cada una de las cuales tiene muestras P (etapa S3831B). P y Q son enteros positivos que satisfacen la relación P * Q = N. P puede ser 1. Además, aquí se adopta una configuración en la cual la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N), que es una secuencia de coeficientes en el dominio de la frecuencia que debe ser sometida a procesamiento de codificación en la primera unidad de codificación 101 o en la segunda unidad de codificación 201, también se utiliza en la unidad de selección de conmutación 383, pero si se trata de una secuencia de coeficientes en el dominio de la frecuencia obtenida por conversión en el dominio de la frecuencia con un grado de precisión diferente y con un procedimiento diferente de los adoptados para la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N), por ejemplo, puede utilizarse una serie espectral de potencias como objeto sobre el que debe realizarse el procesamiento por la unidad de selección de conmutación 383.
La unidad de selección de conmutación 383 obtiene entonces una serie AVExs(q) (q = 1, ..., Q) formada por el valor logarítmico del valor medio de la potencia de cada una de las secuencias de coeficientes parciales XSf(l)(n) (n = 1, ..., P), XSf(2)(n) (n = 1, ..., P), ..., XSf(Q)(n) (n = 1, ..., P) (etapa S3832B). El valor logarítmico del valor medio de la potencia de cada secuencia de coeficientes parciales es AVEXS(q), que se obtiene mediante la fórmula (3A).
Además, la unidad de selección de conmutación 383 obtiene el valor logarítmico del valor medio de la potencia de la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) (etapa S3833B). El valor logarítmico del valor medio de la potencia de la secuencia de coeficientes MDCT es AVETotal que se obtiene mediante la fórmula (9).
Figure imgf000018_0001
La unidad de selección de conmutación 383 obtiene entonces el número de AVExS(q) en el que q satisface la fórmula (10) dentro del intervalo de QLow (1 < QLow) a QHigh (QLow ^ QHigh ^ Q), es decir, el intervalo predeterminado de una o más regiones parciales ubicadas en el lado de la alta frecuencia, en otras palabras, el número de regiones en la cresta (etapa S3834B). ^ y A son constantes positivas.
AVExs(q) > (X'AVETotal X (10)
La unidad de selección de conmutación 383 determina que las componentes de alta frecuencia de la señal acústica de entrada de la trama actual son dispersas si el número de regiones en la cresta es menor o igual que un valor umbral TH3, y que las componentes de alta frecuencia de la señal acústica de entrada de la trama actual no son dispersas si el número de regiones en la cresta excede el valor umbral TH3 (etapa S3835B). Aquí, el valor umbral TH3 es un valor que se establece mediante una regla predeterminada de manera que, si las componentes de alta frecuencia de la señal acústica de entrada de una trama anterior cercana a la trama actual se encuentran dispersas, el valor se convierte en un valor mayor que un valor que se define cuando las componentes de alta frecuencia de la señal acústica de entrada de la trama anterior cerca de la trama actual no se encuentran dispersas. Por ejemplo, si las componentes de alta frecuencia de la señal acústica de entrada de la trama anterior se encuentran dispersas, se utiliza TH31 predeterminado como valor umbral TH3; si las componentes de alta frecuencia de la señal acústica de entrada de la trama anterior cercana a la trama actual no se encuentran dispersas, se utiliza TH3_2 predeterminado, que es una valor inferior a TH3_1, como valor umbral TH3. Aquí, la trama anterior cercana a la trama actual es, por ejemplo, la trama anterior o la trama anterior a la trama anterior. El resultado de la evaluación sobre si las componentes de alta frecuencia de la señal acústica de entrada de la trama actual son o no dispersas se almacena en la unidad de selección de conmutación 383 hasta el final de, al menos, dos tramas posteriores de la trama actual.
La unidad de selección de conmutación 383 selecciona entonces codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 sobre la base del procesamiento de codificación de la trama anterior, el resultado de la evaluación de la trama actual y la trama anterior que se sitúa cerca de la trama actual, en cuanto a si las componentes de alta frecuencia de la señal de sonido de entrada son dispersas o no (etapa S3836B). Es decir, la unidad de selección de conmutación 383 selecciona si permite o no la codificación de la secuencia de coeficientes en el dominio de frecuencia de la trama actual mediante un procesamiento de codificación diferente del procesamiento de codificación de la trama anterior.
Por ejemplo, cuando la secuencia de coeficientes Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101, si las componentes de alta frecuencia de la trama actual no se encuentran dispersas y las componentes de alta frecuencia se encuentran dispersas en, al menos, una de las tramas anteriores y la trama anterior a la trama anterior, la unidad de selección 383 hace posible seleccionar codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en la segunda unidad de codificación 201; de lo contrario, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en la primera unidad de codificación 101. Es decir, cuando se codificó la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior en la primera unidad de codificación 101, si las componentes de alta frecuencia de la trama actual no se encuentran dispersas y las componentes de alta frecuencia se encuentran dispersas en, al menos, una de las tramas anterior y en la trama anterior a la trama anterior, la unidad de selección de conmutación 383 permite codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación diferente del procesamiento de codificación de la trama anterior; en caso contrario, la unidad de selección de conmutación 383 no permite codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior.
Por otro lado, cuando se codificó la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior en la segunda unidad de codificación 201, si (1) las componentes de alta frecuencia de la trama actual se encuentran dispersas y las componentes de alta frecuencia de la trama anterior no se encuentran dispersas o (2) las componentes de alta frecuencia de la trama actual se encuentran dispersas, las componentes de alta frecuencia de la trama anterior se encuentran dispersas y las componentes de alta frecuencia de la trama anterior no se encuentran dispersas, la unidad de selección de conmutación 383 hace posible seleccionar codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en la primera unidad de codificación 101; de lo contrario, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en la segunda unidad de codificación 201. Es decir, cuando se codificó la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior en la segunda unidad de codificación 201, si (1) las componentes de alta frecuencia de la trama actual se encuentran dispersas y las componentes de alta frecuencia de la trama anterior no se encuentran dispersas o (2) las componentes de alta frecuencia de la trama actual se encuentran dispersas, las componentes de alta frecuencia de la trama anterior se encuentran dispersas, y las componentes de alta frecuencia de la trama anterior no se encuentran dispersas, la unidad de selección de conmutación 383 permite que la secuencia de coeficientes en el dominio de la frecuencia de la trama actual se codifique mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior; en caso contrario, la unidad de selección de conmutación 383 no permite codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación diferente del procesamiento de codificación de la trama anterior.
Dicho sea de paso, si la unidad de selección de conmutación 383 permite codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior, la unidad de selección de conmutación 383 selecciona el procesamiento de codificación de la secuencia de coeficientes en el dominio de la frecuencia de la trama actual basándose en la información sobre la cual el procesamiento de la codificación resulta adecuado obtenida a través de una unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 correspondiente. Por ejemplo, si la unidad de selección de conmutación 383 permite codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación diferente del procesamiento de codificación de la trama anterior, incluso cuando la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201, si la información sobre la que es adecuado el procesamiento de codificación obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 correspondiente indica el procesamiento de codificación de la primera unidad de codificación 101, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en la primera unidad de codificación 101. Además, si la unidad de selección de conmutación 383 permite codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación diferente del procesamiento de codificación de la trama anterior, incluso cuando la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101, si la información sobre la que es adecuado el procesamiento de codificación obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 correspondiente indica el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 selecciona codificar la secuencia del coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en la segunda unidad de codificación 201.
Dicho sea de paso, incluso cuando la unidad de selección de conmutación 383 permite que la secuencia de coeficientes en el dominio de frecuencia de la presente trama se codifique mediante un proceso de codificación que es diferente del procesamiento de codificación de la trama anterior, si se determina que la secuencia de coeficientes en el dominio de la frecuencia de la trama actual tiene que codificarse por el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior sobre la base de la otra información obtenida por un medio que no está representado en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual puede codificarse por el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior.
Asimismo, en la etapa S3831B, se pueden adoptar diferentes números de muestra para diferentes secuencias de coeficientes parciales. Por ejemplo, la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual puede dividirse en Q secuencias de coeficientes parciales XSf(l)(n) (n = 1, ..., P1), XSf(2)(n) (n = 1, ..., P2), ..., XSf(Q)(n) (n = 1, ..., Pq). P1, P2, ..., Pq son enteros positivos que satisfacen P1 + P2 + ... Pq = N. Asimismo, es preferible que P1, P2, ..., Pq satisfaga P1 < P2 á ... < Pq. Además, Q es un entero positivo.
Asimismo, si la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 realizó el mismo procesamiento que el procesamiento de las etapas S383 IB, S3832B y S3833B, la unidad de selección de conmutación 383 puede utilizar el resultado del procesamiento realizado por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 correspondiente sin realizar la etapa S383 IB, la etapa S3832B y la etapa S3833B.
[Tercera realización]
En la primera realización y la segunda realización, el procesamiento de codificación para el que es adecuada la trama actual se determina utilizando un valor umbral; en una tercera realización, se hace una valoración utilizando dos valores umbral.
La configuración de un dispositivo de codificación de la tercera realización es la figura 1, que es la misma que la primera realización. Un dispositivo de codificación 300 de la tercera realización es igual que el dispositivo de codificación 300 de la primera realización o la segunda realización, excepto que el procesamiento de la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 y la unidad de selección de conmutación 383 en la unidad de selección 380 es diferente de la del dispositivo de codificación 300 de la primera realización o la segunda realización. La configuración de un dispositivo de decodificación de la tercera realización es la figura 2, que es la misma que la primera realización, y el procesamiento de cada unidad es también la misma que la del dispositivo de decodificación de la primera realización. A continuación, se describen la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 pertinente y la unidad de selección de la conmutación 383 en la unidad de selección 380, que realizan un procesamiento diferente del procesamiento que se realiza en el dispositivo de codificación 300 de la primera realización.
<Unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382>
La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 realiza el procesamiento en cada etapa ilustrada en la figura 7. La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina si la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la primera unidad de codificación 101 o para el procesamiento de codificación de la segunda unidad de codificación 201, en otras palabras, qué procesamiento de codificación se puede realizar, y produce el resultado de la evaluación (etapa S382A).
A continuación, se describirá un ejemplo del funcionamiento de la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382. La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 realiza el procesamiento en cada etapa ilustrada en la figura 7. En el ejemplo siguiente, el procesamiento de codificación de la primera unidad de codificación 101 es el procesamiento de codificación que utiliza una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal, lo que se ilustra en la bibliografía no patentada 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es el procesamiento de codificación que incluye una codificación de longitud variable, que se realiza sobre un diferencial entre el valor logarítmico de la energía media de los coeficientes en cada dominio de la frecuencia obtenido mediante división y el valor logarítmico de la energía media de una frecuencia adyacente, lo cual se ilustra en la bibliografía no patentada 2.
En este ejemplo, si las subidas y bajadas de una envolvente espectral de una señal acústica de entrada son pronunciadas y/o el grado de concentración de la envolvente espectral es alto, la unidad de procesamiento de codificación adecuada 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la primera unidad de codificación 101; si las subidas y bajadas de la envolvente espectral de la señal acústica de entrada son suaves y/o el grado de concentración de la envolvente espectral es bajo, la unidad de procesamiento de codificación adecuada 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es apta para el procesamiento de la codificación de la segunda unidad de codificación 201; si las subidas y bajadas de la envolvente espectral de la señal acústica de entrada son moderadas y/o el grado de concentración de la envolvente espectral es medio, la unidad de procesamiento de codificación adecuada 382 determina que, o bien el procesamiento de codificación de la primera unidad de codificación 101, o bien el procesamiento de codificación de la segunda unidad de codificación 201, pueden llevarse a cabo en la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual, es decir, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201. La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 produce el resultado de la evaluación.
Si los subidas y bajadas de la envolvente espectral de la señal acústica de entrada son moderadas y/o el grado de concentración de la envolvente espectral es medio, como se describirá más adelante, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior. Es decir, en la unidad de selección de conmutación 383, el procesamiento de codificación de la trama actual se selecciona de tal modo que la conmutación del procesamiento de codificación entre la trama anterior y la trama actual no transmite al oyente una fuerte sensación de artificialidad.
De este modo, un caso donde las subidas y bajadas de la envolvente espectral de la señal acústica de entrada son moderadas y/o el grado de concentración de la envolvente espectral es medio puede incluir no solo un caso en el que el procesamiento de codificación de la primera unidad de codificación 101 o el procesamiento de codificación de la segunda unidad de codificación 201 puede realizarse en la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual y un caso en el que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual sea apta para tanto el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201, pero también un caso en el que es difícil saber para cuál de los procesos de codificación de la primera unidad de codificación 101 y el proceso de codificación de la segunda unidad de codificación 201 es adecuada la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual y un caso en el que existe la posibilidad de que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual no sea adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201. Es decir, la evaluación antes descrita como «adecuada tanto para el procesamiento de codificación de la primera unidad codificadora 101 como para el procesamiento de codificación de la segunda unidad codificadora 201» puede traducirse en una evaluación en la que «es imposible evaluar la idoneidad para el procesamiento de codificación de la primera unidad de codificación 101, así como la idoneidad para el procesamiento de codificación de la segunda unidad de codificación 201».
Como procedimiento para estimar las subidas y bajadas y el grado de concentración de un espectro, se puede adoptar cualquier procedimiento, y una configuración en la cual se describirá la profundidad del valle de una envolvente espectral. En esta configuración, si el valle de una envolvente espectral es poco profundo, se determina que las subidas y bajadas de un espectro son suaves y el grado de concentración del espectro es bajo; si el valle de una envolvente espectral es profundo, se determina que las subidas y bajadas de un espectro son pronunciadas y que el grado de concentración del espectro es alto; si la profundidad del valle de la envolvente espectral es media, se determina que las subidas y bajadas de un espectro son moderadas y que el grado de concentración del espectro es medio.
La unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 realiza las etapas S3821 a S3825 que son las mismas que aquellas de la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 de la primera realización y la etapa S3826A que es diferente de la etapa correspondiente de la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 de la primera realización. A continuación, se describirá una diferencia con respecto a la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382.
Después de la etapa S3825, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 realiza el siguiente procesamiento de la evaluación utilizando los valores umbral TH2 1 y TH2J2 y la salida de la información de idoneidad que se describirá más adelante (etapa S3826A).
Si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio EV de AVEXS(q) de las regiones parciales del valle es menor que un valor umbral predeterminado TH2_1, dado que se estima que el valle de un espectro es poco profundo y que el espectro es un espectro cuya envolvente espectral tiene subidas y bajadas suaves, o cuyo grado de concentración es bajo, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es idónea para el procesamiento de codificación de la segunda unidad de codificación 201.
Además, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor que un valor umbral predeterminado TH2_2, el cual es un valor mayor que el valor umbral TH2_1, dado que se estima que el valle de un espectro es profundo y que el espectro es un espectro cuya envolvente espectral tiene subidas y bajadas pronunciadas o cuyo grado de concentración es alto, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la primera unidad de codificación 101.
Por otro lado, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor que o igual al valor umbral TH2_1 pero menor que o igual al valor umbral TH2_2, dado que se estima que la profundidad del valle del espectro es media y que el espectro es un espectro cuya envolvente espectral tiene subidas y bajadas moderadas o cuyo grado de concentración es medio, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 puede realizar el procesamiento de codificación de la primera unidad de codificación 101 o el procesamiento de codificación de la segunda unidad de codificación 201 en la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual. Es decir, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201.
Entonces, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 genera información sobre la idoneidad, que es información sobre el procesamiento de codificación adecuado. La información de idoneidad es el resultado de la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 y puede decirse que la información de idoneidad es la información sobre cuál del procedimiento de codificación de la primera unidad de codificación 101 y el procedimiento de codificación de la segunda unidad de codificación 201 es adecuado o la información sobre si tanto el procedimiento de codificación de la primera unidad de codificación 101 y el procedimiento de codificación de la segunda unidad de codificación 201 son adecuados o no.
Dicho sea de paso, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 puede proporcionar información que indique que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es idónea para el procesamiento de codificación de la primera unidad de codificación 101 o información que indique que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es idónea para el procesamiento de codificación de la segunda unidad de codificación 201 únicamente si se determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es idónea para cualquier uno de los procesos de codificación de la primera unidad de codificación 101 y de la segunda unidad de codificación 201 y que realiza cualquier uno del procesamiento de codificación de la primera unidad de codificación 101 y el procesamiento de codificación de la segunda unidad de codificación 201 en la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual.
Es decir, puede adoptarse una configuración en la que no se produzca el resultado de la evaluación si se determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para tanto el procesamiento de codificación de la primera unidad de codificación 101 y para el procesamiento de codificación de la segunda unidad de codificación 201.
<Unidad de selección de conmutación 383>
En función de la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 y la información, que se obtuvo por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382, sobre cuál del procesamiento de codificación de la primera unidad de codificación 101 y el procesamiento de codificación de la segunda unidad de codificación 201 es idóneo o la información sobre si tanto el procesamiento de la primera unidad de codificación 101 y el procesamiento de codificación de la segunda unidad de codificación 201 son adecuados, es decir, la información (información de idoneidad) sobre el procesamiento de codificación adecuado, la unidad de selección de conmutación 383 selecciona si codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 y produce un código de conmutación que es un código mediante el cual puede identificarse el procesamiento de codificación seleccionado (etapa S383A). El código de conmutación de salida se introduce en el dispositivo de decodificación 400. Aquí, si no se permite la conmutación, independientemente del procesamiento de codificación para el cual la trama actual es adecuada, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior. Además, si se permite la conmutación y la trama actual es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior. Además, si se permite la conmutación y la trama actual es adecuada para cualquier uno del procesamiento de codificación de la primera unidad de codificación 101 y el procesamiento de codificación de la segunda unidad de codificación 201, independientemente del procesamiento de codificación de la trama anterior, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación para el cual la trama actual es adecuada.
A continuación, se describirá un ejemplo del funcionamiento de la unidad de selección de conmutación 383. En el ejemplo siguiente, el procesamiento de codificación de la primera unidad de codificación 101 es el procesamiento de codificación que utiliza una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal, lo que se ilustra en la bibliografía no patentada 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es el procesamiento de codificación que incluye una codificación de longitud variable que se realiza sobre un diferencial entre el valor logarítmico de la energía media de los coeficientes en cada dominio de la frecuencia obtenido mediante división y el valor logarítmico de la energía media de una frecuencia adyacente, lo cual se ilustra en la bibliografía no patentada 2.
Si la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de toma de decisiones que permite la conmutación 381 indica que no se permite la conmutación y/o la información (información de idoneidad) sobre qué procesamiento de codificación es adecuado obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 es adecuado indica el mismo procesamiento de codificación que el procesamiento de codificación realizado sobre la secuencia de coeficientes MDCT
Xf--i(n) (n = 1, ..., N) de la trama anterior o indica que tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201 son adecuados, la unidad de selección de conmutación 383 selecciona el mismo procesamiento de codificación que el procesamiento de codificación realizado en la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior como el procesamiento de codificación que se realiza en la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual.
Es decir, si la secuencia de coeficientes de la T Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de toma de decisiones que permite la conmutación 381 indica que no se permite la conmutación, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual también en la primera unidad de codificación 101. Asimismo, si la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información (información de idoneidad) sobre la que es adecuado el procesamiento de codificación que se obtuvo mediante la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la primera unidad de codificación 101, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual también en la primera unidad de codificación 101. Además, si la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información (información de idoneidad) sobre la que es adecuado el procesamiento de codificación que se obtuvo mediante la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 indica que tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201 son adecuados, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual también en la primera unidad de codificación 101.
Además, si la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información sobre si se permite la conmutación que se obtuvo en la unidad de toma de decisiones que permite la conmutación 381 indica que no se permite la conmutación, la unidad de selección de conmutación 383 seleccionará codificar la secuencia de coeficientes Xf(n) (n = 1, ..., N) de la trama actual, también en la segunda unidad de codificación 201. Además, si la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información (información de idoneidad) sobre la cual es adecuado el procesamiento de codificación que se obtuvo mediante la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de la MDCT Xf(n) (n = 1, ..., N) de la trama actual, también en la segunda unidad de codificación 201. Asimismo, si la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información (información de idoneidad) sobre la que es adecuado el procesamiento de codificación que se obtuvo mediante la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 indica que tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201 son adecuados, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual también en la segunda unidad de codificación 201.
Si la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 indica que se permite la conmutación, y la información (información de idoneidad) sobre la que es adecuado el procesamiento de codificación que se obtuvo por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 indica un procesamiento de codificación que es diferente del procesamiento de codificación realizado en la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior, la unidad de selección de conmutación 383 selecciona el procesamiento de codificación que es diferente del procesamiento de codificación realizado en la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior como el procesamiento de codificación que se realiza en la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual. Es decir, si la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101, la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 indica que se permite la conmutación, y la información (información de idoneidad) sobre qué procesamiento de codificación es apropiado obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 indica que el procedimiento de codificación de la segunda unidad 201, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en la segunda unidad de codificación 201. Además, si la secuencia de coeficientes MDCT Xf--i(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201, la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 indica que se permite la conmutación, y la información (información de idoneidad) sobre qué procesamiento de codificación es adecuado obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 pertinente indica el procesamiento de codificación de la primera unidad de codificación 101, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes MDCT Xf(n) (n = 1, ..., N) de la trama actual en la primera unidad de codificación 101.
Dicho sea de paso, si la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 está configurada para no producir el resultado de la evaluación si se determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 simplemente tiene que realizar, si no se introduce la información sobre el procesamiento de codificación adecuado al mismo, el procesamiento que se realiza cuando la información antes descrita (información de idoneidad) sobre la cual el procesamiento de codificación es adecuado indica que tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201 son adecuados.
[Primera modificación]
Para determinar si la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal, lo cual se ilustra en la bibliografía no patentada 1, o el procesamiento de codificación que incluye la codificación de longitud variable que se lleva a cabo sobre un diferencial entre el valor logarítmico del valor promedio de la energía de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía promedio en un dominio de la frecuencia adyacente, lo cual se ilustra en la bibliografía no patentada 2, se puede realizar una valoración que incluya no solo la magnitud de las subidas y bajadas de una envolvente espectral de una señal acústica de entrada y el grado de concentración de la envolvente espectral, sino también el resto de la información.
Por ejemplo, incluso cuando la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama anterior fue codificada por la primera unidad de codificación 101, la unidad de toma de decisiones que permite la conmutación 381 determina que se permite la conmutación, y la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de la codificación de la segunda unidad de codificación 201, si se determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual ha de codificarse mediante el procesamiento de codificación de la primera unidad de codificación 101 sobre la base de la información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual puede codificarse mediante la primera unidad de codificación 101. Es decir, el dispositivo de codificación 300 simplemente ha de configurarse para hacer posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual por la segunda unidad de codificación 201 si la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama anterior fue codificada por la primera unidad de codificación 101, la unidad de toma de decisiones que permite la conmutación 381 determina que se permite la conmutación, y la unidad de toma de decisiones sobre el procesamiento de codificación idóneo 382 determina que la secuencia de coeficientes en el dominio de la frecuencia de entrada de señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201.
Además, a la inversa, incluso cuando la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama anterior fue codificada por la segunda unidad de codificación 201, la unidad de toma de decisiones que permite la conmutación 381 determina que se permite la conmutación, y la unidad de toma de decisiones sobre el procesamiento de codificación idóneo 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de la codificación de la primera unidad de codificación 101, si se determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual ha de codificarse mediante el procesamiento de codificación de la segunda unidad de codificación 201 sobre la base de la información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual puede codificarse mediante la segunda unidad de codificación 201. Es decir, el dispositivo de codificación 300 simplemente ha de configurarse para hacer posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual por la primera unidad de codificación 101 si la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama anterior fue codificada por la segunda unidad de codificación 201, la unidad de toma de decisiones que permite la conmutación 381 determina que se permite la conmutación, y la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia de entrada de señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la primera unidad de codificación 101.
Por otra parte, por ejemplo, en el dispositivo de codificación 300 de la tercera realización, incluso cuando la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama anterior fue codificada por la primera unidad de codificación 101 y la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201, si la unidad de toma de decisiones que permite la conmutación 381 determina que se permite la conmutación y se determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual ha de codificarse mediante el procesamiento de codificación de la segunda unidad de codificación 201 sobre la base de las demás informaciones obtenidas por un medio que no figura en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia que corresponde a la señal acústica de entrada de la trama actual puede codificarse por la segunda unidad de codificación 201.
Por otra parte, a la inversa, incluso cuando la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama anterior fue codificada por la segunda unidad de codificación 201 y la unidad de procesamiento de la codificación adecuada la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para tanto el procesamiento de la codificación de la primera unidad de codificación 101 como para el procesamiento de la codificación de la segunda unidad de codificación 201, si la unidad de toma de decisiones que permite la conmutación 381 determina que se permite la conmutación y se determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual ha de codificarse mediante el procesamiento de la codificación de la primera unidad de codificación 101, sobre la base de las demás informaciones obtenidas por un medio que no está representado en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual puede codificarse mediante la primera unidad de codificación 101.
Es decir, el dispositivo de codificación 300 de la tercera realización simplemente ha de configurarse de forma que haga posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior si la unidad de toma de decisiones que permite la conmutación 381 determina que se permite el cambio de frecuencia, y la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201.
[Segunda modificación]
Para seleccionar si se debe codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual en la primera unidad de codificación 101 o en la segunda unidad de codificación 201, no se puede utilizar la información sobre si se permite o no la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381. En este caso, la unidad de toma de decisiones que permite la conmutación 381 no tiene que estar provista en la unidad de selección 380.
En este caso, la unidad de selección de conmutación 383 selecciona si codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual en la primera unidad de codificación 101 o en la segunda unidad de codificación 201, basándose en la información de idoneidad obtenida por la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 sin utilizar la información sobre si se permite la conmutación obtenida por la unidad de toma de decisiones que permite la conmutación 381 y produce un código de conmutación que es un código mediante el cual se puede identificar el procesamiento de codificación seleccionado.
Por ejemplo, es necesario simplemente codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual por la primera unidad de codificación 101 si la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la primera unidad de codificación 101 y codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual por la segunda unidad de codificación 201 si la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201.
También en este caso, como es el caso de la primera modificación, se puede realizar una valoración que incluya el resto de la información. Por ejemplo, incluso cuando la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de la codificación de la primera unidad de codificación 101, si se determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual ha de codificarse mediante el procesamiento de codificación de la segunda unidad de codificación 201 sobre la base de la información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual puede codificarse mediante la segunda unidad de codificación 201.
Por ejemplo, incluso cuando la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de la codificación de la segunda unidad de codificación 201, si se determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual ha de codificarse mediante el procesamiento de codificación de la primera unidad de codificación 101 sobre la base de la información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual puede codificarse mediante la primera unidad de codificación 101.
Es decir, una configuración simplemente ha de ser una configuración que haga posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual mediante el procesamiento de codificación de la primera unidad de codificación 101 si la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la primera unidad de codificación 101. Por otra parte, una configuración simplemente ha de ser una configuración que haga posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual mediante el procesamiento de codificación de la segunda unidad de codificación 201 si la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201.
Además, por ejemplo, en el dispositivo de codificación 300 de la tercera realización, de casos en los que la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201, en un caso donde se determine que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual ha de codificarse mediante el procesamiento de codificación de la primera unidad de codificación 101 sobre la base de la otra información obtenida por un medio que no está descrito en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual puede codificarse por la primera unidad de codificación 101.
Asimismo, en los casos en que la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201,
en un caso en el que se determine que la secuencia de coeficientes en el dominio de la frecuencia
correspondiente a la señal acústica de entrada de la trama actual ha de codificarse mediante el procesamiento de codificación de la segunda unidad de codificación 201 sobre la base de la otra información obtenida por un medio que no está descrito en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual puede codificarse por la segunda unidad de codificación 201.
Es decir, el dispositivo de codificación 300 de la tercera realización simplemente ha de configurarse de forma que haga posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior si la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 determina que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es adecuada para tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201.
Dicho sea de paso, en una comparación entre el valor calculado y el valor umbral en las realizaciones descritas anteriormente, los ajustes simplemente tienen que hacerse de tal forma que, si el valor calculado es el mismo valor que el valor umbral, el valor calculado se clasifique en cualquier uno de los dos casos adyacentes la una a la otra, con el valor umbral situado entre ambos como un límite. Es decir, una condición en la que un valor es mayor que o igual a un determinado valor umbral puede traducirse en una condición en la que un valor es mayor que ese valor umbral y una condición en la que un valor es menor que ese valor umbral puede traducirse en una condición en la que un valor es menor que o igual a ese valor umbral. Asimismo, una condición en la que un valor es mayor que un determinado valor umbral puede traducirse en una condición en la que un valor es mayor queo igual a ese valor umbral y una condición en la que un valor es menor que o igual a ese valor umbral puede traducirse en una condición en la que un valor es menor que ese valor umbral.
Por ejemplo, en la primera realización, la unidad de selección 380 puede hacer posible seleccionar el procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior como el procesamiento de codificación de la trama actual si al menos una de las magnitudes de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama actual es menor que o igual a un valor umbral predeterminado (etapa S380).
Además, en la segunda realización, la unidad de toma de decisiones que permite la conmutación 381 puede determinar que se permite la conmutación, es decir, la unidad de toma de decisiones que permite la conmutación 381 hace posible codificar la secuencia de coeficientes en el dominio de la frecuencia de la trama actual mediante un procesamiento de codificación que es diferente del procesamiento de codificación mediante el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior si, al menos, una de la magnitud de energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama anterior y la magnitud de energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama actual es menor que o igual a un valor umbral predeterminado y produce el resultado de la evaluación.
Además, en la primera realización, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio EV de AVEXS(q) de las regiones parciales del valle es menor que el valor umbral predeterminado TH2, dado que se estima que el valle de un espectro es poco profundo y que el espectro es un espectro cuya envolvente espectral tiene subidas y bajadas suaves, o cuyo grado de concentración es bajo, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 puede determinar que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es idónea para el procesamiento de codificación de la segunda unidad de codificación 201. A la inversa, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio EV de AVEXS(q) de las regiones parciales del valle es mayor o igual que un valor umbral predeterminado TH2, dado que se estima que el valle de un espectro es profundo y que el espectro es un espectro cuya envolvente espectral tiene subidas y bajadas pronunciadas o cuyo grado de concentración es alto, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 puede determinar que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es idónea para el procesamiento de codificación de la primera unidad de codificación 101.
Además, en la tercera realización, si una diferencia entre el valor medio E de AVExs(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor o igual que un valor umbral predeterminado TH2_2 que es un valor mayor que el valor umbral TH2_1, dado que se estima que el valle de un espectro es profundo y que el espectro es un espectro cuya envolvente espectral tiene subidas y bajadas pronunciadas o cuyo grado de concentración es alto, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 puede determinar que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual es idónea para el procesamiento de codificación de la primera unidad de codificación 101. En este caso, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor o igual que el valor umbral TH2_1 pero menor que el valor umbral TH2_2, dado que se estima que la profundidad del valle del espectro es media y que el espectro es un espectro cuya envolvente espectral tiene subidas y bajadas moderadas o cuyo grado de concentración es medio, la unidad de toma de decisiones sobre el procesamiento de codificación adecuado 382 puede realizar cualquier uno del procesamiento de codificación de la primera unidad de codificación 101 y el procesamiento de codificación de la segunda unidad de codificación 201 en la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada de la trama actual.
El procesamiento descrito en el dispositivo de codificación y el procedimiento de codificación pueden realizarse, además de realizarse en orden cronológico en el orden mencionado en la descripción, en paralelo o individualmente dependiendo de la potencia de procesamiento de un dispositivo que realice el procesamiento o cuando sea necesario.
Además, cuando las etapas del procedimiento de codificación se implementan en un ordenador, los detalles del procesamiento de las funciones que se suponen que deben proporcionarse en el procedimiento de codificación se describen mediante un programa. Debido a que este programa se ejecuta en el ordenador, las etapas se implementan en el ordenador.
El programa que describe los detalles del procesamiento se puede grabar en un medio de grabación legible por ordenador. Como medio de grabación legible por ordenador, puede utilizarse cualquier medio de grabación legible por ordenador tal como un dispositivo de grabación magnético, un disco óptico, un medio de grabación magnetoóptico, una memoria de semiconductor o similar.
Además, cada medio de procesamiento se puede configurar como resultado de un programa predeterminado que se ejecuta en el ordenador, y al menos parte de los detalles de procesamiento del mismo se pueden implementar en el hardware.

Claims (6)

REIVINDICACIONES
1. Un procedimiento de codificación para codificar una señal acústica de entrada trama por trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado a partir de una primera etapa de codificación y una segunda etapa de codificación del procesamiento de codificación, comprendiendo el procedimiento de codificación:
una etapa de selección para determinar si se permite el procesamiento de la codificación de conmutación de una trama anterior a una trama actual si al menos una de las magnitudes de energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama anterior y la magnitud de energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama actual es menor que o igual al valor de un umbral predeterminado; en caso contrario, no se permite la conmutación;
donde la etapa de selección selecciona además codificar la trama actual en la segunda etapa de codificación en un caso donde la señal acústica de entrada de la trama anterior se codificó en la primera etapa de codificación y un índice que indica que las subidas y bajadas de un espectro de la señal acústica de entrada de la trama actual son pronunciadas o que un cierto grado de concentración del espectro sea alto es menor que un valor de umbral determinado de antemano, de casos donde se hace posible el cambio del procesamiento de codificación desde la trama anterior a la trama actual,
donde la primera etapa de codificación es una etapa de codificación de una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal acústica de entrada; y
la segunda etapa de codificación es una etapa de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada, que implica una codificación de longitud variable que se realiza sobre un diferencial entre un valor logarítmico de la energía media de los coeficientes en cada una de las regiones parciales, obtenidas mediante la división de la secuencia de coeficientes del dominio de la frecuencia correspondiente a la señal acústica de entrada en una pluralidad de regiones parciales, y el valor logarítmico de la energía media de un dominio de la frecuencia adyacente.
2. Un procedimiento de codificación para codificar una señal acústica de entrada trama por trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado a partir de una primera etapa de codificación y una segunda etapa de codificación de procesamiento de codificación, comprendiendo el procedimiento de codificación:
una etapa de selección para evaluar si se permite la conmutación del procesamiento de codificación desde una trama anterior a una trama actual si al menos una de las magnitudes de la energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama actual es menor que o igual a un valor umbral predeterminado; de lo contrario, se decidirá si se hace posible una selección para seleccionar un procesamiento de codificación que sea diferente del procesamiento de codificación de la trama anterior como el procesamiento de codificación de la trama actual o si se selecciona el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior como el procesamiento de codificación de la trama actual de conformidad con un estado en el que las componentes de alta frecuencia de la señal acústica de entrada son dispersas;
donde la etapa de selección selecciona además codificar la trama actual en la segunda etapa de codificación en un caso donde la señal acústica de entrada de la trama anterior se codificó en la primera etapa de codificación y un índice que indica que las subidas y bajadas de un espectro de la señal acústica de entrada de la trama actual son pronunciadas o que un cierto grado de concentración del espectro es alto es menor que un valor de umbral determinado de antemano, de casos donde se hace posible el cambio del procesamiento de codificación desde la trama anterior a la trama actual,
donde la primera etapa de codificación es una etapa de codificación de una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal acústica de entrada; y
la segunda etapa de codificación es una etapa de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada, que implica una codificación de longitud variable que se realiza sobre un diferencial entre un valor logarítmico de la energía media de los coeficientes en cada una de las regiones parciales obtenido al dividir la secuencia de coeficientes del dominio de la frecuencia correspondiente a la señal acústica de entrada en una pluralidad de regiones parciales y un valor logarítmico de la energía media de un dominio de la frecuencia adyacente.
3. Un dispositivo de codificación para codificar una señal acústica de entrada trama por trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado a partir de una primera etapa de codificación y una segunda etapa de codificación de procesamiento de codificación, comprendiendo el dispositivo de codificación:
una unidad de selección adaptada para evaluar si se permite el procesamiento de la codificación de conmutación de una trama anterior a una trama actual si al menos una de las magnitudes de energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama anterior y la magnitud de energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama actual es menor que o igual al valor de un valor umbral preestablecido; en caso contrario, no se permite la conmutación; donde la unidad de selección se adapta además para seleccionar codificar la trama actual en la segunda etapa de codificación en un caso en el que la señal acústica de entrada de la trama anterior se codificó en la primera etapa de codificación y un índice que muestra que las subidas y bajadas de un espectro de la señal acústica de entrada de la trama actual son pronunciadas o un grado de concentración del espectro es alto es menor que el valor del umbral predefinido, de casos en los que se posibilita el procesamiento de codificación de conmutación desde la trama anterior a la trama actual,
donde la primera etapa de codificación es una etapa de codificación de una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal acústica de entrada; y
la segunda etapa de codificación es una etapa de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada, que implica una codificación de longitud variable que se realiza sobre un diferencial entre un valor logarítmico de la energía media de los coeficientes en cada una de las regiones parciales obtenido mediante la división de la secuencia de coeficientes del dominio de la frecuencia correspondiente a la señal acústica de entrada en una pluralidad de regiones parciales, y el valor logarítmico de la energía media de un dominio de la frecuencia adyacente.
4. Un dispositivo de codificación para codificar una señal acústica de entrada trama por trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado a partir de una primera etapa de codificación y una segunda etapa de codificación de procesamiento de codificación, comprendiendo el dispositivo de codificación:
una unidad de selección para evaluar si se permite la conmutación del procesamiento de codificación desde una trama anterior a una trama actual si al menos una de las magnitudes de la energía de las componentes de alta frecuencia de una señal acústica de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal acústica de entrada de la trama actual es menor que o igual a un valor del umbral predeterminado; de lo contrario, para seleccionar si se hace posible una selección para seleccionar un procesamiento de codificación que sea diferente del procesamiento de codificación de la trama anterior como el procesamiento de codificación de la trama actual o seleccionar el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior como el procesamiento de codificación de la trama actual de conformidad con un estado en el que las componentes de alta frecuencia de la señal acústica de entrada son dispersas;
donde la unidad de selección se adapta además para seleccionar codificar la trama actual en la segunda etapa de codificación en un caso en el que la señal acústica de entrada de la trama anterior se codificó en la primera etapa de codificación y un índice que señala que las subidas y bajadas de un espectro de la señal acústica de entrada de la trama actual son pronunciadas o un grado de concentración del espectro es alto es menor que el valor del umbral predefinido, de casos en los que se posibilita el procesamiento de codificación de conmutación desde la trama anterior a la trama actual,
donde la primera etapa de codificación es una etapa de codificación de una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada utilizando una envolvente espectral basada en coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal acústica de entrada; y
la segunda etapa de codificación es una etapa de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal acústica de entrada, que implica una codificación de longitud variable que se realiza sobre un diferencial entre un valor logarítmico de la energía media de los coeficientes en cada una de las regiones parciales, obtenido al dividir la secuencia de coeficientes del dominio de la frecuencia correspondiente a la señal acústica de entrada en una pluralidad de regiones parciales, y el valor logarítmico de la energía media de un dominio de la frecuencia adyacente.
5. Un programa adaptado para hacer que una computadora ejecute cada paso del procedimiento de codificación según la reivindicación 1 o 2.
6. Un medio de grabación legible por ordenador en el que se graba un programa según la reivindicación 5.
ES15826810T 2014-07-28 2015-05-15 Codificación de una señal acústica Active ES2770704T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014152958 2014-07-28
PCT/JP2015/063989 WO2016017238A1 (ja) 2014-07-28 2015-05-15 符号化方法、装置、プログラム及び記録媒体

Publications (1)

Publication Number Publication Date
ES2770704T3 true ES2770704T3 (es) 2020-07-02

Family

ID=55217142

Family Applications (3)

Application Number Title Priority Date Filing Date
ES19201443T Active ES2838006T3 (es) 2014-07-28 2015-05-15 Codificación de señal de sonido
ES15826810T Active ES2770704T3 (es) 2014-07-28 2015-05-15 Codificación de una señal acústica
ES20200287T Active ES2908564T3 (es) 2014-07-28 2015-05-15 Codificación de una señal de sonido

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES19201443T Active ES2838006T3 (es) 2014-07-28 2015-05-15 Codificación de señal de sonido

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES20200287T Active ES2908564T3 (es) 2014-07-28 2015-05-15 Codificación de una señal de sonido

Country Status (8)

Country Link
US (4) US10304472B2 (es)
EP (3) EP3614382B1 (es)
JP (3) JP6411509B2 (es)
KR (3) KR102049294B1 (es)
CN (4) CN106796801B (es)
ES (3) ES2838006T3 (es)
PL (2) PL3163571T3 (es)
WO (1) WO2016017238A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3614382B1 (en) * 2014-07-28 2020-10-07 Nippon Telegraph And Telephone Corporation Coding of a sound signal
CN114898761A (zh) * 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
CN110868220B (zh) * 2018-08-28 2021-09-07 株洲中车时代电气股份有限公司 车辆设备的身份标识的配置及异常检测方法
CN113948085B (zh) * 2021-12-22 2022-03-25 中国科学院自动化研究所 语音识别方法、系统、电子设备和存储介质

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450490A (en) * 1994-03-31 1995-09-12 The Arbitron Company Apparatus and methods for including codes in audio signals and decoding
HU219256B (en) * 1994-03-31 2001-03-28 Arbitron Co Apparatus and method for including a code having at least one code frequency component with an audio signal having a plurality of audio signal frequency components
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JP3317470B2 (ja) * 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
JP3612260B2 (ja) * 2000-02-29 2005-01-19 株式会社東芝 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP3453116B2 (ja) * 2000-09-26 2003-10-06 パナソニック モバイルコミュニケーションズ株式会社 音声符号化方法及び装置
JP3426207B2 (ja) * 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
EP1292036B1 (en) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Digital signal decoding methods and apparatuses
JP3960932B2 (ja) * 2002-03-08 2007-08-15 日本電信電話株式会社 ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
US7599835B2 (en) * 2002-03-08 2009-10-06 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7379864B2 (en) * 2003-05-06 2008-05-27 Lucent Technologies Inc. Method and apparatus for the detection of previous packet loss in non-packetized speech
EP3118849B1 (en) * 2004-05-19 2020-01-01 Fraunhofer Gesellschaft zur Förderung der Angewand Encoding device, decoding device, and method thereof
US7752039B2 (en) * 2004-11-03 2010-07-06 Nokia Corporation Method and device for low bit rate speech coding
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
CN101496097A (zh) * 2006-07-31 2009-07-29 高通股份有限公司 用于在与语音信号相关联的包中包含识别符的系统及方法
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US8483854B2 (en) * 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
CN101763856B (zh) * 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码系统
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
CN101552006B (zh) * 2009-05-12 2011-12-28 武汉大学 加窗信号mdct域的能量及相位调整方法及其装置
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
BR112012032746A2 (pt) * 2010-06-21 2016-11-08 Panasonic Corp dispositivo de descodificação, dispositivo de codificação, e métodos para os mesmos.
CN102446508B (zh) * 2010-10-11 2013-09-11 华为技术有限公司 语音音频统一编码窗型选择方法及装置
JP5694751B2 (ja) * 2010-12-13 2015-04-01 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
US9711158B2 (en) * 2011-01-25 2017-07-18 Nippon Telegraph And Telephone Corporation Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
KR102070429B1 (ko) * 2011-10-21 2020-01-28 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치
CN103366750B (zh) * 2012-03-28 2015-10-21 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
KR101841380B1 (ko) * 2014-01-13 2018-03-22 노키아 테크놀로지스 오와이 다중-채널 오디오 신호 분류기
BR112016025850B1 (pt) * 2014-05-08 2022-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Métodos para codificar um sinal de áudio e para discriminação de sinal de áudio, codificador para codificação de um sinal de áudio, discriminador de sinal de áudio, dispositivo de comunicação, e, meio de armazenamento legível por computador
GB2526128A (en) * 2014-05-15 2015-11-18 Nokia Technologies Oy Audio codec mode selector
MX368572B (es) * 2014-05-15 2019-10-08 Ericsson Telefon Ab L M Clasificacion y codificacion de señal de audio.
EP3614382B1 (en) * 2014-07-28 2020-10-07 Nippon Telegraph And Telephone Corporation Coding of a sound signal
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection

Also Published As

Publication number Publication date
US11037579B2 (en) 2021-06-15
CN112992163A (zh) 2021-06-18
US20170178659A1 (en) 2017-06-22
US11043227B2 (en) 2021-06-22
ES2908564T3 (es) 2022-05-03
PL3796314T3 (pl) 2022-03-28
US20190206414A1 (en) 2019-07-04
WO2016017238A1 (ja) 2016-02-04
KR101993828B1 (ko) 2019-06-27
US10304472B2 (en) 2019-05-28
KR20190077115A (ko) 2019-07-02
ES2838006T3 (es) 2021-07-01
CN106796801B (zh) 2021-02-26
KR102049294B1 (ko) 2019-11-27
CN106796801A (zh) 2017-05-31
KR20170024030A (ko) 2017-03-06
EP3163571A4 (en) 2017-11-29
JP6608993B2 (ja) 2019-11-20
JPWO2016017238A1 (ja) 2017-06-01
CN112992164A (zh) 2021-06-18
EP3614382A1 (en) 2020-02-26
US10629217B2 (en) 2020-04-21
PL3163571T3 (pl) 2020-05-18
EP3163571A1 (en) 2017-05-03
US20200176007A1 (en) 2020-06-04
EP3796314B1 (en) 2021-12-22
EP3163571B1 (en) 2019-11-20
JP2018139004A (ja) 2018-09-06
EP3796314A1 (en) 2021-03-24
KR20190042773A (ko) 2019-04-24
US20200176006A1 (en) 2020-06-04
KR102061316B1 (ko) 2019-12-31
JP2019215558A (ja) 2019-12-19
JP6739604B2 (ja) 2020-08-12
CN112992165A (zh) 2021-06-18
JP6411509B2 (ja) 2018-10-24
EP3614382B1 (en) 2020-10-07

Similar Documents

Publication Publication Date Title
ES2770704T3 (es) Codificación de una señal acústica
RU2680352C1 (ru) Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ и устройство для декодирования аудиосигналов
JP2017191341A (ja) 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス
EP3288033A1 (en) Methods and systems for efficient recovery of high frequency audio content
RU2765985C2 (ru) Классификация и кодирование аудиосигналов
JP2011013560A (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
US9548056B2 (en) Signal adaptive FIR/IIR predictors for minimizing entropy
EP2353160A1 (en) An apparatus
US20130144611A1 (en) Coding device, decoding device, coding method, and decoding method
JP4134262B2 (ja) 信号処理方法、信号処理装置及びプログラム
US9123329B2 (en) Method and apparatus for generating sideband residual signal
US9852722B2 (en) Estimating a tempo metric from an audio bit-stream
KR101536855B1 (ko) 레지듀얼 코딩을 이용하는 인코딩 장치 및 방법
JP2008250347A (ja) 信号処理方法、信号処理装置及びプログラム