ES2838006T3 - Codificación de señal de sonido - Google Patents

Codificación de señal de sonido Download PDF

Info

Publication number
ES2838006T3
ES2838006T3 ES19201443T ES19201443T ES2838006T3 ES 2838006 T3 ES2838006 T3 ES 2838006T3 ES 19201443 T ES19201443 T ES 19201443T ES 19201443 T ES19201443 T ES 19201443T ES 2838006 T3 ES2838006 T3 ES 2838006T3
Authority
ES
Spain
Prior art keywords
encoding
coefficients
sound signal
input sound
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19201443T
Other languages
English (en)
Inventor
Takehiro Moriya
Yutaka Kamamoto
Noboru Harada
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Application granted granted Critical
Publication of ES2838006T3 publication Critical patent/ES2838006T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectroscopy & Molecular Physics (AREA)

Abstract

Un método de codificación para codificar una señal de sonido de entrada trama a trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado de un primer paso de codificación y un segundo paso de codificación de procesamiento de codificación, el método de codificación que comprende: un paso de selección de juzgar que se permite la conmutación de un procesamiento de codificación de una trama anterior a una presente trama si al menos una de una magnitud de energía de las componentes de alta frecuencia de una señal de sonido de entrada de la trama anterior y la magnitud de energía de las componentes de alta frecuencia de una señal de sonido de entrada de la presente trama es menor o igual que un valor umbral predeterminado; de otro modo, no permitir la conmutación; en donde el paso de selección hace posible además una selección para codificar la presente trama en el primer paso de codificación en un caso donde la señal de sonido de entrada de la trama anterior se codificó en el segundo paso de codificación y un índice que indica que los ascensos y descensos de un espectro de la señal de sonido de entrada de la presente trama son pronunciados o un grado de concentración del espectro es alto, es mayor o igual que un valor umbral predeterminado, de casos donde se hace posible conmutar un procesamiento de codificación de la trama anterior a la presente trama, donde el primer paso de codificación es un paso de codificación de una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada usando una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal de sonido de entrada; y el segundo paso de codificación es un paso de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada, que implica una codificación de longitud variable que se realiza sobre un diferencial entre un valor logarítmico de energía promedio de los coeficientes en cada región parcial obtenida dividiendo la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada en una pluralidad de regiones parciales y un valor logarítmico de energía promedio de un dominio de la frecuencia adyacente.

Description

DESCRIPCIÓN
Codificación de señal de sonido
Campo técnico
La presente invención se refiere a una tecnología de codificación de señal de sonido. Más particularmente, la presente invención se refiere a una tecnología de codificación para codificación de una señal de sonido convirtiendo la señal de sonido en el dominio de la frecuencia.
Antecedentes de la técnica
En la codificación de señales de sonido tales como habla y música, se usa ampliamente un método de codificación de una señal de sonido de entrada en el dominio de la frecuencia. Como el método de codificación de una señal de sonido en el dominio de la frecuencia, hay, por ejemplo, métodos de la Bibliografía no de Patentes 1 y la Bibliografía no de Patentes 2.
El método de codificación descrito en la Bibliografía no de Patentes 1 es un método que realiza procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal. Específicamente, el método de codificación descrito en la Bibliografía no de Patentes 1 es un método que obtiene un código de coeficiente de predicción lineal codificando coeficientes que se obtienen a partir de una señal de sonido de entrada y son convertibles en coeficientes de predicción lineal y obtiene un código de coeficiente normalizado codificando una secuencia de coeficientes normalizados que se obtiene normalizando una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada mediante una secuencia de coeficientes de envolvente espectral correspondiente a coeficientes que son convertibles en coeficientes de predicción lineal cuantificados correspondientes al código de coeficientes de predicción lineal. Los coeficientes que son convertibles en coeficientes de predicción lineal son, por ejemplo, coeficientes de predicción lineal en sí mismos, coeficientes PARCOR (coeficientes de autocorrelación parcial), parámetros de LSP o similares. El método de codificación descrito en la Bibliografía no de Patentes 2 es un método que realiza procesamiento de codificación que implica codificación de longitud variable de valor diferencial obteniendo un diferencial entre el valor logarítmico de la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía promedio de un dominio de la frecuencia adyacente. Específicamente, el método de codificación descrito en la Bibliografía no de Patentes 2 es un método que divide una secuencia de coeficientes en el dominio de la frecuencia correspondiente a una señal de sonido de entrada en dominios de la frecuencia de manera que cuanto más bajas sean las frecuencias, menor llegará a ser el número de muestras del dominio de la frecuencia; cuanto más altas sean las frecuencias, mayor llegará a ser el número de muestras del dominio de la frecuencia, obtiene la energía promedio de cada dominio de la frecuencia obtenido por división, y cuantifica la energía promedio en los ejes logarítmicos; realiza codificación de longitud variable sobre un diferencial entre el valor obtenido por cuantificación y el valor obtenido cuantificando la energía promedio de un dominio de la frecuencia adyacente en los ejes logarítmicos de una manera similar; y determina adaptativamente, usando la energía promedio, que se cuantificó en los ejes logarítmicos, de cada dominio de la frecuencia obtenido por división, un número de bits de cuantificación de cada coeficiente en el dominio de la frecuencia y la anchura del paso de cuantificación de cada coeficiente en el dominio de la frecuencia, cuantifica cada coeficiente en el dominio de la frecuencia según el mismo, y además realiza codificación de longitud variable sobre el mismo.
La Bibliografía de Patentes 1 describe codificadores de habla y métodos de codificación de habla que codifican tramas inactivas a diferentes tasas. Además, se describen aparatos y métodos para procesar una señal de habla codificada que calculan una trama decodificada en base a una descripción de una envolvente espectral sobre una primera banda de frecuencia y la descripción de una envolvente espectral sobre una segunda banda de frecuencia, en la que la descripción de la primera banda de frecuencia se basa en información de una trama codificada correspondiente y la descripción de la segunda banda de frecuencia se basa en información de al menos una trama codificada precedente. El cálculo de la trama decodificada también se puede basar en una descripción de la información temporal para la segunda banda de frecuencia que se basa en información de al menos una trama codificada anterior.
La Bibliografía de Patentes 2 se refiere a un método y dispositivo para mejorar la ocultación del borrado de tramas causada por tramas de una señal de sonido codificada borradas durante la transmisión desde un codificador hasta un decodificador, y para acelerar la recuperación del decodificador después de que se hayan recibido las tramas no borradas de la señal de sonido codificada. Con ese propósito, los parámetros de ocultación/recuperación se determinan en el codificador o decodificador. Cuando se determinan en el codificador, los parámetros de ocultación/recuperación se transmiten al decodificador. En el decodificador, la ocultación de la trama de borrado y la recuperación del decodificador se realizan en respuesta a los parámetros de ocultación/recuperación. Los parámetros de ocultación/recuperación se pueden seleccionar del grupo que consta de: un parámetro de clasificación de señal, un parámetro de información de energía y un parámetro de información de fase. La determinación de los parámetros de ocultación/recuperación comprende clasificar las tramas sucesivas de la señal de sonido codificada como sin voz, transición sin voz, transición con voz, con voz o de comienzo, y esta clasificación se determina sobre la base de al menos una parte de los siguientes parámetros: un parámetro de correlación normalizada, un parámetro de pendiente espectral, un parámetro de relación señal a ruido, un parámetro de estabilidad de tono, un parámetro de energía de trama relativa y un parámetro de paso por cero.
Bibliografía de la técnica anterior
Bibliografía de Patentes
Bibliografía de Patentes 1: US 2008/027717 A1.
Bibliografía de Patentes 2: US 2005/154584 A1.
Bibliografía no de Patentes
Bibliografía no de Patentes 1: Anthony Vetro, “MPEG Unified Speech and Audio Coding”, Industria y Estándares, IEEE MultiMedia, abril-junio de 2013.
Bibliografía no de Patentes 2: M. Bosi y R. E. Goldberg, “Introduction to Digital Audio Coding and Standards”, Kluwer Academic Publishers, 2003.
Compendio de la invención
Problemas a resolver por la invención
Mediante el método de codificación de la Bibliografía no de Patentes 2, dado que es posible reducir la cantidad de código de un código de energía promedio realizando una codificación de longitud variable sobre un diferencial de energía promedio si los ascensos y descensos de una envolvente espectral de una señal de sonido de entrada no son pronunciados y el grado de concentración de un espectro no es alto, es posible codificar la señal de sonido de entrada de manera eficiente. No obstante, si los ascensos y descensos de una envolvente espectral de una señal de sonido de entrada son pronunciados y el grado de concentración de un espectro es alto, llega a ser grande la cantidad de código de un código de energía promedio que se obtiene realizando codificación de longitud variable sobre un diferencial de energía promedio.
Por otra parte, mediante el método de codificación de la Bibliografía no de Patentes 1, dado que es posible codificar una envolvente espectral de manera eficiente usando coeficientes que son convertibles en coeficientes de predicción lineal, es posible codificar una señal de sonido de entrada de manera más eficiente que el método de codificación de la Bibliografía no de Patentes 2 si los ascensos y descensos de una envolvente espectral de la señal de sonido de entrada son pronunciados y el grado de concentración de un espectro es alto. No obstante, si los ascensos y descensos de una envolvente espectral de una señal de sonido de entrada no son pronunciados y el grado de concentración de un espectro no es alto, no es posible realizar la codificación de manera tan eficientemente como el método de codificación de la Bibliografía no de Patentes 2.
Como se ha descrito anteriormente, los métodos de codificación existentes algunas veces no pueden realizar la codificación de manera eficiente dependiendo de las características de una señal de sonido de entrada.
Un objeto de la presente invención es proporcionar un método de codificación, un dispositivo, un programa y un medio de grabación que puedan realizar la codificación de manera eficiente independientemente de las características de una señal de sonido de entrada y obtener una señal de sonido decodificada que suena menos artificial para un oyente.
Medios para resolver los problemas
En vista de estos problemas, la presente invención proporciona métodos de codificación y dispositivos de codificación, así como los correspondientes programas y los medios de grabación legibles por ordenador, que tienen las características de las reivindicaciones independientes respectivas.
Un método de codificación según un ejemplo que no se reivindica pero que es útil para comprender la presente invención es un método de codificación que codifica una señal de sonido de entrada trama a trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado de una pluralidad de tipos de procesamiento de codificación en el dominio de la frecuencia, el método de codificación que incluye: un paso de selección para hacer posible una selección para seleccionar un procesamiento de codificación que sea diferente de un procesamiento de codificación de la trama anterior como procesamiento de codificación de la presente trama si al menos una de la magnitud de la energía de las componentes de alta frecuencia de una señal de sonido de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de una señal de sonido de entrada de la presente trama es menor o igual que un valor umbral predeterminado.
Un método de codificación según otro ejemplo que no se reivindica pero que es útil para comprender la presente invención es un método de codificación que codifica una señal de sonido de entrada trama a trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado de una pluralidad de tipos de procesamiento de codificación en el dominio de la frecuencia, el método de codificación que incluye: un paso de selección para hacer posible una selección para seleccionar un procesamiento de codificación que es diferente de un procesamiento de codificación de la trama anterior como procesamiento de codificación de la presente trama si al menos una de la magnitud de la energía de las componentes de alta frecuencia de una señal de sonido de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de una señal de sonido de entrada de la presente trama es menor o igual que un valor umbral predeterminado; de otro modo, decidir si hacer posible una selección para seleccionar un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior como el procesamiento de codificación de la presente trama o seleccionar el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior como el procesamiento de codificación de la presente trama según un estado en el que las componentes de alta frecuencia de la señal de sonido de entrada son escasas.
Un método de codificación según otro ejemplo que no se reivindica pero que es útil para comprender la presente invención es un método de codificación que codifica una señal de sonido de entrada trama a trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado de una pluralidad de tipos de procesamiento de codificación en el dominio de la frecuencia, el método de codificación que incluye: un primer paso de codificación de codificar una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada usando una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal de sonido de entrada; un segundo paso de codificación de codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada, que implica codificación de longitud variable que se realiza sobre un diferencial entre el valor logarítmico de la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía promedio de un dominio de la frecuencia adyacente; y un paso de selección para hacer posible una selección para codificar la presente trama en el primer paso de codificación si los ascensos y descensos de un espectro de la señal de sonido de entrada de la presente trama son pronunciados o el grado de concentración del espectro es alto y hacer posible una selección para codificar la presente trama en el segundo paso de codificación si los ascensos y descensos del espectro de la señal de sonido de entrada de la presente trama son suaves o el grado de concentración del espectro es bajo.
Efectos de la invención
Con una configuración que permite cualquiera de una pluralidad de tipos de procesamiento de codificación realizando la codificación trama a trama en el dominio de la frecuencia a ser seleccionada, es posible obtener una señal de sonido decodificada que suena menos artificial para un oyente.
Breve descripción de los dibujos
La Fig. 1 es un diagrama de bloques que ilustra la configuración de un dispositivo de codificación.
La Fig. 2 es un diagrama de bloques que ilustra la configuración de un dispositivo de decodificación.
La Fig. 3 es un diagrama que representa un ejemplo del flujo de procesamiento de un método de codificación.
La Fig. 4 es un diagrama que representa un ejemplo del flujo de procesamiento de una unidad de selección 380. La Fig. 5 es un diagrama que representa un ejemplo del flujo de procesamiento de una unidad de juicio de procesamiento de codificación adecuado 382.
La Fig. 6 es un diagrama que representa un ejemplo del flujo de procesamiento de una unidad de selección de conmutación 383 de una segunda realización.
La Fig. 7 es un diagrama que representa un ejemplo del flujo de procesamiento de una unidad de juicio de procesamiento de codificación adecuado 382 de una tercera realización.
La Fig. 8 es un diagrama conceptual del primer procesamiento de codificación y del segundo procesamiento de codificación.
Descripción detallada de las realizaciones
Primera realización
En lo sucesivo, se describirá una primera realización de la presente invención. La primera realización se configura de manera que, en una configuración en la que una secuencia de coeficientes en el dominio de la frecuencia correspondiente a una señal de sonido de entrada de cada trama se codifica por cualquiera de una pluralidad de diferentes tipos de procesamiento de codificación que realiza procesamiento de codificación en el dominio de la frecuencia, una conmutación del procesamiento de codificación se realice solamente cuando la energía de las componentes de alta frecuencia de una señal de sonido de entrada y/o una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada sea pequeña. La energía de las componentes de alta frecuencia de una señal de sonido de entrada es la magnitud en sí misma de la energía de las componentes de alta frecuencia de una señal de sonido de entrada, la magnitud de la energía de las componentes de alta frecuencia en una señal de sonido de entrada o similares.
<Dispositivo de codificación 300>
La configuración de un dispositivo de codificación 300 se representa en la Fig. 1. El dispositivo de codificación 300 incluye una unidad de conversión en el dominio de la frecuencia 110, una unidad de selección 380, una primera unidad de codificación 101 y una segunda unidad de codificación 201. La primera unidad de codificación 101 incluye, por ejemplo, una unidad de codificación de análisis de predicción lineal 120, una unidad de generación de secuencia de coeficientes de envolvente espectral 130, una unidad de normalización de envolvente 140 y una unidad de codificación de coeficientes normalizados 150. La segunda unidad de codificación 201 incluye, por ejemplo, una unidad de división de región 220, una unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 y una unidad de codificación de coeficientes 250. Para el dispositivo de codificación 300, una señal digital de sonido de habla (a la que se hace referencia en lo sucesivo como señal de sonido de entrada) en el dominio del tiempo es una entrada trama a trama, que es un segmento de tiempo predeterminado, y se realiza el siguiente procesamiento sobre una base trama a trama. En lo sucesivo, un procesamiento específico de cada unidad se describirá en base a la premisa de que la presente señal de sonido de entrada es una trama de orden f. Una señal de sonido de entrada de la trama de orden f se supone que es xf(n) (n = 1, ..., Nt). Aquí, Nt representa el número de muestras por trama.
En lo sucesivo, se describirá la operación del dispositivo de codificación 300. Mediante el dispositivo de codificación 300, se realiza un procesamiento en cada paso de un método de codificación ilustrado en la Fig. 3.
<Unidad de conversión en el dominio de la frecuencia 110>
La unidad de conversión en el dominio de la frecuencia 110 convierte la señal de sonido de entrada xf(n) (n = 1, ..., Nt) en una secuencia de coeficientes en el dominio de la frecuencia, por ejemplo, una secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) en un punto N y emite la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) (Paso S110). No obstante, N es el número de muestras en el dominio de la frecuencia y es un número entero positivo. La conversión al dominio de la frecuencia se puede realizar mediante un método de conversión conocido públicamente que no sea MDCT.
Además, si las secuencias de coeficientes en el dominio de la frecuencia obtenidas en una pluralidad de grados de precisión y mediante una pluralidad de métodos son necesarias en la primera unidad de codificación 101, la segunda unidad de codificación 201 y la unidad de selección 380, es posible obtener secuencias de coeficientes en el dominio de la frecuencia en una pluralidad de grados de precisión y mediante una pluralidad de métodos en la unidad de conversión en el dominio de la frecuencia 110. Por ejemplo, cuando la primera unidad de codificación 101 y la segunda unidad de codificación 201 usan una secuencia de coeficientes de MDCT como una secuencia de coeficientes en el dominio de la frecuencia y la unidad de selección 380 usa una serie espectral de potencia como una secuencia de coeficientes en el dominio de la frecuencia, la unidad de conversión en el dominio de la frecuencia 110 simplemente tiene que obtener una secuencia de coeficientes de MDCT y una serie espectral de potencia a partir de una señal de sonido de entrada. Además, por ejemplo, cuando la primera unidad de codificación 101 y la segunda unidad de codificación 201 usan una secuencia de coeficientes de MDCT como una secuencia de coeficientes en el dominio de la frecuencia y la unidad de selección 380 usa una serie de energía de cada banda de frecuencia como una secuencia de coeficientes en el dominio de la frecuencia, la unidad de conversión en el dominio de la frecuencia 110 simplemente tiene que obtener una secuencia de coeficientes de MDCT y una serie de energía de cada banda de frecuencia a partir de una señal de sonido de entrada. Además, por ejemplo, cuando la primera unidad de codificación 101 y la segunda unidad de codificación 201 usan una secuencia de coeficientes de MDCT como una secuencia de coeficientes en el dominio de la frecuencia, una unidad de juicio de permiso de conmutación 381 de la unidad de selección 380 usa una serie de energía de cada banda de frecuencia como una secuencia de coeficientes en el dominio de la frecuencia, y una unidad de juicio de procesamiento de codificación 382 de la unidad de selección 380 usa una serie espectral de potencia como una secuencia de coeficientes en el dominio de la frecuencia, la unidad de conversión en el dominio de la frecuencia 110 simplemente tiene que obtener una secuencia de coeficientes de MDCT, una serie de energía de cada banda de frecuencia y una serie espectral de potencia a partir de una señal de sonido de entrada.
<Unidad de selección 380>
La unidad de selección 380 hace posible seleccionar un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior como procesamiento de codificación de la presente trama si al menos una de la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la presente trama es menor que un valor umbral predeterminado (Paso S380).
En otras palabras, la unidad de selección 380 hace un juicio en el sentido de que, si al menos la energía de las componentes de alta frecuencia de una señal de sonido de entrada es pequeña, la unidad de selección 380 permite que una secuencia de coeficientes en el dominio de la frecuencia de la presente trama sea codificada mediante un procesamiento de codificación que es diferente del procesamiento de codificación por el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior; de otro modo, la unidad de selección 380 no permite que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama sea codificada mediante un procesamiento de codificación que es diferente del procesamiento de codificación por el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior. La unidad de selección 380 realiza entonces un control de conmutación de manera que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique según el resultado del juicio.
La unidad de selección 380 incluye, por ejemplo, la unidad de juicio de permiso de conmutación 381, la unidad de juicio de procesamiento de codificación adecuado 382, una unidad de selección de conmutación 383 y una unidad de conmutación 384. En lo sucesivo, se describirá un ejemplo de la unidad de selección 380. La unidad de selección 380 realiza un procesamiento en cada paso ilustrado en la Fig. 4.
<Unidad de juicio de permiso de conmutación 381 >
La unidad de juicio de permiso de conmutación 381 juzga que, si al menos una de la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la presente trama es menor que un valor umbral predeterminado, se permite una conmutación, es decir, juzga que la unidad de juicio de permiso de conmutación 381 hace posible codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante un procesamiento de codificación que es diferente del procesamiento de codificación por el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior; de otro modo, la unidad de juicio de permiso de conmutación 381 juzga que no se permite la conmutación, es decir, la unidad de juicio de permiso de conmutación 381 no permite que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama sea codificada mediante un procesamiento de codificación que es diferente del procesamiento de codificación por el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior; la unidad de juicio de permiso de conmutación 381 emite entonces el resultado del juicio (paso S381).
En lo sucesivo, se describirá un ejemplo de la operación de la unidad de juicio de permiso de conmutación 381. Primero, se describirá un ejemplo en el que la energía de alta frecuencia de una secuencia de coeficientes de MDCT se usa como la magnitud de la energía de las componentes de alta frecuencia de una señal de sonido de entrada. La unidad de juicio de permiso de conmutación 381 primero obtiene la energía de alta frecuencia Ehf-1 de una secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior mediante la siguiente fórmula (1) y la energía de alta frecuencia Ehf de una secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama mediante la siguiente fórmula (2) (Paso S3811). En la fórmula (1) y la fórmula (2), M es un número entero positivo predeterminado que es menor que N.
uvi - n= ZN-M (Xf ,(n))' (O
Figure imgf000006_0001
La unidad de juicio de permiso de conmutación 381 juzga entonces que, si al menos una de la energía de alta frecuencia Ehf-1 de la trama anterior y la energía de alta frecuencia Ehf de la presente trama es menor que un valor umbral predeterminado TH1, es decir, Ehf-1 < TH1 y/o Ehf < TH1, se permite la conmutación; de otro modo, la unidad de juicio de permiso de conmutación 381 juzga que no se permite la conmutación; la unidad de juicio de permiso de conmutación 381 emite entonces información sobre si se permite o no la conmutación (paso S3812).
Por cierto, la energía de alta frecuencia Ehf-1 de la trama anterior que se obtiene en el Paso S3811 de la presente trama es la misma que la energía de alta frecuencia Ehf de la presente trama obtenida en el Paso S3811 de la trama anterior. De este modo, almacenando la energía de alta frecuencia calculada Ehf en la unidad de juicio de permiso de conmutación 381 hasta que al menos una trama inmediatamente siguiente a la trama, no hay necesidad de calcular la energía de alta frecuencia Ehf-1 de la trama anterior.
A continuación, se describirá un ejemplo en el que la relación entre la energía de alta frecuencia a la energía total de una secuencia de coeficientes de MDCT se usa como la magnitud de la energía de las componentes de alta frecuencia de una señal de sonido de entrada.
La unidad de juicio de permiso de conmutación 381 primero obtiene la relación Ehf-1 de energía de alta frecuencia a la energía total de una secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior mediante la siguiente fórmula (1A) y la relación Ehf de energía de alta frecuencia a la energía total de la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama mediante la siguiente fórmula (2A) (Paso S3811). En la fórmula (1A) y la fórmula (2A), M es un número entero positivo predeterminado.
Figure imgf000007_0001
La unidad de juicio de permiso de conmutación 381 juzga entonces que, si al menos una de la relación Ehf-i de energía de alta frecuencia a la energía total de la trama anterior y la relación Ehf de energía de alta frecuencia a la energía total de la presente trama es menor que el valor umbral predeterminado TH1, es decir, Ehf-1 < TH1 y/o Ehf < TH1, se permite la conmutación; de otro modo, la unidad de juicio de permiso de conmutación 381 juzga que no se permite la conmutación; la unidad de juicio de permiso de conmutación 381 emite entonces información sobre si se permite o no la conmutación (Paso S3812).
Por cierto, la relación Ehf-1 de energía de alta frecuencia a la energía total de la trama anterior que se obtiene en el Paso S3811 de la presente trama es la misma que la relación Ehf de energía de alta frecuencia a la energía total de la presente trama obtenida en el Paso S3811 de la trama anterior. De este modo, almacenando la relación calculada Ehf de energía de alta frecuencia a la energía total en la unidad de juicio de permiso de conmutación 381 hasta al menos una trama inmediatamente siguiente a la trama, no hay necesidad de calcular la relación Ehf-1 de energía de alta frecuencia a la energía total de la trama anterior.
Por cierto, en los dos ejemplos descritos anteriormente, se juzga que se permite la conmutación si Ehf-1 < TH1 y/o Ehf < TH1; de otro modo, se juzga que no se permite la conmutación, pero se puede juzgar que se permite la conmutación si Ehf-1 < TH 1 y Ehf < TH 1; de otro modo, se puede juzgar que no se permite la conmutación. En otras palabras, se puede juzgar que, si tanto la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la trama anterior como la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la presente trama son menores que un valor umbral predeterminado, se permite la conmutación, es decir, se hace posible la codificación de la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante un procesamiento de codificación que es diferente del procesamiento de codificación por el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior; de otro modo, se puede juzgar que no se permite la conmutación, es decir, no se permite la codificación de la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante un procesamiento de codificación que es diferente del procesamiento de codificación por el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior.
Además, en los ejemplos descritos anteriormente, la energía de alta frecuencia y la relación de la energía de alta frecuencia a la energía total se obtienen usando una secuencia de coeficientes de MDCT, pero la energía de alta frecuencia y la relación de la energía de alta frecuencia a la energía total se pueden obtener usando una serie espectral de potencia o una serie de energía de cada banda de frecuencia.
<Unidad de juicio de procesamiento de codificación adecuado 382 >
La unidad de juicio de procesamiento de codificación adecuado 382 hace un juicio en cuanto si una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para un procesamiento de codificación de la primera unidad de codificación 101 o un procesamiento de codificación de la segunda unidad de codificación 201 y emite el resultado del juicio (paso S382).
En lo sucesivo, se describirá un ejemplo de la operación de la unidad de juicio de procesamiento de codificación adecuado 382. La unidad de juicio de procesamiento de codificación adecuado 382 realiza un procesamiento en cada paso ilustrado en la Fig. 5. En el siguiente ejemplo, el procesamiento de codificación de la primera unidad de codificación 101 es un procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal, que se ilustra en la Bibliografía no de Patentes 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es un procesamiento de codificación que implica codificación de longitud variable que se realiza sobre un diferencial entre el valor logarítmico de la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía promedio de un dominio de la frecuencia adyacente, que se ilustra en la Bibliografía no de Patentes 2.
En este ejemplo, si los ascensos y descensos de una envolvente espectral de una señal de sonido de entrada son pronunciados o/y el grado de concentración de la envolvente espectral es alto, se juzga que una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101; si los ascensos y descensos de una envolvente espectral de una señal de sonido de entrada son suaves o/y el grado de concentración de la envolvente espectral es bajo, se juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201. Entonces se emite el resultado del juicio.
Como método de estimación de los ascensos y descensos y el grado de concentración de un espectro, se puede adoptar cualquier método; en el siguiente ejemplo, se describirá una configuración en la que se estima la profundidad del valle de un espectro o la envolvente del mismo. En esta configuración, se juzga que los ascensos y descensos de un espectro son suaves y el grado de concentración del espectro es bajo si el valle del espectro o la envolvente del mismo es poco profundo y que los ascensos y descensos de un espectro son pronunciados y el grado de concentración del espectro es alto si el valle del espectro o la envolvente del mismo es profundo. El valle poco profundo de un espectro o la envolvente del mismo se traduce en un suelo de ruido alto. Además, el valle profundo de un espectro o la envolvente del mismo se traduce en un suelo de ruido bajo.
La unidad de juicio de procesamiento de codificación adecuado 382 divide primero la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en Q secuencias de coeficientes parciales XSf(1)(n) (n = 1, ..., P), XSf(2)(n) (n = 1, ..., P), ..., XSf(Q)(n) (n = 1, ..., P), cada una que tiene P muestras (Paso S3821). P y Q son números enteros positivos que satisfacen la relación P x Q = N. P puede ser 1. Además, aquí, se adopta una configuración en la que una secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) que es una secuencia de coeficientes en el dominio de la frecuencia que se ha de someter a procesamiento de codificación en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 también se usa en la en la unidad de juicio de procesamiento de codificación adecuado 382, pero una secuencia de coeficientes en el dominio de la frecuencia obtenida por conversión en el dominio de la frecuencia en un grado diferente de precisión y mediante un método diferente de los adoptados para la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N), por ejemplo, una serie espectral de potencia se puede usar como objeto sobre el que se ha de realizar un procesamiento mediante la unidad de juicio de procesamiento de codificación adecuado 382.
La unidad de juicio de procesamiento de codificación adecuado 382 obtiene entonces una serie AVEXS(q) (q = 1, ..., Q) formada por el valor medio de la potencia o el valor logarítmico del mismo de cada una de las secuencias de coeficientes parciales XSf(1)(n) (n = 1, ..., P), XSf(2)(n) (n = 1, ..., P), ..., XSf(Q)(n) (n = 1, ..., P) (Paso S3822). El valor medio de la potencia es AVEXS(q) obtenido mediante la fórmula (3). Además, el valor logarítmico del valor medio de la potencia es AVEXS(q) obtenido mediante la fórmula (3A).
Figure imgf000008_0001
La unidad de juicio de procesamiento de codificación adecuado 382 juzga entonces, para cada elemento de la serie AVExs(1), AVExs(2), ..., AVExs(Q) formada por el valor medio de la potencia o el valor logarítmico del valor medio de la potencia, si el elemento es o no menor que ambos de dos elementos adyacentes y obtiene el número de elementos juzgado que es menor que ambos de los dos elementos adyacentes (Paso s3823). Es decir, la unidad de juicio de procesamiento de codificación adecuado 382 obtiene el número Vally de q que satisface la fórmula (4).
AVE\s(q) - inin(AVE\>;tq-1 K AVLxs(q l l )) < 0 (4)
La unidad de juicio de procesamiento de codificación adecuado 382 obtiene entonces el valor medio EV de Vally AVExs(q) correspondiente a q que satisface la fórmula (4), es decir, el valor medio Ev de las regiones parciales del valle (Paso S3824). Si AVExs(q) es el valor medio de la potencia, Ev obtenido en el Paso S3824 es el valor medio de la potencia de las regiones parciales en una parte del valle. Si AVExs(q) es el valor logarítmico del valor medio de la potencia, Ev obtenido en el Paso S3824 es el valor medio del valor logarítmico del valor medio de la potencia de las regiones parciales en una parte del valle. Además, la unidad de juicio de procesamiento de codificación adecuado 382 obtiene el valor medio de potencia o el valor logarítmico del valor medio de potencia de todas las regiones parciales (Paso S3825). El valor medio de la potencia de todas las regiones parciales es el valor medio de la potencia de la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) y es E obtenido mediante la fórmula (11). El valor logarítmico del valor medio de la potencia de todas las regiones parciales es el valor logarítmico del valor medio de la potencia de la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) y es E obtenido mediante la fórmula (11A).
Figure imgf000009_0001
La unidad de juicio de procesamiento de codificación adecuado 382 juzga entonces que, dado que se estima que el valle de un espectro es poco profundo y el espectro es un espectro cuya envolvente espectral tiene ascensos y descensos suaves o cuyo grado de concentración es bajo si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es menor o igual que un valor umbral predeterminado TH2, una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201. Por el contrario, dado que se estima que el valle de un espectro es profundo y el espectro es un espectro cuya envolvente espectral tiene ascensos y descensos pronunciados o cuyo grado de concentración es alto si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor que el valor umbral TH2, la unidad de juicio de procesamiento de codificación adecuado 382 juzga que una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101. La unidad de juicio de procesamiento de codificación adecuado 382 emite información sobre qué procesamiento de codificación es adecuado (Paso S3826). También se hace referencia a la información sobre un procesamiento de codificación adecuado como información de idoneidad.
Además, en el Paso S3821, se pueden adoptar diferentes números de muestra para diferentes secuencias de coeficientes parciales. Por ejemplo, la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama se puede dividir en Q secuencias de coeficientes parciales XSf(1)(n) (n = 1, ..., P1), XSf(2)(n) (n = 1, ..., P2), ..., XSf(Q)(n) (n = 1, ..., Pq). P1, P2, ..., Pq son números enteros positivos que satisfacen P1 P2 ... Pq = N. Además, es preferible que P1, P2, ..., Pq satisfagan P1 < P2 < ... < Pq. Además, Q es un número entero positivo.
<Unidad de selección de conmutación 383>
En base a la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 y la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382, la unidad de selección de conmutación 383 selecciona si codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 y emite un código de conmutación que es un código por el cual se puede identificar el procesamiento de codificación seleccionado (Paso S383). El código de conmutación de salida se introduce en un dispositivo de decodificación 400. Aquí, si no se permite la conmutación, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior independientemente del procesamiento de codificación para el que la presente trama es adecuada. Además, si se permite la conmutación, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante el procesamiento de codificación para el cual la presente trama es adecuada independientemente del procesamiento de codificación de la trama anterior. No obstante, puede haber un caso donde, incluso cuando se permita la conmutación, la unidad de selección de conmutación 383 seleccione codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior, no mediante el procesamiento de codificación para el que la presente trama es adecuada.
En lo sucesivo, se describirá un ejemplo de la operación de la unidad de selección de conmutación 383. En el siguiente ejemplo, el procesamiento de codificación de la primera unidad de codificación 101 es el procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal, que se ilustra en la Bibliografía no de Patentes 1, y el procesamiento de codificación de la segunda la unidad de codificación 201 es un procesamiento de codificación que implica codificación de longitud variable que se realiza sobre un diferencial entre el valor logarítmico de la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía promedio de un dominio de la frecuencia adyacente, que se ilustra en la Bibliografía no de Patentes 2.
Si la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que no se permite la conmutación y/o la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica que el mismo procesamiento de codificación que el procesamiento de codificación realizado en la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, N) de la trama anterior, la unidad de selección de conmutación 383 selecciona el mismo procesamiento de codificación que el procesamiento de codificación realizado en la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior como el procesamiento de codificación que se realiza en la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama.
Es decir, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que no se permite la conmutación, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama también en la primera unidad de codificación 110. Además, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la primera unidad de codificación 101, la unidad de selección de conmutación 383 también selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama también en la primera unidad de codificación 101.
Además, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que no se permite la conmutación, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama también en la segunda unidad de codificación 201. Además, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 también selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama también en la segunda unidad de codificación 201.
Si la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que se permite la conmutación y la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica un procesamiento de codificación que es diferente del procesamiento de codificación realizado sobre la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior, la unidad de selección de conmutación 383 selecciona el procesamiento de codificación que es diferente del procesamiento de codificación realizado en la secuencia de coeficientes de MDCT Xm(n) (n = 1, ..., N) de la trama anterior como procesamiento de codificación que se realiza sobre la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama. Es decir, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que se permite la conmutación y la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en la segunda unidad de codificación 201. Además, si la secuencia de coeficientes de MDCT Xf- 1(n) (n = 1, ... , N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que se permite la conmutación y la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la primera unidad de codificación 101, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en la primera unidad de codificación 101.
<Unidad de conmutación 384>
La unidad de conmutación 384 realiza un control para introducir la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) emitida desde la unidad de conversión en el dominio de la frecuencia 110 a la primera unidad de codificación 101 o a la segunda unidad de codificación 201 de manera que la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama se codifique mediante el procesamiento de codificación seleccionado mediante la unidad de selección de conmutación 383 (Paso S384). Además, si la señal de sonido de entrada xf(n) (n = 1, ..., Nt) de la presente trama también es necesaria para la codificación de la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama, la unidad de conmutación 384 también introduce la señal de sonido de entrada xf(n) (n = 1, ..., Nt) de la presente trama a la primera unidad de codificación 101 o/y a la segunda unidad de codificación 201.
Por ejemplo, si el procesamiento de codificación de la primera unidad de codificación 101 es un procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal, que se ilustra en la Bibliografía no de Patentes 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es un procesamiento de codificación que implica codificación de longitud variable que se realiza sobre un diferencial entre la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y la energía promedio de un dominio de la frecuencia adyacente, que se ilustra en la Bibliografía no de Patentes 2, dado que la señal de sonido de entrada Xf(n) (n = 1, Nt) de la presente trama es necesaria solamente en la primera unidad de codificación 101, la unidad de conmutación 384 también introduce la señal de sonido de entrada xf(n) (n = 1, ..., Nt) de la presente trama a la primera unidad de codificación 101 cuando se introduce la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) a la primera unidad de codificación 101.
<Primera unidad de codificación 101, segunda unidad de codificación 201 >
Tanto la primera unidad de codificación 101 como la segunda unidad de codificación 201 realizan el procesamiento de codificación de codificar una secuencia de coeficientes en el dominio de la frecuencia, pero la primera unidad de codificación 101 y la segunda unidad de codificación 201 realizan diferentes tipos de procesamiento de codificación. Es decir, la primera unidad de codificación 101 codifica una secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la segunda unidad de codificación 201 y emite un primer código que es un código obtenido de este modo (Paso S101). Además, la segunda unidad de codificación 201 codifica una secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la primera unidad de codificación 101 y emite un segundo código que es un código obtenido de este modo (Paso S201). Por ejemplo, la primera unidad de codificación 101 realiza un procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal, y la segunda unidad de codificación 201 realiza un procesamiento de codificación usando la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división.
En lo sucesivo, se describirá un ejemplo de la operación de la primera unidad de codificación 101 y la segunda unidad de codificación 201. En el siguiente ejemplo, el procesamiento de codificación de la primera unidad de codificación 101 es un procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal, que se ilustra en la Bibliografía no de Patentes 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es un procesamiento de codificación que implica codificación de longitud variable que se realiza sobre un diferencial entre la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y la energía promedio de un dominio de la frecuencia adyacente, que se ilustra en la Bibliografía no de Patentes 2.
En este ejemplo, como se ilustra en el lado izquierdo de la Fig.8, un primer procesamiento de codificación mediante la primera unidad de codificación 101 expresa una forma de envolvente espectral en el dominio de la frecuencia mediante coeficientes que son convertibles en coeficientes de predicción lineal. Por otra parte, como se ilustra en el lado derecho de la Fig.8, un segundo procesamiento de codificación mediante la segunda unidad de codificación 201 expresa una forma de envolvente mediante una banda de factor de escala (división de una secuencia de coeficientes en el dominio de la frecuencia en una pluralidad de regiones). Se puede decir que el segundo procesamiento de codificación es muy eficiente si el valor medio cambia suavemente porque el segundo procesamiento de codificación usa codificación de longitud variable del valor diferencial de la altura promedio de cada región.
En base al resultado de la decisión o selección hecha mediante la unidad de selección 380, se realiza uno del procesamiento de la primera unidad de codificación 101 y el procesamiento de la segunda unidad de codificación 201, que son una pluralidad de tipos de procesamiento de codificación en el dominio de la frecuencia.
<Primera unidad de codificación 101 >
La primera unidad de codificación 101 incluye la unidad de codificación de análisis de predicción lineal 120, la unidad de generación de secuencia de coeficientes de envolvente espectral 130, la unidad de normalización de envolvente 140 y la unidad de codificación de coeficientes normalizados 150. A la primera unidad de codificación 101, se introducen la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) y la señal de sonido de entrada xf(n) (n = 1, ..., Nt) de la presente trama, y se emite a partir de la misma un primer código que contiene un código de coeficiente de predicción lineal CLf y un código de coeficiente normalizado CNf. El primer código de salida se introduce al dispositivo de decodificación 400. Por cierto, la primera unidad de codificación 101 es la que se obtiene eliminando, del procesamiento de codificación descrito en la Bibliografía no de Patentes 1, una parte que convierte una señal de sonido de entrada en una secuencia de coeficientes en el dominio de la frecuencia. Es decir, el procesamiento de codificación que se realiza en la unidad de conversión en el dominio de la frecuencia 110 y en la primera unidad de codificación 101 es similar al procesamiento de codificación descrito en la Bibliografía no de Patentes 1.
<Unidad de codificación de análisis de predicción lineal 120>
La unidad de codificación de análisis de predicción lineal 120 obtiene coeficientes que son convertibles en coeficientes de predicción lineal realizando un análisis de predicción lineal sobre la señal de sonido de entrada. xf(n) (n = 1, ..., Nt), y obtiene un código de coeficiente de predicción lineal CLf y coeficientes que son convertibles en coeficientes de predicción lineal cuantificados correspondientes al código de coeficiente de predicción lineal CLf codificando los coeficientes que son convertibles en coeficientes de predicción lineal y emite el código de coeficiente de predicción lineal CLf y los coeficientes (Paso S120). Los coeficientes que son convertibles en coeficientes de predicción lineal son coeficientes de predicción lineal en sí mismos, coeficientes PARCOR (coeficientes de autocorrelación parcial), parámetros de LSP o similares.
<Unidad de generación de secuencia de coeficientes de envolvente espectral 130>
La unidad de generación de secuencia de coeficientes de envolvente espectral 130 obtiene una secuencia de coeficientes de envolvente espectral de potencia Wf(n) (n = 1, ..., N) correspondiente a los coeficientes que son convertibles en los coeficientes de predicción lineal cuantificados obtenidos mediante la unidad de codificación de análisis de predicción lineal 120 y emite la secuencia de coeficientes de envolvente espectral de potencia Wf(n) (n = 1, ..., N) (Paso S130).
<Unidad de normalización de envolvente 140>
La unidad de normalización de envolvente 140 normaliza cada coeficiente Xf(n) (n = 1, ..., N) de la secuencia de coeficientes de MDCT obtenida mediante la unidad de conversión en el dominio de la frecuencia 110 usando la secuencia de coeficientes de envolvente espectral de potencia Wf(n) (n = 1, ..., N) obtenida mediante la unidad de generación de secuencia de coeficientes de envolvente espectral 130 y emite una secuencia de coeficientes de MDCT normalizados XNf(n) (n = 1, ..., N) (Paso S140). Es decir, la unidad de normalización de envolvente 140 obtiene, como la secuencia de coeficientes de MDCT normalizados XNf(n) (n = 1, ..., N), una serie formada por valores obtenidos dividiendo cada coeficiente de la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) por un coeficiente correspondiente contenido en la secuencia de coeficientes de envolvente espectral de potencia Wf(n) (n = 1, ..., N).
<Unidad de codificación de coeficientes normalizados 150>
La unidad de codificación de coeficientes normalizados 150 obtiene el código de coeficiente normalizado CNf codificando la secuencia de coeficientes de MDCT normalizados XNf(n) (n = 1, ..., N) obtenida mediante la unidad de normalización de envolvente 140 (Paso S150).
<Segunda unidad de codificación 201 >
Además, la segunda unidad de codificación 201 incluye la unidad de división de región 220, la unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 y la unidad de codificación de coeficientes 250. Para la segunda unidad de codificación 201, se introduce la secuencia de coeficientes de MDCT Xf(N) (n = 1, ..., N) de la presente trama, y se emite a partir de la misma un segundo código que contiene un código de energía promedio CAf y un código de coeficiente CDf. El segundo código de salida se introduce en el dispositivo de decodificación 400. Por cierto, la segunda unidad de codificación 201 es lo que se obtiene eliminando, del procesamiento de codificación descrito en la Bibliografía no de Patentes 2, una parte que convierte una señal de sonido de entrada en una secuencia de coeficientes en el dominio de la frecuencia. Es decir, el procesamiento de codificación que se realiza en la unidad de conversión en el dominio de la frecuencia 110 y en la segunda unidad de codificación 201 es similar al procesamiento de codificación descrito en la Bibliografía no de Patentes 2.
<Unidad de división de región 220>
La unidad de división de región 220 divide la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) obtenida mediante la unidad de conversión en el dominio de la frecuencia 110 en una pluralidad de regiones parciales de manera que cuanto más bajas sean las frecuencias de las regiones parciales, menor llegará a ser el número de muestras de las regiones parciales; cuanto más altas sean las frecuencias de las regiones parciales, mayor llegará a ser el número de muestras de las regiones parciales (Paso S220). Si el número de regiones parciales se supone que es R y el número de muestras contenido en las regiones parciales se supone que es S1, ..., Sr, cada coeficiente Xf(n) (n = 1, ..., N) de la secuencia de coeficientes de MDCT se divide en regiones parciales de la muestra en la frecuencia más baja en orden de la siguiente manera: XBf(1)(n) (n = 1, ..., S1), XBf(2)(n) (n = 1, ..., S2), ..., XBf(R)(n) (n = 1, ..., Sr). R y S1, ..., Sr son números enteros positivos. Se supone que S1, ..., Sr satisfacen la relación S1 < S2 <; ... < Sr. Se hace referencia a XBf(1)(n) (n = 1, ..., S1), XBf(2)(n) (n = 1, ..., S2), ..., XBf(R)(n) (n = 1, ..., Sr) como secuencia de coeficientes de región parcial.
<Unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240>
La unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 obtiene, para cada región parcial obtenida mediante la unidad de división de región 220, la energía promedio de los coeficientes contenidos en la región parcial, cuantifica cada energía promedio de la región parcial en los ejes logarítmicos, realiza una codificación de longitud variable sobre una diferencia en el valor de cuantificación de la energía promedio en los ejes logarítmicos entre las regiones parciales adyacentes y obtiene un código de energía promedio CAf (Paso S240). La unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 primero obtiene la energía promedio EXB(r) (r = 1, ..., R) de cada región parcial r (r = 1, ..., R) mediante la fórmula (5) (Paso S2401).
Figure imgf000013_0001
La unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 realiza entonces una cuantificación escalar de la energía promedio EXB(r) (r = 1, R) en el dominio logarítmico para cada región parcial y obtiene un valor de cuantificación Q(log (EXB(r))) (r = 1, ..., R) de la energía promedio en el dominio logarítmico (Paso S2402). La unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 obtiene entonces, para cada región parcial, una diferencia DiffEXB(r) entre el valor de cuantificación Q(log(EXS(r))) de la energía promedio en el dominio logarítmico y el valor de cuantificación Q(log(EXS(r-1))) de la energía promedio en el dominio logarítmico, la energía promedio de los coeficientes contenidos en una región parcial adyacente (Paso S2403). No obstante, cuando r = 1, el valor de cuantificación escalar Q(log(EXS(r))) en sí mismo del valor logarítmico de la energía promedio Exb(1) se usa como DiffEXB(1). Se hace referencia a DiffEXB(r) (r = 1, ..., R) como diferencial de energía logarítmica promedio. Es decir, DiffEXB(r) (r = 1, ..., R) se obtiene mediante la fórmula (6). No obstante, se supone que Q() es una función de cuantificación escalar y se supone que es una función que emite un valor entero que se obtiene redondeando una fracción decimal de un valor obtenido normalizando (dividiendo) una entrada por un valor predeterminado.
DiffExsír) - Q(log(E*B(r))) - Q(logf EXB(f-1))) fr > 2 )
DiffExB(l) = Q(logíExK(im (ó)
La unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 obtiene un código de energía promedio CAf realizando una codificación de longitud variable en el diferencial de energía logarítmica promedio DiffEXB(r) (r = 1, ..., R) (Paso S2404). Por cierto, dado que la frecuencia estadística de aparición es alta cuando el valor absoluto del diferencial de energía logarítmica promedio DiffEXB(r) es pequeño, el código de longitud variable se determina por adelantado de manera que la cantidad de código llegue a ser menor que en un caso donde el valor absoluto es grande. Es decir, cuando las fluctuaciones en la energía logarítmica promedio en cada región son pequeñas, es decir, los ascensos y descensos de una envolvente espectral son suaves, hay una tendencia a ser capaz de acortar la longitud del código del código de energía promedio CAf si el grado de concentración de la envolvente espectral es bajo.
<Unidad de codificación de coeficientes 250>
La unidad de codificación de coeficientes 250 obtiene un código de coeficientes CDf realizando, por ejemplo, una cuantificación escalar sobre cada coeficiente de la secuencia de coeficientes de región parcial XBf(1)(n) (n = 1, ..., S1), XBf(2)(n) (n = 1, ..., S2), ..., XBf(R) (n) (n = 1, ..., Sr) obtenida mediante la unidad de división de región 220 usando el valor de cuantificación Q(log(EXB(r))) (r = 1, ..., R) de la energía promedio en el dominio logarítmico obtenido mediante la unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 (Paso S250). El ancho del paso de cuantificación y el número de bits de cuantificación que se usan para esta cuantificación escalar se determinan a partir del valor de cuantificación Q(EXB(r)) (r = 1, ..., R) de la energía promedio para cada secuencia de coeficientes de región parcial XBf(1)(n) (n = 1, ..., S1), XBf(2)(n) (n = 1, ..., S2), ..., XBf(R)(n) (n = 1, ..., Sr) obtenida mediante la unidad de división de región 220. Por cierto, el valor de cuantificación Q(Exb(Ó) (r = 1, ..., R) de la energía promedio se obtiene convirtiendo el valor de cuantificación Q(log(EXB(r))) (r = 1, ..., R) de la energía promedio en el dominio logarítmico en un valor en el dominio lineal mediante la fórmula (7).
Q(EXB(r)) = eQ(los(ExB(r))) (7)
La unidad de codificación de coeficientes 250 distribuye primero el número de bits dado como la cantidad de código del código de coeficiente CDf a los coeficientes de cada secuencia de coeficientes de región parcial con consideración dada al valor de cuantificación Q(log(EXB(r))) (r = 1, ..., R) de la energía promedio en el dominio logarítmico correspondiente a cada región y un valor de una diferencia entre ese valor y el valor logarítmico de energía a un nivel espectral indiscernible audiblemente que se estima por la frecuencia (Paso S2501).
La unidad de codificación de coeficientes 250 determina entonces el ancho de paso de cuantificación escalar de cada coeficiente de cada secuencia de coeficientes de región parcial a partir del valor de cuantificación Q(EXB(r)) (r = 1, ..., R) de la energía promedio de cada región parcial y el número de bits distribuidos (Paso S2502).
La unidad de codificación de coeficientes 250 obtiene entonces un código de coeficientes CDf cuantificando cada coeficiente de cada secuencia de coeficientes de región parcial por el ancho de paso determinado de este modo y el número de bits y realizar una codificación de longitud variable sobre el valor entero de cada coeficiente cuantificado (Paso S2503).
<Dispositivo de decodificación 400>
La configuración del dispositivo de decodificación 400 se representa en la Fig. 2. El dispositivo de decodificación 400 incluye una unidad de conmutación 480, una primera unidad de decodificación 401 y una segunda unidad de decodificación 501. La primera unidad de decodificación 401 incluye, por ejemplo, una unidad de decodificación de predicción lineal 420, una unidad de generación de secuencia de coeficientes de envolvente espectral 430, una unidad de decodificación de coeficientes normalizados 450 y una unidad de normalización inversa de envolvente 440. La segunda unidad de decodificación 501 incluye, por ejemplo, una unidad de decodificación de longitud variable de diferencial de energía logarítmica promedio 540 y una unidad de decodificación de coeficientes 550. Al dispositivo de decodificación 400, un código que contiene un código de conmutación y un código de entrada se introduce trama a trama, que es un segmento de tiempo predeterminado. En el caso de la trama codificada en la primera unidad de codificación 101, el código de entrada contiene el código de coeficiente de predicción lineal CLf y el código de coeficiente normalizado CNf; en el caso de la trama codificada en la segunda unidad de codificación 201, el código de entrada contiene el código de energía promedio CAf y el código de coeficiente CDf. En lo sucesivo, se describirá el procesamiento específico de cada unidad en base a la premisa de que la trama que se está procesando actualmente es una trama de orden f.
En lo sucesivo, se describirá la operación del dispositivo de decodificación 400.
<Unidad de conmutación 480>
La unidad de conmutación 480 selecciona si decodificar el código de entrada de la presente trama en la primera unidad de decodificación 401 o en la segunda unidad de decodificación 501 en base al código de conmutación de entrada y realiza un control de tal forma que introduzca el código de entrada a la primera unidad de decodificación 401 o a la segunda unidad de decodificación 501 de manera que se realice el procesamiento de decodificación seleccionado (Paso S480).
Específicamente, si el código de conmutación de entrada es un código que especifica el procesamiento de codificación de la primera unidad de codificación 101, es decir, un código que especifica el procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal, la unidad de conmutación 480 realiza el control de tal forma que introduzca el código de entrada a la primera unidad de decodificación 401 que realiza el procesamiento de decodificación correspondiente al procesamiento de codificación de la primera unidad de codificación 101. Además, si el código de conmutación de entrada es un código que especifica el procesamiento de codificación de la segunda unidad de codificación 201, es decir, un código que especifica el procesamiento de codificación que implica una codificación de longitud variable que se realiza sobre un diferencial entre la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y la energía promedio de un dominio de la frecuencia adyacente, la unidad de conmutación 480 realiza un control de tal forma que introduzca el código de entrada a la segunda unidad de decodificación 501 que realiza el procesamiento de decodificación correspondiente al procesamiento de codificación de la segunda unidad de codificación 201.
<Primera unidad de decodificación 401 >
La primera unidad de decodificación 401 incluye la unidad de decodificación de predicción lineal 420, la unidad de generación de secuencia de coeficientes de envolvente espectral 430, la unidad de decodificación de coeficientes normalizados 450 y la unidad de normalización inversa de envolvente 440. A la primera unidad de decodificación 401, se introducen el código de coeficiente de predicción lineal CLf y el código de coeficiente normalizado CNf de la presente trama, y se emite a partir de la misma una secuencia de coeficientes Xf(n) (n = 1, ..., N) en el dominio de la frecuencia.
<Unidad de decodificación de predicción lineal 420>
La unidad de decodificación de predicción lineal 420 obtiene coeficientes que son convertibles en coeficientes de predicción lineal decodificados decodificando el código de coeficiente de predicción lineal CLf contenido en el código de entrada. Los coeficientes que son convertibles en coeficientes de predicción lineal decodificados son los mismos que los coeficientes que son convertibles en los coeficientes de predicción lineal cuantificados obtenidos mediante la unidad de codificación de análisis de predicción lineal 120 del dispositivo de codificación 300. Además, el procesamiento de decodificación que se realiza mediante la unidad de decodificación de predicción lineal 420 corresponde al procesamiento de codificación que se realiza mediante la unidad de codificación de análisis de predicción lineal 120 del dispositivo de codificación 300. Por cierto, los coeficientes que son convertibles en coeficientes de predicción lineal son coeficientes de predicción lineal en sí mismos, coeficientes PARCOR (coeficientes de autocorrelación parcial), parámetros de LSP o similares.
<Unidad de generación de secuencia de coeficientes de envolvente espectral 430>
La unidad de generación de secuencia de coeficientes de envolvente espectral 430 obtiene una secuencia de coeficientes de envolvente espectral de potencia Wf(n) (n = 1, ..., N) correspondiente a los coeficientes obtenidos mediante la unidad de decodificación de predicción lineal 420, que son convertibles en coeficientes de predicción lineal decodificados, y emite la secuencia de coeficientes de envolvente espectral de potencia Wf(n) (n = 1, N). No obstante, N es un número de muestras en el dominio de la frecuencia y es un número entero positivo.
<Unidad de decodificación de coeficientes normalizados 450>
La unidad de decodificación de coeficientes normalizados 450 obtiene una secuencia de coeficientes de MDCT normalizados decodificados AXNf(n) (n = 1, ..., N) decodificando el código de coeficiente normalizado de entrada CNf (Paso S450). Aquí, el procesamiento de decodificación que se realiza mediante la unidad de decodificación de coeficientes normalizados 450 corresponde al procesamiento de codificación que se realiza mediante la unidad de codificación de coeficientes normalizados 150 del dispositivo de codificación 300. Es decir, si el procesamiento de conversión en el dominio de la frecuencia que no es MDCT se realiza en el dispositivo de codificación 300, AXNf(n) (n = 1, ..., N) es una secuencia de coeficientes en el dominio de la frecuencia, que no es MDCT, correspondiente al procesamiento de conversión en el dominio de la frecuencia realizado en el dispositivo de codificación 300. Por cierto, aunque la secuencia de coeficientes de MDCT normalizados decodificada AXNf(n) (n =1, ..., N) corresponde a la secuencia de coeficientes de MDCT normalizados XNf(n) (n = 1, ..., N) introducida a la unidad de codificación de coeficientes normalizados 150 del dispositivo de codificación 300, dado que un error de cuantificación está contenido en cada coeficiente, se usa AXNf(n) obtenida sumando “A” a XNf(n).
<Unidad de normalización inversa de envolvente 440>
La unidad de normalización inversa de envolvente 440 realiza una normalización inversa en cada coeficiente AXNf(n) (n = 1, ..., N) de la secuencia de coeficientes de MDCT normalizados decodificada obtenida mediante la unidad de decodificación de coeficientes normalizados 450 usando la secuencia de coeficientes de envolvente espectral de potencia Wf(n) (n = 1, ..., N) obtenida mediante la unidad de generación de secuencia de coeficientes de envolvente espectral 430, y emite una secuencia de coeficientes de MDCT decodificados AXNf(n) (n = 1, ..., N) (Paso S440). Es decir, la unidad de normalización inversa de envolvente 440 obtiene una serie formada por valores obtenidos multiplicando los coeficientes correspondientes de los coeficientes de la secuencia de coeficientes de MDCT normalizados decodificada XNf(n) (n = 1, ..., N) y los coeficientes de la secuencia de coeficientes de envolvente espectral de potencia Wf(n) (n = 1, ..., N) como la secuencia de coeficientes de MDCT decodificados AXf(n) (n = 1, ..., N).
<Segunda unidad de decodificación 501 >
La segunda unidad de decodificación 501 incluye la unidad de decodificación de longitud variable de diferencial de energía logarítmica promedio 540 y la unidad de decodificación de coeficientes 550. A la segunda unidad de decodificación 501, se introducen el código de energía promedio CAf y el código de coeficiente CDf de la presente trama, y se emite a partir de la misma una secuencia de coeficientes Xf(n) (n = 1, ..., N) en el dominio de la frecuencia
<Unidad de decodificación de longitud variable de diferencial de energía logarítmica promedio 540>
La unidad de decodificación de longitud variable de diferencial de energía logarítmica promedio 540 obtiene una energía promedio decodificada Q(EXB(r)) (r = 1, ..., R) en una región parcial decodificando el código de energía promedio de entrada CAf (paso S540). Por cierto, dado que la energía promedio decodificada es la misma que el valor de cuantificación de la energía promedio obtenida en la unidad de codificación de coeficientes 250 del dispositivo de codificación 300, se usa el mismo símbolo Q(EXB(r)).
La unidad de decodificación de longitud variable de diferencial de energía logarítmica promedio 540 primero obtiene una diferencia DiffEXB(r) (r = 1, ..., R) en energía en el dominio logarítmico de cada región parcial decodificando el código de energía promedio CAf (Paso S5401). Aquí, el procesamiento de decodificación que se realiza mediante la unidad de decodificación de longitud variable de diferencial de energía logarítmica promedio 540 corresponde al procesamiento de codificación que se realiza mediante la unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 del dispositivo de codificación 300. Por cierto, dado que una diferencia en la energía en el dominio logarítmico de cada región parcial es la misma que una diferencia de energía en el dominio logarítmico de cada región parcial que se obtiene en la unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 del dispositivo de codificación 300, se usa el mismo símbolo DiffEXB(r).
La unidad de decodificación de longitud variable de diferencial de energía logarítmica promedio 540 obtiene entonces, para cada región parcial, un valor decodificado Q(log(EXB(r))) de la energía promedio en el dominio logarítmico sumando la diferencia DiffEXB(r) (r = 1, ..., R) en energía en el dominio logarítmico a un valor decodificado Q(log(EXB(r-1))) de la energía promedio en el dominio logarítmico de un región parcial adyacente (Paso S5402). Por cierto, dado que el valor decodificado de la energía promedio en el dominio logarítmico es el mismo que el valor de cuantificación de la energía promedio en el dominio logarítmico que se obtiene en la unidad de codificación de longitud variable de diferencial de energía logarítmica promedio 240 del dispositivo de codificación 300, se usa el mismo símbolo Q(log(EXB(r))).
Q O o g í K x i í t lD j - D i f í E ^ O )
Q('log(Exn(r)}) ■■ DiffExB(r) - Q(log(Exn(r-l))) (r > 2) (8)
La unidad de decodificación de longitud variable de diferencial de energía logarítmica promedio 540 obtiene entonces lo que tiene el valor decodificado Q(log(EXB(r-1))) (r = 1, R) de la energía promedio en el dominio logarítmico como un valor en el dominio lineal como energía promedio decodificada Q(ExB(r)) (r = 1, ..., R) (Paso S5403).
<Unidad de decodificación de coeficientes 550>
La unidad de decodificación de coeficientes 550 obtiene una secuencia de coeficientes decodificados AXf(n) (n = 1, ..., N) decodificando el código de coeficiente CDf usando la energía promedio decodificada Q(ExB(r)) (r = 1, ..., R) obtenida en la unidad de decodificación de longitud variable de diferencial de energía logarítmica promedio 540 (Paso S550). Aquí, el procesamiento de decodificación que se realiza mediante la unidad de decodificación de coeficientes 550 corresponde al procesamiento de codificación que se realiza mediante la unidad de codificación de coeficientes 250 del dispositivo de codificación 300. Dado que el código de coeficiente de entrada CDf es lo que se obtuvo realizando codificación de longitud variable sobre cada coeficiente de cada secuencia de coeficientes de región parcial en la unidad de codificación de coeficientes 250 del dispositivo de codificación 300, se puede reconstituir automáticamente la longitud de código de una parte de código del código de coeficiente CDf correspondiente a cada coeficiente. Además, el ancho del paso de cuantificación de cada región se obtiene a partir de la energía promedio decodificada Q(ExB(r)) obtenida en la unidad de decodificación de longitud variable de diferencial de energía logarítmica promedio 540. Como resultado, es posible obtener la secuencia de coeficientes de MDCT decodificados AXf(n) (n = 1, ..., N) en el dominio de la frecuencia del código de coeficiente CDf.
<Unidad de conversión en el dominio del tiempo 410>
La unidad de conversión en el dominio del tiempo 410 obtiene una señal de sonido decodificada Axf(n) (n = 1, ..., Nt) convirtiendo una secuencia de coeficientes de MDCT decodificada AXf(n) (n = 1, ..., N) en el punto N en el dominio del tiempo y emite la señal de sonido decodificada Axf(n) (n = 1, ..., Nt) (Paso S410). No obstante, Nt es un número de muestras en el dominio del tiempo y es un número entero positivo. Si la conversión en el dominio de la frecuencia que no es MDCT se realiza en la unidad de conversión en el dominio de la frecuencia 110 del dispositivo de codificación 300, es necesario realizar simplemente un procesamiento de conversión en el dominio del tiempo correspondiente a ese procesamiento de conversión.
Según la primera realización, dado que la conmutación de un procesamiento de codificación y un procesamiento de decodificación se puede realizar solamente cuando la energía de alta frecuencia de una señal de sonido de entrada sea pequeña, incluso cuando se instala una pluralidad de tipos de procesamiento de codificación y procesamiento de decodificación que son diferentes en las características de cuantificación de las componentes de alta frecuencia, es posible obtener una señal de sonido decodificada que suene menos artificial para un oyente.
Según la primera realización, además, dado que es posible seleccionar un procesamiento de codificación adecuado para una señal de sonido de entrada, sin realizar una codificación real, a partir de un procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal y un procesamiento de codificación que usa la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división, es posible realizar un procesamiento de codificación adecuado para una señal de sonido de entrada con una pequeña cantidad de procesamiento aritmético.
Según la primera realización, además, dado que es posible realizar una codificación seleccionando un procesamiento de codificación a partir de un procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal y un procesamiento de codificación que usa la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división, independientemente de si los ascensos y descensos de un espectro de una señal de sonido de entrada son o no pronunciados y si el grado de concentración del espectro es o no alto, es posible realizar un procesamiento de codificación eficiente independientemente de las características de la señal de sonido de entrada.
Segunda realización
En la primera realización, una secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifica siempre mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior cuando la magnitud de la energía de las componentes de alta frecuencia de una señal de sonido de entrada es grande; una segunda realización permite que una secuencia de coeficientes en el dominio de la frecuencia en la presente trama sea codificada mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior dependiendo del estado en el que las componentes de alta frecuencia de una señal de sonido de entrada son escasas incluso cuando la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada sea grande.
Un dispositivo de codificación de la segunda realización hace posible seleccionar un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior como procesamiento de codificación de la presente trama si la energía de las componentes de alta frecuencia de una señal de sonido de entrada es pequeña; de otro modo, según el estado en el que las componentes de alta frecuencia de la señal de sonido de entrada son escasas, el dispositivo de codificación selecciona si hacer posible seleccionar un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior como procesamiento de codificación de la presente trama o seleccionar el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior como procesamiento de codificación de la presente trama.
La configuración del dispositivo de codificación de la segunda realización es la Fig. 1, que la misma que la primera realización. Un dispositivo de codificación 300 de la segunda realización es el mismo que el dispositivo de codificación 300 de la primera realización, excepto que el procesamiento de la unidad de juicio de permiso de conmutación 381 y la unidad de selección de conmutación 383 en la unidad de selección 380 es diferente de la del dispositivo de codificación 300 de la primera realización. La configuración de un dispositivo de decodificación de la segunda realización es la Fig.2, que es la misma que la primera realización, y el procesamiento de cada unidad también es el mismo que el del dispositivo de decodificación de la primera realización. En lo sucesivo, se describirán la unidad de juicio de permiso de conmutación 381 y la unidad de selección de conmutación 383 en la unidad de selección 380, que realizan un procesamiento diferente del procesamiento realizado en el dispositivo de codificación 300 de la primera realización.
<Unidad de juicio de permiso de conmutación 381 >
La unidad de juicio de permiso de conmutación 381 juzga que, si al menos una de la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la presente trama es menor que un valor umbral predeterminado, se permite la conmutación, es decir, juzga que la unidad de juicio de permiso de conmutación 381 hace posible codificar una secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante un procesamiento de codificación que es diferente del procesamiento de codificación por el cual se codificó la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior, y emite el resultado del juicio (Paso S381). De otro modo, la unidad de juicio de permiso de conmutación 381 no hace ningún juicio tal como que se permite la conmutación o que no se permite la conmutación, y emite información que indica que cualquier juicio, tal como que se permite la conmutación o que no se permite la conmutación, no se ha hecho como resultado del juicio, o no emite ningún resultado del juicio. Como la magnitud de la energía de las componentes de alta frecuencia de una señal de sonido de entrada, como es el caso de la primera realización, se puede usar la energía de alta frecuencia o se puede usar la relación de energía de alta frecuencia a la energía total.
<Unidad de selección de conmutación 383>
La unidad de selección de conmutación 383 selecciona si la secuencia de coeficientes en el dominio de la frecuencia de la presente trama está codificada en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 en base a la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381, la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382, y el estado, que se obtiene de la señal de sonido de entrada, que indica si las componentes de alta frecuencia de la señal de sonido de entrada son o no escasas, y emite un código de conmutación que es un código por el cual se puede identificar el procesamiento de codificación seleccionado (Paso S383B). El código de conmutación de salida se introduce al dispositivo de decodificación 400.
Si la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que se permite la conmutación, es decir, la energía de las componentes de alta frecuencia de la señal de sonido de entrada es pequeña, la unidad de selección de conmutación 383 realiza el mismo procesamiento que la unidad de selección de conmutación 383 de la primera realización. Si la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que no se ha hecho ningún juicio tal como que se permite la conmutación o que no se permite la conmutación o el resultado del juicio no se introduce a la unidad de juicio de permiso de conmutación 381, es decir, si la energía de componentes de alta frecuencia de la señal de sonido de entrada es grande, la unidad de selección de conmutación 383 selecciona si permitir o no que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior en base al estado, que se obtiene de la señal de sonido de entrada, que indica si las componentes de alta frecuencia de la señal de sonido de entrada son o no escasas.
En lo sucesivo, de la operación de la unidad de selección de conmutación 383, se describirá una diferencia de la operación de la unidad de selección de conmutación 383 de la primera realización, es decir, un ejemplo de la operación de la unidad de selección de conmutación 383 cuando la energía de las componentes de alta frecuencia de la señal de sonido de entrada es grande. En el siguiente ejemplo, como es el caso de la primera realización, el procesamiento de codificación de la primera unidad de codificación 101 es un procesamiento de codificación que usa una envolvente espectral en base a los coeficientes que son convertibles en coeficientes de predicción lineal, que se ilustra en la Bibliografía no de Patentes 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es un procesamiento de codificación que implica una codificación de longitud variable que se realiza sobre un diferencial entre el valor logarítmico de la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía promedio de un dominio de la frecuencia adyacente, que se ilustra en la Bibliografía no de Patentes 2. La unidad de selección de conmutación 383 realiza el procesamiento de los Pasos S3831B a S3836B de la Fig. 6, por ejemplo.
La unidad de selección de conmutación 383 divide primero la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en Q secuencias de coeficientes parciales XSf(1)(n) (n = 1, ..., P), XSf(2)(n) (n = 1, ..., P), ..., XSf(Q)(n) (n = 1, ..., P), cada una que tiene P muestras (Paso S3831B). P y Q son números enteros positivos que satisfacen la relación P x Q = N. P puede ser 1. Además, aquí, se adopta una configuración en la que la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) que es una secuencia de coeficientes en el dominio de la frecuencia que se ha de someter a procesamiento de codificación en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 también se usa en la unidad de selección de conmutación 383, pero se adopta una secuencia de coeficientes en el dominio de la frecuencia obtenida mediante la conversión al dominio de la frecuencia en un grado diferente de precisión y mediante un método diferente de los adoptados para la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N), por ejemplo, una serie espectral de potencia se puede usar como objeto sobre el que se ha de realizar el procesamiento mediante la unidad de selección de conmutación 383.
La unidad de selección de conmutación 383 obtiene entonces una serie AVEXS(q) (q = 1, ..., Q) formada por el valor logarítmico del valor medio de potencia de cada una de las secuencias de coeficientes parciales XSf(1)(n ) (n = 1, ..., P), XSf(2)(n) (n = 1, ..., P), ..., XSf(Q)(n) (n = 1, ..., P) (Paso S3832B). El valor logarítmico del valor medio de potencia de cada secuencia de coeficientes parciales es AVEXS(q) que se obtiene mediante la fórmula (3A).
Además, la unidad de selección de conmutación 383 obtiene el valor logarítmico del valor medio de potencia de la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) (Paso S3833B). El valor logarítmico del valor medio de potencia de la secuencia de coeficientes de MDCT es AVETotal que se obtiene mediante la fórmula (9).
Figure imgf000018_0001
La unidad de selección de conmutación 383 obtiene entonces el número de AVEXS(q) en el que q satisface la fórmula (10) dentro del intervalo previamente establecido de QBajo (1 < QBajo) a ÜAlto (QBajo á Qwto á Q), es decir, el intervalo predeterminado de una o más de una región parcial situada en el lado de alta frecuencia, en otras palabras, el número de regiones en el pico (Paso S3834B). g y A son constantes positivas.
AVExíi(q) > U'AVÍ'Tmui ■ A, (10)
La unidad de selección de conmutación 383 juzga entonces que las componentes de alta frecuencia de la señal de sonido de entrada de la presente trama son escasas si el número de regiones en el pico es menor o igual que un valor umbral TH3 y juzga que las componentes de alta frecuencia de la señal de sonido de entrada de la presente trama no son escasa si el número de regiones en el pico excede el valor umbral TH3 (Paso S3835B). Aquí, el valor umbral TH3 es un valor que se determina por una regla predeterminada de manera que, si las componentes de alta frecuencia de la señal de sonido de entrada de una trama pasada cerca de la presente trama son escasas, el valor llega a ser en un valor mayor que un valor que se establece cuando las componentes de alta frecuencia de la señal de sonido de entrada de la trama pasada cerca de la presente trama no son escasas. Por ejemplo, si las componentes de alta frecuencia de la señal de sonido de entrada de la trama pasada cerca de la presente trama son escasas, se usa TH3_1 predeterminado como el valor umbral TH3; Si las componentes de alta frecuencia de la señal de sonido de entrada de la trama pasada cerca de la presente trama no son escasas, se usa TH3_2 predeterminado que es un valor menor que TH3_1 como el valor umbral TH3. Aquí, la trama pasada cerca de la presente trama es, por ejemplo, la trama anterior o la trama antes de la trama anterior. El resultado del juicio en cuanto a si las componentes de alta frecuencia de la señal de sonido de entrada de la presente trama son escasas se almacena en la unidad de selección de conmutación 383 hasta el final de al menos dos tramas después de la presente trama.
La unidad de selección de conmutación 383 selecciona entonces codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama o bien en la primera unidad de codificación 101 o bien en la segunda unidad de codificación 201 en base al procesamiento de codificación de la trama anterior y el resultado del juicio en la presente trama y la trama pasada cerca de la presente trama en cuanto a si las componentes de alta frecuencia de la señal de sonido de entrada son o no escasas (Paso S3836B). Es decir, la unidad de selección de conmutación 383 selecciona si se permite o no que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique mediante un procesamiento de codificación que es diferente de un procesamiento de codificación de la trama anterior.
Por ejemplo, cuando la secuencia de coeficientes de MDCT Xf-i(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101, si las componentes de alta frecuencia de la presente trama no son escasas y las componentes de alta frecuencia son escasas en al menos una de la trama anterior y la trama antes de la trama anterior, la unidad de selección de conmutación 383 hace posible seleccionar codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en la segunda unidad de codificación 201; de otro modo, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en la primera unidad de codificación 101. Es decir, cuando la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101, si las componentes de alta frecuencia de la presente trama no son escasas y las componentes de alta frecuencia son escasas en al menos una de la trama anterior y la trama antes de la trama anterior, la unidad de selección de conmutación 383 permite que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior; de otro modo, la unidad de selección de conmutación 383 no permite que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior.
Además, cuando la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201, si (1) las componentes de alta frecuencia de la presente trama son escasas y las componentes de alta frecuencia de la trama anterior no son escasas o (2) las componentes de alta frecuencia de la presente trama son escasas, las componentes de alta frecuencia de la trama anterior son escasas y las componentes de alta frecuencia de la trama antes de la trama anterior no son escasas, la unidad de selección de conmutación 383 hace posible seleccionar codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en la primera unidad de codificación 101; de otro modo, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en la segunda unidad de codificación 201. Es decir, cuando la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201, si (1) las componentes de alta frecuencia de la presente trama son escasas y las componentes de alta frecuencia de la trama anterior no son escasas o (2) las componentes de alta frecuencia de la presente trama son escasas, las componentes de alta frecuencia de la trama anterior son escasas y las componentes de alta frecuencia de la trama antes de la trama anterior no son escasas, la unidad de selección de conmutación 383 permite que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior; de otro modo, la unidad de selección de conmutación 383 no permite que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique mediante un procesamiento de codificación que es diferente de un procesamiento de codificación de la trama anterior.
Por cierto, si la unidad de selección de conmutación 383 permite que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior, la unidad de selección de conmutación 383 selecciona el procesamiento de codificación de la secuencia de coeficientes en el dominio de la frecuencia de la presente trama en base a la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382. Por ejemplo, si la unidad de selección de conmutación 383 permite que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior, incluso cuando la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201, si la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la primera unidad de codificación 101, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en la primera unidad de codificación 101. Además, si la unidad de selección de conmutación 383 permite que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior, incluso cuando la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101, si la información sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en la segunda unidad de codificación 201.
Por cierto, incluso cuando la unidad de selección de conmutación 383 permita que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama se codifique mediante un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior, si se juzga que la secuencia de coeficientes en el dominio de la frecuencia de la presente trama tiene que ser codificada mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior en base a la otra información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama se puede codificar mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior.
Además, en el paso S3831B, se pueden adoptar diferentes números de muestras para diferentes secuencias de coeficientes parciales. Por ejemplo, la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama se puede dividir en Q secuencias de coeficientes parciales XSf(1)(n) (n = 1, ..., P1), XSf(2)(n) (n = 1, ..., P2), ..., XSf(Q)(n) (n = 1, ..., Pq). P1, P2, ..., Pq son números enteros positivos que satisfacen P1 P2 ... Pq = N. Además, es preferible que P1, P2, ..., Pq satisfagan P1 < P2 < ... < Pq. Además, Q es un número entero positivo.
Además, si la unidad de juicio de procesamiento de codificación adecuado 382 realizó el mismo procesamiento que el procesamiento en el Paso S3831B, el Paso S3832B y el Paso S3833B, la unidad de selección de conmutación 383 puede usar el resultado del procesamiento realizado mediante la unidad de juicio de procesamiento de codificación adecuado 382 sin realizar el Paso S3831B, el Paso S3832B y el Paso S3833B.
Tercera realización
En la primera realización y la segunda realización, un procesamiento de codificación para el que es adecuada la presente trama se juzga usando un valor umbral; en una tercera realización, se hace un juicio usando dos valores umbral.
La configuración de un dispositivo de codificación de la tercera realización es la Fig. 1, que es la misma que la primera realización. Un dispositivo de codificación 300 de la tercera realización es el mismo que el dispositivo de codificación 300 de la primera realización o la segunda realización excepto que el procesamiento de la unidad de juicio de procesamiento de codificación adecuado 382 y la unidad de selección de conmutación 383 en la unidad de selección 380 es diferente del del dispositivo de codificación 300 de la primera realización o la segunda realización. La configuración de un dispositivo de decodificación de la tercera realización es la Fig. 2, que es la misma que la primera realización, y el procesamiento de cada unidad es también el mismo que el del dispositivo de decodificación de la primera realización. En lo sucesivo, se describirá la unidad de juicio de procesamiento de codificación adecuado 382 y la unidad de selección de conmutación 383 en la unidad de selección 380, que realizan un procesamiento diferente del procesamiento realizado en el dispositivo de codificación 300 de la primera realización. <Unidad de juicio de procesamiento de codificación adecuado 382>
La unidad de juicio de procesamiento de codificación adecuado 382 realiza un procesamiento en cada paso ilustrado en la Fig. 7. La unidad de juicio de procesamiento de codificación adecuado 382 juzga si la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101 o el procesamiento de codificación de la segunda unidad de codificación 201, en otras palabras, qué procesamiento de codificación se puede realizar, y emite el resultado del juicio (Paso S382A).
En lo sucesivo, se describirá un ejemplo de la operación de la unidad de juicio de procesamiento de codificación adecuado 382. La unidad de juicio de procesamiento de codificación adecuado 382 realiza un procesamiento en cada paso ilustrado en la Fig. 7. En el siguiente ejemplo, el procesamiento de codificación de la primera unidad de codificación 101 es un procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal, que se ilustra en la Bibliografía no de Patentes 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es un procesamiento de codificación que implica codificación de longitud variable que se realiza sobre un diferencial entre el valor logarítmico de la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía promedio de un dominio de la frecuencia adyacente, que se ilustra en la Bibliografía no de Patentes 2. En este ejemplo, si los ascensos y descensos de una envolvente espectral de una señal de sonido de entrada son pronunciados o/y el grado de concentración de la envolvente espectral es alto, la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101; si los ascensos y descensos de la envolvente espectral de la señal de sonido de entrada son suaves o/y el grado de concentración de la envolvente espectral es bajo, la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201; si los ascensos y descensos de la envolvente espectral de la señal de sonido de entrada son moderados o/y el grado de concentración de la envolvente espectral es medio, la unidad de juicio de procesamiento de codificación adecuado 382 juzga que o bien el procesamiento de codificación de la primera unidad de codificación 101 o bien el procesamiento de codificación de la segunda unidad de codificación 201 se puede realizar sobre la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama, es decir, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201. La unidad de juicio de procesamiento de codificación adecuado 382 emite entonces el resultado del juicio.
Si los ascensos y descensos de la envolvente espectral de la señal de sonido de entrada son moderados o/y el grado de concentración de la envolvente espectral es medio, como se describirá más adelante, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior. Es decir, en la unidad de selección de conmutación 383, el procesamiento de codificación de la presente trama se selecciona de manera que la conmutación del procesamiento de codificación entre la trama anterior y la presente trama no dé al oyente una fuerte sensación de artificialidad. De este modo, un caso donde los ascensos y descensos de la envolvente espectral de la señal de sonido de entrada son moderados o/y el grado de concentración de la envolvente espectral es medio puede incluir no solamente un caso donde o bien el procesamiento de codificación de la primera unidad de codificación 101 o bien el procesamiento de codificación de la segunda unidad de codificación 201 se puede realizar en la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama y un caso donde la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuado tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201, sino también en un caso donde es difícil decir para cuál del procesamiento de la primera unidad de codificación 101 y el procesamiento de codificación de la segunda unidad de codificación 201, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada y un caso donde hay una posibilidad de que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama no sea adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201. Es decir, el juicio descrito anteriormente “que es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación. 201” puede traducirse en un juicio “es imposible juzgar la idoneidad para el procesamiento de codificación de la primera unidad de codificación 101 y la idoneidad para el procesamiento de codificación de la segunda unidad de codificación 201”.
Como método de estimación de los ascensos y descensos y el grado de concentración de un espectro, se puede adoptar cualquier método, y se describirá una configuración en la que se estima la profundidad del valle de una envolvente espectral. En esta configuración, si el valle de una envolvente espectral es poco profundo, se juzga que los ascensos y descensos de un espectro son suaves y el grado de concentración del espectro es bajo; si el valle de una envolvente espectral es profundo, se juzga que los ascensos y descensos de un espectro son pronunciados y el grado de concentración del espectro es alto; si la profundidad del valle de una envolvente espectral es media, se juzga que los ascensos y descensos de un espectro son moderados y el grado de concentración del espectro es medio.
La unidad de juicio de procesamiento de codificación adecuado 382 realiza los Pasos S3821 a S3825 que son los mismos que los de la unidad de juicio de procesamiento de codificación adecuado 382 de la primera realización y el Paso S3826A que es diferente del paso correspondiente de la unidad de juicio de procesamiento de codificación adecuado 382 de la primera realización. En lo sucesivo, se describirá una diferencia de la unidad de juicio de procesamiento de codificación adecuado 382 de la primera realización.
Después del Paso S3825, la unidad de juicio de procesamiento de codificación adecuado 382 realiza el siguiente procesamiento de juicio usando los valores umbral TH2_1 y TH2_2 y la salida de información de idoneidad que se describirá más adelante (Paso S3826A).
Si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es menor que un valor umbral predeterminado TH2_1, dado que se estima que el valle de un espectro es poco profundo y el espectro es un espectro cuya envolvente espectral tiene ascensos y descensos suaves o cuyo grado de concentración es bajo, la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201.
Además, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor que un valor umbral predeterminado TH2_2 que es un valor mayor que el valor umbral TH2_1, dado que se estima que el valle de un espectro es profundo y el espectro es un espectro cuya envolvente espectral tiene ascensos y descensos pronunciados o cuyo grado de concentración es alto, la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101.
Además, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor o igual que el valor umbral TH2_1 pero menor o igual que el valor umbral TH2_2, dado que se estima que la profundidad del valle de un espectro es media y el espectro es un espectro cuya envolvente espectral tiene ascensos y descensos moderados o cuyo grado de concentración es medio, la unidad de juicio de procesamiento de codificación adecuado 382 puede realizar o bien el procesamiento de codificación de la primera unidad de codificación 101 o bien el procesamiento de codificación de la segunda unidad de codificación 201 en la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama. Es decir, la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201.
Entonces, la unidad de juicio de procesamiento de codificación adecuado 382 emite información de idoneidad que es información sobre un procesamiento de codificación adecuado. La información de idoneidad es el resultado del juicio de la unidad de juicio de procesamiento de codificación adecuado 382 y se puede decir que la información de idoneidad es información sobre cuál del procesamiento de codificación de la primera unidad de codificación 101 y el procesamiento de codificación de la segunda unidad de codificación 201 es adecuado o información en cuanto a si tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201 son o no adecuados.
Por cierto, la unidad de juicio de procesamiento de codificación adecuado 382 puede emitir información que indica que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101 o la información que indica que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201 solamente cuando se juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para cualquiera del procesamiento de codificación de la primera unidad de codificación 101 y del procesamiento de codificación de la segunda unidad de codificación 201 y realizar cualquiera del procesamiento de codificación de la primera unidad de codificación 101 y del procesamiento de codificación de la segunda unidad de codificación 201 en la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama. Es decir, se puede adoptar una configuración en la que el resultado del juicio no se emite si se juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201.
<Unidad de selección de conmutación 383>
En base a la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 y la información, que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382, sobre cuál del procesamiento de codificación de la primera unidad de codificación 101 y del procesamiento de codificación de la segunda unidad de codificación 201 es adecuado o la información en cuanto a si tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201 son o no adecuados, es decir, la información (información de idoneidad) sobre un procesamiento de codificación adecuado, la unidad de selección de conmutación 383 selecciona si codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 y emite un código de conmutación que es un código por el cual se puede identificar el procesamiento de codificación seleccionado (Paso S383A). El código de conmutación de salida se introduce al dispositivo de decodificación 400. Aquí, si no se permite la conmutación, independientemente del procesamiento de codificación para el que es adecuada la presente trama, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior. Además, si se permite la conmutación y la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior. Además, si se permite la conmutación y la presente trama es adecuada para cualquiera del procesamiento de codificación de la primera unidad de codificación 101 y el procesamiento de codificación de la segunda unidad de codificación 201, independientemente del procesamiento de codificación de la trama anterior, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante el procesamiento de codificación para el cual la presente trama es adecuada.
En lo sucesivo, se describirá un ejemplo de la operación de la unidad de selección de conmutación 383. En el siguiente ejemplo, el procesamiento de codificación de la primera unidad de codificación 101 es un procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal, que se ilustra en la Bibliografía no de Patentes 1, y el procesamiento de codificación de la segunda unidad de codificación 201 es un procesamiento de codificación que implica codificación de longitud variable que se realiza sobre un diferencial entre el valor logarítmico de la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía promedio de un dominio de la frecuencia adyacente, que se ilustra en Bibliografía no de Patentes 2.
Si la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que no se permite la conmutación y/o la información (información de idoneidad) sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el mismo procesamiento de codificación que el procesamiento de codificación realizado sobre la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior o indica que tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201 son adecuados, la unidad de selección de conmutación 383 selecciona el mismo procesamiento de codificación que el procesamiento de codificación realizado sobre la secuencia de coeficientes de MDCT X f-1 (n) (n = 1, N) de la trama anterior como el procesamiento de codificación que se realiza sobre la secuencia de coeficientes de MDCT X f(n) (n = 1, ..., N) de la presente trama.
Es decir, si la secuencia de coeficientes de MDCT X f-1 (n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que no se permite la conmutación, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama también en la primera unidad de codificación 101. Además, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información (información de idoneidad) sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la primera unidad de codificación 101, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama también en la primera unidad de codificación 101. Además, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101 y la información (información de idoneidad) sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica que tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201 son adecuados, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama también en la primera unidad de codificación 101.
Además, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que no se permite la conmutación, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama también en la segunda unidad de codificación 201. Además, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información (información de idoneidad) sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama también en la segunda unidad de codificación 201. Además, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201 y la información (información de idoneidad) sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica que tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda unidad de codificación 201 son adecuados, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama también en la segunda unidad de codificación 201.
Si la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que se permite la conmutación y la información (información de idoneidad) sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica un procesamiento de codificación que es diferente del procesamiento de codificación realizado sobre la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior, la unidad de selección de conmutación 383 selecciona el procesamiento de codificación que es diferente del procesamiento de codificación realizado en la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior como el procesamiento de codificación que se realiza en la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama. Es decir, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la primera unidad de codificación 101, la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que se permite la conmutación, y la información (información de idoneidad) sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, ..., N) de la presente trama en la segunda unidad de codificación 201. Además, si la secuencia de coeficientes de MDCT Xf-1(n) (n = 1, ..., N) de la trama anterior se codificó en la segunda unidad de codificación 201, la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381 indica que se permite la conmutación, y la información (información de idoneidad) sobre qué procesamiento de codificación es adecuado que se obtuvo mediante la unidad de juicio de procesamiento de codificación adecuado 382 indica el procesamiento de codificación de la primera unidad de codificación 101, la unidad de selección de conmutación 383 selecciona codificar la secuencia de coeficientes de MDCT Xf(n) (n = 1, N) de la presente trama en la primera unidad de codificación 101.
Por cierto, si la unidad de juicio de procesamiento de codificación adecuado 382 está configurada para no emitir el resultado del juicio si se juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201, la unidad de selección de conmutación 383 simplemente tiene que realizar, si no se introduce a la misma la información sobre un procesamiento de codificación adecuado, un procesamiento que se realiza cuando la información descrita anteriormente (información de idoneidad) sobre qué procesamiento de codificación es adecuado indica que tanto el procesamiento de codificación de la primera unidad de codificación 101 como el procesamiento de codificación de la segunda la unidad de codificación 201 son adecuados.
Primera modificación
Como juicio en cuanto a si la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación que usa una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal, que se ilustra en la Bibliografía no de Patentes 1, o el procesamiento de codificación que implica la codificación de longitud variable que se realiza sobre un diferencial entre el valor logarítmico de la energía promedio de los coeficientes en cada dominio de la frecuencia obtenido por división y el valor logarítmico de la energía promedio de un dominio de la frecuencia adyacente, que se ilustra en la Bibliografía no de Patentes 2, se puede hacer un juicio que incluye no solamente la magnitud de los ascensos y descensos de una envolvente espectral de la señal de sonido de entrada y el grado de concentración de la envolvente espectral, sino también la otra información.
Por ejemplo, incluso cuando la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la trama anterior se codificó mediante la primera unidad de codificación 101, la unidad de juicio de permiso de conmutación 381 juzga que se permite la conmutación, y la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201, si se juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama tiene que ser codificada mediante el procesamiento de codificación de la primera unidad de codificación 101 en base a la otra información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama se puede codificar mediante la primera unidad de codificación 101. Es decir, el dispositivo de codificación 300 simplemente tiene que estar configurado para hacer posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama mediante la segunda unidad de codificación 201 si la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la trama anterior se codificó mediante la primera unidad de codificación 101, la unidad de juicio de permiso de conmutación 381 juzga que se permite la conmutación, y la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201.
Además, por el contrario, incluso cuando la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la trama anterior se codificó mediante la segunda unidad de codificación 201, la unidad de juicio de permiso de conmutación 381 juzga que se permite la conmutación, y la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101, si se juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama tiene que ser codificada mediante el procesamiento de codificación de la segunda unidad de codificación 201 en base a la otra información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama se puede codificar mediante la segunda unidad de codificación 201. Es decir, el dispositivo de codificación 300 simplemente tiene que ser configurado para hacer posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama mediante la primera unidad de codificación 101 si la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la trama anterior se codificó mediante la segunda unidad de codificación 201, la unidad de juicio de permiso de conmutación 381 juzga que se permite la conmutación, y la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101.
Además, por ejemplo, en el dispositivo de codificación 300 de la tercera realización, incluso cuando la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la trama anterior se codificó mediante la primera unidad de codificación 101 y la unidad de juicio de procesamiento de codificación adecuado 382 juzgue que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201, si la unidad de juicio de permiso de conmutación 381 juzga que se permite la conmutación y se juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama tiene que ser codificada mediante el procesamiento de codificación de la segunda unidad de codificación 201 en base a la otra información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama se puede codificar mediante la segunda unidad de codificación 201.
Además, por el contrario, incluso cuando la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la trama anterior se codificó mediante la segunda unidad de codificación 201 y la unidad de juicio de procesamiento de codificación adecuado 382 juzgue que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201, si la unidad de juicio de permiso de conmutación 381 juzga que se permite la conmutación y se juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama tiene que ser codificada mediante el procesamiento de codificación de la primera unidad de codificación 101 en base a la otra información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama se puede codificar mediante la primera unidad de codificación 101.
Es decir, el dispositivo de codificación 300 de la tercera realización simplemente tiene que ser configurado para hacer posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior si la unidad de juicio de permiso de conmutación 381 juzga que se permite la conmutación y la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201.
Segunda modificación
Para una selección en cuanto a si codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama en la primera unidad de codificación 101 o en la segunda unidad de codificación 201, no se puede usar la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381. En este caso, la unidad de juicio de permiso de conmutación 381 no tiene que estar prevista en la unidad de selección 380.
En este caso, la unidad de selección de conmutación 383 selecciona si codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama en la primera unidad de codificación 101 o en la segunda unidad de codificación 201 en base a la información de idoneidad obtenida mediante la unidad de juicio de procesamiento de codificación adecuado 382 sin usar la información sobre si se permite o no la conmutación que se obtuvo mediante la unidad de juicio de permiso de conmutación 381, y emite un código de conmutación que es un código por el cual se puede identificar el procesamiento de codificación seleccionado.
Por ejemplo, es necesario simplemente codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama mediante la primera unidad de codificación 101 si la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101 y codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama mediante la segunda unidad de codificación 201 si la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201.
También en este caso, como es el caso de la primera modificación, se pueden hacer un juicio que incluya la otra información. Por ejemplo, incluso cuando la unidad de juicio de procesamiento de codificación adecuado 382 juzgue que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101, si se juzga que el secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama tiene que ser codificada mediante el procesamiento de codificación de la segunda unidad de codificación 201 en base a la otra información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama se puede codificar mediante la segunda unidad de codificación 201.
Por el contrario, incluso cuando la unidad de juicio de procesamiento de codificación adecuado 382 juzgue que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201, si se juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama tiene que ser codificada mediante el procesamiento de codificación de la primera unidad de codificación 101 en base a la otra información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama se puede codificar mediante la primera unidad de codificación 101.
Es decir, una configuración simplemente tiene que ser una configuración que hace posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama mediante el procesamiento de codificación de la primera unidad de codificación 101 si la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101. Además, una configuración simplemente tiene que ser una configuración que hace posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama mediante el procesamiento de codificación de la segunda unidad de codificación 201 si la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201.
Además, por ejemplo, en el dispositivo de codificación 300 de la tercera realización, de casos donde la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201, en un caso donde se juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama tiene que ser codificada mediante el procesamiento de codificación de la primera unidad de codificación 101 en base a la otra información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama se puede codificar mediante la primera unidad de codificación 101.
Además de los casos donde la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201, en un caso donde se juzgue que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama tiene que ser codificada mediante el procesamiento de codificación de la segunda unidad de codificación 201 en base a la otra información obtenida por un medio que no se representa en el dispositivo de codificación 300, la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama se puede codificar mediante la segunda unidad de codificación 201.
Es decir, el dispositivo de codificación 300 de la tercera realización simplemente tiene que ser configurado para hacer posible seleccionar codificar la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama mediante el mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior si la unidad de juicio de procesamiento de codificación adecuado 382 juzga que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada tanto para el procesamiento de codificación de la primera unidad de codificación 101 como para el procesamiento de codificación de la segunda unidad de codificación 201.
Por cierto, en una comparación entre el valor calculado y el valor umbral en las realizaciones descritas anteriormente, los ajustes simplemente tienen que ser hechos de manera que, si el valor calculado es el mismo valor que el valor umbral, el valor calculado se clasifique en uno cualquiera de dos casos adyacentes entre sí con el valor umbral colocado entre los mismos como límite. Es decir, una condición de que un valor sea mayor o igual que un cierto valor umbral puede traducirse en una condición de que un valor sea mayor que ese valor umbral y una condición de que un valor sea menor que ese valor umbral puede traducirse en una condición de que un valor sea menor o igual que ese valor umbral. Además, una condición de que un valor sea mayor que un cierto valor umbral puede traducirse en una condición de que un valor sea mayor o igual que ese valor umbral y la condición de que un valor sea menor o igual que ese valor umbral puede traducirse en una condición de que un valor sea menor que ese valor umbral.
Por ejemplo, en la primera realización, la unidad de selección 380 puede hacer posible seleccionar un procesamiento de codificación que es diferente de un procesamiento de codificación de la trama anterior como el procesamiento de codificación de la presente trama si al menos una de la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la presente trama es menor o igual que un valor umbral predeterminado (Paso S380).
Además, en la segunda realización, la unidad de juicio de permiso de conmutación 381 puede juzgar que se permite la conmutación, es decir, la unidad de juicio de permiso de conmutación 381 hace posible codificar la secuencia de coeficientes en el dominio de la frecuencia de la presente trama mediante un procesamiento de codificación que es diferente del procesamiento de codificación por el cual la secuencia de coeficientes en el dominio de la frecuencia de la trama anterior se codificó si al menos una de la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la trama anterior y la magnitud de la energía de las componentes de alta frecuencia de la señal de sonido de entrada de la presente trama es menor o igual que un valor umbral predeterminado y emitir el resultado del juicio.
Además, en la primera realización, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es menor que el valor umbral predeterminado TH2, dado que se estima que el valle de un espectro es poco profundo y el espectro es un espectro cuya envolvente espectral tiene suaves ascensos y descensos o cuyo grado de concentración es bajo, la unidad de juicio de procesamiento de codificación adecuado 382 puede juzgar que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la segunda unidad de codificación 201. Por el contrario, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor o igual que el valor umbral TH2, dado que se estima que el valle de un espectro es profundo y el espectro es un espectro cuya envolvente espectral tiene ascensos y descensos pronunciados o cuyo grado de concentración es alto, la unidad de juicio de procesamiento de codificación adecuado 382 puede juzgar que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101.
Además, en la tercera realización, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor o igual que el valor umbral predeterminado TH2_2 que es un valor mayor que el valor umbral TH2_1, dado que se estima que el valle de un espectro es profundo y el espectro es un espectro cuya envolvente espectral tiene ascensos y descensos pronunciados o cuyo grado de concentración es alto, la unidad de juicio de procesamiento de codificación adecuado 382 puede juzgar que la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama es adecuada para el procesamiento de codificación de la primera unidad de codificación 101. En este caso, si una diferencia entre el valor medio E de AVEXS(q) de todas las regiones parciales y el valor medio Ev de AVEXS(q) de las regiones parciales del valle es mayor o igual que el valor umbral TH2_1 pero menor que el valor umbral TH2_2, dado que se estima que la profundidad del valle de un espectro es media y el espectro es un espectro cuya envolvente espectral tiene ascensos y descensos moderados o cuyo grado de concentración es medio, la unidad de juicio de procesamiento de codificación adecuado 382 puede realizar cualquiera del procesamiento de codificación de la primera unidad de codificación 101 y del procesamiento de codificación de la segunda unidad de codificación 201 sobre la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada de la presente trama.
El procesamiento descrito en el dispositivo de codificación y el método de codificación se pueden realizar, además de ser realizados en orden cronológico en el orden mencionado en la descripción, en paralelo o individualmente dependiendo de la potencia de procesamiento de un dispositivo que realiza el procesamiento o cuando se necesite.
Además, cuando los pasos en el método de codificación se implementan por un ordenador, los detalles de procesamiento de las funciones que se supone que se proporcionan en el método de codificación se describen por un programa. Como resultado de este programa que se ejecuta por el ordenador, los pasos se implementan en el ordenador.
El programa que describe los detalles del procesamiento se puede grabar en un medio de grabación legible por ordenador. Como el medio de grabación legible por ordenador, se puede usar cualquier medio de grabación legible por ordenador, tal como un dispositivo de grabación magnética, un disco óptico, un medio de grabación magnetoóptico, una memoria semiconductores o similar.
Además, cada medio de procesamiento se puede configurar como resultado de un programa predeterminado que se ejecuta en el ordenador, y al menos parte de los detalles de procesamiento del mismo se pueden implementar en el hardware.

Claims (6)

REIVINDICACIONES
1. Un método de codificación para codificar una señal de sonido de entrada trama a trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado de un primer paso de codificación y un segundo paso de codificación de procesamiento de codificación, el método de codificación que comprende: un paso de selección de juzgar que se permite la conmutación de un procesamiento de codificación de una trama anterior a una presente trama si al menos una de una magnitud de energía de las componentes de alta frecuencia de una señal de sonido de entrada de la trama anterior y la magnitud de energía de las componentes de alta frecuencia de una señal de sonido de entrada de la presente trama es menor o igual que un valor umbral predeterminado; de otro modo, no permitir la conmutación;
en donde el paso de selección hace posible además una selección para codificar la presente trama en el primer paso de codificación en un caso donde la señal de sonido de entrada de la trama anterior se codificó en el segundo paso de codificación y un índice que indica que los ascensos y descensos de un espectro de la señal de sonido de entrada de la presente trama son pronunciados o un grado de concentración del espectro es alto, es mayor o igual que un valor umbral predeterminado, de casos donde se hace posible conmutar un procesamiento de codificación de la trama anterior a la presente trama,
donde el primer paso de codificación es un paso de codificación de una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada usando una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal de sonido de entrada; y
el segundo paso de codificación es un paso de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada, que implica una codificación de longitud variable que se realiza sobre un diferencial entre un valor logarítmico de energía promedio de los coeficientes en cada región parcial obtenida dividiendo la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada en una pluralidad de regiones parciales y un valor logarítmico de energía promedio de un dominio de la frecuencia adyacente.
2. Un método de codificación para codificar una señal de sonido de entrada trama a trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado de un primer paso de codificación y un segundo paso de codificación del procesamiento de codificación, el método de codificación que comprende: un paso de selección de juzgar que se permite la conmutación de un procesamiento de codificación de una trama anterior a una presente trama si al menos una de una magnitud de energía de las componentes de alta frecuencia de una señal de sonido de entrada de la trama anterior y la magnitud de energía de las componentes de alta frecuencia de una señal de sonido de entrada de la presente trama es menor o igual que un valor umbral predeterminado; de otro modo, decidir si hacer posible una selección para seleccionar un procesamiento de codificación que sea diferente del procesamiento de codificación de la trama anterior como el procesamiento de codificación de la presente trama o seleccionar un mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior como el procesamiento de codificación de la presente trama según un estado en el que las componentes de alta frecuencia de la señal de sonido de entrada son escasas;
en donde el paso de selección hace posible además una selección para codificar la presente trama en el primer paso de codificación en un caso donde la señal de sonido de entrada de la trama anterior se codificó en el segundo paso de codificación y un índice que indica que los ascensos y descensos de un espectro de la señal de sonido de entrada de la presente trama son pronunciados o un grado de concentración del espectro es alto, es mayor o igual que un valor umbral predeterminado, de los casos donde se hace posible conmutar un procesamiento de codificación de la trama anterior a la presente trama,
donde el primer paso de codificación es un paso de codificación de una secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada usando una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal de sonido de entrada; y
el segundo paso de codificación es un paso de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada, que implica una codificación de longitud variable que se realiza sobre un diferencial entre un valor logarítmico de energía promedio de los coeficientes en cada región parcial obtenida dividiendo la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada en una pluralidad de regiones parciales y un valor logarítmico de energía promedio de un dominio de la frecuencia adyacente.
3. Un dispositivo de codificación adaptado para codificar una señal de sonido de entrada trama a trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado de un primer paso de codificación y un segundo paso de codificación de un procesamiento de codificación, el dispositivo de codificación que comprende:
una unidad de selección adaptada para juzgar que se permite la conmutación de un procesamiento de codificación de una trama anterior a una presente trama si al menos una de una magnitud de energía de las componentes de alta frecuencia de una señal de sonido de entrada de la trama anterior y la magnitud de energía de las componentes de alta frecuencia de una señal de sonido de entrada de la presente trama es menor o igual que un valor umbral predeterminado; de otro modo, no permitir la conmutación;
en donde la unidad de selección se adapta además para hacer posible una selección para codificar la presente trama en el primer paso de codificación en un caso donde la señal de sonido de entrada de la trama anterior se codificó en el segundo paso de codificación y un índice que indica que los ascensos y descensos de un espectro de la señal de sonido de entrada de la presente trama son pronunciados o un grado de concentración del espectro es alto, es mayor o igual que un valor umbral predeterminado, de casos donde se hace posible la conmutación de un procesamiento de codificación de la trama anterior a la presente trama,
donde el primer paso de codificación es un paso de codificación de una secuencia de coeficientes en un dominio de la frecuencia correspondiente a la señal de sonido de entrada usando una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal de sonido de entrada; y
el segundo paso de codificación es un paso de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada, que implica codificación de longitud variable que se realiza sobre un diferencial entre un valor logarítmico de energía promedio de los coeficientes en cada región parcial obtenida dividiendo la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada en una pluralidad de regiones parciales y un valor logarítmico de energía promedio de un dominio de la frecuencia adyacente.
4. Un dispositivo de codificación adaptado para codificar una señal de sonido de entrada trama a trama de un segmento de tiempo predeterminado mediante un procesamiento de codificación seleccionado de un primer paso de codificación y un segundo paso de codificación de un procesamiento de codificación, el dispositivo de codificación que comprende:
una unidad de selección adaptada para juzgar que la conmutación de un procesamiento de codificación de una trama anterior a una presente trama se permite si al menos una de una magnitud de energía de las componentes de alta frecuencia de una señal de sonido de entrada de la trama anterior y la magnitud de energía de las componentes de alta frecuencia de una señal de sonido de entrada de la presente trama es menor o igual que un valor umbral predeterminado; de otro modo, seleccionar si hacer posible una selección para seleccionar un procesamiento de codificación que es diferente del procesamiento de codificación de la trama anterior como el procesamiento de codificación de la presente trama o seleccionar un mismo procesamiento de codificación que el procesamiento de codificación de la trama anterior como el procesamiento de codificación de la presente trama según un estado en el que las componentes de alta frecuencia de la señal de sonido de entrada son escasas;
en donde la unidad de selección está adaptada además para hacer posible una selección para codificar la presente trama en el primer paso de codificación en un caso donde la señal de sonido de entrada de la trama anterior se codificó en el segundo paso de codificación y un índice que indica que los ascensos y descensos de un espectro de la señal de sonido de entrada de la presente trama son pronunciados o un grado de concentración del espectro es alto, es mayor o igual a un valor umbral predeterminado, de casos donde se hace posible la conmutación del procesamiento de codificación de la trama anterior a la presente trama,
donde el primer paso de codificación es un paso de codificación de una secuencia de coeficientes en un dominio de la frecuencia correspondiente a la señal de sonido de entrada usando una envolvente espectral en base a coeficientes que son convertibles en coeficientes de predicción lineal correspondientes a la señal de sonido de entrada; y
el segundo paso de codificación es un paso de codificación de la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada, que implica una codificación de longitud variable que se realiza sobre un diferencial entre un valor logarítmico de energía promedio de los coeficientes en cada región parcial obtenida dividiendo la secuencia de coeficientes en el dominio de la frecuencia correspondiente a la señal de sonido de entrada en una pluralidad de regiones parciales y un valor logarítmico de energía promedio de un dominio de la frecuencia adyacente.
5. Un programa adaptado para hacer que un ordenador ejecute cada paso del método de codificación según la reivindicación 1 o 2.
6. Un medio de grabación legible por ordenador en el que se graba un programa según la reivindicación 5.
ES19201443T 2014-07-28 2015-05-15 Codificación de señal de sonido Active ES2838006T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014152958 2014-07-28

Publications (1)

Publication Number Publication Date
ES2838006T3 true ES2838006T3 (es) 2021-07-01

Family

ID=55217142

Family Applications (3)

Application Number Title Priority Date Filing Date
ES19201443T Active ES2838006T3 (es) 2014-07-28 2015-05-15 Codificación de señal de sonido
ES20200287T Active ES2908564T3 (es) 2014-07-28 2015-05-15 Codificación de una señal de sonido
ES15826810T Active ES2770704T3 (es) 2014-07-28 2015-05-15 Codificación de una señal acústica

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES20200287T Active ES2908564T3 (es) 2014-07-28 2015-05-15 Codificación de una señal de sonido
ES15826810T Active ES2770704T3 (es) 2014-07-28 2015-05-15 Codificación de una señal acústica

Country Status (8)

Country Link
US (4) US10304472B2 (es)
EP (3) EP3614382B1 (es)
JP (3) JP6411509B2 (es)
KR (3) KR102061316B1 (es)
CN (4) CN112992163B (es)
ES (3) ES2838006T3 (es)
PL (2) PL3163571T3 (es)
WO (1) WO2016017238A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112992163B (zh) * 2014-07-28 2024-09-13 日本电信电话株式会社 编码方法、装置以及记录介质
CN114898761A (zh) 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
CN110868220B (zh) * 2018-08-28 2021-09-07 株洲中车时代电气股份有限公司 车辆设备的身份标识的配置及异常检测方法
CN113948085B (zh) * 2021-12-22 2022-03-25 中国科学院自动化研究所 语音识别方法、系统、电子设备和存储介质

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL183307B1 (pl) * 1994-03-31 2002-06-28 Arbitron Co System kodowania sygnału dźwiękowego
US5450490A (en) * 1994-03-31 1995-09-12 The Arbitron Company Apparatus and methods for including codes in audio signals and decoding
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JP3317470B2 (ja) * 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
JP3612260B2 (ja) * 2000-02-29 2005-01-19 株式会社東芝 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP3453116B2 (ja) * 2000-09-26 2003-10-06 パナソニック モバイルコミュニケーションズ株式会社 音声符号化方法及び装置
JP3426207B2 (ja) * 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
US7200561B2 (en) * 2001-08-23 2007-04-03 Nippon Telegraph And Telephone Corporation Digital signal coding and decoding methods and apparatuses and programs therefor
CN1639984B (zh) * 2002-03-08 2011-05-11 日本电信电话株式会社 数字信号编码方法、解码方法、编码设备、解码设备
JP3960932B2 (ja) * 2002-03-08 2007-08-15 日本電信電話株式会社 ディジタル信号符号化方法、復号化方法、符号化装置、復号化装置及びディジタル信号符号化プログラム、復号化プログラム
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7379864B2 (en) * 2003-05-06 2008-05-27 Lucent Technologies Inc. Method and apparatus for the detection of previous packet loss in non-packetized speech
EP1742202B1 (en) * 2004-05-19 2008-05-07 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device, and method thereof
US7752039B2 (en) * 2004-11-03 2010-07-06 Nokia Corporation Method and device for low bit rate speech coding
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
CN101496097A (zh) * 2006-07-31 2009-07-29 高通股份有限公司 用于在与语音信号相关联的包中包含识别符的系统及方法
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
CN101140759B (zh) * 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
US8483854B2 (en) * 2008-01-28 2013-07-09 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multiple microphones
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
CN101763856B (zh) * 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码系统
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
CN101552006B (zh) * 2009-05-12 2011-12-28 武汉大学 加窗信号mdct域的能量及相位调整方法及其装置
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
WO2011161886A1 (ja) * 2010-06-21 2011-12-29 パナソニック株式会社 復号装置、符号化装置およびこれらの方法
CN102446508B (zh) * 2010-10-11 2013-09-11 华为技术有限公司 语音音频统一编码窗型选择方法及装置
JP5694751B2 (ja) * 2010-12-13 2015-04-01 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
WO2012102149A1 (ja) * 2011-01-25 2012-08-02 日本電信電話株式会社 符号化方法、符号化装置、周期性特徴量決定方法、周期性特徴量決定装置、プログラム、記録媒体
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
KR102070429B1 (ko) * 2011-10-21 2020-01-28 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치
CN103366750B (zh) * 2012-03-28 2015-10-21 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
WO2015104447A1 (en) * 2014-01-13 2015-07-16 Nokia Technologies Oy Multi-channel audio signal classifier
MX356883B (es) * 2014-05-08 2018-06-19 Ericsson Telefon Ab L M Codificador y discriminador de señal de audio.
CN111192595B (zh) * 2014-05-15 2023-09-22 瑞典爱立信有限公司 音频信号分类和编码
GB2526128A (en) * 2014-05-15 2015-11-18 Nokia Technologies Oy Audio codec mode selector
CN112992163B (zh) * 2014-07-28 2024-09-13 日本电信电话株式会社 编码方法、装置以及记录介质
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection

Also Published As

Publication number Publication date
EP3796314B1 (en) 2021-12-22
US10629217B2 (en) 2020-04-21
KR20170024030A (ko) 2017-03-06
US11043227B2 (en) 2021-06-22
EP3796314A1 (en) 2021-03-24
CN112992164A (zh) 2021-06-18
JP6739604B2 (ja) 2020-08-12
KR20190042773A (ko) 2019-04-24
US20200176006A1 (en) 2020-06-04
PL3796314T3 (pl) 2022-03-28
JP2018139004A (ja) 2018-09-06
KR20190077115A (ko) 2019-07-02
EP3163571A4 (en) 2017-11-29
ES2908564T3 (es) 2022-05-03
JPWO2016017238A1 (ja) 2017-06-01
CN112992165A (zh) 2021-06-18
CN106796801A (zh) 2017-05-31
JP6608993B2 (ja) 2019-11-20
CN112992163B (zh) 2024-09-13
KR101993828B1 (ko) 2019-06-27
US20170178659A1 (en) 2017-06-22
PL3163571T3 (pl) 2020-05-18
EP3163571B1 (en) 2019-11-20
CN112992163A (zh) 2021-06-18
CN106796801B (zh) 2021-02-26
ES2770704T3 (es) 2020-07-02
US20200176007A1 (en) 2020-06-04
KR102049294B1 (ko) 2019-11-27
US10304472B2 (en) 2019-05-28
WO2016017238A1 (ja) 2016-02-04
JP2019215558A (ja) 2019-12-19
US11037579B2 (en) 2021-06-15
EP3614382B1 (en) 2020-10-07
KR102061316B1 (ko) 2019-12-31
EP3163571A1 (en) 2017-05-03
EP3614382A1 (en) 2020-02-26
JP6411509B2 (ja) 2018-10-24
US20190206414A1 (en) 2019-07-04

Similar Documents

Publication Publication Date Title
US10297264B2 (en) Audio signal classification and coding
US11037579B2 (en) Coding method, device and recording medium
US10553227B2 (en) Audio coding method and apparatus
US9117461B2 (en) Coding device, decoding device, coding method, and decoding method for audio signals