ES2834391T3 - Codificación de una señal de audio - Google Patents

Codificación de una señal de audio Download PDF

Info

Publication number
ES2834391T3
ES2834391T3 ES19185171T ES19185171T ES2834391T3 ES 2834391 T3 ES2834391 T3 ES 2834391T3 ES 19185171 T ES19185171 T ES 19185171T ES 19185171 T ES19185171 T ES 19185171T ES 2834391 T3 ES2834391 T3 ES 2834391T3
Authority
ES
Spain
Prior art keywords
samples
frequency domain
sample
period
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19185171T
Other languages
English (en)
Inventor
Takehiro Moriya
Yutaka Kamamoto
Noboru Harada
Yusuke Hiwasaki
Masahiro Fukui
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Application granted granted Critical
Publication of ES2834391T3 publication Critical patent/ES2834391T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/903Pitch determination of speech signals using a laryngograph
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/906Pitch tracking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un método de codificación que comprende: obtener un periodo de tono en el dominio de tiempo L de una señal de audio en un periodo de tiempo dado y un código de periodo de tono en el dominio de tiempo correspondiente al periodo de tono en el dominio de tiempo L y generar el código de periodo de tono en el dominio de tiempo; una etapa de conversión de periodo consistente en obtener, como intervalo convertido T1, un intervalo de muestras en una cadena de muestras de dominio de frecuencia de N puntos basada en el periodo de tono en el dominio de tiempo L y el número N de puntos de muestras en un dominio de frecuencia, estando la cadena de muestras de dominio de frecuencia de N puntos derivada de la señal de audio, correspondiendo el intervalo de muestras al periodo de tono en el dominio de tiempo L de la señal de audio; una etapa de análisis de periodo de tono en el dominio de frecuencia consistente en elegir un periodo de tono en el dominio de frecuencia T a partir de unos candidatos que incluyen el intervalo convertido T1 y múltiplos enteros U X T1 del intervalo convertido T1, en donde U es un número entero en un primer rango predeterminado, siendo el periodo de tono en el dominio de frecuencia T un periodo de tono de la cadena de muestras de dominio de frecuencia de N puntos, y obtener y generar un primer código de periodo de tono en el dominio de frecuencia que indica cuántas veces el periodo de tono en el dominio de frecuencia T es mayor que el intervalo convertido T1; y una etapa de codificación basada en periodo de tono en el dominio de frecuencia consistente en codificar una cadena de muestras de dominio de frecuencia de N puntos mediante un método de codificación basado en el periodo de tono en el dominio de frecuencia T para obtener y generar una cadena de códigos, En donde el método de codificación basado en el periodo de tono de dominio de frecuencia T es un método de codificación en el que las primeras muestras incluidas en un primer grupo de muestras de todas o alguna de una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente al periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia de N puntos y una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente a un múltiplo entero del periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia de N puntos son codificadas utilizando codificación de longitud variable de acuerdo con un primer criterio correspondiente a magnitudes de amplitudes o magnitudes estimadas de amplitudes de las primeras muestras incluidas en el primer grupo de muestras y las segundas muestras incluidas en un segundo grupo de muestras de muestras en la cadena de muestras que no están incluidas en el primer grupo de muestras son codificadas utilizando codificación de longitud variable de acuerdo con un segundo criterio correspondiente a las magnitudes de amplitudes o magnitudes estimadas de amplitudes de las segundas muestras incluidas en el segundo grupo de muestras.

Description

DESCRIPCIÓN
Codificación de una señal de audio
[CAMPO TÉCNICO]
La presente invención se refiere una técnica para codificar una señal de audio y, en particular, para codificar una cadena de muestras en el dominio de frecuencia, obtenidas transformando una señal de audio al dominio de frecuencia.
[TÉCNICA ANTECEDENTE]
La codificación adaptativa que codifica coeficientes ortogonales tales como coeficientes DFT (Transformada de Fourier Discreta) y MDCT (Transformada de Coseno Discreta Modificada) es conocida como un método para codificar señales de voz y señales de audio a bajos regímenes de bits (por ejemplo aproximadamente 10 a 20 kbits/s). Por ejemplo, AMR-WB+ (Banda ancha de Múltiples Regímenes Adaptativa Extendida) que es una técnica estándar, tiene el modo de codificación TCX (excitación codificada de trasformada) en el que los coeficientes DFT son normalizados y cuantificados mediante vector cada 8 muestras.
En TwinVQ (“Transform Domain Weighted Interleave Vertor Quantification”) o Extensión de un Fichero TwinVQ, todos los coeficientes MDCT son reorganizados de acuerdo con un regla fija y la colección resultante de muestras es combinada en vectores y codificada. En algunos casos de TwinVQ, se utiliza un método en el que los componentes grandes son extraídos de los coeficientes MDCT, por ejemplo, en cada periodo de tono en el dominio de tiempo, la información correspondiente al periodo de tono en el dominio de tiempo es codificada, el resto de la cadena de coeficientes MDCT después de la extracción de los componentes grandes en cada periodo de tono en el dominio de tiempo son reorganizados, y las cadenas de coeficientes MDCT reorganizadas son cuantificadas con vector cada cierto número predeterminado de muestras. Ejemplos de referencias en TwinVQ incluyen las bibliografías No relacionadas con Patentes 1 y 2.
Un ejemplo de técnica para extraer muestras a intervalos regulares para la codificación es el descrito en la Bibliografía de Patente 1.
La bibliografía de Patente 2, describe un aparato de codificación de voz que incluye un circuito de detección de tono que detecta un periodo de tono de una señal de voz, generando la onda de tono un circuito que muestra la señal de voz para una pluralidad de tonos basados en el periodo de tono detectado por el circuito de detección de tono y que genera una onda de un tono a partir de la onda de la pluralidad de tonos, un circuito de restricción de banda que restringe la banda de frecuencia de una onda de tono generada en el circuito de generación de onda de tono, y un circuito de codificación para codificar la onda de voz es restringida de banda en el circuito de restricción de banda. El número de muestreo de la onda para una pluralidad de tonos y la anchura de banda restringida se pueden cambiar de acuerdo con la cantidad de periodo de tono extraído en el circuito de detección de tono. Además, el circuito de detección de tono es capaz de detectar correctamente el periodo de tono incluso cuando el periodo de tono no es un múltiplo del periodo de muestreo.
La bibliografía de patente 3, describe a un proceso para mejorar la calidad producida por la codificación de bits de orden inferior de una señal acústica por una señal baja de operación. En el procesamiento de codificación, las muestras contenidas en una secuencia de muestras en un dominio de frecuencia derivado de una señal acústica son reorganizadas. Por ejemplo, al menos algunas de las muestras contenidas en una secuencia de muestras son reorganizadas, de manera que una o una pluralidad de muestras sucesivas que incluye una muestra correspondiente a una frecuencia fundamental, y se reúnen una o una pluralidad de muestras sucesivas que incluyen una muestra que corresponden a un múltiplo entero de la frecuencia fundamental. La información (información auxiliar) que especifica la reorganización también es producida. Después, una secuencia de muestra obtenida mediante reorganización es codificada. En el proceso de descodificación, una secuencia de muestras en un dominio de frecuencia es obtenida descodificando una cadena de códigos de entrada, y una secuencia de muestras original es obtenida a partir de la secuencia de muestras obtenida en base a la información auxiliar.
[BIBLIOGRAFÍA DE TÉCNICA ANTERIOR]
[BIBLIOGRAFÍA DE PATENTE]
Bibliografía de Patente 1: Solicitud de Patente Japonesa Abierta a Inspección N° JP2009-156971
Bibliografía de Patente 2: Solicitud de Patente Europea Abierta a Inspección N° EP 0333121
Bibliografía de Patente 3: Solicitud de Patente Internacional Abierta a Inspección N° WO 2012/046685
[BIBLIOGRAFÍA NO RELACIONADA CON PATENTES]
Bibliografía No relacionada con Patentes 1: T. Moriya, N. Iwakami, A. Jin, K. Ikeda, y S. Miki, “A Design of Transform Coder for Both Speech and audio Signals at a bit/sample,” Proc. ICASSP '97 , pp. 1371 - 1374, 1997.
Bibliografía No relacionada con Patentes 2: J. Herre, E. Allamanche, K. Brandenburg, M. Dietz, B. Teichmann, B. Grill, A. Jin, T. Moriya, N. Iwakami. T. Norimatsu, M. Tsushima, T. Ishikawa. “The Integrated Filterbank Based Scalable MPEG-4, audio-Coder” 105th Convention audio Engineering Society, 4810, 1998.
[SUMARIO DE LA INVENCIÓN]
[PROBLEMA A RESOLVER POR LA INVENCIÓN]
Dado que la codificación basada en TCX, tal como AMR-WB+ no tiene en cuenta variaciones en la amplitud de las cadenas de muestras de dominio de frecuencia basadas en la periodicidad, la eficiencia de la codificación disminuye cuando las cadenas de muestras con amplitudes ampliamente variables son codificada juntas. Con el fin de mejorar la eficiencia de la codificación, es efectivo codificar diferentes grupos de muestras con variaciones de amplitud pequeñas de acuerdo con diferentes criterios en base a los periodos de tono de las cadenas de muestras en el dominio de frecuencia.
Sin embargo, no hay un método conocido para determinar de forma eficaz un periodo de tono de una cadena de muestra en el dominio de frecuencia para codificar la cadena de muestras.
A la luz de los antecedentes técnicos descritos anteriormente, un objetivo de la presente invención es proporcionar una técnica capaz de determinar de forma eficaz un periodo de tono de una cadena de muestras en el dominio de frecuencia en la codificación.
[MEDIOS PARA RESOLVER LOS PROBLEMAS]
A la vista de estos problemas, la presente invención proporciona un método de codificación, un codificador, así como un correspondiente programa, y un correspondiente medio de grabación leíble por un ordenador que tienen las características de las respectivas reivindicaciones independientes.
De acuerdo con una técnica de codificación que es útil para entender la presente invención, un intervalo de muestras de dominio de frecuencia correspondiente a un periodo de tono de dominio de tiempo L correspondiente a un código de periodo de tono de dominio de tiempo de una señal de audio en un periodo de tiempo dado se obtiene como un intervalo convertido T1, un periodo de tono de dominio de frecuencia T es elegido de entre los candidatos que incluyen el intervalo convertido T1 y múltiplos enteros U X T1 del intervalo convertido T1, y se obtiene un código de periodo de tono de dominio de frecuencia que indica cuántas veces el periodo de tono de dominio de frecuencia T es mayor que el intervalo convertido T1. El código de periodo de tono de dominio de frecuencia es generado, de manera que un lado de descodificación puede identificar el periodo de tono de dominio de frecuencia T.
[EFECTOS DE LA INVENCIÓN]
De acuerdo con la presente invención, dado que un periodo de tono de dominio de frecuencia T es encontrado entre múltiples números enteros de un intervalo convertido, la cantidad de computación requerida para encontrar el periodo de tono de dominio de frecuencia T es pequeña. Además, dado que la información que representa cuántas veces el periodo de tono de dominio de frecuencia T es mayor que el intervalo convertido, es utilizada como información para identificar el periodo de tono de dominio de frecuencia T, la cantidad de código de un código de periodo de tono de dominio de frecuencia se puede mantener pequeña. De este modo un periodo de tono de una cadena de muestras de dominio de frecuencia se puede determinar de forma efectiva en la codificación y el periodo de tono de la cadena de muestras de dominio de frecuencia puede ser identificado en la descodificación.
[BREVE DESCRIPCIÓN DE LOS DIBUJOS]
La Figura 1 es un diagrama de bloques de un codificador de acuerdo con un ejemplo que actualmente no está reivindicado pero que puede ser útil para el entendimiento de la invención;
la Figura 2 es un diagrama de bloques de un descodificador de acuerdo con un ejemplo que actualmente no está reivindicado pero que puede ser útil para el entendimiento de la invención;
la Figura 3 es un diagrama que ilustra la relación entre la frecuencia fundamental en el dominio de tiempo, el periodo de tono de dominio de tiempo y los puntos de muestra;
la Figura 4 es un diagrama que ilustra la relación entre un intervalo convertido ideal en el dominio de frecuencia, y un intervalo igual al intervalo convertido multiplicado por m, y la frecuencia;
la Figura 5 es un diagrama que ilustra la frecuencia del periodo de tono de dominio de frecuencia /(longitud de marco de transformada * 2/periodo de tono de dominio de frecuencia);
la Figura 6 es un diagrama conceptual que ilustra un ejemplo de reorganización de muestras incluidas en una cadena de muestras;
la Figura 7 es un diagrama conceptual que ilustra un ejemplo de reorganización de muestras incluidas en una cadena de muestras;
la Figura 8 es un diagrama de bloques de un codificador de acuerdo con un ejemplo que actualmente no está reivindicado pero que puede ser útil para el entendimiento de la invención:
la Figura 9 es un diagrama de bloques de un descodificador de acuerdo con un ejemplo que actualmente no está reivindicado pero que puede ser útil para el entendimiento de la invención;
la Figura 10 es un diagrama de bloques de un codificador de acuerdo con una realización;
la Figura 11 es un diagrama de bloques de un descodificador de acuerdo con un ejemplo que actualmente no está reivindicado pero que puede ser útil para el entendimiento de la invención;
la Figura 12 es un diagrama que ilustra un libro de códigos de longitud variable de acuerdo con un ejemplo que actualmente no está reivindicado pero que puede ser útil para el entendimiento de la invención;
la Figura 13 es un diagrama que ilustra un libro de códigos de longitud variable de acuerdo con un ejemplo que actualmente no está reivindicado pero que puede ser útil para el entendimiento de la invención;
la Figura 14 es un diagrama de bloques que ilustra un codificador de acuerdo con un ejemplo que actualmente no está reivindicado pero que puede ser útil para el entendimiento de la invención;
la Figura 15 es un diagrama de bloques de un descodificador de acuerdo con un ejemplo que actualmente no está reivindicado pero que puede ser útil para el entendimiento de la invención; y
la Figura 16 es un diagrama de bloques de un analizador de periodo de tono de dominio de frecuencia de acuerdo con un ejemplo que actualmente no está reivindicado pero que puede ser útil para el entendimiento de la invención.
[DESCRIPCIÓN DETALLADA DE LA REALIZACIÓN]
Las realizaciones de la presente invención y los ejemplos útiles para entender a invención serán descritos con referencia a los dibujos. Los mismos elementos tienen los mismos números de referencia y se omite la descripción repetida de esos elementos.
[PRIMER EJEMPLO]
Este ejemplo actualmente no está reivindicado pero puede ser útil para el entendimiento de la invención
Codificador 11
Un proceso de codificación realizado por un codificador 11 se describirá con referencia a la Figura 1. Los componentes del codificador 11 realizan operaciones descritas más adelante para cada marco, que es un periodo de tiempo dado. En la siguiente descripción, el número de muestras en un marco está designado por Nt y un marco de una señal de audio digital es una cadena de señales de audio digitales x(1), x(Nt).
Analizador de Predicción de Largo Plazo 111
(General)
Un analizador de predicción de largo plazo 111 obtiene un periodo de tono de dominio de tiempo L correspondiente a un cadena de señales de audio digital de entrada x(1), ..., x(Nt) en cada marco, que es un periodo de tiempo dado (etapa S111-1), calcula la ganancia de tono gp correspondiente al periodo de tono de dominio de tiempo L (etapa S111-2), obtiene, en base a la ganancia de tono gp, la información de selección de predicción de largo plazo que indica si va a ser realizada o no la predicción de largo plazo y genera la información de selección de predicción de largo plazo (etapa S111-3) y, cuando la información de selección de predicción de largo plazo indica que la predicción de largo plazo va a ser realizada, genera además al menos un periodo de tono de dominio de tiempo L y el código de periodo de tono de dominio de tiempo CL que identifica el periodo de tono de dominio de tiempo L (etapa S111-4).
(Etapa S111-1: Periodo de tono de dominio de tiempo L)
El analizador de predicción de largo plazo 111 elige un candidato de periodo de tono de dominio de tiempo t que maximiza el valor que se puede obtener de acuerdo con la fórmula (A1) como periodo de tono de dominio de tiempo L correspondiente a una cadena de señales de audio digital x(1), ..., x(Nt) de entre los candidatos de periodo de tono de dominio de tiempo t, por ejemplo.
Figure imgf000004_0001
Cada candidato t y el periodo de tono de dominio de tiempo L pueden ser representados no solo por un número entero solo (precisión de número entero) sino también pueden ser representados por un valor entero y un calor de fracción (una fracción) (precisión fraccional). Para obtener el valor de la fórmula (A1) para un candidato t de precisión fraccional, un filtro de interpolación que aplica una media ponderada a una pluralidad de muestras de señal de audio digitales se utiliza para obtener x(t - t).
(Etapa S111 -2: Ganancia de tono gp)
En base a la señal de audio digital y al periodo de tono de dominio de tiempo L, por ejemplo, el analizador de predicción de largo plazo 111 calcula una ganancia de tono gp de acuerdo con la fórmula (A2).
Nt
£ x ( t ) x ( t - L )
o - . t=i (A2)
g P fiTt Wt
JSx2(t)Xx2(t-L)
V t=l t=l
(Etapa S111-3: Información de selección de predicción de largo plazo)
Si la ganancia de tono gp es mayor que o igual a un valor predeterminado, el analizador de predicción de largo plazo 111 obtiene y genera información de selección de predicción de largo plazo que indica que la predicción de largo plazo va a ser realizada; si la ganancia de tono gp es menor que un valor predeterminado, el analizador de predicción de largo plazo 111 obtiene y genera información de selección de predicción de largo plazo que indica que la predicción de largo plazo no se va a realizar.
(Etapa S111-4: Cuando se realiza la predicción de largo plazo)
Cuando la información de selección de predicción de largo plazo indica que la predicción de largo plazo va a ser realizada, el analizador de predicción de largo plazo 111 realiza la siguiente operación.
Los candidatos t de periodo de tono de dominio de tiempo predeterminados son almacenados en el analizador de predicción de largo plazo 111 en asociación con índices únicos asignados a ellos. El analizador de predicción de largo plazo 111 selecciona, como el código de periodo de tono de dominio de tiempo Cl que identifica el periodo de tono de dominio de tiempo L, un índice que identifica un candidato t que ha sido elegido como el periodo de tono de dominio de tiempo L.
El analizador de predicción de largo plazo 111 entonces genera el periodo de tono de dominio de tiempo L y el código de periodo de tono de dominio de tiempo Cl además de la información de selección de predicción de largo plazo.
Si el analizador de predicción de largo plazo 111 también genera una ganancia de tono cuantificada gpA y un código de ganancia de tono Cgp, los candidatos de ganancia de tono predeterminados son almacenados en el analizador de predicción de largo plazo 111 en asociación con los índices únicos asignados a ellos. El analizador de predicción de largo plazo 111 selecciona, como código de ganancia de tono Cgp que identifica la ganancia de tono cuantificada gpA, el índice que identifica un candidato de ganancia de tono que está más cerca de la ganancia de tono gp de entre los candidatos de ganancia de tono.
El analizador de predicción de largo plazo 111 entonces genera la ganancia de tono cuantificada gpA y el código de ganancia de tono Cgp además de la información de selección de predicción de largo plazo, el periodo de tono de dominio de tiempo L y el código de periodo de tono de dominio de tiempo Cl .
Unidad Aritmética residual de Predicción de Largo plazo 112
Cuando la información de selección de predicción de largo plazo generada desde el analizador de predicción de largo plazo 111 indica que va a ser realizada la predicción de largo plazo, una unidad aritmética residual de predicción de largo plazo 112 resta una señal predicha de largo plazo de una cadena de señales de audio digital en cada marco, que es un periodo de tiempo dado, para generar y una cadena de señales residual de predicción de largo plazo. Por ejemplo, en base a la cadena de señales de audio digital de entrada x(1), ..., x(Nt), un periodo de tono de dominio de tiempo L, y una ganancia de tono cuantificada gpA, la unidad aritmética residual de predicción de largo plazo 112 calcula una cadena de señales residuales de predicción de largo plazo xp(1), ..., Xp(Nt) de acuerdo con la fórmula (A3), con lo que se genera la cadena de señal residual de predicción de largo plazo. Si el analizador de predicción de largo plazo 111 no genera una ganancia de tono cuantificada gpA, un valor predeterminado, tal como 0,5, por ejemplo, puede ser utilizado como gpA.
Figure imgf000005_0001
T ransformador de Dominio de Frecuencia 113a
Primero, cuando la salida de información de selección de predicción de largo plazo generada desde el analizador de predicción de largo plazo 111 indica que se va a realizar predicción de largo plazo, un trasformador de dominio de frecuencia 113a transforma la cadena de señal residual de predicción de largo plazo Xp(1), ..., Xp(Nt) en una cadena de coeficientes MDCT X(1), ..., X(N) en N puntos en el dominio de frecuencia (N se refiere a la “longitud de marco de transformada”) en una base de marco a marco; cuando la salida de información de selección de predicción de largo plazo procedente del analizador de predicción de largo plazo 111 indica que no se va a realizar predicción de largo plazo, el trasformador de dominio de frecuencia 113a transforma la cadena de señal de audio digital de salida x(1), ... x(Nt) a una cadena de coeficientes MDCT X(1), ..., X(N) en N puntos en el dominio de frecuencia (etapa S113a).
El transformador de dominio de frecuencia 113a realiza la transformada de MDCT de una cadena de señales residual de predicción de largo plazo en ventana o una cadena de señales de audio digital en ventana en 2*N puntos en el dominio para obtener coeficientes en N puntos en el dominio de frecuencia. Aquí, el símbolo “*” representa multiplicación. El transformador de dominio de frecuencia 113a mueve una ventana en el dominio de tiempo N puntos a un tiempo para actualizar el marco. Las muestras de marcos adyacentes se superponen en N puntos cada vez que se mueve la ventana. La forma de la ventana se puede establecer utilizando el grado de retraso o el grado de superposición separadamente para muestras para predicción de largo plazo para la transformada MDCT. Por ejemplo, Nt puntos pueden ser extraídos como muestras para ser sometidos a predicción de largo plazo a partir de una parte de muestras que no se superpone. Si el análisis de predicción de largo plazo es también aplicado a muestras de superposición, un proceso de superposición, diferencias de predicción de largo plazo, y el orden en el que un proceso de combinación es aplicado, necesita ser establecido de manera que no se produzca un error significativo entre el codificador y en descodificador.
Normalizador de Envolvente Ponderado 113b
Un normalizador de envolvente ponderado 113b normaliza cada coeficiente en una cadena de coeficientes MDCT de entrada con una cadena de coeficientes de envolvente de espectro de potencia de una cadena de señales de audio digital estimada utilizando un coeficiente predictivo lineal obtenido mediante análisis de predicción lineal de la cadena de señales de audio digital en cada marco y genera una cadena de coeficientes MDCT normalizada ponderada (etapa S113b). Aquí, con el fin de conseguir la cuantificación que minimice auditivamente la distorsión, el normalizador de envolvente ponderado 113b utiliza cadena de coeficientes de envolvente espectral de potencia ponderada obtenida moderando la envolvente espectral de potencia para normalizar los coeficientes en las cadenas de coeficientes MDCT en una base de marco a marco. Como resultado, la cadena de coeficientes MDCT normalizada ponderada no tiene una pendiente inclinada de amplitud o variaciones grandes de amplitud cuando se compara con la cadena de coeficientes MDCT de entrada pero tiene variaciones de magnitud similares a las de la cadena de coeficientes de envolvente espectral de potencia de la señal digital de voz/audio, esto es, la cadena de coeficientes MDCT normalizada ponderada tiene amplitudes algo mayores en una región de coeficientes que corresponde a bajas frecuencias y tiene una estructura final debido al periodo de tono de dominio de tiempo.
[Ejemplo de Proceso de Normalización de Envolvente Ponderado]
Los coeficientes W(1), ..., W(N) de una cadena de coeficientes de envolvente espectral de potencia que se corresponden con los coeficientes X(1), ..., X(N) de una cadena de coeficientes MDCT en N puntos pueden ser obtenidos transformando los coeficientes predictivos lineales a un dominio de frecuencia. Por ejemplo, de acuerdo con un proceso autoregresivo de orden p, que en un modelo de todos los polos, una señal de audio digital x(t) en un punto de muestra t correspondiente a un instante de tiempo puede ser expresada por la fórmula (1) con valores pasados x(t-1), ..., x(t-p) de la propia señal en pos puntos de tiempo pasados p (p es un número entero positivo), residuales de predicción e(t) y coeficientes predictivos lineales a1, ..., ap. Después, los coeficientes W(n) [1 < n < N] de la cadena de coeficientes de envolvente espectral de energía pueden ser expresados mediante la fórmula (2), en donde exp (.) es una función exponencial con una base de constante de Napier, j es una unidad imaginaria, y o2 es la energía residual de predicción.
Figure imgf000006_0001
Los coeficientes predictivos lineales pueden ser obtenidos mediante análisis de predicción lineal de la misma cadena de señales de audio digital que ha sido introducida en el analizador de predicción de largo plazo 111 por el normalizador de envolvente ponderado 113b o pueden ser obtenidos mediante análisis de predicción lineal de la señal de voz/audio por otros medios, no mostrados, dispuestos en el codificador 11. En tal caso, el normalizador de envolvente ponderado 113b utiliza los coeficientes predictivos lineales para obtener los coeficientes W(1), ..., W(N) en la cadena de coeficientes de envolvente de espectro de potencia. Si los coeficientes W(1), ..., W(N) en la cadena de coeficientes de envolvente espectral de potencia ya han sido obtenidos con otros medios, (la unidad aritmética de cadena de coeficientes de envolvente espectral de potencia) en el codificador 11, el normalizador de envolvente ponderado 113b puede utilizar los coeficientes W(1), ..., W(N) en la cadena de coeficientes de envolvente espectral de energía. Nótese que dado que un codificador 12, que será descrito más adelante, necesita obtener los mismos valores obtenidos en el codificador 11, son utilizados los coeficientes predictivos lineales cuantificados y/o las cadenas de coeficientes de envolvente espectral de energía. En lo que sigue, la expresión “coeficiente predictivo lineal” o “cadena de coeficientes de envolvente espectral de energía” significa un coeficiente predictivo lineal cuantificado o una cadena de coeficientes de envolvente espectral de potencia cuantificada a menos que se especifique lo contrario. Los coeficientes predictivos lineales son codificados mediante un técnica de codificación convencional, por ejemplo, y los códigos de coeficientes predictivo resultantes son transmitidos al lado de descodificación. La técnica de codificación convencional puede ser una técnica de codificación que proporcione códigos correspondientes a los propios coeficientes predictivos lineales como códigos de coeficientes predictivos, una técnica de codificación que convierta los coeficientes predictivos lineales a parámetros LSP y proporcione códigos correspondientes a los parámetros LSP como código de coeficiente predictivos, o una técnica que convierta los coeficientes predictivos lineales en coeficientes PARCOR y proporcione códigos correspondientes a los coeficientes PARCOR como códigos de coeficientes predictivos, por ejemplo. Si las cadenas de coeficientes de envolvente espectral de potencia son obtenidas con otros medios proporcionados en el codificador 11, otros medios en el codificador 11 codifican los coeficientes predictivos lineales mediante una técnica de codificación convencional y transmite los códigos de coeficientes predictivos al lado de descodificación.
Aunque se proporcionará en la presente dos ejemplos de proceso de normalización de envolvente ponderada, la presente invención no se limita a los ejemplos.
<Ejemplo 1>
El normalizador de envolvente ponderado 113b divide los coeficientes X(1), ..., X(N) en una cadena de coeficientes MDCT mediante valores de corrección Wy (1), ..., Wy (N) de los coeficientes en la cadena de coeficientes de envolvente espectral de potencia que corresponde con los coeficientes para obtener los coeficientes X(1)/Wy (1), ..., X(N)/Wy (N) en una cadena de coeficientes MDCT normalizaba ponderada. Los calores de corrección WY(n) [1 < n< N] son proporcionados por la fórmula (3), en donde y es una constante positiva menor o igual que 1 y modera los coeficientes de espectro de potencia.
Figure imgf000007_0001
<Ejemplo 2>
El normalizador de envolvente ponderado 113b eleva los coeficientes en una cadena de coeficientes espectral de potencia que corresponden a los coeficientes X(1), ..., X(N) en una cadena de coeficientes MDCT a la potencia penésima (0 < p <1) y divide los coeficientes X(1), ..., X(N) por valores elevados W(1)p, ..., W(N)p para obtener los coeficientes X(1)/W(1)p, ..., X(N)/W(N)p en una cadena de coeficientes MDCT normalizaba ponderada.
Como resultado, se obtiene una cadena de coeficientes MDCT normalizada ponderada en un marco. La cadena de coeficientes MDCT normalizada ponderara no tiene una pendiente inclinada de amplitud o variaciones grandes comparada con la cadena de coeficientes MDCT de entrada pero tiene variaciones de magnitud similares a las de la envolvente espectral de potencia de la cadena de coeficientes MDCT de entrada, esto es, la cadena de coeficientes MDCT normalizada ponderada tiene amplitudes algo mayores en una región de coeficientes que corresponde a bajas frecuencias y tiene una estructura fina debido al periodo de tono de dominio de tiempo.
Nótese que el proceso inverso del proceso de normalización de envolvente ponderado, esto es, el proceso para reconstruir la cadena de coeficientes MDCT a partir de la cadena de coeficientes MDCT normalizada ponderada, se realiza en el lado de descodificación, los ajustes para el método para calcular las cadenas de coeficientes de envolvente espectral de potencia a partir de cadenas de coeficientes de envolvente espectral de potencia necesitan ser comunes entre los lados de codificación y descodificación.
Unidad Aritmética de Ganancia Normalizada 113c
Después, una unidad aritmética de ganancia normalizada 113c toma una entrada de una cadena de coeficiente MDCT normalizada ponderada y determina el tamaño de etapa de cuantificación utilizando la suma de los valores de amplitudes en cada valor en todas las frecuencias, de manera que los coeficientes en la cadena de coeficientes MDCT moralizada ponderada en cada marco pueden ser cuantificados por un número tota de bits dado, y obtiene un coeficiente (en lo que sigue referido como ganancia) mediante el cual, los coeficientes de la cadena de coeficientes MDCT normalizada ponderada es dividida, de manera que es proporcionado el tamaño de etapa de cuantificación (etapa S113c). La información que representa la ganancia es transmitida al lado de descodificación como información de ganancia. La unidad aritmética de ganancia normalizada 113c normaliza (divide) los coeficientes en la cadena de coeficientes MDCT normalizada ponderada en cada marco por la ganancia y genera los coeficientes normalizados.
Cuantificador 113d
Después el cuantificador 113d utiliza el tamaño de etapa de cuantificación determinado en el proceso en la etapa S113c para cuantificar los coeficientes en la cadena de coeficientes MDCT normalizada ponderada normalizada con la ganancia en una base de marco a marco y genera la cadena de coeficientes MDCT cuantificada resultante como una “cadena de muestras de dominio de frecuencia” (etapa S113d).
La cadena de coeficientes MDCT cuantificada (la cadena de muestras de dominio de frecuencia) en cada marco obtenida por el proceso en la etapa S113d es introducida en un analizador de periodo de tono de dominio de frecuencia 115 y en una unidad de reorganización 116a.
Convertidor de Periodo 114
Cuando la información de selección de predicción de largo plazo indica que la predicción de largo plazo va a ser realizada, un convertidor de periodo 114 obtiene un intervalo convertido T1 basado en un un periodo de tono de dominio de tiempo de entrada L, y el número N de puntos de muestra en el dominio de frecuencia de acuerdo con la fórmula (A4) y genera el intervalo convertido T1. “INT ()” en la fórmula (A4) representa un valor número contenido en el paréntesis reducido al número entero mas cercano.
Figure imgf000008_0001
Nótese que aunque un intervalo convertido teórico es N*2/L - 1/ , 1/2 es añadido al N*2/L - 1/2 para redondear al número entero más cercano si es deseable que el intervalo convertido T1 sea un valor entero. Alternativamente, N*2/L - / puede se redondeado a una posición decimal predeterminada y el valor resultante puede ser establecido como el intervalo convertido T1. Por ejemplo, si N*2/L - / es mantenido en un formato de punto flotante pseudobinario con una parte de fracción de cinco dígitos y un periodo de tono de número entero es obtenido mediante redondeo, 25(N*2L - 1/2 1/2) puede ser redondeado hacia abajo al número entero más cercano, el valor resultante puede ser establecido como el intervalo convertido T1, T1 puede ser multiplicado por un número entero, el resultado puede ser multiplicado por un número entero, el resultado puede ser multiplicado por 1/25 = 1/32 para convertirlo de nuevo en un formato de punto flotante, y el valor resultante puede ser establecido como candidato para determinar el periodo de tono de dominio de frecuencia.
Cuando la información de selección de predicción de largo plazo indica que no se va a realizar predicción de largo plazo, el convertidor de periodo 114 no hace nada. Sin embargo, el mismo proceso se puede realizar, el cual sería realizado cuando la información de selección de largo plazo indica que se va a realizar predicción de largo plazo. Esto es, el convertidor de periodo 114 puede ser configurado para tomar entradas de un periodo de dominio de tiempo L y el número N de puntos de muestra en el dominio de frecuencia y puede calcular y generar un intervalo convertidor T1 sin recibir información de selección de predicción de largo plazo.
Analizador de Periodo de Tono de Dominio de Frecuencia 115
Cuando la información de selección de predicción de largo plazo indica que se va a realizar predicción de largo plazo, un analizador de periodo de tono de dominio de frecuencia 115 elige un periodo de tono de dominio de frecuencia T de entre los candidatos que incluyen un intervalo convertidor de entrada T1 y múltiplos enteros U X T1 del intervalo convertido T1, y genera el periodo de tono de dominio de frecuencia T y un código de periodo de tono de dominio de frecuencia que indica cuántas veces el periodo de tono de dominio de frecuencia T es mayor que el intervalo convertido T1. Aquí, U es un número entero en un primer rango predeterminado. Por ejemplo, U puede ser un número entero distinto de 0 y U > 2 , por ejemplo. Por ejemplo, si los valores enteros en el primer rango predeterminado son mayores o iguales que 2 y menores o iguales que 8, un total de ocho valores, a saber, el intervalo convertido T1 y los valores iguales a 2 a 8 veces el intervalo convertido T1, es decir, 2T1, 3T1, 4T1, 5T1, 6T1, 7T1 y 8T1, son candidatos de periodo de tono de dominio de frecuencia a partir de los cuales se elige un periodo de tono de dominio de frecuencia T. Un código de periodo de tono de dominio de frecuencia en este caso es un código que es al menos de 3 bits de largo y está en correspondencia uno a uno con el número entero más grande o igual a 1 y menor o igual a 8.
Cuando la información de selección de predicción de largo plazo indica que no se va a realizar predicción de largo plazo, el analizador de periodo de tono de dominio de frecuencia 115 elige un periodo de tono de dominio de frecuencia T de entre los candidatos que son números enteros en un segundo rango predeterminado y genera el periodo de tono de dominio de frecuencia T y un código de periodo de tono de dominio de frecuencia que indica el periodo de tono de dominio de frecuencia T. Por ejemplo, si los números enteros en el segundo rango predeterminado son mayores o iguales a 5 y menores o iguales a 36, el total de los 25 valores, 5, 6, ..., 36 son candidatos de periodo de tono de dominio de frecuencia a partir de los cuales se elige un periodo de tono de dominio de frecuencia T. Un código de periodo de tono de dominio de frecuencia en este caso es un código que es al menos de 5 bits de largo y está en correspondencia de uno a uno con un número entero mayor o igual que 0 y menor o agua a 31.
El analizador de periodo de tono de dominio de frecuencia 115 elige un candidato que maximiza un indicador del grado de concentración de energía de un grupo de muestras seleccionado de acuerdo con una regla de reorganización predeterminada, por ejemplo, como el periodo de tono de dominio de frecuencia T. El indicador del grado de concentración de energía puede ser la suma de la energía o la suma de los valores absolutos. Si el indicador del grado de concentración de energía es la suma de la energía, un candidato que maximiza la suma de la energía de todas las muestras incluidas en un grupo de muestras seleccionado de acuerdo con una regla de reorganización predeterminada es elegido como periodo de tono de dominio de frecuencia T. Si el indicador del grado de concentración de energía es la suma de los valores absolutos, un candidato que maximiza la suma de los valores absolutos de todas las muestras incluidas en un grupo de muestras seleccionado de acuerdo con una regla de reorganización predeterminada es elegido como periodo de tono de dominio de frecuencia. La expresión “grupo de muestras seleccionado de acuerdo con una regla de reorganización predeterminada” será descrita más adelante con detalle en la sección sobre la unidad de reorganización 116a.
Alternativamente, por ejemplo el analizador de periodo de tono de dominio de frecuencia 115 puede realmente codificar una cadena de muestras reorganizada a una regla predeterminada y puede elegir un candidato que minimiza la cantidad de código como el periodo de tono de dominio de frecuencia T. La expresión “una cadena de muestras reorganizada de acuerdo con una regla predeterminada” se describirá más adelante con detalle en la sección sobre la unidad de reorganización 116a.
Alternativamente, el analizador de periodo de dominio de frecuencia 115 puede elegir, por ejemplo, un número predeterminado de candidatos que produzcan los indicadores más grandes de los grados de concentración de energía en un grupo de muestras seleccionado de acuerdo con una regla de reorganización predeterminada, puede actualmente codificar una cadena de muestras de los candidatos elegidos reorganizados de acuerdo con una regla predeterminada, y puede elegir un candidato que minimice la cantidad de código como periodo de tono de dominio de frecuencia T.
El significado de elegir un periodo de tono de dominio de frecuencia T de entre los candidatos que son un intervalo convertido T1 y múltiplos enteros U X T1 del intervalo convertido T1 por el analizador de periodo de tono de dominio de frecuencia 115 cuando la información de selección de largo plazo indica que se va a realizar la predicción de largo plazo se describirá a continuación.
Permitir que una cadena residual de predicción de largo plazo en ventana en 2*N puntos en el dominio de tiempo sea xp'(1), ..., Xp'(2*N), después la trasformada MDCT de la cadena de señales Xp'(1), ..., Xp'(2*N) produzca la siguiente cadena de coeficientes MDCT X(1), ..., X(N), por ejemplo:
Figure imgf000009_0001
en donde, p es un coeficientes tal como (1/N)1/2 y k es un índice K = 1, ..., N que corresponde con una frecuencia. Esto es, cada cadena de coeficientes MDCT X(k) es el producto interno del siguiente vector de base ortonormal 2*N-dimensional B(k) y un centro de cadena de señales xp'(1), ..., Xp'(2*N)), por ejemplo.
Figure imgf000009_0002
Idealmente, la cadena de señales Xp'(1), ..., Xp'(2*N) tiene una periodicidad fundamental Pf (el periodo fundamental de la cadena de señal de audio digital x(1), ..., x(Nt)) en el dominio de tiempo, por lo tanto, una cadena que consista en cada producto interior dado anterior, es decir al energía o valor absoluto de cada coeficiente MDCT X(k) es maximizada a intervalos de frecuencia de 2*N/Pf (en lo que sigue denominados como “intervalos convertidos ideales”) (excepto para el caso especial tal como cuando la cadena de señales Xp'(1), ..., Xp'(2*N) es una onda sinusoidal). Por consiguiente, el periodo de tono de dominio de tiempo L elegido en la etapa S-111-1 es idealmente el periodo fundamental Pf y el intervalo convertido ideal 2*N/Pf en donde Pf = L es el periodo de tono de dominio de frecuencia T.
Sin embargo, x(1), ..., x(Nt) y X(1), ..., X(N) son valores discretos. No todos los números enteros múltiplos de un intervalo de muestras vecinas de X(1), ..., X(N) en el dominio de tiempo son el periodo fundamental Pf. Además, los múltiplos enteros de un intervalo de muestras vecino X(1), ..., X(N) en el dominio de frecuencia no son siempre los intervalos convertidos ideales 2*N/Pf. Por consiguiente, en algunos casos el periodo de tono de dominio de tiempo L elegido en la etapa S 111-1 puede ser un múltiplo entero del periodo fundamental Pf o un candidato t próximo a un múltiplo entero del periodo fundamental Pf en lugar del periodo fundamental Pf o un candidato t elegido próximo al periodo fundamental Pf. Si el periodo de tono de dominio de tiempo L es un múltiplo entero n*Pf del periodo fundamental, el intervalo de dominio de frecuencia T r transformado a partir de periodo de tono de dominio de tiempo L será igual al intervalo convertido ideal multiplicado por una fracción de un número entero, es decir (2*N/Pf)/n. En consecuencia, puede haber casos en los que un grupo de muestras no puede ser seleccionado con el periodo de tono de dominio de frecuencia T que es igual a los intervalos convertidos ideales 2*N/Pf pero un grupo de muestras puede ser seleccionado con un periodo de tono de dominio de frecuencia T que sea igual a un múltiplo entero del intervalo T r= 2*N/L para incrementar el indicador del grado de concentración de energía del grupo de muestras seleccionado. Esos casos serán descritos con un ejemplo.
Como se ha descrito previamente, el periodo de tono de dominio de tiempo L elegido en el etapa S111-1 es un candidato t que puede maximizar un valor que puede ser obtenido de acuerdo con la fórmula A(1). En general x(t)x(t - t ) en la fórmula (A1) es maximizado cuando es elegido un candidato t que es el más cercano a uno cualquiera del periodo fundamental Pf de la cadena de señales de audio digital x(1), ..., x(Nt) o múltiplos enteros del periodo fundamental Pf, es decir, nPf (en donde n es un número entero positivo). Esto es, un candidato t que es el más cercano a cualquiera de n*Pf es más probable que sea el periodo de tono de dominio de tiempo L. Aquí, cuando el periodo fundamental Pf es un múltiplo entero del periodo de muestreo (el intervalo entre las muestras vecinas) de la cadena de señales de audio digital x(1), ... x(N), el periodo fundamental Pf o un candidato t que es el más cercano al periodo fundamental Pf es probable que maximice el valor que puede ser obtenido de acuerdo con la fórmula (A1) y es probable que sea el periodo de tono de dominio de tiempo L. Por otra parte, cuando el periodo fundamental Pf no es un múltiplo entero el periodo de muestreo, n*Pf que no es igual al periodo fundamental Pf o un candidato t que es el mas cercano a tal n*Pf es más probable maximizar el valor que puede ser obtenido de acuerdo con la fórmula (A1) y es probable que sea el periodo de tono de dominio de tiempo L. Por ejemplo, en el ejemplo de la Figura 3, el periodo fundamental Pf no es un múltiplo entero del periodo de muestreo y el 2*Pf es elegido como periodo de tono de dominio de tiempo L. Si hay múltiples candidatos que son múltiplos enteros del periodo de muestreo entre los candidatos t para el periodo de tono de dominio de tiempo, un candidato que tiene un valor más pequeño produce un valor más grande de la fórmula A1 y es por tanto más probable que sea elegido como el periodo de tono de dominio de tiempo L. Por ejemplo si 2*Pf y 4*Pf son múltiplos enteros del periodo de muestreo, 2*Pf es más probable que sea elegido como el periodo de tono de dominio de tiempo L debido a que 2*Pf produce un valor más grande de la fórmula (A1). Esto es, es más probable que sea utilizado un valor más pequeño de n dado anteriormente.
En otras palabras, el periodo de tono de dominio de tiempo L elegido en la etapa S111-1 puede ser aproximado como L = n*Pf. Por lo tanto, el intervalo de dominio de frecuencia Tr = 2*N/L convertido a partir del periodo de tono de dominio de tiempo L puede ser aproximado como:
T ' = 2*N/L » 2*N/n*Pf = (2*N/Pf)/n (A41)
En otras palabras, el intervalo Tr puede se aproximado a 1/n veces el intervalo convertido ideal (2*N/Pf). En este caso, un múltiplo entero del intervalo n*Tr, en lugar del intervalo T r, corresponde al intervalo convertido ideal 2*N/Pf.
Además, un múltiplo entero del intervalo de muestreo en el dominio de frecuencia no siempre corresponde al intervalo convertido ideal 2*N/Pf. Por ejemplo, en el ejemplo de la Figura 4, dado que el intervalo convertido ideal 2*N/Pf no es un múltiplo entero de un periodo de muestreo vecino de la cadena de coeficientes MDCT X(1), ..., X(N), un grupo de muestras no puede ser seleccionado con el intervalo convertido ideal 2*N/Pf que sea igual al periodo de tono de dominio de frecuencia T. Sin embargo, en términos de aumentar el grado de concentración de energía de un grupo de muestras seleccionado en base al periodo de tono de dominio de frecuencia, el periodo de tono de dominio de frecuencia T = m*2*N/Pf, que es m veces (en donde m es número entero positivo) mayor que un intervalo convertido ideal 2*N/Pf puede ser elegido para aumentar el indicador del grado de concentración de energía sobre el grupo de muestras seleccionado, incluso si el propio intervalo convertido ideal 2*N/Pf no puede ser elegido como periodo de tono de dominio de frecuencia. Esto es, con el fin de aumentar el grado de concentración de energía en un grupo de muestras seleccionado, la relación entre el periodo de tono de dominio de frecuencia y el intervalo convertido T1 ' se puede escribir a partir de la fórmula (A41) como sigue:
T = m (2 N/P ) * m*n*Ti’ (A42)
Además, utilizando el intervalo convertido T1 en la fórmula (A4), la fórmula (A42) puede ser aproximada como sigue:
T = m*n*INT(TY) = m*n*INT(2*N/L) = m*n*Ti (A43)
Esto es, el periodo de tono de dominio de frecuencia T puede ser aproximado por un múltiplo entero del intervalo convertido T1. En otras palabras, un múltiplo entero del intervalo convertido T1 es más probable que sea un periodo de tono de dominio de frecuencia T que proporciona un indicador más grande del grado de concentración de energía en un grupo de muestras que otros valores. Esto es, un indicador grande del grado de concentración de energía en un grupo de muestras puede ser proporcionado por un periodo de tono de dominio de frecuencia T a parir de candidatos que son el intervalo convertido T1, múltiplos enteros del intervalo convertido T1 y valores cercanos a estos valores.
Dado que un valor más pequeño de n es más probable que sea utilizado como se ha descrito anteriormente, y m es un número entero positivo, en el dominio de frecuencia un multiplicador más pequeño m*n para el intervalo convertido T1 de periodo de tono de dominio de frecuencia T es más probable que sea elegido como periodo de tono de dominio de frecuencia T. Esto es, un indicador grande del grado de concentración de energía en un grupo de muestras puede ser proporcionado por un periodo de tono de dominio de frecuencia T a partir de candidatos que son el intervalo convertido T i, múltiplos enteros del intervalo convertido Ti y valores cercanos a estos valores.
Dado que un valor más pequeño de n es más probable que sea utilizado como se ha descrito anteriormente, y m es un número entero positivo, en el dominio de frecuencia un multiplicador más pequeño m*n para el intervalo convertido Ti del periodo de tono de dominio de frecuencia T es más probable que sea elegido como periodo de tono de dominio de frecuencia T. Esto es, un múltiplo entero más pequeño del intervalo convertido Ti es probablemente elegido como el periodo de tono de dominio de frecuencia T.
La Figura 5 ilustra un gráfico en el que el eje horizontal representa el periodo de tono de dominio de frecuencia / longitud de marco de transformada*2 / periodo de tono de dominio de tiempo) (T/(2*N/L) = T/Ti) y el eje vertical representa la frecuencia. La Figura 5 ilustra la relación entre el periodo de tono de dominio de frecuencia y el periodo de tono de dominio de tiempo que proporciona un indicador grande del grado de concentración de energía en un grupo de muestras. Se puede observar en la Figura 5, que el periodo de tono de dominio de frecuencia T se produce más frecuentemente que un múltiplo como un múltiplo entero (especialmente multiplicado por i, 2, 3 o 4) del intervalo convertido Ti o un valor próximo a un múltiplo entero del intervalo convertido Ti y el periodo de tono de dominio de frecuencia T se produce menos frecuentemente como un valor distinto de los múltiplos enteros del intervalo convertido Ti. En otras palabras, la Figura 5 indica que un periodo de tono de dominio de frecuencia T que proporciona un grado de concentración de energía grande en un grupo de muestras es ampliamente probable que sea un múltiplo entero del intervalo convertido Ti o un valor cercano a un múltiplo entero del intervalo convertido Ti. También se puede observar que un multiplicador más pequeño m*n para el intervalo convertido Ti del periodo de tono de dominio de frecuencia T es más probable que sea elegido como periodo de tono de dominio de frecuencia T. Por consiguiente, un valor que proporciona un grado grande de concentración de energía en un grupo de muestras se puede encontrar como el periodo de tono de dominio de frecuencia de entre candidatos que son múltiplos enteros del intervalo convertido T i y valores cercanos a ellos.
Codificador i i6 Basado en Periodo de Tono de Dominio de Frecuencia
Un codificador i i6 basado en periodo de tono de dominio de frecuencia incluye una unidad de reorganización ii6 a y un codificador 116b codifica una cadena de muestras de dominio de frecuencia de entrada mediante un método de codificación basado en un periodo de tono de dominio de frecuencia T y genera una cadena de códigos resultante.
Unidad de Reorganización 116a
La unidad de reorganización 116a reorganiza al menos algunas muestras incluidas en una cadena de muestras, de manera que ( i) todas las muestras en la cadena de muestras de dominio de frecuencia están incluidas y (2) todas o alguna de una o una pluralidad de muestras sucesivas incluyendo una muestra correspondiente a un periodo de tono de dominio de frecuencia T elegido por el analizador de periodo de tono de dominio de frecuencia i i5 en la cadena de muestras de dominio de frecuencia y una o una pluralidad de sucesivas muestras incluyendo una muestra correspondiente a un múltiplo entero del periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia son agrupadas juntas en un subgrupo, y genera la cadena de muestras reorganizada. Esto es, al menos algunas de las muestras incluidas en una cadena de muestras de entrada son reorganizadas de manera que una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente a un periodo de tono de dominio de frecuencia T y una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente a un múltiplo entero del periodo de tono de dominio de frecuencia T son agrupadas juntas.
Una o una pluralidad de sucesivas muestras incluyendo la muestra correspondiente al periodo de tono de dominio de frecuencia T y una o una pluralidad de sucesivas muestras que incluyen muestras correspondientes a un múltiplo entero del periodo de tono de dominio de frecuencia T son reunidas juntas en un subgrupo en un lado de baja frecuencia.
A modo de ejemplo, la unidad de reorganización 116a selecciona tres muestras, a saber una muestra F(nT) correspondiente a un múltiplo entero del periodo de tono de dominio de frecuencia T, la muestra que precede a la muestra F(n) y la muestra que sigue a la muestras F(nT), F(nT -1), F(nT) y F(nT 1), a partir de una cadena de muestras de entrada. El grupo de las muestras seleccionadas es un “grupo se muestras seleccionado de acuerdo con una regla de reorganización predeterminada) en el analizador de periodo de tono de dominio de frecuencia 115. F(j) es una muestra correspondiente a un número de identificación j que representa un índice de muestra correspondiente a una frecuencia. Aquí, n es un número entero comprendido entre 1 y un valor tal que nT 1 no excede un límite superior predeterminado N de muestras que van a ser reorganizadas. El máximo valor del número de identificación j que representa un índice de muestra correspondiente a una frecuencia es denominada como jmax. Sin embargo, N puede ser menor que jmax con el fin de agrupar muestras que tengan indicadores grandes juntas en un subgrupo en el lado de baja frecuencia para mejorar la eficiencia de la codificación como se describirá mas adelante, debido a que los indicadores de muestras en una banda de elevada frecuencia de una señal de audio tal como voz y música son típicamente lo suficientemente pequeños. Por ejemplo, N puede ser aproximadamente la mitad del valor de jmax. Dejando que nmax denote el valor máximo de n que es determinado en base al límite superior N, entonces las muestras correspondientes a frecuencias en el rango de la frecuencia más baja a una primera frecuencia predeterminada nmax*T 1 entre las muestras en una cadena de muestras de entrada son las muestras que van a ser reorganizadas. Aquí, el símbolo * representa multiplicación.
La unidad de reorganización 116 organiza las muestras seleccionadas F(j) en orden desde el principio de la cadena de muestras a la vez que mantiene la secuencia original de los números de identificación j para generar una cadena de muestras A. Por ejemplo, si n representa un número entero comprendido entre 1 y 5, la unidad de reorganización 116 organiza un primer grupo de muestras F(T - 1), F(T) y F(T 1), un segundo grupo de muestras F(2T - 1), F(2T) y F(2T 1), un tercer grupo de muestras F(3T - 1), F(3T) y F(3T 1), un cuarto grupo de muestras F(4T - 1), F(4T) y F(4T 1), y un quinto grupo de muestras F(5T - 1), F(5T) y F(5T 1) en orden desde el inicio de la cadena de muestras. Esto es, 15 muestras F(T - 1), F(T), F(T 1), F(2T - 1), F(2T), F(2T 1), F(3T - 1), F(3T), F(3T 1), F(4T -1), F(4T), F(4T 1), F(5T - 1), F(5T) y F(5T 1) son organizadas en este orden desde el inicio de la cadena de nuestras y las 15 muestras forman la cadena de muestras A.
La unidad de reorganización 116a organiza además las muestras F(j) que no han sido seleccionadas en orden desde el extremo de la cadena de muestras A a la vez que mantiene la secuencia original de los números de identificación. Las muestras F(j) que no han sido seleccionadas están situadas entre los grupos de muestras que forman la cadena de muestras A. Un subgrupo de sucesivas muestras está referido como un conjunto de muestras. Esto es, en el ejemplo descarito anteriormente, un primer conjunto de muestras F(1), ..., F(T - 2), un segundo conjunto de muestras F(T 2), ..., F(2T - 2), un tercer conjunto de muestras F(2T 2), ..., F(3T - 2), un cueto conjunto de muestras F(3T 2), ..., F(4T - 2), un quinto conjunto de muestras F(4T 2), ..., F(5T - 2), y un sexto conjunto de muestras F(5T 2), ..., F(jmax) está dispuesto en orden desde el extremo de la cadena de muestras S y estas muestras forman la cadena de muestras B.
En resumen, una cadena de muestras de entrada F(j) (1 < j < jmax) en este ejemplo es reorganizada como F(T - 1), F(T), F(T 1), F(2T - 1), F(2T), F(2T 1), F(3T 1), F(3T), F(3T 1), F(4T - 1), F(4T), F(4T 1), F(5T - 1), F(5T), F(5T 1), F(1), ..., F(T - 2), F(T 2), ..., F(2T - 2), F(2T 2), ..., F(3T - 2), F(3T 2), ..., F(4T - 2), F(4T 2), ..., F(5T - 2), F(5T 2), ..., F(jmax) (véase la Figura 6). La cadena de muestras reorganizada es una “cadena de muestras reorganizada de acuerdo con una regla de reorganización predeterminada” en el analizador de periodo de tono de dominio de frecuencia 115.
Nótese que en una banda de baja frecuencia, las muestras distintas de las muestras que corresponden al periodo de tono de dominio de frecuencia T y las muestras que corresponden a los múltiplos enteros del periodo de tono de dominio de frecuencia T a menudo tienen amplitudes y valores de energía grandes. Por lo tanto, las muestras en el rango comprendido entre la frecuencia más baja y una frecuencia predeterminada f pueden ser excluidas de la reorganización. Por ejemplo, si la frecuencia predeterminada f es nT a, las muestras originales F(1), ... F(nT a) no son reorganizadas pero las muestras originales F(nT a 1) y las posteriores muestras son reorganizadas, en donde a es prestablecido a un número entero mayor o igual a 0 y algo menor que T (por ejemplo un número entero menor que T/2). Aquí, n pueden ser un número entero mayor o igual a 2. Alternativamente, las P muestras sucesivas originales F(1), ..., F(P) a partir de una muestra que corresponde a la frecuencia más baja pueden ser excluidas de la reorganización y la muestra original F(P 1) y las posteriores muestras pueden ser reorganizadas. En este caso, la frecuencia predeterminada f es P. Una colección de muestras puede ser reorganizaba de acuerdo con la regla descrita anteriormente. Nótese que si una primera frecuencia predeterminada ha sido establecida, la frecuencia predeterminada f (una segunda frecuencia predeterminada) es menor que la primera frecuencia predeterminada.
Si las muestras originales F(1), ..., F(T 1), por ejemplo, no son reorganizadas y una muestra original F(T 2) y las posteriores muestras van a ser reorganizadas, la cadena de muestras de entrada F(j) (1 < j < jmax) será reorganizada como F(1), ..., F(T 1), F(2T - 1), F(2T), F(2T 1), F(3T - 1), F(3T), F(3T 1), F(4T - 1), F(4T), F(4T 1), F(5T - 1), F(5T), F(5T 1), F(T 2), ..., F(2T - 2), F(2T 2), ..., F(3T - 2), F(3T 2), ..., F(4T - 2), F(4T 2), ..., F(5T - 2), F(5T 2), ..., F(jmax) de acuerdo con la regla de reorganización descrita anteriormente (véase la Figura 7).
Límites superiores diferentes N o diferentes primeras frecuencias predeterminadas que determinan el valor máximo de números de identificación j que van a ser reorganizados pueden ser establecidos para diferentes marcos, en lugar de establecer un límite superior N o primera frecuencia predeterminada que sea común para todos los marcos. En ese caso, la información que especifica un limite superior N o una primera frecuencia predeterminada para cada marco puede ser transmitido al lado de descodificación. Además, el número de grupos de muestras que van a ser reorganizadas puede ser especificado en lugar de especificar el valor máximo de número de identificación j que van a ser reorganizados. En ese caso, el número de grupos de muestras puede ser establecido para cada marco y la información que específica el número de grupos de muestras puede ser transmitida al lado de descodificación. Por supuesto, el número de grupos de muestras que van a ser reorganizados pueden ser común para todos los marcos. Segundas frecuencias predeterminadas diferentes f pueden ser establecidas para diferentes marcos, en lugar de establecer un segundo valor predeterminado que sea común a todos los marcos. En ese caso, la información que especifica una segunda frecuencia predeterminada para cada marco puede ser transmitida al lado de descodificación.
La envolvente de indicadores de muestras en la cadena de muestras de este modo reorganizada decae con el aumento de frecuencia cuando las frecuencias y los indicadores de las muestras son graficados como abscisas y ordenadas, respetivamente. La razón es el hecho de que las cadenas de señales de audio, especialmente las cadenas de muestras de señales de voz y música en el dominio de frecuencia generalmente contienen menos componentes de elevada frecuencia. En otras palabras, la unidad de reorganización 116a reorganiza al menos algunas de las muestras contenidas en la cadena de muestras de entrada de manera que la envolvente de los indicadores de las muestras disminuye con el aumento de la frecuencia. Nótese que las Figuras 6 y 7 ilustran ejemplos en los que todas las muestras incluidas en una cadena de muestras en el dominio de frecuencia son valores positivos con el fin de mostrar claramente que las muestras que tienen amplitudes mayores aparecen en el lado de frecuencia más bajo como resultado de la reorganización de las muestras. En la práctica, las muestras incluidas en una cadena de muestras en el dominio de frecuencia son a menudo positivas o negativas o cero. La reorganización descrita anteriormente o un proceso de reorganización que será descrito más adelante pueden ser realizados en tales casos también.
Aunque la reorganización en este ejemplo agrupa una o una pluralidad de muestras sucesivas que incluyen una muestra correspondiente al periodo de tono de dominio de frecuencia T y una o una pluralidad de muestra sucesivas que incluyen una muestra correspondiente a un múltiplo entero del periodo de tono de dominio de frecuencia T juntas en un subgrupo en el lado de baja frecuencia, se puede realizar reorganización que agrupe una o una pluralidad de muestras sucesivas que incluyen una muestra correspondiente al periodo de tono de dominio de frecuencia T y una o una pluralidad de muestras sucesivas que incluyen muestras correspondientes a un múltiplo entero del periodo de tono de dominio de frecuencia T juntas en un subgrupo en el lado de alta frecuencia. En ese caso, los grupos de muestras en la cadena de muestras A son organizados en orden inverso, los conjuntos de muestras en la cadena de muestras B son organizados en el orden inverso, la cadena de muestras B es colocada en el lado de baja frecuencia, la cadena de muestras A sigue la cadena de muestras B. Esto es, las muestras en el ejemplo descrito anteriormente, son organizadas en el siguiente orden desde el lado de baja frecuencia: el sexto conjunto de muestras F(5T 2), ..., F(jmax), el quinto conjunto de muestras F(4T 2), ...,. F(5T - 2), el cuarto conjunto de muestras F(3T 2), ..., F(4T - 2), el tercer conjunto de muestras F(2T 2), ..., F(3T - 2), el segundo conjunto de muestras F(T 2), ..., F(2T - 2), el primer conjunto de muestras F(1), ..., F(T - 2), el quinto grupo de muestras F(5T - 1), F(5T), F(5t + 1), el cuarto grupo de muestras F(4T - 1), F(4T), F(4T 1), el tercer grupo de muestras F(3T - 1), F(3t ), F(3t 1), el segundo grupo de muestras F(2T - 1), F(2t ), F(2T 1), y el primer grupo de muestras F(T - 1), F(T), F(T 1). La envolvente de indicadores de las muestras en la cadena de muestras así reorganizada se eleva con el aumento de frecuencia cuando las frecuencias y los indicadores de muestras son graficados como abscisas y ordenadas, respetivamente. En otras palabras, la unidad de reorganización 116a reorganiza al menos alguna de las muestras incluidas en la cadena de muestras de entrada, de manera que la envolvente de las muestras aumenta con la frecuencia creciente.
El periodo de tono de dominio de frecuencia T puede ser un valor fraccional en lugar de un número entero. En ese caso, F(R(nT - 1)), F(RNnT)), y F(R(nT 1), por ejemplo son seleccionados, en donde R(nT) representa un valor nT redondeado al número entero más cercano.
Nótese que si el analizador de periodo de tono de dominio de frecuencia 115 realiza el proceso para elegir un candidato que minimice la cantidad de código real como periodo de tono de dominio de frecuencia T, el codificador 116 basado en el periodo de tono de dominio de frecuencia no necesita incluir la unidad de reorganización 116a debido a que el analizador de periodo de tono de dominio de frecuencia 115 genera una cadena de muestras reorganizada.
[El número de muestras recogidas]
Se proporciona un ejemplo en el que el número de muestras incluidas en cada grupo de muestras se fija en tres, a saber una muestra que corresponde a un periodo de tono de dominio de frecuencia T o un múltiplo entero del periodo de tono de dominio de frecuencia (en lo que sigue la muestra denominada como muestra de centro), la muestra que precede a la muestra de centro, y la muestra que sigue a la muestra de centro. Sin embargo, si el número de muestras en un grupo de muestras y los índices de muestras son variables, la unidad de reorganización 116a genera información que indica que una seleccionada de una pluralidad de alternativas en la que las combinaciones de números de muestras en un grupo de muestras y los índices de muestras son diferentes como información auxiliar (primera información auxiliar).
Por ejemplo, si
(1) solo la muestra de centro F(nT),
(2) un total de tres muestras, a saber, una muestra de centro, la muestra que precede a la muestra de centro y la muestra que sigue a la muestra de centro F(nT -1), F(nT), F(nT 1),
(3) un total de tres muestras, a saber, una muestra de centro y dos muestras precedentes F(nT -2), F(nT -1), F(nT),
(4) un total de cuatro muestras, a saber, una muestra de centro y tres muestras precedentes F(nT -3), F(nT -2), F(nT -1), F(nT),
(5) un total de tres muestras, a saber, una muestra de centro y dos muestras sucesivas F(nT), F(nT 1), F(nT 2), y
(6) un total de cuatro muestras, a saber, una muestra de centro y tres muestras sucesivas, F(nT), F(nT 1), F(nT 2), F(nT 3)
son establecidas como alternativas y es seleccionada (4), información que indica que (4) ha sido seleccionada es generada como primera información auxiliar. Tres bits son suficientes para la información que indica la alternativa seccionada en este ejemplo.
Un método para elegir una de las alternativas es como sigue. La unidad de reorganización 116a puede realizar reorganización correspondiente a cada una de estas alternativas y el codificador 116b, que será descrito más adelante, puede obtener la cantidad de código de una cadena de códigos correspondiente a cada una de las alternativas. Después, la alternativa que produce la cantidad de código más pequeña puede ser seleccionada. En este caso, la primera información auxiliar es generada desde el codificador 116b en lugar de desde la unidad de reorganización 116a. Este método se aplica también a un caso en el que n puede ser seleccionado a partir de una pluralidad de alternativas.
Codificador 116b
Después el codiciador 116b codifica la salida de cadena de muestras desde la unidad de reorganización 116a y genera la cadena de códigos resultante (etapa S116b). Por ejemplo, el codificador 116b cambia la codificación de longitud de variable de acuerdo con la localización de las amplitudes de muestras incluidas en la cadena de muestras generadas desde de la unidad de reorganización 116a y codifica la cadena de muestras. Esto es, dado que las muestras que tienen amplitudes grandes son reunidas juntas en un subgrupo en el lado de baja frecuencia (o alta) en un marco por la unidad de reorganización 116a, el codificador 116b realiza la codificación de longitud variable apropiada para la localización. Si los ejemplos que tienen amplitudes iguales o casi iguales son reunidos juntos en un subgrupo en cada región local como la salida de cadena de muestras procedente de la unidad de reorganización 116a, la cantidad de código media se puede reducir, por ejemplo, mediante codificación Rice utilizando diferentes parámetros Rice para diferentes regiones. Se describirá un ejemplo, en el que las muestras que tienen amplitudes grandes son agrupadas juntas en un subgrupo en el lado de baja frecuencia en un marco (el lado más cercano al inicio del marco).
[Ejemplo de Codificación]
A modo de ejemplo, el codificador 116b aplica codificación Rice (también denominada codificación de Golomb-Rice) a cada muestra en una región en la que las muestras que tienen amplitudes grandes son reunidas juntas en un subgrupo. En una región distinta de esta región, el codificador 116b aplica codificación de entropía (tal como codificación Huffman o codificación aritmética), que también es adecuada para un conjunto de muestras reunidas juntas. Para aplicar la codificación Rice, un parámetro Rice y una región a la que la codificación Rice es aplicada pueden ser fijados o una pluralidad de diferentes combinaciones de región a las que la codificación Rice es aplicada y el parámetro Rice puede ser provisto, de manera que se puede elegir una combinación a partir de las combinaciones. Cuando una de la pluralidad de combinaciones es elegida, los siguientes códigos de longitud variable (valores binarios contenidos en las marcas “ “), por ejemplo, se pueden utilizar como información de selección que indica la elección para la codificación Rice y el codificador 116b genera la información de selección que indica la elección.
“1”: la codificación Rice no está aplicada.
“01”: la codificación Rice está aplicada a la primera 1/32 región de una cadena con el parámetro Rice 1. “001”: la codificación Rice está aplicada a la primera 1/32 región de una cadena con el parámetro Rice 2. “0001”: la codificación Rice está aplicada a la primera 1/16 región de una cadena con el parámetro Rice 1. “00001”: la codificación Rice está aplicada a la primera 1/16 región de una cadena con el parámetro Rice 2. “00000”: la codificación Rice está aplicada a la primera 1/32 región de una cadena con el parámetro Rice 3.
Un método para elegir una de estas alternativas puede ser comparar las cantidades de código de las cadenas de código correspondientes a diferentes alternativas para la codificación Rice que son obtenidas codificando para elegir una alterativa con la cantidad de código más pequeña.
Cuando una región en la que las muestras que tienen una amplitud de 0 se produce en una sucesión larga aparece en una muestra reorganizada, la cantidad de código promedio se puede reducir mediante codificación de longitud de ejecución, por ejemplo, del número de muestras sucesivas que tienen una amplitud de 0. En tal caso, el codificador 116b (1) aplica codificación Rice a cada muestra en la región en la que las muestras que tienen amplitudes grandes están agrupadas juntas en un subgrupo y, (2) en las regiones distintas de esa región, (a) aplica codificación que genera códigos que representan el número de sucesivas muestras que tienen una amplitud de 0 a una región en donde las muestras que tienen una amplitud de 0 aparecen en sucesión, (b) aplica codificación de entropía (tal como codificación Huffman o codificación aritmética), que es también adecuada pare un conjunto de muestras reunidas juntas, a las regiones restantes. De nuevo, una elección se puede hacer entre alternativas de codificación Rice descritas anteriormente. En este caso, la información que indica rejones en las que ha siso aplicada codificación de longitud de ejecución necesita ser enviada al lado de descodificación. Esta información puede ser incluida en la información de selección descrita anteriormente, por ejemplo. Adicionalmente la pluralidad de tipos de métodos de codificación de entropía son proporcionados como alternativas, información que identifica cual de los tipos de codificación ha sido elegida necesita ser enviada al lado de codificación. La información puede ser incluida en la información de selección descrita anteriormente, por ejemplo.
En algunas situaciones, puede no haber ventaja en la reorganización de muestras incluidas en la cadena de muestras. En tal caso, una cadena de muestras original necesita ser codificada. La unidad de reorganización 116a por tanto genera una cadena de muestras originales (una cadena de muestras que no ha sido reorganizada) también. Después el descodificador 116b codifica la cadena de muestras original y la cadena de muestras reorganizada por la codificación de longitud variable. La cantidad de código de la cadena de códigos obtenida por la codificación de longitud variable de la cadena de muestras original es comparada con la cantidad de código de la cadena de códigos obtenida por codificación de longitud variable de la cadena de muestras reorganizada utilizando diferentes métodos de codificación de longitud variable para diferentes regiones. Si la cantidad de código de la cadena de códigos obtenida por la codificación de longitud variable de la cadena de muestras original es la más pequeña, es generada la cadena de códigos obtenida por codificación de longitud variable de la cadena de muestras original. En este caso, el codificador 116b también genera información auxiliar (segunda información auxiliar) indicando si la cadena de muestras correspondientes a la cadena de códigos es una cadena de muestras reorganizada o no. Un bit es suficiente para la segunda información auxiliar. Nótese que si la segunda información auxiliar indica que la cadena de muestras correspondiente a la cadena de códigos es la cadena de muestras original en la que las muestras no han sido reorganizadas, la primera información auxiliar no necesita ser generada.
Además, es posible predeterminar reorganizar una cadena de muestras solo si una ganancia de predicción o una ganancia de predicción estimada son mayores que un umbral predeterminado. El método toma la ventaja del hecho de que cuando la ganancia de predicción en voz o música es grande, la vibración de las cuerdas vocales o la vibración de un instrumento musical son fuertes y la periodicidad es elevada. La ganancia de predicción es la energía del sonido original dividida por la energía de una predicción residual. En la codificación que utiliza coeficientes predictivos lineales y coeficientes PARCOR como parámetros, los parámetros cuantificados pueden ser utilizados en un codificador y el descodificador en común. Por lo tanto, por ejemplo, el codificador 116b puede utilizar un coeficiente PARCOR de i-ésimo orden cuantificado k(i) obtenido por otros medios, no mostrado, provisto en el codificador 11 para calcular una ganancia de predicción estimada representada por el recíproco de (1 - k(i) * k(j)) multiplicados entre sí. Si el valor estimado calculado es mayor que un umbral predeterminado, el codificador 116b genera una cadena de códigos obtenida por codificación variable de una muestra reorganizada; de otro modo, la unidad de codificación 116b genera una cadena de códigos obtenida por descodificación variable de una cadena de muestras original. En ese caso, la segunda información auxiliar que indica si la cadena de muestras correspondiente a una cadena de códigos es una cadena de muestras reorganizaba o no, no necesita ser generada. Esto es, la reorganización es probable que tenga un efecto mínimo en el sonido ruidoso inapreciable o silencio y por tanto la reorganización se genera para reducir el gasto de la segunda información auxiliar y la computación.
En una configuración alternativa, la unidad de reorganización 116a puede calcular una ganancia de predicción o una ganancia de predicción estimada. Si la ganancia de predicción o la ganancia de predicción estimada es mayor que un umbral predeterminado, la unidad de reorganización 116a puede reorganizar una cadena de muestras y generar la cadena de muestras reorganizaba al codificador 116b; de otro modo, la unidad de reorganización 116a puede generar una entrada de cadena de muestras en la unidad de reorganización 116a al codificador 116b sin reorganizar la cadena de muestras. Después, el codificador 116b puede codificar la cadena de muestras generada desde la unidad de reorganización 116a mediante codificación de longitud variable.
En esta configuración, el umbral está presente como un valor común en el lado de codificación y el lado de descodificación.
Nótese que la codificación Rice, la codificación aritmética y la codificación de longitud de ejecución tomadas como ejemplo aquí son bien conocidas y por tanto se omiten las descripciones detalladas de estos métodos. Dado que un coeficiente PARCOR cuantificado es un coeficiente que puede ser convertido a partir de un coeficiente predictivo lineal o un parámetro LSP, primero un coeficiente predictivo lineal cuantificado o un parámetro LSP cuantificado pueden ser obtenidos utilizando otros medios, no mostrados, dispuestas en el codificador 11, en lugar de obtener un coeficiente PARCOR cuantificado utilizando otros medios, no mostrados dispuestas en el codificador 11, después un coeficiente PARCOR cuantificado puede ser obtenido a partir del parámetro obtenido, y después puede ser obtenida una ganancia de predicción estimada. En esencia, la ganancia de predicción estimada es obtenida en base al coeficiente cuantificado correspondiente a un coeficiente predictivo lineal.
Aunque se ha descrito un ejemplo en el que son utilizados métodos de codificación de longitud variable diferentes de acuerdo con la localización de las amplitudes de las muestras incluidas en una salida de cadena de muestras procedente de la unidad de reorganización 116a, la presente invención no se limita a este proceso de codificación. Por ejemplo, se puede utilizar un proceso de codificación en el que una o más muestras son tratadas como un símbolo (unidad de codificación) y un código que es asignado a una secuencia de uno o más símbolos (en lo que sigue denominada como secuencia de símbolos) es controlada adaptativamente dependiendo de la cadena de símbolos que precede inmediatamente la secuencia de símbolos. Un ejemplo de tal proceso de codificación puede ser la codificación aritmética adaptativa, que es utilizada en JPEG 2000. En la codificación aritmética adaptativa, son realizados un proceso de modelización y codificación aritmética. En el proceso de modelización, una tabla de frecuencia de una secuencia de símbolos para codificación aritmética es seleccionada de la secuencia de símbolos inmediatamente precedente. Después, se realiza la codificación en la que una media línea de intervalo cerrado [0,1] es dividida en intervalos de acuerdo con la probabilidad de ocurrencia de una secuencia de símbolos seleccionada, y son asignados códigos para la secuencia de símbolos a valores fracciónales binarios que indica las posiciones en los intervalos. En un ejemplo útil para el entendimiento de la presente invención, el proceso de modelización divide secuencialmente una cadena de muestras de dominio de frecuencia reorganizada (una cadena de coeficientes MDCT cuantificados en el ejemplo anteriormente descrito) en símbolos, empezando desde el lado de baja frecuencia, y selecciona una tabla de frecuencias para la codificación aritmética, y la codificación aritmética divide una media línea de intervalo cerrado [0, 1] en intervalos de acuerdo con la probabilidad de ocurrencia de una secuencia de símbolos seleccionada y asigna códigos a la secuencia de símbolos a valores fraccionales binarios que indican posiciones en los intervalos. Dado que la reorganización ha sido realizada para reorganizar la cadena de muestras de manera que las muestras han sido indicadores iguales o casi iguales (por ejemplo, los valores absolutos de las amplitudes) que reflejan los tamaños de las muestras son agrupadas juntas en un subgrupo como se ha descrito anteriormente, las variaciones de los indicadores que reflejan los tamaños de las muestras entre muestras adyacentes en la cadena de muestras son pequeños, la precisión de las tablas de frecuencia de símbolos es elevada y la cantidad de código total de códigos obtenidos por la codificación aritmética de los símbolos se puede mantener pequeña.
Descodificador
Un proceso de descodificación realizado por el descodificador 12 se describirá con referencia a la Figura 2. Este descodificador no está actualmente reivindicado pero la descripción del mismo puede ser útil para el entendimiento de la invención.
Al menos información de selección de predicción de largo plazo, información de ganancia, código de periodo de tono de dominio de frecuencia, y cadena de códigos son introducidos en el codificador 12. Cuando la información de selección de predicción de largo plazo indica que se va a realizar predicción de largo plazo, al menos un código de periodo de tono de dominio de tiempo Cl es introducido. Además del código de periodo de tono de dominio de tiempo Cl , un código de ganancia de tono Cgp puede ser introducido. Si la selección de información, primera información auxiliar y segunda información auxiliar son generadas desde el descodificador 11, la información de selección, la primera información auxiliar y la segunda información auxiliar son también introducidas en el descodificador 12.
Descodificador 123 Basado en Periodo de Tono de Dominio de Frecuencia
Un descodificador basado en periodo de tono de dominio de frecuencia 123 incluye un descodificador 123a y una unidad de recuperación 123b, descodifica una cadena de códigos de entrada utilizando un método de descodificación en un periodo de tono de dominio de frecuencia T para obtener la secuencia de muestras original, y generala secuencia de muestras.
Descodificador 123a
El descodificador 123a descodifica una cadena de códigos de entrada en una base de marco por marco y genera una cadena de muestras de dominio de frecuencia (etapa S123a).
Si la segunda información auxiliar es introducía en el descodificador 12, el descodificador 123a genera la cadena de muestras de dominio de frecuencia obtenida para una sección, que depende de si la segunda información auxiliar indica o no que la cadena de muestras correspondiente a la cadena de códigos es una cadena de muestras reorganizada. Si la segunda información auxiliar indica que la cadena de muestras correspondiente a la cadena de códigos es una cadena de muestras reorganizada, la cadena de muestras de dominio de frecuencia obtenida por el descodificador 123a es generada para la unidad de recuperación 123b. Si la segunda información auxiliar indica que la cadena de muestras correspondiente a la cadena de códigos es una cadena de muestras que no ha sido reorganizada, la cadena de muestras de dominio de frecuencia obtenida por el descodificador 123a es generada para un multiplicador de ganancia 124a.
Además, si el codificador 11 ha hecho la determinación de antemano basada en la comparación entre una ganancia de predicción o una ganancia de predicción estimada y un umbral como para reorganizar las muestras, el descodificador 12 realiza la determinación similar a la determinación. Específicamente, el descodificador 123a utiliza un coeficiente PARCOR cuantificado de orden i-ésimo k(i) obtenido por otros medios, no mostrados, dispuestos en el descodificador 12 para calcular la ganancia de predicción estimada representada por el recíproco de (1 - k(i)) * k(j)) multiplicados entre sí. Si el valor estimado calculado es mayor que un umbral predeterminado, el descodificador 123a genera una cadena de muestras de dominio de frecuencia que el descodificador 123a ha obtenido para la unidad de recuperación 123b. De otro modo, el descodificador 123a genera una cadena de muestras de dominio de frecuencia original que el descodificador 123a ha obtenido para el multiplicador de ganancia 124a.
Nótese que los medios, no mostrados, dispuestos en el descodificador 12 pueden obtener un coeficiente PARCOR cuantificado utilizando un método bien conocido tal como un método mediante el cual un código que corresponde a un coeficiente PARCOR es descodificado para obtener un parámetro LSP cuantificado y el parámetro LSP cuantificado obtenido es convertido para obtener un coeficiente PARCOR cuantificado. Todos estos métodos obtienen un coeficiente cuantificado correspondiente a un coeficiente predictivo lineal a partir de un código correspondiente a un coeficiente predictivo lineal. Esto es, una ganancia de predicción estimada está basada en un coeficiente cuantificado correspondiente a un coeficiente predictivo lineal obtenido descodificando un código correspondiente al coeficiente predictivo lineal.
Si la selección de información es introducida desde el codificador 11 en el descodificador 12, el descodificador 123a realiza un proceso de descodificación en una cadena de códigos de entrada utilizando un método de descodificación de acuerdo con la información de selección. Por supuesto, es realizado un método de descodificación correspondiente al método de codificación realizado para obtener la cadena de codificación. Detalles del proceso de descodificación realizado por el codificador 123a corresponden a los detalles del proceso de codificación realizado por el codificador 116b del codificador 11. Por lo tanto, la descripción del proceso de codificación se incorpora aquí para establecer que la descodificación correspondiente a la codificación realizada por el codificador 11 es el proceso de descodificación realizado por el descodificador 123a, y por tanto se omitirá una descripción detallada del proceso de descodificación. Nótese que si es introducida la selección de información, qué tipo de codificación ha sido realizada puede ser inidentificada por al información de selección. Si la información de selección incluye, por ejemplo, información que identifica una región en la que ha sido aplicada codificación Rice y parámetros Rice, la información que indica una región en la que ha sido aplicada codificación de longitud de ejecución, y la información que identifica el tipo de codificación de entropía, métodos de descodificación correspondientes a estos métodos de codificación son aplicados a las correspondientes regiones de cadenas de codificación de entrada. El proceso de descodificación correspondiente a la codificación Rice, el proceso de descodificación correspondiente a la codificación de entropía, y el proceso de descodificación correspondiente a la codificación de longitud de ejecución son bien conocidos y por tanto serán omitidas la descripciones de estos procesos de descodificación.
Descodificador de Información de Predicción de Largo plazo 121
Un descodificador de información de predicción de largo plazo 121 descodifica un código de periodo de tono de dominio de tiempo de entrada CL para obtener y generar un periodo de tono de dominio de tiempo L cuando la información de selección de predicción de largo plazo indica que se va a realizar predicción de largo plazo. Si un código de ganancia de tono Cgp es también introducido, el descodificador de información de predicción de largo plazo 121 también descodifica el código de ganancia de tono Cgp para obtener y generar una ganancia de tono cuantificada gpA.
Convertidor de Periodo 122
Cuando la información de selección de predicción de largo plazo indica que la perdición de largo plazo va a ser realizada, un convertidor de periodo 122 descodifica el código de periodo de tono de dominio de frecuencia para obtener un valor entero que indica cuántas veces el periodo de tono de dominio de frecuencia T es mayor que un intervalo convertido T1 , obtiene el intervalo convertido T1 en base al periodo de dominio de tiempo L y el número N de puntos de dominio de frecuencia de acuerdo con la fórmula (A4), multiplica el intervalo convertido T1 por el valor entero para obtener y generar el periodo de tono de dominio de frecuencia T.
Cuando la información de selección de predicción de largo plazo indica que no se va a realizar predicción de largo plazo, el convertidor de periodo 122 descodifica el código de periodo de dominio de frecuencia de entrada para obtener y generar un periodo de tono de dominio de frecuencia T.
Unidad de Recuperación 123b
Después, una unidad de recuperación 123b obtiene y genera la secuencia original de muestras procedentes de la salida de cadena de muestras de dominio de frecuencia procedente del descodificador 123a en una base de marco a marco de acuerdo con el periodo de tono de dominio de frecuencia T obtenido por el convertidor de periodo 122 o, si la información auxiliar es introducida en el descodificador 12, de acuerdo con el periodo de tono de dominio de frecuencia T obtenido por el convertidor de periodo 122 y la información auxiliar de entrada (etapa S123b). Aquí, la “secuencia original de muestras” es equivalente a la “cadena de muestras de dominio de frecuencia” generada desde la unidad aritmética de cadena de muestras de dominio de frecuencias 113 del codificador 11. Aunque hay varios métodos de reorganización que se pueden realizar mediante la unidad de reorganización 116a del codificador 11, y varias alternativas posibles de reorganización correspondientes a los métodos de reorganización como se ha establecido anteriormente, sólo un tipo de reorganización, si la hay, ha sido realizada en la cadena, y el tipo de reorganización puede ser identificado por el periodo de tono de dominio de frecuencia T y la información auxiliar.
Detalles del proceso de recuperación realizado por la unidad de recuperación 123b corresponden a los detalles del proceso de reorganización realizado por la unidad de reorganización 116 del codificador 11. Por lo tanto, la descripción del proceso de reorganización se incorpora aquí para establecer que el proceso de recuperación realizado por la unidad de recuperación 123b es el inverso de la reorganización realizada por la unidad de reorganización 116a (reorganización en el orden inverso), y por ello se omitirá la descripción detallada del proceso de recuperación. Para facilitar el entendimiento del proceso, se describirá a continuación un ejemplo del proceso de recuperación correspondiente al ejemplo específico del proceso de reorganización descrito anteriormente.
Por ejemplo, en el ejemplo descrito anteriormente en el que la unidad 116a reúne grupos de muestras juntos en un subgrupo en el lado de baja frecuencia y genera F(T - 1), F(T), F(T 1), F(2T - 1), F(2T), F(2T 1), F(3T - 1), F(3T), F(3T 1), F(4T - 1), F(4T), F(4T 1), F(5T - 1), F(5T), F(5T 1), F(1), ..., F(T - 2), F(T 2), ..., F(2T - 2), F(2T 2), ..., F(3T - 2), F(3T 2), ..., F(4T - 2), F(4T 2), ..., F(5T - 2), F(5T 2), ..., F(jmax), la cadena de muestras de dominio de frecuencia F(T - 1), F(T), F(T 1), F(2T - 1), F(2T), F(2T 1), F(3T - 1), F(3T), F(3T 1), F(4T - 1), F(4T), F(4T 1), F(5T - 1), F(5T), F(5T 1), F(1), F(T - 2), F(T 2), F(2T - 2), F(2T 2), F(3T - 2), F(3T 2), ..., F(4T - 2), F(4t + 2), ..., F(5T - 2), F(5T 2), ..., F(jmax) generada desde el descodificador 123a es introducida en la unidad de recuperación 123b. En base al periodo de tono de dominio de frecuencia T y a la información auxiliar, la unidad de recuperación 123b puede recuperar la cadena de muestras de entrada F(T - 1), F(T), F(T 1), F(2T - 1), F(2T), F(2T 1), F(3T - 1), F(3T), F(3T 1), F(4T - 1), F(4T), F(4T 1), F(5T - 1), F(5T), F(5T 1), F(1), ..., F(T - 2), F(T 2), ..., F(2T - 2), F(2T 2), ..., F(3T - 2), F(3T 2), ..., F(4T - 2), F(4T 2), ..., F(5T - 2), F(5T 2), ..., F(jmax) a la secuencia de muestras original F(j) ( 1< j < jmax).
Multiplicador de Ganancia 124a
Después, un multiplicador de ganancia 124a multiplica, en una base de marco a marco, cada coeficiente de la cadena de muestras generada desde el descodificador 123a o la unidad de recuperación 123b por una ganancia identificada por la información de ganancia descrita anteriormente para obtener y generar una “cadena de coeficientes MDCT normalizados ponderada normalizada” (etapa S124a).
Normalizador Inverso de Envolvente Ponderado 124b
Después, un normalizador inverso de envolvente ponderado 124 aplica, en una base de marco a marco, un coeficiente de corrección obtenido de una cadena de coeficientes de envolvente de espectro de potencia transmitida a cada coeficiente de la “cadena de coeficientes MDCT normalizada ponderada normalizada” generada desde el multiplicador de ganancia 124a como se ha descrito anteriormente para obtener y generar una “cadena de coeficientes MDCT” (etapa S124a). Un ejemplo se describirá en combinación con el ejemplo del proceso de normalización de envolvente ponderado, realizado en el codificador 11. El normalizador inverso de envolvente ponderado 124b multiplica cada coeficiente en una “cadena de coeficientes MDCT normalizados ponderada normalizaba” generada desde el multiplicador de ganancia 124a mediante la p-ésima potencia (0 < p < 1) de cada coeficiente en una cadena de coeficientes de envolvente de espectro de potencia que se corresponde con el coeficiente W(1)p, ..., W(N)p, para obtener los coeficientes X(1), ..., X(N) en una cadena de coeficientes MDCT.
Transformador de Dominio de Tiempo 124c
Después, un transformador de dominio de tiempo 124c transforma, en una base de marco a marco, la “cadena de coeficientes MDCT” generada desde el normalizador inverso de envolvente ponderado 124b en el dominio de tiempo para obtener y generar una cadena de señales (cadena de señales de dominio de tiempo) en cada marco (etapa S124c). Cuando la información de selección de predicción de largo plazo generada desde el descodificador de información de predicción de largo plazo 121 indica que se va a realizar predicción de largo plazo, la cadena de señales obtenida por el transformador de dominio de tiempo 124c es introducida en un sintetizador de predicción de largo plazo 125 como una cadena de señales residual de predicción de largo plazo xp(1), ..., xp(Nt). Cuando la información de selección de predicción de largo plazo generada desde el descodificador de información de predicción de largo plazo 121 indica que no se va a realizar predicción de largo plano, la cadena de señales obtenida por el transformador de dominio de tiempo 124c es generada desde el descodificador 12 como una cadena de señales de audio digitales x(1), ..., x(Nt).
Sintetizador de Predicción de largo plazo
Cuando la información de selección de predicción de largo plazo indica que se va a realizar predicción de largo plazo, el sintetizador de predicción de largo plazo 125 obtiene una cadena de señales de audio digital x(1), ..., x(Nt) en base a la cadena de señales residual de predicción de largo plazo xp(1), ..., xp(Nt) obtenida por el transformador de dominio de tiempo 124c, un periodo de tono de dominio de tiempo L y una ganancia de tono cuantificada gpA generada desde el descodificador de información de predicción de largo plazo 121, y una señal de audio digital previa generada por el sintetizador de predicción de largo plazo 125 de acuerdo con la fórmula (A5). Si el descodificador de información de predicción de largo plazo 121 no genera una ganancia de tono cuantificada gpA, esto es, un código de ganancia de tono Cgp no ha sido introducido en el descodificador 12, un valor predeterminado, por ejemplo 0,5, es utilizado como gpA. En este caso, el valor de gpA es almacenado en el descodificador de información de predicción de largo plazo 121 de antemano de manera que el codificador 11 y el descodificador 12 pueden utilizar el mismo valor.
x(t) = xp(t) gPAx(t - L) (A5)
La cadena de señales obtenida por el sintetizador de predicción de largo plazo 125 es generada como una cadena de señales de audio digital x(1), ..., x(Nt) desde el descodificador 12.
Cuando la información de selección de predicción de largo plazo indica que no se va a realizar predicción de largo plazo, el sintetizador de predicción de largo plazo 125 no realiza nada.
Como resultará evidente del ejemplo, si el periodo de tono de dominio de frecuencia T es claro, se puede realizar la codificación eficiente codificando una cadena de muestras reorganizada de acuerdo con el periodo de tono de dominio de frecuencia T (esto es, la longitud de código media se puede reducir). Además, dado que las muestras que tienen indicadores iguales o casi iguales son reunidas juntas en un subgrupo en una región local reorganizando la cadena de muestras, la distorsión de cuantificación y la cantidad de código se pueden reducir a la vez que se mantiene la codificación eficiente.
[MODIFICACIÓN DEL PRIMER EJEMPLO]
Esta modificación del primer ejemplo actualmente no está reivindicada pero la descripción de la misma puede ser útil para el entendimiento de la invención.
Aunque el codificador 11 del primer ejemplo elige un periodo de tono de dominio de frecuencia T de entre candidatos que son un intervalo convertido T1 y múltiplos enteros U X T1 del intervalo convertido T1 , el periodo de tono de dominio de frecuencia T se puede elegir de candidatos que incluyen múltiplos del intervalo convertido T1 distintos de los múltiplos enteros U X T1. Las diferencias de una modificación respecto al primer ejemplo se describirán a continuación.
Codificador 11'
Un codificador 11' de esta modificación difiere del codificador 11 del primer ejemplo en que el codificador 11' incluye un analizador de periodo de tono de dominio de frecuencia 115' en lugar del analizador de periodo de tono de dominio de frecuencia 115. En esta modificación, el analizador de periodo de tono de dominio de frecuencia 115' elige y genera un periodo de tono de dominio de frecuencia T de entre candidatos que son un intervalo convertido T1 , múltiplos enteros U X T1 del intervalo convertido T1 , y múltiplos predeterminados del intervalo convertido T1 distintos de los múltiplos enteros U X T1. Cuando la información de selección de predicción de largo plazo indica que la predicción de largo plazo no se va a realizar, el analizador de periodo de tono de dominio de frecuencia 115' elige un periodo de tono de dominio de frecuencia T de entre candidatos que son valores enteros en un segundo rango predeterminado, como en el primer ejemplo.
Analizador de Periodo de Tono de Dominio de Frecuencia 115'
Un analizador de periodo de tono de dominio de frecuencia 115' elige un periodo de tono de dominio de frecuencia T de candidatos que son un intervalo convertido T1 , múltiplos enteros U X T1 del intervalo convertido T1 , y múltiplos predeterminados del intervalo convertido T1 distintos de los múltiplos enteros U X T1 (elige un periodo de tono de dominio de frecuencia T de entre candidatos que incluyen el intervalo convertido T1 y los múltiplos U X T1 del intervalo convertido T1) y genera un periodo de tono de dominio de frecuencia T y un código de periodo de tono de dominio de frecuencia que indica cuántas veces el periodo de tono de dominio de frecuencia T es mayor que el intervalo convertido T1.
Por ejemplo, si los números enteros en un primer rango predeterminado son mayores o iguales a 2 y menores o iguales a 9, un total de 16 valores, a saber, un intervalo convertido T1 , sus múltiplos enteros 2T1 , 3T1 , 4T1 , 5T1 , 6T1 , 7T1 , 8T1 , 9T1 , y unos múltiplos predeterminados 1,9375T1, 2,0626T1, 2,125T1, 2,1875T1, 2,25T1, 2,9375T1 y 3,0625T1, distintos de los múltiplos enteros del intervalo convertido T1 son candidatos para el periodo de tono de dominio de frecuencia, a partir de los cuales se elige un periodo de tono de dominio de frecuencia T. Un código de periodo de tono de dominio de frecuencia es al menos de 4 bits de longitud y está en una correspondencia de uno a uno con cada uno de los 16 candidatos.
Nótese que “los números enteros en el primer rango predeterminado” no necesariamente necesitan incluir todos los números enteros mayores o iguales a un número entero dado y menores o iguales a un número entero dado. Por ejemplo, los números enteros en el primer rango predeterminado pueden ser números enteros mayores o iguales a 2 y menores o iguales a 9, excluyendo 5. En este caso, por ejemplo un total de 16 valores, a saber el Intervalo convertido T1 , sus múltiplos enteros, 2T1 , 3T1 , 4T1 , 5T1 , 6T1 , 7T1 , 8T1 , 9T1 , y unos múltiplos predeterminados 1,3730T1, 1,53125T1 , 2,03125T1, 2,0625T1, 2,09375T1, 2,1250T1, 8,5000T1, y 14,5000T1, distintos de los múltiplos enteros el intervalo convertido T1 son candidatos para el periodo de tono de dominio de frecuencia, a partir de los cuales se elige el periodo de tono de dominio de frecuencia T. Un código de periodo de tono de dominio de frecuencia en este caso es de al menos 4 bits de longitud y está en correspondencia de uno a uno con cada uno de los 16 candidatos.
Cuando la información de selección de predicción de largo plazo indica que no se va a realizar predicción de largo plazo, el analizador de periodo de tono de dominio de frecuencia 115' elige un periodo de tono de dominio de frecuencia T de los candidatos que son valores enteros en un segundo rango predeterminado, como en el primer ejemplo.
Descodificador 12'
Un descodificador 12' de esta modificación difiere del descodificador 12 que ha sido descrito en el contexto del primer ejemplo en que el descodificador 12' incluye un convertidor de periodo 122' en lugar de un convertidor de periodo 122.
Convertidor de Periodo 122'
Cuando la información de selección de predicción de largo plazo indica que se va a realizar predicción de largo plazo, un convertidor de periodo 122' descodifica un código de periodo de tono de dominio de frecuencia para obtener un valor (un múltiplo) que indica cuántas veces el periodo de tono de dominio de frecuencia T es mayor que el intervalo convertido T1 , obtiene el intervalo convertido T1 en base al periodo de tono de dominio de frecuencia L y al número N de puntos de muestra de dominio de frecuencia de acuerdo con al fórmula (A4), multiplica el intervalo convertido T1 por el valor que indica cuántas veces mayor para obtener y generar el periodo de tono de dominio de frecuencia T.
Cuando la información de selección de predicción de largo plazo indica que no se va a realizar predicción de largo plazo, el convertidor de periodo 122' descodifica el código de periodo de tono de dominio de frecuencia para obtener y generar un periodo de tono de dominio de frecuencia T.
[MODIFICACIÓN 2 DEL PRIMER EJEMPLO]
Esta modificación del primer ejemplo actualmente no está reivindicada pero la descripción de la misma puede ser útil para el entendimiento de la invención.
En la modificación 1 del primer ejemplo, un periodo de tono de dominio de frecuencia T es elegido de candidatos que incluyen múltiplos de un intervalo convertido T1 que nos son múltiplos enteros, además de múltiplos enteros U X T1 del intervalo convertido T1. En la modificación 2 del primer ejemplo, el hecho de que un múltiplo entero U X T1 sea más probable que sea un periodo de tono de dominio de frecuencia T que otros valores es tenido en consideración y la longitud del código de periodo de tono de dominio de frecuencia se determina en base al libro de códigos de longitud variable.
Un analizador de periodo de tono de dominio de frecuencia 115'' elige un periodo de tono T teniendo en cuenta la longitud del código de periodo de tono de dominio de frecuencia también.
Las diferencias de la modificación 1 del primer ejemplo se describirán a continuación. Un codificador 11'' de esta modificación difiere del codificador 11 del primer ejemplo en que el codificador 11'' incluye el analizador de periodo de tono de dominio de frecuencia 115'' en lugar del analizador de periodo de tono de dominio de frecuencia 115. Analizador de Periodo de Tono de Dominio de Frecuencia 115''
En analizador de periodo de tono de dominio de frecuencia 115'' elige un periodo de tono de dominio de frecuencia T de los candidatos que son un intervalo convertido T1, múltiplos enteros U X T1 del intervalo convertido T1, y múltiplos predeterminados del intervalo convertido T1 distintos de los múltiplos enteros U X T1 (elige un periodo de tono de dominio de frecuencia T de entre los candidatos que incluyen el intervalo convertido T1 y los múltiplos U X T1 del intervalo convertido T1) y genera un periodo de tono de dominio de frecuencia T en el código de periodo de tono de dominio de frecuencia que indica cuántas veces el periodo de tono de dominio de frecuencia T es mayor que el intervalo convertido T1.
En la presente, el código de periodo de tono de dominio de frecuencia que indica cuántas veces el periodo de tono de dominio de frecuencia T es mayor que el intervalo convertido T1 se determina utilizando un libro de códigos de longitud variable en el que las longitudes de los códigos correspondientes a los múltiplos enteros V X T1 del intervalo convertido T1 son mas cortas que las longitudes de los códigos correspondientes a otros candidatos, en donde V es un número entero. Por ejemplo, V es un número entero que no es 0 y es un número entero positivo, por ejemplo, Por ejemplo, V e {1, U}.
Por ejemplo, un libro de códigos de longitud variable (ejemplo 1) puede ser utilizado para elegir el código de periodo de tono de dominio de frecuencia en el que la longitud del código de longitud variable para un periodo de tono de dominio de frecuencia T es igual al propio intervalo convertido y la longitud del código de longitud variable para un periodo de tono de dominio de frecuencia T que es igual a un múltiplo entero U X T1 del intervalo convertido T1 son más cortas que las longitudes de otros códigos de longitud variable. Nótese que los “códigos de longitud variable” son códigos en los que a los eventos más probables son asignados los códigos más cortos que los códigos para eventos improbables, con lo que se reduce la longitud media de los códigos. Tal código de periodo de tono de dominio de frecuencia es más cortos cuando el periodo de tono de dominio de frecuencia T es igual al propio intervalo convertido T1 o a un múltiplo entero del intervalo convertido T1 que cuando el periodo de tono de dominio de frecuencia T es cualquier otro valor. Un ejemplo de tal libre de códigos de longitud variables se proporciona en la Figura 12. Dado que el múltiplo entero del intervalo convertido T1 es más probable que sea elegido como un periodo de tono de dominio de frecuencia que otros valores, la longitud de código media puede ser disminuida utilizando un libro de códigos de longitud variable para elegir el código de periodo de tono de dominio de frecuencia.
Alternativamente, el libro de códigos de longitud variable (ejemplo 2) puede ser utilizado para elegir un periodo de tono de dominio de frecuencia en el que la longitud de un código de longitud variable para un periodo de tono de dominio de frecuencia T que es igual a un intervalo convertido T1 en sí mismo, la longitud de un código de longitud variable para un periodo de tono de dominio de frecuencia T que es igual a un múltiplo U X T1 del intervalo convertido T1, la longitud de un código de longitud variable para un periodo de tono de dominio de frecuencia T que sea próximo al intervalo convertido T1, y la longitud de un código de longitud variable para un periodo de tono de dominio de frecuencia T que sea próxima a un múltiplo entero U X T1 del intervalo convertido T1 son más cortas que las longitudes de otros códigos de longitud variable. La longitud del código de periodo de tono de dominio de frecuencia en este caso es más corta cuando el periodo de tono de dominio de frecuencia T es igual a propio intervalo convertido T1, o a un múltiplo entero del intervalo convertido T1, o próxima al intervalo convertido T1, o próxima a un múltiplo entero el intervalo convertido Ti que cuando el periodo de tono de dominio de frecuencia T es cualquier otro valor. Dado que el periodo de tono de dominio de frecuencia T es igual al intervalo convertido Ti, o a un múltiplo entero el intervalo convertido Ti, o próximo al intervalo convertido Ti, o próximo a un múltiplo entero del intervalo convertido Ti es más probable que sea elegido como periodo de tono de dominio de frecuencia, la longitud de códigos medios se puede reducir haciendo las longitudes de los códigos correspondientes a estos valores más cortas que los códigos correspondientes a los otros valores.
Alternativamente un libro de códigos de longitud variable (ejemplo 3) en el que la longitud de un código de longitud variable para un periodo de tono de dominio de frecuencia T que es igual al propio intervalo convertido es más corta que la longitud de un código de longitud variable para un periodo de tono de dominio de frecuencia T que es igual a un múltiplo entero U X Ti del intervalo convertido Ti puede ser utilizado como código de periodo de tono de dominio de frecuencia. La longitud del código de periodo de tono de dominio de frecuencia en este caso es más corta cuando el periodo de tono de dominio de frecuencia T es igual al intervalo convertido Ti que cuando el periodo de tono de dominio de frecuencia T está próximo al intervalo convertido Ti.
Alternativamente, se puede utilizar un libro de códigos de longitud variable (ejemplo 4) en el que el código de longitud variable para un periodo de tono de dominio de frecuencia T que es un múltiplo entero U X Ti del intervalo convertido Ti es más corto que la longitud de un código de longitud variable para un periodo de tono de dominio de frecuencia T que sea próximo a un múltiplo entero U X Ti del intervalo convertido Ti. La longitud del primer código de periodo de tono de dominio de frecuencia en este caso es más corta cuando el primer periodo de tono de dominio de frecuencia T es un múltiplo entero del intervalo convertido Ti que cuando el primer periodo de tono de dominio de frecuencia T está próximo a un múltiplo entero el intervalo convertido Ti.
Si la información acerca de los marcos anteriores no puede ser utilizada o no es utilizada como se ha descrito anteriormente, un multiplicador más pequeño m*n para el intervalo convertido Ti de un periodo de tono de dominio de frecuencia T es más probable que sea elegido como periodo de tono de dominio de frecuencia T. Teniendo esto en cuenta, un libro de códigos de longitud variable (ejemplo 5) puede ser utilizado para elegir un código de periodo de tono de dominio de frecuencia en el que códigos de longitud variable son asignados, de manera que al menos la longitud de un código de longitud variable para un periodo de tono de dominio de frecuencia T que sea un múltiplo entero V X Ti del intervalo convertido Ti sea monótonamente no decreciente con respecto a la magnitud del múltiplo entero V como se ilustra en la Figura i3. En este caso, al menos la longitud del código de periodo de tono de dominio de frecuencia para el periodo de tono de dominio de frecuencia T que sea un múltiplo entero V X Ti del intervalo convertido Ti es monótonamente no decreciente con respecto a la magnitud del número entero V.
Alternativamente, se puede utilizar un libro de códigos de longitud variable (ejemplo 6) que tiene una combinación de características de los ejemplos i y 3 descritos anteriormente, o se puede utilizar un libro de códigos de longitud variable (ejemplo 7) que tiene una combinación de características de los ejemplos 2 y 3, o se puede utilizar un libro de códigos de longitud variable (ejemplo 8) que tiene una combinación de características de los ejemplos 2 y 4, o se puede utilizar un libro de códigos de longitud variable (ejemplo 9) que tiene una combinación de características de los ejemplos 2, 3 y 4, o se puede utilizar un libro de códigos de longitud variable (ejemplo i0) que tiene una combinación de características de cualquiera de los ejemplos i a 9 y la característica del ejemplo 5.
El analizador de periodo de tono de dominio de frecuencia 115 " elige un periodo de tono de dominio de frecuencia T teniendo en cuenta la longitud de un código que indica que la relación entre un indicador del grado de concentración de energía en un grupo de muestras seleccionado de acuerdo con una regla de reorganización predeterminada y un intervalo convertido Ti. Por ejemplo, el analizador de periodo de tono de dominio de frecuencia 115" elige un código más corto que indica la relación con el intervalo convertido Ti de entre los códigos que tiene el mismo indicador del grado de concentración. Alternativamente, el analizador de periodo de tono de dominio de frecuencia 115" elige un periodo de tono de dominio de frecuencia T que maximiza un indicador modificado del grado de concentración: indicador modificado de grado de concentración = indicador de grado de concentración - c* (longitud de código que indica la relación con el intervalo convertido Ti)
en donde c es una constante predeterminada apropiada (ponderación)
[SEGUNDO EJEMPLO]
Este ejemplo actualmente no está reivindicado pero puede ser útil para el entendimiento de la invención.
Codificador 21
Un codificador 21 de un segundo ejemplo difiere del codificador 11 del primer ejemplo en que el codificador 21 incluye un analizador de periodo de tono de dominio de frecuencia 215 en lugar del analizador de periodo de tono de dominio de frecuencia 115. En este ejemplo, cuando la información de selección de predicción de largo plazo indica que va a ser realizada predicción de largo plazo, el analizador de periodo de tono de dominio de frecuencia 215 elige un candidato intermedio de entre un intervalo convertido Ti y múltiplos enteros U X Ti del intervalo convertido Ti, elige un periodo de tono de dominio de frecuencia T de entre el candidato intermedio y valores en un tercer rango predeterminado que son próximos al candidato intermedio, y genera el periodo de tono de dominio de frecuencia T. Cuando la información de selección de predicción de largo plazo indica que no se va a realizar predicción de largo plazo, el analizador de periodo de tono de dominio de frecuencia 215 elige un periodo de tono de dominio de frecuencia T de entre los candidatos que son números enteros en un segundo rango predeterminado, como en la primera realización, y genera un periodo de tono de dominio de frecuencia T. Diferencias respecto al primer ejemplo serán descritas a continuación.
Analizador de Periodo de Tono de Dominio de Frecuencia 215
Cuando la información de selección de predicción de largo plazo indica que se va a realizar predicción de largo plazo, el analizador de periodo de tono de dominio de frecuencia 215 elige primero un candidato de entre un intervalo convertido T1 y múltiplos enteros U X T1 del intervalo convertido T1. El analizador de periodo de tono de dominio de frecuencia 215 después elige un periodo de tono de dominio de frecuencia T de entre el candidato intermedio y valores en un tercer rango predeterminado que son próximos al candidato intermedio y genera el periodo de tono de dominio de frecuencia T. Además, el analizador de periodo de tono de dominio de frecuencia 215 genera información que indica cuántas veces el candidato intermedio es mayor que el intervalo convertido T1 e información que indica la diferencia entre el periodo de tono de dominio de frecuencia T y el candidato intermedio como códigos de periodo de tono de dominio de frecuencia.
Por ejemplo, si los números enteros en un primer rango predeterminado son mayores o iguales a 2 y menores o iguales a 8, un total de ocho valores, a saber el intervalo convertido T1 y los valores iguales a 2 a 8 veces el intervalo convertido T1 , es decir, 2T1 , 3T1 , 4T1 , 5T1 , 6T1 , 7T1 , y 8T1 , son candidatos para el candidato intermedio, a partir de los cuales es seleccionado un candidato intermedio Tcand. La información que indica cuántas veces el candidato intermedio es mayor qué el intervalo convertido T1 es un código que tiene al menos 3 bits de longitud y está en correspondencia de uno a uno con un número entero mayor o igual que 1 y menor o igual que 8.
Si los números enteros de un tercer rango predeterminado son mayores o iguales a -3 y menores o iguales a 4, por ejemplo, un total de ocho valores, a saber Tcand-3, Tcand-2, Tcand-1, Tcand, Tcand+1, Tcand+2, Tcand+3, y Tcand+4, son candidatos para el periodo de tono de dominio de frecuencia T, a partir de los cuales es elegido un periodo de tono de dominio de frecuencia T. En este caso, la información que indica la diferencia entre el periodo de tono de dominio de frecuencia T y un candidato intermedio es un código que es de al menos 3 bits de longitud y está en correspondencia de uno a uno con un número entero mayor o igual a -3 y menor o igual a 4.
Nótese que los valores en el tercer rango predeterminado pueden ser valores enteros o valores fraccionales. Como en las modificaciones de la primera realización, un candidato intermedio puede ser elegido a partir de candidatos que no son múltiplos enteros U X T1 de un intervalo convertido T1 además del intervalo convertido T1 y los múltiplos enteros U X T1 de un intervalo convertido T1. Esto es, un candidato intermedio puede ser elegido a partir de candidatos que incluyen el intervalo convertido T1 y múltiples enteros U X T1 del intervalo convertido T1.
Descodificador 22
Un descodificador 22 de acuerdo con un ejemplo será descrito a continuación. Este descodificador no está actualmente reivindicado pero la descripción del mismo puede ser útil para el entendimiento de la invención.
El descodificador 22 de este ejemplo difiere del descodificador 12 descrito en el contexto del primer ejemplo en que el descodificador 22 incluye un convertidor de periodo 222 en lugar de un convertidor de periodo 122. En este ejemplo, cuando la información de selección de predicción de largo plazo indica que se va a realizar predicción de largo plazo, el convertidor de periodo 222 descodifica un código de periodo de tono de dominio de frecuencia para obtener un valor entero que indica cuántas veces un candidato intermedio es mayor que un intervalo convertido T1 y la diferencia ente un periodo de tono de dominio de frecuencia T y el candidato intermedio, añade la diferencia con el intervalo convertidor T1 multiplicado por el valor entero, y genera el resultado como el periodo de tono de dominio de frecuencia T. Cuando la información de selección de predicción de largo plazo indica que la predicción de largo plazo no se va a realizar, el convertidor de periodo 222 descodifica un código de periodo de tono de dominio de frecuencia para obtener y generar un periodo de tono de dominio de frecuencia T.
[TERCER EJEMPLO]
Este ejemplo actualmente no está reivindicado pero puede ser útil para entender la invención.
Codificador 31
Un codificador 31 de un tercer ejemplo difiere de los codificadores 11, 11', 21 de la primera realización, las modificaciones del primer ejemplo y del segundo ejemplo, en que el codificador 31 incluye un analizador de periodo de tono de dominio de frecuencia 315 en lugar del analizador de periodo de tono de dominio de frecuencia 115, 115', 215. El analizador de periodo de tono de dominio de frecuencia 315 de esta realización realiza un proceso en el que la condición “cuando la información de selección de predicción de largo plazo indica que la predicción de largo plazo se va a realizar” es remplazada por la condición “cuando la ganancia de tono cuantificada gpA es mayor o igual que un valor predeterminado” y la condición “cuando la información de selección de predicción de largo plazo indica que no se va a realizar predicción de largo plazo” es sustituida por la condición “cuando la ganancia de tono cuantificada gpA es menor que un valor predeterminado”. El resto del proceso es el mismo que el proceso en el primer y segundo ejemplos. Nótese que este ejemplo es afirmado en una configuración en la que el codificador 31 obtiene una ganancia de tono cuantificada gpA y un código de ganancia de tono Cgp en la primera realización.
Descodificador 32
Un descodificador 32 de acuerdo con un ejemplo será descrito a continuación. Este descodificador actualmente no está reivindicado pero la descripción del mismo puede ser útil para el entendimiento de la invención.
El descodificador 32 de este ejemplo difiere de los descodificadores 12, 12', 22 descritos en el contexto del primer ejemplo y del segundo ejemplo, en que el descodificador 32 incluye un convertidor de periodo 322 en lugar del convertidor de periodo 122, 122', 222. El convertidor de periodo 322 en este ejemplo realiza un proceso en el que la condición “cuando la información de selección de predicción de largo plazo indica que se va a realizar predicción de largo plazo” es sustituida por la condición “cuando la ganancia de tono cuantificada gpA es mayor o igual que un valor predeterminado” y la condición “cuando la información de selección de predicción de largo plazo indica que la predicción de largo plazo no se va a realizar” es remplazada por la condición “cuando la ganancia de tono cuantificada gpA es menor que un valor predeterminado”. El resto del proceso es el mismo que el proceso descrito en el contexto del primer y del segundo ejemplo. Nótese que este ejemplo es afirmado en una configuración en la que el código de ganancia de tono Cgp es introducido en el descodificador 32 y es obtenida una ganancia de tono cuantificada gpA en el primer ejemplo.
[CUARTO EJEMPLO]
Este ejemplo actualmente no está reivindicado pero puede ser útil para el entendimiento de la invención.
Codificador 41
Un codificador 41 de un cuarto ejemplo difiere de los codificadores 11, 11', 21 del primer ejemplo, las modificaciones del primer ejemplo, y del segundo ejemplo en que el codificador 41 incluye un analizador de predicción de largo plazo 411, una unidad aritmética residual de predicción de largo plazo 412, un transformador de dominio de frecuencia 413a, un convertidor de periodo 414 y un analizador de periodo de tono de dominio de frecuencia 415 en lugar del analizador de predicción de largo plazo 111, la unidad aritmética residual de predicción de largo plazo 112, el transformador de dominio de frecuencia 113a, el convertidor de periodo 114, y el analizador de periodo de tono de dominio de frecuencia 115, 115', 215, respectivamente.
El analizador de predicción de largo plazo 411 de este ejemplo realiza la predicción de largo plazo independientemente del valor del la ganancia de tono gp. Más concretamente, el analizador de predicción de largo plazo 411 realiza el mismo proceso que el realizado por el analizador de predicción de largo plazo 111 “cuando la información de selección de predicción de largo plazo indica que se va a realizar la predicción de largo plazo”, independientemente del valor de la ganancia de tono gp. Por consiguiente, el analizador de predicción de largo plazo 411 no necesita determinar si se realiza o no la predicción de largo plazo en base a si la ganancia de tono gp es o no mayor o igual que un valor predeterminado y no necesita generar información de selección de largo plazo.
Después, la unidad aritmética residual de predicción de largo plazo 412, el transformador de dominio de frecuencia 413a, el convertidor de periodo 414 y el analizador de periodo de tono de dominio de frecuencia 415 realizan un proceso equivalente al proceso realizado por la unida aritmética residual de predicción de largo plazo 112, el transformador de dominio de frecuencia 113a, el convertidor de periodo 114, y el analizador de periodo de tono de dominio de frecuencia 115, 115', 215, respectivamente, “cuando la información de selección de predicción de largo plazo generada desde el analizador de predicción de largo plazo 111 indica que se va a realizar predicción de largo plazo”.
Descodificador 42
Un descodificador 42 de acuerdo con un ejemplo será descrito a continuación. Este descodificador actualmente no está reivindicado pero la descripción del mismo puede ser útil para el entendimiento de la invención.
El descodificador 42 de este ejemplo difiere de los descodificadores 12, 12', 22 descritos en el contexto del primer ejemplo y del segundo ejemplo en que el descodificador 42 incluye un descodificador 423a, un descodificador de información de predicción de largo plazo 421, un convertidor de periodo 422, un transformado de dominio de tiempo 424c, un sintetizador de predicción de largo plazo 425 en lugar el descodificador 123a, el descodificador de información de predicción del largo plazo 121, el convertidor de periodo 122, 122', 222, el transformador de dominio de tiempo 124c, y el sintetizador de predicción de largo plazo 125, respetivamente. De acuerdo con este ejemplo, la combinación de predicción de largo plazo es realizada independientemente de la información de selección de predicción de largo plazo y el valor de la ganancia de tono cuantificada gpA. Por consiguiente, la información de selección de predicción de largo plazo no necesita ser introducida en el descodificador 42 de este ejemplo.
El descodificador 432a, el descodificador de información de predicción de largo plazo 421, el convertidor de periodo 422, el transformador de dominio de tiempo 424c, y el sintetizador de predicción de largo plazo 425 de este ejemplo realizan un proceso equivalente al proceso realizado por el descodificador 123a, el descodificador de información de redición de largo plazo 121, el convertidor de periodo 122, 122', 222, el transformador de dominio de tiempo 124c, y el sintetizador de predicción de largo plazo 125 “cuando la información de selección de predicción de largo plazo indica que se va a realizar la predicción de largo plazo”.
Alternativas
Cada uno de los codificadores 11, 11', 21, 31, 41 de los ejemplos descritos anteriormente incluye el transformador de dominio de frecuencia 113a, 413a, el normalizador de envolvente ponderada 113b, la unidad aritmética de ganancia normalizada 113c y el cuantificador 114d, y una cadena de coeficientes MDCT en cada marco obtenido en el cuantificador 113d es introducida en el analizador de periodo de tono de dominio de frecuencia 115, 115', 215, 315, 415. Sin embargo, el codificador 11, 11', 21, 31, 41 puede incluir secciones de procesamiento distintas del transformador de dominio de frecuencia 113a, 413a, el normalizador de envolvente ponderada 113b, la unidad aritmética de ganancia normalizada 113c y el cuantificador 113d o pueden realizar un proceso con algunas de la secciones de procesamiento dadas anteriormente que están omitidas. A modo de ejemplo, el codificador 11, 11', 21, 31, 41 puede incluir una unida aritmética de cadena de muestras de dominio de frecuencia 113 que incluye al transformador de dominio de frecuencia 113a, 413a, el normalizador de envolvente ponderada 113b, la unidad aritmética de ganancia normalizada 113c y el cuantificador 113d. Cuando la predicción de largo plazo va a ser realizada, la unidad aritmética de cadena de muestras de dominio de frecuencia 113 provista en el codificador 11, 11', 21, 31, 41 realiza el proceso para obtener una cadena de muestras de dominio de frecuencia derivada de una señal residual de predicción de largo plazo como se ha descrito anteriormente; cuando la predicción de largo plazo no va a ser realizada, la unidad aritmética de muestras de dominio de frecuencia 113 realiza el proceso para obtener una cadena de muestras de dominio de frecuencia derivada de una señal de audio como se ha descrito anteriormente. La cadena de muestras obtenida por la unidad aritmética de cadena de muestras de dominio de frecuencia 113 es introducida en el analizador de periodo de tono de dominio de frecuencia 115, 115', 215, 315, 415.
Lo mismo aplica a los descodificadores 12, 12', 22, 32, 42. A modo de ejemplo, el descodificador 12, 12', 22, 32, 42 puede incluir una unidad aritmética de cadena de señal de dominio de tiempo 124 que incluye el multiplicador de ganancia 124a, el normalizador inverso de envolvente ponderara 124b, y el transformador de dominio de tiempo 124c, 424c. La unidad aritmética de cadena de señales de dominio de tiempo 124 proporcionada en el descodificador 12, 12', 22, 32, 42 realiza un proceso para obtener una cadena de señal de dominio de tiempo derivada de la cadena de muestras de dominio de frecuencia introducida desde el descodificador 123a, 423a o la unidad de recuperación 123b. Cuando la información de selección de predicción de largo plazo generada desde el descodificador de información de predicción de largo plazo 121, 421 indica que va a ser realizada predicción de largo plazo, una cadena de señales obtenida por la unida aritmética de cadena de señales de dominio de tiempo 124 es introducida en el sintetizador de predicción de largo plazo 125, 425 como una cadena de señales residual de predicción de largo plazo Xp(1), ..., Xp(Nt). Cuando la información de selección de predicción de largo plazo generada desde el descodificador de información de predicción de largo plazo 121, 421 indica que no se va a realizar predicción de largo plazo, una cadena de señales obtenida por la unidad aritmética de señales de dominio de tiempo 124 es generada desde el descodificador 12, 12', 22, 32, 42 como una cadena de señales de audio digital x(1), ..., x(Nt).
[QUINTO EJEMPLO]
Este ejemplo actualmente no está reivindicado pero puede ser útil para el entendimiento de la invención.
Codificador 51
Como se ilustra en la Figura 8, un codificador 51 de un quinto ejemplo difiere de los codificadores 11, 11', 21,31,41 del primer ejemplo, las modificaciones del primer ejemplo, del segundo ejemplo, del tercer ejemplo y del cuarto ejemplo, en que el codificador 51 no incluye el codificador basado en periodo de tono de dominio de frecuencia 116. El codificador 51 en este ejemplo funciona como un codificador que obtiene un código para identificar un periodo de tono de dominio de frecuencia. Si una cadena de muestras de dominio de frecuencia generada desde codificador 51 también va a ser codificada, la cadena de muestras de dominio de frecuencia generada desde el codificador 51 es introducida en el codificador basado en periodo de tono de dominio de frecuencia 116 externo al codificador 51 y es codificada por el codificador basado en periodo de tono de dominio de frecuencia 116, por ejemplo, aunque otros medios de codificación pueden ser utilizados para codificar la cadena de muestras de dominio de frecuencia. El resto del codificador 51 es el mismo que los codificadores 11, 11', 21, 31, 41 del primer ejemplo, las modificaciones del primer ejemplo, el segundo ejemplo, el tercer ejemplo y el cuarto ejemplo.
Descodificador 52
Como se ilustra en la Figura 9, un descodificador 52 de este ejemplo difiere de los descodificadores 12, 12', 22, 32, 42 del primer ejemplo, las modificaciones del primer ejemplo, del segundo ejemplo, del tercer ejemplo y del cuarto ejemplo en que el descodificador basado en periodo de tono de dominio de frecuencia 123, la unidad aritmética de cadena de señales de dominio de tiempo 124 y el sintetizador de predicción de largo plazo 125 son externos al descodificador 52. El descodificador 52 funciona como un descodificador que obtiene al menos un periodo de tono de dominio de frecuencia de predicción de largo plazo T y un periodo de tono de dominio de tiempo L a partir de al menos un código de periodo de tono de dominio de frecuencia y un código de periodo de tono de dominio de tiempo. Por ejemplo, un periodo de tono de dominio de tiempo L y una ganancia de tono cuantificada gpA generada desde el descodificador 52 son introducidas en el sintetizador de predicción de largo plazo 125. Por ejemplo, una cadena de códigos y un periodo de tono de dominio de frecuencia T generados desde el descodificador 52 (e información auxiliar sin la información auxiliar es introducida) son introducidos en el descodificador basado en periodo de tono de dominio de frecuencia 123. El resto del descodificador 52 es el mismo que los descodificadores 12, 12', 22, 32, 42 del primer ejemplo, las modificaciones del primer ejemplo, del segundo ejemplo, del tercer ejemplo y del cuarto ejemplo.
[REALIZACIÓN]
Las Figuras 10 y 11 ilustran un codificador 61 de una realización y el descodificador 62 de un ejemplo útil para el entendimiento de la invención. El codificador 61 y el descodificador 62 difieren de los del primer ejemplo, las modificaciones del primer ejemplo, del segundo ejemplo, del tercer ejemplo y del cuarto ejemplo en que el codificador basado en periodo de tono de dominio de frecuencia 616 está configurado en lugar del codificador basado en periodo de tono de dominio de frecuencia 116 y el descodificador basado en periodo de tono de dominio de frecuencia 623 está configurado en lugar del descodificador basado en periodo de tono de dominio de frecuencia 123. La cadena de muestras de dominio de frecuencia es introducida en el codificador basado en periodo de tono de dominio de frecuencia 616. Una cadena de códigos, un periodo de tono de dominio de frecuencia T, e información auxiliar son introducida en el descodificador basado en periodo de tono de dominio de frecuencia 623. Solo el codificador basado en periodo de tono de dominio de frecuencia 616 y el descodificador basado en periodo de tono de dominio de frecuencia 623 serán descritos a continuación.
Codificador Basado en Periodo de Tono de Dominio de Frecuencia 616
El codificador basado en periodo de tono de dominio de frecuencia 616 incluye un codificador 616a, codifica una cadena de muestras de dominio de frecuencia de entrada utilizando un método de codificación basado en un periodo de tono de dominio de frecuencia T, y genera cadenas de códigos resultantes de la codificación.
Codificador 616b
El codificador 616b codifica el grupo de muestras G1 compuesto por todas o algunas de una o una pluralidad de muestras sucesivas que incluyen una muestra correspondiente a un periodo de tono de dominio de frecuencia T en una cadena de muestras de dominio de frecuencia y una o una pluralidad de muestras sucesivas que incluyen una muestra correspondiente a un múltiplo entero del periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia y el grupo de muestras G2 compuesto por las muestras que no están incluidas en el grupo de muestras G1 en la cadena de muestras de dominio de frecuencia de acuerdo con criterios diferentes (separadamente) y genera las cadenas de códigos resultantes.
Ejemplos de Grupos de Muestras G1, G2
Un ejemplo de las “todas o algunas de una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente a un periodo de tono de dominio de frecuencia T en una cadena de muestras de dominio de frecuencia y una o una pluralidad de muestras sucesivas que incluyen una muestra correspondiente a un múltiplo entro del periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia” es la misma que la dada en la primera realización y tal grupo de muestras es el grupo de muestras G1. Como se ha descrito en el primer ejemplo, tal grupo de muestras G1 puede ser establecido de varias formas. Por ejemplo, un conjunto de grupos de muestras cada uno de los cuales está formado por tres muestras, a saber, una muestra F(nT) correspondiente al periodo de tono de dominio de frecuencia T, la muestra F(nT - 1) que precede a la muestra F(nT) y la muestra F(nT 1) que sucede a la muestra F(nT), F(nT -1), F(nT) y F(nT 1), en una entrada de cadena de muestras en el codificador 616b es un ejemplo el grupo de muestras G1. Por ejemplo, si n representa un número entero comprendido entre 1 y 5, la muestra G1 es un grupo formado por un primer grupo de muestras F(T -1), F(T), F(T 1), un segundo grupo de muestras F(2T -1), F(2T), F(2T 1), un tercer grupo de muestras F(3T -1), F(3T), F(3T 1), un cauto grupo de muestras F(4T -1), F(4T), F(4T 1), y un quinto grupo de muestras F(5T -1), F(5T), F(5T 1).
Un grupo de muestras que no están incluidas en el grupo G1 en la cadena de muestras introducida en el codificador 616b es el grupo de muestras G2. Por ejemplo, si n representa un número entero comprendido entre 1 y 5, un ejemplo del grupo de muestras G2 es un grupo formado por un primer conjunto de muestras F(1), ..., F(T -2), un segundo conjunto de muestras F(T 2), ..., F(T - 2), un tercer conjunto de muestras F(2T 2), ..., F(3T - 2), un cuarto conjunto de muestras F(3T 2), ..., F(4T - 2), un quinto conjunto de muestras F(4T 2), ..., F(5T - 2), y un sexto conjunto de muestras F(5T 2), ..., F(jmax).
Si un periodo de tono de dominio de frecuencia T es un valor fraccional como se ilustra en el primer ejemplo, el grupo de muestras G1 puede ser un conjunto de grupos de muestras formado por F(R(nT - 1)), F(R(nT)), y F(R(nT 1)), por ejemplo, en donde R(nT) es un valor nT redondeado al número entero más cercano. El número de muestras incluido en cada uno de los grupos de muestras que forman el grupo de muestras G1 y los índices de muestras pueden ser variables y la información que representa una combinación seleccionada de una pluralidad de diferentes combinaciones de número de muestras incluida en cada grupo de muestras que forma el grupo de muestras G1 y los índices de muestras puede ser generada como información auxiliar (primera información auxiliar).
[Ejemplos de Codificación de Acuerdo con Diferentes Criterios]
El codificador 616b codifica el grupo de muestras G1 y el grupo de muestras G2 de acuerdo con diferentes criterios sin reorganizar las muestras incluidas en los grupos de muestras G1 y G2 y genera las cadenas de códigos resultantes.
En general, las amplitudes de las muestras incluidas en el grupo de muestras G1 son mayores que las amplitudes de las muestras incluidas en los grupos de muestras G2. Las muestras en el grupo G1 están codificadas utilizando codificación de longitud variable de acuerdo con un criterio relacionado con las magnitudes de las amplitudes o las magnitudes estimadas de las amplitudes de las muestras incluidas en el grupo de muestras G1 y las muestras incluidas en el grupo de muestras G2 están codificadas utilizando codificación de longitud variable de acuerdo con un criterio relacionado con las magnitudes de las amplitudes o las magnitudes estimadas de las amplitudes de la muestre en el grupo de muestras G2. Con esta configuración, la cantidad de códigos media de los códigos de longitud variable se puede reducir debido a que se pueden conseguir una mayor precisión de estimación de las amplitudes de las muestras que si todas las muestra incluidas en la cadena de muestras están codificadas mediante codificación longitud variable de acuerdo con el mismo criterio. Esto es, la codificación del grupo de muestras G1 y del grupo de muestras G2 de acuerdo con criterios diferentes tiene el efecto de reducir la cantidad de código de la cadena de muestras sin reorganizar las muestras. Ejemplos de la magnitud de amplitud incluyen el valor absoluto de la amplitud y energía de amplitud.
[EJEMPLO DE CODIFICACIÓN RICE]
Se describirá un ejemplo utilizando codificación Rice de muestra a muestra como codificación de longitud variable. En este caso, el codificador 616b codifica las muestras incluidas en el grupo de muestras G1 mediante codificación Rice en una base de muestre a muestra utilizando un parámetro Rice correspondiente a la magnitud de amplitud o a una magnitud de amplitud estimada de cada una de las muestras incluidas en el grupo de muestras G1. El codificador 616n codifica también las muestra incluidas en el grupo de muestras G2 mediante codificación Rice en una base de muestra a muestra utilizando un parámetro Rice correspondiente a la magnitud de amplitud de o una magnitud de amplitud estimada se cada una de las muestras incluidas en el grupo de muestras G2. El codificado 616b genera cadenas de códigos obtenidas por codificación Rice e información auxiliar para identificar los parámetros Rice.
Por ejemplo, el codificador 616b obtiene un parámetro Rice para el grupo de muestras G1 en cada marco a partir del promedio de magnitudes de amplitudes de las muestras incluidas en el grupo de muestras G1 en ese marco. Por ejemplo, el codificador 616b obtiene un parámetro Rice para el grupo de muestras G2 en cada marco a partir del promedio de magnitudes de amplitudes de las muestras incluidas en el grupo de muestras G2 en ese marco. Un parámetro Rice es un número entero mayor o igual a 0. El codificador 616b utiliza, en cada marco, el parámetro Rice para el grupo de muestras G1 para codificar las muestras incluidas en el grupo de muestras G1 mediante codificación Rice y utiliza el parámetro Rice para el grupo de muestras G2 para codificar las muestras incluidas en el grupo de muestras G2 mediante codificación Rice. Esta codificación puede reducir la cantidad de código media. Esto se describirá más adelante con detalle.
Primero, se proporcionará un ejemplo en el que las muestra incluidas en el grupo de muestras G1 son codificadas mediante codificación Rice en una base de muestra a muestra.
Un código que se puede obtener por codificación Rice de muestras X(k) incluidas en el grupo de muestras G1 en una base de muestra a muestra incluye el prefijo(k) resultante de codificación unaria de un cociente q(k) obtenido dividiendo la muestra X(k) por un valor correspondiente al parámetro Rice s del grupo de muestras G1 y un sub(k) que identifica el resto. Esto es, un código correspondiente a una muestra X(k) en este ejemplo incluye en prefijo (k) y el sub(k). Las muestras X(k) que van a ser codificadas por codificación Rice son representaciones de número entero. Un método para calcular q(k) y sub(k) se ilustrará a continuación.
Si el parámetro s > 0, entonces q(k) es generado como sigue. Aquí, floor(x) es el máximo número entero menor o igual a x.
q(k)= floor(X(k)/2s' ' ) (para X(k)>0) ... (Bl)
q(k) = floor{(-X(k)- 1 )/2s 1} (para X(k)<0) ... (B2)
Si el parámetro Rice s = 0, el cociente q(k) es generado como sigue.
q(k) = 2*X(k) ( para X(k) > 0) ... (B3)
q(k) = 2*X(k) - I (para X(k) < 0) ... (B4)
Si el parámetro s > 0, sub(k) es generado como sigue.
sub(k) = X(k)-2s l*q(k) 2s l (para X(k)>0) ... (B5) sub(k) = (-X(k) -1) - 2S 1 *q(k)(parax(k) < 0) ...(B6)
Si el parámetro Rice s = 0, sub(k) es nulo (sub(k) = nulo).
Las fórmulas (B1) a (B4) pueden ser generalizadas para representar el cociente q(k) como sigue. Aquí, | ■ | representa el valor absoluto de ■.
q(k) = floor{(2*IX(k)l - z)/2s} (z = 0 o 1 o 2) ... (B7)
En la codificación Rice, en prefijo(k) es un código resultante de la codificación unaria del cociente q(k) y la cantidad de código puede ser expresadas utilizando la formula (B7) como
floor{(2*IX(k)l-z)/2s} 1 ... (B8)
En la codificación Rice, sub(k) que define el resto de las formulas (B5) y (B6) está representado por s bits. Por consiguiente, la cantidad de código C(s, X(k), G1) de códigos (prefijo(k) y sub(k)) correspondiente a las muestras X(k) incluidas en el grupo de muestras G1 es como sigue:
C(s,X(k),Gl) - £[floor{(2* I X(k) I -z)/2s} 1 s]
keG l
Aquí, aproximando como floor{(2*| X(k) | - z)/2s} = (2*| X(k) | - z)/2s, la fórmula (B6) se puede aproximar como sigue:
C(s,X(k),Gl) - 2's(2 * D - z* IG 11) (1 s> I Gl I
D = £ |X (k)|
keG l
en donde | G11 representa el número de muestras X(k) incluidas en el grupo de muestras G1 en un marco.
s' denota s que produce 0 como resultado de una diferenciación parcial con respecto a s en la fórmula (B10), entonces
s’ = log2{ln2*(2*D/IGll - z)j ... (B ll)
Si D/| G11 es suficientemente grande, la fórmula (B11) se puede aproximar como
s' = log2{ln2*(2 • D/IG1I)} ... (B12)
Dado que s' obtenida de acuerdo con la formula (B12) no es un número entero, s' es cuantificado a un número entero y es utilizada como el parámetro Rice s. La parámetro Rice s corresponde con la media D/|G11 de las magnitudes de amplitudes de las muestras incluidas en el grupo de muestras G1 (véase la fórmula B12)) y minimiza la cantidad de código total de los códigos correspondientes a las muestras X(k) incluidas en el grupo de muestras G1.
Lo anterior se aplica a la codificación Rice de las muestras incluidas en el grupo de muestras G2 también. De este modo, la cantidad de código total puede ser minimizada obteniendo un parámetro Rice para el grupo de muestras G1 a partir de la media de las magnitudes de amplitudes de las muestras incluidas en el grupo de muestras G1 en cada marco, obteniendo un parámetro Rice para el grupo de muestras G2 a partir de la media de las magnitudes de amplitudes de las muestras incluidas en el grupo de muestras G2, y realizando codificación Rice del grupo de muestras G1 y el grupo de muestras G2 respectivamente.
Cuanto menor variación en la magnitud de la amplitud de las muestras X(k), mejor es la evaluación de la cantidad de código total C(s, X(k), G1) de acuerdo con la fórmula aproximada (B10). Por consiguiente, especialmente cuando las magnitudes de amplitudes de las nuestras incluidas en el grupo de muestras G1 son sustancialmente uniformes y las magnitudes de amplitudes de las muestras incluidas en el grupo de muestras G2 son sustancialmente uniformes, la cantidad de código puede ser significativamente más reducida.
[Ejemplo 1 de Información auxiliar para Identificar Parámetros Rice]
Si el parámetro Rice para el grupo de muestras G1 y el parámetro Rice para el grupo de muestras G2 están diferenciados, el lado de descodificación requiere información auxiliar (tercera información auxiliar) para identificar el parámetro Rice para el grupo de muestras G1 y la información auxiliar (cuarta información auxiliar) para identificar el parámetro Rice para el grupo de muestras G2. Por tanto, el codificador 616b puede generar la tercera información auxiliar y la cuarta información auxiliar además de la cadena de códigos de códigos obtenidos por codificación Rice de la cadena de muestra en una base de muestra a muestra.
[Ejemplo 2 de Información Auxiliar para Identificar Parámetros Rice]
Si una señal de audio va a ser codificada, el promedio de las magnitudes de amplitudes de las muestras incluidas en el grupo de muestras G1 es mayor que la media de las magnitudes de amplitudes de las muestras en el grupo de muestras G2 y un parámetro Rice para el grupo de muestras G1 es mayor que un parámetro Rice para el grupo de muestras G2. Tomando ventaja de este hecho, la cantidad de código de información auxiliar para identificar los parámetros Rice se puede reducir.
Por ejemplo, se supone que un parámetro Rice para el grupo de muestras G1 es mayor que un parámetro Rice para el grupo de muestras G2 en un valor fijo (por ejemplo 1). Esto es, se supone que la relación “parámetro Rice para el grupo de muestras G1 = parámetro Rice para el grupo de muestras G2 valor fijo” se cumple de manera invariable. En este caso, el codificador 616b necesita generar sólo una de la tercera información auxiliar y la cuarta información auxiliar además de una cadena de códigos.
[Ejemplo 3 de Información Auxiliar para Identificar Parámetros Rice]
La información que por sí misma permite que un parámetro Rice para el grupo de muestras G1 sea identificado puede ser establecida como la quinta información auxiliar y la información que permite una diferencia entre el parámetro Rice para el grupo de muestras G1 y el parámetros Rice para el grupo de muestras G2 sea identificada puede ser establecida como la sexta información auxiliar. Alternativamente, la información que permite por sí misma que un parámetro Rice para el grupo de muestras G2 sea identificado puede ser establecida como la sexta información auxiliar y la información que permite una diferencia entre un parámetro Rice para el grupo de muestras G1 y el parámetro Rice para el grupo de muestras G2 sean identificados puede ser establecida como la quinta información auxiliar. Nótese que el parámetro Rice para el grupo de muestras G1 es mayor que el parámetro Rice para el grupo de muestras G2, la información auxiliar que indica que el parámetro Rice para el grupo de muestras G1 y el parámetro Rice para el grupo de muestras G2 es mayor (tal como la información que indica positivo o negativo) no se requiere.
[Ejemplo 4 de Información Auxiliar para Identificar Parámetros Rice]
Si el número de bits de código asignado a un marco entero está especificado, el valor de la ganancia obtenida en el etapa S113c es significativamente restringido y el rango de valores que se pueden tomar por las amplitudes de las muestras es también significativamente restringido. En ese caso, la media de las magnitudes de amplitudes de las muestras se puede estimar a partir del número de bits de códigos asignados a un marco total con un cierto grado de precisión. El codificador 616b puede utilizar un parámetro Rice que puede ser estimado a partir de una media estimada de las magnitudes de amplitudes de las muestras para realizar la codificación Rice.
Por ejemplo, el codificador 616b puede utilizar el parámetro Rice más una valor de diferencia (por ejemplo 1) como el parámetro Rice para el grupo de muestras G1 y puede utilizar el parámetro Rice estimado como el parámetro Rice para el grupo de muestras G2. Alternativamente, el codificador 616b puede utilizar el parámetro Rice estimado como el parámetro Rice para el grupo de muestras G1 y el parámetro Rice estimado menos un segundo valor de diferencia (por ejemplo 1) puede ser utilizado como el parámetro Rice para el grupo de muestras G2.
El codificador 616b en ambos de estos casos puede generar, por ejemplo, información auxiliar (séptima información auxiliar) para identificar el primer valor de diferencia o información auxiliar (octava información auxiliar) para identificar el segundo valor de diferencia, además de una cadena de códigos.
[Ejemplo 5 de Información Auxiliar para Identificar Parámetros Rice]
Un parámetro Rice que tiene un efecto mayor de reducir la cantidad de código puede ser estimado en base a la información de envolvente de las amplitudes de una cadena de muestras X(1), X(N) cuando las magnitudes de amplitudes de las muestras incluidas en el grupo de muestras G1 o las magnitudes de amplitudes de las muestras incluidas en el grupo de muestras G2 no son uniformes. Por ejemplo, cuando las magnitudes de las amplitudes de las muestras son mayores en frecuencias más elevadas, la cantidad de código puede ser reducida aumentando el parámetro Rice para muestras en el lado de banda elevado entre las muestras incluidas en el grupo de muestras G1 a velocidad constante y aumentando el parámetro Rice para muestras en el lado de banda elevado entre las muestras incluidas en el grupo de muestras G2 a velocidad constante. Un ejemplo se proporciona a continuación.
T l 1
Figure imgf000029_0001
En la tabla 1, s1 y 2s son parámetros Rice para los grupos de muestras G1 y G2, respetivamente, ilustrados en los [Ejemplos 1 a 4 de Información Auxiliar para Identificar Parámetros Rice] y const. 1 a const. 10 son valores enteros positivos predeterminados. El codificador 616b en este ejemplo tiene solo que generar información auxiliar que identifica la información de envolvente (novena información auxiliar) además de cadenas de códigos y piezas de información auxiliar ilustradas en los ejemplos 2 y 3 de los parámetros Rice. Si la información de envolvente es ya conocida par el lado de descodificación, el codificador 616b no necesita generar la novena información auxiliar.
Descodificador basado en Periodo de Tono de Dominio de Frecuencia 623
El descodificador basado en periodo de tono de dominio de frecuencia 623 incluye un descodificador 623a y descodifica una cadena de códigos utilizando un método de descodificación basado en periodo de tono de dominio de frecuencia T para obtener y generar una cadena de muestras de dominio de frecuencia.
Descodificador 623a
El descodificador 623a descodifica las cadenas de códigos para obtener cadenas de muestras de dominio de frecuencia por procesos (separados) de descodificación de acuerdo con criterios diferentes para el grupo de muestras G1 compuesto por todas o alguna de una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente a un periodo de tono de dominio de frecuencia T en una cadena de muestras de dominio de frecuencia y una o una pluralidad de muestras sucesivas que incluyen una muestra correspondiente a un múltiplo entero del periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia y al grupo de muestras G2 compuesto por las muestras que no están incluidas en el grupo G1 en la cadena de muestras de dominio de frecuencia y genera las cadenas de muestras de dominio de frecuencia.
[Ejemplos de Grupos de Códigos C1, C2 y Grupos de Muestras G1, G2]
El descodificador 623a identifica los números de muestras incluidos en los grupos de códigos C1 y C2 incluidos en una cadena de códigos de entrada en cada marco y los números de muestras incluidas en los Grupos de muestras G1 y G2 correspondientes a los grupos de códigos C1 y C2 por un periodo de tono de dominio de frecuencia T (si es introducida primera información auxiliar, por el periodo de tono de dominio de frecuencia T y la primera información auxiliar), descodifica los grupos de códigos C1 y C2, asigna los grupos de valores de muestras resultantes a los números de muestra correspondientes a los códigos para obtener grupos de muestras G1 y G2, con lo que se obtiene una cadena de muestras de dominio de frecuencia. El grupo de código C1 está formado por códigos correspondientes a las muestras incluidas en el grupo de muestras G1 en la cadena de códigos y el grupo de códigos C2 está formado por los códigos correspondientes a las muestras incluidas en el grupo de muestras G2 en la cadena de códigos. El método para identificar los grupos de códigos C1 y C2 en el descodificador 623a corresponde a un método para establecer los grupos de muestras G1 y G2 en el codificador 616b. Por ejemplo, las “muestras” en la descripción del método para establecer los grupos de muestras G1 y G2 son sustituidas por “códigos”, “F(j)” por “C(j)”, “grupo de muestras G1” por “grupo de códigos C1”, y el “grupo de muestras G2” por el “grupo de códigos C2”, en donde C(j) es un código correspondiente a una muestra F(j).
Por ejemplo, si el grupo de muestras G1 es un grupo compuesto por tres muestras, a saber, una muestra F(nT), correspondiente a un múltiplo entre del periodo de tono de dominio de frecuencia T, la muestra que precede a la muestra F(nT) y la muestra que sucede a la muestras F(nT), F(nT -1), F(nT) y F(nT 1), en una entrada de cadena de muestras en el codificador 616b, el descodificador 623a establece un grupo formado por los códigos C(nT -1), C(nT) y C(nT 1) correspondientes a tres números de muestras que incluyen el número de muestra nT correspondiente a un múltiplo entero del periodo de tono de dominio de frecuencia T, y los números de muestra precedente y posterior nT -1 y nT 1, en una cadena de códigos de entrada C(1), ..., C(jmax) como grupo de códigos C1, establece un grupo formado por los códigos que no están incluidos en el grupo de códigos C1 como grupo de códigos C2, descodifica cada uno de los códigos C(nT - 1), C(nT), C(nT 1) incluidos en el grupo de códigos C1 para obtener una muestra F(nT - 1) con un número de muestra nT -1, una muestra F(nT) con el número de muestra nT, y la muestra F(nT 1) con el número de muestra nT 1, y descodifica los códigos incluidos en el grupo de códigos C2 para obtener muestras con los números de muestras que excluyen los números de muestras nT - 1, nT y nT 1. Por ejemplo, si n representa un número entero comprendido entre 1 y 5, el grupo de códigos C1 es un grupo formado por un primer grupo de códigos C(T - 1), C(t), C(T 1), un segundo grupo de códigos C(2T -1), C(2T), C(2T 1), un tercer grupo de códigos C(3T - 1), C(3T), C(3T 1), un cuarto grupo de códigos c (4T -1) , C(4T), C(4T 1), y un quinto grupo de códigos C(5T - 1), C(5T), C(5T 1); un grupo de códigos C2 es un grupo formado por un primer conjunto de códigos C(1), ..., C(T - 2), un segundo conjunto de códigos C(T 2), ..., C(2T - 2), un tercer conjunto de códigos C(2T 2), ..., C(3T - 2), un cuarto conjunto de códigos C(3T 2), ..., C(4T -2) , un quinto conjunto de códigos C(4T 2), ..., C(5T - 2), y un sexto conjunto de códigos C(5T 2), ..., C(jmax). Estos grupos y conjuntos de códigos son descodificados para obtener un primer grupo de muestras F(T - 1), F(T), F(T 1), un segundo grupo de muestras F(2T - 1), F(2T), F(2T 1), un tercer grupo de muestras F(3T - 1), F(3T), F(3T 1), un cuarto grupo de muestras F(4T - 1), F(4T), F(4T 1), un quinto grupo de muestras F(5T - 1), F(5T), F(5T 1), un primer conjunto de muestras F(1), ..., F(T - 2), un segundo conjunto de muestras F(T 2), ..., F(2T - 2), un tercer conjunto de muestras F(2T 2), ..., F(3T - 2), un cuarto conjunto de muestras F(3T 2), ..., F(4T - 2), un quinto conjunto de muestras F(4T 2), ..., F(5T - 2), y un sexto conjunto de muestras F(5T 2), ..., F(jmax), con lo que se obtiene una cadena de muestras de dominio de frecuencia.
[Ejemplo de Descodificación de Acuerdo con Diferentes Criterios]
El descodificador 623a descodifica el grupo de códigos C1 y el grupo de códigos C2 de acuerdo con diferentes criterios para obtener y generar cadenas de muestras de dominio de frecuencia. Por ejemplo, el descodificador 623a descodifica los códigos incluidos en el grupo de códigos C1 de acuerdo con un criterio relacionado con las magnitudes de amplitudes o magnitudes de amplitudes estimadas de las muestras incluidas en el grupo de muestras G1 correspondiente al grupo de códigos C1 y descodifica los códigos incluidos en el grupo de códigos C2 de acuerdo con un criterio relacionado con las magnitudes de amplitudes o las magnitudes de amplitudes estimadas de las muestras incluidas en el grupo de muestras G2 correspondiente al grupo de códigos C2.
[Ejemplo de Codificación Rice]
Se describirá un ejemplo en el que una cadena de códigos ha sido obtenida mediante codificación Rice de muestra a muestra.
Es este caso, el descodificador 623a, en una base de marco a marco, establece un parámetro Rice para el grupo de muestras G1 inidentificado a partir de la información auxiliar de entrada (al menos algo de la primera a novena información auxiliar) como el parámetro Rice para el grupo de códigos C1 y establece un parámetro Rice para el grupo de muestras G2 identificado a partir de información auxiliar de entrada como el parámetro Rice para el grupo de códigos C2. Los métodos para identificar los parámetros Rice que corresponden a [Ejemplos 1 a 5 de Información Auxiliar para Identificar Parámetros Rice] descritos anteriormente se ilustrarán a continuación.
[Ejemplo 1 de Información Auxiliar para Identificar Parámetros Rice]
Por ejemplo, el descodificador 623a en el que la tercera información auxiliar y la cuarta información auxiliar han sido introducidas identifica el parámetro Rice para el grupo de muestras G1 a partir de la tercera información auxiliar y establece el parámetro Rice como el parámetro Rice para el grupo C1 e identifica el parámetro Rice para el grupo de muestras G2 a partir de la cuarta información auxiliar y establece el parámetro Rice como el parámetro Rice para el grupo C2.
[Ejemplo 2 de Información Auxiliar para Identificar Parámetros Rice]
Por ejemplo, el descodificador 623a en el que solo la cuarta información auxiliar ha sido introducida además de una cadena de códigos, identifica el parámetro Rice para el grupo de códigos C2 a partir de la cuarta información auxiliar y establece el parámetro Rice para el grupo de códigos C2 más un valor fijo (por ejemplo, 1) como parámetro Rice para el grupo de códigos C1. Alternativamente, el descodificador 623a en el que solo ha sido introducida la tercera información auxiliar además de una cadena de códigos identifica el parámetro Rice para el grupo de códigos C1 a partir de la tercera información auxiliar y establece el parámetro Rice para el grupo de códigos C1 menos un valor fijo (por ejemplo, 1) como el parámetro Rice para el grupo de códigos C2.
[Ejemplo 3 de Información Auxiliar para Identificar Parámetros Rice]
Por ejemplo, el descodificador 623a en el que la quinta información auxiliar que identifica un parámetro Rice y la secta información auxiliar que identifica una diferencia han sido introducidas identifica el parámetro Rice para el grupo de muestras G1 a partir de la información auxiliar y establece el parámetro Rice como el parámetro Rice pare le grupo de códigos C1. Además, el descodificador 623a establece el parámetro Rice para el grupo de códigos C1 menos la diferencia identificada a partir de la sexta información auxiliar como el parámetro Rice para el grupo de códigos C2.
Por ejemplo, el descodificador 623a en el que han sido introducidas la quinta información auxiliar que identifica una diferencia y la sexta información auxiliar que identifica un parámetro Rice, identifica el parámetro Rice para el grupo de muestras G1 a partir de la sexta información auxiliar y establece el parámetro Rice como el parámetro Rice para el grupo de códigos C1. Además, el descodificador 623a establece el parámetro Rice para el grupo de códigos C2 más la diferencia identificada a partir de la quinta información auxiliar como el parámetro Rice para el grupo de códigos C1.
[Ejemplo 4 de Información Auxiliar para Identificar Parámetros Rice]
Por ejemplo, el descodificador 623a en el que ha sido introducida la séptima información auxiliar establece un parámetro Rice estimado a partir del número de bits de código asignado a un marco completo como el parámetro Rice para el grupo de códigos C2 y establece el parámetro Rice para el grupo de códigos C2 más un primer valor de diferencia a partir de la séptima información auxiliar como el parámetro Rice para el grupo de códigos C1.
Por ejemplo, el descodificador 623a en el que ha sido introducida la octava información auxiliar establece un parámetro Rice estimado a partir del número de códigos asignado a un marco completo como el parámetro Rice para el grupo de códigos C1 y el parámetro Rice para el grupo de códigos C1 menos un valor de diferencia identificado a partir de la octava información auxiliar como el parámetro Rice para el grupo de códigos C2.
[Ejemplo 5 de Información Auxiliar para Identificar Parámetros Rice]
Por ejemplo, el descodificador 623a en el que ha sido introducida la novena información auxiliar además de la información auxiliar para identificar los parámetros Rice descritos anteriormente, utiliza al menos alguna de la tercera a octava información auxiliar para identificar s1 y s2 y establece s1 y s2 en base a la novena información auxiliar como se ilustra en la [Tabla 1] proporcionada anteriormente para obtener los parámetros Rice para los grupos de códigos C1 y C2.
Si la novena información auxiliar no está introducida pero la información de envolvente es conocida y el codificador 616b tiene establecido s1 y s2 como se ilustra en la [Tabla 1] proporcionada anteriormente para obtener los parámetros Rice para los grupos G1 y G2, el descodificador 623a establece s1 y s2 como se ilustra en [Tabla 1] proporcionada anteriormente para obtener los parámetros Rice para los grupos de códigos C1 y C2.
El descodificador 623a que ha obtenido los parámetros Rice como se ha descrito anteriormente utiliza el parámetro Rice para el grupo de códigos C1 para descodificar los códigos incluidos en el grupo C1 en cada marco y utiliza el parámetro Rice para el grupo de códigos C2 para descodificar los códigos incluidos en el grupo de códigos C2 para obtener y generar la secuencia original de muestras. Nótese que la descodificación correspondiente a la codificación Rice es bien conocida y por tanto la descripción de la descodificación se omitirá.
[SEXTO EJEMPLO]
Este ejemplo actualmente no está reivindicado pero puede ser útil para el entendimiento de la invención.
En la realización, se han proporcionado ejemplos en los que el codificador basado en periodo de tono de dominio de frecuencia 616 está configurado en el codificador 61 de acuerdo con la realización y el descodificador basado en periodo de tono de dominio de frecuencia 623 está configurado el en descodificador 62 de acuerdo con el ejemplo que es útil para el entendimiento de la invención. Sin embrago, el codificador basado en periodo de tono de dominio de frecuencia 616 puede ser externo respecto al codificador 61 y el descodificador basado en periodo de tono de dominio de frecuencia 623 puede ser externo respecto al codificador 62. Esta diferencia es la misma que la diferencia de configuración del quinto ejemplo del primer ejemplo, las modificaciones del primer ejemplo, del segundo ejemplo, del tercer ejemplo y del cuarto ejemplo y por tanto se omitirá una descripción adicional de la configuración.
[SÉPTIMO EJEMPLO]
Este ejemplo actualmente no está reivindicado pero puede ser útil para el entendimiento de la invención.
Codificador 81
Como se ilustra en la Figura 14, un descodificador 81 de un séptimo ejemplo difiere del codificador 51 del quinto ejemplo en que el codificador 81 no incluye el analizador de predicción de largo plazo 111, la unidad aritmética residual de predicción de largo plazo 112, y la unidad aritmética de cadena de muestras de dominio de frecuencia 113. El codificador 81 en este ejemplo funciona como un codificador que toma entradas de un periodo de tono de dominio de tiempo L, un código de periodo de tono de dominio de tiempo CL y una cadena de muestras de dominio de frecuencia de una fuente externa para el codificador 81 y obtiene un código para identificar un periodo de tono de dominio de frecuencia para la cadena de muestras de dominio de frecuencia.
El periodo de tono de dominio de tiempo L y el código de periodo de tono de dominio de tiempo Cl que van a ser introducidos en el codificador 81 son calculados en un analizador de predicción de rango plazo externo 111. Sin embargo, pueden ser calculados por otros medios de cálculo de periodo de tono de dominio de tiempo.
La cadena se muestras de dominio de frecuencia introducida en el codificador 81 puede ser una cadena de muestras correspondiente a una cadena de muestras resultante de la conversión de una cadena de señales de audio digital de entrada en N puntos en el dominio de frecuencia y puede ser una cadena de coeficientes MDCT, calculada en una unidad aritmética de cadena de muestras de dominio de frecuencia 113 externa al codificador 81 o una cadena de muestras de dominio de frecuencia generada por otros medios de generación de cadenas de muestras de dominio de frecuencia.
Un convertidor de periodo 814 del codificador 81 toma las entradas de periodo de tono de dominio de tiempo L y el número N de puntos de muestras en el dominio de frecuencia y calcula y genera un intervalo convertido T1. El proceso para obtener el intervalo convertido T1 es el mismo que el proceso realizado por el convertidor de periodo 114. Nótese que en lugar del periodo de tono de dominio de tiempo L, puede ser introducido un código de periodo de tono de dominio de tiempo Cl correspondiente al periodo de tono de dominio de tiempo L. En ese caso, el convertidor de periodo 814 obtiene el periodo de tono de dominio de tiempo L correspondiente al código de periodo de tono de dominio de tiempo Cl , obtiene el intervalo convertido T1 del periodo de tono de dominio de tiempo L y genera el intervalo convertido T1.
El intervalo convertido T1 y la cadena de muestras de dominio de frecuencias son introducidas en el analizador de periodo de tono de dominio de frecuencia 815. El analizador de periodo de tono de dominio de frecuencia 815 elije un periodo de tono de dominio de frecuencia de entre candidatos que incluyen el intervalo convertido T1 y múltiplos enteros U X T1 (en donde U es un número entero en un primer rango predeterminado) del intervalo convertido T1 y obtiene y genera un código para identificar el periodo de tono de dominio de frecuencia. El proceso para elegir el periodo de tono de dominio de frecuencia y el proceso para obtener el código para identificar el periodo de tono de dominio de frecuencia son los mismos que los realizados por los analizadores de periodo de tono de dominio de frecuencia 115, 115', 215, 315, 415 cuando la información de selección de predicción de largo plazo indica que se va a realizar predicción de largo plazo.
El convertidor de periodo 814 y el analizador de periodo de tono de dominio de frecuencia 815 pueden realizar diferentes procesos dependiendo de si la información de selección de predicción de largo plazo indica que la predicción de largo plazo se va a realizar o no, como los convertidores de periodo 114, 414 y los analizadores de periodo de tono de dominio de frecuencia 115, 115', 215, 315, 415. En ese caso, la información de selección de predicción de largo plazo es también introducida en el codificador 81 desde el analizador de predicción de largo plazo 111 externo al codificador 81.
Descodificador 82
Un descodificador 82 de acuerdo con un ejemplo se describirá a continuación. Este descodificador actualmente no está reivindicado pero la descripción del mismo puede ser útil para el entendimiento de la invención.
Como se ilustra en la Figura 15, un descodificador 82 de este ejemplo difiere del descodificador 52 del quinto ejemplo en que el descodificador 82 no incluye el descodificador de información de predicción de largo plazo 121. El descodificador 82 funciona como un descodificador que obtiene al menos periodo de tono de dominio de frecuencia T a partir de un periodo de tono de dominio de tiempo L obtenido por un descodificador de información de predicción de largo plazo 121 externo al descodificador 82 y a partir de al menos un código de periodo de tono de dominio de frecuencia y un código de periodo de tono de dominio de tiempo incluidos en una cadena de códigos de entrada. Por ejemplo, una cadena de códigos y un periodo de tono de dominio de frecuencia T procedente del codificador 81 (e información auxiliar si la información auxiliar está introducida) son introducidos en el descodificador de periodo de tono de dominio de frecuencia 123. El resto del descodificado 82 es el mismo descodificador 52 del quinto ejemplo.
[OCTAVO EJEMPLO]
Este ejemplo actualmente no está reivindicado pero puede ser útil para el entendimiento de la invención.
Analizador de Periodo de Tono de Dominio de Frecuencia 91
En el quinto, sexto y séptimo ejemplos, un código de periodo de tono de dominio de frecuencia correspondiente al periodo de tono de dominio de frecuencia T es generado en la suposición de que el periodo de tono de dominio de frecuencia T obtenido en el codificador 51, 81 es utilizado en la codificación el cadenas de muestras de dominio de frecuencia en un codificador basado en periodo de tono de dominio de frecuencia externo 116, 616. Sin embargo, el periodo de tono de dominio de frecuencia T puede ser utilizado con fines distintos a la codificación y, en esos casos, un periodo de tono de dominio de frecuencia correspondiente al periodo de tono de dominio de frecuencia T no necesita ser generado. Otros fines distintos a la codificación pueden incluir análisis de voz, análisis de música, segregación de voz, segregación de música, reconocimiento de voz y reconocimiento de música, por ejemplo.
Como está ilustrado en la Figura 16, un analizador de periodo de tono de dominio de frecuencia 91 de un octavo ejemplo difiere de los codificadores 51, 81 del quinto, sexto y séptimo ejemplos en que el analizador de periodo de tono de dominio de frecuencia 91 no genera un código de periodo de tono de dominio de frecuencia correspondiente al periodo de tono de dominio de frecuencia T. En este caso, el analizador de periodo de tono de dominio de frecuencia 91 funciona como un analizador de periodo de tono de dominio de frecuencia y determina un periodo de tono de dominio de frecuencia para una cadena de muestras de dominio de frecuencia a partir del periodo de tono de dominio de tiempo L introducido desde una fuente externa.
Un convertidor de periodo 914 del octavo ejemplo toma las entradas del periodo de tono de dominio de tiempo L y el número N de puntos de muestra en el dominio de frecuencia y calcula y genera un intervalo convertido T1. El proceso para obtener el intervalo convertido T1 es el mismo que el realizado por el convertidor de periodo 114.
Un analizador de periodo de tono de dominio de frecuencia 915 toma entradas del intervalo convertido T1 y la cadena de muestras de dominio de frecuencia, elige un periodo de tono de dominio de frecuencia de entre candidatos que incluyen el intervalo convertido T1 y múltiplos enteros U X T1 (en donde U es un número entero en un primer rango predeterminado) del intervalo convertido T1 y genera el periodo de tono de dominio de frecuencia.
[Notas]
Aunque las configuraciones con el codificador basado en periodo de tono de dominio de frecuencia 16 que incluyen la unidad de reorganización 116a y el codificador 116b han sido descritas en el primer ejemplo, las modificaciones del primer ejemplo, del segundo ejemplo, del tercer ejemplo, y del cuarto ejemplo y la configuración con el codificador basado en periodo de tono de dominio de frecuencia 616b han sido descritas en la realización, todos estos codificadores basados en periodo de tono de dominio de frecuencia “codifican la cadena de dominio de frecuencia de entrada mediante un método de codificación basado en un periodo de tono de dominio de frecuencia T y generan la cadena de códigos obtenida mediante la codificación”. Más concretamente, todos estos codificadores basados en periodo de tono de dominio de frecuencia pueden “codificar un grupo de muestras G1 compuesto por todas o alguna de una o una pluralidad de muestras sucesivas que incluyen una muestra correspondiente a un periodo de tono de dominio de frecuencia T en una cadena de muestras de dominio de frecuencia y una o una pluralidad de sucesivas muestras que incluyen una muestras correspondiente un múltiplo entero el periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia y un grupo de muestras formado por las muestras que no están incluidas en el grupo de muestras G1 en la cadena de muestras de dominio de frecuencia de acuerdo con diferentes criterios (separadamente) y generan cadenas de códigos obtenidas por codificación”.
Lo mismo aplica al descodificador. Todos los descodificadores basados en periodo de tono de dominio de frecuencia en el contexto del primer ejemplo, las modificaciones del primer ejemplo, del segundo ejemplo, del tercer ejemplo y del cuarto ejemplo y el descodificador basado en periodo de tono de dominio de frecuencia de acuerdo con el ejemplo que está descrito en el contexto de la realización pueden “descodificar una cadena de código de entrada mediante un método basado en el periodo de tono de dominio de frecuencia T y generar una cadena de muestras de dominio de frecuencia”. Más concretamente, todos estos descodificadores basados en periodo de tono de dominio de frecuencia “descodifican una cadena de códigos de entrada para producir un grupo de muestras formado por todas o alguna de una o una pluralidad de muestras sucesivas que incluyen una muestra correspondiente con un periodo de tono de dominio de frecuencia T en una cadena de muestras de dominio de frecuencia y una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente a un múltiplo entero el periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia y un grupo de muestras formados por muestras que no están incluidas en el grupo de muestras G1 en la cadena de muestras de dominio de frecuencia de acuerdo con diferentes criterio (separadamente), con lo que se obtiene y genera una cadena de muestras de dominio de frecuencia”.
<Configuración de Hardware a Modo de Ejemplo del Codificador/Descodificador>
Un codificador/descodificador de acuerdo con la realización y los ejemplos descritos anteriormente incluyen una sección de entrada a la que un teclado o similar puede estar conectado, y una sección de salida a la que una pantalla de cristal líquido y similar puede estar conectada, una CPU (Unidad de Procesamiento Central) (que puede incluir una memoria tal como una memoria caché), memorias tales como una RAM (Memoria de Acceso Aleatorio) y una ROM (Memoria de Solo Lectura), un almacenamiento externo, que es un disco duro, y un bus que interconecta la sección de entrada, la sección de salida, la CPU, la RAM, la ROM y el almacenamiento externo, de tal manera que pueden intercambiar datos. Un dispositivo (drive) capaz de leer y escribir datos en un medio grabable, tal como un CD-ROM puede estar provisto en el codificador/descodificador si es necesario. Una entidad física que incluye estos recursos de hardware puede ser un ordenador con fines generales.
Los programas para realizar la codificación/descodificación y los datos requeridos para los programas están almacenados en el almacenamiento externo del codificador/descodificador (el almacenamiento no se limita a un almacenamiento externo; por ejemplo, los programas pueden estar almacenados en un dispositivo de almacenamiento de solo lectura tal como un ROM). Los datos obtenidos a través del procesamiento de los programas son almacenados en el RAM o el dispositivo de almacenamiento externo cuando resulte apropiado. Un dispositivo de almacenamiento que almacena datos y direcciones en sus ubicaciones de almacenamiento está en lo que sigue denominado como el “almacenamiento”.
El almacenamiento del codificador almacena un programa para reorganizar una cadena de muestras incluida en un dominio de frecuencia que es derivado de una señal de voz/audio y un programa para codificar las cadenas de muestras reorganizadas.
El almacenamiento del descodificador almacena un programa para descodificar cadenas de códigos de entada y un programa para recuperar las cadenas de muestras descodificadas a unas cadenas de muestras originales antes de la reorganización por el codificador.
En el codificador, los programas almacenados en el almacenamiento y los datos requeridos para el procesamiento de los programas están cargados en la RAM y se requiere que sean interpretados y ejecutados o procesados por la CPU. Como resultado, la CPU implementa funciones dadas (tales como la unidad de reorganización y el codificador) para implementar la codificación.
En el descodificador, los programas almacenados en el almacenamiento y los datos requeridos para el procesamiento de los programas están cargados en la RAM cuando se requiere y son interpretados y ejecutados o procesados por la CPU. Como resultado, la CPU implementa funciones dadas (tales como el descodificador y la unidad de recuperación) para implementar la descodificación.
<Adenda>
Además, los procesos descritos en la realización y en los ejemplos pueden ser realizados no sólo en la secuencia de tiempo como está escrita o pueden ser realizados en paralelo unos con otros o individualmente, dependiendo de la producción de los aparatos para realizar los procesos y requisitos. Por ejemplo, los procesos realizados por el descodificador de información de predicción de largo plazo 121 y los procesos realizados por el descodificador 123a, 523a en los procesos de descodificación descritos anteriormente pueden ser realizados en paralelo.
Si las funciones de procesamiento de algunas de las entidades (el codificador/descodificador) descritas en las realizaciones y ejemplos son implementados por un ordenador, el procesamiento en las funciones que las entidades de hardware deberían incluir está descrito en unos programas. El programa es ejecutado en el ordenador para implementar las funciones de procesamiento de la entidad de hardware en el ordenador.
Los programas que describen el procesamiento pueden estar grabados en un medio de grabación leíble por ordenador. Un ejemplo de medio de grabación leíble por ordenador es un medio de grabación no transitorio. El medio de grabación leíble por ordenador puede ser un medio de grabación tal como un dispositivo de grabación magnético, un disco óptico, un medio de grabación magneto-óptico, y una memoria de semiconductor. Específicamente, por ejemplo, un dispositivo de disco duro, un disco flexible, o una cinta magnética, pueden ser utilizados como dispositivo de grabación magnética, un DVD (Disco Versátil Digital), un DVD-RAM (Memoria de Acceso Aleatorio), un CD-ROM (Memoria de Solo Lectura de Disco Compacto), o un CD-R (grabable)/RW (Regrabable) pueden ser utilizados como disco óptico, MO (disco magneto-óptico) pueden ser utilizaditos como medio de grabación magneto-óptico, y un EEP-ROM (Memoria Borrable Electrónicamente y de Solo Lectura Programable) puede ser utilizado como una memoria de semiconductor.
El programa es distribuido vendiendo, transfiriendo o prestando un medio de grabación portátil en el que está grabado el programa, tal como un DVD o un CD-ROM. El programa puede ser almacenado en un dispositivo de almacenamiento de un servidor y ser trasferido desde el servidor a otros ordenadores en red, distribuyendo con ello el programa.
Un ordenador que ejecuta el programa primero almacena el programa grabado en un medio de grabación portátil o transfiere desde un servidor al dispositivo de almacenamiento del ordenador. Cuando el ordenador ejecuta los procesos, el ordenador lee el programa almacenando en el medio de grabación del ordenador y ejecuta los procesos de acuerdo con el programa leído. En otro modo de ejecución del programa, el ordenador puede leer el programa directamente desde un medio de grabación portátil y ejecutar los procesos de acuerdo con el programa o puede ejecutar los procesos de acuerdo con el programa cada vez que el programa es transferido desde el servidor al ordenador. Alternativamente, los procesos pueden ser ejecutados utilizando el denominado servicio ASP (Proveedor de Servicio de Aplicación) en el que el programa no es transferido desde un servidor al ordenador sino que las funciones del proceso son implementadas mediante instrucciones para ejecutar el programa y adquisición de los resultados de la ejecución. Nótese que el programa en este modo abarca información que es proporcionada por el procesamiento mediante un ordenador electrónico y es equivalente al programa (tal como los datos que no son comandos directos para ordenador sino que tienen naturaleza que define el procesamiento del ordenador).
Aunque las entidades de hardware están configuradas haciendo que el ordenador ejecute un programa predeterminado en la realización descrita anteriormente, al menos algunos de los procesos pueden ser implementados por hardware.

Claims (8)

REIVINDICACIONES
1. Un método de codificación que comprende:
obtener un periodo de tono en el dominio de tiempo L de una señal de audio en un periodo de tiempo dado y un código de periodo de tono en el dominio de tiempo correspondiente al periodo de tono en el dominio de tiempo L y generar el código de periodo de tono en el dominio de tiempo;
una etapa de conversión de periodo consistente en obtener, como intervalo convertido T1, un intervalo de muestras en una cadena de muestras de dominio de frecuencia de N puntos basada en el periodo de tono en el dominio de tiempo L y el número N de puntos de muestras en un dominio de frecuencia, estando la cadena de muestras de dominio de frecuencia de N puntos derivada de la señal de audio, correspondiendo el intervalo de muestras al periodo de tono en el dominio de tiempo L de la señal de audio;
una etapa de análisis de periodo de tono en el dominio de frecuencia consistente en elegir un periodo de tono en el dominio de frecuencia T a partir de unos candidatos que incluyen el intervalo convertido T1 y múltiplos enteros U X T1 del intervalo convertido T1, en donde U es un número entero en un primer rango predeterminado, siendo el periodo de tono en el dominio de frecuencia T un periodo de tono de la cadena de muestras de dominio de frecuencia de N puntos, y obtener y generar un primer código de periodo de tono en el dominio de frecuencia que indica cuántas veces el periodo de tono en el dominio de frecuencia T es mayor que el intervalo convertido T1; y
una etapa de codificación basada en periodo de tono en el dominio de frecuencia consistente en codificar una cadena de muestras de dominio de frecuencia de N puntos mediante un método de codificación basado en el periodo de tono en el dominio de frecuencia T para obtener y generar una cadena de códigos, En donde el método de codificación basado en el periodo de tono de dominio de frecuencia T es un método de codificación en el que las primeras muestras incluidas en un primer grupo de muestras de todas o alguna de una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente al periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia de N puntos y una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente a un múltiplo entero del periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia de N puntos son codificadas utilizando codificación de longitud variable de acuerdo con un primer criterio correspondiente a magnitudes de amplitudes o magnitudes estimadas de amplitudes de las primeras muestras incluidas en el primer grupo de muestras y las segundas muestras incluidas en un segundo grupo de muestras de muestras en la cadena de muestras que no están incluidas en el primer grupo de muestras son codificadas utilizando codificación de longitud variable de acuerdo con un segundo criterio correspondiente a las magnitudes de amplitudes o magnitudes estimadas de amplitudes de las segundas muestras incluidas en el segundo grupo de muestras.
2. El método de codificación de acuerdo con la reivindicación 1, en el que
el método de codificación basado en el periodo de tono de dominio de frecuencia T es el método de codificación en el que las primeras muestras incluidas en el primer grupo de muestras son codificadas mediante codificación Rice en una base de muestra a muestra utilizando un primer parámetro Rice correspondiente a magnitudes de amplitudes o magnitudes estimadas de amplitudes de las primeras muestras incluidas en el primer grupo de muestras y las segundas muestras incluidas en el segundo grupo de muestras son codificadas mediante codificación Rice en una base de muestra a muestra utilizando un segundo parámetro Rice correspondiente a magnitudes de amplitudes o magnitudes estimadas de amplitudes de las segundas muestras incluidas en el segundo grupo de muestras.
3. El método de codificación de acuerdo con al reivindicación 1, en el que
el método de codificación basado en el periodo de tono de dominio de frecuencia T es el método de codificación en el que las primeras muestras incluidas en el primer grupo de muestras son codificadas mediante codificación Rice en una base de muestra a muestra utilizando un primer parámetro Rice que se obtiene a partir de un promedio de magnitudes de amplitudes de las primeras muestras incluidas en el primer grupo de muestras y las segundas muestras incluidas en el segundo grupo de muestras son codificadas mediante codificación Rice en una base de muestra a muestra utilizando un segundo parámetro Rice que se obtiene a partir de un promedio de magnitudes de amplitudes de las segundas muestras incluidas en el segundo grupo de muestras.
4. Un codificador (61) que comprende:
medios adaptados para obtener un periodo de tono de dominio de tiempo L de una señal de audio en un periodo de tiempo dado y un código de periodo de tono de dominio de tiempo correspondiente al periodo de tono de dominio de tiempo L y producir el código de periodo de tono de dominio de tiempo;
un convertidor de periodo (114, 414) adaptado para obtener, como un intervalo convertido T1, un intervalo de muestra en una cadena de muestras de dominio de frecuencia de N puntos basada en el periodo de tono de dominio de tiempo L y el número N de puntos de muestra en un dominio de frecuencia, siendo la cadena de muestras de dominio de frecuencia de N puntos derivada de la señal de audio, correspondiendo el intervalo de muestras al periodo de tono de dominio de tiempo L de la señal de audio;
un analizador de periodo de tono de dominio de frecuencia (115, 115', 215, 315, 415) adaptado para elegir un periodo de tono de dominio de frecuencia T a partir de candidatos que incluyen el intervalo convertido T1 y múltiplos enteros U x Ti del intervalo convertido T i, en donde U es un número entero en un primer rango predeterminado, siendo el periodo de tono de dominio de frecuencia L un periodo de tono de la cadena de muestras de dominio de frecuencia de N puntos, y obtener y producir un primer código de periodo de tono de dominio de frecuencia que indica cuántas veces el periodo de tono de dominio de frecuencia T es mayor que el intervalo convertido T1; y
un codificador (616) basado en periodo de tono de dominio de frecuencia, adaptado para codificar la cadena de muestras de dominio de frecuencia de N puntos mediante un método de codificación basado en el periodo de tono de dominio de frecuencia T para obtener y producir una cadena de códigos,
en donde el método de codificación basado en el periodo de tono de dominio de frecuencia T es un método de codificación en el que las primeras muestras incluidas en un primer grupo de muestras de todas o algunas de una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente al periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia de N puntos y una o una pluralidad de sucesivas muestras que incluyen una muestra correspondiente a un múltiplo entero del periodo de tono de dominio de frecuencia T en la cadena de muestras de dominio de frecuencia de N puntos son codificadas utilizando codificación de longitud variable de acuerdo con un primer criterio correspondiente a las magnitudes de amplitudes o a las magnitudes estimadas de amplitudes de las primeras muestras incluidas en el primer grupo de muestras y las segundas muestras incluidas en un segundo grupo de muestras de muestras en la cadena de muestras que no están incluidas en del primer grupo de muestras son codificadas utilizando codificación de longitud variable de acuerdo con un segundo criterio correspondiente a magnitudes de amplitudes o magnitudes estimadas de amplitudes de las segundas muestras incluidas en el segundo grupo de muestras.
5. El codificador (61) de acuerdo con la reivindicación 4, en el que
el método de codificación basado en el periodo de tono de dominio de frecuencia T es el método de codificación en el que las primeras muestras incluidas en el primer grupo de muestras son codificadas mediante codificación Rice en una base de muestra a muestra utilizando un primer parámetro Rice correspondiente a magnitudes de amplitudes o magnitudes estimadas de amplitudes de las primeras muestras incluidas en el primer grupo de muestras y las segundas muestras incluidas en el segundo grupo de muestras son codificadas mediante codificación Rice en una base de muestra a muestra utilizando un segundo parámetro Rice correspondiente a las magnitudes de amplitudes o magnitudes estimadas de amplitudes de las segundas muestras incluidas en el segundo grupo de muestras.
6. El codificador (61) de acuerdo con la reivindicación 4, en el que
el método de codificación basado en el periodo de tono de dominio de frecuencia T es el método de codificación en el que las primeras muestras incluidas en el primer grupo de muestras son codificadas mediante codificación Rice en una base de muestra a muestra utilizando un primer parámetro Rice que se obtiene a partir de un promedio de magnitudes de amplitudes de las primeras muestras incluidas en el primer grupo de muestras y las segundas muestras incluidas en el segundo grupo de muestras son codificadas mediante codificación Rice en una base de muestra a muestra utilizando un segundo parámetro Rice que se obtiene a partir de un promedio de magnitudes de amplitudes de las segundas muestras incluidas en el segundo grupo de muestras.
7. Un programa adaptado para hacer que un ordenador ejecute las etapas del método de codificación de acuerdo con una cualquiera de las reivindicaciones 1 a 3.
8. Un medio donde grabación leíble por ordenador que almacena el programa de acuerdo con la reivindicación 7.
ES19185171T 2012-05-23 2013-05-22 Codificación de una señal de audio Active ES2834391T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012117172 2012-05-23
JP2012171155 2012-08-01

Publications (1)

Publication Number Publication Date
ES2834391T3 true ES2834391T3 (es) 2021-06-17

Family

ID=49623862

Family Applications (3)

Application Number Title Priority Date Filing Date
ES18173806T Active ES2762160T3 (es) 2012-05-23 2013-05-22 Métodos de descodificación de audio, descodificadores de audio, y programa y soporte de registro correspondientes
ES13793620.9T Active ES2689072T3 (es) 2012-05-23 2013-05-22 Codificación de una señal de audio
ES19185171T Active ES2834391T3 (es) 2012-05-23 2013-05-22 Codificación de una señal de audio

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES18173806T Active ES2762160T3 (es) 2012-05-23 2013-05-22 Métodos de descodificación de audio, descodificadores de audio, y programa y soporte de registro correspondientes
ES13793620.9T Active ES2689072T3 (es) 2012-05-23 2013-05-22 Codificación de una señal de audio

Country Status (8)

Country Link
US (3) US9947331B2 (es)
EP (3) EP2830057B1 (es)
JP (1) JP6053196B2 (es)
KR (4) KR101762204B1 (es)
CN (3) CN109147827B (es)
ES (3) ES2762160T3 (es)
PL (2) PL3385950T3 (es)
WO (1) WO2013176177A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101762204B1 (ko) * 2012-05-23 2017-07-27 니폰 덴신 덴와 가부시끼가이샤 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
WO2016121826A1 (ja) * 2015-01-30 2016-08-04 日本電信電話株式会社 符号化装置、復号装置、これらの方法、プログラム及び記録媒体
CN107430869B (zh) * 2015-01-30 2020-06-12 日本电信电话株式会社 参数决定装置、方法及记录介质
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
JP6517924B2 (ja) * 2015-04-13 2019-05-22 日本電信電話株式会社 線形予測符号化装置、方法、プログラム及び記録媒体
CN106373594B (zh) * 2016-08-31 2019-11-26 华为技术有限公司 一种音调检测方法及装置
CN110291583B (zh) * 2016-09-09 2023-06-16 Dts公司 用于音频编解码器中的长期预测的系统和方法
JP6712643B2 (ja) * 2016-09-15 2020-06-24 日本電信電話株式会社 サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム
WO2019142513A1 (ja) * 2018-01-17 2019-07-25 日本電信電話株式会社 符号化装置、復号装置、摩擦音判定装置、これらの方法及びプログラム
CN110728990B (zh) * 2019-09-24 2022-04-05 维沃移动通信有限公司 基音检测方法、装置、终端设备和介质
US11769071B2 (en) * 2020-11-30 2023-09-26 IonQ, Inc. System and method for error correction in quantum computing

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4797926A (en) 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US5003604A (en) * 1988-03-14 1991-03-26 Fujitsu Limited Voice coding apparatus
US5127053A (en) * 1990-12-24 1992-06-30 General Electric Company Low-complexity method for improving the performance of autocorrelation-based pitch detectors
JP3362471B2 (ja) * 1993-07-27 2003-01-07 ソニー株式会社 音声信号の符号化方法及び復号化方法
WO1996006489A1 (fr) * 1994-08-22 1996-02-29 Sony Corporation Emetteur-recepteur
TW321810B (es) * 1995-10-26 1997-12-01 Sony Co Ltd
WO1999059139A2 (en) * 1998-05-11 1999-11-18 Koninklijke Philips Electronics N.V. Speech coding based on determining a noise contribution from a phase change
GB9811019D0 (en) * 1998-05-21 1998-07-22 Univ Surrey Speech coders
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
JP4550176B2 (ja) * 1998-10-08 2010-09-22 株式会社東芝 音声符号化方法
JP2000267700A (ja) * 1999-03-17 2000-09-29 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
JP4005359B2 (ja) * 1999-09-14 2007-11-07 富士通株式会社 音声符号化及び音声復号化装置
JP3404350B2 (ja) * 2000-03-06 2003-05-06 パナソニック モバイルコミュニケーションズ株式会社 音声符号化パラメータ取得方法、音声復号方法及び装置
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
JP3731575B2 (ja) * 2002-10-21 2006-01-05 ソニー株式会社 符号化装置及び復号装置
WO2004097796A1 (ja) * 2003-04-30 2004-11-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置及びこれらの方法
JP5036317B2 (ja) 2004-10-28 2012-09-26 パナソニック株式会社 スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
EP1837997B1 (en) * 2005-01-12 2011-03-16 Nippon Telegraph And Telephone Corporation Long-term prediction encoding method, long-term prediction decoding method, devices thereof, program thereof, and recording medium
UA92341C2 (ru) * 2005-04-01 2010-10-25 Квелкомм Инкорпорейтед Системы, способы и устройство широкополосного речевого кодирования
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
JP4964114B2 (ja) 2007-12-25 2012-06-27 日本電信電話株式会社 符号化装置、復号化装置、符号化方法、復号化方法、符号化プログラム、復号化プログラム、および記録媒体
US8909521B2 (en) * 2009-06-03 2014-12-09 Nippon Telegraph And Telephone Corporation Coding method, coding apparatus, coding program, and recording medium therefor
JP5612698B2 (ja) 2010-10-05 2014-10-22 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
KR101762204B1 (ko) * 2012-05-23 2017-07-27 니폰 덴신 덴와 가부시끼가이샤 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
US9589570B2 (en) * 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates

Also Published As

Publication number Publication date
KR20140143438A (ko) 2014-12-16
EP3385950B1 (en) 2019-09-25
US9947331B2 (en) 2018-04-17
ES2762160T3 (es) 2020-05-22
KR20170073732A (ko) 2017-06-28
JPWO2013176177A1 (ja) 2016-01-14
US20150046172A1 (en) 2015-02-12
KR101762204B1 (ko) 2017-07-27
CN108962270B (zh) 2023-03-17
CN109147827A (zh) 2019-01-04
US10083703B2 (en) 2018-09-25
CN104321814B (zh) 2018-10-09
KR20160087394A (ko) 2016-07-21
EP2830057B1 (en) 2018-07-11
KR101663607B1 (ko) 2016-10-07
EP2830057A4 (en) 2016-01-13
ES2689072T3 (es) 2018-11-08
EP3576089A1 (en) 2019-12-04
JP6053196B2 (ja) 2016-12-27
WO2013176177A1 (ja) 2013-11-28
US20180182405A1 (en) 2018-06-28
PL3385950T3 (pl) 2020-02-28
EP2830057A1 (en) 2015-01-28
US10096327B2 (en) 2018-10-09
CN104321814A (zh) 2015-01-28
KR101750071B1 (ko) 2017-06-23
CN108962270A (zh) 2018-12-07
EP3576089B1 (en) 2020-10-14
EP3385950A1 (en) 2018-10-10
US20180182406A1 (en) 2018-06-28
KR20160100411A (ko) 2016-08-23
CN109147827B (zh) 2023-02-17
PL2830057T3 (pl) 2019-01-31

Similar Documents

Publication Publication Date Title
ES2834391T3 (es) Codificación de una señal de audio
US11074919B2 (en) Encoding method, decoding method, encoder, decoder, program, and recording medium
ES2558508T3 (es) Método de codificación, codificador, método de determinación de la cantidad de una característica periódica, aparato de determinación de la cantidad de una característica periódica, programa y medio de grabación
JPWO2012046685A1 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
JP5694751B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体