ES2244452T3 - Metodo para mejorar la eficacia de codificacion de una señal de audio. - Google Patents
Metodo para mejorar la eficacia de codificacion de una señal de audio.Info
- Publication number
- ES2244452T3 ES2244452T3 ES00944090T ES00944090T ES2244452T3 ES 2244452 T3 ES2244452 T3 ES 2244452T3 ES 00944090 T ES00944090 T ES 00944090T ES 00944090 T ES00944090 T ES 00944090T ES 2244452 T3 ES2244452 T3 ES 2244452T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- audio signal
- coding
- encoded
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 114
- 238000000034 method Methods 0.000 title claims abstract description 77
- 230000005540 biological transmission Effects 0.000 claims description 40
- 230000009466 transformation Effects 0.000 claims description 27
- 238000001228 spectrum Methods 0.000 claims description 26
- 230000001131 transforming effect Effects 0.000 claims 2
- 238000004364 calculation method Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 12
- 238000012546 transfer Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000011002 quantification Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 9
- 239000000523 sample Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 238000010295 mobile communication Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000012723 sample buffer Substances 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Método para codificar una señal de audio que comprende las siguientes etapas: - examinar una porción de la señal de audio a codificar para encontrar otra porción de la señal de audio que sea la que mejor se corresponda con la porción de la señal de audio a codificar y que se selecciona como secuencia de referencia de muestras; - generar una serie de señales predichas de dicha secuencia de referencia de muestras utilizando una serie de órdenes del elemento de predicción de amplitud tonal; - determinar una eficacia de codificación de, al menos, una de dichas señales predichas; y - utilizar la eficacia de codificación determinada para seleccionar un método de codificación de la porción de la señal de audio a codificar.
Description
Método para mejorar la eficacia de codificación
de una señal de audio.
En general, los sistemas de codificación de audio
producen señales codificadas a partir de una señal de audio
analógica, tal como una señal de voz. Normalmente, las señales
codificadas se transmiten a un receptor mediante métodos de
transmisión de datos específicos del sistema de transmisión de
datos. En el receptor se genera una señal de audio a partir de las
señales codificadas. La cantidad de información que debe
transmitirse se ve afectada, por ejemplo, por el ancho de banda
utilizado en el sistema para la información codificada, así como por
la eficacia con la que puede ejecutarse la codificación.
A efectos de codificación, se generan muestras
digitales a partir de la señal analógica, por ejemplo a intervalos
regulares de 0,125 ms. Las muestras se procesan normalmente en
grupos de un tamaño fijo, por ejemplo en grupos con una duración de
aproximadamente 20 ms. Estos grupos de muestras se denominan también
"tramas". Por lo general, una trama es la unidad básica en la
cual se procesan los datos de audio.
La finalidad de los sistemas de codificación de
audio consiste en obtener una calidad de sonido que sea la mejor
posible dentro del margen del ancho de banda disponible. A estos
efectos, puede utilizarse la periodicidad presente en una señal de
audio, y especialmente en una señal de voz. La periodicidad de la
voz está causada, por ejemplo, por la vibración de las cuerdas
vocales. Normalmente, el período de vibración se sitúa dentro de la
gama de 2 ms a 20 ms. En numerosos codificadores de voz de acuerdo
con la técnica anterior, se utiliza una técnica conocida como
predicción a largo plazo (LTP) cuya finalidad consiste en evaluar y
utilizar dicha periodicidad para mejorar la eficacia del proceso de
codificación. De este modo, durante la codificación, la parte
(trama) de la señal a codificar se compara con porciones de la señal
previamente codificadas. Si se encuentra una señal similar en la
parte codificada anteriormente, la demora (retardo) entre la señal
similar y la señal a codificar se somete a examen. Se genera una
señal predicha que representa la señal a codificar y que se basa en
la señal similar. Además, se genera una señal de error que
representa la diferencia entre la señal predicha y la señal a
codificar. De este modo, la codificación se lleva a cabo
ventajosamente de tal forma que sólo se transmiten la información de
retardo y la señal de error. En el receptor se recuperan las
muestras correctas de la memoria, se utilizan para predecir la parte
de la señal a codificar y se combinan con la señal de error a partir
del retardo. Matemáticamente, puede considerarse que este elemento
de predicción de amplitud tonal realiza una operación de filtrado
que queda ilustrada mediante una función de transferencia como la
que se muestra a continuación:
P(z) =
\beta
z^{-\alpha}
La ecuación que antecede muestra la función de
transferencia de un elemento de predicción de amplitud tonal de
primer orden, siendo \beta el coeficiente del elemento de
predicción de amplitud tonal y \alpha es el retardo que representa
la periodicidad. En el caso de filtros elementos de predicción de
amplitud tonal de más alto nivel, es posible utilizar una función de
transferencia más general:
P(z)=
\sum\limits^{m_{1}}_{k=-m_{1}} \beta_{k}
z^{-(\alpha+k)}
La finalidad consiste en seleccionar coeficientes
\beta_{k} para cada trama de tal forma que el error de
codificación, es decir la diferencia entre la señal real y la señal
generada utilizando las muestras precedentes sea lo más pequeña
posible. Ventajosamente, estos coeficientes se seleccionan para ser
utilizados en la codificación con la cual se consiga el menor error,
utilizando el método de los mínimos cuadrados. Ventajosamente, los
coeficientes se actualizan trama por trama.
La patente US 5.528.629 describe un sistema de
codificación de voz perteneciente a la técnica anterior que utiliza
la predicción a corto plazo (STP) así como una predicción a largo
plazo de primer orden.
Los codificadores de la técnica anterior
presentan como desventaja que no se presta atención a la relación
entre la frecuencia de la señal de audio y su periodicidad. De este
modo, la periodicidad de la señal no se puede utilizar eficazmente
en todas las situaciones y la cantidad de información codificada se
hace innecesariamente larga, o la calidad del sonido de la señal de
audio reconstruida en el receptor se deteriora.
En algunas situaciones, por ejemplo cuando una
señal de audio tiene un carácter altamente periódico y experimenta
pocas variaciones a lo largo del tiempo, la información de retardo
por sí sola facilita una buena base para predecir la señal. En esta
situación no es necesario utilizar un elemento de predicción de
amplitud tonal de orden superior. En otras situaciones, lo contrario
es cierto. El retardo no es necesariamente un múltiplo entero del
intervalo de muestreo. Por ejemplo, puede encontrarse entre dos
muestras sucesivas de la señal de audio. En esta situación, los
elementos de predicción de amplitud tonal de orden superior pueden
efectuar interpolaciones entre los tiempos de muestreo discretos a
fin de facilitar una representación más precisa de la señal. Además,
la respuesta en frecuencia de los elementos de predicción de
amplitud tonal de orden superior tiende a disminuir en función de la
frecuencia. Esto significa que los elementos de predicción de
amplitud tonal de orden superior proporcionan un mejor modelado de
los componentes de frecuencias inferiores de la señal de audio. En
la codificación de voz esto resulta ventajoso, ya que los
componentes de baja frecuencia influyen más significativamente sobre
la calidad percibida de la señal de voz que los componentes de
frecuencias más elevadas. Por lo tanto, cabe señalar que la
capacidad de variación del orden del elemento de predicción de
amplitud tonal utilizado para predecir una señal de audio de acuerdo
con la evolución de la señal resulta muy deseable. Un codificador
que utilice un elemento de predicción de amplitud tonal de orden
fijo puede resultar excesivamente complejo en ciertas situaciones,
siendo incapaz de modelar suficientemente la señal de audio
en
otras.
otras.
Una finalidad de la presente invención según se
define en las reivindicaciones independientes adjuntas consiste en
implementar un método para mejorar la precisión de codificación y la
eficiencia de transmisión de las señales de audio en un sistema de
transmisión de datos en el cual los datos de audio se generan con
una mayor precisión y se transfieren con una mayor eficacia que con
los métodos utilizados por la técnica anterior. Un codificador de
acuerdo con la invención, su finalidad consiste en predecir la señal
de audio a codificar trama por trama con la mayor precisión posible,
al mismo tiempo que garantiza que la cantidad de información a
transmitir sigue siendo reducida.
La presente invención presenta considerables
ventajas cuando se la compara con las soluciones de acuerdo con la
técnica anterior. El método de acuerdo con la invención permite que
una señal de audio se codifique con mayor precisión que en el caso
de los métodos de la técnica anterior, al mismo tiempo que garantiza
que la cantidad de información que a transmitir sigue siendo baja.
La invención también permite que la codificación de una señal de
audio se lleve a cabo de una forma más flexible que con los métodos
de acuerdo con la técnica anterior. La invención puede llevarse a
cabo de tal forma que de preferencia a la precisión con la cual se
predice la señal de audio (maximización cualitativa), que de
preferencia a la reducción de la cantidad de información necesaria
para representar la señal de audio codificada (minimización
cuantitativa), o que se llegue a un compromiso entre las dos.
Utilizando el método de acuerdo con la invención, también es posible
tener en cuenta más adecuadamente las periodicidades de las
diferentes frecuencias que existen en la señal de audio.
En los siguientes párrafos se describirá la
invención en mayor detalle, haciendo referencia a los dibujos
adjuntos en los cuales:
La figura 1 muestra un codificador de acuerdo con
una realización preferida de la invención.
La figura 2 muestra un codificador de acuerdo con
una realización preferida de la invención.
La figura 3 es un diagrama de bloques reducido
que presenta un sistema de transmisión de datos de acuerdo con una
realización preferida de la invención.
La figura 4 es un diagrama de flujo que muestra
un método de acuerdo con una realización preferida de la
invención.
Las figuras 5a y 5b son ejemplos de tramas de
transmisión de datos generadas por el decodificador de acuerdo con
una realización preferida de la invención.
La figura 1 es un diagrama de bloques reducido
que muestra un codificador 1 de acuerdo con una realización
preferida de la invención. La figura 4 es un diagrama de flujo 400
que muestra el método de acuerdo con la invención. El codificador 1
es, por ejemplo, un codificador de voz de un dispositivo inalámbrico
de comunicaciones 2 (figura 3) para la conversión de una señal de
audio en una señal codificada a transmitir en un sistema de
transmisión de datos, tal como una red de comunicaciones móviles o
Internet. De este modo, un decodificador 33 se encuentra
ventajosamente situado en una estación base de la red de
comunicaciones móviles. De igual modo, una señal de audio analógica,
por ejemplo una señal generada por un micrófono 29 y amplificada en
un bloque de audio 30, si fuera necesario, se convierte mediante un
conversor analógico / digital 4 en una señal digital. La precisión
de la conversión es, por ejemplo, de 8 o 12 bits, y el intervalo
(resolución de tiempo) entre las muestras sucesivas es de, por
ejemplo, 0,125 ms. Es evidente que los valores numéricos presentados
en esta descripción son tan sólo ejemplos que aclaran la invención y
no la limitan.
Las muestras obtenidas a partir de la señal de
audio se almacenan en una memoria intermedia de muestras (no
representada) que puede llevarse a cabo de una forma conocida como,
por ejemplo, en la memoria 5 del dispositivo inalámbrico de
comunicaciones 2. Ventajosamente, la codificación de la señal de
audio se lleva a cabo trama a trama de forma que se transmite un
número predeterminado de muestras al codificador 1 para su
codificación, por ejemplo las muestras generadas a lo largo de un
período de 20 ms (= 160 muestras suponiendo un intervalo de tiempo
de 0,125 ms entre las muestras sucesivas). Las muestras de una trama
a codificar se transmiten ventajosamente a un bloque de
transformación 6 en el que la señal de audio se transforma del
dominio del tiempo a un ámbito de transformación (dominio de la
frecuencia) por ejemplo mediante una transformada de coseno discreto
modificada (MDCT). La salida del bloque de transformación 6
proporciona un grupo de valores que representan las propiedades de
la señal transformada al dominio de la frecuencia. Esta
transformación se representa mediante el bloque 404 en el diagrama
de flujo de la figura 4.
Una realización alternativa para la
transformación de una señal del dominio de tiempo al dominio de la
frecuencia consiste en un banco de filtros compuesto por diversos
filtros paso-banda. La banda de paso de cada filtro
es relativamente estrecha, con lo que las magnitudes de las señales
en las salidas de los filtros representan el espectro de frecuencia
de la señal a transformar.
Un bloque de retardo 7 determina cuál de las
secuencias de muestras precedentes se corresponde mejor con la trama
a codificar en un momento dado (bloque 402). Esta etapa de
determinación del retardo se lleva a cabo ventajosamente de tal
forma que el bloque de retardo 7 compara los valores almacenados en
una memoria intermedia de referencia 8 con las muestras de la trama
a codificar y calcula el error entre las muestras de la trama a
codificar y una secuencia correspondiente de muestras almacenada en
la memoria intermedia de referencia, utilizando por ejemplo un
método de mínimos cuadrados. Preferiblemente, la secuencia de
muestras formada por muestras sucesivas y que tiene el menor error
se selecciona como secuencia de referencia de muestras.
Cuando la secuencia de referencia de muestras se
selecciona a partir de las muestras almacenadas por el bloque de
retardo 7 (bloque 403), el bloque de retardo 7 transfiere la
información relativa a esta a un bloque de cálculo de coeficientes 9
a fin de llevar a cabo la evaluación del coeficiente del elemento de
predicción de amplitud tonal. Por tanto en el bloque de cálculo de
coeficientes 9, se calculan los coeficientes del elemento de
predicción de amplitud tonal b(k) para diferentes órdenes del
elemento de predicción de amplitud tonal, tal como 1, 3, 5 y 7
basándose en las muestras que contiene la secuencia de referencia de
muestras. Los coeficientes calculados b(k) se transfieren a
continuación al bloque elemento de predicción de amplitud tonal 10.
En el diagrama de flujo de la figura 4, estas etapas se muestran en
los bloques 405 a 411. Es evidente que los órdenes presentados aquí
funcionan únicamente como ejemplos que aclaran la invención sin
limitarla. La invención también puede aplicarse con otros órdenes, y
el número de órdenes disponible también puede ser diferente del
total de cuatro órdenes presentados en este documento.
Después de haber calculado los coeficientes del
elemento de predicción de amplitud tonal, estos se cuantifican, con
lo que se obtienen coeficientes del elemento de predicción de
amplitud tonal cuantificados. Los coeficientes del elemento de
predicción de amplitud tonal se cuantifican preferiblemente de forma
que la señal reconstruida generada en el decodificador 33 del
receptor se corresponda con la original de la forma más estrecha
posible en condiciones de transmisión de datos sin error. Al
cuantificar los coeficientes del elemento de predicción de amplitud
tonal, resulta ventajoso utilizar la resolución más elevada posible
(etapas de cuantificación lo menores posible) a fin de reducir al
mínimo los errores provocados por el redondeo.
Las muestras almacenadas en la secuencia de
referencia de muestras se transfieren al bloque del elemento de
predicción de amplitud tonal 10 en el que se genera una señal
predicha, para cada orden del elemento de predicción de amplitud
tonal a partir de las muestras de la secuencia de referencia,
utilizando los coeficientes de elemento de predicción de amplitud
tonal calculados y cuantificados b(k). Cada señal predicha
representa la predicción de la señal a codificar, evaluada
utilizando el orden del elemento de predicción de amplitud tonal en
cuestión. En esta realización preferida de la invención, la señales
predichas se transfieren adicionalmente a un segundo bloque de
transformación 11, en el que se transforman al dominio de la
frecuencia. El bloque de transformación 11 lleva a cabo la
transformación utilizando dos o más órdenes diferentes, en los que
se generan unas series de valores transformados que se corresponden
con las señales predichas por los diferentes órdenes del elemento de
predicción de amplitud tonal. El bloque del elemento de predicción
de amplitud tonal 10 y el segundo bloque de transformación 11 pueden
realizarse de tal forma que lleven a cabo las operaciones necesarias
para cada orden del elemento de predicción de amplitud tonal o,
alternativamente, pueden llevarse a cabo para cada orden en un
bloque independiente del elemento de predicción de amplitud tonal 10
y un segundo bloque de transformación independiente 11.
En el bloque de cálculo 12, los valores de la
señal predicha transformados al dominio de la frecuencia se comparan
con la representación transformada al dominio de la frecuencia de la
señal de audio a codificar obtenida a partir del bloque de
transformación 6. Se calcula una señal de error de predicción
tomando la diferencia entre el espectro de frecuencias de la señal
de audio a codificar y el espectro de frecuencias de la señal
predicha utilizando el elemento de predicción de secuencias.
Ventajosamente, la señal de error de predicción comprende una serie
de valores de error de predicción correspondientes a la diferencia
entre los componentes de frecuencia de la señal a codificar y los
componentes de frecuencia de la señal predicha. También se calcula
un error de codificación que representa, por ejemplo, el promedio de
la diferencia entre el espectro de frecuencia de la señal de audio y
la señal predicha. Preferiblemente, el error de codificación se
calcula utilizando el método de los mínimos cuadrados. Puede
utilizarse cualquier otro método apropiado, comprendiendo métodos
basados en el modelado psico-acústico de la señal de
audio para determinar la señal predicha que mejor represente la
señal de audio a codificar.
En el bloque 12 también se calcula una medida de
eficacia de codificación (ganancia de predicción) a fin de
determinar la información a transmitir al canal de transmisión
(bloque 413). La finalidad consiste en reducir al mínimo la cantidad
de información (bits) a transmitir (minimización cuantitativa), así
como las distorsiones de la señal (maximización cualitativa).
A fin de reconstruir la señal en el receptor en
función de las muestras anteriores almacenadas en el dispositivo de
recepción, es necesario transmitir al receptor, por ejemplo, los
coeficientes del elemento de predicción de amplitud tonal
cuantificados correspondientes al orden seleccionado, la información
relativa al orden, el retardo, y la información relativa al error de
predicción. Ventajosamente, la medida de la eficacia de codificación
indica si es posible transmitir la información necesaria para
decodificar la señal codificada en el bloque del elemento de
predicción de amplitud tonal 10 con un número de bits inferior al
necesario para transmitir la información relativa a la señal
original. Esta determinación puede llevarse a cabo, por ejemplo, de
forma que se defina un primer valor de referencia que representa la
cantidad de información a transmitir si se genera la información
necesaria para la decodificación utilizando un elemento de
predicción de amplitud tonal específico. Adicionalmente, se define
un segundo valor de referencia que representa la cantidad de
información a transmitir cuando la información necesaria para la
decodificación se genera a partir de la señal de audio original.
Ventajosamente, la medida de la eficacia de codificación es la
relación entre el segundo valor de referencia y el primer valor de
referencia. El número de bits necesario para representar la señal
predicha depende, por ejemplo, del orden del elemento de predicción
de amplitud tonal (es decir, el número de coeficientes que van a
transmitirse), de la precisión con la cual se va a representar
(cuantificar) cada coeficiente, así como de la cantidad y la
precisión de la información sobre error asociada a la señal
predicha. Por otra parte, el número de bits necesario para
transmitir información relativa a la señal de audio original
depende, por ejemplo, de la precisión de la representación de la
señal de audio al dominio de la frecuencia.
Si la eficacia de codificación determinada de
esta forma es superior a uno, ello indicará que la información
necesaria para decodificar la señal predicha podrá transmitirse con
un número de bits inferior a la información relativa a la señal
original. En el bloque de cálculo 12 se determina el número de bits
necesarios para la transmisión de estas diferentes alternativas,
seleccionándose la alternativa para la cual el número de bits a
transmitir resulta inferior (bloque 414).
De acuerdo con una primera realización de la
invención, el orden del elemento de predicción de amplitud tonal con
el cual se obtiene el menor error de codificación se selecciona para
codificar la señal de audio (bloque 412). Si la medida de la
eficacia de codificación del elemento de predicción de amplitud
tonal seleccionado es superior a 1, se seleccionará la información
relativa a la señal predicha para su transmisión. Si la medida de la
eficacia de codificación no es superior a 1, la información a
transmitir se generará en función de la señal de audio original. De
acuerdo con esta realización de la invención, se da más importancia
a la minimización del error de predicción (maximización
cualitativa).
De acuerdo con una segunda realización ventajosa
de la invención, se calcula una medida de la eficacia de
codificación para cada orden del elemento de predicción de amplitud
tonal. A continuación se utiliza el orden del elemento de predicción
de amplitud tonal que proporcione el menor error de codificación
seleccionado de entre aquellos órdenes para los cuales la medida de
la eficacia de codificación es superior a 1, a fin de codificar la
señal de audio. Si ninguno de los órdenes del elemento de predicción
de amplitud tonal proporciona una ganancia de predicción (es decir,
ninguna medida de la eficacia de codificación es superior a 1) la
información a transmitir se generará entonces ventajosamente a
partir de la señal de audio original. Esta realización de la
invención permite establecer un compromiso entre el error de
predicción y la eficacia de codificación.
De acuerdo con una tercera realización de la
invención, se calcula una medida de la eficacia de codificación para
cada orden del elemento de predicción de amplitud tonal y se
selecciona el orden del elemento de predicción de amplitud tonal que
proporcione la mayor eficacia de codificación seleccionado de entre
aquellos órdenes para los cuales la medida de la eficacia de
codificación es superior a 1, a fin de codificar la señal de audio.
Si ninguno de los órdenes del elemento de predicción de amplitud
tonal proporciona una ganancia de predicción (es decir, ninguna
medida de la eficacia de codificación es superior a 1) la
información a transmitir se generará entonces ventajosamente a
partir de la señal de audio original. De este modo, esta realización
de la invención da más importancia a la maximización de la eficacia
de codificación (minimización cuantitativa).
De acuerdo con una cuarta realización de la
invención, se calcula una medida de eficacia de codificación para
cada orden del elemento de predicción de amplitud tonal y se
selecciona el orden de tonos que proporcione la mayor eficacia de
codificación de codificar la señal de audio, aun cuando la eficacia
de codificación no sea superior a 1.
El cálculo del error de codificación y la
selección del orden del elemento de predicción de amplitud tonal se
llevan a cabo a intervalos regulares, preferiblemente de forma
independiente para cada trama, siendo posible en distintas tramas,
utilizar el orden del elemento de predicción de amplitud tonal que
mejor se corresponda con las propiedades de la señal de audio en un
momento dado.
Como se ha explicado anteriormente, si la
eficacia de codificación determinada en el bloque 12 no es superior
a 1, ello indicará que resulta ventajoso transmitir el espectro de
frecuencia de la señal original, en la que se genera ventajosamente
una cadena de bits 501 a transmitir al canal de transmisión de datos
de la forma siguiente (bloque 415). La información del bloque de
cálculo 12 relativa a la alternativa de transmisión seleccionada se
transfiere al bloque de selección 13 (líneas D1 y D4 de la figura
1). En el bloque de selección 13, los valores de la transformada al
dominio de la frecuencia que representan la señal de audio original
se seleccionan para su transmisión a un bloque de cuantificación 14.
La transmisión de los valores de la transformada al dominio de la
frecuencia de la señal de audio original al bloque de cuantificación
14 está ilustrada mediante la línea A1 del diagrama de bloques de la
figura 1. En el bloque de cuantificación 14, los valores de la señal
transformados al dominio de la frecuencia se cuantifican de una
forma conocida en sí. Los valores cuantificados se transfieren a un
bloque de multiplexado 15, en el cual se genera la cadena de bits a
transmitir. Las figuras 5a y 5b muestran un ejemplo de una
estructura de cadena de bits que puede aplicarse ventajosamente en
relación con la presente invención. La información relativa al
método de codificación seleccionado se transfiere desde el bloque de
cálculo 12 al bloque de multiplexado 15 (líneas D1 y D3) en el cual
se genera la cadena de bits de acuerdo con la alternativa de
transmisión. Un primer valor lógico, por ejemplo el estado lógico 0,
se utiliza como información sobre el método de codificación 502 para
indicar que los valores transformados al dominio de la frecuencia
que representan la señal de audio original se transmiten en la
cadena de bits en cuestión. Además de la información sobre el método
de codificación 502 se transmiten los propios valores en la cadena
de bits cuantificados de acuerdo con una precisión dada. El campo
utilizado para la transmisión de estos valores está marcado en la
figura 5a con el número de referencia 503. El número de valores
transmitidos en cada cadena de bits depende de la frecuencia de
muestreo y de la longitud de la trama examinada en un momento dado.
En esta situación, la información sobre el orden del elemento de
predicción de amplitud tonal, los coeficientes del elemento de
predicción de amplitud tonal, retardos y errores no se transmite
debido a que la señal se reconstruye en el receptor en función de
los valores del dominio de la frecuencia de la señal de audio
original transmitida en la cadena de bits 501.
Si la eficacia de codificación es superior a uno,
resulta ventajoso codificar la señal de audio utilizando el elemento
de predicción de amplitud tonal seleccionado y la cadena de bits 501
(figura 5b) a transmitir al canal de transmisión de datos se genera
ventajosamente de la forma siguiente (bloque 416): La información
relativa a la alternativa de transmisión seleccionada se transmite
desde el bloque de cálculo 12 al bloque de selección 13. Esto se
ilustra mediante las líneas D1 y D4 en el diagrama de bloques de la
figura 1. En el bloque de selección 13, se seleccionan los
coeficientes del elemento de predicción de amplitud tonal
cuantificado para su transferencia al bloque de multiplexado 15.
Esto se ilustra mediante la línea B1 del diagrama de bloques de la
figura 1. Es evidente que los coeficientes del elemento de
predicción de amplitud tonal también pueden transferirse al bloque
de multiplexado 15 de un modo diferente que a través del bloque de
selección 13. La cadena de bits a transmitir se genera en el bloque
de multiplexado 15. La información relativa al método de
codificación seleccionado se transfiere desde el bloque de cálculo
12 al bloque de multiplexado 15 (líneas D1 y D3), en el cual se
genera la cadena de bits de acuerdo con la alternativa de
transmisión. Un segundo valor lógico, por ejemplo el estado lógico
1, se utiliza como información sobre el método de codificación 502
para indicar que dichos coeficientes del elemento de predicción de
amplitud tonal cuantificado se han transmitido en la cadena de bits
en cuestión. Los bits de un campo de orden 504 se configuran de
acuerdo con el orden del elemento de predicción de amplitud tonal
seleccionado. Si, por ejemplo, se dispone de cuatro órdenes
diferentes, dos bits (00,01,10,11) serán suficientes para indicar
qué orden se ha seleccionado en un momento dado. Además, la
información sobre el retardo se transmite en la cadena de bits en un
campo de retardo 505. En este ejemplo preferido, el retardo se
indica mediante 11 bits, pero es evidente que también pueden
aplicarse otras longitudes dentro del ámbito de la invención. Los
coeficientes del elemento de predicción de amplitud tonal
cuantificados se añaden a la cadena de bits en el campo de
coeficientes 506. Si el orden del elemento de predicción de amplitud
tonal seleccionado es uno, sólo se transmite un coeficiente, si el
orden es tres, se transmiten tres coeficientes, etc. El número de
bits utilizados en la transmisión de los coeficientes puede también
variar en diversas realizaciones. En una realización ventajosa, el
coeficiente de primer orden se representa mediante tres bits, los
coeficientes de tercer orden con un total de cinco bits, los
coeficientes de quinto orden con un total de nueve bits y los
coeficientes de séptimo orden con un total de diez bits. En general,
puede afirmarse que cuanto más elevado sea el orden seleccionado,
será mayor el número de bits necesarios para la transmisión de los
coeficientes del elemento de predicción de amplitud tonal
cuantificado.
Además de la información que antecede, cuando la
señal de audio se codifica en función del elemento de predicción de
amplitud tonal seleccionado, será necesario transmitir la
información sobre error de predicción en un campo de error 507. Esta
información de error de predicción se genera ventajosamente en el
bloque de cálculo 12 como una señal de diferencia que representa la
diferencia entre el espectro de frecuencia de la señal de audio a
codificar y el espectro de frecuencia de la señal que puede
decodificarse (es decir, reconstruirse) utilizando los coeficientes
del elemento de predicción de amplitud tonal cuantificado del
elemento de predicción de amplitud tonal seleccionado en conjunción
con la secuencia de referencia de muestras. De este modo, la señal
de error a cuantificar se transfiere, por ejemplo, a través del
primer bloque de selección 13 al bloque de cuantificación 14. La
señal de error cuantificada se transfiere desde el bloque de
cuantificación 14 al bloque de multiplexado 15 donde los valores de
error de predicción cuantificados se añaden al campo de error 507 de
la cadena de bits.
El codificador 1 de acuerdo con la invención
comprende también una función local de decodificación. La señal de
audio codificada se transfiere desde el bloque de cuantificación 14
al bloque de cuantificación inversa 17. Como se ha descrito
anteriormente, en la situación en la que la eficacia de codificación
no es superior a 1, la señal de audio se representa mediante sus
valores de espectro de frecuencia cuantificados. En este caso, los
valores del espectro de frecuencia cuantificados se transfieren al
bloque de cuantificación inversa 17 donde se cuantifican
inversamente en una forma conocida en sí a fin de restaurar el
espectro de frecuencias original de la señal de audio del modo más
preciso posible. Los valores cuantificados inversamente que
representan el espectro de frecuencias de la señal de audio original
constituyen una salida del bloque 17 al bloque de suma 18.
Si la eficacia de codificación es superior a 1,
la señal de audio se representa mediante información del elemento de
predicción de amplitud tonal, por ejemplo información del orden del
elemento de predicción de amplitud tonal, coeficientes del elemento
de predicción de amplitud tonal cuantificados, un valor de retardo e
información de error de predicción en forma de valores del dominio
de la frecuencia cuantificados. Como se ha descrito anteriormente,
la información de error de predicción representa la diferencia entre
el espectro de frecuencia de la señal de audio a codificar y el
espectro de frecuencias de la señal de audio a reconstruir en
función del elemento de predicción de amplitud tonal seleccionado y
de la secuencia de referencia de muestras. Por lo tanto, en este
caso, los valores del dominio de la frecuencia cuantificados que
comprenden la información de predicción de error se transfieren al
bloque de cuantificación inversa 17, donde se cuantifican
inversamente de tal forma que se restauren los valores del dominio
de la frecuencia del error de predicción de la forma más precisa
posible. De este modo la salida del bloque 17 comprende valores de
error de predicción cuantificados inversamente. Estos valores se
aplican como una entrada del bloque de suma 18, donde se suman con
los valores del dominio de la frecuencia de la señal predicha
utilizando el elemento de predicción de amplitud tonal seleccionado.
De esta forma se genera una representación reconstruida del dominio
de la frecuencia de la señal de audio original. Los valores del
dominio de la frecuencia de la señal predicha están disponibles a
partir del bloque de cálculo 12 donde se calculan en relación con la
determinación del error de predicción y se transfieren al bloque de
suma 18 como se indica mediante la línea C1 en la figura 1.
El funcionamiento del bloque de suma 18 se activa
y se desactiva de acuerdo con la información de control
proporcionada por el bloque de cálculo 12. La transferencia de
información de control que permite esta operación de activación y
desactivación se indica mediante la conexión entre el bloque de
cálculo 12 y el bloque de suma 18 (líneas D1 y D2 de la figura 1).
La operación de activación y desactivación es necesaria para tener
en cuenta los diferentes tipos de valores del dominio de la
frecuencia cuantificados inversamente proporcionados por el bloque
de cuantificación inversa 17. Como se ha descrito anteriormente, si
la eficacia de codificación no es superior a 1, la salida del bloque
17 comprende valores del dominio de la frecuencia cuantificados
inversamente que representan la señal de audio original. En este
caso, no es necesario llevar a cabo ninguna operación de suma y no
se precisa ninguna información relativa a los valores del dominio de
la frecuencia de ninguna señal de audio predicha construida en el
bloque de cálculo 12. En esta situación, la operación del bloque de
suma 18 se ve inhibida por la información de control facilitada a
partir del bloque de cálculo 12 y los valores del dominio de la
frecuencia cuantificados inversamente que representan la señal de
audio original pasan a través del bloque de suma 18. Por otra parte,
si la eficacia de codificación es superior a 1, la salida del bloque
17 comprende valores de error de predicción cuantificados
inversamente. En este caso, es necesario sumar los valores de error
de predicción cuantificados inversamente con el espectro de
frecuencias de la señal predicha a fin de generar una representación
del dominio de la frecuencia reconstruido de la señal de audio
original. A continuación, el funcionamiento del bloque de suma 18 se
activa mediante la información de control transferida desde el
bloque de cálculo 12 haciendo que los valores del error de
predicción cuantificados inversamente se sumen con el espectro de
frecuencias de la señal predicha. Ventajosamente, la información de
control necesaria es facilitada por la información sobre el método
de codificación generado en el bloque 12 en relación con la elección
de la codificación que va a aplicarse a la señal de audio.
En una realización alternativa, la cuantificación
puede llevarse a cabo antes de calcular los valores del error de
predicción y de la eficacia de codificación, llevándose a cabo los
cálculos del error de predicción y de la eficacia de codificación
utilizando valores del dominio de la frecuencia cuantificados que
representan la señal original y las señales predichas.
Ventajosamente, la cuantificación se lleva a cabo en bloques de
cuantificación situados entre los bloques 6 y 12 y los bloques 11 y
12 (no representados). En esta realización, no es necesario el
bloque de cuantificación 14 pero se requiere un bloque adicional de
cuantificación inversa en la vía indicada por la línea C1.
La salida del bloque de suma 18 consiste en datos
de dominio de la frecuencia muestreados que se corresponden con la
secuencia de muestras codificada (señal de audio). Estos datos de
dominio de la frecuencia muestreados se transforman adicionalmente
al dominio del tiempo en un transformador DCT modificado inverso 19
desde el cual la secuencia de muestras decodificada se transfiere a
la memoria intermedia 8 para su almacenamiento y utilización en
relación con la codificación de las tramas posteriores. La capacidad
de almacenamiento de la memoria intermedia de referencia 8 se
selecciona en función del número de muestras necesario para
conseguir los requisitos de eficacia de codificación de la
aplicación en cuestión. En la memoria intermedia de referencia 8 se
almacena preferiblemente una nueva secuencia de muestras
sobrescribiendo las muestras más antiguas de la memoria intermedia,
es decir la memoria intermedia es de las denominadas circulares.
La cadena de bits generada en el codificador 1 se
transfiere a un transmisor 16, en el cual se lleva a cabo la
modulación de una forma conocida en sí. La señal modulada se
transfiere a través del canal de transmisión de datos 3 al receptor,
por ejemplo como señales de radio-frecuencia.
Ventajosamente, la señal de audio codificada se transmite trama a
trama, sustancialmente inmediatamente después de finalizar la
codificación de una trama dada. Alternativamente, la señal de audio
puede codificarse, almacenarse en la memoria del terminal de
transmisión y transmitirse en un momento posterior.
En un dispositivo receptor 31, la señal recibida
desde el canal de transmisión de datos es demodulada en una forma
conocida en sí en un bloque receptor 20. La información contenida en
la trama de datos demodulada se determina en el decodificador 33. En
un bloque demultiplexor 21 del decodificador 33 se examina en primer
lugar, en función de la información sobre el método de codificación
502 de la cadena de bits, si la información recibida se generó a
partir de la señal de audio original. Si el decodificador determina
que la cadena de bits 501 generada en el codificador 1 no contiene
los valores de la transformada del dominio de la frecuencia de la
señal original, la decodificación se lleva a cabo ventajosamente de
la forma siguiente. El orden M que va a utilizarse en el bloque
elemento de predicción de amplitud tonal 24 se determina a partir
del campo de orden 504 y el retardo se determina a partir del campo
de retardo 505. Los coeficientes del elemento de predicción de
amplitud tonal cuantificados recibidos en el campo coeficientes 506
de la cadena de bits 501 así como la información relativa al orden y
al retardo se transfieren al bloque del elemento de predicción de
amplitud tonal 24 del decodificador. Esto se ilustra mediante la
línea B2 de la figura 2. Los valores cuantificados de la señal de
error de predicción recibidos en el campo 507 de la cadena de bits
se cuantifican inversamente en un bloque de cuantificación inversa
22 y se transfieren al bloque de suma 23 del decodificador. A partir
de la información de retardo, el bloque del elemento de predicción
de amplitud tonal 24 del decodificador recupera las muestras a
utilizar como secuencia de referencia a partir de una memoria
intermedia de muestra 28, y lleva a cabo una predicción de acuerdo
con el orden seleccionado M, en el cual el bloque elemento de
predicción de amplitud tonal 24 utiliza los coeficientes del
elemento de predicción de amplitud tonal recibidos. De este modo, se
genera una primera señal de dominio del tiempo reconstruida que se
transforma al dominio de la frecuencia en un bloque de
transformación 25. Esta señal de dominio de la frecuencia se
transfiere al bloque de suma 23 donde se genera una señal de dominio
de la frecuencia como una suma de esta señal y de la señal de error
de predicción cuantificado inversamente. De este modo, en
condiciones de transmisión de datos libre de errores, la señal del
dominio de la frecuencia reconstruida se corresponde sustancialmente
con la señal codificada original del dominio de la frecuencia. Esta
señal del dominio de la frecuencia se transforma al dominio del
tiempo mediante una transformación modificada inversa DCT en un
bloque de transformación inversa 26 en el que una señal de audio
digital se encuentra presente en la salida del bloque de
transformación inversa 26. Esta señal se convierte en una señal
analógica en el conversor digital / analógico 27, se amplifica si
fuese necesario y se transfiere a otras etapas posteriores de
procesamiento en una forma conocida en sí. En la figura 3, esto se
muestra mediante el bloque de audio
32.
32.
Si la cadena de bits 501 generada en el
codificador 1 comprende los valores de la señal original
transformada al dominio de la frecuencia, la decodificación se lleva
a cabo ventajosamente de la forma siguiente. Los valores de la
transformada del dominio de la frecuencia cuantificados se
cuantifican inversamente en el bloque de cuantificación inversa 22 y
se transfieren a través del bloque de suma 23 al bloque de
transformación inversa 26. En el bloque de transformación inversa
26, la señal del dominio de la frecuencia se transforma al dominio
del tiempo mediante una transformada modificada inversa DCT en la
que una señal de dominio del tiempo correspondiente a la señal de
audio original se genera en formato digital. Si fuese necesario,
esta señal se transforma en una señal analógica en el conversor
digital / analógico 27.
En la figura 2, la referencia A2 muestra la
transmisión de la información de control al bloque de suma 23. Esta
información de control se utiliza de una manera análoga a la
descrita en relación con la función local de decodificador del
codificador. Dicho de otro modo, si la información sobre el método
de codificación proporcionada en el campo 502 de una cadena de bits
recibida 501 indicase que las cadenas de bits contienen valores del
dominio de la frecuencia cuantificados obtenidos a partir de la
propia señal de audio, se ve inhibido el funcionamiento del bloque
de suma 23. Esto permite que los valores del dominio de la
frecuencia cuantificados de la señal del audio pasen a través del
bloque de suma 23 al bloque de transformación inversa 26. Por otra
parte, si la información sobre el método de codificación recuperada
a partir del campo 502 de una cadena de bits recibidos indicase que
la señal de audio se ha codificado utilizando un elemento de
predicción de amplitud tonal, se activará el funcionamiento del
bloque de suma 23, permitiendo que se sumen los datos de error de
predicción cuantificados inversamente con la representación del
dominio de la frecuencia de la señal predicha generada por el bloque
de transformación 25.
En el ejemplo de la figura 3, el dispositivo de
transmisión es un dispositivo inalámbrico de comunicaciones 2 y el
dispositivo de recepción es una estación base 31, en la que la señal
transmitida desde el dispositivo inalámbrico de comunicaciones 2 se
decodifica en el decodificador 33 de la estación base 31, a partir
de la cual la señal de audio analógica se transmite a otras etapas
de procesamiento de una forma conocida en sí.
Es evidente que en el presente ejemplo sólo se
han presentado las características más esenciales para la aplicación
de la invención, pero en aplicaciones prácticas el sistema de
transmisión de datos también comprende funciones distintas de las
aquí presentadas. También es posible utilizar otros métodos de
codificación en relación con la codificación de acuerdo con la
invención, como la predicción a corto plazo. Adicionalmente, cuando
se transmite la señal codificada de acuerdo con la invención, pueden
llevarse a cabo otras etapas de procesamiento, como la codificación
de
canal.
canal.
También es posible determinar la correspondencia
entre la señal predicha y la señal real al dominio del tiempo. De
este modo, en una realización alternativa de la invención, no es
necesario transformar las señales al dominio de la frecuencia en el
que los bloques de transformación 6, 11 no son necesariamente
precisos, como tampoco lo son el bloque de transformación inversa 19
del codificador ni el bloque de transformación 25 ni el bloque de
transformación inversa 26 del decodificador. La eficacia de
codificación y el error de predicción se determinan por tanto en
función de señales de dominio del tiempo.
Las etapas de codificación / decodificación de la
señal de audio, descritas anteriormente pueden aplicarse a
diferentes tipos de sistemas de transmisión de datos, como sistemas
de comunicaciones móviles, sistemas de TV vía satélite, sistemas de
vídeo a la carta, etc. Por ejemplo, un sistema de comunicaciones
móviles en el cual las señales de audio se transmiten en modo
full-duplex requiere un par de sistemas de
codificador / decodificador tanto en el dispositivo inalámbrico de
comunicaciones 2 como en la estación base 31 o similar. En el
diagrama de bloques de la figura 3, los bloques funcionales
correspondientes del dispositivo inalámbrico de comunicaciones 2 y
de la estación base 31, se encuentran marcados básicamente con los
mismos números de referencia. Aunque el codificador 1 y el
decodificador 33 se muestran como unidades independientes en la
figura 3, en aplicaciones prácticas pueden implementarse en una
unidad denominada codec (codificador-decodificador)
en la cual se implementan todas las funciones necesarias para llevar
a cabo la codificación y la decodificación. Si la señal de audio se
transmite en formato digital en el sistema de comunicaciones
móviles, las conversiones analógico / digital y digital / analógico,
respectivamente, no serán necesarias en la estación base. De este
modo, dichas transformaciones se llevan a cabo en el dispositivo
inalámbrico de comunicaciones y en el interfaz a través del cual la
red de comunicaciones móviles se conecta a otra red de
telecomunicaciones como una red telefónica pública. No obstante, si
esta red telefónica es una red telefónica digital, estas
transformaciones también podrán efectuarse, por ejemplo, en un
teléfono digital (no mostrado) conectado a dicha red telefónica.
Las etapas de codificación descritas
anteriormente no se llevan a cabo necesariamente durante la
transmisión, sino que la información codificada puede almacenarse
para su posterior transmisión. Además, la señal de audio aplicada al
codificador no tiene que ser necesariamente una señal de audio en
tiempo real, sino que la señal de audio a codificar puede ser
información almacenada previamente a partir de la señal de
audio.
En los siguientes párrafos se describirán desde
el punto de vista matemático las diferentes etapas de codificación
de acuerdo con una realización ventajosa de la invención. La función
de transferencia del bloque del elemento de predicción de amplitud
tonal se expresa de la forma siguiente:
(1)B(z)
= \sum\limits_{k =
-m_{1}}^{m_{2}}b(k)z^{-(\alpha+k)}
donde \alpha es el retardo,
b(k) son los coeficientes del elemento de predicción de
amplitud tonal, y m_{1} y m_{2} dependen del orden (M),
ventajosamente de la forma
siguiente:
m_{1} =
(M-1)/2
m_{2} =
M-m1-1
Ventajosamente, la secuencia de muestras que
mejor se correspondan (es decir, la secuencia de referencia) se
determina utilizando el método de los mínimos cuadrados. Esto puede
expresarse de la forma siguiente:
(2)E =
\sum\limits_{i=0}^{N-1}\left(x(i)-
\sum\limits_{j = -m_{1}}^{m_{2}}b(j) \tilde{x} (i + j -
\alpha)\right)^{2}
donde E = error, x() es la señal de
entrada en el dominio del tiempo, \tilde{x}() es la señal
reconstruida a partir de la secuencia de muestras anterior y N es el
número de muestras de la trama examinada. El retardo \alpha puede
calcularse fijando la variable m_{1} = 0 y m_{2} = 0 y
despejando b en la ecuación 2. Otra alternativa para resolver el
retardo \alpha consiste en utilizar el método de correlación
normalizado, usando la
fórmula:
(3)\alpha =
max_{lag} \left\{\frac{\sum\limits^{N-1}_{i=0}
(x(i)\tilde{x}(i -
lag))}{\sqrt{\sum\limits^{N-1}_{i=0} \tilde{x} (i -
lag)^{2}}} , lag = startlag,..., endlag
\right\}
Cuando ha sido encontrada la secuencia de
muestras que mejor se corresponden (referencia), el bloque de
retardo 7 contiene información acerca del retardo, es decir cuanto
tiempo antes apareció la secuencia de muestras correspondientes en
la señal de audio.
Los coeficientes del elemento de predicción de
amplitud tonal b(k) pueden calcularse para cada orden M a
partir de la ecuación (2) que puede re-expresarse
como sigue:
(4)E =
\sum\limits^{N-1}_{i=0} x(i)^{2} - 2 \cdot
\sum\limits^{N-1}_{i=0} x(i)
\sum\limits^{m_{2}}_{j=-m_{1}} b(j) \tilde{x} (i + j -
\alpha) + \sum\limits^{N-1}_{i=0}
\left(\sum\limits^{m_{2}}_{j=-m_{1}} b(j)\tilde{x} (i + j -
\alpha)\right)^{2}
El valor óptimo para los coeficientes b(k)
puede determinarse buscando un coeficiente b(k) para el cual
la variación en el error con respecto a b(k) sea lo más
reducida posible. Esto puede calcularse fijando a cero la derivada
parcial de la relación de error respecto a b (\deltaE/\deltab=0)
con lo cual se llega a la siguiente fórmula:
(5)-2 \cdot
\sum\limits^{N-1}_{i=0} x(i)
\sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j - \alpha) + 2 \cdot
\sum\limits^{N-1}_{i=0}
\left[\left(\sum\limits^{m_{2}}_{j=-m_{1}} b(j) \tilde{x}(i +
j - \alpha)\right) \cdot \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i
+ j - \alpha)\right] =
0
es
decir:
\sum\limits^{N-1}_{i=0}
\left[\sum\limits^{m_{2}}_{j=-m_{1}} b(j) \tilde{x} (i + j -
\alpha) \cdot \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j -
\alpha)\right] = \sum\limits^{N-1}_{i=0} x(i)
\ \sum\limits^{m_{2}}_{j=-m_{1}} \tilde{x} (i + j -
\alpha)
Esta ecuación se puede escribir en formato
matricial, en el que los coeficientes b(k) pueden
determinarse resolviendo la ecuación matricial:
\bar{b} =
\bar{A}^{-1} \cdot
\bar{r}
donde:
En el método de acuerdo con la invención, el
objeto es utilizar la periodicidad de la señal de audio de forma más
eficaz que en los sistemas de acuerdo con la técnica anterior. Esto
se consigue aumentando la adaptabilidad del codificador a los
cambios en la frecuencia de la señal de audio, calculando los
coeficientes del elemento de predicción de amplitud tonal para
diversos órdenes. El orden del elemento de predicción de amplitud
tonal utilizado para codificar la señal de audio puede seleccionarse
de forma que se reduzca al mínimo el error de predicción a fin de
aumentar al máximo la eficacia de codificación o conseguir un
compromiso entre el error de predicción y la eficacia de
codificación. La selección se lleva a cabo a ciertos intervalos,
preferiblemente de forma independiente para cada trama. Los
coeficientes de orden y de elemento de predicción de amplitud tonal
pueden, de este modo, cambiar trama por trama. En el método de
acuerdo con la invención es posible por lo tanto aumentar la
flexibilidad de la codificación en comparación con métodos de
codificación de la técnica anterior que utilizaban un orden fijo.
Además, en el método de acuerdo con la invención, si la cantidad de
información (número de bits) a transmitir para una trama dada no se
puede reducir mediante codificación, podrá transmitirse la señal
original transformada al dominio de la frecuencia en lugar de los
coeficientes del elemento de predicción de amplitud tonal y la señal
de error.
Los procedimientos de cálculo previamente
presentados utilizados en el método de acuerdo con la invención
pueden llevarse a cabo ventajosamente en forma de un programa, como
códigos de programa del controlador 34 en una unidad de
procesamiento de señales digitales o similar, y/o como una
realización de hardware. De acuerdo con la anterior descripción de
la invención, cualquier persona versada en la materia podrá llevar a
cabo el codificador 1 de acuerdo con la invención y, de este modo,
no será necesario comentar en mayor detalle en este contexto los
diferentes bloques funcionales del codificador 1.
A fin de transmitir dichos coeficientes del
elemento de predicción de amplitud tonal al receptor, es posible
utilizar las llamadas tablas de búsqueda. En este tipo de tablas de
búsqueda se almacenan distintos valores de coeficientes y en lugar
del coeficiente, se transmite el índice de este coeficiente en la
tabla de búsquedas. La tabla de búsquedas es conocida tanto para el
codificador 1 como para el decodificador 33. En la etapa de
recepción es posible determinar el coeficiente del elemento de
predicción de amplitud tonal en cuestión a partir del índice
transmitido utilizando la tabla de búsquedas. En algunos casos,
utilizar la tabla de búsquedas puede reducir el número de bits a
transmitir cuando se compara con la transmisión de coeficientes del
elemento de predicción de amplitud tonal.
La presente invención no se limita a las
realizaciones presentadas anteriormente, ni está limitada en otros
aspectos, sino que puede modificarse dentro del ámbito de las
reivindicaciones adjuntas.
Claims (36)
1. Método para codificar una señal de audio que
comprende las siguientes etapas:
- -
- examinar una porción de la señal de audio a codificar para encontrar otra porción de la señal de audio que sea la que mejor se corresponda con la porción de la señal de audio a codificar y que se selecciona como secuencia de referencia de muestras;
- -
- generar una serie de señales predichas de dicha secuencia de referencia de muestras utilizando una serie de órdenes del elemento de predicción de amplitud tonal;
- -
- determinar una eficacia de codificación de, al menos, una de dichas señales predichas; y
- -
- utilizar la eficacia de codificación determinada para seleccionar un método de codificación de la porción de la señal de audio a codificar.
2. Método de acuerdo con la reivindicación 1,
caracterizado porque los métodos de codificación que pueden
seleccionarse comprenden un método en el cual la señal de audio a
codificar se codifica de acuerdo con una señal predicha.
3. Método de acuerdo con la reivindicación 2,
caracterizado porque los métodos de codificación que pueden
seleccionarse comprenden un método en el cual la señal de audio a
codificar se codifica de acuerdo con la propia señal de audio.
4. Método de acuerdo con la reivindicación 1,
caracterizado porque se determina un error de codificación de
cada una de dichas señales predichas.
5. Método de acuerdo con la reivindicación 4,
caracterizado porque la eficacia de codificación se define
para la señal predicha con el error de codificación menor y porque
la codificación se lleva a cabo a partir de la señal predicha que
tiene dicho error de codificación menor si la información de
eficacia de codificación determinada indica que la cantidad de
información codificada es inferior a la que se tendría sí la
codificación se realizase a partir de la porción de la señal de
audio a codificar.
6. Método de acuerdo con la reivindicación 5,
caracterizado porque la porción de la señal de audio a
codificar se transforma al dominio de la frecuencia a fin de
determinar el espectro de frecuencias de la señal de audio y porque
cada señal predicha se transforma al dominio de la frecuencia a fin
de determinar el espectro de frecuencias de cada señal predicha y
porque dicha eficacia de codificación se determina para dicha señal
predicha con el menor error de codificación a partir del espectro de
frecuencia de la señal de audio y del espectro de frecuencia de la
señal predicha.
7. Método de acuerdo con la reivindicación 1,
caracterizado porque la eficacia de codificación se determina
para cada una de dichas señales predichas y se determina un error de
codificación de aquellas señales predichas respecto a las cuales la
información de eficacia de codificación indica que la cantidad de
información codificada es inferior a la que se tendría sí la
codificación se realizase a partir de la porción de la señal de
audio a codificar y la codificación se realiza a partir de la señal
predicha que proporciona el menor error de codificación.
8. Método de acuerdo con la reivindicación 1,
caracterizado porque una eficacia de codificación se
determina para cada una de dichas señales predichas y la
codificación se realiza a partir de la señal predicha que
proporciona la mayor eficacia de codificación, cuando la eficacia de
codificación determinada indica que la cantidad de información
codificada es inferior a la que se tendría sí la codificación se
realizase a partir de la porción de la señal de audio a
codificar.
9. Método de acuerdo con la reivindicación 1,
caracterizado porque la eficacia de codificación se determina
para cada una de dichas señales predichas y la codificación se
realiza a partir de la señal predicha que proporciona mayor eficacia
de codificación.
10. Método de acuerdo con las reivindicaciones 7,
8 o 9, caracterizado porque la porción de la señal de audio a
codificar se transforma al dominio de la frecuencia para determinar
el espectro de frecuencia de la señal de audio, y cada señal
predicha se transforma al dominio de la frecuencia a fin de
determinar el espectro de frecuencia de cada señal predicha, y
porque dicha eficacia de codificación se determina para cada señal
predicha a partir del espectro de frecuencia de la señal de audio y
al espectro de frecuencia de la señal predicha.
11. Método de acuerdo con las reivindicaciones 5,
6, 7, 8 o 9, caracterizado porque la información relativa al
error de predicción se determina para cada una de dichas señales
predichas.
12. Método de acuerdo con las reivindicaciones 5,
6, 7, 8 o 9, caracterizado porque dichas señales predichas se
generan utilizando un orden de predicción diferente para cada una de
dichas señales predichas.
13. Método de acuerdo con las reivindicaciones 6
o 10, caracterizado porque dicha información relativa al
error de predicción determinada para cada una de dichas señales
predichas se calcula como un espectro de diferencia que representa
utilizar dicho espectro de frecuencia de la señal de audio y del
espectro de frecuencia de la señal predi-
cha.
cha.
14. Método de acuerdo con las reivindicaciones 10
o 13, caracterizado porque la transformación al dominio de la
frecuencia se lleva a cabo utilizando una transformación DCT
modificada.
15. Método de acuerdo con las reivindicaciones 1
a 14, caracterizado porque la información codificada (501) de
la señal predicha comprende, al menos, datos relativos al método de
codificación (502), datos relativos al orden seleccionado (504), un
retardo (505), coeficientes del elemento de predicción de amplitud
tonal (506) y datos relativos al error de predicción (507).
16. Método de acuerdo con las reivindicaciones 1
a 15, caracterizado porque la señal de audio se divide en
tramas, y en el que la codificación se lleva a cabo
independientemente para cada trama generada a partir de la señal
de
audio.
audio.
17. Método de acuerdo con las reivindicaciones 1
a 16, caracterizado porque la señal de audio es una señal de
voz.
18. Método de acuerdo con las reivindicaciones 4
a 7, caracterizado porque dicho error de codificación se
determina utilizando uno de los siguientes métodos:
- -
- un método de mínimos cuadrados;
- -
- un método basado en modelado psico-acústico de la señal de audio a codificar.
19. Método de acuerdo con la reivindicación 18,
caracterizado porque cuando dicho error de codificación se
determina utilizando el método de los mínimos cuadrados, el error de
codificación se calcula a partir del error de predicción.
20. Método de acuerdo con cualquiera de las
reivindicaciones 1 a 19, caracterizado porque dicha señal de
audio codificada se transmite a un dispositivo de recepción.
21. Codificador (1) que comprende medios (16, 20)
para codificar una señal de audio, comprendiendo dichos medios de
codificación:
- -
- medios (7) para examinar una porción de la señal de audio a codificar para encontrar otra porción de la señal de audio que sea la que mejor se corresponda con la porción de la señal de audio a codificar, que se ha seleccionado como secuencia de referencia de muestras;
- -
- medios (9, 10) para utilizar una serie de órdenes de elemento de predicción de amplitud tonal para generar una serie de señales predichas a partir de dicha secuencia de referencia de muestras;
- -
- medios (12) para determinar una eficacia de codificación de al menos una de dichas señales predichas; y
- -
- medios (12, 13, 14) para utilizar la eficacia de codificación determinada para seleccionar un método de codificación de la porción de la señal de audio a codificar.
22. Codificador (1) de acuerdo con la
reivindicación 21, caracterizado porque comprende medios (4,
6-14) de codificación de la señal de audio a partir
de una señal predicha.
23. Codificador (1) de acuerdo con la
reivindicación 22, caracterizado porque comprende medios (4,
6, 14) para codificar la propia señal de audio.
24. Sistema para transmisión de datos que
comprende:
- -
- un codificador de acuerdo con la reivindicación 21, y
- -
- medios (16) para transmitir la señal de audio codificada.
25. Sistema de transmisión de datos de acuerdo
con la reivindicación 24, caracterizado porque comprende
medios para determinar un error de codificación de, al menos, una de
dichas señales predichas.
26. Sistema de transmisión de datos de acuerdo
con la reivindicación 24, caracterizado porque comprende
medios de transformación de la porción de la señal de audio a
codificar al dominio de la frecuencia y medios para transformar cada
una de dichas señales predichas al dominio de la frecuencia.
27. Sistema de transmisión de datos de acuerdo
con la reivindicación 24, caracterizado porque comprende
medios para generar una cadena de bits (15) para su transmisión a un
dispositivo receptor, comprendiendo dicha cadena de bits, al menos,
información relativa al método de codificación seleccionado.
28. Sistema de transmisión de datos de acuerdo
con cualquiera de las reivindicaciones 24 a 27, caracterizado
porque comprende medios para dividir la señal de audio en
tramas.
29. Sistema de transmisión de datos de acuerdo
con cualquiera de las reivindicaciones 24 a 28, caracterizado
porque comprende un terminal móvil.
30. Decodificador (33) para decodificar una señal
de audio codificada en un codificador de acuerdo con la
reivindicación 21, caracterizado porque el decodificador
comprende:
- -
- medios para determinar el método para codificar la señal de audio a decodificar comprendiendo medios para examinar, a partir de la información sobre el método de codificación (502), si la información recibida se generó a partir de la señal de audio original, y medios para examinar el orden del elemento de predicción de amplitud tonal (M) utilizado en la fase de codificación; y
- -
- medios para decodificar la señal de audio de acuerdo con el método de codificación determinado que comprende medios (21) para recibir información relativa a una señal predicha, medios para decodificar la señal utilizando la información codificada generada a partir de la propia señal de audio, medios para seleccionar el orden del elemento de predicción de amplitud tonal para decodificar la señal y medios para decodificar la señal realizando una predicción de acuerdo con el orden del elemento de predicción de amplitud tonal (M) seleccionado.
31. Decodificador de acuerdo con la
reivindicación 30, caracterizado porque el decodificador
comprende medios (21) para determinar a partir de dicha información
recibida al menos datos relativos a un orden seleccionado (504), un
retardo (505), al menos un coeficiente del elemento de predicción de
amplitud tonal (506) y datos de error de predicción (507).
32. Decodificador de acuerdo con la
reivindicación 31, caracterizado porque comprende medios (24,
28) para generar una señal predicha utilizando dichos datos
relativos a un orden seleccionado (504), un retardo (505), y al
menos un coeficiente del elemento de predicción de amplitud tonal
(506).
33. Decodificador de acuerdo con la
reivindicación 31 o 32, caracterizado porque comprende medios
(23, 24, 28) para generar una señal de audio reconstruida utilizando
dicha señal predicha y dichos datos de error de predicción.
34. Decodificador de acuerdo con la
reivindicación 30, caracterizado porque comprende medios (21)
para recibir información relativa a la propia señal de audio.
35. Decodificador de acuerdo con la
reivindicación 34, caracterizado porque comprende medios (22,
23, 26) para generar una señal de audio reconstruida utilizando
dicha información recibida relativa a la propia señal de audio.
36. Método para decodificar una señal de audio
codificada de acuerdo con el método de la reivindicación 1,
caracterizado porque dicho método comprende la etapa de
examinar, a partir de la información del método de codificación
(502), si la información recibida se generó a partir de la señal de
audio original, en el que la señal se decodifica utilizando la
información codificada generada a partir de la propia señal de
audio, examinándose en otro caso el orden del elemento de predicción
de amplitud tonal (M) utilizado en la etapa de codificación, y
efectuándose una predicción de acuerdo con el orden del elemento de
predicción de amplitud tonal (M) para recuperar la señal de
audio.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI991537A FI116992B (fi) | 1999-07-05 | 1999-07-05 | Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi |
FI991537 | 1999-07-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2244452T3 true ES2244452T3 (es) | 2005-12-16 |
Family
ID=8555025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES00944090T Expired - Lifetime ES2244452T3 (es) | 1999-07-05 | 2000-07-05 | Metodo para mejorar la eficacia de codificacion de una señal de audio. |
Country Status (13)
Country | Link |
---|---|
US (2) | US7289951B1 (es) |
EP (3) | EP1587062B1 (es) |
JP (2) | JP4142292B2 (es) |
KR (2) | KR100593459B1 (es) |
CN (2) | CN1235190C (es) |
AT (2) | ATE418779T1 (es) |
AU (1) | AU761771B2 (es) |
BR (1) | BRPI0012182B1 (es) |
CA (1) | CA2378435C (es) |
DE (2) | DE60041207D1 (es) |
ES (1) | ES2244452T3 (es) |
FI (1) | FI116992B (es) |
WO (1) | WO2001003122A1 (es) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002173892A (ja) | 2000-09-27 | 2002-06-21 | Nippon Paper Industries Co Ltd | グラビア印刷用塗工紙 |
FI118067B (fi) | 2001-05-04 | 2007-06-15 | Nokia Corp | Menetelmä audiosignaalin pakkauksen purkamisessa, pakkauksen purkulaite, ja elektroniikkalaite |
DE10138650A1 (de) * | 2001-08-07 | 2003-02-27 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschlüsseln eines diskreten Signals sowie Verfahren und Vorrichtung zur Entschlüsselung |
US7933767B2 (en) * | 2004-12-27 | 2011-04-26 | Nokia Corporation | Systems and methods for determining pitch lag for a current frame of information |
US20070213705A1 (en) * | 2006-03-08 | 2007-09-13 | Schmid Peter M | Insulated needle and system |
US7610195B2 (en) * | 2006-06-01 | 2009-10-27 | Nokia Corporation | Decoding of predictively coded data using buffer adaptation |
JP2008170488A (ja) | 2007-01-06 | 2008-07-24 | Yamaha Corp | 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法 |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
WO2009132662A1 (en) * | 2008-04-28 | 2009-11-05 | Nokia Corporation | Encoding/decoding for improved frequency response |
KR20090122143A (ko) * | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8380523B2 (en) * | 2008-07-07 | 2013-02-19 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US20100114568A1 (en) * | 2008-10-24 | 2010-05-06 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
WO2010053287A2 (en) * | 2008-11-04 | 2010-05-14 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
GB2466672B (en) | 2009-01-06 | 2013-03-13 | Skype | Speech coding |
GB2466674B (en) | 2009-01-06 | 2013-11-13 | Skype | Speech coding |
GB2466675B (en) | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
KR101614767B1 (ko) * | 2009-10-28 | 2016-04-22 | 에스케이텔레콤 주식회사 | 벡터 양자화 기반 2차 예측을 통한 동영상 부호화/복호화 장치, 방법 및 기록 매체 |
CN106231337B (zh) | 2010-04-13 | 2020-06-19 | Ge视频压缩有限责任公司 | 解码器、解码方法、编码器以及编码方法 |
CN105915918B (zh) * | 2010-04-13 | 2019-09-06 | Ge视频压缩有限责任公司 | 跨平面预测的方法和装置 |
BR122020008249B1 (pt) | 2010-04-13 | 2021-02-17 | Ge Video Compression, Llc | herança em amostra de arranjo em subdivisão multitree |
CN106067983B (zh) | 2010-04-13 | 2019-07-12 | Ge视频压缩有限责任公司 | 解码数据流的方法、生成数据流的方法及解码器 |
EP3703369B1 (en) | 2010-04-13 | 2024-07-24 | GE Video Compression, LLC | Sample region merging |
US9268762B2 (en) * | 2012-01-16 | 2016-02-23 | Google Inc. | Techniques for generating outgoing messages based on language, internationalization, and localization preferences of the recipient |
DE102012207750A1 (de) | 2012-05-09 | 2013-11-28 | Leibniz-Institut für Plasmaforschung und Technologie e.V. | Vorrichtung zur plasmabehandlung von menschlichen, tierischen oder pflanzlichen oberflächen, insbesondere von haut oder schleimhautarealen |
PL3252762T3 (pl) * | 2012-10-01 | 2019-07-31 | Nippon Telegraph And Telephone Corporation | Sposób kodowania, koder, program i nośnik zapisu |
KR102251833B1 (ko) | 2013-12-16 | 2021-05-13 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
EP2916319A1 (en) | 2014-03-07 | 2015-09-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for encoding of information |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US36721A (en) * | 1862-10-21 | Improvement in breech-loading fire-arms | ||
JPH0683443B2 (ja) * | 1985-03-05 | 1994-10-19 | 富士通株式会社 | フレ−ム内フレ−ム間符号化方式 |
DE69029120T2 (de) * | 1989-04-25 | 1997-04-30 | Toshiba Kawasaki Kk | Stimmenkodierer |
CA2021514C (en) | 1989-09-01 | 1998-12-15 | Yair Shoham | Constrained-stochastic-excitation coding |
NL9001985A (nl) * | 1990-09-10 | 1992-04-01 | Nederland Ptt | Werkwijze voor het coderen van een analoog signaal met een herhalend karakter en een inrichting voor het volgens deze werkwijze coderen. |
US5528629A (en) | 1990-09-10 | 1996-06-18 | Koninklijke Ptt Nederland N.V. | Method and device for coding an analog signal having a repetitive nature utilizing over sampling to simplify coding |
NL9002308A (nl) | 1990-10-23 | 1992-05-18 | Nederland Ptt | Werkwijze voor het coderen en decoderen van een bemonsterd analoog signaal met een herhalend karakter en een inrichting voor het volgens deze werkwijze coderen en decoderen. |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
US6400996B1 (en) * | 1999-02-01 | 2002-06-04 | Steven M. Hoffberg | Adaptive pattern recognition based control system and method |
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
US5784631A (en) * | 1992-06-30 | 1998-07-21 | Discovision Associates | Huffman decoder |
IT1257065B (it) * | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
FI95086C (fi) | 1992-11-26 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin tehokkaaksi koodaamiseksi |
CA2116736C (en) * | 1993-03-05 | 1999-08-10 | Edward M. Roney, Iv | Decoder selection |
JPH06332492A (ja) * | 1993-05-19 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音声検出方法および検出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5574825A (en) * | 1994-03-14 | 1996-11-12 | Lucent Technologies Inc. | Linear prediction coefficient generation during frame erasure or packet loss |
JP3277692B2 (ja) | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 情報符号化方法、情報復号化方法及び情報記録媒体 |
JPH08166800A (ja) * | 1994-12-13 | 1996-06-25 | Hitachi Ltd | 複数種類の符号化方法を備える音声符号器および復号器 |
JP3183072B2 (ja) | 1994-12-19 | 2001-07-03 | 松下電器産業株式会社 | 音声符号化装置 |
JPH08190764A (ja) * | 1995-01-05 | 1996-07-23 | Sony Corp | ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体 |
FR2729246A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
FR2729247A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
US5864798A (en) * | 1995-09-18 | 1999-01-26 | Kabushiki Kaisha Toshiba | Method and apparatus for adjusting a spectrum shape of a speech signal |
TW321810B (es) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP4005154B2 (ja) * | 1995-10-26 | 2007-11-07 | ソニー株式会社 | 音声復号化方法及び装置 |
JPH1091194A (ja) * | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
JP3707154B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | 音声符号化方法及び装置 |
JPH10105194A (ja) * | 1996-09-27 | 1998-04-24 | Sony Corp | ピッチ検出方法、音声信号符号化方法および装置 |
EP1071081B1 (en) * | 1996-11-07 | 2002-05-08 | Matsushita Electric Industrial Co., Ltd. | Vector quantization codebook generation method |
JPH10149199A (ja) * | 1996-11-19 | 1998-06-02 | Sony Corp | 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体 |
FI964975A (fi) | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
US6252632B1 (en) * | 1997-01-17 | 2001-06-26 | Fox Sports Productions, Inc. | System for enhancing a video presentation |
US6202046B1 (en) * | 1997-01-23 | 2001-03-13 | Kabushiki Kaisha Toshiba | Background noise/speech classification method |
JP3064947B2 (ja) * | 1997-03-26 | 2000-07-12 | 日本電気株式会社 | 音声・楽音符号化及び復号化装置 |
FI973873A (fi) * | 1997-10-02 | 1999-04-03 | Nokia Mobile Phones Ltd | Puhekoodaus |
JP3765171B2 (ja) | 1997-10-07 | 2006-04-12 | ヤマハ株式会社 | 音声符号化復号方式 |
US6351730B2 (en) * | 1998-03-30 | 2002-02-26 | Lucent Technologies Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
US6014618A (en) * | 1998-08-06 | 2000-01-11 | Dsp Software Engineering, Inc. | LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor and optimized ternary source excitation codebook derivation |
US6493665B1 (en) * | 1998-08-24 | 2002-12-10 | Conexant Systems, Inc. | Speech classification and parameter weighting used in codebook search |
US6188980B1 (en) * | 1998-08-24 | 2001-02-13 | Conexant Systems, Inc. | Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
WO2000060575A1 (en) * | 1999-04-05 | 2000-10-12 | Hughes Electronics Corporation | A voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
-
1999
- 1999-07-05 FI FI991537A patent/FI116992B/fi not_active IP Right Cessation
-
2000
- 2000-07-05 CN CNB008124884A patent/CN1235190C/zh not_active Expired - Lifetime
- 2000-07-05 CA CA002378435A patent/CA2378435C/en not_active Expired - Lifetime
- 2000-07-05 AU AU58326/00A patent/AU761771B2/en not_active Expired
- 2000-07-05 DE DE60041207T patent/DE60041207D1/de not_active Expired - Lifetime
- 2000-07-05 EP EP05104931A patent/EP1587062B1/en not_active Expired - Lifetime
- 2000-07-05 DE DE60021083T patent/DE60021083T2/de not_active Expired - Lifetime
- 2000-07-05 KR KR1020057013257A patent/KR100593459B1/ko active IP Right Grant
- 2000-07-05 EP EP08170594A patent/EP2037451A1/en not_active Withdrawn
- 2000-07-05 KR KR1020017016955A patent/KR100545774B1/ko active IP Right Grant
- 2000-07-05 EP EP00944090A patent/EP1203370B1/en not_active Expired - Lifetime
- 2000-07-05 JP JP2001508440A patent/JP4142292B2/ja not_active Expired - Lifetime
- 2000-07-05 ES ES00944090T patent/ES2244452T3/es not_active Expired - Lifetime
- 2000-07-05 AT AT05104931T patent/ATE418779T1/de not_active IP Right Cessation
- 2000-07-05 WO PCT/FI2000/000619 patent/WO2001003122A1/en active IP Right Grant
- 2000-07-05 US US09/610,461 patent/US7289951B1/en not_active Expired - Lifetime
- 2000-07-05 BR BRPI0012182A patent/BRPI0012182B1/pt not_active IP Right Cessation
- 2000-07-05 CN CNB2005101201121A patent/CN100568344C/zh not_active Expired - Lifetime
- 2000-07-05 AT AT00944090T patent/ATE298919T1/de not_active IP Right Cessation
-
2005
- 2005-03-02 JP JP2005056891A patent/JP4426483B2/ja not_active Expired - Lifetime
- 2005-12-08 US US11/296,957 patent/US7457743B2/en not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2244452T3 (es) | Metodo para mejorar la eficacia de codificacion de una señal de audio. | |
ES2205891T3 (es) | Un metodo y un dispositivo para una busqueda adaptativa de tono de ancho de banda al codificar señales de banda ancha. | |
ES2223591T3 (es) | Codificacion eficaz de envolvente especial utilizando una resolucion tiempo/frecuencia variable. | |
ES2207643T3 (es) | Sintesis de señal de excitacion durante borrado de tramas o perdida de paquetes. | |
ES2358213T3 (es) | Flujo redundante de bits de audio y métodos de procesamiento de flujo de bits de audio. | |
JP3849210B2 (ja) | 音声符号化復号方式 | |
US20060173675A1 (en) | Switching between coding schemes | |
US7610195B2 (en) | Decoding of predictively coded data using buffer adaptation | |
KR102229487B1 (ko) | 리던던트 프레임 정보를 통신하는 시스템들 및 방법들 | |
ES2302530T3 (es) | Procedimiento de codificacion y descodificacion de audio con flujo variable. | |
ES2628127T3 (es) | Cuantificador avanzado | |
CN104781876A (zh) | 音频编码装置、音频编码方法和音频编码程序以及音频解码装置、音频解码方法和音频解码程序 | |
JP2007504503A (ja) | 低ビットレートオーディオ符号化 | |
CA2551281A1 (en) | Voice/musical sound encoding device and voice/musical sound encoding method | |
KR100215342B1 (ko) | 전송시스템 및 그 전송 시스템에서 사용되는 수신기 | |
CA2765523A1 (en) | Coding method, decoding method, and device and recording medium using the methods |