MX2013009295A

MX2013009295A - Dispositivo y método para cuantificar ganancias de contribuciones adaptativas y fijas de una excitación en un codec celp.

Info

Publication number: MX2013009295A
Application number: MX2013009295A
Authority: MX
Inventors: Vladimir Malenovsky
Original assignee: Voiceage Corp
Priority date: 2011-02-15
Filing date: 2012-02-14
Publication date: 2013-10-08
Also published as: CN103392203A; AU2012218778B2; AU2012218778A1; NZ611801A; JP2017097367A; ZA201305431B; SI2676271T1; CN104505097A; RU2591021C2; LT2676271T; US20120209599A1; JP6072700B2; JP2014509407A; EP2676271B1; ES2812598T3; DK2676271T3; JP6316398B2; KR101999563B1; EP3686888A1; US9076443B2

Abstract

Un dispositivo y método para cuantificar una ganancia de una contribución fija de una excitación en un cuadro, incluyendo subcuadros, de una señal de sonido codificada, en donde la ganancia de la contribución de excitación fija se estima en un subcuadro usando un parámetro representativo de una clasificación del cuadro. La ganancia de la contribución de excitación fija es entonces cuantificada en el subcuadro utilizando la ganancia estimada. El dispositivo y el método se utilizan conjuntamente en ganancias de cuantificación de las contribuciones adaptativas y fijas de una excitación en un cuadro de una señal de sonido codificada. Para recuperar una ganancia cuantificada de una contribución fija de una excitación en un subcuadro de un cuadro, la ganancia de la contribución de excitación fija se estima utilizando un parámetro representativo de una clasificación del cuadro, un libro de códigos de ganancia proporciona un factor de corrección en respuesta a un índice de libro de códigos de ganancia recibido y un multiplicador multiplica la ganancia estimada por el factor de corrección para proporcionar una ganancia cuantificada de la contribución de excitación fija.

Description

DISPOSITIVO Y MÉTODO PARA CUANTIFICAR GANANCIAS DE CONTRIBUCIONES ADAPTATIVAS Y FIJAS DE UNA EXCITACIÓN EN UN CODEC CELP CAMPO TÉCNICO DE LA INVENCIÓN La presente realización se relaciona a cuantificación de la ganancia de una contribución fija de una excitación en una señal de sonido codificada. La presente realización también se relaciona con una cuantificación conjunta de las ganancias de las contribuciones adaptativas y fijas de la excitación.

ANTECEDENTES DE LA INVENCIÓN En un codificador con una estructura codee, por ejemplo una estructura codee CELP (Predicción lineal de excitación de código) tal como ACELP (predicción lineal algebraica de excitación de código), una señal de entrada de voz o de audio (señal de sonido) se procesa en segmentos cortos, conocidos como cuadros. Para capturar rápidamente las propiedades variables de una señal de entrada de sonido, cada cuadro además se divide en subcuadros. Una estructura codee CELP también produce contribuciones adaptativas y fijas de un libro de códigos que se agregan en conjunto para formar una excitación completa. Ganancias relacionadas a las contribuciones adaptativas y fijas de un libro de códigos se cuantifican y se transmiten a un decodificador junto con otros parámetros de codificación. La contribución adaptativa y la contribución del libro de códigos de la excitación se referencia como "la contribución adaptativa" y "la contribución fija" de la excitación a través de todo el documento.

Existe una necesidad de una técnica para cuantificar las ganancias de las contribuciones adaptativas y fijas de la excitación que mejoran la robustez del codee en contra de borraduras de cuadro o pérdida de paquete que se puedan presentarse durante la transmisión de los parámetros de codificación desde el codificador al decodificador.

SUMARIO DE LA INVENCIÓN Conforme un primer aspecto, la presente realización se trata de un dispositivo para cuantificar una ganancia de una contribución fija de una excitación en un cuadro, incluyendo subcuadros, de una señal de sonido codificada, que comprende: una entrada para un parámetro representativo de una clasificación del cuadro, un estimador de la ganancia de la contribución fija de la excitación en una subcuadro del cuadro, en donde el estimador se suministra con el parámetro representativo de la clasificación del cuadro; y un cuantificador predictivo de la ganancia de la contribución fija de la excitación, en el subcuadro, usando de la ganancia estimada.

La presente realización también se refiere a un método para cuantificar una ganancia de una contribución fija de una excitación en un cuadro, incluyendo subcuadros, de una señal de sonido codificada, que comprende : recibir un parámetro representativo de una clasificación del cuadro; estimar la ganancia de la contribución fija de la excitación en un subcuadro del cuadro, usando el parámetro representativo de la clasificación del cuadro; y cuantificar de manera predictiva la ganancia de la contribución fija de la excitación en el subcuadro, usando la ganancia estimada.

De acuerdo al tercer aspecto, se proporciona un dispositivo para cuantificar ganancias conjuntamente de contribuciones fijas y adaptativas de una excitación en un cuadro de una señal de sonido codificada; que comprende: un cuantificador de la ganancia de la contribución adaptativa de la excitación; y el dispositivo descrito anteriormente para cuantificar la ganancia de la contribución fija de la excitación.

La presente realización además se refiere a un método para conjuntamente cuantificar ganancias de contribuciones fijas y adaptativas de una excitación en un cuadro de una señal de sonido codificada, que comprende : cuantificar la ganancia de la contribución adaptativa de la excitación, y cuantificar la ganancia de la contribución fija de la excitación con el uso del método descrito anteriormente.

De acuerdo a un quinto aspecto, se proporciona un dispositivo para recuperar una ganancia cuantificada de una contribución fija de una excitación en un subcuadro de un cuadro, que comprende: un receptor de un índice de libro de códigos de ganancia; un estimador de la ganancia de la contribución fija de la excitación en el subcuadro, en donde el estimador se suministra con un parámetro representativo de una clasificación del cuadro; un libro de códigos de ganancia para suministrar un factor de corrección en respuesta al índice del libro de códigos de ganancia, y un multiplicador de la ganancia estimada por el factor de corrección para proporcionar una ganancia cuantificada de la contribución fija de la excitación en el subcuadro.

La presente realización también trata un método para recuperar una ganancia cuantificada de una contribución fija de una excitación en un subcuadro de un cuadro, que comprende: recibir un índice de libro de códigos de ganancia; estimar la ganancia de la contribución fija de la excitación en el subcuadro, usando un parámetro representativo de una clasificación del cuadro; suministrar, desde un libro de códigos de ganancia y para el subcuadro, un factor de corrección en respuesta al índice del libro de códigos de ganancia; y multiplicar la ganancia estimada por el factor de corrección para proporcionar una ganancia cuantificada de la contribución fija de la excitación en dicho subcuadro.

La presente realización además trata un dispositivo para recuperar ganancias cuantificadas de contribuciones adaptativas y fijas de una excitación en un subcuadro de un cuadro, que comprende: un receptor de un índice de un libro de códigos de ganancia; un estimador de la ganancia de la contribución fija de la excitación en el subcuadro, en donde el estimador es suministrado con un parámetro representativo de la clasificación del cuadro, un libro de códigos de ganancia para suministrar la ganancia cuantificada de la contribución adaptativa de la excitación y un factor de corrección para el subcuadro en respuesta al índice del libro de códigos de ganancia; y un multiplicador de la ganancia estimada por el factor de corrección para proporcionar un ganancia cuantificada de la contribución fija de la excitación en el subcuadro.

Además, la realización describe un método para recuperar ganancias cuantificadas de contribuciones adaptativas y fijas de una excitación en un subcuadro de un cuadro, que comprende: recibir un índice de un libro de códigos de ganancia; estimar la ganancia de la contribución fija de la excitación en el subcuadro, usando un parámetro representativo de una clasificación del cuadro; suministrar, desde un libro de códigos de ganancia y para el subcuadro, la ganancia cuantificada de la contribución adaptativa de la excitación y un factor de corrección en respuesta al índice del libro de códigos de ganancia; y multiplicar la ganancia estimada por el factor de corrección para proporcionar una ganancia cuantificada de la contribución fija de la excitación en el subcuadro.

Lo anterior y otras funciones se harán más aparentes al leer la siguiente descripción no-restrictiva de las realizaciones ilustrativas, que se dan solamente como ejemplos con referencia a los siguientes dibujos.

DESCRIPCIÓN BREVE DE LAS FIGURAS En los dibujos anexos: Figura 1 es un diagrama esquemático que describe la construcción de una excitación filtrada en un codificador con base en CELP; Figura 2 es un diagrama de bloques esquemático que describe un estimador de la ganancia de la contribución fija de la excitación en un primer subcuadro de cada cuadro; Figura 3 es un diagrama de bloques esquemático que describe un estimador de la ganancia de la contribución fija de la excitación en todos los subcuadros subsecuentes al primer subcuadro; Figura 4 es un diagrama de bloques esquemático que describe una máquina de estado en la cual se calculan coeficientes de estimación y se utilizan para diseñar un libro de códigos de ganancia para cada subcuadro; Figura 5 es un diagrama de bloques esquemático que describe un cuantificador de ganancia; y Figura 6 es un diagrama de bloques esquemático de otra realización de un cuantificador de ganancia equivalente ai cuantificador de ganancia de la Figura 5.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN Enseguida se describe la cuantificacion de una ganancia de una contribución fija de una excitación en una señal de sonido codificada así como la cuantificacion conjunta de ganancias de contribuciones adaptativas y fijas de la excitación. La cuantificacion se puede aplicar en cualquier cantidad de subcuadros y desarrollarse con cualquier voz de entrada o señal de audio (señal de sonido de entrada) muestreada en cualquier frecuencia de muestreo aleatoria. También se cuantifican las ganancias de las contribuciones adaptativas y fijas de la excitación sin la necesidad de una predicción entre los cuadros. La ausencia de la predicción entre cuadros da como resultado una mejor robustez contra borraduras de cuadros o pérdidas de paquetes que se puedan presentar durante la transmisión de parámetros codificados.

La ganancia de la contribución adaptativa de la excitación se cuantifica directamente, mientras la ganancia de la contribución fija de la excitación se cuantifica a través de una ganancia estimada. La estimación de la ganancia de la contribución fija de la excitación está basada en parámetros que existen tanto en el codificador como en el decodificador. Estos parámetros se calculan cuando se está procesando el cuadro actual. De esta forma, ninguna información de un cuadro previo es requerida en el transcurso de la cuantificacion o de la decodificación, lo que como se mencionó anteriormente, mejora la robustez del codee contra borraduras del cuadro.

Aunque la siguiente descripción se refiere a una estructura codee de CELP (Predicción lineal de excitación de código), por ejemplo ACELP (Predicción lineal con excitación por código algebraico), se debe tener en cuenta que el objeto de la presente realización se puede aplicar en otros tipos de estructuras de codee.

Ganancias no-cuantificados óptimas para ías contribuciones adaptativas y fijas de la excitación En la técnica de codificación CELP, la excitación se compone de dos contribuciones: la contribución adaptativa (excitación de libro de código adaptativo) y la contribución fija (excitación del libro de códigos fijo). El libro de códigos adaptativo está basado en una predicción a largo plazo y por lo tanto se relaciona con la excitación pasada. La contribución adaptativa de la excitación se encuentra por medio de una búsqueda de bucle cerrado alrededor de un valor estimado de un retraso de tono. El retraso de tono estimado se encuentra a través de un análisis de correlación. La búsqueda de un bucle cerrado consiste en minimizar el error medio cuadrado ponderado (MSWE) entre una señal objetivo (en la codificación CELP, una versión filtrada perceptiblemente de la voz de entrada o señal de audio (señal de sonido de entrada)) y la contribución adaptativa filtrada de la excitación a escala por un incremento adaptativo del libro de códigos. El filtro en la búsqueda de bucle cerrado corresponde al filtro de síntesis ponderado, conocido en la técnica de codificación CELP. Una búsqueda de libro de códigos fijo también se lleva a cabo al minimizar el error medio cuadrado (???) entre una señal objetivo actualizada (después de eliminar la contribución adaptativa de la excitación) y la contribución fija filtrada de la excitación a escala por una ganancia de libro de códigos fijo. La construcción de la excitación filtrada total se muestra en la Figura 1. Para una mayor referencia, una implementación de codificación CELP se describe en el siguiente documento : 3GPP TS 26.190, "Adaptive Multi-Rate - Wideband (AMR-WB) speech codee; Transcoding functions", del cual el contenido completo se incluye aquí como referencia.

La Figura 1 es un diagrama esquemático que describe la construcción de la excitación total filtrada en un codificador CELP. La señal de entrada 101, formada por la señal objetivo mencionada anteriormente, se conoce como x(i) y se usa como referencia durante la búsqueda de ganancias para las contribuciones adaptativas y fijas de la excitación. La contribución adaptativa filtrada de la excitación se conoce como /(/) y la contribución fija filtrada de la excitación (innovación) se conoce como z(/). Las ganancias correspondientes se conocen como gp para la contribución adaptativa y gc para la contribución fija de la excitación. Como se ilustra en , 1a Figura 1, un amplificador 104 aplica la ganancia gp a la contribución adaptativa filtrada (/) de la excitación y un amplificador 105 aplica la ganancia gc a la contribución fija filtrada z(/) de la excitación. Las ganancias óptimos cuantificadas se encuentran por medio de la minimización del cuadrado medio de la señal de error e(/), calculada a través de un primer restador 107, restando la señal gpy(i) a la salida del ¡amplificador 104 de la señal objetivo x¡ y un segundo restador 108 resta la señal g^i) a la salida del amplificador 105 del resultado de la resta del restador 107. Para todas las señales en la Figura 1, el índice / indica las muestras de señales diferentes y corridas desde O a i-1, donde L es la longitud de cada subcuadro. Como es bien conocido por las personas expertas en la materia, la contribución de libro de códigos adaptativo filtrado se calcula generalmente como la convolucion entre el vector de excitación del libro de códigos adaptativo v(n) y la respuesta de impulso del filtro de síntesis ponderado h(n), que es y{n) = v(n)*h(n). De manera similar, la excitación del libro de códigos fijo filtrado z(n) se obtiene por medio de z{n) = c(n)*h(n), donde c(n) es la excitación del libro de códigos fijo.

Suponiendo que se conoce la señal objetivo x(/), la contribución adaptativa filtrada de la excitación (/) y la contribución fija filtrada de la excitación z{¡), el conjunto óptimo de las ganancias no cuantificadas gp y gc se encuentra, al minimizar la energía de la señal de error e( ) dada por la siguiente relación : e(í) = x(i) - gpy(i) - gcz(i), i = 0, L - 1 (1) La ecuación (1) se puede encontrar en forma vectorial como * = * - gPy - gcz (2) vector de transposición, se traduce en ganancias no cuantificadas óptimas donde las constantes o correlaciones c0, Ci, c2l c3, c4 y c5 se calculan como <¾ = y y» c\ = ? c2 - z'z, c3 = x'z, c4 = ^z, (4) Las ganancias óptimas en la ecuación (3) no se cuantifican directamente, sino que se utilizan en la formación de un libro de códigos de ganancia, como se describirá más adelante. Las ganancias se cuantifican conjuntamente, después de aplicar la predicción de la ganancia de la contribución fija de la excitación. La predicción se realiza mediante el cálculo de un valor estimado de la ganancia ?? de la contribución fija de la excitación. La ganancia de la contribución fija de la excitación está dada por gc - gcQ./ donde ? es un factor de corrección. Por lo tanto, cada entrada de libro de códigos contiene dos valores. El primer valor corresponde a la ganancia cuantificada gp de la contribución adaptativa de la excitación. El segundo valor corresponde al factor de corrección ? que se utiliza para multiplicar la ganancia estimada gco de la contribución fija de la excitación. El índice óptimo en el libro de códigos de ganancia (9p Y y) se encuentra minimizando el error cuadrado medio entre la señal objetivo y la excitación total filtrada. La estimación de la ganancia de la contribución fija de la excitación se describe en detalle a continuación.

Estimación de la ganancia de la contribución fija de la excitación Cada cuadro contiene un cierto número de subcuadros. Vamos a marcar el número de subcuadros en un cuadro como K y el índice del subcuadro actual como k. La estimación gc0 de la ganancia de la contribución fija de la excitación se realiza de manera diferente en cada subcuadro.

La Figura 2 es un diagrama de bloques esquemático que describe un estimador 200 de la ganancia de la contribución fija de la excitación (en lo sucesivo ganancia de libro de códigos fijo) en un primer subcuadro de cada cuadro.

El estimador 200 calcula primero una estimación de la ganancia de libro de códigos fijo en respuesta a un parámetro t representativo de la clasificación del cuadro actual. La energía del vector de código de innovación del libro de códigos fijo se resta de la ganancia de libro de códigos fijo estimado para tener en cuenta esta energía del vector de código de innovación filtrada. La ganancia resultante de libro de códigos fijo, se estima que se multiplica por un factor de corrección seleccionado desde un libro de códigos de ganancia para producir la ganancia cuantificada de libro de códigos fijo gc.

En una forma de realización, el estimador 200 comprende un calculador 201 de una estimación lineal de la ganancia de libro de códigos fijo en el dominio logarítmico. La ganancia de libro de códigos fijo se estima suponiendo la unidad de la energía del vector de código de la innovación 202 del libro de códigos fijo. Sólo una estimación de parámetros es utilizado por el calculador 201, el parámetro f. representativo de la clasificación del cuadro actual. Un restador 203 resta entonces la energía del vector de código de innovación filtrado 202 del libro de códigos fijo en el dominio logarítmico de la ganancia de libro de códigos fijo estimada linealmente en el dominio logarítmico en la salida del calculador 201. El convertidor 204 convierte la ganancia de libro de códigos fijo estimada en el dominio logarítmico desde el restador 203 al dominio lineal. La salida en el dominio lineal desde el convertidor 204 es la ganancia estimada del libro de códigos fijo gco- Un multiplicador 205 multiplica la ganancia estimada g< por el factor de corrección 206 seleccionado de la ganancia del libro de códigos. Como se ha descrito en el párrafo anterior, la salida del multiplicador 205 constituye la ganancia cuantificada del libro de códigos fijo gc.

La ganancia cuantificada gp de la contribución adaptativa de la excitación (en lo sucesivo, la ganancia del libro de códigos adaptativo) se selecciona directamente a partir de la ganancia de libro de códigos. Un multiplicador 207 multiplica la excitación adaptativa filtrada 208 del libro de códigos adaptativo por la ganancia cuantificada del libro de códigos adaptativo gp para producir la contribución adaptativa filtrada 209 de la excitación filtrada . Otro multiplicador 210 multiplica el vector de código de innovación filtrada 202 del libro de códigos fijo por la ganancia cuantificada de libro de códigos fijo gc para producir la contribución fija filtrada 211 de la excitación filtrada. Por último, un sumador 212 suma las contribuciones filtradas adaptativas 209 y fijas 211 de la excitación para formar la excitación filtrada total 214.

En el primer subcuad ro del cuadro actual, la ganancia del libro de códigos fijo estimada en el dominio logarítmico en la salida del restador 203 está dada por donde G$ = log10Gr$) .

El término interior en el logaritmo de la ecuación (5) corresponde a la raíz cuadrada de la energía del vector de innovación filtrada 202 (£, es la energía del vector de innovación filtrada en el primer subcuadro del cuadro n) . Este término interior ( raíz cuadrada de la energía E¡) está determinado por un primer calculador 215 de la energía E¡ del vector de innovación filtrada 202 y un calculador 216 de la raíz cuadrada de esta energía E¡. Un calculador 217 entonces calcula el logaritmo de la raíz cuadrada de la energía E¡ para su aplicación a la entrada negativa del restador 203. El término interior (raíz cuadrada de la energía E¡) tiene una energía no-cero, la energía se incrementa en una pequeña cantidad en el caso que todos los cuadros sean cero para evitar el log (0).

La estimación de la ganancia del libro de códigos fijo en el calculador 201 es lineal en el dominio logarítmico con coeficientes de estimación ao y ai que se encuentran para cada subcuadro por medio de una minimización al cuadrado medio en una base de datos de señal grande (entrenamiento) como se explicará en la siguiente descripción. El único parámetro de estimación 202 en la ecuación, t, denota el parámetro de clasificación para el cuadro n (en una realización, este valor es constante para todas los subcuadros en el cuadro n). Detalles acerca de la clasificación de los cuadros se dan a continuación. Por último, el valor estimado de la ganancia en el ?1 G(l) dominio logarítmico se convierte de nuevo en el dominio lineal ( g¿c ¡ - 10 c0 ) por el calculador 204 y se utiliza en el proceso de búsqueda para el mejor índice de la ganancia del libro de códigos como se explicará en la siguiente descripción.

El superíndice (1) denota el primer subcuadro del cuadro actual n.

Como se explica en la descripción anterior, el parámetro t representativo de la clasificación del cuadro actual se utiliza en el cálculo de la ganancia estimada del libro de códigos fijo gc0. Los diferentes libros de códigos pueden ser diseñados para diferentes clases de señales de voz. Sin embargo, esto aumentará los requisitos para la memoria. Además, la estimación de la ganancia de libro de códigos fijo en los cuadros que siguen al primer cuadro se puede basar en el parámetro de clasificación del cuadro r y las ganancias de libro de códigos adaptativo y fijo disponibles de los subcuadros anteriores en el cuadro actual. La estimación se limita al límite de cuadro para aumentar la robustez frente a borrados de cuadro.

Por ejemplo, los cuadros se pueden clasificar como cuadros callados, sonoros, genéricos, o de transición. Diferentes alternativas se pueden utilizar para la clasificación. Un ejemplo se da más adelante a continuación como una realización ilustrativa y no limitativa. Además, el número de clases de voz puede ser diferente de la que se ha utilizado anteriormente. Por ejemplo, la clasificación puede ser sólo sonoros o callados en una realización. En otra realización más clases pueden agregarse como fuertemente sonoros y fuertemente callados.

Los valores para la estimación del parámetro de clasificación t pueden ser elegidos arbitrariamente. Por ejemplo, para señales de banda estrecha, los valores de parámetro t se establecen en : 1, 3, 5, y 7, para cuadros callados, sonoros, genéricos, y de transición, respectivamente, y para señales de banda ancha, que se establecen en 0, 2, 4, y 6, respectivamente. Sin embargo, otros valores para el parámetro de estimación t pueden ser utilizados para cada clase. La inclusión de esta estimación del parámetro de clasificación t en el diseño y la formación para la determinación de parámetros de estimación se traducirá en una mejor estimación ?? de la ganancia de libro de códigos fijo.

Los subcuadros que siguen del primer subcuadro en un cuadro usan un esquema de estimación ligeramente diferente. La diferencia es, de hecho, que en estos subcuadros, tanto en la ganancia cuantificada del libro de códigos adaptativo y la ganancia cuantificada del libro de códigos fijo del subcuadro anterior (s) en el cuadro actual se utilizan como parámetros de estimación auxiliares para aumentar la eficiencia.

La Figura 3 es un diagrama esquemático de bloques de un estimador 300 para estimar la ganancia de libro de códigos fijo en los subcuadros que siguen del primer subcuadro en un cuadro actual. Los parámetros de estimación incluyen el parámetro de clasificación r y los valores cuantificados (parámetros 301) de ambos las ganancias de libro de códigos adaptativo y fijo de los subcuadros anteriores del cuadro actual. Estos parámetros 301 se designan como gpm, gc{1), gp 2), gc{2), etc. donde el superíndice se refiere al primer, segundo y otros subcuadros anteriores. Una estimación de la ganancia de libro de códigos fijo se calcula y se multiplica por un factor de corrección seleccionado de la ganancia de libro de códigos para producir una ganancia cuantificada de libro de códigos fijo gc, la formación de la ganancia de la contribución fija de la excitación (esta ganancia estimada de libro de códigos fijo es diferente de la del primer subcuadro).

En una forma de realización, un calculador 302 calcula una estimación lineal de la ganancia de libro de códigos fijo de nuevo en el dominio logarítmico y un convertidor 303 convierte la estimación de la ganancia de vuelta al dominio lineal. Las ganancias de libro de códigos adaptativo cuantificadas gpw, gp{2), etc. de los subcuadros anteriores son suministradas al calculador 302 directamente, mientras que las ganancias cuantificadas de libro de códigos fijo gc(1), g -2 etc. de los subcuadros anteriores son suministradas al calculador 302 en el dominio logarítmico a través de un calculador logarítmico 304. Un multiplicador 305 multiplica entonces la ganancia estimada de libro de códigos fijo gc o (que es diferente de la del primera subcuadro) desde el convertidor 303 por el factor de corrección 306, seleccionado a partir de la ganancia de libro de códigos. Como se describe en el párrafo anterior, el multiplicador 305 da salida entonces a una ganancia cuantificada de libro de códigos fijo gc , La formación de la ganancia de la contribución fija de la excitación.

Un primer multiplicador 307 multiplica la excitación adaptativa filtrada 308 del libro de códigos adaptativo por la ganancia cuantificada de libro de códigos adaptativo gp seleccionada directamente de la ganancia de libro de códigos para producir la contribución adaptativa 309 de la excitación. Un segundo multiplicador 310 multiplica el vector de código de innovación filtrada 311 del libro de códigos fijo por la ganancia cuantificada de libro de códigos fijo gc para producir la contribución fija 312 de la excitación. Un sumador 313 suma las contribuciones adaptativas filtradas 309 y fijas filtradas 312 de la excitación juntas para formar la excitación filtrada total 314 para el cuadro actual.

La ganancia estimada de libro de códigos fijo del calculador 302 en el ka subcuadro del cuadro actual en el dominio logarítmico está dada por donde C?J*} = log10(gj*)) es la ganancia cuantificada de libro de códigos fijo en el (k) dominio logarítmico en el subcuadro k, y gp es la ganancia cuantificada de libro de códigos adaptativo en el subcuadro k.

Por ejemplo, en una realización, se utilizan cuatro (4) subcuadros (K= 4) por lo que las ganancias estimadas de libro de códigos fijo, en el dominio logarítmico, en el segundo, tercer, y cuarto subcuadro del calculador 302 están dadas por las siguientes relaciones: C = a0 + a]t + b0G^ + bigM + ¼G<2> + b^g , and G¾> = a0 + axt + b0GÍl) + byg + ¼C¾2> + b,g + bAG + b5gf.

La estimación anterior de la ganancia de libro de códigos fijo se basa tanto en las ganancias cuantificadas adaptativas y fijas del libro de códigos de todos los subcuadros anteriores del cuadro actual. También existe otra diferencia entre el presente esquema de estimación y el que se utiliza en el primer subcuadro. La energía del vector de innovación filtrada desde el libro de códigos fijo no se resta de la estimación lineal de la ganancia de libro de códigos fijo en el dominio logarítmico del calculador 302. La razón proviene de la utilización del libro de códigos adaptativo cuantificado y las ganancias de libro de códigos fijo de los subcuadros anteriores en la ecuación de estimación. En el primer subcuadro, la estimación lineal se lleva a cabo por el calculador 201 asumiendo energía de unidad del vector de innovación. Posteriormente, esta energía se resta para traer la ganancia estimada de libro de códigos fijo al mismo nivel energético como su valor óptimo (o al menos cerca de él). En el segundo y siguientes subcuadros, los valores cuantificados anteriores de la ganancia de libro de códigos fijo ya están en este nivel, por lo que no hay necesidad de tomar la energía del vector de innovación filtrada en consideración. Los coeficientes de estimación a¡ y b¡ son diferentes para cada subcuadro y que se determinan fuera de línea con una base de datos de entrenamiento grande como se describirá más adelante en este documento.

Cálculo de los coeficientes de estimación Un conjunto óptimo de coeficientes de estimación se encuentra en una gran base de datos que contiene las señales de voz limpias, ruidosas y mixtas en varios idiomas y los niveles y con hablantes varoniles y femeniles.

Los coeficientes de estimación se calculan mediante la ejecución del codee con valores no cuantificados óptimos de las ganancias de libro de códigos adaptativo y fijo en la gran base de datos. Se recuerda que las ganancias de libro de códigos adaptativo y fijo no cuantificadas óptimas se encuentran de acuerdo con las ecuaciones (3) y (4).

En la siguiente descripción se asume que la base de datos comprende ?/+1 cuadros, y el índice de cuadro es n = Q,..., N. . El índice de cuadro n se añade a los parámetros utilizados en el entrenamiento que varían a base de un cuadro (clasificación, primera energía de innovación de subcuadro, y las ganancias óptimas de libro de códigos adaptativo y fijo).

Los coeficientes de estimación se encuentran minimizando el error cuadrado medio entre la ganancia de libro de códigos fijo y la ganancia óptima en el dominio logarítmico sobre todos los cuadros en la base de datos.

Para el primer subcuadro, la energía del error cuadrada medio se encuentra por De la ecuación (5), la ganancia estimada de libro de códigos fijo en el primer subcuadro del cuadro n se da por G$(H) = a0 + a]t(n) - log]0(VE )) , después la energía del error cuadrado medio se encuentra por En la ecuación anterior (8), Eest es la energía total (en toda la base de datos) del error entre las ganancias estimadas y las ganancias óptimas del libro de códigos fijo, ambas en el dominio logarítmico. La ganancia óptima del libro de códigos fijo en el primer subcuadro se denota como p( 1 )C 0pt- Como se ha mencionado en la descripción anterior, E¡(n) es la energía del vector de innovación filtrada desde el libro de códigos fijo y G(??) es el parámetro de clasificación del cuadro n. El índice superior (1) se utiliza para denotar el primer subcuadro y n es el índice del cuadro.

El problema de minimización puede ser simplificado mediante la definición de una ganancia normalizada del vector de innovación en el dominio logarítmico. Es decir G¡] n) = log]0(jE? n)) + \og]0(gWpl (n)), n = 0,.., N - \ . (9) La energía total de error se convierte entonces en La solución del problema anteriormente definido MSE (Error Cuadrado Medio) encuentra por medio del siguiente par de derivadas parciales Los valores óptimos de estimación de coeficientes que resultan de las ecuaciones anteriores se dan por La estimación de la ganancia de libro de códigos fijo en eP'primér subcuadro se realiza en el dominio logarítmico y la ganancia estimada de libro de códigos fijo debería estar tan cerca como sea posible a la ganancia normalizada del vector de innovación en el dominio logarítmico, G,(1)(n).

Para el segundo y otros subsecuentes subcuadros, el esquema de estimación es ligeramente diferente. La energía de error se encuentra por donde G . pt - log10(íTc,op/) ¦ Sustituyendo la ecuación (6) en la ecuación (12) obtiene la siguiente Para el cálculo de los coeficientes de estimación en el segundo y siguientes subcuadros de cada cuadro, los valores cuantificados de ambas ganancias de libro de códigos adaptativo y del libro de códigos fijo de los subcuadros anteriores se utilizan en la ecuación anterior ( 13). A pesar de que es posible utilizar las ganancias óptimas no cuantificadas en su lugar, el uso de valores cuantificados conduce a la máxima eficiencia de estimación en todos los subcuadros y por lo tanto a un mejor rendimiento global del cuantificador de ganancia.

Por lo tanto, el número de coeficientes de estimación aumenta a medida que el índice del subcuadro actual es avanzado. La propia cuantificación de ganancia se describe en la siguiente descripción. Los coeficientes de estimación a, y b¡ son diferentes para cada subcuadro, pero los mismos símbolos se utilizan para la simplicidad. Normalmente, se usan el superíndice (<c) asociado a los mismos, o se denominan de forma diferente para cada subcuadro, en donde k es el índice de subcuadro.

La minimización de la función de error en la ecuación ( 13) conduce al siguiente sistema de ecuaciones lineales (14) La solución de este sistema, es decir, el conjunto óptimo de coeficientes de estimación a0, au bo/ - - - »^2k-3/ no se proporciona aquí, ya que conduce a fórmulas complicadas. Por lo general se resuelve por el software matemático equipada con una resolución de ecuaciones lineales, por ejemplo, MATLAB. Esto se realiza más fácilmente fuera de línea y no durante el proceso de codificación.

Para el segundo subcuadro, la ecuación (14) se reduce a Como se ha mencionado anteriormente, el cálculo de los coeficientes de estimación se alterna con ganancia de cuantificación como se muestra en la Figura 4.

Más específicamente, la Figura 4 es un diagrama de bloques esquemático que describe una máquina de estados 400 en que se calculan los coeficientes de estimación (401) para cada subcuadro. El libro de códigos de ganancia está diseñado entonces (402) para cada subcuadro utilizando los coeficientes de estimación calculados. La cuantificación de ganancia (403) para el subcuadro se lleva a cabo a continuación, sobre la base de los coeficientes de estimación calculados y el diseño del libro de códigos de ganancia. La estimación de la propia ganancia de libro de códigos fijo es ligeramente diferente en cada subcuadro, los coeficientes de estimación se encuentran por medio del error cuadrado medio mínimo, y el libro de códigos de ganancia puede ser diseñado mediante el uso del algoritmo KMEANS como se describe, por ejemplo, en MacQueen, JB ( 1967). "Some Methods for classification and Analysis of Multivariate Observations". Actas del quinto Simposio de Berkeley de Estadística Matemática y Probabilidad. Universidad de California Press, págs 281-297, cuyo contenido completo se incorpora aquí como referencia.

Cuantificación de ganancia La Figura 5 es un diagrama de bloques esquemático que describe un cuantificador de ganancia 500.

Antes de la cuantificación de ganancia se supone que tanto la excitación adaptativa filtrada 501 del libro de códigos adaptativo y el vector de código de innovación filtrada 502 del libro de códigos fijo son ya conocidos. La cuantificación de la ganancia en el codificador se lleva a cabo mediante la búsqueda del libro de códigos diseñado de ganancia 503 en el sentido MMSE (Mínimum Mean Square Error - error cuadrado medio mínimo) . Como se describe en la descripción anterior, cada entrada en el libro de códigos de ganancia 503 incluye dos valores: la ganancia cuantificada de libro de códigos adaptativo gp y el factor de corrección ? para la contribución fija de la excitación. La estimación de la ganancia de libro de códigos fijo se lleva a cabo de antemano y la ganancia estimada de libro de códigos fijo gn se usa para multiplicar el factor de corrección ? seleccionado del libro de códigos de ganancia 503. En cada subcuadro, el libro de códigos de ganancia 503 es buscado por completo, es decir, para los índices q~0, ..,Q-1, siendo Q el número de índices del libro de códigos de ganancia. Es posible limitar el rango de búsqueda en el caso de la ganancia cuantificada de libro de códigos adaptativo gp tiene el mandato de estar por debajo de un determinado umbral. Para permitir la reducción del rango de búsqueda, las entradas de libro de códigos se pueden ordenar en orden ascendente según el valor de la ganancia de libro de códigos adaptativo gp.

Haciendo referencia a la Figura 5, la ganancia de libro de códigos de doble entrada 503 se busca y cada índice proporciona dos valores - la ganancia de libro de códigos adaptativo gp y el factor de corrección ?. Un multiplicador 504 multiplica el factor de corrección ? por la ganancia estimada de libro de códigos fijo g^ y el valor resultante se utiliza como la ganancia cuantificada 505 de la contribución fija de la excitación (ganancia cuantificada de libro de códigos fijo). Otra multiplicador 506 multiplica la excitación adaptativa filtrada 505 del libro de códigos adaptativo por la ganancia cuantificada de libro de códigos adaptativo gp a partir del libro de códigos de ganancia 503 para producir la contribución adaptativa 507 de la excitación. Un multiplicador 508 multiplica el vector de código de innovación filtrado 502 por la ganancia cuantificada de libro de códigos fijo 505 para producir la contribución fija 509 de la excitación. Un sumador 510 suma ambas contribuciones, la adaptativa 507 y la fija 509 de la excitación juntas con el fin de formar la excitación total filtrada 511. Un restador 512 resta la excitación total filtrada 511 de la señal objetivo x¡ para producir la señal de error e,. Un calculador 513 calcula la energía 515 de la señal de error e, y lo proporciona de nuevo al mecanismo de búsqueda de libro de código de ganancia. Todos o un subconjunto de los índices del libro de códigos de ganancia 501 se buscan de esta manera y el índice del libro de códigos de ganancia 503 que produce la energía de error más baja 515 se selecciona como el índice ganador y se envía al decodificador.

La cuantificación de ganancia se puede realizar minimizando la energía del error en la ecuación (2). La energía se encuentra por E = e'e = (x - gpy - gcz)'(x - gpy - gcz) . (15) Sustituyendo gc por ygcQ se obtiene la siguiente relación E = cs + SP2 - 2gpCl + Y2gc20c2 - 2rgc0c3 + 2gpygc0c4 (16) donde las constantes o correlaciones c0, c c2 c3, c4 y c5 se calculan como en la ecuación (4) anterior. Las constantes o correlaciones c0/ clt c2, c3/ c4 y c5, y la ganancia estimada se calcula antes de la búsqueda del libro de códigos de ganancia 503, y entonces la energía en la ecuación (16) se calcula para cada índice de libro de códigos (cada conjunto de valores de entrada gp y ?).

El vector de código del libro de códigos de ganancia 503 que conduce a la energía más baja 515 de la señal de error e, es elegido como el vector de código ganador y sus valores de entrada corresponden a los valores cuantificados gp y ?. El valor cuantificado de la ganancia de libro de códigos fijo se calcula entonces como gc = gco-r - La Figura 6 es un diagrama de bloques esquemático de un cuantificador de ganancia equivalente 600 como en la figura 5, la realización de cálculo de la energía E¡ de la señal de error e, utilizando la ecuación (16). Más específicamente, el cuantificador 600 de ganancia comprende un libro de códigos de ganancia 601, una calculadora 602 de constantes o correlaciones, y un calculador 603 de la energía 604 de la señal de error. El calculador 602 calcula las constantes o correlaciones c0, c c2c3, c4 y Cs usando la ecuación (4) y el vector objetivo x, el vector de excitación adaptativa filtrada y desde el libro de códigos adaptativo, y el vector de código fijo filtrado z desde el libro de códigos fijo, donde t indica la transposición de vector. El calculador 603 utiliza la ecuación (16) para calcular la energía E¡ de la señal de error e, a partir de la ganancia estimada de libro de códigos fijo ?<$, las correlaciones c0, Ci, c2c3, c4 y c5 del calculador 602, y la ganancia cuantificada del libro de códigos adaptativo gp y el factor de corrección ? a partir del libro de códigos de ganancia 601. La energía 604 de la señal de error del calculador 603 se suministra de nuevo al mecanismo de búsqueda de libro de códigos de ganancia. Una vez más, todos o un subconjunto de los índices de la ganancia de libro de código 601 se buscan de esta manera y el índice de la ganancia de libro de códigos 601, produciendo el más bajo error de energía 604 se selecciona como el índice ganador y se envía al decodificador.

En el cuantificador de ganancia 600 de la Figura 6, el libro de códigos de ganancia 601 tiene un tamaño que puede ser diferente dependiendo del subcuadro. La mejor estimación de la ganancia de libro de códigos fijo se alcanza más tarde en los subcuadros en un cuadro debido al incremento del número de parámetros de estimación. Por lo tanto, un número menor de bits se puede utilizar en subcuadros posteriores. En una forma de realización, cuatro (4) subcuadros donde se utilizan los números de bits para el libro de códigos de ganancia son 8, 7, 6, y 6 correspondientes a los subcuadros 1, 2, 3, y 4, respectivamente. En otra forma de realización a una velocidad de bits inferior, 6 bits se utilizan en cada subcuadro.

En el decodificador, el índice recibido se utiliza para recuperar los valores de la ganancia cuantificada de libro de códigos adaptativo gp y el factor de corrección ? a partir del libro de códigos de ganancia. La estimación de la ganancia de libro de códigos fijo se realiza de la misma manera que en el codificador, como se describe en la descripción anterior. El valor cuantificado de la ganancia de libro de códigos fijo se calcula por la ecuación gc = gCQ.y · Tanto el vector de código adaptativo y el vector de código de innovación se decodifican a partir del flujo de bits y se convierten en las contribuciones de excitación adaptativas y fijas que se multiplican por las respectivas ganancias de libro de códigos adaptativo y fijo. Ambas contribuciones de excitación se suman para formar la excitación total. La señal de síntesis se encuentra mediante el filtrado de la excitación total a través de un filtro de síntesis LP como se conoce en la técnica de codificación CELP.

Clasificación de señal Diferentes métodos pueden ser usados para determinar la clasificación de un cuadro, por ejemplo parámetro t de la Figura 1. Un ejemplo no limitativo se da en la siguiente descripción, donde los cuadros se clasifican como callados, sonoros, genéricos, o de transición. Sin embargo, el número de clases de voz puede ser diferente del utilizado en este ejemplo. Por ejemplo, la clasificación puede ser sólo sonoros o callados en una realización. En otra realización más clases pueden agregarse como fuertemente sonoro y fuertemente callado.

La clasificación de la señal se puede realizar en tres pasos, donde cada paso se distingue por una clase específica de señal. En primer lugar, un detector de actividad de señal (SAD) distingue entre cuadros de voz activa e inactiva. Si se detecta un cuadro de voz inactiva (señal de ruido de fondo), entonces la cadena de clasificación termina y el cuadro se codifica con la generación de ruido de confort (CNG) . Si se detecta un cuadro de voz activa, el cuadro se somete a un segundo clasificador para distinguir los cuadros callados. Si el clasificador clasifica el cuadro como señal de voz callada, la cadena de clasificación termina y el cuadro se codifica usando un método de codificación optimizada para señales calladas. De lo contrario, el cuadro se procesa a través de un módulo de clasificación de "sonoro estable". Si se clasifica el cuadro como cuadro sonoro estable, entonces el cuadro se codifica usando un método de codificación optimizado para señales sonoras estables. De lo contrario, es probable que el cuadro contenga un segmento de señal no estacionaria tal como un comienzo sonoro o una señal sonora de evolución rápida. Estos cuadros suelen requerir un codificador de propósito general y de alta velocidad de bits para mantener una buena calidad subjetiva. La técnica de cuantificación de ganancia descrito ha sido desarrollado y optimizado para cuadros sonoros y de propósito general estables. Sin embargo, se puede extender fácilmente para cualquier otra clase de señal.

Enseguida, se describirá la clasificación de cuadros de señal callada y sonora.

Las partes calladas de la señal de sonido se caracterizan por la falta de componente periódico y se pueden dividir en cuadros más inestables, donde la energía y el espectro cambian rápidamente, y cuadros estables donde estas características permanecen relativamente estables. La clasificación de los cuadros callados utiliza los siguientes parámetros: • medida de voz rx , calculado como una correlación normalizada promedio; • medida de inclinación espectral promedio ( e, ) ; • incremento de energía a corto plazo máxima a bajo nivel ( e, ) para detectar de manera eficiente segmentos de señal explosivos; · variación de energía a corto plazo máxima {dE) utilizada para evaluar la estabilidad del cuadro; • estabilidad de tono para distinguir la música de la señal callada como se describe en [Jelinek, M., Vaillancourt, T., Gibbs, J., "G.718 : A new embedded speech and audio coding standard with high resilience to error- prone transmission channels", En IEEE Communications Magazine, vol. 47, pp. 117-123, octubre de 2009 ] Cuyo contenido completo se incorpora aquí como referencia, y • energía del cuadro relativa (£rei) para detectar señales de muy baja energía.

Medida de voz La correlación normalizada, que se utiliza para determinar la medida de voz, se calcula como parte del análisis de tono de bucle abierto. En el arte de la codificación CELP, el módulo de búsqueda de bucle abierto generalmente da salida de dos estimaciones por cuadro. Aquí, también se utiliza para dar salida a las medidas de correlación normalizadas. Estas correlaciones normalizadas se calculan en una señal ponderada y una señal ponderada pasada en el retardo de tono en bucle abierto. La señal de voz ponderada sn(n) se calcula utilizando un filtro de ponderación perceptual. Por ejemplo, se utiliza un filtro de ponderación perceptual con denominador fijo, adecuado para señales de banda ancha. Un ejemplo de una función de transferencia del filtro de ponderación perceptual se da por la siguiente relación: donde A(z) es una función del filtro de transferencia de la predicción lineal (LP) calculado por medio del algoritmo de Levinson-Durbin y está dada por la siguiente relación Análisis LP y el análisis de tono en bucle abierto son bien conocidos en la técnica de codificación CELP y, en consecuencia, no se describirán con más detalle en la presente descripción.

La medida de voz 7X se define como una correlación normalizada promedio dada por la siguiente relación : C norm = -(C (dn) + C norm (d 1.) + C norm (a< l,)')' donde Cn0rm(Gfo)# Cnw7n(c/i) y Cnorm(d2) son, respectivamente, la correlación normalizada de la primera mitad del cuadro actual, la correlación normalizada de la segunda mitad del cuadro actual, y la correlación normalizada del pronóstico (el comienzo del siguiente cuadro). Los argumentos de las correlaciones son los rezagos de tono en bucle abierto.

Inclinación espectral La inclinación espectral contiene información acerca de una distribución de frecuencias de la energía. La inclinación espectral se puede estimar en el dominio de la frecuencia como una relación entre la energía se concentra en las frecuencias bajas y la energía se concentra en las altas frecuencias. Sin embargo, se puede también calcularse de diferentes maneras, tales como una proporción entre los dos primeros coeficientes de autocorrelación de la señal.

La energía en las frecuencias altas y frecuencias bajas se calcula siguiendo las bandas críticas perceptivas como se describe en [J.D. Johnston, "Transform Coding of Audio Signáis Using Perceptual Noise Criteria," IEEE Journal on Selected Areas in Communications, vol. 6, no. 2, pp. 314-323, February 1988] cuyo contenido completo se incorpora aquí por referencia. La energía en las altas frecuencias se calcula como el promedio de energía de las dos últimas bandas críticas con la siguiente relación : donde ECB(i) es la energía de la banda crítica de a banda y bmax es la última banda crítica. La energía en las bajas frecuencias se calcula como el promedio de energía de las primeras 10 bandas críticas con la siguiente relación : donde í?m¡n es la primera banda crítica.

Las bandas críticas medias están excluidas del cálculo, ya que no tienden a mejorar la distinción entre los cuadros con alta concentración de energía en las frecuencias bajas (generalmente sonoras) y con alta concentración de energía en las frecuencias altas (generalmente calladas). Entre las dos, el contenido de energía no es característico de cualquiera de las clases comentadas más adelante y aumenta la confusión de decisión.

La inclinación espectral se da por donde Nh y N¡ son, respectivamente, las energías de ruido promedio en las dos últimas bandas críticas y las primeras 10 bandas críticas, calculadas de la misma manera como Eh y E, . Las energías de ruido estimadas se han añadido a la computación de inclinación para dar cuenta de la presencia de ruido de fondo. El cálculo de la inclinación espectral se lleva a cabo dos veces por cuadro y la inclinación espectral promedia se calcula, la que se utiliza después en la clasificación de cuadro callado. Es decir donde e0|d es la inclinación espectral en la segunda mitad del cuadro anterior. incremento máximo de energía a corto plazo a bajo nivel El incremento máximo de energía a corto plazo a bajo nivel dEO se evalúa en la señal de sonido de entrada s(n), donde n=0 corresponde a la primera muestra del cuadro actual. La energía de la señal se evalúa dos veces por subcuadro. Suponiendo, por ejemplo, el escenario de cuatro subcuadros por cuadro, entonces la energía se calcula 8 veces por cuadro. Si la longitud del cuadro total es, por ejemplo, 256 muestras, cada uno de estos segmentos cortos puede tener 32 muestras. En el cálculo, también se toman en consideración las energías a corto plazo de las últimas 32 muestras del cuadro anterior y las primeras 32 muestras del cuadro siguiente. Las energías a corto plazo se calculan utilizando las siguientes relaciones: donde j= -1 y j= 8 corresponden al final del cuadro anterior y el comienzo del cuadro siguiente, respectivamente. Otro conjunto de nueve energías a corto plazo se calcula al desplazar los índices de señal en la ecuación anterior en 16 muestras mediante la siguiente relación : E<2)0-) = max(52(/ + 32; - 16)) , 7 Para las energías que sean lo suficientemente bajas, es decir, que cumplen la condición 101og(¾)(y)) < 37 , se calcula la siguiente proporción para el primer conjunto de energías y se repite el mismo cálculo para Esl U) con j= 0,..,7 para obtener dos conjuntos de proporciones rat(1) y ratm . El único máximo en estos dos conjuntos se busca por que es el incremento máximo de energía a corto plazo a bajo nivel.

Variación máxima de energía a corto plazo Este parámetro dE es similar al incremento máximo de energía a corto plazo a bajo nivel con la diferencia de que la condición de bajo nivel no se aplica. Por lo tanto, el parámetro se calcula como el máximo de los siguientes cuatro valores: max( "Q-),Ei;) - -l)) for/=l,..,7 min(EJ(;> ), E( > - l)) m«( 2)(y), 2)o-i)) for/=l,..,8. min( 2)(7), 2> -l)) Clasificación de señal callada La clasificación de los cuadros de señal callada se basa en los parámetros descritos anteriormente, a saber: la medida de voz rx , la inclinación espectral promedio et , el incremento máximo de energía a corto plazo a nivel bajo dEO y la variación máxima de energía a corto plazo dE. El algoritmo se ve además apoyado por el parámetro de estabilidad tonal, la bandera SAD y la energía del cuadro relativa calculada durante la fase de actualización de la energía del ruido. Para obtener información más detallada acerca de estos parámetros, véase, por ejemplo [Jelinek, M., et al., "Advances in source-controlled variable bitrate wideband speech coding", Taller especial en MAUI (SWIM): Lecciones por masters en el procesamiento de voz, Maui, Hawaii, 12-14 de enero de 2004] de los cuales el contenido completo se incorpora a la presente por referencia.

La energía del cuadro relativa se encuentra por Erel - El - E) donde Et es la energía total del cuadro (en dB) y Ef es la energía a largo plazo promedio del cuadro, actualizado en cada cuadro activo Ef = 0.99Ef - 0. lEt .

Las reglas de clasificación callada de señales de banda ancha se resumen a continuación [(( Fx < 0.695 ) Y ( e, < 4.0 )) O (£„, < -14)] Y [último cuadro INACTIVO O SIN VOZ O ((eviej0<2.4) Y (rx(0) <0,66))] [dEQ < 250] Y [ef(l) < 2.7] Y NO [( tonal_stab¡l¡ty Y ({ rx > 0.52 ) Y ( e, > 0.5 )) O ( e, > 0.85 )) Y (£re, > -14) Y SAD bandera establecida en 1] La primera línea de esta condición está relacionada con las señales de baja energía y señales con baja correlación que concentran su energía en las frecuencias altas. La segunda línea cubre las compensaciones sonoras, la tercera línea cubre los segmentos de señal explosivos y la cuarta línea está relacionada con inicios sonoros. La última línea distingue las señales musicales que se declararon de otra forma como calladas.

Si se cumplen las condiciones combinadas la clasificación termina declarando el cuadro actual como callado.

Clasificación de señal sonora Si un cuadro no se clasifica como cuadro inactivo o cuadro callado, a continuación, se prueba si se trata de un cuadro sonoro estable. La regla de decisión se basa en la correlación normalizada Fx en cada subcuadro (con 1/4 de resolución de submuestra), la inclinación espectral media et y las estimaciones de tono en bucle abierto en todos los subcuadros (con 1/4 resolución de submuestra).

El procedimiento de estimación de tono en bucle abierto calcula tres rezagos de tono en bucle abierto: d0, d y d2, correspondiente a la primera mitad del cuadro, la segunda mitad del cuadro y el pronóstico (primera mitad del cuadro del cuadro siguiente). Con el fin de obtener una información precisa del tono en todos los cuatro subcuadros, se calcula 1/4 de refinamiento del tono fraccional de resolución de muestra. Este refinamiento se calcula sobre una señal de entrada ponderada perceptivamente swct[n) (por ejemplo, la señal de sonido de entrada s(n) filtrada a través del filtro de ponderación perceptual que se ha descrito anteriormente). Ál comienzo de cada subcuadro de un análisis de correlación a corto plazo (40 muestras) con la resolución de 1 de la muestra se lleva a cabo en, el intervalo de (-7, +7) usando los siguientes retrasos: d0 para el primer y segundo subcuadros y dx para el tercer y cuarto subcuadros. Las correlaciones se interpolan a continuación^ en torno a sus máximos en las posiciones fracciónales dmax - 3/4, dmax - 1/2, dmax -. 1/4, dmax , dmax + 1/4, dmax + 1/2, tfmax + 3/4. El valor que produce la correlación máxima es elegido como el retardo de tono refinado. .

Marque retardos de tono de bucle abierto refinados anotados en los cuatro subcuadros como 7(0), 7(1), 7(2) y 7(3) y sus correspondientes correlaciones normalizadas como C(0), C(l), C(2) y C(3). Entonces, la condición de clasificación expresada de la señal sonora está dada por , [C(0) > 0.605] Y [C(l) > 0.605] Y [C(2) > 0.605] Y [C(3) > 0.605] Y [et>4] Y [|7-(1) - T(0)| ] < 3 Y [|7(2) - 7(1)| ] < 3Y [|7(3) - 7(2)| ] < 3 La condición de clasificación de la señal sonora expresada arriba indica que la correlación normalizada debe ser lo suficientemente alta en todos los subcuadros, las estimaciones de tono no deben divergir a lo largo del cuadro y la energía debe ser concentrada en las frecuencias bajas. Si se cumplen estas condiciones, la clasificación termina declarando el cuadro actual como sonoro. De lo contrario el cuadro actual se declara como genérico.

Aunque la presente invención se ha descrito en la descripción anterior con referencia a realizaciones ilustrativas no restrictivas de la misma, estas realizaciones pueden ser modificadas a voluntad dentro del alcance de las reivindicaciones adjuntas sin apartarse del espíritu y la naturaleza de la presente invención.

Claims

REIVINDICACIONES Un dispositivo para cuantificar una ganancia de una contribución fija de una excitación en un cuadro, incluyendo subcuadros, de una señal de sonido codificada, que comprende: una entrada para un parámetro representativo de una clasificación del cuadro; un estimador de la ganancia de la contribución fija de la excitación en un subcuadro de dicho cuadro, en el que el estimador se suministra con el parámetro representativo de la clasificación de la cuadro; y un cuantificador predictivo de la ganancia de la contribución fija de la excitación, en el subcuadro, utilizando la ganancia estimada. El dispositivo para cuantificar de conformidad con la reivindicación 1, en donde el cuantificador predictivo determina un factor de corrección para la ganancia estimada como una cuantificación de la ganancia de la contribución fija de la excitación, y en el que la ganancia estimada multiplicada por el factor de corrección da la ganancia cuantificada de la contribución fija de la excitación. El dispositivo para cuantificar de conformidad con la reivindicación 1 o 2, en donde el estimador comprende, para un primer subcuadro del cuadro, un calculador de una primera estimación de la ganancia de la contribución fija de la excitación en respuesta al parámetro representativo de la clasificación del cuadro, y un restador de una energía de un vector de código de innovación filtrado a partir de un libro de códigos fijo de la primera estimación para obtener la ganancia estimada. El dispositivo para cuantificar de conformidad con la reivindicación 2, en donde el estimador comprende, para un primer subcuadro del cuadro : un calculador de una estimación lineal de la ganancia de la contribución fija de la excitación en un dominio logarítmico en respuesta al parámetro representativo de la clasificación del cuadro; un restador de una energía de un vector de código de innovación filtrado a partir de un libro de códigos fijo en el dominio logarítmico de la estimación de ganancia lineal del calculador, el restador mientras produce una ganancia en el dominio logarítmico; un convertidor de la ganancia en el dominio logarítmico desde el restador al dominio lineal para producir la ganancia estimada; y un multiplicador de la ganancia estimada por el factor de corrección para producir la ganancia cuantificada de la contribución fija de la excitación. El dispositivo para cuantificar de conformidad con cualquiera de las reivindicaciones 1 a 4, en donde el estimador, para cada subcuadro de dicho cuadro siguiente al primer subcuadro, responde al parámetro representativo de la clasificación del cuadro y las ganancias de las contribuciones adaptativas y fijas de la excitación de al menos una subcuadro anterior del cuadro para estimar la ganancia de la contribución fija de la excitación. El dispositivo para cuantificar de conformidad con la reivindicación 5, en donde el estimador comprende, para cada subcuadro siguiente al primer subcuadro, un calculador de una estimación lineal de la ganancia de la contribución fija de la excitación en el dominio logarítmico y un convertidor de la estimación lineal en el dominio logarítmico en el dominio lineal para producir la ganancia estimada. 7. El dispositivo para cuantificar de conformidad con la reivindicación 6, en donde las ganancias de las contribuciones adaptativas y fijas de la excitación de al menos un subcuadro anterior del cuadro son ganancias cuantificadas y las ganancias cuantificadas de las contribuciones de adaptación de la excitación son suministradas directamente al calculador mientras que las ganancias cuantificadas de las contribuciones fijas de la excitación son suministradas al calculador en el dominio logarítmico a través de un calculador logarítmico. 8. El dispositivo para cuantificar de conformidad con la reivindicación 3 o 4, en donde el calculador de la estimación de la ganancia de la contribución fija de la excitación utiliza en relación con coeficientes de estimación de parámetros de clasificación determinados usando una base de datos de entrenamiento grande. 9. El dispositivo para cuantificar de conformidad con la reivindicación 6 o 7, en donde el calculador de una estimación lineal de la ganancia de la contribución fija de la excitación en el dominio logarítmico utiliza en relación con el parámetro de clasificación del cuadro y las ganancias de las contribuciones adaptativas y fijas de la excitación de al menos un subcuadro anterior, coeficientes de estimación que son diferentes para cada subcuadro y se determinan utilizando una base de datos de entrenamiento grande. 10. El dispositivo para cuantificar de conformidad con cualquiera de las reivindicaciones 1 a 9, en donde el estimador utiliza, para la estimación de la ganancia de la contribución fija de excitación, los coeficientes de estimación diferentes para cada subcuadro del cuadro. 11. El dispositivo para cuantificar de conformidad con cualquiera de las reivindicaciones 1 a 10, en donde el estimador delimita la estimación de la ganancia de la contribución fija de la excitación en el cuadro para aumentar la robustez contra el borrado del cuadro. 12. Un dispositivo para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de una excitación en un cuadro de una señal de sonido codificada, que comprende: un cuantificador de la ganancia de la contribución adaptativa de la excitación; y el dispositivo para cuantificar la ganancia de la contribución fija de la excitación como se define en cualesquiera de las reivindicaciones 1 a 11. 13. El dispositivo para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de la excitación de conformidad con la reivindicación 12, que comprende un libro de códigos de ganancia que tiene entradas de las cuales cada una comprende la ganancia cuantificada de la contribución adaptativa de la excitación y un factor de corrección para la ganancia estimada. 14. El dispositivo para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de la excitación de conformidad con la reivindicación 13, en donde el cuantificador de la ganancia de la contribución adaptativa de la excitación y el cuantificador predictivo de la ganancia de la contribución fija de la excitación buscan el libro de códigos de ganancia y seleccionan la ganancia de la contribución adaptativa de la excitación de una entrada del libro de códigos de ganancia y el factor de corrección de la misma entrada del libro de códigos de ganancia como una cuantificación de la ganancia de la contribución fija de la excitación. 15. El dispositivo para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de la excitación de conformidad con la reivindicación 13, que comprende un diseñador del libro de códigos de ganancia para cada subcuadro del cuadro. 16. El dispositivo para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de la excitación de conformidad con la reivindicación 15, en donde el libro de códigos de ganancia tiene diferentes tamaños en diferentes subcuadros del cuadro. 17. El dispositivo para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de la excitación de conformidad con la reivindicación 14, en donde el cuantificador de la ganancia de la contribución adaptativa de la excitación y el cuantificador predictivo de la ganancia de la contribución fija de la excitación buscan el libro de código de ganancia completamente en cada subcuadro. 18. Un dispositivo para recuperar una ganancia cuantificada de una contribución fija de una excitación en un subcuadro de un cuadro, que comprende: un receptor de un índice de libro de códigos de ganancia; un estimador de la ganancia de la contribución fija de la excitación en el subcuadro, en donde el estimador se suministra con un parámetro representativo de una clasificación del cuadro; un libro de códigos de ganancia para suministrar un factor de corrección en respuesta al índice de libro de códigos de ganancia; y un multiplicador de la ganancia estimada por el factor de corrección para proporcionar una ganancia cuantificada de la contribución fija de la excitación en dicho subcuadro. 19. El dispositivo para recuperar una ganancia cuantificada de una contribución fija de una excitación de conformidad con la reivindicación 18, en donde el estimador comprende, por un primer subcuadro del cuadro, un calculador de una primera estimación de la ganancia de la contribución fija de la excitación en respuesta al parámetro representativo de la clasificación del cuadro, y un restador de una energía de un vector de código de innovación filtrado a partir de un libro de códigos fijo de la primera estimación para obtener la ganancia estimada. 20. El dispositivo para recuperar una ganancia cuantificada de una contribución fija de una excitación de conformidad con la reivindicación 18, en donde el estimador, para cada subcuadro de dicho cuadro siguiente al primer subcuadro, es sensible al parámetro representativo de la clasificación del cuadro y las ganancias de las contribuciones adaptativas y fijas de la excitación de al menos un subcuadro anterior del cuadro para estimar la ganancia de la contribución fija de la excitación. 21. El dispositivo para recuperar una ganancia cuantificada de una contribución fija de una excitación de conformidad con cualesquiera de las reivindicaciones 18 a 20, en donde el estimador utiliza, para la estimación de la ganancia de la contribución fija de la excitación, coeficientes de estimación diferentes para cada subcuadro de la cuadro. 22. El dispositivo para recuperar una ganancia cuantificada de una contribución fija de una excitación de conformidad con cualesquiera de las reivindicaciones 18 a 21, en donde el estimador delimita la estimación de la ganancia de la contribución fija de la excitación en el cuadro para aumentar la robustez contra borrado del cuadro. 23. Un dispositivo para recuperar ganancias cuantificadas de contribuciones adaptativas y fijas de una excitación en un subcuadro de un cuadro, que comprende: un receptor de un índice de libro de códigos de ganancia; un estimador de la ganancia de la contribución fija de la excitación en el subcuadro, en donde el estimador se suministra con un parámetro representativo de la clasificación del cuadro; un libro de códigos de ganancia para el suministro de la ganancia cuantificada de la contribución adaptativa de la excitación y un factor de corrección para el subcuadro en respuesta al índice de libro de códigos de ganancia; y un multiplicador de la ganancia estimada por el factor de corrección para proporcionar una ganancia cuantificada de contribución fija de la excitación en el subcuadro. 24. El dispositivo para recuperar ganancias cuantificadas de contribuciones adaptativas y fijas de una excitación de conformidad con la reivindicación 23, en donde el libro de códigos de ganancias comprende entradas de las cuales cada una comprende la ganancia cuantificada de la contribución adaptativa de la excitación y el factor de corrección para la ganancia estimada. 25. El dispositivo para recuperar ganancias cuantificadas de contribuciones adaptativas y fijas de una excitación de conformidad con la reivindicación 23 o 24, en donde la ganancia del libro de códigos de ganancias tiene diferentes tamaños en diferentes subcuadros del cuadro. 26. Un método para cuantificar una ganancia de una contribución fija de una excitación en un cuadro, incluyendo subcuadros, de una señal de sonido codificada, el método comprende los pasos de: recibir un parámetro representativo de una clasificación del cuadro; estimar la ganancia de la contribución fija de la excitación en un subcuadro de dicho cuadro, usando el parámetro representativo de la clasificación del cuadro; y cuantificar de manera predictiva la ganancia de la contribución fija de la excitación, en la subcuadro, usando la ganancia estimada. 27. El método para cuantificar de conformidad con la reivindicación 26, en donde el paso de cuantificar de manera predictiva la ganancia de la contribución fija de la excitación comprende el paso de determinar un factor de corrección para la ganancia estimada como una cuantificación de la ganancia de la contribución fija de la excitación, y en donde la ganancia estimada multiplicada por el factor de corrección da la ganancia cuantificada de la contribución fija de la excitación. 28. El método para cuantificar de conformidad con la reivindicación 26 o 27, en donde el paso de estimar la ganancia de la contribución fija de la excitación comprende, para un primer subcuadro del cuadro, los pasos de: calcular una primera estimación de la ganancia de la contribución fija de la excitación en respuesta para el parámetro representativo de la clasificación del cuadro; y restar una energía de un vector de código de innovación filtrado a partir de un libro de códigos fijo de la primera estimación para obtener la ganancia estimada. 29. El método para cuantificar de conformidad con la reivindicación 27, en donde el paso de estimar la ganancia de la contribución fija de la excitación comprende, para un primer subcuadro del cuadro, los pasos de: calcular una estimación lineal de la ganancia de la contribución fija de la excitación en un dominio logarítmico en respuesta al parámetro representativo de la clasificación del cuadro; restar una energía de un vector de código de innovación filtrado a partir de un libro de códigos fijo en el dominio logarítmico de la estimación de ganancia lineal, para producir una ganancia en el dominio logarítmico; convertir la ganancia en el dominio logarítmico de la resta al dominio lineal para producir la ganancia estimada; y multiplicar la ganancia estimada por el factor de corrección para producir la ganancia cuantificada de la contribución fija de la excitación. 30. El método para cuantificar de conformidad con cualesquiera de las reivindicaciones 26 a 29, en donde el pasos de estimar la ganancia de la contribución fija de la excitación, para cada subcuadro de dicho cuadro que sigue al primer subcuadro, es sensible al parámetro representativo de la clasificación del cuadro y las ganancias de las contribuciones adaptativas y fijas de la excitación de al menos una subcuadro anterior del cuadro para estimar la ganancia de la contribución fija de la excitación. 31. El método para cuantificar de conformidad con la reivindicación 30, en donde el paso de estimar la ganancia de la contribución fija de la excitación comprende, para cada subcuadro siguiente al primer subcuadro, los pasos de: calcular una estimación lineal de la ganancia de la contribución fija de la excitación en el dominio logarítmico; y convertir la estimación lineal en el dominio logarítmico en el dominio lineal para producir la ganancia estimada. 32. El método para cuantificar de conformidad con la reivindicación 31, en donde las ganancias de las contribuciones adaptativas de la excitación de al menos un subcuadro anterior del cuadro son ganancias cuantificadas y las ganancias de las contribuciones fijas de la excitación de al menos una subcuadro. anterior del, cuadro son ganancias cuantificadas en el dominio logarítmico. , . . .. . . 33. El método para cuantificar de conformidad con la reivindicación 28 o 29, en donde el pasos de calcular la estimación de la ganancia de la contribución fija comprende el paso de usar en relación con los coeficientes de estimación de parámetros de clasificación determinados usando una gran base de datos de entrenamiento. 34. El método para cuantificar de conformidad cor\ la reivindicación 31 o 32, en donde el paso de calcular una estimación lineal de la ganancia de la contribución fija de la excitación en el dominio logarítmico comprende los pasos de: usar en relación con el parámetro de clasificación del cuadro y las ganancias de las contribuciones adaptativas y fijas de la excitación de al menos uno coeficientes de estimación del subcuadro anterior que son diferentes para cada subcuadro; y usar de manera determinada una base de datos grande de entrenamiento. 35. El método para cuantificar de conformidad con cualesquiera de las reivindicaciones 26 a 34, en donde el paso de estimar la ganancia de la contribución fija de la excitación comprende el paso de usar, para la estimación de la ganancia de la contribución fija de la excitación, los coeficientes de estimación diferentes para cada subcuadro del cuadro. 36. El método para cuantificar de conformidad con cualesquiera las reivindicaciones 26 a 35, en donde el paso de estimar la ganancia de la contribución fija de la excitación se delimita en el cuadro para aumentar la robustez contra borrado del cuadro. 37. Un método para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de una excitación en una cuadro de una señal de sonido codificada, el método comprende los pasos de: cuantificar la ganancia de la contribución adaptativa de la excitación; y cuantificar la ganancia de la contribución fija de la excitación usando el método como se define en cualesquiera de las reivindicaciones 26 a 36. 38. El método para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de una excitación de conformidad con la reivindicación 37, además comprende el paso de utilizar un libro de códigos de ganancia que tiene entradas de las cuales cada una que comprende la ganancia cuantificada de la contribución adaptativa de la excitación y un factor de corrección para la ganancia estimada. 39. El método para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de una excitación de conformidad con la reivindicación 38, en donde el paso de cuantificar la ganancia de la contribución adaptativa de la excitación y cuantificar la ganancia de la contribución fija de la excitación comprende los pasos de : buscar del libro de código de ganancia; y seleccionar la ganancia de la contribución adaptativa de la excitación de una entrada del libro de códigos de ganancia y el factor de corrección de la misma entrada del libro de códigos de ganancia como una cuantificación de la ganancia de la contribución fija de la excitación. 40. El método para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de una excitación de conformidad con la reivindicación 38, que comprende el paso de diseñar el libro de códigos de ganancia para cada subcuadro del cuadro. 41. El método para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de una excitación de conformidad con la reivindicación 40, en donde el libro de códigos de ganancia tiene diferentes tamaños en diferentes subcuadros del cuadro. 42. El método para cuantificar conjuntamente ganancias de contribuciones adaptativas y fijas de una excitación de conformidad con la reivindicación 39, en donde el paso de cuantificar la ganancia de la contribución adaptativa de la excitación y cuantificar la ganancia de la contribución fija de la excitación comprende el paso de buscar el libro de códigos de ganancia por completo en cada subcuadro. 43. Un método para recuperar una ganancia cuantificada de una contribución fija de una excitación en un subcuadro de un cuadro, el método comprende los pasos de: recibir un índice de libro de códigos de ganancia; estimar la ganancia de la contribución fija de la excitación en la subcuadro, utilizando un parámetro representativo de una clasificación del cuadro; suministrar, a partir de un libro de códigos de ganancia y para el subcuadro, un factor de corrección en respuesta al índice de libro de códigos de ganancia; y . · · . ·· . multiplicar la ganancia estimada por el factor de corrección para proporcionar una ganancia cuantificada de la contribución fija de la excitación en dicho subcuadro. . ..... 44. El método para recuperar una ganancia cuantificada de upa contribución fija de una excitación de conformidad con la reivindicación 43, en. donde el paso de estimar de la ganancia de la contribución fija de la excitación comprende, para un primer subcuadro del cuadro, los pasos de: calcular una primera estimación de la ganancia de la contribución fija de la excitación en respuesta al parámetro representativo de la clasificación del cuadro; restar una energía de un vector de código de innovación filtrado a partir de un libro de códigos fijo de la primera estimación para obtener la ganancia estimada. 45. El método para recuperar una ganancia cuantificada de una contribución fija de una excitación de conformidad con la reivindicación 43, en donde el paso de estimar la ganancia de la contribución fija de la excitación comprende, en cada subcuadro de dicho cuadro que sigue al primer subcuadro, el pasos de usar el parámetro representativo de la clasificación del cuadro y las ganancias de las contribuciones adaptativas y fijas de la excitación de al menos una subcuadro anterior del cuadro para estimar la ganancia de la contribución fija de la excitación. 46. El método para recuperar una ganancia cuantificada de una contribución fija de una excitación de conformidad con cualesquiera de las reivindicaciones 43 a 45, en donde el paso de estimar la ganancia de la contribución fija de la excitación comprende el paso de usar coeficientes de estimación diferentes para cada subcuadro del cuadro. 47. El método para recuperar una ganancia cuantificada de una contribución fija de una excitación de conformidad con cualesquiera de las reivindicaciones 43 a 46, en donde además comrpende el pasos de delimitar la estimación de la ganancia de la contribución fija de la excitación en el cuadro para aumentar la robustez contra borrado del cuadro. 48. Un método para recuperar ganancias cuantificadas de contribuciones adaptativas y fijas de una excitación en un subcuadro de un cuadro, el método comprende los pasos de: recibir un índice de libro de códigos de ganancia; estimar la ganancia de la contribución fija de la excitación en el subcuadro, utilizando un parámetro representativo de una clasificación del cuadro; suministrar, a partir de un libro de códigos de ganancia y para el subcuadro, la ganancia cuantificada de la contribución adaptativa de la excitación y un factor de corrección en respuesta al índice de libro de códigos de ganancia; y multiplicar la ganancia estimada por el factor de corrección para proporcionar una ganancia cuantificada de contribución fija de la excitación en el subcuadro. 49. El método para recuperar ganancias cuantificadas de contribuciones adaptativas y fijas de una excitación de conformidad con la reivindicación 48, en donde el libro de códigos de ganancia comprende entradas de la cuales cada una comprende la ganancia cuantificada de la contribución adaptativa de la excitación y el factor de corrección para la ganancia estimada. 50. El método para recuperar ganancias cuantificadas de contribuciones adaptativas y fijas de una excitación de conformidad con las reivindicaciones 48 y 49, en donde el libro de códigos de ganancias tiene diferentes tamaños en diferentes subcuadros del cuadro.