MXPA01002144A - Un criterio adaptable para codificacion de voz - Google Patents

Un criterio adaptable para codificacion de voz

Info

Publication number
MXPA01002144A
MXPA01002144A MXPA/A/2001/002144A MXPA01002144A MXPA01002144A MX PA01002144 A MXPA01002144 A MX PA01002144A MX PA01002144 A MXPA01002144 A MX PA01002144A MX PA01002144 A MXPA01002144 A MX PA01002144A
Authority
MX
Mexico
Prior art keywords
signal
voice
factor
original
speech
Prior art date
Application number
MXPA/A/2001/002144A
Other languages
English (en)
Inventor
Roar Hagen
Erik Ekudden
Original Assignee
Telefonaktieboiaget Lm Ericsson (Publ)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktieboiaget Lm Ericsson (Publ) filed Critical Telefonaktieboiaget Lm Ericsson (Publ)
Publication of MXPA01002144A publication Critical patent/MXPA01002144A/es

Links

Abstract

La presente invención se refiere a la producción de una señal de voz original una pluralidad de parámetros (gaQ gfQ) a partir de los cuales se puede reconstrucción una aproximación de la señal de voz original, se genera una señal adicional en respuesta a la señal de voz original, cuya señal adicional estádestinada a representar la señal de voz original. Por lo menos uno de los parámetros estádeterminado utilizando primera y segunda diferencias entre la señal de voz original y la señal adicional. La primera diferencia es una diferencia entre una forma de onda asociada con la señal de voz original y una forma de onda asociada con la señaladicional, y la segunda diferencia es una diferencia entre un parámetro de energía derivado a partir de la señal de voz original y un parámetro de energía correspondiente asociado con la señal adicional.

Description

?- .a-?ng from an original specch signal a p\ura_icy of paramcrcr. (gJQ.gfq) from u-rncn an approxirna on of thc ordinal s? j i GI_ rc-consiruacd. a tuphcr gnal is gcncralcd in response to trie original specch ngnal. *hicn furen r .?¿r>ol ?= meen.. •a .• isiíidl specch signal. AÍ leait onc of iric papamcccrs is dcicanmc-d (69, 71) using rípst and sccond oiffcrrnccs t.-r. .-- .- c- r .gn dt.d ?r? fu ticr -igna! TTic f ? diffcrcncc is a diffcrcncc ctt->ccn a v_avcform aSSo t-J •. iiíi (tic opgin.-i', |» , ,- _ -j forrr, ?s.oci.tcd u.?r? me furr er signal, and thc sccond dit'fcrcncc ¡s a diffcrcricc bcs ccn an cncr y _rj '.i o--. - c.r'gi'iül specch signal and a corre=pond?ng cncrgy param ter assoctated Í¡ÜÍ thc t ph r signal.
UN CRITERIO ADAPTABLE PARA CODIFICACIÓN DE VOZ CAMPO DE LA INVENCIÓN La invención se refiere de manera general a la codificación de voz y, de manera más particular a criterios de codificación mejorados para acomodar señales similares a ruido en velocidades de bitio reducidas.
ANTECEDENTES DE LA INVENCIÓN La mayoría de los codificadores de voz modernos se basan en alguna forma del modelo para generación de la señal de voz codificada. Los parámetros y señales del modelo son cuantificados y la información que describen es transmitida sobre el canal. El modelo decodificador dominante en las aplicaciones de telefonía celular es la tecnología de Pronóstico en Línea Urgente del Código (CELP). Un descodificador CELP convencional está ilustrado en la Figura 1. La voz codificada es generada mediante una alimentación de señal de excitación a través del filtro de síntesis de todos los polos con un orden típico de 10. La señal de excitación es formada como una suma de dos señales ca y cf, las cuales son capturadas a partir de códigos de cifrado y descifrado respectivos (uno fijo y otro adaptable) y multiplicados subsecuentemente por los factores de ganancia adecuados ga y gf. Las señales de los códigos de cifrado y descifrado son típicamente de una longitud de 5 ms (una subestructura) considerando que el filtro de síntesis es actualizado comúnmente cada 20 ms (una estructura). Los parámetros asociados con el modelo CELP son los coeficientes del filtro de síntesis, los registros del código de cifrado y descifrado y los factores de ganancia. En la Figura 2, se describe un codificador CELP convencional. Una repetición del descodificador CELP (FIGURA 1) se usa para generar las señales codificadas para cada subestructura. La señal codificada es comparada con la señal no codificada (digitalizada) en 21 y una señal de error ponderado se usa para controlar el proceso de codificación. El filtro de síntesis está determinado utilizando el pronóstico lineal (LP). Este procedimiento de codificación convencional es referido como un análisis por síntesis de pronóstico lineal (LPAS). Como se comprenderá a partir de la descripción anterior, los codificadores LPAS emplean la comparación de forma de onda en un dominio de voz ponderado, es decir, la señal de error es filtrada con un filtro de ponderación. Esto puede expresarse como la reducción al mínimo del siguiente criterio de error cuadrático: Dw - | JSvCS., I IH I -S-W-H-lga-ca-r-gf-cí)¡ |: (Eq.1) en donde S es el. vector que contiene una subestructura de muestras de voz no codificadas, Sw, representa S multiplicado por el filtro de ponderación W, ca y cf son los vectores de código a partir de los códigos del cifrado y descifrado adaptable y fijo respectivamente, W es una matriz que ejecuta la operación del filtro de ponderación, H es una matriz que ejecuta la operación de filtro de síntesis, y CSW es la señal codificada multiplicada por el filtro de ponderación W. Convencionalmente, la operación de codificación para reducir al mínimo el criterio de la Ecuación 1 se ejecuta de acuerdo con las siguientes etapas: Etapa 1. Calcular el filtro de síntesis mediante pronóstico lineal y cuantificar los coeficientes de filtro. El filtro de ponderación es calculado a partir de los coeficientes de filtro de pronóstico lineal. Etapa 2. El vector de código ca se encuentra mediante la búsqueda del código de cifrado y descifrado adaptable para reducir al mínimo Dw de la Ecuación 1, asumiendo que gf es cero y que ga es igual al valor óptimo. Debido a que cada vector de código ca tiene asociada convencionalmente con el mismo un valor óptimo de ga, la búsqueda se hace insertando cada vector de código ca en la Ecuación 1 junto con sus valores ga óptimos asociados. Etapa 3. El vector de código cf se encuentra buscando el código de cifrado y descifrado para reducir al mínimo Dw, utilizando el vector de código ca y la ganancia ga encontrada en la etapa 2. La ganancia fija gf se asume igual al valor óptimo. Etapa 4. Los factores de ganancia ga y gf son cuantificados. Obsérvese que ga puede cuantificarse después de la etapa 2 si se utilizaron cuantificadores escalares.
El procedimiento de comparación de forma de onda descrito anteriormente es bien conocido por trabajar adecuadamente, por lo menos para velocidades de bitios de 8 kb/s o más. Sin embargo, cuando se reduce la velocidad de bitios la habilidad para hacer la comparación de forma de onda de señales similares a ruido no periódicas tales como los mensajes silenciosos y el ruido de fondo son alterados. Para segmentos de voz con sonido, el criterio de comparación de onda se comparta en forma adecuada, aunque la escasa capacidad de comparación de forma de onda para las señales similares a ruido conduce a una señal codificada con un nivel frecuentemente demasiado bajo y un carácter de variación molesto (conocido como turbulencia). Para señales similares a ruido, es bien sabido en la técnica que es mejor comparar el carácter espectral de la señal y tener una buena comparación del nivel de señal (ganancia). Ya que el filtro de síntesis de pronóstico lineal proporciona el carácter espectral de la señal, un criterio alternativo para la Ecuación 1 anterior puede usarse para señales similares a ruido: (Eq.2) en donde Es es la energía de la señal de voz descodificada y Ecs es la energía de la señal codificada CS = H(ga ca + gf cf). La ecuación 2 implica comparación de energía en oposición a la comparación de forma de onda en la Ecuación 1. Este criterio puede usarse también en el dominio de voz ponderado mediante la inclusión del filtro de ponderación W. Obsérvese que las operaciones de raíz cuadrada se incluyen en la Ecuación 2 solamente para tener un criterio en el mismo dominio que la Ecuación 1; esto no es necesario y no es una restricción. Existen también otros criterios de comparación de energía posibles tales como DE=|ES-Ecsl- el criterio puede también formularse en el dominio residual como sigue: (Eq.3 i en donde Er es la energía de la señal residual r obtenida mediante filtración S a través del (H + ) inverso del filtro de síntesis, y Ex es la energía de la señal de excitación proporcionada por x = ga ca + gf cf. Los diferentes criterios anteriores se han empleado en la codificación multimodal convencional donde diferentes modos de codificación (por ejemplo, comparación de energía) se han usado para voz si sonido y ruido de fondo. En estos modos, los criterios de comparación de energía como en las Ecuaciones 2 y 3, se han utilizado. Una desventaja con este enfoque es la necesidad de la decisión de modo, por ejemplo, seleccionar el modo de comparación de forma de onda (Ecuación 1) para la voz con sonido y seleccionar el modo de comparación de energía (Ecuaciones 2 y 3) para las señales similares a ruido como la voz sin sonido y el ruido de fondo. La decisión de modo es sensible y provoca artefactos molestos cuando es errónea. Así mismo, el cambio drástico de la estrategia de codificación entre los modos puede provocar sonidos indeseables. Por lo tanto, es deseable proporcionar una codificación mejorada de las señales similares a ruido en velocidades de bitio reducidas sin las desventajas antes mencionadas de la codificación multimodal. La presente invención combina de manera ventajosa la comparación de forma de onda y los criterios de comparación de energía para mejorar la codificación de las señales similares a ruido en velocidades de bitio reducidas sin las desventajas de la codificación multimodal.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1 ilustra en forma diagramática un descodificador CELP convencional. La Figura 2 ¡lustra en forma diagramática un codificador CELP convencional. La Figura 3 ¡lustra en forma gráfica un factor de equilibrio de acuerdo con la invención. La Figura 4 ilustra- en forma gráfica un ejemplo específico del factor de equilibrio de la Figura 3.
La Figura 5 ilustra de manera diagramática una porción pertinente de un codificador CELP ilustrativo de acuerdo con la invención. La Figura 6 es un diagrama de flujo que ¡lustra operaciones de ejemplo de la porción de codificador CELP de la Figura 5. La Figura 7 ilustra de manera diagramática un sistema de comunicación de acuerdo con la invención.
DESCRIPCIÓN DETALLADA La presente invención combina la comparación de forma de onda y los criterios de comparación de energía en un solo criterio DwE. El equilibrio entre la comparación de forma de onda y la comparación de energía es ajustada en forma uniformemente adaptable mediante los factores de ponderación: en donde K y L son factores de ponderación que determinan los pesos relativos entre la distorsión de la comparación de forma de onda Dw y la distorsión de la comparación de energía Dg. Los factores de ponderación K y L pueden fijarse respectivamente para ser iguales a 1-c y a como sigue: en donde a es un factor de equilibrio que tiene un valor de 0 a 1 para proporcionar el equilibrio entre la parte de comparación de forma de onda Dw y la parte de comparación de energía Dg del criterio. El valor a es preferiblemente una función del nivel de voz, o la periodicidad, en el segmento de voz actual = a(v) en donde v es un indicador de voz. Un diseño principal de un ejemplo de la función a(v) se muestra en la Figura 3. Los niveles de voz por debajo de a, a = d, en niveles de voz sobre b, a = c y a disminuye gradualmente desde d hasta c en niveles de voz entre a y b. En una formulación específica, el criterio de la Ecuación 5 puede expresarse como: D us (1 -a) ) ' (Eq.6) en donde E8W es la energía de la señal Sw y Ecsw es la energía de la señal CSW. Aunque el criterio de la Ecuación 6 anterior, o la variación del mismo, puede usarse de manera ventajosa para todo el proceso de codificación en un codificador CELP, las mejoras significativas resultan cuando se utilizan solamente en la parte de cuantificación de ganancia (es decir, la etapa 4 del método de codificación anterior). Aunque la descripción aquí detalla la aplicación del criterio de la Ecuación 6 a la cuantificación de ganancia, puede emplearse en la búsqueda de los códigos de cifrado y descifrado ca y cf en una forma similar.
Obsérvese que ECsw de la Ecuación 6 puede expresarse como: E cs |csw (Eq.7) de manera que la Ecuación 6 puede re-escribirse como: (Eq. 8) Puede verse a partir de la Ecuación 1 que: CSw = W-H-(ga-ca + gf-cf). (Eq.9) Una vez que los vectores de codificación ca y cf son determinados, por ejemplo, utilizando la Ecuación 1 y las etapas 1-3 anteriores, la tarea es encontrar los valores de ganancia cuantificados correspondientes. Para la cuantificación de vector, estos valores de ganancia cuantificados están dados como una entrada a partir del código de cifrado y descifrado del cuantificador de vector. Este código de cifrado y descifrado incluye entradas plurales y cada entrada incluye un par de valores de ganancia cuantificados, gaQ y gfQ. Insertando todos los pares de valores de ganancia cuantificados gaQ y gfQ desde el código de cifrado y descifrado del cuantificador de vector en la Ecuación 9, e insertando después cada CS resultante en la Ecuación 8, son calculados todos los valores posibles de DWE en la Ecuación 8. El par de valor de ganancia a partir del código de cifrado y descifrado del cuantificador de vector que proporciona el último valor de Dwg se selecciona para los valores de ganancia cuantificados. En varios codificadores modernos, se usa ia cuantificación de pronóstico para los valores de ganancia, o por lo menos para el valor de ganancia del código de cifrado y descifrado, fijo. Esto se incorpora de manera directa en la Ecuación 9 debido a que el pronóstico está hecho antes de la búsqueda. En vez de invertir los valores de ganancia del código de cifrado y descifrado en la Ecuación 9, los valores de ganancia del código de cifrado y descifrado multiplicados por los valores de ganancia pronosticados son invertidos en la Ecuación 9. Cada CS resultante es insertado después en la Ecuación 8 como se hizo antes. Para la cuantificación escalar los factores de ganancia, se usan frecuentemente un criterio simple donde la ganancia óptima es cuantificada directamente, es decir, un criterio como: se utiliza, donde DSGQ es el criterio de cuantificación de ganancia escalar, g0pt es la ganancia óptima (ya sea ga0pt o gfopt) como se determinó convencionalmente en la Etapa 2 ó 3 anterior, y g es un valor de ganancia cuantificado a partir del código de cifrado y descifrado de cualquiera de los cuantificadores escalares ga o gf. El valor de ganancia cuantificado que reduce al mínimo DSGQ es seleccionado. En la cuantificación de los factores de ganancia, el término comparación de energía puede, si se desea emplearse de manera ventajosa sólo para la ganancia del código de cifrado y descifrado fijo, ya que el código de cifrado y descifrado adaptable usualmente juega un rol menor para los segmentos de voz similares a ruido. Por tanto, el criterio de la Ecuación 10 puede usarse para cuantificar la ganancia del código de cifrado y descifrado adaptable en tanto que se usa un nuevo criterio D gfQ para cuantificar la ganancia del código de cifrado y descifrado fijo a saber: (Eq. \ I en donde gfopt es el valor gf óptimo determinado a partir de la Etapa 3 anterior, y gaQ es la ganancia del código de cifrado y descifrado adaptable cuantificada determinada utilizando la Ecuación 10. Todos los valores de ganancia cuantificados a partir del código de cifrado y descifrado del cuantificador escalar gf son invertidos como gf en la Ecuación 11, y el valor de ganancia cuantificado que reduce al mínimo DgfQ es seleccionado. La adaptación del factor de balance a es una clave para obtener un buen rendimiento con el nuevo criterio. Como se describió previamente, a es preferiblemente una función del nivel de voz. La ganancia de codificación del código de cifrado y descifrado adaptable es un ejemplo de un buen indicador del nivel de voz. Los ejemplos de determinaciones de nivel de voz incluyen por tanto: v, = lOlogl0( ¡;r||2/ ||r-g Q-ca ||7j (Eq en donde v, es la medida del nivel de voz para la cuantificación de vector, vs es la medida del nivel de voz para la cuantificación escalar y r es la señal residual definida anteriormente en la presente. Aunque el nivel de voz está determinado en el dominio residual utilizando las Ecuaciones 12 y 13, el nivel de voz puede determinarse también en, por ejemplo, el dominio de voz ponderado sustituyendo Sw por r en las Ecuaciones 12 y 13, y multiplicando los términos ga-ca de las Ecuaciones 12 y 13 por W-H. Para evitar la fluctuación local en los valores v, los valores v pueden filtrarse antes del mapeo para el dominio a. Por ejemplo, un filtro medio del valor de corriente y los valores de las 4 subestructuras anteriores se pueden usar como sigue: en donde . v-2- v-3' son los valores v para las 4 subestructuras previas. La función mostrada en la Figura 4 ¡lustra un ejemplo del mapeo a partir dei indicador de voz vm para e\ .actor de baiar.ce a. 0.5 _sO a(v, --{ 0.5 - 0.25 - vm 0<vm<2.0 0 m=2.0 (Eq.15) Esta función se expresa matemáticamente Obsérvese que el valor máximo de a es menor que 1, significando que la comparación de energía total nunca ocurre, y alguna comparación de forma de onda permanece siempre en el criterio (ver Ecuación 5). Al principio de la voz, cuando la energía de la señal se incrementa drásticamente, la ganancia de codificación del código de cifrado y descifrado adaptable es frecuentemente menor debido al hecho de que el código de cifrado y descifrado no contiene señales relevantes. Sin embargo, la comparación de forma de onda es importante al inicio y por lo tanto a es forzado a cero si se detecta un inicio. Una detección de inicio simple basada en la ganancia del código de cifrado y descifrado fijo óptima puede usarse como sigue: a(vj = 0si fopr>2.0-gfOF ., (l¿ . l0) en donde gfopt-? es la ganancia del código de cifrado y descifrado fijo óptima determinada en la Etapa 3 sobre la subestructura anterior. También es ventajoso limitar el incremento en el valor cuando fue cero en la subestructura previa. Esto puede implementarse dividiendo simplemente el valor de a por un número adecuado, por ejemplo, 2.0 cuando el valor a anterior fue cero. Los artefactos provocados por el movimiento a partir de la comparación de forma de onda pura a mayor comparación de energía se evitan de esta manera.
Así mismo, una vez que el factor de equilibrio a se ha determinado utilizando las Ecuaciones 15 y 16, puede filtrarse de manera ventajosa, por ejemplo, promediándolo con los valores a de las subestructuras previas. Como se mencionó antes, la Ecuación 6 (y por tanto las Ecuaciones 8 y 9) pueden usarse para seleccionar los vectores de código de cifrado y descifrado adaptable y fijo ca y cf. Debido a que el vector de código de cifrado y descifrado adaptable ca no es conocido aún, las medidas de voz de las Ecuaciones 12 y 13 no pueden calcularse, de manera que el factor de balance de la Ecuación 15 tampoco puede calcularse. Por tanto, a fin de utilizar las Ecuaciones 8 y 9 para las búsquedas del código de cifrado y descifrado fijo y adaptable, el factor de equilibrio a es fijado preferiblemente a un valor que ha sido determinado de manera empírica para producir los resultados deseados para las señales similares a ruido. Una vez que el factor de equilibrio a se ha determinado de manera empírica, entonces pueden proceder las búsquedas del código de cifrado y descifrado fijo y adaptable en la forma establecida en las Etapas 1-4 anteriores, aunque utilizando el criterio de las Ecuaciones 8 y 9. De manera alternativa, después de que se determinaron ca y ga en la Etapa 2 usando un valor a determinado de manera empírica, entonces la ecuaciones 12-15 pueden usarse como apropiadas para determinar un valor de a que se va utilizar en la Ecuación 8 durante la búsqueda de la Etapa 3 del código de cifrado y descifrado fijo.
La Figura 5 es una representación de diagrama de bloque de una porción ilustrativa del codificador de voz CELP de acuerdo con la invención. La porción de codificador de la Figura 5 incluye un controlador de criterio 51 que tiene una entrada para recibir ia señal de voz no codificada, y también acoplado para comunicación con los códigos de cifrado y descifrado fijo y adaptable 61 y 62 y con los códigos de cifrado y descifrado del cuantificador de ganancia 50, 54 y 60. El controlador de criterios 51 es capaz de ejecutar todas las operaciones convencionales asociadas con el diseño del codificador CELP de la Figura 2 incluyendo la implementación de los criterios convencionales representados por las Ecuaciones 1-3 y 10 anteriores, y ejecutando las operaciones convencionales descritas en las Etapas 1-4 anteriores. Además de las operaciones convencionales antes descritas, el controlador de criterios 51 también es capaz de implementar las operaciones descritas anteriormente con respecto a las Ecuaciones 4-9 y 11-16. El controlador de criterio 51 proporciona un determinador de voz 53 con ca como se determinó en la Etapa 2 anterior, y ga0pt (o gaQ si se utilizó la cuantificación escalar), como se determinó ejecutando las Etapas 1-4 anteriores. El controlador de criterios aplica además el filtro de síntesis inversa H"1 a la señal de voz no codificada para determinar de esta manera la señal residual r, la cual también es accesada al determinador de voz 53. El determinador de voz 53 responde a sus entrada antes descritas para determinar el indicador de nivel de voz v de acuerdo con la Ecuación 12 (cuantificación de vector) o la Ecuación 13 (cuantificación escalar). El indicador de nivel de voz v está provisto a la entrada de un filtro 55 que somete el indicador del nivel de voz v a una operación de filtrado (tal como el filtrado medio descrito anteriormente), produciendo de esta manera un indicador de nivel de voz filtrado vf filtrado como una salida, para el filtrado medio, el filtro 55 puede incluir una porción de memoria 56 como se muestra para almacenar los indicadores del nivel de voz de las subestructuras anteriores. El indicador de nivel de voz filtrada vf emitido desde el filtro 55 es introducido a un determinador de factor de equilibrio 57. El determinador de factor de equilibrio 57 usa el indicador de nivel de voz filtrado vf para determinar el factor de equilibrio a, por ejemplo de la manera antes descrita con respecto a la Ecuación 15 (donde vm representa un ejemplo específico de vf de la Figura 5) y la Figura 4. El controlador de criterio 51 entra al determinador de factor de equilibrio gf0pt para la subestructura actual, y este valor puede almacenarse en una memoria 58 del determinador de factor de equilibrio 57 para uso en la implementación de la Ecuación 16. El determinador de factor de equilibrio también incluye una memoria 59 para almacenar el valor a de cada subestructura (o por lo menos los valores a de cero) a fin de permitir que el determinador de factor de equilibrio 57 limite el incremento en el valor a cuando el valor a asociado con la subestructura anterior fue de cero.
Una vez que el controlador de criterio 51 ha obtenido los coeficientes de filtro de síntesis, y se han aplicado los criterios deseados para determinar los vectores del código de cifrado y descifrado y los valores de ganancia cuantificados asociados, entonces la Información indicativa de esos parámetros es emitida desde el controlador de criterios en 52 para transmitirse a través del canal de comunicación. La Figura 5 ilustra también de manera conceptual el código de cifrado y descifrado 50 de un cuantificador de vector, y los códigos de cifrado y descifrado 54 y 60 de los cuantificadores escalares respectivos del valor de ganancia del código de cifrado y descifrado adaptable ga y el valor de ganancia del código de cifrado y descifrado fijo gf. Como se describió antes, el código de cifrado y descifrado del cuantificador de vector 50 incluye una pluralidad de entradas, cada entrada que incluye un par de valores de ganancia cuantificados ga y gfQ. Los códigos de cifrado y descifrado del cuantificador escalar 54 y 60 incluyen cada uno un valor de ganancia cuantificado por entrada. La Figura 6 ilustra en formato de diagrama de flujo, las operaciones ilustrativas (como se describen en detalle anteriormente) de la porción de codificador de ejemplo de la Figura 5. Cuando una nueva subestructura de la voz no codificada es recibida en 63, las Etapas 1-4 anteriores son ejecutadas de acuerdo a un criterio deseado en 64 para determinar ca, ga, cf y gf. Posteriormente, en 65, la medida de voz v es determinada, y el factor de equilibrio a es determinado posteriormente en 66. Posteriormente, en 67, el factor de equilibrio se utiliza para definir el criterio de ia cuantificación del factor de ganancia Dwg, en términos de la comparación de forma de onda y la comparación de energía. Si se está utilizando la cuantificación de vector empleada en 68, entonces el criterio de comparación de forma de onda/comparación de energía combinado Dwg se usa para cuantificar los factores de ganancia de ambos en 69. Si se está utilizando la cuantificación escalar, entonces en 70, la ganancia del código de cifrado y descifrado adaptable ga es cuantificada utilizando DSGQ de la Ecuación 10, y en 71 la ganancia del código de cifrado y descifrado fija gf es cuantificada utilizando el criterio de comparación de forma de onda/comparación de energía combinado DgfQ de la Ecuación 11. Después de que se han cuantificado ios factores de ganancia, se espera la siguiente subestructura en 63. La Figura 7 es un diagrama de bloque de un sistema de comunicación ilustrativo que incluye un codificador de voz de acuerdo con la presente invención. En la Figura 7, un codificador 72 de acuerdo con la presente Invención está provisto en un transceptor 73 el cual comunica con un transceptor 74 a través de un canal de comunicación 75. El codificador 72 recibe una señal de voz no codificada, y proporciona al canal 75 información a partir de la cual el descodificador convencional 76 (tal como es descrito anteriormente con respecto a la Figura 1) en el transceptor 74 puede reconstruir la señal de voz original. Como un ejemplo, los transceptores 73 y 74 de la Figura 7, pueden ser teléfonos celulares y el canal 75 puede ser un canal de comunicación a través de una red telefónica celular. Otras aplicaciones del codificador de voz 72 de la presente invención son numerosas y fácilmente evidentes. Será también evidente para los trabajadores de ia técnica que un codificador • de voz de acuerdo con la invención puede implementarse fácilmente utilizando, por ejemplo, un procesador de señal digital programado adecuadamente (DSP) u otro dispositivo de procesamiento de datos, ya sea solo o en combinación con la lógica de soporte externa. El nuevo criterio de codificación de voz combina de manera uniforme la comparación de forma de onda y la comparación de energía. Por lo tanto, la necesidad para usar una u otra se evita, aunque la combinación adecuada de los criterios puede emplearse. El problema de las decisiones de modo equivocadas entre los criterios también se evita. La naturaleza adaptable del criterio hace posible ajustar de manera uniforme el equilibrio de la comparación de forma de onda y energía. Por lo tanto, los artefactos debido a los cambios drásticos en el criterio están controlados. Alguna comparación de forma de onda puede mantenerse siempre en el nuevo criterio. El problema de una señal completamente inadecuada con un alto nivel de sonido similar a ruido-ráfaga puede evitarse por tanto. Aunque se han descrito las modalidades ilustrativas de la presente invención en detalle, esto no limita el alcance de la invención, el cual puede practicarse en una variedad de modalidades.

Claims (27)

  1. REIVINDICACIONES 1. Un método para producir a partir de una señal de voz original, una pluralidad de parámetros a partir de los cuales puede reconstruirse una aproximación de la señal de voz original, que comprende: generar en respuesta a la señal de voz original una señal adicional que está destinada a representar la señal de voz original; determinar una primera diferencia entre una forma de onda asociada con la señal de voz original y la forma de onda asociada con la señal adicional; determinar una segunda diferencia entre un parámetro de energía derivado a partir de la señal de voz original y un parámetro de energía correspondiente asociado con la señal adicional; y utilizar la primera y segunda diferencias para determinar por lo menos uno de los parámetros a partir del cual la aproximación de la señal de voz original puede reconstruirse.
  2. 2. El método de conformidad con la reivindicación 1, caracterizado porque la etapa de utilización incluye asignar a la primera y segunda diferencias grados relativos de importancia en la determinación de por lo menos un parámetro.
  3. 3. El método de conformidad con la reivindicación 2, caracterizado porque dicha etapa de asignación incluye calcular un factor de equilibrio indicativo de los grados relativos de importancia de la primera y segunda diferencias.
  4. 4. El método de conformidad con la reivindicación 3, que incluye utilizar el factor de equilibrio para determinar primero y segundo factores de ponderación respectivamente asociados con la primera y segunda diferencias, la etapa de utilización de la primera y segunda diferencias, que incluye multiplicar la primera y segunda diferencias por el primero y segundo factores de ponderación, respectivamente.
  5. 5. El método de conformidad con la reivindicación 4, caracterizado porque la etapa de utilizar el factor de balance para determinar el primero y segundo factores de ponderación incluye fijar selectivamente uno de los factores de ponderación a cero.
  6. 6. El método de conformidad con la reivindicación 5, caracterizado porque la etapa de fijar selectivamente uno de los factores de ponderación a cero incluye detectar un inicio de voz en la señal de voz original, y fijar el segundo factor de ponderación a cero en respuesta a la detección del inicio de voz.
  7. 7. El método de conformidad con la reivindicación 3, caracterizado porque la etapa de calcular el factor de equilibrio incluye calcular el factor de equilibrio en base a por lo menos un factor de equilibrio calculado previamente.
  8. 8. El método de conformidad con la reivindicación 7, caracterizado porque la etapa de calcular el factor de equilibrio en base a un factor de equilibrio calculado previamente incluye limitar la magnitud del factor de equilibrio en respuesta a un factor de equilibrio calculado previamente que tiene una magnitud predeterminada.
  9. 9. El método de conformidad con la reivindicación 3, caracterizado porque la etapa de calcular el factor de equilibrio incluye determinar un nivel de voz asociado con I señal de voz original, y calcular el factor de equilibrio como una función del nivel de voz.
  10. 10. El método de conformidad con la reivindicación 9, caracterizado porque la etapa de determinar el nivel de voz incluye aplicar una operación de filtrado al nivel de voz para producir un nivel de voz filtrado, la etapa de cálculo que incluye calcular el factor de equilibrio como una función del nivel de voz filtrado.
  11. 11. El método de conformidad con la reivindicación 10, caracterizado porque la etapa de aplicar una operación de filtrado incluye aplicar una operación de filtrado medio, que incluye determinar un nivel de voz medio de entre un grupo de niveles de voz que incluye el nivel de voz al cual se aplica la operación de filtrado y una pluralidad de niveles de voz previamente determinado asociados con la señal de voz original.
  12. 12. El método de conformidad con la reivindicación 2, caracterizado porque la etapa de asignación incluye determinar primero y segundo factores de ponderación respectivamente asociados con la primera y segunda diferencias, incluyendo la determinación de un nivel de voz asociado con la señal de voz original y determinar los factores de ponderación como una función del nivel de voz.
  13. 13. El método de conformidad con la reivindicación 12, caracterizado porque la etapa de determinación del primero y segundo factores de ponderación como una función del nivel de voz incluye formar el primer factor de ponderación mayor que el segundo factor de ponderación en respuesta a un primer nivel de voz y hacer el segundo factor de ponderación mayor que el primer factor de ponderación en respuesta a un segundo nivel de voz que es menor que el primer nivel de voz.
  14. 14. El método de conformidad con la reivindicación 1, caracterizado porque la etapa de uso incluye utilizar la primera y segunda diferencias para determinar un valor de ganancia cuantificada para uso en al reconstrucción en la señal de voz original de acuerdo con un proceso de codificación de voz de Pronóstico de Línea Urgente del Código.
  15. 15. Un aparato de codificación de voz que comprende: una entrada para recibir una señal de voz original; una salida para proporcionar información indicativa de los parámetros a partir de los cuales puede reconstruirse una señal de voz original, y un controlador acoplado entre la entrada y la salida para proporcionar en respuesta a la señal de voz original una señal adicional destinada a representar la señal de voz original, el controlador que determina además por lo menos uno de los parámetros en base a la primera y segunda diferencias entre la señal de voz original y la señal adicional, en donde la primera diferencia es una diferencia entre una forma de onda asociada con la señal de voz original y la forma de onda asociada con la señal adicional, y en donde la segunda diferencia es una diferencia entre el parámetro de energía derivado a partir de la señal de voz original y un parámetro de energía correspondiente asociado con la señal adicional.
  16. 16. El aparato de conformidad con la reivindicación 15, que incluye un determinador de factor de equilibrio para calcular un factor de equilibrio indicativo de los grados relativos de importancia de la primera y segunda diferencias en la determinación de por lo menos un parámetro, el determinador de factor de equilibrio que tiene una salida acoplada con el controlador para proporcionar el factor de balance a dicho controlador para uso en la determinar de dicho por lo menos un parámetro.
  17. 17. El aparato de conformidad con la reivindicación 16, que incluye un determinador del nivel de voz acoplado con dicha entrada para determinar un nivel de voz de la señal de voz original, el determinador de nivel de voz que tiene una salida acoplada a una entrada del determinador de factor de equilibrio para proporcionar el nivel de voz al determinador de factor de equilibrio, el determinador de factor de equilibrio operable para determinar el factor de equilibrio en respuesta a la información del nivel de voz.
  18. 18. El aparato de conformidad con la reivindicación 17, que incluye un filtro acoplado entre la salida del determinador de nivel de voz y la entrada del determinador de factor de equilibrio para recibir el nivel de voz a partir del determinador de nivel de voz y proporcionar al determinador de factor de equilibrio un nivel de voz filtrado.
  19. 19. El aparato de conformidad con la reivindicación 18, caracterizado porque el filtro es un filtro medio.
  20. 20. El aparato de conformidad con la reivindicación 16, caracterizado porque el controlador responde al factor de equilibrio para determinar el primero y segundo factores de ponderación respectivamente asociados con la primera y segunda diferencias.
  21. 21. El aparato de conformidad con la reivindicación 20, caracterizado porque el controlador es operable para multiplicar la primera y segunda diferencias respectivamente por el primero y segundo factores de ponderación en la determinación de dicho por lo menos un parámetro.
  22. 22. El aparato de conformidad con la reivindicación 21, caracterizado porque el controlador es operable para fijar la segunda diferencia a cero en respuesta a un inicio de voz en la señal de voz original.
  23. 23. El aparato de conformidad con la reivindicación 16, caracterizado porque el determinador de factor de equilibrio es operable para calcular el factor de equilibrio en base a por lo menos un factor de equilibrio calculado previamente.
  24. 24. El aparato de conformidad con la reivindicación 23, caracterizado porque el determlnador de factor de equilibrio es operable para limitar la magnitud del factor de equilibrio en respuesta a un factor de equilibrio calculado previamente que tiene una magnitud predeterminada.
  25. 25. El aparato de conformidad con la reivindicación 15, caracterizado porque el aparato de codificación de voz incluye un codificador de voz de pronóstico en línea urgente del código, y en donde dicho por lo menos un parámetro es un valor de ganancia cuantificada.
  26. 26. Un aparato transceptor para uso en un sistema de comunicación que comprende: una entrada para recibir los estímulos de entrada del usuario; una salida para proporcionar una señal de salida hacia un canal de comunicación para transmisión hacia un receptor por medio del canal de comunicación; y un aparato de codificación de voz que tiene una entrada acoplada a la entrada del transceptor y que tiene una salida acoplada a la salida del transceptor, la entrada del aparato de codificación de voz para recibir una señal de voz originada a partir de la entrada del transceptor, la salida del aparato de codificación de voz para proporcionar el transceptor la información de salida indicativa de los parámetros a partir de los cuales puede reconstruirse una aproximac-ión de la señal de voz original en el receptor, el aparato de codificación de voz que incluye un controlador acoplado entre la entrada y la salida del mismo para proporcionar en respuesta a la señal de voz original una señal adicional destinada a representar la señal de voz original, el controlador que determina además por lo menos uno de los parámetros en base a la primera y segunda diferencias entre la señal de voz original y la señal adicional, en donde la primera diferencia es una diferencia entre una forma de onda asociada con la señal de voz original y la forma de onda asociada con la señal adicional y en donde la segunda diferencia es una diferencia entre el parámetro de energía derivado a partir de la señal de voz original y un parámetro de energía correspondiente asociado con ia señal adicional.
  27. 27. El aparato de conformidad con la reivindicación 26, caracterizado porque el aparato transceptor forma una porción de un teléfono celular.
MXPA/A/2001/002144A 1998-09-01 2001-02-28 Un criterio adaptable para codificacion de voz MXPA01002144A (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US09144961 1998-09-01

Publications (1)

Publication Number Publication Date
MXPA01002144A true MXPA01002144A (es) 2002-03-05

Family

ID=

Similar Documents

Publication Publication Date Title
EP2301021B1 (en) Device and method for quantizing lpc filters in a super-frame
JP4101957B2 (ja) 音声パラメータの合同量子化
US5568514A (en) Signal quantizer with reduced output fluctuation
JP6779966B2 (ja) 先進量子化器
EP1598811B1 (en) Decoding apparatus and method
JP2004510174A5 (es)
JPH0863200A (ja) 線形予測係数信号生成方法
JPH08328591A (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
JP3254687B2 (ja) 音声符号化方式
KR19990023932A (ko) 스위치식 예측 양자화 방법
JP2004310088A (ja) 半レート・ボコーダ
AU774998B2 (en) An adaptive criterion for speech coding
JPH08278799A (ja) 雑音荷重フィルタリング方法
JP2016514857A (ja) オーディオ・エンコーダおよびデコーダ
JP4059350B2 (ja) 分析合成線形予測音声符号化における利得量子化方法
US5313554A (en) Backward gain adaptation method in code excited linear prediction coders
KR100416363B1 (ko) 선형 예측 분석 대 합성 엔코딩 방법 및 엔코더
KR19980080742A (ko) 신호 부호화방법 및 장치
JPH11504733A (ja) 聴覚モデルによる量子化を伴う予測残余信号の変形符号化による多段音声符号器
MXPA01002144A (es) Un criterio adaptable para codificacion de voz
Yang et al. Pitch synchronous multi-band (PSMB) speech coding
JP2892462B2 (ja) コード励振線形予測符号化器
KR100463577B1 (ko) 음성 부호화기용 선스펙트럼주파수 벡터 양자화 장치
Hernandez-Gomez et al. High-quality vector adaptive transform coding at 4.8 kb/s
EP0662682A2 (en) Speech signal coding