ES2367259T3 - Procedimiento y dispositivo para transmisión de señales de atenuación y de rafaga dentro de banda eficiente y funcionamiento máximo en velocidad de transmisión mitad en codificación de voz de banda ancha de velocidad de transmisión de bits variable para sistemas inalámbricos de cdma. - Google Patents

Procedimiento y dispositivo para transmisión de señales de atenuación y de rafaga dentro de banda eficiente y funcionamiento máximo en velocidad de transmisión mitad en codificación de voz de banda ancha de velocidad de transmisión de bits variable para sistemas inalámbricos de cdma. Download PDF

Info

Publication number
ES2367259T3
ES2367259T3 ES03739909T ES03739909T ES2367259T3 ES 2367259 T3 ES2367259 T3 ES 2367259T3 ES 03739909 T ES03739909 T ES 03739909T ES 03739909 T ES03739909 T ES 03739909T ES 2367259 T3 ES2367259 T3 ES 2367259T3
Authority
ES
Spain
Prior art keywords
coding parameters
signal coding
signal
transmission
cdma2000
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES03739909T
Other languages
English (en)
Inventor
Milan Jelinek
Redwan Salami
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Application granted granted Critical
Publication of ES2367259T3 publication Critical patent/ES2367259T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Communication Control (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Selective Calling Equipment (AREA)

Abstract

Un procedimiento que comprende: recibir unos parametros de codificacion de senal representativos de una senal sonora codificada de acuerdo con un modo de comunicacion a velocidad de transmision completa de un esquema de comunicacion de VBR-WB de CDMA2000; recibir una peticion para transmitir los parametros de codificacion de senal usando un modo de comunicacion a velocidad de transmision mitad del esquema de comunicacion de VBR-WB de CDMA2000 para reducir la velocidad de transmision de bits durante la transmision de dichos parametros de codificacion de senal; insertar una identificacion del modo de comunicacion que va a transmitirse junto con los parametros de codificacion de senal restantes; y como respuesta a la peticion, rechazar una parte de los parametros de codificacion de senal para posibilitar la transmision de los parametros de codificacion de senal restantes usando el modo de comunicacion a velocidad de transmision mitad del esquema de comunicacion de VBR-WB de CDMA2000, en el que la parte rechazada de los parametros de codificacion de senal son unos indices de libro de codigos fijo de un libro de codigos algebraico.

Description

Campo de la invención
La presente invención se refiere a un procedimiento para la interrelación de una primera estación que usa un primer esquema de comunicación y que comprende un primer codificador y un primer descodificador con una segunda estación que usa un segundo esquema de comunicación y que comprende un segundo codificador y un segundo descodificador, en el que la comunicación entre las estaciones primera y segunda se lleva a cabo transmitiendo unos parámetros de codificación de señal a partir del codificador de una de las estaciones primera y segunda al descodificador de la otra de dichas estaciones primera y segunda.
Antecedentes de la invención
La demanda de técnicas de codificación de voz de banda estrecha y de banda ancha digitales eficientes con una buena compensación entre la calidad subjetiva y la velocidad de transmisión de bits está aumentando en diversas áreas de aplicación tales como la realización de teleconferencias, multimedia, y comunicaciones inalámbricas. Hasta hace poco, se ha usado principalmente en aplicaciones de codificación de voz un ancho de banda telefónico limitado a un intervalo de 200 a 3400 Hz. No obstante, las aplicaciones de voz de banda ancha proporcionan una inteligibilidad y naturalidad aumentadas en la comunicación en comparación con el ancho de banda telefónico convencional. Se ha hallado que un ancho de banda en el intervalo de 50 a 7000 Hz es suficiente para entregar una buena calidad dando una impresión de comunicación cara a cara. Para señales de audio generales, este ancho de banda da una calidad subjetiva aceptable, pero es aún más baja que la calidad de una radio FM o un CD que funcionen en intervalos de 20 a 16.000 Hz y de 20 a 20.000 Hz, respectivamente.
Un codificador de voz convierte una señal de voz en un flujo de bits digital que se transmite por un canal de comunicación o se almacena en un medio de almacenamiento. La señal de voz se digitaliza, es decir, se muestrea y se cuantifica con habitualmente 16 bits por muestra. El codificador de voz tiene el papel de representar estas muestras digitales con un número más pequeño de bits mientras que mantiene una buena calidad subjetiva de voz. El sintetizador o descodificador de voz opera sobre el flujo de bits que se transmite o que se almacena y lo convierte de nuevo en una señal de voz.
La codificación por predicción lineal excitada por código (CELP) es una de las mejores técnicas de la técnica anterior para lograr un buen compromiso entre la calidad subjetiva y la velocidad de transmisión de bits. Esta técnica de codificación constituye la base de diversas normas de codificación de voz tanto en aplicaciones inalámbricas como de línea cableada. En la codificación por CELP, la señal de voz muestreada se procesa en bloques de N muestras sucesivos denominados habitualmente tramas, en las que N es un número predeterminado que normalmente se corresponde con de 10 a 30 ms. Un filtro de predicción lineal (LP) se calcula y se transmite cada trama. El cálculo del filtro de LP normalmente necesita de una anticipación, es decir, un segmento de voz de 5 a 15 ms de la trama posterior. La trama de N muestras se divide en bloques más pequeños denominados subtramas. Habitualmente el número de subtramas en una trama es de tres (3) o cuatro (4) lo que da como resultado unas subtramas de 4 a 10 ms. En cada subtrama, una señal de excitación se obtiene habitualmente a partir de dos componentes, la excitación anterior y la excitación innovadora de libro de códigos fijo. A menudo, se hace referencia a la componente que se forma a partir de la excitación anterior como el libro de códigos adaptativo o excitación de altura de tono. Los parámetros que caracterizan a la señal de excitación se codifican y se transmiten al descodificador, en el que la señal de excitación reconstruida se usa como la entrada del filtro de LP.
En los sistemas inalámbricos que usan la tecnología de acceso múltiple por división de código (CDMA), el uso de una codificación de voz de velocidad de transmisión de bits variable (VBR) controlada por fuente mejora de forma significativa la capacidad del sistema. En la codificación de VBR controlada por fuente, el codificador–decodificador funciona a diversas velocidades de transmisión de bits, y se usa un módulo de selección de velocidad de transmisión para determinar la velocidad de transmisión de bits usada para la codificación de cada trama de voz basándose en la naturaleza de la trama de voz (por ejemplo con voz, sin voz, transitorio, ruido en segundo plano, etc.). El objetivo es conseguir la mejor calidad de voz a una velocidad de transmisión de bits promedio dada, a la que también se hace referencia como la velocidad de transmisión de datos promedio (ADR). El codificador–decodificador puede funcionar en diferentes modos ajustando el módulo de selección de velocidad de transmisión para conseguir unas ADR diferentes en los diferentes modos, en los que el rendimiento de codificador–decodificador mejora con el aumento de las ADR. Esto dota al codificador–decodificador de un mecanismo de compensación entre la calidad de voz y la capacidad del sistema. En los sistemas de CDMA (por ejemplo CDMA–one y CDMA2000), normalmente se usan 4 velocidades de transmisión de bits y se hace referencia a las mismas como la velocidad de transmisión completa (FR), la velocidad de transmisión mitad (HR), la velocidad de transmisión de un cuarto (QR), y la velocidad de transmisión de un octavo (ER). En este sistema se soportan dos conjuntos de velocidades de transmisión a los que se hace referencia como Conjunto I de velocidades de transmisión y Conjunto II de velocidades de transmisión. En el Conjunto II de velocidades de transmisión, un codificador–decodificador de velocidad de transmisión variable con un mecanismo de selección de velocidad de transmisión funciona a unas velocidades de transmisión de bits de codificación de fuente de 13,3 (FR), 6,2 (HR), 2,7 (QR), y 1,0 (ER) kbit/s, lo que se corresponde con unas velocidades de transmisión de bits brutas de 14,4, 7,2, 3,6, y 1,8 kbit/s (con algunos bits añadidos para la detección de errores).
En los sistemas de CDMA, puede imponerse la velocidad de transmisión mitad en lugar de la velocidad de transmisión completa en algunas tramas de voz con el fin de enviar una información de transmisión de señales dentro de banda (denominada transmisión de señales de atenuación y de ráfaga). El uso de la velocidad de transmisión mitad como una velocidad de transmisión de bits máxima puede estar impuesto también por el sistema durante unas condiciones de canal malas (tales como en las proximidades de los límites de una célula) con el fin de mejorar la robustez del codificador–decodificador. Se hace referencia a esto como el máximo en velocidad de transmisión mitad. Normalmente, en la codificación de VBR, la velocidad de transmisión mitad se usa cuando la trama es estacionaria con voz o estacionaria sin voz. Se usan dos estructuras de codificador–decodificador para cada tipo de señal (en el caso de una señal sin voz se usa un modelo de CELP sin el libro de códigos de altura de tono y en el caso de una señal con voz se usa una modificación para realzar la periodicidad y para reducir el número de bits para los índices de altura de tono). La velocidad de transmisión completa se usa para iniciaciones, tramas transitorias, y tramas con voz mixtas (habitualmente se usa un modelo de CELP típico). Cuando el módulo de selección de velocidad de transmisión elige la trama que va a codificarse como una trama de velocidad de transmisión completa y el sistema impone la trama de velocidad de transmisión mitad el rendimiento de voz se deteriora debido a que los modos de velocidad de transmisión mitad no son capaces de codificar de forma eficiente las iniciaciones y las señales transitorias.
Un codificador–decodificador de banda ancha que se conoce como codificador–decodificador de voz de banda ancha de múltiple velocidad de transmisión adaptativo (AMR–WB) se seleccionó recientemente por la UIT–T Sector de Normalización de las Telecomunicaciones de la Unión Internacional de Telecomunicaciones) para diversos servicios y telefonía de voz de banda ancha y por la 3GPP (Third Generation Partnership Project, Proyecto de Asociación de Tercera Generación) para los sistemas inalámbricos de tercera generación de W–CDMA y de GSM. El codificador–decodificador de AMR–WB comprende nueve (9) velocidades de transmisión de bits en el intervalo de 6,6 a 23,85 kbit/s. La designación de un codificador–decodificador de VBR controlada por fuente basado en AMR– WB para el sistema de CDMA2000 tiene la ventaja de posibilitar la interrelación entre CDMA2000 y otros sistemas que usan el codificador–decodificador de AMR–WB. La velocidad de transmisión de bits de AMR–WB de 12,65 kbit/s es la velocidad de transmisión más próxima que puede encajar en la velocidad de transmisión completa de 13,3 kbit/s del Conjunto II de velocidades de transmisión. Esta velocidad de transmisión puede usarse como la velocidad de transmisión común entre un codificador–decodificador de VBR de banda ancha de CDMA2000 y AMR–WB para posibilitar la capacidad de interrelación sin la necesidad de la transcodificación (lo que deteriora la calidad de voz). Una velocidad de transmisión mitad a 6,2 kbit/s tiene que añadirse a la solución de banda ancha de VBR de CDMA2000 para posibilitar el funcionamiento eficiente en el marco del Conjunto II de velocidades de transmisión. El codificador–decodificador puede entonces funcionar en pocos modos específicos de CDMA2000 y comprende un modo para posibilitar la capacidad de interrelación con los sistemas que usan el codificador–decodificador de AMR– WB. No obstante, en una llamada de funcionamiento libre conjunto entre sistemas entre CDMA2000 y otro sistema que usa AMR–WB, el sistema de CDAM2000 puede forzar el uso de la velocidad de transmisión mitad tal como se explicó con anterioridad (tal como en la transmisión de señales de atenuación y de ráfaga). Debido a que el codificador–decodificador de AMR–WB no reconoce la velocidad de transmisión mitad de 6,2 kbit/s del codificador– decodificador de banda ancha de CDMA2000, las tramas de velocidad de transmisión mitad forzadas se interpretan como tramas borradas. Esto afecta de forma adversa el rendimiento de la conexión. El documento EP 0492459 A2 muestra el rechazo de los índices de libro de códigos para unos códigos incrustados en una red conmutada por paquetes de ATM.
Sumario de la invención
De acuerdo con los diferentes aspectos de la presente invención, se proporcionan un procedimiento, un sistema, y un dispositivo de acuerdo con las reivindicaciones 1 a 17.
Los objetos, ventajas y características precedentes y otros de la presente invención se harán más evidentes tras la lectura de la siguiente descripción no restrictiva de realizaciones ilustrativas de la misma, dada a modo de ejemplo sólo con referencia a los dibujos que las acompañan.
Breve descripción de los dibujos
La figura 1 es un diagrama de bloques esquemático de un ejemplo no restrictivo del sistema de comunicación de voz en el que puede usarse la presente invención; la figura 2 es un diagrama de bloques funcional de un ejemplo no restrictivo de un codificador–decodificador de velocidad de transmisión de bits variable, que comprende una lógica de determinación de velocidad de transmisión; la figura 3 es un diagrama de bloques funcional de un ejemplo no restrictivo de un codificador–decodificador de velocidad de transmisión de bits variable que incluye una lógica de determinación de velocidad de transmisión que usa una HR genérica para tramas de baja energía; la figura 4 es el diagrama de bloques funcional del ejemplo no restrictivo de un codificador–decodificador de velocidad de transmisión de bits variable de acuerdo con la figura 3, que incluye una petición de sistema de velocidad de transmisión mitad dentro de la lógica de determinación de velocidad de transmisión; la figura 5 es un diagrama de bloques funcional de un ejemplo de codificador–decodificador de velocidad de transmisión de bits variable de acuerdo con la realización ilustrativa no restrictiva de la presente invención, que incluye una petición de sistema de velocidad de transmisión mitad en el nivel de paquetes (o nivel de flujo de bits) dentro de la lógica de determinación de velocidad de transmisión; la figura 6 es una configuración a modo de ejemplo para un procedimiento de transmisión de señales de atenuación y de ráfaga de acuerdo con la realización ilustrativa no restrictiva de la presente invención, en el modo capaz de interrelación de VBR–WB cuando se ve involucrado en una llamada de móvil a móvil de 3GPP ↔ CDMA2000 o una llamada de AMR–WB ↔ VBR–WB IP; la figura 7 es un diagrama de bloques esquemático de un ejemplo no restrictivo de un dispositivo de codificación de banda ancha, más específicamente un codificador de AMR–WB; y la figura 8 es un diagrama de bloques esquemático de un ejemplo no restrictivo de un dispositivo de decodificación de banda ancha, más específicamente un descodificador de AMR–WB.
Descripción detallada de la realización ilustrativa
Aunque la realización ilustrativa de la presente invención se describirá en la siguiente descripción en relación con una señal de voz, debe mantenerse en mente que los conceptos de la presente invención se aplican igualmente a otros tipos de señal, en particular pero no exclusivamente a otros tipos de señales sonoras.
La figura 1 ilustra un sistema 100 de comunicación de voz que representa el uso de dispositivos de codificación y de decodificación de voz. El sistema 100 de comunicación de voz de la figura 1 soporta la transmisión de una señal de voz a través de un canal 101 de comunicación. Aunque puede comprender por ejemplo un cable, un enlace óptico o un enlace de fibra, el canal 101 de comunicación normalmente comprende al menos en parte un enlace de radiofrecuencia. El enlace de radiofrecuencia a menudo soporta comunicaciones de voz simultáneas múltiples que requieren recursos de ancho de banda compartidos tales como los que pueden encontrarse con los sistemas de telefonía celular. Aunque no se muestra, el canal 101 de comunicación puede reemplazarse por un dispositivo de almacenamiento en una única implementación del dispositivo del sistema 100 que registra y almacena la señal de voz codificada para una reproducción posterior.
En el sistema 100 de comunicación de voz de la figura 1, un micrófono 102 produce una señal 103 de voz analógica que se suministra a un convertidor 104 de analógico a digital (A/D) para convertirla en una señal 105 de voz digital. Un codificador 106 de voz codifica la señal 105 de voz digital para producir un conjunto de parámetros 107 de codificación de señal que se codifican en forma binaria y se entregan a un codificador 108 de canal. El codificador 108 de canal opcional añade redundancia a la representación binaria de los parámetros 107 de codificación de señal antes de transmitirlos por el canal 101 de comunicación.
En el receptor, un descodificador 109 de canal usa la información redundante en el flujo 111 de bits recibido para detectar y corregir los errores de canal que han ocurrido durante la transmisión. Un descodificador 110 de voz convierte el flujo 112 de bits que se recibe a partir del descodificador 109 de canal de vuelta en un conjunto de parámetros de codificación de señal y crea a partir de los parámetros de codificación de señal recuperados una señal 113 de voz sintetizada digital. La señal 113 de voz sintetizada digital reconstruida en el descodificador 110 de voz se convierte en una forma 114 analógica mediante un convertidor 115 de digital a analógico (D/A) y se reproduce a través de una unidad 116 de altavoz.
Codificación de voz de velocidad de transmisión de bits variable controlada por fuente
La figura 2 representa un ejemplo no restrictivo de una configuración de codificador–decodificador de velocidad de transmisión de bits variable que incluye una lógica de determinación de velocidad de transmisión para controlar cuatro velocidades de transmisión de bits de codificación. En este ejemplo, el conjunto de velocidades de transmisión de bits comprende una velocidad de transmisión de bits de codificador–decodificador dedicada para tramas de voz no activas (módulo 208 de codificación de velocidad de transmisión de un octavo (CNG)), una velocidad de transmisión de bits para tramas de voz sin voz (módulo 207 de codificación sin voz de velocidad de transmisión mitad), una velocidad de transmisión de bits para tramas con voz estables (módulo 206 de codificación con voz de velocidad de transmisión mitad), y una velocidad de transmisión de bits para otros tipos de tramas (módulo 205 de codificación de velocidad de transmisión completa).
La lógica de determinación de velocidad de transmisión se basa en una clasificación de señal realizada en tres etapas (201, 202, y 203) en función de la trama, cuyo funcionamiento se conoce bien por los expertos en la técnica.
En primer lugar, un detector 201 de actividad de voz (VAD) discrimina entre tramas de voz activas e inactivas. Si una trama de voz inactiva se detecta (señal de ruido en segundo plano) entonces la cadena de clasificación de señal finaliza y la trama se codifica en el módulo 208 de codificación como una trama de velocidad de transmisión de un octavo con una generación de ruido confortable (CNG, Comfort Noise Generation) en el descodificador (1,0 kbit/s de acuerdo con el Conjunto II de velocidades de transmisión de CDMA2000). Si se detecta una trama de voz activa, la trama se somete a un segundo clasificador 202.
El segundo clasificador 202 está dedicado a realizar una decisión de existencia de voz. Si el clasificador 202 clasifica la trama como una trama de voz sin voz, la cadena de clasificación finaliza, y la trama se codifica en el módulo 207 con una velocidad de transmisión mitad optimizada para señales sin voz (6,2 kbit/s de acuerdo con el Conjunto II de velocidades de transmisión de CDMA2000). En otro caso, la trama de voz se procesa a través del clasificador 203 “con voz estable”.
Si la trama se clasifica como una trama con voz estable, entonces la trama se codifica en el módulo 206 con una velocidad de transmisión mitad optimizada para señales con voz estables (6,2 kbit/s de acuerdo con el Conjunto II de velocidades de transmisión de CDMA2000). En otro caso, es probable que la trama contenga un segmento de voz no estacionario tal como una señal de iniciación con voz o de voz con voz en rápida evolución. Estas tramas normalmente requieren una alta velocidad de transmisión de bits para sostener una buena calidad subjetiva. Por lo tanto, en este caso, la trama de voz se codifica en el módulo 205 como una trama de velocidad de transmisión completa (13,3 kbit/s de acuerdo con el Conjunto II de velocidades de transmisión de CDMA2000).
En una implementación alternativa no restrictiva que se muestra en la figura 3, si la trama no se clasifica como “con voz estable”, se procesa a través de un clasificador 311 de trama de baja energía. Esto se usa para detectar tramas que no se han tenido en cuenta por el detector 201 de VAD. Si la energía de trama está por debajo de un umbral determinado la trama se codifica usando un codificador 312 de velocidad de transmisión mitad genérico, en otro caso la trama se codifica en el módulo 205 como una trama de velocidad de transmisión completa.
La señal que clasifica los módulos 201, 202, 203 y 311 se conoce bien por los expertos en la técnica y, por consiguiente, no se describirá adicionalmente en la presente memoria descriptiva. En el ejemplo no restrictivo de la figura 3, los módulos de codificación a diferentes velocidades de transmisión de bits, concretamente los módulos 205, 206, 207, 208 y 312 se basan en unas técnicas de codificación de predicción lineal excitada por código (CELP), que también conocen bien los expertos en la técnica. Por ejemplo, las velocidades de transmisión de bits se ajustan de acuerdo con el Conjunto II de velocidades de transmisión del sistema de CDMA2000 que se describe anteriormente en el presente documento.
La realización ilustrativa no restrictiva de la presente invención se describe en el presente documento con referencia a un codificador–decodificador de voz de banda ancha que ha normalizado la Unión Internacional de Telecomunicaciones (ITU) como la Recomendación G.722.2 y que se conoce como el codificador–decodificador de AMR–WB (codificador–decodificador de banda ancha de múltiple velocidad de transmisión adaptativo) [Recomendación G.722.2 de la UIT–T “Codificación de voz de banda ancha a aproximadamente 16 kbit/s usando banda ancha de múltiple velocidad de transmisión adaptativo (AMR–WB), Génova, 2002]. Este codificador– decodificador también se ha seleccionado por el Proyecto de Asociación de Tercera Generación (3GPP) para telefonía de banda ancha en sistemas inalámbricos de tercera generación [3GPP TS 26.190, “Codificador– decodificador de voz de banda ancha de AMR: funciones de transcodificación”, Especificaciones técnicas de 3GPP]. AMR–WB puede funcionar a 9 velocidades de transmisión de bits de 6,6 a 23,85 kbit/s. A continuación, la velocidad de transmisión de bits de 12,65 kbit/s se usa como un ejemplo de velocidad de transmisión completa.
Naturalmente, la realización ilustrativa no restrictiva de la presente invención puede aplicarse a otros tipos de conjuntos de codificador–decodificador.
Para la conveniencia del lector, una visión de conjunto del codificador–decodificador de AMR–WB se da a continuación en el presente documento.
Visión de conjunto del codificador de AMR–WB.
Haciendo referencia a la figura 7, la señal de voz muestreada se codifica bloque a bloque por el dispositivo 700 de codificación de la figura 7 que se desglosa en once módulos numerados del 701 al 711.
La señal 712 de voz de entrada se procesa por lo tanto bloque a bloque, es decir en los anteriormente mencionados bloques de L muestras denominados tramas.
Haciendo referencia a la figura 7, se reduce la frecuencia de muestreo de la señal 712 de voz de entrada muestreada en un módulo 701 de reducción de frecuencia de muestreo. Se reduce la frecuencia de muestreo de la señal de 16 kHz a 12,8 kHz, usando unas técnicas bien conocidas por los expertos en la técnica. La reducción de la frecuencia de muestreo aumenta la eficiencia de la codificación, debido a que se codifica un ancho de banda de frecuencia más pequeña. Esto también reduce la complejidad del algoritmo debido a que el número de muestras en una trama se disminuye. Después de la reducción de la frecuencia de muestreo, la trama de 20 ms de 320 muestras se reduce a una trama de 256 muestras (proporción de reducción de la frecuencia de muestreo de 4/5).
La trama de entrada se suministra entonces al módulo 702 de procesamiento previo opcional. El módulo de procesamiento 702 previo puede consistir en un filtro de paso alto con una frecuencia de corte de 50 Hz. El filtro 702 de paso alto elimina las componentes de sonido no deseadas por debajo de 50 Hz.
La señal procesada previamente de frecuencia de muestreo reducida, se indica por sp(n), n = 0, 1, 2,..., L–1, en la que L es la longitud de la trama (256 a una frecuencia de muestreo de 12,8 kHz). Esta señal sp(n) se somete a preacentuación usando un filtro 703 de preacentuación que tiene la siguiente función de transferencia:
P(z)=1 – µz–1
en la que µ es un factor de preacentuación con un valor que se encuentra entre 0 y 1 (un valor típico es µ = 0,7). La función del filtro 703 de preacentuación es realzar los contenidos de alta frecuencia de la señal de voz de entrada. También reduce el intervalo dinámico de la señal de voz de entrada, lo que lo hace más adecuado para una implementación de punto fijo. La preacentuación también juega un importante papel para lograr una ponderación perceptiva global apropiada del error de cuantificación, lo que contribuye a una calidad del sonido mejorada.
La salida del filtro 703 de preacentuación se indica por s(n). Esta señal se usa para realizar un análisis de LP en el módulo 704. El análisis de LP es una técnica bien conocida por los expertos en la técnica. En el ejemplo de la figura 7, se usa el enfoque de autocorrelación. En el enfoque de autocorrelación, la señal s(n) en primer lugar se introduce en una ventana usando, normalmente, una ventana de Hamming que tiene una duración del orden de 30 a 40 ms. Las autocorrelaciones se calculan a partir de la señal de ventana, y se usa una recursión de Levinson–Durbin para calcular los coeficientes de filtro de LP, ai, en los que i = 1,..., p, y en los que p es el orden de LP, que es normalmente de 16 en codificación de ancha banda. Los parámetros ai son los coeficientes de la función de transferencia A(z) del filtro de LP, que se da por la siguiente relación:
imagen1
Se realiza un análisis de LP en el módulo 704, que también realiza la cuantificación y la interpolación de los coeficientes de filtro de LP. Los coeficientes de filtro de LP en primer lugar se transforman en otro dominio equivalente más adecuado para los fines de cuantificación y de interpolación. Los dominios de par espectral de línea (LSP) y de par espectral de inmitancia (ISP) son dos dominios en los que la cuantificación y la interpolación pueden realizarse de forma eficiente. Los 16 coeficientes de filtro de LP, ai, pueden cuantificarse con un número de bits del orden de 30 a 50 bits usando cuantificación por división o de etapa múltiple, o un combinación de la misma. La finalidad de la interpolación es posibilitar la actualización de los coeficientes de filtro de LP cada subtrama mientras se transmiten una vez cada trama, lo que mejora el rendimiento del codificador sin el aumento de la velocidad de transmisión de bits. Se cree que por lo demás la cuantificación y la interpolación de los coeficientes de filtro de LP se conocen bien por los expertos en la técnica y, por consiguiente, no se describirán adicionalmente en la presente memoria descriptiva.
Las siguientes párrafos describirán el resto de las operaciones de codificación cuando se realizan en una subtrama base. La trama de entrada se divide en 4 subtramas de 5 ms (64 muestras a la frecuencia de muestreo de 12,8 kHz). En la siguiente descripción, el filtro A(z) indica el filtro de LP interpolado no cuantificado de la subtrama, y el filtro Â(z) indica el filtro de LP interpolado cuantificado de la subtrama. El filtro Â(z) se suministra cada subtrama a un multiplexor 713 para la transmisión a través de un canal de comunicación.
En los codificadores de análisis por síntesis, la altura de tono óptima y los parámetros de innovación se buscan minimizando el error cuadrático medio entre la señal 712 de voz de entrada y una señal de voz sintetizada en un dominio de ponderación de forma perceptiva. La señal ponderada sw(n) se calcula en un filtro 705 de ponderación perceptiva como respuesta a la señal s(n) a partir del filtro 703 de preacentuación. Se usa un filtro 705 de ponderación perceptiva con denominador fijo, adaptado para señales de banda ancha. Un ejemplo de función de transferencia para el filtro 705 de ponderación perceptiva se da mediante la siguiente relación:
–1 )
W(z) = A(z/ γ1)/ (1– γ2z
en laque0 < γ2< γ1 ≤ 1
Con el fin de simplificar el análisis de la altura de tono, un retardo de altura de tono de lazo abierto TOL se estima en primer lugar en un módulo 706 de búsqueda de altura de tono de lazo abierto a partir de la señal de voz ponderada sw(n). Entonces el análisis de la altura de tono de lazo cerrado, que se realiza en un módulo 707 de búsqueda de altura de tono de lazo cerrado en función de la subtrama, se limita alrededor del retardo de altura de tono de lazo abierto TOL lo que reduce de forma significativa la complejidad de la búsqueda de los parámetros de LTP T (retardo de la altura de tono) y b (ganancia de la altura de tono). El análisis de lazo abierto de la altura de tono se realiza habitualmente en el módulo 706 una vez cada 10 ms (dos subtramas) usando unas técnicas bien conocidas por los expertos en la técnica.
El vector objetivo x para el análisis de LTP (predicción a largo plazo) se calcula en primer lugar. Esto se hace habitualmente sustrayendo la respuesta a entrada cero s0 del filtro de síntesis ponderada W(z)/ Â(z) a partir de la señal de voz ponderada sw(n). Esta respuesta a entrada cero s0 se calcula mediante un calculador 708 de respuesta a entrada cero como respuesta al filtro de interpolación cuantificada de LP Â(z) a partir del análisis de LP, el módulo 704 de cuantificación e interpolación y a los estados iniciales del filtro de síntesis ponderada W(z)/ Â(z) que se
5
10
15
20
25
30
35
40
45
almacena en un módulo 711 de actualización de memoria como respuesta a los filtros de LP A(z) y Â(z), y el vector de excitación u. Esta operación se conoce bien por los expertos en la técnica y, por consiguiente, no se describirá adicionalmente.
Un vector de respuesta a impulsos de N dimensiones h del filtro de síntesis ponderada W(z)/ Â(z) se calcula en el generador 709 de respuesta a impulsos usando los coeficientes del filtro de LP A(z) y Â(z) a partir del módulo 704. De nuevo, esta operación se conoce bien por los expertos en la técnica y, por consiguiente, no se describirá adicionalmente en la presente memoria descriptiva.
Los parámetros de altura de tono de lazo cerrado (o libro de códigos de altura de tono) b, T y j se calculan en el módulo 707 de búsqueda de altura de tono de lazo cerrado, que usa el vector objetivo x, el vector de respuesta a impulsos h y el retardo de altura de tono de lazo abierto TOL como entradas.
La búsqueda de altura de tono consiste en encontrar el mejor retardo de la altura de tono T y la ganancia b que minimiza un error de predicción de altura de tono ponderado cuadrático medio, por ejemplo
e (j) = ||x – b (j) y (j)||2 en la que j = 1, 2,…,k
entre el vector objetivo x y una versión de filtrado a escala de la excitación anterior by.
Más específicamente, la búsqueda de altura de tono (libro de códigos de altura de tono) se compone de tres etapas.
En la primera etapa, un retardo de altura de tono de lazo abierto TOL se estima en el módulo 706 de búsqueda de altura de tono de lazo abierto como respuesta a la señal de voz ponderada sw(n). Tal como se indica en la descripción precedente, este análisis de lazo abierto de la altura de tono se realiza habitualmente una vez cada 10 ms (dos subtramas) usando unas técnicas bien conocidas por los expertos en la técnica.
En la segunda etapa, se busca un criterio de búsqueda C en el módulo 707 de búsqueda de altura de tono de lazo cerrado para unos retardos de la altura de tono enteros alrededor del retardo de altura de tono de lazo abierto estimado TOL (habitualmente ± 5), lo que simplifica de forma significativa el método de búsqueda. Se usa un método sencillo para la actualización del vector de códigos de filtrado yT (este vector se define en la siguiente descripción) sin la necesidad de calcular la convolución para cada retardo de la altura de tono. Un ejemplo de criterio de búsqueda C se da mediante:
imagen1
en la que t indica el vector transpuesto.
Una vez que se encuentra un retardo de la altura de tono entero óptimo en la segunda etapa, una tercera etapa de la búsqueda (módulo 707) somete a prueba, por medio del criterio de búsqueda C, las fracciones alrededor de ese retardo de la altura de tono entero óptimo. Por ejemplo, la norma de AMR–WB usa una resolución de submuestras de ¼y½.
En señales de banda ancha, la estructura de armónicos existe sólo hasta una frecuencia determinada, dependiendo del segmento de voz. Por lo tanto, con el fin de conseguir una representación eficiente de la contribución de la altura de tono en unos segmentos con voz de una señal de voz de banda ancha, se necesita una flexibilidad para hacer variar la cantidad de periodicidad a lo largo del espectro de banda ancha. Esto se consigue procesando el vector de códigos de altura de tono a través de una pluralidad de filtros de conformación de frecuencia (por ejemplo filtros de paso bajo o pasa banda). Y se selecciona el filtro de conformación de frecuencia que minimiza el error ponderado
(j)
cuadrático medio edefinido anteriormente. El filtro de conformación de frecuencia seleccionado se identifica mediante un índice j.
El índice de libro de códigos de altura de tono T se codifica y se transmite al multiplexor 713 para la transmisión a través de un canal de comunicación. La ganancia de la altura de tono b se cuantifica y se transmite al multiplexor
713. Un bit adicional se usa para codificar el índice j, suministrándose también este bit adicional al multiplexor 713.
Una vez se determinan los parámetros de la altura de tono, o de LTP (predicción a largo plazo) b, T,y j, la próxima etapa consiste en la búsqueda de la excitación innovadora óptima por medio del módulo de búsqueda de excitación innovadora 710 de la figura 7. En primer lugar, el vector objetivo x se actualiza sustrayendo la contribución de LTP:
x’=x–byT
en la que b es la ganancia de la altura de tono y yT es el vector de libro de códigos de altura de tono filtrado (la excitación anterior en el retraso T filtrada con el filtro de filtro de conformación de frecuencia seleccionado (índice j)y convolucionada con la respuesta de impulso h).
5
15
25
35
45
El método de búsqueda de excitación innovadora en CELP se realiza en un libro de códigos de innovación para encontrar el vector de códigos de excitación óptima ck y la ganancia g que minimiza el error cuadrático medio E entre el vector objetivo x’ y una versión de filtrado a escala del vector de códigos ck, por ejemplo:
E=||x’–gHck||2
en la que H es una matriz de convolución triangular inferior que se deduce a partir del vector de respuesta a impulsos h. El índice k del libro de códigos de innovación que se corresponde con el vector de códigos óptimo encontrado ck y la ganancia g se suministran al multiplexor 213 para la transmisión a través de un canal de comunicación.
Debe observarse que el libro de códigos de innovación usado puede ser un libro de códigos dinámico que consiste de un libro de códigos algebraico seguido por un filtro previo adaptativo F(z) que realza unas componentes espectrales dadas con el fin de mejorar la calidad de voz de síntesis, de acuerdo con la patente de los Estados Unidos 5.444.816 concedida a Adoul et al. el 22 de agosto de 1995. Más específicamente, la búsqueda de libro de códigos innovadora puede realizarse en el módulo 710 por medio de un libro de códigos algebraico tal como el que se describe en las patentes de los Estados Unidos n.os 5.444.816 (Adoul et al.) expedida el 22 de agosto de 1995;
5.699.482 concedida a Adoul et al., el 17 de diciembre de 1997; 5.754.976 concedida a Adoul et al., el 19 de mayo de 1998; y 5.701.392 (Adoul et al.) fechada el 23 de diciembre de 1997.
Visión de conjunto del descodificador de AMR–WB
El descodificador 800 de voz de la figura 8 ilustra las diversas etapas que se llevan a cabo entre la entrada 822 digital (flujo de bits de entrada al demultiplexor 817) y la señal 823 de voz muestreada de salida (salida del sumador 821).
El demultiplexor 817 extrae los parámetros de codificación de señal a partir de la información binaria (flujo 822 de bits de entrada) recibida a partir de un canal digital de entrada. A partir de cada trama binaria que se recibe, los parámetros de codificación de señal extraídos son:
los coeficientes de LP interpolados y cuantificados Â(z) (línea 825) también denominados parámetros de predicción a corto plazo (STP, Short–Term Prediction) producidos una vez por trama.
los parámetros de predicción a largo plazo (LTP) T, b,y j (para cada subtrama); y
el índice de excitación innovadora k y la ganancia g (para cada subtrama).
La señal de voz actual se sintetiza basándose en estos parámetros tal como se explicará a continuación en el presente documento.
Un libro 818 de códigos de excitación innovadora es sensible al índice k para producir el vector de códigos de innovación ck, que está a escala por la ganancia de excitación innovadora descodificada g a través de un amplificador 824. Este libro 818 de códigos de innovación tal como el que se describe en las patentes de los Estados Unidos anteriormente mencionadas con números 5.444.816; 5.699.482; 5.754.976; y 5.701.392 se usa para producir el vector de códigos de innovación ck.
El vector de códigos a escala generado gck en la salida del amplificador 824 se procesa a través de un realzador 805 de la altura de tono dependiente de la frecuencia.
El realce de la periodicidad de la señal de excitación u mejora la calidad de los segmentos con voz. El realce de la periodicidad se consigue filtrando el vector de códigos innovador ck con respecto al libro de códigos de excitación (fijo) innovador a través de un filtro de innovación F(z) (el realzador 805 de la altura de tono) cuya respuesta en frecuencia acentúa las frecuencias más altas más que las frecuencias más bajas. Los coeficientes del filtro de innovación F(z) se relacionan con la cantidad de periodicidad en la señal de excitación u.
Una forma posible y eficiente de deducir los coeficientes del filtro de innovación F(z) es relacionarlos con la cantidad de contribución de la altura de tono en la señal de excitación total u. Esto da como resultado una respuesta en frecuencia dependiendo de la periodicidad de la subtrama, en la que las frecuencias más altas se acentúan más fuertemente (pendiente global más pronunciada) para ganancias de la altura de tono más altas. El filtro 805 de innovación tiene el efecto de reducir la energía del vector de códigos de innovación ck a frecuencias más bajas cuando la señal de excitación u es más periódica, lo que realza la periodicidad de la señal de excitación u a unas frecuencias más bajas más que a unas frecuencias más altas. Una forma que se sugiere para el filtro 805 de innovación es la siguiente:
F(z)=–αz+1–αz–1
en la que α es un factor de periodicidad que se deduce a partir del nivel de periodicidad de la señal de excitación u. El factor de periodicidad α se calcula en el generador 804 de factor de existencia de voz. En primer lugar, se calcula 5
10
15
20
25
30
35
40
45
un factor de existencia de voz rv en el generador 804 de factor de existencia de voz mediante:
rv=(Ev–Ec)/(Ev+Ec)
en la que Ev es la energía del vector de códigos de altura de tono a escala bvT y Ec es la energía del vector de códigos innovador a escala gck. Es decir:
y
imagen1
Obsérvese que el valor de rv se encuentra entre –1 y 1 (1 se corresponde con señales puramente con voz y –1 se corresponde con señales puramente sin voz).
El vector de códigos de altura de tono a escala anteriormente mencionado bvT se produce aplicando el retraso de altura de tono T a un libro 801 de códigos de altura de tono para producir un vector de códigos de altura de tono. El vector de códigos de altura de tono se procesa entonces a través de un filtro 802 de paso bajo o pasa banda cuya frecuencia de corte se selecciona en relación con el índice j del demultiplexor 817 para producir el vector de códigos de altura de tono de filtrado vT. Entonces, el vector de códigos de altura de tono de filtrado vT se amplifica entonces por la ganancia de la altura de tono b mediante un amplificador 826 para producir el vector de códigos de altura de tono a escala bvT.
El factor de existencia de voz α se calcula entonces en el generador 804 de factor de existencia de voz mediante:
α=0,125 (1+rv)
que se corresponde con un valor de 0 para señales puramente sin voz y de 0,25 para señales puramente con voz.
La señal realzada cf se calcula por lo tanto filtrando el vector de códigos innovador a escala gck a través del filtro 805 de innovación (F(z)).
La señal realzada de excitación u’ se calcula mediante el sumador 820 como:
u'=cf+bvT
Debe observarse que este proceso no se realiza en el codificador 700. Por lo tanto, es esencial la actualización del contenido del libro 801 de códigos de altura de tono usando el valor anterior de la señal de excitación u sin realce que se almacena en la memoria 803 para mantener el sincronismo entre el codificador 700 y el descodificador 800. Por lo tanto, la señal de excitación u se usa para la actualización de la memoria 803 del libro 801 de códigos de altura de tono y la señal realzada de excitación u’ se usa en la entrada del filtro 806 de síntesis de LP.
La señal sintetizada s’ se calcula filtrando la señal realzada de excitación u’ a través del filtro 806 de síntesis de LP que tiene la forma 1/ Â(z), en la que Â(z) es el filtro de LP interpolado y cuantificado en la subtrama actual. Tal como puede verse en la figura 8, los coeficientes de LP interpolados y cuantificados Â(z) en la línea 825 a partir del demultiplexor 817 se suministran al filtro 806 de síntesis de LP para ajustar los parámetros del filtro 806 de síntesis de LP en consecuencia. El filtro 807 de desacentuación es la inversa del filtro 703 de preacentuación de la figura 7. La función de transferencia del filtro 807 de desacentuación se da mediante
–1 )
D(z)=1/(1–µz
en la que µ es un factor de preacentuación con un valor que se encuentra entre 0 y 1 (un valor típico es µ = 0,7). Puede también usarse un filtro de orden más alto.
El vector s’ se filtra a través del filtro 807 de desacentuación D(z) para obtener el vector sd, que se procesa a través del filtro 808 de paso alto para eliminar las frecuencias no deseadas por debajo de 50 Hz y obtener adicionalmente sh.
El sobremuestreador 809 lleva a cabo el proceso inverso del reductor 701 de frecuencia de muestreo de la figura 7. Por ejemplo, un sobremuestreo convierte la velocidad de transmisión de muestreo de 12,8 kHz de vuelta a la velocidad de transmisión de muestreo original de 16 kHz, usando unas técnicas bien conocidas por los expertos en la técnica. La señal de síntesis sobremuestreada se indica por ŝ. Se hace referencia también a la señal ŝ como la señal intermedia de banda ancha sintetizada.
5
10
15
20
25
30
35
40
La señal de síntesis sobremuestreada ŝ no contiene los componentes de frecuencia más alta que se perdieron durante el proceso de reducción de la frecuencia de muestreo (módulo 701 de la figura 7) en el codificador 700. Esto da una percepción de paso bajo a la señal de voz sintetizada. Para restaurar la banda completa de la señal original, un método de generación de alta frecuencia se realiza en el módulo 810 y requiere una entrada a partir del generador 804 de factor de existencia de voz (la figura 8).
La secuencia de ruido de filtrado de pasa banda resultante z a partir del módulo 310 de generación de alta frecuencia se añade mediante el sumador 821 a la señal de voz sintetizada sobremuestreada ŝ para obtener la señal de voz de salida reconstruida final sout en la salida 823. Un ejemplo de un proceso de regeneración de alta frecuencia se describe en la solicitud de patente internacional PCT publicada con el n.º WO 00/25305 el 4 de mayo de 2000.
Haciendo referencia de nuevo a la figura 3, en modo de comunicación a velocidad de transmisión completa, un codificador–decodificador de acuerdo con la norma de AMR–WB funciona a 12,65 kbit/s y se usa con la asignación de bits dada en la tabla 1. El uso de la velocidad de transmisión de 12,65 kbit/s del codificador–decodificador de AMR–WB posibilita el diseño de un codificador–decodificador de velocidad de transmisión de bits variable para el sistema de CDMA2000 capaz de efectuar una interrelación con otros sistemas que usan la norma sobre codificador– decodificador de AMR–WB. Se añaden 13 bits adicionales para ajustarse en la velocidad de transmisión completa de 13,3 kbit/s del Conjunto II de velocidades de transmisión de CDMA2000. Estos bits se usan para mejorar la robustez del codificador–decodificador en el caso de tramas borradas. Más detalles acerca del codificador– decodificador de AMR–WB pueden encontrarse en la referencia “Recomendación G.722.2 de la UIT–T “Codificación de voz de banda ancha a aproximadamente 16 kbit/s usando banda ancha de múltiple velocidad de transmisión adaptativo (AMR–WB)”, Génova, 2002”. El codificador–decodificador se basa en el modelo de predicción lineal excitada por código algebraico (ACELP, Algebraic Code–Excited Linear Prediction) optimizado para señales de banda ancha. Funciona en tramas de voz de 20 ms con una frecuencia de muestreo de 16 kHz. Los parámetros de filtro de LP se codifican una vez por trama usando 46 bits. Entonces la trama se divide en cuatro subtramas en la que las ganancias e índices de libro de códigos adaptativos y fijos se codifican una vez por trama. El libro de códigos fijo se construye usando una estructura de libro de códigos algebraico en la que las 64 posiciones en una subtrama se dividen en cuatro pistas de posiciones entrelazadas y en la que se ubican dos pulsos con signo en cada pista. Los dos pulsos de cada pista se codifican usando nueve bits dando un total de 36 bits por subtrama.
Tabla 1. Asignación de bits de AMR–WB normalizada a 12,65 kbit/s (las tramas de 20 ms comprenden cuatro subtramas)
Parámetro
Bits por trama
bandera de VAD
1
Parámetros de LP Retraso de altura de tono Filtrado de altura de tono Ganancias Libro de códigos algebraico
46 30 = 9 + 6 + 9 + 6 4 = 1 + 1 + 1 + 1 28 = 7 + 7 + 7 + 7 144 = 36 + 36 + 36 + 36
Total
253 bits
Basándose en AMR–WB a 12,65 kbit/s, la solución de banda ancha de velocidad de transmisión de bits variable (VBR–WB) puede funcionar de acuerdo con diversos modos de comunicación de entre los que un modo puede efectuar una interrelación con AMR–WB a 12,65 kbit/s. Por lo tanto se usan dos versiones de la velocidad de transmisión completa (FR), una FR capaz de interrelación en la que los 13 bits no usados se añaden para obtener 13,3 kbit/s, y una FR de CDMA específico o genérico en la que el bit de VAD y los 13 bits adicionales disponibles se usan para transmitir información que mejora la robustez del codificador–decodificador frente a borrados de trama (FE, Frame ERasures). La asignación de bits de las dos versiones de codificación de FR es la que se muestra en la tabla 2. Debe resaltarse que no se necesitan bits adicionales para la información de clasificación de trama. La protección de FER de 14 bits contiene una información de energía de 6 bits. Por lo tanto, sólo se usan 63 niveles para cuantificar la energía y el último nivel que se corresponde con el valor 63 está reservado para indicar el uso del modo capaz de interrelación. Por lo tanto, en el caso de FR capaz de interrelación, el índice de información de energía se ajusta a 63.
5
10
15
20
25
30 Tabla 2. Asignación de bits del Conjunto II de velocidades de transmisión de CDMA2000 de velocidad de transmisión completa genérica y capaz de interrelación basándose en la norma de AMR–WB a 12,65 kbit/s.
Bits por trama
Parámetro
FR genérica FR capaz de interrelación
Info de clase
– –
Bit de VAD
– 1
Parámetros de LP
46 46
Retraso de altura de tono
30 30
Filtrado de altura de tono
4 4
Ganancias
28 28
Libro de códigos algebraico
144 144
bits de protección de FER
14 –
Bits no usados
– 13
Total
266 266
En el caso de tramas con voz estables, se usa el módulo 206 de codificación con voz de velocidad de transmisión mitad. La asignación de bits de velocidad de transmisión mitad con voz se da en la tabla 3. Debido a que las tramas que han de codificarse en este modo de comunicación son de forma característica muy periódicas, una velocidad de transmisión de bits sustancialmente más baja es suficiente para sostener una buena calidad subjetiva en comparación con, por ejemplo, las tramas de transición. Se usa una modificación de señal que permite una codificación eficiente de la información de retraso que usa sólo nueve bits por trama de 20 ms lo que ahorra una proporción considerable de la cantidad disponible de bits para otros parámetros de codificación de señal. En la modificación de señal, se fuerza a la señal a seguir un contorno de altura de tono determinado que puede transmitirse con 9 bits por trama. Un buen rendimiento de predicción a largo plazo permite usar sólo 12 bits por subtrama de 5 ms para la excitación de libro de códigos fijo sin sacrificar la calidad de voz subjetiva. El libro de códigos fijo es un libro de códigos algebraico y comprende dos pistas con un pulso cada una, mientras que cada pista tiene 32 posiciones posibles.
Tabla 3. Asignación de bits de velocidad de transmisión mitad genérica, con voz y sin voz de acuerdo con el Conjunto II de velocidades de transmisión de CDMA2000.
Bits por trama
Parámetro
HR genérica HR con voz HR sin voz
Info de clase
1 3 2
Bit de VAD
– – –
Parámetros de LP
36 36 46
Retraso de altura de tono
13 9 –
Filtrado de altura de tono
– 2 –
Ganancias
26 26 24
Libro de códigos algebraico
48 48 52
bits de protección de FER
– – –
Bits no usados
– – –
Total
124 124 124
En el caso de tramas sin voz, no se usa el libro de códigos adaptativo (o libro de códigos de altura de tono). Un libro de códigos gaussiano de 13 bits se usa en cada subtrama en la que la ganancia de libro de códigos se codifica con 6 bits por subtrama. Obsérvese que en los casos en los que la velocidad de transmisión de bits promedio necesita reducirse adicionalmente, puede usarse una velocidad de transmisión sin voz de un cuarto en el caso de tramas sin voz estables.
Se usa un modo de velocidad de transmisión mitad genérico (312) para segmentos de baja energía tales como el que se muestra en la figura 3. Este modo de HR genérico puede usarse también en un funcionamiento de máxima velocidad de transmisión mitad tal como se explicará más tarde. La asignación de bits de la HR genérica se muestra en la tabla 3 anterior.
Como ejemplo, para la información de clasificación para los diferentes codificadores de HR, en el caso de una HR genérica, se usa 1 bit para indicar si la trama es una HR genérica u otra HR. En el caso de una HR sin voz, se usan 2 bits para la clasificación: el primer bit para indicar que la trama no es una HR genérica y el segundo bit para indicar que es una HR sin voz y no una HR con voz o una HR capaz de interrelación (lo que se explicará más tarde). En el caso de una HR con voz, se usan 3 bits: los primeros 2 bits indican que la trama no es una HR genérica o sin voz, y el tercer bit indica si la trama es una HR sin voz o capaz de interrelación.
El módulo 208 de codificación de velocidad de transmisión de un octavo (CNG) se usa para codificar unas tramas de
5
10
15
20
25
30
35
40
45
50
55
voz inactivas (silencio o ruido en segundo plano). En este caso sólo se codifican los parámetros de filtro de LP con 14 bits por trama y se codifica una ganancia con 6 bits por trama. Estos parámetros se usan para una generación de ruido confortable (CNG, Confortable Noise Generation) en el descodificador. La asignación de bits se indica en la tabla 4.
Tabla 4. Asignación de bits de la velocidad de transmisión de un octavo a 1,0 kbit/s para una trama de 20 ms.
Parámetro
Bits/ Trama
Parámetros de LP
14
Ganancia
6
Total
20 bits/ trama = 1,0 kbit
Funcionamiento de velocidad de transmisión mitad impuesto por el sistema
De acuerdo con el esquema de codificación de CDMA, el sistema puede imponer el uso de la velocidad de transmisión mitad en lugar de la velocidad de transmisión completa en algunas tramas de voz con el fin de enviar una información de transmisión de señales dentro de banda. Se hace referencia a esto como transmisión de señales de atenuación y de ráfaga. El uso de la velocidad de transmisión mitad como una velocidad de transmisión de bits máxima puede estar impuesto también por el sistema durante unas condiciones de canal malas (tales como en las proximidades de los límites de una célula) con el fin de mejorar la robustez del codificador–decodificador. Se hace referencia a esto como el máximo en velocidad de transmisión mitad. En la configuración de codificación de VBR que se describe anteriormente, la velocidad de transmisión mitad se usa cuando la trama es estacionaria con voz o estacionaria sin voz. La velocidad de transmisión completa se usa para las iniciaciones, las tramas transitorias y las tramas con voz mixtas. Cuando el módulo de selección de velocidad de transmisión elige la trama que va a codificarse como una trama de velocidad de transmisión completa y el sistema impone la trama de velocidad de transmisión mitad el rendimiento de voz se deteriora debido a que los modos de comunicación a media velocidad no son capaces de codificar de forma eficiente las tramas transitorias y las iniciaciones.
Además, en una llamada de funcionamiento libre conjunto entre sistemas entre CDMA2000 que usa la solución de Conjunto II de velocidades de transmisión de VBR basándose en AMR–WB y otro sistema que usa la norma AMR– WB, el sistema de CDMA2000 puede finalmente forzar la velocidad de transmisión mitad tal como se explicó con anterioridad (tal como en la transmisión de señales de atenuación y de ráfaga). Debido a que el codificador– decodificador de AMR–WB no reconoce la velocidad de transmisión mitad de 6,2 kbit/s del codificador–decodificador de banda ancha de CDMA2000, entonces las tramas de velocidad de transmisión mitad forzadas se interpretan como tramas borradas. Esta deteriora el rendimiento de la conexión.
La realización ilustrativa no restrictiva de la presente invención implementa una técnica novedosa para mejorar el rendimiento de conjuntos de codificador–decodificador de voz de velocidad de transmisión de bits variable que funcionan en los sistemas inalámbricos de CDMA en situaciones en las que la velocidad de transmisión mitad está impuesta por el sistema. Además, esta técnica novedosa mejora el rendimiento en el caso de un funcionamiento libre conjunto entre sistemas entre CDMA2000 y otros sistemas que usan un codificador–decodificador de AMR–WB cuando el sistema de CDMA2000 fuerza el uso de la velocidad de transmisión mitad.
En un funcionamiento máximo en velocidad de transmisión mitad o transmisión de señales de atenuación y de ráfaga, cuando el sistema solicita el uso de la velocidad de transmisión mitad mientras el mecanismo de clasificación ha seleccionado una velocidad de transmisión completa, esto indica que la trama no es sin voz ni con voz estable y es probable que la trama contenga un segmento de voz no estacionario tal como una iniciación con voz o una señal de voz con voz en rápida evolución. Por lo tanto el uso de la velocidad de transmisión mitad optimizada para señales sin voz o con voz estables deteriora el rendimiento de voz. Un nuevo modo de velocidad de transmisión mitad se necesita en este caso, y se ha introducido una HR genérica que puede usarse en tales casos. Por lo tanto en el caso de funcionamiento de atenuación y de ráfaga o máximo en velocidad de transmisión mitad el codificador usa la HR genérica si la trama no se clasifica como una HR con voz o sin voz. No obstante, en sistemas de CDMA2000, hay un funcionamiento conocido como transmisión de señales de nivel de paquetes mediante el que la información de transmisión de señales no se proporciona al codificador y el sistema puede forzar el uso de HR después de que se ha codificado la trama. Por lo tanto, si la trama se ha codificado como FR y el sistema requiere el uso de HR entonces la trama se declarará como borrada. Además, en el caso de funcionamiento de atenuación y de ráfaga y máximo en velocidad de transmisión mitad en el modo capaz de interrelación en el que el codificador de VBR está realizando una interrelación con AMR–WB a 12,65 kbit/s, entonces la HR genérica no puede usarse debido a que no es parte de AMR–WB. Para evitar el borrado de la trama en estas situaciones (transmisión de señales de nivel de paquetes, o de atenuación y de ráfaga y máximo en velocidad de transmisión mitad en el modo capaz de interrelación), la realización ilustrativa no restrictiva de la presente invención usa un modo de velocidad de transmisión mitad que se deduce directamente a partir del modo de velocidad de transmisión completa rechazando una parte de los parámetros de codificación de señal, por ejemplo los índices de libro de códigos fijo después de que se ha codificado la trama como una trama de velocidad de transmisión completa. En el lado de descodificador, la parte rechazada de los parámetros de codificación de señal, por ejemplo los índices de libro de códigos fijo, puede
5
10
15
20
25
30
35
40
45
generarse de forma aleatoria y el descodificador funcionará como si estuviera en velocidad de transmisión completa. Se hace referencia a este modo de velocidad de transmisión mitad como HR de transmisión de señales o HR capaz de interrelación debido a que tanto la codificación como la decodificación se realizan en velocidad de transmisión completa. La asignación de bits del modo de velocidad de transmisión mitad capaz de interrelación de acuerdo con la realización ilustrativa no restrictiva de la presente invención se da en la tabla 5. En esta realización ilustrativa no restrictiva la velocidad de transmisión completa se basa en la norma de AMR–WB a 12,65 kbit/s, y la velocidad de transmisión mitad se deduce rechazando los 144 bits necesarios para los índices del libro de códigos fijo algebraico. La diferencia entre la HR de transmisión de señales y la HR capaz de interrelación es que la HR de transmisión de señales se usa en un funcionamiento de transmisión de señales de nivel de paquetes dentro del sistema de CDMA2000 y pueden aún usarse unos bits de protección de FER. La HR de transmisión de señales se deduce directamente a partir de la FR genérica que se muestra en la tabla 1 rechazando los 144 bits para los índices de libro de códigos algebraico. Se añaden tres bits para la información de clase y sólo se usan seis bits para la protección de FER lo que deja cinco bits no usados. La HR capaz de interrelación se deduce a partir de la FR capaz de interrelación rechazando los 144 bits para los índices de libro de códigos algebraico. Tres bits se añaden para la información de clase lo que deja 12 bits no usados. Tal como se explicó con anterioridad al discutir la información de clasificación en el caso de las diferentes velocidades medias, se usan tres bits en el caso de una HR con voz o una HR capaz de interrelación. No se envía información adicional para distinguir entre la HR de transmisión de señales y la HR capaz de interrelación. De forma similar al caso de FR, se usa el último nivel de la información de energía de 6 bits para esta finalidad. Sólo se usan 63 niveles para cuantificar la energía y el último nivel que se corresponde con el valor 63 está reservado para indicar el uso del modo capaz de interrelación. Por lo tanto en el caso de una HR capaz de interrelación, el índice de información de energía se ajusta a 63.
Tabla 5. Asignación de bits de la velocidad de transmisión capaz de interrelación y mitad de transmisión de señales a 6,2 kbit/s.
Bits por trama
Parámetro
HR de transmisión de señales HR capaz de interrelación
Info de clase Bit de VAD Parámetros de LP Retraso de altura de tono Filtrado de altura de tono Ganancias Libro de códigos algebraico bits de protección de FER Bits no usados
3 – 46 30 4 28 – 8 5 3 1 46 30 4 28 – – 12
Total
124 124
La figura 4 representa el diagrama de bloques esquemático funcional de la figura 3 añadiendo la petición de sistema para el uso de una velocidad de transmisión mitad dentro de la lógica de determinación de velocidad de transmisión. La configuración en la figura 3 es válida para un funcionamiento dentro del sistema de CDMA2000. Al final de la cadena de determinación de velocidad de transmisión, el módulo 404 verifica si una petición de sistema de velocidad de transmisión mitad está presente. Si la lógica de determinación de velocidad de transmisión indica que la trama es una trama de voz activa (módulo 201), y no es sin voz (módulo 202) ni con voz estable (módulo 203) ni una trama con baja energía (módulo 311), pero el sistema solicita un funcionamiento de velocidad de transmisión mitad (módulo 404), entonces se usa la velocidad de transmisión mitad genérica para codificar la trama en el módulo 312.
En caso contrario (no está presente una petición de sistema de velocidad de transmisión mitad) la trama de voz se codifica en el módulo 205 como una trama de velocidad de transmisión completa (13,3 kbit/s de acuerdo con el Conjunto II de velocidades de transmisión de CDMA2000).
En la realización ilustrativa no restrictiva de la presente invención tal como la que se muestra en la figura 5, la lógica de determinación de velocidad de transmisión y la codificación de velocidad de transmisión variable son las mismas que en la figura 3. No obstante, después de que se ha codificado la trama y se transmiten los bits, se realiza una comprobación para verificar si el sistema solicita un funcionamiento de velocidad de transmisión mitad en el módulo
514. Si este es el caso y la trama transmitida es una trama de FR entonces se rechaza una parte de los parámetros de codificación de señal, por ejemplo los índices de libro de códigos fijo, con el fin de obtener una trama de velocidad de transmisión mitad de transmisión de señales (módulo 510). Obsérvese que en esta realización ilustrativa no restrictiva, se usan de uno a tres bits para el modo de velocidad de transmisión mitad (genérica, con voz, sin voz, o capaz de interrelación). Por lo tanto, los 3 bits que indican una velocidad de transmisión mitad de transmisión de señales o capaz de interrelación se añaden después de que se rechaza la parte de los parámetros de codificación de señal (índices de libro de códigos fijo). Los bits en la trama se distribuyen de acuerdo con la tabla 5.
La elección del rechazo de los índices de libro de códigos fijo se debe al hecho de que estos bits son los menos sensibles a errores, y generarlos de forma aleatoria tiene escaso impacto en el rendimiento. No obstante, debe mantenerse en mente que pueden rechazarse otros bits para obtener una velocidad de transmisión mitad capaz de
interrelación o de transmisión de señales sin pérdida de generalidad.
En esta realización ilustrativa no restrictiva, en un funcionamiento de velocidad de transmisión mitad de transmisión de señales o capaz de interrelación en el lado de codificador, el codificador funciona como un codificador de velocidad de transmisión completa. La búsqueda de libro de códigos fijo se realiza como es usual y la excitación de libro de códigos fijo determinado se usa en la actualización del contenido de libro de códigos adaptativo y de las memorias de filtro para las tramas próximas de acuerdo con la norma de AMR–WB a 12,65 kbit/s [Recomendación
G.722.2 de la UIT–T “Codificación de voz de banda ancha a aproximadamente 16 kbit/s usando banda ancha de múltiple velocidad de transmisión adaptativo (AMR–WB)”, Génova, 2002] [3GPP TS 26.190, “Codificador– decodificador de voz de banda ancha de AMR: funciones de transcodificación”, Especificaciones técnicas de 3GPP]. Por lo tanto, se usan índices de libro de códigos no aleatorios dentro del funcionamiento de codificador. Esto es evidente en la implementación de la figura 5 en la que la petición de sistema de velocidad de transmisión mitad (módulo 514) se verifica después de que se ha codificado la trama en un funcionamiento de velocidad de transmisión completa normal.
En un funcionamiento de velocidad de transmisión mitad de transmisión de señales o capaz de interrelación en el lado de descodificador, la parte rechazada de los parámetros de codificación de señal, por ejemplo los índices del libro de códigos fijo se generan de forma aleatoria. El descodificador funciona entonces como en un funcionamiento de velocidad de transmisión completa. Pueden usarse otros procedimientos para generar la parte rechazada de los parámetros de codificación de señal. Por ejemplo, los parámetros rechazados pueden obtenerse copiando partes del flujo de bits recibido. Obsérvese que puede ocurrir un desajuste entre las memorias en los lados de codificador y de descodificador, debido a que la parte rechazada de los parámetros de codificación de señal, por ejemplo la excitación de libro de códigos fijo no es la misma. No obstante, no parece que tal desajuste tenga influencia en el rendimiento, especialmente en el caso de una transmisión de señales de atenuación y de ráfaga al efectuar una interrelación entre AMR–WB y VBR de CDMA2000, en la que las velocidades de transmisión típicas son de aproximadamente 2%.
El rendimiento del enfoque propuesto en un funcionamiento de atenuación y de ráfaga es casi transparente en comparación con el caso en el que no hay una petición de sistema de velocidad de transmisión mitad. En muchos casos, la lógica de determinación de velocidad de transmisión ya ha determinado la trama que va a codificarse con o bien una velocidad de transmisión de un octavo, o bien una velocidad de transmisión de un cuarto, o bien una velocidad de transmisión mitad (genérica, con voz, o sin voz). En un caso de este tipo, se deniega la petición de sistema de velocidad de transmisión mitad debido a que ya se ha adaptado por el codificador y el tipo de señal en la trama es adecuado para codificar a una velocidad de transmisión mitad o a una velocidad de transmisión más baja.
Debe observarse que la lógica de clasificación es adaptativa con un modo de funcionamiento. Por lo tanto con el fin de mejorar el rendimiento, en el modo máximo de velocidad de transmisión mitad y transmisión de señales de atenuación y de ráfaga, esta lógica de clasificación puede relajarse para usar los conjuntos de codificador– decodificador de velocidad de transmisión mitad específicos (la velocidad de transmisión mitad con voz y sin voz se usa relativamente más a menudo que en funcionamiento normal). Esto es un tipo de ampliación al funcionamiento de modo múltiple, en el que la lógica de clasificación está más relajada y se usan modos con velocidades de transmisión de datos promedio más bajas.
Funcionamiento libre conjunto entre un sistema de CDMA2000 y otros sistemas que usan la norma de AMR–WB
Tal como se ha mencionado con anterioridad, la designación de un codificador–decodificador de banda ancha de velocidad de transmisión de bits variable (VBR–WB) para el sistema de CDMA2000 basándose en el codificador– decodificador de AMR–WB tiene la ventaja de posibilitar un funcionamiento libre conjunto (TFO, Tandem Free Operation), o funcionamiento conmutado por paquetes, entre el sistema de CDMA2000 y otros sistemas que usan la norma de AMR–WB (tales como el sistema GSM móvil o un sistema inalámbrico de tercera generación de W– CDMA). No obstante, en una llamada de funcionamiento libre conjunto entre sistemas entre CDMA2000 y otro sistema que usa AMR–WB, el sistema de CDMA2000 puede forzar el uso de la velocidad de transmisión mitad tal como se explicó con anterioridad (tal como en la transmisión de señales de atenuación y de ráfaga). Debido a que el codificador–decodificador de AMR–WB no reconoce la velocidad de transmisión mitad de 6,2 kbit/s del codificador– decodificador de banda ancha de CDMA2000, entonces las tramas de velocidad de transmisión mitad forzadas se interpretan como tramas borradas. Esta deteriora el rendimiento de la conexión. El uso del modo de velocidad de transmisión mitad capaz de interrelación que se ha dado a conocer con anterioridad mejorará de forma significativa el rendimiento debido a que este modo puede efectuar una interrelación con la velocidad de transmisión de 12,65 kbit/s de la norma de AMR–WB.
Tal como se ha dado a conocer anteriormente en el presente documento, la velocidad de transmisión mitad capaz de interrelación es básicamente una pseudo–velocidad de transmisión completa, en la que el codificador– decodificador funciona como si estuviera en el modo de velocidad de transmisión completa. La diferencia es que una parte de los parámetros de codificación de señal, por ejemplo los índices de libro de códigos algebraico se rechazan al final y no se transmiten. En el lado de descodificador, la parte rechazada de los parámetros de codificación de señal, por ejemplo los índices de libro de códigos algebraico se generan de forma aleatoria y entonces el descodificador funciona como si estuviera en un modo de velocidad de transmisión completa.
5
10
15
20
25
30
35
40
La figura 6 ilustra una configuración de acuerdo con la realización ilustrativa no restrictiva de la presente invención, que muestra el uso del modo de velocidad de transmisión mitad capaz de interrelación durante la transmisión dentro de banda de una información de transmisión de señales (es decir, una condición de atenuación y de ráfaga) en el lado de sistema de CDMA2000. En esta figura, el otro lado es un sistema que usa la norma de AMR–WB y se da como ejemplo un sistema inalámbrico de 3GPP.
En el enlace con la dirección de CDMA2000 a 3GPP u otro sistema que usa AMR–WB, cuando la subcapa de múltiplex indica una petición para el modo de velocidad de transmisión mitad (véase la petición de sistema de atenuación y de ráfaga 601), el codificador 602 de VBR–WB funcionará en la velocidad de transmisión mitad capaz de interrelación (I–HR) que se describe con anterioridad. En la interfaz 604 de sistema, cuando se recibe una trama de I–HR, unos índices de libro de códigos algebraico generados de forma aleatoria se insertan mediante el módulo 603 en el flujo de bits a través de la interfaz 604 basada en IP del sistema para entregar una velocidad de transmisión de 12,65 kbit/s. El descodificador 605 en el lado de 3GPP lo interpretará como una trama de 12,65 kbit/s ordinaria.
En el sentido opuesto, es decir, en un enlace de 3GPP u otro sistema que use AMR–WB a CDMA2000, si se recibe en la interfaz del sistema 606 una petición de velocidad de transmisión mitad (véase la petición de atenuación y de ráfaga del sistema 607), entonces un módulo 608 rechaza los índices de libro de códigos algebraico e inserta 3 bits que indican la trama de tipo I–HR. El descodificador 609 en el lado de CDMA2000 funcionará como una trama de tipo I–HR, que es parte de la solución de VBR–WB.
Esta propuesta requiere una lógica mínima en la interfaz del sistema y mejora de forma significativa el rendimiento sobreforzando las tramas de atenuación y de ráfaga como tramas en blanco y de ráfaga (tramas borradas).
Otra preocupación en la interrelación es el manejo de ruido en las tramas de segundo plano. En el lado de AMR– WB, el codificador 610 soporta un funcionamiento de DTX (transmisión discontínua) y de CNG (generación de ruido confortable). Las tramas de voz inactivas (silencio o ruido en segundo plano) o bien se codifican como tramas de SID (descripción de silencio) que usan 35 bits o bien no se transmiten (ausencia de datos). En el lado de CDMA2000, se codifican unas tramas de voz inactivas usando una velocidad de transmisión de un octavo (ER). Debido a que no pueden enviarse los 35 bits para el SID usando ER, una CNG de velocidad de transmisión de un cuarto (QR) se usa para enviar unas tramas de SID desde el lado AMR–WB al lado de CDMA2000. Las tramas sin datos no transmitidas en el lado de AMR–WB se convierten en tramas de ER (todos los bits se ajustan a 1 en la realización ilustrativa). En el lado de CDMA2000 en el modo capaz de interrelación, las tramas de ER se tratan por descodificador como unos borrados de trama.
En la interrelación del lado de CDMA2000 al de AMR–WB, en el principio los de segmentos de voz inactivos, se usa QR de CNG, luego se usan tramas de ER. En la realización ilustrativa no restrictiva de la invención, el funcionamiento es similar al funcionamiento de VAD/ DTX/ CNG en AMR–WB en la que se envía una trama de SID una vez cada ocho tramas. En este caso, la primera trama de voz inactiva se codifica como una trama de QR de CNG y las siguientes 7 tramas se codifican como tramas de ER. En la interfaz del sistema, las tramas de QR de CNG se convierten en tramas de SID de AMR–WB y las tramas de ER no se transmiten (tramas sin datos).
La asignación de bits de las tramas de QR de CNG y de ER de CNG se muestra en la tabla 6.
Tabla 6. Asignación de bits de QR de CNG a 2,7 kbit/s y ER DE CNG a 1 kbit/s para una trama de 20 ms.
Bits por trama
Parámetro
QR de CNG ER DE CNG
Info de clase Parámetros de LP Ganancias Bits no usados
1 28 6 19 – 14 6 –
Total
54 20
Aunque la presente invención se ha descrito en la descripción precedente en relación con una realización ilustrativa no restrictiva de la misma, esta realización ilustrativa puede modificarse a voluntad, dentro del alcance de las reivindicaciones adjuntas sin alejarse del alcance de la presente invención.

Claims (17)

  1. REIVINDICACIONES
    1.
    Un procedimiento que comprende:
    recibir unos parámetros de codificación de señal representativos de una señal sonora codificada de acuerdo con un modo de comunicación a velocidad de transmisión completa de un esquema de comunicación de VBR–WB de CDMA2000; recibir una petición para transmitir los parámetros de codificación de señal usando un modo de comunicación a velocidad de transmisión mitad del esquema de comunicación de VBR–WB de CDMA2000 para reducir la velocidad de transmisión de bits durante la transmisión de dichos parámetros de codificación de señal; insertar una identificación del modo de comunicación que va a transmitirse junto con los parámetros de codificación de señal restantes; y como respuesta a la petición, rechazar una parte de los parámetros de codificación de señal para posibilitar la transmisión de los parámetros de codificación de señal restantes usando el modo de comunicación a velocidad de transmisión mitad del esquema de comunicación de VBR–WB de CDMA2000, en el que la parte rechazada de los parámetros de codificación de señal son unos índices de libro de códigos fijo de un libro de códigos algebraico.
  2. 2.
    Un procedimiento tal como se define en la reivindicación 1, que además comprende:
    generar unos parámetros de codificación de señal de reemplazo para reemplazar los índices de libro de códigos fijo rechazados.
  3. 3.
    Un procedimiento tal como se define en la reivindicación 2, en el que generar unos parámetros de codificación de señal de reemplazo comprende generar de nuevo de forma aleatoria los índices de libro de códigos fijo.
  4. 4.
    Un procedimiento tal como se define en la reivindicación 1, que además comprende:
    transmitir los parámetros de codificación de señal restantes usando el modo de comunicación a velocidad de transmisión mitad del esquema de comunicación de VBR–WB de CDMA2000; generar unos parámetros de codificación de señal de reemplazo para reemplazar la parte rechazada de los parámetros de codificación de señal; y decodificar los parámetros de codificación de señal incluyendo la parte reemplazada de los parámetros de codificación de señal de acuerdo con un modo de comunicación a velocidad de transmisión completa de un esquema de comunicación de AMR–WB.
  5. 5.
    Un procedimiento tal como se define en la reivindicación 1, que además comprende codificar inicialmente la señal sonora de acuerdo con un modo de comunicación a velocidad de transmisión completa de un esquema de comunicación de AMR–WB.
  6. 6.
    Un procedimiento tal como se define en la reivindicación 1 o 4, que además comprende transmitir los parámetros de codificación de señal restantes usando el modo de comunicación a velocidad de transmisión mitad del esquema de comunicación de VBR–WB de CDMA2000.
  7. 7.
    Un procedimiento que comprende:
    recibir una indicación de que los parámetros de codificación de señal se han transmitido usando un modo de comunicación a velocidad de transmisión mitad de un esquema de comunicación de VBR–WB de CDMA2000 en lugar de un modo de comunicación a velocidad de transmisión completa del esquema de comunicación de VBR–WB de CDMA2000 para reducir la velocidad de transmisión de bits durante la transmisión de dichos parámetros de codificación de señal, en el que los parámetros de codificación de señal son representativos de una señal sonora codificada de acuerdo con el modo de comunicación a velocidad de transmisión completa del esquema de comunicación de VBR–WB de CDMA2000; y como respuesta a dicha indicación, generar unos parámetros de codificación de señal de reemplazo para reemplazar una parte de los parámetros de codificación de señal rechazados para reducir la velocidad de transmisión de bits durante la transmisión con el fin de producir unos segundos parámetros de codificación de señal de acuerdo con un modo de comunicación a velocidad de transmisión completa de un esquema de comunicación de AMR–WB, en el que la parte rechazada de los parámetros de codificación de señal son unos índices de libro de códigos fijo de un libro de códigos algebraico.
  8. 8.
    Un procedimiento tal como se define en la reivindicación 7, que además comprende recibir los parámetros de codificación de señal y decodificar la señal sonora usando los segundos parámetros de codificación de señal.
  9. 9.
    Un procedimiento tal como se define en la reivindicación 8, que además comprende transmitir los segundos parámetros de codificación de señal de acuerdo con el modo de comunicación a velocidad de transmisión completa del esquema de comunicación de AMR–WB.
  10. 10.
    Software informático que comprende unas instrucciones de programa que pueden usarse mediante un aparato
    informático para realizar el procedimiento de cualquiera de las reivindicaciones 1 a 9.
  11. 11.
    Un sistema que comprende una primera estación que usa un esquema de comunicación de VBR–WB de CDMA2000 y una segunda estación que usa un esquema de comunicación de AMR–WB, siendo un modo de comunicación a velocidad de transmisión completa del esquema de comunicación de VBR–WB de CDMA2000 capaz de interrelación con un modo de comunicación a velocidad de transmisión completa del esquema de comunicación de AMR–WB; comprendiendo dicha primera estación:
    medios para codificar una señal sonora para generar unos parámetros de codificación de señal de acuerdo con el modo de comunicación a velocidad de transmisión completa del esquema de comunicación de VBR– WB de CDMA2000, medios para recibir una petición para transmitir los parámetros de codificación de señal usando un modo de comunicación a velocidad de transmisión mitad del esquema de comunicación de VBR–WB de CDMA2000, medios para rechazar, como respuesta a dicha petición, una parte de los parámetros de codificación de señal codificada de acuerdo con el modo de comunicación a velocidad de transmisión completa del esquema de comunicación de VBR–WB de CDMA2000, en el que la parte rechazada de los parámetros de codificación de señal son unos índices de libro de códigos fijo de un libro de códigos algebraico, y medios para transmitir los parámetros de codificación de señal restantes usando el modo de comunicación a velocidad de transmisión mitad del esquema de comunicación de VBR–WB de CDMA2000;
    comprendiendo dicha segunda estación:
    medios para recibir los parámetros de codificación de señal restantes, medios para generar unos parámetros de codificación de señal de reemplazo para reemplazar dicha parte rechazada de los parámetros de codificación de señal, y medios para decodificar los parámetros de codificación de señal usando los parámetros de codificación de señal restantes y los parámetros de codificación de señal de reemplazo generados.
  12. 12.
    Un dispositivo que comprende:
    medios para recibir unos parámetros de codificación de señal representativos de una señal sonora codificada de acuerdo con un modo de comunicación a velocidad de transmisión completa de un esquema de comunicación de VBR–WB de CDMA2000; medios para recibir una petición para transmitir los parámetros de codificación de señal usando un modo de comunicación a velocidad de transmisión mitad del esquema de comunicación de VBR–WB de CDMA2000 para reducir la velocidad de transmisión de bits durante la transmisión de dichos parámetros de codificación de señal; medios para rechazar una parte de los parámetros de codificación de señal para posibilitar la transmisión de los parámetros de codificación de señal restantes usando el modo de comunicación a velocidad de transmisión mitad del esquema de comunicación de VBR–WB de CDMA2000, en el que la parte rechazada de los parámetros de codificación de señal son unos índices de libro de códigos fijo de un libro de códigos algebraico; medios para insertar una identificación del modo de comunicación que va a transmitirse junto con los parámetros de codificación de señal restantes; y medios para transmitir los parámetros de codificación de señal restantes de acuerdo con el modo de comunicación a velocidad de transmisión mitad del esquema de comunicación de VBR–WB de CDMA2000.
  13. 13.
    Un dispositivo que comprende:
    medios para recibir una indicación de que los parámetros de codificación de señal se han transmitido usando un modo de comunicación a velocidad de transmisión mitad de un esquema de comunicación de VBR–WB de CDMA2000 en lugar de un modo de comunicación a velocidad de transmisión completa del esquema de comunicación de VBR–WB de CDMA2000 para reducir la velocidad de transmisión de bits durante la transmisión de dichos parámetros de codificación de señal, en el que los parámetros de codificación de señal son representativos de una señal sonora; y medios para generar, como respuesta a dicha indicación, unos parámetros de codificación de señal de reemplazo para reemplazar una parte de los parámetros de codificación de señal rechazados para reducir la velocidad de transmisión de bits durante la transmisión con el fin de producir unos segundos parámetros de codificación de señal de acuerdo con un modo de comunicación a velocidad de transmisión completa de un esquema de comunicación de AMR–WB, en el que la parte rechazada de los parámetros de codificación de señal son unos índices de libro de códigos fijo de un libro de códigos algebraico.
  14. 14.
    Un dispositivo tal como se define en la reivindicación 13, en el que los medios para generar unos parámetros de codificación de señal de reemplazo están dispuestos para generar de forma aleatoria unos parámetros de codificación de señal de reemplazo.
  15. 15.
    Un dispositivo tal como se define en la reivindicación 14, en el que los parámetros de codificación de señal de
    reemplazo generados de forma aleatoria comprenden unos índices de libro de códigos fijo de reemplazo generados de forma aleatoria.
  16. 16.
    Un dispositivo tal como se define en la reivindicación 15, que además comprende unos medios para transmitir los parámetros de codificación de señal incluyendo la parte reemplazada de los parámetros de codificación de señal
    5 de acuerdo con el modo de comunicación a velocidad de transmisión completa del esquema de comunicación de AMR–WB.
  17. 17. Un dispositivo tal como se define en la reivindicación 13, que además comprende unos medios para recibir los parámetros de codificación de señal y unos medios para decodificar la señal sonora usando los segundos parámetros de codificación de señal.
    10
ES03739909T 2002-07-05 2003-06-27 Procedimiento y dispositivo para transmisión de señales de atenuación y de rafaga dentro de banda eficiente y funcionamiento máximo en velocidad de transmisión mitad en codificación de voz de banda ancha de velocidad de transmisión de bits variable para sistemas inalámbricos de cdma. Expired - Lifetime ES2367259T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CA2392640 2002-07-05
CA002392640A CA2392640A1 (en) 2002-07-05 2002-07-05 A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems

Publications (1)

Publication Number Publication Date
ES2367259T3 true ES2367259T3 (es) 2011-10-31

Family

ID=30005535

Family Applications (1)

Application Number Title Priority Date Filing Date
ES03739909T Expired - Lifetime ES2367259T3 (es) 2002-07-05 2003-06-27 Procedimiento y dispositivo para transmisión de señales de atenuación y de rafaga dentro de banda eficiente y funcionamiento máximo en velocidad de transmisión mitad en codificación de voz de banda ancha de velocidad de transmisión de bits variable para sistemas inalámbricos de cdma.

Country Status (15)

Country Link
US (1) US8224657B2 (es)
EP (1) EP1520271B1 (es)
JP (2) JP2005532579A (es)
KR (1) KR101105353B1 (es)
CN (2) CN1692408A (es)
AT (1) ATE518225T1 (es)
AU (1) AU2003281378B2 (es)
BR (1) BR0312467A (es)
CA (1) CA2392640A1 (es)
ES (1) ES2367259T3 (es)
HK (1) HK1130558A1 (es)
MX (1) MXPA05000285A (es)
MY (1) MY144845A (es)
RU (2) RU2326449C2 (es)
WO (1) WO2004006226A1 (es)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7499403B2 (en) * 2003-05-07 2009-03-03 Alcatel-Lucent Usa Inc. Control component removal of one or more encoded frames from isochronous telecommunication stream based on one or more code rates of the one or more encoded frames to create non-isochronous telecommunications stream
EP1768106B8 (en) * 2004-07-23 2017-07-19 III Holdings 12, LLC Audio encoding device and audio encoding method
WO2006090852A1 (ja) * 2005-02-24 2006-08-31 Matsushita Electric Industrial Co., Ltd. データ再生装置
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8209187B2 (en) * 2006-12-05 2012-06-26 Nokia Corporation Speech coding arrangement for communication networks
GB0705324D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
PT2171712T (pt) * 2007-06-27 2016-09-28 ERICSSON TELEFON AB L M (publ) Método e disposição para melhorar sinais áudio espaciais
DE102008022125A1 (de) * 2008-05-05 2009-11-19 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Klassifikation von schallerzeugenden Prozessen
US8320553B2 (en) * 2008-10-27 2012-11-27 Apple Inc. Enhanced echo cancellation
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101783142B (zh) * 2009-01-21 2012-08-15 北京工业大学 转码方法、装置和通信设备
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
ES2673637T3 (es) * 2009-06-23 2018-06-25 Voiceage Corporation Cancelación prospectiva de solapamiento en dominio de tiempo con aplicación en dominio de señal ponderada u original
JP5314771B2 (ja) 2010-01-08 2013-10-16 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体
US9093066B2 (en) 2010-01-13 2015-07-28 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering to cancel time reversed and zero input responses of adjacent frames
KR20130036304A (ko) * 2010-07-01 2013-04-11 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
EP2625688B1 (en) 2010-10-06 2014-12-03 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac)
CN102104917B (zh) * 2011-02-21 2013-10-09 上海华为技术有限公司 一种调整自适应编码速率的方法、基站控制器及终端
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
KR101900319B1 (ko) 2012-02-07 2018-09-19 삼성전자 주식회사 서비스 연동 수행 방법과 이를 위한 시스템
WO2014035328A1 (en) * 2012-08-31 2014-03-06 Telefonaktiebolaget L M Ericsson (Publ) Method and device for voice activity detection
US9589570B2 (en) 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
JP6335190B2 (ja) * 2012-12-21 2018-05-30 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
CN104853383B (zh) * 2015-04-02 2018-05-04 四川大学 一种语音码率调整的方法和装置
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
KR102477464B1 (ko) 2015-11-12 2022-12-14 삼성전자주식회사 무선 통신 시스템에서 음성 패킷의 크기를 제어하기 위한 장치 및 방법
CN105517064A (zh) * 2015-12-03 2016-04-20 海能达通信股份有限公司 一种语音码率调整的方法及核心网设备
CN111262587B (zh) * 2018-11-30 2023-06-06 康泰医学系统(秦皇岛)股份有限公司 一种数据压缩方法、装置、设备及计算机可读存储介质

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5568483A (en) 1990-06-25 1996-10-22 Qualcomm Incorporated Method and apparatus for the formatting of data for transmission
US5511073A (en) * 1990-06-25 1996-04-23 Qualcomm Incorporated Method and apparatus for the formatting of data for transmission
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
BR9206143A (pt) * 1991-06-11 1995-01-03 Qualcomm Inc Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados
CA2157024C (en) * 1994-02-17 1999-08-10 Kenneth A. Stewart Method and apparatus for group encoding signals
US5519779A (en) * 1994-08-05 1996-05-21 Motorola, Inc. Method and apparatus for inserting signaling in a communication system
TW271524B (es) * 1994-08-05 1996-03-01 Qualcomm Inc
JPH08146997A (ja) 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
ZA961025B (en) * 1995-02-28 1996-07-16 Qualcomm Inc Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
DE69620967T2 (de) * 1995-09-19 2002-11-07 At & T Corp., New York Synthese von Sprachsignalen in Abwesenheit kodierter Parameter
US5996022A (en) * 1996-06-03 1999-11-30 Webtv Networks, Inc. Transcoding data in a proxy computer prior to transmitting the audio data to a client
US6269338B1 (en) * 1996-10-10 2001-07-31 U.S. Philips Corporation Data compression and expansion of an audio signal
DE69712535T2 (de) * 1996-11-07 2002-08-29 Matsushita Electric Industrial Co., Ltd. Vorrichtung zur Erzeugung eines Vektorquantisierungs-Codebuchs
GB2349251B (en) * 1998-02-24 2003-01-08 Seagate Technology A detector for, and method of, detecting data values using sample vectors
SE516595C2 (sv) * 1998-03-13 2002-02-05 Ericsson Telefon Ab L M Kommunikationsanordning och arbetssätt för behandling av röstmeddelanden
JP2000081898A (ja) * 1998-09-03 2000-03-21 Denso Corp ホワイトノイズの生成方法、ホワイトノイズの振幅制御方法およびデジタル電話装置
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6539237B1 (en) * 1998-11-09 2003-03-25 Cisco Technology, Inc. Method and apparatus for integrated wireless communications in private and public network environments
US6182030B1 (en) * 1998-12-18 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced coding to improve coded communication signals
US6260009B1 (en) 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
JP2000305597A (ja) 1999-03-12 2000-11-02 Texas Instr Inc <Ti> 音声圧縮のコード化
AUPQ141199A0 (en) * 1999-07-05 1999-07-29 Telefonaktiebolaget Lm Ericsson (Publ) Data rate adaptation between mobile stations through transit fixed network
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US7010001B2 (en) * 2000-01-10 2006-03-07 Qualcomm, Incorporated Method and apparatus for supporting adaptive multi-rate (AMR) data in a CDMA communication system
CN1266674C (zh) * 2000-02-29 2006-07-26 高通股份有限公司 闭环多模混合域线性预测语音编解码器和处理帧的方法
JP2001267085A (ja) 2000-03-23 2001-09-28 Sanyo Electric Co Ltd 有機発光装置およびその製造方法
AU2000244000A1 (en) * 2000-04-11 2001-10-23 Nokia Corporation Application of rtp and rtcp in the amr transport in voice over ip networks
ES2287122T3 (es) * 2000-04-24 2007-12-16 Qualcomm Incorporated Procedimiento y aparato para cuantificar de manera predictiva habla sonora.
FI20001577A (fi) * 2000-06-30 2001-12-31 Nokia Mobile Phones Ltd Puheenkoodaus
US6847929B2 (en) * 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US6766289B2 (en) * 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
US6789059B2 (en) * 2001-06-06 2004-09-07 Qualcomm Incorporated Reducing memory requirements of a codebook vector search
US7042841B2 (en) 2001-07-16 2006-05-09 International Business Machines Corporation Controlling network congestion using a biased packet discard policy for congestion control and encoded session packets: methods, systems, and program products
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
US6981184B2 (en) * 2002-04-11 2005-12-27 Motorola, Inc. Apparatus and method for processing a corrupted frame
US6885638B2 (en) * 2002-06-13 2005-04-26 Motorola, Inc. Method and apparatus for enhancing the quality of service of a wireless communication

Also Published As

Publication number Publication date
RU2326449C2 (ru) 2008-06-10
MXPA05000285A (es) 2005-09-20
HK1130558A1 (en) 2009-12-31
RU2461897C2 (ru) 2012-09-20
CN101494055A (zh) 2009-07-29
CN101494055B (zh) 2012-10-10
CA2392640A1 (en) 2004-01-05
EP1520271B1 (en) 2011-07-27
RU2008102318A (ru) 2009-07-27
AU2003281378A2 (en) 2004-01-23
WO2004006226A1 (en) 2004-01-15
ATE518225T1 (de) 2011-08-15
JP2009239927A (ja) 2009-10-15
WO2004006226B1 (en) 2004-03-04
CN1692408A (zh) 2005-11-02
MY144845A (en) 2011-11-30
US20060100859A1 (en) 2006-05-11
KR101105353B1 (ko) 2012-01-16
JP5173939B2 (ja) 2013-04-03
US8224657B2 (en) 2012-07-17
JP2005532579A (ja) 2005-10-27
AU2003281378B2 (en) 2010-08-19
AU2003281378A1 (en) 2004-01-23
EP1520271A1 (en) 2005-04-06
RU2005102831A (ru) 2005-07-20
BR0312467A (pt) 2005-04-26
KR20050016976A (ko) 2005-02-21

Similar Documents

Publication Publication Date Title
ES2367259T3 (es) Procedimiento y dispositivo para transmisión de señales de atenuación y de rafaga dentro de banda eficiente y funcionamiento máximo en velocidad de transmisión mitad en codificación de voz de banda ancha de velocidad de transmisión de bits variable para sistemas inalámbricos de cdma.
ES2361154T3 (es) Procedimiento para la interoperación entre codecs de la voz de banda ancha tasa múltiple adaptativo (amr-wr) y de banda ancha, tasa de bits variable modo múltiple (vmr-wb).
ES2625895T3 (es) Método y dispositivo para la ocultación eficiente del borrado de tramas en códecs de voz basados en la predicción lineal
ES2434947T3 (es) Procedimiento y dispositivo para la ocultación eficiente de un borrado de trama en códecs de voz
US7657427B2 (en) Methods and devices for source controlled variable bit-rate wideband speech coding
ES2356492T3 (es) Método de conmutación de tasa de transmisión en decodificación de audio escalable en tasa de transmisión y ancho de banda.
ES2205892T3 (es) Aumento de la periodicidad al descodificar señales de banda ancha.
Jelinek et al. On the architecture of the cdma2000/spl reg/variable-rate multimode wideband (VMR-WB) speech coding standard
CA2491623C (en) Method and device for efficient in-band dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
EP1808852A1 (en) Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
Paksoy Variable rate speech coding with phonetic classification