ES2395365T3 - Método y aparato para la distribución de una sub-trama - Google Patents

Método y aparato para la distribución de una sub-trama Download PDF

Info

Publication number
ES2395365T3
ES2395365T3 ES09836080T ES09836080T ES2395365T3 ES 2395365 T3 ES2395365 T3 ES 2395365T3 ES 09836080 T ES09836080 T ES 09836080T ES 09836080 T ES09836080 T ES 09836080T ES 2395365 T3 ES2395365 T3 ES 2395365T3
Authority
ES
Spain
Prior art keywords
frame
sub
samples
signal
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09836080T
Other languages
English (en)
Inventor
Dejun Zhang
Fengyan Qi
Lei Miao
Jianfeng Xu
Qing Zhang
Lixiong Li
Fuwei Ma
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2395365T3 publication Critical patent/ES2395365T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Abstract

Un método de puesta en tramas, que comprende:la obtención (21) de un orden de predicción de Codificación de Predicción Lineal LPC y de una altura tonal de una señal;la supresión (22) de las muestras de la señal que son inaplicables a una síntesis de Predicción a Largo Plazo LTP enfunción del orden de predicción de LPC y de la altura tonal yla división (23) de las muestras restantes de la señal en varias sub-tramas;en donde la supresión (22) de las muestras de la señal que son inaplicables a una síntesis de Predicción a Largo PlazoLTP comprende:la supresión de una parte del primer número de orden de predicción de LPC de muestras en la cabecera de la señal y delnúmero de muestras de altura tonal siguiente, en donde la parte es un número entero de muestras que varía desde 0 alorden de predicción LPC menos 1.

Description

Método y aparato para la distribución de una sub-trama
CAMPO DE LA INVENCIÓN
La presente invención se refiere a tecnologías de codificación de voz y en particular, a un método y aparato de puesta en tramas.
ANTECEDENTES DE LA INVENCIÓN
Cuando se procesa, la señal de voz se suele poner en tramas parar reducir la complejidad de cálculo del codec (codificador-decodificador) y el retardo del procesamiento. La señal de voz permanece estable en un segmento temporal después de que se ponga en tramas la señal y los parámetros cambien con lentitud. Por lo tanto, los requisitos tales como la precisión de cuantización se pueden cumplir solamente si la señal se procesa en función de la longitud de trama en la predicción a corto plazo para la señal. Además, cuando una persona articula un sonido, la glotis vibra a una determinada frecuencia y la frecuencia es la altura tonal. Cuando la altura tonal es baja, si la longitud de la trama seleccionada es demasiado grande, pueden existir múltiples alturas tonales diferentes en una sola trama de señal de voz de una trama. En consecuencia, la altura tonal calculada es inexacta. Por lo tanto, una trama necesita dividirse en sub-tramas en promedio.
En algunos campos de compresión sin pérdidas o con pérdidas, para reducir el impacto causado por la pérdida de paquetes en la red sobre la calidad del sonido, la trama actual necesita ser independiente de la trama anterior. Por ejemplo, la norma G.711 Codificación Sin Pérdidas (LLC) especifica que no está permitido utilizar los datos en la memoria intermedia histórica para predecir la señal de la trama actual. Por lo tanto, la primera parte de la señal, en la trama actual, se utiliza para predecir la parte izquierda de la señal en la trama actual. Si la técnica anterior, que divide la trama de señal completa en varias sub-tramas en promedio, se sigue aplicando, pocos datos en las varias sub-tramas en la cabecera son sometidos al análisis de Predicción a Largo Plazo (LTP). Según se representa en la Figura 1, para la frecuencia de muestreo de 8 kHz y la longitud de trama de 20 ms, una trama se divide en cuatro sub-tramas como promedio y cada sub-trama tiene 40 muestras. Suponiendo que la altura tonal de la primera sub-trama es T[0] = 34, el número de muestras para síntesis mediante el algoritmo de LTP en la primera sub-trama es solamente 40 -34 = 6. Las primeras 34 muestras se tratan como una memorización intermedia histórica de las sub-tramas subsiguientes. De este modo, la ganancia de la primera sub-trama cambia bruscamente con respecto a las sub-tramas subsiguientes y la ganancia calculada de la primera sub-trama es muy diferente de la correspondiente a las sub-tramas siguientes, con lo que surgen inconvenientes operativos para el procesamiento posterior. Si T[0] es mayor que la longitud de sub-trama (tal como T[0] = 60), incluso se impacta la segunda sub-trama.
El documento US 2008/215317 A1 da a conocer un codec (codificador-decodificador) de audio sin pérdidas que codifica/decodifica un flujo de bits de tasa binaria variable (VBR) sin pérdidas, con capacidad de punto de acceso aleatorio (RAP) para iniciar la decodificación sin pérdidas en un segmento especificado dentro de una trama y/o la capacidad de conjunto de parámetros de predicción múltiples (MPPS) en particiones para mitigar los efectos transitorios. Esta operación se realiza por una técnica de segmentación adaptativa que fija los puntos de partida de segmentos basados en las restricciones impuestas por la existencia de un punto RAP deseado y/o transitorios detectados en la trama y selecciona una duración de segmento óptima en cada trama para reducir la carga útil de tramas codificadas sujetas a una restricción de carga útil del segmento codificado. En general, las restricciones de contorno especifican que un RAP deseado o transitorios detectados deben permanecer dentro de un cierto número de bloques de análisis de un punto de partida de segmentos. En una forma de realización, a modo de ejemplo, en donde los segmentos dentro de una trama sean de la misma duración y de una potencia de dos de la duración de los bloques de análisis, el RAP y/o restricciones de transitorios establecen una duración de segmento máxima para garantizar las condiciones deseadas.
SUMARIO DE LA INVENCIÓN
La presente invención da a conocer un método de puesta en tramas según la reivindicación 1 y un aparato de puesta en tramas según la reivindicación 12 para resolver el problema causado por la puesta en tramas promediada simple en la técnica anterior en donde las ganancias entre sub-tramas son incoherentes.
Según el primer aspecto de la idea inventiva, un método de puesta en tramas comprende:
la obtención de un orden de predicción de codificación de predicción lineal (LPC) y una altura tonal de una señal;
la supresión de muestras inaplicables a la síntesis de LTP en función del orden de predicción de LPC y de la altura tonal y
la división de las muestras restantes de la señal en varias sub-tramas.
Según el segundo aspecto de la idea inventiva, un aparato de puesta en tramas comprende: una unidad de obtención, configurada para obtener un orden de predicción de Codificación de Predicción Lineal (LPC) y
una altura tonal de una señal; una unidad de supresión de muestras, configurada para suprimir las muestras inaplicables a la síntesis de LTP en función del orden de predicción de LPC y de la altura tonal obtenida por la unidad de obtención y
una unidad de puesta en tramas, configurada para dividir las muestras restantes de la señal después de que la unidad de supresión de muestras suprima las muestras inaplicables en varias sub-tramas.
BREVE DESCRIPCIÓN DE LOS DIBUJOS Para hacer más evidente la solución técnica dada a conocer por la presente invención, los dibujos adjuntos para ilustrar las formas de realización de la presente invención se describen a continuación. Evidentemente, los dibujos adjuntos son solamente a modo de ejemplo.
La Figura 1 representa un método de puesta en tramas de promedio en la técnica anterior;
La Figura 2 es un diagrama de flujo de un método de puesta en tramas según una forma de realización de la presente invención; La Figura 3 es un diagrama de flujo de un método de puesta en tramas según una forma de realización de la presente
invención; La Figura 4 representa una instancia operativa del método de puesta en tramas representado en la Figura 3; La Figura 5 es un diagrama de flujo de otro método de puesta en tramas según una forma de realización de la presente
invención; La Figura 6 representa una instancia operativa del método de puesta en tramas representado en la Figura 5; La Figura 7 representa otra instancia operativa del método de puesta en tramas representado en la Figura 5; La Figura 8 es un diagrama de flujo de otro método de puesta en tramas según una forma de realización de la presente
invención; La Figura 9 representa una instancia operativa del método de puesta en tramas representado en la Figura 8; La Figura 10 ilustra una estructura de un aparato de puesta en tramas según una forma de realización de la presente
invención;
La Figura 11 ilustra una estructura de otro aparato de puesta en tramas según una forma de realización de la presente invención; La Figura 12 ilustra una estructura de otro aparato de puesta en tramas según una forma de realización de la presente
invención y
La Figura 13 es un diagrama de flujo de un método de puesta en tramas según una forma de realización de la presente invención. DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La solución técnica dada a conocer por la presente invención se describe a continuación haciendo referencia a los
dibujos adjuntos. Evidentemente, las formas de realización aquí dadas a conocer son solamente a modo de ejemplos y
no son todas las formas de realización de la presente invención. Según se representa en la Figura 2, un método de puesta en tramas, dado a conocer en una forma de realización de la presente invención, incluye las etapas siguientes:
Etapa 21: Obtener un orden de predicción de Codificación de Predicción Lineal (LPC) y una altura tonal de una señal.
Etapa 22: Suprimir las muestras inaplicables a la síntesis de LTP en función del orden de predicción de LPC y de la altura tonal. Etapa 23: Dividir las muestras restantes de la señal en varias sub-tramas.
En la codificación LPC, la predicción de LPC puede ser un modo fijo o un modo adaptativo. El modo fijo significa que el orden de predicción es un número entero fijo (tal como 4, 8, 12 y 16) y se puede seleccionar en función de la experiencia
o características del codificador. El modo adaptativo significa que el orden de predicción final puede variar con las señales. En este caso, “lpc_order” representa el orden de predicción de LPC final.
Por ejemplo, el método para determinar el orden de predicción de LPC, en el modo adaptativo, se utiliza en esta forma de realización:
(1)
Utilizar el orden de predicción máximo para realizar el análisis de LPC para las muestras de la señal, en un espacio lineal, para obtener coeficientes de reflexión, esto es, coeficientes de PARCOR: ipar[0], …, y ipar[N-1], en donde N es el orden de predicción máximo.
(2)
Calcular el número de bits, esto es, Bc[1], …, y Bc[N] de los coeficientes de reflexión cuantificados en órdenes diferentes.
(3)
Utilizar órdenes diferentes para realizar la predicción de LPC y para obtener las señales residuales previstas. Realizar una codificación de entropía para las señales residuales para obtener el número de bits, esto es, Bc[1], …, y Bc[N] requeridos para la codificación de entropía en órdenes diferentes.
(4)
Calcular el número total de bits, esto es, Btotal[1] ..., y Btotal[N] requerido para órdenes diferentes, en donde Btotal[i] = Bc[i] + Bc[i] .
(5)
Encontrar el valor mínimo de Btotal[j] entre Btotal[1], … y Btotal[N], en donde j es el mejor orden “lpc_order”.
Numerosos otros métodos se pueden utilizar para calcular el orden adaptativo “lpc_order” y la presente invención no está limitada al método de cálculo anterior.
La predicción de LPC se refiere a utilizar las lpc_order muestras anteriores para predecir el valor de la muestra actual. Evidentemente, para las lpc_order muestras en la cabecera de cada trama, la precisión de la predicción aumenta gradualmente (porque al estar más muestras están implicadas en la predicción, se obtiene un valor más exacto). Puesto que la primera muestra no está precedida por ninguna muestra, la predicción de LPC no es aplicable y el valor predictivo de la primera muestra es 0. La fórmula de LPC para la segunda muestra, para la última de las lpc_order muestras, es:
La fórmula de LPC para las muestras después de las lpc_order muestras es:
Suponiendo que la señal de voz se exprese como x(n), en donde n = 0, 1, …, L y L es la longitud de la señal (esto es, el número de muestras tales como 40, 80, 160, 240, 320 y otros números enteros positivos), la señal residual de LPC es res(n):
Puesto que las muestras del primer lpc_order se predicen sin precisión, la señal residual del LPC obtenida a través de la predicción de LPC es relativamente grande. Para evitar el impacto sobre el rendimiento de la síntesis de LTP, la totalidad
o parte de las muestras en el intervalo que varía desde 0 al lpc_order pueden ser inaplicables a la síntesis de LTP y necesitan suprimirse.
En esta forma de realización, la altura tonal obtenida puede ser la altura tonal T0 de la trama de voz completa. T0 se obtiene mediante el cálculo de la función de correlación. Por ejemplo, supóngase que el valor d, que maximiza el valor siguiente, es T0:
en donde L1 es el número de muestras utilizadas para calcular la función de correlación.
En algunas formas de realización, si la trama de voz se divide de antemano, la altura tonal obtenida puede ser la altura tonal de la primera sub-trama de la trama de voz que ha experimentado la puesta en tramas.
Puesto que la primera parte de la señal, en la trama actual, se utiliza para predecir la parte izquierda de la señal en la trama actual, necesita suprimirse un número específico de muestras en la cabecera de la trama actual para garantizar longitudes coherentes de las sub-tramas en la síntesis de LTP, en donde el número es igual a la altura tonal.
En el método de puesta en tramas dado a conocer en esta forma de realización, en función del orden de predicción de LPC obtenido y de la altura tonal, después de que se eliminen las muestras inaplicables a la síntesis de LTP, las muestras restantes de la señal se dividen en varias sub-tramas, con lo que se garantiza que cada sub-trama utilice muestras coherentes para la síntesis de LTP y la obtención de las ganancias de LTP coherentes. Por lo tanto, la forma de realización resuelve el problema causado por una puesta en tramas media simple en la técnica anterior en donde las ganancias entre las sub-tramas son incoherentes, reduce la complejidad de cálculo y asimismo, reduce los bits para cuantificación de ganancias, sin impactar sobre el rendimiento.
La Figura 3 representa un método de puesta en tramas en una forma de realización de la presente invención. Esta forma de realización supone que la señal obtenida es una trama de señal. El método incluye las etapas siguientes:
Etapa 31: Obtener el orden de predicción de LPC “lpc_order” y la altura tonal “T0” de una trama de señal.
En algunas formas de realización, si la trama de señal se divide de antemano, esta etapa puede ser también: sustitución de la altura tonal “T0” por la obtención de la altura tonal de la primera sub-trama. Para facilidad de descripción, T0 se toma a modo de ejemplo en esta etapa, en esta forma de realización y en formas de realización posteriores.
Etapa 32: Suprimir las primeras lpc_order muestras en la cabecera de la trama de señal y las T0 muestras siguientes.
Las T0 muestras siguientes se refieren a las T0 muestras que siguen a la muestra de lpc_order. Por ejemplo, una trama incluye 100 muestras 0-99 y el orden de predicción de LPC es lpc_order = 10 y la altura tonal es T0 = 20 y por lo tanto, las primeras lpc_order muestras (esto es, las muestras: 0-9) en la trama se suprimen primero y luego, se suprimen las T0 muestras siguientes (esto es, las muestras 10-29).
Etapa 33: Determinar el número (S) de sub-tramas en la trama a dividirse en función de la longitud de la trama de señal.
La trama se divide en varias sub-tramas en función de la longitud de la señal de entrada y el número de sub-tramas varía con la longitud de la señal. Por ejemplo, para el muestreo a una frecuencia de 8 kHz, una longitud de trama de 20 ms se puede dividir en 2 sub-tramas; una longitud de trama de 30 ms se puede dividir en 3 sub-tramas y una longitud de trama de 40 ms se puede dividir en 4 sub-tramas. Puesto que la altura tonal de cada sub-trama necesita transmitirse al decodificador, si una trama se divide en más sub-tramas, se consumen más bits para la codificación de la altura tonal. Por lo tanto, para equilibrar entre la mejora del rendimiento y la complejidad del cálculo, el número de sub-tramas, en una trama, necesita determinarse adecuadamente.
En algunas formas de realización, una longitud de trama de 20 ms constituye 1 sub-trama; una trama de longitud de 30 ms se divide en 2 sub-tramas y una trama de longitud de 40 ms se divide en 3 sub-tramas. Es decir, una trama compuesta por 160 muestras incluye solamente una sub-trama; 1 trama compuesta por 240 muestras incluye 2 subtramas y una trama compuesta por 320 muestras incluye 3 sub-tramas.
La siguiente descripción supone que una trama de longitud de 20 ms se divide en 2 sub-tramas. Para otros modos de división, las operaciones subsiguientes son similares y otros modos de división están también cubiertos dentro del alcance de protección de la presente invención.
Etapa 34: Dividir el número de muestras restantes de la señal por el valor S y redondear al número entero inferior el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas.
Es decir, la longitud de cada una de las primeras S-1 sub-tramas es [(L-lpc_order -T0) / S], en donde L es la longitud de la trama y L*J se refiere al redondeo al número entero inferior, por ejemplo L1,2J = L1,9J = 1.
Etapa 35: Sustraer la longitud total de las primeras S-1 sub-tramas desde las muestras restantes de la trama de señal. La diferencia obtenida es la longitud de la S-ésima sub-trama.
Según se representa en la Figura 4, esta forma de realización supone que la frecuencia de muestreo es 8 kHz y que una trama de longitud de 20 ms se divide en 2 sub-tramas. La longitud de trama de señal es L = 160 muestras. El orden lpc_order de la trama de señal obtenida es 12 (muestras) y la altura tonal T0 de la trama de señal obtenida es 35 muestras. Después de que las primeras lpc_order muestras (12) y las T0 muestras (35) se supriman de la trama de señal, las restantes L-(lpc_order + T0) = 160-47 = 113 muestras se dividen por 2 y el cociente se redondea al número entero inferior. El resultado es que la longitud de la primera sub-trama es 56 muestras. La longitud de la segunda subtrama, incluyendo la última sub-trama, es 113-56 = 57 muestras.
En el método de puesta en tramas dado a conocer en esta forma de realización, en función del orden de predicción de LPC obtenido y de la altura tonal, después de que se supriman las lpc_order muestras en la cabecera de la trama de señal y las T0 muestras siguientes, las muestras restantes de la trama de señal se dividen en varias sub-tramas con lo que se asegura que cada sub-trama utilice muestras coherentes para síntesis de LTP y la obtención de ganancias de LTP coherentes. Por lo tanto, la forma de realización resuelve el problema causado por la puesta en tramas media simple en la técnica anterior en la que la ganancia entre sub-tramas es incoherente, reduce la complejidad de cálculo y reduce los bits para cuantificación de las ganancias, sin impactar sobre el rendimiento.
La Figura 5 ilustra otro método de puesta en tramas en una forma de realización de la presente invención. Esta forma de realización supone que la señal obtenida es una trama de señal. El método comprende las etapas siguientes:
Etapa 51: Obtener el orden de predicción de LPC “lpc_order” y la altura tonal “T0” de la trama de señal.
Etapa 52: Suprimir un número entero aleatorio de muestras en el intervalo que varía desde 0 a lpc_order-1 en la cabecera de la trama de señal y suprimir las T0 muestras siguientes.
Etapa 53: Determinar el número (S) de sub-tramas en la trama a dividirse en función de la longitud de la trama de señal.
Etapa 54: Dividir el número de muestras restantes de la trama de señal por el valor S y redondear al número entero inferior el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas.
Etapa 55: Sustraer la longitud total de las primeras S-1 sub-tramas desde las muestras restantes de la trama de señal. La diferencia obtenida es la longitud de la S-ésima sub-trama.
Esta forma de realización difiere de la forma de realización anterior en que: la supresión de las muestras inaplicables a la síntesis de LTP suprime solamente parte de las primeras muestras lpc_order en la cabecera de la trama de señal y las T0 muestras siguientes. Otras etapas son las mismas y por ello no se describirán a continuación.
Como se analizó anteriormente, las lpc_order muestras hacen inexacta la predicción, pero las siguientes muestras hacen la predicción más precisa. A veces, las muestras que dan lugar a alta precisión están implicadas en la síntesis de LTP. Para permitir que más muestras estén implicadas en la síntesis de LTP, en esta forma de realización, es necesario suprimir solamente parte de las primeras lpc_order muestras, por ejemplo, V muestras, en donde V = 0, 1, …, lpc_order
1. El valor de V es un valor fijo (tal como 4 o 5) seleccionado de forma empírica u obtenido a través de cálculo, por ejemplo, V = lpc_order / 2. Permitiendo que más muestras estén implicadas en la síntesis de LTP, este método puede conseguir, a veces, un mejor efecto que el método anterior.
Según se representa en la Figura 6, se sigue suponiendo que la frecuencia de muestreo es 8 kHz y que una trama de longitud de 20 ms se divide en 2 sub-tramas. La longitud de trama de señal es L = 160 muestras; el orden de predicción LPC “lpc_order” de la trama de señal obtenida es 12 (muestras) y la altura tonal “T0” es 35 muestras. V está entre las primeras lpc_order muestras en la cabecera de la trama de señal que se suprimen, en donde V = lpc_order / 2 = 6 y las T0 = 35 muestras siguientes son también eliminadas. Las restantes L-(V + T0) = 160-6-35 = 119 muestras se dividen por 2 y el cociente se redondea al número entero inferior. El resultado es que la longitud de la primeras sub-trama es 59 muestras. La longitud de la segunda sub-trama, esto es, la longitud de la última sub-trama es 119-59 = 60 muestras.
Según se representa en la Figura 7, una forma de realización sigue suponiendo que la frecuencia de muestreo es 8 kHz y que una trama de longitud de 20 ms se divide en 2 sub-tramas. La longitud de trama de señal es L = 160 muestras; el orden de predicción de LPC “lpc_order” de la trama de señal obtenida es 12 (muestras) y la altura tonal “T0” es 35 muestras. Solamente las T0 = 35 muestras primeras se suprimen en la cabecera de la trama de señal y todas las lpc_order muestras están implicadas en la síntesis de LTP. Las restantes L-T0 = 160-35 = 125 muestras se dividen por 2 y el cociente se redondea al número entero inferior. El resultado es que la longitud de la primera sub-trama es 62 muestras. La longitud de la segunda sub-trama, esto es, la longitud de la última sub-trama es 125-62 = 63 muestras.
En el método de puesta en tramas dado a conocer en esta forma de realización, en función del orden de predicción de LPC obtenido y de la altura tonal, después de que se supriman parte de las primeras lpc_order muestras en la cabecera de la trama de señal (esta parte puede ser un número entero aleatorio de muestras y el número entero varía desde 0 a lpc_order-1) y las T0 muestras siguientes se eliminan, las restantes muestras de la trama de señal se dividen en varias sub-tramas, con lo que se asegura que cada sub-trama utilice muestras coherentes para síntesis de LTP y la obtención de ganancias de LTP coherentes. Por lo tanto, la forma de realización resuelve el problema causado por la puesta en tramas media simple en la técnica anterior en donde las ganancias entre sub-tramas son incoherentes, reduce la complejidad del cálculo y reduce los bits para cuantificación de ganancias, sin impactar sobre el rendimiento.
Antes de la puesta en tramas, es imposible conocer la altura tonal T[0] de la primera sub-trama. Sin embargo, puesto que la altura tonal, en una trama de señal, varía ligeramente y T[0] es un valor que fluctúa ligeramente en la gama de T0, por ejemplo T[0]E[T0 - 2, T0 + 2], las formas de realización anteriores sustituyen la altura tonal T0 de la trama de señal completa por la altura tonal T[0] de la primera sub-trama, suprimen las muestras inaplicables a la síntesis de LTP, dividen las restantes muestras de la trama de señal en varias sub-tramas y utilizan la longitud de sub-trama después de la división como la longitud de sub-trama final directamente.
La Figura 8 ilustra otro método de puesta en tramas en una forma de realización de la presente invención. Esta forma de realización supone que la señal obtenida es una trama de señal. El método incluye las etapas siguientes:
Etapa 81: Obtener el orden de predicción de LPC “lpc_order” y la altura tonal “T[0]” de la primera sub-trama de una trama de señal.
En esta forma de realización, la altura tonal T[0] de la primera sub-trama se obtiene en el modo de puesta en tramas previa. Más concretamente, la altura tonal T0 de la trama de señal completa se utiliza como la altura tonal de la primera sub-trama para dividir la trama. Después de que se obtenga la longitud de la primera sub-trama, la altura tonal de la primera sub-trama se determina mediante búsqueda dentro del margen de fluctuación de la altura tonal de la trama de señal.
Etapa 82: Suprimir un número entero aleatorio de muestras en el intervalo que varía desde 0 a lpc_order en la cabecera de la trama de señal y suprimir la T[0] muestras siguientes.
Etapa 83: Determinar el número (S) de sub-tramas en la trama en función de la longitud de la trama de señal.
Etapa 84: Dividir el número de muestras restantes de la trama de señal por el valor S y redondear, al número entero inferior, el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas.
Para mayor simplicidad, esta etapa se puede omitir y la longitud de sub-trama anteriormente calculada se puede utilizar directamente para el cálculo siguiente.
Etapa 85: Sustraer la longitud total de las primeras S-1 sub-tramas desde las restantes muestras de la trama de señal. La diferencia obtenida es la longitud de la S-ésima sub-trama.
Según se representa en la Figura 9, esta forma de realización sigue suponiendo que la frecuencia de muestreo es 8 kHz y que una trama de longitud de 20 ms se divide en 2 sub-tramas. La longitud de trama de señal es L = 160 muestras. El valor de lpc_order de la trama de señal obtenida es 12 (muestras) y la altura tonal T0 de las trama de señal obtenida es
35. En primer lugar, se realiza la puesta en tramas previa y se utiliza T0 = 35 como la mejor altura tonal T[0] de la primera sub-trama. Después de que se supriman las primeras lpc_order muestras (12) y las T0 muestras siguientes (35) desde la trama de señal, las restantes L-(lpc_order + T0) = 160-47 = 113 muestras se dividen por 2 y el cociente se redondea al número entero inferior. El resultado es que la longitud de la primera sub-trama es 56 muestras. Después de que se obtenga la longitud de la primera sub-trama, el margen de fluctuación de T0, es decir, T[0] E [T0-2, T0 + 2], se busca para determinar la mejor altura tonal T[0] (que es igual a 34 muestras) de la primera sub-trama. La operación de puesta en tramas se realiza de nuevo en función de la mejor altura tonal obtenida T[0] de la primera sub-trama: después de que se supriman las primeras lpc_order muestras (12) y las T[0] muestras siguientes (34) desde la trama de señal, las restantes L-(lpc_order + T[0]) = 160-46 = 114 muestras se dividen por 2 y el cociente se redondea al número entero inferior. El resultado es que la longitud de la primera sub-trama es 57 muestras. La longitud de la segunda sub-trama, esto es, la longitud de la última sub-trama, es 114-57 = 57 muestras.
En el método de puesta en tramas dado a conocer en esta forma de realización, se realiza primero una puesta en tramas previa para obtener la altura tonal de la primera sub-trama; después de que se supriman la totalidad o parte de las primeras lpc_order muestras en la cabecera de la trama de señal (esta parte puede ser un número entero aleatorio de muestras y el número entero varía desde 0 a lpc_order) y las T[0] muestras siguientes de la primera sub-trama, las restantes muestras de la trama de señal se dividen en varias sub-tramas, con lo que se asegura que cada sub-trama utilice muestras coherentes para síntesis de LTP y la obtención de las ganancias de LTP coherentes. Por lo tanto, esta forma de realización resuelve el problema causado por la puesta en tramas media simple en la técnica anterior en la que las ganancias entre sub-tramas son incoherentes, reduce la complejidad del cálculo y reduce los bits para cuantificación de ganancias, sin impactar sobre el rendimiento.
La Figura 13 ilustra otro método de puesta en tramas en una forma de realización de la presente invención. Esta forma de realización supone que la señal obtenida es una trama de señal. El método incluye las etapas siguientes:
Etapa 141: Obtener el orden de predicción LPC y la altura tonal T0 de la señal.
Etapa 142: Suprimir las muestras inaplicables para la síntesis de LTP en función del orden de predicción LPC y de la altura tonal T0.
Etapa 143: Dividir las restantes muestras de la señal en varias sub-tramas.
Las etapas 141 a 143 son un proceso de realizar la puesta en tramas adaptativa en función de la altura tonal T0 para obtener la longitud de cada sub-trama y se han descrito en las formas de realización anteriores.
Etapa 144: Búsqueda de la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama entre las diversas sub-tramas y determinar la altura tonal T[0] de la primera sub-trama.
En la etapa 143 en esta forma de realización, las restantes muestras se dividen en varias sub-tramas; después de que se obtenga la longitud de la primera sub-trama, el margen de fluctuación de la altura tonal T0 de la trama de voz, por ejemplo, T[0]E [T0-2, T0 + 2], se busca para determinar la altura tonal T[0] de la primera sub-trama.
Etapa 145: Determinar el punto de partida y el punto final de cada sub-trama de nuevo en función de la orden de predicción de LPC, de la altura tonal de la primera sub-trama y de la longitud de cada sub-trama.
En esta forma de realización, después de que se determine la altura tonal T[0] de la primera sub-trama, T[0] puede ser diferente de T0, de modo que el punto de partida de la primera sub-trama puede cambiar después de que se supriman primero las muestras que son inaplicables para la síntesis de LTP. El punto de partida y el punto final de la primera subtrama necesitan ajustarse. Puesto que la longitud de sub-trama obtenida en la etapa 143 se sigue utilizando aquí, el punto de partida y el punto final de cada sub-trama que sigue a la primera sub-trama necesitan determinarse de nuevo. En este caso, es posible que la longitud de cada sub-trama no se cambie y que la suma de las longitudes de todas las sub-tramas no sea igual al número de las restantes muestras de la señal, pero esta posibilidad no impacta sobre el efecto de esta forma de realización. En algunas formas de realización, como una medida de optimización adicional, permanece invariable la longitud de las primeras S-1 sub-tramas; la longitud total de las primeras S-1 sub-tramas se sustrae del número de las muestras restantes de la señal y la diferencia obtenida sirve como la longitud de la S-ésima sub-trama.
En esta forma de realización, la longitud de cada sub-trama obtenida en la etapa 143 se sigue utilizando y la longitud de cada sub-trama no se determina de nuevo, con lo que se reduce la complejidad del cálculo.
Después de que se determine la altura tonal T[0] de la primera sub-trama, la supresión de las muestras inaplicables a la síntesis de LTP puede ser de nuevo la supresión de las primeras lpc_order muestras en la cabecera de la trama de señal y las T[0] muestras siguientes o la eliminación de un número entero aleatorio de muestras en el intervalo que varía desde 0 a lpc_order-1 en la cabecera de la trama de señal y las T[0] muestras siguientes.
Etapa 146: Búsqueda de la altura tonal de las sub-tramas siguientes a la primera sub-trama para obtener la altura tonal de las sub-tramas siguientes.
En algunas formas de realización, la altura tonal de las sub-tramas que siguen a la primera sub-trama puede ser objeto de búsqueda y por lo tanto, se obtiene la altura tonal de todas las sub-tramas, con lo que se facilita la supresión de la correlación a largo plazo en la señal y se facilita la decodificación en el decodificador. El método para determinar la altura tonal de las siguientes sub-tramas se describe en la etapa 144 y por ello no se volverá a describir a continuación.
En algunas formas de realización, la etapa 146 sobre la determinación de la altura tonal de las siguientes sub-tramas puede ocurrir antes de la etapa 145, sin afectar al cumplimiento de los objetivos de la presente invención. En otras formas de realización, la etapa 146 se puede combinar con la etapa 144. Es decir, en la etapa 144, la altura tonal de cada sub-trama se busca para obtener la altura tonal de cada sub-trama, incluyendo la altura tonal T[0] de la primera sub-trama. Por lo tanto, las formas de realización de la presente invención no limitan la ocasión de determinar la altura tonal de sub-tramas siguientes. Todas las variaciones de las formas de realización dadas a conocer en la presente invención para cumplir sus objetivos están cubiertas en el alcance de protección de la presente invención.
Etapa 147: Realizar la puesta en tramas adaptativa de nuevo en función de la altura tonal T[0] de la primera sub-trama y obtener la longitud de cada sub-trama.
En algunas formas de realización, para determinar cada sub-trama más adecuadamente para obtener más ganancias de LTP coherentes y para conseguir mejores efectos técnicos de la presente invención, la trama de voz puede dividirse, por segunda vez, en función de la altura tonal T[0] de la primera sub-trama para obtener la longitud de cada sub-trama de nuevo.
El método para dividir la trama de voz, por segunda vez, puede ser: suprimir las muestras inaplicables para la síntesis de LTP de nuevo en función del orden de predicción de LPC y de la altura tonal T[0] de la primera sub-trama y dividir las muestras restantes recientemente obtenidas de la señal en varias sub-tramas.
Más concretamente, determinar el número (S) de sub-tramas en la trama a dividirse en función de la longitud de la señal; dividir el número recuperado de las muestras restantes de la señal por el valor S y redondear al número entero inferior el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas, esto es, [L- lpc_order - T[0])/S], en donde L es la longitud de trama y L*J se refiere al redondeo al número entero inferior, por ejemplo, L1,2J = L1,9J = 1 y sustraer la longitud total de las primeras S-1 sub-tramas desde las muestras restantes recuperadas de la señal y la diferencia obtenida es la longitud de la S-ésima sub-trama.
En algunas formas de realización, la etapa 146 puede ocurrir después de la etapa 147.
En el método de puesta en tramas dado a conocer en esta forma de realización, la altura tonal de la primera sub-trama se obtiene primero mediante la puesta en trama y luego, el punto de partida y el punto de final de cada sub-trama se determina, de nuevo, en función del orden de predicción de LPC, de la altura tonal de la primera sub-trama y de la longitud de cada sub-trama, con lo que se obtiene la ganancia de LTP más coherente entre las sub-tramas.
Mediante una segunda operación de puesta en tramas, esta forma de realización garantiza, además, que todas las subtramas después de la división utilicen muestras coherentes para la síntesis de LTP y se obtengan ganancias de LTP coherentes. Por lo tanto, la forma de realización resuelve el problema causado por la puesta en tramas media simple en la técnica anterior en donde las ganancias entre sub-tramas son incoherentes, reduce la complejidad del cálculo y reduce los bits para cuantificación de ganancias, sin impactar sobre el rendimiento.
En esta forma de realización, se busca la altura tonal de las sub-tramas siguientes a la primera sub-trama y por lo tanto, se obtiene la altura tonal de todas las sub-tramas, con lo que se facilita la supresión de la correlación a largo plazo en la señal y se facilita también la decodificación en el decodificador.
Según se representa en la Figura 10, un aparato de puesta en tramas dado a conocer en una forma de realización de la presente invención, comprende:
una unidad de obtención 101, configurada para obtener el orden de predicción de LPC y la altura tonal de la señal;
una unidad de supresión de muestra 102, configurada para suprimir las muestras inaplicables a la síntesis de LTP en función del orden de predicción de LPC y la altura tonal obtenida por la unidad de obtención 101 y
una unidad de puesta en tramas 103, configurada para dividir las muestras restantes de la señal en varias sub-tramas después de que la unidad de supresión de muestras 102 suprima las muestras inaplicables.
Según se ilustra en la Figura 10, la unidad de puesta en tramas 103 comprende:
un módulo de determinación del número de sub-tramas 131, configurado para: determinar el número (S) de sub-tramas en la trama a dividirse en función de la longitud de la trama de señal;
un módulo de asignación de longitud de sub-tramas 132, configurado para redondear al número entero inferior un cociente resultante de dividir un número por el valor S para obtener la longitud de cada una de las primeras S-1 subtramas, en donde el número es el número de las muestras restantes de la trama de señal después de que la unidad de supresión de muestras 102 realice la supresión y el valor de S se determina por el módulo de determinación del número de sub-tramas y
un último módulo de determinación de longitud de sub-trama 133, configurado para sustraer la longitud total de las primeras S-1 sub-tramas desde las muestras restantes de la trama de señal, en donde la diferencia obtenida es la longitud de la S-ésima sub-trama.
La Figura 11 representa otra forma de realización, en donde la unidad de supresión de muestras 102 es el primer módulo de supresión de muestras 121. El primer módulo de supresión de muestras 121 está configurado para suprimir las lpc_order muestras en la cabecera de la trama de señal y las T0 muestras siguientes en donde la unidad de puesta en tramas 102 divide la trama en varias sub-tramas.
En otra forma de realización, la unidad de supresión de muestras 102 es el segundo módulo de supresión de muestras
122. El segundo módulo de supresión de muestras 122 está configurado para suprimir una parte de las lpc_order muestras en la cabecera de la trama de señal (esta parte es un número entero aleatorio de muestras y el número entero varía desde 0 a lpc_order-1) y las T0 muestras siguientes, en donde la unidad de puesta en tramas 102 asigna la longitud de cada sub-trama.
Según se representa en la Figura 12, un aparato de puesta en tramas, dado a conocer en otra forma de realización de la presente invención, comprende:
una primera unidad de determinación de altura tonal de sub-trama 120, configurada para buscar el margen de fluctuación de la altura tonal de la señal para determinar la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama obtenida por el módulo de asignación de longitud de sub-trama 132.
La unidad de supresión de muestras 102 es el tercer módulo de supresión de muestras 123. El tercer módulo de supresión de muestras 123 está configurado para suprimir un número entero aleatorio de muestras en la cabecera de la trama de señal y las T[0] muestras siguientes (el número entero varía desde 0 a lpc_order; lpc_order es el orden de predicción de LPC y T[0] es la altura tonal de la primera sub-trama), en donde la unidad de puesta en tramas 102 divide la trama en varias sub-tramas. En algunas formas de realización, la unidad de puesta en tramas 102 está configurada también para determinar el punto de partida y el punto final de cada sub-trama de nuevo en función de la longitud de cada sub-trama.
En el aparato de puesta en tramas dado a conocer en esta forma de realización, en función del orden de predicción de LPC y de la altura tonal obtenida por la unidad de obtención 101, después de que se supriman las muestras inaplicables a la síntesis de LTP por la unidad de supresión de muestras 102, la unidad de puesta en tramas 103 divide las muestras restantes de la señal en varias sub-tramas. Sin importar si la unidad de supresión de muestras 102 es el primer módulo de supresión de muestras 121, el segundo módulo de supresión de muestras 122 o el tercer módulo de supresión de muestras 123, el aparato asegura que cada sub-trama después de la división utilice muestras consistentes para la síntesis de LTP y para obtener ganancias de LTP coherentes. Por lo tanto, esta forma de realización resuelve el problema causado por la puesta en tramas media simple, en la técnica anterior, en la que las ganancias entre sub-tramas son incoherentes, reduce la complejidad del cálculo y reduce los bits para la cuantificación de ganancias, sin impactar sobre el rendimiento.
El método de puesta en tramas puesto en práctica por el aparato de puesta en tramas dado a conocer en una forma de realización de la presente invención se describe, además, a continuación:
La unidad de obtención 101 obtiene el orden de predicción de LPC y la altura tonal T0 de la señal. En algunas formas de realización, si la trama de señal se divide de antemano, esta etapa puede ser también: la obtención de la altura tonal de la primera sub-trama en lugar de la altura tonal “T0”. Para facilidad de descripción, esta forma de realización toma como ejemplo a T0.
La unidad de supresión de muestras 102 suprime las muestras inaplicables para la síntesis de LTP en función del orden de predicción de LPC y de la altura tonal T0. En algunas formas de realización, el primer módulo de supresión de muestras 121 suprime las primeras lpc_order muestras en la cabecera de la trama de señal y las T0 muestras siguientes; en otras formas de realización, el segundo módulo de supresión de muestras 122 suprime un número entero aleatorio de muestras en la cabecera de la trama de señal (el número entero varía desde 0 a lpc_order-1) y las T0 muestras siguientes.
La unidad de puesta en tramas 103 divide las restantes muestras de la señal en varias sub-tramas. Más concretamente, el módulo de determinación del número de sub-trama 131 determina el número (S) de sub-tramas de una trama a dividirse en función de la longitud de la señal. El módulo de asignación de longitud de sub-trama 132 divide el número de las restantes muestras de la señal por el valor S y redondea al número entero inferior el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas. El último módulo de determinación de longitud de sub-tramas 133 sustrae la longitud total de las primeras S-1 sub-tramas a partir de las muestras restantes de la trama de señal y obtiene una diferencia como la longitud de la S-ésima sub-trama.
Además, la trama de voz puede dividirse por segunda vez. La primera unidad de determinación de altura tonal de subtrama 120 busca la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama entre las diversas sub-tramas y determina la altura tonal T[0] de la primera sub-trama.
El tercer módulo de supresión de tramas 123 suprime las primeras lpc_order muestras en la cabecera de la trama de señal y las T[0] muestras siguientes de la primera sub-trama o suprime un número entero aleatorio de muestras en la cabecera de la trama de señal (el número entero varía desde 0 a lpc_order) y las T[0] muestras siguientes de la primera sub-trama. En adelante, la unidad de puesta en tramas 102 divide la trama por segunda vez. En algunas formas de realización, la unidad de puesta en tramas 102 puede determinar el punto de partida y el punto final de cada sub-trama de nuevo en función de la longitud de cada sub-trama determinada en la primera operación de puesta en tramas. En otros escenarios operativos, la unidad de puesta en tramas 102 determina el punto de partida y el punto final de cada sub-trama de nuevo y luego, divide la trama de voz por segunda vez.
Los métodos en las formas de realización de la presente invención pueden ponerse en práctica mediante un módulo de software. Cuando se venden o utilizan como un producto independiente, el módulo de software puede memorizarse también en un medio de memorización legible por ordenador. El medio de memorización puede ser una memoria de lectura solamente, un disco magnético o un disco compacto.
Todas las unidades funcionales en las formas de realización de la presente invención se pueden integrar en un módulo de procesamiento o existir con independencia o dos o más de dichas unidades se integran en un módulo. El módulo integrado puede ser hardware o un módulo de software. Cuando se pone en práctica como un módulo de software y se vende o utiliza como un producto independiente, el módulo integrado puede también memorizarse en un medio de
5 memorización legible por ordenador. El medio de memorización puede ser una memoria de solamente lectura, un disco magnético o un disco compacto.
Lo anteriormente descrito son un método y aparato para la puesta en tramas según la presente invención. Aunque la invención se ha descrito mediante varias formas de realización a modo de ejemplo, la invención no está limitada a dichas 10 formas de realización.

Claims (16)

  1. REIVINDICACIONES
    1. Un método de puesta en tramas, que comprende:
    la obtención (21) de un orden de predicción de Codificación de Predicción Lineal LPC y de una altura tonal de una señal;
    la supresión (22) de las muestras de la señal que son inaplicables a una síntesis de Predicción a Largo Plazo LTP en función del orden de predicción de LPC y de la altura tonal y
    la división (23) de las muestras restantes de la señal en varias sub-tramas;
    en donde la supresión (22) de las muestras de la señal que son inaplicables a una síntesis de Predicción a Largo Plazo LTP comprende:
    la supresión de una parte del primer número de orden de predicción de LPC de muestras en la cabecera de la señal y del número de muestras de altura tonal siguiente, en donde la parte es un número entero de muestras que varía desde 0 al orden de predicción LPC menos 1.
  2. 2.
    El método según la reivindicación 1, en donde la supresión (22) de las muestras de la señal que son inaplicables a la síntesis de la Predicción a Largo Plazo LTP comprende:
    la supresión del número de muestras del orden de predicción LPC en la cabecera de la señal y el número de muestras de altura tonal siguiente que sigue al número de muestras del primer orden de predicción LPC en la cabecera de la señal.
  3. 3.
    El método según la reivindicación 1, en donde la supresión de las muestras de la señal que son inaplicables a la síntesis de Predicción a Largo Plazo LTP comprende:
    la supresión (52) de un número entero aleatorio de muestras en el intervalo que varía desde 0 al orden de predicción LPC menos 1 en la cabecera de la señal y el número de muestras de altura tonal siguiente que sigue al número entero aleatorio de muestras.
  4. 4.
    El método según la reivindicación 1, en donde la división de las muestras restantes de la señal en varias sub-tramas comprende:
    la determinación (53) del número S de sub-tramas a dividirse en función de la longitud de la señal;
    la división (54) del número de muestras restantes de la señal por el valor S y el redondeo al número entero inferior del cociente con el fin de obtener la longitud de cada una de las S-1 primeras sub-tramas y
    la sustracción (55) de la longitud total de las S-1 primeras sub-tramas de las muestras restantes de la señal con el fin de obtener una diferencia como longitud de la S-ésima sub-trama.
  5. 5.
    El método según la reivindicación 1, que comprende la realización de una puesta en tramas previa antes de obtener la altura tonal de la señal y la obtención de la altura tonal de la señal que consiste en la obtención de una altura tonal de la primera sub-trama después de la puesta en tramas previa.
  6. 6.
    El método según la reivindicación 5, en donde la puesta en tramas previa comprende:
    la utilización de una altura tonal de la señal completa como altura tonal de la primera sub-trama para dividir la trama, de forma adaptativa, con el fin de obtener la longitud de la primera sub-trama y
    la determinación de la altura tonal de la primera sub-trama mediante la búsqueda en el intervalo de fluctuación de la altura tonal de la señal.
  7. 7. El método según la reivindicación 1, que comprende, además, después de la división de las muestras restantes de la señal en varias sub-tramas:
    la búsqueda de la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama entre las varias sub-tramas y la determinación de la altura tonal de la primera sub-trama y
    la determinación del punto de comienzo del punto final de cada sub-trama de nuevo en función del orden de predicción LPC, de la altura tonal de la primera sub-trama y de la longitud de cada sub-trama.
  8. 8. El método según cualquiera de las reivindicaciones 1 a 3 que comprende, además, después de la división de las muestras restantes de la señal en varias sub-tramas:
    la búsqueda de la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama entre las varias sub-tramas y la determinación de la altura tonal de la primera sub-trama;
    la supresión de las muestras inaplicables a la síntesis LTP de nuevo en función del orden de predicción LPC y de la altura tonal de la primera sub-trama y
    la división de las muestras restantes recientemente obtenidas de la señal en varias sub-tramas.
  9. 9. El método de puesta en tramas según la reivindicación 1, que después de la división (143) de las muestras restantes de la señal en varias sub-tramas comprende, además:
    la búsqueda (144) de la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama entre las varias sub-tramas y la determinación de la altura tonal de la primera sub-trama;
    la determinación (145) del punto de comienzo y del punto final de cada sub-trama de nuevo en función del orden de predicción LPC, de la altura tonal de la primera sub-trama y de la longitud de cada sub-trama;
    la supresión de las muestras de la señal que son inaplicables a la síntesis de Predicción a Largo Plazo LTP de nuevo en función del orden de predicción LPC y de la altura tonal de la primera sub-trama y
    la división de las muestras restantes recientemente obtenidas de la señal en varias sub-tramas.
  10. 10. El método según la reivindicación 9, en donde la supresión (142) de las muestras de la señal que son inaplicables a la síntesis de Predicción a Largo Plazo LTP comprenden de nuevo:
    la supresión del primer número de muestras del orden de predicción LPC en la cabecera de la señal y del número de muestras de altura tonal de primera sub-trama siguiente que sigue al número de muestras del primer orden de predicción LPC en la cabecera de la señal.
  11. 11. El método según la reivindicación 9 o 10, en donde la división de las muestras restantes recientemente obtenidas de la señal en varias sub-tramas comprende:
    la determinación del número S de sub-tramas a dividir en función de la longitud de la señal;
    la división del número de muestras restantes recientemente obtenidas de la señal por valor S y el redondeo al número entero inferior del cociente con el fin de obtener la longitud de cada una de las S-1 primeras sub-tramas y
    la substracción de la longitud total de las S-1 primeras sub-tramas a partir de las muestras restantes recientemente obtenidas de la señal con el fin de obtener una diferencia como longitud de la S-ésima sub-trama.
  12. 12. Un aparato de puesta en tramas, que comprende:
    una unidad de obtención (101), configurada para obtener un orden de predicción de Codificación de Predicción Lineal LPC y una altura tonal de una señal;
    una unidad de supresión de muestras (102), configurada para suprimir las muestras inaplicables a la síntesis de Predicción a Largo Plazo LTP en función del orden de predicción de LPC y de la altura tonal obtenida por la unidad de obtención y
    una unidad de puesta en tramas (103), configurada para dividir las muestras restantes de la señal en varias sub-tramas después de que la unidad de supresión de muestras suprima las muestras inaplicables;
    en donde la unidad de supresión de muestras (102) es uno u otro de los siguientes módulos:
    un primer módulo de supresión de muestras, configurado parar suprimir el número de muestras del primer orden de predicción LPC en la cabecera y el número de muestras de altura tonal de la señal o
    un segundo módulo de supresión de muestras, configurado para suprimir un número entero aleatorio de muestras en el intervalo que varía desde 0 al orden de predicción de LPC menos 1 en la cabecera y el número de muestras de la altura tonal de la señal.
  13. 13. El aparato según la reivindicación 12, en donde la unidad de puesta en tramas (103) comprende:
    un módulo de determinación del número de sub-tramas (131), configurado para determinar el número S de sub-tramas a dividirse en función de la longitud de la señal;
    un módulo de asignación de longitud de sub-trama (132), configurado para redondear al número entero inferior un cociente de la división de un número por el valor S con el fin de obtener la longitud de cada una de las S-1 primeras subtramas, siendo este número el número de las muestras restantes de la trama de señal después de que la unidad de supresión de muestras realice la supresión y siendo S determinado por el módulo de determinación de número de subtramas y
    un último módulo de determinación de longitud de sub-trama (133), configurado para sustraer una longitud total de las S1 primeras sub-tramas de las muestras restantes de la señal, con el fin de obtener una diferencia como longitud de la Sésima sub-trama.
  14. 14.
    El aparato según una cualquiera de las reivindicaciones 12 o 13 que comprende, además:
    una primera unidad de determinación de altura tonal de sub-trama (120), configurada para buscar el intervalo de fluctuación de la altura tonal de la señal con el fin de determinar la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama obtenida por el módulo de asignación de longitud de sub-trama.
  15. 15.
    El aparato según la reivindicación 14, en donde:
    la unidad de supresión de muestras es un tercer módulo de supresión de muestras (123) configurado para suprimir un número entero aleatorio de muestras en el intervalo que varía desde 0 al orden de predicción LPC en la cabecera y el número de muestras de altura tonal de la primera sub-trama siguiente de la señal y
    la unidad de puesta en tramas (103) está configurada para determinar el punto de comienzo y el punto final de cada subtrama de nuevo en función de la longitud de cada sub-trama.
  16. 16. El aparato según la reivindicación 14, en donde:
    la unidad de supresión de muestras es un tercer módulo de supresión de muestras (123), configurado para suprimir un número entero aleatorio de muestras en el intervalo que varía de 0 al orden de predicción LPC en la cabecera y el número de muestras de altura tonal de la primera sub-trama siguiente de la señal y
    la unidad de puesta en tramas (103) está configurada para dividir las muestras restantes de la señal en varias sub-tramas después de que el tercer módulo de supresión de muestras haya efectuado la supresión.
    Obtener la orden de predicción LPC lpc_order y la altura tonal T0 de una
    trama de señal
    Suprimir un número entero aleatorio de muestras en el intervalo que varía desde 0 a lpc_order-1 en la cabecera de la trama de señal y suprimir las T0 muestras siguientes
    Determinar el número (S) de sub-tramas en la trama a dividirse en función de la longitud de señal
    Dividir las muestras restantes de las señales por el número S y redondear al número entero inferior el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas
    Substraer la longitud total de las primeras S-1 sub-tramas desde las muestras restantes de la trama de señal y la diferencia obtenida es la longitud de la sub-trama S
    Obtener la orden de LPC “lpc_order” de una trama de señal y la altura
    tonal “T[0]” de la primera sub-trama
    Suprimir un número entero aleatorio de muestras en el intervalo que varía desde 0 a lpc_order en la cabecera de la trama de señal y suprimir las T[0] muestras siguientes
    Determinar el número (S) de sub-tramas en la trama a dividirse en función de la longitud de trama de señal
    Dividir las muestras restantes de las señales por el número S y redondear al número entero inferior el cociente para obtener la longitud de cada una de las primeras S-1 sub-tramas
    Substraer la longitud total de las primeras S-1 sub-tramas desde las muestras restantes de la trama de señal y la diferencia obtenida es la longitud de la sub-trama S
    Unidad de Unidad supresión obtención muestra
    Unidad puesta en tramas
    Módulo determinación número sub-trama
    Módulo asignación longitud sub-trama
    Último módulo determinación longitud sub-trama
    Unidad de obtención
    Tercer módulo supresión muestra
    Primera unidad determinación altura tonal subtrama Unidad puesta en tramas
    Módulo determinación número sub-trama
    Módulo asignación
    longitud sub-trama
    Último módulo determinación longitud sub-trama
    Obtener la orden de LPC y una altura tonal T0 de señales
    Suprimir muestras inaplicables a síntesis de LTP en función del orden de LPC y la altura tonal T0
    Dividir las muestras restantes de la señal en varias sub-tramas
    Buscar la altura tonal de la primera sub-trama en función de la longitud de la primera sub-trama entre las diversas sub-tramas y determinar la altura tonal T[0] de la primera sub-trama
    Determinar el punto de comienzo y el punto final de cada sub-trama de nuevo en función de la orden de LPC, la altura tonal de la primera sub-trama y la longitud de cada sub-trama
    Buscar la altura tonal de las sub-tramas siguientes a la primera subtrama para obtener la altura tonal de las sub-tramas siguientes
    Realizar la puesta en tramas adaptativa de nuevo en función de la altura tonal T[0] de la primera sub-trama y obtener la longitud de cada sub-trama
ES09836080T 2008-12-31 2009-12-31 Método y aparato para la distribución de una sub-trama Active ES2395365T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN200810186854 2008-12-31
CN200810186854 2008-12-31
CN2009101518341A CN101615394B (zh) 2008-12-31 2009-06-25 分配子帧的方法和装置
CN200910151834 2009-06-25
PCT/CN2009/076309 WO2010075793A1 (zh) 2008-12-31 2009-12-31 分配子帧的方法和装置

Publications (1)

Publication Number Publication Date
ES2395365T3 true ES2395365T3 (es) 2013-02-12

Family

ID=41495005

Family Applications (2)

Application Number Title Priority Date Filing Date
ES09836080T Active ES2395365T3 (es) 2008-12-31 2009-12-31 Método y aparato para la distribución de una sub-trama
ES12185319.6T Active ES2509817T3 (es) 2008-12-31 2009-12-31 Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES12185319.6T Active ES2509817T3 (es) 2008-12-31 2009-12-31 Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas

Country Status (5)

Country Link
US (1) US8843366B2 (es)
EP (3) EP2538407B1 (es)
CN (1) CN101615394B (es)
ES (2) ES2395365T3 (es)
WO (1) WO2010075793A1 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101615394B (zh) * 2008-12-31 2011-02-16 华为技术有限公司 分配子帧的方法和装置
CN103971691B (zh) * 2013-01-29 2017-09-29 鸿富锦精密工业(深圳)有限公司 语音信号处理系统及方法
CN106409304B (zh) * 2014-06-12 2020-08-25 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
DE102016119750B4 (de) * 2015-10-26 2022-01-13 Infineon Technologies Ag Vorrichtungen und Verfahren zur Mehrkanalabtastung
CN110865959B (zh) * 2018-08-27 2021-10-15 武汉杰开科技有限公司 一种用于唤醒i2c设备的方法及电路

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2632758B1 (fr) * 1988-06-13 1991-06-07 Matra Communication Procede de codage et codeur de parole a prediction lineaire
FR2729245B1 (fr) * 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
US6169970B1 (en) * 1998-01-08 2001-01-02 Lucent Technologies Inc. Generalized analysis-by-synthesis speech coding method and apparatus
WO2001015144A1 (fr) 1999-08-23 2001-03-01 Matsushita Electric Industrial Co., Ltd. Vocodeur et procede correspondant
SE9903223L (sv) * 1999-09-09 2001-05-08 Ericsson Telefon Ab L M Förfarande och anordning i telekommunikationssystem
US6889187B2 (en) * 2000-12-28 2005-05-03 Nortel Networks Limited Method and apparatus for improved voice activity detection in a packet voice network
SE521600C2 (sv) * 2001-12-04 2003-11-18 Global Ip Sound Ab Lågbittaktskodek
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
CN1971707B (zh) * 2006-12-13 2010-09-29 北京中星微电子有限公司 一种进行基音周期估计和清浊判决的方法及装置
US8249860B2 (en) * 2006-12-15 2012-08-21 Panasonic Corporation Adaptive sound source vector quantization unit and adaptive sound source vector quantization method
CN103383846B (zh) * 2006-12-26 2016-08-10 华为技术有限公司 改进语音丢包修补质量的语音编码方法
CN101030377B (zh) * 2007-04-13 2010-12-15 清华大学 提高声码器基音周期参数量化精度的方法
CN101615394B (zh) * 2008-12-31 2011-02-16 华为技术有限公司 分配子帧的方法和装置
US8700410B2 (en) * 2009-06-18 2014-04-15 Texas Instruments Incorporated Method and system for lossless value-location encoding

Also Published As

Publication number Publication date
EP2538407B1 (en) 2014-07-23
WO2010075793A1 (zh) 2010-07-08
EP2538407A2 (en) 2012-12-26
CN101615394B (zh) 2011-02-16
EP2755203A1 (en) 2014-07-16
EP2538407A3 (en) 2013-04-24
US8843366B2 (en) 2014-09-23
ES2509817T3 (es) 2014-10-20
CN101615394A (zh) 2009-12-30
US20110099005A1 (en) 2011-04-28
EP2296144B1 (en) 2012-10-03
EP2296144A1 (en) 2011-03-16
EP2296144A4 (en) 2011-06-22

Similar Documents

Publication Publication Date Title
US9269366B2 (en) Hybrid instantaneous/differential pitch period coding
JP5230444B2 (ja) 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法
US20180047402A1 (en) Encoding method, decoding method, encoder apparatus, decoder apparatus, and recording medium for processing pitch periods corresponding to time series signals
ES2395365T3 (es) Método y aparato para la distribución de una sub-trama
US8364472B2 (en) Voice encoding device and voice encoding method
US8712763B2 (en) Method for encoding signal, and method for decoding signal
US20100185442A1 (en) Adaptive sound source vector quantizing device and adaptive sound source vector quantizing method
JPH08272395A (ja) 音声符号化装置
US7318024B2 (en) Method of converting codes between speech coding and decoding systems, and device and program therefor
US8200483B2 (en) Adaptive sound source vector quantization device, adaptive sound source vector inverse quantization device, and method thereof
EP3899931B1 (en) Phase quantization in a speech encoder
US8762136B2 (en) System and method of speech compression using an inter frame parameter correlation
JPH113098A (ja) 音声符号化方法および装置
JP3024467B2 (ja) 音声符号化装置
KR20110086919A (ko) 에스엠브이 및 에이엠알 음성 부호화 기법을 위한 상호부호화 방법 및 장치
Popescu et al. A DIFFERENTIAL, ENCODING, METHOD FOR THE ITP DELAY IN CELP
JPH07271397A (ja) 音声符号化装置
JP3068689B2 (ja) 音声符号化方法
JP2001134298A (ja) 音声符号化装置と音声復号化装置、及び音声符号化復号化システム
EP3285253B1 (en) Method for coding a speech/sound signal
JP2004126628A (ja) 音声符号化装置及び音声復号装置
JPH05315968A (ja) 音声符号化装置