ES2627410T3 - Aparato para codificar una señal de voz/sonido - Google Patents

Aparato para codificar una señal de voz/sonido Download PDF

Info

Publication number
ES2627410T3
ES2627410T3 ES11855814.7T ES11855814T ES2627410T3 ES 2627410 T3 ES2627410 T3 ES 2627410T3 ES 11855814 T ES11855814 T ES 11855814T ES 2627410 T3 ES2627410 T3 ES 2627410T3
Authority
ES
Spain
Prior art keywords
subframe
energy
autocorrelation
section
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11855814.7T
Other languages
English (en)
Inventor
Tomofumi Yamanashi
Toshiyuki Morii
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
III Holdings 12 LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by III Holdings 12 LLC filed Critical III Holdings 12 LLC
Application granted granted Critical
Publication of ES2627410T3 publication Critical patent/ES2627410T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un aparato de codificacion que comprende: una seccion de calculo de energia adaptada para calcular una de energia de trama y energia de subtrama de una senal de voz/sonido utilizando una operacion de autocorrelacion de la senal de voz/sonido; y una seccion de codificacion adaptada para codificar la senal de voz/sonido utilizando una de la energia de trama y la energia de subtrama, y para generar informacion codificada, en el que, cuando se realiza una operacion de autocorrelacion en la senal de voz/sonido utilizando la ecuacion 1 o la ecuacion 2, la seccion de calculo de energia esta adaptada para realizar operaciones de autocorrelacion**Fórmula** en una combinacion de j' y m' para la aproximacion, que es diferente de una combinacion de j y m segun los valores de j y m, y para calcular una de la energia de trama y la energia de subtrama mediante la sustitucion de las operaciones de autocorrelacion **Fórmula**en la combinacion de j y m con la operaciones de autocorrelacion en la combinacion de j' y m':**Fórmula** Ek: energia (energia de subtrama) de subtrama cuyo indice de subtrama es k, Ai: senal de voz/sonido despues del filtrado, P: orden de filtrado, αj, αm: coeficiente de filtro, xn: senal de voz/sonido de subtrama de orden (n+1), j, m: indice que indica tiempo de retardo cuando se calcula la autocorrelacion, i: indice de muestras de senal de voz/sonido, Ns: numero de subtramas, k: indice de subtrama, iniciok: indice de muestras principal de subtrama cuyo indice de subtrama es k, y fink: indice de muestras de cola de subtrama cuyo indice de subtrama es k; y**Fórmula** E: energia de trama, Ai: senal de voz/sonido despues del filtrado, P: orden de filtrado, αj, αm: coeficiente de filtro, xn: senal de voz/sonido de trama de orden (n+1), j, m: indice que indica tiempo de retardo cuando se calcula la autocorrelacion, i: indice de muestras de senal de voz/sonido, inicio: indice de muestras principal de trama, y fin: indice de muestras de cola de trama, y en el que la seccion de calculo de energia esta adaptada para realizar control con el fin de incrementar el numero de combinaciones de j y m a sustituir con operaciones de autocorrelacion en la combinacion de j' y m' a medida que la diferencia entre j y m en la ecuacion 1 o ecuacion 2 se incrementa.

Description

5
10
15
20
25
30
35
40
45
50
55
DESCRIPCION
Aparato para codificar una senal de voz/sonido Campo tecnico
La presente invencion se refiere a un aparato de codificacion usado para un sistema de comunicacion que codifica y transmite una senal.
Tecnica anterior
Las tecnicas de codificacion por compresion se usan a menudo cuando se transmite una senal de voz/sonido en un sistema de comunicacion de paquetes representado por una comunicacion por Internet o un sistema de comunicacion movil o similar para mejorar la eficiencia de transmision de la senal de voz/sonido. Ademas de codificar simplemente la senal de voz/sonido a una tasa de bit baja, tambien hay una demanda creciente de una tecnica para codificar a senal de voz/sonido de banda mas ancha y una tecnica para codificar/descodificar con una baja cantidad de calculo de procesamiento sin causar una degradacion de la calidad de sonido.
Se estan desarollando diversas tecnicas para satisfacer tal demanda en cuanto a la reduccion de la cantidad de calculo de procesamiento sin causar una degradacion en la calidad de una senal descodificada. Por ejemplo, segun una tecnica divulgada en bibliograffa sobre patentes (en lo sucesivo en la presente memoria, abreviado como PTL) 1, un aparato de codificacion de tipo CELP (prediccion lineal excitada por codigo) calcula energfa de una senal de voz introducida antes de un analisis predictivo lineal. Segun PTL 1, un analisis predictivo lineal se realiza solo cuando se determina que la energfa calculada no sea 0, mientras que un coeficiente de prediccion lineal segun un patron fijo predeterminado se emite cuando se determina que la energfa calculada sea 0. Este esquema puede cortar la realizacion de un analisis predictivo lineal que consume mucho tiempo y acortar por ello el tiempo de procesamiento y por tanto suprimir el consumo actual que acompana a la cantidad de calculo de procesamiento.
El documento WO 02/099787 A1 describe procedimientos y aparato para seleccionar rapidamente una forma de onda de excitacion optima a partir de un libro de codigos que se presentan en la presente memoria. En esquemas de codificacion que utilizan la mejora del tono (pitch) hacia adelante y hacia atras, la carga de almacenamiento y de procesador se reduce mediante la aproximacion de una matriz de autocorrelacion bidimensional con un vector de autocorrelacion unidimensional. La aproximacion es posible cuando un elemento de correlacion cruzada esta configurado para determinar la matriz de autocorrelacion de una respuesta de impulsos y un elemento de determinacion de energia de impulsos esta configurado para determinar la energia de un vector de codigo de impulsos que incorpora posiciones de impulsos secundarias.
El documento WO 02/099788 A1 describe ademas procedimientos y aparato para seleccionar rapidamente una forma de onda de excitacion optima a partir de un libro de codigos que se presentan en la presente memoria. Para reducir el numero de computaciones requeridas para seleccionar el vector de libro de codigos optimo se selecciona un subconjunto de vectores de codigo basados en posiciones de impulsos optimas (425), en el que el subconjunto de vectores de codigo forma un libro de codigo secundario. Mas que buscar el libro de codigos entero, solo se buscan las entradas del libro de codigo secundario (400).
El documento US 5 717 825 A especifica un procedimiento de codificacion de voz de prediccion lineal excitada por codigo algebraico que usa la tecnica de codificacion CELP con libros de codigos algebraicos. La bi^queda de la excitacion CELP incluye un calculo de determinados componentes de la matriz de covarianza U=H'H donde H indica una matriz de Toeplitz triangular mas baja formada sobre la base de la respuesta de impulsos de un filtro compuesto hecho de filtros de sintesis y de un filtro de ponderacion perceptual. Los componentes almacenados en la memoria de la matriz de covarianza son solo aquellos de la forma U(posip, posip) y aquellos de la forma U(posip, posjq), posip y posjq respectivamente indicando posicion i y posicion los impulsos p y q en los codigos de los libros de codigos algebraicos.
El documento US 5 924 062 A especifica un codec ACLEP con almacenamiento y busqueda de matriz de autocorrelacion modificada comprendiendo una matriz de correlacion de libro de codigos una matriz de tipo Toeplitz- (diagonalmente simetrica) que se calcula a partir de una subtrama de cuarenta muestras de una senal de voz, que forma una matriz de 40x40. Los coeficientes de correlacion resultantes que constituyen los codigos se almacenan dentro de una memoria local de DSP despues del calculo al dividir la matriz en cinco pistas predefinidas x- y y-, teniendo cada pista un conjunto unico de ocho posiciones de impulsos. Utilizando las ocho posiciones de impulsos en cada pista, se crean quince sub-matrices 8x8 que incluyen todos los coeficientes de correlacion en la matriz 40x40 original. Las sub-matrices se distribuyen dentro de una matriz de mapeo 5x5 que esta correlacionada con una matriz de mapeo de estructuras para determinar la configuracion de la matriz de autocorrelacion resultante para almacenamiento y busqueda. Las sub-matrices dentro de cada columna de matrices de mapeo correlacionadas se buscan al dirigir un puntero de multiplexacion hacia esa columna particular.
Lista de citas
Literatura de patentes
5
10
15
20
25
30
35
40
45
PTL 1 solicitud de patente japonesa abierta a inspeccion publica num. HEI 5-63580 Sumario de Invencion
Problema tecnico
Segun la PTL 1 anterior, el aparato de codificacion aplica en primer lugar un preprocesamiento tal como eliminacion de un componente DC y eliminacion de una region de baja frecuencia hacia la senal de voz introducida (en adelante en la presente memoria, denominada "senal de entrada"). A continuacion, el aparato de codificacion calcula una autocorrelacion de la senal de entrada sometida al preprocesamiento y calcula la energfa de trama media (calcula $(0, 0) y $(10, 10) en la bibliograffa de patentes descrita arriba) utilizando esta autocorrelacion. PTL 1 entonces da a conocer una configuracion para determinar si la energfa de trama media anteriormente descrita es o no 0 y omitiendo el analisis predictivo lineal subsiguiente cuando la energfa de trama media es 0.
Sin embargo, la energfa de trama divulgada en PTL 1 anteriormente es solo un valor promedio y no puede decirse que la exactitud del mismo sea suficiente. Ademas, el calculo de la energfa de trama exacta segun el procedimiento divulgado en la bibliograffa de patente anterior necesita 100 operaciones de autocorrelacion a partir de $(0, 0) a $(10, 10), requiriendo una enorme cantidad de calculo.
Es un objeto de la presente invencion proporcionar un aparato de codificacion que reduzca drasticamente la cantidad de calculo de procesamiento (cantidad de calculo) en una configuracion de calculo de energfa de trama o energfa de subtrama de una senal de entrada utilizando operaciones de autocorrelacion sin causar degradacion de la exactitud de energfa de trama o energfa de subtrama.
Solucion al problema
Segun la presente invencion, los objetivos anteriores se realizan tal como se definen en las reivindicaciones independientes.
Efectos ventajosos de la invencion
Segun la presente invencion, en una configuracion de calculo de energfa de trama o energfa de subtrama de una senal de entrada que utiliza operaciones de autocorrelacion, la realizacion de operaciones de autocorrelacion aproximada hace posible reducir drasticamente la cantidad de calculo de procesamiento (cantidad de calculo) sin causar deterioro de la exactitud de energfa de trama o energfa de subtrama.
Breve descripcion de los dibujos
La figura 1 es un diagrama de bloques que ilustra una configuracion de un sistema de comunicacion que tiene un aparato de codificacion y un aparato de descodificacion segun la realizacion 1 de la presente invencion;
La figura 2 es un diagrama de bloques que ilustra una configuracion interna principal del aparato de codificacion segun la realizacion 1 mostrado en la figura1;
La figura 3 es un diagrama de bloques que ilustra una configuracion principal de la seccion de calculo de energfa de subtrama;
La figura 4 es un diagrama que ilustra un ejemplo de una matriz utilizada para calcular energfa de subtrama Ek;
La figura 5 es un diagrama que ilustra un ejemplo de una matriz de autocorrelacion;
La figura 6 es un diagrama que ilustra una matriz que es una version simplificada de la matriz de autocorrelacion en
la figura 5;
La figura 7 es un diagrama de configuracion conceptual de la matriz de autocorrelacion en la figura 6;
La figura 8 es un diagrama que ilustra un ejemplo de la matriz de autocorrelacion simplificada;
La figura 9 es un diagrama que ilustra un procedimiento de agrupamiento;
La figura 10 es un diagrama de bloques que ilustra una configuracion interna principal de la seccion de codificacion CELP segun la realizacion 1 mostrada en la figura 2;
La figura 11 es un diagrama de bloques que ilustra una configuracion interna principal del aparato de descodificacion segun la realizacion 1 mostrada en la figura 1;
La figura 12 es un diagrama que ilustra otro ejemplo de la matriz de autocorrelacion simplificada;
La figura 13 es un diagrama de bloques que ilustra una configuracion de una seccion de calculo de energfa de subtrama diferente a la de la figura 3;
5
10
15
20
25
30
35
40
45
50
55
La figura 14 es un diagrama que ilustra otro ejemplo de la matriz de autocorrelacion simplificada segun el ejemplo 2;
La figura 15 es un diagrama de bloques que ilustra a rango objetivo de operacion de autocorrelacion; y
La figura 16 es un diagrama que ilustra una configuracion de trama en procesamiento de division de grupos adaptativo.
Descripcion de realizaciones/ejemplos
A continuacion en la presente memoria, se describira en detalle la realizacion 1 de la presente invencion con referencia a los dibujos adjuntos. Un aparato de codificacion segun la presente invencion y un aparato de descodificacion se describiran tomando un aparato de codificacion de voz y un aparato de descodificacion de voz como un ejemplo. Una senal de entrada que se utilizara en adelante en la presente memoria es un termino generico para una senal obtenida mediante la conversion de una denominada senal de sonido a una electrica tal como senal de voz, senal de sonido o una mezcla de estas senales.
(Realizacion 1)
La figura 1 es un diagrama de bloques que ilustra una configuracion de un sistema de comunicacion que incluye un aparato de codificacion y un aparato de descodificacion segun una realizacion de la presente invencion. En la figura 1, el sistema de comunicacion se provee de un aparato de codificacion 101 y aparato 103 de descodificacion, que pueden comunicarse entre sf a traves de una trayectoria de transmision 102. El aparato de codificacion 101 y aparato 103 de descodificacion se utilizan mientras que estan montados normalmente en un aparato de estacion base o aparato de terminal de comunicaciones o similar. Como es el caso de PTL 1, la presente realizacion describira una configuracion en la que se omite el subsiguiente procesamiento de analisis predictivo lineal cuando la energfa de subtrama (energfa de trama) es 0. Sin embargo, la presente realizacion es diferente de la PTL 1 en un procedimiento de calculo de energfa de subtrama (energfa de trama).
El aparato de codificacion 101 divide una senal de entrada en bloques de N muestras (N es un numero natural) cada una y codifica la senal de entrada en unidades de trama, constando una trama de N muestras. En este caso, se supone que la senal de entrada que va a codificarse se expresa como Xn(n=0, ..., N-1). El sfmbolo n representa un elemento de senal de orden (n+1) de la senal de entrada dividida en bloques de N muestras. El aparato de codificacion 101 transmite informacion de entrada codificada (informacion codificada) al aparato 103 de descodificacion a traves de la trayectoria de transmision 102.
El aparato 103 de descodificacion recibe la informacion codificada transmitida desde el aparato de codificacion 101 a traves de la trayectoria de transmision 102, descodifica la informacion codificada y obtiene una senal de salida.
La figura 2 es un diagrama de bloques que ilustra una configuracion interna de aparato de codificacion 101 mostrado en la figura 1. El aparato de codificacion 101 esta construido principalmente a partir de la seccion 201 de calculo de energfa de subtrama, la seccion 202 de determinacion, y seccion 203 de codificacion CELP. Se asume que la seccion 201 de calculo de energfa de subtrama, la seccion 202 de determinacion y seccion 203 de codificacion CELP realizan procesamiento en subunidades de trama. A continuacion en la presente memoria, se describiran detalles de cada proceso.
La seccion 201 de calculo de energfa de subtrama recibe una senal de entrada. La seccion 201 de calculo de energfa de subtrama divide primeramente la senal de entrada recibida en subtramas. A continuacion en la presente memoria, se describira una configuracion en la que la senal de entrada Xn(n=0, ., N-1) se divide en, por ejemplo, Ns subtramas (mdice de subtrama k=0 a Ns-1).
La seccion 201 de calculo de energfa de subtrama calcula energfa de subtrama Ek (k=0, ..., Ns-1) para cada subtrama dividida. Detalles del procedimiento de calculo de energfa de subtrama se describiran mas adelante. La seccion 201 de calculo de energfa de subtrama emiteenergfa de subtrama Ek calculada a la seccion 202 de determinacion.
La seccion 202 de determinacion recibe energfa de subtrama Ek (k=0, ..., Ns-1) de la seccion 201 de calculo de energfa de subtrama La seccion 202 de determinacion determina si o la energfa de subtrama Ek es 0 para cada subtrama recibida y emite el resultado de determinacion a la seccion 203 de codificacion CELP como informacion de determinacion Ik (k=0, Ns-1). La seccion 202 de determinacion fija el valor de informacion de determinacion Ik en 0 (Ik=0) cuando la energfa de subtrama Ek es 0, o fija el valor de informacion de determinacion Ik a 1 (Ik=1) cuando la energfa de subtrama Ek no es 0. El ejemplo de fijacion anterior es solamente un ejemplo, y la presente invencion puede aplicarse de manera similar a los casos donde la seccion 202 de determinacion fija el valor en otro valor.
A continuacion, la seccion 202 de determinacion genera informacion de determinacion de fijacion Ik (k=0, Ns-1) en la seccion 203 de codificacion CELP.
La seccion 203 de codificacion CELP recibe la senal de entrada e informacion de determinacion Ik (k=0, Ns-1) desde la seccion 202 de determinacion. La seccion 203 de codificacion CELP codifica la senal de entrada utilizando la
5
10
15
20
25
30
35
informacion de determinacion introducida. Mas adelante se describiran detalles del procesamiento de codificacion en la seccion 203 de codificacion CELP.
A continuacion se describiran la configuracion interna de seccion 201 de calculo de energfa de subtrama.
La figura 3 es un diagrama que ilustra la configuracion interna de seccion 201 de calculo de energfa de subtrama. La seccion 201 de calculo de energfa de subtrama incluye seccion 2012 de agrupamiento, y seccion 2011 de operacion.
Se describira una configuracion en la presente realizacion como un ejemplo donde la seccion 2011 de operacion de seccion 201 de calculo de energfa de subtrama realiza colectivamente procesamiento de filtrado y calculo de correlacion en la senal de entrada.
Se supone que la seccion 2012 de agrupamiento tiene de antemano informacion de orden P de un coeficiente de filtro. La seccion 2012 de agrupamiento agrupa entonces elementos de una matriz de autocorrelacion en una pluralidad de grupos segun variables j y m y emite la informacion de agrupamiento a la seccion 2011 de operacion. El procedimiento de agrupamiento en la seccion 2012 de agrupamiento se describira mas adelante.
La seccion 2011 de operacion calcula la energfa de subtrama basandose en la informacion de agrupamiento. En ese caso, la seccion 2011 de operacion realiza colectivamente el procesamiento de filtrado y el procesamiento de calculo de correlacion en la senal de entrada. El procedimiento de calculo de energfa de subtrama en la seccion 2011 de operacion se describira mas adelante.
A continuacion se describiran detalles del procedimiento de calculo de energfa de subtrama Ek en la seccion 201 de calculo de energfa de subtrama.
La seccion 201 de calculo de energfa de subtrama primeramente calcula la autocorrelacion en la senal de entrada Xi dividida en subtramas (i=iniciok, fink) y calcula energfa de subtrama utilizando esto. En este caso, se supone que iniciok y fink indican a mdice de muestras principal y a mdice de muestras de cola, respectivamente, de una subtrama cuyo mdice de subtrama es k.
Primeramente, se describiran una configuracion general en la que la seccion 201 de calculo de energfa de subtrama realiza simplemente el procesamiento de filtrado en una senal de entrada y calcula la autocorrelacion en la senal de entrada despues del filtrado. Supongamos que un coeficiente de filtro en el momento de procesamiento de filtrado es aj (j=0, ..., P-1). El orden del coeficiente de filtro en este momento es P. La ecuacion 3 muestra procesamiento de filtrado en la senal de entrada Xn. Supongamos que la senal de entrada despues del filtrado se expresa como Ai (i=iniciok, ..., fink). El procesamiento de filtrado en este caso no esta limitado a tipos de filtro tales como filtro de paso bajo, filtro de paso alto y filtro de paso banda.
[3]
imagen1
(ecuacion 3)
A continuacion, la seccion 201 de calculo de energfa de subtrama calcula la autocorrelacion de orden P 9(j, m) en la senal de entrada Ai despues del filtrado obtenido desde ecuacion 3. En este caso, la seccion 201 de calculo de energfa de subtrama obtiene energfa de subtrama Ek de senal de entrada Ai sometida a procesamiento de filtrado utilizando una covarianza segun la ecuacion 4 abajo.
[4]
imagen2
(Ecuacion 4)
La energfa de subbanda exacta puede calcularse segun la ecuacion 4 anterior. Sin embargo, en la simple
5
10
15
20
25
30
35
40
configuracion tal como se describe anteriormente, necesitan calcularse las autocorrelaciones respectivas segun los valores de j y m, que da como resultando un problema en el que la cantidad de calculo se vuelve enorme.
Por tanto la seccion 201 de calculo de energfa de subtrama de la presente invencion simplifica la operacion en la ecuacion 4 anterior sin causar deterioro de la exactitud, y reduce de este modo drasticamente la cantidad de calculo. La presente invencion no realiza actualmente el procesamiento de filtrado en la senal de entrada, pero realiza el procesamiento sustancialmente equivalente al procesamiento de calculo de energfa de trama (energfa de subtrama) de la senal de entrada sometida a procesamiento de filtrado, es decir procesamiento de calculo aproximado. Por esta razon, supongamos que se utilizan los coeficientes de procesamiento de filtrado. Es decir, segun la presente invencion, el procesamiento de filtrado en sf mismo en la configuracion simple anterior esta incluida tambien en el procedimiento de calculo de energfa de trama (energfa de subtrama) que se describira mas adelante. Como en el caso del procesamiento de filtrado en la configuracion simple anterior, sin limitarse a los tipos de filtro tales como filtro de paso bajo, filtro de paso alto, y filtro de paso banda, la presente invencion puede aplicarse igualmente a varios tipos de procesamiento de filtrado. El procedimiento de calculo de energfa de subtrama en la seccion 201 de calculo de energfa de subtrama de la presente invencion se describira en detalle a continuacion.
La ecuacion 4 anterior puede modificarse como la ecuacion 5 abajo. Cuando la ecuacion 5 esta dividida segun los valores respectivos de i, j y m, la ecuacion 5 puede expresarse como la suma de elementos de una matriz en la figura 4 (elementos de matriz).
[5]
imagen3
(Ecuacion 5)
En este caso, en la ecuacion 5, la parte de coeficiente de filtro qam de cada termino es independiente de i y qam es un coeficiente de filtro predeterminado, y por tanto qam no necesita calcularse para cada proceso de trama. Por tanto, la parte que necesita calcularse para cada proceso de trama es la parte de Ix^i-m de cada termino en la ecuacion 5 y esta parte necesita calcularse para cada de i, j y m. En este caso, la expresion de calculo de la parte de Ixi-jxi-m solo puede expresarse como la suma de una matriz en la figura 5 (en adelante en la presente memoria, denominada "matriz de autocorrelacion"). La matriz de autocorrelacion en la figura 5 tiene un formato en la que coeficiente de filtro qam se omite desde la matriz en la figura 4.
En la matriz de autocorrelacion en la figura 5, el valor de la autocorrelacion permanece el mismo incluso si los valores de j y m se conmutan, y por tanto los valores de los elementos respectivos puede expresarse como ecuacion 6 abajo segun la combinacion de valores de j y m. En este caso, la utilizacion de ecuacion 6, la matriz de autocorrelacion en la figura 5 puede simplificarse adicionalmente tal como se muestra en la figura 6.
[6]
V(j, m) = V(m, j) = YjXi-jx/-,u (/ = inicioj,—, fin * k = 0,-• M, -1)
I
(Ecuacion 6)
Ademas, la figura 7 es un diagrama de configuracion conceptual de la matriz de autocorrelacion en la figura 6. Se supone que cada region en la figura 7 indica cada elemento (elemento de matrix) (V(j, m)) en la figura 6. Ademas, dado que las regiones rodeadas por una lmea discontinua en el area superior derecha de la matriz se corresponden con las regiones en el area inferior izquierda (area sombreada) de la matriz respectivamente, el calculo de la autocorrelacion puede omitirse realmente. La figura 7 solo muestra el concepto de la configuracion de la matriz de autocorrelacion, un ejemplo de caso donde orden P del coeficiente de filtro es 10, y el numero de regiones
5
10
15
20
25
30
35
40
45
50
55
(elementos de matriz), es decir el orden del coeficiente de filtro no esta limitado a esto.
Cuando se calcula la energfa de subtrama exacta segun la ecuacion 5, necesita calcularse la matriz entera de autocorrelacion en la figura 6 (o la figura 7), que requerira una cantidad de calculo enorme. Por tanto, la seccion 201 de calculo de energfa de subtrama de la presente invencion simplifica la matriz de autocorrelacion tal como se muestra en la figura 8 (en adelante en la presente memoria, denominada "matriz de autocorrelacion simplificada"). Para ser mas espedfica, la seccion 2012 de agrupamiento de seccion 201 de calculo de energfa de subtrama agrupa los elementos de la matriz de autocorrelacion en una pluralidad de grupos segun variables j y m. En este caso, la matriz de autocorrelacion simplificada en la figura 8 es una version simplificada del diagrama de configuracion conceptual de la matriz de autocorrelacion mostrada en la figura 7.
La figura 8 es un ejemplo donde la seccion 2012 de agrupamiento agrupa los elementos respectivos de la matriz de autocorrelacion segun variables j y m. En el ejemplo en la figura 8, para una mayor diferencia entre variables j y m, la seccion 2012 de agrupamiento fija una region de grupo mayor (en adelante en la presente memoria, denominada "region de grupo"). La figura 9 es un diagrama que muestra la correspondencia entre la diferencia entre variables j y m, y cada grupo. En la figura 9, el numero 0 a 9 mostrado en cada region indica la diferencia entre variables j y m. En el ejemplo mostrado en la figura 9, los elementos respectivos cuya diferencia entre variables j y m es 0 o 1 estan agrupadas en grupos G1 a G4, estando compuesto cada grupo de 5 elementos. Ademas, los elementos respectivos cuya diferencia entre variables j y m es 2 o 3 estan agrupados en grupos G5 a G7, estando compuesto cada grupo de 5 elementos. Ademas, los elementos respectivos cuya diferencia entre variables j y m es 4 o 5 estan agrupados en grupos G8 y G9, estando compuesto cada grupo de 6 elementos. Ademas, 10 elementos cuya diferencia entre variables j y m es 6, 7, 8 o 9 estan agrupados en grupo G10. Es decir, en el ejemplo en la figura 8, elementos que tienen una mayor diferencia en valores entre variables j y m estan agrupados en una configuracion en la que los valores de autocorrelacion estan mas simplificados (aproximados).
Es decir, tal como esta claro por la figura 8 y la figura 9, la matriz de autocorrelacion simplificada esta creada basandose en una idea de que cuanto mayor es la diferencia entre variables j y m, mas gruesa (mas simplificada) es la resolucion de cada valor de la matriz de autocorrelacion que esta fijada.
La seccion 2012 de agrupamiento emite informacion de agrupamiento a la seccion 2011 de operacion.
La seccion 2011 de operacion calcula entonces los valores de autocorrelacion asumiendo que todos los elementos que pertenecen al mismo grupo tienen el mismo valor de autocorrelacion. En este momento la seccion 2011 de operacion fija, como el valor de autocorrelacion en el mismo grupo, , por ejemplo, un valor de autocorrelacion de un elemento que tiene la minima suma de j y m en el grupo.
La seccion 2011 de operacion de la seccion 201 de calculo de energfa de subtrama calcula la autocorrelacion correspondiente a cada sfmbolo segun la ecuacion 6 basandose en la matriz de autocorrelacion simplificada en la figura 8 y calcula la energfa de subtrama segun ecuacion 5 utilizando el valor calculado.
Cuando los casos en la figura 7 y la figura 8 se toman como un ejemplo de explicacion, la autocorrelacion necesita calcularse 55 veces (55 regiones en la figura 7) bajo circunstancias normales. Por otro lado, en la presente invencion, la seccion 2012 de agrupamiento de la seccion 201 de calculo de energfa de subtrama agrupa los elementos respectivos de la matriz de autocorrelacion en una pluralidad de grupos. En el ejemplo mostrado en la figura 8, los elementos respectivos de la matriz de autocorrelacion estan agrupados en 10 grupos G1 a G10. La seccion 201 de calculo de energfa de subtrama fija, por ejemplo, un valor de autocorrelacion de un elemento que tiene la minima suma de j y m en cada grupo como un valor de autocorrelacion de todos los elementos incluido en el grupo. Cuando los elementos respectivos estan agrupados en 10 grupos tal como se muestra en la figura 8 mediante la aproximacion de los valores de autocorrelacion de esta manera la presente invencion necesita solo 10 calculos de autocorrelacion, y puede reducir de este modo drasticamente la cantidad de calculo.
Es decir, la presente invencion aproxima (sustituye) la suma (Ixh x,-m) de operaciones de autocorrelacion dentro de un determinado rango (i, j) de una senal de entrada que debe calcularse cuando se calcula la energfa de trama exacta (energfa de subtrama) con la suma (Ixi-px^) de operaciones de autocorrelacion dentro de otro rango (i', j'). Por ejemplo, en el ejemplo de la figura 8, la suma (Ixi-gx^) de operaciones de autocorrelacion de (j, m)=(9, 6) se sustituye con la suma (1x^-0) de operaciones de autocorrelacion de (j', m')=(6, 0) cuyos j y m tienen valores mrnimos entre los elementos incluidos en grupo G10 que contiene (j, m)=(9, 6).
Ademas, mediante el control de la frecuencia de aproximacion (sustitucion) segun un tiempo de retardo (diferencia de tiempo entre senales cuya correlacion se calcula) durante la operacion de autocorrelacion, es posible suprimir el deterioro de la exactitud del calculo de energfa de trama (energfa de subtrama). Para ser mas espedficos, a medida que el tiempo de retardo durante operacion de autocorrelacion incrementa, es decir a medida que la diferencia entre variables j y m en la ecuacion 5 incrementa, la frecuencia de aproximacion se incrementa, y de este modo es posible suprimir el deterioro de la exactitud en calculo de energfa. Es decir, cuanto mayor es el tiempo de retardo durante operacion de autocorrelacion, es decir cuanto mayor es la diferencia entre variables j y m en la ecuacion 5, mas grande se fija la region de grupo mediante la seccion 2012 de agrupamiento. En otras palabras, la seccion 2012 de agrupamiento realiza el control para incrementar la frecuencia de sustitucion con la suma de operaciones de
5
10
15
20
25
30
35
40
45
50
55
autocorrelacion en el segundo rango identico al tiempo de retardo (diferencia entre variables j y m) durante el incremento de la operacion de autocorrelacion. Por tanto, cuando el tiempo de retardo (diferencia entre variables j y m) durante la operacion de autocorrelacion es amplio, la frecuencia con la que la suma (Ixi-X-m) de operaciones de autocorrelacion dentro de un determinado rango (i, j) de una senal de entrada se aproxima con la suma (Ixi-px^) de operacion de autocorrelacion dentro de otro rango (i', j') se incrementa, y de este modo es posible reducir la cantidad de calculo de autocorrelacion.
La figura 10 es un diagrama de bloques que ilustra una configuracion interna principal de seccion 203 de codificacion CELP. La seccion 203 de codificacion CELP incluye seccion 301 de preprocesamiento, la seccion 302 de analisis LPC (coeficientes de prediccion lineal), la seccion 302 de cuantificacion LpC, filtro 304 de smtesis, la seccion 305 de adicion, libro de codigos 306 de excitacion adaptativa, la seccion 307 de ganancia de cuantificacion, libro de codigos 308 de excitacion fija, secciones 309 y 310 de multiplicacion, la seccion 311 de adicion, la seccion 312 de ponderacion perceptual, la seccion 313 de determinacion de parametros, y seccion 314 de multiplexacion.
La informacion de determinacion informacion emitida desde la seccion 202 de determinacion se introduce en la seccion 301 de preprocesamiento.
En la figura 10, cuando la informacion de determinacion Ik (k=0, ..., Ns-1) es 1, la seccion 301 de preprocesamiento realiza, en la senal de entrada, procesamiento de filtro de paso alto de eliminacion de un componente DC, y procesamiento de conformacion de forma de onda o procesamiento de enfasis previo para mejorar el rendimiento de procesamiento de codificacion subsiguiente. La seccion 301 de preprocesamiento emite entonces la senal Xin obtenida mediante la aplicacion de estos procesos a la seccion 302 de analisis LPC y seccion 305 de adicion. Cuando la informacion de determinacion Ik (k=0, ..., Ns-1) es 0, es decir cuando la energfa de subtrama de la senal de entrada es 0, la seccion 301 de preprocesamiento no realiza el preprocesamiento y no emite nada al bloque de procesamiento subsiguiente. Es decir, cuando la informacion de determinacion Ik (k=0, ..., Ns-1) es 0, la seccion 203 de codificacion CELP no realiza procesamiento de codificacion CELP. Por tanto, el procesamiento en las secciones diferentes de la seccion 301 de preprocesamiento y la seccion 314 de multiplexacion en el caso donde informacion de determinacion Ik (k=0, ..., Ns-1) es 1 se describira en adelante en la presente memoria.
La seccion 302 de analisis LPC realiza un analisis predictivo lineal utilizando la senal Xin introducida desde la seccion 301 de preprocesamiento y emite el resultado de analisis (coeficiente de prediccion lineal) a la seccion 303 de cuantificacion LPC.
La seccion 303 de cuantificacion LPC realiza procesamiento de cuantificacion en el coeficiente de prediccion lineal (LPC) introducido desde la seccion 302 de analisis LPC, emite el LPC cuantificado al filtro 304 de smtesis y emite un codigo (L) que representa el LPC cuantificado a la seccion 314 de multiplexacion.
El filtro 304 de smtesis realiza una smtesis de filtrado en la excitacion introducida desde la seccion 311 de adicion que se describira mas adelante utilizando un coeficiente de filtro basandose en el LPC cuantificado introducido desde la seccion 303 de cuantificacion LPC, genera una senal sintetizada y emite la senal sintetizada a la seccion
305 de adicion.
La seccion 305 de adicion invierte la polaridad de la senal sintetizada introducida desde el filtro 304 de smtesis, suma la senal sintetizada con la polaridad invertida a la senal Xin introducida desde la seccion 301 de preprocesamiento, calcula de este modo una senal de error y emite la senal de error a la seccion 312 de ponderacion perceptual.
El libro de codigos 306 de excitacion adaptativa almacena la excitacion emitida en el pasado desde la seccion 311 de adicion en una memoria intermedia, extrae muestras correspondientes a una trama desde la excitacion pasada especificada por la senal introducida desde la seccion 313 de determinacion de parametros que se describira mas adelante, as un vector de excitacion adaptativa, y emite las muestras a la seccion 309 de multiplicacion.
La seccion 307 de generacion de ganancia de cuantificacion emite una ganancia de excitacion adaptativa de cuantificacion y una ganancia de excitacion fija de cuantificacion especificada por la senal introducida desde la seccion 313 de determinacion de parametros a la seccion 309 de multiplicacion y seccion 310 de multiplicacion respectivamente.
El libro de codigos 308 de excitacion fija emite un vector de excitacion de impulsos que tiene una forma especificada por una senal introducida desde la seccion 313 de determinacion de parametros a la seccion 310 de multiplicacion como un vector de excitacion fija. Un vector obtenido mediante la multiplicacion del vector de excitacion de impulsos por un vector de extension puede emitirse tambien a la seccion 310 de multiplicacion como el vector de excitacion fija.
La seccion 309 de multiplicacion multiplica el vector de excitacion adaptativa introducido desde el libro de codigos
306 de excitacion adaptativa por la ganancia de excitacion adaptativa de cuantificacion introducida desde la seccion
307 de ganancia de cuantificacion y emite el resultado de multiplicacion a la seccion 311 de adicion. Ademas la seccion 310 de multiplicacion multiplica el vector de excitacion fija introducido desde el libro de codigos 308 de excitacion fija por la ganancia de excitacion fija de cuantificacion introducida desde la seccion 307 de ganancia de
5
10
15
20
25
30
35
40
45
50
55
cuantificacion y emite el resultado de multiplicacion a la seccion 311 de adicion.
La seccion 311 de adicion realiza la adicion del vector en el vector de excitacion adaptativa multiplicado por la ganancia introducida desde la seccion 309 de multiplicacion y el vector de excitacion fija multiplicado por la ganancia introducida desde la seccion 310 de multiplicacion y emite la excitacion, que es el resultado de adicion, al filtro 304 de smtesis y libro de codigos 306 de excitacion adaptativa. La excitacion emitida al libro de codigos 306 de excitacion adaptativa se almacena en la memoria intermedia de libro de codigos 306 de excitacion adaptativa.
La seccion 312 de ponderacion perceptual realiza la ponderacion perceptual en la senal de error introducida desde la seccion 305 de adicion y emite la senal de error a la seccion 313 de determinacion de parametros como distorsion de codificacion.
La seccion de determinacion 313 de parametros selecciona un vector de excitacion adaptativa, vector de excitacion fija y ganancia de cuantificacion que minimiza la distorsion de codificacion introducida desde la seccion 312 de ponderacion perceptual desde el libro de codigos 306 de excitacion adaptativa, libro de codigos 308 de excitacion fija y seccion 307 de ganancia de cuantificacion respectivamente, y emite un codigo (A) de vector de excitacion adaptativa, codigo (F) de vector de excitacion fija y codigo (G) de ganancia de cuantificacion que muestra los resultados de seleccion a la seccion 314 de multiplexacion.
La informacion de determinacion se introduce en la seccion 314 de multiplexacion desde la seccion 202 de determinacion. Cuando la informacion de determinacion Ik (k=0, ..., Ns-1) es 1, la seccion 314 de multiplexacion multiplexa el codigo (L) que indica el LPC cuantificado introducido desde la seccion 302 de cuantificacion LPC, el codigo (A) de vector de excitacion adaptativa introducida desde la seccion 313 de determinacion de parametros, codigo (F) de vector de excitacion fija el codigo (G) de ganancia de cuantificacion y la informacion de determinacion Ik (k=0, ..., Ns-1) y emite el codigo multiplexado a la trayectoria de transmision 102 como informacion codificada. Cuando la informacion de determinacion Ik (k=0, ..., Ns-1) es 0, la seccion 314 de multiplexacion emite solo la informacion de determinacion a la trayectoria de transmision 102 como informacion codificada.
El procesamiento en la seccion 203 de codificacion CELP se ha descrito hasta aqrn.
El procesamiento en el aparato de codificacion 101 se ha descrito hasta aqrn.
A continuacion se describira una configuracion interna de aparato 103 de descodificacion mostrado en la figura 1 con referencia a la figura 11. En este caso, se describira un caso en el que la seccion 103 de descodificacion realiza descodificacion de voz de tipo CELP.
La figura 11 es un diagrama de bloques que ilustra una configuracion interna principal de aparato 103 de descodificacion. El aparato 103 de descodificacion incluye seccion 401 de desmultiplexacion, la seccion 402 de descodificacion LPC, libro de codigos 403 de excitacion adaptativa, la seccion 404 de generacion de ganancia de cuantificacion, libro de codigos 405 de excitacion fija, secciones 406 y 407 de multiplicacion, la seccion 408 de adicion, filtro 409 de smtesis, y seccion 410 de procesamiento posterior.
En la figura 11, la seccion 401 de desmultiplexacion desmultiplexa la informacion codificada introducida desde el aparato de codificacion 101 en codigos individuales (L), (A), (G), (F), e informacion de determinacion. El codigo (L) LPC desmultiplexado se emite a la seccion 402 de descodificacion LPC. Ademas, el codigo desmultiplexado (A) de vector de excitacion adaptativa se emite al libro de codigos 403 de excitacion adaptativa. Ademas, el codigo desmultiplexado (G) de ganancia de cuantificacion se emite a la seccion 404 de generacion de ganancia de cuantificacion. Ademas, el codigo desmultiplexado (F) de vector de excitacion fija se emite al libro de codigos 405 de excitacion fija. Ademas, la informacion de determinacion desmultiplexada se emite a la seccion 410 de procesamiento posterior. Cuando la informacion de determinacion Ik (k=0, ..., Ns-1) es 0, los codigos individuales diferentes a la informacion de determinacion no estan incluidos en la informacion codificada, y por tanto se supone que los componentes diferentes a la seccion 410 de procesamiento posterior no realizaran procesamiento en este caso. Por tanto, el procesamiento mediante los componentes diferentes a la seccion 410 de procesamiento posterior se describiran en adelante en la presente memoria cuando la informacion de determinacion Ik (k=0, ..., Ns-1) es 1.
La seccion 402 de descodificacion LPC descodifica el LPC cuantificado desde el codigo (L) introducido desde la seccion 401 de desmultiplexacion y emite el LPC cuantificado descodificado al filtro 409 de smtesis.
El libro de codigos 403 de excitacion adaptativa extrae muestras correspondientes a una trama desde la excitacion pasada especificada por el codigo (A) de vector de excitacion adaptativa introducida desde la seccion 401 de desmultiplexacion como vectores de excitacion adaptativa y emite las muestras a la seccion 406 de multiplicacion.
La seccion 404 de generacion de ganancia de cuantificacion descodifica la ganancia de excitacion adaptativa de cuantificacion y la ganancia de excitacion fija de cuantificacion especificada por el codigo (G) de ganancia de cuantificacion introducida desde la seccion 401 de desmultiplexacion, emite la ganancia de excitacion adaptativa de cuantificacion a la seccion 406 de multiplicacion y emite la ganancia de excitacion fija de cuantificacion a la seccion 407 de multiplicacion.
5
10
15
20
25
30
35
40
45
50
55
El libro de codigos 405 de excitacion fija genera un vector de excitacion fija especificada por el codigo (F) de vector de excitacion fija introducido desde la seccion 401 de desmultiplexacion y emite el vector de excitacion fija a la seccion 407 de multiplicacion.
La seccion 406 de multiplicacion multiplica el vector de excitacion adaptativa introducido desde el libro de codigos
403 de excitacion adaptativa por la ganancia de excitacion adaptativa de cuantificacion introducida desde la seccion
404 de generacion de ganancia de cuantificacion y emite el resultado de multiplicacion a la seccion 408 de adicion. Por otro lado, la seccion 407 de multiplicacion multiplica el vector de excitacion fija introducido desde el libro de codigos 405 de excitacion fija por la ganancia de excitacion fija de cuantificacion introducida desde la seccion 404 de generacion de ganancia de cuantificacion y emite el resultado de multiplicacion a la seccion 408 de adicion.
La seccion 408 de adicion suma el vector de excitacion adaptativa multiplicado por la ganancia introducida desde la seccion 406 de multiplicacion y el vector de excitacion fija multiplicado por la ganancia introducida desde la seccion 407 de multiplicacion, genera excitacion y emite la excitacion al filtro 409 de smtesis y libro de codigos 403 de excitacion adaptativa.
El filtro 409 de smtesis realiza una smtesis de filtrado de la excitacion introducida desde la seccion 408 de adicion utilizando el coeficiente de filtro descodificado por la seccion 402 de descodificacion LPC y emite la senal sintetizada a la seccion 410 de procesamiento posterior.
La seccion 410 de procesamiento posterior recibe informacion de determinacion Ik (k=0, Ns-1). Cuando la
informacion de determinacion Ik (k=0, ..., Ns-1) es 1, la seccion 410 de procesamiento posterior aplica el procesamiento de mejorar la calidad subjetiva de voz tal como enfasis de formantes o enfasis de tono (pitch), y/o procesamiento de mejorar la calidad subjetiva de ruido estatico o similar a la senal introducida desde el filtro 409 de smtesis y emite la senal procesada como una senal de salida. Ademas, en este momento, un aparato de almacenamiento previsto en la seccion 410 de procesamiento posterior provoca que se almacene una senal de salida de la trama actual. Cuando la informacion de determinacion Ik (k=0, ..., Ns-1) es 0, la seccion 410 de procesamiento posterior multiplica la senal de salida en la trama pasada almacenada en el aparato de almacenamiento en la seccion 410 de procesamiento posterior por un coeficiente predeterminado (0<p<1,0) y emite la senal multiplicada como una senal de salida. Ademas, el aparato de almacenamiento provoca que se almacene la senal de salida en este momento. Cuando la informacion de determinacion Ik (k=0, ..., Ns-1) es 0, puede adoptarse un procedimiento en el que la emision cero (senal de voz inactiva) se emite sin realizar el procesamiento anteriormente descrito.
Hasta aqrn se ha descrito el procesamiento en el aparato 103 de descodificacion mostrado en la figura 1.
Hasta aqrn se ha descrito la realizacion 1 de la presente invencion.
Por tanto, segun la presente realizacion, en la configuracion de calculo de energfa de trama o energfa de subtrama de una senal de entrada que utiliza operaciones de autocorrelacion, que realiza operaciones de autocorrelacion aproximada hace posible reducir drasticamente la cantidad de calculo de procesamiento (cantidad de calculo) sin causar deterioro de la exactitud de energfa de trama o energfa de subtrama.
Para ser mas espedficos, la seccion 2012 de agrupamiento agrupa elementos respectivos de una matriz de autocorrelacion en una pluralidad de grupos segun un tiempo de retardo (es decir diferencia entre j y m) durante operacion de autocorrelacion. Por ejemplo, cuanto mayor es el tiempo de retardo (es decir diferencia entre j y m) durante la operacion de autocorrelacion, mas elementos de la matriz de autocorrelacion se agrupan en el mismo grupo mediante la seccion 2012 de agrupamiento. Cuando el procesamiento de filtrado se realiza en la senal de entrada xi (i=iniciok, ..., fink), la seccion 2011 de operacion fija la senal de entrada despues del filtrado como A (vease ecuacion 3) y fija la suma (Ixi.j x,_m) de operaciones de autocorrelacion en un primer rango (j, m) de esta senal de entrada Ai como la suma (ixi.j' x^) de operaciones de autocorrelacion en un segundo rango (j', m') en el mismo grupo que el primer rango. Por tanto, a medida que el tiempo de retardo (diferencia entre j y m (diferencia de tiempo)) durante la operacion de autocorrelacion en el primer rango (j, m) se incrementa, la seccion 2012 de agrupamiento incrementa la frecuencia de sustitucion con la suma de operaciones de autocorrelacion en el mismo segundo rango (j', m'). Es decir, a medida que la diferencia entre j y m en la ecuacion 5 se incrementa, la seccion 2012 de agrupamiento incrementa el numero de combinaciones de j y m a sustituir mediante las operaciones de autocorrelacion en j' y m'. Por tanto, en lugar de utilizar simplemente un valor promedio, es posible aproximar las operaciones de autocorrelacion en el primer rango, y reducir de este modo la cantidad de calculo sin causar deterioro de la exactitud de calculo.
Como un ejemplo de aproximacion de operaciones de autocorrelacion, se ha descrito un caso en la presente realizacion tal como se muestra en la figura 8 donde, cuanto mayor es la diferencia entre variables j y m en operaciones de autocorrelacion que utilizan variables j y m, mas simplificada se adopta la (aproximada) configuracion (procedimiento de agrupamiento).
En la figura 8, aunque los valores de operacion de autocorrelacion correspondientes a regiones que tienen valores j (o m) diferentes se fijan para que sean iguales, un procedimiento que no entra bajo la definicion de la invencion tambien es efectivo por lo cual la seccion 2012 de agrupamiento de seccion 201 de calculo de energfa de subtrama
5
10
15
20
25
30
35
40
45
50
55
agrupa regiones en el que las diferencias entre j y m son iguales como una matriz de Toeplitz. La figura 12 muestra este ejemplo de configuracion. En la figura 12, el grupo G1 es un grupo en el que la diferencia entre j y m se corresponden con 0. Asimismo, los grupos G2 a 10 son grupos donde la diferencia entre j y m se corresponden con 1 a 9, respectivamente.
Ademas, una configuracion en la que una region agrupada se determina segun la posicion de una muestra que tiene gran amplitud en una senal de entrada puede tomarse tambien como un ejemplo. La figura 13 muestra un ejemplo de seccion 201a de calculo de energfa de subtrama en este caso. La diferencia de la seccion 201 de calculo de energfa de subtrama en la figura 3 reside en que la seccion 2012a de agrupamiento que recibe una senal de entrada esta dispuesta en lugar de la seccion 2012 de agrupamiento. En esta configuracion, por ejemplo, la seccion 2012a de agrupamiento de seccion 201a de calculo de energfa de subtrama busca subtramas de la senal de entrada para ver si hay o no una muestra cuya amplitud es igual a o mayor que un umbral. Puede haber una configuracion en la que cuando hay una muestra que tiene la amplitud igual a o mayor que el umbral, la seccion 2012a de agrupamiento fija un lfmite de agrupamiento entre cuando la operacion de autocorrelacion incluye la muestra correspondiente y cuando no. Para ser mas espedficos, la seccion 2012a de agrupamiento agrupa un rango (elementos de matriz) que incluye una muestra donde la amplitud de la senal de entrada sea igual a o mayor que un umbral en el mismo grupo (grupo 1) para distinguirlo de un grupo de rango que no incluye ninguna muestra que tenga la amplitud igual a o mayor que el umbral. Es decir, el rango que no incluye la muestra que tiene la amplitud igual a o mayor que el umbral se agrupa en otro grupo (grupo 2). La seccion 2011 de operacion sustituye entonces la suma de operaciones de autocorrelacion en el primer rango (i, j) que pertenece al grupo 1 con operaciones de autocorrelacion en el segundo rango (i', j') que pertenece al grupo 1. Ademas, la seccion 2011 de operacion sustituye la suma de operaciones de autocorrelacion en un tercer rango (i, j) que pertenece al grupo 2 con operaciones de autocorrelacion en un cuarto rango (i', j') que pertenece al grupo 2. Por tanto, es posible evitar que las operaciones de autocorrelacion en el rango que incluye la muestra, donde la amplitud de la senal de entrada sea igual a o mayor que el umbral, se sustituyan por operaciones de autocorrelacion que tengan valores completamente diferentes, y suprimir de este modo el deterioro de la exactitud de calculo provocado por la sustitucion.
El procedimiento de agrupamiento anteriormente descrito puede combinarse tambien con el procedimiento de agrupamiento descrito en el presente ejemplo.
Se ha descrito una configuracion en la que el valor (valor tfpico) de autocorrelacion correspondiente a cada region agrupada de una matriz simplificada esta fijada a un valor de una region que tiene la suma minima de j y m, pero puede aplicarse igualmente a una configuracion en la que un valor diferente al descrito anteriormente esta fijado como el valor de autocorrelacion de la region agrupada. Por ejemplo, un valor de una region central en cada region agrupada (por ejemplo, region en la que exista el centro de gravedad de una region agrupada) pueda fijarse como un valor tfpico.
Ademas del procedimiento de determinacion de valor tfpico anteriormente, puede adoptarse tambien un procedimiento por el cual un valor tfpico se fija de manera eficiente en una parte de ataque (parte transitoria) o similar. En este caso, la parte de ataque (parte transitoria) se refiere a, por ejemplo, una parte donde el nivel de senal de una senal de voz se incrementa drasticamente, es decir una parte de una senal de voz en la que la amplitud inmediatamente despues de la parte sea considerablemente mayor que la amplitud inmediatamente antes de la parte. Por ejemplo, en una trama en la que un estado de voz inactivo se cambia a un estado de voz activo, una muestra con energfa bastante pequena existe al comienzo seguida por muestras que tienen mayor energfa. Es decir, existe una parte de ataque.
En este caso, si, por ejemplo, un valor cercano a la parte inferior derecha en la matriz de autocorrelacion en la figura 12 esta fijado como un valor tfpico, un error puede incrementar cuando los valores de autocorrelacion se calculan utilizando una muestra que tenga originalmente energfa pequena, provocando que la exactitud de calculo de energfa se deteriore considerablemente. En algunos casos puede producirse un sonido extrano.
Por tanto, para una parte de ataque tal, al fijar el valor cercano a la parte superior izquierda en la matriz de autocorrelacion en la figura 12 como un valor tfpico, es posible reducir el error en el caso donde un valor de autocorrelacion extremadamente pequeno se calcula originalmente.
Ademas, al contrario de la parte de ataque, en una trama en la que un estado de voz activo se cambia a un estado de voz inactivo, existe una muestra con energfa extremadamente grande al comienzo seguida por muestras que tienen energfa pequena. En este caso, por ejemplo, al fijar el valor cercano a la parte inferior izquierda en la matriz de autocorrelacion en la figura 12 como un valor tfpico, es posible reducir el error cuando un valor de autocorrelacion extremadamente pequeno se requiere originalmente por la misma razon a la descrita anteriormente.
Por tanto, cuando la variacion en la amplitud de la muestra es grande debido a, por ejemplo, el cambio entre voz activa y voz inactiva en una trama o subtrama, las operaciones de autocorrelacion en j y m se sustituyen por operaciones de autocorrelacion en j' y m' que incluyen una muestra con amplitud pequena. La determinacion adaptativa de valores tfpicos tal como se describe anteriormente hace posible reducir adicionalmente errores de operacion de autocorrelacion con respecto a la trama entera o subtrama.
5
10
15
20
25
La presente realizacion ha descrito un procedimiento de reduccion de la cantidad de calculo cuando se calcula la energfa de subtrama de una senal de entrada utilizando operacion de autocorrelacion sin causar deterioro de la exactitud de calculo, pero la presente invencion no esta limitada a esto, y puede aplicarse igualmente a un caso en el que se calcula la energfa de trama de una senal de entrada. En este caso, en lugar de la ecuacion 1, ecuacion 3 a ecuacion 6 descritas en la presente realizacion, se utilizan la ecuacion 2, ecuacion 7 a ecuacion 10 respectivamente. No hay concepto de subtrama en la ecuacion 2, ecuacion 7 a ecuacion 10, y se supone que todo el procesamiento se realiza en unidades de trama.
[7]
[8]
imagen4
... (Ecuacion 7)
[9]
fp-i ' 2 ,
®=zv-z
, (j - inicio
u=0
7-i > \
-z
ZVw
i
J=0 J
p-\
a-l
= LLa^L
Xi-jXi-m
/=0m=0 i
imagen5
(Ecuacion 8)
E = (' = inici0'"'-fin )

i j=Q ni=0 i
= OCqOCq ^ XfXf H“ CXqCX] ^ X{X._y + • * • + £X0(Xp^ ^X{P_j y

i i i
+ ala0YixMxi + «,<*,£*,_i*h

i ir /
+ a/,_|£EoZ;c.'-(M)'*; + cxP_lcxl Z^MP-iixj-i _i + ^p-ictp_\ Z JC,-ff-i)xt-fp-ii

I i i
... (Ecuacion 9)
[10]
V(j, m) = V(m, j) = Yjxi-jxi-m (* =inicio ,fin )
' ... (Ecuacion 10)
Ademas, la seccion 201/201a de calculo de energfa de subtrama segun la presente realizacion no esta limitada a un aparato de codificacion, pero tambien es util como un aparato de procesamiento de senales que calcula energfa en unidades de subtrama (o trama).
(Ejemplo 2)
El ejemplo 2 describira una configuracion en la que un procedimiento de agrupamiento esta fijado de manera adaptativa para cada proceso de trama o subproceso de trama en la matriz de autocorrelacion descrita en la realizacion 1. Se ha descrito un caso previamente en 1 (figura 8, figura 9) donde el agrupamiento esta fijado sobre una trama entera pero la fijacion adaptativa de agrupamiento, hace posible mejorar adicionalmente la exactitud de la operacion. Ademas, el procesamiento se describira abajo basandose en la configuracion de matriz descrita en la
5
10
15
20
25
30
35
40
45
50
figura 12.
Dado que un sistema de comunicacion que incluye un aparato de codificacion y un aparato de descodificacion segun el presente ejemplo tiene la misma configuracion que la mostrada en la realizacion 1 (figura 1), se omitira la ilustracion y descripcion de la misma. Ademas, puesto que la configuracion interna del aparato de codificacion segun el presente ejemplo es la misma que la configuracion mostrada en la realizacion 1 (figura 2), se omitira la ilustracion y descripcion de la misma. Ademas, puesto que la configuracion interna de la seccion de calculo de energfa de subtrama segun el presente ejemplo tiene la misma configuracion que la configuracion mostrada en la realizacion 1 (figura 3), la configuracion interna se describira utilizando la figura 3. Ademas, puesto que la configuracion interna del aparato de descodificacion segun el presente ejemplo tiene la misma configuracion que la configuracion mostrada en la realizacion 1 (figura 11), se omitira la ilustracion y descripcion de la misma.
Se supone que la seccion 2012 de agrupamiento en el aparato de codificacion del presente ejemplo realiza el agrupamiento basandose en un procedimiento de agrupamiento tal como la matriz de Toeplitz mostrado en la figura 12 descrito anteriormente.
El procedimiento de agrupamiento tal como se muestra en la figura 12 descrito anteriormente agrupa elementos respectivos de la matriz de autocorrelacion para cada region que tiene la misma diferencia entre j y m y esta simplificada para tener el mismo valor de operacion de autocorrelacion dentro del grupo. Esto proporciona una ventaja que es posible reducir drasticamente el numero de veces que se realiza la operacion de autocorrelacion. Sin embargo, cuando existen elementos que tienen valores de operacion de autocorrelacion significativamente diferentes dentro del mismo grupo, hay el problema de que se produce un gran error de operacion.
Por tanto, el presente ejemplo describira una configuracion basandose en el procedimiento de agrupamiento tal como se muestra en la figura 12 que suprime los errores en la operacion de autocorrelacion al dividir un grupo en dos partes. Para simplificar la descripcion, se describira un caso abajo donde solo un grupo cuyos valores j y m sean identicos (grupo en la diagonal de una matriz de autocorrelacion) se divide en dos partes.
La figura 14 muestra un ejemplo de agrupamiento en este caso. En la figura 14, un grupo donde los valores j y m son identicos (grupo en la diagonal de una matriz de autocorrelacion), es decir grupo G1 en la figura 12, se divide en dos grupos: grupo G1-1 y grupo G1-2.
A continuacion, se describiran abajo como dividir el grupo G1 en dos partes.
La figura 15 muestra un rango objetivo en el que la operacion de autocorrelacion se realiza en el grupo G1 en una forma simplificada. Del grupo G1 de la matriz de autocorrelacion, el rango desde el elemento superior izquierdo al elemento de parte inferior derecha en la que se realiza la operacion de autocorrelacion se modifica desde rango (0) al rango (P-1) tal como se muestra en la figura 15. La seccion 2012 de agrupamiento en el presente ejemplo busca el mdice de muestras i que maximiza la ecuacion 11 abajo y divide el grupo G1 en dos subgrupos G1-1 y G1-2 utilizando este mdice i como un punto de division. En este caso, en la ecuacion 11, L representa una longitud de subtrama.
[11]
imagen6
(Ecuacion 11)
El ejemplo en la figura 14 muestra un caso en el que el punto de division es justo un punto medio del rango de busqueda, es decir el punto de division es i=inicioi+(P-1 )/2.
La figura 16 muestra una vista general del procesamiento de busqueda en el punto de division en la ecuacion 11. Se supone que la parte de estado en la figura 16 es Xi, y la longitud desde la parte trasera de una trama a la parte de estado, es decir una parte del orden del filtro es yi+L. Sin embargo, para simplificar la descripcion, se describira un caso en el que el procesamiento se realiza en unidades de trama, no en subunidades de trama.
En este caso, la ecuacion 11 muestra una variacion de energfa de trama cuando el rango objetivo de operacion de correlacion se ha desplazado en una muestra en un momento. Por tanto, un punto que maximiza la ecuacion 11 es un punto en el que la variacion de energfa de trama es la mayor, y cuando la seccion 2012 de agrupamiento divide el grupo en ese punto, es posible reducir estadfsticamente el numero de errores en la operacion de correlacion que acompana el agrupamiento. Tal como se describio anteriormente, la figura 16 muestra una configuracion durante procesamiento de trama, y durante el procesamiento de subtrama, la posicion de inicio (iniciok) de cada subtrama puede sumarse a las posiciones de inicio de Xi e yi+L y el punto de division puede obtenerse utilizando el mismo procedimiento que se describio anteriormente.
5
10
15
20
25
30
35
40
45
50
Por tanto, segun el presente ejemplo, la realizacion de la operacion de autocorrelacion aproximada en una configuracion en la que energfa de trama o energfa de subtrama de una senal de entrada se calcula utilizando operaciones de autocorrelacion hace posible reducir drasticamente la cantidad de calculo de procesamiento (cantidad de calculo) sin causar un deterioro de la exactitud de energfa de trama o energfa de subtrama. Ademas, en el procesamiento de la operacion de autocorrelacion aproximada, que determina de manera adaptativa el procedimiento de operacion de aproximacion del procesamiento de operacion de autocorrelacion en unidades de procesamiento de trama (o subtrama) hace posible suprimir adicionalmente el deterioro de la exactitud de energfa de trama o energfa de subtrama.
Aunque el presente ejemplo ha descrito una configuracion en la que el procedimiento de division esta fijado de manera adaptativa cuando la parte de una matriz de Toeplitz se divide en dos partes tal como se muestra en la figura 14, como un ejemplo, esto puede aplicarse igualmente a un caso en el que la parte de la matriz de Toeplitz se divide en tres o mas grupos. En este caso, ademas del punto donde se maximiza la ecuacion 11, un punto donde el valor de ecuacion 11 se convierte en el segundo mas largo puede fijarse como un segundo punto de division. Ademas, cuando la parte de la matriz de Toeplitz se divide en k (k es un mtegro igual a o mayor de 3) grupos, un punto en el que el valor de ecuacion 11 se convierte en el de orden (k-1) mas largo puede fijarse como un punto de division de orden (k-1).
Ademas, aunque el presente ejemplo ha descrito una configuracion en la que algunos grupos de una matriz de Toeplitz estan divididos tal como se muestra en la figura 14 como un ejemplo, no esta limitado a esto y puede aplicarse igualmente a un caso en el que todos los grupos de la matriz de Toeplitz estan divididos, o a un caso de agrupamiento diferente al de una matriz de Toeplitz (por ejemplo, el caso de agrupamiento tal como se muestra en la figura 9).
Ademas, aunque el presente ejemplo no se refiere particularmente a un valor tfpico de cada grupo (cada subgrupo) de una matriz de autocorrelacion agrupada, es posible calcular un valor tfpico como se ha descrito anteriormente. Por ejemplo puede asumirse que un valor de operacion de autocorrelacion correspondiente al elemento superior izquierdo de cada grupo (cada subgrupo) sea un valor tfpico de cada grupo (cada subgrupo).
Ademas, puede asumirse que un valor de operacion de autocorrelacion correspondiente al elemento central de cada grupo (cada subgrupo) sea un valor tfpico, y de este modo es posible reducir estadfsticamente un error en la operacion de autocorrelacion con respecto a la matriz entera de autocorrelacion.
Ademas, el aparato de codificacion segun la presente invencion, no esta limitado a la anterior realizacion, pero puede implementarse modificado en varios modos segun las reivindicaciones.
Aunque se ha supuesto que el aparato de descodificacion realice el procesamiento utilizando informacion codificada transmitida desde el aparato de codificacion puede procesarse informacion codificada que contiene parametros o datos necesarios incluso si no es necesariamente informacion codificada desde el aparato de codificacion.
Ademas, la presente invencion puede aplicarse tambien a casos en los que un programa de procesamiento de senales se escribe en un medio de grabacion que pueda leerse mecanicamente tal como memoria, disco, cinta, CD, DVD y funciona, y pueden obtenerse operaciones y efectos similares a aquellos en la realizacion anterior.
Por lo tanto aunque se hayan descrito casos en los que la presente invencion este configurada mediante hardware, la presente invencion puede implementarse tambien mediante software.
Cada bloque funcional empleado en la descripcion de la realizacion anteriormente mencionada puede implementarse normalmente como un LSI (circuito de alto grado de integracion) constituido por un circuito integrado. Estos pueden ser chips individuales o parcial o totalmente contenidos denominados "IC," "sistema LSI," "super LSI," o "ultra LSI" dependiendo de los diferentes rangos de integracion.
Ademas el procedimiento de integracion de circuitos no esta limitado a los LSI, y la implementacion utilizando sistema de circuitos dedicados o procesadores de uso general tambien es posible. Tras la fabricacion de LSI tambien es posible la utilizacion de un FPGA programable (arreglo de puerta programable de campo) o un procesador reconfigurable en el que las conexiones y ajustes de las celdas de circuito dentro de un LSI pueden volver a configurarse es tambien posible.
Ademas si la tecnologfa de circuitos integrados aparece para reemplazar los LSI como un resultado del avance de la tecnologfa de semiconductores o un derivado de otra tecnologfa naturalmente tambien es posible llevar a cabo la integracion de bloques funcionales utilizando esta tecnologfa. Tambien es posible la aplicacion de biotecnologfa.
Se hace referencia a las divulgaciones de la solicitud de patente japonesa num. 2011-006211, presentada el 14 de enero, 2011 y la solicitud de patente japonesa num. 2011-054919, presentada el 14 de marzo, 2011.
5
10
15
20
25
Aplicabilidad industrial
El aparato de codificacion segun la presente invencion puede reducir de manera eficiente la cantidad de operaciones cuando se calcula la ene^a de trama o ene^a de subtrama de una senal de entrada utilizando autocorrelaciones y pueden aplicarse a, por ejemplo, un sistema de comunicacion o sistema de comunicacion movil.
Lista de numeros de referencia
101
aparato de codificacion
102
trayectoria de transmision
103
aparato de descodificacion
201,
201a seccion de calculo de energfa de subtrama
2011
seccion de operacion
2012
!, 2012a seccion de agrupamiento
202
seccion de determinacion
203
seccion de codificacion CELP
301
seccion de preprocesamiento
302
seccion de analisis LPC
303
seccion de cuantificacion LPC
"3- o CO
4^ O CD filtro de smtesis
305,
311,408 seccion de adicion
CD O CO
CO o libro de codigos de excitacion adaptativa
307,
404 seccion de generacion de ganancia de cuantificacion
CO o CO
4^ O cn libro de codigos de excitacion fija
CO o CD
310, 406, 407 seccion de multiplicacion
312
seccion de ponderacion perceptual
313
seccion de determinacion de parametros
314
seccion de multiplexacion
401
seccion de desmultiplexacion
402
seccion de descodificacion LPC
410
seccion de procesamiento posterior

Claims (3)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    REIVINDICACIONES
    1. Un aparato de codificacion que comprende:
    una seccion de calculo de energfa adaptada para calcular una de energfa de trama y energfa de subtrama de una senal de voz/sonido utilizando una operacion de autocorrelacion de la senal de voz/sonido; y una seccion de codificacion adaptada para codificar la senal de voz/sonido utilizando una de la energfa de trama y la energfa de subtrama, y para generar informacion codificada, en el que,
    cuando se realiza una operacion de autocorrelacion en la senal de voz/sonido utilizando la ecuacion 1 o la ecuacion 2, la seccion de calculo de energia esta adaptada para realizar operaciones de autocorrelacion
    en una combinacion de j' y m' para la aproximacion, que es diferente de una
    imagen1
    combinacion de j y m segun los valores de j y m, y para calcular una de la energia de trama y la energia de subtrama mediante la sustitucion de las operaciones de autocorrelacion ^ en la
    combinacion de j y m con la operaciones de autocorrelacion en la combinacion de j' y m': [1]
    Ek = Z42 (/'= inicioi5...s fint k = 0,---,Ns-\)
    i j=0 i
    (ecuacion 1)
    Ek ene^a (energia de subtrama) de subtrama cuyo mdice de subtrama es k,
    Ai: senal de voz/sonido despues del filtrado,
    P: orden de filtrado, q, am: coeficiente de filtro,
    Xn: senal de voz/sonido de subtrama de orden (n+1),
    j, m: mdice que indica tiempo de retardo cuando se calcula la autocorrelacion, i: mdice de muestras de senal de voz/sonido,
    Ns: numero de subtramas, k: mdice de subtrama,
    iniciok: mdice de muestras principal de subtrama cuyo mdice de subtrama es k, y fink: mdice de muestras de cola de subtrama cuyo mdice de subtrama es k; y [2]
    imagen2
    (ecuacion 2)
    E: energia de trama,
    Ai: senal de voz/sonido despues del filtrado,
    P: orden de filtrado, aj, am: coeficiente de filtro,
    Xn: senal de voz/sonido de trama de orden (n+1),
    j, m: mdice que indica tiempo de retardo cuando se calcula la autocorrelacion, i: mdice de muestras de senal de voz/sonido, inicio: mdice de muestras principal de trama, y fin: mdice de muestras de cola de trama, y
    en el que la seccion de calculo de energia esta adaptada para realizar control con el fin de incrementar el numero de combinaciones de j y m a sustituir con operaciones de autocorrelacion en la combinacion de j' y m' a medida que la diferencia entre j y m en la ecuacion 1 o ecuacion 2 se incrementa.
  2. 2. Un aparato de terminal de comunicaciones que comprende el aparato de codificacion segun la reivindicacion 1.
  3. 3. Un aparato de estacion base que comprende el aparato de codificacion segun la reivindicacion 1.
ES11855814.7T 2011-01-14 2011-12-14 Aparato para codificar una señal de voz/sonido Active ES2627410T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2011006211 2011-01-14
JP2011006211 2011-01-14
JP2011054919 2011-03-14
JP2011054919 2011-03-14
PCT/JP2011/006981 WO2012095924A1 (ja) 2011-01-14 2011-12-14 符号化装置、通信処理装置および符号化方法

Publications (1)

Publication Number Publication Date
ES2627410T3 true ES2627410T3 (es) 2017-07-28

Family

ID=46506853

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11855814.7T Active ES2627410T3 (es) 2011-01-14 2011-12-14 Aparato para codificar una señal de voz/sonido

Country Status (5)

Country Link
US (1) US9324331B2 (es)
EP (2) EP3285253B1 (es)
JP (1) JP5722916B2 (es)
ES (1) ES2627410T3 (es)
WO (1) WO2012095924A1 (es)

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03236100A (ja) * 1990-02-14 1991-10-22 Toshiba Corp 音声検出方式
US5179594A (en) 1991-06-12 1993-01-12 Motorola, Inc. Efficient calculation of autocorrelation coefficients for CELP vocoder adaptive codebook
US5173941A (en) 1991-05-31 1992-12-22 Motorola, Inc. Reduced codebook search arrangement for CELP vocoders
US5265190A (en) 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
JPH06138896A (ja) * 1991-05-31 1994-05-20 Motorola Inc 音声フレームを符号化するための装置および方法
US5187745A (en) 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
JPH0563580A (ja) * 1991-09-02 1993-03-12 Mitsubishi Electric Corp 音声信号処理方法
JPH0830298A (ja) * 1994-07-20 1996-02-02 Hitachi Ltd 音声符号化装置
FR2729245B1 (fr) * 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
US6047254A (en) * 1996-05-15 2000-04-04 Advanced Micro Devices, Inc. System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
US5924062A (en) 1997-07-01 1999-07-13 Nokia Mobile Phones ACLEP codec with modified autocorrelation matrix storage and search
JP2947788B1 (ja) * 1998-05-12 1999-09-13 日本電信電話株式会社 音声および音響信号の高速な符号化方法および装置および記録媒体
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US7376242B2 (en) * 2001-03-22 2008-05-20 Digimarc Corporation Quantization-based data embedding in mapped data
US6766289B2 (en) 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
US6789059B2 (en) 2001-06-06 2004-09-07 Qualcomm Incorporated Reducing memory requirements of a codebook vector search
JP2008158312A (ja) * 2006-12-25 2008-07-10 Oki Electric Ind Co Ltd ピッチ推定器及びピッチ推定方法、並びに、自己相関演算器及び自己相関演算方法
DE102008009718A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
ES2654433T3 (es) * 2008-07-11 2018-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de señal de audio, método para codificar una señal de audio y programa informático
CN101609678B (zh) * 2008-12-30 2011-07-27 华为技术有限公司 信号压缩方法及其压缩装置

Also Published As

Publication number Publication date
US20130339009A1 (en) 2013-12-19
JPWO2012095924A1 (ja) 2014-06-09
JP5722916B2 (ja) 2015-05-27
EP3285253A1 (en) 2018-02-21
WO2012095924A1 (ja) 2012-07-19
EP2665060B1 (en) 2017-03-08
EP2665060A4 (en) 2014-07-09
EP2665060A1 (en) 2013-11-20
EP3285253B1 (en) 2020-08-12
US9324331B2 (en) 2016-04-26

Similar Documents

Publication Publication Date Title
ES2715191T3 (es) Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
ES2629453T3 (es) Codificador, descodificador y procedimiento de codificación
ES2733878T3 (es) Codificación mejorada de señales de audio digitales multicanales
ES2398627T3 (es) Aparato y procedimiento para calcular una cantidad de envolventes espectrales
US7904293B2 (en) Sub-band voice codec with multi-stage codebooks and redundant coding
ES2434251T3 (es) Método y aparato para generar una capa de mejora dentro de un sistema de codificación de audio de múltiples canales
ES2474915T3 (es) Dispositivo de codificación, dispositivo de decodificación y métodos correspondientes
JP4498677B2 (ja) 複数チャネル信号の符号化及び復号化
ES2329198T3 (es) Aparato para busqueda en el libro de codificacion fijo.
ES2746217T3 (es) Método de decodificación y dispositivo de decodificación
ES2303129T3 (es) Transcodificacion entre indices de diccionarios de multi-impulsos utilizados en la codificacion en compresion de señales digitales.
JPWO2007114290A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
JP5714002B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
ES2718935T3 (es) Método y codificador para la codificación conjunta de vectores de una señal de voz
ES2627410T3 (es) Aparato para codificar una señal de voz/sonido
ES2428572T3 (es) Dispositivo de codificación de audio y método de codificación de audio
JP6001451B2 (ja) 符号化装置及び符号化方法
JPH03273300A (ja) 音声符号化装置