ES2629453T3 - Codificador, descodificador y procedimiento de codificación - Google Patents

Codificador, descodificador y procedimiento de codificación Download PDF

Info

Publication number
ES2629453T3
ES2629453T3 ES08864773.0T ES08864773T ES2629453T3 ES 2629453 T3 ES2629453 T3 ES 2629453T3 ES 08864773 T ES08864773 T ES 08864773T ES 2629453 T3 ES2629453 T3 ES 2629453T3
Authority
ES
Spain
Prior art keywords
section
gain
coding
input signal
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES08864773.0T
Other languages
English (en)
Inventor
Tomofumi Yamanashi
Masahiro Oshikiri
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
III Holdings 12 LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by III Holdings 12 LLC filed Critical III Holdings 12 LLC
Application granted granted Critical
Publication of ES2629453T3 publication Critical patent/ES2629453T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un aparato de codificación que comprende: una primera sección de codificación que codifica una señal de entrada de voz/audio y genera una primera información codificada; y una sección de descodificación que descodifica la primera información codificada y genera una señal descodificada; caracterizado por una sección de decisión de la característica que analiza una estabilidad de una estructura armónica de la señal de entrada de voz/audio y genera una información característica armónica mostrando un resultado del análisis, en el que la estabilidad de la estructura armónica es un parámetro que muestra la periodicidad y variación de amplitud del espectro de señal de entrada; y una segunda sección de codificación que genera una segunda información codificada mediante la codificación de una diferencia de la señal descodificada con respecto a la señal de entrada de voz/audio, y que cambia un número de bits a asignar a una pluralidad de parámetros que forman la segunda información codificada en base a la información característica armónica.

Description

5
10
15
20
25
30
35
40
45
50
55
DESCRIPCION
Codificador, descodificador y procedimiento de codificacion Campo tecnico
La presente invencion se refiere a un aparato de codificacion, aparato de descodificacion y procedimiento de codificacion usado en un sistema de comunicacion que codifica y transmite senales.
Tecnica anterior
En la transmision de senales de voz/audio en, por ejemplo, un sistema de comunicacion por paquetes representado por un sistema de comunicacion por Internet y de comunicacion movil, se usan frecuentemente tecnicas de compresion/codificacion para mejorar la eficiencia de la transmision de las senales de voz/audio (por ejemplo senales de musica). Tambien, recientemente, hay una creciente necesidad de tecnicas de codificacion simplemente de senales de voz/audio a una baja tasa de bits y la codificacion de senales de voz/audio de una banda mas ancha.
Para satisfacer esta necesidad, hay una tecnica para la codificacion de senales de una banda de frecuencia ancha a una baja tasa de bits (por ejemplo, vease el Documento de Patente 1). De acuerdo con esta tecnica, la tasa de bits global se reduce dividiendo una senal de entrada en una senal de banda mas baja y una senal de banda mas alta y mediante la codificacion del espectro de entrada sustituyendo el espectro de la senal de banda mas alta con el espectro de la senal de banda mas baja.
Documento de Patente 1: traduccion japonesa de la solicitud PCT abierta a inspeccion publica N.° 2001-521648.
El documento WO 03/046891 (A1) describe un procedimiento y un aparato para la mejora de sistemas de codificacion de fuentes de audio que utilizan una reconstruccion de alta frecuencia (HFR). Utiliza un mecanismo de deteccion (703a) en el lado del codificador para evaluar que partes del espectro no seran reproducidas correctamente por el procedimiento HFR en el descodificador. La informacion sobre estas se codifica eficientemente (703b) y se envfa al descodificador, en el que se combina con la salida de la unidad HFR.
Divulgacion de la invencion
Problemas a ser resueltos por la invencion
Sin embargo, la tecnica de expansion de banda desvelada en el Documento de Patente 1 no tiene en cuenta la estructura armonica en la banda mas baja de un espectro de senal de entrada o la estructura armonica en la banda mas baja de un espectro descodificado. Por ejemplo, con la tecnica de expansion de banda anterior, el procesamiento de la expansion de banda se realiza sin identificar si una senal de entrada es una senal de audio o una senal de voz. Sin embargo, en general, comparado con una senal de audio, una senal de voz es probable que tenga una estructura armonica inestable y una envolvente espectral de una forma complicada.
Por lo tanto, si un numero igual de bits al numero de bits asignado a la envolvente espectral de una senal de audio se asigna a la envolvente espectral de una senal de voz para expandir la banda, la calidad de codificacion se degrada y, como resultado, la calidad del sonido de las senales descodificadas puede degradarse. Tambien, por el contrario, en un caso en el que la estructura armonica de una senal de entrada sea muy estable como una senal de audio, necesita asignarse un numero especialmente grande de bits para representar la estructura armonica. En resumen, para mejorar la calidad de sonido de senales descodificadas, es necesario conmutar un procesamiento espedfico para la expansion de banda de acuerdo con la estabilidad de la estructura armonica.
La FIG. 1 muestra caractensticas espectrales de dos senales de entrada entre las que una caractenstica espectral vana significativamente. En la FIG. 1, el eje horizontal representa la frecuencia y el eje vertical representa la amplitud espectral. La FIG. 1A muestra un espectro de periodicidad muy estable, mientras que la FIG. 1B muestra un espectro de periodicidad muy inestable. Aunque el Documento de Patente 1 no desvela espedficamente criterios de seleccion sobre que banda en el espectro de la banda mas baja se usa para generar el espectro de banda mas alta, el procedimiento de busqueda de la parte mas similar al espectro de banda mas alta a partir del espectro de banda mas baja en cada trama, se considera que es el procedimiento mas comun. En este caso, con un procedimiento convencional, tras la generacion del espectro de banda mas alta mediante una tecnica de expansion de banda, el procesamiento de la expansion de banda se realiza en el mismo esquema (por ejemplo, el mismo procedimiento de busqueda de similitud o el mismo procedimiento de cuantificacion de la envolvente del espectro), sin identificar el espectro de una senal de entrada de referencia. Sin embargo, el espectro en la FIG. 1A tiene una periodicidad muy estable en comparacion con el espectro de la FIG. 1B y, en consecuencia, tras la realizacion de la expansion de banda usando el espectro de la FIG. 1A, la calidad del sonido de una senal descodificada se degrada gravemente a menos que las posiciones de los picos y valles del espectro de banda mas alta se codifiquen adecuadamente. Esto es, en este caso, es necesario incrementar la cantidad de informacion sobre que banda se usa en el espectro de banda mas baja para generar el espectro de la banda mas alta. Por el contrario, tras la realizacion de la expansion de banda usando el espectro de la FIG. 1B, la estructura armonica del espectro no es tan importante y no tiene una influencia significativa sobre la calidad del sonido de una senal descodificada.
Convencionalmente, existe un problema porque se aplica la expansion de banda con un procedimiento comun incluso a senales de entrada que tienen caractensticas espectrales significativamente diferentes y por lo tanto no es posible proporcionar una senal descodificada de calidad suficientemente alta.
Es por lo tanto un objeto de la presente invencion proporcionar un aparato de codificacion, aparato de 5 descodificacion y procedimiento de codificacion para suprimir la degradacion de la calidad de senales descodificadas debido a la expansion de banda mediante la realizacion de la expansion de banda teniendo en cuenta la estructura armonica en la banda mas baja de un espectro de senal de entrada o la estructura armonica en la banda mas baja de un espectro descodificado.
Sumario de la invencion
10 Los problemas y desventajas anteriores de la tecnica anterior se resuelven mediante la presente invencion tal como se reivindica en las reivindicaciones independientes. Realizaciones ventajosas y preferidas de la invencion se definen mediante reivindicaciones dependientes.
Medios para resolver el problema
El aparato de codificacion de la presente invencion emplea una configuracion que tiene: una primera seccion de 15 codificacion que codifica una senal de entrada y genera una primera informacion codificada; una seccion de descodificacion que descodifica la primera informacion codificada y genera una senal descodificada; una seccion de decision de la caractenstica que analiza una estabilidad de una estructura armonica de la senal de entrada y genera una informacion caractenstica armonica mostrando un resultado del analisis; y una segunda seccion de codificacion que genera una segunda informacion codificada mediante la codificacion de una diferencia de la senal descodificada 20 con respecto a la senal de entrada y, en base a la informacion caractenstica armonica, cambia un numero de bits a asignar a una pluralidad de parametros que forman la segunda informacion codificada.
El aparato de descodificacion de la presente invencion emplea una configuracion que tiene: una seccion de recepcion que recibe la primera informacion codificada adquirida mediante codificacion de una senal de entrada en un aparato de codificacion, segunda informacion codificada adquirida mediante la codificacion de una diferencia 25 entre la senal de entrada y una senal descodificada que descodifica la primera informacion codificada, y una
informacion caractenstica armonica generada en base a un analisis resultado de analizar una estabilidad de una estructura armonica de la senal de entrada; una primera seccion de descodificacion que descodifica una primera capa usando la primera informacion codificada y adquiere una primera senal descodificada; y una segunda seccion de descodificacion que descodifica una segunda capa usando la segunda informacion codificada y la primera senal 30 descodificada, y adquiere una segunda senal descodificada, en el que la segunda seccion de descodificacion descodifica la segunda capa usando una pluralidad de parametros que forman la segunda informacion codificada y al que se asigna un numero de bits en base a la informacion caractenstica armonica en el aparato de codificacion.
El procedimiento de codificacion de la presente invencion incluye: una primera etapa de codificacion para codificar una senal de entrada y generar una primera informacion codificada; una etapa de descodificacion para descodificar 35 la primera informacion codificada y generar una senal descodificada; una etapa de decision de la caractenstica para
analizar una estabilidad de una estructura armonica de la senal de entrada y generar informacion caractenstica armonica que muestra un resultado del analisis; y una segunda etapa de codificacion para generar una segunda informacion codificada mediante la codificacion de una diferencia de la segunda senal descodificada con respecto a la senal de entrada y, en base a la informacion caractenstica armonica, cambiar un numero de bits para asignar a 40 una pluralidad de parametros que forman la segunda informacion codificada.
Efecto ventajoso de la invencion
De acuerdo con la presente invencion, es posible proporcionar senales descodificadas de alta calidad a partir de varias senales de entrada que tengan estructuras armonicas significativamente diferentes.
Breve descripcion de los dibujos
45 La FIG. 1 muestra caractensticas espectrales en una tecnica de expansion de banda convencional;
la FIG. 2 es un diagrama de bloques que muestra la configuracion de un sistema de comunicacion que incluye un aparato de codificacion y un aparato de descodificacion de acuerdo con la realizacion 1 de la presente invencion; la FIG. 3 es un diagrama de bloques que muestra los componentes principales del interior de un aparato de codificacion mostrado en la FIG. 2;
50 la FIG. 4 es un diagrama de bloques que muestra los componentes principales del interior de una seccion de codificacion de la primera capa mostrada en la FIG. 3;
la FIG. 5 es un diagrama de bloques que muestra los componentes principales del interior de una seccion de descodificacion de la primera capa mostrada en la FIG. 3;
la FIG. 6 es un diagrama de flujo que muestra las etapas en el procedimiento de generar informacion 55 caractenstica en una seccion de decision de la caractenstica mostrada en la FIG. 3;
la FIG. 7 es un diagrama de bloques que muestra los componentes principales del interior de una seccion de codificacion de la segunda capa mostrada en la FIG. 3;
5
10
15
20
25
30
35
40
45
50
55
la FIG. 8 ilustra un procesamiento de filtrado espedfico en una seccion de filtrado mostrada en la FIG. 7;
la FIG. 9 es un diagrama de flujo que muestra las etapas en el procedimiento de busqueda de un coeficiente de
tono optimo T' en una seccion de busqueda mostrada en la FIG. 7;
la FIG. 10 es un diagrama de bloques que muestra los componentes principales del interior de un aparato de descodificacion mostrado en la FIG. 2;
la FIG. 11 es un diagrama de bloques que muestra los componentes principales del interior de una seccion de descodificacion de la segunda capa mostrada en la FIG. 10;
la FIG. 12 es un diagrama de bloques que muestra los componentes principales del interior de una variacion de un aparato de codificacion mostrado en la FIG. 3;
la FIG. 13 es un diagrama de flujo que muestra las etapas en el procedimiento de generar informacion caractenstica en una seccion de decision de la caractenstica mostrada la FIG. 12;
la FIG. 14 es un diagrama de bloques que muestra los componentes principales del interior de un aparato de codificacion de acuerdo con la realizacion 2 de la presente invencion; y
la FIG. 15 es un diagrama de flujo que muestra las etapas en el procedimiento de generar informacion caractenstica en una seccion de decision de la caractenstica mostrada en la FIG. 14.
Mejor modo de llevar a cabo la invencion
Un ejemplo de un esquema de la presente invencion es que, en un caso en el que se tiene en cuenta la diferencia en la estructura armonica entre la banda mas alta de una senal de entrada y una de entre la banda mas baja de un espectro de senal descodificada y la banda mas baja de la senal de entrada, y donde esta diferencia es igual a o mayor que un nivel predeterminado, es posible proporcionar senales descodificadas de alta calidad a partir de varias senales de entrada que tengan estructuras armonicas significativamente diferentes, mediante la conmutacion del procedimiento de codificacion de datos espectrales de la banda mas alta de una senal de banda ancha en base a datos espectrales de la banda mas baja de la senal de banda ancha (es decir, procedimiento de expansion de banda).
Se explicaran a continuacion en detalle realizaciones de la presente invencion con referencia a los dibujos adjuntos. Tambien, se explicaran el aparato de codificacion y el aparato de descodificacion de acuerdo con la presente invencion usando un aparato de codificacion de voz y un aparato de descodificacion de voz como un ejemplo.
(Realizacion 1)
La FIG. 2 es un diagrama de bloques que muestra la configuracion de un sistema de comunicacion que incluye un aparato de codificacion y un aparato de descodificacion de acuerdo con la realizacion 1 de la presente invencion. En la FIG. 2, el sistema de comunicacion proporciona un aparato de codificacion y un aparato de descodificacion, que pueden comunicar entre sf a traves de un trayecto de propagacion.
El aparato 101 de codificacion divide una senal de entrada cada N muestras (en donde N es un numero natural) y realiza la codificacion por trama compuesta de N muestras. En este caso, una senal de entrada a ser codificada se representa por Xn (n = 0, ..., N-1). En este caso, n representa el (n+1)-esimo elemento de senal de la senal de entrada dividida cada N muestras. La informacion de entrada codificada (es decir la informacion codificada) se transmite al aparato 103 de descodificacion a traves de un canal 102 de transmision.
El aparato 103 de descodificacion recibe y descodifica la informacion codificada transmitida desde el aparato 101 de codificacion a traves del canal 102 de transmision, y proporciona una senal de salida.
La FIG. 3 es un diagrama de bloques que muestra los componentes principales del interior del aparato 101 de codificacion mostrado en la FIG. 2.
Cuando la frecuencia de muestreo de una senal de entrada es SRentrada, la seccion 201 de procesamiento de reduccion de muestreo reduce la frecuencia de muestreo de la senal de entrada desde SRentrada a SRbase (SRbase < SRentrada), y produce la salida de la senal de entrada de muestreo reducido hacia la primera seccion 202 de codificacion de capa como una senal de entrada de muestreo reducido.
La seccion 202 de codificacion de la primera capa codifica la senal de entrada de muestreo reducido recibida como entrada desde la seccion 201 de procesamiento de muestreo reducido usando, por ejemplo, un procedimiento de codificacion de voz de tipo CELP (Prediccion Lineal con Excitacion por Codigo), y genera una primera capa de informacion codificada. Adicionalmente, la seccion 202 de codificacion de la primera capa produce la salida de la primera capa de informacion codificada a la seccion 203 de descodificacion de la primera capa y a la seccion 208 de multiplexado de informacion codificada y produce la salida de una ganancia de excitacion adaptativa de cuantificacion incluida en la primera capa de informacion codificada hacia la seccion 206 de decision de la caractenstica.
La seccion 203 de descodificacion de la primera capa descodifica la primera capa de informacion codificada recibida como entrada desde la seccion 202 de codificacion de la primera capa usando, por ejemplo, un procedimiento de descodificacion de voz de tipo CELP, para generar una senal descodificada de la primera capa, y produce la salida de la senal descodificada de la primera capa generada hacia la seccion 204 de procesamiento de muestreo
5
10
15
20
25
30
35
40
aumentado. Tambien, la seccion 203 de descodificacion de la primera capa se describira posteriormente en detalle.
La seccion 204 de procesamiento de muestreo aumentado incrementa las muestras de la senal descodificada de la primera capa recibida como entrada desde la seccion 203 de descodificacion de la primera capa desde SRbase a SRentrada, y produce la salida de la senal descodificada de la primera capa de muestreo aumentado hacia la seccion 205 de procesamiento de transformada ortogonal como una senal descodificada de la primera capa de muestreo aumentado.
La seccion 205 de procesamiento de transformada ortogonal incorpora memorias intermedias buf 1n y buf 2n (n = 0, ..., N-1) y aplica la transformada de coseno discreta modificada (“MDCT”) a la senal de entrada Xn y a la primera capa de la senal yn descodificada de muestreo aumentado recibida como entrada desde la seccion 204 de procesamiento de muestreo aumentado.
A continuacion, como para el procesamiento de transformada ortogonal en la seccion 205 de procesamiento de transformada ortogonal, se explicaran las etapas de calculo y la salida de datos hacia las memorias intermedias internas.
Primero, la seccion 205 de procesamiento de transformada ortogonal inicializa las memorias intermedias buf 1n y buf 2n usando 0 como el valor inicial de acuerdo con la ecuacion 1 y la ecuacion 2.
[1]
[2]
buf 1n = 0 (n = 0, ■■■, N-1) .(Ecuacion 1)
buf 2n = 0 (n = 0, ■■■, N-1) .(Ecuacion 2)
A continuacion, la seccion 205 de procesamiento de transformada ortogonal aplica la MDCT a la senal de entrada Xn y a la primera capa de la senal yn descodificada de acuerdo con las ecuaciones 3 y 4 siguientes, y calcula los coeficientes MDCT S2(k) de la senal de entrada (de aqrn en adelante “espectro de entrada”) y los coeficientes MDCT S1(k) de la primera capa de la senal yn descodificada de muestreo aumentado (de aqrn en adelante “primera capa del espectro descodificado”).
[3]
S2(k) = y'n cos| |-(2n+l+W)(2fe+l)n,./ _ Q L 4W J( , ■, n-1) .(Ecuacion 3)
[4]
S1(k) = y'n cos| |-(2n+l+W)(2fe+l)n,./ _ Q L 4N J( , ■, n-1) .(Ecuacion 4)
En este caso, k es el mdice de cada muestra en una trama. La seccion 205 de procesamiento de transformada ortogonal calcula Xn', que es un vector que combina la senal de entrada Xn y la memoria intermedia buf 1n de acuerdo con la ecuacion 5 siguiente. Adicionalmente, la seccion 205 de procesamiento de transformada ortogonal calcula yn', que es un vector que combina la primera capa de la senal yn descodificada de muestreo aumentado y la memoria intermedia buf 2n, de acuerdo con la ecuacion 6 siguiente.
[5]
[6]
buf1„(n = 0,-,tf-1)
Xn ixn_N(n = N,-,2N -1)
buf2n(n = 0,-,W-1)
7n = {yn-N(n = N,-,2N-1)
.(Ecuacion 5)
.(Ecuacion 6)
A continuacion, la seccion 205 de procesamiento de transformada ortogonal actualiza las memorias intermedias buf 1 n y buf 2n de acuerdo con la ecuacion 7 y la ecuacion 8.
[7]
[8]
buf 1 n = Xn (n = 0, ■■■, N-1) .(Ecuacion 7)
buf2n = yn (n = 0, ■■■, N-1) .(Ecuacion 8)
5
10
15
20
25
30
35
40
45
50
55
Adicionalmente, la seccion 205 de procesamiento de transformada ortogonal produce la salida del espectro S2(k) de entrada y del primera capa del espectro S1(k) descodificado hacia la seccion 207 de codificacion de la segunda capa.
La seccion 206 de decision de la caractenstica genera informacion caractenstica de acuerdo con el valor de la ganancia de excitacion adaptativa de cuantificacion incluida en la primera capa de informacion codificada recibida como entrada desde la seccion 202 de codificacion de la primera capa, y produce la salida de la informacion caractenstica hacia la seccion 207 de codificacion de la segunda capa. La seccion 206 de decision de la caractenstica se describira posteriormente en detalle.
En base a la informacion caractenstica recibida como entrada desde la seccion 206 de decision de la caractenstica, la seccion 207 de codificacion de la segunda capa genera una segunda capa de informacion codificada usando el espectro S2(k) de entrada y la primera capa del espectro S1(k) descodificado recibida como entrada desde la seccion 205 de procesamiento de transformada ortogonal, y produce la salida de la segunda capa de informacion codificada generada hacia la seccion 208 de multiplexado de informacion codificada. La seccion 207 de codificacion de la segunda capa se describira posteriormente en detalle.
La seccion 208 de multiplexado de informacion codificada multiplexa la primera capa de informacion codificada recibida como entrada desde la seccion 202 de codificacion de la primera capa y la segunda capa de informacion codificada recibida como entrada desde la seccion 207 de codificacion de la segunda capa, anade, si es necesario, un codigo de error de transmision, y otros similares, a la informacion codificada multiplexada y produce la salida del resultado hacia el canal de transmision 102 como informacion codificada.
La FIG. 4 es un diagrama de bloques que muestra los componentes principales del interior de la seccion 202 de codificacion de la primera capa.
En la FIG. 4, la seccion 301 de procesamiento realiza un procesamiento de filtrado paso alto para eliminar la componente de CC, un procesamiento de conformado de la forma de onda o procesamiento de pre-enfasis para mejora del rendimiento del procesamiento de codificacion posterior, sobre la senal de entrada, y produce la salida de la senal (Xin) sometida a estos procesamientos hacia la seccion 302 de analisis LPC (Coeficiente de Prediccion Lineal) y la seccion 305 de suma.
La seccion 302 de analisis LPC realiza un analisis predictivo lineal usando la Xin recibida como entrada desde la seccion 301 de pre-procesamiento, y produce la salida del resultado del analisis (coeficiente de analisis predictivo lineal) hacia la seccion 303 de cuantificacion LPC.
La seccion 303 de cuantificacion LPC realiza el procesamiento de cuantificacion del coeficiente de prediccion lineal (LPC) recibido como entrada desde la seccion 302 de analisis LPC, produce la salida del LPC cuantificado hacia el filtro 304 de smtesis y produce un codigo (L) que representa el LPC cuantificado hacia la seccion 314 de multiplexado.
El filtro 304 de smtesis genera una senal sintetizada mediante la realizacion de una smtesis de filtro de una excitacion recibida como entrada desde la seccion 311 de suma (descrita a continuacion) usando un coeficiente de filtro basado en el LPC cuantificado recibido como entrada desde la seccion 303 de cuantificacion LPC, y produce la salida de la senal sintetizada hacia la seccion 305 de suma.
La seccion 305 de suma calcula una senal de error mediante la inversion de la polaridad de la senal sintetizada recibida como entrada desde el filtro 304 de smtesis y anade la senal sintetizada con una polaridad inversa a la Xin recibida como entrada desde la seccion 301 de pre-procesamiento, y produce la salida de la senal de error a la seccion 312 de ponderacion perceptual.
El libro de codigos 306 de excitacion adaptativa almacena excitaciones enviadas en el pasado desde la seccion 311 de suma en una memoria intermedia, extrae una trama de muestras desde una excitacion pasada especificada mediante una senal recibida como entrada desde la seccion 313 de determinacion de parametros (descrita a continuacion) como un vector de excitacion adaptativa, y produce la salida de este vector hacia la seccion 309 de multiplicacion.
La seccion 307 de generacion de ganancia de cuantificacion produce la salida de una ganancia de excitacion adaptativa de cuantificacion y una ganancia de excitacion fija de cuantificacion, especificadas por una senal recibida como entrada desde la seccion 313 de determinacion de parametros, a la seccion 309 de multiplicacion y a la seccion 310 de multiplicacion, respectivamente.
El libro de codigos 308 de excitacion fija produce la salida de un vector de excitacion de impulso que tiene una forma especificada por una senal recibida como entrada desde la seccion 313 de determinacion de parametros, hacia la seccion 310 de multiplicacion como un vector de excitacion fija. En este caso, un resultado de la multiplicacion del vector de excitacion de impulso por un vector de dispersion puede enviarse igualmente a la seccion 310 de multiplicacion como un vector de excitacion fija.
La seccion 309 de multiplicacion multiplica el vector de excitacion adaptativa recibido como entrada desde el libro de
5
10
15
20
25
30
35
40
45
50
55
codigos 306 de excitacion adaptativa por la ganancia de excitacion adaptativa de cuantificacion recibida como entrada desde la seccion 307 de generacion de ganancia de cuantificacion, y produce la salida del resultado hacia la seccion 311 de suma. Tambien, la seccion 310 de multiplicacion multiplica el vector de excitacion fija recibido como entrada desde el libro de codigos 308 de excitacion fija por la ganancia de excitacion fija de cuantificacion recibida como entrada desde la seccion 307 de generacion de ganancia de cuantificacion, y produce la salida del resultado hacia la seccion 311 de suma.
La seccion 311 de suma anade el vector de excitacion adaptativa multiplicado por la ganancia recibida como entrada desde la seccion 309 de multiplicacion y el vector de excitacion fija multiplicado por la ganancia recibida como entrada desde la seccion 310 de multiplicacion, y produce la salida de la excitacion del resultado de la suma hacia el filtro 304 de smtesis y hacia el libro de codigos 306 de excitacion adaptativa. La excitacion enviada al libro de codigos 306 de excitacion adaptativa se almacena en la memoria intermedia del libro de codigos 306 de excitacion adaptativa.
La seccion 312 de ponderacion perceptual realiza una ponderacion perceptual de la senal de error recibida como entrada desde la seccion 305 de suma y produce la salida del resultado hacia la seccion 313 de determinacion del parametro como distorsion de codificacion.
La seccion 313 de determinacion de parametros selecciona el vector de excitacion adaptativa, el vector de excitacion fija y la ganancia de cuantificacion que minimizan la distorsion de codificacion recibida como entrada desde la seccion 312 de ponderacion perceptual, desde el libro de codigos 306 de excitacion adaptativa, el libro de codigos 308 de excitacion fija y la seccion 307 de generacion de ganancia de cuantificacion, respectivamente, y produce la salida de un codigo (A) del vector de excitacion adaptativa, un codigo (F) del vector de excitacion fija y un codigo (G) de la ganancia de cuantificacion que muestra los resultados de la seleccion, a la seccion 314 de multiplexado. Adicionalmente, la seccion 313 de determinacion de parametros produce la salida de la ganancia (G_A) de excitacion adaptativa de cuantificacion incluida en el codigo (G) de ganancia de cuantificacion para su salida hacia la seccion 314 de multiplexado, a la seccion 206 de decision de la caractenstica.
La seccion 314 de multiplexado multiplexa el codigo (L) que muestra el LPC cuantificado recibido como entrada desde la seccion 303 de cuantificacion de LPC, el codigo (A) del vector de excitacion adaptativa, el codigo (F) del vector de excitacion fija y el codigo (G) de la ganancia de cuantificacion recibido como entrada desde la seccion 313 de determinacion de parametros, y produce la salida del resultado hacia la seccion 203 de descodificacion de la primera capa como la primera capa de informacion codificada.
La FIG. 5 es un diagrama de bloques que muestra los componentes principales del interior de la seccion 203 de descodificacion de la primera capa.
En la FIG. 5, la seccion 401 de demultiplexado demultiplexa la primera capa de informacion codificada recibida como entrada desde la seccion 202 de codificacion de la primera capa, en codigos individuales (L), (A), (G) y (F). El codigo LPC separado (L) se envfa a la seccion 402 de descodificacion de LPC, el codigo (A) del vector de excitacion adaptativa separado se envfa al libro de codigos 403 de excitacion adaptativa, el codigo (G) de ganancia de cuantificacion separada se envfa a la seccion 404 de generacion de la ganancia de cuantificacion y el codigo (F) del vector de excitacion fija separado se envfa al libro de codigos 405 de excitacion fija.
La seccion 402 de descodificacion LPC descodifica el LPC cuantificado a partir del codigo (L) recibido como entrada desde la seccion 401 de demultiplexado, y produce la salida del LPC cuantificado descodificado hacia el filtro 409 de smtesis.
El libro de codigos 403 de excitacion adaptativa extrae una trama de muestras de una excitacion pasada especificada por el codigo (A) del vector de excitacion adaptativa recibido como entrada desde la seccion 401 de demultiplexado, como un vector de excitacion adaptativa, y produce la salida del vector de excitacion adaptativa hacia la seccion 406 de multiplicacion.
La seccion 404 de generacion de ganancia de cuantificacion descodifica una ganancia de excitacion adaptativa de cuantificacion y una ganancia de excitacion fija de cuantificacion especificada por el codigo (G) de ganancia de cuantificacion recibido como entrada desde la seccion 401 de demultiplexado, produce la salida de la ganancia de excitacion adaptativa de cuantificacion hacia la seccion 406 de multiplicacion y la salida de la ganancia de excitacion fija de cuantificacion hacia la seccion 407 de multiplicacion.
El libro de codigos 405 de excitacion fija genera un vector de excitacion fija especificado por el codigo (F) del vector de excitacion fija recibido como entrada desde la seccion 401 de demultiplexado, y produce la salida del vector de excitacion fija hacia la seccion 407 de multiplicacion.
La seccion 406 de multiplicacion multiplica el vector de excitacion adaptativa recibido como entrada desde el libro de codigos 403 de excitacion adaptativa por la ganancia de excitacion adaptativa de cuantificacion recibida como entrada desde la seccion 404 de generacion de ganancia de cuantificacion, y produce la salida del resultado hacia la seccion 408 de suma. Tambien, la seccion 407 de multiplicacion multiplica el vector de excitacion fija recibido como entrada desde el libro de codigos 405 de excitacion fija por la ganancia de excitacion fija de cuantificacion recibida
5
10
15
20
25
30
35
40
45
50
55
como entrada desde la seccion 404 de generacion de ganancia de cuantificacion, y produce la salida del resultado hacia la seccion 408 de suma.
La seccion 408 de suma genera una excitacion mediante la suma del vector de excitacion adaptativa multiplicado por la ganancia recibida como entrada desde la seccion 406 de multiplicacion y el vector de excitacion fija multiplicado por la ganancia recibida como entrada desde la seccion 407 de multiplicacion, y produce la salida de la excitacion al filtro 409 de smtesis y hacia el libro de codigos 403 de excitacion adaptativa.
El filtro 409 de smtesis realiza una smtesis de filtro de la excitacion recibida como entrada desde la seccion 408 de suma usando el coeficiente de filtro descodificado en la seccion 402 de descodificacion LPC, y produce la salida de la senal sintetizada a la seccion 410 de pos-procesamiento.
La seccion 410 de pos-procesamiento aplica un procesamiento para la mejora de la calidad subjetiva de la voz tal como enfasis de forma y enfasis de tono y el procesamiento para la mejora de la calidad subjetiva del ruido fijo, a la senal recibida como entrada desde el filtro 409 de smtesis, y produce la salida del resultado a la seccion 204 de procesamiento de aumento de muestreo como una senal descodificada de la primera capa.
La FIG. 6 es un diagrama de flujo que muestra las etapas en el procedimiento de generacion de informacion caractenstica en la seccion 206 de decision de la caractenstica. Aqm, una etapa se denominara como “ST” en la explicacion que sigue.
Primero, la seccion 206 de decision de la caractenstica recibe como entrada la ganancia G_A de excitacion adaptativa de cuantificacion desde la seccion 313 de determinacion de parametros de la seccion 202 de codificacion de la primera capa (ST 1010). A continuacion, la seccion 206 de decision de la caractenstica decide si la ganancia G_A de excitacion adaptativa de cuantificacion es o no menor que un umbral TH (ST 1020). Si se decide que G_A es menor que TH en ST 1020 (“SP’ en ST 1020), la seccion 206 de decision de la caractenstica fija el valor de informacion caractenstica a “0” (ST 1030). Por el contrario, si se decide que G_A es igual a o mayor que TH in ST 1020 (“NO” en ST 1020), la seccion 206 de decision de la caractenstica fija el valor de informacion caractenstica a “1” (ST 1040). De esa forma, la informacion caractenstica usa al valor “1” para mostrar que la estabilidad de la estructura armonica del espectro de entrada es igual a o mayor que un nivel predeterminado, o usa al valor “0” para mostrar que la estabilidad de la estructura armonica de un espectro de entrada es mas bajo que un nivel predeterminado. A continuacion, la seccion 206 de decision de la caractenstica produce la salida de la informacion caractenstica hacia la seccion 207 de codificacion de la segunda capa (ST 1050).
En este caso, la estabilidad de la estructura armonica es un parametro que muestra la periodicidad y la variacion de amplitud del espectro (es decir los niveles de picos y valles). Por ejemplo, cuando la periodicidad se hace clara o la amplitud se hace grande, la estructura armonica es estable.
La FIG. 7 es un diagrama de bloques que muestra los componentes principales del interior de la seccion 207 de codificacion de la segunda capa.
La seccion 207 de codificacion de la segunda capa se proporciona con una seccion 501 de fijacion de estado del filtro, seccion 502 de filtrado, seccion 503 de busqueda, seccion 504 de fijacion de coeficiente de tono, seccion 505 de codificacion de ganancia y seccion 506 de multiplexado. Estos componentes realizan las operaciones siguientes.
La seccion 501 de fijacion de estado del filtro fija el espectro S1(k) [0<k<FL] descodificado de la primera capa recibido como entrada desde la seccion 205 de procesamiento de transformada ortogonal, como un estado de filtro usado en la seccion 502 de filtrado. Como el estado interno del filtro (es decir el estado de filtro), el espectro S1(k) descodificado de la primera capa se almacena en la banda 0<k<FL del espectro S(k) en toda la banda de frecuencia 0<k<FH en la seccion 502 de filtrado.
La seccion 502 de filtrado tiene un filtro de tono multi-toma (es decir un filtro que tiene mas de una toma), filtra el espectro descodificado de la primera capa en base al estado del filtro establecido en la seccion 501 de fijacion de estado del filtro y el coeficiente de tono recibido como entrada desde la seccion 504 de fijacion del coeficiente de tono, y calcula el valor estimado S2'(k) [FL<k<FH] del espectro de entrada (de aqm en adelante “espectro estimado”). Adicionalmente, la seccion 502 de filtrado produce la salida del espectro S2'(k) estimado hacia la seccion 503 de busqueda. El procesamiento de filtrado en la seccion 502 de filtrado se describira posteriormente en detalle.
La seccion 503 de busqueda calcula la similitud entre la banda mas alta FL<k<FH del espectro S2(k) de entrada recibido como entrada desde la seccion 205 de procesamiento de transformada ortogonal y el espectro S2'(k) estimado recibido como entrada desde la seccion 502 de filtrado. La similitud se calcula mediante, por ejemplo, calculos de correlacion. El procesamiento en la seccion 502 de filtrado, el procesamiento en la seccion 503 de busqueda y el procesamiento en la seccion que 504 de fijacion del coeficiente de tono forman un bucle cerrado. En este bucle cerrado, la seccion 503 de busqueda calcula la similitud para cada coeficiente de tono mediante el cambio de modo variado del coeficiente de tono T recibido como entrada desde la seccion 504 de fijacion del coeficiente de tono a la seccion 502 de filtrado. De estas similitudes calculadas, la seccion 503 de busqueda produce la salida del coeficiente de tono que maximiza la similitud, es decir, el coeficiente de tono T' optimo, hacia la seccion 506 de multiplexado. Adicionalmente, la seccion 503 de busqueda produce la salida del espectro S2'(k) estimado para el
5
10
15
20
25
30
35
40
45
50
coeficiente de tono T' optimo hacia la seccion 505 de codificacion de ganancia.
La seccion 504 de fijacion del coeficiente de tono conmuta un intervalo de busqueda del coeficiente de tono T' optimo en base a informacion caractenstica recibida como entrada desde la seccion 206 de decision de la caractenstica. Adicionalmente, la seccion 504 de fijacion del coeficiente de tono cambia el coeficiente de tono T poco a poco en el intervalo de busqueda bajo el control de la seccion 503 de busqueda, y produce la salida secuencialmente del coeficiente de tono T hacia la seccion 502 de filtrado.
Por ejemplo, la seccion 504 de fijacion del coeficiente de tono fija un intervalo de busqueda desde Tmin a Tmax0 cuando el valor de la informacion caractenstica es “0”, y fija un intervalo de busqueda desde Tmin a Tmaxi cuando el valor de la informacion caractenstica es “1”. En este caso, Tmax0 es menor que Tmaxi. Esto es, cuando el valor de la informacion caractenstica es “1”, la seccion 504 de fijacion del coeficiente de tono incrementa el numero de bits a asignar al coeficiente de tono T mediante la conmutacion del intervalo de busqueda para el coeficiente de tono T' optimo a un intervalo de busqueda mas amplio. Tambien, cuando el valor de la informacion caractenstica es “0”, la seccion 504 de fijacion del coeficiente de tono disminuye el numero de bits a asignar al coeficiente de tono T mediante la conmutacion del intervalo de busqueda para el coeficiente de tono T' optimo a un intervalo de busqueda mas estrecho.
La seccion 505 de codificacion de ganancia calcula la informacion de ganancia de la banda mas alta FL<k<FH del espectro S2(k) de entrada recibido como entrada desde la seccion 205 de procesamiento de transformada ortogonal, en base a informacion caractenstica recibida como entrada desde la seccion 206 de decision de la caractenstica. Para ser mas espedfico, la seccion 505 de codificacion de ganancia divide la banda de frecuencias FL<k<FH en J sub-bandas y calcula la potencia espectral por sub-banda del espectro S2(k) de entrada. En este caso, la potencia espectral B(j) de la j-esima sub-banda se representa por la ecuacion 9 a continuacion.
[9]
B(j) = -(Ecuacion 9)
En la ecuacion 9, BL(j) representa la frecuencia mas baja en la j-esima sub-banda y BH(j) representa la frecuencia mas alta en la j-esima sub-banda. Adicionalmente, de modo similar, la seccion 505 de codificacion de ganancia calcula la potencia espectral B'(j) por sub-banda del espectro S2'(k) estimado recibido como entrada desde la seccion 503 de busqueda, de acuerdo con la ecuacion 10 siguiente. A continuacion, la seccion 505 de codificacion de ganancia calcula la variacion V(j) por sub-banda de un espectro estimado para el espectro S2(k) de entrada, de acuerdo con la ecuacion 11 siguiente.
[10]
B’(j) = iBBBLo^'Cfc)2 ■■■(Ecuacion 10)
[11]
V(j) =
imagen1
■ (Ecuacion 11)
Adicionalmente, la seccion 505 de codificacion de ganancia conmuta los libros de codigos usados en la codificacion de la variacion V(j) de acuerdo con el valor de la informacion caractenstica, codifica la variacion V(j) y produce la salida de un mdice asociado con la variacion Vq(j) codificada a la seccion 506 de multiplexado. La seccion 505 de codificacion de ganancia conmuta un libro de codigos a un libro de codigos de tamano de libro de codigos representado por “Tamano0” cuando el valor de la informacion caractenstica es “0”, o conmuta un libro de codigos a un libro de codigos de tamano de libro de codigos representado por “Tamano1” cuando el valor de la informacion caractenstica es “1”, y codifica la variacion V(j). En este caso, Tamano1 es menor que Tamano0. Esto es, cuando el valor de la informacion caractenstica es “0”, la seccion 505 de codificacion de ganancia incrementa el numero de bits a asignar para la codificacion de la variacion de ganancia V(j) mediante la conmutacion del libro de codigos usado para codificar la variacion de ganancia V(j) a un libro de codigos de un tamano mayor (es decir, un libro de codigos con un numero mayor de entradas de vectores de codigo). Tambien, cuando el valor de la informacion caractenstica es “1”, la seccion 505 de codificacion de ganancia disminuye el numero de bits a asignar para codificar la variacion de ganancia V(j) mediante la conmutacion del libro de codigos usado para codificar la variacion de ganancia V(j) a un libro de codigos de un tamano mas pequeno. En este caso, si la variacion del numero de bits a asignar para la variacion de ganancia V(j) en la seccion 505 de codificacion de ganancia se hace igual a la variacion del numero de bits a asignar al coeficiente de tono T en la seccion 504 de fijacion del coeficiente de tono, es posible fijar el numero de bits usado en la codificacion en la seccion 207 de codificacion de la segunda capa. Por ejemplo, cuando el valor de la informacion caractenstica es “0”, se requiere realizar el incremento de bits para asignar a la variacion de ganancia V(j) en la seccion 505 de codificacion de ganancia igual a la disminucion de bits a asignar al coeficiente de tono T en la seccion 504 de fijacion del coeficiente de tono.
La seccion 506 de multiplexado produce una segunda capa de informacion codificada mediante el multiplexado del
5
10
15
20
25
30
35
40
45
coeficiente de tono T' optimo recibido como entrada desde la seccion 503 de busqueda, el mdice de variacion V(j) recibido como entrada desde la seccion 505 de codificacion de ganancia y la informacion caractenstica recibida como entrada desde la seccion 206 de decision de la caractenstica, y produce la salida del resultado hacia la seccion 208 de multiplexado de informacion codificada. En este caso, es igualmente posible introducir directamente T', V(j) y la informacion caractenstica en la seccion 208 de multiplexado de informacion codificada y multiplexarla con la primera capa de informacion codificada en la seccion 208 de multiplexado de informacion codificada.
A continuacion, se explicara en detalle el procesamiento de filtrado en la seccion 502 de filtrado usando la FIG. 8.
La seccion 502 de filtrado genera el espectro de la banda FL<k<FH usando el coeficiente de tono T recibido como entrada desde la seccion 504 de fijacion del coeficiente de tono. La funcion de transferencia en la seccion 502 de filtrado se representa mediante la ecuacion 12 siguiente.
[12]
P(Z) = i y* -(Ecuacion 12)
1 Li=-MPiz
En la ecuacion 12, T representa los coeficientes de tono dados desde la seccion 504 de fijacion del coeficiente de tono, y pi representa los coeficientes de filtro almacenados en el interior por adelantado. Por ejemplo, cuando el numero de tomas es de tres, los candidatos a coeficientes de filtro son (p-1, p0, pi) = (0,1, 0,8, 0,2). Ademas, son posibles los valores (p-1, p0, p1) = (0,2, 0,6, 0,2) o (0,3, 0,4, 0,3). Tambien, M es 1 en la ecuacion 12. Tambien, M representa el mdice relativo al numero de tomas.
La banda 0<k<FL en el espectro S(k) de toda la banda de frecuencias en la seccion 502 de filtrado almacena la primera capa del espectro S1(k) descodificado como el estado interno del filtro (es decir, el estado del filtro).
La banda FL<k<FH de S(k) almacena el espectro S2'(k) estimado mediante procesamiento de filtrado de las siguientes etapas. Esto es, el espectro S(k-T) de una frecuencia que sea mas baja que k en T, se asigna basicamente a S2'(k). En este caso, para mejorar el nivel de alisado del espectro, de hecho, es necesario asignar la suma de espectros a S2'(k), en la que estos espectros se obtienen mediante la asignacion de todas las fes al espectro piS(k-T+i) multiplicando el coeficiente de filtro pi predeterminado por el espectro S(k-T+i), y en el que el espectro piS(k-T+i) es un espectro cercano separado por i del espectro S(k-T). Este procesamiento se representa por la ecuacion 5 siguiente.
[13]
S2'(k) = ^ S2(k-T + i)2 ...(Ecuacion 13)
Mediante la realizacion del calculo anterior por cambio de frecuencia k en el intervalo FL<k<FH en orden desde la frecuencia mas baja FL, se calcula el espectro S2'(k) estimado en FL<k<FH.
El procesamiento de filtrado anterior se realiza mediante una reposicion a cero de S(k) en el intervalo FL<k<FH cada vez que se da al coeficiente de tono T desde la seccion 504 de fijacion del coeficiente de tono. Esto es, se calcula S(k) y se envfa a la seccion 503 de busqueda cada vez que cambia el coeficiente de tono T.
A continuacion, se explicaran las etapas en el procedimiento de busqueda del coeficiente de tono T' optimo en la seccion 502 de busqueda usando la FIG. 9. La FIG. 9 es un diagrama de flujo que muestra las etapas en el procedimiento de busqueda del coeficiente de tono T' optimo en la seccion 503 de busqueda.
Primero, la seccion 503 de busqueda inicializa la similitud minima Dmin, que es un valor variable para almacenamiento del valor de similitud minima, a [+~] (ST 4010). A continuacion, de acuerdo con la ecuacion 14 siguiente, la seccion 503 de busqueda calcula la similitud D entre la banda mas alta FL<k<FH del espectro S2(k) de entrada en un coeficiente de tono dado y el espectro S2'(k) estimado (ST 4020).
[14]
D =
imagen2
S2(k)-S2(k)
(E"=0 S2(k)-S2’(k)r E"=!0S2'(fe)-S2'(fe)
.(Ecuacion 14)
En la ecuacion 14, M' representa el numero de muestras tras el calculo de la similitud D, y adopta un valor arbitrario igual a o menor que la longitud de la muestra FH-FL+1 en la banda mas alta.
Tambien, como se ha descrito anteriormente, un espectro estimado generado en la seccion 502 de filtrado es el espectro adquirido mediante filtrado de la primera capa del espectro descodificado. Por lo tanto, la similitud entre la banda mas alta FL<k<FH del espectro S2(k) de entrada y el espectro S2'(k) estimado calculado en la seccion 503 de busqueda muestra tambien la similitud entre la banda mas alta FL<k<FH del espectro S2(k) de entrada y la primera capa del espectro descodificado.
5
10
15
20
25
30
35
40
45
50
55
A continuacion, la seccion 503 de busqueda decide si la similitud D calculada es o no menor que la similitud mmima Dmin (ST 4030). Si la similitud calculada en ST 4020 es menor que la similitud minima Dmin (“Sr en ST 4030), la seccion 503 de busqueda asigna la similitud a la similitud minima Dmin (ST 4040). Por el contrario, si la similitud calculada en ST 4020 es igual a o mayor que la similitud minima Dmin (“NO” en ST 4030), la seccion de busqueda 503 decide si el intervalo de busqueda esta o no agotado. Esto es, con respecto a todos los coeficientes de tono en el intervalo de busqueda, la seccion 503 de busqueda decide si la similitud se calcula o no de acuerdo con la ecuacion 14 anterior en ST 4020 (ST 4050). Si el intervalo de busqueda no acaba (“NO” en ST 4050), el flujo vuelve a ST 4020 de nuevo en la seccion 503 de busqueda. Adicionalmente, la seccion 503 de busqueda calcula la similitud de acuerdo con la ecuacion 14, con respecto a un coeficiente de tono diferente del coeficiente de tono usado cuando la similitud se calculo previamente de acuerdo con la ecuacion 14 en la etapa ST 4020. Por el contrario, si el intervalo de busqueda esta agotado (“ST en ST 4050), la seccion de busqueda 503 produce la salida del coeficiente de tono T asociado con la similitud minima Dmin hacia la seccion 506 de multiplexado como coeficiente de tono T' optimo (ST 4060).
A continuacion, se explicara el aparato 103 de descodificacion mostrado en la FIG. 2.
La FIG. 10 es un diagrama de bloques que muestra los componentes principales del interior del aparato de descodificacion 103.
En la FIG. 10, la seccion 601 de demultiplexado de informacion codificada separa la primera capa de informacion codificada y la segunda capa de informacion codificada desde la informacion de entrada codificada, produce la salida de la primera capa de informacion codificada separada a la seccion 602 de descodificacion de la primera capa y produce la salida de la segunda capa de informacion codificada separada a la seccion 605 de descodificacion de la segunda capa.
La seccion 602 de descodificacion de la primera capa descodifica la primera capa de informacion codificada recibida como entrada desde la seccion 601 de demultiplexado de informacion codificada, y produce la salida de una senal descodificada de la primera capa generada a la seccion 603 de procesamiento de aumento de muestreo. En este caso, la configuracion y operaciones de la seccion 602 de descodificacion de la primera capa son las mismas que en la seccion 203 de descodificacion de la primera capa mostrada en la FIG. 3, y por lo tanto se omitiran las explicaciones espedficas.
La seccion 603 de procesamiento de aumento de muestreo realiza el aumento de muestreo de la senal descodificada de la primera capa recibida como entrada desde la seccion 602 de descodificacion de la primera capa desde SRbase a SRentrada, y produce la salida de la senal descodificada de la primera capa de muestreo aumentado adquirida mediante el procesamiento de aumento de muestreo a la seccion 604 de procesamiento de transformada ortogonal.
La seccion 604 de procesamiento de transformada ortogonal aplica un procesamiento de transformada ortogonal (es decir MDCT) a la senal descodificada de la primera capa de muestreo aumentado recibida como entrada desde la seccion 603 de procesamiento de aumento de muestreo, y produce la salida del coeficiente MDCT S1(k) de la senal descodificada de la primera capa de muestreo aumentado resultante (de aqrn en adelante “espectro descodificado de la primera capa”) a la seccion 605 de descodificacion de la segunda capa. En este caso, la configuracion y operaciones de la seccion 604 de procesamiento de transformada ortogonal son las mismas que en la seccion 205 de procesamiento de transformada ortogonal, y por lo tanto se omitiran las explicaciones espedficas.
La seccion 605 de descodificacion de la segunda capa genera una senal descodificada de la segunda capa que incluye componentes de la banda mas alta, desde el espectro S1(k) descodificado de la primera capa recibido como entrada desde la seccion 604 de procesamiento de transformada ortogonal y desde la segunda capa de informacion codificada recibida como entrada desde la seccion 601 de demultiplexado de informacion codificada, y produce la salida de la senal descodificada de la segunda capa como una senal de salida.
La FIG. 11 es un diagrama de bloques que muestra los componentes principales del interior de la seccion 605 de descodificacion de la segunda capa mostrada la FIG. 10.
En la FIG. 11, la seccion 701 de demultiplexado demultiplexa la segunda capa de informacion codificada recibida como entrada desde la seccion 601 de demultiplexado de informacion codificada al coeficiente de tono T' optimo, el mdice de variacion Vq(j) codificada y la informacion caractenstica, en donde el coeficiente de tono T' optimo es informacion relativa al filtrado, la variacion codificada Vq(j) es informacion relativa a las ganancias y la informacion caractenstica es informacion relativa a la estructura armonica. Adicionalmente, la seccion de demultiplexado 701 produce la salida del coeficiente de tono T' optimo hacia la seccion 703 de filtrado y la salida del mdice de variacion codificada Vq(j) y la informacion caractenstica hacia la seccion 704 de descodificacion de ganancia. En este caso, si el coeficiente de tono T' optimo, el mdice de variacion codificada Vq(j) y la informacion caractenstica se han separado en la seccion 601 de demultiplexado de informacion, no es necesario proporcionar la seccion 701 de demultiplexado.
La seccion 702 de fijacion de estado del filtro fija el espectro S1(k) [0<k<FL] descodificado de la primera capa como entrada desde la seccion 604 de procesamiento de transformada ortogonal al estado de filtro usado en la seccion 703 de filtrado. En este caso, cuando el espectro de toda la banda de frecuencias 0<k<FL en la seccion 703 de
5
10
15
20
25
30
35
40
45
filtrado se denomina como “S(k)” por facilidad de explicacion, el primer espectro S1(k) codificado de capa se almacena en la banda 0<k<FL de S(k) como el estado interno del filtro (estado del filtro). En este caso, la configuracion y operaciones de la seccion 702 de fijacion de estado del filtro son las mismas que en la seccion 501 de fijacion de estado del filtro, y por lo tanto se omitiran explicaciones espedficas.
La seccion 703 de filtrado tiene un filtro de tono multi-toma (es decir un filtro que tiene mas de una toma). Adicionalmente, la seccion 703 de filtrado filtra el espectro S1(k) descodificado de la primera capa en base al estado de filtro fijado en la seccion 702 de fijacion del estado del filtro, el coeficiente de tono T' optimo recibido como entrada desde la seccion 701 de demultiplexado y los coeficientes de filtro almacenados en el interior por adelantado, y calcula el espectro S2'(k) estimado del espectro S2(k) de entrada como se muestra en la ecuacion 13 anterior. Incluso en la seccion 703 de filtrado, se usa la funcion de filtro mostrada en la ecuacion 12 anterior.
La seccion 704 de descodificacion de ganancia descodifica el mdice de variacion Vq(j) codificado usando la informacion caractenstica recibida como entrada desde la seccion 701 de demultiplexado, y calcula la variacion Vq(j) que representa el valor cuantificado de variacion V(j). En este caso, la seccion 704 de descodificacion de ganancia conmuta los libros de codigos usados en la descodificacion del mdice de variacion codificada Vq(j) de acuerdo con el valor de la informacion caractenstica. El procedimiento de conmutacion de libros de codigos en la seccion 704 de descodificacion de ganancia es el mismo que el procedimiento de conmutacion de libros de codigos en la seccion 505 de codificacion de ganancia. Esto es, la seccion 704 de descodificacion de ganancia conmuta los libros de codigos de tamano de libro de codigos representado por “Tamano0” cuando el valor de informacion caractenstica es “0”, o conmuta el libro de codigos de tamano de libro de codigos representado por “Tamano1” cuando el valor de la informacion caractenstica es “1”. Incluso en este caso, Tamano1 es menor que Tamano0.
De acuerdo con la ecuacion 15 siguiente, la seccion 705 de ajuste del espectro multiplica al espectro S2'(k) estimado recibido como entrada desde la seccion 703 de filtrado por la variacion Vq(j) por sub-banda recibida como entrada desde la seccion 704 de descodificacion de ganancia. Por este medio, la seccion 705 de ajuste del espectro ajusta la forma espectral en la banda de frecuencias FL<k<FH del espectro S2'(k) estimado, y genera y produce la salida del espectro S3(k) descodificado de la segunda capa a la seccion 706 de procesamiento de transformada ortogonal.
[15]
S3(k) = S2'(k)- Vq(k) (BL(j) < k < BH(j), para todo j) ...(Ecuacion 15)
En este caso, la banda mas baja 0<k<FL del espectro S3(k) descodificado de la segunda capa se compone del espectro S1(k) descodificado de la primera capa, y la banda mas alta FL<k<FH del espectro S3(k) descodificado de la segunda capa se compone del espectro S2'(k) estimado con la forma espectral ajustada.
La seccion 706 de procesamiento de transformada ortogonal transforma el espectro S3(k) descodificado de la segunda capa recibido como entrada desde la seccion 705 de ajuste del espectro en una senal en el dominio del tiempo, y produce la salida de la senal descodificada de la segunda capa resultante como una senal de salida. En este caso, se realiza el procesamiento adecuado tal como tratamiento en ventanas, solape y suma cuando es necesario, para impedir que aparezcan discontinuidades entre tramas.
Se explicara a continuacion el procesamiento espedfico en la seccion 706 de procesamiento de transformada ortogonal.
La seccion 706 de procesamiento de transformada ortogonal incorpora la memoria intermedia buf(k) y la inicializa tal como se muestra en la ecuacion 16 siguiente.
[16]
buf’(k) = 0 (k = 0, ■■■, N-1) ...(Ecuacion 16)
Tambien, usando el espectro S3(k) descodificado de la segunda capa recibido como entrada desde la seccion 705 de ajuste del espectro, la seccion 706 de procesamiento de transformada ortogonal calcula la senal y''n descodificada de la segunda capa de acuerdo con la ecuacion 17 siguiente.
[17]
y”n = 1Z5(fc)cos[(2n+1+^)(2fc+1)TC] (n = 0, ■■■, N-1) .(Ecuacion 17)
En la ecuacion 17, Z5(k) representa un vector que combina el espectro S3(k) descodificado y la memoria intermedia buf(k) tal como se muestra en la ecuacion 18 siguiente.
5
10
15
20
25
30
35
40
45
50
55
bu {/'(fc)(fc = 0,-,W-1)
Z5(k) = .. .(Ecuacion 18)
[S3(k)(k = N,-,2N-1)
A continuacion, la seccion 706 de procesamiento de transformada ortogonal actualiza la memoria intermedia buf'(k) de acuerdo con la ecuacion 19 siguiente.
[19]
buf’(k) = S4(k) (k = 0, ■■■, N-1) .(Ecuacion 19)
A continuacion, la seccion 706 de procesamiento de transformada ortogonal descodifica la senal y''n como una senal de salida.
As^ de acuerdo con la presente realizacion, en la codificacion/descodificacion de realizacion de expansion de banda usando el espectro de la banda mas baja y estimando el espectro de la banda mas alta, un aparato de codificacion analiza la estabilidad de la estructura armonica de un espectro de entrada usando una ganancia de excitacion adaptativa de cuantificacion y cambios adecuadamente en la asignacion de bits entre los parametros de codificacion de acuerdo con el resultado del analisis, de modo que sea posible mejorar la calidad del sonido de las senales descodificadas adquiridas en un aparato de descodificacion.
Para ser mas espedfico, un aparato de codificacion de acuerdo con la presente realizacion decide que estructura armonica de un espectro de entrada es relativamente estable cuando una ganancia de excitacion adaptativa de cuantificacion es igual a o mayor que un umbral, o decide que la estructura armonica del espectro de entrada es relativamente inestable cuando la ganancia de excitacion adaptativa de cuantificacion es menor que el umbral. Asf, en el primer caso, mientras que se incrementa el numero de bits para la busqueda de un coeficiente de tono optimo usado en el filtrado para la expansion de banda, se disminuye el numero de bits para la codificacion de informacion relativa a ganancia. Tambien, en el ultimo caso, mientras que se disminuye el numero de bits para la busqueda de un coeficiente de tono optimo usado en el filtrado para la expansion de banda, se incrementa el numero de bits para la codificacion de informacion relativa a ganancias. Por este medio, es posible realizar una codificacion con una asignacion de bits adecuada en base a la estructura armonica de un espectro de entrada, y mejorar la calidad del sonido de senales descodificadas en un aparato de descodificacion.
Tambien, se ha descrito anteriormente un caso de ejemplo con la presente realizacion en donde la seccion 206 de decision de la caractenstica genera informacion caractenstica usando una ganancia de excitacion adaptativa cuantificada. Sin embargo, la presente invencion no esta limitada a esto, y la seccion 206 de decision de la caractenstica puede determinar la informacion caractenstica usando otros parametros incluidos en la primera capa de informacion codificada tal como un vector de excitacion adaptativa. Tambien, el numero de parametros usados para determinar la informacion caractenstica no esta limitado a uno, y es igualmente posible usar una pluralidad de o todos los parametros incluidos en la primera capa de informacion codificada.
Tambien, se ha descrito anteriormente un caso de ejemplo con la presente realizacion en el que la seccion 206 de decision de la caractenstica genera informacion caractenstica usando una ganancia de excitacion adaptativa de cuantificacion incluida en la primera capa de informacion codificada. Sin embargo, la presente invencion no esta limitada a esto, y la seccion 206 de decision de la caractenstica puede analizar la estabilidad de la estructura armonica de un espectro de entrada directamente y generar la informacion caractenstica. Como un procedimiento de analisis de la estabilidad de la estructura armonica del espectro de entrada, por ejemplo, hay un procedimiento de calculo de la variacion de energfa por trama de una senal de entrada.
Este procedimiento se explicara a continuacion usando la FIG. 12 y la FIG. 13. La FIG. 12 es un diagrama de bloques que muestra los componentes principales del interior de un aparato de codificacion que genera informacion caractenstica de acuerdo con la variacion de energfa. El aparato de codificacion 111 difiere del aparato de codificacion 101 mostrado en la FIG. 3 en que proporciona la seccion 216 de decision de la caractenstica en lugar de la seccion 206 de decision de la caractenstica. En la FIG. 12, se recibe directamente una senal de entrada como entrada en la seccion 216 de decision de la caractenstica. La FIG. 13 es un diagrama de flujo que muestra las etapas en el procedimiento de generacion de la informacion caractenstica en la seccion 216 de decision de la caractenstica. En primer lugar, la seccion 216 de decision de la caractenstica calcula la energfa E_act de la trama actual de una senal de entrada (ST 2010). A continuacion, la seccion 216 de decision de la caractenstica decide si el valor absoluto |E_act - E_Pre| de la diferencia entre la energfa E_act de la trama actual y la energfa E_Pre de la trama previa es o no igual a o mayor que un umbral TH (ST 2020). La seccion 216 de decision de la caractenstica establece el valor de la informacion caractenstico a “0” (ST 2030) si |E_act - E_Pre| es igual a o mayor que TH (“Sr en ST 2020), o establece el valor de la informacion caractenstica a “1” (ST 2040) si |E_act - E_Pre| es menor que TH (“NO” en ST 2020). A continuacion, la seccion 216 de decision de la caractenstica produce la salida de la informacion caractenstica hacia la seccion 207 de codificacion de la segunda capa (ST 2050) y actualiza la energfa E_Pre de la trama previa usando la energfa E_act de la trama actual (ST 2060). Aqrn, la seccion 216 de decision de la caractenstica almacena la energfa de diversas tramas pasadas, y es posible usar la energfa para calcular la variacion de energfa de la trama actual respecto a tramas pasadas.
5
10
15
20
25
30
35
40
45
50
55
60
Tambien, se ha descrito anteriormente un caso con la presente realizacion en el que la asignacion de bits se cambia dependiendo de las caractensticas de la senal de entrada cambiando el tamano de un intervalo de ajuste de los coeficientes de tono (es decir el numero de entradas) en la seccion 504 de ajuste del coeficiente de tono de la seccion 207 de codificacion de la segunda capa y cambiando el tamano de un tamano de libro de codigos (es decir el numero de entradas) tras la codificacion en la seccion 505 de codificacion de ganancia. Sin embargo, la presente invencion no esta limitada a esto, y es igualmente aplicable a un caso en donde el procesamiento de codificacion se cambia por otros procedimientos distintos a un simple procedimiento de cambio del intervalo de los coeficientes de tono y el tamano del libro de codigos. Por ejemplo, como para el procedimiento de ajuste de los coeficientes de tono, es posible conmutar el intervalo de ajuste de los coeficientes de tono de una forma irregular, en lugar de conmutar entre ‘Tmm a Tmax0” y ‘Tmm a Tmax1” de una forma simple. Esto es, es posible realizar una busqueda en el intervalo desde Tmm a Tmax0 (en donde el numero de entradas es Tmax0-Tmm) cuando el valor de la informacion caractenstica es “0”, y realizar una busqueda en el intervalo desde Tmm a Tmax2 cada k entradas (el numero de entradas es Tmax1-Tmm) cuando el valor de la informacion caractenstica es “1”. Aqm, las condiciones anteriormente descritas se aplican al numero de entradas. Asf, no solo mediante el cambio del numero de entradas de los coeficientes de tono simple y regularmente sino tambien mediante el cambio de los coeficientes de tono irregularmente con la condicion de que el numero de entradas sea Tmax1-Tmm, es posible adoptar un procedimiento de ajuste de los coeficientes de tono mas de acuerdo con las caractensticas de la senal de entrada. En comparacion con el procedimiento de ajuste descrito en la presente realizacion, este procedimiento de ajuste permite una busqueda de similitud a traves de un intervalo amplio de la banda mas baja de una senal de entrada, y es por lo tanto efectivo especialmente en el caso en el que la caractenstica del espectro de una senal de entrada vana significativamente a lo largo de la banda mas baja.
Tambien, como para el tamano del libro de codigos, ademas del procedimiento de conmutar entre un libro de codigos de tamano de libro de codigos representado por “Tamano0” y un libro de codigos de tamano de libro de codigos representado por “Tamanol” de una forma simple, es igualmente posible el procedimiento de cambio de la configuracion de ganancias a ser codificadas. Por ejemplo, cuando el valor de la informacion caractenstica es “0”, la seccion 505 de codificacion de ganancia divide la banda de frecuencias FL<k<FH en K sub-bandas, en lugar de J sub-bandas (K>J), y puede codificar la variacion de ganancia en cada sub-banda. Aqm, se supone que la variacion de ganancia en K sub-bandas se codifica usando la cantidad de informacion requerida cuando el tamano de libro de codigos anterior es “Tamano0”. Asf, mediante la codificacion de la variacion de ganancia con las condiciones de que el ancho de banda de la sub-banda es mas estrecho y el numero sub-bandas se incrementa, en lugar de cambiar el tamano del libro de codigos de una forma simple tras la codificacion de la variacion de ganancia, es posible codificar ganancias mas de acuerdo con una caractenstica de la senal de entrada. Con este procedimiento, mediante el cambio del numero de sub-bandas en la ganancia de la banda mas alta, es posible mejorar la resolucion de la ganancia en el eje de frecuencias, y este procedimiento es efectivo especialmente cuando la potencia del espectro de la banda mas alta de una senal de entrada vana significativamente en el eje de la frecuencia.
(Realizacion 2)
Se ha descrito con la realizacion 1 un caso de ejemplo de la presente invencion en el que la informacion caractenstica se genera usando senales en el dominio del tiempo o informacion codificada. A diferencia de esto, en la Realizacion 2 de la presente invencion, se describira un caso usando la FIG. 14 y la FIG. 15 en donde la informacion caractenstica se genera mediante la conversion de una senal de entrada en el dominio de la frecuencia y el analisis de la estabilidad de la estructura armonica.
Un sistema de comunicacion de acuerdo con la presente realizacion y el sistema de comunicacion de acuerdo con la Realizacion 1 de la presente invencion son similares, y difieren solamente en proporcionar el aparato de codificacion 121 en lugar del aparato de codificacion 101.
La FIG. 14 es un diagrama de bloques que muestra los componentes principales del interior del aparato de codificacion 121 de acuerdo con la Realizacion 2 de la presente invencion. Aqm, al aparato de codificacion 121 mostrado en la FIG. 14 y el aparato de codificacion 101 mostrado en la FIG. 3 son basicamente el mismo, pero se diferencian solamente en que proporciona la seccion 226 de decision de la caractenstica en lugar de la seccion 206 de decision de la caractenstica.
La seccion 226 de decision de la caractenstica analiza la estabilidad de la estructura armonica del espectro de entrada recibido como entrada desde la seccion 205 de transformada ortogonal, genera informacion caractenstica en base a este resultado de analisis y produce la salida de la informacion caractenstica hacia la seccion 207 de codificacion de la segunda capa. En este caso, se explicara un caso de ejemplo en donde se usa la medicion de alisado espectral (“SFM”) como la estructura armonica del espectro de entrada. La SFM se representa por la relacion entre la media geometrica y la media aritmetica (= media geometrica / media aritmetica) de un espectro de amplitud. La SFM se aproxima a 0,0 cuando el nivel de pico del espectro se hace mas alto o se aproxima a 1,0 cuando el nivel de ruido del espectro se hace mas alto. La seccion 226 de decision de la caractenstica calcula la SFM de un espectro de senal de entrada y genera informacion caractenstica H mediante la comparacion de la SFM y un umbral predeterminado SFMumbraltal como se muestra en la ecuacion 20 siguiente.
5
10
15
20
25
30
35
40
45
50
55
H =
0(siSFM > SFMumbra|)
{ 1(en otro caso)
...(Ecuacion 20)
La FIG. 15 es un diagrama de flujo que muestra las etapas en el procedimiento de generar informacion caractenstica en la seccion 226 de decision de la caractenstica.
En primer lugar, la seccion 226 de decision de la caractenstica calcula la SFM como resultado del analisis de la estabilidad de la estructura armonica de un espectro de entrada (ST 3010). A continuacion, la seccion 226 de decision de la caractenstica decide si la SFM del espectro de entrada es o no igual a o mayor que el umbral SFMumbral (ST 3020). El valor de la informacion caractenstica H se establece en “0” (ST 3030) si la SFM del espectro de entrada es igual a o mayor que SFMumbral (“Sr en ST 3020), o el valor de la informacion caractenstica H se establece en “1” (ST 3040) si la SFM del espectro de entrada es menor que SFMumbral (“NO” en ST 3020). A continuacion, la seccion 226 de decision de la caractenstica produce la salida de la informacion caractenstica hacia la seccion 207 de codificacion de la segunda capa (ST 3050).
De ese modo, de acuerdo con la presente realizacion, en la codificacion/descodificacion de la realizacion de expansion de banda usando el espectro de la banda mas baja y estimando el espectro de la banda mas alta, un aparato de codificacion analiza la estabilidad de la estructura armonica de un espectro de entrada adquirido mediante la conversion de una senal de entrada en el dominio de la frecuencia y cambia la asignacion de bits entre los parametros de codificacion de acuerdo con el resultado del analisis. Por lo tanto, es posible mejorar la calidad del sonido de las senales descodificadas adquiridas en un aparato de descodificacion.
Tambien, se ha descrito un caso de ejemplo anteriormente con la presente realizacion en el que la informacion caractenstica se genera usando la SFM como la estructura armonica de un espectro de entrada. Sin embargo, la presente invencion no esta limitada a esto, y es igualmente posible usar otros parametros como la estructura armonica de un espectro de entrada. Por ejemplo, cuando la seccion 226 de decision de la caractenstica cuenta el numero de picos con amplitud igual a o mayor que un umbral predeterminado en un espectro de entrada (en este caso, si el espectro de entrada es consecutivamente igual a o mayor que el umbral, la parte consecutiva se cuenta como un pico), y cuando el numero contado es menor que un numero predeterminado, la seccion 226 de decision de la caractenstica decide que la estructura armonica es estable (es decir, el valor de la informacion caractenstica se establece en “1”). En este caso, no hay problema para invertir el valor de la informacion caractenstica H entre un caso en donde el numero de picos es igual a o mayor que un umbral y un caso en donde el numero de picos es menor que el umbral. Tambien, la seccion 226 de decision de la caractenstica puede filtrar un espectro de entrada mediante un filtro combinado que utiliza un periodo de tono calculado en una seccion 202 de codificacion de la primera capa, calcular la energfa por banda de frecuencia y decidir que la estructura armonica es estable cuando la energfa calculada es igual a o mayor que un umbral predeterminado. Tambien, la seccion 226 de decision de la caractenstica puede analizar la estructura armonica de un espectro de entrada utilizando un intervalo dinamico y generar informacion caractenstica. Tambien, la seccion 226 de decision de la caractenstica puede calcular la tonalidad (es decir nivel armonico) de un espectro de entrada y cambiar el procesamiento de la codificacion en la seccion 207 de codificacion de la segunda capa de acuerdo con la tonalidad calculada. La tonalidad se desvela en MPEG-2 AAC (ISO/IEC 13818-7), y por lo tanto se omitira la explicacion.
Tambien, se ha descrito anteriormente con la presente realizacion un caso de ejemplo en el que la informacion caractenstica se genera por trama de procesamiento para un espectro de entrada. Sin embargo, la presente invencion no esta limitada a esto, y es igualmente posible generar informacion caractenstica por sub-banda de un espectro de entrada. Esto es, la seccion 226 de decision de la caractenstica puede evaluar la estabilidad de la estructura armonica por sub-banda de un espectro de entrada y generar informacion caractenstica. En este caso, las sub-bandas en las que se evalua la estabilidad de la estructura armonica pueden o no adoptar la misma configuracion como sub-bandas en la seccion 505 de codificacion de ganancia y la seccion 704 de descodificacion de ganancia. De ese modo, mediante el analisis de la estructura armonica por sub-banda y el cambio del procesamiento de la expansion de banda en la seccion 207 de codificacion de la segunda capa de acuerdo con este resultado de analisis, es posible codificar una senal de entrada mas eficientemente.
Se han descrito anteriormente realizaciones de la presente invencion.
Tambien, se han descrito casos de ejemplo con las realizaciones anteriores en los que, cuando la seccion 503 de busqueda busca una parte similar entre la banda mas alta de un espectro de entrada, S2(k) (FL<k<FH), y el espectro S2'(k) estimado, esto es, cuando la seccion 503 de busqueda busca el coeficiente de tono T' optimo, se busca toda la parte de cada espectro mediante la conmutacion del intervalo de busqueda de acuerdo con el valor de la informacion caractenstica. Sin embargo, la presente invencion no esta limitada a esto, y es igualmente posible buscar solamente la parte de cada espectro tal como la parte de cabecera, mediante la conmutacion del intervalo de busqueda de acuerdo con el valor de la informacion caractenstica.
Tambien, aunque se han descrito casos de ejemplo con las realizaciones anteriores en los que se conmutan los libros de codigos usando informacion caractenstica en una seccion de descodificacion de ganancia, es igualmente posible realizar la descodificacion sin usar informacion caractenstica y conmutacion de libros de codigos.
5
10
15
20
25
30
35
40
45
50
55
Tambien, se han descrito casos de ejemplo con las realizaciones anteriores en los que se usan “0” y “1” como valores de informacion caractenstica. Sin embargo, la presente invencion no esta limitada a esto, y es igualmente posible proporcionar dos o mas umbrales a ser comparados con la estabilidad de la estructura armonica, y fijar tres o mas clases de valores de informacion caractenstica. En este caso, la seccion 503 de busqueda, la seccion 505 de codificacion de ganancia y la seccion 704 de descodificacion de ganancia proporcionan cada una tres o mas clases de intervalos de busqueda y tres o mas clases de libros de codigos de tamanos de libro de codigos diferentes, y conmutan adecuadamente estos intervalos de busqueda o libros de codigos de acuerdo con la informacion caractenstica.
Tambien, se han descrito casos de ejemplo con las realizaciones anteriores en los que la seccion 503 de busqueda, la seccion 505 de codificacion de ganancia y la seccion 704 de descodificacion de ganancia conmutan cada una intervalos de busqueda o libros de codigos de acuerdo con el valor de la informacion caractenstica y cambian el numero de bits a asignar para codificar los coeficientes de tono o ganancias. Sin embargo, la presente invencion no esta limitada a esto, y es igualmente posible cambiar el numero de bits a asignar para codificar parametros distintos a los coeficientes de tono o ganancias, de acuerdo con el valor de la informacion caractenstica.
Tambien, se han descrito casos de ejemplo con las realizaciones anteriores en los que los intervalos de busqueda en los que se busca el coeficiente de tono T' optimo se conmutan de acuerdo con la estabilidad de la estructura armonica de un espectro de entrada. Sin embargo, la presente invencion no esta limitada a esto, y, cuando la estructura armonica de un espectro de entrada es igual a o menor que un nivel predeterminado, en la seccion 503 de busqueda, es posible igualmente seleccionar siempre un coeficiente de tono de una forma fija sin busqueda del coeficiente de tono T' optimo, mientras se asigna un numero mayor de bits para codificacion de ganancia. Esto es debido a que, cuando una ganancia de excitacion adaptativa es bastante pequena, el nivel de tono del espectro de la banda mas baja de un espectro de entrada es bastante bajo, y es posible mejorar adicionalmente la precision global de la codificacion mediante el uso de mas bits para la codificacion de una ganancia del espectro de banda mas alta que mediante el uso de mas bits para la busqueda de un coeficiente de tono adaptativo en la seccion 503 de busqueda.
Tambien, se han descrito casos de ejemplo con las realizaciones anteriores en los que la seccion 505 de codificacion de ganancia y la seccion 704 de descodificacion de ganancia conmutan entre una pluralidad de libros de codigos de diferentes libros de codigos. Sin embargo, la presente invencion no esta limitada a esto y, con un unico libro de codigos, es posible igualmente conmutar solamente los numeros de entradas usados en la codificacion. Por este medio, es posible reducir la capacidad de memoria requerida en un aparato de codificacion y aparato de descodificacion. Adicionalmente, en este caso, si el orden de disposicion de los codigos almacenados en el libro de codigos unico se asocia con los numeros de entradas usados, es posible realizar la codificacion mas eficientemente.
Tambien, se han descrito casos de ejemplo con las realizaciones anteriores en los que la seccion 202 de codificacion de la primera capa y la seccion 203 de descodificacion de la primera capa realizan una codificacion/descodificacion de voz con un esquema CELP Sin embargo, la presente invencion no esta limitada a esto, y la seccion 202 de codificacion de la primera capa y la seccion 203 de descodificacion de la primera capa pueden realizar igualmente una codificacion/descodificacion de voz con otros esquemas distintos al esquema CELP
Tambien, el umbral, el nivel y el numero de picos usados para comparacion pueden ser un valor fijo o un valor variable fijado adecuadamente con condiciones, esto es, un requisito esencial es que sus valores se establezcan antes de que se realice la comparacion.
Tambien, aunque el aparato de descodificacion de acuerdo con las realizaciones anteriores realice el procesamiento usando flujos de bits transmitidos desde el aparato de codificacion de acuerdo con las realizaciones anteriores, la presente invencion no esta limitada a esto, y es igualmente posible realizar el procesamiento con flujos de bits que no se transmiten desde el aparato de codificacion de acuerdo con las realizaciones anteriores siempre que estos flujos de bits incluyan parametros y datos esenciales.
Tambien, la presente invencion es aplicable incluso a un caso en el que se hace funcionar un programa de procesamiento de senal despues de ser registrado o escrito en un medio de registro legible por ordenador tal como una memoria, disco, cinta, CD y DVD de modo que sea posible proporcionar operaciones y efectos similares a los de la presente realizacion.
Aunque se han descrito casos con las realizaciones anteriores como un ejemplo en los que la presente invencion se implementa como hardware, la presente invencion puede implementarse con software.
Adicionalmente, cada bloque de funcion empleado en la descripcion de cada una de las realizaciones mencionadas anteriormente puede implementarse tfpicamente como un LSI constituido por un circuito integrado. Estos pueden ser chips individuales o parcial o totalmente contenidos en un unico chip. Se adopta aqrn “LSI” pero puede hacerse referencia tambien como un “IC”, “sistema LSI”, “super LSI”, o “ultra LSI” dependiendo de los diferentes grados de integracion.
Adicionalmente, el procedimiento de integracion del circuito no esta limitado a los LSI, y es tambien posible la implementacion usando circuitos dedicados o procesadores de proposito general. Despues de la fabricacion del LSI,
es posible tambien la utilizacion de un FPGA (matriz de puertas programable en campo) o un procesador reconfigurarle en donde pueden regenerarse las conexiones y configuraciones de celulas del circuito en un LSI.
Adicionalmente, si una tecnologfa de circuitos integrados viene a sustituir los LSI como resultado del avance de la tecnologfa de semiconductores o un derivado de otra tecnologfa, es posible naturalmente llevar a cabo la integracion 5 del bloque de funcion usando esta tecnologfa. Es posible tambien la aplicacion de biotecnolog^a.
Aplicabilidad industrial
El aparato de codificacion, aparato de descodificacion y procedimiento de codificacion de acuerdo con la presente invencion puede mejorar la calidad de las senales descodificadas tras la realizacion de expansion de banda usando el espectro de la banda mas baja y estimando el espectro de la banda mas alta, y son aplicables a, por ejemplo, un 10 sistema de comunicacion por paquetes, un sistema de comunicaciones moviles y otros similares.

Claims (13)

  1. REIVINDICACIONES
    1. Un aparato de codificacion que comprende:
    una primera seccion de codificacion que codifica una senal de entrada de voz/audio y genera una primera informacion codificada; y
    5 una seccion de descodificacion que descodifica la primera informacion codificada y genera una senal descodificada;
    caracterizado por
    una seccion de decision de la caractenstica que analiza una estabilidad de una estructura armonica de la senal de entrada de voz/audio y genera una informacion caractenstica armonica mostrando un resultado del analisis, 10 en el que la estabilidad de la estructura armonica es un parametro que muestra la periodicidad y variacion de amplitud del espectro de senal de entrada; y
    una segunda seccion de codificacion que genera una segunda informacion codificada mediante la codificacion de una diferencia de la senal descodificada con respecto a la senal de entrada de voz/audio, y que cambia un numero de bits a asignar a una pluralidad de parametros que forman la segunda informacion codificada en base 15 a la informacion caractenstica armonica.
  2. 2. El aparato de codificacion de acuerdo con la reivindicacion 1, en el que:
    la primera seccion de codificacion realiza una codificacion de voz con un esquema de prediccion lineal con excitacion por codigo, y genera la primera informacion codificada incluyendo una ganancia de excitacion adaptativa de cuantificacion; y
    20 la seccion de decision de la caractenstica genera la informacion caractenstica armonica de diferentes valores, dependiendo de si la ganancia de excitacion adaptativa de cuantificacion es o no igual a o mayor que un primer umbral.
  3. 3. El aparato de codificacion de acuerdo con la reivindicacion 2, en el que la segunda seccion de codificacion comprende:
    25 una seccion de filtrado que filtra la primera senal descodificada, que es una senal de una banda igual a o mas baja que una frecuencia predeterminada, y genera una senal de estimacion, que es una senal que estima una banda mas alta de la senal de entrada que la frecuencia;
    una seccion de ajuste que establece un intervalo de busqueda mas amplio cuando la ganancia de excitacion adaptativa de cuantificacion es igual a o mayor que el primer umbral, o establece un intervalo de busqueda mas 30 estrecho cuando la ganancia de excitacion adaptativa de cuantificacion es menor que el primer umbral, y establece un coeficiente de tono usado en la seccion de filtrado mediante el cambio del coeficiente de tono en el intervalo de busqueda; y
    una seccion de busqueda que busca el coeficiente de tono en un caso en el que una similitud es mas pequena entre la banda mas alta de la senal de entrada y una de entre la banda mas baja de la senal de entrada y la 35 senal de estimacion.
  4. 4. El aparato de codificacion de acuerdo con la reivindicacion 2, en el que la segunda seccion de codificacion comprende:
    una seccion de filtrado que filtra la primera senal descodificada, que es una senal de una banda igual a o mas baja que una frecuencia predeterminada, y genera una senal de estimacion, que es una senal que estima una 40 banda mas alta de la senal de entrada que la frecuencia;
    una seccion de ajuste que establece un numero de candidatos de busqueda a un valor mayor que un segundo umbral cuando la ganancia de excitacion adaptativa de cuantificacion es igual a o mayor que el primer umbral, o establece el numero de candidatos de busqueda a un valor menor que el segundo umbral cuando la ganancia de excitacion adaptativa de cuantificacion es menor que el primer umbral, y establece un coeficiente de tono usado 45 en la seccion de filtrado mediante el cambio del coeficiente de tono de acuerdo con el numero de candidatos de busqueda; y
    una seccion de busqueda que busca el coeficiente de tono en un caso en el que una similitud es mas pequena entre la banda mas alta de la senal de entrada y una de entre la banda mas baja de la senal de entrada y la senal de estimacion.
    50 5. El aparato de codificacion de acuerdo con la reivindicacion 2, en el que:
    la segunda seccion de codificacion comprende una seccion de codificacion de ganancia que codifica una ganancia de la senal de entrada usando un libro de codigos de ganancia compuesto por una pluralidad de vectores de codigo; y
    la seccion de codificacion de ganancia disminuye un numero de vectores de codigo usados para codificar la 55 ganancia cuando la ganancia de excitacion adaptativa de cuantificacion es igual a o mayor que el primer umbral, o incrementa el numero de vectores de codigo usados para codificar la ganancia cuando la ganancia de
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    excitacion adaptativa de cuantificacion es menor que el primer umbral.
  5. 6. El aparato de codificacion de acuerdo con la reivindicacion 2, en el que:
    la segunda seccion de codificacion comprende una seccion de codificacion de ganancia que codifica una ganancia de la senal de entrada usando un libro de codigos de ganancia compuesto por una pluralidad de vectores de codigo; y
    la seccion de codificacion de ganancia disminuye un numero de sub-bandas usadas para codificar la ganancia cuando la ganancia de excitacion adaptativa de cuantificacion es igual a o mayor que el primer umbral, o incrementa el numero de sub-bandas usadas para codificar la ganancia cuando la ganancia de excitacion adaptativa de cuantificacion es menor que el primer umbral.
  6. 7. El aparato de codificacion de acuerdo con la reivindicacion 5, en el que la seccion de codificacion de ganancia comprende una pluralidad de libros de codigos de ganancia de diferentes tamanos de libro de codigos y cambia el numero de vectores de codigo usados para codificar la ganancia mediante la conmutacion de los libros de codigos de ganancia usados para codificar la ganancia.
  7. 8. El aparato de codificacion de acuerdo con la reivindicacion 5, en el que la seccion de codificacion de ganancia comprende un libro de codigos de ganancia y cambia el numero de vectores de codigo usados para codificar la ganancia en una pluralidad de vectores de codigo que forman el unico libro de codigos de ganancia.
  8. 9. El aparato de codificacion de acuerdo con la reivindicacion 1, en el que la seccion de decision de la caractenstica calcula una variacion de energfa de una trama actual con respecto a una trama pasada de la senal de entrada de voz/audio, y genera la informacion caractenstica armonica de diferentes valores dependiendo de si la variacion es o no igual a o mayor que un umbral.
  9. 10. El aparato de codificacion de acuerdo con la reivindicacion 1, que comprende adicionalmente una seccion de transformacion que transforma la senal de entrada de voz/audio a un dominio de la frecuencia y genera un espectro en el dominio de la frecuencia,
    en el que la seccion de decision de la caractenstica analiza la estabilidad de la estructura armonica de la senal de entrada de voz/audio usando el espectro en el dominio de la frecuencia.
  10. 11. El aparato de codificacion de acuerdo con la reivindicacion 10, en el que:
    la seccion de transformacion realiza un procesamiento de transformada ortogonal de la senal de entrada de voz/audio y calcula un coeficiente de transformada ortogonal como el espectro en el dominio de la frecuencia; y la seccion de decision de la caractenstica calcula una medicion de alisado del espectro del coeficiente de transformada ortogonal y genera la informacion caractenstica armonica de diferentes valores dependiendo de si la medicion de alisado espectral es o no igual a o mayor que un umbral.
  11. 12. El aparato de codificacion de acuerdo con la reivindicacion 10, en el que:
    la seccion de transformacion realiza un procesamiento de transformada ortogonal de la senal de entrada y calcula un coeficiente de transformada ortogonal como el espectro en el dominio de la frecuencia; y la seccion de decision de la caractenstica genera la informacion de caractenstica armonica de diferentes valores, dependiendo de si un numero de picos con una amplitud igual a o mayor que un nivel predeterminado es o no igual a o mayor que un numero predeterminado en el coeficiente de transformada ortogonal.
  12. 13. Un aparato de descodificacion que comprende:
    una seccion de recepcion que recibe la primera informacion codificada adquirida mediante la codificacion de una senal de entrada de voz/audio en un aparato de codificacion; y
    una primera seccion de descodificacion que descodifica una primera capa usando la primera informacion codificada y adquiere una primera senal descodificada;
    caracterizado porque
    la seccion de recepcion recibe adicionalmente una segunda informacion codificada adquirida mediante la codificacion de una diferencia entre la senal de entrada de voz/audio y una senal descodificada obtenida mediante la descodificacion de la primera informacion codificada, e informacion de caractenstica armonica generada en base a un analisis resultado de analizar una estabilidad de una estructura armonica de la senal de entrada de voz/audio, en el que la estabilidad de la estructura armonica es un parametro que muestra la periodicidad y variacion de amplitud del espectro de la senal de entrada; y el aparato de descodificacion comprende adicionalmente:
    una segunda seccion de descodificacion que descodifica una segunda capa usando la segunda informacion codificada y la primera senal descodificada, y adquiere una segunda senal descodificada,
    en el que la segunda seccion de descodificacion realiza la descodificacion en la segunda capa usando una pluralidad de parametros que forman la segunda informacion codificada y a los que se asigna un numero de bits
    en base a la informacion de caractenstica armonica en el aparato de codificacion.
  13. 14. Un procedimiento de codificacion que comprende:
    una primera etapa de codificacion para codificar una senal de entrada de voz/audio y generar una primera informacion codificada; y
    5 una etapa de descodificacion para descodificar la primera informacion codificada y generar una senal descodificada;
    caracterizado por
    una etapa de decision de la caractenstica para analizar una estabilidad de una estructura armonica de la senal de entrada de voz/audio y que genera una informacion de caractenstica armonica mostrando un resultado del 10 analisis, en el que la estabilidad de la estructura armonica es un parametro que muestra la periodicidad y variacion de amplitud del espectro de la senal de entrada; y
    una segunda etapa de codificacion para generar una segunda informacion codificada mediante la codificacion de una diferencia de la senal descodificada con respecto a la senal de entrada de voz/audio, y cambiar un numero de bits a asignar a una pluralidad de parametros que forman la segunda informacion codificada en base a la 15 informacion de caractenstica armonica.
ES08864773.0T 2007-12-21 2008-12-22 Codificador, descodificador y procedimiento de codificación Active ES2629453T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2007330838 2007-12-21
JP2007330838 2007-12-21
JP2008129710 2008-05-16
JP2008129710 2008-05-16
PCT/JP2008/003894 WO2009081568A1 (ja) 2007-12-21 2008-12-22 符号化装置、復号装置および符号化方法

Publications (1)

Publication Number Publication Date
ES2629453T3 true ES2629453T3 (es) 2017-08-09

Family

ID=40800885

Family Applications (1)

Application Number Title Priority Date Filing Date
ES08864773.0T Active ES2629453T3 (es) 2007-12-21 2008-12-22 Codificador, descodificador y procedimiento de codificación

Country Status (6)

Country Link
US (1) US8423371B2 (es)
EP (2) EP2224432B1 (es)
JP (1) JP5404418B2 (es)
CN (1) CN101903945B (es)
ES (1) ES2629453T3 (es)
WO (1) WO2009081568A1 (es)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
JP5764488B2 (ja) 2009-05-26 2015-08-19 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 復号装置及び復号方法
JP2010276780A (ja) * 2009-05-27 2010-12-09 Panasonic Corp 通信装置および信号処理方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102598123B (zh) * 2009-10-23 2015-07-22 松下电器(美国)知识产权公司 编码装置、解码装置及其方法
WO2011058752A1 (ja) 2009-11-12 2011-05-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2011058758A1 (ja) * 2009-11-13 2011-05-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
CN102714040A (zh) * 2010-01-14 2012-10-03 松下电器产业株式会社 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
BR112012032746A2 (pt) 2010-06-21 2016-11-08 Panasonic Corp dispositivo de descodificação, dispositivo de codificação, e métodos para os mesmos.
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
KR101442127B1 (ko) 2011-06-21 2014-09-25 인텔렉추얼디스커버리 주식회사 쿼드트리 구조 기반의 적응적 양자화 파라미터 부호화 및 복호화 방법 및 장치
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
WO2013136935A1 (ja) * 2012-03-13 2013-09-19 インフォメティス株式会社 センサ、センサ信号処理装置および電力線信号符号化装置
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
WO2014054556A1 (ja) * 2012-10-01 2014-04-10 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
CN103077723B (zh) * 2013-01-04 2015-07-08 鸿富锦精密工业(深圳)有限公司 音频传输系统
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CN106847297B (zh) 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
CN103971694B (zh) 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
EP3040987B1 (en) 2013-12-02 2019-05-29 Huawei Technologies Co., Ltd. Encoding method and apparatus
KR102251833B1 (ko) * 2013-12-16 2021-05-13 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
US10410645B2 (en) * 2014-03-03 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
CN110875048B (zh) * 2014-05-01 2023-06-09 日本电信电话株式会社 编码装置、及其方法、记录介质
MY186995A (en) 2015-04-22 2021-08-26 Huawei Tech Co Ltd An audio signal processing apparatus and method
BR112021012753A2 (pt) 2019-01-13 2021-09-08 Huawei Technologies Co., Ltd. Método implementado por computador para codificação de áudio, dispositivo eletrônico e meio legível por computador não transitório

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685607A (ja) * 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JP2746039B2 (ja) * 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
JP3483958B2 (ja) * 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JPH08272395A (ja) * 1995-03-31 1996-10-18 Nec Corp 音声符号化装置
JP3616432B2 (ja) * 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
AU3708597A (en) * 1996-08-02 1998-02-25 Matsushita Electric Industrial Co., Ltd. Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus
CN1262994C (zh) * 1996-11-07 2006-07-05 松下电器产业株式会社 噪声消除器
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
JP2000172283A (ja) * 1998-12-01 2000-06-23 Nec Corp 有音検出方式及び方法
GB2357683A (en) * 1999-12-24 2001-06-27 Nokia Mobile Phones Ltd Voiced/unvoiced determination for speech coding
JP3566220B2 (ja) * 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
AU2002318813B2 (en) * 2001-07-13 2004-04-29 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
ES2237706T3 (es) * 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
JP2003323199A (ja) * 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
JP3881946B2 (ja) * 2002-09-12 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
JP4578145B2 (ja) * 2003-04-30 2010-11-10 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
CA2524243C (en) * 2003-04-30 2013-02-19 Matsushita Electric Industrial Co. Ltd. Speech coding apparatus including enhancement layer performing long term prediction
DE602004004950T2 (de) * 2003-07-09 2007-10-31 Samsung Electronics Co., Ltd., Suwon Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
GB0321093D0 (en) * 2003-09-09 2003-10-08 Nokia Corp Multi-rate coding
WO2005040749A1 (ja) * 2003-10-23 2005-05-06 Matsushita Electric Industrial Co., Ltd. スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法
US20050096898A1 (en) * 2003-10-29 2005-05-05 Manoj Singhal Classification of speech and music using sub-band energy
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
US7983904B2 (en) * 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
US7599833B2 (en) * 2005-05-30 2009-10-06 Electronics And Telecommunications Research Institute Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
DE602007013026D1 (de) * 2006-04-27 2011-04-21 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
SG136836A1 (en) * 2006-04-28 2007-11-29 St Microelectronics Asia Adaptive rate control algorithm for low complexity aac encoding

Also Published As

Publication number Publication date
EP3261090A1 (en) 2017-12-27
WO2009081568A1 (ja) 2009-07-02
US20100274558A1 (en) 2010-10-28
EP2224432A1 (en) 2010-09-01
US8423371B2 (en) 2013-04-16
JP5404418B2 (ja) 2014-01-29
CN101903945B (zh) 2014-01-01
EP2224432A4 (en) 2011-01-19
EP2224432B1 (en) 2017-03-15
JPWO2009081568A1 (ja) 2011-05-06
CN101903945A (zh) 2010-12-01

Similar Documents

Publication Publication Date Title
ES2629453T3 (es) Codificador, descodificador y procedimiento de codificación
ES2474915T3 (es) Dispositivo de codificación, dispositivo de decodificación y métodos correspondientes
JP5186054B2 (ja) マルチステージコードブックおよび冗長コーディング技術フィールドを有するサブバンド音声コーデック
KR101246991B1 (ko) 오디오 신호 처리 방법
EP2239731B1 (en) Encoding device, decoding device, and method thereof
JP5058152B2 (ja) 符号化装置および符号化方法
JP5449133B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5283046B2 (ja) ピーク検出に基づく選択的スケーリングマスク計算
JP5413839B2 (ja) 符号化装置および復号装置
ES2452300T3 (es) Dispositivo de alisamiento espectral, dispositivo de codificación, dispositivo de decodificación, dispositivo de terminal de comunicación, dispositivo de estación base y método de alisamiento espectral
JP4606418B2 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
US20100280833A1 (en) Encoding device, decoding device, and method thereof
KR20110131192A (ko) 부호화 장치, 복호 장치 및 이들 방법
US20100017197A1 (en) Voice coding device, voice decoding device and their methods
KR20040055916A (ko) 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2013057895A1 (ja) 符号化装置及び符号化方法
RU2414009C2 (ru) Устройство и способ для кодирования и декодирования сигнала
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2011045927A1 (ja) 符号化装置、復号装置およびこれらの方法