MX2011001253A - Dispositivo de filtrado espectral, dispositivo de codificacion, dispositivo de decodificacion, dispositivo de terminal de comunicacion, dispositivo de estacion base y metodo de filtrado espectral. - Google Patents

Dispositivo de filtrado espectral, dispositivo de codificacion, dispositivo de decodificacion, dispositivo de terminal de comunicacion, dispositivo de estacion base y metodo de filtrado espectral.

Info

Publication number
MX2011001253A
MX2011001253A MX2011001253A MX2011001253A MX2011001253A MX 2011001253 A MX2011001253 A MX 2011001253A MX 2011001253 A MX2011001253 A MX 2011001253A MX 2011001253 A MX2011001253 A MX 2011001253A MX 2011001253 A MX2011001253 A MX 2011001253A
Authority
MX
Mexico
Prior art keywords
section
sub
spectrum
band
linear transformation
Prior art date
Application number
MX2011001253A
Other languages
English (en)
Inventor
Hiroyuki Ehara
Toshiyuki Morii
Masahiro Oshikiri
Tomofumi Yamanashi
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Publication of MX2011001253A publication Critical patent/MX2011001253A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Abstract

Se describe un dispositivo de filtrado espectral con una estructura con la cual se lleva a cabo filtrado después de que se ha llevado a cabo una conversión no lineal para un espectro calculado a partir de una señal de audio, y con el cual la cantidad de cálculo de procesamiento se reduce significativamente mientras se conserva excelente calidad de audio. Con este dispositivo de filtrado espectral, una unidad de división de sub-bandas (102) divide un espectro de entrada en varias sub-bandas; una unidad de cálculo de valores representativos (103) calcula un valor representativo para cada sub-banda usando una media aritmética y una media geométrica; con respecto a cada valor representativo, una unidad de conversión no lineal (104) lleva a cabo una conversión no lineal cuya característica se enfatiza más al incrementarse el valor; y una unidad de filtrado (105) que filtra el valor representativo que ha sido sometido a la conversión no lineal para cada sub-banda, en el dominio de frecuencias.

Description

DISPOSITIVO DE FILTRADO ESPECTRAL, DISPOSITIVO DE CODIFICACION, DISPOSITIVO DE DECODIFICACION, DISPOSITIVO DE TERMINAL DE COMUNICACION, DISPOSITIVO DE ESTACION BASE Y METODO DE FILTRADO ESPECTRAL Campo de la Invención La presente invención se refiere a un aparato de filtrado de espectro, a un aparato de codificación, a un aparato de decodificación, a un aparato terminal de comunicación, a un aparato de estación base y a un método de filtrado de espectro para filtrar el espectro de señales de voz .
Antecedentes de la Invención Cuando señales de voz/audio son transmitidas en un sistema de comunicación por paquetes tipificado por comunicación por Internet y un sistema de comunicación móvil, comúnmente se usa una técnica de compresión/codificación para mejorar la velocidad de transmisión de las señales de voz/audio. Además, en años recientes, además de una demanda por codificar de manera simple señales de voz/audio a bajas velocidades de bits, existe una demanda cada vez más alta por una técnica para codificar señales de voz/audio en alta calidad.
Para satisfacer esta demanda, se están llevando a cabo estudios para desarrollar varias técnicas para llevar a REF . : 216819 cabo transformación ortogonal (es decir, transformación de tiempo- frecuencia) de una señal de voz para extraer componentes de frecuencia (es decir espectro) de la señal de voz y aplicar diferentes procesamientos tales como transformación lineal y transformación no lineal en el espectro calculado para mejorar la calidad de la señal decodificada (véase, por ejemplo, literatura de patente 1) . De acuerdo con el método descrito en la literatura de patente 1, primero, un espectro de frecuencias contenido en una señal de voz de cierta longitud de tiempo es analizado, y después procesamiento de transformación no lineal para enfatizar valores de potencia de espectro más altos es aplicado al espectro analizado. Luego, procesamiento de filtrado lineal para el espectro sometido a procesamiento de transformación no lineal, se lleva a cabo en el dominio de frecuencias. Después de esto, procesamiento de transformación no lineal inverso se lleva a cabo para cancelar las características de transformación no lineal, y, además, procesamiento de filtrado inverso se lleva a cabo para cancelar características de filtrado, de tal forma que los componentes de ruido incluidos en la señal de voz sobre la banda completa sean suprimidos. Así, con el método descrito en la literatura de patente 1, todas las muestras de un espectro adquiridas de una señal de voz son sujetas a procesamiento de transformación no lineal y luego el espectro es filtrado, por lo que la señal de voz se adquiere en buena calidad. La literatura de patente 1 introduce métodos de transformación tales como transformación de potencia y transformación logarítmica como ejemplos de procesamiento no lineal.
Lista de citas Literatura de patente PTL i Solicitud de patente japonesa abierta al público No. 2002-244695 PTL 2 WO 2007/037361 Literatura que no es patente NPL 1 Yuichiro Takamizawa, Toshiyuki Nomura y Masao Ikekawa, "High-Quality and Processor-Efficient Implementation of an MPEG-2 AAC Encoder" , IEICE TRANS . INF. & SYST . , VOL . E86-D, No. 3 Marzo 2003.
Breve Descripción de la Invención Problema técnico Sin embargo, con el método descrito en la literatura de patente 1, procesamiento de transformación no lineal tiene que llevarse a cabo para todas las muestras de un espectro adquirido a partir de una señal de voz, y por lo tanto existe el problema de que la cantidad de procesamiento de cálculo es enorme. Además, si sólo parte de las muestras de un espectro son extraídas para reducir la cantidad de procesamiento de cálculo, calidad de voz suficientemente alta no puede siempre lograrse simplemente al llevar a cabo filtrado del espectro después de transformación no lineal.
Con base en una configuración para llevar a cabo transformación no lineal de un valor de espectro calculado a partir de una señal de voz y luego filtrar el espectro, un objetivo de la presente invención es proporcionar un aparato de filtrado de espectro, un aparato de codificación, un aparato de decodificación, un aparato de terminal de comunicación, un aparato de estación base y un método de filtrado de espectro, con lo cual la adecuada calidad de voz se mantiene y la cantidad de procesamiento de cálculo puede reducirse sustancialmente .
Solución al problema El aparato de filtrado de espectro de acuerdo con la presente invención emplea una configuración que incluye: una sección de transformación de tiempo-frecuencia que lleva a cabo una transformación de tiempo- frecuencia de una señal de entrada y genera un componente de frecuencia; una sección de división de sub-banda que divide el componente de frecuencia en una pluralidad de sub-bandas; una sección de cálculo de valores representativos que calcula un valor representativo de cada sub-banda dividida al calcular una media aritmética y usando un cálculo de multiplicación que utiliza un resultado de cálculo de la media aritmética; una sección de transformación no lineal que lleva a cabo una transformación no lineal de valores representativos de las sub-bandas; y una sección de filtrado que filtra los valores representativos sujetos a la transformación no lineal en el dominio de frecuencias.
El método de filtrado de espectro de acuerdo con la presente invención incluye: una etapa de transformación de tiempo- frecuencia para llevar a cabo una transformación de tiempo-frecuencia de una señal de entrada y genera un componente de frecuencia; una etapa de división de sub-banda para dividir el componente de frecuencia en una pluralidad de sub-bandas; una etapa de cálculo de valores representativos para calcular un valor representativo de cada sub-banda dividida al calcular una media aritmética y usando un cálculo de multiplicación utilizando un resultado del cálculo de la media aritmética; una etapa de transformación no lineal para llevar a cabo una transformación no lineal de valores representativos de las sub-bandas; y una etapa de filtrado para filtrar los valores representativos sujetos a la transformación no lineal en el dominio de frecuencias.
Efectos adecuados de la invención Con la presente invención, es posible mantener adecuada calidad de voz y reducir la cantidad de procesamiento de cálculo sustancialmente.
Breve Descripción de las Figuras Las figuras 1A, IB, 1C y ID proporcionan perspectivas generales de espectro que muestran una perspectiva general del procesamiento de acuerdo con la modalidad 1 de la presente invención.
La figura 2 es un diagrama de bloques que muestra una configuración de las partes principales de un aparato de filtrado de espectro de acuerdo con la modalidad 1.
La figura 3 es un diagrama de bloques que muestra una configuración de partes principales de una sección de cálculo de valores representativos de acuerdo con la modalidad 1.
La figura 4 es una perspectiva general que muestra una configuración de sub-bandas y sub-grupos de una señal de entrada de acuerdo con la modalidad 1.
La figura 5 es un diagrama de bloques que muestra una configuración de un sistema de comunicación que tiene un aparato de codificación y un aparato de decodificación de acuerdo con la modalidad 2 de la presente invención.
La figura 6 es un diagrama de bloques que muestra una parte principal interior del aparato de codificación de acuerdo con la modalidad 2 mostrada en la figura 5.
La figura 7 es un diagrama de bloques que muestra una configuración de partes principales interiores de la sección de codificación de segunda capas de acuerdo con la modalidad 2 mostrada en la figura 6.
La figura 8 es un diagrama de bloques que muestra una configuración de partes principales del aparato de filtrado de espectro de acuerdo con la modalidad 2 mostrada en la figura 7.
La figura 9 muestra un diagrama para explicar los detalles del procesamiento de filtración en la sección de filtración de acuerdo con la modalidad 2 mostrada en la figura 7.
La figura 10 es un diagrama de flujo para explicar las etapas de procesamiento para buscar coeficiente de separación óptimo de Tp' con respecto a la sub-banda SBP en la sección de búsqueda de acuerdo con la modalidad 2 mostrada en la figura 7.
La figura 11 es un diagrama de bloques que muestra una configuración de partes principales internas del aparato de decodificación de acuerdo con la modalidad 2 mostrado en la figura 5 y La figura 12 es un diagrama de bloques que muestra una configuración de partes principales internas de la segunda sección de decodificación de capas de acuerdo con la modalidad 2 mostrada en la figura 11.
Descripción Detallada de la Invención Las modalidades de la presente invención se describirán en detalle con referencia a las figuras acompañantes .
Modalidad 1 Primero, se describirá usando la figura 1 una perspectiva general del método de filtrado de espectro de acuerdo con una modalidad de la presente invención. La figura 1 muestra diagramas de espectro para explicar una perspectiva general de un método de filtrado de espectro de acuerdo con la presente modalidad.
La figura 1A muestra un espectro de una señal de entrada. Con la presente modalidad, primero, un espectro de señales de entrada se divide en una pluralidad de sub-bandas . La figura IB muestra cómo un espectro de señal de entrada se divide en una pluralidad de sub-bandas. El diagrama de espectro de la figura 1 es para explicar una perspectiva general de la presente invención, y la presente invención, y la presente invención de ninguna manera debe ser limitada al número de sub-bandas mostradas en la figura.
Después, se calcula un valor representativo de cada sub-banda. Para ser más específicos, muestras en una sub-banda se dividen más en una pluralidad de sub-grupos. Después, una media aritmética de valores de espectro absolutos es calculada por sub-grupo.
Después, una media geométrica de los valores de la media aritmética de sub-grupos individuales es calculada por sub-banda. Este valor de media geométrica no es un valor de media geométrica preciso aún, y, en este punto, un valor que se obtiene al multiplicar simplemente valores de media aritmética de grupos individuales puede ser calculado, y un valor de media geométrica preciso se puede encontrar después de transformación no lineal (descrita más adelante) . El procesamiento anterior es para reducir la cantidad de procesamiento de cálculo, y es igualmente posible encontrar un valor de media geométrica preciso en este punto.
Un valor de media geométrica encontrado de esta manera se puede usar como un valor representativo de cada sub-banda. La figura 1C muestra valores representativos de sub-bandas individuales sobre un espectro de señales de entrada mostrado con líneas punteadas. Para facilidad de explicación, la figura 1C muestra valores de media geométrica precisos como valores representativos, en lugar de valores obtenidos simplemente al multiplicar valores de media aritmética de sub-grupos individuales.
Después, al referirse al valor representativo de cada sub-banda, se lleva a cabo transformación no lineal (por ejemplo, transformación logarítmica) para un espectro de una señal de entrada de tal manera que valores de potencia de espectro más grandes sean enfatizados, y después se lleva a cabo procesamiento de filtrado en el dominio de frecuencias. Posteriormente, se lleva a cabo transformación no lineal inversa (por ejemplo, transformación logarítmica inversa) , y un espectro filtrado se calcula en cada sub-banda. La figura ID muestra un espectro filtrado de cada sub-banda sobre un espectro de señales de entrada mostrado con líneas punteadas.
Por medio de este procesamiento, es posible llevar a cabo filtrado de espectro en el dominio logarítmico mientras se reduce la degradación en la calidad de voz y se reduce la cantidad de procesamiento de cálculo sustancialmente . Ahora, se describirá una configuración de un aparato de filtrado de espectro que proporciona la ventaja anterior, de acuerdo con una modalidad de la presente invención .
El aparato de filtrado de espectro de acuerdo con la presente modalidad filtra un espectro de entrada, y envía el espectro después del filtrado (en adelante "espectro filtrado") como una señal de salida. Para ser más específicos, el aparato de filtrado de espectro divide una señal de entrada cada N muestras (en donde N es un número natural) , y lleva a cabo procesamiento de filtrado por cuadro usando N muestras como un cuadro. Aquí, una señal de entrada que es el objeto de procesamiento de filtrado se representa como "xn" (n = 0, N = 1) .
La figura 2 muestra una configuración de partes principales del aparato de filtrado de espectro 100 de acuerdo con la presente modalidad.
El aparato de filtrado de espectro 100 mostrado en la figura 2 se forma principalmente con la sección de procesamiento de transformación de tiempo-frecuencia 101, sección de división de sub-bandas 102, sección de cálculo de valores representativos 103, sección de transformación no lineal 104, sección de filtrado 105 y sección de transformación no lineal inversa 106.
La sección de procesamiento de transformación de tiempo-frecuencia 101 aplica una transformación de Fourier rápida (FFT) a la señal de entrada xn y encuentra un espectro de componente de frecuencia Sl(k) (en adelante "espectro de entrada" ) .
Después, la sección de procesamiento de transformación de tiempo-frecuencia 101 envía el espectro de entrada Sl(k) a la sección de división de sub-banda 102.
La sección de división de sub-bandas 102 divide el espectro de entrada SI (k) recibido como entrada de la sección de procesamiento de transformación de tiempo-frecuencia 101, en P sub-bandas (en donde P es un entero igual a o mayor que 2) . Ahora, se describirá un caso abajo en donde la sección de división de sub-bandas 102 divide el espectro de entrada SI (k) de tal manera que cada sub-banda contenga el mismo número de muestras. El número de muestras puede variar entre sub-bandas. La sección de división de sub-bandas 102 envía los espectros divididos por sub-banda (en adelante "espectros de sub-bandas"), a la sección de cálculo de valores representativos 103.
La sección de cálculo de valores representativos 103 calcula un valor representativo para cada sub-banda de un espectro de entrada dividido en sub-bandas, recibido como entrada desde la sección de división de sub-bandas 102, y envía el valor representativo calculado por sub-banda, a la sección de transformación no lineal 104. El procesamiento en la sección de cálculo de valores representativos 103 se describirá en detalle más adelante.
La figura 3 muestra una configuración interior de la sección de cálculo de valores representativos 103. La sección de cálculo de valores representativos 103 mostrada en la figura 3 tiene la sección de cálculo de media aritmética 201 y la sección de cálculo de media geométrica 202.
Primero, la sección de división de sub-bandas 102 envía un espectro de sub-banda a la sección de cálculo de media aritmética 201.
La sección de cálculo de media aritmética 201 divide cada sub-banda del espectro de sub-bandas recibido como entrada en Q sub-grupos del sub-grupo 0, sub-grupo Q-l, etc. (en donde Q es un entero igual a o mayor que 2) . Ahora, se describirá abajo un caso en el que Q sub-grupos se forman cada uno con R muestras (R es un entero igual a o mayor que 2) . Aunque se describirá un caso abajo en donde Q sub-grupos se forman todos con R muestras, el número de muestras puede variar entre sub-grupos.
La figura 4 muestra una configuración de muestra de sub-bandas y sub-grupos. La figura 4 muestra, como un ejemplo, un caso en donde el número de muestras que constituirán una sub-banda es ocho, el número de sub-grupos Q que constituirán una sub-banda es dos y el número de muestras R en un sub-grupo es cuatro.
Luego, para cada uno de los sub-grupos Q, la sección de cálculo de media aritmética 201 calcula una media aritmética de los valores absolutos de los espectros (coeficientes FFT) contenidos en cada sub-grupo, usando la ecuación 1.
Ecuación 1 En la ecuación 1, AVElq es una media aritmética de los valores absolutos de los espectros contenidos en el sub-grupo q, y PSq es el índice de la muestra principal en el sub-grupo q- Después, la sección de cálculo de media aritmética 201 envía los espectros de valores de media aritmética calculados por sub-banda, AVElq (q = 0 ~ Q-l) (espectros de valor de medias aritméticas de sub-banda) a la sección de cálculo de media geométrica 202.
La sección de cálculo de media geométrica 202 multiplica los espectros de valor de media aritmética AVElq (q = 0 ~ Q-l) de todas las sub-bandas recibidas como entrada desde la sección de cálculo de media aritmética 201, como se muestra en la ecuación 2, y calcula un espectro representativo, AVE2P (p = 0 ~ P-l) , para cada sub-banda.
Ecuación 2 En la ecuación 2, P es el número de sub-bandas.
Después, la sección de cálculo de media geométrica 202 envía espectros de valor representativo de sub-banda calculados AVE2p (p = 0 ~ P-l) a la sección de transformación no lineal 104.
La sección de transformación no lineal 104 aplica transformación no lineal que tiene una característica de enfatizar valores representativos más grandes, a los espectros de valor representativos de sub-banda AVE2P, recibidos como entrada desde la sección de cálculo de media geométrica 202, usando la ecuación 3, y calcula primeros espectros de valores representativos logarítmicos de sub-banda, AVE3P (p = 0 ~ P-l) . Se describirá un caso en donde la transformación logarítmica se lleva a cabo como procesamiento de transformación no lineal.
A VE3p=\ogw {A VE2p ) (p = Q, - P- l) - (3) Ecuación 3 Después, un segundo espectro de valor representativo logarítmico de sub-banda, AVE4P (p = 0 ~ P-l) , se calcula al multiplicar el primer espectro de valor representativo logarítmico de sub-banda calculado, AVE3P (p = 0 ~ P-l) por el recíproco del número de los sub-grupos, Q, usando la ecuación 4.
AVE3„ . .
AVE4p=—-^L (p = 0,-P-í) - (4) Ecuación 4 Aunque en el procesamiento de la ecuación 2 en la sección de cálculo de media geométrica 202 los espectros de valor de media aritmética de sub-banda AVE1P de sub-bandas individuales se multiplican simplemente, en el procesamiento de la ecuación 4 en la sección de transformación no lineal 104, se calcula una media geométrica. Con la presente modalidad, la transformación en el dominio logarítmico se lleva a cabo usando la ecuación 3, y después la multiplicación por el recíproco del número de sub-grupos, Q, se lleva a cabo usando la ecuación 4. Mediante este medio, el cálculo de la raíz radical, que incluye una gran cantidad de cálculo, puede reemplazarse por una simple división. Además, cuando el número de sub-grupos, Q, es una constante, el cálculo de la raíz radical puede reemplazarse por multiplicación simple, al calcular el recíproco de Q por adelantado, de tal forma que la cantidad de cálculo pueda reducirse más .
Después, la sección de transformación no lineal 104 envía segundos espectros de valor representativo logarítmico de sub-banda AVE4P (p = 0 P-l) calculados usando la ecuación 4, para filtrar la sección de filtrado 105.
En referencia de nuevo a la figura 2, la sección de filtrado 105 filtra segundos espectros de valor representativos logarítmicos de sub-banda AVE4P (p = 0 ~ P-l) recibidos como entrada desde la sección de transformación no lineal 104, en el dominio de frecuencias, usando la ecuación 5, y calcula espectros filtrados logarítmicos AVE5P (p = 0 ~ P.-l) .
... Ecuación 5 La ecuación 5 representa procesamiento de filtración de suavizado, y, en esta ecuación 5, MA_LEN es el orden de filtración de suavizado y Wi es la ponderación de filtro de filtrado.
Además, en la ecuación 5 se proporciona un método para calcular un espectro filtrado logarítmico cuando el índice de sub-banda p es >= (MA_LE - 1 ) / 2 y p<=P-l- (MA_LEN-l)/2. Cuando el índice de sub-banda p está en la parte superior o cerca del final, los espectros son filtrados usando la ecuación 6 y la ecuación 7 tomando en cuenta las condiciones limítrofes.
MA LEN - A VE5p = ^ AVE4 Wt \ 0=p < (6) MA LEN - \ , p + +1 Ecuación 6 ( _ , MA LEN - X „ , P - \ = < p < P - \ _ , MA LEN - \ , P - \ - p + = +1 - (7) Ecuación 7 Además, la sección de filtrado 105 lleva a cabo filtrado con un base en un promedio de movimiento simple, como procesamiento de filtrado por procesamiento de filtración de suavizado, como se describió arriba (cuando Wi es 1 para todas las i's, el filtrado se lleva a cabo con base en el promedio de movimiento) . Para la función de ventana (ponderación) , una ventana de Haning u otras funciones de ventana pueden ser usadas .
Después, la sección de filtrado 105 envía espectros filtrados calculados AVE5P (p = 0 ~ P-l) a la sección de transformación no lineal inversa 106.
La sección de transformación no lineal inversa 106 lleva a cabo transformación logarítmica inversa como transformación no lineal inversa para espectros filtrados logarítmicos AVE5P (p = 0 ~ P-l) recibidos como entrada desde la sección de filtrado 105. La sección de transformación no lineal inversa 106 lleva a cabo transformación logarítmica inversa para los espectros filtrados logarítmicos AVE5P (p = 0 ~ P-l) usando la ecuación 8, y calcula el espectro filtrado AVE6P (p = 0 ~ P-l) .
AVE6p = 10"iS' {p = , - P-\) -¦¦ (8) Ecuación 8 Además, la sección de transformación no lineal inversa 106 calcula un espectro filtrado de todas las muestras usando los valores de muestras en cada sub-banda como los valores de espectro filtrado de dominio lineal AVE6P (p = 0 ~ P-l) .
La sección de transformación no lineal inversa 106 envía los valores de espectro filtrados de todas las muestras como un resultado de procesamiento del aparato de filtrado de espectro 100.
El aparato de filtrado de espectros y el método de filtrado de espectro de acuerdo con la presente invención han sido descritos.
Como se describió arriba, con la presente modalidad, la sección de división de sub-bandas 102 divide un espectro de entrada en una pluralidad de sub-bandas, la sección de cálculo de valores representativos 103 calcula valores representativos por sub-banda usando una media aritmética o media geométrica, la sección de transformación no lineal 104 lleva a cabo transformación no lineal que tiene una característica de enfatizar valores más grandes a cada valor representativo, y la sección de filtrado 105 filtra valores representativos sujetos a transformación no lineal por sub-banda en el dominio de frecuencias.
De esta manera, todas las muestras de un espectro se dividen en una pluralidad de sub-bandas, y, para cada sub-banda, se encuentra un valor representativo al combinar una media aritmética con cálculo de multiplicación o media geométrica, y luego se lleva a cabo el filtrado después de que el valor representativo sea sometido a transformación no lineal, por lo que es posible mantener adecuada calidad de voz y reducir la cantidad de procesamiento de cálculo sustancialmente .
Como se describió arriba, la presente invención emplea una configuración para calcular valores representativos de sub-bandas al combinar medias aritméticas y medias geométricas de muestras en sub-bandas, por lo que es posible evitar la degradación de la calidad de voz que puede ocurrir debido a la variación de la escala de valores de muestra en una sub-banda cuando valores promedio en el dominio lineal se usen simplemente como valores representativos de sub-bandas.
Aunque la transformación de Fourier rápida (FFT) ha sido explicada como un ejemplo de procesamiento de transformación de tiempo-frecuencia con la presente modalidad, la presente invención por ningún motivo debe ser limitada a esto, y otros métodos de transformación de tiempo-frecuencia aparte de la transformación de Fourier rápida (FFT) son igualmente aplicables. Por ejemplo, de acuerdo con la literatura de patente 1, después del cálculo de valores de enmascarado perceptual (véase figura 2) , la transformación de coseno discreto modificada (MDCT) , no la transformación de Fourier rápida (FFT) , se usa para calcular componentes de frecuencia (espectro) . De esta manera, la presente invención es aplicable a configuraciones que usan la transformación de coseno discreta modificada (MDCT) y otros métodos de transformación de tiempo- frecuencia en una sección de procesamiento de transformación de tiempo-frecuencia .
En la configuración descrita arriba, la sección de cálculo de media geométrica 202 multiplica un espectro de valor de media aritmética AVElq (q = 0 ~ Q-l) , y no calcula raíces radicales. Es decir, hablando estrictamente, la sección de cálculo de media geométrica 202 no calcula valores de media geométrica, porque, como se explicó arriba, en la sección de transformación no lineal 104, la transformación en el dominio logarítmico se lleva a cabo usando la ecuación 3 como procesamiento de trans ormación no lineal y luego la multiplicación por el recíproco del número de sub-grupos Q se lleva a cabo usando la ecuación 4, por lo que es posible reemplazar el cálculo de raíz radical por simple división (multiplicación) y en consecuencia reducir la cantidad de cálculo .
En consecuencia, la presente invención no está necesariamente limitada a la configuración anterior. La presente invención es igualmente aplicable a, por ejemplo, una configuración para multiplicar, en la sección de cálculo de media geométrica 202, espectros de valor de media aritmética AVElq (q = 0 ~ Q-l) por los valores de espectros de valor de media aritmética por sub-banda, y luego calcular una raíz radical del número de sub-grupos y enviar la raíz radical calculada a la sección de transformación no lineal 104 como espectros de valor representativo de sub-banda AVE2P (p = 0 ~ P-l) . De cualquier forma, la sección de filtrado 105 es capaz de adquirir un valor representativo que haya sido sujeto a transformación no lineal, por sub-banda. En este caso, el cálculo de la ecuación 4 en la sección de transformación no lineal 104 puede ser omitido.
Se ha descrito un caso arriba con la presente modalidad en donde un valor representativo de cada sub-banda se calcula al, primero, calcular un valor de media aritmética de un sub-grupo, y después buscar un valor de media geométrica de los valores de media aritmética de todos los sub-grupos en una sub-banda. Sin embargo, la presente invención por ningún motivo debe limitarse a esto y es igualmente aplicable a un caso en donde, por ejemplo, el número de muestras que constituyen un sub-grupo es 1, es decir, un caso en donde un valor de media geométrica de todas las muestras en una sub-banda se use como un valor representativo de la sub-banda sin calcular un valor de media aritmética de cada sub-grupo. En esta configuración de nuevo, como se describió arriba, en lugar de calcular un valor de media geométrica preciso, es posible calcular un valor de media geométrica en el dominio logarítmico al llevar a cabo transformación no lineal y luego llevar a cabo multiplicación por el recíproco del número de sub-grupos.
En la descripción anterior, todas las muestras en una sub-banda tienen el mismo valor de espectro en la sección de transformación no lineal inversa 106. Sin embargo, la presente invención por ningún motivo está limitada a esto, y es igualmente posible proporcionar una sección de procesamiento de filtrado inverso después de la sección de transformación no lineal inversa 106 de tal manera que la sección de procesamiento de filtrado inverso pueda asignar peso a muestras en cada sub-banda y llevar a cabo procesamiento de filtrado inverso. Este procesamiento de filtrado inverso no tiene que ser completamente opuesto a la sección de filtrado 105.
Aunque se ha descrito un caso con la descripción anterior en donde la sección de transformación no lineal 104 lleva a cabo transformación logarítmica inversa como procesamiento de transformación no lineal inverso y la sección de transformación no lineal inversa 106 lleva a cabo transformación logarítmica inversa como procesamiento de transformación no lineal inverso, esto de ninguna manera es limitativo, y es igualmente posible usar transformación de potencia y otros y llevar a cabo procesamiento inverso de transformación no lineal como procesamiento de transformación no lineal inverso. Sin embargo, dado que el cálculo de una raíz radical puede ser reemplazado por división simple (multiplicación) al multiplicar el recíproco del número de sub-grupos Q usando la ecuación 4, el hecho de que la sección de transformación no lineal 104 lleve a cabo transformación logarítmica como transformación no lineal, debe compensar la reducción de la cantidad de cálculo. En consecuencia, si procesamiento que sea diferente a la transformación logarítmica se lleva a cabo como procesamiento de transformación no lineal, es entonces igualmente posible calcular un valor representativo por sub-banda al calcular un valor de media geométrica de valores de media aritmética de sub-grupos y aplicar procesamiento no lineal a los valores representativos .
Además, en cuanto al número de sub-bandas y el número de sub-grupos, si, por ejemplo, la frecuencia de muestreo de una señal de entrada es 32 kHz y un cuadro es 20 mseg de largo, es decir, si una señal de entrada comprende 640 muestras, es posible, por ejemplo, establecer el número de sub-bandas en ochenta, el número de sub-grupos en dos, el número de muestras por sub-grupo en cuatro y el orden de filtración de suavizado en siete, por ejemplo. La presente invención por ningún motivo está limitada a este ajuste y es igualmente aplicable a casos en los que valores diferentes sean aplicados.
El aparato de filtrado de espectro y el método de filtrado de espectro de acuerdo con la presente invención son aplicables a cualquiera y todos los dispositivos o componentes de filtrado de espectro que lleven a cabo filtrado en el dominio espectral, incluyendo aparato de codificación de voz y método de codificación de voz, aparato de decodificación de voz y método de decodificación de voz y aparato de reconocimiento de voz y método de reconocimiento de voz. Por ejemplo, aunque, con la técnica de incremento de ancho de banda descrita en la literatura de patente 2, el procesamiento para calcular una envoltura espectral a partir de LPCs (Coeficientes Predictivos Lineales) , y, con base en esta envoltura espectral calculada, remover la envoltura espectral del espectro de banda inferior, se usa para calcular parámetros para generar un espectro de banda más alta, es igualmente posible usar un espectro filtrado calculado al aplicar el método de filtrado de espectro de acuerdo con la presente invención a un espectro de banda inferior en lugar de la envoltura espectral usada en el procesamiento de remoción de envoltura espectral en la literatura de patente 2.
Además, aunque se ha explicado una configuración con la presente modalidad en donde un espectro de entrada SI (k) se divide en P sub-bandas (en donde P es un entero igual a o mayor que 2) todos teniendo el mismo número de muestras, la presente invención por ningún motivo se debe limitar a esto y es igualmente aplicable a una configuración en la cual el número de muestras varíe entre sub-bandas. Por ejemplo, es posible una configuración en la cual sub-bandas se dividan de tal manera que una sub-banda en un lado de banda inferior tenga un número más pequeño de muestras y una sub-banda en el lado de banda superior tenga un mayor número de muestras. Hablando generalmente, en percepción humana, la resolución de frecuencia disminuye en el lado de banda superior, por lo que un filtrado de espectro más eficiente se hace posible con la configuración anterior. Lo mismo aplica a sub-grupos para constituir cada sub-banda. Aunque se ha descrito arriba un caso con la presente modalidad en donde Q sub-grupos se forman todos con R muestras, la presente invención por ningún motivo está limitada a esto, y es igualmente aplicable a configuraciones en donde sub-grupos se dividan de tal manera que un sub-grupo en el lado de banda inferior tenga un número más pequeño de muestras y un sub-grupo en el lado de banda superior tenga un número más grande de muestras.
Aunque el promedio de movimiento ponderado ha sido descrito como un ejemplo de procesamiento de filtrado con la presente modalidad, la presente invención por ningún motivo está limitada a esto y es igualmente aplicable a varios procesamientos de filtrado. Por ejemplo, como se describió arriba, en una configuración en la cual el número de muestras varía entre sub-bandas (es decir, el número de muestras se incrementa en la banda superior) , es posible hacer que el número de tomas en un filtro promedio en movimiento que no sea el mismo entre la izquierda y la derecha e incrementar el número de tomas en la banda superior. Cuando el número de muestras se incrementa en sub-bandas en la banda superior, es posible llevar a cabo perceptualmente procesamiento de filtrado más adecuado usando un filtro promedio en movimiento que tenga un pequeño número de tomas en el lado de banda superior. La presente invención es aplicable a casos usando un filtro promedio de movimiento que sea asimétrico entre la izquierda y la derecha y tenga un mayor número de tomas en el lado de banda superior.
Modalidad 2 Se describirá ahora una configuración con la presente modalidad en la que el procesamiento de filtrado de espectro explicado con la modalidad 1 se usa en procesamiento preparatorio después de codificación de incremento de banda descrito en la literatura de patente 2.
La figura 5 es un diagrama de bloques que muestra una configuración de un sistema de comunicación que tiene un aparato de codificación y aparato de decodificación de acuerdo con la modalidad 2. En la figura 5, el sistema de comunicación tiene un aparato de codificación y aparato de decodificación que son mutuamente comunicables por medio de un canal de transmisión. El aparato de codificación y aparato de decodificación son montados normalmente en un aparato de estación base y aparato de terminal de comunicación para usarse.
El aparato de codificación 301 divide una señal de entrada cada N muestras (en donde N es un número natural) y lleva a cabo codificación sobre una base por cuadro usando N muestras como un cuadro. La señal de entrada que será sujeta a codificación es representada como xn (n = 0, N-l) . n es el (n+1) 0 componente de señal en la señal de entrada dividido entre N muestras. La información de entrada que ha sido sujeta a codificación (información codificada) es transmitida al aparato de decodificación 303 por medio del canal de transmisión 302.
El aparato de decodificación 303 recibe la información codificada transmitida desde el aparato de codificación 301 por medio del canal de transmisión 302, y, al decodificar esto, adquiere una señal de salida.
La figura 6 es un diagrama de bloques que muestra una configuración de partes principales interiores del aparato de codificación 301. Si la frecuencia de muestreo de señales SRinput/ la sección de procesamiento de sub-muestreo 311 sub-muestrea la frecuencia de muestreo de señal de entrada a partir de SRinput a SRbase (SRbase < SRinput) y envía la señal de entrada después del sub-muestreo a la sección de codificación de primera capa 312 como una señal de entrada sub-muestreada .
La sección de codificación de primera capa 312 genera información codificada de primera capa al codificar la señal de entrada sub-muestreada recibida como entrada desde la sección de procesamiento de sub-muestreo 311, usando un método de codificación de voz de un esquema CELP (predicción lineal excitada por códigos) , y envía la información codificada de primera capa generada a la sección de decodificación de primera capa 313 y a la sección de integración de información codificada 317.
La sección de decodificación de primera capa 313 genera una señal decodificada de primera capa al decodificar la información codificada de primera capa recibida como entrada desde la sección de codificación de primera capa 312, usando, por ejemplo, un método de decodificación de voz CELP, y envía la señal decodificada de primera capa generada a la sección de procesamiento de sobre-muestreo 314.
La sección de procesamiento de sobre-muestreo 314 sobre-muestrea la frecuencia de muestreo de la señal de entrada recibida como entrada desde la sección de decodificación de primera capa 313 a partir de SRbaSe a SRinput, y envía la señal de primera capa decodificada después del sobre-muestreo a la sección de procesamiento de transformación de tiempo- frecuencia 315 como una señal decodificada de primera capa sobre-muestreada.
La sección de retraso 318 da un retraso de una longitud predeterminada a la señal de entrada. Este retraso es para corregir el retraso de tiempo en la sección de procesamiento de sub-muestreo 311, sección de codificación de primera capa 312, sección de decodificación de primera capa 313 y sección de procesamiento de sobre-muestreo 314.
La sección de procesamiento de transformación de tiempo-frecuencia 315 tiene memoria temporal bufln y buf2n (n = 0, N-l) en su interior, y aplica una transformación de coseno discreta modificada (MDCT) a la señal de entrada xn y la señal decodificada de primera capa sobre-muestreada yn recibida como entrada desde la sección de procesamiento de sobre-muestreo 314.
Después, el procesamiento de transformación ortogonal en la sección de procesamiento de transformación de tiempo- frecuencia 315 será descrito en cuanto a su etapa de cálculo y envío de datos a memorias de almacenamiento temporal internas .
Primero, la sección de procesamiento de transformación de tiempo-f ecuencia 315 inicializa bufln y buf2n usando el valor inicial "0" de acuerdo con la ecuación 9 y ecuación 10 abajo. buf\„ = 0(n = 0, ...,N-l) Ecuación 9 bu/2n = 0(n = 0, ...,N-\) Ecuación 10 Después, la sección de procesamiento de transformación de tiempo- frecuencia 315 lleva a cabo una MDCT de la señal de entrada xn y la señal decodificada de primera capa sobre-muestreada yn, y encuentra el coeficiente MDCT S2 (k) de la señal de entrada (en adelante "espectro de entrada") y el coeficiente MDCT SI (k) de la señal decodificada de primera capa sobre-muestreada yn (en adelante "espectro decodificado de primera capa").
Ecuación 11 Ecuación 12 K es el índice de cada muestra en un cuadro. La sección de procesamiento de transformación de tiempo-frecuencia 315 encuentra xn< , que es un vector que combina la señal de entrada xn y la memoria de almacenamiento temporal bufln a partir de la ecuación 13 abajo. la sección de procesamiento de transformación de tiempo-frecuencia 315 encuentra también yn que es un vector que combina la señal decodificada de primera capa sobre-muestreada yn y la memoria de almacenamiento temporal buf2n- buf\n (« = 0,— iV-l) ( 1 3 ) (» = N,-2N-1) Ecuación 13 Ecuación 14 Después, la sección de procesamiento de transformación de tiempo- frecuencia 315 actualiza la memoria de almacenamiento temporal bufln y buf2n usando la ecuación 15 y la ecuación 16. bufln = xn(n = 0,...,N-l) Ecuación 15 bufln=y„(n = 0,...,N-l) Ecuación 16 Luego, la sección de procesamiento de transformación de tiempo-frecuencia 315 envía el espectro de entrada S2 (k) y el espectro decodificado de primera capa SI (k) a la sección de codificación de segunda capa 316.
La sección de codificación de segunda capa 316 genera información codificada de segunda capa usando el espectro de entrada S2 (k) y espectro decodificado de primera capa Sl(k) recibido como entrada desde la sección de procesamiento de transformación de tiempo-frecuencia 315, y envía la información codificada de segunda capa generada a la sección de integración de información codificada 317. Los detalles de la sección de codificación de segunda capa 316 se describirán más adelante.
La sección de integración de información codificada 317 integra la información codificada de primera capa recibida como entrada desde la sección de codificación de primera capa 312 y la información codificada de segunda capa recibida como entrada desde la sección de codificación de segunda capa 316, y, si es necesario, adjunta un código de corrección de error de transmisión al código de origen de información integrada, y envía el resultado al canal de transmisión 302 como información codificada.
La configuración de partes principales interiores de la sección de codificación de segunda capa 316 mostrada en la figura 6 se describirá a continuación usando la figura 7.
La sección de codificación de segunda capa 316 tiene la sección de división de bandas 360, sección de filtrado de espectro 361, sección de ajuste de estado de filtro 362, sección de filtración 363, sección de búsqueda 364, sección de ajuste de coeficiente de separación 365, sección de codificación de ganancia 366 y sección multiplexora 367, y estas secciones llevan a cabo las siguientes operaciones.
La sección de división de bandas 360 divide la parte de banda superior (FL < = k < F H) del espectro de entrada S2 (k) recibido como entrada desde la sección de procesamiento de transformación de tiempo-frecuencia 315 en P sub-bandas SBP (p = 0, 1, P-l) . Después, la sección de división de bandas 360 envía el ancho de banda BWP (p = 0, 1, P-l) e índice delantero BSP (p = 0, 1, P-l) (FL < = BSP < FH) de cada sub-banda dividida a la sección de filtración 363, sección de búsqueda 364 y sección multiplexora 367 como información de división de bandas. La parte en el espectro de entrada S2 (k) que corresponde a la sub-banda SBP será referida como espectro de sub-banda S2P (k) (BSP < = k < BSP + B p) .
La sección de filtrado de espectro 361 aplica procesamiento de filtrado al espectro decodificado de primera capa Sl(k) (0 < = k < FL) recibido como entrada desde la sección de procesamiento de trans ormación de tiempo-frecuencia 315, envía el espectro decodificado de primera capa filtrado SI' (k) (0 < = k < FL) después del procesamiento de filtrado, a la sección de ajuste de estado de filtro 362.
La figura 8 muestra una configuración interna de la sección de filtrado de espectro 361. La sección de filtrado de espectro 361 está configurada principalmente con la sección de división de sub-bandas 102, sección de cálculo de valores representativos 103, sección de transformación no lineal 104, sección de filtrado 105 y sección de transformación no lineal inversa 106. Estos componentes son iguales a los componentes descritos en la modalidad 1 y se les asignarán los mismos números de referencia sin explicaciones .
La sección de ajuste de estado de filtro 362 ajusta el espectro decodificado de primera capa filtrado SI' (k) (0 < = k < FL) recibido como entrada desde la sección de filtrado de espectro 361 como el estado de filtro interno para usarse en la sección de filtración 363 subsecuente. El espectro decodificado de primera capa filtrado SI' (k) es acomodado como el estado de filtro interno (estado de filtro) en la 0 < = k < FL banda de espectro S(k) sobre la gama de frecuencias completa en la sección de filtración 363.
La sección de filtración 363, que tiene un filtro de separación de varias tomas, filtra el espectro decodificado de primera capa con base en el estado de filtro ajustado en la sección de ajuste de estado de filtro 362, el coeficiente de separación recibido como entrada desde la sección de ajuste de coeficientes de separación 365 y la información de división de bandas recibidas como entrada desde la sección de división de bandas 360, y calcula el espectro estimado S2P' (k) (BSP < = k < BSP + BWP) (p = 0, 1, ..., P-l) de cada sub-banda SBP (p = O, 1, P-l) (en adelante "espectro estimado SBP de sub-banda").
La sección de filtración 363 envía el espectro estimado S2P' (k) de la sub-banda SBP a la sección de búsqueda 364. Los detalles del procesamiento de filtración en la sección de filtración 363 se describirán más adelante. El número de varias tomas puede ser cualquier valor (entero) igual a o mayor que 1.
Con base en información de división de bandas recibida como entrada desde la sección de división de bandas 360, la sección de búsqueda 364 calcula el grado de similitud entre el espectro estimado S2P' (k) de la sub-banda SBP recibido como entrada desde la sección de filtración 363, y cada espectro de sub-banda S2P (k) en la banda superior (FL < k < FH) del espectro de entrada S2 (k) recibido como entrada desde la sección de procesamiento de transformación de tiempo- frecuencia 315. Este grado de similitud se calcula mediante, por ejemplo, cálculo de correlación. El procesamiento de la sección de filtración 363, sección de búsqueda 364 y sección de ajuste de coeficiente de separación 365 constituye procesamiento de búsqueda de circuito cerrado por sub-banda, y, en cada circuito cerrado, la sección de búsqueda 364 calcula el grado de similitud con respecto a cada coeficiente de separación al modificar variadamente el coeficiente de separación T recibido como entrada desde la sección de ajuste de coeficiente de separación 365 en la sección de filtración 363. En cada circuito cerrado de sub-banda, o, por ejemplo, en un circuito cerrado que corresponde a la sub-banda SBP, la sección de búsqueda 364 busca un coeficiente de separación óptimo Tp' para maximizar el grado de similitud (en la escala de Tmin ~ Tmax) , y envía T coeficientes de separación óptimos a la sección multiplexora 367. La sección de búsqueda 364 calcula parte de la banda del espectro decodificado de primera capa para simular cada sub-banda SBP usando cada coeficiente de separación óptimo Tp' . Después, la sección de búsqueda 364 envía el espectro estimado S2P' (k) que corresponde a cada coeficiente de separación óptimo Tp' (p = 0, 1, P-l) a la sección de codificación de ganancia 366. Los detalles del procesamiento de búsqueda para el coeficiente de separación óptimo Tp' (p = 0, 1, P-l) en la sección de búsqueda 364 se describirán más adelante.
Con base en control por la sección de búsqueda 364, cuando la sección de ajuste de coeficientes de separación 365 lleva a cabo procesamiento de búsqueda de circuito cerrado que corresponde a la primera sub-banda SB0 con sección de filtración 363 y sección de búsqueda 364, modifica el coeficiente de separación T gradualmente en una escala de búsqueda predeterminada entre Tmin y Tmax y envía salidas a la sección de filtración 363 secuencialmente .
La sección de codificación de ganancia 366 calcula la información de ganancia con respecto a la parte de banda superior (FL < = k < FH) del espectro de entrada S2 (k) recibido como entrada desde la sección de procesamiento de transformación de tiempo- frecuencia 315. Para ser más específicos, la sección de codificación de ganancia 366 divide la banda de frecuencias FL < k < FH en J sub-bandas, y busca la potencia espectral del espectro de entrada S2 (k) por su banda. En este caso, la potencia espectral Bj de la (j+l)a sub-banda es representada por la ecuación 17 abajo.
Ecuación 17 En la ecuación 17, BLj es la frecuencia mínima de la (j +l) sub-banda, y BHj es la frecuencia máxima de la (j+l)a sub-banda. La sección de codificación de ganancia 366 forma el espectro estimado S2 ' (k) de la banda superior del espectro de entrada al conectar el espectro estimado S2P' (k) (p = 0, 1, P-l) de cada sub-banda recibida como entrada desde la sección de búsqueda 364 continua en el dominio de frecuencia. Después, la sección de codificación de ganancia 366 calcula la potencia espectral B'j del espectro estimado S2' (k) por sub-banda, como en el caso de calcular la potencia espectral del espectro de entrada S2 (k) , usando la ecuación 18 abajo. Después, la sección de codificación de ganancia 366 calcula la cantidad de variación, Vj , de 1 potencia espectral del espectro estimado S2 ' (k) por sub banda, con respecto al espectro de entrada S2 (k) , usando 1 ecuación 19 abajo.
Bllj B/= ?S2'(kf (/ = 0,-,J- l) - (1 8) k=BLj Ecuación 18 Ecuación 19 Después, la sección de codificación de ganancia 366 codifica la cantidad de variación Vj , y envía un índice que corresponde a la cantidad de variación codificada VQj a la sección multiplexora 367.
La sección multiplexora 367 multiplexa información de división de bandas recibida como entrada desde la sección de división de bandas 360, coeficiente de separación óptima Tp para cada sub-banda SBP (p = 0, 1, P-l) recibido como entrada desde la sección de búsqueda 364, y un índice de cantidad de variación VQj recibido como entrada desde la sección de codificación de ganancia 366, como información de segunda capa codificada, y envía esa información codificada de segunda capa a la sección de integración de información codificada 317. Es igualmente posible ingresar Tp' y el índice de VQj directamente en la sección de integración de información codificada 317, y multiplexar éstas con la información de primera capa codificada en la sección de integración de información codificada 317.
Los detalles del procesamiento de filtración en la sección de filtración 363 mostrada en la figura 7 se describirán en detalle usando la figura 9.
Usando el estado de filtro recibido como entrada desde la sección de ajuste de estado de filtro 362, el coeficiente de separación T recibido como entrada desde la sección de ajuste de coeficiente de separación 365, y la información de división de bandas recibida como entrada desde la sección de división de bandas 360, la sección de filtración 363 genera un espectro estimado en la banda BSP < = k < BSP + BWP (p = 0, 1, P-l) de la sub-banda SBP (p = 0, 1, P-l) . La función de transferencia F (z) del filtro usado en la sección de filtración 363 se representan por la siguiente ecuación 20.
Ahora, usando SBP como un ejemplo, se explicará el proceso de generar el espectro estimado S2P' (k) del espectro de sub-banda S2P (k) .
F(*) = ^ - (20) Ecuación 20 En la ecuación 20, T es un coeficiente de separación proporcionado desde la sección de ajuste de coeficiente de separación 365, y ß? es un coeficiente de filtro almacenado dentro por adelantado. Por ejemplo, cuando el número de tomas es 3, los candidatos a coeficiente de filtro incluyen ( ß-? , ß0 , ß? ) = (0.1, 0.8, 0.1), por ejemplo. Otros valores tales como ( ß -? , ß0 , ß? ) = (0.2, 0.6, 0.2), (0.3, 0.4, 0.3) también son aplicables. Valores ( ß -? , ß0 , ß? ) = (0.0, 1.0, 0.0) también son aplicables, y, en este caso, parte de la banda 0 < = k < FL del primer espectro decodificado de capa no se modifica en forma y se copia tal cual en la banda de BSP < = k < BSP + BWP. M = 1 en la ecuación 20. M es un indicador relacionado con el número de tomas .
El espectro decodificado de primera capa filtrado SI' (k) es acomodado en la banda 0 < = k < FL del espectro S (k) de la banda de frecuencias completa en la sección de filtración 363 como el estado de filtro interno (estado de filtro) .
En la banda BSP < = k < BSP+BWE de S (k) , el espectro estimado S2P' (k) de la sub-banda SBP es acomodado por el procesamiento de filtración de las siguientes etapas. Básicamente, en S2P' (k) , el espectro S (k-T) que tiene una frecuencia T más baja que esta k, es sustituido. Para mejorar la lisura de un espectro, en la práctica, el espectro 3i'S(k-T+i) dado al multiplicar el espectro cercano S (k-T+i) es decir i aparte del espectro S (k-T) por el coeficiente de filtro predeterminado ß? se encuentra con respecto a todas las i's, y un espectro que añade los espectros de todas las i's es sustituido en S2p(k) . Este procesamiento se representa por la siguiente ecuación 21.
S2pÍk) = /í¡ S2(k - T +i)2 - (21) Ecuación 21 El espectro estimado S2P' (k) en BSP< = k < BSP + B P se calcula al llevar a cabo el cálculo anterior en orden desde la frecuencia más baja y cambiando k en el intervalo de BSP < = k < BSP + BWP.
El procesamiento de filtración anterior se lleva a cabo mediante aclaración de ceros S(k) en el intervalo BSP < = k < BSP + BWP cada vez que el coeficiente de separación T se proporciona desde la sección de ajuste de coeficientes de separación 365. Es decir, S (k) se calcula cada vez que el coeficiente de separación T cambia y se envía a la sección de búsqueda 364.
La figura 10 es un diagrama de flujo que muestra las etapas de procesamiento para buscar un coeficiente de separación óptimo Tp' para la sub-banda SBP en la sección de búsqueda 364. La sección de búsqueda 364 busca el coeficiente de separación óptima Tp' (p = 0, 1, P-l) en cada sub-banda SBP (p = 0, 1, P-l) al repetir las etapas mostradas en la figura 10.
Primero, la sección de búsqueda 364 inicializa el grado mínimo de similitud, Tmin, que es una variable para ahorrar el valor mínimo del grado de similitud, a "+8" (ST110) . Después, siguiendo la ecuación 22 abajo, a un coeficiente de separación dado, la sección de búsqueda 364 calcula el grado de similitud, T, entre la parte de banda superior (FL < = k < FH) del espectro de entrada S2 (k) y el espectro estimado S2P' (k) (ST120) .
D =?S2(BSp +k)¦S2(BSp + (? < M'< BWp) (22) Ecuación 22 En la ecuación 22, M' es el número de muestras después de calcular el grado de similitud en D, y puede asumir valores arbitrarios iguales a o más pequeños que el ancho de banda de cada sub-banda. S2P' (k) no está presente en la ecuación 22 pero es representado usando BSP y S2 ' (k) .
Después, la sección de búsqueda 364 determina si el grado de similitud calculado, en D, es o no más pequeño que el grado de similitud mínimo, Train (ST130) . Si el grado de similitud D calculado en ST120 es más pequeño que el grado de similitud mínimo Dmin ("SÍ" en ST130) , la sección de búsqueda 364 sustituye el grado de similitud D en el grado de similitud mínimo Dmin (ST140) . Por otro lado, si el grado de similitud D calculado en ST120 es igual a o mayor que el grado de similitud mínimo Tmin ("NO" en ST130) , la sección de búsqueda 364 determina si el procesamiento en el intervalo de búsqueda ha terminado o no. Es decir, la sección de búsqueda 364 determina si el grado de similitud ha sido o no calculado con respecto a todos los coeficientes de separación en el intervalo de búsqueda en ST120 de acuerdo con la ecuación 22 arriba (ST150) . La sección de búsqueda 364 regresa a ST 120 de nuevo cuando el procesamiento no ha terminado sobre el intervalo de búsqueda ("NO" en ST150) . Después, la sección de búsqueda 364 calcula el grado de similitud de acuerdo con la ecuación 22, para diferentes coeficientes de separación a partir del caso de calcular el grado de similitud de acuerdo con la ecuación 22 en ST120 anterior. Por otro lado, cuando se termina el procesamiento sobre el intervalo de búsqueda ("SÍ" en ST150) , la sección de búsqueda 364 envía el coeficiente de separación T que corresponde al grado de similitud mínimo, a la sección multiplexora 367, como coeficiente de separación óptimo Tp (ST160) .
A continuación se describirá el aparato de decodificación 303 mostrado en la figura 5.
La figura 11 es un diagrama de bloques que muestra una configuración de partes principales internas del aparato de decodificación 303.
En la figura 11, la sección de desmultiplexión de información codificada 331 desmultiplexa entre información codificada de primera capa e información de segunda capa codificada en la información codificada recibida como entrada, envía la información codificada de primera capa a la sección de decodificación de primera capa 332, y envía la información codificada de segunda capa a la sección de decodificación de segunda capa 335.
La sección de decodificación de primera capa 332 decodifica la información codificada de primera capa recibida como entrada desde la sección desmultiplexora de información codificada 331, y envía la señal decodificada de primera capa generada a la sección de procesamiento de sobre-muestreo 333. Las operaciones de la sección de decodificación de primera capa 332 son iguales a las de la sección de decodificación de primera capa 313 mostrada en la figura 6 y no se explicarán en detalle.
La sección de procesamiento de sobre-muestreo 333 lleva a cabo procesamiento de sobre-muestreo de la frecuencia de muestreo a partir de SRbase a SRinput con respecto a la señal decodificada de primera capa recibida como entrada desde la sección de decodificación de primera capa 332, y envía la señal decodificada de primera capa sobre-muestreada resultante a la sección de procesamiento de transformación de tiempo-frecuencia 334.
La sección de procesamiento de transformación de tiempo- frecuencia 334 aplica el procesamiento de transformación ortogonal (MDCT) a la señal decodificada de primera capa sobre-muestreada recibida como entrada desde la sección de procesamiento de sobre-muestreo 333, y envía al coeficiente MDCT SI (k) (en adelante "espectro decodificado de primera capa") de la señal decodificada de primera capa sobre-muestreada resultante a la sección de decodificación de segunda capa 335. Las operaciones de la sección de procesamiento de transformación de tiempo-frecuencia 334 son iguales al procesamiento en la sección de procesamiento de transformación de tiempo-frecuencia 315 para una señal decodificada de primera capa sobre-muestreada mostrada en la figura 6, y no se describirán en detalle.
La sección de decodificación de segunda capa 335 genera una señal decodificada de segunda capa que incluye componentes de banda superior usando el espectro decodificado de primera capa SI (k) recibido como entrada desde la sección de procesamiento de transformación de tiempo-frecuencia 334 y la información de segunda capa codificada recibida como entrada desde la sección desmultiplexora de información codificada 331, y envía esto como una señal de salida.
La figura 12 es un diagrama de bloques que muestra una configuración de partes principales internas de la sección de decodificación de segunda capa 335 mostrada en la figura 11.
La sección desmultiplexora 351 desmultiplexa la información codificada de segunda capa recibida como entrada desde la sección desmultiplexora de información codificada 331 en la información de división de banda incluyendo el ancho de banda VWp (p = 0, 1, P-l) e índice principal BSP (p = 0, 1, P-l) (FL < = BSP < FH) de cada sub-banda, coeficiente de separación óptimo Tp' (p = 0, 1, P-l), que es información relacionada con filtración, y el índice de la cantidad de variación codificada VQj (j = 0, 1, J-l) , que es información relacionada con ganancia. Además, la sección desmultiplexora 351 envía información de división de bandas y coeficiente de separación óptimo Tp' (p = 0, 1, P-l) a la sección de filtración 354, y envía el índice de cantidad codificada de variación VQj (j = 0, 1, J-l) a la sección de decodificación de ganancia 355. Si en la sección desmultiplexora de información codificada 331 índices de información de división de bandas Tp' (p = 0, 1, P-l) y VQj (j = 0, 1, J-l) son desmultiplexados , la sección desmultiplexora 351 no es necesaria.
¦ La sección de filtrado de espectro 352 aplica procesamiento de filtrado al espectro decodificado de primera capa Sl(k) (0 < = k < FL) recibido como entrada desde la sección de procesamiento de transformación de tiempo-frecuencia 334, y envía el espectro decodificado de primera capa filtrado SI' (k) (0 < = k < FL) a la sección de ajuste de estado de filtro 353. El procesamiento en la sección de filtrado de espectro 352 es igual al procesamiento en la sección de filtrado de espectro 361 en la sección de codificación de segunda capa 316 y por lo tanto no se describirá aquí .
La sección de ajuste de estado de filtro 353 ajusta el espectro decodificado de primera capa filtrado SI' (k) (0 < = k < FL) recibido como entrada desde la sección de filtrado de espectro 352 como el estado de filtro que se usará en la sección de filtración 354. Al invocar al espectro de la banda de frecuencias 0 < = k < FH completa "S(k)" en la sección de filtración 354 por conveniencia, el espectro decodificado de primera capa filtrado SI' (k) es acomodado en la banda 0 < = k < FL de S (k) como el estado de filtro interno (estado de filtro) . La configuración y operaciones de la sección de ajuste de estado de filtro 353 son iguales a las de la sección de ajuste de estado de filtro 362 mostrado en la figura 7 y no se describirán en detalle aquí .
La sección de filtración 354 tiene un filtro de separación de varias tomas (que tiene al menos dos tomas) . La sección de filtración 354 filtra el espectro decodificado de primera capa filtrado SI' (k) con base en información de división de bandas recibida como entrada desde la sección desmultiplexora 351, el estado de filtro ajustado en la sección de ajuste de estado de filtro 353, coeficiente de separación ??' (p = O, 1, P-l) recibido como entrada desde la sección desmultiplexora 351, y un coeficiente de filtro almacenado dentro o por adelantado, y calcula el espectro estimado S2P' (k) (BSP < = k < BSP+BWP) (p = 0, 1, P-l) de cada sub-banda SBP (p = 0, 1, P-l) mostrado en la ecuación 21 arriba. La sección de filtración 354 usa también la función de filtro representada por la ecuación 20. El procesamiento de filtración y función de filtro en este caso son representados como la ecuación 20 y la ecuación 21 excepto que T es reemplazado por Tp' .
La sección de decodificación de ganancia 355 decodifica el índice de cantidad de variación codificada VQj recibido como entrada desde la sección desmultiplexora 351 y busca cantidad de variación VQj que sea un valor cuantificado de la cantidad de variación Dj .
La sección de ajuste de espectro 356 busca espectro estimado S2' (k) de un espectro de entrada al conectar el espectro estimado S2P' (k) (BSP < = k < BSP+BWP) (p = 0, 1, P-l) de cada sub-banda recibida como entrada desde la sección de filtración 354 en el dominio de frecuencias. De acuerdo con la ecuación 23 abajo, la sección de ajuste de espectro 356 multiplica además el espectro estimado S2 ' (k) por la cantidad de variación VQj de cada sub-banda recibida como entrada desde la sección de decodificación de ganancia 355. Mediante este medio, la sección de ajuste de espectro 356 ajusta la forma espectral de la banda de frecuencias FL < = k < FH del espectro estimado S2 ' (k) , genera el espectro decodificado S3 (k) y envía el espectro decodificado S3 (k) a la sección de procesamiento de transformación de tiempo-frecuencia 357. 53 (k) = S2 '(k) VQj (BLj=k=BH para todas las j) Ecuación 23 Después, de acuerdo con la ecuación 24, la sección de ajuste de espectro 356 sustituye el espectro decodificado de primera capa en SI (k) (0 < = k < FL) recibido como entrada desde la sección de procesamiento de transformación de tiempo - frecuencia 334, en la banda inferior (0 < = k < FL) del espectro decodificado S3 (k) .
La parte de banda inferior (0 < = k < FL) del espectro decodificado S3 (k) se forma con el espectro decodificado de primera capa SI (k) y la parte de banda superior (FL < = k < FH) del espectro decodificado S3 (k) se forma con el espectro estimado S2' (k) después del ajuste de banda espectral.
S3(k) = Sl(k) (0=k=FL) Ecuación 24 La sección de procesamiento de transformación de tiempo- frecuencia 357 lleva a cabo transformación ortogonal del espectro decodificado S3 (k) recibido como entrada desde la sección de ajuste de espectro 356 en una señal de dominio de tiempo, y envía la señal decodificada de segunda capa resultante como una señal de salida. Aquí, si es necesario, procesamiento adecuado tal como ventaneo o adición de superposición se llevan a cabo para impedir que se produzcan discontinuidades entre cuadros.
El procesamiento en la sección de procesamiento de transformación de tiempo- frecuencia 357 se describirá en detalle .
La sección de procesamiento de transformación tiempo-frecuencia 357 tiene la memoria de almacenamiento temporal buf ' (k) dentro e inicializa la memoria de almacenamiento temporal buf (k) como se muestra con la ecuación 25 abajo. buf'(k) = 0 (jfe = 0, ..., N - 1 ) Ecuación 25 Además, de acuerdo con la ecuación 26 abajo, sección de procesamiento de transformación de tiempo-frecuencia 357 busca la señal de segunda capa decodificada yn" usando el espectro decodificado de segunda capa S3 (k) recibido como entrada desde la sección de ajuste de espectro 356.
Ecuación 26 En la ecuación 26, Z4 (k) es un vector que combina el espectro decodificado S3 (k) y la memoria de almacenamiento temporal buf ' (k) como se muestra por la ecuación 27 abajo.
Ecuación 27 Después, la sección de procesamiento de transformación de tiempo- frecuencia 357 actualiza la memoria de almacenamiento temporal buf (k) de acuerdo con la ecuación 28 abajo. buf'(k) = S3(k)(k=0, ...,N-\) Ecuación 28 Después, la sección de procesamiento de transformación de tiempo- frecuencia 357 envía la señal decodificada yn" como una señal de salida.
Así, de acuerdo con la presente modalidad, en codificación/decodificación para llevar a cabo incremento de ancho de banda usando un espectro de banda inferior y estimando un espectro de banda superior, el procesamiento de filtrado para combinar una media aritmética y una media geométrica se lleva a cabo para un espectro de banda inferior como procesamiento preparatorio. Mediante este medio, es posible reducir la cantidad de cálculo sin causar degradación de calidad de una señal decodificada .
Además, aunque se ha explicado una configuración arriba con la presente modalidad en donde, después de la codificación de incremento de ancho de banda, un espectro decodificado de banda inferior obtenido por medio de decodificación se somete a procesamiento de lisado y un espectro de banda superior se estima usando un espectro decodificador de banda inferior filtrado y codificado, la presente invención por ningún motivo está limitada a esto y es igualmente aplicable a una configuración para llevar a cabo procesamiento de lisado para un espectro de banda inferior de una señal de entrada, estimando un espectro de banda superior a partir de un espectro de banda filtrando y luego codificando el espectro de banda superior .
El aparato de filtrado de espectro y el método de filtrado de espectro de acuerdo con la presente invención por ningún motivo están limitados a las modalidades anteriores y pueden implementarse en varias modificaciones. Por ejemplo, las modalidades pueden combinarse de varias maneras.
La presente invención es igualmente aplicable a casos en los que un programa de procesamiento de señales es grabado o escrito en un medio de grabación legible por computadora tal como un CD y DVD y operado, y proporciona los mismos efectos de trabajo y ventajas que con la presente modalidad.
Aunque se han descrito casos ejemplares arriba con las modalidades anteriores en donde la presente invención se implementa con hardware, la presente invención puede implementarse con software también.
Además, cada bloque de funciones empleado en las descripciones de modalidades anteriores puede implementarse típicamente como un LCI constituido por un circuito integrado. Estos pueden ser chips individuales o estar contenidos parcial o totalmente en un solo chip . "LCI" se adopta aquí pero esto también puede referirse como "IC", "LCI de sistema", "súper LCI", o "ultra LCI" dependiendo de los grados de integración diferentes.
Además, el método de integración de circuitos no está limitado a LCI ' s , y la implementación usando circuitos dedicados o procesadores de propósitos generales también es posible. Después de la fabricación de un LCI, la utilización de una FPGA (Disposición de Puertas Programable por Campo) o un procesador reconfigurable en donde conexiones y ajustes de celdas de circuito en un LCI pueden regenerarse también es posible .
Además, si tecnología de circuitos integrados llega a reemplazar LCI's como resultado del avance de la tecnología de semiconductores u otra tecnología derivada, naturalmente también es posible llevar a cabo la integración de bloques de funciones usando esta tecnología. También es posible la aplicación de biotecnología .
Las descripciones de la solicitud de patente japonesa número 2008-205645, presentada el 8 de agosto de 2008, solicitud de patente japonesa No. 2009-096222, presentada el 10 de abril del 2009, incluyendo las descripciones, figuras y resúmenes, se incorporan en la presente a manera de referencia en sus totalidades.
Aplicación industrial El aparato de filtrado de espectro, aparato de codificación, aparato de decodificación, aparato de terminal de comunicación, aparato de estación base y método de filtrado de espectro de acuerdo con la presente invención hacen posible filtrar el dominio de frecuencias por una cantidad pequeña y por lo tanto aplicable a, por ejemplo, sistemas de comunicación por paquetes, sistemas de comunicación móviles y así sucesivamente.
Explicación de números de referencia 100 Aparato de filtrado de espectro 101, 315, 334, 357 Sección de procesamiento de transformación de tiempo-frecuencia 102 Sección de división de sub-bandas 103 Sección de cálculo de valores representativos 104 Sección de transformación no lineal 105 Sección de filtrado 106 Sección de transformación no lineal inversa 201 Sección de cálculo de media aritmética 202 Sección de cálculo de media geométrica 301 Aparato de codificación 302 Canal de transmisión 303 Aparato de decodificación 311 Sección de procesamiento de sub-muestreo 312 Sección de codificación de primera capa 313, 332 Sección de decodificación de primera capa 314, 333 Sección de procesamiento de sobre-muestreo 316 Sección de codificación de segunda capa 317 Sección de integración de información codificada 318 Sección de retraso 331 Sección desmultiplexora de información codificada 335 Sección de decodificación de segunda capa 351 Sección desmultiplexora 352, 361 Sección de filtrado de espectro 353, 362 Sección de ajuste de estado de filtro 354, 363 Sección de filtración 355 Sección de codificación de ganancia 356 Sección de ajuste de espectro 360 Sección de división de bandas 364 Sección de búsqueda 365 Sección de ajuste de coeficientes de separación 366 Sección de codificación de ganancia 367 Sección multiplexora Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (12)

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones :
1. Un aparato de filtrado de espectro caracterizado porque comprende : una sección de transformación de tiempo-frecuencia que lleva a cabo una transformación de tiempo-frecuencia de una señal de entrada y genera un componente de frecuencia; una sección de división de sub-bandas que divide el componente de frecuencia de una pluralidad de sub-bandas; una sección de cálculo de valores representativos que calcula un valor representativo de cada sub-banda dividida al calcular una media aritmética y usando un cálculo de multiplicación utilizando un resultado de cálculo de la media aritmética; una sección de transformación no lineal que lleva a cabo una transformación no lineal de valores representativos de las sub-bandas; y una sección de filtrado que filtra los valores representativos sujetos a la transformación no lineal en el dominio de frecuencias.
2. El aparato de filtrado de espectro de conformidad con la reivindicación 1, caracterizado porque comprende además una sección de transformación no lineal inversa que lleva a cabo una transformación no lineal inversa de una característica opuesta a la transformación no lineal, para los valores representativos filtrados.
3. El aparato de filtrado de espectro de conformidad con la reivindicación 1, caracterizado porque la sección de transformación no lineal lleva a cabo la transformación no lineal que tiene una característica de enfatizar un valor más grande, para los valores representativos .
4. El aparato de filtrado de espectro de conformidad con la reivindicación 1, caracterizado porque la sección de transformación no lineal lleva a cabo una transformación logarítmica como la transformación no lineal.
5. El aparato de filtrado de espectro de conformidad con la reivindicación 1, caracterizado porque la sección de cálculo de valores representativos calcula los valores representativos de la sub-bandas al estimar una media geométrica usando un resultado del cálculo de multiplicación.
6. El aparato de filtrado de espectro de conformidad con la reivindicación 1, caracterizado porque la sección de cálculo de valores representativos calcula los valores representativos de las sub-bandas al dividir cada sub-banda en una pluralidad de sub-grupos, calcula el valor de media aritmética por sub-grupo y calcula el valor de media geométrica usando un resultado del cálculo de multiplicación usando los valores de media aritmética de los sub-grupos.
7. El aparato de filtrado de espectro de conformidad con la reivindicación 1, caracterizado porque: la sección de cálculo de valores representativos calcula los valores representativos de cada sub-banda al dividir cada sub-banda en una pluralidad de sub-grupos, calcular un valor de media aritmética para cada subgrupo y calcular un valor obtenido al multiplicar los valores de medias aritméticas de los sub-grupos como un valor representativo de cada sub-banda; y la sección de transformación no lineal calcula un valor intermedio de cada sub-banda al llevar a cabo la transformación no lineal del valor representativo de cada sub-banda y calcula un valor obtenido al multiplicar un intermedio en cada sub-banda por un recíproco de un número de sub-grupos en cada sub-banda con un valor representativo sujeto a la transformación no lineal.
8. Un aparato de codificación caracterizado porque comprende : una primera sección de codificación que genera primera información codificada al codificar una parte de banda inferior de una señal de entrada en o debajo de una frecuencia predeterminada; una sección de decodificación que genera una señal decodificada al decodificar la primera información codificada; y una segunda sección de codificación que genera segunda información codificada al dividir una parte de banda superior de la señal de entrada sobre la frecuencia predeterminada en .una pluralidad de sub-bandas y estimar la pluralidad de sub-bandas a partir de la señal de entrada o la señal decodificada, en donde la segunda sección de codificación comprende el aparato de filtrado de espectro de conformidad con una de las reivindicaciones 1 a 7 que recibe como entrada y filtra la señal decodificada, y estima la pluralidad de sub-bandas a partir de la señal de entrada o la señal decodificada filtrada.
9. Un aparato de decodificación caracterizado porque comprende : una sección receptora que recibe primera información codificada y segunda información codificada, la primera información codificada es obtenida al codificar una parte de banda inferior de una señal de entrada del lado de codificación en o debajo de una frecuencia predeterminada, y la segunda información codificada es generada al dividir una parte de banda superior de la señal de entrada del lado de codificación sobre la frecuencia predeterminada en una pluralidad de sub-bandas y estimando la pluralidad de sub- bandas a partir de la primera señal decodificada obtenida al decodificar la señal de entrada del lado de codificación o la primera información codificada; una primera sección de decodificación que decodifica la primera información codificada y genera una segunda señal decodificada; y una segunda sección de decodificación que genera una tercera señal decodificada al estimar una parte de banda superior de la señal de entrada del lado de codificación usando la segunda información codificada, en donde la segunda sección de decodificación comprende el aparato de filtrado de espectro de conformidad con una de las reivindicaciones 1 a 7 que recibe como entrada y filtra la segunda señal decodificada; y estima la parte de banda superior de la señal de entrada del lado de codificación a partir de la segunda señal decodificada filtrada.
10. Un aparato de terminal de comunicación caracterizado porque comprende el aparato de filtrado de espectro de conformidad con una de las reivindicaciones 1 a 7.
11. Un aparato de estación base caracterizado porque comprende el aparato de filtrado de espectro de conformidad con una de las reivindicaciones 1 a 7.
12. Un método de filtrado de espectro caracterizado porque comprende : una etapa de transformación de tiempo-frecuencia para llevar a cabo una transformación de tiempo-frecuencia de una señal de entrada y generar un componente de frecuencia; una etapa de división de sub-bandas para dividir el componente de frecuencia en una pluralidad de sub-bandas; una etapa de cálculo de valores representativos para calcular un valor representativo de cada sub-banda dividida al calcular una media aritmética y al usar un cálculo de multiplicación usando un resultado de cálculo de la media aritmética; una etapa de transformación no lineal para llevar a cabo una transformación no lineal de valores representativos de las sub-bandas; y una etapa de filtrado para filtrar los valores representativos sujetos a la transformación no lineal en el dominio de frecuencias.
MX2011001253A 2008-08-08 2009-08-07 Dispositivo de filtrado espectral, dispositivo de codificacion, dispositivo de decodificacion, dispositivo de terminal de comunicacion, dispositivo de estacion base y metodo de filtrado espectral. MX2011001253A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008205645 2008-08-08
JP2009096222 2009-04-10
PCT/JP2009/003799 WO2010016271A1 (ja) 2008-08-08 2009-08-07 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法

Publications (1)

Publication Number Publication Date
MX2011001253A true MX2011001253A (es) 2011-03-21

Family

ID=41663498

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2011001253A MX2011001253A (es) 2008-08-08 2009-08-07 Dispositivo de filtrado espectral, dispositivo de codificacion, dispositivo de decodificacion, dispositivo de terminal de comunicacion, dispositivo de estacion base y metodo de filtrado espectral.

Country Status (11)

Country Link
US (1) US8731909B2 (es)
EP (1) EP2320416B1 (es)
JP (1) JP5419876B2 (es)
KR (1) KR101576318B1 (es)
CN (1) CN102099855B (es)
BR (1) BRPI0917953B1 (es)
DK (1) DK2320416T3 (es)
ES (1) ES2452300T3 (es)
MX (1) MX2011001253A (es)
RU (1) RU2510536C9 (es)
WO (1) WO2010016271A1 (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CA3203400C (en) 2010-07-19 2023-09-26 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
US9319790B2 (en) 2012-12-26 2016-04-19 Dts Llc Systems and methods of frequency response correction for consumer electronic devices
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US20160379661A1 (en) * 2015-06-26 2016-12-29 Intel IP Corporation Noise reduction for electronic devices
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
WO2018225412A1 (ja) * 2017-06-07 2018-12-13 日本電信電話株式会社 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム
JP6439843B2 (ja) * 2017-09-14 2018-12-19 ソニー株式会社 信号処理装置および方法、並びにプログラム

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH046450A (ja) * 1990-04-24 1992-01-10 Sumitomo Light Metal Ind Ltd Al合金材上の溶着金属定量方法
JPH0522151A (ja) * 1991-07-09 1993-01-29 Toshiba Corp 帯域分割形符号化方式
DE4212339A1 (de) * 1991-08-12 1993-02-18 Standard Elektrik Lorenz Ag Codierverfahren fuer audiosignale mit 32 kbit/s
US5495552A (en) * 1992-04-20 1996-02-27 Mitsubishi Denki Kabushiki Kaisha Methods of efficiently recording an audio signal in semiconductor memory
JP3087814B2 (ja) * 1994-03-17 2000-09-11 日本電信電話株式会社 音響信号変換符号化装置および復号化装置
JP4274614B2 (ja) * 1999-03-09 2009-06-10 パナソニック株式会社 オーディオ信号復号方法
EP1199812A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
DE10105339B4 (de) * 2001-02-05 2004-05-13 november Aktiengesellschaft Gesellschaft für Molekulare Medizin Verfahren zur fälschungssicheren Markierung, fälschungssichere Markierung und Kit
JP3586205B2 (ja) * 2001-02-22 2004-11-10 日本電信電話株式会社 音声スペクトル改善方法、音声スペクトル改善装置、音声スペクトル改善プログラム、プログラムを記憶した記憶媒体
JP3976169B2 (ja) * 2001-09-27 2007-09-12 株式会社ケンウッド 音声信号加工装置、音声信号加工方法及びプログラム
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
US7590250B2 (en) * 2002-03-22 2009-09-15 Georgia Tech Research Corporation Analog audio signal enhancement system using a noise suppression algorithm
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP3881932B2 (ja) * 2002-06-07 2007-02-14 株式会社ケンウッド 音声信号補間装置、音声信号補間方法及びプログラム
JP4161628B2 (ja) * 2002-07-19 2008-10-08 日本電気株式会社 エコー抑圧方法及び装置
US7277550B1 (en) * 2003-06-24 2007-10-02 Creative Technology Ltd. Enhancing audio signals by nonlinear spectral operations
CN1322488C (zh) * 2004-04-14 2007-06-20 华为技术有限公司 一种语音增强的方法
JP4810422B2 (ja) * 2004-05-14 2011-11-09 パナソニック株式会社 符号化装置、復号化装置、およびこれらの方法
KR100634506B1 (ko) * 2004-06-25 2006-10-16 삼성전자주식회사 저비트율 부호화/복호화 방법 및 장치
CN101273404B (zh) 2005-09-30 2012-07-04 松下电器产业株式会社 语音编码装置以及语音编码方法
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
EP1928115A1 (en) * 2006-11-30 2008-06-04 Nokia Siemens Networks Gmbh & Co. Kg Adaptive modulation and coding in a SC-FDMA system
JP2008205645A (ja) 2007-02-16 2008-09-04 Mitsubishi Electric Corp アンテナ装置
JP2009096222A (ja) 2007-10-12 2009-05-07 Komatsu Ltd 建設機械

Also Published As

Publication number Publication date
EP2320416A1 (en) 2011-05-11
JPWO2010016271A1 (ja) 2012-01-19
BRPI0917953B1 (pt) 2020-03-24
JP5419876B2 (ja) 2014-02-19
WO2010016271A1 (ja) 2010-02-11
KR101576318B1 (ko) 2015-12-09
CN102099855A (zh) 2011-06-15
RU2510536C2 (ru) 2014-03-27
EP2320416B1 (en) 2014-03-05
US20110137643A1 (en) 2011-06-09
EP2320416A4 (en) 2012-08-22
ES2452300T3 (es) 2014-03-31
RU2011104350A (ru) 2012-09-20
DK2320416T3 (da) 2014-05-26
KR20110049789A (ko) 2011-05-12
US8731909B2 (en) 2014-05-20
CN102099855B (zh) 2012-09-26
RU2510536C9 (ru) 2015-09-10
BRPI0917953A2 (pt) 2015-11-10

Similar Documents

Publication Publication Date Title
MX2011001253A (es) Dispositivo de filtrado espectral, dispositivo de codificacion, dispositivo de decodificacion, dispositivo de terminal de comunicacion, dispositivo de estacion base y metodo de filtrado espectral.
EP3288034B1 (en) Decoding device, and method thereof
EP2224432B1 (en) Encoder, decoder, and encoding method
EP2239731B1 (en) Encoding device, decoding device, and method thereof
EP1798724B1 (en) Encoder, decoder, encoding method, and decoding method
KR101661374B1 (ko) 부호화 장치, 복호 장치 및 이들 방법
EP1852849A1 (en) Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
EP1806737A1 (en) Sound encoder and sound encoding method
EP2584561B1 (en) Decoding device, encoding device, and methods for same
JP5355387B2 (ja) 符号化装置および符号化方法
WO2012004998A1 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
WO2013057895A1 (ja) 符号化装置及び符号化方法
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
FG Grant or registration
GB Transfer or rights