ES2452300T3 - Dispositivo de alisamiento espectral, dispositivo de codificación, dispositivo de decodificación, dispositivo de terminal de comunicación, dispositivo de estación base y método de alisamiento espectral - Google Patents

Dispositivo de alisamiento espectral, dispositivo de codificación, dispositivo de decodificación, dispositivo de terminal de comunicación, dispositivo de estación base y método de alisamiento espectral Download PDF

Info

Publication number
ES2452300T3
ES2452300T3 ES09804758.2T ES09804758T ES2452300T3 ES 2452300 T3 ES2452300 T3 ES 2452300T3 ES 09804758 T ES09804758 T ES 09804758T ES 2452300 T3 ES2452300 T3 ES 2452300T3
Authority
ES
Spain
Prior art keywords
section
subband
spectrum
transformation
smoothing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09804758.2T
Other languages
English (en)
Inventor
Tomofumi Yamanashi
Masahiro Oshikiri
Toshiyuki Morii
Hiroyuki Ehara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Application granted granted Critical
Publication of ES2452300T3 publication Critical patent/ES2452300T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un aparato de alisamiento de espectro que comprende: una sección (101) de transformación de tiempo-frecuencia para realizar una transformación de tiempo-frecuenciade una señal de conversación de entrada y para generar un espectro de componente de frecuencia; una sección (102) de división de subbanda para dividir el espectro de componente de frecuencia en unapluralidad de subbandas, y para dividir adicionalmente cada subbanda en una pluralidad de subgrupos; una sección (103) de cálculo de valor representativo para emitir un valor representativo de cada subbandadividida calculando, para cada subgrupo de una subbanda dividida, una media aritmética de los valoresabsolutos de los componentes de frecuencia del subgrupo, usando un cálculo de multiplicación de un productode dichas medias aritméticas calculadas para los subgrupos de la subbanda dividida, y emitir el producto como elvalor representativo de la subbanda; una sección (104) de transformación no lineal para realizar una transformación no lineal de los valoresrepresentativos de las subbandas calculando un valor intermedio de cada subbanda realizando unatransformación logarítmica del valor representativo de la subbanda, multiplicando el valor intermedio de lasubbanda por la inversa del número de subgrupos en la subbanda, y emitir un valor obtenido mediante dichamultiplicación como un valor representativo sometido a la transformación no lineal; y una sección (105) de alisamiento para alisar los valores representativos sometidos a la transformación no linealen el dominio de frecuencia.

Description

Dispositivo de alisamiento espectral, dispositivo de codificación, dispositivo de decodificación, dispositivo de terminal de comunicación, dispositivo de estación base y método de alisamiento espectral 5
Campo técnico
La presente invención se refiere a un aparato de alisamiento de espectro, un aparato de codificación, un aparato de decodificación, un aparato de terminal de comunicación, un aparato de estación base y un método de alisamiento de
10 espectro que alisa espectro de señales de conversación.
Antecedentes de la técnica
Cuando se transmiten señales de conversación/audio en un sistema de comunicación de paquetes caracterizado por
15 comunicación de internet y un sistema de comunicación móvil, se usa a menudo una técnica de compresión/codificación para mejorar la velocidad de transmisión de señales de conversación/audio. Adicionalmente, en los últimos años, además de una demanda para codificar de manera simple señales de conversación/audio a bajas tasas de bits, existe una creciente demanda de una técnica para codificar señales de conversación/audio en alta calidad.
20 Para satisfacer esta demanda, están en marcha estudios para desarrollar diversas técnicas para realizar transformación ortogonal (es decir, transformación de tiempo-frecuencia) de una señal de conversación para extraer componentes de frecuencia (es decir espectro) de la señal de conversación y aplicar diversos procesamientos tales como transformación lineal y transformación no lineal al espectro calculado para mejorar la calidad de la señal
25 decodificada (véase, por ejemplo, bibliografía de patente 1). De acuerdo con el método desvelado en la bibliografía de patente 1, en primer lugar, se analiza un espectro de frecuencia contenido en una señal de conversación de una cierta longitud de tiempo, y a continuación se aplica procesamiento de transformación no lineal para destacar mayores valores de potencia de espectro para el espectro analizado. A continuación, se realiza procesamiento de alisamiento lineal para el espectro sometido a procesamiento de transformación no lineal en el dominio de
30 frecuencia. Después de esto, se realiza procesamiento de transformación no lineal inversa para cancelar características de transformación no lineal, y, adicionalmente, se realiza procesamiento de alisamiento inverso para cancelar características de alisamiento, de modo que se suprimen los componentes de ruido incluidos en la señal de conversación a través de toda la banda. Por lo tanto, con el método desvelado en la bibliografía de patente 1, todas las muestras de un espectro obtenidas desde una señal de conversación se someten a procesamiento de
35 transformación no lineal y a continuación se alisa el espectro, de modo que se obtiene la señal de conversación en buena calidad. La bibliografía de patente 1 introduce métodos de transformación tales como transformación de potencia y transformación logarítmica como ejemplos de procesamiento no lineal.
Lista de citas
40 Bibliografía de patente
PTL 1
Solicitud de Patente Japonesa Abierta a Inspección Publica Nº 2002-244695
45 PTL 2 Documento WO 2007/037361 Bibliografía distinta de patente
NPL 1
50 Yuichiro TAKAMIZAWA, Toshiyuki NOMURA y Masao IKEKAWA, “High-Quality and Processor-Efficient Implementation of and MPEG-2 AAC Encoder”, IEICE TRANS. INF. &SYST., VOL.E86-D, Nº 3 marzo de 2003
Además, la Publicación de Solicitud de Patente de Estados Unidos 2004/0013276 desvela un sistema de mejora de señal de audio analógica que usa un algoritmo de supresión de ruido.
55 La Publicación de Solicitud de Patente de Estados Unidos 2007/0136053 desvela un detector de música para cancelación de eco y reducción de ruido.
La Publicación de Solicitud de Patente de Estados Unidos 2002/049584 desvela codificación perceptualmente 60 mejorada de señales acústicas.
Sumario de la invención
Problema técnico
5 Sin embargo, con el método desvelado en la bibliografía de patente 1, el procesamiento de transformación no lineal necesita realizarse para todas las muestras de un espectro obtenido desde una señal de conversación, y por tanto existe un problema de que la cantidad de procesamiento de cálculo es enorme. Adicionalmente, si únicamente se extraen parte de las muestras de un espectro para reducir la cantidad de procesamiento de cálculo, no puede siempre conseguirse suficientemente alta calidad de conversación realizando simplemente alisamiento de espectro después de transformación no lineal.
En base a una configuración para realizar transformación no lineal de un valor de espectro calculado desde una señal de conversación y a continuación alisar el espectro, es un objeto de la presente invención proporcionar un aparato de alisamiento de espectro, un aparato de codificación, un aparato de decodificación, un aparato de terminal
15 de comunicación, un aparato de estación base y un método de alisado de espectro, como se define mediante las reivindicaciones adjuntas, en las cuales se mantiene buena calidad de conversación y puede reducirse sustancialmente la cantidad de procesamiento de cálculo.
Solución al problema
En un ejemplo útil para entender los antecedentes de la presente invención, el aparato de alisamiento de espectro de acuerdo con la presente invención emplea una configuración para incluir: una sección de transformación de tiempo-frecuencia que realiza una transformación de tiempo-frecuencia de una señal de entrada y genera un componente de frecuencia; una sección de división de subbanda que divide el componente de frecuencia en una
25 pluralidad de subbandas; un valor representativo que calcula la sección que calcula un valor representativo de cada subbanda dividida calculando una media aritmética y usando un cálculo de multiplicación que usa un resultado de cálculo de la media aritmética; una sección de transformación no lineal que realiza una transformación no lineal de valores representativos de las subbandas; y una sección de alisamiento que alisa los valores representativos sometidos a la transformación no lineal en el dominio de frecuencia.
En otro ejemplo, el método de alisamiento de espectro incluye: una etapa de transformación de tiempo-frecuencia de realizar una transformación de tiempo-frecuencia de una señal de entrada y genera un componente de frecuencia; una etapa de división de subbanda de dividir el componente de frecuencia en una pluralidad de subbandas; una etapa de cálculo de valor representativo de calcular un valor representativo de cada subbanda dividida calculando
35 una media aritmética y usando un cálculo de multiplicación que usa un resultado de cálculo de la media aritmética; una etapa de transformación no lineal de realizar una transformación no lineal de valores representativos de las subbandas; y una etapa de alisamiento de alisar los valores representativos sometidos a la transformación no lineal en el dominio de frecuencia.
Efectos ventajosos de la invención
Con la presente invención, es posible mantener buena calidad de conversación y reducir la cantidad de procesamiento de cálculo.
45 Breve descripción de los dibujos
La Figura 1 proporciona vistas generales de espectro que muestran una vista general de procesamiento de acuerdo con la realización 1 de la presente invención; La Figura 2 es un diagrama de bloques que muestra una configuración de la parte principal de un aparato de alisamiento de espectro de acuerdo con la realización 1; La Figura 3 es un diagrama de bloques que muestra una configuración de la parte principal de una sección de cálculo de valor representativo de acuerdo con la realización 1; La Figura 4 es una vista general que muestra una configuración de subbandas y subgrupos de una señal de entrada de acuerdo con la realización 1;
55 La Figura 5 es un diagrama de bloques que muestra una configuración de un sistema de comunicación que tiene un aparato de codificación y aparato de decodificación de acuerdo con la realización 2 de la presente invención; La Figura 6 es un diagrama de bloques que muestra una parte principal interna del aparato de codificación de acuerdo con la realización 2 mostrada en la Figura 5; La Figura 7 es un diagrama de bloques que muestra una configuración de la parte principal interna de la sección de codificación de segunda capa de acuerdo con la realización 2 mostrada en la Figura 6; La Figura 8 es un diagrama de bloques que muestra una configuración de la parte principal del aparato de alisamiento de espectro de acuerdo con la realización 2 mostrada en la Figura 7; La Figura 9 muestra un diagrama para explicar los detalles del procesamiento de filtrado en la sección de filtrado de acuerdo con la realización 2 mostrada en la Figura 7;
65 La Figura 10 es un diagrama de flujo para explicar las etapas de procesamiento para buscar el coeficiente de tono óptimo Tp’ con respecto a la subbanda SBp en la sección de búsqueda de acuerdo con la realización 2 mostrada en la Figura 7; La Figura 11 es un diagrama de bloques que muestra una configuración de la parte principal interna del aparato de decodificación de acuerdo con la realización 2 mostrada en la Figura 5; y La Figura 12 es un diagrama de bloques que muestra una configuración de la parte principal interna de la
5 sección de decodificación de segunda capa de acuerdo con la realización 2 mostrada en la Figura 11.
Descripción de las realizaciones
Se describirán en detalle realizaciones de la presente invención con referencia a los dibujos adjuntos.
10 (Realización 1)
En primer lugar, se describirá una vista general del método de alisamiento de espectro de acuerdo con una realización de la presente invención usando la Figura 1. La Figura 1 muestra diagramas de espectro para explicar
15 una vista general del método de alisamiento de espectro de acuerdo con la presente realización.
La Figura 1A muestra un espectro de una señal de entrada. Con la presente realización, en primer lugar, se divide un espectro de señal de entrada en una pluralidad de subbandas. La Figura 1B muestra cómo se divide un espectro de señal de entrada en una pluralidad de subbandas. El diagrama de espectro de la Figura 1 es para explicar una
20 vista general de la presente invención, y la presente invención no está limitada de ninguna manera al número de subbandas mostradas en el dibujo.
A continuación, se calcula un valor representativo de cada subbanda. Para ser más específicos, las muestras en una subbanda se dividen adicionalmente en una pluralidad de subgrupos. A continuación, se calcula una media
25 aritmética de valores de espectro absolutos por subgrupo.
A continuación, se calcula una media geométrica de los valores de media aritmética de subgrupos individuales por subbanda. Este valor de media geométrica no es un valor de media geométrica precisa aún, y, en este punto, puede calcularse un valor que se obtiene simplemente multiplicando valores de media aritmética de grupos individuales, y
30 puede encontrarse un valor de media geométrica precisa después de transformación no lineal (descrito más adelante). El procesamiento anterior es para reducir la cantidad de procesamiento de cálculo, y es igualmente posible para encontrar un valor de media geométrica precisa en este punto.
Un valor de media geométrica encontrado de esta manera puede usarse como un valor representativo de cada
35 subbanda. La Figura 1C muestra valores representativos de subbandas individuales a través de un espectro de señal de entrada mostrado con líneas discontinuas. Para facilidad de explicación, la Figura 1C muestra valores de media geométrica precisa como valores representativos, en lugar de valores obtenidos simplemente multiplicando valores de media aritmética de subgrupos individuales.
40 A continuación, con referencia a cada valor representativo de subbanda, se realiza transformación no lineal (por ejemplo, transformación logarítmica) para un espectro de una señal de entrada de manera que se destacan mayores valores de potencia de espectro, y a continuación se realiza procesamiento de alisamiento en el dominio de frecuencia. Posteriormente, se realiza transformación no lineal inversa (por ejemplo, transformación logarítmica inversa), y se calcula un espectro alisado en cada subbanda. La Figura 1D muestra un espectro alisado de cada
45 subbanda a través de un espectro de señal de entrada mostrado con líneas discontinuas.
Por medio de este procesamiento, es posible realizar alisamiento de espectro en el dominio logarítmico mientras se reduce la degradación de calidad de conversación y se reduce sustancialmente la cantidad de procesamiento de cálculo. Ahora, se describirá una configuración de un aparato de alisamiento de espectro que proporciona la anterior
50 ventaja, de acuerdo con una realización de la presente invención.
El aparato de alisamiento de espectro de acuerdo con la presente realización alisa un espectro de entrada, y emite el espectro después del alisamiento (en lo sucesivo en el presente documento “espectro alisado”) como una señal de salida. Para ser más específicos, el aparato de alisamiento de espectro divide una señal de entrada cada N
55 muestras (donde N es un número natural), y realiza procesamiento de alisamiento por trama usando N muestras como una trama. En este punto, una señal de entrada que se somete a procesamiento de alisamiento se representa como “xn” (n=0, ..., N-1).
La Figura 2 muestra una configuración de la parte principal del aparato 100 de alisamiento de espectro de acuerdo 60 con la presente realización.
El aparato 100 de alisamiento de espectro mostrado en la Figura 2 está formado principalmente con la sección 101 de procesamiento de transformación de tiempo-frecuencia, sección 102 de división de subbanda, sección 103 de cálculo de valor representativo, sección 104 de transformación no lineal, sección 105 de alisamiento y sección 106
65 de transformación no lineal inversa.
La sección 101 de procesamiento de transformación de tiempo-frecuencia aplica una transformada rápida de Fourier (FFT) a la señal de entrada xn y encuentra un espectro de componente de frecuencia S1(k) (en lo sucesivo en el presente documento “espectro de entrada”).
5 A continuación, la sección 101 de procesamiento de transformación de tiempo-frecuencia emite el espectro de entrada S1(k) a la sección 102 de división de subbanda.
La sección 102 de división de subbanda divide el espectro de entrada S1(k) recibido como entrada desde la sección 101 de procesamiento de transformación de tiempo-frecuencia, en P subbandas (donde P es un entero igual a o
10 mayor de 2). Ahora, se describirá un caso a continuación donde la sección 102 de división de subbanda divide el espectro de entrada S1(k) de manera que cada subbanda contiene el mismo número de muestras. El número de muestras puede variar entre subbandas. La sección 102 de división de subbanda emite los espectros divididos por subbanda (en lo sucesivo en el presente documento “espectros de subbanda”), a la sección 103 de cálculo de valor representativo.
15 La sección 103 de cálculo de valor representativo calcula un valor representativo para cada subbanda como un espectro de entrada dividido en subbandas, recibido como entrada desde la sección 102 de división de subbanda, y emite el valor representativo calculado por subbanda, a la sección 104 de transformación no lineal. El procesamiento en la sección 103 de cálculo de valor representativo se describirá en detalle más adelante.
20 La Figura 3 muestra una configuración interna de la sección 103 de cálculo de valor representativo. La sección 103 de cálculo de valor representativo mostrada en la Figura 3 tiene la sección 201 de cálculo de media aritmética y la sección 202 de cálculo de media geométrica.
25 En primer lugar, la sección 102 de división de subbanda emite un espectro de subbanda a la sección 201 de cálculo de media aritmética.
La sección 201 de cálculo de media aritmética divide cada subbanda del espectro de subbanda recibido como entrada en Q subgrupos del subgrupo 0, subgrupo Q-1, etc. (donde Q es un entero igual a o mayor de 2). Ahora, se
30 describirá un caso a continuación donde se forman Q subgrupos cada uno con R muestras (R es un entero igual a o mayor de 2). Aunque se describirá un caso a continuación donde se forman todos los Q subgrupos con R muestras, el número de muestras puede variar entre subgrupos.
La Figura 4 muestra una configuración de muestra de subbandas y subgrupos. La Figura 4 muestra, como un 35 ejemplo, un caso donde el número de muestras para constituir una subbanda es ocho, el número de subgrupos Q para constituir una subbanda es dos y el número de muestras R en un subgrupo es cuatro.
A continuación, para cada uno de los Q subgrupos, la sección 201 de cálculo de media aritmética calcula una media aritmética de los valores absolutos de los espectros (coeficientes FFT) contenidos en cada subgrupo, usando la 40 ecuación 1.
[1]
45 En la ecuación 1, AVE1q es una media aritmética de los valores absolutos de los espectros contenidos en el subgrupo q, y BSq es el índice de la muestra anterior en el subgrupo q.
A continuación, la sección 201 de cálculo de media aritmética emite espectros de valor de media aritmética calculados por subbanda, AVE1q (q=0!Q-1) (espectros de valor de media aritmética de subbanda), a la sección 202 50 de cálculo de media geométrica.
La sección 202 de cálculo de media geométrica multiplica los espectros de valor de media aritmética AVE1q (q=0!Q1) de todas las subbandas recibidas como entrada desde la sección 201 de cálculo de media aritmética, como se muestra en la ecuación 2, y calcula un espectro representativo, AVE2p (p=0!P-1), para cada subbanda.
En la ecuación 2, P es el número de subbandas.
A continuación, la sección 202 de cálculo de media geométrica emite espectros de valor representativo de subbanda calculados AVE2p (p=0!P-1) a la sección 104 de transformación no lineal.
5 La sección 104 de transformación no lineal aplica transformación no lineal que tiene una característica de destacar mayores valores representativos, a espectros de valor representativo de subbanda AVE2p recibidos como entrada desde la sección 202 de cálculo de media geométrica, usando la ecuación 3, y calcula los primeros espectros de valor representativo logarítmico de subbanda AVE3p (p=0!P-1). Se describirá un caso en este punto donde se
10 realiza transformación logarítmica como procesamiento de transformación no lineal.
[3]
A continuación, se calcula un segundo espectro de valor representativo logarítmico de subbanda, AVE4p (p=0!P-1), 15 multiplicando el primer espectro de valor representativo logarítmico de subbanda calculado, AVE3p (p=0!P-1) por la inversa del número de subgrupos, Q, usando la ecuación 4.
[4]
20 Aunque en el procesamiento de la ecuación 2 en la sección 202 de cálculo de media geométrica simplemente se multiplican los espectros de valor de media aritmética de subbanda AVE1p de subbandas individuales, en el procesamiento de la ecuación 4 en la sección 104 de transformación no lineal, se calcula una media geométrica. Con la presente realización, se realiza transformación en el dominio logarítmico usando la ecuación 3, y a
25 continuación se realiza la multiplicación por la inversa del número de subgrupos, Q, usando la ecuación 4. Por este medio, el cálculo de la raíz del radical, que implica una gran cantidad de cálculo, puede sustituirse por división simple. Adicionalmente, cuando el número de subgrupos, Q, es una constante, el cálculo de la raíz del radical puede sustituirse por multiplicación simple, calculando la inversa de Q con antelación, de modo que la cantidad de cálculo puede reducirse adicionalmente.
30 A continuación, la sección 104 de transformación no lineal emite los segundos espectros de valor representativo logarítmico de subbanda AVE4p (p=0!P-1) calculados usando la ecuación 4, a la sección 105 de alisamiento.
Con referencia de vuelta a la Figura 2 de nuevo, la sección 105 de alisamiento alisa los segundos espectros de valor
35 representativo logarítmico de subbanda AVE4p (p=0!P-1) recibidos como entrada desde la sección 104 de transformación no lineal, en el dominio de frecuencia, usando la ecuación 5, y calcula espectros alisados logarítmicos AVE5p (p=0!P-1).
[5]
La ecuación 5 representa procesamiento de filtrado de alisamiento, y, en esta ecuación 5, MA_LEN es el orden de filtrado de alisamiento y Wi es la ponderación del filtro de alisamiento.
45 Adicionalmente, en la ecuación 5 se proporciona un método para calcular un espectro alisado logarítmico cuando el índice de subbanda p es p∀=(MA_LEN-1)/2 y p#=P-1-(MA_LEN-1)/2. Cuando el índice de subbanda p está en lo más alto o cerca del último, se alisan los espectros usando la ecuación 6 y ecuación 7 teniendo en cuenta las condiciones de límite.
[6] 50
[7]
5 Adicionalmente, la sección 105 de alisamiento realiza alisamiento en base a una media móvil simple, como el procesamiento de alisamiento alisando el procesamiento de filtrado, como se ha descrito anteriormente (cuando Wi es 1 para todas las i, se realiza alisamiento en base a la media móvil). Para la función ventana (ponderación), puede usarse la ventana Hanning u otras funciones ventana.
10 A continuación, la sección 105 de alisamiento emite los espectros alisados calculados AVE5p (p=0!P-1) a la sección 106 de transformación no lineal inversa.
La sección 106 de transformación no lineal inversa realiza transformación logarítmica inversa como transformación no lineal inversa para los espectros alisados logarítmicos AVE5p (p=0!P-1) recibidos como entrada desde la sección
15 105 de alisamiento. La sección 106 de transformación no lineal inversa realiza transformación logarítmica inversa para los espectros alisados logarítmicos AVE5p (p=0!P-1) usando la ecuación 8, y calcula el espectro alisado AVE6p (p=0!P-1).
[8]
Adicionalmente, la sección 106 de transformación no lineal inversa calcula un espectro alisado de todas las muestras usando los valores de muestras en cada subbanda como los valores de espectro alisado de dominio lineal AVE6p (p=0!P-1).
25 La sección 106 de transformación no lineal inversa emite los valores de espectros alisados de todas las muestras como un resultado de procesamiento del aparato 100 de alisamiento de espectro.
Se ha descrito el aparato de alisamiento de espectro y método de alisamiento de espectro de acuerdo con la 30 presente invención.
Como se ha descrito anteriormente, con la presente realización, la sección 102 de división de subbanda divide un espectro de entrada en una pluralidad de subbandas, la sección 103 de cálculo de valor representativo calcula el valor representativo por subbanda usando una media aritmética o media geométrica, la sección 104 de
35 transformación no lineal realiza transformación no lineal que tiene una característica de destacar mayores valores a cada valor representativo, y la sección 105 de alisamiento alisa valores representativos sometidos a transformación no lineal por subbanda en el dominio de frecuencia.
Por lo tanto, todas las muestras de un espectro se dividen en una pluralidad de subbandas, y, para cada subbanda,
40 se encuentra un valor representativo combinando una media aritmética con cálculo de multiplicación o media geométrica, y a continuación se realiza alisamiento después de que el valor representativo se somete a transformación no lineal, de modo que es posible mantener buena calidad de conversación y reducir sustancialmente la cantidad de procesamiento de cálculo.
45 Como se ha descrito anteriormente, la presente invención emplea una configuración para calcular valores representativos de subbandas combinando medias aritméticas y medias geométricas de muestras en subbandas, de modo que es posible evitar la degradación de calidad de conversación que puede aparecer debido a la variación de la escala de valores de muestra en una subbanda cuando se usan valores de media en el dominio lineal simplemente como valores representativos de subbandas.
Aunque se ha explicado la transformada rápida de Fourier (FFT) como un ejemplo de procesamiento de
5 transformación de tiempo-frecuencia con la presente realización, la presente invención no está limitada de ninguna manera a esto, y son igualmente aplicables otros métodos de transformación de tiempo-frecuencia además de la transformada rápida de Fourier (FFT). Por ejemplo, de acuerdo con la bibliografía de patente 1, tras el cálculo de valores de enmascaramiento perceptual (véase la Figura 2), se usa la transformada de coseno discreta modificada (MDCT), y no la transformada rápida de Fourier (FFT), para calcular componentes de frecuencia (espectro). Por lo tanto, la presente invención es aplicable a configuraciones que usan la transformada de coseno discreta modificada (MDCT) y otros métodos de transformación de tiempo-frecuencia en una sección de procesamiento de transformación de tiempo-frecuencia.
En la configuración anteriormente descrita, la sección 202 de cálculo de media geométrica multiplica un espectro de
15 valor de media aritmética AVE1q (q=0!Q-1), y no calcula raíces de radicales. Es decir, en sentido estricto, la sección 202 de cálculo de media geométrica no calcula valores de media geométrica, debido a que, como se ha explicado anteriormente, en la sección 104 de transformación no lineal, se realiza transformación en el dominio logarítmico usando la ecuación 3 como procesamiento de transformación no lineal y a continuación se realiza la multiplicación por la inversa del número de subgrupos Q usando la ecuación 4, de modo que es posible sustituir el cálculo de la raíz del radical mediante división simple (multiplicación) y en consecuencia reducir la cantidad de cálculo.
En consecuencia, la presente invención no está necesariamente limitada a la configuración anterior. La presente invención es igualmente aplicable a, por ejemplo, una configuración para multiplicar, en la sección 202 de cálculo de media geométrica, los espectros de valor de media aritmética AVE1q (q=0!Q-1) por los valores de espectros de valor
25 de media aritmética por subbanda, y a continuación calcular una raíz del radical del número de subgrupos y emitir la raíz del radical calculada a la sección 104 de transformación no lineal como los espectros de valores representativos de subbanda AVE2p (p=0!P-1). De cualquier manera, la sección 105 de alisamiento puede obtener un valor representativo que se ha sometido a transformación no lineal, por subbanda. En este caso, puede omitirse el cálculo de la ecuación 4 en la sección 104 de transformación no lineal.
Anteriormente se ha descrito un caso con la presente realización donde se calcula un valor representativo de cada subbanda calculando, en primer lugar, un valor de media aritmética de un subgrupo, y a continuación encontrando un valor de media geométrica de los valores de media aritmética de todos los subgrupos en una subbanda. Sin embargo, la presente invención no está limitada de ninguna manera a esto y es igualmente aplicable a un caso
35 donde, por ejemplo, el número de muestras para constituir un subgrupo es uno, es decir, un caso donde se usa un valor de media geométrica de todas las muestras en una subbanda como un valor representativo de la subbanda sin calcular un valor de media aritmética de cada subgrupo. En esta configuración de nuevo, como se ha descrito anteriormente, en lugar de calcular un valor de media geométrica precisa, es posible calcular un valor de media geométrica en el dominio logarítmico realizando transformación no lineal y a continuación realizar multiplicación por la inversa del número de subgrupos.
En la descripción anterior, todas las muestras en una subbanda tienen el mismo valor de espectro en la sección 106 de transformación no lineal inversa. Sin embargo, la presente invención no está limitada de ninguna manera a esto, y es igualmente posible proporcionar una sección de procesamiento de alisamiento inverso después de la sección
45 106 de transformación no lineal inversa de modo que la sección de procesamiento de alisamiento inverso pueda asignar ponderación a muestras en cada subbanda y realizar procesamiento de alisamiento inverso. Este procesamiento de alisamiento inverso no necesita ser completamente contrario a la sección 105 de alisamiento.
Aunque se ha descrito un caso con la anterior descripción donde la sección 104 de transformación no lineal realiza transformación logarítmica inversa como procesamiento de transformación no lineal inversa y la sección 106 de transformación no lineal inversa realiza transformación logarítmica inversa como procesamiento de transformación no lineal inversa, esto no es de ninguna manera limitante, y es igualmente posible usar transformación de potencia y otras y realizar procesamiento inverso de transformación no lineal como procesamiento de transformación no lineal inversa. Sin embargo, dado que el cálculo de una raíz del radical puede sustituirse por división simple
55 (multiplicación) multiplicando la inversa del número de subgrupos Q usando la ecuación 4, el hecho de que la sección 104 de transformación no lineal realiza transformación logarítmica como transformación no lineal, debe acreditarse para la reducción de la cantidad de cálculo. En consecuencia, si se realiza procesamiento que es diferente de la transformación logarítmica como procesamiento de transformación no lineal, es entonces igualmente posible calcular un valor representativo por subbanda calculando un valor de media geométrica de valores de media aritmética de subgrupos y aplicar procesamiento no lineal a los valores representativos.
Adicionalmente, al igual que para el número de subbandas y el número de subgrupos, si, por ejemplo, la frecuencia de muestreo de una señal de entrada es 32 kHz y una trama es de 20 ms de longitud, es decir, si una señal de entrada se comprende de 640 muestras, es posible para, por ejemplo, establecer el número de subbandas a 65 ochenta, el número de subgrupos a dos, el número de muestras por subgrupo a cuatro y el orden de filtrado de alisamiento a siete, por ejemplo. La presente invención no está limitada de ninguna manera a este ajuste y es
igualmente aplicable a casos donde se aplican diferentes valores.
El aparato de alisamiento de espectro y método de alisamiento de espectro de acuerdo con la presente invención son aplicables a cualquiera y todos los dispositivos de alisamiento de espectro o componentes que realizan 5 alisamiento en el dominio espectral, incluyendo aparatos de codificación de conversación y método de codificación de conversación, aparatos de decodificación de conversación y método de decodificación de conversación y aparatos de reconocimiento de conversación y método de reconocimiento de conversación. Por ejemplo, aunque, con la técnica de mejora de ancho de banda desvelada en la bibliografía de patente 2, se usa el procesamiento para calcular una envolvente espectral a partir de LPC (Coeficientes Predictivos Lineales), y, en base a esta envolvente espectral calculada, retirar la envolvente espectral a partir del espectro de banda inferior, para calcular parámetros para generar un espectro de banda superior, es igualmente posible usar un espectro alisado calculado aplicando el método de alisamiento de espectro de acuerdo con la presente invención a un espectro de banda inferior en lugar de la envolvente espectral usada en el procesamiento de retirada de envolvente espectral en la bibliografía de patente
2.
15 Adicionalmente, aunque se ha explicado una configuración con la presente realización donde se divide un espectro de entrada S1(k) en P subbandas (donde P es un entero igual a o mayor de 2) todas tienen el mismo número de muestras, la presente invención no está limitada de ninguna manera a esto y es igualmente aplicable a una configuración en la que el número de muestras varía entre subbandas. Por ejemplo, es posible una configuración en la que se dividen subbandas de manera que una subbanda en el lado de banda inferior tiene un número menor de muestras y una subbanda en el lado de banda superior tiene un mayor número de muestras. En términos generales, en la percepción humana, la resolución de frecuencia disminuye en el lado de banda superior, de modo que se hace posible alisamiento de espectro más eficaz con la configuración anterior. Lo mismo se aplica a subgrupos para constituir cada subbanda. Aunque se ha descrito un caso anteriormente con la presente realización donde se forman
25 todos los Q subgrupos con R muestras, la presente invención no está limitada de ninguna manera a esto, y es igualmente aplicable a configuraciones donde se dividen subgrupos de manera que un subgrupo en el lado de banda inferior tiene un menor número de muestras y un subgrupo en el lado de banda superior tiene un gran número de muestras.
Aunque se ha descrito una media móvil ponderada como un ejemplo de procesamiento de alisamiento con la presente realización, la presente invención no está limitada de ninguna manera a esto y es igualmente aplicable a diversos procesamientos de alisamiento. Por ejemplo, como se ha descrito anteriormente, en una configuración en la que el número de muestras varía entre subbandas (es decir, el número de muestras aumenta en la banda superior), es posible hacer que el número de derivaciones en un filtro de media móvil no sea el mismo entre la izquierda y la
35 derecha y aumentar el número de derivaciones en la banda superior. Cuando el número de muestras aumenta en subbandas en la banda superior, es posible realizar perceptualmente procesamiento de alisamiento más adecuado usando un filtro de media móvil que tiene un pequeño número de derivaciones en el lado de banda superior. La presente invención es aplicable a casos que usan un filtro de media móvil que es asimétrico entre la izquierda y la derecha y tiene un mayor número de derivaciones en el lado de la banda superior.
(Realización 2)
Se describirá ahora una configuración con la presente realización donde se usa el procesamiento de alisamiento de espectro explicado con la realización 1 en procesamiento preparatorio tras codificación de mejora de banda
45 desvelada en la bibliografía de patente 2.
La Figura 5 es un diagrama de bloques que muestra una configuración de un sistema de comunicación que tiene un aparato de codificación y aparato de decodificación de acuerdo con la realización 2. En la Figura 5, el sistema de comunicación tiene un aparato de codificación y un aparato de decodificación que son mutuamente comunicables mediante un canal de transmisión. El aparato de codificación y aparato de decodificación se montan normalmente en un aparato de estación base y aparato de terminal de comunicación para uso.
El aparato 301 de codificación divide una señal de entrada cada N muestras (donde N es un número natural) y realiza codificación en una base en tramas usando N muestras como una trama. La señal de entrada a someter a
55 codificación se representa como xn (n=0, ..., N-1). n es el (n+1)-ésimo componente de señal en la señal de entrada dividido cada N muestras. La información de entrada que se ha sometido a codificación (información codificada) se transmite al aparato 303 de decodificación mediante el canal 302 de transmisión.
El aparato 303 de decodificación recibe la información codificada transmitida desde el aparato 301 de codificación mediante el canal 302 de transmisión, y, decodificando esto, obtiene una señal de salida.
La Figura 6 es un diagrama de bloques que muestra una configuración de la parte principal interna del aparato 301 de codificación. Si la frecuencia de muestreo de señal de entrada es SRentrada, la sección 311 de procesamiento de submuestreo submuestrea la frecuencia de muestreo de señal de entrada desde SRentrada a SRbase (SRbase#SRentrada),
65 y emite señal de entrada después de submuestrear a la sección 312 de codificación de primera capa como una señal de entrada submuestreada.
La sección 312 de codificación de primera capa genera la información codificada de primera capa codificando la señal de entrada submuestreada recibida como entrada desde la sección 311 de procesamiento de submuestreo, usando un método de codificación de conversación de un esquema CELP (Predicción Lineal con Excitación por Código), y emite la información codificada de primera capa generada a la sección 313 de decodificación de primera
5 capa y sección 317 de integración de información codificada.
La sección 313 de decodificación de primera capa genera una señal decodificada de primera capa decodificando la información codificada de primera capa recibida como entrada desde la sección 312 de codificación de primera capa, usando, por ejemplo, un método de decodificación de conversación CELP, y emite la señal decodificada de
10 primera capa generada a la sección 314 de procesamiento de sobremuestreo.
La sección 314 de procesamiento de sobremuestreo sobremuestrea la frecuencia de muestreo de la señal de entrada recibida como entrada desde la sección 313 de decodificación de primera capa desde SRbase a SRentrada, y emite la señal decodificada de primera capa después de sobremuestrear a la sección 315 de procesamiento de
15 transformación de tiempo-frecuencia como una señal decodificada de primera capa sobremuestreada.
La sección 318 de retardo proporciona un retardo de una longitud predeterminada, a la señal de entrada. Este retardo es para corregir el retardo de tiempo en la sección 311 de procesamiento de submuestreo, sección 312 de codificación de primera capa, sección 313 de decodificación de primera capa y sección 314 de procesamiento de
20 sobremuestreo.
La sección 315 de procesamiento de transformación de tiempo-frecuencia tiene la memoria intermedia buf1n y buf2n (n=0,...,N-1) en su interior, y aplica una transformada de coseno discreta modificada (MDCT) a la señal de entrada xn y señal decodificada de primera capa sobremuestreada yn recibidas como entrada desde la sección 314 de
25 procesamiento de sobremuestreo.
A continuación, se describirá el procesamiento de transformación ortogonal en la sección 315 de procesamiento de transformación de tiempo-frecuencia como para su etapa de cálculo y salida de datos a memorias intermedias internas.
30 En primer lugar, la sección 315 de procesamiento de transformación de tiempo-frecuencia inicializa buf1n y buf2n usando el valor inicial “0” de acuerdo con la ecuación 9 y ecuación 10 a continuación.
[9]
40 A continuación, la sección 315 de procesamiento de transformación de tiempo-frecuencia realiza una MDCT de la señal de entrada xn y señal decodificada de primera capa sobremuestreada yn, y encuentra el coeficiente MDCT S2(k) de la señal de entrada (en lo sucesivo en el presente documento “espectro de entrada”) y el coeficiente MDCT S1(k) de la señal decodificada de primera capa sobremuestreada yn (en lo sucesivo en el presente documento
45 “primer espectro decodificado de capa”).
[11]
50 [12] K es el índice de cada muestra en una trama. La sección 315 de procesamiento de transformación de tiempofrecuencia encuentra xn’, que es un vector que combina la señal de entrada xn y la memoria intermedia buf1n a partir de la ecuación 13 a continuación. La sección 315 de procesamiento de transformación de tiempo-frecuencia también encuentra yn’ que es un vector que combina la señal decodificada de primera capa sobremuestreada yn y la memoria intermedia buf2n.
[13]
10 [14]
A continuación, la sección 315 de procesamiento de transformación de tiempo-frecuencia actualiza la memoria 15 intermedia buf1n y buf2n usando la ecuación 15 y ecuación 16.
[15]
A continuación, la sección 315 de procesamiento de transformación de tiempo-frecuencia emite el espectro de 25 entrada S2(k) y el primer espectro decodificado de capa S1(k) a la sección 316 de codificación de segunda capa.
La sección 316 de codificación de segunda capa genera la información codificada de segunda capa usando el espectro de entrada S2(k) y el primer espectro decodificado de capa S1(k) recibidos como entrada desde la sección 315 de procesamiento de transformación de tiempo-frecuencia, y emite la información codificada de segunda capa
30 generada a la sección 317 de integración de información codificada. Los detalles de la sección 316 de codificación de segunda capa se describirán más adelante.
La sección 317 de integración de información codificada integra la información codificada de primera capa recibida como entrada desde la sección 312 de codificación de primera capa y la información codificada de segunda capa
35 recibida como entrada desde la sección 316 de codificación de segunda capa, y, si fuera necesario, adjunta un código de corrección de errores de transmisión al código fuente de información integrada, y emite el resultado al canal 302 de transmisión como información codificada.
A continuación, se describirá la configuración de la parte principal interna de la sección 316 de codificación de 40 segunda capa mostrada en la Figura 6 usando la Figura 7.
La sección 316 de codificación de segunda capa tiene la sección 360 de división de banda, sección 361 de alisamiento de espectro, sección 362 de ajuste de estado de filtro, sección 363 de filtrado, sección 364 de búsqueda, sección 365 de ajuste de coeficiente de tono, sección 366 de codificación de ganancia y sección 367 de
45 multiplexación, y estas secciones realizan las siguientes operaciones.
La sección 360 de división de banda divide la parte de la banda superior (FL#=k#FH) del espectro de entrada S2(k) recibido como entrada desde la sección 315 de procesamiento de transformación de tiempo-frecuencia en P subbandas SBp (p=0, 1, ... , P-1). A continuación, la sección 360 de división de banda emite el ancho de banda BWp
50 (p=0, 1, ... , P-1) e índice anterior BSp (p=0, 1, ... , P-1) (FL#=BSp#FH) de cada subbanda dividida a la sección 363 de filtrado, sección 364 de búsqueda y sección 367 de multiplexación como información de división de banda. La parte en el espectro de entrada S2(k) que corresponde a la subbanda SBp se denominará como espectro de subbanda S2p(k)
La sección 361 de alisamiento de espectro aplica procesamiento de alisamiento al primer espectro decodificado de capa S1(k) (0#=k#FL) recibido como entrada desde la sección 315 de procesamiento de transformación de tiempo5 frecuencia, emite primer espectro decodificado de capa alisado S1’(k) (0#=k#FL) después de procesamiento de alisamiento, a la sección 362 de ajuste de estado de filtro.
La Figura 8 muestra una configuración interna de la sección 361 de alisamiento de espectro. La sección 361 de alisamiento de espectro está configurada principalmente con la sección 102 de división de subbanda, sección 103 de
10 cálculo de valor representativo, sección 104 de transformación no lineal, sección 105 de alisamiento y sección 106 de transformación no lineal inversa. Estos componentes son los mismos que los componentes descritos con la realización 1 y se les asignará los mismos números de referencia sin explicaciones.
La sección 362 de ajuste de estado de filtro establece el primer espectro decodificado de capa S1’(k) (0#=k#FL)
15 recibido como entrada desde la sección 361 de alisamiento de espectro como el estado de filtro interno para uso en la siguiente sección 363 de filtrado. El primer espectro decodificado de capa alisado S1’(k) se adapta como el estado de filtro interno (estado de filtro) en la banda 0#=k#FL del espectro S(k) a través de todo el intervalo de frecuencia en la sección 363 de filtrado.
20 La sección 363 de filtrado, que tiene un filtro de tono de multi-derivación, filtra el primer espectro decodificado de capa en base al estado de filtro establecido en la sección 362 de ajuste de estado de filtro, el coeficiente de tono recibido como entrada desde la sección 365 de ajuste de coeficiente de tono e información de división de banda recibida como entrada desde la sección 360 de división de banda, y calcula el espectro estimado S2p’(k) (BSp#=k#BSp+BWp) (p=0, 1, ..., P-1) de cada subbanda SBp (p=0, 1, ..., P-1) (en lo sucesivo “espectro estimado de
25 subbanda SBp”). La sección 363 de filtrado emite el espectro estimado S2p’(k) de la subbanda SBp a la sección 364 de búsqueda. Los detalles del procesamiento de filtrado en la sección 363 de filtrado se describirán más adelante. El número de múltiples derivaciones puede ser cualquier valor (entero) igual a o mayor de 1.
En base a la información de división de banda recibida como entrada desde la sección 360 de división de banda, la
30 sección 364 de búsqueda calcula el grado de similitud entre el espectro estimado S2p’(k) de la subbanda SBp recibido como entrada desde la sección 363 de filtrado, y cada espectro de subbanda S2p(k) en la banda superior (FL#=k#FH) del espectro de entrada S2(k) recibido como entrada desde la sección 315 de procesamiento de transformación de tiempo-frecuencia. Este grado de similitud se calcula mediante, por ejemplo, cálculo de correlación. El procesamiento en la sección 363
35 de filtrado, sección 364 de búsqueda y sección 365 de ajuste de coeficiente de tono constituye el procesamiento de búsqueda de bucle cerrado por subbanda, y, en cada bucle cerrado, la sección 364 de búsqueda calcula el grado de similitud con respecto a cada coeficiente de tono modificando diversamente el coeficiente de tono T recibido como entrada desde la sección 365 de ajuste de coeficiente de tono en la sección 363 de filtrado. En cada bucle cerrado de subbanda, o, por ejemplo, en un bucle cerrado que corresponde a la subbanda SBp, la sección 364 de búsqueda
40 encuentra el coeficiente de tono óptimo Tp’ para maximizar el grado de similitud (en el intervalo de Tmín!Tmáx), y emite P coeficientes de tono óptimo a la sección 367 de multiplexación. La sección 364 de búsqueda calcula parte de la banda del primer espectro decodificado de capa para asemejarse a cada subbanda SBp usando cada coeficiente de tono óptimo Tp’. A continuación, la sección 364 de búsqueda emite el espectro estimado S2p’(k) que corresponde a cada coeficiente de tono óptimo Tp’ (p=0, 1, ..., P-1), a la sección 366 de codificación de ganancia.
45 Los detalles del procesamiento de búsqueda para el coeficiente de tono óptimo Tp’ (p=0, 1, ..., P-1) en la sección 364 de búsqueda se describirán más adelante.
En base al control mediante la sección 364 de búsqueda, cuando la sección 365 de ajuste de coeficiente de tono realiza procesamiento de búsqueda de bucle cerrado que corresponde a la primera subbanda SB0 con la sección
50 363 de filtrado y la sección 364 de búsqueda, modifica el coeficiente de tono T gradualmente en un intervalo de búsqueda predeterminado entre Tmín y Tmáx y envía secuencialmente salidas a la sección 363 de filtrado.
La sección 366 de codificación de ganancia calcula información de ganancia con respecto a la parte de la banda superior (FL#=k#FH) del espectro de entrada S2(k) recibido como entrada desde la sección 315 de procesamiento
55 de transformación de tiempo-frecuencia. Para ser más específicos, la sección 366 de codificación de ganancia divide la banda de frecuencia FL#=k#FH en J subbandas, y encuentra potencia espectral del espectro de entrada S2(k) por subbanda. En este caso, la potencia espectral Bj de la (j+1)-ésima subbanda se representa mediante la ecuación 17 a continuación.
En la ecuación 17, BLj es la mínima frecuencia de la (j+1)-ésima subbanda, y BHj es la máxima frecuencia de la (j+1)-ésima subbanda. La sección 366 de codificación de ganancia forma el espectro estimado S2’(k) de la banda superior del espectro de entrada relacionando el espectro estimado S2p’(k) (p=0, 1,..., P-1) de cada subbanda recibido como entrada desde la sección 364 de búsqueda continua en el dominio de frecuencia. A continuación, la sección 366 de codificación de ganancia calcula la potencia espectral B’j del espectro estimado S2’(k) por subbanda, como en el caso de calcular la potencia espectral del espectro de entrada S2(k), usando la ecuación 18 a continuación. A continuación, la sección 366 de codificación de ganancia calcula la cantidad de variación, Vj, de la potencia espectral del espectro estimado S2’(k) por subbanda, con respecto al espectro de entrada S2(k), usando la ecuación 19 a continuación.
15 A continuación, la sección 366 de codificación de ganancia codifica la cantidad de variación Vj, y emite un índice que corresponde a la cantidad codificada de variación VQj a la sección 367 de multiplexación.
La sección 367 de multiplexación multiplexa información de división de banda recibida como entrada desde la
20 sección 360 de división de banda, el coeficiente de tono óptimo Tp’ para cada subbanda SBp (p=0, 1, ..., P-1) recibido como entrada desde la sección 364 de búsqueda y un índice de cantidad de variación VQj recibido como entrada desde la sección 366 de codificación de ganancia, como la información codificada de segunda capa, y emite esa información codificada de segunda capa a la sección 317 de integración de información codificada. Es igualmente posible introducir Tp’ y el índice de VQj directamente en la sección 317 de integración de información
25 codificada, y multiplexar estos con la información codificada de primera capa en la sección 317 de integración de información codificada.
Los detalles del procesamiento de filtrado en la sección 363 de filtrado mostrados en la Figura 7 se describirán en detalle usando la Figura 9.
30 Usando el estado de filtro recibido como entrada desde la sección 362 de ajuste de estado de filtro, el coeficiente de tono T recibido como entrada desde la sección 365 de ajuste de coeficiente de tono, e información de división de banda recibida como entrada desde la sección 360 de división de banda, la sección 363 de filtrado genera un espectro estimado en la banda BSp#=k#BSp+BWp (p=0, 1, ..., P-1) de la subbanda SBp (p=0, 1, ..., P-1). La función
35 de transferencia F(z) del filtro usado en la sección 363 de filtrado se representa mediante la ecuación 20 a continuación.
Ahora, usando SBp como un ejemplo, se explicará el proceso de generar el espectro estimado S2p’(k) del espectro de subbanda S2p(k). 40 [20]
En la ecuación 20, T es un coeficiente de tono proporcionado desde la sección 365 de ajuste de coeficiente de tono, y ∃i es un coeficiente de filtro almacenado en su interior con antelación. Por ejemplo, cuando el número de
45 derivaciones es tres, los candidatos de coeficiente de filtro incluyen (∃-1, ∃0, ∃1)=(0,1, 0,8, 0,1), por ejemplo. Otros valores tales como (∃-1, ∃0, ∃1)=(0,2, 0,6, 0,2), (0,3, 0,4, 0,3) son también aplicables. Los valores (∃-1, ∃0, ∃1)=(0,0, 1,0, 0,0) son también aplicables, y, en este caso, parte de la banda 0#=k#FL del primer espectro decodificado de capa no se modifica en forma y se copia como es en la banda de BSp#=k#BSp+BWp. M=1 en la ecuación 20. M es un indicador relacionado con el número de derivaciones.
50 El primer espectro decodificado de capa alisado S1’(k) se adapta en la banda 0#=k#FL del espectro S(k) de toda la banda de frecuencia en la sección 363 de filtrado como el estado de filtro interno (estado de filtro).
En la banda BSp#=k#BSp+BWp de S(k), el espectro estimado S2p’(k) de la subbanda SBp se adapta mediante procesamiento de filtrado de las siguientes etapas. Básicamente, en S2p’(k), el espectro S(k-T) que tiene una frecuencia T inferior que esta k, se sustituye. Para mejorar el alisado de un espectro, en la práctica, el espectro ∃i·S(k-T+i) proporcionado multiplicando el espectro cercano S(k-T+i) es decir se encuentra i además del espectro S(k-T) mediante el coeficiente de filtro predeterminado ∃i con respecto a todas las i, y una adición de espectro de los espectros de todas las i se sustituye en S2p’(k). Este procesamiento se representa mediante la ecuación 21 a continuación.
[21]
10 El espectro estimado S2p’(k) en BSp#=k#BSp+BWp se calcula realizando el cálculo anterior para formar la frecuencia más baja y cambiar k en el intervalo de BSp#=k#BSp+BWp.
El anterior procesamiento de filtrado se realiza mediante borrado de ceros S(k) en el intervalo BSp#=k#BSp+BWp 15 cada vez que se proporciona el coeficiente de tono T desde la sección 365 de ajuste de coeficiente de tono. Es decir, se calcula S(k) cada vez que cambia el coeficiente de tono T y se emite a la sección 364 de búsqueda.
La Figura 10 es un diagrama de flujo que muestra las etapas de procesamiento para buscar el coeficiente de tono óptimo Tp’ para subbanda SBp en la sección 364 de búsqueda. La sección 364 de búsqueda busca el coeficiente de 20 tono óptimo Tp’ (p=0, 1, ..., P-1) en cada subbanda SBp (p=0, 1, ..., P-1) repitiendo las etapas mostradas en la Figura
10.
En primer lugar, la sección 364 de búsqueda inicializa el mínimo grado de similitud, Dmín, que es una variable para grabar el mínimo valor del grado de similitud, a “+%“ (ST 110). A continuación, la siguiente ecuación 22 a 25 continuación, a un coeficiente de tono dado, la sección 364 de búsqueda calcula el grado de similitud, D, entre la parte de la banda superior (FL#=k#FH) del espectro de entrada S2(k) y el espectro estimado S2p’(k) (ST 120).
30 En la ecuación 22, M’ es el número de muestras tras calcular el grado de similitud D, y puede suponer valores arbitrarios iguales a o menores del ancho de banda de cada subbanda. S2p’(k) no está presente en la ecuación 22 pero se representa usando BSp y S2’(k).
A continuación, la sección 364 de búsqueda determina si el grado de similitud calculado, D, es o no menor que el
35 mínimo grado de similitud, Dmín (ST 130). Si el grado de similitud D calculado en ST 120 es menor que el mínimo grado de similitud Dmín (“SÍ” en ST 130), la sección 364 de búsqueda sustituye el grado de similitud D en el mínimo grado de similitud Dmín (ST 140). Por otro lado, si el grado de similitud D calculado en ST 120 es igual a o mayor que el mínimo grado de similitud Dmín (“NO” en ST 130), la sección 364 de búsqueda determina si ha finalizado o no el procesamiento en el intervalo de búsqueda. Es decir, la sección 364 de búsqueda determina si se ha calculado o no
40 el grado de similitud con respecto a todos los coeficientes de tono en el intervalo de búsqueda en ST 120 de acuerdo con la ecuación 22 anterior (ST 150). La sección 364 de búsqueda vuelve a ST 120 de nuevo cuando el procesamiento no ha finalizado a través del intervalo de búsqueda (“NO” en ST 150). A continuación, la sección 364 de búsqueda calcula el grado de similitud de acuerdo con la ecuación 22, para diferentes coeficientes de tono desde el caso de calcular el grado de similitud de acuerdo con la ecuación 22 anterior ST 120. Por otro lado, cuando se
45 finaliza el procesamiento a través del intervalo de búsqueda (“SÍ” en ST 150), la sección 364 de búsqueda emite el coeficiente de tono T que corresponde al mínimo grado de similitud, a la sección 367 de multiplexación, como el coeficiente de tono óptimo Tp’ (ST 160).
A continuación, se describirá el aparato 303 de decodificación mostrado en la Figura 5.
50 La Figura 11 es un diagrama de bloques que muestra una configuración de la parte principal interna del aparato 303 de decodificación.
En la Figura 11, la sección 331 de demultiplexación de información codificada demultiplexa entre la información codificada de primera capa e información codificada de segunda capa en información codificada recibida como entrada, emite la información codificada de primera capa a la sección 332 de decodificación de primera capa, y emite la información codificada de segunda capa a la sección 335 de decodificación de segunda capa.
5 La sección 332 de decodificación de primera capa decodifica la información codificada de primera capa recibida como entrada desde la sección 331 de demultiplexación de información codificada, y emite la señal decodificada de primera capa generada a la sección 333 de procesamiento de sobremuestreo. Las operaciones de la sección 332 de decodificación de primera capa son las mismas que en la sección 313 de decodificación de primera capa mostrada en la Figura 6 y no se explicarán en detalle.
La sección 333 de procesamiento de sobremuestreo realiza procesamiento de sobremuestreo de la frecuencia de muestreo desde SRbase a SRentrada con respecto a la señal decodificada de primera capa recibida como entrada desde la sección 332 de decodificación de primera capa, y emite la señal decodificada de primera capa
15 sobremuestreada resultante a la sección 334 de procesamiento de transformación de tiempo-frecuencia.
La sección 334 de procesamiento de transformación de tiempo-frecuencia aplica procesamiento de transformación ortogonal (MDCT) a la señal decodificada de primera capa sobremuestreada recibida como entrada desde la sección 333 de procesamiento de sobremuestreo, y emite el coeficiente MDCT S1(k) (en lo sucesivo en el presente documento “espectro decodificado de primera capa”) de la señal decodificada de primera capa sobremuestreada resultante a la sección 335 de decodificación de segunda capa. Las operaciones de la sección 334 de procesamiento de transformación de tiempo-frecuencia son las mismas que el procesamiento en la sección 315 de procesamiento de transformación de tiempo-frecuencia para una señal decodificada de primera capa sobremuestreada mostrada en la Figura 6, y no se describirán en detalle.
25 La sección 335 de decodificación de segunda capa genera una señal decodificada de segunda capa que incluye componentes de banda superior que usan el primer espectro decodificado de capa S1(k) recibido como entrada desde la sección 334 de procesamiento de transformación de tiempo-frecuencia y la información codificada de segunda capa recibida como entrada desde la sección 331 de demultiplexación de información codificada, y emite esta como una señal de salida.
La Figura 12 es un diagrama de bloques que muestra una configuración de la parte principal interna de la sección 335 de decodificación de segunda capa mostrada en la Figura 11.
35 La sección 351 de demultiplexación demultiplexa la información codificada de segunda capa recibida como entrada desde la sección 331 de demultiplexación de información codificada en información de división de banda que incluye el ancho de banda BWp (p=0, 1, ..., P-1) y el índice anterior BSp (p=0, 1, ..., P-1) (FL#=BSp#FH) de cada subbanda, el coeficiente de tono óptimo Tp’ (p=0, 1, ..., P-1), que es información relacionada con filtrado, y el índice de cantidad de variación codificada VQj (j=0, 1, ..., J-1), que es información relacionada con ganancia. Adicionalmente, la sección 351 de demultiplexación emite información de división de banda y coeficiente de tono óptimo a Tp’ (p=0, 1, ..., P-1) a la sección 354 de filtrado, y emite el índice de cantidad de variación codificada VQj (j=0, 1, ..., J-1) a la sección 355 de decodificación de ganancia. Si en la sección 331 de demultiplexación de información codificada se demultiplexa el índice de información de división de banda Tp’ (p=0, 1, ..., P-1) y VQj (j=0, 1,..., J-1), la sección 351 de demultiplexación no es necesaria.
45 La sección 352 de alisamiento de espectro aplica procesamiento de alisamiento al primer espectro decodificado de capa S1(k) (0#=k#FL) recibido como entrada desde la sección 334 de procesamiento de transformación de tiempofrecuencia, y emite el primer espectro decodificado de capa alisado S1’(k) (0#=k#FL) a la sección 353 de ajuste de estado de filtro. El procesamiento en la sección 352 de alisamiento de espectro es el mismo que el procesamiento en la sección 361 de alisamiento de espectro en la sección 361 de codificación de segunda capa y por lo tanto no se describirá en este punto.
La sección 353 de ajuste de estado de filtro establece el primer espectro decodificado de capa alisado S1’(k) (0#=k#FL) recibido como entrada desde la sección 352 de alisamiento de espectro como el estado de filtro para usar
55 en la sección 354 de filtrado. Denominando al espectro de toda la banda de frecuencia 0#=k#FH “S(k)” en la sección 354 de filtrado por conveniencia, se adapta el primer espectro decodificado de capa alisado S1’(k) en la banda 0#=k#FL de S(k) como el estado de filtro interno (estado de filtro). La configuración y operaciones de la sección 353 de ajuste de estado de filtro son las mismas que la sección 362 de ajuste de estado de filtro mostrada en la Figura 7 y no se describirán en detalle en este punto.
La sección 354 de filtrado tiene un filtro de tono multi-derivación (que tiene al menos dos derivaciones). La sección 354 de filtrado filtra el primer espectro decodificado de capa alisado S1’(k) en base a información de división de banda recibida como entrada desde la sección 351 de demultiplexación, el estado de filtro establecido en la sección 353 de ajuste de estado de filtro, el coeficiente de tono Tp’ (p=0, 1, ..., P-1) recibido como entrada desde la sección
65 351 de multiplexación, y un coeficiente de filtro almacenado en su interior con antelación, y calcula el espectro estimado S2p’(k) (BSp#=k#BSp+BWp) (p=0, 1,..., P-1) de cada subbanda SBp (p=0, 1,..., P-1) mostrado en la ecuación 21 anterior. La sección 354 de filtrado también usa la función de filtro representada mediante la ecuación
20. El procesamiento de filtrado y la función de filtro en este caso se representan como la ecuación 20 y ecuación 21 excepto que T se sustituye por Tp’.
5 La sección 355 de decodificación de ganancia decodifica el índice de cantidad de variación codificada VQj recibido como entrada desde la sección 351 de demultiplexación, y encuentra cantidad de variación VQj que es un valor cuantificado de cantidad de variación Vj.
10 La sección 356 de ajuste de espectro encuentra el espectro estimado S2’(k) de un espectro de entrada relacionando el espectro estimado S2p’(k) (BSp#=k#BSp+BWp) (p=0, 1, ..., P-1) de cada subbanda recibido como entrada desde la sección 354 de filtrado en el dominio de frecuencia. De acuerdo con la ecuación 23 a continuación, la sección 356 de ajuste de espectro multiplica adicionalmente el espectro estimado S2’(k) por la cantidad de variación VQj de cada subbanda recibida como entrada desde la sección 355 de decodificación de ganancia. Por este medio, la sección
15 356 de ajuste de espectro ajusta la forma espectral en la banda de frecuencia FL#=k#FH del espectro estimado S2’(k), genera el espectro decodificado S3(k) y emite el espectro decodificado S3(k) a la sección 357 de procesamiento de transformación de tiempo-frecuencia.
20 A continuación, de acuerdo con la ecuación 24, la sección 356 de ajuste de espectro sustituye el primer espectro decodificado de capa S1(k) (0#=k#FL), recibido como entrada desde la sección 334 de procesamiento de transformación de tiempo-frecuencia, en la banda baja (0#=k#FL) del espectro decodificado S3(k). La parte de la banda inferior (0#=k#FL) del espectro decodificado S3(k) se forma con el primer espectro decodificado
25 de capa S1(k) y la parte de la banda superior (FL#=k#FH) del espectro decodificado S3(k) se forma con el espectro estimado S2’(k) después del ajuste de forma espectral.
30 La sección 357 de procesamiento de transformación de tiempo-frecuencia realiza transformación ortogonal del espectro decodificado S3(k) recibido como entrada desde la sección 356 de ajuste de espectro en una señal de dominio de tiempo, y emite la señal decodificada de segunda capa resultante como una señal de salida. En este punto, si fuera necesario, se realiza procesamiento adecuado tal como multiventana o adición de solapamiento para evitar que se produzcan discontinuidades entre tramas.
35 Se describirá en detalle el procesamiento en la sección 357 de procesamiento de transformación de tiempofrecuencia.
La sección 357 de procesamiento de transformación de tiempo-frecuencia tiene la memoria intermedia buf’(k) en su 40 interior e inicializa la memoria intermedia buf’(k) como se muestra con la ecuación 25 a continuación.
Adicionalmente, de acuerdo con la ecuación 26 a continuación, la sección 357 de procesamiento de transformación 45 de tiempo-frecuencia encuentra la señal decodificada de segunda capa yn’’ usando el segundo espectro decodificado de capa S3(k) recibido como entrada desde la sección 356 de ajuste de espectro.
[26]
50 En la ecuación 26, Z4(k) es un vector que combina el espectro decodificado S3(k) y la memoria intermedia buf’(k) como se muestra mediante la ecuación 27 a continuación.
[27] A continuación, la sección 357 de procesamiento de transformación de tiempo-frecuencia actualiza la memoria intermedia buf’(k) de acuerdo con la ecuación 28 a continuación.
[28]
5 A continuación, la sección 357 de procesamiento de transformación de tiempo-frecuencia emite la señal decodificada yn’’ como una señal de salida.
Por lo tanto, de acuerdo con la presente realización, en codificación/decodificación para realizar mejora de ancho de
10 banda usando un espectro de banda inferior y estimar un espectro de banda superior, se realiza el procesamiento de alisamiento para combinar una media aritmética y media geométrica para un espectro de banda inferior como procesamiento preparatorio. Por este medio, es posible reducir la cantidad de cálculo sin producir la degradación de calidad de una señal decodificada.
15 Adicionalmente, aunque se ha explicado una configuración anteriormente con la presente realización donde, tras codificación de mejora de ancho de banda, se somete un espectro decodificado de banda inferior obtenido por medio de decodificación a procesamiento de alisamiento y se estima un espectro de banda superior usando un espectro decodificado de banda inferior alisado y se codifica, la presente invención no está limitada de ninguna manera a esto y es igualmente aplicable a una configuración para realizar procesamiento de alisamiento para un
20 espectro de banda inferior de una señal de entrada, estimar un espectro de banda superior desde un espectro de entrada alisado y a continuación codificar el espectro de banda superior.
El aparato de alisamiento de espectro y método de alisamiento de espectro de acuerdo con la presente invención no están limitados de ninguna manera a las anteriores realizaciones y pueden implementarse en diversas
25 modificaciones. Por ejemplo, pueden combinarse realizaciones de diversas maneras.
La presente invención es igualmente aplicable a casos donde se graba o escribe un programa de procesamiento de señal en un medio de grabación legible por ordenador tal como un CD y DVD y se hace funcionar, y proporciona los mismos efectos de trabajo y ventajas que con la presente realización.
30 Aunque se han descrito casos de ejemplo anteriormente con las anteriores realizaciones donde se implementa la presente invención con hardware, la presente invención puede implementarse también con software.
Adicionalmente, cada bloque de función empleado en las anteriores descripciones de realizaciones puede
35 implementarse típicamente como un LSI constituido mediante un circuito integrado. Estos pueden ser chips individuales o estar parcialmente o totalmente contenidos en un único chip. Se adopta en este punto “LSI” pero este puede también denominarse como “IC”, “sistema LSI”, “súper LSI” o “ultra LSI” dependiendo de los diferentes grados de integración.
40 Además, el método de integración de circuitos no está limitado a LSP, y es también posible implementación usando circuitería especializada o procesadores de fin general. Después de la fabricación LSI, también es posible la utilización de un FPGA (Campo de Matriz de Puertas Programables) o un procesador reconfigurable donde las conexiones y ajustes de celdas de circuitos en un LSI pueden regenerarse.
45 Además, si tecnología de circuitos integrados resulta que sustituye LSI como un resultado del avance de la tecnología de semiconductores u otra tecnología derivada, naturalmente también es posible realizar la integración de bloques de función usando esta tecnología. También es posible la aplicación de biotecnología.
Aplicabilidad industrial
50 El aparato de alisamiento de espectro, aparato de codificación, aparato de decodificación, aparato de terminal de comunicación, aparato de estación base y método de alisamiento de espectro de acuerdo con la presente invención hacen posible el alisamiento en el dominio de frecuencia mediante una pequeña cantidad y son por lo tanto aplicables a, por ejemplo, sistemas de comunicación de paquetes, sistemas de comunicación móvil y así
55 sucesivamente.
Explicación de números de referencia
100 aparato de alisamiento de espectro
60 101, 315, 334, 357 sección de procesamiento de transformación de tiempo-frecuencia 102 sección de división de subbanda 103 sección de cálculo de valor representativo 104 sección de transformación no lineal 105 sección de alisamiento 106 sección de transformación no lineal inversa 201 sección de cálculo de media aritmética 202 sección de cálculo de media geométrica 301 aparato de codificación
5 302 canal de transmisión 303 aparto de decodificación 311 sección de procesamiento de submuestreo 312 sección de codificación de primera capa 313, 332 sección de decodificación de primera capa
10 314, 333 sección de procesamiento de sobremuestreo 316 sección de codificación de segunda capa 317 sección de integración de información codificada 318 sección de retardo 331 sección de demultiplexación de información codificada
15 335 sección de decodificación de segunda capa 351 sección de demultiplexación 352, 361 sección de alisamiento de espectro 353, 362 sección de ajuste de estado de filtro 354, 363 sección de filtrado
20 355 sección de codificación de ganancia 356 sección de ajuste de espectro 360 sección de división de banda 364 sección de búsqueda 365 sección de ajuste de coeficiente de tono
25 366 sección de codificación de ganancia 367 sección de multiplexación

Claims (7)

  1. REIVINDICACIONES
    1. Un aparato de alisamiento de espectro que comprende:
    5 una sección (101) de transformación de tiempo-frecuencia para realizar una transformación de tiempo-frecuencia de una señal de conversación de entrada y para generar un espectro de componente de frecuencia; una sección (102) de división de subbanda para dividir el espectro de componente de frecuencia en una pluralidad de subbandas, y para dividir adicionalmente cada subbanda en una pluralidad de subgrupos; una sección (103) de cálculo de valor representativo para emitir un valor representativo de cada subbanda dividida calculando, para cada subgrupo de una subbanda dividida, una media aritmética de los valores absolutos de los componentes de frecuencia del subgrupo, usando un cálculo de multiplicación de un producto de dichas medias aritméticas calculadas para los subgrupos de la subbanda dividida, y emitir el producto como el valor representativo de la subbanda; una sección (104) de transformación no lineal para realizar una transformación no lineal de los valores
    15 representativos de las subbandas calculando un valor intermedio de cada subbanda realizando una transformación logarítmica del valor representativo de la subbanda, multiplicando el valor intermedio de la subbanda por la inversa del número de subgrupos en la subbanda, y emitir un valor obtenido mediante dicha multiplicación como un valor representativo sometido a la transformación no lineal; y una sección (105) de alisamiento para alisar los valores representativos sometidos a la transformación no lineal en el dominio de frecuencia.
  2. 2. El aparato de alisamiento de espectro de acuerdo con la reivindicación 1, que comprende adicionalmente una sección (106) de transformación no lineal inversa para realizar una transformación no lineal inversa de una característica contraria a la transformación no lineal, para los valores representativos alisados.
  3. 3. Un aparato de codificación que comprende:
    una primera sección de codificación para generar la primera información codificada codificando una parte de la banda inferior de una señal de entrada a o por debajo de una frecuencia predeterminada; una sección de decodificación para generar una señal decodificada decodificando la primera información codificada; y una segunda sección de codificación para generar la segunda información codificada dividiendo una parte de la banda superior de la señal de entrada por encima de la frecuencia predeterminada en una pluralidad de subbandas y estimar la pluralidad de subbandas desde la señal de entrada o la señal decodificada,
    35 donde la segunda sección de codificación comprende un aparato de alisamiento de espectro de acuerdo con una de las reivindicaciones 1 a 2 para recibir como entrada y alisar la señal decodificada, y para estimar la pluralidad de subbandas desde la señal de entrada o la señal decodificada alisada.
  4. 4. Un aparato de decodificación que comprende:
    una sección de recepción para recibir la primera información codificada y la segunda información codificada, siendo obtenida la primera información codificada codificando una parte de la banda inferior de una señal de entrada del lado de codificación a o por debajo de una frecuencia predeterminada, y siendo generada la segunda información codificada dividiendo una parte de la banda superior de la señal de entrada del lado de codificación
    45 por encima de la frecuencia predeterminada en una pluralidad de subbandas y estimar la pluralidad de subbandas desde una primera señal decodificada obtenida decodificando la señal de entrada del lado de codificación o de la primera información codificada; una primera sección de decodificación para decodificar la primera información codificada y generar una segunda señal decodificada; y una segunda sección de decodificación para generar una tercera señal decodificada estimando una parte de la banda superior de la señal de entrada del lado de codificación usando la segunda información codificada, donde la segunda sección de decodificación comprende el aparato de alisamiento de espectro de una de las reivindicaciones 1 a 2 para recibir como entrada y alisar la segunda señal decodificada y para estimar la parte de la banda superior de la señal de entrada del lado de codificación desde la segunda señal
    55 decodificada alisada.
  5. 5.
    Un aparato terminal de comunicación que comprende el aparato de alisamiento de espectro de una de las reivindicaciones 1 a 2.
  6. 6.
    Un aparato de estación base que comprende el aparato de alisamiento de espectro de una de las reivindicaciones 1 a 2.
  7. 7.
    Un método de alisamiento de espectro que comprende:
    65 una etapa de transformación de tiempo-frecuencia de realizar una transformación de tiempo-frecuencia de una señal de conversación de entrada y generar un espectro de componente de frecuencia; una etapa de división de subbanda de dividir el espectro de componente de frecuencia en una pluralidad de subbandas, y dividir adicionalmente cada subbanda en una pluralidad de subgrupos; una etapa de cálculo de valor representativo que emite un valor representativo de cada subbanda dividida calculando, para cada subgrupo de una subbanda dividida, una media aritmética de los valores absolutos de los
    5 componentes de frecuencia del subgrupo, usando un cálculo de multiplicación de un producto de dichas medias aritméticas calculadas para los subgrupos de la subbanda dividida, y emitir el producto como el valor representativo de la subbanda; una etapa de transformación no lineal de realizar una transformación no lineal de valores representativos de las subbandas calculando un valor intermedio de cada subbanda realizando una transformación logarítmica del valor
    10 representativo de la subbanda, multiplicando el valor intermedio de la subbanda por la inversa del número de subgrupos en la subbanda, y emitir un valor obtenido mediante dicha multiplicación como un valor representativo sometido a la transformación no lineal; y una etapa de alisamiento de alisar los valores representativos sometidos a la transformación no lineal en el dominio de frecuencia.
ES09804758.2T 2008-08-08 2009-08-07 Dispositivo de alisamiento espectral, dispositivo de codificación, dispositivo de decodificación, dispositivo de terminal de comunicación, dispositivo de estación base y método de alisamiento espectral Active ES2452300T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2008205645 2008-08-08
JP2008205645 2008-08-08
JP2009096222 2009-04-10
JP2009096222 2009-04-10
PCT/JP2009/003799 WO2010016271A1 (ja) 2008-08-08 2009-08-07 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法

Publications (1)

Publication Number Publication Date
ES2452300T3 true ES2452300T3 (es) 2014-03-31

Family

ID=41663498

Family Applications (1)

Application Number Title Priority Date Filing Date
ES09804758.2T Active ES2452300T3 (es) 2008-08-08 2009-08-07 Dispositivo de alisamiento espectral, dispositivo de codificación, dispositivo de decodificación, dispositivo de terminal de comunicación, dispositivo de estación base y método de alisamiento espectral

Country Status (11)

Country Link
US (1) US8731909B2 (es)
EP (1) EP2320416B1 (es)
JP (1) JP5419876B2 (es)
KR (1) KR101576318B1 (es)
CN (1) CN102099855B (es)
BR (1) BRPI0917953B1 (es)
DK (1) DK2320416T3 (es)
ES (1) ES2452300T3 (es)
MX (1) MX2011001253A (es)
RU (1) RU2510536C9 (es)
WO (1) WO2010016271A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
PL4016527T3 (pl) 2010-07-19 2023-05-22 Dolby International Ab Przetwarzanie sygnałów audio podczas rekonstrukcji wysokich częstotliwości
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
US9319790B2 (en) * 2012-12-26 2016-04-19 Dts Llc Systems and methods of frequency response correction for consumer electronic devices
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
JP6593173B2 (ja) 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
US20160379661A1 (en) * 2015-06-26 2016-12-29 Intel IP Corporation Noise reduction for electronic devices
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
JP6780108B2 (ja) * 2017-06-07 2020-11-04 日本電信電話株式会社 符号化装置、復号装置、平滑化装置、逆平滑化装置、それらの方法、およびプログラム
JP6439843B2 (ja) * 2017-09-14 2018-12-19 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP7576632B2 (ja) 2020-03-20 2024-10-31 ドルビー・インターナショナル・アーベー スピーカのための低音強調

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH046450A (ja) * 1990-04-24 1992-01-10 Sumitomo Light Metal Ind Ltd Al合金材上の溶着金属定量方法
JPH0522151A (ja) * 1991-07-09 1993-01-29 Toshiba Corp 帯域分割形符号化方式
DE4212339A1 (de) * 1991-08-12 1993-02-18 Standard Elektrik Lorenz Ag Codierverfahren fuer audiosignale mit 32 kbit/s
US5495552A (en) * 1992-04-20 1996-02-27 Mitsubishi Denki Kabushiki Kaisha Methods of efficiently recording an audio signal in semiconductor memory
JP3087814B2 (ja) * 1994-03-17 2000-09-11 日本電信電話株式会社 音響信号変換符号化装置および復号化装置
JP4274614B2 (ja) * 1999-03-09 2009-06-10 パナソニック株式会社 オーディオ信号復号方法
EP1199812A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Perceptually improved encoding of acoustic signals
DE10105339B4 (de) * 2001-02-05 2004-05-13 november Aktiengesellschaft Gesellschaft für Molekulare Medizin Verfahren zur fälschungssicheren Markierung, fälschungssichere Markierung und Kit
JP3586205B2 (ja) * 2001-02-22 2004-11-10 日本電信電話株式会社 音声スペクトル改善方法、音声スペクトル改善装置、音声スペクトル改善プログラム、プログラムを記憶した記憶媒体
JP3976169B2 (ja) * 2001-09-27 2007-09-12 株式会社ケンウッド 音声信号加工装置、音声信号加工方法及びプログラム
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
AU2003233425A1 (en) * 2002-03-22 2003-10-13 Georgia Tech Research Corporation Analog audio enhancement system using a noise suppression algorithm
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP3881932B2 (ja) * 2002-06-07 2007-02-14 株式会社ケンウッド 音声信号補間装置、音声信号補間方法及びプログラム
JP4161628B2 (ja) * 2002-07-19 2008-10-08 日本電気株式会社 エコー抑圧方法及び装置
US7277550B1 (en) * 2003-06-24 2007-10-02 Creative Technology Ltd. Enhancing audio signals by nonlinear spectral operations
CN1322488C (zh) * 2004-04-14 2007-06-20 华为技术有限公司 一种语音增强的方法
EP1744139B1 (en) * 2004-05-14 2015-11-11 Panasonic Intellectual Property Corporation of America Decoding apparatus and method thereof
KR100634506B1 (ko) * 2004-06-25 2006-10-16 삼성전자주식회사 저비트율 부호화/복호화 방법 및 장치
EP1926083A4 (en) 2005-09-30 2011-01-26 Panasonic Corp AUDIOCODING DEVICE AND AUDIOCODING METHOD
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
EP1928115A1 (en) * 2006-11-30 2008-06-04 Nokia Siemens Networks Gmbh & Co. Kg Adaptive modulation and coding in a SC-FDMA system
JP2008205645A (ja) 2007-02-16 2008-09-04 Mitsubishi Electric Corp アンテナ装置
JP2009096222A (ja) 2007-10-12 2009-05-07 Komatsu Ltd 建設機械

Also Published As

Publication number Publication date
CN102099855B (zh) 2012-09-26
EP2320416A1 (en) 2011-05-11
BRPI0917953B1 (pt) 2020-03-24
US8731909B2 (en) 2014-05-20
RU2510536C9 (ru) 2015-09-10
EP2320416B1 (en) 2014-03-05
KR20110049789A (ko) 2011-05-12
US20110137643A1 (en) 2011-06-09
JP5419876B2 (ja) 2014-02-19
EP2320416A4 (en) 2012-08-22
MX2011001253A (es) 2011-03-21
CN102099855A (zh) 2011-06-15
KR101576318B1 (ko) 2015-12-09
RU2510536C2 (ru) 2014-03-27
RU2011104350A (ru) 2012-09-20
WO2010016271A1 (ja) 2010-02-11
DK2320416T3 (da) 2014-05-26
BRPI0917953A2 (pt) 2015-11-10
JPWO2010016271A1 (ja) 2012-01-19

Similar Documents

Publication Publication Date Title
ES2452300T3 (es) Dispositivo de alisamiento espectral, dispositivo de codificación, dispositivo de decodificación, dispositivo de terminal de comunicación, dispositivo de estación base y método de alisamiento espectral
ES2629453T3 (es) Codificador, descodificador y procedimiento de codificación
EP2251861B1 (en) Encoding device and method thereof
EP1798724B1 (en) Encoder, decoder, encoding method, and decoding method
JP5161069B2 (ja) 広帯域音声符号化のためのシステム、方法、及び装置
KR101246991B1 (ko) 오디오 신호 처리 방법
EP2239731B1 (en) Encoding device, decoding device, and method thereof
EP2402940B9 (en) Encoder, decoder, and method therefor
US20100010810A1 (en) Post filter and filtering method
EP2584561B1 (en) Decoding device, encoding device, and methods for same
WO2011058752A1 (ja) 符号化装置、復号装置およびこれらの方法