ES2916257T3 - Decodificador de voz, codificador de voz, método de decodificación de voz, método de codificación de voz, programa de decodificación de voz y programa de codificación de voz - Google Patents

Decodificador de voz, codificador de voz, método de decodificación de voz, método de codificación de voz, programa de decodificación de voz y programa de codificación de voz Download PDF

Info

Publication number
ES2916257T3
ES2916257T3 ES18181397T ES18181397T ES2916257T3 ES 2916257 T3 ES2916257 T3 ES 2916257T3 ES 18181397 T ES18181397 T ES 18181397T ES 18181397 T ES18181397 T ES 18181397T ES 2916257 T3 ES2916257 T3 ES 2916257T3
Authority
ES
Spain
Prior art keywords
frequency band
time envelope
frequency
low
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18181397T
Other languages
English (en)
Inventor
Kei Kikuiri
Atsushi Yamaguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Application granted granted Critical
Publication of ES2916257T3 publication Critical patent/ES2916257T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Analogue/Digital Conversion (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

Decodificador (1) de voz que decodifica una secuencia codificada de señal de voz codificada, que comprende: medios (1a) de demultiplexación para demultiplexar la secuencia codificada para dar una secuencia codificada de banda de baja frecuencia y una secuencia codificada de banda de alta frecuencia; medios (1b) de decodificación de banda de baja frecuencia para decodificar la secuencia codificada de banda de baja frecuencia demultiplexada por los medios (1a) de demultiplexación y obtener una señal de banda de baja frecuencia (X(j,i)); medios (1c) de transformación de frecuencia para transformar la señal de banda de baja frecuencia (X(j,i)), que se obtiene por los medios (1b) de decodificación de banda de baja frecuencia, en un dominio de frecuencia; medios (1d) de análisis de secuencia codificada de banda de alta frecuencia para analizar la secuencia codificada de banda de alta frecuencia demultiplexada por los medios (1a) de demultiplexación y adquirir información complementaria para la generación de banda de alta frecuencia e información de envolvente de tiempo; medios (1e, 1r) de decodificación de secuencia codificada para decodificar la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo adquiridas por los medios (1d) de análisis de secuencia codificada de banda de alta frecuencia; medios (1h) de generación de banda de alta frecuencia para generar, usando la información complementaria para la generación de banda de alta frecuencia decodificada por los medios (1e, 1r) de decodificación de secuencia codificada, una señal de banda de alta frecuencia de la señal de voz a partir de la señal de banda de baja frecuencia (X(j,i)); medios (1f1,..., 1fn) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo, N es un número entero igual o superior a dos, para analizar la señal de banda de baja frecuencia (X(j,i)) transformada en el dominio de frecuencia por los medios (1c) de transformación de frecuencia y adquirir una pluralidad de envolventes de tiempo de banda de baja frecuencia L0(k,i), usando las siguientes ecuaciones 2 y 3, componentes de subbanda Xdec(j,i) de la señal de banda de baja frecuencia (X(j,i)), un número entero k, el índice j en la dirección de frecuencia, el índice i en la dirección de tiempo, el número sE de todas las tramas, y dos matrices Bl, Bh con el tamaño n que se definen de modo que la señal Xdec(j,i), Bl(k)<=j<=Bh(k), t(s)<=i<t(s+1), 0<=s<sE, corresponde a la componente de subbanda k-ésima, 1<=k<=n; en el que t(s) se define de modo que el intervalo t(s)<=i<t(s+1) de la señal Xdec(j,i) con respecto al índice i corresponde a la trama s-ésima, 0<=s<sE; [Ecuación 2] **(Ver fórmula)** [Ecuación 3] **(Ver fórmula)** medios (1g) de cálculo de envolvente de tiempo para calcular una envolvente de tiempo de banda de alta frecuencia usando la información de envolvente de tiempo, que se adquiere por los medios (1e, 1r) de decodificación de secuencia codificada, y la pluralidad de envolventes de tiempo de banda de baja frecuencia, que se adquieren por los medios (1f1,..., 1fn) de cálculo de envolvente de tiempo de banda de baja frecuencia; medios (1i) de ajuste de envolvente de tiempo para ajustar, usando la envolvente de tiempo adquirida por los medios (1g) de cálculo de envolvente de tiempo, una envolvente de tiempo de la señal de banda de alta frecuencia generada por los medios (1h) de generación de banda de alta frecuencia; y medios (1j) de transformación de frecuencia inversa para sumar la señal de banda de alta frecuencia (Y(i,j)), que se ajusta por los medios (1i) de ajuste de envolvente de tiempo, y la señal de banda de baja frecuencia (X(j,i)), que se decodifica por los medios (1b) de decodificación de banda de baja frecuencia, y emitir una señal de dominio de tiempo que contiene componentes de banda de frecuencia completa, en el que el cálculo de la envolvente de tiempo de banda de alta frecuencia por los medios (1g) de cálculo de envolvente de tiempo incluye un procesamiento de suavizado en la dirección de tiempo aplicado a la pluralidad de envolventes de tiempo de banda de baja frecuencia, calculando la siguiente ecuación 4 usando los coeficientes sc(j) de suavizado y un orden d, d>=1, de suavizado [Ecuación 4] **(Ver fórmula)**

Description

DESCRIPCIÓN
Decodificador de voz, codificador de voz, método de decodificación de voz, método de codificación de voz, programa de decodificación de voz y programa de codificación de voz
Campo técnico
La presente invención se refiere a un decodificador de voz, a un codificador de voz, a un método de decodificación de voz, a un método de codificación de voz, a un programa de decodificación de voz y a un programa de codificación de voz.
Técnica anterior
Las tecnologías de codificación de voz y audio que comprimen la cantidad de datos en una señal a una-varias décimas partes eliminando información que no se percibe necesariamente por un humano según la psicología auditiva son una tecnología significativamente importante en relación con la transmisión y acumulación de señales. Un ejemplo de técnicas de codificación de audio perceptual ampliamente usadas es MPEG4 AAC (codificación de audio avanzada) normalizada por ISO/IEC MPEG (grupo de expertos de imágenes en movimiento).
Además, como método para mejorar el rendimiento de la codificación de voz y obtener una alta calidad de voz a una baja tasa de transmisión de bits, recientemente se ha usado ampliamente una tecnología de extensión de ancho de banda que genera componentes de banda de alta frecuencia de una voz usando componentes de banda de baja frecuencia. Un ejemplo típico de tecnología de extensión de ancho de banda es la tecnología SBR (replicación de la banda espectral) usada en MPEG4 AAC. La tecnología de SBR genera componentes de banda de alta frecuencia realizando, en una señal transformada en el dominio de frecuencia mediante un banco de QMF (filtro de espejo en cuadratura), el copiado de coeficientes espectrales desde una banda de baja frecuencia hasta una banda de alta frecuencia y después de eso ajusta las componentes de banda de alta frecuencia ajustando la envolvente espectral y la tonalidad de los coeficientes replicados. El ajuste de la envolvente espectral y la tonalidad se denominará a continuación en el presente documento “ajuste de envolvente de frecuencia”. El método de codificación de voz que usa una tecnología de extensión de ancho de banda de este tipo puede reproducir componentes de banda de alta frecuencia de una señal usando únicamente una pequeña cantidad de información complementaria, y por tanto es eficaz para lograr una tasa de transmisión de bits inferior de codificación de voz.
En la tecnología de extensión de ancho de banda en el dominio de frecuencia tal como SBR, dado que la envolvente de frecuencia se ajusta a los coeficientes espectrales expresados en el dominio de frecuencia, cuando se codifica una señal de audio con grandes variaciones de envolvente de tiempo, tal como una señal de voz, un sonido de aplausos o un sonido de castañuelas, existe un caso en el que puede percibirse ruido reverberante, denominado preeco o posteco, en la señal decodificada. Este problema está provocado por el hecho de que la envolvente de tiempo de componentes de banda de alta frecuencia se deforma en el procedimiento de ajuste y, en muchos casos, se vuelve de una forma más plana que antes del ajuste. La envolvente de tiempo de componentes de banda de alta frecuencia que se ha vuelto plana como resultado del ajuste no coincide con la envolvente de tiempo de componentes de banda de alta frecuencia en la señal original antes de la codificación y provoca preecos o postecos.
Como solución a este problema, se conoce el siguiente método (véase el documento de patente 1). Específicamente, el método adquiere la potencia eléctrica de componentes de banda de baja frecuencia para cada ranura de tiempo de una señal de dominio de frecuencia, extrae información de envolvente de tiempo a partir de la potencia adquirida, y superpone la información de envolvente de tiempo extraída sobre componentes de banda de alta frecuencia que se ajustan usando información complementaria y después se procesan para ajustar la envolvente de frecuencia. Este método se denomina a continuación en el presente documento “método de deformación de envolvente de tiempo”. De ese modo es posible ajustar la envolvente de tiempo de una señal decodificada para tener una forma menos distorsionada y obtener una señal reproducida con menos preeco y posteco.
El documento de patente 2 divulga una técnica de extensión de ancho de banda que permite que se codifique y decodifique información usando un modelo de autosimilitud fractal o un modelo de sustitución espectral precisa o ambos. Además, se divulga una técnica de codificación de amplitud temporal multibanda que resulta útil como mejora para cualquier técnica de codificación/decodificación y ayuda con la reconstrucción precisa de la envolvente temporal y emplea un banco de filtros de utilidad.
El documento de patente 3 divulga una manera eficaz de cuantizar una conformación de envolvente temporal de la señal de banda alta beneficiándose de la relación de energía entre la señal de banda baja y la señal de banda alta.
El documento de patente 4 divulga la obtención de un coeficiente de predicción lineal de una señal representada en un dominio de frecuencia, realizando un análisis de predicción lineal en una dirección de frecuencia usando un método de covarianza o un método de autocorrelación.
El documento no de patente 1 proporciona información adicional sobre los detalles técnicos de la tecnología de conformación de envolvente temporal mejorada (eETS).
Lista de referencias
Bibliografía de patentes
PTL 1: documento WO/2010/114123
PTL 2: documento US 2007/238415 A1
PTL 3: US 2010/063812 A1
PTL4: CA2844635A1
Bibliografía no de patentes
NPTL1: KEI KIKUIRI ET AL: “Report on Enhanced Temporal Envelope Shaping CE for USAC”, 92. MPEG MEETING; 19-4-2010 - 23-4-2010; DRESDEN; (MOTION PICTURE EXPERT GROUP 0R ISO/IEC JTC1/SC29/WG11), n.° M17502, 15 de abril de 2010 (15-04-2010), XP030046092.
Sumario de la invención
Problema técnico
En el método de deformación de envolvente de tiempo divulgado en el documento de patente 1 descrito anteriormente, tras obtenerse una señal decodificada que sólo contiene componentes de banda de baja frecuencia que se obtienen basándose en un flujo de bits multiplexado introducido, se obtiene una señal en el dominio de QMF a partir de la señal decodificada. Además, se adquiere información de envolvente de tiempo a partir de la señal en el dominio de QMF, y se ajusta la información de envolvente de tiempo usando parámetros. Después de eso, usando la información de envolvente de tiempo ajustada, se realiza un procedimiento de deformación de envolvente de tiempo en la señal en el dominio de QMF obtenida a partir de componentes de banda de alta frecuencia de.
Sin embargo, en el método de deformación de envolvente de tiempo anteriormente descrito, dado que el procedimiento de deformación de envolvente de tiempo se realiza usando información de envolvente de tiempo individual que es función del tiempo obtenido a partir de la señal en el dominio de QMF obtenida a partir de las componentes de banda de baja frecuencia, cuando la envolvente de tiempo de las componentes de banda de baja frecuencia y la envolvente de tiempo de las componentes de banda de alta frecuencia no están suficientemente correlacionadas, es difícil ajustar la forma de onda de la envolvente de tiempo. Como resultado, tienden a no reducirse suficientemente los preecos y postecos en la señal decodificada.
La presente invención se ha realizado a la vista del problema anterior y proporciona un decodificador de voz, un codificador de voz, un método de decodificación de voz, un método de codificación de voz, un programa de decodificación de voz y un programa de codificación de voz en los que, ajustando la envolvente de tiempo de una señal decodificada para tener una forma menos distorsionada, se obtiene una señal reproducida cuyos preecos y postecos están suficientemente reducidos.
Solución al problema
Para resolver el problema anterior, un decodificador según un aspecto de la invención es un decodificador de voz que decodifica una secuencia codificada de una señal de voz de codificación. El decodificador de voz incluye las características según la reivindicación 1. En las reivindicaciones dependientes se proporcionan características adicionales para realizaciones ventajosas de la invención.
Un método de decodificación según un aspecto de la invención es un método de decodificación de voz de decodificar una secuencia codificada de una señal de voz codificada. El método incluye las etapas según la reivindicación 11. En la reivindicación dependiente se proporcionan características adicionales para una realización ventajosa de la invención.
Un programa de decodificación según un aspecto de la invención es un programa de decodificación de voz según la reivindicación 14.
Según el decodificador, el método de decodificación o el programa de decodificación mencionados anteriormente, se obtiene la señal de banda de baja frecuencia a partir de la secuencia codificada mediante demultiplexación y decodificación, y se obtienen la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo a partir de la secuencia codificada mediante demultiplexación, decodificación y descuantificación. Después, se generan las componentes de banda de alta frecuencia en el dominio de frecuencia a partir de la señal de banda de baja frecuencia transformada en el dominio de frecuencia usando la información complementaria para la generación de banda de alta frecuencia, y, después de adquirir una pluralidad de envolventes de tiempo de banda de baja frecuencia analizando la señal de banda de baja frecuencia en el dominio de frecuencia, se calcula la envolvente de tiempo de banda de alta frecuencia usando la pluralidad de envolventes de tiempo de banda de baja frecuencia y la información de envolvente de tiempo. Además, se ajusta la envolvente de tiempo de las componentes de banda de alta frecuencia mediante la envolvente de tiempo de banda de alta frecuencia calculada, y se suman entre sí las componentes de banda de alta frecuencia ajustadas y la señal de banda de baja frecuencia y de ese modo se emite la señal de dominio de tiempo. De esta manera, dado que se usa una pluralidad de envolventes de tiempo de banda de baja frecuencia para el ajuste de la envolvente de tiempo de las componentes de banda de alta frecuencia, la forma de onda de la envolvente de tiempo de las componentes de banda de alta frecuencia se ajusta con alta precisión mediante el uso de la correlación entre las envolventes de tiempo de componentes de banda de baja frecuencia y la envolvente de tiempo de componentes de banda de alta frecuencia. Como resultado, la envolvente de tiempo en la señal decodificada se ajusta para tener una forma menos distorsionada, y por tanto puede obtenerse una señal reproducida en la que los preecos y postecos están suficientemente reducidos.
Según la reivindicación dependiente 3, el decodificador de voz incluye además medios de control de cálculo de envolvente de tiempo para controlar al menos uno de (i) cálculo de las envolventes de tiempo de banda de baja frecuencia en los medios de cálculo de envolvente de tiempo de banda de baja frecuencia primera a N-ésima y (ii) cálculo de la envolvente de tiempo de banda de alta frecuencia en los medios de cálculo de envolvente de tiempo usando la señal de banda de baja frecuencia transformada en el dominio de frecuencia por los medios de transformación de frecuencia. Con los medios de control de cálculo de envolvente de tiempo, es posible omitir el cálculo de las envolventes de tiempo de banda de baja frecuencia o el cálculo de la envolvente de tiempo de banda de alta frecuencia según propiedades tales como la potencia de la señal de banda de baja frecuencia, reduciendo así la cantidad de computación.
Según la reivindicación dependiente 4, el decodificador de voz incluye además medios de control de cálculo de envolvente de tiempo para controlar al menos uno de (i) cálculo de las envolventes de tiempo de banda de baja frecuencia en los medios de cálculo de envolvente de tiempo de banda de baja frecuencia primera a N-ésima y (ii) cálculo de la envolvente de tiempo de banda de alta frecuencia en los medios de cálculo de envolvente de tiempo usando la información de envolvente de tiempo adquirida por los medios de decodificación y descuantificación de secuencia codificada. Con los medios de control de cálculo de envolvente de tiempo, es posible omitir el cálculo de las envolventes de tiempo de banda de baja frecuencia o el cálculo de la envolvente de tiempo de banda de alta frecuencia según la información de envolvente de tiempo obtenida a partir de la secuencia codificada, reduciendo así la cantidad de computación.
Según la reivindicación dependiente 5, los medios de análisis de secuencia codificada de banda de alta frecuencia adquieren además información de control de cálculo de envolvente de tiempo, y el decodificador de voz incluye además medios de control de cálculo de envolvente de tiempo para controlar al menos uno de (i) cálculo de las envolventes de tiempo de banda de baja frecuencia en los medios de cálculo de envolvente de tiempo de banda de baja frecuencia primera a N-ésima y (ii) cálculo de la envolvente de tiempo de banda de alta frecuencia en los medios de cálculo de envolvente de tiempo usando la información de control de cálculo de envolvente de tiempo adquirida por los medios de análisis de secuencia codificada de banda de alta frecuencia. En esta configuración, es posible omitir el cálculo de las envolventes de tiempo de banda de baja frecuencia o el cálculo de la envolvente de tiempo de banda de alta frecuencia según la información de control de cálculo de envolvente de tiempo obtenida a partir de la secuencia codificada, reduciendo así la cantidad de computación.
Según la reivindicación dependiente 7, los medios de análisis de secuencia codificada de banda de alta frecuencia adquieren además información de control de cálculo de envolvente de tiempo, y que los medios de decodificación y descuantificación de secuencia codificada incluyen además medios de control de cálculo de envolvente de tiempo que adquieren además segunda información de envolvente de frecuencia y determinan, basándose en la información de control de cálculo de envolvente de tiempo, si ajustar la envolvente de frecuencia de las componentes de banda de alta frecuencia basándose en la segunda información de envolvente de frecuencia y, cuando se determina que se ajusta la envolvente de frecuencia, controlan no realizar el cálculo de las envolventes de tiempo de banda de baja frecuencia por los medios de cálculo de envolvente de tiempo de banda de baja frecuencia primera a N-ésima y el cálculo de la envolvente de tiempo de banda de alta frecuencia por los medios de cálculo de envolvente de tiempo. También en este caso, es posible omitir el cálculo de las envolventes de tiempo de banda de baja frecuencia o el cálculo de la envolvente de tiempo de banda de alta frecuencia según la información de control de cálculo de envolvente de tiempo obtenida a partir de la secuencia codificada, reduciendo así la cantidad de computación.
Además, medios de ajuste de envolvente de tiempo-frecuencia pueden procesar, con una función especificada, las componentes de banda de alta frecuencia de la señal de voz generada por los medios de generación de banda de alta frecuencia. Los medios de cálculo de envolvente de tiempo de banda de baja frecuencia pueden procesar, con una función especificada, la pluralidad adquirida de envolventes de tiempo de banda de baja frecuencia.
Además, un codificador según un aspecto de la invención es un codificador de voz que codifica una señal de voz. El codificador de voz incluye las características según la reivindicación 7. En las reivindicaciones dependientes se proporcionan características adicionales para realizaciones ventajosas.
Un método de codificación según un aspecto de la invención es un método de codificación de voz de codificar una señal de voz. El método incluye la etapa según la reivindicación 13.
Un programa de codificación según un aspecto de la invención es un programa de codificación de voz según la reivindicación 15.
Según el codificador de voz, el método de codificación o el programa de codificación mencionados anteriormente, se obtiene la señal de banda de baja frecuencia submuestreando de una señal de voz, y se codifica la señal de banda de baja frecuencia, mientras que se calcula una pluralidad de envolventes de tiempo de componentes de banda de baja frecuencia basándose en la señal de voz en el dominio de frecuencia, y usando la pluralidad de envolventes de tiempo de componentes de banda de baja frecuencia, se calcula la información de envolvente de tiempo para adquirir la envolvente de tiempo de componentes de banda de alta frecuencia. Además, se calcula la información complementaria para la generación de banda de alta frecuencia para generar componentes de banda de alta frecuencia a partir de la señal de banda de baja frecuencia, y, después de cuantificar y codificar la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo, se construye la secuencia codificada de banda de alta frecuencia, que contiene la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo. Después, se genera la secuencia codificada en la que se multiplexan la secuencia codificada de banda de baja frecuencia y la secuencia codificada de banda de alta frecuencia. Por consiguiente, cuando se introduce la secuencia codificada en el decodificador, puede usarse una pluralidad de envolventes de tiempo de banda de baja frecuencia en el lado de decodificador para ajustar la envolvente de tiempo de componentes de banda de alta frecuencia en el lado de decodificador, y de ese modo se ajusta la forma de onda de la envolvente de tiempo de componentes de banda de alta frecuencia con alta precisión, usando la correlación entre la envolvente de tiempo de componentes de banda de baja frecuencia y la envolvente de tiempo de componentes de banda de alta frecuencia en el lado de decodificador. Como resultado, la envolvente de tiempo en la señal decodificada se ajusta para tener una forma menos distorsionada, y por tanto puede obtenerse una señal reproducida en el lado de decodificador en la que los preecos y postecos están suficientemente reducidos.
Según reivindicación dependiente 8, el codificador de voz incluye además medios de cálculo de envolvente de frecuencia para calcular información de envolvente de frecuencia de las componentes de banda de alta frecuencia de la señal de voz que se transforma en el dominio de frecuencia por los medios de transformación de frecuencia, que los medios de cuantificación y codificación cuantifican y codifican además la información de envolvente de frecuencia, y que los medios de construcción de secuencia codificada construyen la secuencia codificada de banda de alta frecuencia añadiendo además la información de envolvente de frecuencia cuantificada y codificada por los medios de cuantificación y codificación. En esta configuración, el ajuste de la envolvente de frecuencia de las componentes de banda de alta frecuencia puede realizarse en el lado de decodificador, y por tanto puede obtenerse una señal reproducida con características de frecuencia mejoradas en el lado de decodificador.
Según reivindicación dependiente 9, el codificador de voz incluye además medios de generación de información de control para generar información de control de cálculo de envolvente de tiempo que controla el cálculo de envolvente de tiempo en un decodificador de voz usando al menos una de (i) la señal de voz transformada en el dominio de frecuencia por los medios de transformación de frecuencia y (ii) la información de envolvente de tiempo calculada por los medios de cálculo de información de envolvente de tiempo, y que los medios de construcción de secuencia codificada construyen la secuencia codificada de banda de alta frecuencia añadiendo además la información de control de cálculo de envolvente de tiempo generada por los medios de generación de información de control. En este caso, es posible aumentar la eficiencia del cálculo de envolvente de tiempo en el lado de decodificador haciendo referencia a la propiedad tal como la potencia de la señal de voz y la información de envolvente de tiempo, reduciendo así la cantidad de computación.
Según reivindicación dependiente 10, los medios de cálculo de información de envolvente de tiempo calculan una envolvente de tiempo de componentes de banda de alta frecuencia de la señal de voz transformada en el dominio de frecuencia por los medios de transformación de frecuencia, y calculan la información de envolvente de tiempo basándose en una correlación entre una envolvente de tiempo calculada a partir de las envolventes de tiempo primera a N-ésima de componentes de banda de baja frecuencia y la envolvente de tiempo de las componentes de frecuencia.
Efectos ventajosos de la invención
Según la presente invención, es posible ajustar la envolvente de tiempo de una señal decodificada para tener una forma menos distorsionada y de ese modo obtener una señal reproducida en la que los preecos y postecos están suficientemente reducidos.
Breve descripción de los dibujos
La figura 1 es un diagrama de bloques esquemático de un decodificador 1 de voz según una realización de la invención que se denomina en el resto de la descripción primera realización;
la figura 2 es un diagrama de flujo que muestra un procedimiento de un método de decodificación de voz implementado por el decodificador 1 de voz mostrado en la figura 1;
la figura 3 es un diagrama de bloques esquemático de un codificador 2 de voz según la primera realización de la invención;
la figura 4 es un diagrama de flujo que muestra un procedimiento de un método de codificación de voz implementado por el codificador 2 de voz mostrado en la figura 3;
la figura 5 es un diagrama que muestra una configuración de una parte principal relacionada con el cálculo de envolvente en un primer ejemplo alternativo del decodificador 1 de voz según la primera realización;
la figura 6 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente realizado por el decodificador 1 de voz mostrado en la figura 5;
la figura 7 es un diagrama que muestra una configuración de una parte principal relacionada con el cálculo de envolvente en un segundo ejemplo alternativo del decodificador 1 de voz según la primera realización;
la figura 8 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente realizado por el decodificador 1 de voz mostrado en la figura 7;
la figura 9 es un diagrama que muestra una configuración de una parte principal relacionada con el cálculo de envolvente en un tercer ejemplo alternativo del decodificador 1 de voz según la primera realización;
la figura 10 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente realizado por el decodificador 1 de voz mostrado en la figura 9;
la figura 11 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente en un cuarto ejemplo alternativo del decodificador 1 de voz según la primera realización;
la figura 12 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente en un quinto ejemplo alternativo del decodificador 1 de voz según la primera realización;
la figura 13 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente en un sexto ejemplo alternativo del decodificador 1 de voz según la primera realización;
la figura 14 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente de tiempo realizado por una unidad 1g de cálculo de envolvente de tiempo en un séptimo ejemplo alternativo del decodificador 1 de voz según la primera realización;
la figura 15 es un diagrama de flujo que muestra una parte del procesamiento por una unidad 1m de control de cálculo de envolvente de tiempo cuando se aplica el séptimo ejemplo alternativo del decodificador 1 de voz según la primera realización al segundo ejemplo alternativo del decodificador 1 de voz según la primera realización;
la figura 16 es un diagrama de flujo que muestra una parte del procesamiento por una unidad 1n de control de cálculo de envolvente de tiempo cuando se aplica el séptimo ejemplo alternativo del decodificador 1 de voz según la primera realización al cuarto ejemplo alternativo del decodificador 1 de voz según la primera realización;
la figura 17 es un diagrama que muestra una configuración de un primer ejemplo alternativo del codificador 2 de voz según la primera realización;
la figura 18 es un diagrama de flujo que muestra un procedimiento de codificación de voz realizado por el codificador 2 de voz mostrado en la figura 17;
la figura 19 es un diagrama que muestra una configuración de un segundo ejemplo alternativo del codificador 2 de voz según la primera realización;
la figura 20 es un diagrama de flujo que muestra un procedimiento de codificación de voz realizado por el codificador 2 de voz mostrado en la figura 19;
la figura 21 es un diagrama que muestra una configuración de un tercer ejemplo alternativo del codificador 2 de voz según la primera realización;
la figura 22 es un diagrama de flujo que muestra un procedimiento de codificación de voz realizado por el codificador 2 de voz mostrado en la figura 21;
la figura 23 es un diagrama que muestra una configuración de un decodificador 101 de voz según una segunda realización, que sirve como ejemplo informativo que no forma parte de la presente invención, pero es útil para entender la presente invención;
la figura 24 es un diagrama de flujo que muestra un procedimiento de decodificación de voz realizado por el decodificador 101 de voz mostrado en la figura 23;
la figura 25 es un diagrama que muestra una configuración de un codificador 102 de voz según una segunda realización que sirve como ejemplo informativo que no forma parte de la presente invención, pero es útil para entender la presente invención;
la figura 26 es un diagrama de flujo que muestra un procedimiento de codificación de voz realizado por el codificador 102 de voz mostrado en la figura 25;
la figura 27 es un diagrama que muestra una configuración en la que se aplica el primer ejemplo alternativo del codificador 2 de voz según la primera realización de la invención al codificador 102 de voz según la segunda realización de la invención;
la figura 28 es un diagrama de flujo que muestra un procedimiento de codificación de voz realizado por el codificador 102 de voz mostrado en la figura 27;
la figura 29 es un diagrama que muestra una configuración en la que se aplica el segundo ejemplo alternativo del codificador 2 de voz según la primera realización de la invención al codificador 102 de voz según la segunda realización de la invención;
la figura 30 es un diagrama de flujo que muestra un procedimiento de codificación de voz realizado por el codificador 102 de voz mostrado en la figura 29;
la figura 31 es un diagrama que muestra una configuración de un decodificador 201 de voz según una tercera realización, que sirve como ejemplo informativo que no forma parte de la presente invención, pero es útil para entenderse la presente invención;
la figura 32 es un diagrama de flujo que muestra un procedimiento de decodificación de voz realizado por el decodificador 201 de voz mostrado en la figura 31;
la figura 33 es un diagrama que muestra una configuración de un decodificador 301 de voz según una cuarta realización, que sirve como ejemplo informativo que no forma parte de la presente invención, pero es útil para entenderse la presente invención;
la figura 34 es un diagrama de flujo que muestra un procedimiento de decodificación de voz realizado por el decodificador 301 de voz mostrado en la figura 33;
la figura 35 es un diagrama que muestra una configuración de un codificador 202 de voz según la tercera realización, que sirve como ejemplo informativo que no forma parte de la presente invención, pero es útil para entenderse la presente invención;
la figura 36 es un diagrama de flujo que muestra un procedimiento de codificación de voz realizado por el codificador 202 de voz mostrado en la figura 35;
la figura 37 es un diagrama que muestra una configuración de un codificador 302 de voz según una cuarta realización, que sirve como ejemplo informativo que no forma parte de la presente invención, pero es útil para entenderse la presente invención;
la figura 38 es un diagrama de flujo que muestra un procedimiento de codificación de voz realizado por el codificador 302 de voz mostrado en la figura 37;
la figura 39 es un diagrama que muestra una configuración de un tercer ejemplo alternativo del decodificador 101 de voz según la segunda realización; y
la figura 40 es un diagrama de flujo que muestra un procedimiento de decodificación de voz realizado por el decodificador 101 de voz mostrado en la figura 39.
Descripción de realizaciones
A continuación en el presente documento se describen en detalle realizaciones preferidas de un decodificador de voz, un codificador de voz, un método de decodificación de voz, un método de codificación de voz, un programa de decodificación de voz y un programa de codificación de voz según la presente invención con referencia a los dibujos. Se observa que, en la descripción de los dibujos, los mismos elementos se indicarán mediante los mismos símbolos de referencia y se omitirá una descripción redundante.
[Realización de la presente invención, primera realización]
La figura 1 es un diagrama de bloques esquemático de un decodificador 1 de voz según una realización de la invención, que se denomina en el resto de la descripción primera realización, y la figura 2 es un diagrama de flujo que muestra un procedimiento de un método de decodificación de voz implementado por el decodificador 1 de voz. El decodificador 1 de voz incluye CPU, ROM, RAM, un dispositivo de comunicación y similares, que no se muestran, y la CPU carga un programa informático especificado (por ejemplo, un programa informático para realizar el procedimiento mostrado en el diagrama de flujo de la figura 2 ) almacenado en una memoria interna tal como la ROM del decodificador 1 de voz en la RAM y ejecuta el programa para ejercer control sobre el decodificador 1 de voz. El dispositivo de comunicación del decodificador 1 de voz recibe una secuencia codificada multiplexada que se emite desde el codificador 2 de voz, que se describirá más adelante, y emite una señal de voz decodificada al exterior.
Tal como se muestra en la figura 1, el decodificador 1 de voz incluye funcionalmente una unidad 1a de demultiplexación (medios de demultiplexación), una unidad 1b de decodificación de banda de baja frecuencia (medios de decodificación de banda de baja frecuencia), una unidad 1c de banco de filtro de división de banda (medios de transformación de frecuencia), una unidad 1d de análisis de secuencia codificada (medios de análisis de secuencia codificada de banda de alta frecuencia), una unidad 1e de decodificación/descuantificación de secuencia codificada (medios de decodificación y descuantificación de secuencia codificada), unidad f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima (n es un número entero de dos o más) (medios de cálculo de envolvente de tiempo de banda de baja frecuencia), una unidad 1g de cálculo de envolvente de tiempo (medios de cálculo de envolvente de tiempo), una unidad 1h de generación de banda de alta frecuencia (medios de generación de banda de alta frecuencia), una unidad 1i de ajuste de envolvente de tiempo (medios de ajuste de envolvente de tiempo), y una unidad 1j de banco de filtro de síntesis de banda (medios de transformación de frecuencia inversa) (de 1c a 1e y de 1h a 1i también se denominan algunas veces unidad de extensión de ancho de banda (medios de extensión de ancho de banda)). Las unidades respectivas del decodificador 1 de voz mostrado en la figura 1 son unidades funcionales que se realizan al ejecutar la CPU del decodificador 1 de voz un programa informático almacenado en la memoria interna del decodificador 1 de voz. La CPU del decodificador 1 de voz ejecuta el programa informático (usa las unidades funcionales de la figura 1) y de ese modo ejecuta secuencialmente el procedimiento mostrado en el diagrama de flujo de la figura 2 (el procedimiento de las etapas S01 a S10). Se supone que diversos datos requeridos para la ejecución del programa informático y diversos datos generados mediante la ejecución del programa informático se almacenan en la memoria interna, tal como ROM y RAM, del decodificador 1 de voz.
A continuación se describirán en detalle en el presente documento las funciones de las unidades respectivas del decodificador 1 de voz.
La unidad 1a de demultiplexación divide una secuencia codificada multiplexada que se introduce a través del dispositivo de comunicación del decodificador 1 de voz para dar una secuencia codificada de banda de baja frecuencia y una secuencia codificada de banda de alta frecuencia mediante demultiplexación.
La unidad 1b de decodificación de banda de baja frecuencia decodifica la secuencia codificada de banda de baja frecuencia suministrada a partir de la unidad 1a de demultiplexación y obtiene una señal decodificada que sólo contiene componentes de banda de baja frecuencia. Un método de decodificación puede basarse en un método de codificación de voz tal como CELP (predicción lineal excitada por código) o basarse en codificación de audio tal como AAC (codificación de audio avanzada) y TCX (excitación codificada de transformada). Además, puede basarse en codificación mediante PCM (modulación de código pulsado). Además, puede basarse en un método que usa esos métodos de codificación de manera conmutable. En esta realización, un método de codificación no está particularmente limitado.
La unidad 1c de banco de filtro de división de banda analiza la señal decodificada que sólo contiene componentes de banda de baja frecuencia suministrada a partir de la unidad 1b de decodificación de banda de baja frecuencia y transforma la señal decodificada en una señal en el dominio de frecuencia. A continuación en el presente documento, la señal en el dominio de frecuencia que corresponde a la banda de baja frecuencia adquirida por la unidad 1c de banco de filtro de división de banda se representa como Xdec(j,i) {0<j<kx , t(s)<i<t(s+1), 0<s<se }, donde j es un índice en la dirección de frecuencia, i es un índice en la dirección de tiempo, y kx es un número entero no negativo. Además, t se define de modo que el intervalo t(s)<i<t(s+1) de la señal Xdec(j,i) con respecto al índice i corresponde a la s-ésima (0<s<se ) trama. Además, se es el número de todas las tramas. La trama anterior corresponde a la trama especificada mediante el método de codificación al que se adapta el método de decodificación de la unidad 1b de decodificación de banda de baja frecuencia. Además, la trama anterior puede corresponder a la denominada trama de SBR o segmento de tiempo de envolvente de SBR en SBR usada en “MPEG4 AAC” especificada por la norma “ ISO/IEC 14496-3”. Obsérvese que, en esta realización, el intervalo de tiempo especificado por la trama no está limitado al ejemplo anterior. El índice anterior i puede corresponder a una submuestra de subbanda de QMF o a una ranura de tiempo que es igual a varias muestras de subbanda en SBR usado en “MPEG4 AAC” especificado por la norma “ISO/IEC 14496-3”.
La unidad 1d de análisis de secuencia codificada analiza la secuencia codificada de banda de alta frecuencia suministrada a partir de la unidad 1a de demultiplexación y adquiere información complementaria codificada para la generación de banda de alta frecuencia e información de envolvente de tiempo-frecuencia codificada.
La unidad 1e de decodificación/descuantificación de secuencia codificada decodifica y descuantifica la información complementaria codificada para la generación de banda de alta frecuencia suministrada a partir de la unidad 1d de análisis de secuencia codificada y obtiene información complementaria codificada para la generación de banda de alta frecuencia, y decodifica y descuantifica la información de envolvente de tiempo codificada suministrada a partir de la unidad 1d de análisis de secuencia codificada y adquiere información de envolvente de tiempo.
Las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima calculan envolventes de tiempo diferentes unas de otras. Específicamente, la k-ésima unidad 1fk de cálculo de envolvente de tiempo de banda de baja frecuencia (1<k<n) recibe una señal de banda de baja frecuencia X(j,i) {0<j<kx, t(s)<i<t(s+1), 0<s<se} a partir de la unidad 1c de banco de filtro de división de banda y calcula la k-ésima envolvente de tiempo Ldec(k,i) en la banda de baja frecuencia (procesamiento en la etapa Sb6). De manera específica, la k-ésima unidad 1fk de cálculo de envolvente de tiempo de banda de baja frecuencia calcula la envolvente de tiempo Ldec(k,i) de la siguiente manera.
En primer lugar, pueden especificarse diferentes subbandas en la banda de baja frecuencia usando dos números enteros kl y kh que satisfacen la siguiente condición.
[Ecuación 1]
Figure imgf000009_0001
El número total de conjuntos posibles de números enteros (kl, kh) que satisfacen la condición anterior es nmáx=kx(kx+1)/2. Las subbandas pueden especificarse seleccionando uno cualquiera de esos conjuntos de números enteros.
A continuación, se especifica un número n de subbandas seleccionando un número n a partir de los nmáx conjuntos de números enteros. A continuación en el presente documento, para representar el número n de bandas, se definen dos matrices Bi y Bh con el tamaño n de modo que la señal Xdec(j,i) {B i(k)<j<Bh(k), t(s)<i<t(s+1)), 0<s<se corresponde a la k-ésima (1<k<n) componente de subbanda.
Además, se adquiere la envolvente de potencia-tiempo del número n de componentes de subbanda mediante la siguiente ecuación.
[Ecuación 2]
Figure imgf000009_0002
Después, se calcula la siguiente ecuación para el Ei_(k,i) anterior.
[Ecuación 3]
L0(k,i) = 101ogwEL(k,i),
1 < k < n , t(s) < i < t(s 1), O < s < sE
Después, se adquiere una envolvente de tiempo L(k,i) realizando un procesamiento especificado en la cantidad Lo(k,i). La envolvente de tiempo L(k,i) se adquiere suavizando la cantidad L0(k,i) en la dirección de tiempo usando la siguiente ecuación.
[Ecuación 4]
Figure imgf000010_0001
En la ecuación anterior, sc(j), 0<j<d es el coeficiente de suavizado, y d es el orden de suavizado. El valor de sc(j) se establece mediante la siguiente ecuación, por ejemplo.
[Ecuación 5]
Figure imgf000010_0002
Sin embargo, en esta realización, el valor de sc(j) no está limitado a la ecuación anterior.
Además, el Lo(k,i) anterior puede calcularse mediante la siguiente ecuación, por ejemplo.
[Ecuación 6 ]
L0(k,i) = EL(k,i),
1 <k <n , t(s) < i< t (s l)9 0 < s < sE
Además, el Lo(k,i) anterior puede calcularse mediante la siguiente ecuación, por ejemplo
[Ecuación 7]
Figure imgf000011_0001
donde £ es el factor de relajación para evitar la división entre cero. Además, el Lo(k,i) anterior puede calcularse mediante la siguiente ecuación, por ejemplo.
[Ecuación 8]
Figure imgf000011_0002
La envolvente de tiempo Ldec(k,i) calculada por la k-ésima unidad 1fk de cálculo de envolvente de tiempo de banda de baja frecuencia se obtiene usando la siguiente ecuación:
[Ecuación 9]
Ldec(.k,i) = L0(k,i)
1 < k< n, t{s) <i < t(s +1), 0 < s < sE
o la siguiente ecuación:
[Ecuación 10]
Figure imgf000012_0001
1 < £ < n, t(s) <i<t(s 1), O <5 < ^
\<l,m<n — 1
Obsérvese que el Ldec(k,i) anterior puede ser cualquier parámetro que represente la variación en el tiempo de la potencia de señal o la amplitud de señal de la k-ésima señal de subbanda y no está limitado a la forma anterior de L0(k,i) y L i(k,i).
Además, el Ldec(k,i) anterior puede calcularse mediante un método que usa un análisis de componente principal de la siguiente manera.
En primer lugar, en el procedimiento de calcular Ldec(k,i) {1<k<n, t(s)<i<t(s+1), 0<s<se descrito anteriormente, se calculan m clases de cantidades correspondientes al Ldec(k,i) anterior para el índice k sustituyendo n por otro número entero m=n-1, y se representan esas cantidades como L2(k,i) {1<k<m(=n-1), t(s)<i<t(s+1), 0<s<sE}. Después, el L2(l,i) {1<l<m, t(s)<i<t(s+1)} anterior correspondiente a la s-ésima (0<s<se ) trama se considera como muestras de un número m de vectores con el orden D=t(s+l)-t(s), y se calcula el promedio de esas muestras mediante la siguiente ecuación.
[Ecuación 11]
Figure imgf000012_0002
Usando el promedio anterior, se define el vector de desplazamiento mediante la siguiente ecuación.
[Ecuación 12]
Figure imgf000012_0003
1 < 1 < m ,
t(s ) < i < t ( s 1), 0 < S < SE
A partir de estos vectores de desplazamiento, se calcula la matriz de varianza-covarianza Cov con el tamaño DxD mediante la siguiente ecuación.
[Ecuación 13]
Figure imgf000013_0001
Después, se calculan los vectores propios V(k) de la matriz Cov que satisfacen la siguiente ecuación
[Ecuación 14]
Figure imgf000013_0002
i ¿ k 1 , 2 , * • • ? Z )
y son ortogonales entre sí. El V(k)i anterior es el componente de los vectores propios V(k), y A(k) es el valor propio de la matriz Cov correspondiente a V(k). Cada uno de los vectores V (k) anteriores puede normalizarse. Sin embargo, una normalización del método no está limitada en esta invención. A continuación en el presente documento, se supone que A(1)>A(2)>..>A(D) para simplificar la descripción.
Usando los vectores propios adquiridos de la manera anterior, la unidad 1fk de cálculo de envolvente de tiempo de banda de baja frecuencia (1<k<n) calcula la envolvente de tiempo Ldec(k,i) de la siguiente manera. Específicamente, cuando D>m(=n-1), se selecciona un número n-1 de vectores a partir de los vectores propios anteriores en el orden de magnitudes correspondientes a los valores propios, y se calcula la envolvente de tiempo mediante la siguiente ecuación.
[Ecuación 15]
V{( ) l < k < n - l
Ldec (k , 0
L2,prom (0 ^ ^
Figure imgf000013_0003
Por otro lado, cuando D<m(=n-1), la envolvente de tiempo se calcula mediante la siguiente ecuación usando los vectores propios anteriores
[Ecuación 16]
Figure imgf000014_0001
donde a es un número constante, y a=0, por ejemplo. Además, cuando D<m(=n-1), la envolvente de tiempo puede calcularse mediante la siguiente ecuación.
[Ecuación 17]
Figure imgf000014_0002
Además, el Ldec(k,i) anterior puede calcularse mediante el siguiente método. En primer lugar, en el procedimiento de calcular L2(l,i) descrito anteriormente, se calcula L2(l,i), 1ál<m, t(s)<i<t(s+1), 0<s<se suponiendo m=n. Estos pueden considerarse como un grupo de número n de vectores D=t(s+1)-t(s) de dimensiones. Usando el número n de vectores, se calcula un número n de vectores ortogonales mediante un método tal como la ortogonalización de Gram-Schmidt y se establecen como Ldec(k,i), 1<l<n, t(s)<i<t(s+1), 0<s<se . Sin embargo, un método de ortogonalización no está limitado al ejemplo anterior. Además, los vectores ortogonales no se normalizan necesariamente.
La unidad 1g de cálculo de envolvente de tiempo calcula una envolvente de tiempo de banda de alta frecuencia usando el número n de envolventes de tiempo de banda de baja frecuencia suministradas a partir de las unidades 1fi a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima y la información de envolvente de tiempo suministrada a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada. Específicamente, el cálculo de la envolvente de tiempo por la unidad 1g de cálculo de envolvente de tiempo se realiza de la siguiente manera.
En primer lugar, se divide la banda de alta frecuencia en nH (nH^1) número de subbandas, y esas subbandas se representan como B(T)1(l=1,2,3,...,nH). A continuación, usando la envolvente de tiempo Ldec(k,i) descrita anteriormente, se calcula la envolvente de tiempo gdec(l,i) de la subbanda B(T)1 en la banda de alta frecuencia. i es el índice en la dirección de tiempo.
Por ejemplo, el gdec(l,i) descrito anteriormente viene dado por la siguiente ecuación.
[Ecuación 18]
Figure imgf000014_0003
El valor en la ecuación anterior:
[Ecuación 19]
Alk(s\ l<l<nH, 1 <k<n, 0 <s <s E
es la información de envolvente de tiempo suministrada a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada.
Además, en la información de envolvente de tiempo suministrada a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada, el coeficiente Ai,k(s) puede contener el coeficiente:
[Ecuación 20]
Figure imgf000015_0001
y, en este caso, el gdec(l,i) anterior puede venir dado por la siguiente ecuación.
[Ecuación 21]
Figure imgf000015_0002
1 < l< n H, t(s) < i < t(s 1), 0 < >s '< ^
Además, la información de envolvente de tiempo suministrada a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada puede contener el coeficiente dado por la siguiente ecuación:
[Ecuación 22]
4 .-A s )> 1 < l < n H, 1 < k < g , 0 < s < s E
además del coeficiente Al,k(s) {1 <l<nH, 1<k<n, 0<s<se } anterior o el coeficiente A l,k(s) {1 <l<nH, 0<k<n, 0<s<se } anterior, y, en este caso, el gdec(l,i) anterior puede venir dado por la siguiente ecuación:
[Ecuación 23]
Figure imgf000015_0003
o la siguiente ecuación:
[Ecuación 24]
Figure imgf000015_0004
1 < l < nH, t(s) < i < t(s 1), 0 < 5 < sE
donde U(k,i) {1<k<g, t(s)<i<t(s+1), 0<s<se} es un coeficiente especificado o una función especificada. Por ejemplo, U(k,i) puede ser la función dada por la siguiente ecuación:
[Ecuación 25]
Figure imgf000016_0001
1 < k < g, t(s) < / < t(s 1), O < s < sE
donde O es un coeficiente especificado.
El gdec(l,i) anterior puede estar en otra forma siempre que sea una representación de Ldec(k,i), y la información de envolvente de tiempo tampoco está limitada a la forma del coeficiente A i,k(s).
Finalmente, usando el gdec(l,i) anterior, la unidad 1g de cálculo de envolvente de tiempo calcula la envolvente de tiempo mediante la siguiente ecuación
[Ecuación 26]
E T(l , i ) = lO °-1Xfe(Z’° ,
l< l< n Ht t(s) < i < t(s 1), 0 < s < sE
o la siguiente ecuación.
Figure imgf000016_0002
= gdec (M ),
1 <l<nHl¡ t(s) ^z < t{s + 1), 0 <s<sE
La unidad 1h de generación de banda de alta frecuencia replica, usando la información complementaria para la generación de banda de alta frecuencia suministrada a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada, la señal de banda de baja frecuencia Xdec(j,i) {0<j<kx , t(s)<i<t(s+1), 0<s<se } suministrada a partir de la unidad 1c de banco de filtro de división de banda sobre la banda de alta frecuencia y de ese modo genera una señal de banda de alta frecuencia Xdec(j,i) {kx<j<kmáx, t(s)<i<t(s+1), 0<s<se }. La generación de la banda de alta frecuencia se realiza según un método de generación de HF en SBR de “MPEG4 AAC” especificado por la norma “ISO/IEC 14496-3” (“ ISO/IEC 14496-3 subparte 4 Codificación de audio general”).
La unidad 1i de ajuste de envolvente de tiempo ajusta la envolvente de tiempo de la señal de banda de alta frecuencia Xh (J,í) {kx<j<kmáx, t(s)<i<t(s+1), 0<s<se } suministrada a partir de la unidad 1h de generación de banda de alta frecuencia usando la envolvente de tiempo Et (I,í) {1<l<nH , t(s)<i<t(s+1), 0<s<se } suministrada a partir de la unidad 1g de cálculo de envolvente de tiempo.
Específicamente, el ajuste de la envolvente de tiempo se realiza mediante un método similar al ajuste de HF en SBR de “MPEG4 AAC” tal como se describe a continuación. Para simplificación, a continuación se describe un método que sólo tiene en cuenta la adición de ruido en el ajuste de HF, y se omiten métodos correspondientes al procesamiento tal como limitador de ganancia, suavizador de ganancia y adición sinusoidal. Sin embargo, resulta fácil generalizar el procesamiento para incluir el procesamiento omitido anteriormente. Obsérvese que se supone que el factor de escala de umbral mínimo de ruido requerido para realizar el procesamiento correspondiente a la adición de ruido o un parámetro requerido para realizar el procesamiento omitido descrito anteriormente ya se suministran a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada.
En primer lugar, para simplificación de la siguiente descripción, se define una matriz Fh que tiene un número nH+1 de índices que representan el límite de la subbanda B(T)i (1 <l<nH) como elementos de modo que la señal XH(j,i) {Fh(I)^Í<Fh(I+1), t(s)<i<t(s+1), 0<s<se} corresponde a la componente de la subbanda B(T)l. Obsérvese que Fh(1)=Kx y FH(nH+1)=kmáx+1.
Según la definición anterior, la envolvente de tiempo se transforma mediante la siguiente ecuación:
[Ecuación 28]
Figure imgf000017_0001
Después de eso, el factor de escala de umbral mínimo de ruido Q(m,i) facilitado por la unidad 1e de decodificación/descuantificación de secuencia codificada se transforma mediante la siguiente ecuación:
[Ecuación 29]
Figure imgf000017_0002
donde M=F(nH+1)-F(1). Además, se calcula la ganancia mediante la siguiente ecuación:
[Ecuación 30]
Figure imgf000017_0003
Se define la cantidad representada mediante la siguiente ecuación.
[Ecuación 31]
Figure imgf000018_0001
Finalmente, la unidad 1i de ajuste de envolvente de tiempo obtiene la señal con la envolvente de tiempo ajustada mediante la siguiente ecuación:
[Ecuación 32]
Re{7(m k j ) ) = Re{^(ni,0} Q2(m,i) ■ K0(/(i)),
Figure imgf000018_0002
0 <m<M, t(s) <i<t (s 1), 0 < s < sE
donde V0 y V1 son matrices que especifican la componente de ruido, y f es la función para mapear el índice i sobre un índice en las matrices (véase la norma “ISO/IEC 14496-34.B.18” para un ejemplo específico).
La unidad 1j de banco de filtro de síntesis de banda suma la señal de banda de alta frecuencia Y(i,j) {kx<j< kmáx, t(s)<i<t(s+1), 0<s<se} suministrada a partir de la unidad 1i de ajuste de envolvente de tiempo y la señal de banda de baja frecuencia X(j,i) {0<j<kx, t(s)<i<t(s+1), 0<s<se} suministrada a partir de la unidad 1c de banco de filtro de división de banda entre sí y después las sintetiza, y de ese modo adquiere una señal de voz decodificada en el dominio de tiempo que contiene las componentes de banda de frecuencia completa, y emite la señal de voz adquirida al exterior a través de un dispositivo de comunicación interno.
A continuación en el presente documento, se describe el funcionamiento del decodificador 1 de voz y también se describe en detalle el método de decodificación de voz en el decodificador 1 de voz con referencia a la figura 2. En primer lugar, la unidad 1a de demultiplexación divide la secuencia codificada introducida para dar la secuencia codificada de banda de baja frecuencia y la secuencia codificada de banda de alta frecuencia (etapa S01). A continuación, la unidad 1b de decodificación de banda de baja frecuencia decodifica la secuencia codificada de banda de baja frecuencia y obtiene la señal decodificada que sólo contiene componentes de banda de baja frecuencia (etapa S02). Después, la unidad 1c de banco de filtro de división de banda analiza la señal decodificada que sólo contiene componentes de banda de baja frecuencia y la transforma en una señal en el dominio de frecuencia (etapa S03). Además, la unidad 1d de análisis de secuencia codificada analiza la secuencia codificada de banda de alta frecuencia y adquiere la información complementaria codificada para la generación de banda de alta frecuencia y la información de envolvente de tiempo cuantificada (etapa S04). Después, la unidad 1e de decodificación/descuantificación de secuencia codificada decodifica la información complementaria para la generación de banda de alta frecuencia y descuantifica la información de envolvente de tiempo (etapa S05). Después de eso, la unidad 1h de generación de banda de alta frecuencia replica la señal de banda de baja frecuencia Xdec(j,i) sobre la banda de alta frecuencia usando la información complementaria para la generación de banda de alta frecuencia y de ese modo genera la señal de banda de alta frecuencia Xdec(j,i) (etapa S06). Después, las unidades 1fi a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima calculan una pluralidad de envolventes de tiempo de banda de baja frecuencia Ldec(k,i) basándose en la señal de banda de baja frecuencia X(j,i) (etapa S07).
Además, la unidad 1g de cálculo de envolvente de tiempo calcula la envolvente de tiempo de banda de alta frecuencia Et (I,í) usando la pluralidad de envolventes de tiempo de banda de baja frecuencia Ldec(k,i) y la información de envolvente de tiempo (etapa S08). Después, la unidad 1i de ajuste de envolvente de tiempo ajusta la envolvente de tiempo de la señal de banda de alta frecuencia Xh (J,¡) usando la envolvente de tiempo Et (I,í) (etapa S09). Finalmente, la unidad 1j de banco de filtro de síntesis de banda suma la señal de banda de alta frecuencia Y(i,j) y la señal de banda de baja frecuencia X(j,i) entre sí y después las sintetiza para adquirir la señal de voz decodificada en el dominio de tiempo y emite la señal de voz decodificada (etapa S10).
La figura 3 es un diagrama que muestra una configuración del codificador 2 de voz según la primera realización de la invención, y la figura 4 es un diagrama de flujo que muestra un procedimiento de un método de codificación de voz implementado por el codificador 2 de voz. El codificador 2 de voz incluye CPU, ROM, RAM, un dispositivo de comunicación y similares que no se muestran físicamente, y la CPU carga un programa informático especificado (por ejemplo, un programa informático para realizar el procedimiento mostrado en el diagrama de flujo de la figura 4) almacenado en una memoria interna tal como la ROM del codificador 2 de voz en la RAM y ejecuta el programa para así ejercer control sobre el codificador 2 de voz. El dispositivo de comunicación del codificador 2 de voz recibe una señal de voz que va a codificarse a partir del exterior y emite un flujo de bits multiplexado codificado al exterior.
Tal como se muestra en la figura 3, el codificador 2 de voz incluye funcionalmente una unidad 2a de submuestreo (medios de submuestreo), una unidad 2b de codificación de banda de baja frecuencia (medios de codificación de banda de baja frecuencia), una unidad 2c de banco de filtro de división de banda (medios de transformación de frecuencia), una unidad 2d de cálculo de información complementaria para la generación de banda de alta frecuencia (medios de cálculo de información complementaria), unidades 2e i a 2en de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima (n es un número entero de dos o más) (medios de cálculo de envolvente de tiempo de banda de baja frecuencia), una unidad 2f de cálculo de información de envolvente de tiempo (medios de cálculo de información de envolvente de tiempo), una unidad 2g de cuantificación/codificación (medios de cuantificación y codificación), una unidad 2h de construcción de secuencia codificada de banda de alta frecuencia (medios de construcción de secuencia codificada), y una unidad 2i de multiplexación (medios de multiplexación). Las unidades respectivas del codificador 2 de voz mostrado en la figura 3 son unidades funcionales que se realizan al ejecutar la CpU del codificador 2 de voz un programa informático almacenado en la memoria interna del codificador 2 de voz. La CPU del codificador 2 de voz ejecuta el programa informático (usa las unidades funcionales de la figura 3) para ejecutar secuencialmente el procedimiento mostrado en el diagrama de flujo de la figura 4 (el procedimiento de las etapas S11 a S20). Se supone que diversos datos requeridos para la ejecución del programa informático y diversos datos generados mediante la ejecución del programa informático se almacenan en la memoria interna, tal como ROM y RAM, del codificador 2 de voz.
La unidad 2a de submuestreo procesa una señal de entrada externa que se recibe a través del dispositivo de comunicación del codificador 2 de voz y obtiene una señal de dominio de tiempo submuestreada en la banda de baja frecuencia. La unidad 2b de codificación de banda de baja frecuencia codifica la señal de dominio de tiempo submuestreada y obtiene una secuencia codificada de banda de baja frecuencia. La codificación en la unidad 2b de codificación de banda de baja frecuencia puede basarse en un método de codificación de voz tal como CELP, o basarse en codificación de transformada tal como AAC o codificación de audio tal como TCX. Además, puede basarse en codificación de PCM. Además, puede basarse en un método que usa esos métodos de codificación de manera conmutable. En esta realización, un método de codificación no está particularmente limitado.
La unidad 2c de banco de filtro de división de banda analiza una señal de entrada externa que se recibe a través del dispositivo de comunicación del codificador 2 de voz y la transforma en una señal X(j,i) en todas las bandas de frecuencia en el dominio de frecuencia, en la que j es un índice en la dirección de frecuencia, i es un índice en la dirección de tiempo.
La unidad 2d de cálculo de información complementaria para la generación de banda de alta frecuencia recibe la señal de dominio de frecuencia X(j,i) a partir de la unidad 2c de banco de filtro de división de banda y calcula, basándose en el análisis de la potencia, variaciones de señal, tonalidad y similares de la banda de alta frecuencia, información complementaria para la generación de banda de alta frecuencia que va a usarse cuando se generan componentes de señal de banda de alta frecuencia a partir de componentes de señal de banda de baja frecuencia.
Las unidades 2e i a 2en de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima calculan una pluralidad de envolventes de tiempo diferentes de componentes de banda de baja frecuencia, respectivamente. Específicamente, la k-ésima unidad 2ek de cálculo de envolvente de tiempo de banda de baja frecuencia (1<k<n) recibe una señal de banda de baja frecuencia X(j,i) {0<j<kx , t(s)<i<t(s+1), 0<s<se } a partir de la unidad 2c de banco de filtro de división de banda y calcula la k-ésima envolvente de tiempo L(k,i) {t(s)<i<t(s+1), 0<s<se } en la banda de baja frecuencia según el método de cálculo descrito anteriormente de la envolvente de tiempo Ldec(k,i) de la k-ésima unidad 1fk de cálculo de envolvente de tiempo de banda de baja frecuencia (1<k<n) del decodificador 1 de voz descrito anteriormente.
La unidad 2f de cálculo de información de envolvente de tiempo recibe la señal de banda de alta frecuencia X(j,i) {kx<j<N, t(s)<i<t(s+1), 0<s<se} a partir de la unidad 2c de banco de filtro de división de banda y recibe la envolvente de tiempo L(k,i) {t(s)<i<t(s+1), 0<s<se} a partir de la k-ésima unidad 2ek de cálculo de envolvente de tiempo de banda de baja frecuencia (1<k<n), y calcula información de envolvente de tiempo requerida para adquirir la envolvente de tiempo de componentes de banda de alta frecuencia de la señal X(j,i). La información de envolvente de tiempo es información que puede construir la aproximación de una envolvente de tiempo de referencia en la banda de alta frecuencia cuando la envolvente de tiempo Ldec(k,i) se facilita en el lado de decodificador 1 de voz descrito anteriormente.
Específicamente, el cálculo de la información de envolvente de tiempo se realiza de la siguiente manera. En primer lugar, se calcula una envolvente de tiempo de potencia mediante la siguiente ecuación.
[Ecuación 33]
Figure imgf000020_0001
A continuación, cuando la envolvente de tiempo de referencia en la l-ésima (1<l<nH) banda de frecuencia de la banda de alta frecuencia se representa como H(l,i) {t(s)<i<t(s+1)}, se calcula la envolvente de tiempo de referencia H(l,i) mediante la siguiente ecuación.
[Ecuación 34]
Figure imgf000020_0002
t(s) <i<t(s Y), 0 <s< sE
o mediante la siguiente ecuación.
[Ecuación 35]
Figure imgf000021_0001
K = F h(l), kl =F„(l 1)-1
t(s) < i < t(s 1)? O < s < sE
Obsérvese que la envolvente de tiempo de referencia en la banda de alta frecuencia puede obtenerse realizando el procesamiento especificado (por ejemplo, suavizado) en H(l,i), como la envolvente de tiempo en la banda de baja frecuencia descrita anteriormente. Además, la envolvente de tiempo de referencia en la banda de alta frecuencia no se calcula necesariamente mediante el método de cálculo anterior siempre que sea un parámetro que representa la variación en el tiempo de la potencia de señal o la amplitud de señal de la señal de banda de alta frecuencia. Cuando la aproximación de la envolvente de tiempo de referencia H(l,i) mediante la envolvente de tiempo L(k,i) se representa como g(l,i), la forma de g(l,i) se adapta a la forma gdec(l,i) en el decodificador 1 de voz. La envolvente de tiempo L(k,i) corresponde a la envolvente de tiempo Ldec(k,i) en el lado de decodificador 1 de voz.
Por ejemplo, la información de envolvente de tiempo puede calcularse definiendo un error del g(l,i) anterior con respecto a la envolvente de tiempo de referencia H(l,i) y calculando g(l,i) que minimiza el error. Específicamente, puede calcularse tratando el error como una función de la información de envolvente de tiempo y hallando la información de envolvente de tiempo que proporciona el valor mínimo del error. El cálculo de la información de envolvente de tiempo puede realizarse digitalmente o puede calcularse usando una fórmula numérica.
De manera más específica, el error del g(l,i) anterior con respecto a la envolvente de tiempo de referencia H(l,i) puede calcularse mediante la siguiente ecuación:
[Ecuación 36]
í ( í l ) - l
error - £ {H(l,í)~ g( l , i ) f ,
i = t ( s )
1 <l<nH, 0<¿'<sE
Además, el error puede calcularse como error ponderado usando la siguiente ecuación:
[Ecuación 37]
\
Figure imgf000021_0002
Además, el error puede calcularse mediante la siguiente ecuación:
[Ecuación 38]
nH í( ,s l) -l
error = ^ ]T w(l,i)(H(l,i)~ g(l, i jf,
1=1 i=t(s)
O < s < sE
El peso w(l,i) puede definirse como un peso que varía con el índice de tiempo i o un peso que varía con el índice de frecuencia l, y puede definirse como un peso que varía con el índice de tiempo i y el índice de frecuencia l. Obsérvese que, en esta realización, la forma del error y la forma del peso no están particularmente limitadas a los ejemplos anteriores.
La unidad 2g de cuantificación/codificación recibe la información de envolvente de tiempo a partir de la unidad 2f de cálculo de información de envolvente de tiempo y después cuantifica y codifica la información de envolvente de tiempo, y recibe la información complementaria para la generación de banda de alta frecuencia a partir de la unidad 2d de cálculo de información complementaria para la generación de banda de alta frecuencia y después codifica la información complementaria para la generación de banda de alta frecuencia.
Como método de cuantificación y codificación de la información de envolvente de tiempo, cuando la información está en forma del coeficiente A l,k(s), por ejemplo, puede cuantificarse Al,k(s) de manera escalar y después codificarse por entropía. Además, puede cuantificarse A l,k(s) de manera vectorial usando un libro de códigos especificado y después puede codificarse su índice. Sin embargo, en esta realización el método de cuantificación y codificación de la información de envolvente de tiempo no está limitado a lo anterior.
La unidad 2h de construcción de secuencia codificada de banda de alta frecuencia recibe la información complementaria codificada para la generación de banda de alta frecuencia y la información de envolvente de tiempo cuantificada a partir de la unidad 2g de cuantificación/codificación y construye una secuencia codificada de banda de alta frecuencia que contiene las mismas.
La unidad 2i de multiplexación recibe la secuencia codificada de banda de baja frecuencia a partir de la unidad 2b de codificación de banda de baja frecuencia y recibe la secuencia codificada de banda de alta frecuencia a partir de la unidad 2h de construcción de secuencia codificada de banda de alta frecuencia, multiplexa esas dos secuencias codificadas para generar una secuencia codificada y emite la secuencia codificada generada.
A continuación en el presente documento se describe el funcionamiento del codificador 2 de voz y también se describe en detalle el método de codificación de voz en el codificador 2 de voz con referencia a la figura 4.
En primer lugar, la unidad 2c de banco de filtro de división de banda analiza una señal de voz de entrada y de ese modo adquiere la señal de dominio de frecuencia X(j,i) en todas las bandas de frecuencia (etapa S11). A continuación, la unidad 2a de submuestreo procesa una señal de voz de entrada externa y adquiere la señal de dominio de tiempo submuestreada (etapa S12). Después, la unidad 2b de codificación de banda de baja frecuencia codifica la señal de dominio de tiempo submuestreada y obtiene la secuencia codificada de banda de baja frecuencia (etapa S13).
Además, la unidad 2d de cálculo de información complementaria para la generación de banda de alta frecuencia analiza la señal de dominio de frecuencia X(j,i) adquirida a partir de la unidad 2c de banco de filtro de división de banda y calcula la información complementaria para la generación de banda de alta frecuencia que va a usarse cuando se generen componentes de señal de banda de alta frecuencia (etapa S14). Después, las unidades 2e1 a 2en de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima calculan una pluralidad de envolventes de tiempo de banda de baja frecuencia L(k,i) basándose en la señal de banda de baja frecuencia X(j,i) (etapa S15). Después de eso, la unidad 2f de cálculo de información de envolvente de tiempo calcula, basándose en la señal de banda de alta frecuencia X(j,i) y la pluralidad de envolventes de tiempo de banda de baja frecuencia L(k,i), la información de envolvente de tiempo requerida para adquirir la envolvente de tiempo de componentes de banda de alta frecuencia de la señal X(j,i) (etapa S16). Después, la unidad 2g de cuantificación/codificación cuantifica y codifica la información de envolvente de tiempo y codifica la información complementaria para la generación de banda de alta frecuencia (etapa S17).
Además, la unidad 2h de construcción de secuencia codificada de banda de alta frecuencia construye la secuencia codificada de banda de alta frecuencia que contiene la información complementaria codificada para la generación de banda de alta frecuencia y la información de envolvente de tiempo cuantificada (etapa S18). Después, la unidad 2i de multiplexación genera la secuencia codificada multiplexando la secuencia codificada de banda de baja frecuencia y la secuencia codificada de banda de alta frecuencia y emite la secuencia codificada generada (etapa S19).
Según el decodificador 1 de voz, el método de decodificación o el programa de decodificación descritos anteriormente, la señal de banda de baja frecuencia se obtiene a partir de la secuencia codificada mediante demultiplexación y decodificación, y la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo se obtienen a partir de la secuencia codificada mediante demultiplexación, decodificación y descuantificación. Después, se genera la componente de banda de alta frecuencia Xdec(j,i) en el dominio de frecuencia a partir de la señal de banda de baja frecuencia Xdec(j,i) transformada en el dominio de frecuencia usando la información complementaria para la generación de banda de alta frecuencia, y, por otro lado, tras adquirir una pluralidad de envolventes de tiempo de banda de baja frecuencia Ldec(k,i) analizando la señal de banda de baja frecuencia Xdec(j,i) en el dominio de frecuencia, se calcula la envolvente de tiempo de banda de alta frecuencia Et (I,í) usando la pluralidad de envolventes de tiempo de banda de baja frecuencia Ldec(k,i) y la información de envolvente de tiempo. Además, se ajusta la envolvente de tiempo de la componente de banda de alta frecuencia X h (J,í) mediante la envolvente de tiempo calculada de banda de alta frecuencia Et (I,í), y se suman la componente de banda de alta frecuencia ajustada y la señal de banda de baja frecuencia entre sí y de ese modo se emite la señal de dominio de tiempo. De esta manera, dado que se usa una pluralidad de envolventes de tiempo de banda de baja frecuencia Ldec(k,i) para el ajuste de la envolvente de tiempo de la componente de banda de alta frecuencia X h Q,í), la forma de onda de la envolvente de tiempo de la componente de banda de alta frecuencia se ajusta con alta precisión mediante el uso de la correlación entre la envolvente de tiempo de componentes de banda de baja frecuencia y la envolvente de tiempo de componentes de banda de alta frecuencia. Como resultado, la envolvente de tiempo en la señal decodificada se ajusta para dar una forma menos distorsionada, y por tanto puede obtenerse una señal reproducida con menos preeco y posteco.
Además, según el codificador 2 de voz, el método de codificación o el programa de codificación descritos anteriormente, se obtiene la señal de banda de baja frecuencia mediante submuestreo de una señal de voz, y se codifica la señal de banda de baja frecuencia y, por otro lado, se calcula una pluralidad de envolventes de tiempo L(k,i) de componentes de banda de baja frecuencia basándose en la señal de voz X(j,i) en el dominio de frecuencia, y se calcula la información de envolvente de tiempo para adquirir la envolvente de tiempo de componentes de banda de alta frecuencia usando la pluralidad de envolventes de tiempo L(k,i) de componentes de banda de baja frecuencia. Además, se calcula la información complementaria para la generación de banda de alta frecuencia para generar componentes de banda de alta frecuencia a partir de la señal de banda de baja frecuencia, y, tras cuantificar y codificar la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo, se construye la secuencia codificada de banda de alta frecuencia que contiene la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo. Después, se genera la secuencia codificada en la que se multiplexan la secuencia codificada de banda de baja frecuencia y la secuencia codificada de banda de alta frecuencia. Por consiguiente, cuando se introduce la secuencia codificada en el decodificador 1 de voz, puede usarse una pluralidad de envolventes de tiempo de banda de baja frecuencia para el ajuste de la envolvente de tiempo de componentes de banda de alta frecuencia en el lado de decodificador 1 de voz, y de ese modo la forma de onda de la envolvente de tiempo de componentes de banda de alta frecuencia se ajusta con alta precisión mediante el uso de la correlación entre la envolvente de tiempo de componentes de banda de baja frecuencia y la envolvente de tiempo de componentes de banda de alta frecuencia en el lado de decodificador 1 de voz. Como resultado, la envolvente de tiempo en la señal decodificada se ajusta para dar una forma menos distorsionada, y por tanto puede obtenerse una señal reproducida con menos preeco y posteco en el lado de decodificador.
[Primer ejemplo alternativo del decodificador de voz según la primera realización]
La figura 5 es un diagrama que muestra una configuración de una parte principal relacionada con el cálculo de envolvente en un primer ejemplo alternativo del decodificador 1 de voz según la primera realización, y la figura 6 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente por el decodificador 1 de voz mostrado en la figura 5.
El decodificador 1 de voz mostrado en la figura 5 incluye una unidad 1k de control de cálculo de envolvente de tiempo (medios de control de cálculo de envolvente de tiempo) además de las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y la unidad 1g de cálculo de envolvente de tiempo. La unidad 1k de control de cálculo de envolvente de tiempo recibe una señal de banda de baja frecuencia a partir de la unidad 1c de banco de filtro de división de banda, calcula la potencia de la señal de banda de baja frecuencia en la trama (etapa S31), y compara la potencia calculada de la señal de banda de baja frecuencia con un umbral especificado (etapa S32). Cuando la potencia de la señal de banda de baja frecuencia no es mayor que el umbral especificado (NO en la etapa S32), la unidad 1k de control de cálculo de envolvente de tiempo emite una señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y emite una señal de control de cálculo de envolvente de tiempo a la unidad 1g de cálculo de envolvente de tiempo de modo que no se realiza el cálculo de envolvente de tiempo en las unidades 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y la unidad 1g de cálculo de envolvente de tiempo. En este caso, la envolvente de tiempo de la señal de banda de alta frecuencia se envía a la unidad 1j de banco de filtro de síntesis de banda sin ajustarse basándose en la envolvente de tiempo descrita anteriormente (por ejemplo, en la ecuación anterior 29, se sustituye E(m,i) por Ecurr(m,i)), y se usa la siguiente ecuación:
[Ecuación 39]
Figure imgf000024_0001
en lugar de la ecuación anterior 30 (etapa S36). Por otro lado, cuando la potencia de la señal de banda de baja frecuencia es mayor que el umbral especificado, la unidad 1k de control de cálculo de envolvente de tiempo emite una señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a las unidades 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y emite una señal de control de cálculo de envolvente de tiempo a la unidad 1g de cálculo de envolvente de tiempo de modo que se realiza el cálculo de envolvente de tiempo en las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y la unidad 1g de cálculo de envolvente de tiempo. En este caso, la señal de banda de alta frecuencia cuya envolvente de tiempo se ajusta mediante la unidad 1i de ajuste de envolvente de tiempo basándose en la envolvente de tiempo descrita anteriormente se envía a la unidad 1j de banco de filtro de síntesis de banda.
Haciendo referencia a la figura 6 , en el primer ejemplo alternativo del decodificador 1 de voz, se ejecuta el procedimiento de cálculo de envolvente mostrado en las etapas S31 a S36 en lugar del procedimiento en las etapas S07 a S09 del decodificador 1 de voz según la primera realización mostrada en la figura 2.
En el primer ejemplo alternativo del decodificador 1 de voz descrito anteriormente, cuando la potencia de la señal de banda de baja frecuencia es baja y no se usa para el cálculo de la envolvente de tiempo de la señal de banda de alta frecuencia, puede omitirse el procedimiento en las etapas S07 a S08 para reducir la cantidad de computación.
Obsérvese que la unidad 1k de control de cálculo de envolvente de tiempo puede calcular la potencia de una parte correspondiente a las envolventes de tiempo de banda de baja frecuencia primera a n-ésima calculadas por las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima, emitir la señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia basándose en un resultado de comparar la potencia calculada correspondiente a las envolventes de tiempo de banda de baja frecuencia primera a n-ésima con un umbral especificado y de ese modo controlar si omitir o no el procesamiento de las unidades 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima.
En este caso, cuando la unidad 1k de control de cálculo de envolvente de tiempo realiza el control para omitir el procesamiento por todas las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima, emite la señal de control de cálculo de envolvente de tiempo a la unidad 1g de cálculo de envolvente de tiempo para omitir el procedimiento de cálculo de envolvente de tiempo. Por otro lado, cuando la unidad 1k de control de cálculo de envolvente de tiempo realiza el control de modo que al menos una de las unidades 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima realiza el procedimiento de cálculo de envolvente de tiempo de banda de baja frecuencia, emite la señal de control de cálculo de envolvente de tiempo a la unidad 1g de cálculo de envolvente de tiempo para realizar el procedimiento de cálculo de envolvente de tiempo.
[Segundo ejemplo alternativo del decodificador de voz según la primera realización]
La figura 7 es un diagrama que muestra una configuración de una parte principal relacionada con el cálculo de envolvente en un segundo ejemplo alternativo del decodificador 1 de voz según la primera realización, y la figura 8 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente realizado por el decodificador 1 de voz mostrado en la figura 7.
El decodificador 1 de voz mostrado en la figura 7 incluye una unidad 1m de control de cálculo de envolvente de tiempo (medios de control de cálculo de envolvente de tiempo) además de las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y la unidad 1g de cálculo de envolvente de tiempo. La unidad 1m de control de cálculo de envolvente de tiempo emite una señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima basándose en la información de envolvente de tiempo recibida a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada y controla la ejecución del cálculo de envolvente de tiempo de banda de baja frecuencia en las unidades 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima.
De manera específica, en el segundo ejemplo alternativo del decodificador 1 de voz, se ejecuta el procedimiento de cálculo de envolvente en las etapas S41 a S48 mostrado en la figura 8 , que sustituye al procedimiento en las etapas S07 a S09 del decodificador 1 de voz según la primera realización mostrada en la figura 2.
En primer lugar, la unidad 1m de control de cálculo de envolvente de tiempo establece un valor de contador “contador” a 0 (etapa S41). A continuación, la unidad 1m de control de cálculo de envolvente de tiempo determina si un coeficiente Ai,contador+i(s) contenido en la información de envolvente de tiempo recibida a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada es 0 o no (etapa S42).
Como resultado de la determinación, cuando el coeficiente A,contador+1(s) es 0 (NO en la etapa S42), la unidad 1m de control de cálculo de envolvente de tiempo emite una señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a la contador-ésima unidad 1fcontador de cálculo de envolvente de tiempo de banda de baja frecuencia de modo que no se realiza el cálculo de envolvente de tiempo de banda de baja frecuencia en la unidad 1fcontador de cálculo de envolvente de tiempo de banda de baja frecuencia y después avanza a la etapa S44. Por otro lado, cuando se determina que el coeficiente Al,contador+1(s) no es 0 (SÍ en la etapa S42), la unidad 1m de control de cálculo de envolvente de tiempo emite una señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a la contador-ésima unidad 1fcontador de cálculo de envolvente de tiempo de banda de baja frecuencia de modo que se realiza el cálculo de envolvente de tiempo de banda de baja frecuencia en la unidad 1fcontador de cálculo de envolvente de tiempo de banda de baja frecuencia. De ese modo se calcula la envolvente de tiempo de banda de baja frecuencia por la unidad 1fcontador de cálculo de envolvente de tiempo de banda de baja frecuencia (etapa S43).
Además, la unidad 1m de control de cálculo de envolvente de tiempo aumenta el valor de contador “contador” en 1 (etapa S44), y después compara el valor de contador “contador” con el número n de las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia (etapa S45). Cuando el valor de contador “contador” es menor que el número n (SÍ en la etapa S45), el procedimiento vuelve a la etapa S42 y repite la determinación para el siguiente coeficiente Alcontador(s) contenido en la información de envolvente de tiempo. Por otro lado, cuando el valor de contador “contador” es igual o superior al número n (NO en la etapa S45), el procedimiento avanza a la etapa S46. Después, la unidad 1m de control de cálculo de envolvente de tiempo determina si el cálculo de envolvente de tiempo de banda de baja frecuencia se realiza en una o más unidades 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia (etapa S46). Como resultado de la determinación, cuando el cálculo de envolvente de tiempo de banda de baja frecuencia no se realiza en ninguna de las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia (NO en la etapa S46), la unidad 1m de control de cálculo de envolvente de tiempo emite la señal de control de cálculo de envolvente de tiempo a la unidad 1g de cálculo de envolvente de tiempo para omitir el procedimiento de cálculo de envolvente de tiempo. En este caso, se realiza la etapa S49 en lugar de las etapas S47 a S48 y después el procedimiento avanza a la etapa S10 (figura 2). Por otro lado, cuando el cálculo de envolvente de tiempo de banda de baja frecuencia se realiza en una o más de las unidades 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia (SÍ en la etapa S46), la unidad 1g de cálculo de envolvente de tiempo realiza el procedimiento de cálculo de envolvente de tiempo (etapa S47). Después, la unidad 1i de ajuste de envolvente de tiempo realiza el ajuste de la envolvente de tiempo de la señal de banda de alta frecuencia (etapa S48). Después de eso, la unidad 1j de banco de filtro de síntesis de banda sintetiza la señal de salida.
Mediante el segundo ejemplo alternativo del decodificador 1 de voz descrito anteriormente, cuando no se requiere una parte del procedimiento basándose en la información de envolvente de tiempo obtenida a partir de la secuencia codificada, puede omitirse cualquiera de los procedimientos en las etapas S07 a S08 para reducir la cantidad de computación.
[Tercer ejemplo alternativo del decodificador de voz según la primera realización]
La figura 9 es un diagrama que muestra una configuración de una parte principal relacionada con el cálculo de envolvente según un tercer ejemplo alternativo del decodificador 1 de voz según la primera realización, y la figura 10 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente mediante el decodificador 1 de voz mostrado en la figura 9.
El decodificador 1 de voz mostrado en la figura 9 incluye una unidad 1n de control de cálculo de envolvente de tiempo (medios de control de cálculo de envolvente de tiempo) además de las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y la unidad 1g de cálculo de envolvente de tiempo. La unidad 1n de control de cálculo de envolvente de tiempo recibe información de control de cálculo de envolvente de tiempo a partir de la unidad 1d de análisis de secuencia codificada. En este ejemplo alternativo, la información de control de cálculo de envolvente de tiempo describe si realizar o no el procedimiento de cálculo de envolvente de tiempo en la trama. Cuando se necesita decodificar y descuantificar para leer la descripción de la información de control de cálculo de envolvente de tiempo, la unidad 1e de decodificación/descuantificación de secuencia codificada realiza la decodificación y descuantificación. Además, la unidad 1n de control de cálculo de envolvente de tiempo determina si realizar o no el procedimiento de cálculo de envolvente de tiempo en la trama haciendo referencia a la información de control de cálculo de envolvente de tiempo. Cuando la unidad 1n de control de cálculo de envolvente de tiempo determina no realizar el procedimiento de cálculo de envolvente de tiempo, emite una señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y emite una señal de control de cálculo de envolvente de tiempo a la unidad 1g de cálculo de envolvente de tiempo de modo que no se realiza el procedimiento de cálculo de envolvente de tiempo en las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y la unidad 1g de cálculo de envolvente de tiempo. En este caso, la señal de banda de alta frecuencia se envía a la unidad 1j de banco de filtro de síntesis de banda sin ajuste de su envolvente de tiempo basándose en la envolvente de tiempo descrita anteriormente. Por otro lado, cuando la unidad 1n de control de cálculo de envolvente de tiempo determina realizar el procedimiento de cálculo de envolvente de tiempo, emite una señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a las unidades 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y emite una señal de control de cálculo de envolvente de tiempo a la unidad 1g de cálculo de envolvente de tiempo de modo que se realiza el procedimiento de cálculo de envolvente de tiempo en las unidades 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y la unidad 1g de cálculo de envolvente de tiempo. En este caso, la señal de banda de alta frecuencia se envía a la unidad 1j de banco de filtro de síntesis de banda tras ajustarse su envolvente de tiempo en la unidad 1i de ajuste de envolvente de tiempo.
Haciendo referencia a la figura 10, en el tercer ejemplo alternativo del decodificador 1 de voz, se ejecuta el procedimiento de cálculo de envolvente en las etapas S51 a S54 en lugar del procedimiento de las etapas S07 a S09 del decodificador 1 de voz según la primera realización mostrada en la figura 2.
También en el tercer ejemplo alternativo del decodificador 1 de voz descrito anteriormente, puede omitirse el procedimiento en las etapas S07 a S08 basándose en la información de control a partir del codificador para así reducir la cantidad de computación.
[Cuarto ejemplo alternativo del decodificador de voz según la primera realización]
La figura 11 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente realizado por un cuarto ejemplo alternativo del decodificador 1 de voz según la primera realización. Obsérvese que la configuración del cuarto ejemplo alternativo del decodificador 1 de voz es la misma que la mostrada en la figura 9.
En el cuarto ejemplo alternativo, se ejecuta el procedimiento de cálculo de envolvente en las etapas S61 a S64 mostrado en la figura 11 en lugar del procedimiento en las etapas S07 a S09 del decodificador 1 de voz según la primera realización mostrada en la figura 2.
Específicamente, la información de control de cálculo de envolvente de tiempo describe la envolvente de tiempo de banda de baja frecuencia que va a usarse para el cálculo de envolvente de tiempo en la trama entre las envolventes de tiempo de banda de baja frecuencia primera a n-ésima. Cuando se necesita decodificar y descuantificar para leer la descripción de la información de control de cálculo de envolvente de tiempo, la unidad 1e de decodificación/descuantificación de secuencia codificada realiza la decodificación y descuantificación. Después, la unidad 1n de control de cálculo de envolvente de tiempo selecciona, basándose en la información de control de cálculo de envolvente de tiempo, la envolvente de tiempo de banda de baja frecuencia que va a usarse para el procedimiento de cálculo de envolvente de tiempo en la trama (etapa S61).
Después, la unidad 1n de control de cálculo de envolvente de tiempo emite la señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima. De ese modo se controla de manera que se calcula la envolvente de tiempo de banda de baja frecuencia por la unidad f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia correspondiente a la envolvente de tiempo de banda de baja frecuencia que se selecciona en la selección anterior, y no se calcula la envolvente de tiempo de banda de baja frecuencia por la unidad 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia correspondiente a las envolventes de tiempo de banda de baja frecuencia que no se selecciona en la selección anterior (etapa S62).
Después de eso, la unidad 1n de control de cálculo de envolvente de tiempo emite la señal de control de cálculo de envolvente de tiempo a la unidad 1g de cálculo de envolvente de tiempo de modo que la envolvente de tiempo se calcula usando sólo la envolvente de tiempo de banda de baja frecuencia seleccionada (etapa S63). Además, la unidad 1i de ajuste de envolvente de tiempo ajusta, usando la envolvente de tiempo calculada, la envolvente de tiempo de la señal de banda de alta frecuencia generada en la unidad 1h de generación de banda de alta frecuencia (etapa S64).
Además, cuando no se selecciona ninguna de las envolventes de tiempo de banda de baja frecuencia en la selección anterior, pueden omitirse las etapas S62 a S63, y puede enviarse la señal de banda de alta frecuencia a la unidad 1j de banco de filtro de síntesis de banda sin ajuste de su envolvente de tiempo basándose en la envolvente de tiempo descrita anteriormente (etapa S36 en la figura 6 ).
También en el cuarto ejemplo alternativo del decodificador 1 de voz descrito anteriormente, puede omitirse el procedimiento en las etapas S07 a S08 basándose en la información de control a partir del codificador para reducir la cantidad de computación.
[Quinto ejemplo alternativo del decodificador de voz según la primera realización]
La figura 12 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente realizado por un quinto ejemplo alternativo del decodificador 1 de voz según la primera realización. Obsérvese que la configuración del quinto ejemplo alternativo del decodificador 1 de voz es la misma que la mostrada en la figura 9.
En el quinto ejemplo alternativo, se ejecuta el procedimiento de cálculo de envolvente en las etapas S71 a S75 mostrado en la figura 12 en lugar del procedimiento en las etapas S07 a S09 del decodificador 1 de voz según la primera realización mostrada en la figura 2.
Específicamente, la información de control de cálculo de envolvente de tiempo describe un método de cálculo de las envolventes de tiempo primera a n-ésima de banda de baja frecuencia en la trama. Cuando se necesita decodificar y descuantificar para leer la descripción de la información de control de cálculo de envolvente de tiempo, la unidad 1e de decodificación/descuantificación de secuencia codificada realiza la decodificación y descuantificación. El método de cálculo de las envolventes de tiempo de banda de baja frecuencia primera a n-ésima descrito en la información de control de cálculo de envolvente de tiempo puede ser el contenido relacionado con el establecimiento de las matrices Bi y Bh que representan subbandas, por ejemplo, y el intervalo de frecuencia de la subbanda puede controlarse basándose en la información de control de cálculo de envolvente de tiempo. El contenido relacionado con el establecimiento de las matrices Bi y Bh puede ser la descripción de un conjunto de números enteros (ki,kh) para establecer las matrices Bi y Bh o la descripción relacionada con la selección a partir de una pluralidad de contenidos especificados de establecimiento de las matrices Bi y Bh. En este ejemplo alternativo, un método de descripción del contenido relacionado con el establecimiento de las matrices Bi y Bh no está particularmente limitado. Además, un método de cálculo de las envolventes de tiempo de banda de baja frecuencia primera a n-ésima descrito en la información de control de cálculo de envolvente de tiempo puede ser el contenido relacionado con el establecimiento del procesamiento especificado (por ejemplo, el contenido relacionado con el establecimiento del coeficiente de suavizado sc(j) descrito anteriormente), y el procesamiento especificado (por ejemplo, el suavizado) puede controlarse basándose en la información de control de cálculo de envolvente de tiempo. El contenido relacionado con el establecimiento del coeficiente de suavizado sc(j) puede ser un resultado de cuantificar y codificar el valor del coeficiente de suavizado sc(j) o puede ser el contenido relacionado con la selección de uno cualquiera de una pluralidad de coeficientes de suavizado sc(j) especificados. Además, puede incluir la descripción sobre si realizar o no el suavizado. En este ejemplo alternativo, un método de descripción del contenido relacionado con el establecimiento del procesamiento especificado (por ejemplo, establecer del coeficiente de suavizado sc(j) descrito anteriormente) no está particularmente limitado. Además, un método de cálculo de las envolventes de tiempo de banda de baja frecuencia primera a n-ésima descrito en la información de control de cálculo de envolvente de tiempo puede incluir al menos uno de los métodos de cálculo anteriores. Obsérvese que, en este ejemplo alternativo, un método de cálculo de las envolventes de tiempo de banda de baja frecuencia primera a n-ésima descrito en la información de control de cálculo de envolvente de tiempo no está limitado a la descripción anterior siempre que se describa el contenido relacionado con un método de cálculo de la envolvente de tiempo de banda de baja frecuencia.
En la etapa S71, la unidad 1n de control de cálculo de envolvente de tiempo determina, basándose en la información de control de cálculo de envolvente de tiempo, si cambiar o no el método de cálculo de la envolvente de tiempo de banda de baja frecuencia en la trama. Cuando se determina no cambiar el método de cálculo de la envolvente de tiempo de banda de baja frecuencia (NO en la etapa S71), las unidades 1fi a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima calculan las envolventes de tiempo de banda de baja frecuencia primera a n-ésima sin cambiar el método de cálculo de la envolvente de tiempo de banda de baja frecuencia (etapa S73). Por otro lado, cuando se determina cambiar el método de cálculo de la envolvente de tiempo de banda de baja frecuencia (SÍ en la etapa S71), la unidad 1n de control de cálculo de envolvente de tiempo emite la señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima y de ese modo indica el método de cálculo de la envolvente de tiempo de banda de baja frecuencia, de modo que se cambia el método de cálculo de la envolvente de tiempo de banda de baja frecuencia (etapa S72). Después de eso, las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima calculan las envolventes de tiempo de banda de baja frecuencia primera a n-ésima mediante el método de cálculo de envolvente de tiempo de banda de baja frecuencia cambiado (etapa S73). Además, la unidad 1g de cálculo de envolvente de tiempo calcula la envolvente de tiempo usando las envolventes de tiempo de banda de baja frecuencia primera a n-ésima calculadas por las unidades 1 f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima (etapa S74). Después, la unidad 1i de ajuste de envolvente de tiempo ajusta, usando la envolvente de tiempo calculada en la unidad 1g de cálculo de envolvente de tiempo, la envolvente de tiempo de la señal de banda de alta frecuencia generada en la unidad 1h de generación de banda de alta frecuencia (etapa S75).
También en el quinto ejemplo alternativo del decodificador 1 de voz descrito anteriormente, el procedimiento en las etapas S07 a S08 puede controlarse con precisión basándose en la información de control a partir del codificador, permitiendo así un ajuste altamente preciso de la envolvente de tiempo.
[Sexto ejemplo alternativo del decodificador de voz según la primera realización]
La figura 13 es un diagrama que muestra una configuración de una parte principal relacionada con el cálculo de envolvente en un sexto ejemplo alternativo del decodificador 1 de voz según la primera realización. El decodificador 1 de voz mostrado en la figura 13 incluye una unidad 1o de control de cálculo de envolvente de tiempo (medios de control de cálculo de envolvente de tiempo) además de las unidades 1 f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y la unidad 1g de cálculo de envolvente de tiempo. La unidad 1o de control de cálculo de envolvente de tiempo está configurada para realizar uno cualquiera o más de los procedimientos de cálculo de envolvente en los ejemplos alternativos primero a quinto del decodificador 1 de voz.
[Séptimo ejemplo alternativo del decodificador de voz según la primera realización]
La figura 14 es un diagrama de flujo que muestra un procedimiento de cálculo de envolvente realizado por un séptimo ejemplo alternativo del decodificador 1 de voz según la primera realización. Obsérvese que la configuración del séptimo ejemplo alternativo del decodificador 1 de voz es la misma que la del decodificador 1 de voz según la primera realización. Las etapas S261 a S262 en la figura 14 sustituyen a la etapa S08 en el diagrama de flujo de la figura 2 que muestra el procedimiento del decodificador 1 de voz según la primera realización.
En este ejemplo alternativo, la unidad 1g de cálculo de envolvente de tiempo realiza el procesamiento especificado (procesamiento de la etapa S261) usando la envolvente de tiempo de banda de baja frecuencia Ldec(k,i) {1<k<n, t(s)<i<t(s+1), 0<s<se} suministrada a partir de las unidades 1 f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y la información de envolvente de tiempo suministrada a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada y después calcula la envolvente de tiempo (procesamiento de la etapa S262). Ejemplos del procesamiento especificado y del cálculo de la envolvente de tiempo relacionado con el mismo son de la siguiente manera.
En el primer ejemplo, el coeficiente Al,k(s) en las ecuaciones 18, 21, 23 ó 24 se calcula usando la información de envolvente de tiempo suministrada en otra forma a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada. Por ejemplo, el coeficiente se calcula mediante la siguiente ecuación
[Ecuación 40]
Figure imgf000028_0001
1 < l< n H, 1 < k < n
0<s<sE
donde ak(s), k=1,2,...,Num, 0<s<se es la información de envolvente de tiempo suministrada a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada, y Flk(x1,x2,...,xNum), 1<l<nH, 1<k<n es una función especificada con un número Num de variables como argumentos. Después de eso, usando el coeficiente A l,k(s) adquirido en el método anterior, se calcula la envolvente de tiempo mediante las ecuaciones 18, 21, 23 ó 24.
En el segundo ejemplo, en primer lugar se calcula la cantidad dada por la siguiente ecuación.
[Ecuación 41]
Figure imgf000028_0002
1 < l < n H, t(s)< i <t(s 1), 0 < 5 < ^
Obsérvese que la siguiente ecuación:
[Ecuación 42]
Figure imgf000028_0003
es un coeficiente especificado.
Además, el g(0)(l,i) descrito anteriormente puede ser un coeficiente especificado, o una función especificada para el índice l, i. Por ejemplo, g(0)(l,i) puede ser una función dada por la siguiente ecuación.
[Ecuación 43]
g i0\ l , i ) = J !ú f - tis}
Figure imgf000029_0001
Después, se calcula la cantidad correspondiente al lado izquierdo de las ecuaciones 18, 21, 23 ó 24, y el resultado se representa como g(l)(l,i) {1 <l<nH, t(s)<i<t(s+1), 0<s<se }. Después, se calcula la envolvente de tiempo mediante la siguiente ecuación, por ejemplo.
[Ecuación 44]
g*c(hí) = g mQ ,í) g m (f,t)
1 < l < n H, t(s)<i<t(s 1), 0 < s < s E
Además, la envolvente de tiempo puede calcularse mediante la siguiente ecuación.
[Ecuación 45]
Figure imgf000029_0002
Además, la envolvente de tiempo puede calcularse mediante la siguiente ecuación.
[Ecuación 46]
g d e c V ’ i ) = 8 m ( h i )
1 < l< n H, t(s) < i < t(s +1), 0 < s < s £
Cuando no se suministra la información de envolvente de tiempo a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada, la envolvente de tiempo puede calcularse mediante la siguiente ecuación.
[Ecuación 47]
gdJ U ) = gm(U)
1 < l < n H, t(s) < i < t(s +1), 0 < í <5£
En este ejemplo alternativo, la forma del gdec(l,i) descrito anteriormente no está limitada al ejemplo anterior.
Obsérvese que, en la presente invención, el procesamiento especificado y el cálculo de la envolvente de tiempo relacionado con el mismo no están limitados a los ejemplos anteriores.
Este ejemplo alternativo puede aplicarse a los ejemplos alternativos primero a sexto del decodificador 1 de voz según la primera realización de la siguiente manera.
En el caso de aplicación al primer ejemplo alternativo del decodificador 1 de voz según la primera realización, la etapa S34 en la figura 6 se sustituye por las etapas S261 a S262 en la figura 14, por ejemplo. Puede prepararse por adelantado una pluralidad de clases del procesamiento especificado descrito anteriormente y cambiarse dependiendo de la potencia de la señal de banda de baja frecuencia. Además, puede seleccionarse uno cualquiera de a) calcular la envolvente de tiempo realizando únicamente el procesamiento especificado descrito anteriormente, b) calcular la envolvente de tiempo realizando el procesamiento especificado descrito anteriormente y además usando la información de envolvente de tiempo y c) calcular la envolvente de tiempo usando la información de envolvente de tiempo sin realizar el procesamiento especificado descrito anteriormente, dependiendo de la potencia de la señal de banda de baja frecuencia.
La figura 15 es un diagrama de flujo que muestra una parte del procesamiento realizado por la unidad 1m de control de cálculo de envolvente de tiempo cuando se aplica el séptimo ejemplo alternativo del decodificador 1 de voz según la primera realización al segundo ejemplo alternativo del decodificador 1 de voz según la primera realización.
En el caso de aplicación al segundo ejemplo alternativo del decodificador 1 de voz según la primera realización, la etapa S42 en la figura 8 se sustituye por la etapa 271 en la figura 15, y la etapa S47 en la figura 8 se sustituye por las etapas S261 a S262 en la figura 14, por ejemplo. Puede prepararse por adelantado una pluralidad de clases del procesamiento especificado descrito anteriormente y cambiarse dependiendo de la información de envolvente de tiempo. Además, puede seleccionarse un procedimiento cualquiera, dependiendo de la información de envolvente de tiempo, de a) calcular la envolvente de tiempo realizando únicamente el procesamiento especificado descrito anteriormente, b) calcular la envolvente de tiempo realizando el procesamiento especificado descrito anteriormente y además usando la información de envolvente de tiempo y c) calcular la envolvente de tiempo usando la información de envolvente de tiempo sin realizar el procesamiento especificado descrito anteriormente.
En el caso de aplicación al tercer ejemplo alternativo del decodificador 1 de voz según la primera realización, la etapa S53 en la figura 10 se sustituye por las etapas S261 a S262 en la figura 14. Puede prepararse por adelantado una pluralidad de clases del procesamiento especificado descrito anteriormente y cambiarse dependiendo de la información de control de cálculo de envolvente de tiempo. Además, puede seleccionarse, dependiendo de la información de control de cálculo de envolvente de tiempo, uno cualquiera de a) calcular la envolvente de tiempo realizando únicamente el procesamiento especificado descrito anteriormente, b) calcular la envolvente de tiempo realizando el procesamiento especificado descrito anteriormente y además usando la información de envolvente de tiempo y c) calcular la envolvente de tiempo usando la información de envolvente de tiempo sin realizar el procesamiento especificado descrito anteriormente.
La figura 16 es un diagrama de flujo que muestra una parte del procesamiento realizado por la unidad 1n de control de cálculo de envolvente de tiempo cuando se aplica el séptimo ejemplo alternativo del decodificador 1 de voz según la primera realización al cuarto ejemplo alternativo del decodificador 1 de voz según la primera realización.
En el caso de aplicación al cuarto ejemplo alternativo del decodificador 1 de voz según la primera realización, la etapa S61 en la figura 11 se sustituye por la etapa 281 en la figura 16, y la etapa S63 en la figura 11 se sustituye por las etapas S261 a S262 en la figura 14. En la etapa 281 en la figura 16, como método de selección de la envolvente de tiempo de componentes de banda de baja frecuencia que va a calcularse a partir de las envolventes de tiempo de banda de baja frecuencia primera a n-ésima, puede examinarse si A (0)l,k en un ejemplo del procesamiento especificado descrito anteriormente es cero o no, y la unidad 1fk de cálculo de envolvente de tiempo de señal de banda de baja frecuencia puede calcular Ldec(k,i) cuando A (0)l,k no es cero y se le indica que calcule Ldec(k,i) en la unidad 1fk de cálculo de envolvente de tiempo de señal de banda de baja frecuencia en la información de control de cálculo de envolvente de tiempo.
En el caso de aplicación al quinto ejemplo alternativo del decodificador 1 de voz según la primera realización, la etapa S74 en la figura 12 se sustituye por las etapas S261 a S262 en la figura 14. Cuando se cambia el método de cálculo de la envolvente de tiempo de componentes de banda de baja frecuencia, puede cambiarse en consecuencia el método de procesamiento descrito anteriormente.
Además, la aplicación al sexto ejemplo alternativo del decodificador 1 de voz según la primera realización se realiza según la manera de aplicación a los ejemplos alternativos primero a quinto descrita anteriormente.
Obsérvese que, aunque en la figura 14 se muestra el flujo que calcula la envolvente de tiempo tras realizar el procesamiento especificado, el procesamiento especificado puede realizarse tras calcular la envolvente de tiempo. Por ejemplo, puede realizarse un procesamiento especificado tal como suavizado en la envolvente de tiempo calculada. Además, la envolvente de tiempo puede calcularse tras realizar el procesamiento especificado, y además puede realizarse otro procesamiento especificado en esa envolvente de tiempo.
[Primer ejemplo alternativo de codificador de voz según la primera realización]
La figura 17 es un diagrama que muestra una configuración de un primer ejemplo alternativo del codificador 2 de voz según la primera realización, y la figura 18 es un diagrama de flujo que muestra un procedimiento de codificación de voz mediante el codificador 2 de voz mostrado en la figura 17.
En el codificador 2 de voz mostrado en la figura 17, se añade una unidad 2j de generación de información de control de cálculo de envolvente de tiempo (medios de generación de información de control) al codificador 2 de voz según la primera realización.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo genera información de control de cálculo de envolvente de tiempo usando al menos una de la señal X(j,i) en el dominio de banda de frecuencia recibido a partir de la unidad 2c de banco de filtro de división de banda y la información de envolvente de tiempo recibida a partir de la unidad 2f de cálculo de información de envolvente de tiempo. La información de control de cálculo de envolvente de tiempo generada puede ser cualquiera de la información de control de cálculo de envolvente de tiempo en los ejemplos alternativos tercero a séptimo del decodificador 1 de voz según la primera realización.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede calcular la potencia de señal en la banda de frecuencia correspondiente a la señal de banda de baja frecuencia de la señal X(j,i) en el dominio de frecuencia recibida a partir de la unidad 2c de banco de filtro de división de banda, por ejemplo, y generar la información de control de cálculo de envolvente de tiempo que indica si realizar o no el cálculo de envolvente de tiempo en el decodificador 1 de voz según la potencia de señal calculada.
Alternativamente, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede calcular la potencia de señal en la banda de frecuencia correspondiente a la señal de banda de alta frecuencia de la señal X(j,i) en el dominio de frecuencia y generar la información de control de cálculo de envolvente de tiempo que indica si realizar o no el cálculo de envolvente de tiempo en el decodificador 1 de voz según la potencia de señal calculada.
Además, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede calcular la potencia de señal en la banda de frecuencia correspondiente a la señal de banda de frecuencia completa (es decir la banda de frecuencia correspondiente a la señal de banda de baja frecuencia y la banda de frecuencia correspondiente a la señal de banda de alta frecuencia) de la señal X(j,i) en el dominio de frecuencia y generar la información de control de cálculo de envolvente de tiempo que indica si realizar o no el cálculo de envolvente de tiempo en el decodificador según la potencia de señal calculada.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede calcular la potencia de una parte correspondiente a las envolventes de tiempo de banda de baja frecuencia primera a n-ésima calculadas por las unidades 2e1 a 2en de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima, y generar la información de control de cálculo de envolvente de tiempo relacionada con la selección de la envolvente de tiempo de banda de baja frecuencia que va a usarse para el cálculo de envolvente de tiempo en el decodificador 1 de voz según la potencia de señal calculada.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede calcular la potencia de señal en la banda de frecuencia correspondiente a la señal de banda de baja frecuencia de la señal X(j,i) en el dominio de frecuencia y generar la información de control de cálculo de envolvente de tiempo relacionada con el método de cálculo de envolvente de tiempo de banda de baja frecuencia en el decodificador 1 de voz según la potencia de señal calculada.
En este ejemplo alternativo, la banda de frecuencia de la potencia de señal que va a calcularse no está particularmente limitada, y la información de control de cálculo de envolvente de tiempo que se genera según la potencia de señal calculada puede ser una cualquiera o más de la información de control de cálculo de envolvente de tiempo en los ejemplos alternativos tercero a séptimo del decodificador 1 de voz según la primera realización descrita anteriormente.
Además, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede detectar o medir las características de señal de la señal X(j,i) en el dominio de frecuencia, y generar la información de control de cálculo de envolvente de tiempo que indica si realizar o no el cálculo de envolvente de tiempo en el decodificador 1 de voz según las características de señal calculadas.
Alternativamente, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con la selección de la envolvente de tiempo de banda de baja frecuencia que va a usarse para el cálculo de envolvente de tiempo en el decodificador 1 de voz según las características de señal de la señal X(j,i) en el dominio de frecuencia.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con el método de cálculo de envolvente de tiempo de banda de baja frecuencia en el decodificador 1 de voz según las características de señal de la señal X(j,i) en el dominio de frecuencia.
Obsérvese que las características de señal detectadas o medidas en la unidad 2j de generación de información de control de cálculo de envolvente de tiempo pueden ser las características relacionadas con la inclinación del borde ascendente o del borde descendente de la señal. Las características de señal pueden ser las características relacionadas con la estacionalidad de la señal. Las características de señal pueden ser las características relacionadas con la intensidad de la tonalidad de la señal. Además, las características de señal pueden ser al menos una de las características anteriores.
En este ejemplo alternativo, las características de señal que van a detectarse o medirse no están particularmente limitadas, y la información de control de cálculo de envolvente de tiempo que se genera según las características de señal detectadas o medidas puede ser una cualquiera o más de la información de control de cálculo de envolvente de tiempo en los ejemplos alternativos tercero a sexto del decodificador 1 de voz según la primera realización descrita anteriormente.
Además, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo que indica si realizar o no el cálculo de envolvente de tiempo en el decodificador 1 de voz según el valor de la información de envolvente de tiempo A l,k(s) (1 <l<nH, 1<k<n,0<s<sE ) recibida a partir de la unidad 2f de cálculo de información de envolvente de tiempo, por ejemplo. La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con la selección de la envolvente de tiempo de banda de baja frecuencia que va a usarse para el cálculo de envolvente de tiempo en el decodificador 1 de voz. La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con el método de cálculo de envolvente de tiempo de banda de baja frecuencia en el decodificador 1 de voz.
En este ejemplo alternativo, la información de control de cálculo de envolvente de tiempo que se genera según la información de envolvente de tiempo puede ser una cualquiera o más de la información de control de cálculo de envolvente de tiempo en los ejemplos alternativos tercero a sexto del decodificador 1 de voz según la primera realización descrita anteriormente.
Alternativamente, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar, usando la señal X(j,i) en el dominio de frecuencia recibida a partir de la unidad 2c de banco de filtro de división de banda y la secuencia codificada de la información complementaria para la generación de banda de alta frecuencia recibida a partir de la unidad 2g de cuantificación/codificación, por ejemplo, la información de control de cálculo de envolvente de tiempo que indica si realizar o no el cálculo de envolvente de tiempo en el decodificador 1 de voz. La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con la selección de la envolvente de tiempo de banda de baja frecuencia que va a usarse para el cálculo de envolvente de tiempo en el decodificador 1 de voz. La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con el método de cálculo de envolvente de tiempo de banda de baja frecuencia en el decodificador 1 de voz.
De manera específica, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede decodificar y descuantificar la secuencia codificada de la información complementaria para la generación de banda de alta frecuencia recibida a partir de la unidad 2g de cuantificación/codificación y de ese modo obtiene información complementaria localmente decodificada para la generación de banda de alta frecuencia, y después genera una pseudoseñal de banda de alta frecuencia localmente decodificada usando la información complementaria localmente decodificada para la generación de banda de alta frecuencia y la señal X(j,i) en el dominio de frecuencia. La pseudoseñal de banda de alta frecuencia localmente decodificada puede generarse realizando el mismo procesamiento que la unidad 1h de generación de banda de alta frecuencia del decodificador 1 de voz según la primera realización. La unidad 2j de generación de información de control de cálculo de envolvente de tiempo compara la pseudoseñal de banda de alta frecuencia localmente decodificada generada con la banda de frecuencia correspondiente a la señal de banda de alta frecuencia de la señal X(j,i) en el dominio de frecuencia y genera la información de control de cálculo de envolvente de tiempo basándose en el resultado de comparación.
La comparación entre la pseudoseñal de banda de alta frecuencia localmente decodificada y la banda de frecuencia correspondiente a la señal de banda de alta frecuencia de la señal X(j,i) en el dominio de frecuencia puede realizarse calculando una señal diferencial de las dos señales y basándose en la potencia de la señal diferencial. Además, puede realizarse calculando las envolventes de tiempo de la pseudoseñal de banda de alta frecuencia localmente decodificada y la banda de frecuencia correspondiente a la señal de banda de alta frecuencia de la señal X(j,i) en el dominio de frecuencia y basándose en al menos una de una diferencia de las envolventes de tiempo y una amplitud de la diferencia.
Alternativamente, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar, usando, por ejemplo, la señal X(j,i) en el dominio de frecuencia recibida a partir de la unidad 2c de banco de filtro de división de banda, la información de envolvente de tiempo recibida a partir de la unidad 2f de cálculo de información de envolvente de tiempo, y la secuencia codificada de la información complementaria para la generación de banda de alta frecuencia recibida a partir de la unidad 2g de cuantificación/codificación, la información de control de cálculo de envolvente de tiempo que indica si realizar o no el cálculo de envolvente de tiempo en el decodificador 1 de voz. La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con la selección de la envolvente de tiempo de banda de baja frecuencia que va a usarse para el cálculo de envolvente de tiempo en el decodificador 1 de voz. La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con el método de cálculo de envolvente de tiempo de banda de baja frecuencia en el decodificador 1 de voz.
De manera específica, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar una pseudoseñal de banda de alta frecuencia localmente decodificada y ajustar la envolvente de tiempo de la pseudoseñal de banda de alta frecuencia localmente decodificada usando la información de envolvente de tiempo recibida a partir de la unidad 2f de cálculo de información de envolvente de tiempo, y después comparar la pseudoseñal de banda de alta frecuencia localmente decodificada con la envolvente de tiempo ajustada con la banda de frecuencia correspondiente a la señal de banda de alta frecuencia de la señal X(j,i) en el dominio de frecuencia y generar la información de control de cálculo de envolvente de tiempo basándose en el resultado de comparación.
La comparación entre la pseudoseñal de banda de alta frecuencia localmente decodificada con la envolvente de tiempo ajustada y la banda de frecuencia correspondiente a la señal de banda de alta frecuencia de la señal X(j,i) en el dominio de frecuencia puede realizarse de la misma manera en que se realiza la comparación entre la pseudoseñal de banda de alta frecuencia localmente decodificada y la banda de frecuencia correspondiente a la señal de banda de alta frecuencia de la señal X(j,i) en el dominio de frecuencia.
Además, en la unidad 2f de cálculo de información de envolvente de tiempo del codificador 2 de voz según la primera realización, la información de envolvente de tiempo puede calcularse usando la pseudoseñal de banda de alta frecuencia localmente decodificada. De manera específica, la secuencia codificada de la información complementaria para la generación de banda de alta frecuencia recibida a partir de la unidad 2g de cuantificación/codificación se introduce adicionalmente en la unidad 2f de cálculo de información de envolvente de tiempo, y la secuencia codificada de la información complementaria para la generación de banda de alta frecuencia se decodifica y se descuantifica para adquirir información complementaria localmente decodificada para la generación de banda de alta frecuencia, y la pseudoseñal de banda de alta frecuencia localmente decodificada se genera usando la información complementaria localmente decodificada para la generación de banda de alta frecuencia y la señal X(j,i) en el dominio de frecuencia.
Por ejemplo, la unidad 2f de cálculo de información de envolvente de tiempo puede emitir, como información de envolvente de tiempo calculada, la información de envolvente de tiempo que permite la mejor aproximación a la banda de frecuencia correspondiente a la señal de banda de alta frecuencia de la señal X(j,i) en el dominio de frecuencia cuando la envolvente de tiempo de la pseudoseñal de banda de alta frecuencia localmente decodificada se ajusta usando la envolvente de tiempo calculada a partir de la información de envolvente de tiempo. La determinación sobre si es próxima a la banda de frecuencia correspondiente a la señal de banda de alta frecuencia de la señal X(j,i) en el dominio de frecuencia puede realizarse basándose en una señal diferencial entre la pseudoseñal de banda de alta frecuencia localmente decodificada con la envolvente de tiempo ajustada y la banda de frecuencia correspondiente a la señal de banda de alta frecuencia de la señal X(j,i) en el dominio de frecuencia, o puede basarse en un error entre las envolventes de tiempo de esas señales.
Alternativamente, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo que indica si realizar o no el cálculo de envolvente de tiempo en el decodificador 1 de voz según la cantidad de información (de manera más específica, el número de bits) necesaria para la codificación de la información de envolvente de tiempo recibida a partir de la unidad 2g de cuantificación/codificación, por ejemplo. La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con la selección de la envolvente de tiempo de banda de baja frecuencia que va a usarse para el cálculo de envolvente de tiempo en el decodificador 1 de voz. La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con el método de cálculo de envolvente de tiempo de banda de baja frecuencia en el decodificador 1 de voz.
De manera específica, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo genera la información de control de cálculo de envolvente de tiempo que indica realizar el cálculo de envolvente de tiempo en el decodificador 1 de voz cuando la cantidad de información (de manera más específica, el número de bits) necesaria para la codificación de la información de envolvente de tiempo recibida a partir de la unidad 2g de cuantificación/codificación es igual o inferior a un umbral especificado, por ejemplo. Por otro lado, cuando la cantidad de información necesaria para la codificación de la información de envolvente de tiempo es superior a un umbral especificado, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo genera la información de control de cálculo de envolvente de tiempo que indica no realizar el cálculo de envolvente de tiempo en el decodificador 1 de voz.
Además, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede generar la información de control de cálculo de envolvente de tiempo relacionada con la selección de la envolvente de tiempo de banda de baja frecuencia que va a usarse para el cálculo de envolvente de tiempo en el decodificador 1 de voz de modo que la cantidad de información necesaria para la codificación de la información de envolvente de tiempo es igual o inferior a un umbral especificado. En este momento, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede notificar el resultado de comparar la cantidad de información necesaria para la codificación de la información de envolvente de tiempo con el umbral a la unidad 2f de cálculo de información de envolvente de tiempo, y la unidad 2f de cálculo de información de envolvente de tiempo puede volver a calcular la información de envolvente de tiempo según el resultado de comparación notificado. Obsérvese que, en el caso en el que vuelva a calcularse la información de envolvente de tiempo, la unidad 2g de cuantificación/codificación codifica y cuantifica la información de envolvente de tiempo que se ha vuelto a calcular. El número de veces que vuelve a calcularse la información de envolvente de tiempo no está particularmente limitado.
En este ejemplo alternativo, la información de control de cálculo de envolvente de tiempo se calcula basándose en la cantidad de información necesaria para la codificación de la información de envolvente de tiempo, y la información de control de cálculo de envolvente de tiempo que va a generarse puede ser una cualquiera o más de la información de control de cálculo de envolvente de tiempo en los ejemplos alternativos tercero a sexto del decodificador 1 de voz según la primera realización descrita anteriormente.
La información de control de cálculo de envolvente de tiempo generada por la unidad 2j de generación de información de control de cálculo de envolvente de tiempo de la manera anterior se añade adicionalmente a la secuencia codificada de banda de alta frecuencia por la unidad 2h de construcción de secuencia codificada de banda de alta frecuencia y de ese modo se construye la secuencia codificada de banda de alta frecuencia.
[Segundo ejemplo alternativo del codificador de voz según la primera realización]
La figura 19 es un diagrama que muestra una configuración de un segundo ejemplo alternativo del codificador 2 de voz según la primera realización, y la figura 20 es un diagrama de flujo que muestra un procedimiento de codificación de voz mediante el codificador 2 de voz mostrado en la figura 19.
En el codificador 2 de voz mostrado en la figura 19, se añade una unidad 2k de decodificación de banda de baja frecuencia al codificador 2 de voz según la primera realización.
La unidad 2k de decodificación de banda de baja frecuencia recibe la secuencia codificada de banda de baja frecuencia a partir de la unidad 2b de codificación de banda de baja frecuencia, decodifica y descuantifica la secuencia codificada de banda de baja frecuencia y de ese modo adquiere una señal de banda de baja frecuencia localmente decodificada. Obsérvese que, cuando puede adquirirse la señal de banda de baja frecuencia cuantificada a partir de la unidad 2b de codificación de banda de baja frecuencia, la unidad 2k de decodificación de banda de baja frecuencia puede descuantificar la señal de banda de baja frecuencia cuantificada y adquirir la señal de banda de baja frecuencia localmente decodificada. Después, las unidades 2e1 a 2en de cálculo de envolvente de tiempo de banda de baja frecuencia calculan las envolventes de tiempo de banda de baja frecuencia primera a n-ésima usando la señal de banda de baja frecuencia localmente decodificada adquirida por la unidad 2k de decodificación de banda de baja frecuencia.
Obsérvese que el segundo ejemplo alternativo del codificador 2 de voz según la primera realización también puede aplicarse al primer ejemplo alternativo del codificador 2 de voz según la primera realización.
[Tercer ejemplo alternativo del codificador de voz según la primera realización]
La figura 21 es un diagrama que muestra una configuración de un tercer ejemplo alternativo del codificador 2 de voz según la primera realización, y la figura 22 es un diagrama de flujo que muestra un procedimiento de codificación de voz mediante el codificador 2 de voz mostrado en la figura 21.
El codificador 2 de voz mostrado en la figura 21 es diferente del codificador 2 de voz según la primera realización en que incluye una unidad 2m de banco de filtro de síntesis de banda en lugar de la unidad 2a de submuestreo.
La unidad 2m de banco de filtro de síntesis de banda recibe la señal X(j,i) en el dominio de frecuencia a partir de la unidad 2c de banco de filtro de división de banda, realiza la síntesis de banda para la banda de frecuencia correspondiente a la señal de banda de baja frecuencia y de ese modo adquiere una señal submuestreada. La adquisición de la señal submuestreada mediante síntesis de banda puede realizarse según el método de banco de filtro de síntesis submuestreado en SBR de “MPEG4 AAC” especificado en la norma “ISO/IEC 14496-3”, por ejemplo (“ISO/IEC 14496-3 subparte 4 Codificación de audio general”).
Obsérvese que el tercer ejemplo alternativo del codificador 2 de voz según la primera realización también puede aplicarse a los ejemplos alternativos primero y segundo del codificador 2 de voz según la primera realización.
En un cuarto ejemplo alternativo del codificador 2 de voz según la primera realización, se realiza el procesamiento especificado correspondiente al séptimo ejemplo alternativo del decodificador 1 de voz según la primera realización descrita anteriormente cuando se calcula g(l,i) en la unidad 2f de cálculo de información de envolvente de tiempo del codificador 2 de voz según la primera realización. Obsérvese que, tal como se describió en el séptimo ejemplo alternativo del decodificador 1 de voz según la primera realización, g(l,i) puede calcularse usando la envolvente de tiempo de banda de baja frecuencia tras realizar el procesamiento especificado, o g(l,i) puede calcularse realizando el procesamiento especificado tras calcular g(l,i) usando la envolvente de tiempo de banda de baja frecuencia.
Obsérvese que el cuarto ejemplo alternativo del codificador 2 de voz según la primera realización también puede aplicarse a los ejemplos alternativos primero a tercero del codificador 2 de voz según la primera realización.
En el caso de aplicar el cuarto ejemplo alternativo del codificador 2 de voz según la primera realización al primer ejemplo alternativo del codificador 2 de voz según la primera realización, información sobre si realizar o no el procesamiento especificado descrito anteriormente en el decodificador 1 de voz según la primera realización puede estar contenida en la información de control de cálculo de envolvente de tiempo basándose en un error de g(l,i) con respecto a H(l,i) descrito anteriormente.
[Segunda realización, que es un ejemplo informativo]
A continuación en el presente documento se describe una segunda realización que sirve como ejemplo informativo que no forma parte de la presente invención, pero es útil para entender la presente invención.
La figura 23 es un diagrama que muestra una configuración del decodificador 101 de voz según la segunda realización, y la figura 24 es un diagrama de flujo que muestra un procedimiento de decodificación de voz mediante el decodificador 101 de voz mostrado en la figura 23. El decodificador 101 de voz de la figura 23 es diferente del decodificador 1 de voz según la primera realización en que incluye además una unidad 1q de superposición de envolvente de frecuencia (medios de superposición de envolvente de frecuencia) y que incluye una unidad 1p de ajuste de envolvente de tiempofrecuencia (medios de ajuste de envolvente de tiempo-frecuencia) en lugar de la unidad 1i de ajuste de envolvente de tiempo (de 1c a 1e, 1h, 1j y 1p también se denominan algunas veces unidad de extensión de ancho de banda (medios de extensión de ancho de banda)).
La unidad 1d de análisis de secuencia codificada analiza la secuencia codificada de banda de alta frecuencia suministrada a partir de la unidad 1a de demultiplexación y de ese modo adquiere información complementaria codificada para la generación de banda de alta frecuencia e información de envolvente de tiempo-frecuencia cuantificada.
La unidad 1e de decodificación/descuantificación de secuencia codificada decodifica la información complementaria codificada para la generación de banda de alta frecuencia suministrada a partir de la unidad 1d de análisis de secuencia codificada y de ese modo obtiene información complementaria para la generación de banda de alta frecuencia, y descuantifica la información de envolvente de tiempo-frecuencia cuantificada suministrada a partir de la unidad 1d de análisis de secuencia codificada y de ese modo adquiere información de envolvente de tiempofrecuencia.
La unidad 1q de superposición de envolvente de frecuencia recibe una envolvente de tiempo Et (I,í) a partir de la unidad 1g de cálculo de envolvente de tiempo e información de envolvente de frecuencia a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada. Después, la unidad 1q de superposición de envolvente de frecuencia calcula una envolvente de frecuencia a partir de la información de envolvente de frecuencia y superpone la envolvente de frecuencia sobre la envolvente de tiempo. Específicamente, la unidad 1q de superposición de envolvente de frecuencia realiza este procesamiento en el siguiente procedimiento, por ejemplo.
En primer lugar, la unidad 1q de superposición de envolvente de frecuencia transforma la envolvente de tiempo mediante la siguiente ecuación.
[Ecuación 48]
Figure imgf000036_0001
A continuación, la unidad 1q de superposición de envolvente de frecuencia divide la banda de alta frecuencia en un número itih(itihSI) de subbandas. Las subbandas se representan como B(F)k (k=1,2,3,..., itih). Además, para simplificación de la descripción, cualquier matriz Gh que tiene un número itih+1 de índices que representan el límite de la subbanda B(F)k (1<k<mH) como factores se define de modo que la señal XhQJ), GH(k)<j<GH(k+1), t(s)<i<t(s+1), 0<s<se corresponde a la componente de la subbanda B(FV. Obsérvese que GH(1)=kx, Gh(itih+1)= kmáx 1.
Después, la unidad 1q de superposición de envolvente de frecuencia calcula la envolvente de frecuencia mediante la siguiente ecuación.
[Ecuación 49]
Figure imgf000036_0002
donde sfdec(k,s) (donde 1<k<mH, 0<s<se) es un factor de ajuste a escala correspondiente a la subbanda B(F)k.
Obsérvese que la envolvente de frecuencia puede calcularse mediante la siguiente ecuación.
[Ecuación 50]
Figure imgf000036_0003
0<s <s.
En esta realización, la forma de EF,dec(k,s) no está limitada al ejemplo anterior.
La unidad 1q de superposición de envolvente de frecuencia calcula sfdec(k,s) de la siguiente manera. En primer lugar, se establecen los valores de sfdec(k,s) correspondientes a varias subbandas como números constantes que no dependen del tiempo tal como se representa mediante la siguiente ecuación (a continuación en el presente documento, un conjunto de índices k correspondientes a esas subbandas se indica como Nc).
[Ecuación 51]
Figure imgf000037_0001
Aunque el valor de C puede ser C=0, en esta realización no se especifica el valor de C. Después, cuando el número entero 1 no está incluido en el conjunto Nc , la unidad 1q de superposición de envolvente de frecuencia adquiere el factor de ajuste a escala sfdec(1,s), 0<s<s a partir de la información de envolvente de frecuencia.
Después de eso, la unidad 1q de superposición de envolvente de frecuencia repite el procesamiento de la siguiente (etapa k) desde k=2 hasta k=mH y calcula el factor de ajuste a escala descrito anteriormente.
(Etapa k)
Cuando el número entero k no está incluido en el conjunto Nc, se adquiere una diferencia de factor de ajuste a escala dsfdec(k,s), 0<s<s a partir de la información de envolvente de frecuencia, se calcula el factor de ajuste a escala mediante la siguiente ecuación:
[Ecuación 52]
Sf d e Á k ’ S ) = Sf d e c ( k - b s ) + dsfdJ k , s )
0 <s<sE
y se añade 1 al número entero k y después el procedimiento avanza a la siguiente (etapa k). Por otro lado, cuando el número entero k está incluido en el conjunto Nc, se añade 1 al número entero k tal cual y después el procedimiento avanza a la siguiente (etapa k).
Además, en el caso de recibir una diferencia de factor de ajuste a escala sfdec(1,s), 0<s<se a partir de la información de envolvente de frecuencia, el procesamiento en la etapa k anterior puede realizarse calculando sfdec(0 ,s), 0<s<se usando la componente de banda de baja frecuencia de la señal en el dominio de frecuencia recibida a partir de la unidad 1c de banco de filtro de división de banda. Por ejemplo, en las ecuaciones 63, 64 y 65 descritas más adelante, puede sustituirse X(j,i) por Xdec(j,i), y calcularse sf(0 ,s) usando un kl y kh especificados que satisfacen 0<kl<kh<kx donde k=0 puede establecerse como sfdec(0 ,s).
En este ejemplo, a diferencia del ejemplo descrito anteriormente, la información de envolvente de frecuencia puede corresponder al propio factor de ajuste a escala sfdec(k,s). Además, la información de envolvente de frecuencia puede ser una diferencia dtsf(s,k), 1<s<se, 1<k<mH en la dirección de tiempo cuando se calcula el factor de ajuste a escala sfdec(k,s), 1<k<mH en la s-ésima (s>1) trama mediante la siguiente ecuación usando el factor de ajuste a escala sfdec(k,s-1) en la (s-1)-ésima trama.
[Ecuación 53]
Figure imgf000037_0002
Sin embargo, en este caso, sfdec(k,0), 1<k<mH correspondiente al valor inicial se adquiere usando otra manera tal como el método descrito anteriormente.
Además, el factor de ajuste a escala de la subbanda puede calcularse usando interpolación o extrapolación a partir de al menos uno del factor de ajuste a escala de la componente de banda de baja frecuencia y el factor de ajuste a escala de la subbanda de la banda de alta frecuencia. En este caso, la información de envolvente de frecuencia es el factor de ajuste a escala de la subbanda que va a usarse para la interpolación o extrapolación y un parámetro de interpolación o extrapolación dentro de la banda de alta frecuencia. Para el cálculo del factor de ajuste a escala de la componente de banda de baja frecuencia, se usa la componente de banda de baja frecuencia de la señal en el dominio de frecuencia recibida a partir de la unidad 1c de banco de filtro de división de banda.
El parámetro de interpolación o extrapolación puede ser un parámetro especificado. Además, la interpolación o extrapolación del factor de ajuste a escala puede realizarse calculando un parámetro que va a usarse realmente para la interpolación o extrapolación a partir del parámetro de interpolación o extrapolación especificado y el parámetro de interpolación o extrapolación contenido en la información de envolvente de frecuencia. Además, en al menos uno de los casos en los que no se recibe la información de envolvente de frecuencia y en los que la información de envolvente de frecuencia no contiene el parámetro de interpolación o extrapolación, la interpolación o extrapolación del factor de ajuste a escala puede realizarse usando únicamente el parámetro de interpolación o extrapolación especificado. Obsérvese que, en esta realización, un método de interpolación y extrapolación no está particularmente limitado.
La forma de la información de envolvente de frecuencia descrita anteriormente es tan sólo un ejemplo, y puede ser cualquier forma siempre que sea un parámetro que represente la variación de la potencia de señal o la amplitud de señal en la dirección de frecuencia para cada subbanda de la banda de alta frecuencia. En esta realización, la forma de la información de envolvente de frecuencia no está particularmente limitada.
Después, la unidad 1q de superposición de envolvente de frecuencia transforma el EF(k,s) descrito anteriormente usando la siguiente ecuación.
[Ecuación 54]
Figure imgf000038_0001
Después, la unidad 1q de superposición de envolvente de frecuencia calcula la cantidad E2(m,i) mediante la siguiente ecuación usando la envolvente de tiempo Eü(m,i) y la envolvente de frecuencia E-i(m,i) transformadas como anteriormente.
[Ecuación 55]
E2(m , i )=El (m,s)-E0(m9i)
Figure imgf000038_0002
t{s) < i < t(s +1), 0 < s < s.
Además, el E2(m,i) descrito anteriormente puede estar en la forma dada por la siguiente ecuación.
[Ecuación 56]
' I v r max ~ J r
Figure imgf000039_0001
t(s) < i < t(s +1), O < s < sE
Además, puede estar en la forma dada por la siguiente ecuación
[Ecuación 57]
Figure imgf000039_0002
0 <m<k —k ,
t ( s )< i< t ( s 1), 0 < 5 < s,
donde Q(m), 0<m<kmáx-kx es un número entero que satisface la siguiente ecuación. [Ecuación 58]
Fh (Q(m)) - k x <m< FH(Q(m) 1 )~kx
Figure imgf000039_0003
Además, puede estar en la forma dada por la siguiente ecuación.
[Ecuación 59]
Figure imgf000040_0001
Obsérvese que, sin embargo, la forma del E2(m,i) descrito anteriormente no está limitada a los ejemplos anteriores. Después, la unidad 1q de superposición de envolvente de frecuencia calcula la cantidad E(m,i) mediante la siguiente ecuación usando el E2(m,i) descrito anteriormente.
[Ecuación 60]
Figure imgf000040_0002
í(s) < i < t(s + 1), 0 < s < s E
El coeficiente C(s) viene dado por la siguiente ecuación.
[Ecuación 61]
Figure imgf000040_0003
Además, puede ser la siguiente ecuación.
[Ecuación 62]
Figure imgf000041_0001
La unidad 1p de ajuste de envolvente de tiempo-frecuencia ajusta, usando la envolvente de tiempo-frecuencia E1(m,i) suministrada a partir de la unidad 1q de superposición de envolvente de frecuencia, la envolvente de tiempo-frecuencia de la señal de banda de alta frecuencia XhQ,í), kx<j<kmáx suministrada a partir de la unidad 1h de generación de banda de alta frecuencia.
Debe observarse que los ejemplos alternativos primero a sexto del decodificador 1 de voz según la primera realización de la invención pueden aplicarse al decodificador 101 de voz según la segunda realización de la invención.
La figura 25 es un diagrama que muestra una configuración de un codificador 102 de voz según la segunda realización que sirve como ejemplo informativo que no forma parte de la presente invención, pero es útil para entender la presente invención, y la figura 26 es un diagrama de flujo que muestra un procedimiento de codificación de voz mediante el codificador 102 de voz mostrado en la figura 25. El codificador 102 de voz de la figura 25 es diferente del codificador 2 de voz según la primera realización en que incluye además una unidad 2n de cálculo de información de envolvente de frecuencia.
La unidad 2n de cálculo de información de envolvente de frecuencia recibe la señal de banda de alta frecuencia X(j,i) {0<j<N, 0<¡<t(sE )} a partir de la unidad 2c de banco de filtro de división de banda y calcula la información de envolvente de frecuencia. Específicamente, el cálculo de la información de envolvente de frecuencia se realiza de la siguiente manera.
En primer lugar, la unidad 2n de cálculo de información de envolvente de frecuencia calcula la envolvente de frecuencia de la potencia en la subbanda B(F)k (donde k=1,2,3,...,mH) mediante la siguiente ecuación.
[Ecuación 63]
Figure imgf000041_0002
A continuación, la unidad 2n de cálculo de información de envolvente de frecuencia calcula el factor de ajuste a escala sf(k,s), 1<k<mH de la subbanda B(F)k. El valor de sf(k,s) se calcula mediante la siguiente ecuación, por ejemplo. [Ecuación 64]
sf(k,s) = 10 log10 EF (k,s ),
Figure imgf000042_0001
Además, la unidad 2n de cálculo de información de envolvente de frecuencia puede calcular el valor de sf(k,s) mediante la siguiente ecuación según el método descrito en la norma “ ISO/IEC 14496-34.B.18”.
[Ecuación 65]
Figure imgf000042_0002
Además, puede establecerse mediante la siguiente ecuación
[Ecuación 66]
s f(k ,s ) = C, \/k e N c, 0 < s < s ' E
según el decodificador 101 de voz.
Después, la unidad 2n de cálculo de información de envolvente de frecuencia puede establecer la información de envolvente de frecuencia como el factor de ajuste a escala sf(k, s) (1<k<mH) descrito anteriormente. Además, la información de envolvente de frecuencia puede estar en forma de la siguiente ecuación. Específicamente, una diferencia del factor de ajuste a escala sf(k, s) descrito anteriormente se define mediante la siguiente ecuación [Ecuación 67]
dsf (k, s) = sf (k, 5 ) sf (k 1, s),
0 < s < s E, 2 < k < mH
y dsf(k,s) y sf(1,s)(0<s<sE ) pueden usarse como información de envolvente de frecuencia.
Además, al igual que la unidad 1q de superposición de envolvente de frecuencia del decodificador 101 de voz según la segunda realización, el factor de ajuste a escala sf(0,s) descrito anteriormente puede calcularse usando la señal de banda de baja frecuencia X(j,i)(0<j<kx) en el dominio de frecuencia, y dsf(1,s) calculado mediante el factor de ajuste a escala sf(0,s) puede estar contenido en la información de envolvente de frecuencia.
Además, la información de envolvente de frecuencia puede ser un parámetro de extrapolación a partir de la banda de baja frecuencia cuando el factor de ajuste a escala de la banda de alta frecuencia se aproxima mediante extrapolación a partir del factor de ajuste a escala de la componente de banda de baja frecuencia. Además, la información de envolvente de frecuencia puede ser el factor de ajuste a escala de la subbanda y el parámetro de interpolación o extrapolación dentro de la banda de alta frecuencia cuando se calcula una parte diferente de varias subbandas a partir de los factores de ajuste a escala de esas varias subbandas de la banda de alta frecuencia usando interpolación o extrapolación. Una combinación de las formas primera y última puede ser la información de envolvente de frecuencia.
Obsérvese que, en esta invención, la información de envolvente de frecuencia no está limitada a los ejemplos descritos anteriormente.
Como método de cuantificación y codificación de la información de envolvente de frecuencia, la información de envolvente de frecuencia puede cuantificarse de manera escalar y después codificarse por entropía tal como codificación de Huffman y codificación aritmética. Además, la información de envolvente de frecuencia puede cuantificarse de manera vectorial usando un libro de códigos especificado y después puede establecerse su índice como un código.
Específicamente, el factor de ajuste a escala sf(k,s) descrito anteriormente puede cuantificarse de manera escalar y después codificarse por entropía tal como codificación de Huffman y codificación aritmética. Además, el dsf(k,s) descrito anteriormente puede cuantificarse de manera escalar y después codificarse por entropía. Además, el factor de ajuste a escala sf(k,s) descrito anteriormente puede cuantificarse de manera vectorial usando un libro de códigos especificado y después establecerse su índice como un código. Además, el dsf(k,s) descrito anteriormente puede cuantificarse de manera vectorial usando un libro de códigos especificado y después establecerse su índice como un código. Además, puede codificarse por entropía una diferencia del factor de ajuste a escala sf(k,s) cuantificado de manera escalar.
Por ejemplo, EDelta(k,s) puede calcularse mediante la siguiente ecuación
[Ecuación 68]
Figure imgf000043_0001
E D e lta (K s ) = E q ( k , s ) - E Q ( k - 1, s ) 9
2 < k < m H ,
Figure imgf000043_0002
usando sf(k,s) en la ecuación descrita anteriormente según el método descrito en la norma “ISO/IEC 14496-34.B.18”, y EDelta(k,s) puede someterse a codificación de Huffman.
Obsérvese que, cuando el número entero 1 está incluido en un conjunto Nc, pueden omitirse la cuantificación y codificación anteriormente descritas de sf(1,s) (0<s<se ) y dsf(1,s) (0<s<se ).
Además, en la presente invención, la cuantificación y codificación de la información de envolvente de frecuencia no están limitadas a los ejemplos descritos anteriormente.
Los ejemplos alternativos primero a cuarto del codificador 2 de voz según la primera realización de la invención pueden aplicarse al codificador 102 de voz según la segunda realización. Por ejemplo, la figura 27 es un diagrama que muestra una configuración cuando se aplica el primer ejemplo alternativo del codificador 2 de voz según la primera realización de la invención al codificador l 02 de voz según la segunda realización, la figura 28 es un diagrama de flujo que muestra un procedimiento de codificación de voz mediante el codificador 102 de voz mostrado en la figura 27. Además, la figura 29 es un diagrama que muestra una configuración cuando se aplica el segundo ejemplo alternativo del codificador 2 de voz según la primera realización de la invención al codificador 102 de voz según la segunda realización, y la figura 30 es un diagrama de flujo que muestra un procedimiento de codificación de voz mediante el codificador 1O2 de voz mostrado en la figura 29.
[Tercera realización que es un ejemplo informativo]
A continuación en el presente documento se describe una tercera realización que sirve como ejemplo informativo que no forma parte de la presente invención, pero es útil para entender la presente invención.
La figura 31 es un diagrama que muestra una configuración de un decodificador 201 de voz según la tercera realización, y la figura 32 es un diagrama de flujo que muestra un procedimiento de decodificación de voz mediante el decodificador 201 de voz mostrado en la figura 31. El decodificador 201 de voz de la figura 31 es diferente del decodificador 1 de voz según la primera realización en que incluye además una unidad 1s de control de cálculo de envolvente de tiempo y que incluye una unidad 1r de decodificación/descuantificación de secuencia codificada y una unidad 1t de ajuste de envolvente en lugar de la unidad 1e de decodificación/descuantificación de secuencia codificada y la unidad 1i de ajuste de envolvente de tiempo (de 1c a 1d, 1h, 1j, y de 1r a 1t también se denominan algunas veces unidad de extensión de ancho de banda (medios de extensión de ancho de banda)).
La unidad 1d de análisis de secuencia codificada analiza la secuencia codificada de banda de alta frecuencia suministrada a partir de la unidad 1a de demultiplexación y de ese modo obtiene información complementaria codificada para la generación de banda de alta frecuencia e información de control de cálculo de envolvente de tiempo y además obtiene información de envolvente de tiempo codificada o segunda información de envolvente de frecuencia codificada.
La unidad 1r de decodificación/descuantificación de secuencia codificada decodifica la información complementaria codificada para la generación de banda de alta frecuencia suministrada a partir de la unidad 1d de análisis de secuencia codificada y de ese modo obtiene información complementaria para la generación de banda de alta frecuencia.
La unidad 1h de generación de banda de alta frecuencia replica, usando la información complementaria para la generación de banda de alta frecuencia suministrada a partir de la unidad 1r de decodificación/descuantificación de secuencia codificada, la señal de banda de baja frecuencia Xdec(j,i), 0<j<kx suministrada a partir de la unidad 1c de banco de filtro de división de banda en la banda de alta frecuencia y de ese modo genera una señal de banda de alta frecuencia Xdec(j,i), kx<j<kmáx.
La unidad 1s de control de cálculo de envolvente de tiempo comprueba, basándose en la información de control de cálculo de envolvente de tiempo suministrada a partir de la unidad 1d de análisis de secuencia codificada, si la unidad 1t de ajuste de envolvente debe ajustar la envolvente de la señal de banda de alta frecuencia usando la segunda información de envolvente de frecuencia. Cuando la unidad 1t de ajuste de envolvente no ajusta la envolvente de la señal de banda de alta frecuencia usando la segunda información de envolvente de frecuencia, la unidad 1r de decodificación/descuantificación de secuencia codificada decodifica y descuantifica la información de envolvente de tiempo codificada suministrada a partir de la unidad 1d de análisis de secuencia codificada y de ese modo obtiene la información de envolvente de tiempo. Por otro lado, cuando la unidad 1t de ajuste de envolvente ajusta la envolvente de la señal de banda de alta frecuencia usando la segunda información de envolvente de frecuencia, la unidad 1s de control de cálculo de envolvente de tiempo emite una señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a las unidades f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y emite una señal de control de cálculo de envolvente de tiempo a la unidad 1g de cálculo de envolvente de tiempo de modo que no se realiza el cálculo de envolvente en las unidades 1f a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia y la unidad 1g de cálculo de envolvente de tiempo.
Además, la unidad 1r de decodificación/descuantificación de secuencia codificada decodifica y descuantifica la segunda información de envolvente de frecuencia codificada suministrada a partir de la unidad 1d de análisis de secuencia codificada y de ese modo obtiene la segunda información de envolvente de frecuencia. Además, en este caso, la unidad 1t de ajuste de envolvente ajusta, usando la segunda información de envolvente de frecuencia suministrada a partir de la unidad 1r de decodificación/descuantificación de secuencia codificada, la envolvente de frecuencia de la señal de banda de alta frecuencia XhQ,í) (kx<j<kmáx) suministrada a partir de la unidad 1h de generación de banda de alta frecuencia.
Específicamente, se calcula la cantidad E3(k,s), 1<k<mH, 0<s<se correspondiente a EF,dec(k,s) usando la segunda información de envolvente de frecuencia decodificada y descuantificada según el método de cálculo de EF,dec(k,s) en la unidad 1q de superposición de envolvente de frecuencia del decodificador 101 de voz, y además se transforma el E3(k,s) descrito anteriormente mediante la siguiente ecuación.
[Ecuación 69]
Figure imgf000045_0001
Después de eso, se adquiere la señal de banda de alta frecuencia Y(i,j) {kx<j<kmáx, t(s)<i<t(s+1), 0<s<se} cuya envolvente se ajusta según el procedimiento en la unidad 1p de ajuste de envolvente de tiempo-frecuencia del decodificador 101 de voz.
Obsérvese que los ejemplos alternativos primero a séptimo del decodificador 1 de voz según la primera realización de la invención pueden aplicarse al decodificador 201 de voz según la tercera realización.
La figura 35 es un diagrama que muestra una configuración de un codificador 202 de voz según la tercera realización, y la figura 36 es un diagrama de flujo que muestra un procedimiento de codificación de voz mediante el codificador 202 de voz mostrado en la figura 35. El codificador 202 de voz de la figura 35 es diferente del codificador 2 de voz según la primera realización en que incluye además una unidad 2j de generación de información de control de cálculo de envolvente de tiempo y una unidad 2o de cálculo de segunda información de envolvente de frecuencia.
La unidad 2o de cálculo de segunda información de envolvente de frecuencia recibe la señal de banda de alta frecuencia X(j,i) {kx<j<N, t(s)<i<t(s+1), 0<s<se} a partir de la unidad 2c de banco de filtro de división de banda y calcula la segunda información de envolvente de frecuencia (procesamiento en la etapa S207).
La segunda información de envolvente de frecuencia puede calcularse de la misma manera que el método de cálculo de la información de envolvente de frecuencia en el codificador 102 de voz según la segunda realización. Sin embargo, en esta realización, el método de cálculo de la segunda información de envolvente de frecuencia no está particularmente limitado.
La unidad 2g de cuantificación/codificación cuantifica y codifica la información de envolvente de tiempo y la segunda información de envolvente de frecuencia. La cuantificación y codificación de la información de envolvente de tiempo pueden realizarse de la misma manera que la cuantificación y codificación en la unidad 2g de cuantificación/codificación del codificador de voz según las realizaciones primera y segunda. La cuantificación y codificación de la segunda información de envolvente de frecuencia pueden realizarse de la misma manera que la cuantificación y codificación de la información de envolvente de frecuencia en la unidad 2g de cuantificación/codificación del codificador de voz según la segunda realización. Sin embargo, en esta realización, el método de cuantificación y codificación de la información de envolvente de tiempo y la segunda información de envolvente de frecuencia no está particularmente limitado.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo genera información de control de cálculo de envolvente de tiempo usando al menos una de la señal X(j,i) en el dominio de frecuencia recibida a partir de la unidad 2c de banco de filtro de división de banda, la información de envolvente de tiempo recibida a partir de la unidad 2 f de cálculo de información de envolvente de tiempo, y la segunda información de envolvente de frecuencia recibida a partir de la unidad 2o de cálculo de segunda información de envolvente de frecuencia (procesamiento en la etapa S209). La información de control de cálculo de envolvente de tiempo generada puede ser la información de control de cálculo de envolvente de tiempo en el decodificador 201 de voz según la tercera realización descrita anteriormente.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede ser la misma que la del primer ejemplo alternativo del codificador 2 de voz según la primera realización, por ejemplo.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo genera las pseudoseñales de banda de alta frecuencia localmente decodificadas usando la información de envolvente de tiempo y la segunda información de envolvente de frecuencia, respectivamente, y las compara con la señal original de la misma manera que en el primer ejemplo alternativo del codificador 2 de voz según la primera realización, por ejemplo. Cuando la pseudoseñal de banda de alta frecuencia localmente decodificada generada usando la segunda información de envolvente de frecuencia es más próxima a la señal original, se genera información que indica el ajuste de la señal de banda de alta frecuencia usando la segunda información de envolvente de frecuencia en el decodificador como información de control de cálculo de envolvente de tiempo. La comparación entre cada una de las pseudoseñales de banda de alta frecuencia localmente decodificadas con la señal original puede realizarse calculando una señal diferencial y determinando si la señal diferencial es pequeña o no, por ejemplo. Además, la comparación puede realizarse calculando las envolventes de tiempo de cada una de las pseudoseñales de banda de alta frecuencia localmente decodificadas y la señal original, calculando una diferencia de las envolventes de tiempo de cada una de las pseudoseñales de banda de alta frecuencia localmente decodificadas y la señal original, y determinando si la diferencia es pequeña o no. Además, la comparación puede realizarse determinando si el valor máximo de la señal diferencial a partir de la señal original y/o la diferencia en la envolvente es pequeño o no. En esta realización, el método de comparación no está limitado a los ejemplos anteriores.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede usar además al menos una de la información de envolvente de tiempo cuantificada y la segunda información de envolvente de frecuencia cuantificada cuando se genera la información de control de cálculo de envolvente de tiempo.
Cuando la información complementaria codificada para la generación de banda de alta frecuencia recibida a partir de la unidad 2g de cuantificación/codificación y la información de control de cálculo de envolvente de tiempo indican que se ajuste la señal de banda de alta frecuencia usando la segunda información de envolvente de frecuencia en el decodificador, la unidad 2h de construcción de secuencia codificada construye la secuencia codificada de banda de alta frecuencia usando la segunda información de envolvente de frecuencia codificada y de lo contrario la construye usando la información de envolvente de tiempo codificada de otro modo (procesamiento en la etapa S211).
Obsérvese que los ejemplos alternativos primero a cuarto del codificador 2 de voz según la primera realización de la invención pueden aplicarse al codificador 202 de voz según la tercera realización.
[Cuarta realización que es un ejemplo informativo]
A continuación en el presente documento se describe una cuarta realización que sirve como ejemplo informativo que no forma parte de la presente invención, pero es útil para entender la presente invención.
La figura 33 es un diagrama que muestra una configuración de un decodificador 301 de voz según la cuarta realización, y la figura 34 es un diagrama de flujo que muestra un procedimiento de decodificación de voz mediante el decodificador 301 de voz mostrado en la figura 33. El decodificador 201 de voz de la figura 33 es diferente del decodificador 1 de voz según la primera realización en que incluye además una unidad 1s de control de cálculo de envolvente de tiempo y una unidad 1u de superposición de envolvente de frecuencia y que incluye una unidad 1r de decodificación/descuantificación de secuencia codificada y una unidad 1v de ajuste de envolvente de tiempofrecuencia en lugar de la unidad 1e de decodificación/descuantificación de secuencia codificada y la unidad 1i de ajuste de envolvente de tiempo, respectivamente (de 1c a 1d, 1h, 1j, de 1r a 1s, y de 1u a 1v también se denominan algunas veces unidad de extensión de ancho de banda (medios de extensión de ancho de banda)).
La unidad 1d de análisis de secuencia codificada analiza la secuencia codificada de banda de alta frecuencia suministrada a partir de la unidad 1a de demultiplexación y de ese modo obtiene información complementaria codificada para la generación de banda de alta frecuencia e información de control de cálculo de envolvente de tiempo y además obtiene información de envolvente de tiempo codificada e información de envolvente de frecuencia codificada o segunda información de envolvente de frecuencia codificada.
La unidad 1s de control de cálculo de envolvente de tiempo comprueba, basándose en la información de control de cálculo de envolvente de tiempo suministrada a partir de la unidad 1d de análisis de secuencia codificada, si la unidad 1v de ajuste de envolvente debe ajustar la envolvente de la señal de banda de alta frecuencia usando la segunda información de envolvente de frecuencia y, cuando la unidad 1v de ajuste de envolvente no ajusta la envolvente de la señal de banda de alta frecuencia usando la segunda información de envolvente de frecuencia, la unidad 1r de decodificación/descuantificación de secuencia codificada decodifica y descuantifica la información de envolvente de tiempo codificada suministrada a partir de la unidad 1d de análisis de secuencia codificada y de ese modo obtiene la información de envolvente de tiempo.
Por otro lado, cuando la unidad 1v de ajuste de envolvente ajusta la envolvente de la señal de banda de alta frecuencia usando la segunda información de envolvente de frecuencia, se realiza el mismo procesamiento que en la etapa S190 de la tercera realización. Además, el procesamiento de la unidad 1v de ajuste de envolvente de tiempo-frecuencia también es el mismo que en la etapa S191 de la tercera realización.
Debe observarse que los ejemplos alternativos primero a séptimo del decodificador 1 de voz según la primera realización de la invención pueden aplicarse al decodificador 301 de voz según la cuarta realización.
La figura 37 es un diagrama que muestra una configuración de un codificador 302 de voz según la cuarta realización, y la figura 38 es un diagrama de flujo que muestra un procedimiento de codificación de voz mediante el codificador 302 de voz mostrado en la figura 37. El codificador 302 de voz de la figura 37 es diferente del codificador 2 de voz según la primera realización en que incluye además una unidad 2j de generación de información de control de cálculo de envolvente de tiempo, una unidad 2p de cálculo de información de envolvente de frecuencia y una unidad 2o de cálculo de segunda información de envolvente de frecuencia.
La unidad 2g de cuantificación/codificación cuantifica y codifica la información de envolvente de tiempo, la información de envolvente de frecuencia y la segunda información de envolvente de frecuencia. La cuantificación y codificación de la información de envolvente de tiempo pueden realizarse de la misma manera que la cuantificación y codificación en la unidad 2g de cuantificación/codificación del codificador de voz según las realizaciones primera y segunda. La cuantificación y codificación de la información de envolvente de frecuencia y la segunda información de envolvente de frecuencia pueden realizarse de la misma manera que la cuantificación y codificación de la información de envolvente de frecuencia en la unidad 2g de cuantificación/codificación del codificador de voz según la segunda realización. Sin embargo, en esta realización, el método de cuantificación y codificación de la información de envolvente de tiempo y la segunda información de envolvente de frecuencia no está particularmente limitado.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo genera información de control de cálculo de envolvente de tiempo usando al menos una de la señal X(j,i) en el dominio de frecuencia recibida a partir de la unidad 2c de banco de filtro de división de banda, la información de envolvente de tiempo recibida a partir de la unidad 2f de cálculo de información de envolvente de tiempo, la información de envolvente de frecuencia recibida a partir de la unidad 2p de cálculo de información de envolvente de frecuencia, y la segunda información de envolvente de frecuencia recibida a partir de la unidad 2o de cálculo de segunda información de envolvente de frecuencia (procesamiento en la etapa S250). La información de control de cálculo de envolvente de tiempo generada puede ser la información de control de cálculo de envolvente de tiempo en el decodificador 301 de voz según la cuarta realización.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede ser la misma que la del primer ejemplo alternativo del codificador 2 de voz según la primera realización, por ejemplo. Además, la unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede ser la misma que la del codificador 202 de voz según la tercera realización, por ejemplo.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo genera las pseudoseñales de banda de alta frecuencia localmente decodificadas usando la información de envolvente de tiempo, la información de envolvente de frecuencia y la segunda información de envolvente de frecuencia, respectivamente, y las compara con la señal original de la misma manera que en el primer ejemplo alternativo del codificador 2 de voz según la primera realización, por ejemplo. Cuando la pseudoseñal de banda de alta frecuencia localmente decodificada generada usando la segunda información de envolvente de frecuencia es más próxima a la señal original, se genera información que indica el ajuste de la señal de banda de alta frecuencia usando la segunda información de envolvente de frecuencia en el decodificador como información de control de cálculo de envolvente de tiempo.
La comparación entre cada una de las pseudoseñales de banda de alta frecuencia localmente decodificadas con la señal original puede ser la misma que en la unidad 2j de generación de información de control de cálculo de envolvente de tiempo del codificador 202 de voz según la tercera realización, y el método de comparación no está particularmente limitado en esta realización.
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo puede usar además al menos una de la información de envolvente de tiempo cuantificada, la información de envolvente de frecuencia cuantificada y la segunda información de envolvente de frecuencia cuantificada cuando se genera la información de control de cálculo de envolvente de tiempo.
Cuando la información complementaria codificada para la generación de banda de alta frecuencia recibida a partir de la unidad de cuantificación/codificación 1g y la información de control de cálculo de envolvente de tiempo indican que se ajuste la señal de banda de alta frecuencia con la segunda información de envolvente de frecuencia en el decodificador, la unidad 2h de construcción de secuencia codificada construye la secuencia codificada de banda de alta frecuencia usando la segunda información de envolvente de frecuencia codificada y de lo contrario la construye con la información de envolvente de tiempo codificada y la información de envolvente de frecuencia codificada (procesamiento en la etapa S252).
Obsérvese que los ejemplos alternativos primero a cuarto del codificador 2 de voz según la primera realización de la invención pueden aplicarse al codificador 302 de voz según la cuarta realización.
[Octavo ejemplo alternativo del decodificador de voz según la primera realización]
En este ejemplo alternativo, en la unidad 1g de cálculo de envolvente de tiempo del decodificador 1 de voz según la primera realización, se realiza procesamiento basándose en una función especificada en la envolvente de tiempo calculada. Por ejemplo, la unidad 1g de cálculo de envolvente de tiempo normaliza la envolvente de tiempo con respecto al tiempo y calcula la envolvente de tiempo Et '(I,í) mediante la siguiente ecuación.
[Ecuación 70]
Figure imgf000048_0001
En este ejemplo alternativo, tras calcularse la envolvente de tiempo Et '(I,í), a partir de entonces puede realizarse un procesamiento de sustituir el valor Et (I,í) por el valor Et '(I,í).
Según este ejemplo alternativo, sólo puede ajustarse la forma temporal de la señal de banda de alta frecuencia Xh (J,í) (Fh (I)^Í<Fh (I+1)) dentro de la banda de frecuencia Fh (I)<Í<Fh (I+1) de la trama s sin cambiar la cantidad total de energía de la banda de frecuencia Fh (I)<Í<Fh (I+1) en la trama s de la señal de banda de alta frecuencia Xh (J, i) generada por la unidad 1h de generación de banda de alta frecuencia.
Obsérvese que el octavo ejemplo alternativo del decodificador 1 de voz según la primera realización puede aplicarse a los ejemplos alternativos primero a séptimo del decodificador 1 de voz según la primera realización y los decodificadores de voz según las realizaciones segunda a cuarta, y, en este caso, puede sustituirse Et (I, i) por Et '(I, i).
[Noveno ejemplo alternativo del decodificador de voz según la primera realización]
En este ejemplo alternativo, cuando las unidades 1fi a 1fn de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima del decodificador 1 de voz según la primera realización adquieren la envolvente de tiempo L i (k, i) suavizando la cantidad Lo(k, i) en la dirección de tiempo, Lo(k,i) (t(s)-d<i<t(s)) se almacena tras la transición de la trama s-1 a la trama s. Este ejemplo alternativo permite el suavizado de la cantidad Lo(k, i) (de manera específica, Lo(k,i) (t(s)<i<t(s)+d)) de la trama s que está más cerca del límite con la trama s-1.
El noveno ejemplo alternativo del decodificador 1 de voz según la primera realización también es aplicable a los ejemplos alternativos primero a octavo del decodificador 1 de voz según la primera realización y los decodificadores de voz según las realizaciones segunda a cuarta.
[Quinto ejemplo alternativo del codificador de voz según la primera realización]
En este ejemplo alternativo, el cálculo de la información de envolvente de tiempo en la unidad 2f de cálculo de información de envolvente de tiempo del codificador 2 de voz según la primera realización se realiza basándose en la correlación entre una envolvente de tiempo de referencia H(l,i) y el g(l,i) descrito anteriormente. Por ejemplo, la unidad 2f de cálculo de información de envolvente de tiempo calcula la información de envolvente de tiempo de la siguiente manera.
Específicamente, se calcula un coeficiente de correlación corr(l) entre H(l,i) y g(l,i) mediante la siguiente ecuación.
[Ecuación 71]
Figure imgf000049_0001
Se compara el coeficiente de correlación corr(l) con un umbral especificado, y se calcula la información de envolvente de tiempo basándose en el resultado de comparación. Alternativamente, puede calcularse un valor correspondiente a corr2(l) y compararse con un umbral especificado, y la información de envolvente de tiempo puede calcularse basándose en el resultado de comparación.
Por ejemplo, la información de envolvente de tiempo se calcula de la siguiente manera: suponiendo que el umbral especificado que va a compararse con el coeficiente de correlación es corrth(l) y gdec(l,i) viene dado por la ecuación 21, la información de envolvente de tiempo se calcula mediante la siguiente ecuación.
[Ecuación 72]
(Ai,k(s) = 0, Ai,0(s) = const(0) corr(l) < corrth(l)
\A¡,k(s) = const(k),A¡,0(s) = 0 de lo contrario
const(k) ^ 0, k > 0
Cuando se introduce la información de envolvente de tiempo calculada en el ejemplo anterior en el segundo ejemplo alternativo del decodificador 1 según la primera realización, en el caso de A l,k(s)=0, A l,ü(s)=const(0) (es decir en el caso en el que el coeficiente de correlación es inferior a un umbral especificado en el codificador) en la subbanda B(T)l, la unidad 1m de control de cálculo de envolvente de tiempo emite la señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a las k-ésimas (k>0) unidades 1fk de cálculo de envolvente de tiempo de banda de baja frecuencia de modo que no se realiza el cálculo de envolvente de tiempo de banda de baja frecuencia en las unidades 1fk de cálculo de envolvente de tiempo de banda de baja frecuencia. Por otro lado, en el caso de Al,k(s)=const(k), A l,ü(s)=0 (es decir en el caso en el que el coeficiente de correlación es superior a un umbral especificado en el codificador), la unidad 1m de control de cálculo de envolvente de tiempo emite la señal de control de cálculo de envolvente de tiempo de banda de baja frecuencia a las k-ésimas (k>0) unidades 1fk de cálculo de envolvente de tiempo de banda de baja frecuencia de modo que se realiza el cálculo de envolvente de tiempo de banda de baja frecuencia en las unidades 1fk de cálculo de envolvente de tiempo de banda de baja frecuencia.
Obsérvese que, en este ejemplo alternativo, el método de cálculo no está limitado al ejemplo anterior siempre que la información de envolvente de tiempo se calcule basándose en la correlación entre la envolvente de tiempo de referencia H(l,i) y el g(l,i) descrito anteriormente.
En el caso de calcular la información de envolvente de tiempo basándose en un error (o un error ponderado) entre la envolvente de tiempo de referencia H(l,i) y g(l,i) tal como se describió en el codificador 2 de voz según la primera realización, la información de envolvente de tiempo se calcula basándose en el grado de coincidencia entre la envolvente de tiempo de referencia H(l,i) y g(l,i). Por otro lado, en este ejemplo alternativo, la información de envolvente de tiempo se calcula basándose en el grado de similitud entre las formas de la envolvente de tiempo de referencia H(l,i) y g(l,i).
El quinto ejemplo alternativo del codificador 2 de voz según la primera realización también es aplicable a los ejemplos alternativos primero a quinto del codificador 2 de voz según la primera realización y los codificadores de voz según las realizaciones segunda a cuarta.
[Primer ejemplo alternativo del decodificador de voz según la segunda realización, que es un ejemplo informativo]
En este ejemplo alternativo, en la unidad 1q de superposición de envolvente de frecuencia del decodificador 101 de voz según la segunda realización, se realiza el procesamiento basándose en una función especificada en la envolvente de frecuencia EF,dec(k,s). Por ejemplo, la unidad 1q de superposición de envolvente de frecuencia realiza el procesamiento basándose en una función de suavizado de la envolvente de frecuencia EF,dec(k,s) dada por la siguiente ecuación.
[Ecuación 73]
Figure imgf000050_0001
donde
[Ecuación 74]
E F,dec,Tem p(k , Í ) = E p dec( k , s ) , t ( S ) < / < í(s 1)
y sch(j) y dh son un coeficiente especificado de suavizado y un orden especificado de suavizado, respectivamente. En este caso, EF,dec,Filt(k,i) se sustituye por EF,dec(k,s) en el procesamiento posterior.
Además, en la ecuación 73 anterior puede incluirse una función de determinación de si suavizar o no la envolvente de frecuencia EF,dec(k,s) basándose en las características de señal de la trama correspondiente a la envolvente de frecuencia EF,dec(k,s). Además, puede incluirse información que indica si realizar o no el suavizado en la secuencia codificada, y puede incluirse una función de determinación de si suavizar o no la envolvente de frecuencia EF,dec(k,s) basándose en la información.
Obsérvese que el primer ejemplo alternativo del decodificador 101 de voz según la segunda realización también es aplicable al decodificador de voz según la cuarta realización.
[Segundo ejemplo alternativo del decodificador de voz según la segunda realización, que es un ejemplo informativo]
En la unidad 1q de superposición de envolvente de frecuencia del decodificador 101 de voz según la segunda realización, la cantidad E(m,i) es el valor obtenido corrigiendo E2(m,i) con C(s) (ecuación 60). Además, según la ecuación 61, la energía de la señal de banda de alta frecuencia tras el ajuste de la envolvente de tiempo-frecuencia en la banda kx<m<kmáx de la trama s se corrige para ser el total de la envolvente de tiempo Eü(m,i) en la banda kx^m<kmáx de la trama s. Por otro lado, según la ecuación 62, la energía de la señal de banda de alta frecuencia tras el ajuste de la envolvente de tiempo-frecuencia en la banda kx<m<kmáx de la trama s se corrige para ser el total de la envolvente de frecuencia E-i(m,i) en la banda kx<m<kmáx de la trama s. En este ejemplo alternativo, C(s) viene dado por la siguiente ecuación de modo que la energía de la señal de banda de alta frecuencia tras el ajuste de la envolvente de tiempo-frecuencia en la banda kx<m<kmáx de la trama s se mantiene tras el ajuste de la envolvente de tiempofrecuencia.
[Ecuación 75]
Figure imgf000050_0002
Además, C(s) puede venir dado por la siguiente ecuación de modo que la energía de la señal de banda de alta frecuencia tras el ajuste de la envolvente de tiempo-frecuencia en la banda kx<m<kmáx de la trama s es el total de la envolvente de tiempo E2(m,i) en la banda kx<m<kmáx de la trama s.
[Ecuación 76]
Obsérvese que el segundo ejemplo alternativo del decodificador 101 de voz según la segunda realización también es aplicable al primer ejemplo alternativo del decodificador 101 de voz según la segunda realización y el decodificador de voz según la cuarta realización.
[Tercer ejemplo alternativo del decodificador de voz según la segunda realización que es un ejemplo informativo]
La figura 39 es un diagrama que muestra una configuración de un tercer ejemplo alternativo del decodificador 101 de voz según la segunda realización, y la figura 40 es un diagrama de flujo que muestra un procedimiento de decodificación de voz mediante el decodificador 101 de voz mostrado en la figura 39. Este ejemplo alternativo es diferente del decodificador 101 de voz según la segunda realización en que incluye una unidad 1w de cálculo de envolvente de frecuencia en lugar de la unidad 1q de superposición de envolvente de frecuencia.
La unidad 1w de cálculo de envolvente de frecuencia en este ejemplo alternativo calcula la envolvente de frecuencia E-i(m,s) de la misma manera que la unidad 1q de superposición de envolvente de frecuencia según la segunda realización (etapa S119a).
Después, la unidad 1p de ajuste de envolvente de tiempo-frecuencia ajusta la envolvente de tiempo-frecuencia de la siguiente manera, por ejemplo, usando la envolvente de tiempo Ej(l,i) y la envolvente de frecuencia E-i(m,s) (etapa S120).
Específicamente, la unidad 1p de ajuste de envolvente de tiempo-frecuencia transforma la envolvente de tiempo Ej(l,i) en Eü(m,i) de la misma manera que la unidad 1q de superposición de envolvente de frecuencia.
Además, de la misma manera que el ajuste de HF en SBR de “MPEG4 AAC”, el factor de escala de umbral mínimo de ruido Q(m,s) en la trama s suministrado a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada se transforma mediante la siguiente ecuación.
[Ecuación 77]
Figure imgf000051_0001
Además, el nivel de sinusoide en la trama s viene dado por la siguiente ecuación usando la cantidad S(m,s) calculada mediante un parámetro que determina si añadir o no un sinusoide y que se suministra a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada.
[Ecuación 78]
Figure imgf000051_0002
Además, la ganancia viene dada por la siguiente ecuación usando la envolvente de frecuencia E-i(m,s), el factor de escala de umbral mínimo de ruido Q(m,s) en la trama s suministrado a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada, y la función 5(s) que depende del parámetro de la trama s suministrado a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada.
[Ecuación 79]
Figure imgf000052_0001
La cantidad Ecurr(m,s) se define mediante la siguiente ecuación.
[Ecuación 80]
Figure imgf000052_0002
También puede definirse mediante la siguiente ecuación.
[Ecuación 81]
Figure imgf000052_0003
Además, S'(m,s) es la función que representa si tiene que añadirse un sinusoide en la subbanda B(F)k (GH(k)<m<GH(k+1)) que incluye la frecuencia representada por el índice m en la trama s, y es “1” cuando tiene que añadirse un sinusoide y de lo contrario es “0”.
Además, la siguiente cantidad X'H(m+kx,i) puede calcularse usando la cantidad Ecurr(m,s) descrita anteriormente. [Ecuación 82]
Figure imgf000053_0001
Alternativamente, la cantidad X'H(m+kx,i) también puede calcularse mediante la siguiente ecuación.
[Ecuación 83]
Figure imgf000053_0002
La cantidad X'H(m+kx,i) también puede calcularse a partir de la siguiente ecuación.
[Ecuación 84]
Figure imgf000053_0003
En este procesamiento, la señal de banda de alta frecuencia XH(m+kx,i) puede suavizarse en la dirección de tiempo en el índice de frecuencia m o la subbanda B(F)k. Por tanto, realizando el procesamiento posterior, la señal de banda de alta frecuencia, basándose en la envolvente de tiempo calculada en la unidad 1g de cálculo de envolvente de tiempo, puede emitirse sin depender de la envolvente de tiempo de la señal de banda de alta frecuencia XH(m+kx,i).
Obsérvese que la ganancia G2(m,s), el factor de escala de umbral mínimo de ruido Q3(m,s) y el nivel de sinusoide S3(m,s) pueden calcularse realizando un procesamiento basándose en una función específica en la ganancia, el factor de escala de umbral mínimo de ruido y el nivel de sinusoide descritos anteriormente. Por ejemplo, de la misma manera que el ajuste de HF en SBR de “MPEG4 AAC”, se realiza un procesamiento basándose en la función de limitación de la ganancia para evitar la adición innecesaria de ruido (limitador de ganancia) y compensación para la pérdida de energía mediante la limitación de ganancia (refuerzo de ganancia) en la ganancia, el factor de escala de umbral mínimo de ruido y el nivel de sinusoide descritos anteriormente para así calcular la ganancia G2(m,s), el factor de escala de umbral mínimo de ruido Q3(m,s) y el nivel de sinusoide S3(m,s) (véase ISO/IEC 1449-3 4.6.18.7.5 para un ejemplo específico). En el caso de realizar el procesamiento especificado anterior, se usan G2(m,s), Q3(m,s) y S3(m,s) en lugar de G(m,s), Q2(m,s) y S2(m,s) en el procesamiento posterior.
Las cantidades G3(m,i) y Q4(m,i) dadas por la siguiente ecuación se calculan usando la ganancia G(m,s), el factor de escala de umbral mínimo de ruido Q2(m,s) y la envolvente de tiempo Eü(m,i) obtenidos como anteriormente. En la siguiente ecuación, la ganancia y el factor de escala de umbral mínimo de ruido se calculan basándose en la envolvente de tiempo, y, tras el procesamiento posterior, finalmente puede emitirse la señal con la envolvente de tiempo-frecuencia ajustada por la unidad 1p de ajuste de envolvente de tiempo-frecuencia.
[Ecuación 85]
G2(m,i) = j E 0(m,i ) • G(m,s )
0 < m < M , t(s ) < i < t(s +1), 0 < s < sE
[Ecuación 86]
Q4 ( m,i) = T¡E0(m,i) ■ Q2 ( m,s)
0 < m < M , t(s ) < i < t(s +1), 0 < s < sE
Obsérvese que, aunque la ganancia y el factor de escala de umbral mínimo de ruido se calculan basándose en la envolvente de tiempo en la ecuación anterior, el nivel de sinusoide también puede calcularse basándose en la envolvente de tiempo de la misma manera que la ganancia y el factor de escala de umbral mínimo de ruido.
Además, puede realizarse un procesamiento basándose en una función especificada en el G3(m,i) y Q4(m,i) descritos anteriormente. Por ejemplo, puede realizarse un procesamiento basándose en una función de suavizado. Se calculan GFilt(m,i) y QFilt(m,i) dados por las siguientes ecuaciones
[Ecuación 87]
Figure imgf000054_0001
0 < m< M, t ( s ) < i < t(s 1), 0 < s < sE
[Ecuación 88]
Figure imgf000055_0001
donde sch(j) y dh son un coeficiente especificado de suavizado y un orden especificado de suavizado, respectivamente. Además, GTemp(m,i) y QTemp(m,i) vienen dados por las siguientes ecuaciones.
[Ecuación 89]
G Temp(m >i d h ) = Al E 0 ( m , i ) ■G ( m , s )
0 < m < M , t ( s ) < i < í ( s l ) , 0 < s < s E
[Ecuación 90]
Q re m p (m J d h ) = ^ E 0 ( m , i ) ■Q 2 ( m , s )
0 < m < M , t ( s ) < i < t ( s l ) , 0 < s < s E
Además, el efecto de suavizado puede obtenerse igualmente mediante procesamiento basándose en las siguientes funciones.
[Ecuación 91]
GFilt(m,i) _ Gantiguo(m) ' wantiguo(m,i) GTemp(m,i) ' wcurr(m,i)
0<m<M, t(s)<i<t(s+1), 0<s<se
[Ecuación 92]
QFilt(m,i) _ Qantiguo(m) ' wantiguo(m,i) QTemp(m,i) ' wcurr(m,i)
0<m<M, t(s)<i<t(s+1), 0<s<se
donde Wantiguo(m,i) y Wcurr(m,i) son factores de ponderación especificados. Además, GTemp(m,i) y QTemp(m,i) vienen dados por las siguientes ecuaciones.
[Ecuación 93]
Figure imgf000055_0002
0 < m < M , t ( s ) < / < ¿ ( s 1) , 0 < s < s E
[Ecuación 94]
Qremp(m,i)= *jE0(m,i) ■ Q2(m,s )
O < m < M , t(s) < i< t(s Y), 0 < s< sE
Además, Gantiguo(m) es la ganancia de un índice de tiempo (específicamente, t(s)-1) en la trama anterior (específicamente, la trama s-1) en el límite con la trama s y viene dado por cualquiera de las siguientes ecuaciones.
[Ecuación 95]
Figure imgf000056_0001
[Ecuación 96]
Gantiguo(m) _ GFilt(m,t(s)-1)
0<m<M, 0<s<se
En el caso en el que se realiza el procesamiento descrito anteriormente basándose en una función especificada, se usan GFilt(m,s) y QFilt(m,s) en lugar de G3(m,s) y Q4(m,s) en el procesamiento posterior.
La función de suavizado descrita anteriormente puede incluir una función de determinación de si realizar o no el suavizado basándose en el parámetro de la trama s suministrado a partir de la unidad 1e de decodificación/descuantificación de secuencia codificada. Además, puede incluirse información que indica si realizar o no el suavizado en la secuencia codificada, y la función de suavizado descrita anteriormente puede incluir una función de determinación de si realizar o no el suavizado basándose en la información. Además, puede incluir una función de determinación de si realizar o no el suavizado basándose en al menos uno de los anteriores.
Finalmente, la unidad 1p de ajuste de envolvente de tiempo-frecuencia obtiene la señal con la envolvente de tiempo ajustada-frecuencia mediante las siguientes ecuaciones
[Ecuación 97]
(m, i) = G}(m, i) ■XH(m kx, i)
Rc{W2 ( m,i)} = Re{W,(m,¿)} Q4(m,i) ■ V0(f(¿)) Im{W2 (m,i)} - Im W i M ) Q4(m,i) •^ (/(/))
[Ecuación 98]
Re {Y(m, i ) } = Re {W 2 (m, i ) } y/v¡, ( m,s,i )
Im {7 (m, 0 } = lm{fV 2 (m, i )} y/ím (m, s, i)
y/^{m,s,í) = S 2 (m,s) ■ (pRsim ( f sla (i))
Figure imgf000056_0002
donde Vo y Vi son matrices que especifican una componente de ruido, f es una función que mapea el índice i en el índice en las matrices, 9 Re,s¡n y 9 im,s¡n son matrices que especifican la fase de una componente sinusoidal, y fsin es una función que mapea el índice i en el índice en las matrices (véase “ ISO/IEC 14496-34.6.18” para un ejemplo específico).
Alternativamente, en la ecuación 97 descrita anteriormente, puede usarse X'H(m+kx,i) en lugar de XH(m+kx,i).
Obsérvese que, cuando se aplica el refuerzo de ganancia de ajuste de HF en SBR de “MPEG4 AAC” descrito anteriormente a la unidad 1q de superposición de envolvente de frecuencia del decodificador 101 de voz según la segunda realización, se compensa la pérdida de energía debida a la limitación de ganancia en unidades de la trama s para cada subbanda B(F)k (GH(k)<j<GH(k+1)). Por otro lado, según la siguiente ecuación, la pérdida de energía debida a la limitación de ganancia se compensa en unidades del índice de tiempo i para la señal de banda de alta frecuencia Xh (J,í) para cada subbanda B(F)k (GH(k)<j<GH(k+1)).
[Ecuación 99]
Figure imgf000057_0001
En la ecuación descrita anteriormente, el limitador de ganancia del ajuste de HF en SBR de “MPEG4 AAC” descrito anteriormente puede aplicarse a la ganancia G(m,s) y al factor de ajuste a escala de ruido Q2(m,s).
Usando la ganancia G2(m,i) y el factor de ajuste a escala de ruido Q3(m,i), GTemp(m,i) y QTemp(m,i) vienen dados por la siguiente ecuación en lugar de las ecuaciones 89 y 90 descritas anteriormente.
[Ecuación 100]
Figure imgf000057_0002
[Ecuación 101]
Figure imgf000057_0003
0 < m < M, t(s) < i < t(s +1), 0 < s < sE
Además, cuando se sustituye la ecuación 99 por la siguiente ecuación, la pérdida de energía debida a la limitación de ganancia se compensa en unidades del índice de tiempo i para la señal de banda de alta frecuencia XhQ,í) para cada subbanda B^k (FH(k)<j<FH(k+1)).
[Ecuación 102]
Figure imgf000058_0001
1 < k < mH, FH(k) <m kx <FH (k 1), í(s) < i < t(s +1). 0 < s < sE
Además, cuando se sustituye la ecuación 99 por la siguiente ecuación, la pérdida de energía debida a la limitación de ganancia se compensa en unidades del índice de tiempo i para la señal de banda de alta frecuencia XhQ,í) para cada índice de frecuencia m.
[Ecuación 103]
Figure imgf000058_0002
Alternativamente, cuando se calcula la cantidad anterior GRefuerzoTemp(m,i), puede usarse X'H(m+kx,i) en lugar de XH(m+kx,i).
En la unidad 1p de ajuste de envolvente de tiempo-frecuencia del decodificador 101 de voz según la segunda realización, el ajuste de la envolvente de tiempo-frecuencia se realiza de una manera similar al ajuste de HF en SBR de “MPEG4 AAC” usando la cantidad E(m,i) recibida a partir de la unidad 1q de superposición de envolvente de frecuencia, de la misma manera que se realiza por la unidad 1i de ajuste de envolvente de tiempo del decodificador 1 de voz según la primera realización. Por tanto, de la misma manera que se realiza mediante el ajuste de HF en SBR de “MPEG4 AAC”, cuando se realiza una operación de limitador de ganancia para evitar la adición de ruido innecesario en una ganancia, un factor de escala de umbral mínimo de ruido y un nivel de sinusoide, y se realiza una operación de refuerzo de ganancia para compensar la pérdida de energía provocada por la operación de refuerzo de ganancia, estas operaciones se realizan en el índice de tiempo i(t(s)<i<t(s+1)). Por otro lado, según este ejemplo alternativo, cuando se realiza una operación de limitador de ganancia para evitar la adición de ruido innecesario en una ganancia, un factor de escala de umbral mínimo de ruido y un nivel de sinusoide, y se realiza una operación de refuerzo de ganancia para compensar la pérdida de energía provocada por la operación de refuerzo de ganancia, al menos una de estas operaciones puede realizarse en la trama s. Por tanto, este ejemplo alternativo permite la reducción de la cantidad de operación para el procesamiento anterior en comparación con el decodificador 101 de voz según la segunda realización.
Obsérvese que el tercer ejemplo alternativo del decodificador 101 de voz según la segunda realización también es aplicable a los ejemplos alternativos primero y segundo del decodificador 101 de voz según la segunda realización y el decodificador de voz según la cuarta realización.
[Otra realización del tercer ejemplo alternativo del decodificador 101 de voz según la segunda realización que es un ejemplo informativo]
En el caso en el que los ejemplos alternativos primero, segundo y tercero del decodificador 1 de voz usado en la primera realización y el quinto ejemplo alternativo del decodificador 1 de voz usado en la primera realización que implementa al menos uno de los ejemplos alternativos anteriores se aplican al ejemplo alternativo descrito anteriormente, hay un caso en el que la unidad 1g de cálculo de envolvente de tiempo no calcula la envolvente de tiempo Et (I,i). En este caso, el procesamiento de operación que requiere Eü(m,i) se realiza sustituyendo Eü(m,i) por 1. De esta manera, puede omitirse el procesamiento de multiplicación de Eü(m,i), la potencia de Eü(m,i) y la raíz cuadrada de Eo(m,i), reduciendo así la cantidad de computación. Obsérvese que, en el procesamiento que usa el método anterior, la unidad 1p de ajuste de envolvente de tiempo-frecuencia no necesita calcular E0(m,i).
[Sexto ejemplo alternativo del codificador 2 de voz según la primera realización]
La unidad 2f de cálculo de información de envolvente de tiempo calcula la información de envolvente de tiempo basándose en las características de al menos una señal de la señal X(j,i) en el dominio de frecuencia obtenida a partir de la unidad 2c de banco de filtro de división de banda, una señal de entrada externa recibida a través del dispositivo de comunicación del codificador 2 de voz, y la señal de banda de baja frecuencia submuestreada en el dominio de tiempo obtenida como salida a partir de la unidad 2a de submuestreo. Las características de señal pueden ser características transitorias, tonalidad, características de ruido y similares de la señal, por ejemplo, aunque las características de señal no están limitadas a estos ejemplos específicos en este ejemplo alternativo.
Obsérvese que este ejemplo alternativo también es aplicable a los ejemplos alternativos primero a quinto del codificador 2 de voz según la primera realización y los codificadores de voz según las realizaciones segunda a cuarta.
[Séptimo ejemplo alternativo del codificador 2 de voz según la primera realización]
La unidad 2j de generación de información de control de cálculo de envolvente de tiempo genera la información de control de cálculo de envolvente de tiempo relacionada con el método de cálculo de envolvente de tiempo de banda de baja frecuencia en el decodificador 1 de voz según las características de señal de al menos una señal de la señal X(j,i) en el dominio de frecuencia obtenida a partir de la unidad 2c de banco de filtro de división de banda, una señal de entrada externa recibida a través del dispositivo de comunicación del codificador 2 de voz, y la señal de banda de baja frecuencia submuestreada en el dominio de tiempo obtenida como salida a partir de la unidad 2a de submuestreo. Las características de señal pueden ser características transitorias, tonalidad, características de ruido y similares de la señal, por ejemplo, aunque las características de señal no están limitadas a esos ejemplos específicos en este ejemplo alternativo.
Obsérvese que este ejemplo alternativo también es aplicable a los ejemplos alternativos primero a sexto del codificador 2 de voz según la primera realización y los codificadores de voz según las realizaciones segunda a cuarta.
[Unidad de cuantificación/codificación del codificador de voz según las realizaciones primera a cuarta]
En la unidad 2g de cuantificación/codificación del codificador de voz según las realizaciones primera a cuarta, el factor de escala de umbral mínimo de ruido, y el parámetro que determina si añadir o no un sinusoide, pueden cuantificarse y codificarse como parte de la rutina.
Aplicabilidad industrial
La presente invención se usa para un decodificador de voz, un codificador de voz, un método de decodificación de voz, un método de codificación de voz, un programa de decodificación de voz, y un programa de codificación de voz, y es posible ajustar la envolvente de tiempo de una señal decodificada para dar una forma menos distorsionada y de ese modo obtener una señal reproducida en la que el preeco y el posteco están suficientemente reducidos.
Lista de signos de referencia
1f1 —1fn...unidad de cálculo de envolvente de tiempo de banda de baja frecuencia, 2e-i —2en...unidad de cálculo de envolvente de tiempo de banda de baja frecuencia, 1, 102, 201, 301...decodificador de voz, 1a...unidad de demultiplexación, 1b...unidad de decodificación de banda de baja frecuencia, 1c...unidad de banco de filtro de división de banda, 1d...unidad de análisis de secuencia codificada, 1e...unidad de descuantificación, 1g...unidad de cálculo de envolvente de tiempo, 1h...unidad de generación de banda de alta frecuencia, 1i...unidad de ajuste de envolvente de tiempo, 1j...unidad de banco de filtro de síntesis de banda, 1k, 1m, 1n, 1o...unidad de control de cálculo de envolvente de tiempo, 1p, 1v...unidad de ajuste de envolvente de tiempo-frecuencia, 1q...unidad de superposición de envolvente de frecuencia, 1r...unidad de decodificación/descuantificación de secuencia codificada, 1s...unidad de control de cálculo de envolvente de tiempo, 1t...unidad de ajuste de envolvente, 1u...unidad de superposición de envolvente de frecuencia, 1w...unidad de cálculo de envolvente de frecuencia, 2, 102, 202, 302...codificador de voz, 2a...unidad de submuestreo, 2b...unidad de codificación de banda de baja frecuencia, 2c...unidad de banco de filtro de división de banda, 2d...unidad de cálculo de información complementaria para la generación de banda de alta frecuencia, 2e-i — 2ek...unidad de cálculo de envolvente de tiempo de banda de baja frecuencia, 2f...unidad de cálculo de información de envolvente de tiempo, 2g...unidad de cuantificación/codificación, 2h...unidad de construcción de secuencia codificada de banda de alta frecuencia, 2 i...unidad de multiplexación, 2j...unidad de generación de información de control de cálculo de envolvente de tiempo, 2k...unidad de decodificación de banda de baja frecuencia, 2m...unidad de banco de filtro de síntesis de banda, 2n, 2o, 2p...unidad de cálculo de información de envolvente de frecuencia

Claims (4)

  1. REIVINDICACIONES
    Decodificador (1) de voz que decodifica una secuencia codificada de señal de voz codificada, que comprende: medios (1a) de demultiplexación para demultiplexar la secuencia codificada para dar una secuencia codificada de banda de baja frecuencia y una secuencia codificada de banda de alta frecuencia; medios (1b) de decodificación de banda de baja frecuencia para decodificar la secuencia codificada de banda de baja frecuencia demultiplexada por los medios (1a) de demultiplexación y obtener una señal de banda de baja frecuencia (X(j,i));
    medios (1c) de transformación de frecuencia para transformar la señal de banda de baja frecuencia (X(j,i)), que se obtiene por los medios (1b) de decodificación de banda de baja frecuencia, en un dominio de frecuencia;
    medios (1d) de análisis de secuencia codificada de banda de alta frecuencia para analizar la secuencia codificada de banda de alta frecuencia demultiplexada por los medios (1a) de demultiplexación y adquirir información complementaria para la generación de banda de alta frecuencia e información de envolvente de tiempo;
    medios (1e, 1r) de decodificación de secuencia codificada para decodificar la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo adquiridas por los medios (1d) de análisis de secuencia codificada de banda de alta frecuencia;
    medios (1h) de generación de banda de alta frecuencia para generar, usando la información complementaria para la generación de banda de alta frecuencia decodificada por los medios (1e, 1r) de decodificación de secuencia codificada, una señal de banda de alta frecuencia de la señal de voz a partir de la señal de banda de baja frecuencia (X(j,i));
    medios (1f 1 ,..., 1fn) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo, N es un número entero igual o superior a dos, para analizar la señal de banda de baja frecuencia (X(j,i)) transformada en el dominio de frecuencia por los medios (1c) de transformación de frecuencia y adquirir una pluralidad de envolventes de tiempo de banda de baja frecuencia Lü(k,i), usando las siguientes ecuaciones 2 y 3, componentes de subbanda Xdec(j,i) de la señal de banda de baja frecuencia (X(j,i)), un número entero k, el índice j en la dirección de frecuencia, el índice i en la dirección de tiempo, el número se de todas las tramas, y dos matrices Bi, Bh con el tamaño n que se definen de modo que la señal Xdec(j,i), Bi(k)<j<Bh(k), t(s)<i<t(s+1), 0<s<se, corresponde a la componente de subbanda k-ésima, 1<k<n; en el que t(s) se define de modo que el intervalo t(s)<i<t(s+1) de la señal Xdec(j,i) con respecto al índice i corresponde a la trama s-ésima, 0<s<se;
    [Ecuación 2]
    Figure imgf000060_0001
    [Ecuació
    Figure imgf000060_0002
    Figure imgf000060_0003
    medios (1g) de cálculo de envolvente de tiempo para calcular una envolvente de tiempo de banda de alta frecuencia usando la información de envolvente de tiempo, que se adquiere por los medios (1e, 1r) de decodificación de secuencia codificada, y la pluralidad de envolventes de tiempo de banda de baja frecuencia, que se adquieren por los medios (1f-i ,..., 1fn) de cálculo de envolvente de tiempo de banda de baja frecuencia; medios (1i) de ajuste de envolvente de tiempo para ajustar, usando la envolvente de tiempo adquirida por los medios (1g) de cálculo de envolvente de tiempo, una envolvente de tiempo de la señal de banda de alta frecuencia generada por los medios (1h) de generación de banda de alta frecuencia; y
    medios (1j) de transformación de frecuencia inversa para sumar la señal de banda de alta frecuencia (Y(i,j)), que se ajusta por los medios (1i) de ajuste de envolvente de tiempo, y la señal de banda de baja frecuencia (X(j,i)), que se decodifica por los medios (1b) de decodificación de banda de baja frecuencia, y emitir una señal de dominio de tiempo que contiene componentes de banda de frecuencia completa,
    en el que el cálculo de la envolvente de tiempo de banda de alta frecuencia por los medios (1g) de cálculo de envolvente de tiempo incluye un procesamiento de suavizado en la dirección de tiempo aplicado a la pluralidad de envolventes de tiempo de banda de baja frecuencia, calculando la siguiente ecuación 4 usando los coeficientes sc(j) de suavizado y un orden d, d>1, de suavizado
    [Ecuació
    Figure imgf000061_0001
    Figure imgf000061_0002
    Decodificador (1) de voz según la reivindicación 1,
    en el que los medios (1d) de análisis de secuencia codificada de banda de alta frecuencia están configurados para adquirir adicionalmente información complementaria codificada para la generación de banda de alta frecuencia, e información de envolvente de frecuencia;
    en el que los medios (1e, 1r) de decodificación de secuencia codificada están configurados para decodificar la información complementaria para la generación de banda de alta frecuencia, la información de envolvente de frecuencia y la información de envolvente de tiempo adquiridas por los medios (1d) de análisis de secuencia codificada de banda de alta frecuencia;
    en el que el decodificador (1) de voz comprende además medios (1w) de cálculo de envolvente de frecuencia para calcular una envolvente de frecuencia usando la información de envolvente de frecuencia adquirida por los medios (1e, 1r) de decodificación de secuencia codificada;
    en el que los medios (1i) de ajuste de envolvente de tiempo comprenden medios (1p, 1v) de ajuste de envolvente de tiempo-frecuencia para ajustar, usando la envolvente de tiempo adquirida por los medios (1g) de cálculo de envolvente de tiempo y la envolvente de frecuencia adquirida por los medios (1w) de cálculo de envolvente de frecuencia, la envolvente de tiempo y una envolvente de frecuencia de las componentes de banda de alta frecuencia generadas por los medios (1h) de generación de banda de alta frecuencia.
    Decodificador (1) de voz según una cualquiera de las reivindicaciones 1 a 2, que comprende además:
    medios (1k, 1m, 1n, 1o) de control de cálculo de envolvente de tiempo para controlar, usando la señal de banda de baja frecuencia (X(j,i)) transformada en el dominio de frecuencia por los medios (1c) de transformación de frecuencia, al menos uno de (i) cálculo de las envolventes de tiempo de banda de baja frecuencia en los medios (1f-i ,..., 1fn) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo y (ii) cálculo de la envolvente de tiempo de banda de alta frecuencia en los medios (1g) de cálculo de envolvente de tiempo.
    Decodificador (1) de voz según una cualquiera de las reivindicaciones 1 a 2, que comprende además:
    medios (1k, 1m, 1n, 1o) de control de cálculo de envolvente de tiempo para controlar, usando la información de envolvente de tiempo adquirida por los medios (1e, 1r) de decodificación de secuencia codificada, al menos uno de (i) cálculo de las envolventes de tiempo de banda de baja frecuencia en los medios (1f-i ,..., 1fn) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo y (ii) cálculo de la envolvente de tiempo de banda de alta frecuencia en los medios (1g) de cálculo de envolvente de tiempo. Decodificador (1) de voz según una cualquiera de las reivindicaciones 1 a 2, en el que
    los medios (1d) de análisis de secuencia codificada de banda de alta frecuencia adquieren además información de control de cálculo de envolvente de tiempo, y
    el decodificador (1) de voz comprende además medios (1k, 1m, 1n, 1o) de control de cálculo de envolvente de tiempo para controlar, usando la información de control de cálculo de envolvente de tiempo adquirida por los medios (1d) de análisis de secuencia codificada de banda de alta frecuencia, al menos uno de (i) cálculo de las envolventes de tiempo de banda de baja frecuencia en los medios (1f-i ,..., 1fn) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo y (ii) cálculo de la envolvente de tiempo de banda de alta frecuencia en los medios (1g) de cálculo de envolvente de tiempo.
    Decodificador (1) de voz según una cualquiera de las reivindicaciones 1 a 2, en el que
    los medios (1d) de análisis de secuencia codificada de banda de alta frecuencia adquieren además información de control de cálculo de envolvente de tiempo,
    los medios (1e, 1r) de decodificación de secuencia codificada adquieren además segunda información de envolvente de frecuencia, y
    el decodificador (1) de voz comprende además medios (1k, 1m, 1n, 1o) de control de cálculo de envolvente de tiempo para determinar, basándose en la información de control de cálculo de envolvente de tiempo, si ajustar la envolvente de frecuencia de las componentes de banda de alta frecuencia basándose en la segunda información de envolvente de frecuencia y, cuando se determina ajustar la envolvente de frecuencia, controlar no realizar el cálculo de las envolventes de tiempo de banda de baja frecuencia en los medios (1f-i ,..., 1fn) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo o cálculo de la envolvente de tiempo de banda de alta frecuencia en los medios (1g) de cálculo de envolvente de tiempo.
    Codificador (2) de voz que codifica una señal de voz, que comprende:
    medios (2c) de transformación de frecuencia para transformar la señal de voz en un dominio de frecuencia; medios (2a) de submuestreo para submuestrear la señal de voz y adquirir una señal de banda de baja frecuencia (X(j,i));
    medios (2b) de codificación de banda de baja frecuencia para codificar la señal de banda de baja frecuencia (X(j,i)) adquirida por los medios (2a) de submuestreo;
    medios (2e-i ,..., 2en) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo, N es un número entero igual o superior a dos, para calcular una pluralidad de envolventes de tiempo de componentes de banda de baja frecuencia Lü(k,i) de la señal de voz transformada en el dominio de frecuencia por los medios (2c) de transformación de frecuencia usando las siguientes ecuaciones 2 y 3, componentes de subbanda Xdec(j,i) de la señal de banda de baja frecuencia (X(j,i)), un número entero k, el índice j en la dirección de frecuencia, el índice i en la dirección de tiempo, el número se de todas las tramas, y dos matrices Bl, Bh con el tamaño n que se definen de modo que la señal Xdec(j,i), Bl(k)<j<Bh(k), t(s)<i<t(s+1), 0<s<se , corresponde a la componente de subbanda k-ésima, 1<k<n; en el quet(s) se define de modo que el intervalo t(s)<i<t(s+1) de la señal Xdec(j,i) con respecto al índice i corresponde a la trama s-ésima, 0<s<se ;
    Figure imgf000062_0001
    [Ecuación 3]
    LQ(k,i) = 10loglQEL(k,i),
    1 < k < n, t(s) < i < t{s 1), O <^ < sE .
    medios (2f) de cálculo de información de envolvente de tiempo para calcular, usando las envolventes de tiempo de las componentes de banda de baja frecuencia calculadas por los medios (2ei,..., 2en) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo, información de envolvente de tiempo necesaria para adquirir una envolvente de tiempo de componentes de banda de alta frecuencia de la señal de voz transformada por los medios (2c) de transformación de frecuencia;
    medios (2d) de cálculo de información complementaria para analizar la señal de voz y calcular información complementaria para la generación de banda de alta frecuencia que va a usarse para generar componentes de banda de alta frecuencia a partir de la señal de banda de baja frecuencia (X(j,i));
    medios (2g) de codificación para codificar la información complementaria para la generación de banda de alta frecuencia, que se genera por los medios (2d) de cálculo de información complementaria, y la información de envolvente de tiempo, que se calcula por los medios (2f) de cálculo de información de envolvente de tiempo;
    medios (2h) de construcción de secuencia codificada para construir una secuencia codificada de banda de alta frecuencia a partir de la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo codificadas por los medios (2g) de codificación; y
    medios (2 i) de multiplexación para generar una secuencia codificada en la que se multiplexan la secuencia codificada de banda de baja frecuencia, que se adquiere por los medios (2b) de codificación de banda de baja frecuencia, y la secuencia codificada de banda de alta frecuencia, que se construye por los medios (2h) de construcción de secuencia codificada,
    en el que el cálculo de la información de envolvente de tiempo por los medios (2 f) de cálculo de envolvente de tiempo incluye un procesamiento de suavizado en dirección de tiempo aplicado a la pluralidad de envolventes de tiempo de banda de baja frecuencia calculando la siguiente ecuación 4 usando coeficientes sc(j) de suavizado y un orden d, d>1, de suavizado.
    [Ecuació
    Figure imgf000063_0001
    1 < k < n , t ( s )< i < t ( s T), 0 < s < s E
    Codificador (2) de voz según la reivindicación 7, que comprende además:
    medios (2n, 2o, 2p) de cálculo de información de envolvente de frecuencia para calcular información de envolvente de frecuencia de las componentes de banda de alta frecuencia de la señal de voz transformada en el dominio de frecuencia por los medios (2c) de transformación de frecuencia, en el que
    los medios (2g) de codificación codifican además la información de envolvente de frecuencia, y
    los medios (2h) de construcción de secuencia codificada construyen la secuencia codificada de banda de alta frecuencia añadiendo además la información de envolvente de frecuencia codificada por los medios (2g) de codificación.
    Codificador (2) de voz según la reivindicación 7 u 8 , que comprende además:
    medios (2j) de generación de información de control para generar información de control de cálculo de envolvente de tiempo que controlan el cálculo de envolvente de tiempo en un decodificador de voz usando al menos uno de (i) la señal de voz transformada en el dominio de frecuencia por los medios (2c) de transformación de frecuencia y (ii) la información de envolvente de tiempo calculada por los medios (2f) de cálculo de información de envolvente de tiempo, en el que
    los medios (2h) de construcción de secuencia codificada construyen la secuencia codificada de banda de alta frecuencia añadiendo además la información de control de cálculo de envolvente de tiempo generada por los medios (2j) de generación de información de control.
    Codificador (2) de voz según una cualquiera de las reivindicaciones 7 a 9, en el que
    los medios (2f) de cálculo de información de envolvente de tiempo calculan una envolvente de tiempo de componentes de banda de alta frecuencia de la señal de voz transformada en el dominio de frecuencia por los medios (2c) de transformación de frecuencia, y calculan la información de envolvente de tiempo basándose en la correlación entre una envolvente de tiempo calculada a partir de las envolventes de tiempo primera a n-ésima de componentes de banda de baja frecuencia y la envolvente de tiempo de las componentes de frecuencia.
    Método de decodificación de voz de decodificar una secuencia codificada generada codificando una señal de voz, que comprende:
    una etapa de demultiplexación, realizada por los medios (1a) de demultiplexación, de demultiplexar la secuencia codificada para dar una secuencia codificada de banda de baja frecuencia y una secuencia codificada de banda de alta frecuencia;
    una etapa de decodificación de banda de baja frecuencia, realizada por los medios (1b) de decodificación de banda de baja frecuencia, de decodificar la secuencia codificada de banda de baja frecuencia demultiplexada por los medios (1a) de demultiplexación y obtener una señal de banda de baja frecuencia (X(j,i));
    una etapa de transformación de frecuencia, realizada por los medios (1c) de transformación de frecuencia, de transformar la señal de banda de baja frecuencia (X(j,i)) obtenida por los medios (1b) de decodificación de banda de baja frecuencia en un dominio de frecuencia;
    una etapa de análisis de secuencia codificada de banda de alta frecuencia, realizada por los medios (1d) de análisis de secuencia codificada de banda de alta frecuencia, de analizar la secuencia codificada de banda de alta frecuencia demultiplexada por los medios (1a) de demultiplexación y adquirir información complementaria codificada para la generación de banda de alta frecuencia e información de envolvente de tiempo;
    una etapa de decodificación de secuencia codificada, realizada por los medios (1e, 1r) de decodificación de secuencia codificada, de decodificar la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo adquiridas por los medios (1d) de análisis de secuencia codificada de banda de alta frecuencia;
    una etapa de generación de banda de alta frecuencia, realizada por los medios (1h) de generación de banda de alta frecuencia, de generar, usando la información complementaria para la generación de banda de alta frecuencia decodificada por los medios (1e, 1r) de decodificación de secuencia codificada, una señal de banda de alta frecuencia de la señal de voz a partir de la señal de banda de baja frecuencia (X(j,i));
    una etapa de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima, N es un número entero igual o superior a dos, realizada por los medios (1f-i ,.., 1fn) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo, de analizar la señal de banda de baja frecuencia (X(j,i)) transformada en el dominio de frecuencia por los medios (1c) de transformación de frecuencia y adquirir una pluralidad de envolventes de tiempo de banda de baja frecuencia Lü(k,i), usando las siguientes ecuaciones 2 y 3, componentes de subbanda Xdec(j,i) de la señal de banda de baja frecuencia (X(j,i)), un número entero k, el índice j en la dirección de frecuencia, el índice i en la dirección de tiempo, el número se de todas las tramas, y dos matrices Bi, Bh con el tamaño n que se definen de modo que la señal Xdec(j,i), Bi(k)<j<Bh(k), t(s)<i<t(s+1), 0<s<se , corresponde a la componente de subbanda k-ésima, 1<k<n; en el que t(s) se define de modo que el intervalo t(s)<i<t(s+1) de la señal Xdec(j,i) con respecto al índice i corresponde a la trama s-ésima, 0<s<se ;
  2. [Ecuación 2]
    Figure imgf000065_0001
  3. [Ecuación 3]
    L0(k,i) = m o g í0EL(kJX
    1 < k < n , t(s) < i < t(s 1), O < s < sE
    una etapa de cálculo de envolvente de tiempo, realizada por los medios (1g) de cálculo de envolvente de tiempo, de calcular una envolvente de tiempo de banda de alta frecuencia usando la información de envolvente de tiempo, que se adquiere por los medios (1e, 1r) de decodificación de secuencia codificada, y la pluralidad de envolventes de tiempo de banda de baja frecuencia, que se adquieren por los medios (1fi ,.., 1fn) de cálculo de envolvente de tiempo de banda de baja frecuencia;
    una etapa de ajuste de envolvente de tiempo, realizada por los medios (1i) de ajuste de envolvente de tiempo, de ajustar una envolvente de tiempo de la señal de banda de alta frecuencia generada por los medios (1h) de generación de banda de alta frecuencia usando la envolvente de tiempo adquirida por los medios (1g) de cálculo de envolvente de tiempo; y
    una etapa de transformación de frecuencia inversa, realizada por los medios (1j) de transformación de frecuencia inversa, de sumar la señal de banda de alta frecuencia, que se ajusta por los medios (1i) de ajuste de envolvente de tiempo, y la señal de banda de baja frecuencia (X(j,i)), que se decodifica por los medios (1b) de decodificación de banda de baja frecuencia, y emitir una señal de dominio de tiempo que contiene las componentes de banda de frecuencia completa,
    en el que el cálculo de la envolvente de tiempo de banda de alta frecuencia por los medios (1g) de cálculo de envolvente de tiempo incluye un procesamiento de suavizado en dirección de tiempo aplicado a la pluralidad de envolventes de tiempo de banda de baja frecuencia calculando la siguiente ecuación 4 usando coeficientes sc(j) de suavizado y un orden d, d>1, de suavizado
    [Ecuación 4]
    Figure imgf000065_0002
    1 < k < n , t(s)<i <t(s+ T), 0 < s < s E
    Método de decodificación de voz según la reivindicación 11,
    en el que la etapa de análisis de secuencia codificada de banda de alta frecuencia comprende además adquirir información complementaria codificada para la generación de banda de alta frecuencia e información de envolvente de frecuencia;
    en el que la etapa de decodificación de secuencia codificada comprende decodificar la información complementaria para la generación de banda de alta frecuencia, la información de envolvente de frecuencia, y la información de envolvente de tiempo adquiridas por los medios (1d) de análisis de secuencia codificada de banda de alta frecuencia;
    en el que el método comprende además una etapa de cálculo de envolvente de frecuencia, realizada por los medios (1w) de cálculo de envolvente de frecuencia, de calcular una envolvente de frecuencia usando la información de envolvente de frecuencia adquirida por los medios (1e, 1r) de decodificación de secuencia codificada;
    en el que la etapa de ajuste de envolvente de tiempo comprende una etapa de ajuste de envolvente de tiempo-frecuencia, realizada por los medios (1p, 1v) de ajuste de envolvente de tiempo-frecuencia de los medios (1i) de ajuste de envolvente de tiempo, de ajustar, usando la envolvente de tiempo adquirida por los medios (1g) de cálculo de envolvente de tiempo y la envolvente de frecuencia adquirida por los medios (1w) de cálculo de envolvente de frecuencia, una envolvente de tiempo y una envolvente de frecuencia de las componentes de banda de alta frecuencia generadas por los medios (1h) de generación de banda de alta frecuencia.
    Método de codificación de voz de codificar una señal de voz, que comprende:
    una etapa de transformación de frecuencia, realizada por los medios (2c) de transformación de frecuencia, de transformar la señal de voz en un dominio de frecuencia;
    una etapa de submuestreo, realizada por los medios (2a) de submuestreo, de submuestrear la señal de voz y adquirir una señal de banda de baja frecuencia;
    una etapa de codificación de banda de baja frecuencia, realizada por los medios (2b) de codificación de banda de baja frecuencia, de codificar la señal de banda de baja frecuencia (X(j,i)) adquirida por los medios (2a) de submuestreo;
    una etapa de cálculo de envolvente de tiempo de banda de baja frecuencia primera a n-ésima, N es un número entero igual o superior a dos, realizada por los medios (2ei ,..., 2en) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo, de calcular una pluralidad de envolventes de tiempo de componentes de banda de baja frecuencia Lü(k,i) de la señal de voz transformada en el dominio de frecuencia por los medios (2c) de transformación de frecuencia, usando las siguientes ecuaciones 2 y 3, componentes de subbanda Xdec(j,i) de la señal de banda de baja frecuencia (X(j,i)), un número entero k, el índice j en la dirección de frecuencia, el índice i en la dirección de tiempo, el número se de todas las tramas, y dos matrices Bi, Bh con el tamaño n que se definen de modo que la señal Xdec(j,i), Bi(k)<j<Bh(k), t(s)<i<t(s+1), 0<s<se, corresponde a la componente de subbanda k-ésima, 1<k<n; en el que t(s) se define de modo que el intervalo t(s)<i<t(s+1) de la señal Xdec(j,i) con respecto al índice i corresponde a la trama s-ésima, 0<s<se;
    [Ecuación 2]
    Figure imgf000066_0001
    [Ecuació
    Figure imgf000066_0002
    Figure imgf000066_0003
    una etapa de cálculo de información de envolvente de tiempo, realizada por los medios (2f) de cálculo de información de envolvente de tiempo, de calcular, usando las envolventes de tiempo de las componentes de banda de baja frecuencia calculadas por los medios (2ei,..., 2en) de cálculo de envolvente de tiempo de banda de baja frecuencia primero a n-ésimo, información de envolvente de tiempo necesaria para adquirir una envolvente de tiempo de componentes de banda de alta frecuencia de la señal de voz transformada por los medios (2c) de transformación de frecuencia;
    una etapa de cálculo de información complementaria, realizada por los medios (2d) de cálculo de información complementaria, de analizar la señal de voz y calcular información complementaria para la generación de banda de alta frecuencia que va a usarse para generar componentes de banda de alta frecuencia a partir de la señal de banda de baja frecuencia (X(j,i));
    una etapa de codificación, realizada por los medios (2g) de codificación, de codificar la información complementaria para la generación de bandas de alta frecuencia, que se genera por los medios (2d) de cálculo de información complementaria, y la información de envolvente de tiempo, que se calcula por los medios (2f) de cálculo de información de envolvente de tiempo;
    una etapa de construcción de secuencia codificada, realizada por los medios (2h) de construcción de secuencia codificada, de construir una secuencia codificada de banda de alta frecuencia a partir de la información complementaria para la generación de banda de alta frecuencia y la información de envolvente de tiempo codificadas por los medios (2g) de codificación; y
    una etapa de multiplexación, realizada por los medios (2 i) de multiplexación, de generar una secuencia codificada en la que se multiplexan la secuencia codificada de banda de baja frecuencia, que se adquiere por los medios (2b) de codificación de banda de baja frecuencia, y la secuencia codificada de banda de alta frecuencia, que se construye por los medios (2h) de construcción de secuencia codificada,
    en el que el cálculo de información de envolvente de tiempo por los medios (2f) de cálculo de envolvente de tiempo incluye un procesamiento de suavizado en dirección de tiempo aplicado a una pluralidad de envolventes de tiempo de banda de baja frecuencia calculando la siguiente ecuación 4 usando coeficientes sc(j) de suavizado y un orden d, d>1, de suavizado
  4. [Ecuación 4]
    Figure imgf000067_0001
    1 < k < n , t(s)<i <t(s+ T), 0 < s < s E
    Programa de decodificación de voz que comprende instrucciones que, cuando se ejecutan por un ordenador, hacen que el ordenador lleve a cabo las etapas del método según cualquiera de las reivindicaciones 11 a 12.
    Programa de codificación de voz que comprende instrucciones que, cuando se ejecutan por un ordenador, hacen que el ordenador lleve a cabo las etapas del método según la reivindicación 13.
ES18181397T 2011-02-18 2012-02-16 Decodificador de voz, codificador de voz, método de decodificación de voz, método de codificación de voz, programa de decodificación de voz y programa de codificación de voz Active ES2916257T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011033917 2011-02-18
JP2011215591 2011-09-29

Publications (1)

Publication Number Publication Date
ES2916257T3 true ES2916257T3 (es) 2022-06-29

Family

ID=46672679

Family Applications (4)

Application Number Title Priority Date Filing Date
ES22157013T Active ES2949240T3 (es) 2011-02-18 2012-02-16 Codificador de voz y método de codificación de voz
ES18181397T Active ES2916257T3 (es) 2011-02-18 2012-02-16 Decodificador de voz, codificador de voz, método de decodificación de voz, método de codificación de voz, programa de decodificación de voz y programa de codificación de voz
ES12747551T Active ES2745141T3 (es) 2011-02-18 2012-02-16 Decodificador de voz, codificador de voz, método de decodificación de voz, método de codificación de voz, programa de decodificación de voz y programa de codificación de voz
ES19181294T Active ES2913760T3 (es) 2011-02-18 2012-02-16 Codificador de voz y método de codificación de voz

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES22157013T Active ES2949240T3 (es) 2011-02-18 2012-02-16 Codificador de voz y método de codificación de voz

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES12747551T Active ES2745141T3 (es) 2011-02-18 2012-02-16 Decodificador de voz, codificador de voz, método de decodificación de voz, método de codificación de voz, programa de decodificación de voz y programa de codificación de voz
ES19181294T Active ES2913760T3 (es) 2011-02-18 2012-02-16 Codificador de voz y método de codificación de voz

Country Status (19)

Country Link
US (1) US8756068B2 (es)
EP (5) EP4020466B1 (es)
JP (7) JP5977176B2 (es)
KR (7) KR102208914B1 (es)
CN (2) CN104916290B (es)
AU (1) AU2012218409B2 (es)
BR (2) BR112013020987B1 (es)
CA (5) CA3239539A1 (es)
DK (5) DK3998607T3 (es)
ES (4) ES2949240T3 (es)
FI (2) FI3998607T3 (es)
HU (3) HUE058847T2 (es)
MX (2) MX339764B (es)
PL (5) PL3407352T3 (es)
PT (5) PT3567589T (es)
RU (8) RU2599966C2 (es)
SG (1) SG192796A1 (es)
TW (3) TWI547941B (es)
WO (1) WO2012111767A1 (es)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL3407352T3 (pl) * 2011-02-18 2022-08-08 Ntt Docomo, Inc. Dekoder mowy, koder mowy, sposób dekodowania mowy, sposób kodowania mowy, program do dekodowania mowy i program do kodowania mowy
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
US11037923B2 (en) 2012-06-29 2021-06-15 Intel Corporation Through gate fin isolation
TWI477789B (zh) * 2013-04-03 2015-03-21 Tatung Co 資訊擷取裝置及其發送頻率調整方法
BR112015029574B1 (pt) 2013-06-11 2021-12-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método de decodificação de sinal de áudio.
EP4325488A3 (en) 2014-02-28 2024-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoding device, encoding device, decoding method, encoding method, terminal device, and base station device
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
AU2017219696B2 (en) 2016-02-17 2018-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
TWI602173B (zh) * 2016-10-21 2017-10-11 盛微先進科技股份有限公司 音訊處理方法與非暫時性電腦可讀媒體
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
US10650834B2 (en) 2018-01-10 2020-05-12 Savitech Corp. Audio processing method and non-transitory computer readable medium
JP7139628B2 (ja) * 2018-03-09 2022-09-21 ヤマハ株式会社 音処理方法および音処理装置
EP3576088A1 (en) * 2018-05-30 2019-12-04 Fraunhofer Gesellschaft zur Förderung der Angewand Audio similarity evaluator, audio encoder, methods and computer program

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3982070A (en) * 1974-06-05 1976-09-21 Bell Telephone Laboratories, Incorporated Phase vocoder speech synthesis system
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP2000122698A (ja) * 1998-10-19 2000-04-28 Mitsubishi Electric Corp 音声符号化装置
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
JP2001318698A (ja) * 2000-05-10 2001-11-16 Nec Corp 音声符号化装置及び音声復号化装置
JP3404024B2 (ja) * 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7987095B2 (en) * 2002-09-27 2011-07-26 Broadcom Corporation Method and system for dual mode subband acoustic echo canceller with integrated noise suppression
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
KR100708121B1 (ko) * 2005-01-22 2007-04-16 삼성전자주식회사 음성 신호의 대역 확장 방법 및 장치
JP4448464B2 (ja) * 2005-03-07 2010-04-07 日本電信電話株式会社 雑音低減方法、装置、プログラム及び記録媒体
EP1864281A1 (en) * 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
UA92742C2 (ru) * 2005-04-01 2010-12-10 Квелкомм Инкорпорейтед Способ и устройство для кодирования речевых сигналов с расщеплением полосы
ATE421845T1 (de) * 2005-04-15 2009-02-15 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
RU2483368C2 (ru) * 2007-11-06 2013-05-27 Нокиа Корпорейшн Кодер
CN101483495B (zh) * 2008-03-20 2012-02-15 华为技术有限公司 一种背景噪声生成方法以及噪声处理装置
JP5203077B2 (ja) * 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
PT2146344T (pt) * 2008-07-17 2016-10-13 Fraunhofer Ges Forschung Esquema de codificação/descodificação de áudio com uma derivação comutável
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
BR122019023704B1 (pt) * 2009-01-16 2020-05-05 Dolby Int Ab sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
PL3407352T3 (pl) * 2011-02-18 2022-08-08 Ntt Docomo, Inc. Dekoder mowy, koder mowy, sposób dekodowania mowy, sposób kodowania mowy, program do dekodowania mowy i program do kodowania mowy

Also Published As

Publication number Publication date
TWI547941B (zh) 2016-09-01
JP6664526B2 (ja) 2020-03-13
JP6510593B2 (ja) 2019-05-08
PT3567589T (pt) 2022-05-19
US20130339010A1 (en) 2013-12-19
CA3239539A1 (en) 2012-08-23
FI3998607T3 (fi) 2024-04-22
PL3998607T3 (pl) 2024-06-24
JP2021043471A (ja) 2021-03-18
EP3998607A1 (en) 2022-05-18
CA3147525A1 (en) 2012-08-23
EP4020466A1 (en) 2022-06-29
MX2013009464A (es) 2013-12-06
KR20220035287A (ko) 2022-03-21
KR102424902B1 (ko) 2022-07-22
EP3567589A1 (en) 2019-11-13
TWI576830B (zh) 2017-04-01
AU2012218409B2 (en) 2016-09-15
CA3055514A1 (en) 2012-08-23
TW201301263A (zh) 2013-01-01
AU2012218409A1 (en) 2013-09-12
DK4020466T3 (da) 2023-06-26
PL2677519T3 (pl) 2019-12-31
RU2707931C1 (ru) 2019-12-02
JP7252381B2 (ja) 2023-04-04
TW201706983A (zh) 2017-02-16
JP2017194716A (ja) 2017-10-26
WO2012111767A1 (ja) 2012-08-23
KR102068112B1 (ko) 2020-01-20
BR112013020987B1 (pt) 2021-01-19
HUE058847T2 (hu) 2022-09-28
CA2827482A1 (en) 2012-08-23
BR122019027753B1 (pt) 2021-04-20
RU2651193C1 (ru) 2018-04-18
KR102375912B1 (ko) 2022-03-16
EP3998607B1 (en) 2024-03-27
JP7009602B2 (ja) 2022-01-25
EP2677519B1 (en) 2019-08-14
KR20140005256A (ko) 2014-01-14
RU2599966C2 (ru) 2016-10-20
PT3998607T (pt) 2024-04-30
RU2013142349A (ru) 2015-03-27
KR20200003943A (ko) 2020-01-10
BR112013020987A2 (pt) 2016-10-11
CA2827482C (en) 2018-01-02
CA2984936A1 (en) 2012-08-23
JP2022043334A (ja) 2022-03-15
HUE058682T2 (hu) 2022-09-28
CN103370742A (zh) 2013-10-23
PL3567589T3 (pl) 2022-06-06
JP2019091074A (ja) 2019-06-13
KR20220106233A (ko) 2022-07-28
ES2913760T3 (es) 2022-06-06
JP6810292B2 (ja) 2021-01-06
EP3407352B9 (en) 2022-08-10
PT4020466T (pt) 2023-06-27
JP2016218464A (ja) 2016-12-22
EP4020466B1 (en) 2023-05-10
PL4020466T3 (pl) 2023-09-25
RU2630379C1 (ru) 2017-09-07
TWI563499B (es) 2016-12-21
KR102208914B1 (ko) 2021-01-27
EP3407352B1 (en) 2022-05-11
EP2677519A1 (en) 2013-12-25
RU2679973C1 (ru) 2019-02-14
DK2677519T3 (da) 2019-09-23
EP3407352A1 (en) 2018-11-28
DK3567589T3 (da) 2022-05-09
RU2718425C1 (ru) 2020-04-02
DK3998607T3 (da) 2024-04-15
HUE062540T2 (hu) 2023-11-28
KR20200142110A (ko) 2020-12-21
CN104916290B (zh) 2018-11-06
KR20170070286A (ko) 2017-06-21
CN104916290A (zh) 2015-09-16
PL3407352T3 (pl) 2022-08-08
SG192796A1 (en) 2013-09-30
CA3055514C (en) 2022-05-17
RU2742199C1 (ru) 2021-02-03
CA2984936C (en) 2019-10-29
DK3407352T3 (da) 2022-06-07
TW201637001A (zh) 2016-10-16
JP2020077012A (ja) 2020-05-21
JP6189498B2 (ja) 2017-08-30
ES2745141T3 (es) 2020-02-27
JP5977176B2 (ja) 2016-08-24
FI4020466T3 (fi) 2023-06-14
PT3407352T (pt) 2022-06-07
EP2677519A4 (en) 2016-10-19
EP3567589B1 (en) 2022-04-06
PT2677519T (pt) 2019-09-30
MX339764B (es) 2016-06-08
KR102565287B1 (ko) 2023-08-08
CN103370742B (zh) 2015-06-03
KR20180089567A (ko) 2018-08-08
RU2674922C1 (ru) 2018-12-13
US8756068B2 (en) 2014-06-17
JPWO2012111767A1 (ja) 2014-07-07
ES2949240T3 (es) 2023-09-26

Similar Documents

Publication Publication Date Title
ES2916257T3 (es) Decodificador de voz, codificador de voz, método de decodificación de voz, método de codificación de voz, programa de decodificación de voz y programa de codificación de voz
EP2128857B1 (en) Encoding device and encoding method
EP4376304A2 (en) Encoder, decoder, encoding method, decoding method, and program