ES2564504T3 - Aparato de codificación y aparato de descodificación con una ampliación de ancho de banda - Google Patents
Aparato de codificación y aparato de descodificación con una ampliación de ancho de bandaInfo
- Publication number
- ES2564504T3 ES2564504T3 ES11853939.4T ES11853939T ES2564504T3 ES 2564504 T3 ES2564504 T3 ES 2564504T3 ES 11853939 T ES11853939 T ES 11853939T ES 2564504 T3 ES2564504 T3 ES 2564504T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- input signal
- encoder
- coding
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003321 amplification Effects 0.000 claims abstract description 71
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 71
- 230000005284 excitation Effects 0.000 claims abstract description 55
- 238000011002 quantification Methods 0.000 claims description 69
- 230000002441 reversible effect Effects 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 98
- 238000000034 method Methods 0.000 description 88
- 238000001228 spectrum Methods 0.000 description 65
- 238000010586 diagram Methods 0.000 description 54
- 230000008569 process Effects 0.000 description 36
- 230000009466 transformation Effects 0.000 description 24
- 238000005070 sampling Methods 0.000 description 20
- 238000004364 calculation method Methods 0.000 description 15
- 238000010606 normalization Methods 0.000 description 15
- 239000007844 bleaching agent Substances 0.000 description 14
- 238000013139 quantization Methods 0.000 description 14
- 239000000284 extract Substances 0.000 description 13
- 230000001052 transient effect Effects 0.000 description 12
- 238000004061 bleaching Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 6
- 230000007704 transition Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000004088 simulation Methods 0.000 description 4
- 206010011878 Deafness Diseases 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Aparato de codificación, que comprende: una unidad de clasificación de señales (210) configurada para determinar un modo de codificación de una señal de baja frecuencia de una señal de entrada, sobre la base de características de la señal de entrada; un codificador de coeficientes de predicción lineal (LPC) (211) configurado para extraer un LPC de la señal de baja frecuencia de la señal de entrada, y para cuantificar el LPC; un codificador de predicción lineal con excitación por código (CELP) (212) configurado para llevar a cabo una codificación de CELP sobre una señal de excitación de LPC de una señal de baja frecuencia de la señal de entrada extraída usando el LPC, cuando se determina que el modo de codificación de la señal de baja frecuencia de la señal de entrada es un modo de codificación CELP; un codificador de ampliación en el dominio del tiempo (213) configurado para llevar a cabo una codificación de ampliación sobre una señal de alta frecuencia de la señal de entrada, cuando se lleva a cabo una codificación CELP sobre la señal de excitación de LPC; un codificador de audio (214) configurado para llevar a cabo una codificación de audio sobre la señal de excitación de LPC, cuando se determina que el modo de codificación de la señal de baja frecuencia de la señal de entrada es un modo de codificación de audio; y un codificador de ampliación en el dominio de la frecuencia (FD) (215) configurado para llevar a cabo una codificación de ampliación sobre la señal de alta frecuencia de la señal de entrada, cuando se lleva a cabo una codificación de audio sobre la señal de excitación de LPC.
Description
5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Aparato de codificacion y aparato de descodificacion con una ampliacion de ancho de banda.
Campo tecnico
Uno o mas aspectos de la presente invencion se refieren a un aparato para codificar y descodificar una senal de audio, por ejemplo, una senal de habla o una senal de musica, y mas particularmente, a un aparato para codificar y descodificar una senal correspondiente a una banda de alta frecuencia de una senal de audio.
Antecedentes de la tecnica
Una senal correspondiente a una banda de alta frecuencia es menos sensible a una estructura fina de frecuencia que una senal correspondiente a una banda de baja frecuencia. Por ello, cuando se incrementa la eficiencia de codificacion con el fin de eliminar restricciones en relacion con los bits disponibles para codificar una senal de audio, a la senal correspondiente a la banda de baja frecuencia se le asigna un numero elevado de bits y a la senal correspondiente a la banda de alta frecuencia se le asigna un numero relativamente reducido de bits.
Una de las tecnologfas que hace uso del metodo anterior es la replicacion de la banda espectral (SBR). En la SBR, la eficiencia de codificacion se incrementa expresando una senal de alta frecuencia con una envolvente y sintetizando la envolvente durante un proceso de descodificacion. La SBR se basa en caracterfsticas de audicion del ser humano, que presenta una resolucion relativamente baja con respecto a una senal de alta frecuencia.
El documento US 2010/0305956 A1 da a conocer un codificador de audio que comprende una unidad de codificacion multicanal, una unidad de codificacion de senales de ampliacion de ancho de banda, una primera unidad de codificacion de esquemas de codificacion y una segunda unidad de codificacion de esquemas de codificacion. Se da a conocer tambien un descodificador de audio correspondiente.
Descripcion detallada de la invencion
Problema tecnico
La presente invencion proporciona metodos de ampliacion de un ancho de banda de una banda de alta frecuencia, sobre la base de una Replicacion de la Banda Espectral (SBR).
Solucion tecnica
Segun un aspecto de la presente invencion, se proporciona un aparato de codificacion de acuerdo con lo expuesto en la reivindicacion 1.
Segun otro aspecto de la presente invencion, se proporciona un aparato de descodificacion de acuerdo con lo expuesto en la reivindicacion 3.
Breve descripcion de los dibujos
La figura 1 es un diagrama de bloques de un aparato de codificacion y un aparato de descodificacion de acuerdo con una forma de realizacion de la presente invencion.
La figura 2A es un diagrama de bloques de la estructura completa del aparato de codificacion de acuerdo con un ejemplo.
La figura 2B es un diagrama de bloques de la estructura completa del aparato de codificacion de acuerdo con otro ejemplo.
La figura 2C es un diagrama de bloques de un codificador en el dominio de la frecuencia (FD) incluido en un aparato de codificacion, de acuerdo con un ejemplo.
La figura 2D es un diagrama de bloques de la estructura completa de un aparato de codificacion de acuerdo con una forma de realizacion de la presente invencion.
La figura 3 es un diagrama de bloques de un codificador basico incluido en un aparato de codificacion, de acuerdo con un ejemplo.
La figura 4 es un diagrama de bloques de un codificador de ampliacion incluido en un aparato de codificacion, de acuerdo con un ejemplo.
5
10
15
20
25
30
35
40
45
50
55
60
65
La figura 5 es un diagrama de bloques de un codificador de ampliacion incluido en un aparato de codificacion, de acuerdo con otro ejemplo.
La figura 6 es un diagrama de bloques de un generador de senales de base incluido en el codificador de ampliacion, de acuerdo con un ejemplo.
La figura 7 es un diagrama de bloques de un estimador de factores incluido en el codificador de ampliacion, de acuerdo con un ejemplo.
La figura 8 es un diagrama de flujo que ilustra una operacion de un cuantificador de energfa de acuerdo con un ejemplo.
La figura 9 es un diagrama que ilustra un proceso de cuantificacion de energfa, de acuerdo con un ejemplo.
La figura 10 es un diagrama que ilustra un proceso de generacion de una senal artificial, de acuerdo con un ejemplo.
Las figuras 11A y 11B ilustran respectivamente ventanas para la estimacion de una envolvente.
La figura 12A es un diagrama de bloques de un aparato de descodificacion de acuerdo con un ejemplo.
La figura 12B es un diagrama de bloques de un aparato de descodificacion de acuerdo con un ejemplo.
La figura 12C es un diagrama de bloques de un descodificador de FD incluido en un aparato de descodificacion, de acuerdo con un ejemplo.
La figura 12D es un diagrama de bloques de un aparato de descodificacion de acuerdo con una forma de realizacion de la presente invencion.
La figura 13 es un diagrama de bloques de un descodificador de ampliacion incluido en un aparato de descodificacion, de acuerdo con un ejemplo.
La figura 14 es un diagrama de flujo que ilustra una operacion de un cuantificador inverso incluido en el descodificador de ampliacion, de acuerdo con un ejemplo.
La figura 15A es un diagrama de flujo que ilustra un metodo de codificacion de acuerdo con un ejemplo.
La figura 15B es un diagrama de flujo que ilustra un metodo de codificacion de acuerdo con un ejemplo.
La figura 15C es un diagrama de flujo que ilustra un metodo de codificacion de acuerdo con un ejemplo.
La figura 16A es un diagrama de flujo que ilustra un metodo de descodificacion de acuerdo con un ejemplo.
La figura 16B es un diagrama de flujo que ilustra un metodo de descodificacion de acuerdo con otro ejemplo.
La figura 16C es un diagrama de flujo que ilustra un metodo de descodificacion de acuerdo con otro ejemplo.
La figura 17 es un diagrama de bloques de la estructura completa de un aparato de codificacion de acuerdo con otro ejemplo.
La figura 18 es un diagrama de flujo que ilustra una operacion de un cuantificador de energfa incluido en un aparato de codificacion, de acuerdo con otro ejemplo.
La figura 19 es un diagrama que ilustra un proceso de cuantificacion de energfa mediante el uso de un metodo de asignacion desigual de bits, de acuerdo con un ejemplo.
La figura 20 es un diagrama que ilustra una cuantificacion vectorial utilizando una prediccion intra-trama, de acuerdo con un ejemplo.
La figura 21 es un diagrama que ilustra un proceso de cuantificacion de energfa mediante la utilizacion de un metodo de ponderacion de frecuencias, de acuerdo con otro ejemplo.
La figura 22 es un diagrama que ilustra una cuantificacion vectorial que utiliza una cuantificacion vectorial fragmentada y en multiples etapas y una prediccion intra-trama, de acuerdo con un ejemplo.
La figura 23 es un diagrama que ilustra una operacion de un cuantificador inverso incluido en un aparato de descodificacion, de acuerdo con otro ejemplo.
5
10
15
20
25
30
35
40
45
50
55
60
65
La figura 24 es un diagrama de bloques de la estructura completa de un aparato de codificacion de acuerdo con otro ejemplo.
La figura 25 es un diagrama que ilustra flujos continuos de bits de acuerdo con un ejemplo.
La figura 26 es un diagrama que ilustra un metodo de ejecucion de asignacion de frecuencias para cada banda de frecuencias, de acuerdo con un ejemplo.
La figura 27 es un diagrama que ilustra bandas de frecuencias utilizadas en un codificador de FD o un descodificador de FD, de acuerdo con un ejemplo.
Modo de la invencion
En lo sucesivo en la presente memoria se describiran detalladamente formas de realizacion ejemplificativas de la presente invencion haciendo referencia a los dibujos adjuntos.
La figura 1 es un diagrama de bloques de un aparato de codificacion 101 y un aparato de descodificacion 102 de acuerdo con una forma de realizacion de la presente invencion.
El aparato de codificacion 101 puede generar una senal de base (o una senal basica) de una senal de entrada y transmitir la senal de base al aparato de descodificacion 102. La senal de base se genera basandose en una senal de baja frecuencia de la senal de entrada. La senal de base puede ser una senal de excitacion para la ampliacion del ancho de banda de alta frecuencia puesto que la senal de base se obtiene blanqueando informacion de envolvente de la senal de baja frecuencia. El aparato de descodificacion 102 puede reconstruir la senal de entrada a partir de la senal de base. En otras palabras, el aparato de codificacion 101 y el aparato de descodificacion 102 llevan a cabo una ampliacion de ancho de banda a banda super-ancha (SWB BWE). De forma detallada, a traves de la SWB BWE, se puede generar una senal que se corresponde con una banda de alta frecuencia de 6,4 a 16 kHz correspondiente a una SWB basandose en una senal de banda ancha (WB) descodificada que se corresponde con una banda de baja frecuencia de 0 a 6,4 kHz. En este caso, los 16 kHz pueden variar en concordancia con las circunstancias. La senal de WB descodificada se puede generar mediante la utilizacion de un codec de habla de acuerdo con una prediccion lineal con excitacion por codigo (CELP) sobre la base de un dominio de prediccion lineal (LPD) o llevando a cabo una cuantificacion en un dominio de la frecuencia. Un ejemplo de un metodo de ejecucion de una cuantificacion en un dominio de la frecuencia puede incluir una codificacion de audio avanzada (AAC) basada en una transformada de coseno discreta modificada (MDCT).
A continuacion se describiran detalladamente operaciones del aparato de codificacion 101 y del aparato de descodificacion 102.
La figura 2A es un diagrama de bloques de la estructura completa de un aparato de codificacion 101 de acuerdo con un ejemplo.
Haciendo referencia a la figura 2A, el aparato de codificacion 101 puede incluir un diezmador 201, un codificador basico 202, un transformador de frecuencia 203 y un codificador de ampliacion 204.
Para la codificacion de banda ancha (WB), el diezmador 201 puede diezmar una senal de entrada. En general, la senal de entrada, por ejemplo una senal de banda super-ancha (SWB) tiene una velocidad de muestreo de 32 kHz, y se convierte a una senal que tiene una velocidad de muestreo apropiada para la codificacion de WB. Por ejemplo, el diezmador 201 puede diezmar la senal de entrada que tiene, por ejemplo, una velocidad de muestreo de 32 kHz a una senal que tiene, por ejemplo, una velocidad de muestreo de 12,8 kHz.
El codificador basico 202 puede llevar a cabo una codificacion basica sobre la senal de entrada diezmada. En otras palabras, el codificador basico 202 puede llevar a cabo una codificacion de WB. Por ejemplo, el codificador basico 202 puede llevar a cabo una codificacion de WB sobre la base de un metodo de CELP.
El transformador de frecuencia 203 puede llevar a cabo una transformacion de frecuencia sobre la senal de entrada. Por ejemplo, el transformador de frecuencia 203 puede llevar a cabo una Transformada de Fourier Rapida (FFT) o MDCT para llevar a cabo una transformacion de frecuencia sobre la senal de entrada. En lo sucesivo en la presente se considera que se utiliza la MDCT.
El codificador de ampliacion 204 puede llevar a cabo una codificacion de ampliacion de ancho de banda mediante la utilizacion de una senal de base de la senal de entrada en un dominio de la frecuencia. Es decir, el codificador de ampliacion 204 puede llevar a cabo una codificacion de SWB BWE sobre la base de la senal de entrada en el dominio de la frecuencia. En este caso, el codificador de ampliacion 204 no recibe informacion de codificacion, tal como se describira haciendo referencia a la figura 4 posteriormente.
5
10
15
20
25
30
35
40
45
50
55
60
65
Ademas, el codificador de ampliacion 204 puede llevar a cabo una codificacion de ampliacion de ancho de banda sobre la base de las caractensticas de la senal de entrada y una senal de base de la senal de entrada en el dominio de la frecuencia. En este caso, el codificador de ampliacion 204 se puede materializar tal como se ilustra en la figura 4 o en la figura 5 de acuerdo con una fuente de las caractensticas de la senal de entrada.
Posteriormente se describira de forma detallada una operacion del codificador de ampliacion 204 haciendo referencia a la figura 4 y a la figura 5.
Asf, un trayecto superior y un trayecto inferior de la figura 2A indican, respectivamente, un proceso de codificacion basica y un proceso de codificacion de ampliacion de ancho de banda. La informacion de energfa de la senal de entrada se puede transmitir al aparato de descodificacion 102 a traves de una codificacion de SWB BWE.
La figura 2B es un diagrama de bloques de la estructura completa de un aparato de codificacion 101 de acuerdo con otro ejemplo.
Haciendo referencia a la figura 2B, el aparato de codificacion 101 puede incluir una unidad de clasificacion de senales 205, un codificador de CELP 206, un codificador de ampliacion en el dominio del tiempo (TD) 207, un transformador de frecuencia 208 y un codificador en el dominio de la frecuencia (FD) 209.
La unidad de clasificacion de senales 205 determina un modo de codificacion de una senal de entrada, sobre la base de las caractensticas de la senal de entrada. En el presente ejemplo, el modo de codificacion puede ser un metodo de codificacion.
Por ejemplo, la unidad de clasificacion de senales 205 puede determinar un modo de codificacion de la senal de entrada teniendo en cuenta las caractensticas en el dominio del tiempo y las caractensticas en el dominio de la frecuencia de la senal de entrada. Ademas, la unidad de clasificacion de senales 205 determina que se lleve a cabo la codificacion de CELP sobre la senal de entrada cuando las caractensticas de la senal de entrada son una senal de habla y determina que se lleve a cabo la codificacion en FD sobre la senal de entrada cuando las caractensticas de la senal de entrada son una senal de audio.
No obstante, la senal de entrada suministrada a la unidad de clasificacion de senales 205 puede ser una senal diezmada por un diezmador (no mostrado). Por ejemplo, una senal de entrada puede ser una senal que tenga una velocidad de muestreo de 12,8 kHz o 16 kHz mediante un nuevo muestreo de una senal que tenga una velocidad de muestreo de 32 kHz o 48 kHz. El nuevo muestreo puede ser un diezmado.
Tal como se ha descrito anteriormente haciendo referencia a la figura 2A, una senal que tenga una velocidad de muestreo de 32 kHz puede ser una senal de banda super-ancha (SWB). La senal de SWB puede ser una senal de banda completa (FB). Una senal que tiene una velocidad de muestreo de 16 kHz puede ser una senal de WB.
La unidad de clasificacion de senales 205 puede determinar que un modo de codificacion de una senal de baja frecuencia que se corresponde con una banda de baja frecuencia de la senal de entrada es un modo CELP o un modo FD, sobre la base de las caractensticas de la senal de baja frecuencia.
Si se determina que el modo de codificacion de la senal de entrada es el modo CELP, el codificador de CELP 206 realiza una codificacion de CELP sobre la senal de baja frecuencia de la senal de entrada. Por ejemplo, el codificador de CELP 206 puede extraer una senal de excitacion a partir de la senal de baja frecuencia de la senal de entrada, y cuantificar la senal de excitacion extrafda, sobre la base de una contribucion de libros de codigos fijos y una contribucion de libros de codigos adaptativos en correspondencia con informacion de altura tonal.
No obstante, el codificador de CELP 206 puede extraer adicionalmente un coeficiente de prediccion lineal (LPC) a partir de la senal de baja frecuencia de la senal de entrada, cuantificar el LCP extrafdo y extraer una senal de excitacion usando el LPC cuantificado.
Ademas, el codificador de CELP 206 puede llevar a cabo una codificacion de CELP sobre la senal de baja frecuencia de la senal de entrada de acuerdo con diversos modos de codificacion segun las caractensticas de la senal de baja frecuencia de la senal de entrada. Por ejemplo, el codificador de CELP 206 puede llevar a cabo una codificacion de CELP sobre la senal de baja frecuencia de la senal de entrada de acuerdo con uno de, por ejemplo, un modo de codificacion para voz sonora, un modo de codificacion para voz sorda, un modo de codificacion de transicion y un modo de codificacion generico.
Cuando se realiza una codificacion de CELP sobre la senal de baja frecuencia de la senal de entrada, el codificador de ampliacion en TD 207 realiza una codificacion de ampliacion sobre una senal de alta frecuencia de la senal de entrada. Por ejemplo, el codificador de ampliacion en TD 207 cuantifica un LPC de una senal de alta frecuencia que se corresponde con una banda de alta frecuencia de la senal de entrada. En este caso, el codificador de ampliacion en TD 207 puede extraer un LPC de la senal de alta frecuencia de la senal de entrada y cuantificar el LPC extrafdo. Alternativamente, el codificador de ampliacion en TD 207 puede generar un LPC de la senal de alta frecuencia de la
5
10
15
20
25
30
35
40
45
50
55
60
65
senal de entrada utilizando la senal de excitacion de la senal de baja frecuencia de la senal de entrada.
Asf, el codificador de ampliacion en TD 207 puede ser un codificador de ampliacion de alta frecuencia en TD.
Si el modo de codificacion de la senal de entrada se determina como modo de codificacion en FD, el transformador de frecuencia 208 lleva a cabo una transformacion de frecuencia sobre la senal de entrada. Por ejemplo, el transformador de frecuencia 208 puede llevar a cabo una transformacion de frecuencia la cual incluye solapamiento de tramas, por ejemplo, MDCT, sobre la senal de entrada.
El codificador de FD 209 lleva a cabo una codificacion en FD sobre la senal de entrada transformada en frecuencia. Por ejemplo, el codificador de FD 209 puede llevar a cabo una codificacion en FD sobre un espectro de frecuencias transformado por el transformador de frecuencia 208. El codificador de FD 209 se describira de forma detallada posteriormente haciendo referencia a la figura 2C.
El aparato de codificacion 101 puede dar salida a un flujo continuo de bits al codificar la senal de entrada tal como se ha descrito anteriormente. Por ejemplo, el flujo continuo de bits puede incluir un encabezamiento y una carga util.
El encabezamiento puede incluir informacion de modo de codificacion que indica el modo de codificacion utilizado para codificar la senal de entrada. La carga util puede incluir informacion de acuerdo con el modo de codificacion utilizado para codificar la senal de entrada. Si la senal de entrada se codifica de acuerdo con el modo CELP, la carga util puede incluir informacion de CELP e informacion de ampliacion de alta frecuencia en TD. Si la senal de entrada se codifica de acuerdo con el modo FD, la carga util puede incluir datos de prediccion e informacion de FD.
No obstante, en el flujo continuo de bits, el encabezamiento puede incluir ademas informacion de modo de trama previa para reparar un error de trama que pueda producirse. Por ejemplo, si el modo de codificacion de la senal de entrada se determina como modo FD, el encabezamiento puede incluir ademas la informacion de modo de trama previa, tal como se describira posteriormente de forma detallada, haciendo referencia a la figura 25.
Asf, el aparato de codificacion 101 se conmuta para utilizar el modo CELP o el modo FD de acuerdo con las caracterfsticas de la senal de entrada, con lo que se codifica apropiadamente la senal de entrada en concordancia con las caracterfsticas de la senal de entrada. Ademas, el aparato de codificacion 101 utiliza el modo FD de acuerdo con la determinacion de la unidad de clasificacion de senales 205, con lo que se lleva a cabo apropiadamente una codificacion en un entorno de alta velocidad de bits.
La figura 2C es un diagrama de bloques del codificador de FD 209 de acuerdo con un ejemplo.
Haciendo referencia a la figura 2C, el codificador de FD 209 puede incluir un codificador de normalizacion 2091, un codificador de impulsos factorial 2092, un generador de informacion de ruido adicional 2093 y un codificador de ampliacion en FD 2094.
El codificador de normalizacion 2091 extrae energfa de cada banda de frecuencias de una senal de entrada transformada por el transformador de frecuencia 208, y cuantifica la energfa extrafda. Ademas, el codificador de normalizacion 2091 puede llevar a cabo un escalado sobre la base de la energfa extrafda. En este caso, el valor de energfa escalado se puede cuantificar. Por ejemplo, el valor de energfa se puede obtener mediante la utilizacion de un metodo de medicion para medir energfa o potencia que presente una relacion de proporcion con la energfa de una banda de frecuencias.
En un flujo continuo de bits se puede incluir informacion normalizada que es un resultado de la cuantificacion realizada por el codificador de normalizacion 2091 y la misma se puede transmitir junto con el flujo continuo de bits al aparato de descodificacion 102.
Por ejemplo, el codificador de normalizacion 2091 divide un espectro de frecuencia que se corresponde con la senal de entrada en un numero predeterminado de bandas de frecuencia, extrae energfa del espectro de frecuencia para cada banda de frecuencias y cuantifica las energfas extrafdas. El valor cuantificado se puede utilizar para normalizar el espectro de frecuencia.
El codificador de normalizacion 2091 puede codificar ademas el valor cuantificado.
El codificador de impulsos factorial 2092 puede llevar a cabo una codificacion por impulsos factorial (FPC) sobre un valor obtenido al escalar la senal de entrada transformada, mediante la utilizacion de un valor de normalizacion cuantificado. En otras palabras, el codificador de impulsos factorial 2092 puede llevar a cabo una FPC sobre un valor de espectro normalizado por el codificador de normalizacion 2091.
Por ejemplo, el codificador de impulsos factorial 2092 asigna un numero de bits disponibles a cada una de las bandas de frecuencia mencionadas, y lleva a cabo una FPC sobre el valor de espectro normalizado de acuerdo con el numero de bits asignado. En este caso, el numero de bits asignado a cada una de las bandas de frecuencia
5
10
15
20
25
30
35
40
45
50
55
60
65
mencionadas se puede determinar de acuerdo con una velocidad de bits objetivo. Ademas, el codificador de impulsos factorial 2092 puede calcular el numero de bits que se va a asignar a cada una de las bandas de frecuencia mencionadas mediante la utilizacion de un valor de codificacion de normalizacion cuantificado por el codificador de normalizacion 2091. En este caso, el codificador de impulsos factorial 2092 puede llevar a cabo una FPC sobre un espectro transformado en frecuencia que no sea un espectro normalizado.
El generador de informacion de ruido adicional 2093 genera informacion de ruido adicional de acuerdo con la ejecucion de la FPC. Por ejemplo, el generador de informacion de ruido adicional 2093 genera un nivel de ruido apropiado, sobre la base de un resultado de realizacion de una FPC sobre un espectro de frecuencia por parte del codificador de impulsos factorial 2092.
En este caso, la informacion de ruido adicional generada por el generador de informacion de ruido adicional 2093 se puede incluir en un flujo continuo de bits de manera que un lado de descodificacion puede remitir a la informacion de ruido adicional para llevar a cabo un llenado de ruido.
El codificador de ampliacion en FD 2094 lleva a cabo una codificacion de ampliacion sobre una senal de alta frecuencia de la senal de entrada. De manera mas especffica, el codificador de ampliacion en FD 2094 lleva a cabo una ampliacion de alta frecuencia mediante la utilizacion de un espectro de baja frecuencia.
Por ejemplo, el codificador de ampliacion en FD 2094 cuantifica informacion de energfa en el dominio de la frecuencia de una senal de alta frecuencia que se corresponde con una banda de alta frecuencia de la senal de entrada. En este caso, el codificador de ampliacion en FD 2094 puede dividir un espectro de frecuencia que se corresponde con la senal de entrada, en un numero predeterminado de bandas de frecuencia, obtener un valor de energfa a partir del espectro de frecuencia para cada una de las bandas de frecuencia mencionadas, y llevar a cabo una cuantificacion vectorial de multiples etapas (MSVQ) usando el valor de energfa. La MSVQ puede ser una cuantificacion vectorial de multiples etapas.
De manera mas especffica, el codificador de ampliacion en FD 2094 puede llevar a cabo la cuantificacion vectorial (VQ) recopilando informacion de energfa de bandas de frecuencia con numeracion impar de entre el numero predeterminado de bandas de frecuencia, obtener un error predicho en una banda de frecuencias con numeracion par, sobre la base de un valor cuantificado de acuerdo con un resultado de la cuantificacion vectorial, y llevar a cabo una cuantificacion vectorial sobre el error predicho obtenido en una etapa sucesiva.
No obstante, el codificador de ampliacion en FD 2094 puede llevar a cabo una cuantificacion vectorial recopilando informacion de energfa de bandas de frecuencia con numeracion par de entre el numero predeterminado de bandas de frecuencia y obtener un error predicho en una banda de frecuencias con numeracion impar mediante la utilizacion de un valor cuantificado de acuerdo con un resultado de la cuantificacion vectorial.
Es decir, el codificador de ampliacion en FD 2094 obtiene un error predicho en una banda de frecuencias (n+1)esima a partir de un valor cuantificado obtenido al llevar a cabo una cuantificacion vectorial sobre una banda de frecuencias nesima y un valor cuantificado obtenido al llevar a cabo una cuantificacion vectorial sobre una banda de frecuencias (n+2)esima. En este caso, "n" indica un numero natural.
Ademas, con el fin de llevar a cabo una cuantificacion vectorial recopilando informacion de energfa, el codificador de ampliacion en FD 2094 puede simular un metodo de generacion de una senal de excitacion en una banda de frecuencias predeterminada, y puede controlar la energfa cuando las caracterfsticas de la senal de excitacion de acuerdo con un resultado de la simulacion son diferentes de las caracterfsticas de la senal original en la banda de frecuencias predeterminada. En este caso, las caracterfsticas de la senal de excitacion de acuerdo con el resultado de la simulacion y las caracterfsticas de la senal original pueden incluir por lo menos uno de una tonalidad y un factor de ruido. Asf, es posible evitar que se incremente el ruido cuando un lado de descodificacion descodifica energfa real.
El codificador de ampliacion en FD 2094 puede utilizar una ampliacion de ancho de banda multimodo que utiliza varios metodos de generacion de una senal de excitacion de acuerdo con caracterfsticas de una senal de alta frecuencia de la senal de entrada. Por ejemplo, el codificador de ampliacion en FD 2094 puede utilizar uno de un modo normal, un modo armonico y un modo de ruido para cada trama con el fin de generar una senal de excitacion, de acuerdo con las caracterfsticas de la senal de entrada.
Ademas, el codificador de ampliacion en FD 2094 puede generar una senal de una banda de frecuencias que varfa de acuerdo con una velocidad de bits. Es decir, la banda de alta frecuencia que se corresponde con una senal de alta frecuencia sobre la cual el codificador de ampliacion en FD 2094 lleva a cabo una codificacion de ampliacion se puede establecer de manera diferente en concordancia con una velocidad de bits.
Por ejemplo, el codificador de ampliacion en FD 2094 se puede utilizar para generar una senal que se corresponde con una banda de frecuencias de aproximadamente 6,4 a 14,4 kHz con una velocidad de bits de 16 kbps, y generar una senal que se corresponde con una banda de frecuencias de aproximadamente 8 a 16 kHz con una velocidad de
5
10
15
20
25
30
35
40
45
50
55
60
65
bits que es igual o superior a 16 kbps. Ademas, el codificador de ampliacion en FD 2094 lleva a cabo una codificacion de ampliacion sobre una senal de alta frecuencia que se corresponde con una banda de frecuencias de aproximadamente 6,4 a 14,4 kHz con una velocidad de bits de 16 kbps y lleva a cabo una codificacion de ampliacion sobre una senal de alta frecuencia que se corresponde con una banda de frecuencias de aproximadamente 8 a 16 kHz con una velocidad de bits que es igual o superior a 16 kbps.
En este caso, el codificador de ampliacion en FD 2094 puede llevar a cabo una cuantificacion de energfa al compartir el mismo libro de codigos a velocidades de bits diferentes, tal como se describira de forma detallada haciendo referencia a la figura 26 posteriormente.
Si se introduce una trama estacionaria en el codificador de FD 209, pueden funcionar el codificador de normalizacion 2091, el codificador de impulsos factorial 2092, el generador de informacion de ruido adicional 2093 y el codificador de ampliacion en FD 2094 del codificador de FD 209.
No obstante, cuando se introduce una trama transitoria, el codificador de ampliacion en FD 2094 no puede funcionar. En este caso, el codificador de normalizacion 2091 y el codificador de impulsos factorial 2092 pueden establecer un valor de banda superior Fbasica de una banda de frecuencias sobre la que se va a llevar a cabo la FPC, el cual es mas alto que cuando se introduce una trama estacionaria. El valor de banda superior Fbasica se describira posteriormente de forma detallada haciendo referencia a la figura 27.
La figura 2D es un diagrama de bloques de la estructura completa de un aparato de codificacion 101 de acuerdo con una forma de realizacion de la presente invencion.
Haciendo referencia a la figura 2D, el aparato de codificacion 101 puede incluir una unidad de clasificacion de senales 210, un codificador de LPC 211, un codificador de CELP 212, un codificador de ampliacion en TD 213, un codificador de audio 214 y un codificador de ampliacion en FD 215.
La unidad de clasificacion de senales 210 determina un modo de codificacion de una senal de entrada de acuerdo con las caracterfsticas de la senal de entrada. De acuerdo con la presente forma de realizacion, el modo de codificacion puede ser un metodo de codificacion.
Por ejemplo, la unidad de clasificacion de senales 210 determina un modo de codificacion de la senal de entrada sobre la base de caracterfsticas en el dominio del tiempo y caracterfsticas en el dominio de la frecuencia de la senal de entrada. Ademas, la unidad de clasificacion de senales 205 puede determinar que se va a llevar a cabo una codificacion de CELP sobre la senal de entrada cuando las caracterfsticas de la senal de entrada son una senal de voz, y puede determinar que se va a llevar a cabo una codificacion de audio sobre la senal de entrada cuando las caracterfsticas de la senal de entrada son una senal de audio.
El codificador de LPC 211 extrae un LPC a partir de una senal de baja frecuencia de la senal de entrada, y cuantifica el LPC. Por ejemplo, de acuerdo con la presente forma de realizacion, el codificador de LPC 211 puede utilizar, por ejemplo, una cuantificacion con codificacion trellis (TCQ), MSVQ o una cuantificacion vectorial en reticula (lattice) (LVQ) para cuantificar el LPC, aunque la presente invencion no se limita a ello.
De manera mas especffica, el codificador de LPC 211 puede volver a muestrear, por ejemplo, una senal de entrada que tenga una velocidad de muestreo de 32 kHz o 48 kHz para extraer en LPC a partir de una senal de baja frecuencia de la senal de entrada que tiene una velocidad de muestreo de 12,8 kHz o 16 kHz.
Tal como se ha descrito anteriormente haciendo referencia a las figuras 2A y 2B, una senal que tiene una velocidad de muestreo de 32 kHz puede ser una senal de SWB. La senal de SWB puede ser una senal de FB. Ademas, una senal que tiene una velocidad de muestreo de 16 kHz puede ser una senal de WB.
El codificador de LPC 211 puede extraer adicionalmente una senal de excitacion de LPC mediante la utilizacion de la LPC cuantificada, aunque la presente invencion no se limita a ello.
Si el modo de codificacion de la senal de entrada se determina como modo CELP, el codificador de CELP 212 lleva a cabo una codificacion de CELP sobre la senal de excitacion de LPC extrafda utilizando el LPC. Por ejemplo, el codificador de CELP 212 puede cuantificar la senal de excitacion de LPC sobre la base de una contribucion de libros de codigos fijos y una contribucion de libros de codigos adaptativos en correspondencia con informacion de altura tonal. En este caso, la senal de excitacion de LPC puede ser generada por al menos uno del codificador de CELP 212 y el codificador de LPC 211.
De acuerdo con la presente forma de realizacion, el codificador de CELP 212 tambien puede llevar a cabo una codificacion de CELP de acuerdo con varios modos de codificacion segun las caracterfsticas de la senal de baja frecuencia de la senal de entrada. Por ejemplo, el codificador de CELP 206 puede llevar a cabo una codificacion de CELP sobre la senal de baja frecuencia de la senal de entrada mediante la utilizacion de uno del modo de codificacion para voz sonora, el modo de codificacion para voz sorda, el modo de codificacion de transicion o el
5
10
15
20
25
30
35
40
45
50
55
60
65
modo de codificacion generico.
El codificador de ampliacion en TD 213 lleva a cabo una codificacion de ampliacion sobre la senal de alta frecuencia de la senal de entrada cuando se realiza una codificacion de CELP sobre la senal de excitacion de LPC de senal de baja frecuencia de la senal de entrada.
Por ejemplo, el codificador de ampliacion en TD 213 cuantifica un LPC de la senal de alta frecuencia de la senal de entrada. En este caso, el codificador de ampliacion en TD 213 puede extraer un LPC de la senal de alta frecuencia de la senal de entrada usando la senal de excitacion de LPC de la senal de baja frecuencia de la senal de entrada.
Asf, el codificador de ampliacion en TD 213 puede ser un codificador de ampliacion de alta frecuencia en TD, aunque la presente invencion no se limita al mismo.
Si el modo de codificacion de la senal de entrada se determina como modo de codificacion de audio, el codificador de audio 214 lleva a cabo una codificacion de audio sobre la senal de excitacion de LPC extrafda utilizando el LPC.
Por ejemplo, el codificador de audio 214 puede llevar a cabo una transformacion de frecuencia sobre la senal de excitacion de LPC y cuantificar la senal de excitacion de LPC transformada.
En este caso, cuando el codificador de audio 214 lleva a cabo la transformacion de frecuencia, el codificador de audio 214 puede utilizar un metodo de transformacion de frecuencia el cual no incluye solapamiento de tramas, por ejemplo una transformada de coseno discreta (DCT). Ademas, el codificador de audio 214 puede llevar a cabo una cuantificacion sobre un espectro de senal de excitacion transformada por frecuencia de acuerdo con una FPC o una VQ en reticula (lattice) (LVQ).
Ademas, si el codificador de audio 214 tiene bits de reserva para llevar a cabo una cuantificacion sobre la senal de excitacion de LPC, el codificador de audio 214 puede realizar una cuantificacion adicional sobre la base de la informacion de codificacion en TD de una contribucion de libros de codigos fijos y una contribucion de libros de codigos adaptativos.
Cuando se lleva a cabo la codificacion de audio sobre la senal de excitacion de LPC de la senal de baja frecuencia de la senal de entrada, el codificador de ampliacion en FD 215 lleva a cabo una codificacion de ampliacion sobre la senal de alta frecuencia de la senal de entrada. En otras palabras, el codificador de ampliacion en FD 215 puede realizar una ampliacion de alta frecuencia mediante la utilizacion de un espectro de baja frecuencia.
Por ejemplo, el codificador de ampliacion en FD 215 lleva a cabo una cuantificacion sobre informacion de energia en el dominio de la frecuencia de una senal de alta frecuencia que se corresponde con una banda de alta frecuencia de la senal de entrada. En este caso, el codificador de ampliacion en FD 215 puede generar un espectro de frecuencia mediante la utilizacion de un metodo de transformacion de frecuencia, por ejemplo, MDCT, dividir el espectro de frecuencia en un numero predeterminado de bandas de frecuencia, obtener energia del espectro de frecuencia para cada una de las bandas de frecuencia mencionadas y llevar a cabo una MSVQ mediante la utilizacion de la energia. En este caso, la MSVQ puede ser una cuantificacion vectorial de multiples etapas.
De manera mas especffica, el codificador de ampliacion en FD 215 puede llevar a cabo una cuantificacion vectorial recopilando informacion de energia de bandas de frecuencia con numeracion impar de entre el numero predeterminado de bandas de frecuencia, obtener un error predicho en una banda de frecuencias con numeracion par, sobre la base de un valor cuantificado de acuerdo con un resultado de la cuantificacion vectorial, y llevar a cabo una cuantificacion vectorial sobre un error predicho en una etapa sucesiva.
No obstante, la presente invencion no se limita a lo mencionado, y el codificador de ampliacion en FD 215 puede llevar a cabo una cuantificacion vectorial recopilando informacion de energia de bandas de frecuencia con numeracion par de entre el numero predeterminado de bandas de frecuencia y obtener un error predicho en una banda de frecuencias con numeracion impar usando un valor cuantificado de acuerdo con un resultado de la cuantificacion vectorial.
Es decir, el codificador de ampliacion en FD 215 obtiene un error predicho en una banda de frecuencias (n+1)esima al utilizar un valor cuantificado obtenido llevando a cabo una cuantificacion vectorial sobre una banda de frecuencias nesima y un valor cuantificado obtenido llevando a cabo una cuantificacion vectorial sobre una banda de frecuencias (n+2)esima. En este caso, "n" indica un numero natural.
Ademas, con el fin de llevar a cabo una cuantificacion vectorial recopilando informacion de energia, el codificador de ampliacion en FD 215 puede simular un metodo de generacion de una senal de excitacion en una banda de frecuencias predeterminada, y puede controlar la energia cuando caracterfsticas de la senal de excitacion de acuerdo con un resultado de la simulacion son diferentes de las caracterfsticas de la senal original en la banda de frecuencias predeterminada.
5
10
15
20
25
30
35
40
45
50
55
60
65
En este caso, las caracterfsticas de la senal de excitacion de acuerdo con el resultado de la simulacion y las caracterfsticas de la senal original pueden incluir por lo menos uno de una tonalidad y un factor de ruido, aunque la presente invencion no se limita a los mismos. Asf, es posible evitar que se incremente el ruido cuando un lado de descodificacion descodifica energfa real.
El codificador de ampliacion en FD 215 puede utilizar una ampliacion de ancho de banda multi-modo que utiliza varios metodos de generacion de una senal de excitacion de acuerdo con las caracterfsticas de la senal de alta frecuencia de la senal de entrada. Por ejemplo, el codificador de ampliacion en FD 215 puede generar una senal de excitacion al utilizar uno del modo normal, el modo armonico, el modo transitorio o el modo de ruido para cada trama de acuerdo con las caracterfsticas de la senal de entrada. En el modo transitorio, tambien se puede cuantificar informacion de envolvente temporal.
Ademas, de acuerdo con la presente forma de realizacion, el codificador de ampliacion en FD 215 puede generar una senal de una banda de frecuencias que varfa de acuerdo con una velocidad de bits. En otras palabras, una banda de alta frecuencia que se corresponde con una senal de alta frecuencia sobre la cual el codificador de ampliacion en FD 215 lleva a cabo una codificacion de ampliacion se puede establecer de manera diferente segun una velocidad de bits.
Por ejemplo, el codificador de ampliacion en FD 215 se puede utilizar para generar una senal que se corresponde
con una banda de frecuencias de aproximadamente 6,4 a 14,4 kHz con una velocidad de bits de 16 kbps, y generar
una senal que se corresponde con una banda de frecuencias de aproximadamente 8 a 16 kHz con una velocidad de bits que es igual o superior a 16 kbps. Ademas, el codificador de ampliacion en FD 215 puede llevar a cabo una codificacion de ampliacion sobre una senal de alta frecuencia que se corresponde con una banda de frecuencias de aproximadamente 6,4 a 14,4 kHz con una velocidad de bits de 16 kbps, y llevar a cabo una codificacion de
ampliacion sobre una senal de alta frecuencia que se corresponde con una banda de frecuencias de
aproximadamente 8 a 16 kHz a una velocidad de bits que es igual o superior a 16 kbps.
En este caso, de acuerdo con la presente forma de realizacion, el codificador de ampliacion en FD 215 puede llevar a cabo una cuantificacion de energfa al compartir el mismo libro de codigos a diferentes velocidades de bits, tal como se describira posteriormente de forma detallada haciendo referencia a la figura 26.
En la presente forma de realizacion, el aparato de codificacion 101 puede codificar la senal de entrada tal como se ha descrito anteriormente y dar salida a la misma en forma de un flujo continuo de bits codificado. Por ejemplo, el flujo continuo de bits incluye un encabezamiento y una carga util.
En este caso, el encabezamiento puede incluir informacion de modo de codificacion que indica un modo de codificacion utilizado para codificar la senal de entrada. La carga util puede incluir informacion de CELP e informacion de ampliacion de alta frecuencia en TD con la que se codifica la senal de entrada utilizando el modo CELP, y puede incluir datos de prediccion, informacion de codificacion de audio e informacion de ampliacion de alta frecuencia en FD cuando la senal de entrada se codifica usando el modo de codificacion de audio.
El aparato de codificacion 101 se puede conmutar para utilizar el modo CELP o el modo de codificacion de audio de acuerdo con las caracterfsticas de la senal de entrada. Asf, se puede llevar a cabo un modo de codificacion apropiado de acuerdo con las caracterfsticas de la senal de entrada.
Ademas, el aparato de codificacion 101 puede utilizar el modo FD de acuerdo con la determinacion de la unidad de clasificacion de senales 210, con lo que se lleva a cabo apropiadamente una codificacion en un entorno de baja velocidad de bits.
La figura 3 es un diagrama de bloques del codificador basico 202 del aparato de codificacion 101 de acuerdo con un ejemplo.
Haciendo referencia a la figura 3, el codificador basico 202 puede incluir una unidad de clasificacion de senales 301 y un codificador 302.
La unidad de clasificacion de senales 301 puede clasificar caracterfsticas de una senal de entrada diezmada, por ejemplo, 12,8 kHz. En otras palabras, la unidad de clasificacion de senales 301 puede clasificar los modos de codificacion de una senal de entrada como diversos modos de codificacion, de acuerdo con las caracterfsticas de la senal de entrada. Por ejemplo, de acuerdo con un codec ITU-T G.718, la unidad de clasificacion de senales 301 puede clasificar modos de codificacion de una senal de habla como modo de codificacion para voz sonora, modo de codificacion para voz sorda, modo de codificacion de transicion y modo de codificacion generico. El modo de codificacion para voz sorda se disena para codificar tramas de voz sorda y la mayorfa de las tramas inactivas.
El codificador 302 puede llevar a cabo una codificacion optimizada para las caracterfsticas de la senal de entrada clasificada por la unidad de clasificacion de senales 301.
5
10
15
20
25
30
35
40
45
50
55
60
65
La figura 4 es un diagrama de bloques del codificador de ampliacion 204 del aparato de codificacion 101, de acuerdo con un ejemplo.
Haciendo referencia a la figura 4, el codificador de ampliacion 204 puede incluir un generador de senales de base 401, un estimador de factores 402, un extractor de energfa 403, un controlador de energfa 404 y un cuantificador de energfa 405. Por ejemplo, el codificador de ampliacion 204 puede estimar un factor de control de energfa sin recibir informacion sobre un modo de codificacion. Como ejemplo alternativo, el codificador de ampliacion 204 puede estimar un factor de control de energfa usando un modo de codificacion. La informacion sobre el modo de codificacion se puede recibir desde el codificador basico 202.
El generador de senales de base 401 puede generar una senal de base de una senal de entrada usando un espectro de frecuencia de la senal de entrada en un dominio de la frecuencia. La senal de base indica una senal para realizar una SWB BWE, sobre la base de una senal de WB. En otras palabras, la senal de base indica una senal que constituye una estructura fina de una banda de baja frecuencia. Posteriormente se describira de forma detallada haciendo referencia a la figura 6 un proceso de generacion de la senal de base.
Por ejemplo, el estimador de factores 402 puede estimar un factor de control de energfa usando la senal de base. Es decir, el aparato de codificacion 101 transmite informacion de energfa de la senal de entrada para generar una senal de una region de SWB en el aparato de descodificacion 102. En este caso, el estimador de factores 402 puede estimar un factor de control de energfa el cual es un parametro destinado a controlar energfa para el control de informacion de energfa desde un punto de vista perceptual. Posteriormente se describira de forma detallada haciendo referencia a la figura 7 un proceso de estimacion del factor de control de energfa.
Como ejemplo alternativo, el estimador de factores 402 puede estimar el factor de control de energfa al utilizar las caracterfsticas de la senal de base y la senal de entrada. En este caso, las caracterfsticas de la senal de entrada se pueden recibir desde el codificador basico 202.
El extractor de energfa 403 puede extraer energfa de una senal de entrada en una banda de frecuencias. La energfa extrafda se transmite al aparato de descodificacion 102. La energfa se puede extraer en cada banda de frecuencias.
El controlador de energfa 404 puede controlar la energfa extrafda de la senal de entrada, usando el factor de control de energfa. En otras palabras, el controlador de energfa 404 puede controlar energfa al aplicar el factor de control de energfa a energfa extrafda en cada banda de frecuencias.
El cuantificador de energfa 405 puede cuantificar la energfa controlada. La energfa se puede convertir a una escala de dB y a continuacion se puede cuantificar. Especfficamente, el cuantificador de energfa 405 puede calcular energfa global la cual es energfa total, y cuantificar escalarmente la energfa global y las diferencias entre la energfa global y la energfa extrafda en cada banda de frecuencias. Alternativamente, se cuantifica directamente energfa extrafda de una primera banda de frecuencias, y a continuacion se puede cuantificar la diferencia entre energfa extrafda en cada una de las bandas de frecuencia, que no sean la primera banda de frecuencias, y energfa extrafda en una banda de frecuencias precedente. Alternativamente, el cuantificador de energfa 405 puede cuantificar directamente la energfa extrafda en cada banda de frecuencias sin utilizar las diferencias entre energfas extrafdas en bandas de frecuencia. Se puede utilizar una cuantificacion escalar o vectorial cuando la energfa extrafda en cada banda de frecuencias se cuantifica directamente. El cuantificador de energfa 405 se describira mas adelante detalladamente haciendo referencia a las figuras 8 y 9.
La figura 5 es un diagrama de bloques del codificador de ampliacion 204 del aparato de codificacion 101, de acuerdo con otro ejemplo.
Haciendo referencia a la figura 5, el codificador de ampliacion 204 puede incluir ademas una unidad de clasificacion de senales 501, en comparacion con el codificador de ampliacion 204 de la figura 4. Por ejemplo, un estimador de factores 402 puede estimar un factor de control de energfa usando caracterfsticas de una senal de base y una senal de entrada. En este caso, las caracterfsticas de la senal de entrada se pueden recibir desde la unidad de clasificacion de senales 501 mas que desde el codificador basico 202.
La unidad de clasificacion de senales 501 puede clasificar una senal de entrada, por ejemplo, 32 kHz y un espectro de MDCT, de acuerdo con las caracterfsticas de la senal de entrada. De manera detallada, la unidad de clasificacion de senales 501 puede clasificar modos de codificacion de la senal de entrada como varios modos de codificacion, sobre la base de las caracterfsticas de las senales de entrada.
Al clasificar la senal de entrada de acuerdo con caracterfsticas de la senal de entrada, se puede estimar el factor de control de energfa unicamente a partir de senales apropiadas para realizar el proceso de estimacion de factores de control de energfa, y se puede controlar la energfa. Por ejemplo, puede que no resulte apropiado llevar a cabo un proceso de estimacion de factores de control de energfa sobre una senal que no contiene ningun componente tonal, por ejemplo una senal de ruido o una senal de voz sorda. En este caso, si un modo de codificacion de una senal de entrada se clasifica como modo de codificacion para voz sorda, el codificador de ampliacion 204 puede llevar a cabo
5
10
15
20
25
30
35
40
45
50
55
60
65
una codificacion de ampliacion de ancho de banda sin llevar a cabo una estimacion de factores de control de energfa.
El generador de senales de base 401, el estimador de factores 402, el extractor de energfa 403, el controlador de energfa 404 y el cuantificador de energfa 405 ilustrados en la figura 5 son tal como se ha descrito anteriormente haciendo referencia a la figura 4.
La figura 6 es un diagrama de bloques del generador de senales de base 401 incluido en el codificador de ampliacion 204, de acuerdo con un ejemplo.
Haciendo referencia a la figura 6, el generador de senales de base 401 puede incluir un generador de senales artificiales 601, un estimador de envolventes 602 y una unidad de aplicacion de envolventes 603.
El generador de senales artificiales 601 puede generar una senal artificial que se corresponde con una banda de alta frecuencia al copiar y plegar una banda de baja frecuencia de una senal de entrada en una banda de frecuencias. En otras palabras, el generador de senales artificiales 601 puede generar una senal artificial en una region de dominio de SWB copiando un espectro de baja frecuencia de la senal de entrada en el dominio de la frecuencia. Posteriormente se describira de forma detallada haciendo referencia a la figura 6 un proceso de generacion de la senal artificial.
El estimador de envolventes 602 puede estimar una envolvente de una senal de base usando una ventana. La envolvente de la senal de base se puede utilizar para eliminar informacion de envolvente sobre una banda de baja frecuencia incluida en un espectro de frecuencia de la senal artificial en la region de SWB. Se puede determinar una envolvente de un fndice de frecuencia particular usando espectros de frecuencia antes y despues de la frecuencia particular. La envolvente de la senal de base tambien se puede estimar a traves de una media movil. Por ejemplo, si se utiliza la MDCT para una transformacion de frecuencia, la envolvente de la senal de base se puede estimar a traves de un valor absoluto del espectro de frecuencia que se transforma por MDCT.
En este caso, el estimador de envolventes 602 puede formar bandas blanqueadoras, calcular el promedio de la magnitud de frecuencia en cada una de las bandas blanqueadoras y estimar el promedio de la magnitud de frecuencia de una banda blanqueadora como una envolvente de frecuencias pertenecientes a la banda blanqueadora. El numero de espectros de frecuencia pertenecientes a la banda blanqueadora se puede fijar de manera que sea menor que el numero de bandas a partir de las cuales se extrae energfa.
Si el promedio de la magnitud de frecuencia calculado en cada una de las bandas blanqueadoras se estima como una envolvente de una frecuencia perteneciente a la banda blanqueadora, el estimador de envolventes 602 puede transmitir informacion que indica si el numero de espectros de frecuencia que pertenecen a las bandas blanqueadoras es elevado o reducido, para controlar el grado de planitud de la senal de base. Por ejemplo, el estimador de envolventes 602 puede transmitir dicha informacion en funcion de dos tipos en los que el numero de espectros de frecuencia es ocho o tres. Si el numero de espectros de frecuencia es tres, el grado de planitud de la senal de base puede ser mayor que cuando el numero de espectros de frecuencia es ocho.
Alternativamente, el estimador de envolventes 602 puede no transmitir la informacion que indica si el numero de espectros de frecuencia que pertenecen a las bandas blanqueadoras es elevado o reducido, y puede determinar el grado de planitud de la senal de base de acuerdo con un modo de codificacion utilizado por el codificador basico 202. El codificador basico 202 puede clasificar un modo de codificacion de una senal de entrada como modo de codificacion para voz sonora, modo de codificacion para voz sorda, modo de codificacion de transicion, o modo de codificacion generico sobre la base de las caracterfsticas de la senal de entrada, y puede codificar la senal de entrada.
En este caso, el estimador de envolventes 602 puede controlar un numero de espectros de frecuencia que pertenecen a las bandas blanqueadoras, sobre la base de un modo de codificacion de acuerdo con las caracterfsticas de la senal de entrada. Por ejemplo, si la senal de entrada se codifica de acuerdo con el modo de codificacion para voz sonora, el estimador de envolventes 602 puede estimar una envolvente de la senal de base formando tres espectros de frecuencia en la banda blanqueadora. Si la senal de entrada se codifica de acuerdo con un modo de codificacion diferente al modo de codificacion para voz sonora, el estimador de envolventes 602 puede estimar una envolvente de la senal de base formando tres espectros de frecuencia en la banda blanqueadora.
La unidad de aplicacion de envolventes 603 puede aplicar la envolvente estimada a la senal artificial. Dicho proceso se corresponde con un proceso de blanqueamiento. La senal artificial puede ser aplanada por la envolvente. La unidad de aplicacion de envolventes 603 puede generar una senal de base al dividir la senal artificial de acuerdo con la envolvente de cada uno de los indices de frecuencia.
La figura 7 es un diagrama de bloques del estimador de factores 402 incluido en el codificador de ampliacion 204, de acuerdo con un ejemplo.
5
10
15
20
25
30
35
40
45
50
55
Haciendo referencia a la figura 7, el estimador de factores 402 puede incluir un primer modulo de calculo de tonalidades 701, un segundo modulo de calculo de tonalidades 702 y un modulo de calculo de factores 703.
El primer modulo de calculo de tonalidades 701 puede calcular una tonalidad de una banda de alta frecuencia de una senal de entrada en un dominio de la frecuencia. En otras palabras, el primer modulo de calculo de tonalidades 701 puede calcular una tonalidad de una region de SWB la cual es una banda de alta frecuencia de una senal de entrada en un dominio de la frecuencia.
El segundo modulo de calculo de tonalidades 702 puede calcular una tonalidad de una senal de base.
Las tonalidades se pueden calcular midiendo la planitud espectral. De manera detallada, las tonalidades se pueden calcular usando la siguiente Ecuacion (1). La planitud espectral se puede medir utilizando la relacion entre una media geometrica y una media aritmetica del espectro de la frecuencia.
T = mm(10*IoglO
f *-i i ^
nm*
hO
"P^I--------
/r, 0.999)
T: tonalidad, S(k): espectro,
N: longitud de coeficientes espectrales, r constante ...(1)
El modulo de calculo de factores 703 puede calcular un factor de control de energfa usando la tonalidad de la banda de alta frecuencia de la senal de entrada y la tonalidad de la senal de base. En este caso, el factor de control de energfa se puede calcular con:
.No
Nh
,To. tonalidad del espectro original, Tb: tonalidad del espectro de base
,No. factor de ruido del espectro original, N>: factor de ruido del espectro de base ....(2),
donde "a" indica el factor de control de energfa, "To" indica la tonalidad de la senal de entrada, y "Tb" indica la tonalidad de la senal de base. Ademas, "Nb" indica un factor de ruido que indica un grado de contencion de una componente de ruido en una senal.
El factor de control de energfa se puede calcular con:
El modulo de calculo de factores 703 puede calcular un factor de control de energfa para cada banda de frecuencias. El factor de control de energfa calculado se puede aplicar a la energfa de la senal de entrada. En este caso, el factor de control de energfa se puede aplicar a la energfa de la senal de entrada cuando el factor de control de energfa es menor que un factor de control de energfa de umbral predeterminado.
La figura 8 es un diagrama de flujo que ilustra una operacion del cuantificador de energfa 405 de acuerdo con un ejemplo.
En la operacion S801, el cuantificador de energfa 405 puede pre-procesar vectores de energfa mediante la utilizacion de un factor de control de energfa y puede seleccionar un vector secundario del vector de energfa pre- procesado. Por ejemplo, el cuantificador de energfa 405 puede restar de cada uno de los vectores de energfa un promedio de los vectores de energfa o puede calcular un peso en relacion con la importancia de cada uno de los vectores de energfa. En este caso, el peso se puede calcular de tal manera que se pueda maximizar la calidad de un sonido sintetico.
Ademas, el cuantificador de energfa 405 puede seleccionar apropiadamente un vector secundario del vector de energfa sobre la base de la eficiencia de la codificacion. Ademas, el cuantificador de energfa 405 puede seleccionar un vector secundario en el mismo intervalo de tiempo para mejorar la eficiencia de interpolacion.
Por ejemplo, el cuantificador de energfa 405 puede seleccionar el vector secundario de acuerdo con la siguiente Ecuacion (4).
kxn (n = 0, ..., N), k>2, indica un numero entero mas grande que es menor que una dimension de vector (4)
5
10
15
20
25
30
35
40
45
50
55
60
En este caso, si k=2, entonces unicamente se seleccionan numeros pares.
En la operacion S802, el cuantificador de energfa 405 cuantifica y cuantifica inversamente el vector secundario seleccionado. El cuantificador de energfa 405 puede cuantificar el vector secundario al seleccionar un fndice de cuantificacion para minimizar un error cuadratico medio (MSE) calculado utilizando la siguiente Ecuacion (5).
MSE:d[x,y] =iXk=i[xk-yk]2 (5)
El cuantificador de energfa 405 puede cuantificar el vector secundario usando una cuantificacion escalar, una cuantificacion vectorial, una TCQ o una LVQ. En la cuantificacion vectorial, puede llevarse a cabo una MSVQ o una VQ fragmentada o pueden llevarse a cabo de manera simultanea una VQ fragmentada y una VQ de multiples etapas. El fndice de cuantificacion se transmite al aparato de descodificacion 102.
Cuando los pesos se calculan durante el pre-procesado, el cuantificador de energfa 405 puede calcular un fndice de cuantificacion optimizado usando un MSE ponderado (WMSE). En este caso, el WMSE se puede calcular con:
WMSE:d[x,y] =k.Xk=iWk[Xk-yk]2 (6)
En la operacion S803, el cuantificador de energfa 405 puede interpolar los restantes vectores secundarios que no se seleccionan.
En la operacion S804, el cuantificador de energfa 405 puede calcular errores de interpolacion que son las diferencias entre los vectores secundarios restantes interpolados y los vectores secundarios originales que coinciden con los vectores de energfa.
En la operacion S805, el cuantificador de energfa 405 cuantifica y cuantifica inversamente el error de interpolacion. En este caso, el cuantificador de energfa 405 puede cuantificar el error de interpolacion usando el fndice de cuantificacion para minimizar el MSE. El cuantificador de energfa 405 puede cuantificar el error de interpolacion usando una cuantificacion escalar, una cuantificacion vectorial, una TCQ o una LVQ. En este caso, en la cuantificacion vectorial, se puede realizar una MSVQ o una VQ fragmentada o se puede llevar a cabo simultaneamente una VQ fragmentada y una MSVQ. Si los pesos se calculan durante el pre-procesado, el cuantificador de energfa 405 puede calcular un fndice de cuantificacion optimizado usando un WMSE.
En la operacion S806, el cuantificador de energfa 405 puede calcular los vectores secundarios restantes, que no se seleccionan, interpolando los vectores secundarios cuantificados los cuales se seleccionan y puede calcular un valor de energfa cuantificado adicionando los errores de interpolacion cuantificados calculados en la operacion S805. Ademas, el cuantificador de energfa 405 puede calcular una energfa cuantificada final al volver a adicionar el promedio, el cual se resta en el pre-procesado, durante el pre-procesado.
En la MSVQ, el cuantificador de energfa 405 lleva a cabo una cuantificacion usando K candidatos de vector secundario para mejorar el rendimiento de la cuantificacion sobre la base del mismo libro de codigos. Si "K" es igual o superior a "2", el cuantificador de energfa 405 puede determinar candidatos optimos de vectores secundarios al llevar a cabo una medicion de la distorsion. En este caso, la medicion de la distorsion se puede determinar de acuerdo con uno de los dos siguientes metodos.
En primer lugar, el cuantificador de energfa 405 puede generar un fndice establecido para minimizar MSEs o WMSEs para cada uno de los candidatos de vector secundario en cada una de las etapas, y seleccionar un candidato de vector secundario que presente la suma mas pequena de MSEs o WMSEs en la totalidad de las etapas de entre los candidatos de vector secundario. En este caso, la cantidad de calculo es reducida.
En segundo lugar, el cuantificador de energfa 405 puede generar un fndice establecido para minimizar MSEs o WMSEs para cada uno de los candidatos de vector secundario en cada una de las etapas, reconstruir un vector de energfa a traves de una cuantificacion inversa, y seleccionar un candidato de vector secundario para minimizar el MSE o WMSE entre el vector de energfa reconstruido y el vector de energfa original. En este caso, la cantidad de calculo se incrementa debido a la reconstruccion del vector de energfa, pero el rendimiento es mejor puesto que los MSEs se calculan utilizando valores realmente cuantificados.
La figura 9 es un diagrama que ilustra un proceso de cuantificacion de energfa, de acuerdo con un ejemplo.
Haciendo referencia a la figura 9, un vector de energfa representa 14 dimensiones. En una primera etapa, el cuantificador de energfa 405 selecciona vectores secundarios que se corresponden con la dimension 7 al seleccionar vectores secundarios con numeracion par del vector de energfa. En la primera etapa, el cuantificador de energfa 405 utiliza una cuantificacion vectorial de segunda etapa, fragmentada en dos, para mejorar el rendimiento.
5
10
15
20
25
30
35
40
45
50
55
60
El cuantificador de energfa 405 lleva a cabo una cuantificacion en la segunda etapa usando una senal de error de la primera etapa. El cuantificador de energfa 405 calcula un error de interpolacion cuantificando de manera inversa los vectores secundarios seleccionados, y cuantifica el error de interpolacion a traves de una cuantificacion vectorial de tercera etapa, fragmentada en dos.
La figura 10 es un diagrama que ilustra un proceso de generacion de una senal artificial, de acuerdo con un ejemplo.
Haciendo referencia a la figura 10, el generador de senales artificiales 601 puede copiar un espectro de frecuencia 1001 que se corresponde con una banda de baja frecuencia de fL a 6,4 kHz de una banda de frecuencias completa. El espectro de frecuencia 1001 copiado se desplaza a una banda de frecuencias de 6,4 a 12,8-fL kHz. Se puede generar un espectro de frecuencia que se corresponde con la banda de frecuencias de 12,8-fL a 16 kHz plegando un espectro de frecuencia correspondiente a la banda de frecuencias de 6,4 a 12,8-fL kHz. En otras palabras, de 6,4 a 16 kHz se genera una senal artificial que se corresponde con una region de SWB la cual es una banda de alta frecuencia.
Si se lleva a cabo una MDCT para generar el espectro de frecuencia, entonces hay presente una correlacion entre fL y 6,4 kHz. De manera detallada, cuando un fndice de frecuencia de MDCT correspondiente a 6,4 kHz es un numero par, un fndice de frecuencia de fL es tambien un numero par. Por contraposicion, si el fndice de frecuencia de MDCT correspondiente a 4 kHz es un numero impar, el fndice de frecuencia de fL es tambien un numero impar.
Por ejemplo, cuando se aplica una MDCT para extraep 640 espectros de frecuencia de la senal de entrada original, un fndice correspondiente a 6,4 kHz es un fndice 256esimo (es decir, 6.400/16.000*640), es decir un numero par. En este caso, fL tambien se selecciona como numero par. En otras palabras, para fL se puede utilizar 2(50 Hz) o 4(100 Hz). Este proceso tambien se puede utilizar durante un proceso de descodificacion.
Las figuras 11A y 11B, respectivamente, ilustran ventanas 1101 y 1102 para calcular una envolvente.
Haciendo referencia a las figuras 11A y 11B, un punto de pico en cada una de las ventanas 1101 y 1102 indica un fndice de frecuencia para la estimacion de una envolvente actual. La envolvente actual de la senal de base se puede estimar con:
Env(n$ =
%
w(k
n + d)*|,(k)|
Env(n): Envolvente, w(k): ventana, S(k): Espectro, n: fndice de frecuencia,
2d + 1: longitud de la ventana ...(7)
Haciendo referencia a las figuras 11A y 11B, las ventanas 1101 y 1102 se pueden utilizar de manera fija, y en este caso no es necesario transmitir bits adicionales. Si la ventana 1101 o 1102 se utiliza selectivamente, es necesario expresar con bits informacion que indica si la ventana 1101 o 1102 se uso para estimar la envolvente y la misma se puede transmitir adicionalmente al aparato de descodificacion 102. Los bits se pueden transmitir para cada banda de frecuencias o se pueden transmitir de una sola vez en una trama.
Cuando se utiliza la ventana 1102, en comparacion con cuando se utiliza la ventana 1101, se adiciona ademas un peso a un espectro de frecuencia en correspondencia con un fndice de frecuencia actual para la estimacion de una envolvente. Asf, la senal de base generada utilizando la ventana 1102 es mas plana que la generada utilizando la ventana 1101. El tipo de ventana de entre las ventanas 1101 y 1102 se puede seleccionar comparando cada una de las senales de base generadas por la ventana 1101 y la ventana 1102 con un espectro de frecuencia de una senal de entrada. Si no, de entre las ventanas 1101 y 1102 se puede seleccionar una ventana que tenga una tonalidad que sea la mas parecida a una tonalidad de una banda de alta frecuencia a traves de una comparacion de la tonalidad de la banda de alta frecuencia. Alternativamente, de entre las ventanas 1101 y 1102 se puede seleccionar una ventana que presente la mayor correlacion con la banda de alta frecuencia a traves de una comparacion de correlaciones.
La figura 12A es un diagrama de bloques del aparato de descodificacion 102 de acuerdo con un ejemplo.
Un proceso de descodificacion realizado por el aparato de descodificacion 102 de la figura 12A es un proceso inverso al proceso realizado por el aparato de codificacion 101 de la figura 2A. Haciendo referencia a la figura 12A, el aparato de descodificacion 102 puede incluir un descodificador basico 1201, un sobremuestreador 1202, un transformador de frecuencia 1203, un descodificador de ampliacion 1204 y un transformador de frecuencia inverso 1205.
El descodificador basico 1201 puede llevar a cabo una descodificacion basica sobre una senal de entrada codificada de forma basica contenida en un flujo continuo de bits. A traves de la descodificacion basica se puede extraer una senal que presente una velocidad de muestreo de 12,8 kHz.
5
10
15
20
25
30
35
40
45
50
55
60
65
El sobremuestreador 1202 puede sobremuestrear la senal de entrada descodificada de forma basica. A traves del sobremuestreo, se puede extraer una senal que presente una velocidad de muestreo de 32 kHz.
El transformador de frecuencia 1204 puede llevar a cabo una transformacion de frecuencia sobre la senal de entrada sobremuestreada. En este caso, se puede utilizar la misma transformacion de frecuencia que se utilizo en el aparato de codificacion 101 Por ejemplo, se puede usar una MDCT.
El descodificador de ampliacion 1204 puede llevar a cabo una descodificacion de ampliacion de ancho de banda usando la senal de entrada de la banda de frecuencias y la energfa de la senal de entrada contenida en el flujo continuo de bits. Posteriormente se describira de forma detallada, haciendo referencia a la figura 9, una operacion del descodificador de ampliacion 1204.
El transformador de frecuencia inverso 1205 puede llevar a cabo una transformacion de frecuencia inversa sobre un resultado de la ejecucion de una descodificacion de ampliacion de ancho de banda. En otras palabras, la transformacion de frecuencia inversa puede ser una operacion inversa de la transformacion de frecuencia realizada por el transformador de frecuencia 1204. Por ejemplo, la transformacion de frecuencia inversa puede ser una Transformada de Coseno Discreta Modificada Inversa (IMDCT).
La figura 12B es un diagrama de bloques del aparato de descodificacion 102 de acuerdo con otro ejemplo.
Un proceso de descodificacion realizado por el aparato de descodificacion 102 de la figura 12B es un proceso inverso al proceso de la figura 12A. Haciendo referencia a la figura 12B, el aparato de descodificacion 102 puede incluir una unidad de comprobacion de informacion de modo 1206, un descodificador de CELP 1207, un descodificador de ampliacion en TD 1208, un descodificador de FD 1209 y un transformador de frecuencia inverso 1210.
La unidad de comprobacion de informacion de modo 1206 comprueba informacion de modo de cada una de las tramas incluidas en un flujo continuo de bits. El flujo continuo de bits puede ser una senal que se corresponde con un flujo continuo de bits de acuerdo con un resultado de la codificacion llevada a cabo por el aparato de codificacion 101 y transmitido al aparato de descodificacion 102.
Por ejemplo, la unidad de comprobacion de informacion de modo 1206 analiza sintacticamente informacion de modo del flujo continuo de bits, y lleva a cabo una operacion de conmutacion a uno de un modo de descodificacion de CELP o un modo de descodificacion en FD de acuerdo con un modo de codificacion de una trama actual, en concordancia con el resultado del analisis sintactico.
De manera mas especffica, la unidad de comprobacion de informacion de modo 1206 puede llevar a cabo una conmutacion, con respecto a cada una de las tramas incluidas en el flujo continuo de bits, de tal manera que una trama codificada de acuerdo con el modo CELP se pueda descodificar por CELP y una trama codificada de acuerdo con el modo FD se pueda descodificar en FD.
El descodificador de CELP 1207 lleva a cabo una descodificacion de CELP sobre la trama codificada de acuerdo con el modo CELP, sobre la base del resultado de la comprobacion. Por ejemplo, el descodificador de CELP 1207 descodifica un LPC incluido en el flujo continuo de bits, descodifica contribuciones de libros de codigos adaptativos y fijos, combina resultados de la descodificacion y genera una senal de baja frecuencia que se corresponde con una senal descodificada para la banda de baja frecuencia.
El descodificador de ampliacion en TD 1208 genera una senal descodificada para la banda de alta frecuencia usando por lo menos uno del resultado de la ejecucion de una descodificacion de CELP y una senal de excitacion de la senal de baja frecuencia. En este caso, la senal de excitacion de la senal de baja frecuencia se puede incluir en el flujo continuo de bits. Ademas, el descodificador de ampliacion en TD 1208 puede utilizar informacion de LPC sobre la senal de alta frecuencia incluida en el flujo continuo de bits para generar la senal de alta frecuencia que se corresponde con una senal descodificada para la banda de alta frecuencia.
Ademas, el descodificador de ampliacion en TD 1208 puede generar una senal descodificada combinando la senal de alta frecuencia con la senal de baja frecuencia generada por el descodificador de CELP 1207. Para generar la senal descodificada, el descodificador de ampliacion en TD 1208 puede convertir ademas las velocidades de muestreo de la senal de baja frecuencia y la senal de alta frecuencia de modo que sean iguales.
El descodificador de FD 1209 lleva a cabo una descodificacion en FD sobre la trama codificada en FD. El descodificador de FD 1209 puede generar un espectro de frecuencia descodificando el flujo continuo de bits. Ademas, el descodificador de FD 1209 puede llevar a cabo una descodificacion sobre el flujo continuo de bits, sobre la base de informacion de modo de una trama previa incluida en el flujo continuo de bits. En otras palabras, el descodificador de FD 1209 puede llevar a cabo una descodificacion en FD sobre las tramas codificadas en FD, basandose en la informacion de modo de la trama previa incluida en el flujo continuo de bits, tal como se describira
5
10
15
20
25
30
35
40
45
50
55
60
65
posteriormente de forma detallada haciendo referencia a la figura 25. El descodificador de FD 1209 se describira posteriormente de forma detallada haciendo referencia a la figura 12C.
El transformador de frecuencia inverso 1210 lleva a cabo una transformacion de frecuencia inversa sobre el resultado de la ejecucion de la descodificacion en FD. El transformador de frecuencia inverso 1210 genera una senal descodificada al llevar a cabo una transformacion de frecuencia inversa sobre un espectro de frecuencia descodificado en FD. Por ejemplo, el transformador de frecuencia inverso 1210 puede llevar a cabo una MDCT Inversa aunque la presente invencion no se limita a la misma.
Por consiguiente, el aparato de descodificacion 102 puede llevar a cabo una descodificacion sobre el flujo continuo de bits, sobre la base de los modos de codificacion de cada una de las tramas del flujo continuo de bits.
La figura 12C es un diagrama de bloques del descodificador de FD 1209 incluido en el aparato de descodificacion 102, de acuerdo con un ejemplo.
Un proceso de descodificacion realizado por el descodificador de FD 1209 de la figura 12C es un proceso inverso al proceso de la figura 12B. Haciendo referencia a la figura 12C, el descodificador de FD 1209 puede incluir un descodificador de normalizacion 12091, un descodificador de FPC 12092, una unidad de ejecucion de llenado de ruido 12093 y un descodificador de ampliacion en FD 12094. El descodificador de ampliacion en FD 12094 puede incluir un descodificador de ampliacion de baja frecuencia en FD 12095 y un descodificador de ampliacion de alta frecuencia en FD 12096.
El descodificador de normalizacion 12091 lleva a cabo una descodificacion de normalizacion sobre la base de informacion de normalizacion de un flujo continuo de bits. La informacion de normalizacion puede ser informacion de acuerdo con un resultado de codificacion por parte del codificador de normalizacion 2091 de la figura 2C.
El descodificador de FPC 12092 lleva a cabo una descodificacion de FPC sobre la base de informacion de FPC del flujo continuo de bits. La informacion de FPC puede ser informacion de acuerdo con un resultado de codificacion por parte del codificador de impulsos factorial 2092 de la figura 2C.
Por ejemplo, el descodificador de FPC 12092 lleva a cabo una descodificacion de FPC al asignar un numero de bits disponible en cada banda de frecuencias, de forma similar a la codificacion realizada por el codificador de impulsos factorial 2092 de la figura 2C.
La unidad de ejecucion de llenado de ruido 12093 lleva a cabo un llenado de ruido sobre un resultado de la ejecucion de la descodificacion de FPC. Por ejemplo, la unidad de ejecucion de llenado de ruido 12093 anade ruido a bandas de frecuencia sobre las cuales se lleva a cabo una descodificacion de FPC. En este caso, la unidad de ejecucion de llenado de ruido 12093 anade ruido hasta las ultimas bandas de frecuencia de las bandas de frecuencia sobre las cuales se lleva a cabo la descodificacion de FPC, tal como se describira haciendo referencia a la figura 27 posteriormente.
El descodificador de ampliacion en FD 12094 puede incluir un descodificador de ampliacion de baja frecuencia en FD 12095 y un descodificador de ampliacion de alta frecuencia en FD 12096.
Si un valor de banda superior Ffpc de las bandas de frecuencia que llevan a cabo una descodificacion de FPC es menor que un valor de banda superior Fbasica de las bandas de frecuencia que realizan la codificacion de FPC, el descodificador de ampliacion de baja frecuencia en FD 12095 lleva a cabo una codificacion de ampliacion sobre un resultado de la ejecucion de una descodificacion de FPC y un resultado de la ejecucion de un llenado de ruido.
Asf, el descodificador de ampliacion de baja frecuencia en FD 12095 genera espectros de frecuencia hasta el valor de banda superior Fbasica de bandas de frecuencia que llevan a cabo una codificacion FPC, mediante la utilizacion de espectros de frecuencia generados por una descodificacion de FPC y un llenado de ruido.
Tal como se ha descrito anteriormente, se pueden generar espectros de baja frecuencia descodificados al multiplicar los espectros de frecuencia generados por el descodificador de ampliacion de baja frecuencia en FD 12095 por un valor de normalizacion descodificado por el descodificador de normalizacion 12091.
No obstante, cuando el descodificador de ampliacion de baja frecuencia en FD 12095 no funciona, se pueden generar espectros de baja frecuencia descodificados al multiplicar los espectros de frecuencia generados por la ejecucion de una descodificacion de FPC y la ejecucion de un llenado de ruido por el valor de normalizacion descodificado por el descodificador de normalizacion 12091.
El descodificador de ampliacion de alta frecuencia en FD 12096 lleva a cabo una descodificacion de ampliacion de alta frecuencia usando los resultados de ejecucion de una descodificacion de FPC y de ejecucion de un llenado de ruido. El descodificador de ampliacion de alta frecuencia en FD 12096 funciona de manera que se corresponde con el codificador de ampliacion en FD 2094 de la figura 2C.
5
10
15
20
25
30
35
40
45
50
55
60
65
Por ejemplo, el descodificador de ampliacion de alta frecuencia en FD 12096 puede cuantificar inversamente energfa de alta frecuencia sobre la base de informacion de energfa de alta frecuencia del flujo continuo de bits, generar una senal de excitacion de una senal de alta frecuencia usando una senal de baja frecuencia de acuerdo con diversos modos de ampliacion de ancho de banda de alta frecuencia y generar una senal de alta frecuencia descodificada de acuerdo con la aplicacion de una ganancia de manera que la energfa de la senal de excitacion puede ser simetrica a la energfa cuantificada inversamente. Por ejemplo, los diversos modos de ampliacion de ancho de banda de alta frecuencia pueden incluir el modo normal, el modo armonico o el modo de ruido.
En este caso, el descodificador de ampliacion de alta frecuencia en FD 12096 puede llevar a cabo una cuantificacion inversa de energfa al compartir el mismo libro de codigos con respecto a diferentes velocidades de bits, tal como se describira de forma detallada haciendo referencia a la figura 26 posteriormente.
Si una trama que se va a descodificar es una trama estacionaria, pueden funcionar el descodificador de normalizacion 12091, el descodificador de FPC 12092, la unidad de ejecucion de llenado de ruido 12093 y el descodificador de ampliacion en FD 12094 incluido en el descodificador de FD 1209.
No obstante, si la trama que se va a descodificar es una trama transitoria, el descodificador de ampliacion en FD 12094 no puede funcionar.
La figura 12D es un diagrama de bloques del aparato de descodificacion 102 de acuerdo con otra forma de realizacion de la presente invencion.
Un proceso de descodificacion realizado por el aparato de descodificacion 102 de la figura 12D es un proceso inverso al proceso de la figura 2D. Haciendo referencia a la figura 12D, el aparato de descodificacion 102 puede incluir una unidad de comprobacion de informacion de modo 1211, un descodificador de LPC 1212, un descodificador de CELP 1213, un descodificador de ampliacion en TD 1214, un descodificador de audio 1215 y un descodificador de ampliacion en FD 1216.
La unidad de comprobacion de informacion de modo 1211 comprueba informacion de modo de cada una de las tramas incluidas en un flujo continuo de bits. El flujo continuo de bits puede ser una senal que se corresponde con un flujo continuo de bits de acuerdo con un resultado de la codificacion realizada por el aparato de codificacion 101 transmitido al aparato de descodificacion 102.
Por ejemplo, la unidad de comprobacion de informacion de modo 1211 analiza sintacticamente informacion de modo del flujo continuo de bits y lleva a cabo una operacion de conmutacion a uno de un modo de descodificacion de CELP o un modo de descodificacion en FD de acuerdo con un modo de codificacion de una trama actual en concordancia con un resultado del analisis sintactico.
De manera mas especffica, la unidad de comprobacion de informacion de modo 1211 puede llevar a cabo una conmutacion, con respecto a cada una de las tramas incluidas en el flujo continuo de bits, de tal manera que una trama codificada de acuerdo con el modo CELP se puede descodificar por CELP y una trama codificada de acuerdo con el modo FD se puede descodificar por FD.
El descodificador de LPC 1212 lleva a cabo una descodificacion de LPC sobre las tramas incluidas en el flujo continuo de bits.
El descodificador de CELP 1213 lleva a cabo una descodificacion de CELP sobre la trama codificada de acuerdo con el modo CELP, sobre la base del resultado de la comprobacion. Por ejemplo, el descodificador de CELP 1213 descodifica contribuciones de libros de codigos adaptativos y fijos, combina resultados de la descodificacion y genera una senal de baja frecuencia que se corresponde con una senal descodificada para banda de baja frecuencia.
El descodificador de ampliacion en TD 1214 genera una senal descodificada para banda de alta frecuencia usando por lo menos uno del resultado de una ejecucion de una descodificacion de CELP y una senal de excitacion de la senal de baja frecuencia. La senal de excitacion de la senal de baja frecuencia se puede incluir en el flujo continuo de bits. Ademas, el descodificador de ampliacion en TD 1208 puede utilizar informacion de LPC descodificada por el descodificador de LPC 1212 para generar la senal de alta frecuencia que se corresponde con una senal descodificada para la banda de alta frecuencia.
Ademas, de acuerdo con la presente forma de realizacion, el descodificador de ampliacion en TD 1214 puede generar una senal descodificada al combinar la senal de alta frecuencia con la senal de baja frecuencia generada por el descodificador de CELP 1214. Para generar la senal descodificada, el descodificador de ampliacion en TD 1214 puede realizar adicionalmente una operacion de conversion sobre las velocidades de muestreo de la senal de baja frecuencia y la senal de alta frecuencia para que sean las mismas.
5
10
15
20
25
30
35
40
45
50
55
60
65
El descodificador de audio 1215 lleva a cabo una descodificacion de audio sobre el audio en tramas codificado, sobre la base del resultado de la comprobacion. Por ejemplo, el descodificador de audio 1215 remite al flujo continuo de bits y lleva a cabo una descodificacion sobre la base de una contribucion en el dominio del tiempo y una contribucion en el dominio de la frecuencia cuando la contribucion en el dominio del tiempo esta presente, o realiza una descodificacion sobre la base de la contribucion en el dominio de la frecuencia cuando la contribucion en el dominio del tiempo no esta presente.
Ademas, el descodificador de audio 1215 puede generar una senal de excitacion de baja frecuencia descodificada al llevar a cabo una transformacion de frecuencia inversa, por ejemplo, una IDCT, sobre una senal cuantificada de acuerdo con una FPC o una LVQ y, generar una senal de baja frecuencia descodificada al combinar la senal de excitacion con un LPC cuantificado de manera inversa.
El descodificador de FD 1216 lleva a cabo una descodificacion de ampliacion usando un resultado de una ejecucion de una de audio. Por ejemplo, el descodificador de FD 1216 convierte la senal de baja frecuencia descodificada a una velocidad de muestreo apropiada para llevar a cabo una descodificacion de ampliacion de alta frecuencia, y lleva a cabo una transformacion de frecuencia, por ejemplo, una MDCT, sobre la senal convertida. El descodificador de ampliacion en FD 1216 puede cuantificar inversamente energfa de alta frecuencia cuantificada, generar una senal de excitacion de una senal de alta frecuencia usando la senal de baja frecuencia de acuerdo con diversos modos de ampliacion de ancho de banda de alta frecuencia y generar una senal de alta frecuencia descodificada de acuerdo con la aplicacion de una ganancia de tal manera que la energfa de la senal de excitacion puede ser simetrica a la energfa cuantificada inversamente. Por ejemplo, los diversos modos de ampliacion de ancho de banda de alta frecuencia pueden incluir el modo normal, el modo armonico, el modo transitorio o el modo de ruido.
Ademas, el descodificador de ampliacion en FD 1216 genera una senal descodificada al llevar a cabo una transformacion de frecuencia inversa, por ejemplo, una MDCT inversa, sobre la senal de alta frecuencia descodificada y la senal de baja frecuencia.
Ademas, si se utiliza el modo transitorio para la ampliacion de ancho de banda de alta frecuencia, el descodificador de ampliacion en FD 1216 puede aplicar una ganancia calculada en un dominio del tiempo de manera que la senal descodificada despues de llevar a cabo una transformacion de frecuencia inversa puede coincidir con una envolvente temporal descodificada, y puede combinar la senal en la cual se aplica la ganancia.
Por consiguiente, el aparato de descodificacion 102 puede llevar a cabo una descodificacion sobre el flujo continuo de bits, sobre la base del modo de codificacion de cada una de las tramas incluidas en el flujo continuo de bits.
La figura 13 es un diagrama de bloques de un descodificador de ampliacion 1304 incluido en el aparato de descodificacion 102, de acuerdo con un ejemplo.
Haciendo referencia a la figura 13, el descodificador de ampliacion 1204 puede incluir un cuantificador inverso 1301, un modulo de calculo de ganancias 1302, una unidad de aplicacion de ganancias 1303, un generador de senales artificiales 1304, un estimador de envolventes 1305 y una unidad de aplicacion de envolventes 1306.
El cuantificador inverso 1301 puede cuantificar de manera inversa la energfa de una senal de entrada. Posteriormente se describira de forma detallada haciendo referencia a la figura 14 un proceso de cuantificacion inversa de la energfa de la senal de entrada.
El modulo de calculo de ganancias 1302 puede calcular una ganancia que se va a aplicar a una senal de base, basandose en la energfa cuantificada inversamente y la energfa de la senal de base. De manera detallada, la ganancia se puede determinar por una relacion entre la energfa cuantificada de manera inversa y la energfa de la senal de base. En general, la energfa se determina usando la suma de los cuadrados de la amplitud del espectro de frecuencia. Asf, se puede usar una rafz cuadrada de la relacion entre la energfa cuantificada de manera inversa y la energfa de la senal de base.
La unidad de aplicacion de ganancias 1303 puede aplicar la ganancia para cada banda de frecuencias con el fin de determinar un espectro de frecuencia de una SWB.
Por ejemplo, el calculo de ganancias y la aplicacion de ganancias se pueden llevar a cabo ecualizando una banda con una banda de frecuencias utilizada para transmitir energfa segun se ha descrito anteriormente. El calculo de ganancias y la aplicacion de ganancias se pueden llevar a cabo al dividir bandas de frecuencia completas en sub- bandas para evitar un cambio drastico de energfa. En este caso, las energfas en los lfmites de la banda se pueden suavizar interpolando energfas cuantificadas inversamente de bandas vecinas. Por ejemplo, el calculo de ganancias y la aplicacion de ganancias se pueden llevar a cabo dividiendo cada banda en tres sub-bandas, asignando energfa cuantificada inversamente de una banda actual a la sub-banda central de entre las tres sub-bandas de cada banda y usando energfa asignada a una banda central de una banda previa o sucesiva y energfa recien suavizada a traves de una interpolacion. Es decir, la ganancia se puede calcular y aplicar en unidades de sub-bandas.
5
10
15
20
25
30
35
40
45
50
55
60
65
Dicho metodo de suavizacion de energfa se puede aplicar en forma de un tipo fijo. Ademas, el metodo de suavizacion de energfa se puede aplicar a solamente tramas requeridas transmitiendo informacion que indica que se requiere suavizacion de energfa desde el codificador de ampliacion 204. En este caso, la informacion que indica que se requiere suavizacion de energfa se puede establecer de tal manera que un error de cuantificacion en la energfa completa cuando se lleva a cabo suavizacion de energfa es menor que un error de cuantificacion en la energfa completa cuando no se lleva a cabo suavizacion de energfa.
La senal de base se puede generar usando una senal de entrada en un dominio de la frecuencia. Un proceso de generacion de la senal de base se puede llevar a cabo tal como se describe a continuacion.
El generador de senales artificiales 1304 puede generar una senal artificial que se corresponde con una banda de alta frecuencia al copiar y plegar una banda de baja frecuencia de la senal de entrada en el dominio de la frecuencia. La senal de entrada en el dominio de la frecuencia puede ser una senal de banda ancha (WB) descodificada que tiene una velocidad de muestreo de 32 kHz.
El estimador de envolventes 1305 puede estimar una envolvente de la senal de base usando una ventana incluida en el flujo continuo de bits. La ventana fue usada por el aparato de codificacion 101 para estimar una envolvente, y en el flujo continuo de bits se puede incluir informacion sobre el tipo de la ventana en forma de un tipo de bit y la misma se puede transmitir al aparato de descodificacion 102.
La unidad de aplicacion de envolventes 1306 puede generar la senal de base al aplicar la envolvente estimada a la senal artificial.
Cuando el estimador de envolventes 602 incluido en el aparato de codificacion 101 estima un promedio de una magnitud de frecuencia para cada banda blanqueadora de manera que resulte una envolvente de una frecuencia que pertenece a la banda blanqueadora, si la informacion que indica si un numero de espectros de frecuencia que pertenecen a la banda blanqueadora es grande o pequeno se transmite al aparato de descodificacion 102, entonces el estimador de envolventes 1305 del aparato de descodificacion 102 puede estimar la envolvente sobre la base del metodo transmitido. A continuacion, la unidad de aplicacion de envolventes 1306 puede aplicar la envolvente estimada a la senal artificial. Alternativamente, la envolvente se puede determinar de acuerdo con un modo de codificacion basica utilizado por un descodificador basico de banda ancha (WB) sin tener que transmitir la informacion.
El descodificador basico 1201 puede descodificar senales al clasificar modos de codificacion de las senales como modo de codificacion para voz sonora, modo de codificacion para voz sorda, modo de codificacion de transicion y modo de codificacion generico, sobre la base de caracterfsticas de las senales. En este caso, el estimador de envolventes 602 puede controlar un numero de espectros de frecuencia que pertenecen a la banda blanqueadora, basandose en un modo de descodificacion de acuerdo con las caracterfsticas de una senal de entrada. Por ejemplo, si la senal de entrada se descodifica de acuerdo con el modo de descodificacion para voz sonora, el estimador de envolventes 1305 puede estimar la envolvente formando tres espectros de frecuencia en la banda blanqueadora. Si la senal de entrada se descodifica en un modo de descodificacion diferente al modo de descodificacion para voz sonora, el estimador de envolventes 1306 puede estimar la envolvente al formar tres espectros de frecuencia en la banda blanqueadora.
La figura 14 es un diagrama de flujo que ilustra una operacion del cuantificador inverso 1301 incluido en el descodificador de ampliacion 1304, de acuerdo con un ejemplo.
En la operacion S1401, el cuantificador inverso 1301 puede cuantificar inversamente un vector secundario seleccionado de vector de energfa, sobre la base de un fndice recibido desde el aparato de codificacion 101.
En la operacion S1402, el cuantificador inverso 1301 puede cuantificar inversamente errores de interpolacion que se corresponden con los vectores secundarios restantes que no se seleccionan, sobre la base del fndice recibido.
En la operacion S1403, el cuantificador inverso 1301 puede calcular los vectores secundarios restantes por interpolacion del vector secundario cuantificado inversamente. A continuacion, el cuantificador inverso 1301 puede adicionar los errores de interpolacion cuantificados de manera inversa a los vectores secundarios restantes. Ademas, el cuantificador inverso 1301 puede calcular una energfa cuantificada inversamente al adicionar un promedio que se resto durante una operacion de pre-procesado, a traves de una operacion de post-procesado.
La figura 15A es un diagrama de flujo que ilustra un metodo de codificacion de acuerdo con un ejemplo.
En la operacion S1501, el aparato de codificacion 101 puede diezmar una senal de entrada.
En la operacion S1502, el aparato de codificacion 101 puede aplicar una codificacion basica sobre la senal de entrada diezmada.
5
10
15
20
25
30
35
40
45
50
55
60
65
En la operacion S1503, el aparato de codificacion 101 puede llevar a cabo una transformacion de frecuencia sobre la senal de entrada.
En la operacion S1504, el aparato de codificacion 101 puede llevar a cabo una codificacion de ampliacion de ancho de banda sobre la senal de entrada en un dominio de la frecuencia. Por ejemplo, el aparato de codificacion 101 puede llevar a cabo una codificacion de ampliacion de ancho de banda, usando informacion de codificacion determinada a traves de una codificacion basica. En este caso, la informacion de codificacion puede incluir un modo de codificacion clasificado de acuerdo con las caracterfsticas de la senal de entrada cuando se lleva a cabo una codificacion basica.
Por ejemplo, el aparato de codificacion 101 puede llevar a cabo una codificacion de ampliacion de ancho de banda tal como se describe posteriormente.
El aparato de codificacion 101 puede generar una senal de base de la senal de entrada en el dominio de la frecuencia usando espectros de frecuencia de la senal de entrada en el dominio de la frecuencia. Como ejemplo alternativo, el aparato de codificacion 101 puede generar una senal de base de la senal de entrada en el dominio de la frecuencia, sobre la base de las caracterfsticas y los espectros de frecuencia de la senal de entrada. En este caso, las caracterfsticas de la senal de entrada se pueden obtener a traves de una codificacion basica o a traves de clasificacion de senales adicional. El aparato de codificacion 101 puede estimar un factor de control de energfa usando la senal de base. El aparato de codificacion 101 puede extraer energfa de la senal de entrada en el dominio de la frecuencia. A continuacion, el aparato de codificacion 101 puede controlar la energfa extrafda usando el factor de control de energfa. El aparato de codificacion 101 puede cuantificar la energfa controlada.
La senal de base se puede generar tal como se describe posteriormente.
El aparato de codificacion 101 puede generar una senal artificial que se corresponde con una banda de alta frecuencia al copiar y plegar una banda de baja frecuencia de la senal de entrada en el dominio de la frecuencia. A continuacion, el aparato de codificacion 101 puede estimar una envolvente de la senal de base usando una ventana. En este caso, el aparato de codificacion 101 puede estimar una envolvente de la senal de base al seleccionar una ventana a traves de una comparacion de tonalidades o de correlaciones. Por ejemplo, el aparato de codificacion 101 puede estimar un promedio de magnitudes de frecuencia de cada una de las bandas blanqueadoras como una envolvente de una frecuencia que pertenece a cada una de las bandas blanqueadoras. De forma detallada, el aparato de codificacion 101 puede estimar la envolvente de la senal de base al controlar un numero de espectros de frecuencia pertenecientes a la banda blanqueadora de acuerdo con un modo de codificacion basica.
A continuacion, el aparato de codificacion 101 puede aplicar la envolvente estimada a la senal artificial de manera que genera la senal de base.
El factor de control de energfa se puede estimar como se describe seguidamente.
El aparato de codificacion 101 puede calcular una tonalidad de la banda de alta frecuencia de la senal de entrada en el dominio de la frecuencia. El aparato de codificacion 101 puede calcular una tonalidad de la senal de base. A continuacion, el aparato de codificacion 101 puede calcular el factor de control de energfa usando la tonalidad de la banda de alta frecuencia de la senal de entrada y la tonalidad de la senal de base.
La cuantificacion de la energfa controlada se puede llevar a cabo tal como se describe a continuacion.
El aparato de codificacion 101 puede seleccionar y cuantificar un vector secundario, y puede cuantificar los vectores secundarios restantes usando un error de interpolacion. En este caso, el aparato de codificacion 101 puede seleccionar un vector secundario en el mismo intervalo de tiempo.
Por ejemplo, el aparato de codificacion 101 puede llevar a cabo una MSVQ utilizando por lo menos dos etapas al seleccionar candidatos de vector secundario. En este caso, el aparato de codificacion 101 puede generar un fndice establecido para minimizar MSEs o WMSEs para cada uno de los candidatos de vector secundario en cada una de las etapas, y seleccionar un candidato de vector secundario que presente la suma menor de MSEs o WMSEs en todas las etapas de entre los candidatos de vector secundario. Alternativamente, el aparato de codificacion 101 puede generar un fndice establecido para minimizar MSEs o WMSEs para cada uno de los candidatos de vector secundario en cada una de las etapas, reconstruir el vector de energfa a traves de una cuantificacion inversa y seleccionar un candidato de vector secundario de manera que satisfaga el MSE o WMSE entre el vector de energfa reconstruido y el vector de energfa original.
La figura 15B es un diagrama de flujo que ilustra un metodo de codificacion de acuerdo con otro ejemplo. El metodo de codificacion de la figura 15B puede incluir operaciones que se realizan secuencialmente por parte del aparato de codificacion 101 de una de las figuras 2A a 2C. Asf, aunque no se describe en la presente, las descripciones anteriores del aparato de codificacion 101 haciendo referencia a las figuras 2A a 2C tambien se pueden aplicar al metodo de codificacion de la figura 15B.
5
10
15
20
25
30
35
40
45
50
55
60
65
En la operacion S1505, la unidad de clasificacion de senales 205 determina un modo de codificacion de una senal de entrada, sobre la base de caractensticas de la senal de entrada.
En la operacion S1506, si el modo de codificacion de una senal de entrada se determina como modo CELP, el codificador de CELP 206 lleva a cabo una codificacion de CELP sobre una senal de baja frecuencia de la senal de entrada.
En la operacion S1507, si la codificacion de CELP se lleva a cabo sobre la senal de baja frecuencia de la senal de entrada, el codificador de ampliacion en TD 207 lleva a cabo una codificacion de ampliacion en TD sobre una senal de alta frecuencia de la senal de entrada.
En la operacion S1508, si el modo de codificacion de una senal de entrada se determina como modo FD, el transformador de frecuencia 208 lleva a cabo una transformacion de frecuencia sobre la senal de entrada.
En la operacion S1509, el codificador de FD 209 realiza una codificacion en FD sobre la senal de entrada transformada en frecuencia.
La figura 15C es un diagrama de flujo que ilustra un metodo de codificacion de acuerdo con otro ejemplo. El metodo de codificacion de la figura 15C puede incluir operaciones que son realizadas secuencialmente por el aparato de codificacion 101 de una de la figuras 2A a 2C. Asf, aunque no se describe en la presente, las descripciones anteriores del aparato de codificacion 101 haciendo referencia a las figuras 2A a 2C tambien se pueden aplicar al metodo de codificacion de la figura 15C.
En la operacion S1510, la unidad de clasificacion de senales 210 determina un modo de codificacion de una senal de entrada, sobre la base de caractensticas de la senal de entrada.
En la operacion S1511, el codificador de LPC 211 extrae un LPC de una senal de baja frecuencia de la senal de entrada y cuantifica el LPC.
En la operacion S1512, si el modo de codificacion de una senal de entrada se determina como modo CELP, el codificador de CELP 212 realiza una codificacion de CELP sobre una senal de excitacion de LPC extrafda utilizando el LPC.
En la operacion S1513, si la codificacion de CELP se lleva a cabo sobre la senal de excitacion de LPC de la senal de baja frecuencia de la senal de entrada, el codificador de ampliacion en TD 213 lleva a cabo una codificacion de ampliacion en TD sobre una senal de alta frecuencia de la senal de entrada.
En la operacion S1514, si el modo de codificacion de una senal de entrada se determina como modo FD, el codificador de audio 214 lleva a cabo una codificacion de audio sobre la senal de excitacion de LPC extrafda utilizando el LPC.
En la operacion S1515, si la codificacion en FD se lleva a cabo sobre la senal de excitacion de LPC de la senal de baja frecuencia de la senal de entrada, el codificador de ampliacion en FD 215 lleva a cabo una codificacion de ampliacion en FD sobre la senal de alta frecuencia de la senal de entrada.
La figura 16 es un diagrama de flujo que ilustra un metodo de descodificacion de acuerdo con un ejemplo.
En la operacion S1601, el aparato de descodificacion 102 puede llevar a cabo una descodificacion basica sobre una senal de entrada codificada de forma basica incluida en un flujo continuo de bits.
En la operacion S1602, el aparato de descodificacion 102 puede sobremuestrear la senal de entrada descodificada de forma basica.
En la operacion S1603, el aparato de descodificacion 102 puede llevar a cabo una transformacion de frecuencia sobre la senal de entrada sobremuestreada.
En la operacion S1604, el aparato de descodificacion 102 puede llevar a cabo una descodificacion de ampliacion de ancho de banda usando una senal de entrada en un dominio de la frecuencia e informacion sobre energfa de la senal de entrada incluida en el flujo continuo de bits.
De manera mas espedfica, la ampliacion de ancho de banda se puede realizar tal como se describe a continuacion.
El aparato de descodificacion 102 puede cuantificar de manera inversa la energfa de la senal de entrada. En este caso, el aparato de descodificacion 101 puede seleccionar y cuantificar inversamente un vector secundario, interpolar el vector secundario cuantificado inversamente y adicionar un error de interpolacion al vector secundario
5
10
15
20
25
30
35
40
45
50
55
60
65
interpolado, con lo que se cuantifica inversamente la energfa.
Ademas, el aparato de descodificacion 102 puede generar una senal de base de la senal de entrada en el dominio de la frecuencia. A continuacion, el aparato de descodificacion 102 puede calcular una ganancia a aplicar a la senal de base usando la energfa cuantificada inversamente y energfa de la senal de base. Despues de esto, el aparato de descodificacion 102 puede aplicar la ganancia para cada banda de frecuencia.
La senal de base se puede generar tal como se describe a continuacion.
El aparato de descodificacion 102 puede generar una senal artificial que se corresponde con una banda de alta frecuencia de la senal de entrada al copiar y plegar una banda de baja frecuencia de la senal de entrada en el dominio de la frecuencia. A continuacion, el aparato de descodificacion 102 puede estimar una envolvente de la senal de base usando informacion de ventanas incluida en el flujo continuo de bits. En este caso, si la informacion de ventana se establece de manera que es la misma, en el flujo continuo de bits no se incluye ninguna informacion de ventana. Despues de esto, el aparato de descodificacion 102 puede aplicar la envolvente estimada a la senal artificial.
La figura 16B es un diagrama de flujo que ilustra un metodo de descodificacion de acuerdo con otro ejemplo. El metodo de codificacion de la figura 16B puede incluir operaciones que se realizan secuencialmente por parte del aparato de descodificacion 102 de una de las figuras 12A a 12C. Asf, aunque no se describe en la presente, las descripciones anteriores del aparato de descodificacion 102 haciendo referencia a las figuras 12A a 12C tambien se pueden aplicar al metodo de descodificacion de la figura 16B.
En la operacion S1606, la unidad de comprobacion de informacion de modo 1206 comprueba informacion de modo de cada una de las tramas incluidas en un flujo continuo de bits.
En la operacion S1607, el descodificador de CELP 1207 lleva a cabo una descodificacion de CELP sobre la trama codificada por CELP, sobre la base de un resultado de la comprobacion.
En la operacion S1608, el descodificador de ampliacion en TD 1208 genera una senal descodificada de una banda de alta frecuencia usando por lo menos uno de un resultado de la ejecucion de una descodificacion de CELP y una senal de excitacion de una senal de baja frecuencia.
En la operacion S1609, el descodificador de FD 1209 lleva a cabo una descodificacion en FD sobre la trama codificada en FD, sobre la base de un resultado de la comprobacion.
El transformador de frecuencia inverso 1210 lleva a cabo una transformacion de frecuencia inversa sobre un resultado de la ejecucion de una descodificacion en FD.
La figura 16C es un diagrama de flujo que ilustra un metodo de descodificacion de acuerdo con otro ejemplo. El metodo de codificacion de la figura 16C puede incluir operaciones que son realizadas secuencialmente por el aparato de descodificacion 102 de una de las figuras 12A a 12C. Asf, aunque no se describe en la presente, las descripciones anteriores del aparato de descodificacion 102 haciendo referencia a las figuras 12A a 12C tambien se pueden aplicar al metodo de descodificacion de la figura 16C.
En la operacion S1611, la unidad de comprobacion de informacion de modo 1211 comprueba informacion de modo de cada una de las tramas incluidas en un flujo continuo de bits.
En la operacion S1612, el descodificador de LPC 1212 lleva a cabo una descodificacion de LPC sobre las tramas incluidas en el flujo continuo de bits.
En la operacion S1613, el descodificador de CELP 1213 lleva a cabo una descodificacion de CELP sobre la trama codificada por CELP, sobre la base de un resultado de la comprobacion.
En la operacion S1614, el descodificador de ampliacion en TD 1214 genera una senal descodificada de una banda de alta frecuencia usando por lo menos uno de un resultado de una ejecucion de una descodificacion de CELP y una senal de excitacion de una senal de baja frecuencia.
En la operacion S1615, el descodificador de audio 1215 lleva a cabo una descodificacion de audio sobre la trama codificada de audio, sobre la base del resultado de la comprobacion.
En la operacion S1616, el descodificador de ampliacion en FD 1216 lleva a cabo una descodificacion de ampliacion en FD usando un resultado de la ejecucion de una descodificacion de audio.
Con respecto a otras cuestiones sobre los metodos de codificacion y descodificacion, las cuales no se describen haciendo referencia a las figuras 15 a 16, tambien deberfa remitirse a las descripciones referentes a las figuras 1 a
5
10
15
20
25
30
35
40
45
50
55
60
65
La figura 17 es un diagrama de bloques de la estructura completa de un aparato de codificacion 1702 de acuerdo con otro ejemplo.
Haciendo referencia a la figura 17, el aparato de codificacion 100 puede incluir un selector de modo de codificacion 1701 y un codificador de ampliacion 1702.
El selector de modo de codificacion 1701 puede determinar un modo de codificacion de la codificacion de ampliacion de ancho de banda utilizando una senal de entrada en un dominio de la frecuencia y una senal de entrada en un dominio del tiempo.
De manera mas especffica, el selector de modo de codificacion 1701 puede clasificar la senal de entrada en el dominio de la frecuencia usando la senal de entrada en el dominio de la frecuencia y la senal de entrada en el dominio del tiempo, y puede determinar el modo de codificacion de la codificacion de ampliacion de ancho de banda y un numero de bandas de frecuencia de acuerdo con el modo de codificacion, sobre la base de un resultado de la clasificacion. En este caso, el modo de codificacion se puede establecer como un conjunto nuevo de modos de codificacion que son diferentes de un modo de codificacion determinado cuando se lleva a cabo la codificacion basica, para mejorar el rendimiento del codificador de ampliacion 1702.
Por ejemplo, los modos de codificacion se pueden clasificar en el modo normal, el modo armonico, el modo transitorio y el modo de ruido. En primer lugar, el selector de modo de codificacion 1701 determina si una trama actual es una trama transitoria, sobre la base de una relacion entre energfa de largo plazo de la senal de entrada en el dominio del tiempo y energfa de una banda de alta frecuencia de la trama actual. Una seccion de una senal transitoria es una seccion en donde se produce un cambio drastico de energfa en el dominio del tiempo y por lo tanto puede ser una seccion en la cual la energfa de una banda de alta frecuencia cambia drasticamente.
Se describira a continuacion un proceso de determinacion de los otros tres modos de codificacion. En primer lugar, se obtienen energfas globales de una trama previa y una trama actual, la relacion entre las energfas globales y una senal en un dominio de la frecuencia se dividen en bandas de frecuencias predeterminadas, y a continuacion se determinan los tres modos de codificacion sobre la base de la energfa promedio y la energfa de pico de cada una de las bandas de frecuencia. En general, en el modo armonico, la diferencia entre la energfa de pico y la energfa promedio de una senal en un dominio de la frecuencia es la mayor. En el modo de ruido, el grado de cambio de energfa de una senal es pequeno en general. Los modos de codificacion de otras senales, excepto para las dos senales, se determinan como modo normal.
De acuerdo con un ejemplo, el numero de bandas de frecuencia se puede determinar como dieciseis en el modo normal y el modo armonico, se puede determinar como cinco en el modo transitorio, y se puede determinar como doce en el modo normal.
El codificador de ampliacion 1702 puede seleccionar el modo de codificacion de la codificacion de ampliacion de ancho de banda usando la senal de entrada en el dominio de la frecuencia y la senal de entrada en el dominio del tiempo. Haciendo referencia a la figura 17, el codificador de ampliacion 1702 puede incluir un generador de senales de base 1703, un estimador de factores 1704, un extractor de energfa 1705, un controlador de energfa 1706 y un cuantificador de energfa 1707. El generador de senales de base 1703 y el estimador de factores 1704 son tal como se ha descrito anteriormente haciendo referencia a la figura 5.
El extractor de energfa 1705 puede extraer energfa que se corresponde con cada una de las bandas de frecuencia de acuerdo con el numero de bandas de frecuencias determinado en concordancia con los modos de codificacion. El generador de senales de base 1703, el estimador de factores 1704 y el controlador de energfa 1706 se pueden determinar para ser usados o no, de acuerdo con el modo de codificacion. Por ejemplo, estos elementos se pueden utilizar en el modo normal y en el modo armonico, pero pueden no ser utilizados en el modo transitorio y en el modo de ruido. El generador de senales de base 1703, el estimador de factores 1704 y el controlador de energfa 1706 son tal como se ha descrito anteriormente haciendo referencia a la figura 5. La energfa de banda sobre la cual se lleva a cabo el control de energfa se puede cuantificar por medio del cuantificador de energfa 1707.
La figura 18 es un diagrama de flujo que ilustra una operacion del cuantificador de energfa 1710 de acuerdo con otro ejemplo.
El cuantificador de energfa 1707 puede cuantificar energfa extrafda de una senal de entrada de acuerdo con un modo de codificacion. En este caso, el cuantificador de energfa 1707 puede cuantificar la energfa de banda que se va a optimizar para la senal de entrada sobre la base de un numero de energfas de banda y caracterfsticas perceptuales de la senal de entrada de acuerdo con el modo de codificacion.
Por ejemplo, si el modo de codificacion es el modo transitorio, el cuantificador de energfa 1707 puede cuantificar, con respecto a cinco energfas de banda, la energfa de banda usando un metodo de ponderacion de frecuencias
5
10
15
20
25
30
35
40
45
50
55
60
65
basado en las caracterfsticas perceptuales de una senal de entrada. Si el modo de codificacion es el modo normal o el modo armonico, el cuantificador de energfa 1707 puede cuantificar, con respecto a dieciseis energfas de banda, la energfa de banda mediante la utilizacion de un metodo de asignacion desigual de bits sobre la base de las caracterfsticas perceptuales de una senal de entrada. Si las caracterfsticas de la senal de entrada no estan claras, el cuantificador de energfa 1707 puede llevar a cabo una cuantificacion de acuerdo con un metodo general, en lugar de considerando las caracterfsticas perceptuales de la senal de entrada.
La figura 19 es un diagrama que ilustra un proceso de cuantificacion de energfa mediante la utilizacion del metodo de asignacion desigual de bits, de acuerdo con un ejemplo.
En el metodo de asignacion desigual de bits, se consideran las caracterfsticas perceptuales de una senal de entrada que constituye un objetivo de la codificacion de ampliacion. Asf, las bandas de frecuencias relativamente bajas con importancia perceptualmente alta se pueden cuantificar por tanto de manera mas precisa de acuerdo con el metodo de asignacion desigual de bits. Con este fin, el cuantificador de energfa 1707 puede clasificar la importancia perceptual al asignar el mismo numero de bits o un numero de bits mayor a las bandas de frecuencias relativamente bajas, en comparacion con los numeros de bits asignados a las otras bandas de frecuencia.
Por ejemplo, el cuantificador de energfa 1707 asigna un numero mayor de bits a los numeros "0" a "5" asignados a bandas de frecuencias relativamente bajas. Los numeros de bits asignados a los numeros "0" a "5" de las bandas de frecuencia relativamente bajas pueden ser los mismos. Cuanto mayor es una banda de frecuencias, menor sera el numero de bits asignado a la banda de frecuencias por el cuantificador de energfa 1707. Por consiguiente, los numeros "0" a "13" asignados a las bandas de frecuencia se pueden cuantificar tal como se ilustra en la figura 19, de acuerdo con la asignacion de bits que se ha descrito anteriormente. Los numeros "14" y "15" asignados a otras bandas de frecuencia se pueden cuantificar tal como se ilustra en la figura 20.
La figura 20 es un diagrama que ilustra una cuantificacion vectorial utilizando una prediccion intra-trama, de acuerdo con un ejemplo.
El cuantificador de energfa 1707 predice un valor representativo de un vector objetivo de cuantificacion que tiene por lo menos dos elementos, y a continuacion puede llevar a cabo una cuantificacion vectorial sobre una senal de error entre cada uno de los elementos mencionados del vector objetivo de cuantificacion y el valor representativo predicho.
La figura 20 ilustra dicho metodo de prediccion intra-trama. El siguiente es un metodo de prediccion de un valor representativo del vector objetivo de cuantificacion y de obtencion de la senal de error:
p = 0,4*QEnv(12) + 0,6*QEnv(13) e(14) = Env(14) - p e(15) = Env(15) - p
■■■(8),
en donde "Env(n)" indica energfa de banda que no se cuantifica, "QEnv(n)" indica la energfa de banda que se cuantifica, "p" indica el valor representativo predicho del vector objetivo de cuantificacion, "e(n)" indica energfa de error. En la Ecuacion (8), "e(14)" y "e(15)" se cuantifican vectorialmente.
La figura 21 es un diagrama que ilustra un proceso de cuantificacion de energfa mediante la utilizacion de un metodo de ponderacion de frecuencias, de acuerdo con otro ejemplo.
Asf, en el metodo de ponderacion de frecuencias, bandas de frecuencias relativamente bajas de importancia perceptualmente alta se pueden cuantificar de manera mas precisa al considerar caracterfsticas perceptuales de una senal de entrada que es un objetivo de la codificacion de ampliacion, como en el metodo de asignacion desigual de bits. Con este fin, la importancia perceptual se clasifica al asignar el mismo peso o un peso mayor a las bandas de frecuencia relativamente bajas, en comparacion con aquellos asignados a las otras bandas de frecuencia.
Por ejemplo, haciendo referencia a la figura 21, el cuantificador de energfa 1707 puede llevar a cabo una cuantificacion asignando un peso mayor, por ejemplo 1,0; a los numeros "0" a "3" asignados a bandas de frecuencias relativamente bajas y asignando un peso menor, por ejemplo, 0,7; al numero "15" asignado a una banda de frecuencias. Para usar los pesos asignados, el cuantificador de energfa 1707 puede calcular un fndice optimo usando un WMSE.
La figura 22 es un diagrama que ilustra una cuantificacion vectorial correspondiente a la cuantificacion vectorial fragmentada y en multiples etapas mediante el uso de una prediccion intra-trama, de acuerdo con un ejemplo.
El cuantificador de energfa 1707 puede llevar a cabo una cuantificacion vectorial en el modo normal en el cual el numero de energfas de banda es dieciseis, tal como se ilustra en la figura 22. En este caso, el cuantificador de energfa 1707 puede llevar a cabo la cuantificacion vectorial usando el metodo de asignacion desigual de bits, una
5
10
15
20
25
30
35
40
45
50
55
60
65
prediccion intra-trama y una VQ fragmentada y en multiples etapas con interpolacion de energfa.
La figura 23 es un diagrama que ilustra una operacion de un cuantificador inverso 1301 incluido en el aparato de descodificacion 102, de acuerdo con un ejemplo.
El funcionamiento del cuantificador inverso 1301 de la figura 23 puede ser un funcionamiento inverso del funcionamiento del cuantificador de energfa 1710 de la figura 18. Cuando se utilizan modos de codificacion para llevar a cabo una codificacion de ampliacion tal como se ha descrito anteriormente haciendo referencia a la figura 17, el cuantificador inverso 1301 puede descodificar informacion de los modos de codificacion.
En primer lugar, el cuantificador inverso 1301 descodifica la informacion de modos de codificacion usando un fndice recibido. A continuacion, el cuantificador inverso 1301 realiza una cuantificacion inversa de acuerdo con la informacion descodificada del modo de codificacion. Haciendo referencia a la figura 23, de acuerdo con los modos de codificacion, los bloques que son objetivos de una cuantificacion inversa se cuantifican inversamente en el orden inverso en el cual se lleva a cabo la cuantificacion.
Una parte que se cuantifico de acuerdo con una VQ fragmentada y en multiples etapas con interpolacion de energfa se puede cuantificar inversamente segun se ilustra en la figura 14. El cuantificador inverso 1301 puede llevar a cabo una cuantificacion inversa que hace uso de una prediccion intra-trama utilizando la siguiente ecuacion:
p = 0,4*QEnv(12) + 0,6*QEnv(13)
QEnv(14) = e(14) + p QEnv(15) = e(15) + p
■■■(9),
en donde "Env(n)" indica energfa de banda que no se cuantifica y "QEnv(n)" indica energfa de banda que se cuantifica. Ademas, "p" indica un valor representativo de un vector objetivo de cuantificacion, y "eA(n)" indica energfa de error cuantificada.
La figura 24 es un diagrama de bloques de un aparato de codificacion 101 de acuerdo con otro ejemplo.
Las operaciones basicas de los elementos del aparato de codificacion 101 ilustrado en la figura 24 son iguales a las de los elementos del aparato de codificacion 101 ilustrado en la figura 2A, excepto que un codificador de ampliacion 2404 no recibe ninguna informacion desde un codificador basico 2404 y puede recibir directamente una senal de entrada en un dominio del tiempo.
La figura 25 es un diagrama que ilustra flujos continuos de bits de acuerdo con un ejemplo.
Haciendo referencia a la figura 25, un flujo continuo de bits 251, un flujo continuo de bits 252 y un flujo continuo de bits 253 se corresponden con una trama Nesima, una trama (N+1)esima y una trama (N+2)esima, respectivamente.
Haciendo referencia a la figura 25, los flujos continuos de bits 251, 252 y 253 incluyen un encabezamiento 254 y una carga util 255.
El encabezamiento 254 puede incluir informacion de modo 2511, 2521 y 2531. La informacion de modo 2511, 2521 y 2531 es informacion de modo de codificacion de la trama Nesima, la trama (N+1)esima y la trama (N+2)esima, respectivamente. Por ejemplo, la informacion de modo 2511 representa un modo de codificacion utilizado para codificar la trama Nesima, la informacion de modo 2512 representa un modo de codificacion utilizado para codificar la trama _ (N+1)esima y la informacion de modo 2513 representa un modo de codificacion utilizado para codificar la trama (N+2)esima. Por ejemplo, los modos de codificacion pueden incluir por lo menos uno de entre el modo CELP, el modo FD y el modo de codificacion de audio.
La carga util 255 incluye informacion sobre datos basicos de acuerdo con los modos de codificacion de estas tramas.
Por ejemplo, en el caso de la trama Nesima codificada en el modo CELP, la carga util 255 puede incluir informacion de CELP 2512 e informacion de ampliacion en TD 2513.
En el caso de la trama (N+1)esima codificada en el modo FD, la carga util 255 puede incluir informacion de FD 2523. En el caso de la trama (N+2)esima codificada en el modo FD, la carga util 255 puede incluir informacion de FD 2532.
La carga util 255 del flujo continuo de bits 252 que se corresponde con la trama (N+1)esima puede incluir ademas datos de prediccion 2522. En otras palabras, el modo de codificacion entre tramas adyacentes se conmuta del modo CELP al modo FD, el flujo continuo de bits 252 de acuerdo con un resultado de la ejecucion de una codificacion en concordancia con el modo FD puede incluir los datos de prediccion 2522.
5
10
15
20
25
30
35
40
45
50
55
60
65
De manera mas especffica, tal como se ilustra en la figura 2B, cuando el aparato de codificacion 101 que tiene la capacidad de conmutar entre el modo CELP y el modo FD lleva a cabo una codificacion de acuerdo con el modo FD, se utiliza una transformacion de frecuencia, por ejemplo, MDCT, la cual incluye solapamiento de tramas.
Asf, si la trama Nesima y la trama (N+1)esima de la senal de entrada se codifican de acuerdo con el modo CELP y el modo FD, respectivamente, entonces la trama (N+1)esima no se puede descodificar mediante la utilizacion de unicamente un resultado de codificacion de acuerdo con el modo FD. Por esta razon, si el modo de codificacion entre tramas adyacentes se conmuta del modo CELP al modo FD, el flujo continuo de bits 252 de acuerdo con el resultado de la ejecucion de la codificacion segun el modo FD puede incluir por tanto los datos de prediccion 2522 que representan informacion correspondiente a la prediccion.
Por consiguiente, un lado de descodificacion puede descodificar el flujo continuo de bits 252 codificado de acuerdo con el modo FD a traves de una prediccion mediante la utilizacion de informacion en el dominio del tiempo descodificada de una trama actual, por ejemplo, la trama (N+1)esima y un resultado de descodificacion de una trama previa, por ejemplo la trama Nesima, sobre la base de los datos de prediccion 2522 incluidos en el flujo continuo de bits 252. Por ejemplo, la informacion en el dominio del tiempo puede ser solapamiento espectral (aliasing) en el dominio del tiempo.
Ademas, la carga util 255 del flujo continuo de bits 252 que se corresponde con la trama (N+1)esima puede incluir ademas informacion de modo de trama previa 2524, y la carga util 255 del flujo continuo de bits 253 que se corresponde con la trama (N+2)esima puede incluir adicionalmente informacion de modo de trama previa 2533.
De manera mas especffica, los flujos continuos de bits 252 y 253 codificados de acuerdo con el modo FD pueden incluir ademas la informacion de modo de trama previa 2524 y 2533, respectivamente.
Por ejemplo, la informacion de modo de trama previa 2524 incluida en el flujo continuo de bits 252 que se corresponde con la trama (N+1)esima puede incluir informacion sobre la informacion de modo 2511 de la trama Nesima, y la informacion de modo de trama previa 2533 incluida en el flujo continuo de bits 253 que se corresponde con la trama (N+2)esima puede incluir informacion sobre la informacion de modo 2524 de la trama (N+1)esima.
Asf, incluso si se produce un error en una de una pluralidad de tramas, el lado de descodificacion puede detectar exactamente una transicion de modo.
La figura 26 es un diagrama que ilustra un metodo de ejecucion de una asignacion de frecuencias para cada banda de frecuencias, de acuerdo con un ejemplo.
Tal como se ha descrito anteriormente, el codificador de ampliacion en FD 2094 de la figura 2C o el codificador de ampliacion en FD 215 de la figura 2D pueden llevar a cabo una cuantificacion de energfa al compartir el mismo libro de codigos incluso a velocidades de bits diferentes. Asf, cuando un espectro de frecuencia que se corresponde con una senal de entrada se divide en un numero predeterminado de bandas de frecuencia, el codificador de ampliacion en FD 2094 o el codificador de ampliacion en FD 215 puede asignar el mismo ancho de banda a cada una de las bandas de frecuencia incluso a velocidades de bits diferentes.
A continuacion se describira un caso 261 en el que una banda de frecuencias de aproximadamente 6,4 a 14,4 kHz se divide a una velocidad de bits de 16 kbps y un caso 262 en el que una banda de frecuencias de aproximadamente 8 a 16 kHz se divide a una velocidad de bits que es igual o superior a 16 kbps. En estos casos, el ancho de banda de cada una de las bandas de frecuencia es el mismo incluso a velocidades de bits diferentes.
Es decir, el ancho de banda 263 de una primera banda de frecuencias puede ser 0,4 kHz tanto a una velocidad de bits de 16 kbps como a una velocidad de bits que sea igual o superior a 16 kbps, y el ancho de banda 264 de una segunda banda de frecuencias puede ser 0,6 kHz tanto a una velocidad de bits de 16 kbps como a una velocidad de bits que sea igual o superior a 16 kbps.
Tal como se ha descrito anteriormente, puesto que el ancho de banda de cada una de las bandas de frecuencia se establece de manera que sea igual incluso a diferentes velocidades de bits, el codificador de ampliacion en FD 2094 o el codificador de ampliacion en FD 215 de acuerdo con la presente forma de realizacion puede llevar a cabo una cuantificacion de energfa al compartir el mismo libro de codigos a velocidades de bits diferentes.
Asf, en una configuracion en la cual se lleva a cabo una conmutacion entre el modo CELP y el modo FD o entre el modo CELP y el modo de codificacion de audio, se puede realizar una ampliacion de ancho de banda multi-modo y se lleva a cabo una comparticion de libro de codigos para soportar diversas velocidades de bits, con lo que se reduce el tamano de, por ejemplo, una memoria de solo lectura (ROM) y se simplifica una implementacion.
La figura 27 es un diagrama que ilustra una banda de frecuencias 271 utilizada en un codificador de FD o un descodificador de FD, de acuerdo con un ejemplo.
5
10
15
20
25
30
35
40
45
50
55
Haciendo referencia a la figura 27, la banda de frecuencias 271 puede ser un ejemplo de una banda de frecuencias que se puede utilizar, por ejemplo, en el codificador de FD 209 de la figura 2B y en el descodificador de FD 1209 de la figura 12B de acuerdo con cada una de las herramientas.
De manera mas especffica, el codificador de impulsos factorial 2092 del codificador de FD 209 limita una banda de frecuencias para llevar a cabo una codificacion FPC, de acuerdo con la velocidad de bits. Por ejemplo, una banda de frecuencias Fbasica para llevar a cabo una codificacion FPC puede ser 6,4 kHz, 8 kHz o 9,6 kHz, de acuerdo con una velocidad de bits.
Una banda de frecuencias codificada por impulsos factorialmente Ffpc 272 se puede determinar al llevar a cabo una FPC en la banda de frecuencias limitada por el codificador de impulsos factorial 2092. En este caso, la unidad de ejecucion de llenado de ruido 12093 del descodificador de FD 1209 lleva a cabo un llenado de ruido en la banda de frecuencias codificada por impulsos factorialmente Ffpc 272.
En este caso, si un valor de banda superior de la banda de frecuencias codificada por impulsos factorialmente Ffpc 272 es menor que un valor de banda superior de la banda de frecuencias Fbasica para llevar a cabo una FPC, el descodificador de ampliacion de baja frecuencia en FD 12095 del descodificador de FD 1209 puede llevar a cabo una descodificacion de ampliacion de baja frecuencia.
Haciendo referencia a la figura 27, el descodificador de ampliacion de baja frecuencia en FD 12095 puede llevar a cabo una descodificacion de ampliacion de baja frecuencia en FD en una banda de frecuencias 273 restante de la banda de frecuencias Fbasica, excluyendo la banda de frecuencias codificada por impulsos factorialmente Ffpc. No obstante, si la banda de frecuencias Fbasica es la misma que la banda de frecuencias codificada por impulsos factorialmente Ffpc 272, la descodificacion de ampliacion de baja frecuencia en FD no puede llevarse a cabo.
El descodificador de ampliacion de alta frecuencia en FD 12096 del descodificador de FD 1209 puede llevar a cabo una codificacion de ampliacion de alta frecuencia en FD en una banda de frecuencias 274 entre un valor de banda superior de la banda de frecuencias Fbasica y un valor de banda superior de una banda de frecuencias Fextrema de acuerdo con una velocidad de bits. Por ejemplo, el valor de banda superior de la banda de frecuencias Fextrema puede ser 14 kHz, 14,4 kHz o 16 kHz aunque la presente invencion no se limita a los mismos. Asf, usando el aparato de codificacion 101 y el aparato de descodificacion 102, se pueden codificar voz y musica de manera eficiente a diversas velocidades de bits a traves de diversos sistemas de conmutacion. Ademas, la codificacion de ampliacion en FD y la descodificacion de ampliacion en FD se pueden llevar a cabo compartiendo un libro de codigos. Asf, se puede implementar audio de alta calidad de una manera menos complicada incluso cuando haya presentes diversas configuraciones. Ademas, puesto que la informacion de modo sobre una trama previa se incluye en un flujo continuo de bits cuando se lleva a cabo la codificacion en FD, la descodificacion se puede llevar a cabo de manera exacta incluso cuando se produzca un error de trama. Por consiguiente, con el aparato de codificacion 101 y el aparato de descodificacion 102, es posible llevar a cabo una codificacion y descodificacion con una complejidad y un retardo reducidos.
Por consiguiente, se pueden codificar y descodificar apropiadamente una senal de habla y una senal de musica de acuerdo con un servicio de voz mejorado (EVS) 3GPP.
Los metodos anteriores de acuerdo con diversas formas de realizacion de la presente invencion se pueden materializar en forma de un programa de ordenador que puede ser ejecutado por diversos tipos de medios de ordenador y que se puede grabar en un soporte de grabacion legible por ordenador. El soporte de grabacion legible por ordenador puede almacenar instrucciones de programa, archivos de datos, estructuras de datos o una combinacion de los mismos. Las instrucciones de programa se pueden disenar o construir especfficamente de acuerdo con la presente invencion o pueden ser bien conocidas en el campo del software de ordenador.
Aunque la presente invencion se ha mostrado y descrito particularmente haciendo referencia a formas de realizacion ejemplificativas de la misma, aquellos con conocimientos habituales en la materia entenderan que en ella se pueden llevar a cabo diversos cambios en cuanto a forma y detalles sin desviarse con respecto al alcance de la invencion segun queda definido por las reivindicaciones adjuntas.
Claims (4)
- 510152025303540455055REIVINDICACIONES1. Aparato de codificacion, que comprende:una unidad de clasificacion de senales (210) configurada para determinar un modo de codificacion de una senal de baja frecuencia de una senal de entrada, sobre la base de caracterfsticas de la senal de entrada;un codificador de coeficientes de prediccion lineal (LPC) (211) configurado para extraer un LPC de la senal de baja frecuencia de la senal de entrada, y para cuantificar el LPC;un codificador de prediccion lineal con excitacion por codigo (CELP) (212) configurado para llevar a cabo una codificacion de CELP sobre una senal de excitacion de LPC de una senal de baja frecuencia de la senal de entrada extrafda usando el LPC, cuando se determina que el modo de codificacion de la senal de baja frecuencia de la senal de entrada es un modo de codificacion CELP;un codificador de ampliacion en el dominio del tiempo (213) configurado para llevar a cabo una codificacion de ampliacion sobre una senal de alta frecuencia de la senal de entrada, cuando se lleva a cabo una codificacion CELP sobre la senal de excitacion de LPC;un codificador de audio (214) configurado para llevar a cabo una codificacion de audio sobre la senal de excitacion de LPC, cuando se determina que el modo de codificacion de la senal de baja frecuencia de la senal de entrada es un modo de codificacion de audio; yun codificador de ampliacion en el dominio de la frecuencia (FD) (215) configurado para llevar a cabo una codificacion de ampliacion sobre la senal de alta frecuencia de la senal de entrada, cuando se lleva a cabo una codificacion de audio sobre la senal de excitacion de LPC.
- 2. Aparato de codificacion segun la reivindicacion 1, en el que el codificador de ampliacion en FD esta ademas configurado para llevar a cabo una cuantificacion de energfa usando un mismo libro de codigos a diferentes velocidades de bits.
- 3. Aparato de descodificacion, que comprende:una unidad de comprobacion de informacion de modo (1211) configurada para comprobar la informacion de modo de cada una de entre una pluralidad de tramas incluidas en un flujo continuo de bits;un descodificador de coeficientes de prediccion lineal (LPC) (1212) configurado para llevar a cabo una descodificacion de LPC sobre la pluralidad de tramas incluidas en el flujo continuo de bits;un descodificador de prediccion lineal con excitacion por codigo (CELP) (1213) configurado para llevar a cabo una descodificacion de CELP sobre una trama codificada por CELP, sobre la base de un resultado de la comprobacion;un descodificador de ampliacion en el dominio del tiempo (1214) configurado para generar una senal descodificada de una banda de alta frecuencia usando por lo menos uno de entre un resultado de la ejecucion de la descodificacion de CELP y una senal de excitacion de una senal de baja frecuencia;un descodificador de audio (1215) configurado para llevar a cabo una descodificacion de audio sobre una trama codificada de audio, sobre la base del resultado de la comprobacion; yun descodificador de ampliacion en el dominio de la frecuencia (FD) (1216) configurado para llevar a cabo una descodificacion de ampliacion usando un resultado de la ejecucion de la descodificacion de audio.
- 4. Aparato de descodificacion segun la reivindicacion 3, en el que el descodificador de ampliacion en FD esta ademas configurado para llevar a cabo una cuantificacion inversa de energfa compartiendo un mismo libro de codigos a diferentes velocidades de bits.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100138045A KR101826331B1 (ko) | 2010-09-15 | 2010-12-29 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
KR20100138045 | 2010-12-29 | ||
US201161495017P | 2011-06-09 | 2011-06-09 | |
US201161495017P | 2011-06-09 | ||
PCT/KR2011/010258 WO2012091464A1 (ko) | 2010-12-29 | 2011-12-28 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2564504T3 true ES2564504T3 (es) | 2016-03-23 |
Family
ID=47904455
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES17179600T Active ES2967508T3 (es) | 2010-12-29 | 2011-12-28 | Aparato y procedimiento de codificación de extensión de ancho de banda de alta frecuencia |
ES11853939.4T Active ES2564504T3 (es) | 2010-12-29 | 2011-12-28 | Aparato de codificación y aparato de descodificación con una ampliación de ancho de banda |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES17179600T Active ES2967508T3 (es) | 2010-12-29 | 2011-12-28 | Aparato y procedimiento de codificación de extensión de ancho de banda de alta frecuencia |
Country Status (14)
Country | Link |
---|---|
US (2) | US10453466B2 (es) |
EP (3) | EP2657933B1 (es) |
JP (3) | JP6148983B2 (es) |
KR (2) | KR102022664B1 (es) |
CN (3) | CN103493131B (es) |
AU (1) | AU2011350143B9 (es) |
BR (2) | BR122021007425B1 (es) |
CA (3) | CA2981539C (es) |
ES (2) | ES2967508T3 (es) |
MX (1) | MX2013007489A (es) |
MY (2) | MY186055A (es) |
RU (1) | RU2672133C1 (es) |
SG (1) | SG191771A1 (es) |
WO (1) | WO2012091464A1 (es) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG191771A1 (en) * | 2010-12-29 | 2013-08-30 | Samsung Electronics Co Ltd | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |
US9418651B2 (en) | 2013-07-31 | 2016-08-16 | Google Technology Holdings LLC | Method and apparatus for mitigating false accepts of trigger phrases |
CN110867190B (zh) | 2013-09-16 | 2023-10-13 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
EP4407609A3 (en) | 2013-12-02 | 2024-08-21 | Top Quality Telephony, Llc | A computer-readable storage medium and a computer software product |
CN111312278B (zh) * | 2014-03-03 | 2023-08-15 | 三星电子株式会社 | 用于带宽扩展的高频解码的方法及设备 |
KR20240046298A (ko) * | 2014-03-24 | 2024-04-08 | 삼성전자주식회사 | 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치 |
CN107077855B (zh) | 2014-07-28 | 2020-09-22 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
WO2016024853A1 (ko) * | 2014-08-15 | 2016-02-18 | 삼성전자 주식회사 | 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기 |
KR102398124B1 (ko) | 2015-08-11 | 2022-05-17 | 삼성전자주식회사 | 음향 데이터의 적응적 처리 |
CN107545900B (zh) * | 2017-08-16 | 2020-12-01 | 广州广晟数码技术有限公司 | 带宽扩展编码和解码中高频弦信号生成的方法和装置 |
CN108630212B (zh) * | 2018-04-03 | 2021-05-07 | 湖南商学院 | 非盲带宽扩展中高频激励信号的感知重建方法与装置 |
CN109448741B (zh) * | 2018-11-22 | 2021-05-11 | 广州广晟数码技术有限公司 | 一种3d音频编码、解码方法及装置 |
JP6693551B1 (ja) * | 2018-11-30 | 2020-05-13 | 株式会社ソシオネクスト | 信号処理装置および信号処理方法 |
US12101613B2 (en) | 2020-03-20 | 2024-09-24 | Dolby International Ab | Bass enhancement for loudspeakers |
CN112086102B (zh) * | 2020-08-31 | 2024-04-16 | 腾讯音乐娱乐科技(深圳)有限公司 | 扩展音频频带的方法、装置、设备以及存储介质 |
CN113299313B (zh) * | 2021-01-28 | 2024-03-26 | 维沃移动通信有限公司 | 音频处理方法、装置及电子设备 |
CN113938749B (zh) * | 2021-11-30 | 2023-05-05 | 北京百度网讯科技有限公司 | 音频数据处理方法、装置、电子设备和存储介质 |
CN114550732B (zh) * | 2022-04-15 | 2022-07-08 | 腾讯科技(深圳)有限公司 | 一种高频音频信号的编解码方法和相关装置 |
Family Cites Families (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE501305C2 (sv) * | 1993-05-26 | 1995-01-09 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
JPH08179796A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | 音声符号化方法 |
JP3317470B2 (ja) * | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
JP3707116B2 (ja) * | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
DE19729494C2 (de) * | 1997-07-10 | 1999-11-04 | Grundig Ag | Verfahren und Anordnung zur Codierung und/oder Decodierung von Sprachsignalen, insbesondere für digitale Diktiergeräte |
JP3235543B2 (ja) * | 1997-10-22 | 2001-12-04 | 松下電器産業株式会社 | 音声符号化/復号化装置 |
SE521225C2 (sv) | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US6377915B1 (en) * | 1999-03-17 | 2002-04-23 | Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. | Speech decoding using mix ratio table |
US7117149B1 (en) | 1999-08-30 | 2006-10-03 | Harman Becker Automotive Systems-Wavemakers, Inc. | Sound source classification |
JP2000132199A (ja) * | 1999-12-02 | 2000-05-12 | Matsushita Electric Ind Co Ltd | 音声符号化装置/復号化装置 |
US6947888B1 (en) | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
JP2002202799A (ja) | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
DE60214027T2 (de) * | 2001-11-14 | 2007-02-15 | Matsushita Electric Industrial Co., Ltd., Kadoma | Kodiervorrichtung und dekodiervorrichtung |
JP2003304238A (ja) * | 2002-04-09 | 2003-10-24 | Sony Corp | 信号再生方法及び装置、信号記録方法及び装置、並びに符号列生成方法及び装置 |
US7218251B2 (en) | 2002-03-12 | 2007-05-15 | Sony Corporation | Signal reproducing method and device, signal recording method and device, and code sequence generating method and device |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US7619995B1 (en) * | 2003-07-18 | 2009-11-17 | Nortel Networks Limited | Transcoders and mixers for voice-over-IP conferencing |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
US7668711B2 (en) | 2004-04-23 | 2010-02-23 | Panasonic Corporation | Coding equipment |
EP2184919A3 (en) | 2004-04-28 | 2010-07-28 | Panasonic Corporation | Stream generation apparatus, stream generation method, coding apparatus, coding method, recording medium and program thereof |
EP1742202B1 (en) * | 2004-05-19 | 2008-05-07 | Matsushita Electric Industrial Co., Ltd. | Encoding device, decoding device, and method thereof |
JP4939424B2 (ja) | 2004-11-02 | 2012-05-23 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 複素値のフィルタ・バンクを用いたオーディオ信号の符号化及び復号化 |
KR100707174B1 (ko) | 2004-12-31 | 2007-04-13 | 삼성전자주식회사 | 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법 |
US7805314B2 (en) * | 2005-07-13 | 2010-09-28 | Samsung Electronics Co., Ltd. | Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data |
US7587314B2 (en) * | 2005-08-29 | 2009-09-08 | Nokia Corporation | Single-codebook vector quantization for multiple-rate applications |
KR20070026939A (ko) * | 2005-08-29 | 2007-03-09 | 주식회사 아이캐시 | 한 개의 카드번호를 이용한 마일리지 포인트, 전자화폐,전자상품권, 선불카드, 직불카드 및 타 신용카드의통합결제 시스템 및 방법 |
KR100795727B1 (ko) * | 2005-12-08 | 2008-01-21 | 한국전자통신연구원 | Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법 |
KR20070115637A (ko) * | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US9159333B2 (en) | 2006-06-21 | 2015-10-13 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
US8010352B2 (en) * | 2006-06-21 | 2011-08-30 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
KR101390188B1 (ko) * | 2006-06-21 | 2014-04-30 | 삼성전자주식회사 | 적응적 고주파수영역 부호화 및 복호화 방법 및 장치 |
KR101393298B1 (ko) | 2006-07-08 | 2014-05-12 | 삼성전자주식회사 | 적응적 부호화/복호화 방법 및 장치 |
US7873514B2 (en) | 2006-08-11 | 2011-01-18 | Ntt Docomo, Inc. | Method for quantizing speech and audio through an efficient perceptually relevant search of multiple quantization patterns |
CN101512639B (zh) * | 2006-09-13 | 2012-03-14 | 艾利森电话股份有限公司 | 用于语音/音频发送器和接收器的方法和设备 |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
JP5171842B2 (ja) * | 2006-12-12 | 2013-03-27 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法 |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
CN101231850B (zh) * | 2007-01-23 | 2012-02-29 | 华为技术有限公司 | 编解码方法及装置 |
FR2912249A1 (fr) * | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
CN101542596B (zh) * | 2007-02-14 | 2016-05-18 | Lg电子株式会社 | 用于编码和解码基于对象的音频信号的方法和装置 |
US8032359B2 (en) * | 2007-02-14 | 2011-10-04 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101430880A (zh) * | 2007-11-07 | 2009-05-13 | 华为技术有限公司 | 一种背景噪声的编解码方法和装置 |
CN101868821B (zh) * | 2007-11-21 | 2015-09-23 | Lg电子株式会社 | 用于处理信号的方法和装置 |
WO2009093466A1 (ja) * | 2008-01-25 | 2009-07-30 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
JP5108960B2 (ja) * | 2008-03-04 | 2012-12-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号処理方法及び装置 |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8831958B2 (en) * | 2008-09-25 | 2014-09-09 | Lg Electronics Inc. | Method and an apparatus for a bandwidth extension using different schemes |
US20100114568A1 (en) * | 2008-10-24 | 2010-05-06 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
RU2493618C2 (ru) * | 2009-01-28 | 2013-09-20 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
JP4892021B2 (ja) | 2009-02-26 | 2012-03-07 | 株式会社東芝 | 信号帯域拡張装置 |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
US8311843B2 (en) * | 2009-08-24 | 2012-11-13 | Sling Media Pvt. Ltd. | Frequency band scale factor determination in audio encoding based upon frequency band signal energy |
ES2797525T3 (es) * | 2009-10-15 | 2020-12-02 | Voiceage Corp | Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC |
BR112012009490B1 (pt) | 2009-10-20 | 2020-12-01 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados |
US9443534B2 (en) | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
CN102436820B (zh) | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
SG191771A1 (en) * | 2010-12-29 | 2013-08-30 | Samsung Electronics Co Ltd | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |
-
2011
- 2011-12-28 SG SG2013050422A patent/SG191771A1/en unknown
- 2011-12-28 AU AU2011350143A patent/AU2011350143B9/en active Active
- 2011-12-28 EP EP11853939.4A patent/EP2657933B1/en active Active
- 2011-12-28 CN CN201180068757.9A patent/CN103493131B/zh active Active
- 2011-12-28 ES ES17179600T patent/ES2967508T3/es active Active
- 2011-12-28 BR BR122021007425-9A patent/BR122021007425B1/pt active IP Right Grant
- 2011-12-28 MX MX2013007489A patent/MX2013007489A/es active IP Right Grant
- 2011-12-28 CN CN201610903549.0A patent/CN106409305B/zh active Active
- 2011-12-28 MY MYPI2017000646A patent/MY186055A/en unknown
- 2011-12-28 CA CA2981539A patent/CA2981539C/en active Active
- 2011-12-28 CA CA2823175A patent/CA2823175C/en active Active
- 2011-12-28 EP EP15199906.7A patent/EP3023985B1/en active Active
- 2011-12-28 CA CA2929800A patent/CA2929800C/en active Active
- 2011-12-28 CN CN201610903714.2A patent/CN106228992B/zh active Active
- 2011-12-28 MY MYPI2017000645A patent/MY185753A/en unknown
- 2011-12-28 ES ES11853939.4T patent/ES2564504T3/es active Active
- 2011-12-28 EP EP17179600.6A patent/EP3249647B1/en active Active
- 2011-12-28 BR BR112013016438-7A patent/BR112013016438B1/pt active IP Right Grant
- 2011-12-28 JP JP2013547347A patent/JP6148983B2/ja active Active
- 2011-12-28 WO PCT/KR2011/010258 patent/WO2012091464A1/ko active Application Filing
-
2012
- 2012-06-11 KR KR1020120062356A patent/KR102022664B1/ko active IP Right Grant
-
2015
- 2015-12-11 JP JP2015242633A patent/JP6240145B2/ja active Active
-
2017
- 2017-11-02 JP JP2017213145A patent/JP6599417B2/ja active Active
- 2017-12-11 RU RU2017143135A patent/RU2672133C1/ru active
-
2018
- 2018-12-10 US US16/215,079 patent/US10453466B2/en active Active
-
2019
- 2019-09-10 KR KR1020190112363A patent/KR102109938B1/ko active IP Right Grant
- 2019-10-18 US US16/657,631 patent/US10811022B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2564504T3 (es) | Aparato de codificación y aparato de descodificación con una ampliación de ancho de banda | |
KR102013242B1 (ko) | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 | |
AU2016222488B2 (en) | Apparatus and method for encoding/decoding for high-frequency bandwidth extension | |
AU2015202393B2 (en) | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |