ES2814154T3 - Codificación de audio - Google Patents

Codificación de audio Download PDF

Info

Publication number
ES2814154T3
ES2814154T3 ES15826814T ES15826814T ES2814154T3 ES 2814154 T3 ES2814154 T3 ES 2814154T3 ES 15826814 T ES15826814 T ES 15826814T ES 15826814 T ES15826814 T ES 15826814T ES 2814154 T3 ES2814154 T3 ES 2814154T3
Authority
ES
Spain
Prior art keywords
subband
khz
audio frame
current audio
spectral coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15826814T
Other languages
English (en)
Inventor
Zexin Liu
Lei Miao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2814154T3 publication Critical patent/ES2814154T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electrolytic Production Of Non-Metals, Compounds, Apparatuses Therefor (AREA)
  • Stereophonic System (AREA)

Abstract

Un método de codificación de audio, que comprende: realizar (201) procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual; adquirir (202) un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual, y determinar (203) si un cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T4; si el cociente de la división del valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que el umbral T4, codificar (204) coeficientes espectrales de la trama de audio actual en base a un algoritmo de excitación codificado de transformación, y si el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T4, codificar (205) coeficientes espectrales de la trama de audio actual en base a un algoritmo de codificación de transformación de alta calidad.

Description

DESCRIPCIÓN
Codificación de audio
Campo técnico
La presente invención se refiere a tecnologías de codificación de audio, y específicamente, a un método de codificación de audio y a un aparato relacionado.
Antecedentes
En un algoritmo de codificación de audio (por ejemplo, música) ya existente, a una misma tasa de bits, algunos algoritmos de codificación de audio están limitados a un ancho de banda de codificación particular, y se utilizan principalmente para codificar una trama de audio que tiene un ancho de banda relativamente bajo, y algunos algoritmos de codificación de audio no están limitados a un ancho de banda de codificación, y se usan principalmente para codificar una trama de audio que tiene un ancho de banda relativamente alto. Ciertamente, las dos categorías mencionadas de algoritmos de codificación de audio tienen ventajas y desventajas.
Sin embargo, en la técnica anterior, durante la codificación de la trama de audio, se usa directamente un algoritmo de codificación fijo para codificar una trama de audio. De esta manera, el algoritmo de codificación de audio utilizado difícilmente puede asegurar una buena calidad de codificación o una buena eficiencia de codificación.
El documento “MPEG unified Speech and Audio Coding” (MULTIMEDIA IEEE, CENTRO DE SERVICIO IEEE, NUEVA YORK, NY, US, vol. 20, núm. 2, 1 de Abril de 2013, páginas 72-78) describe que la USAC incorpora las arquitecturas de codificación TCX y MdCT.
Compendio
La presente invención proporciona un método de codificación de audio y un aparato relacionado, para mejorar la calidad de codificación o la eficiencia de codificación de la codificación de trama de audio. La presente invención está definida por las reivindicaciones independientes.
Tal y como puede apreciarse, después de que se adquiera un parámetro de codificación de referencia de una trama de audio actual, se selecciona un algoritmo TCX o un algoritmo HQ en base al parámetro de codificación de referencia adquirido de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. El parámetro de codificación de referencia de la trama de audio actual está asociado a un algoritmo de codificación utilizado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y el parámetro de codificación de referencia de la trama de audio actual, y además ayuda a mejorar la calidad de codificación o la eficiencia de codificación de la trama de audio actual.
Breve descripción de los dibujos
Para describir las soluciones técnicas de la presente invención de manera más clara, se introducen a continuación de forma resumida los dibujos que se acompañan para describir realizaciones de la presente invención. Evidentemente, los dibujos que se acompañan en la descripción que sigue muestran solamente algunas realizaciones de la presente invención.
La Figura 1, la Figura 3, y las Figuras 5 a 8 son diagramas de flujo esquemáticos de varios métodos de codificación de audio conforme a ejemplos útiles para entender la presente invención;
La Figura 2 y la Figura 4 son diagramas de flujo esquemáticos de dos métodos de codificación de audio conforme a realizaciones de la presente invención, y
La Figura 9 y la Figura 10 son diagramas esquemáticos de dos tipos de codificadores de audio conforme a ejemplos útiles para entender la presente invención.
Descripción de realizaciones
La presente invención proporciona un método de codificación de audio y un aparato relacionado, para mejorar la calidad de codificación o la eficiencia de codificación en codificación de trama de audio.
Para hacer que los expertos en la materia entiendan mejor las soluciones técnicas de la presente invención, lo que sigue describe claramente las soluciones técnicas de la presente invención con referencia a los dibujos que se acompañan, que muestran realizaciones preferidas de la presente invención. Evidentemente, las realizaciones descritas son solamente una parte y no todas las realizaciones de la presente invención.
Lo que sigue proporciona descripciones detalladas.
En la descripción, reivindicaciones y dibujos que se acompañan de la presente invención, los términos “primero”, “segundo”, “tercero”, “cuarto”, y así sucesivamente, están destinados a distinguir entre diferentes objetos, pero no están destinados a describir un orden específico. Adicionalmente, los términos “incluyen” y “tienen” y cualquier variación de los mismos, están destinados a cubrir inclusiones no exclusivas. Por ejemplo, un proceso, un método, un sistema, un producto o un dispositivo que incluya una serie de etapas o de unidades, no está limitado a las etapas o unidades relacionadas, sino que opcionalmente incluye además un etapa o unidad que no haya sido relacionada, u opcionalmente incluye además otra etapa o unidad inherente del proceso, el método, el producto o el dispositivo.
Lo que sigue introduce en primer lugar el método de codificación de audio proporcionado en las realizaciones de la presente invención. El método de codificación de audio proporcionado en las realizaciones de la presente invención puede ser ejecutado mediante un codificador de audio. El codificador de audio puede ser cualquier aparato que necesite recoger, almacenar, o transmitir una señal de audio, por ejemplo, un teléfono móvil, un ordenador de tableta, un ordenador personal, o un ordenador portátil.
En un ejemplo del método de codificación de audio útil para entender la presente invención, el método de codificación de audio incluye: realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual; adquirir un parámetro de codificación de referencia de la trama de audio actual; y si el parámetro de codificación de referencia adquirido de la trama de audio actual satisface una primera condición de parámetro, codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de excitación codificado de transformación, o si el parámetro de codificación de referencia adquirido de la trama de audio actual satisface una segunda condición de parámetro, codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de codificación de transformación de alta calidad.
Con referencia a la Figura 1, la Figura 1 es un diagrama de flujo esquemático de un método de codificación de audio conforme a un ejemplo útil para entender la presente invención. Según se muestra en la Figura 1, el método de codificación de audio proporcionado en este ejemplo útil para entender la presente invención puede incluir el siguiente contenido:
101: Realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual.
La trama de audio mencionada puede ser una trama de habla o una trama de música.
102: Adquirir un parámetro de codificación de referencia de la trama de audio actual.
103: Si el parámetro de codificación de referencia adquirido de la trama de audio actual satisface una primera condición de parámetro, codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de codificación de excitación codificado de transformación (Inglés: transform coded excitation, TCX para abreviar).
104: Si el parámetro de codificación de referencia adquirido de la trama de audio actual satisface una segunda condición de parámetro, codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de codificación de transformación de alta calidad (Inglés: high quality transform coding, HQ para abreviar).
Como puede apreciarse, en soluciones de este ejemplo útiles para entender la presente invención, después de que se adquiere un parámetro de codificación de referencia de una trama de audio actual, se selecciona un algoritmo TCX o un algoritmo HQ en base al parámetro de codificación de referencia adquirido de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. El parámetro de codificación de referencia de la trama de audio actual está asociado a un algoritmo de codificación usado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y el parámetro de codificación de referencia de la trama de audio actual, y además ayuda a mejorar la calidad de codificación o la eficiencia de codificación de la trama de audio actual.
En el algoritmo TCX, se realiza habitualmente procesamiento de extracción sobre una señal en el dominio del tiempo de la trama de audio actual. Por ejemplo, se usa un filtro espejo de cuadratura para realizar procesamiento de extracción sobre la señal en el dominio del tiempo de la trama de audio actual. En el algoritmo HQ, el procesamiento de extracción no se realiza sobre la señal en el dominio del tiempo de la trama de audio actual.
Según un requisito de un escenario de aplicación, el parámetro de codificación de referencia, adquirido en la etapa 102, de la trama de audio actual, puede ser variable.
Por ejemplo, el parámetro de codificación de referencia puede incluir al menos uno de los siguientes parámetros: una tasa de codificación de la trama de audio actual; una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda z, y que es de la trama de audio actual; una desviación de envolvente de los coeficientes espectrales que están ubicados dentro de una subbanda w, y que es de la trama de audio actual; un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual; un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda m, y que es de la trama de audio actual, y un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda n, y que es de la trama de audio actual; una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual; una desviación de envolvente de coeficientes espectrales que están ubicados dentro de una subbanda r, y que es de la trama de audio actual, y una desviación de envolvente de coeficientes espectrales que están ubicados dentro de una subbanda s, y que es la trama de audio actual; una envolvente de coeficientes espectrales que están ubicados dentro de una subbanda e, y que es de la trama de audio actual, y una envolvente de coeficientes espectrales que están ubicados dentro de una subbanda f, y que es de la trama de audio actual; o un valor de parámetro de correlación espectral entre coeficientes espectrales que están ubicados dentro de una subbanda p, y que es de la trama de audio actual, y coeficientes espectrales que están ubicados dentro de una subbanda q, y que es de la trama de audio actual.
Un valor de parámetro mayor de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, indica una correlación espectral más intensa entre los coeficientes espectrales ubicados dentro de la subbanda p, y los coeficientes espectrales ubicados dentro de la subbanda q. El valor de parámetro de la correlación espectral puede ser, por ejemplo, un valor de parámetro de correlación cruzada normalizado.
Los intervalos de segmento de frecuencia de las subbandas pueden ser determinados conforme a necesidades reales.
Opcionalmente, en algunas maneras de implementación posibles, un segmento de frecuencia más alta de la subbanda z puede ser mayor que un segmento F1 de frecuencia crítica, y un segmento de frecuencia más alto de la subbanda w puede ser mayor que el segmento F1 de frecuencia crítica. Un rango de valor del segmento F1 de frecuencia crítica puede ser, por ejemplo, de 6,4 kHz a 12 kHz. Por ejemplo, un valor del segmento F1 de frecuencia crítica puede ser de 6,4 kHz, 8 kHz, 9 kHz, 10 kHz o 12 kHz. Ciertamente, el segmento F1 de frecuencia crítica puede ser otro valor.
Opcionalmente, en algunas formas de implementación posibles, un segmento de frecuencia más alta de la subbanda j puede ser mayor que un segmento F2 de frecuencia crítica, y un segmento de frecuencia más alta de la subbanda n es mayor que el segmento F2 de frecuencia crítica. Por ejemplo, un rango de valor del segmento F2 de frecuencia crítica puede ser de 4,8 kHz a 8 kHz. Específicamente, por ejemplo, un valor del segmento F2 de frecuencia crítica puede ser 6,4 kHz, 4,8 kHz, 6 kHz, 8 kHz, 5 kHz o 7 kHz. Ciertamente, el segmento F2 de frecuencia crítica puede ser otro valor.
Opcionalmente, en algunas formas de implementación posibles, un segmento de frecuencia más alta de la subbanda i puede ser menor que el segmento de frecuencia más alta de la subbanda j, un segmento de frecuencia más alta de la subbanda m puede ser menor que el segmento de frecuencia más alta de la subbanda n, un segmento de frecuencia más alta de la subbanda x puede ser menor o igual que un segmento de frecuencia más baja de la subbanda y, un segmento de frecuencia más alta de la subbanda p puede ser menor o igual que un segmento de frecuencia más baja de la subbanda q, un segmento de frecuencia más alta de la subbanda r puede ser menor o igual que un segmento de frecuencia más baja de la subbanda s, y un segmento de frecuencia más alta de la subbanda e puede ser menor o igual que un segmento de frecuencia más baja de la subbanda f.
Opcionalmente, en algunas formas de implementación posibles, se puede satisfacer al menos una de las condiciones siguientes:
un segmento de frecuencia más baja de la subbanda w es mayor o igual que el segmento F1 de frecuencia crítica, un segmento de frecuencia más baja de la subbanda z es mayor o igual que el segmento F1 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda i es menor o igual que un segmento de frecuencia más baja de la subbanda j, el segmento de frecuencia más alta de la subbanda m es menor o igual que un segmento de frecuencia más baja de la subbanda n, un segmento de frecuencia más baja de la subbanda j es mayor o igual que el segmento F2 de frecuencia crítica, un segmento de frecuencia más baja de la subbanda n es mayor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda i es menor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda m es menor o igual que el segmento F2 de frecuencia crítica, un segmento de frecuencia más baja de la subbanda j es mayor o igual que el segmento F2 de frecuencia crítica, o un segmento de frecuencia más baja de la subbanda n es mayor o igual que el segmento F2 de frecuencia crítica.
Opcionalmente, en algunas formas de implementación posibles, se puede satisfacer al menos una de las condiciones siguientes: el segmento de frecuencia más alta de la subbanda e es menor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda x es menor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda p es menor o igual que el segmento F2 de frecuencia crítica, o el segmento de frecuencia más alta de la subbanda r es menor o igual que el segmento F2 de frecuencia crítica.
Opcionalmente, en algunas formas de implementación posibles, el segmento de frecuencia más alta de la subbanda f puede ser menor o igual que el segmento F2 de frecuencia crítica y, ciertamente, el segmento de frecuencia más baja de la subbanda f puede ser mayor o igual que el segmento F2 de frecuencia crítica. El segmento de frecuencia más alta de la subbanda q puede ser menor o igual que el segmento F2 de frecuencia crítica y, ciertamente, el segmento de frecuencia más baja de la subbanda q puede ser mayor o igual que el segmento F2 de frecuencia crítica. El segmento de frecuencia más alta de la subbanda s puede ser menor o igual que el segmento F2 de frecuencia crítica y, ciertamente, el segmento de frecuencia más baja de la subbanda s puede ser mayor o igual que el segmento F2 de frecuencia crítica.
Por ejemplo, un rango de valor del segmento de frecuencia más alta de la subbanda z puede ser de 12 kHz a 16 kHz. Un rango de valor del segmento de frecuencia más baja de la subbanda z puede ser de 8 kHz a 14 kHz. Un rango de valor de un ancho de banda de la subbanda z puede ser de 1,6 kHz a 8 kHz. Específicamente, por ejemplo, un intervalo de segmento de frecuencia de la subbanda z puede ser de 8 kHz a 12 kHz, de 9 kHz a 11 kHz, de 8 kHz a 9,6 kHz, o de 12 kHz a 14 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda z no está limitado a los ejemplos que anteceden.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda w puede ser determinado conforme a necesidades reales. Por ejemplo, un rango de valor del segmento de frecuencia más alta de la subbanda w puede ser de 12 kHz a 16 kHz, y un rango de valor del segmento de frecuencia más baja de la subbanda w puede ser de 8 kHz a 14 kHz. Específicamente, por ejemplo, el intervalo de segmento de frecuencia de la subbanda w es de 8 kHz a 12 kHz, de 9 kHz a 11 kHz, de 8 kHz a 9,6 kHz, de 12 kHz a 14 kHz, o de 12,2 kHz a 14,5 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda w no está limitado a los ejemplos que anteceden. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda w puede ser el mismo que, o similar al intervalo de segmento de frecuencia de la subbanda z.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda i puede ser de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4.8 kHz, de 4,8 kHz a 6,4 kHz, de 0,4 kHz a 6,4 kHz, o de 0,4 kHz a 3,6 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda i no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda j puede ser de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, de 4,8 kHz a 9,6 kHz, o de 4,8 kHz a 8 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda j no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda m puede ser de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4.8 kHz, de 4,8 kHz a 6,4 kHz, de 0,4 kHz a 6,4 kHz, o de 0,4 kHz a 3,6 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda m no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda m puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda i.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda n puede ser de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, de 4,8 kHz a 9,6 kHz, o de 4,8 kHz a 8 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda n no está limitado a los ejemplos que anteceden. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda n puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda j.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda x puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 2 kHz a 3,2 kHz, o de 2,5 kHz a 3,4 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda x no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda y puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 4,4 kHz a 6,4 kHz, o de 4,5 kHz a 6,2 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda y no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda p puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 2,1 kHz a 3,2 kHz, o de 2,5 kHz a 3,5 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda p no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda p puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda x.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda q puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 4,2 kHz a 6,4 kHz, o de 4,7 kHz a 6,2 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda q no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda q puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda y.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda r puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 2,05 kHz a 3,27 kHz, o de 2,59 kHz a 3,51 kHz. Ciertamente, el intervalo de segmento de frecuencia de las subbanda r no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda r puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda x.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda s puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 5,4 kHz a 7,1 kHz, o de 4,55 kHz a 6,29 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda s no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda s puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda y.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda e puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 0,8 kHz a 3 kHz, o de 1,9 kHz a 3,8 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda e no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda e puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda x.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda f puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 5,3 kHz a 7,15 kHz, o de 4,58 kHz a 6,52 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda f no está limitado a los ejemplos anteriores. En algunas formas de realización posibles, el intervalo de segmento de frecuencia de la subbanda f puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda y.
La primera condición de parámetro puede ser modificada.
Por ejemplo, en algunas forma de implementación posibles, la primera condición de parámetro puede incluir, por ejemplo, al menos una de las siguientes condiciones:
la tasa de codificación de la trama de audio actual es menor que un umbral T1 (el umbral T1 puede ser, por ejemplo, mayor que, o igual a, 24,4 kbps, 32 kbps, 64 kbps u otra tasa),
la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T2 (el umbral T2 puede ser, por ejemplo, mayor que, o igual a 1,2, 3, 5 u otro valor);
la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T3 (el umbral T3 puede ser, por ejemplo, mayor que, o igual a 10, 20, 35, u otro valor);
un cociente de la división del valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T4 (el umbral T4 puede ser, por ejemplo, mayor que, o igual a, 0,5, 1,2, 3 u otro valor);
una diferencia de restar el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, del valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, es mayor o igual que un umbral T5 (el umbral T5 puede ser, por ejemplo, mayor que, o igual a, 10, 20, 51, 100 u otro valor);
un cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es mayor o igual que un umbral T6 (el umbral T6 puede ser, por ejemplo, mayor que, o igual a 0,5, 1,1,2, 3 u otro valor);
una diferencia de restar el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, del valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, es mayor o igual que un umbral T7 (el umbral T7 puede ser, por ejemplo, mayor que, o igual a 11,20, 50, 101 u otro valor);
una relación entre la relación de valor de pico respecto al valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto al valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, cae dentro de un intervalo R1 (el intervalo R1 puede ser, por ejemplo, [0,5, 2], [0,4, 2,5], u otro valor);
un valor absoluto de una diferencia entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es menor o igual que un umbral T8 (el umbral T8 puede ser, por ejemplo, mayor que, o igual a 1, 2, 3 u otro valor);
una relación de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, respecto a la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, cae dentro de un intervalo R2 (el intervalo R2 puede ser, por ejemplo, [0,5, 2], [0,4, 2,5], u otro valor);
un valor absoluto de una diferencia entre la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, y la desviación de envolvente de los coeficientes espectrales que están ubicados en la subbanda s, y que es de la trama de audio actual, es menor o igual que un umbral T9 (el umbral T9 puede ser, por ejemplo, mayor o igual que 10, 20, 35 u otro valor);
una relación de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, respecto a la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, cae dentro de un intervalo R3 (el intervalo R3 puede ser, por ejemplo, [0,5, 2], [0,4, 2,5] u otro valor);
un valor absoluto de una diferencia entre la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es menor o igual que un umbral T10 (el umbral T10 puede ser, por ejemplo, mayor o igual que 11,20, 50, 101 u otro valor);
el valor de parámetro de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, es mayor o igual que un umbral T11 (el umbral T11 puede ser, por ejemplo, 0,5, 0,8, 0,9, 1 u otro valor).
En otro ejemplo, en algunas formas de implementación posibles, la primera condición de parámetro, por ejemplo, puede incluir una de las siguientes condiciones:
la tasa de codificación de la trama de audio actual es mayor o igual que el umbral T1, y el cociente de la división del valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T12 (el umbral T12 puede ser, por ejemplo, mayor o igual que el umbral T4, y el umbral T12 puede ser, por ejemplo, mayor que, o igual a 2, 3, 5, 8 u otro valor);
la tasa de codificación de la trama de audio actual es mayor o igual que el umbral T1, y el cociente de la división del valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es la trama de audio actual, por valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es la trama de audio actual, es mayor o igual que un umbral T13 (el umbral T13 puede ser, por ejemplo, mayor o igual que el umbral T6, y el umbral T13 puede ser, por ejemplo, mayor que, o igual a 2, 3, 9, 7 u otro valor);
la tasa de codificación de la trama de audio actual es mayor o igual que el umbral T1, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T14 (el umbral T14 puede ser, por ejemplo, menor o igual que el umbral T2, y el umbral T14 puede ser, por ejemplo, menor que, o igual a 0,5, 2, 3, 1,5, 4 u otro valor);
la tasa de codificación de la trama de audio actual es mayor o igual que el umbral T1, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T15 (el umbral T15 puede ser, por ejemplo, menor o igual que el umbral T3, y el umbral T15 puede ser, por ejemplo, menor que, o igual a 5, 8, 10, 20 u otro valor);
la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T16 (el umbral T16 puede ser, por ejemplo, mayor o igual que el umbral T4, y el umbral T16 puede ser, por ejemplo, mayor que, o igual a 2, 3, 5, 8 u otro valor);
la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es mayor o igual que un umbral T17 (el umbral T17 puede ser, por ejemplo, mayor o igual que el umbral T6, y el umbral T17 puede ser, por ejemplo, mayor que, o igual a 2, 3, 9, 7, u otro valor);
la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T18 (el umbral T18 puede ser, por ejemplo, menor o igual que el umbral T2, y el umbral T18 puede ser, por ejemplo, menor que, o igual a 0,5, 2, 3, 1,5, 4, 5 u otro valor);
la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T19 (el umbral T19 puede ser, por ejemplo, menor o igual que el umbral T3, y el umbral T19 puede ser, por ejemplo, menor que, o igual a 5, 8, 10, 20 u otro valor);
el valor absoluto de la diferencia entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T8, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T20 (el umbral T20 puede ser, por ejemplo, mayor o igual que el umbral T4, y el umbral T20 puede ser, por ejemplo, mayor que, o igual a 2, 3, 5, 8 u otro valor);
el valor absoluto de la diferencia entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T8, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es mayor o igual que un umbral T21 (el umbral T21 puede ser, por ejemplo, mayor o igual que el umbral T6, y el umbral T21 puede ser, por ejemplo, mayor que, o igual a 2, 3, 9, 7 u otro valor);
el valor absoluto de la diferencia entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T8, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T22 (el umbral T22 puede ser, por ejemplo, menor o igual que el umbral T2, y el umbral T22 puede ser, por ejemplo, menor que, o igual a 0,5, 2, 3, 1,5, 4, 5 u otro valor);
el valor absoluto de la diferencia entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T8, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T23 (el umbral T23 puede ser, por ejemplo, menor o igual que el umbral T3, y el umbral T23 puede ser, por ejemplo, menor que, o igual a 5, 8, 10, 20 u otro valor);
la relación de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, respecto a la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, no cae dentro del intervalo R2, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda 1, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T24 (el umbral T24 puede ser, por ejemplo, mayor o igual que el umbral T4, y el umbral T24 puede ser, por ejemplo, mayor que, o igual a 2, 3, 5, 8 u otro valor);
la relación de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, respecto a la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, no cae dentro del intervalo R2, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es mayor o igual que un umbral T25 (el umbral T25 puede ser, por ejemplo, mayor o igual que el umbral T6, y el umbral T25 puede ser, por ejemplo, mayor que, o igual a 2, 3, 9, 7 u otro valor);
la relación de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que de la trama de audio actual, respecto a la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, no caen dentro del intervalo R2, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual un umbral T26 (el umbral T26 puede ser, por ejemplo, menor o igual que el umbral T2, y el umbral T26 puede ser, por ejemplo, menor que, o igual a 0,5, 2, 3, 1,5, 4, 5 u otro valor);
la relación de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, respecto a la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, no cae dentro del intervalo R2, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T27 (el umbral T27 puede ser, por ejemplo, menor o igual que el umbral T3, y el umbral T27 puede ser, por ejemplo, menor que, o igual a 5, 8, 10, 20 u otro valor);
el valor absoluto de la diferencia entre la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T9, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T28 (el umbral T28 puede ser, por ejemplo, mayor o igual que el umbral T4, y el umbral T28 puede ser, por ejemplo, mayor que, o igual a 2, 3, 5, 8 u otro valor);
el valor absoluto de la diferencia entre la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T9, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es mayor o igual que un umbral T29 (el umbral T29 puede ser, por ejemplo, mayor o igual que el umbral T6, y el umbral T29 puede ser, por ejemplo, mayor que, o igual a 2, 3, 9, 7 u otro valor);
el valor absoluto de la diferencia entre la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T9, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T30 (el umbral T30 puede ser, por ejemplo, menor o igual que el umbral T2, y el umbral T30 puede ser, por ejemplo, menor que, o igual a 0,5, 2, 3, 1,5, 4, 5 u otro valor);
el valor absoluto de la diferencia entre la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T9, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T31 (el umbral T31 puede ser, por ejemplo, menor o igual que el umbral T3, y el umbral T31 puede ser, por ejemplo, menor que, o igual a 5, 8, 10, 20 u otro valor);
la relación de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, respecto a la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, cae dentro del intervalo R3, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T32 (el umbral T32 puede ser, por ejemplo, mayor o igual que el umbral T4, y el umbral T32 puede ser, por ejemplo, mayor que, o igual a 2, 3, 5, 8 u otro valor);
la relación de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, respecto a la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, cae dentro del intervalo R3, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es mayor o igual que un umbral T33 (el umbral T33 puede ser, por ejemplo, mayor o igual que el umbral T6, y el umbral T33 puede ser, por ejemplo, mayor que, o igual a 2, 3, 9, 7 u otro valor);
la relación de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, respecto a la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, cae dentro del intervalo R3, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T34 (el umbral T34 puede ser, por ejemplo, menor o igual que el umbral T2, y el umbral T34 puede ser, por ejemplo, menor que, o igual a 0,5, 2, 3, 1,5, 4, 5 u otro valor);
la relación de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, respecto a la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, cae dentro del intervalo R3, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T35 (el umbral T35 puede ser, por ejemplo, menor o igual que el umbral T3, y el umbral T35 puede ser, por ejemplo, menor que, o igual a 5, 8, 9,5, 10, 15, 20 u otro valor);
el valor absoluto de la diferencia entre la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T10, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T36 (el umbral T36 puede ser, por ejemplo, mayor o igual que el umbral T4, y el umbral T36 puede ser, por ejemplo, mayor que, o igual a 2, 3, 5, 8 u otro valor);
el valor absoluto de la diferencia entre la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T10, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es mayor o igual que un umbral T37 (el umbral T37 puede ser, por ejemplo, mayor o igual que el umbral T6, y el umbral T37 puede ser, por ejemplo, mayor que, o igual a 2, 3, 9, 7 u otro valor);
el valor absoluto de la diferencia entre la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T10, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T38 (el umbral T38 puede ser, por ejemplo, menor o igual que el umbral T2, y el umbral T38 puede ser, por ejemplo, menor que, o igual a 0,5, 2, 3, 1,5, 4, 5 u otro valor);
el valor absoluto de la diferencia entre la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T10, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T39 (el umbral T39 puede ser, por ejemplo, menor o igual que el umbral T3, y el umbral T39 puede ser, por ejemplo, menor que, o igual a 5, 8, 9,5, 10, 15, 20 u otro valor);
el valor de parámetro de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, es menor o igual que el umbral T11, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T40 (el umbral T40 puede ser, por ejemplo, mayor o igual que el umbral T4, y el umbral T40 puede ser, por ejemplo, mayor que, o igual a 2, 3, 5, 8 u otro valor);
el valor de parámetro de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, es menor o igual que el umbral T11, y el cociente de la división del valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es mayor o igual que un umbral T41 (el umbral T41 puede ser, por ejemplo, mayor o igual que el umbral T6, y el umbral T41 puede ser, por ejemplo, mayor que, o igual a 2, 3, 9, 7 u otro valor);
el valor de parámetro de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que de la trama de audio actual, es menor o igual que el umbral T11, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T42 (el umbral T42 puede ser, por ejemplo, menor o igual que el umbral T2, y el umbral T42 puede ser, por ejemplo, menor que, o igual a 0,5, 2, 3, 1,5, 4, 5 u otro valor);
el valor de parámetro de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, es menor o igual que el umbral T11, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T43 (el umbral T43 puede ser, por ejemplo, menor o igual que el umbral T3, y el umbral T43 puede ser, por ejemplo, menor que, o igual a 5, 8, 9,5, 10, 15, 20 u otro valor);
un cociente de dividir la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, por la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es menor que un umbral T44 (un intervalo de valor del umbral T44 puede ser, por ejemplo, de 1,5 a 3), y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es menor que un umbral T45 (un intervalo de valor del umbral T45 puede ser, por ejemplo, de 1 a 3);
un cociente de dividir la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, por la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que un umbral T46 (un intervalo de valor del umbral T46 puede ser, por ejemplo, de 1,5 a 3), y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que un umbral T47 (un intervalo de valor del umbral T47 puede ser, por ejemplo, de 1 a 3);
una diferencia de restar la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, de la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, es menor que un umbral T48 (un intervalo de valor del umbral T48 puede ser, por ejemplo, de -1 a 3), y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es menor que un umbral T49 (un intervalo de valor del umbral T49 puede ser, por ejemplo, de 1 a 3);
una diferencia de restar la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, de la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, es mayor que un umbral T50 (un intervalo de valor del umbral T50 puede ser, por ejemplo, de -1 a 3), y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que un umbral T51 (un intervalo de valor del umbral T51 puede ser, por ejemplo, de 1 a 3);
un cociente de dividir la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, por la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es menor que un umbral T52 (un intervalo de valor del umbral T52 puede ser, por ejemplo, de 1 a 3), y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es menor que un umbral T53 (el umbral T53 puede ser, por ejemplo, 10, 20, 30 u otro valor);
un cociente de dividir la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, por la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que un umbral T54 (un intervalo de valor del umbral T54 puede ser, por ejemplo, de 1 a 3), y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que un umbral T55 (el umbral T55 puede ser, por ejemplo, 10, 20, 30 u otro valor);
una diferencia de restar la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, es menor que un umbral T56 (un intervalo de valor del umbral T56 puede ser, por ejemplo, de -40 a 40), y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro la subbanda s, y que es de la trama de audio actual, es menor que un umbral T57 (el umbral T57 puede ser, por ejemplo, 10, 20, 30 u otro valor);
una diferencia de restar la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, es mayor que un umbral T58 (un intervalo de valor del umbral T58 puede ser, por ejemplo, de -40 a 40), y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que un umbral T59 (el umbral T59 puede ser, por ejemplo, 10, 20, 30 u otro valor);
un cociente de dividir la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, por la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es menor que un umbral T60 (un intervalo de valor del umbral T60 puede ser, por ejemplo, de 1 a 3), y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es menor que un umbral T61 (el umbral T61 puede ser, por ejemplo, 10, 20, 30 u otro valor);
un cociente de dividir la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, por la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que un umbral T62 (un intervalo de valor del umbral T62 puede ser, por ejemplo, de 1 a 3), y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que un umbral T63 (el umbral T63 puede ser, por ejemplo, 10, 20, 30 u otro valor);
una diferencia de restar la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, es menor que un umbral T64 (un intervalo de valor del umbral T64 puede ser, por ejemplo, de -40 a 40), y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es menor que un umbral T65 (el umbral T65 puede ser, por ejemplo, 10, 20, 30 u otro valor);
una diferencia de restar la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, es mayor que un umbral T66 (un intervalo de valor del umbral T66 puede ser, por ejemplo, de -40 a 40), y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que un umbral T67 (el umbral T67 puede ser, por ejemplo, 10, 20, 30 u otro valor);
el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor o igual que un umbral T68 (el umbral T68 puede ser, por ejemplo, menor que, o igual a 0,5, 1,2, 3 u otro valor), y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T69 (el umbral T69 puede ser, por ejemplo, menor que, o igual a 1,2, 3, 5 u otro valor);
la diferencia de restar el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, del valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, es menor o igual que un umbral T70 (el umbral T70 puede ser, por ejemplo, menor que, o igual a 10, 20, 51, 100 u otro valor), y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T71 (el umbral T71 puede ser, por ejemplo, menor que, o igual a 1,2, 3, 5 u otro valor);
el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor o igual que un umbral T72 (el umbral T72 puede ser, por ejemplo, mayor que, o igual a 0,5, 1,1, 2, 3 u otor valor), y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T73 (el umbral T73 puede ser, por ejemplo, menor que, o igual a 1,2, 3, 5 u otro valor);
la diferencia de restar el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, del valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, es menor o igual que un umbral T74 (el umbral T74 puede ser, por ejemplo, mayor que, o igual a 11,20, 50, 101 u otro valor), y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es menor o igual que un umbral T75 (el umbral T75 puede ser, por ejemplo, menor que, o igual a 1,2, 3, 5 u otro valor);
el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor o igual que un umbral T76 (el umbral T76 puede ser, por ejemplo, menor que, o igual a 0,5, 1,2, 3 u otro valor), y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T77 (el umbral T77 puede ser, por ejemplo, mayor que, o igual a 10, 20, 35 u otro valor);
la diferencia de restar el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, del valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, es menor o igual que un umbral T78 (el umbral T78 puede ser, por ejemplo, menor que, o igual a 10, 20, 51, 100 u otro valor), y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T79 (el umbral T79 puede ser, por ejemplo, mayor que, o igual a 10, 20, 35 u otro valor);
el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor o igual que un umbral T80 (el umbral T80 puede ser, por ejemplo, mayor que, o igual a 0,5, 1,1, 2, 3 u otro valor), y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T81 (el umbral T81 puede ser, por ejemplo, mayor que, o igual a 10, 20, 35 u otro valor), o
la diferencia de restar el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, del valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, es menor o igual que un umbral T82 (el umbral T82 puede ser, por ejemplo, mayor que, o igual a 11,20, 50, 101 u otro valor), y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es menor o igual que un umbral T83 (el umbral T83 puede ser, por ejemplo, mayor que, o igual a 10, 20, 35 u otro valor).
Se puede comprender que la primera condición de parámetro no se limita a los ejemplos anteriores, y que se puede ampliar con otras múltiples maneras de implementación posibles en base a los ejemplos anteriores.
Por ejemplo, en algunas formas de implementación posibles, la segunda condición de parámetro incluye al menos una de las siguientes condiciones:
la tasa de codificación de la trama de audio actual es mayor o igual que el umbral T1;
la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T2;
la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T3;
el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T4;
la diferencia de restar el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, del valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, es menor que el umbral T5;
el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor que el umbral T6;
la diferencia de restar el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, del valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, es menor que el umbral T7;
la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1;
el valor absoluto de la diferencia entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T8;
la relación de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, respecto a la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, no cae dentro del intervalo R2;
el valor absoluto de la diferencia entre la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral la relación de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, respecto a la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, no cae dentro del intervalo R3;
el valor absoluto de la diferencia entre la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T10, o
el valor de parámetro de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, es menor que el umbral T11.
Conforme a otro ejemplo, en algunas formas de implementación posibles, la segunda condición de parámetro incluye una de las siguientes condiciones:
la tasa de codificación de la trama de audio actual es mayor o igual que el umbral T1, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T12;
la tasa de codificación de la trama de audio actual es mayor o igual que el umbral T1, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor que el umbral T13;
la tasa de codificación de la trama de audio actual es mayor o igual que el umbral T1, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T14;
la tasa de codificación de la trama de audio actual es mayor o igual que el umbral T1, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T15;
la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T16;
la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor que el umbral T17;
la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T18;
la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T19;
el valor absoluto de la diferencia entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T8, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T20;
el valor absoluto de la diferencia entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T8, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor que el umbral T21;
el valor absoluto de la diferencia entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T8, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T22;
el valor absoluto de la diferencia entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T8, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T23;
la relación de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, respecto a la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, no cae dentro del intervalo R2, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T24;
la relación de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, respecto a la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, no cae dentro del intervalo R2, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor que el umbral T25;
la relación de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, respecto a la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, no cae dentro del intervalo R2, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T26;
la relación de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, respecto a la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, no cae dentro del intervalo R2, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T27;
el valor absoluto de la diferencia entre la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T9, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T28;
el valor absoluto de la diferencia entre la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T9, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor que el umbral T29;
el valor absoluto de la diferencia entre la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T9, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T30;
el valor absoluto de la diferencia entre la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T9, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T31;
la relación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, respecto a la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, cae dentro del intervalo R3, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T32;
la relación de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, respecto a la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, cae dentro del intervalo R3, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor que el umbral T33;
la relación de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, respecto a la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, cae dentro del intervalo R3, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T34;
la relación de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, respecto a la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, cae dentro del intervalo R3, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T35;
el valor absoluto de la diferencia entre la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T10, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T36;
el valor absoluto de la diferencia entre la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T10, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor que el umbral T37;
el valor absoluto de la diferencia entre la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T10, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que de la trama de audio actual, es mayor que el umbral T38;
el valor absoluto de la diferencia entre la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T10, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T39;
el valor de parámetro de la correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, es menor o igual que el umbral T11, y el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T40;
el valor de parámetro de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, es menor o igual que el umbral T11, y el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor que el umbral T41;
el valor de parámetro de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, es menor o igual que el umbral T11, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T42;
el valor de parámetro de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, es menor o igual que el umbral T11, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T43;
el cociente de dividir la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, por la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es menor que el umbral T44, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T45;
el cociente de dividir la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, por la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T46, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es menor que el umbral T47;
la diferencia de restar la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, de la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, es menor que el umbral T48, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor que el umbral T49;
la diferencia de restar la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, de la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, es mayor que el umbral T50, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es menor que el umbral T51;
el cociente de dividir la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, por la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es menor que el umbral T52, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T53;
el cociente de dividir la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, por la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T54, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es menor que el umbral T55;
la diferencia de sustraer la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, es menor que el umbral T56, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es mayor que el umbral T57;
la diferencia de restar la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, de la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda r, y que es de la trama de audio actual, es mayor que el umbral T58, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda s, y que es de la trama de audio actual, es menor que el umbral T59;
el cociente de dividir la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, por la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es menor que el umbral T60, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T61;
el cociente de dividir la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, por la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T62, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es menor que el umbral T63;
la diferencia de restar la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, es menor que el umbral T64, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es mayor que el umbral T65;
la diferencia de restar la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, de la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda e, y que es de la trama de audio actual, es mayor que el umbral T66, y la envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda f, y que es de la trama de audio actual, es menor que el umbral T67;
el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor o igual que el umbral T68, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T69;
la diferencia de restar el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, del valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, es menor o igual que el umbral T70, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T71;
el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor o igual que el umbral T72, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T73;
la diferencia de restar el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, del valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, es menor o igual que el umbral T74, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que el umbral T75;
el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor o igual que el umbral T76, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T77;
la diferencia de restar el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, del valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, es menor o igual que el umbral T78, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T79;
el cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es menor o igual que el umbral T80, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro de la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T81, o
la diferencia de restar el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, del valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, es menor o igual que el umbral T82, y la desviación de envolvente de los coeficientes espectrales que están ubicados dentro la subbanda w, y que es de la trama de audio actual, es mayor que el umbral T83.
Se puede comprender que la segunda condición de parámetro no está limitada a los ejemplos anteriores, y que se pueden extender otras múltiples maneras de implementación posibles en base a los ejemplos anteriores.
Se puede comprender que los ejemplos de la primera condición de parámetro y de la segunda condición de parámetro no son en su totalidad maneras de implementación posibles. En una aplicación real, los ejemplos anteriores pueden ser ampliados, para enriquecer las maneras de implementación posibles de la primera condición de parámetro y de la segunda condición de parámetro.
Para una mejor comprensión de las realizaciones de la presente invención, se proporciona en lo que sigue una descripción ejemplar con referencia a algunos escenarios de aplicación específicos.
Haciendo referencia a la Figura 2, la Figura 2 es un diagrama de flujo esquemático de otro método de codificación de audio conforme a otra realización de la presente invención. En un ejemplo mostrado en la Figura 2, un algoritmo de codificación usado para codificar coeficientes espectrales de una trama de audio actual se determina principalmente en base a un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y a un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual.
Según se muestra en la Figura 2, el otro método de codificación de audio proporcionado en la otra realización de la presente invención, puede incluir el siguiente contenido:
201: Realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual.
La trama de audio mencionada en las realizaciones de la presente invención puede ser una trama de habla o una trama de música.
Se supone que un ancho de banda de la señal en el dominio del tiempo de la trama de audio actual es de 16 kHz.
El procesamiento de transformación de tiempo-frecuencia se realiza sobre la señal en el dominio del tiempo de la trama de audio actual usando un algoritmo de transformación rápida de Fourier (en inglés: fast Fourier transform, FFT para abreviar), un algoritmo de transformación coseno discreto modificado (en inglés: modified discrete cosine transform, MDCT para abreviar), u otro algoritmo de transformación de tiempo-frecuencia, para obtener los coeficientes espectrales de la trama de audio actual.
202: Adquirir un valor medio de energía de los coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual.
203: Determinar si un cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T4.
En caso afirmativo, se realiza la etapa 204; en caso negativo, se realiza la etapa 205.
El umbral T4 puede ser mayor que, o igual a 0,5, y el umbral T4, por ejemplo, es 0,5, 1, 1,5, 2, 3 u otro valor.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda i puede ser de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4,8 kHz, de 4,8 kHz a 6,4 kHz, o de 0,4 kHz a 6,4 kHz.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda j puede ser de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, o de 4,8 kHz a 9,6 kHz.
204: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo TCX.
205: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo HQ.
Como se puede apreciar, en soluciones de la presente realización, después de que se hayan adquirido un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual, se selecciona un algoritmo TCX o un algoritmo HQ en base al valor medio de energía adquirido de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, y al valor medio de energía adquirido de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. Una relación entre el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, y el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, está asociado a un algoritmo de codificación usado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y un parámetro de codificación de referencia de la trama de audio actual, y ayuda además a mejorar la calidad de codificación o la eficiencia de codificación de la trama de audio actual.
Haciendo referencia a la Figura 3, la Figura 3 es un diagrama de flujo esquemático de otro método de codificación de audio conforme a otro ejemplo útil para la comprensión de la presente invención. En un ejemplo mostrado en la Figura 3, un algoritmo de codificación usado para codificar coeficientes espectrales de una trama de audio actual se determina principalmente en base a un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda z, y que es de la trama de audio actual.
Según se muestra en la Figura 3, el otro método de codificación de audio proporcionado en el otro ejemplo útil para la comprensión de la presente invención, puede incluir el siguiente contenido:
301: Realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual.
La trama de audio mencionada en el ejemplo útil para la comprensión de la presente invención puede ser una trama de habla o una trama de música.
Se supone que un ancho de banda de la señal en el dominio del tiempo de la trama de audio actual es de 16 kHz.
302: Adquirir un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual.
303: Determinar si un cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T68.
En caso negativo, se realiza la etapa 304; en caso afirmativo, se realiza la etapa 306.
El umbral T68 es mayor o igual que un umbral T4. Por ejemplo, el umbral T68 puede ser mayor que, o igual a 0,6, y el umbral T68, por ejemplo, es 0,8, 0,6, 1, 1,5, 2, 3, 5 u otro valor.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda i puede ser de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4,8 kHz, de 4,8 kHz a 6,4 kHz, o de 0,4 kHz a 6,4 kHz.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda j puede ser de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, o de 4,8 kHz a 9,6 kHz.
304: Adquirir una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda z, y que es de la trama de audio actual.
305: Determinar si la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, es mayor que un umbral T69.
En caso afirmativo, se realiza la etapa 307; en caso negativo, se realiza la etapa 306.
El umbral T69 puede ser mayor que, o igual a 1, y el umbral T69, por ejemplo, es 1, 1,1, 1,5, 2, 3,5, 6, 4,6 u otro valor.
Por ejemplo, un intervalo de valor de un segmento de frecuencia más alta de la subbanda z puede ser de 12 kHz a 16 kHz, y un intervalo de valor de un segmento de frecuencia más baja de la subbanda z puede ser de 8 kHz a 14 kHz. Específicamente, por ejemplo, un intervalo de segmento de frecuencia de la subbanda z puede ser de 8 kHz a 12 kHz, de 9 kHz a 11 kHz, o de 8 kHz a 9,6 kHz.
306: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo TCX.
307: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo HQ.
Como se puede apreciar, en soluciones de este ejemplo útil para la comprensión de la presente invención, se selecciona un algoritmo TCX o un algoritmo HQ principalmente en base a un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda z, y que es de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. Una relación entre el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, y el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda z, y que es de la trama de audio actual, están asociados a un algoritmo de codificación usado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y un parámetro de codificación de referencia de la trama de audio actual, y ayuda a demás a mejorar la calidad de codificación o la eficacia de codificación de la trama de audio actual.
Haciendo referencia a la Figura 4, la Figura 4 es un diagrama de flujo esquemático de otro método de codificación de audio conforme a otra realización de la presente invención. En un ejemplo mostrado en la Figura 4, se determina un algoritmo de codificación usado para codificar coeficientes espectrales de una trama de audio actual, principalmente en base a una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual.
Según se muestra en la Figura 4, el otro método de codificación de audio proporcionado en la otra realización de la presente invención puede incluir el siguiente contenido:
401: Realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual.
La trama de audio mencionada en las realizaciones de la presente invención puede ser una trama de habla o una trama de música.
Se supone que un ancho de banda de la señal en el dominio del tiempo de la trama de audio actual es de 16 kHz.
402: Adquirir una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual.
403: Determinar si una relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, cae dentro de un intervalo R1.
En caso afirmativo, se realiza la etapa 404; en caso negativo, se realiza la etapa 405.
El intervalo R1 puede ser, por ejemplo, [0,5, 2], [0,8, 1,25], [0,4, 2,5], u otro intervalo.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda x puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, o de 1,6 kHz a 3,2 kHz, y un intervalo de segmento de frecuencia de la subbanda y puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, o de 4,8 kHz a 6,4 kHz.
404: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo TCX.
405: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo HQ.
Como puede apreciarse, en soluciones de esta realización, se selecciona un algoritmo TCX o un algoritmo HQ principalmente en base a una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. La relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, se asocian a un algoritmo de codificación usado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y un parámetro de codificación de referencia de la trama de audio actual, y ayuda además a mejorar la calidad de codificación o la eficiencia de codificación de la trama de audio actual.
Haciendo referencia a la Figura 5, la Figura 5 es un diagrama de flujo esquemático de otro método de codificación de audio conforme a otro ejemplo útil para comprender la presente invención. En un ejemplo mostrado en la Figura 5, se determina un algoritmo de codificación usado para codificar coeficientes espectrales de una trama de audio actual principalmente en base a una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual.
Según se muestra en la Figura 5, el otro método de codificación de audio proporcionado en el otro ejemplo útil para la comprensión de la presente invención puede incluir el siguiente contenido:
501: Realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual.
La trama de audio mencionada en las realizaciones de la presente invención puede ser una trama de habla o una trama de música.
Se supone que un ancho de banda de la señal en el dominio del tiempo de la trama de audio actual es de 16 kHz.
502: Adquirir una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual.
503: Determinar si un cociente de dividir la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro la subbanda x, y que es de la trama de audio actual, por la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor o igual que un umbral T46.
En caso afirmativo, se realiza la etapa 504; en caso negativo, se realiza la etapa 505.
El umbral T46 puede ser mayor que, o igual a 0,5, y el umbral T46, por ejemplo, es 0,5, 1, 1,5, 2, 3 u otro valor.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda x puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, o de 1,6 kHz a 3,2 kHz, y un intervalo de segmento de frecuencia de la subbanda y puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, o de 4,8 kHz a 6,4 kHz.
504: Determinar si la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es mayor o igual que un umbral T47.
Si es afirmativo, se realiza la etapa 506; si es negativo, se realiza la etapa 507.
505: Determinar si la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, es menor que el umbral T47.
Si es afirmativo, se realiza la etapa 506; si es negativo, se realiza la etapa 507.
506: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo TCX.
507: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo HQ.
Como puede apreciarse, en soluciones de este ejemplo útil para comprender la presente invención, se selecciona un algoritmo TCX o un algoritmo HQ principalmente en base a una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. La relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, se asocian a un algoritmo de codificación usado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y un parámetro de codificación de referencia de la trama de audio actual, y además ayuda a mejorar la calidad de codificación o la eficiencia de codificación de la trama de audio actual.
Haciendo referencia a la Figura 6, la Figura 6 es un diagrama de flujo esquemático de otro método de codificación de audio conforme a otro ejemplo útil para entender la presente invención. En un ejemplo mostrado en la Figura 6, se determina un algoritmo de codificación usado para codificar coeficientes espectrales de una trama de audio actual, principalmente en base a una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual, un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual.
Según se muestra en la Figura 6, el otro método de codificación de audio proporcionado en el otro ejemplo útil para la comprensión de la presente invención, puede incluir el siguiente contenido:
601: Realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual.
La trama de audio mencionada en las realizaciones de la presente invención puede ser una trama de habla o una trama de música.
Se supone que un ancho de banda de la señal en el dominio del tiempo de la trama de audio actual es de 16 kHz.
602: Adquirir una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual.
603: Determinar si una relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, cae dentro de un intervalo R1.
En caso negativo, se realiza la etapa 604; en caso afirmativo, se realiza la etapa 606.
El intervalo R1 puede ser, por ejemplo, [0,5, 2], [0,8, 1,25], [0,4, 2,5] u otro intervalo.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda x puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, o de 1,6 kHz a 3,2 kHz, y un intervalo de segmento de frecuencia de la subbanda y puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, o de 4,8 kHz a 6,4 kHz.
604: Adquirir un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual.
605: Determinar si un cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T16.
En caso afirmativo, se realiza la etapa 606; en caso negativo, se realiza la etapa 607.
Un intervalo de segmento de frecuencia de la subbanda i puede ser, por ejemplo, de 0 kHz a 1,6 kHz, o de 1 kHz a 2,6 kHz, y un intervalo de segmento de frecuencia de la subbanda j puede ser, por ejemplo, de 6,4 kHz a 8 kHz, de 4,8 kHz a 6,4 kHz, o de 7,4 kHz a 9 kHz.
El umbral T16 es mayor que un umbral T4. Por ejemplo, el umbral T16 puede ser mayor que, o igual a 2, y el umbral T16, por ejemplo, es 2, 2,5, 3, 3,5, 5, 5,1, u otro valor.
606: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo TCX.
607: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo HQ.
Según puede apreciarse, en soluciones de este ejemplo útil para la comprensión de la presente invención, se selecciona un algoritmo TCX o un algoritmo HQ principalmente en base a una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de un subbanda x, y que es de una trama de audio actual, una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual, un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. La relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, y el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, están asociados a un algoritmo de codificación usado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y un parámetro de codificación de referencia de la trama de audio actual, y además ayuda a mejorar la calidad de codificación o la eficiencia de codificación de la trama de audio actual.
Con referencia a la Figura 7, la Figura 7 es un diagrama de flujo esquemático de otro método de codificación de audio conforme a otro ejemplo útil para entender la presente invención. En un ejemplo mostrado en la Figura 7, se determina un algoritmo de codificación usado para codificar coeficientes espectrales de una trama de audio actual, principalmente usando una tasa de codificación de la trama de audio actual, un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual.
Según se muestra en la Figura 7, el otro método de codificación de audio proporcionado en el otro ejemplo útil para la comprensión de la presente invención, puede incluir el siguiente contenido:
701: Realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual.
La trama de audio mencionada puede ser una trama de habla o una trama de música.
Se supone que un ancho de banda de la señal en el dominio del tiempo de la trama de audio actual es 16 kHz. 702: Determinar si una tasa de codificación de la trama de audio actual es mayor o igual que un umbral T1.
En caso afirmativo, se realiza la etapa 703; en caso negativo, se realiza la etapa 705.
El umbral T1, por ejemplo, es mayor que, o igual a 24,4 kbps. Por ejemplo, el umbral T1 es igual a 24,4 kbps, 32 kbps, 64 kbps, u otra tasa.
703: Adquirir un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual.
704: Determinar si un cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T12.
En caso afirmativo, se realiza la etapa 705; en caso negativo, se realiza la etapa a 706.
Un intervalo de segmento de frecuencia de la subbanda i puede ser, por ejemplo, de 0 kHz a 1,6 kHz, o de 1 kHz a 2,6 kHz, y un intervalo de segmento de frecuencia de la subbanda j puede ser, por ejemplo, de 6,4 kHz a 8 kHz, de 4,8 kHz a 6,4 kHz, o de 7,4 kHz a 9 kHz.
El umbral T12 puede ser mayor que un umbral T4. Por ejemplo, el umbral T12 puede ser mayor que, o igual a 2, y el umbral T12, por ejemplo, es 2, 2,5, 3, 3,5, 5, 5,2 u otro valor.
705: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo TCX.
706: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo HQ.
Como puede apreciarse, en soluciones de este ejemplo útil para la comprensión de la presente invención, se selecciona un algoritmo TCX o un algoritmo HQ principalmente en base a una tasa de codificación de una trama de audio actual, un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. La tasa de codificación de la trama de audio actual, el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, y el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, están asociados a un algoritmo de codificación usado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y un parámetro de codificación de referencia de la trama de audio actual, y además ayuda a mejorar la calidad de codificación o la eficiencia de codificación de la trama de audio actual.
Con referencia a la Figura 8, la Figura 8 es un diagrama de flujo esquemático de otro método de codificación de audio conforme a otro ejemplo útil para la comprensión de la presente invención. En un ejemplo mostrado en la Figura 8, se determina un algoritmo de codificación usado para codificar coeficientes espectrales de una trama de audio actual, principalmente en base a un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda m, y que es de la trama de audio actual, y un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda n, y que es de la trama de audio actual.
Según se muestra en la Figura 8, el otro método de codificación de audio proporcionado en el otro ejemplo útil para la comprensión de la presente invención, puede incluir el siguiente contenido:
801: Realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual.
La trama de audio mencionada puede ser una trama de habla o una trama de música.
Se asume que un ancho de banda de la señal en el dominio del tiempo de la trama de audio actual es 16 kHz. 802: Adquirir un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda m, y que es de la trama de audio actual, y un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda n, y que es de la trama de audio actual.
803: Determinar si un cociente de dividir el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, por el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, es mayor o igual que un umbral T6.
En caso afirmativo, se realiza la etapa 804; en caso negativo, se realiza la etapa 805.
El umbral T6 puede ser mayor que, o igual a 0,3, y el umbral T6, por ejemplo, es 0,5, 1, 1,5, 2, 3,2 u otro valor.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda m puede ser de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4,8 kHz, de 4,8 kHz a 6,4 kHz, o de 0,4 kHz a 6,4 kHz.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda n puede ser de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, o de 4,8 kHz a 9,6 kHz.
804: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo TCX.
805: Codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo HQ.
Como puede apreciarse, en soluciones de este ejemplo útil para comprender la presente invención, se selecciona un algoritmo TCX o un algoritmo HQ principalmente en base a un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda m, y que es de la trama de audio actual, y un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda n, y que es de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. Una relación entre el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda m, y que es de la trama de audio actual, y el valor medio de amplitud de los coeficientes espectrales que están ubicados dentro de la subbanda n, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda z, y que es de la trama de audio actual, están asociados a un algoritmo de codificación usado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y un parámetro de codificación de referencia de la trama de audio actual, y además ayuda a mejorar la calidad de codificación o la eficiencia de codificación de la trama de audio actual.
Se puede entender que las formas ejemplares de implementación de la Figura 2 a la Figura 8 son simplemente algunas formas de implementación. En una aplicación real, se pueden ampliar otras múltiples formas de implementación posibles en base a descripciones ejemplares relacionadas en el ejemplo útil para la comprensión de la presente invención correspondiente a la Figura 1.
En algunos escenarios, se puede considerar lo que sigue durante la selección de una subbanda.
Cuando se calcula una similitud entre parámetros de propiedad de coeficientes espectrales ubicados dentro de dos subbandas, se pueden seleccionar dos subbandas emparejadas, por ejemplo, donde las dos subbandas son de 0 kHz a 1,6 kHz y de 6,4 kHz a 8 kHz. En algunos escenarios, puesto que una propiedad en coeficientes espectrales en 0 a 1 kHz difiere considerablemente de una propiedad de coeficientes espectrales en 1 a 1,6 kHz, el espectro de 0 kHz a 1,6 kHz puede no ser seleccionado cuando se calcula la similitud entre los parámetros de propiedad de los coeficientes espectrales. Por ejemplo, se pueden seleccionar coeficientes espectrales incluidos en 1 kHz a 2,6 kHz para reemplazar coeficientes espectrales incluidos en 0 a 1,6 kHz, para calcular un parámetro de propiedad de coeficientes espectrales de baja frecuencia. En ese caso, si se copian coeficientes espectrales de baja frecuencia incluidos en 1 kHz a 2,6 kHz a alta frecuencia, los coeficientes espectrales correspondientes son coeficientes espectrales de alta frecuencia dentro de 7,4 kHz a 9 kHz. Cuando se calcula un parámetro de propiedad de coeficientes espectrales de alta frecuencia, los coeficientes espectrales incluidos en 7,4 kHz a 9 kHz son más adecuados para el cálculo de una propiedad espectral. Sin embargo, en algunos escenarios, la resolución de coeficientes espectrales incluidos en 0 kHz a 6,4 kHz puede ser muy alta, y los coeficientes espectrales incluidos dentro de 0 kHz a 6,4 kHz son adecuados para el cálculo de un parámetro de propiedad. Si la resolución de coeficientes espectrales incluidos en 6,4 kHz a 16 kHz es relativamente baja, los coeficientes espectrales incluidos dentro de 6,4 kHz a 16 kHz pueden ser inadecuados para el cálculo de un parámetro de propiedad de coeficientes espectrales. Por lo tanto, cuando se calcula el parámetro de propiedad de los coeficientes espectrales de alta frecuencia, los coeficientes espectrales incluidos dentro de 4,8 kHz a 6,4 kHz pueden ser seleccionados para calcular un parámetro de propiedad, y el parámetro de propiedad se usa como un parámetro de propiedad de alta frecuencia.
La codificación de los coeficientes espectrales de la trama de audio actual en base al algoritmo de excitación codificado de transformación puede incluir específicamente: dividir los coeficientes espectrales en N subbandas; calcular y cuantificar una envolvente de cada subbanda; realizar asignación de bits para cada subbanda conforme a un valor de envolvente cuantificado y a una cantidad de bits disponibles; cuantificar coeficientes espectrales de cada subbanda conforme a una cantidad de bits asignados a la subbanda; y, escribir los coeficientes espectrales cuantificados y un valor de índice de una envolvente espectral en una corriente de bits.
Lo que sigue proporciona además un aparato relacionado, configurado para implementar la solución que antecede.
Con referencia a la Figura 9, un ejemplo útil para la comprensión de la presente invención proporciona además un codificador 900 de audio. El codificador 900 de audio puede incluir una unidad 910 de transformación de tiempofrecuencia, una unidad 920 de adquisición, y una unidad 930 de codificación.
La unidad 910 de transformación de tiempo-frecuencia está configurada para llevar a cabo procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual.
La unidad 920 de adquisición está configurada para adquirir un parámetro de codificación de referencia de la trama de audio actual.
La unidad 930 de codificación está configurada para: si el parámetro de codificación de referencia que se adquiere por medio de la unidad 920 de adquisición y que es de la trama de audio actual, satisface una primera condición de parámetro, codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de excitación codificado de transformación, o si el parámetro de codificación de referencia que ha sido adquirido por la unidad de adquisición, y que es de la trama de audio actual, satisface una segunda condición de parámetro, codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de codificación de transformación de alta calidad.
Según un requisito de un escenario de aplicación, el parámetro de codificación de referencia que es adquirido por la unidas 920 de adquisición, y que es de la trama de audio actual, puede ser modificado.
Por ejemplo, el parámetro de codificación de referencia puede incluir al menos uno de los siguientes parámetros: una tasa de codificación de la trama de audio actual; una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda z, y que es de la trama de audio actual; una desviación de envolvente de coeficientes espectrales que están ubicados dentro de una subbanda w, y que es de la trama de audio actual; un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual; un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda m, y que es de la trama de audio actual, y un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda n, y que es de la trama de audio actual; una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual; una desviación de envolvente de coeficientes espectrales que están ubicados dentro de una subbanda r, y que es de la trama de audio actual, y una desviación de envolvente de coeficientes espectrales que están ubicados dentro de una subbanda s, y que es de la trama de audio actual; una envolvente de coeficientes espectrales que están ubicados dentro de una subbanda e, y que es de la trama de audio actual, y una envolvente de coeficientes espectrales que están ubicados dentro de una subbanda f, y que es de la trama de audio actual; o un valor de parámetro de correlación espectral entre coeficientes espectrales que están ubicados dentro de una subbanda p, y que es de la trama de audio actual, y coeficientes espectrales que están ubicados dentro de una subbanda q, y que es de la trama de audio actual.
Un valor de parámetro más grande de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicados dentro de la subbanda q, y que es de la trama de audio actual, indica una correlación espectral más intensa entre los coeficientes espectrales ubicados dentro de la subbanda p y los coeficientes espectrales ubicados dentro de la subbanda q. El valor de parámetro de la correlación espectral puede ser, por ejemplo, un valor de parámetro de correlación cruzada normalizado.
Los intervalos de segmento de frecuencia de las subbandas pueden ser determinados de acuerdo con necesidades reales.
Opcionalmente, en algunas formas de implementación posibles, un segmento de frecuencia más alta de la subbanda z puede ser mayor que un segmento F1 de frecuencia crítica, y un segmento de frecuencia más alta de la subbanda w puede ser mayor que el segmento F1 de frecuencia crítica. Un intervalo de valor del segmento F1 de frecuencia crítica puede ser, por ejemplo, de 6,4 kHz a 12 kHz. Por ejemplo, un valor del segmento F1 de frecuencia crítica puede ser de 6,4 kHz, 8 kHz, 9 kHz, 10 kHz o 12 kHz. Ciertamente, el segmento F1 de frecuencia crítica puede ser otro valor.
Opcionalmente, en algunas formas de implementación posibles, un segmento de frecuencia más alta de la subbanda j puede ser mayor que un segmento F2 de frecuencia crítica, y un segmento de frecuencia más alta de la subbanda n es mayor que el segmento F2 de frecuencia crítica. Por ejemplo, un intervalo de valor del segmento F2 de frecuencia crítica puede ser de 4,8 kHz a 8 kHz. Específicamente, por ejemplo, un valor del segmento F2 de frecuencia crítica puede ser de 6,4 kHz, 4,8 kHz, 6 kHz, 8 kHz, 5 kHz o 7 kHz. Ciertamente, el segmento F2 de frecuencia crítica puede ser otro valor.
Opcionalmente, en algunas formas de implementación posibles, un segmento de frecuencia más alta de la subbanda i puede ser menor que el segmento de frecuencia más alta de la subbanda j, un segmento de frecuencia más alta de la subbanda m puede ser menor que el segmento de frecuencia más alta de la subbanda n, un segmento de frecuencia más alta de la subbanda x puede ser menor o igual que un segmento de frecuencia más baja de la subbanda y, un segmento de frecuencia más alta de la subbanda p puede ser menor o igual que un segmento de frecuencia más baja de la subbanda q, un segmento de frecuencia más alta de la subbanda r puede ser menor o igual que un segmento de frecuencia más baja de la subbanda s, y un segmento de frecuencia más alta de la subbanda e puede ser menor o igual que un segmento de frecuencia más baja de la subbanda f.
Opcionalmente, en algunas formas de implementación posibles, se puede satisfacer al menos una de las siguientes condiciones:
un segmento de frecuencia más baja de la subbanda w es mayor o igual que el segmento F1 de frecuencia crítica, un segmento de frecuencia más baja de la subbanda z es mayor o igual que el segmento F1 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda i es menor o igual que un segmento de frecuencia más baja de la subbanda j, el segmento de frecuencia más alta de la subbanda m es menor o igual que un segmento de frecuencia más baja de la subbanda n, un segmento de frecuencia más baja de la subbanda j es mayor o igual que el segmento F2 de frecuencia crítica, un segmento de frecuencia más baja de la subbanda n es mayor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda i es menor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda m es menor o igual que el segmento F2 de frecuencia crítica, un segmento de frecuencia más baja de la subbanda j es mayor o igual que el segmento F2 de frecuencia crítica, o un segmento de frecuencia más baja de la subbanda n es mayor o igual que el segmento F2 de frecuencia crítica.
Opcionalmente, en algunas formas de implementación posibles, se puede satisfacer al menos una de las siguientes condiciones: el segmento de frecuencia más alta de la subbanda e es menor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda x es menor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda p es menor o igual que el segmento F2 de frecuencia crítica, o el segmento de frecuencia más alta de la subbanda r es menor o igual que el segmento F2 de frecuencia crítica.
Opcionalmente, en algunas formas de implementación posibles, el segmento de frecuencia más alta de la subbanda f puede ser menor o igual que el segmento F2 de frecuencia crítica, y ciertamente, el segmento de frecuencia más baja de la subbanda f puede ser mayor o igual que el segmento F2 de frecuencia crítica. El segmento de frecuencia más alta de la subbanda q puede ser menor o igual que el segmento F2 de frecuencia crítica, y ciertamente, el segmento de frecuencia más baja de la subbanda q puede ser mayor o igual que el segmento F2 de frecuencia crítica. El segmento de frecuencia más alta de la subbanda s puede ser menor o igual que el segmento F2 de frecuencia crítica, y ciertamente, el segmento de frecuencia más baja de la subbanda s puede ser mayor o igual que el segmento F2 de frecuencia crítica.
Por ejemplo, un intervalo de valor del segmento de frecuencia más alta de la subbanda z puede ser de 12 kHz a 16 kHz. Un intervalo de valor del segmento de frecuencia más baja de la subbanda z puede ser de 8 kHz a 14 kHz. Un intervalo de valor de un ancho de banda de la subbanda z puede ser de 1,6 kHz a 8 kHz. Específicamente, por ejemplo, un intervalo de segmento de frecuencia de la subbanda z puede ser de 8 kHz a 12 kHz, de 9 kHz a 11 kHz, de 8 kHz a 9,6 kHz, o de 12 kHz a 14 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda z no está limitado a los ejemplos que anteceden.
Por ejemplo, se puede determinar un intervalo de segmento de frecuencia de la subbanda w según las necesidades reales. Por ejemplo, un intervalo de valor del segmento de frecuencia más alta de la subbanda w puede ser de 12 kHz a 16 kHz, y un intervalo de valor del segmento de frecuencia más baja de la subbanda w puede ser de 8 kHz a 14 kHz. Específicamente, por ejemplo, el intervalo de segmento de frecuencia de la subbanda w es de 8 kHz a 12 kHz, de 9 kHz a 11 kHz, de 8 kHz a 9,6 kHz, de 12 kHz a 14 kHz, o de 12,2 kHz a 14,5 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda w no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda w puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda z.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda i puede ser de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4.8 kHz, de 4,8 kHz a 6,4 kHz, de 0,4 kHz a 6,4 kHz, o de 0,4 kHz a 3,6 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda i no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda j puede ser de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, de 4,8 kHz a 9,6 kHz, o de 4,8 kHz a 8 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda j no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda m puede ser de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4.8 kHz, de 4,8 kHz a 6,4 kHz, de 0,4 kHz a 6,4 kHz, o de 0,4 kHz a 3,6 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda m no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda m puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda i.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda n puede ser de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, de 4,8 kHz a 9,6 kHz, o de 4,8 kHz a 8 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda n no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda n puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda j.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda x puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 2 kHz a 3,2 kHz, o de 2,5 kHz a 3,4 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda x no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda y puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 4,4 kHz a 6,4 kHz, o de 4,5 kHz a 6,2 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda y no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda p puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 2,1 kHz a 3,2 kHz, o de 2,5 kHz a 3,5 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda p no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda p puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda x.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda q puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 4,2 kHz a 6,4 kHz, o de 4,7 kHz a 6,2 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda q no está limitado a los ejemplos anteriores. En algunas formas de realización posibles, el intervalo de segmento de frecuencia de la subbanda q puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda y.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda r puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 2,05 kHz a 3,27 kHz, o de 2,59 kHz a 3,51 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda r no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda r puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda x.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda s puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 5,4 kHz a 7,1 kHz, o de 4,55 kHz a 6,29 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda s no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda s puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda y.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda e puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 0,8 kHz a 3 kHz, o de 1,9 kHz a 3,8 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda e no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda e puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda x.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda f puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 5,3 kHz a 7,15 kHz, o de 4,58 kHz a 6,52 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda f no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda f puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda y
La primera condición de parámetro y la segunda condición de parámetro pueden ser cambiadas.
Por ejemplo, en algunas formas de implementación posibles, la primera condición de parámetro en esta realización puede ser, por ejemplo, la primera condición de parámetro en la realización de método, y la segunda condición de parámetro en esta realización puede ser, por ejemplo, la segunda condición de parámetro en la realización de método. Para las descripciones relacionadas, se hace referencia a los registros en la realización de método.
Se puede entender que las funciones de cada módulo funcional del codificador 900 de audio en esta realización pueden ser implementadas específicamente conforme a los métodos de las realizaciones de método que anteceden. Para un proceso de implementación específico, se hace referencia a la descripción relacionada de las realizaciones de método anteriores, y no se van a describir aquí los detalles.
El codificador 900 de audio puede ser cualquier aparato que necesite captar, almacenar o transmitir una señal de audio, por ejemplo un teléfono móvil, un ordenador de tableta, un ordenador personal o un ordenador portátil.
Como puede apreciarse, en soluciones de este ejemplo útil para la comprensión de la presente invención, tras la adquisición de un parámetro de codificación de referencia de una trama de audio actual, el codificador 900 de audio selecciona un algoritmo TCX o un algoritmo HQ en base al parámetro de codificación de referencia adquirido de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. El parámetro de codificación de referencia de la trama de audio actual está asociado a un algoritmo de codificación usado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y el parámetro de codificación de referencia de la trama de audio actual, y además ayuda a mejorar la calidad de codificación o la eficiencia de codificación de la trama de audio actual.
Con referencia a la Figura 10, la Figura 10 es un diagrama estructural de bloques de un codificador 1000 de audio conforme a otro ejemplo útil para la comprensión de la presente invención.
El codificador 1000 de audio puede incluir al menos un procesador 1001, una memoria 1005, y al menos un bus 1002 de comunicaciones. El bus 1002 de comunicaciones está configurado para implementar conexión y comunicación entre los componentes.
Opcionalmente, el codificador 1000 de audio puede incluir además al menos una interfaz 1004 de red, una interfaz 1003 de usuario, y similares. Opcionalmente, la interfaz 1003 de usuario incluye un display (por ejemplo, una pantalla táctil, un display de cristal líquido, un dispositivo de formación de imágenes holográficas (en inglés: Holographic), o un proyector (en inglés: Projector), un dispositivo de clic (por ejemplo, un ratón, una rueda de desplazamiento (en inglés: trackball), un panel táctil, o una pantalla táctil), una cámara y/o un dispositivo captador.
La memoria 1005 puede incluir una memoria de solo lectura y una memoria de acceso aleatorio, y proporcionar una instrucción y datos para el procesador 1001. Una parte de la memoria 1005 puede incluir además una memoria de acceso aleatorio no volátil.
En algunas formas de implementación, la memoria 1005 almacena los siguientes elementos, módulos ejecutables o estructuras de datos, o un subconjunto de los mismos, o un conjunto de extensión de los mismos: la unidad 910 de transformación de tiempo-frecuencia, la unidad 920 de adquisición, y la unidad 930 de codificación.
En este ejemplo útil para la comprensión de la presente invención, el procesador 1001 ejecuta el código o la instrucción presente en la memoria 1005, para: llevar a cabo procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual; adquirir un parámetro de codificación de referencia de la trama de audio actual; y, si el parámetro de codificación de referencia adquirido de la trama de audio actual satisface una primera condición de parámetro, codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de excitación codificado de transformación, o si el parámetro de codificación de referencia adquirido de la trama de audio actual satisface una segunda condición de parámetro, codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de codificación de transformación de alta calidad.
Conforme a un requisito de un escenario de realización, el parámetro de codificación de referencia que es adquirido por el procesador 1001, y que es de la trama de audio actual, puede ser modificado.
Por ejemplo, el parámetro de codificación de referencia puede incluir al menos uno de los siguientes parámetros: una tasa de codificación de la trama de audio actual; una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda z, y que es de la trama de audio actual; una desviación de envolvente de coeficientes espectrales que están ubicados dentro de una subbanda w, y que es de la trama de audio actual; un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual; un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda m, y que es de la trama de audio actual, y un valor medio de amplitud de coeficientes espectrales que están ubicados dentro de una subbanda n, y que es de la trama de audio actual; una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual; una desviación de envolvente de coeficientes espectrales que están ubicados dentro de una subbanda r, y que es de la trama de audio actual, y una desviación de envolvente de coeficientes espectrales que están ubicados dentro de una subbanda s, y que es de la trama de audio actual; una envolvente de coeficientes espectrales que están ubicados dentro de una subbanda e, y que es de la trama de audio actual, y una envolvente de coeficientes espectrales que están ubicados dentro de una subbanda f, y que es de la trama de audio actual; o un valor de parámetro de correlación espectral entre coeficientes espectrales que están ubicados dentro de una subbanda p, y que es de la trama de audio actual, y coeficientes espectrales que están ubicados dentro de una subbanda q, y que es de la trama de audio actual.
Un valor mayor de parámetro de correlación espectral entre los coeficientes espectrales que están ubicados dentro de la subbanda p, y que es de la trama de audio actual, y los coeficientes espectrales que están ubicaos dentro de la subbanda q, y que es de la trama de audio actual, indica una correlación espectral más intensa entre los coeficientes espectrales ubicados dentro de la subbanda p y los coeficientes espectrales ubicados dentro de la subbanda q. El valor de parámetro de la correlación espectral puede ser, por ejemplo, un valor de parámetro de correlación cruzada normalizado.
Los intervalos de segmento de frecuencia de las subbandas pueden ser determinados según necesidades reales.
Opcionalmente, en algunas formas de implementación posibles, un segmento de frecuencia más alta de la subbanda z pude ser mayor que un segmento F1 de frecuencia crítica, y un segmento de frecuencia más alta de la subbanda w puede ser mayor que el segmento F1 de frecuencia crítica. Un intervalo de valor del segmento F1 de frecuencia crítica puede ser, por ejemplo, de 6,4 kHz a 12 kHz. Por ejemplo, un valor del segmento F1 de frecuencia crítica puede ser 6,4 kHz, 8 kHz, 9 kHz, 10 kHz o 12 kHz. Ciertamente, el segmento F1 de frecuencia crítica puede ser otro valor.
Opcionalmente, en algunas formas de implementación posibles, un segmento de frecuencia más alta de la subbanda j puede ser mayor que un segmento F2 de frecuencia crítica, y un segmento de frecuencia más alta de la subbanda n es mayor que el segmento F2 de frecuencia crítica. Por ejemplo, un intervalo de valor del segmento F2 de frecuencia crítica puede ser de 4,8 kHz a 8 kHz. Específicamente, por ejemplo, el valor del segmento F2 de frecuencia crítica puede ser de 6,4 kHz, 4,8 kHz, 6 kHz, 8 kHz, 5 kHz o 7 kHz. Ciertamente, el segmento F2 de frecuencia crítica puede ser otro valor.
Opcionalmente, en algunas formas de implementación posibles, un segmento de frecuencia más alta se la subbanda i puede ser menor que el segmento de frecuencia más alta de la subbanda j, un segmento de frecuencia más alta de la subbanda m puede ser menor que el segmento de frecuencia más alta de la subbanda n, un segmento de frecuencia más alta de la subbanda x puede ser menor o igual que un segmento de frecuencia más baja de la subbanda y, un segmento de frecuencia más alta de la subbanda p puede ser menor o igual que un segmento de frecuencia más baja de la subbanda q, un segmento de frecuencia más alta de la subbanda r puede ser menor o igual que un segmento de frecuencia más baja de la subbanda s, y un segmento de frecuencia más alta de la subbanda e puede ser menor o igual que un segmento de frecuencia más baja de la subbanda f.
Opcionalmente, en algunas formas de implementación posibles, se puede satisfacer al menos una de las siguientes condiciones:
un segmento de frecuencia más baja de la subbanda w es mayor o igual que el segmento F1 de frecuencia crítica, un segmento de frecuencia más baja de la subbanda z es mayor o igual que el segmento F1 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda i es menor o igual que un segmento de frecuencia más baja de la subbanda j, el segmento de frecuencia más alta de la subbanda m es menor o igual que un segmento de frecuencia más baja de la subbanda n, un segmento de frecuencia más baja de la subbanda j es mayor o igual que el segmento F2 de frecuencia crítica, un segmento de frecuencia más baja de la subbanda n es mayor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda i es menor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda m es menor o igual que el segmento F2 de frecuencia crítica, un segmento de frecuencia más baja de la subbanda j es mayor o igual que el segmento F2 de frecuencia crítica, o un segmento de frecuencia más baja de la subbanda n es mayor o igual que el segmento F2 de frecuencia crítica.
Opcionalmente, en algunas formas de implementación posibles, se puede satisfacer al menos una de las siguientes condiciones:
el segmento de frecuencia más alta de la subbanda e es menor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda x es menor o igual que el segmento F2 de frecuencia crítica, el segmento de frecuencia más alta de la subbanda p es menor o igual que el segmento F2 de frecuencia crítica, o el segmento de frecuencia más alta de la subbanda r es menor o igual que el segmento F2 de frecuencia crítica.
Opcionalmente, en algunas formas de implementación posibles, el segmento de frecuencia más alta de la subbanda f puede ser menor o igual que el segmento F2 de frecuencia crítica, y ciertamente, el segmento de frecuencia más baja de la subbanda f puede ser mayor o igual que el segmento F2 de frecuencia crítica. El segmento de frecuencia más alta de la subbanda q puede ser menor o igual que el segmento F2 de frecuencia crítica, y ciertamente, el segmento de frecuencia más baja de la subbanda q puede ser mayor o igual que el segmento F2 de frecuencia crítica. El segmento de frecuencia más alta de la subbanda s puede ser menor o igual que el segmento F2 de frecuencia crítica, y ciertamente, el segmento de frecuencia más baja de la subbanda s puede ser mayor o igual que el segmento F2 de frecuencia crítica.
Por ejemplo, un intervalo de valor del segmento de frecuencia más alta de la subbanda z puede ser de 12 kHz a 16 kHz. Un intervalo de valor del segmento de frecuencia más baja de la subbanda z puede ser de 8 kHz a 14 kHz. Un intervalo de valor de un ancho de banda de la subbanda z puede ser de 1,6 kHz a 8 kHz. Específicamente, por ejemplo, un intervalo de segmento de frecuencia de la subbanda z puede ser de 8 kHz a 12 kHz, de 9 kHz a 11 kHz, de 8 kHz a 9,6 kHz, o de 12 kHz a 14 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda z no está limitado a los ejemplos anteriores.
Por ejemplo, se puede determinar un intervalo de segmento de frecuencia de la subbanda w según las necesidades reales. Por ejemplo, un intervalo de valor del segmento de frecuencia más alta de la subbanda w puede ser de 12 kHz a 16 kHz, y un intervalo de valor del segmento de frecuencia más baja de la subbanda w puede ser de 8 kHz a 14 kHz. Específicamente, por ejemplo, el intervalo de segmento de frecuencia de la subbanda w es de 8 kHz a 12 kHz, de 9 kHz a 11 kHz, de 8 kHz a 9,6 kHz, de 12 kHz a 14 kHz, o de 12,2 kHz a 14,5 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda w no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda w puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda z.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda i puede ser de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4.8 kHz, de 4,8 kHz a 6,4 kHz, de 0,4 kHz a 6,4 kHz, o de 0,4 kHz a 3,6 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda i no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda j puede ser de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, de 4,8 kHz a 9,6 kHz, o de 4,8 kHz a 8 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda j no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda m puede ser de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4.8 kHz, de 4,8 kHz a 6,4 kHz, de 0,4 kHz a 6,4 kHz, o de 0,4 kHz a 3,6 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda m no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda m puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda i.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda n puede ser de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, de 4,8 kHz a 9,6 kHz, o de 4,8 kHz a 8 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda n no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda n puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda j.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda x puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1.6 kHz a 3,2 kHz, de 2 kHz a 3,2 kHz, o de 2,5 kHz a 3,4 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda x no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda y puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 4,4 kHz a 6,4 kHz, o de 4,5 kHz a 6,2 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda y no está limitado a los ejemplos anteriores.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda p puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 2,1 kHz a 3,2 kHz, o de 2,5 kHz a 3,5 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda p no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda p puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda x.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda q puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 4,2 kHz a 6,4 kHz, o de 4,7 kHz a 6,2 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda q no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda q puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda y.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda r puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 2,05 kHz a 3,27 kHz, o de 2,59 kHz a 3,51 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda r no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda r puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda x.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda s puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 5,4 kHz a 7,1 kHz, o de 4,55 kHz a 6,29 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda s no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda s puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda y.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda e puede ser de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, de 1,6 kHz a 3,2 kHz, de 0,8 kHz a 3 kHz, o de 1,9 kHz a 3,8 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda e no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda e puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda x.
Por ejemplo, un intervalo de segmento de frecuencia de la subbanda f puede ser de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, de 4,8 kHz a 6,4 kHz, de 5,3 kHz a 7,15 kHz, o de 4,58 kHz a 6,52 kHz. Ciertamente, el intervalo de segmento de frecuencia de la subbanda f no está limitado a los ejemplos anteriores. En algunas formas de implementación posibles, el intervalo de segmento de frecuencia de la subbanda f puede ser igual o similar al intervalo de segmento de frecuencia de la subbanda y.
La primera condición de parámetro y la segunda condición de parámetro pueden ser modificadas.
Por ejemplo, en algunas formas de implementación posibles, la primera condición de parámetro en esta realización puede ser, por ejemplo, la primera condición de parámetro en la realización de método, y la segunda condición de parámetro en esta realización pueden ser, por ejemplo, la segunda condición de parámetro en la realización de método. Para descripciones relacionadas, se hace referencia a los registros de la realización de método.
Se puede entender que las funciones de cada módulo funcional del codificador 1000 de audio en la presente realización pueden ser específicamente implementadas conforme a los métodos de las realizaciones de método que anteceden. Para un proceso de implementación específico, se hace referencia a la descripción relacionada de las realizaciones de método anteriores, y los detalles no van a ser descritos aquí.
El codificador 1000 de audio puede ser cualquier aparato que necesite captar, almacenar o transmitir una señal de audio, por ejemplo un teléfono móvil, un ordenador de tableta, un ordenador personal, o un ordenador portátil.
Como puede apreciarse, en soluciones de este ejemplo útil para la comprensión de la presente invención, tras adquirir un parámetro de codificación de referencia de una trama de audio actual, el codificador 1000 de audio selecciona un algoritmo TCX o un algoritmo HQ en base al parámetro de codificación de referencia adquirido de la trama de audio actual, para codificar coeficientes espectrales de la trama de audio actual. El parámetro de codificación de referencia de la trama de audio actual está asociado a un algoritmo de codificación usado para codificar coeficientes espectrales de la trama de audio actual, lo que ayuda a mejorar la adaptabilidad y la compatibilidad entre el algoritmo de codificación y el parámetro de codificación de referencia de la trama de audio actual, y además ayuda a mejorar la calidad de codificación o la eficiencia de codificación de la trama de audio actual.
Además, se usan múltiples parámetros de codificación de referencia opcionales, lo que ayuda a satisfacer requisitos de selección de algoritmos en múltiples escenarios.
Un ejemplo útil para la comprensión de la presente invención proporciona además un medio de almacenaje con ordenador, donde el medio de almacenaje con ordenador puede almacenar un programa, y cuando el programa se ejecuta, se realiza una parte o todas las etapas del método de codificación de audio registrado en la realización del método.
Se debe apreciar que, por brevedad de la descripción, las realizaciones de método que anteceden están representadas a modo de una serie de acciones. Sin embargo, los expertos en la materia podrán apreciar que la presente invención no se limita al orden descrito de las acciones, puesto que conforme a la presente invención, algunas etapas pueden ser llevadas a cabo en otros órdenes o de forma simultánea. Un experto en la materia podrá apreciar además que las realizaciones descritas en la presente memoria pertenecen en su totalidad a ejemplos de realización, y que las acciones y módulos involucrados no son necesariamente requeridos por la presente invención.
En las realizaciones que anteceden, la descripción de cada realización tiene un enfoque respectivo. Para alguna parte que no se haya descrito con detalle en una realización, se puede hacer referencia a descripciones relacionadas de otras realizaciones.
En las diversas realizaciones proporcionadas en la presente solicitud, se debe entender que el aparato descrito puede ser implementado de otras formas. Por ejemplo, la realización del aparato descrito es simplemente un ejemplo. Por ejemplo, la división de unidades es simplemente una división de función lógica y es posible otra división en una implementación real. Por ejemplo, una pluralidad de unidades o componentes pueden ser combinados o integrados en otro sistema, o algunas características pueden ser ignoradas o no llevadas a cabo. Adicionalmente, los acoplamientos mutuos mostrados o discutidos o los acoplamientos directos o las conexiones de comunicación pueden ser implementados a través de algunas interfaces. Los acoplamiento indirectos o las conexiones de comunicación entre los aparatos o las unidades, pueden ser implementados de forma electrónica, mecánica, o de otras formas.
Las unidades descritas como partes separadas pueden estar o no separadas físicamente, y las partes mostradas como unidades pueden ser o no unidades físicas, pueden estar ubicadas en una posición, o pueden estar distribuidas sobre una pluralidad de unidades de red. Una parte de, o todas, las unidades pueden ser seleccionadas según necesidades reales para conseguir los objetivos de las soluciones de las realizaciones.
Adicionalmente, las unidades funcionales en las realizaciones de la presente invención pueden estar integradas en una unidad de procesamiento, o cada una de las unidades puede existir físicamente por sí sola, o estar dos o más unidades integradas en una sola unidad. La unidad integrada puede ser implementada en forma de hardware, o puede ser implementada en forma de unidad funcional de software.
Cuando la unidad integrada se implementa en forma de unidad funcional de software y se vende o se usa como producto independiente, la unidad integrada puede estar almacenada en un medio de almacenaje legible con ordenador. Sobre la base de este entendimiento, las soluciones técnicas de la presente invención esencialmente, o la parte que contribuye a la técnica anterior, o todas o una parte de las soluciones técnicas, pueden ser implementadas en forma de un producto de software. El producto de software se almacena en un medio de almacenaje e incluye varias instrucciones para dar instrucciones a un dispositivo informático (que puede ser un ordenador personal, un servidor o un dispositivo de red) para llevar a cabo todas o una parte de las etapas de los métodos descritos en las realizaciones de la presente invención. El medio de almacenaje que antecede incluye: cualquier medio que pueda almacenar un código de programa, tal como una unidad flash USB, un disco duro extraíble, una memoria de solo lectura (en inglés, Read Only Memory, ROM), una memoria de acceso aleatorio (en inglés, Random Access Memory, RAM), un disco magnético, o un disco óptico.
Las realizaciones anteriores están destinadas únicamente a describir las soluciones técnicas de la presente invención y no son limitativas de la presente invención.

Claims (8)

  1. REIVINDICACIONES
    1 Un método de codificación de audio, que comprende:
    realizar (201) procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual;
    adquirir (202) un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual, y
    determinar (203) si un cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T4;
    si el cociente de la división del valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que el umbral T4, codificar (204) coeficientes espectrales de la trama de audio actual en base a un algoritmo de excitación codificado de transformación, y
    si el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T4, codificar (205) coeficientes espectrales de la trama de audio actual en base a un algoritmo de codificación de transformación de alta calidad.
  2. 2. - El método según la reivindicación 1, en donde un intervalo de segmento de frecuencia de la subbanda i es de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4,8 kHz, de 4,8 kHz a 6,4 kHz, o de 0,4 kHz a 6,4 kHz, o un intervalo de segmento de frecuencia de la subbanda j es de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, o de 4,8 kHz a 9,6 kHz.
  3. 3. - Un método de codificación de audio, que comprende:
    realizar (401) procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual;
    adquirir (402) una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual;
    determinar (403) si una relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, cae dentro de un intervalo R1;
    si la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, cae dentro de un intervalo R1, codificar (404) coeficientes espectrales de la trama de audio actual en base a un algoritmo de excitación codificado de transformación, y
    si la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1, codificar (405) coeficientes espectrales de la trama de audio actual en base a un algoritmo de codificación de transformación de alta calidad.
  4. 4. - El método según la reivindicación 3, en donde un intervalo de segmento de frecuencia de la subbanda x es de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, o de 1,6 kHz a 3,2 kHz, y un intervalo de segmento de frecuencia de la subbanda y es de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, o de 4,8 kHz a 6,4 kHz.
  5. 5. - Un codificador de audio, que comprende:
    una unidad configurada para realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual;
    una unidad configurada para adquirir un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda i, y que es de la trama de audio actual, y un valor medio de energía de coeficientes espectrales que están ubicados dentro de una subbanda j, y que es de la trama de audio actual;
    una unidad configurada para determinar si un cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que un umbral T4;
    una unidad configurada para codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de excitación codificado de transformación si el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es mayor o igual que el umbral T4, y
    una unidad configurada para codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de codificación de transformación de alta calidad si el cociente de dividir el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda i, y que es de la trama de audio actual, por el valor medio de energía de los coeficientes espectrales que están ubicados dentro de la subbanda j, y que es de la trama de audio actual, es menor que el umbral T4.
  6. 6. - El codificador de audio según la reivindicación 5, en donde un intervalo de segmento de frecuencia de la subbanda i es de 3,2 kHz a 6,4 kHz, de 3,2 kHz a 4,8 kHz, de 4,8 kHz a 6,4 kHz, o de 0,4 kHz a 6,4 kHz, o un intervalo de segmento de frecuencia de la subbanda j es de 6,4 kHz a 9,6 kHz, de 6,4 kHz a 8 kHz, de 8 kHz a 9,6 kHz, o de 4,8 kHz a 9,6 kHz.
  7. 7. - Un codificador de audio, que comprende:
    una unidad configurada para realizar procesamiento de transformación de tiempo-frecuencia sobre una señal en el dominio del tiempo de una trama de audio actual, para obtener coeficientes espectrales de la trama de audio actual;
    una unidad configurada para adquirir una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda x, y que es de la trama de audio actual, y una relación de valor de pico respecto a valor medio de coeficientes espectrales que están ubicados dentro de una subbanda y, y que es de la trama de audio actual;
    una unidad configurada para determinar si una relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, cae dentro de un intervalo R1;
    un unidad configurada para codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de excitación codificado de transformación si la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, cae dentro de un intervalo R1, y
    una unidad configurada para codificar coeficientes espectrales de la trama de audio actual en base a un algoritmo de codificación de transformación de alta calidad si la relación entre la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda x, y que es de la trama de audio actual, y la relación de valor de pico respecto a valor medio de los coeficientes espectrales que están ubicados dentro de la subbanda y, y que es de la trama de audio actual, no cae dentro del intervalo R1.
  8. 8. - El codificador de audio según la reivindicación 7, en donde un intervalo de segmento de frecuencia de la subbanda x es de 0 kHz a 1,6 kHz, de 1 kHz a 2,6 kHz, o de 1,6 kHz a 3,2 kHz, y un intervalo de segmento de frecuencia de la subbanda y es de 6,4 kHz a 8 kHz, de 7,4 kHz a 9 kHz, o de 4,8 kHz a 6,4 kHz.
ES15826814T 2014-07-28 2015-04-01 Codificación de audio Active ES2814154T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410363905.5A CN104143335B (zh) 2014-07-28 2014-07-28 音频编码方法及相关装置
PCT/CN2015/075645 WO2016015485A1 (zh) 2014-07-28 2015-04-01 音频编码方法及相关装置

Publications (1)

Publication Number Publication Date
ES2814154T3 true ES2814154T3 (es) 2021-03-26

Family

ID=51852493

Family Applications (2)

Application Number Title Priority Date Filing Date
ES20159183T Active ES2938742T3 (es) 2014-07-28 2015-04-01 Codificación de audio
ES15826814T Active ES2814154T3 (es) 2014-07-28 2015-04-01 Codificación de audio

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES20159183T Active ES2938742T3 (es) 2014-07-28 2015-04-01 Codificación de audio

Country Status (15)

Country Link
US (4) US10056089B2 (es)
EP (2) EP3157010B1 (es)
JP (2) JP6538822B2 (es)
KR (2) KR102022500B1 (es)
CN (2) CN104143335B (es)
AU (2) AU2015296447B2 (es)
BR (1) BR112016029904B1 (es)
CA (3) CA2951321C (es)
ES (2) ES2938742T3 (es)
MX (1) MX360606B (es)
MY (1) MY174461A (es)
PL (1) PL3790007T3 (es)
RU (1) RU2670790C9 (es)
SG (2) SG11201610047RA (es)
WO (1) WO2016015485A1 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104143335B (zh) 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置
JP6501259B2 (ja) * 2015-08-04 2019-04-17 本田技研工業株式会社 音声処理装置及び音声処理方法
US20220254331A1 (en) * 2021-02-05 2022-08-11 Cambium Assessment, Inc. Neural network and method for machine learning assisted speech recognition
CN112767956B (zh) * 2021-04-09 2021-07-16 腾讯科技(深圳)有限公司 音频编码方法、装置、计算机设备及介质
CN117597731A (zh) * 2021-06-29 2024-02-23 瑞典爱立信有限公司 用于音频编码模式选择的频谱分类器

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3364825B2 (ja) 1996-05-29 2003-01-08 三菱電機株式会社 音声符号化装置および音声符号化復号化装置
DE69926821T2 (de) * 1998-01-22 2007-12-06 Deutsche Telekom Ag Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
US6704705B1 (en) * 1998-09-04 2004-03-09 Nortel Networks Limited Perceptual audio coding
US6721280B1 (en) 2000-04-19 2004-04-13 Qualcomm Incorporated Method and apparatus for voice latency reduction in a voice-over-data wireless communication system
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
EP1351401B1 (en) * 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
DE60307252T2 (de) * 2002-04-11 2007-07-19 Matsushita Electric Industrial Co., Ltd., Kadoma Einrichtungen, verfahren und programme zur kodierung und dekodierung
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
US7333930B2 (en) 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
CN101180677B (zh) * 2005-04-01 2011-02-09 高通股份有限公司 用于宽频带语音编码的系统、方法和设备
WO2007083931A1 (en) 2006-01-18 2007-07-26 Lg Electronics Inc. Apparatus and method for encoding and decoding signal
CN101496099B (zh) * 2006-07-31 2012-07-18 高通股份有限公司 用于对有效帧进行宽带编码和解码的系统、方法和设备
CN101145345B (zh) * 2006-09-13 2011-02-09 华为技术有限公司 音频分类方法
CN101145343B (zh) * 2006-09-15 2011-07-20 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
CN101025918B (zh) * 2007-01-19 2011-06-29 清华大学 一种语音/音乐双模编解码无缝切换方法
KR101411901B1 (ko) * 2007-06-12 2014-06-26 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
KR101452722B1 (ko) * 2008-02-19 2014-10-23 삼성전자주식회사 신호 부호화 및 복호화 방법 및 장치
US20090319261A1 (en) 2008-06-20 2009-12-24 Qualcomm Incorporated Coding of transitional speech frames for low-bit-rate applications
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
RU2515704C2 (ru) * 2008-07-11 2014-05-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодер и аудиодекодер для кодирования и декодирования отсчетов аудиосигнала
JP5325293B2 (ja) * 2008-07-11 2013-10-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたオーディオ信号を復号化するための装置および方法
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
WO2010003539A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal synthesizer and audio signal encoder
JP5555707B2 (ja) * 2008-10-08 2014-07-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム
US8498874B2 (en) 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
MX2012004116A (es) * 2009-10-08 2012-05-22 Fraunhofer Ges Forschung Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, metodo y programa de computacion que usan un modelado de ruido en base a linealidad-prediccion-codi ficacion.
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
PL2491555T3 (pl) * 2009-10-20 2014-08-29 Fraunhofer Ges Forschung Wielotrybowy kodek audio
EP2525355B1 (en) * 2010-01-14 2017-11-01 Panasonic Intellectual Property Corporation of America Audio encoding apparatus and audio encoding method
US8886523B2 (en) 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
US9275650B2 (en) * 2010-06-14 2016-03-01 Panasonic Corporation Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs
WO2011156905A2 (en) 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102074242B (zh) * 2010-12-27 2012-03-28 武汉大学 语音音频混合分级编码中核心层残差提取系统及方法
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
US20140058737A1 (en) * 2011-10-28 2014-02-27 Panasonic Corporation Hybrid sound signal decoder, hybrid sound signal encoder, sound signal decoding method, and sound signal encoding method
US9111531B2 (en) * 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
WO2013180164A1 (ja) * 2012-05-30 2013-12-05 日本電信電話株式会社 符号化方法、符号化装置、プログラム、および記録媒体
CN104143335B (zh) 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置

Also Published As

Publication number Publication date
JP6538822B2 (ja) 2019-07-03
PL3790007T3 (pl) 2023-05-02
CA3058990A1 (en) 2016-02-04
KR102022500B1 (ko) 2019-11-25
MX2017001039A (es) 2017-05-04
US20190164562A1 (en) 2019-05-30
JP2017522608A (ja) 2017-08-10
JP6888051B2 (ja) 2021-06-16
RU2017101806A3 (es) 2018-08-30
US20170125031A1 (en) 2017-05-04
US20200066290A1 (en) 2020-02-27
CA2951321C (en) 2019-12-31
KR20190014603A (ko) 2019-02-12
US20180268832A1 (en) 2018-09-20
EP3157010A1 (en) 2017-04-19
EP3157010A4 (en) 2017-10-25
BR112016029904B1 (pt) 2023-04-18
ES2938742T3 (es) 2023-04-14
US10706866B2 (en) 2020-07-07
EP3790007B1 (en) 2023-01-04
AU2018201411A1 (en) 2018-03-22
EP3790007A1 (en) 2021-03-10
CN104143335A (zh) 2014-11-12
MY174461A (en) 2020-04-20
WO2016015485A1 (zh) 2016-02-04
KR101947127B1 (ko) 2019-02-12
CA3064092C (en) 2022-04-19
US10056089B2 (en) 2018-08-21
BR112016029904A2 (pt) 2017-08-22
AU2018201411B2 (en) 2019-08-22
AU2015296447A1 (en) 2017-01-05
CA3064092A1 (en) 2016-02-04
RU2670790C9 (ru) 2018-11-23
SG11201610047RA (en) 2017-01-27
RU2670790C2 (ru) 2018-10-25
AU2015296447B2 (en) 2018-01-18
KR20170010822A (ko) 2017-02-01
CN106448688A (zh) 2017-02-22
RU2017101806A (ru) 2018-08-30
JP2019164379A (ja) 2019-09-26
SG10201805102PA (en) 2018-08-30
CA2951321A1 (en) 2016-02-04
CN106448688B (zh) 2019-11-05
EP3157010B1 (en) 2020-06-10
US10504534B2 (en) 2019-12-10
MX360606B (es) 2018-11-09
US10269366B2 (en) 2019-04-23
CN104143335B (zh) 2017-02-01

Similar Documents

Publication Publication Date Title
ES2814154T3 (es) Codificación de audio
Saff et al. Logarithmic potentials with external fields
ES2540215T3 (es) Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial
WO2013040052A3 (en) Efficient access to storage devices with usage bitmaps
ES2785041T3 (es) Búsqueda de forma de cuantificador de vector en pirámide
JP6517300B2 (ja) 信号処理方法及び装置
JP5256375B2 (ja) 符号化方法、復号方法、装置、プログラム及び記録媒体
Kemper et al. An audio compression method based on wavelets subband coding
Braun Generalized Wavelet Theory and Non-Linear, Non-Periodic Boundary Value Problems
JP5762620B2 (ja) 低周波数エフェクトチャネルのための複雑さが低減された変換
Watson Bryan Watson, Guitar: Student Recital