ES2575693T3 - Un método y un aparato para detectar tasa de muestreo de audio - Google Patents

Un método y un aparato para detectar tasa de muestreo de audio Download PDF

Info

Publication number
ES2575693T3
ES2575693T3 ES11875412.6T ES11875412T ES2575693T3 ES 2575693 T3 ES2575693 T3 ES 2575693T3 ES 11875412 T ES11875412 T ES 11875412T ES 2575693 T3 ES2575693 T3 ES 2575693T3
Authority
ES
Spain
Prior art keywords
frequency
sampling
audio
linear spectral
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11875412.6T
Other languages
English (en)
Inventor
Anssi Sakari RÄMÖ
Adriana Vasilache
Lasse Juhani Laaksonen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Technologies Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Technologies Oy filed Critical Nokia Technologies Oy
Application granted granted Critical
Publication of ES2575693T3 publication Critical patent/ES2575693T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un método que comprende: recibir, un conjunto de parámetros de audio codificado para una trama de audio, en donde el conjunto comprende índices que representan al menos dos coeficientes de frecuencia espectral lineales cuantificados, en donde la trama de audio cuando se decodifica comprende muestras de audio muestreadas digitalmente a una frecuencia de muestreo, en donde la frecuencia de muestreo es una de una pluralidad de frecuencias de muestreo para un decodificador de audio; convertir los índices a los al menos dos coeficientes de frecuencia espectral lineales cuantificados; y determinar la frecuencia de muestreo para la trama de audio comprobando el valor de un coeficiente de frecuencia espectral lineal cuantificado de orden más alto de los al menos dos coeficientes de frecuencia espectral lineales cuantificados.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Un metodo y un aparato para detectar tasa de muestreo de audio Campo de la solicitud
La presente aplicacion se refiere a la codificacion, y en particular, pero no exclusivamente a la codificacion del habla o de audio.
Antecedentes de la solicitud
Las senales de audio, como el habla o la musica, se codifican por ejemplo para posibilitar la transmision o almacenamiento eficaz de la senales de audio.
Los codificadores y decodificadores de audio se usan para representar senales basadas en audio, tales como musica y ruido de fondo. Estos tipos de codificadores normalmente no utilizan un modelo del habla para el proceso de codificacion, en su lugar usan procesos para representar todos los tipos de senales de audio, incluyendo el habla.
Los codificadores y decodificadores (codec) del habla estan normalmente optimizados para senales del habla, y pueden operar a una tasa de bits fija o variable.
Los codec del habla y de audio pueden configurarse tambien para operar con tasas de bits variables. A tasas de bits inferiores, un codec de este tipo puede funcionar con senales del habla a una tasa de codificacion equivalente a un codec del habla puro. A tasas de bits superiores, el codec puede codificar cualquier senal incluyendo musica, ruido de fondo y el habla, con calidad y rendimiento superior.
Los codec del habla y de audio pueden usar codificacion predictiva lineal para representar eficazmente correlaciones a corto plazo en la senal.
Los codec del habla y de audio normalmente realizan Codificacion Predictiva Lineal adoptando un filtro autorregresivo (AR) para modelar las correlaciones a corto plazo en la senal. Los coeficientes del filtro se conocen como coeficientes de Prediccion Lineal (LP) donde el numero de coeficientes se determina por el orden del filtro AR.
Los coeficientes LP pueden determinarse usando analisis predictivo lineal. El analisis puede realizarse de manera regular en el audio o el habla de entrada para diferentes instancias de tiempo, dando como resultado actualizaciones frecuentes para el conjunto de coeficientes de LP.
Los coeficientes de LP se transforman normalmente a Frecuencias Espectrales Lineales (LSF) para facilitar el almacenamiento o transmision a traves de un canal de comunicacion.
La codificacion del habla y de audio de tasa de bits variable puede usar un numero variable de coeficientes de LP cuando se codifica la senal del habla de entrada.
Adicionalmente un codec del habla y de audio de tasa de bits variable puede soportar tambien diferentes anchos de banda con el mismo numero de coeficientes de LP.
Por ejemplo, un codec del habla y de audio de tasa de bits variable puede variar el orden de codificacion de LPC dependiendo del ancho de banda o frecuencia de muestreo de la senal a codificar.
Como alternativa, un codec del habla y de audio de tasa de bits variable puede codificar una senal de audio muestreada en una cualquiera de un numero de tasas de muestreo usando el mismo o similar orden de codificacion de LPC. En consecuencia cualquier cambio al orden de codificacion de LP o frecuencia de muestreo requiere que se senalice al decodificador, ya que esto puede dar como resultado un cambio en el modo de decodificacion.
Los codec de tasa de bits variable pueden transmitir el orden de codificacion de LP o tasa de muestreo en forma de una bandera de indice como parte del flujo de bits codificado.
Sin embargo, la transmision del orden de codificacion de LP o tasa de muestreo incurre en la penalization de los bits adicionales en el flujo de bits codificado.
El documento EP1785985 desvela un codificador del habla escalable con prediccion espectral lineal (LSP) de ancho de banda escalable. En particular se desvela un metodo para convertir LSP de banda estrecha a LSP de banda ancha.
5
10
15
20
25
30
35
40
45
50
55
60
65
Sumario de la solicitud
Esta solicitud parte de la consideracion de que los codec del habla y de audio de tasa de bits variable pueden desplegar analisis de codificacion predictiva lineal de orden variable con tasas de muestreo variables cuando codifican en la senal de entrada. Por lo tanto como parte del esquema de codificacion se requiere que se notifique al decodificador del orden de codificacion de LP y/o de la tasa de muestreo. Aunque esta informacion puede representarse en unos pocos bits, sin embargo, es deseable que se elimine la tara de codificacion para senalizar el orden de codificacion de LP y la tasa de muestreo.
Las siguientes realizaciones tienen por objeto tratar el problema anterior.
De acuerdo con un aspecto, existe un metodo que comprende recibir, un conjunto de parametros de audio codificado para una trama de audio, el conjunto comprende indices que representan al menos dos coeficientes de frecuencia espectral lineales cuantificados, la trama de audio cuando se decodifica comprende muestras de audio muestreadas digitalmente a una frecuencia de muestreo, la frecuencia de muestreo es una de una pluralidad de frecuencias de muestreo para un decodificador de audio; convertir los indices a los al menos dos coeficientes de frecuencia espectral lineales cuantificados; y determinar la frecuencia de muestreo para la trama de audio comprobando el valor de un coeficiente de frecuencia espectral lineal cuantificado de orden mas alto de los al menos dos coeficientes de frecuencia espectral lineales cuantificados.
La comprobacion del valor del coeficiente de frecuencia espectral lineal cuantificado de orden mas alto puede comprender: comparar el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto con cada uno de una pluralidad de intervalos de frecuencia, un primer intervalo de frecuencia de la pluralidad de intervalos de frecuencia esta asociado a una primera frecuencia de muestreo, y un segundo intervalo de frecuencia de la pluralidad de intervalos de frecuencia esta asociado a una segunda frecuencia de muestreo; determinar la frecuencia de muestreo de la trama de audio para que sea la primera frecuencia de muestreo cuando el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto puede estar en el primer intervalo de frecuencia; y determinar la frecuencia de muestreo de la trama de audio para que sea la segunda frecuencia de muestreo cuando el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto puede estar en el segundo intervalo de frecuencia.
El primer intervalo de frecuencia de la pluralidad de intervalos de frecuencia puede abarcar las frecuencias entre un primer limite de baja frecuencia y un primer limite de alta frecuencia, y el segundo intervalo de frecuencia de la pluralidad de intervalos de frecuencia puede abarcar las frecuencias entre un segundo limite de baja frecuencia y un segundo limite de alta frecuencia, y las frecuencias abarcadas por el primer intervalo de frecuencia son diferentes del intervalo de frecuencias abarcado por el segundo intervalo de frecuencia.
Cada una de la pluralidad de frecuencias de muestreo puede estar asociada cada una a uno de una pluralidad de diferentes modos de operacion del decodificador de audio, y la frecuencia de muestreo determinada de la trama de audio puede estar asociada a uno de la pluralidad de diferentes modos de operacion del decodificador de audio.
La pluralidad de frecuencias de muestreo puede comprender 12,8 kHz y 16 kHz, el intervalo de frecuencia para la frecuencia de muestreo de 12,8 kHz puede tener un limite de baja frecuencia de 3950 Hz y un limite de alta frecuencia de 6350 Hz, y el intervalo de frecuencia para la frecuencia de muestreo de 16 kHz puede tener un limite de baja frecuencia de 6350 Hz y un limite de alta frecuencia de 7950 Hz respectivamente.
De acuerdo con otro aspecto se proporciona un aparato que comprende: medios para recibir un conjunto de parametros de audio codificado para una trama de audio, el conjunto comprende indices que representan al menos dos coeficientes de frecuencia espectral lineales cuantificados, la trama de audio cuando se decodifica comprende muestras de audio muestreadas digitalmente a una frecuencia de muestreo, la frecuencia de muestreo es una de una pluralidad de frecuencias de muestreo para un decodificador de audio; medios para convertir los indices a los al menos dos coeficientes de frecuencia espectral lineales cuantificados; y medios para determinar la frecuencia de muestreo para la trama de audio teniendo medios para comprobar el valor de un coeficiente de frecuencia espectral lineal cuantificado de orden mas alto de los al menos dos coeficientes de frecuencia espectral lineales cuantificados.
Los medios para comprobar el valor del coeficiente de frecuencia espectral lineal cuantificado de orden mas alto pueden comprender: medios para comparar el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto con cada uno de una pluralidad de intervalos de frecuencia, un primer intervalo de frecuencia de la pluralidad de intervalos de frecuencia puede estar asociado a una primera frecuencia de muestreo, y un segundo intervalo de frecuencia de la pluralidad de intervalos de frecuencia puede estar asociado a una segunda frecuencia de muestreo; medios para determinar la frecuencia de muestreo de la trama de audio para que sea la primera frecuencia de muestreo cuando el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto puede estar en el primer intervalo de frecuencia; y medios para determinar la frecuencia de muestreo de la trama de audio para que sea la segunda frecuencia de muestreo cuando el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto puede estar en el segundo intervalo de frecuencia.
5
10
15
20
25
30
35
40
45
50
55
60
65
El primer intervalo de frecuencia de la pluralidad de intervalos de frecuencia puede abarcar las frecuencias entre un primer limite de baja frecuencia y un primer limite de alta frecuencia, el segundo intervalo de frecuencia de la pluralidad de intervalos de frecuencia puede abarcar las frecuencias entre un segundo limite de baja frecuencia y un segundo limite de alta frecuencia, y las frecuencias abarcadas por el primer intervalo de frecuencia pueden ser diferentes del intervalo de frecuencias abarcado por el segundo intervalo de frecuencia.
Cada una de la pluralidad de frecuencias de muestreo puede estar asociada cada una a uno de una pluralidad de diferentes modos de operacion del decodificador de audio, y la frecuencia de muestreo determinada de la trama de audio puede estar asociada a uno de la pluralidad de diferentes modos de operacion del decodificador de audio.
La pluralidad de frecuencias de muestreo puede comprender 12,8 kHz y 16 kHz, el intervalo de frecuencia para la frecuencia de muestreo de 12,8 kHz puede tener un limite de baja frecuencia de 3950 Hz y un limite de alta frecuencia de 6350 Hz, y el intervalo de frecuencia para la frecuencia de muestreo de 16 kHz puede tener un limite de baja frecuencia de 6350 Hz y un limite de alta frecuencia de 7950 Hz respectivamente.
Breve descripcion de los dibujos
Para entender mejor la presente invencion, se hara referencia ahora a modo de ejemplo a los dibujos adjuntos en los que:
La Figura 1 muestra esquematicamente un aparato adecuado para emplear algunas realizaciones de la solicitud; La Figura 2 muestra esquematicamente un sistema de codec de audio adecuado que emplea algunas realizaciones de la solicitud;
La Figura 3 muestra esquematicamente una parte de codificador del sistema de codec de mostrado en la figura 2 de acuerdo con algunas realizaciones de la solicitud;
La Figura 4 muestra una vista esquematica que representa un histograma de la frecuencia espectral lineal de orden mas alto para datos de audio muestreados a 12,8 kHz, y un histograma de la frecuencia espectral lineal de orden mas alto para muestras de datos de audio de 16 kHz de acuerdo con algunas realizaciones de la solicitud;
y
La Figura 5 muestra esquematicamente una parte de decodificador del sistema de codec de audio como se muestra en la Figura 2.
Descripcion de algunas realizaciones de la solicitud
Lo siguiente describe en mas detalle posibles mecanismos de codec para el aprovisionamiento de codificacion de LP o de orden de LSF y/o identificacion de tasa de muestreo en los codec de audio y del habla. En este sentido se hace referencia en primer lugar a la Figura 1 que muestra un diagrama de bloques esquematico de un dispositivo o aparato electronico ejemplar 10, que puede incorporar un codec de acuerdo con las realizaciones de la solicitud.
El aparato 10 puede ser por ejemplo un terminal movil o equipo de usuario de un sistema de comunicacion inalambrica. En otras realizaciones el aparato 10 puede ser un dispositivo de audio-video tal como una camara de video, un receptor de television (TV), grabador de audio o reproductor de audio tal como un grabador/reproductor de mp3, un grabador multimedia (tambien conocido como grabador/reproductor mp4), o cualquier ordenador adecuado para el procesamiento de senales de audio.
El aparato 10 en algunas realizaciones comprende un microfono 11, que esta enlazado mediante un convertidor de analogico a digital (ADC) 14 a un procesador 21. El procesador 21 esta enlazado mediante un convertidor de digital a analogico (DAC) 32 a los altavoces 33. El procesador 21 esta enlazado adicionalmente a un transceptor (RX/TX) 13, a una interfaz de usuario (UI) 15 y a una memoria 22.
El procesador 21 puede configurarse para ejecutar diversos codigos de programa. Los codigos de programa implementados en algunas realizaciones comprenden un codigo de codificacion de audio para codificar una banda de frecuencia inferior de una senal de audio y una banda de frecuencia superior de una senal de audio. Los codigos de programa implementados 23 en algunas realizaciones comprenden adicionalmente un codigo de decodificacion de audio y del habla. Los codigos de programa implementados 23 pueden almacenarse en algunas realizaciones por ejemplo en la memoria 22 para recuperacion mediante el procesador 21 cada vez que sea necesario. La memoria 22 podria proporcionar adicionalmente una seccion 24 para almacenar datos, por ejemplo datos que se han codificado de acuerdo con las realizaciones de la solicitud.
El codigo de codificacion y decodificacion en las realizaciones puede implementarse en hardware o firmware.
La interfaz de usuario 15 posibilita a un usuario introducir comandos al aparato 10, por ejemplo mediante un teclado numerico, y/o para obtener informacion desde el aparato 10, por ejemplo mediante una pantalla. En algunas realizaciones una pantalla tactil puede proporcionar funciones tanto de entrada como de salida para la interfaz de usuario. El aparato 10 en algunas realizaciones comprende un transceptor 13 adecuado para posibilitar la comunicacion con otros aparatos, por ejemplo mediante una red de comunicacion inalambrica.
5
10
15
20
25
30
35
40
45
50
55
60
65
Se ha de entender de nuevo que la estructura del aparato 10 podria complementarse y variarse de muchas maneras.
Un usuario del aparato 10 por ejemplo puede usar el microfono 11 para introducir el habla u otras senales de audio que se han de transmitir a algun otro aparato o que se han de almacenar en la seccion de datos 24 de la memoria 22. Una aplicacion correspondiente en algunas realizaciones puede activarse para este fin por el usuario mediante la interfaz de usuario 15. Esta aplicacion en estas realizaciones puede realizarse mediante el procesador 21, que provoca que el procesador 21 ejecute el codigo de codificacion almacenado en la memoria 22.
El convertidor de analogico a digital (ADC) 14 en algunas realizaciones convierte la senal de audio analogico de entrada en una senal de audio digital y proporciona la senal de audio digital al procesador 21. En algunas realizaciones el microfono 11 puede comprender una funcion de microfono y ADC integrados y proporcionar senales de audio digital directamente al procesador para procesar.
El procesador 21 en tales realizaciones a continuacion puede procesar la senal de audio digital de la misma manera que se ha descrito con referencia a las Figuras 3 a 5.
El flujo de bits resultante puede proporcionarse en algunas realizaciones al transceptor 13 para transmision a otro aparato. Como alternativa, los datos de audio o del habla codificados en algunas realizaciones pueden almacenarse en la seccion de datos 24 de la memoria 22, por ejemplo para una transmision posterior o para una presentacion posterior mediante el mismo aparato 10.
El aparato 10 en algunas realizaciones puede recibir tambien un flujo de bits con datos codificados correspondientemente desde otro aparato mediante el transceptor 13. En este ejemplo, el procesador 21 puede ejecutar el codigo de programa de decodificacion almacenado en la memoria 22. El procesador 21 en tales realizaciones decodifica los datos recibidos, y proporciona los datos decodificados a un convertidor de digital a analogico 32. El convertidor de digital a analogico 32 convierte los datos decodificados digitales en datos de audio analogicos y puede emitir en algunas realizaciones el audio analogico mediante los altavoces 33. La ejecucion del codigo de programa de decodificacion puede activarse tambien en algunas realizaciones mediante una aplicacion solicitada por el usuario mediante la interfaz de usuario 15.
Los datos codificados recibidos en algunas realizaciones pueden almacenarse tambien en lugar de una presentacion inmediata mediante los altavoces 33 en la seccion de datos 24 de la memoria 22, por ejemplo para decodificacion y presentacion posterior o decodificacion y reenvio a otro aparato mas.
Deberia apreciarse que las estructuras esquematicas descritas en las Figuras 3 a 5 representan unicamente una parte de la operation de un codec de audio como se muestra ejemplarmente implementado en el aparato mostrado en la Figura 1.
La operacion general de los codec de audio como se emplea mediante las realizaciones de la solicitud se muestra en la Figura 2. La codificacion de audio y del habla general comprende un codificador, como se ilustra esquematicamente en la Figura 2. Ilustrado mediante la Figura 2 esta un sistema 102 con un codificador 104, y un almacenamiento o canal de medios 106. Deberia entenderse que como se ha descrito anteriormente algunas realizaciones del aparato 10 puede comprender o implementar un codificador 104.
El codificador 104 comprime una senal de audio de entrada 110 que produce un flujo de bits 112, que en algunas realizaciones puede almacenarse o transmitirse a traves de un canal de medios 106. El flujo de bits 112 puede recibirse en el decodificador 108. El decodificador 108 descomprime el flujo de bits 112 y produce una senal de salida de audio 114. La tasa de bits del flujo de bits 112 y la calidad de la senal de audio de salida 114 en relation a la senal de entrada 110 son las principales caracteristicas que definen el rendimiento del sistema de codificacion 102.
La Figura 3 muestra esquematicamente algunos componentes del codificador 104 de acuerdo con las realizaciones de la solicitud. Los componentes del codificador 104 pueden comprender una entrada 303 dispuesta para recibir una senal de audio.
La senal de audio recibida mediante la entrada 303 puede conectarse a la entrada de un colector de tramas 310.
Se ha de entender en las realizaciones que el colector de tramas 310 puede recibir senales de audio que se han muestreado a un numero de diferentes tasas de muestreo.
Por ejemplo, en un primer grupo de realizaciones la entrada 303 puede recibir una senal de audio que se ha muestreado al menos con alguna de las siguientes frecuencias de muestreo 8000 Hz, 12800 Hz, 16000 Hz, 25600 Hz, 32000 Hz y 48000 Hz.
5
10
15
20
25
30
35
40
45
50
55
60
65
Como alternativa en otro grupo de realizaciones pueden usarse otros conjuntos de tasas de muestreo tales como 11025, 22050 y 44100 Hz.
El colector de tramas 310 puede estar dispuesto tambien para recibir una senal de entrada adicional que transporta la frecuencia de muestreo de la senal de audio. Con referencia a la Figura 3, la entrada adicional se representa como la conexion 305.
En las realizaciones el colector de tramas 310 puede reunir una pluralidad de muestras de Modulation por Pulsos Codificados (PCM) de entrada para formar una trama de muestras de audio. El numero de muestras en cada trama puede determinarse mediante la frecuencia de muestreo y el ancho de banda de audio de la senal de audio de entrada. Por ejemplo, en un primer grupo de realizaciones el colector de tramas 310 puede reunir las muestras de audio de entrada en un tamano de trama de 160, 256 o 320 muestras para frecuencias de muestra de audio de 8 kHz, 12,8 kHz o 16 kHz respectivamente.
En algunas realizaciones el colector de tramas 310 puede aplicar una funcion de ventanas a la trama de muestras de audio. Por ejemplo, en el primer grupo de realizaciones el colector de tramas puede aplicar una funcion de ventanas de Hamming. Sin embargo, otras realizaciones pueden usar funciones de ventanas tales como: Hanning, Kaiser, Blackman o Bartlett.
La salida del colector de tramas 310 puede estar dispuesta para conectarse a la entrada de un analizador de LPC 312.
Adicionalmente, el analizador de LPC 312 puede estar dispuesto tambien para recibir la entrada 305 que transporta la frecuencia de muestreo de la senal de audio. El analizador de LPC 312 puede analizar la trama de audio de entrada para determinar la prediction o los coeficientes de filtro para cualquier etapa de prediction posterior.
En un primer grupo de realizaciones los coeficientes de prediccion segun se determinan mediante el analizador de LPC 312 son los coeficientes de LP. El numero de coeficientes de LP, en otras palabras, el orden del predictor, puede ser dependiente de la frecuencia de muestreo de la senal de audio.
Por ejemplo, el analizador de LPC 312 puede notificarse mediante la linea de senal 305 de que la senal de audio de entrada esta muestreada a una frecuencia de muestreo de 8 kHz. En este ejemplo particular el analizador de LPC puede determinar el orden de prediccion para que sea diez, o en otras palabras el analizador de LPC producira diez coeficientes de LP para cada trama de audio muestreado.
En otro ejemplo del primer grupo de realizaciones, puede informarse al analizador de LPC mediante la linea de senal 305 de que la senal de audio esta muestreada a una tasa de 16 kHz. En este ejemplo, el analizador de LPC puede determinar el orden de prediccion para que sea dieciseis, produciendo de esta manera dieciseis coeficientes de LP para cada trama de audio. De manera similar para la tasa de muestreo de 12,8 kHz, el analizador de LPC puede determinar el orden de prediccion para que sea dieciseis, produciendo de esta manera dieciseis coeficientes de LP para cada trama de audio.
En algunas realizaciones el analisis de las correlaciones a corto plazo en la trama de audio puede conseguirse mediante analisis de codification predictiva lineal (LPC). Esta tecnica se basa en calcular cualquiera de la autocovarianza o autocorrelation de la trama de audio a traves de un intervalo de diferentes retardos de muestra. El intervalo de retardos de muestra puede determinarse mediante el orden de prediccion.
En un primer grupo de realizaciones el analisis de LPC puede realizarse usando el metodo de correlation en el cual el resultado de calcular las autocorrelaciones a traves del intervalo de diferentes retardos segun se determina mediante el orden de prediccion puede formarse en una matriz cuadrada simetrica conocida como la matriz de Toeplitz. La matriz de Toeplitz tiene la propiedad de que es simetrica alrededor de la diagonal principal y todos los elementos a lo largo de cualquier diagonal dada son iguales. Para determinar los coeficientes de LP la matriz puede invertirse usando el algoritmo de Levinson-Durbin.
En un segundo grupo de realizaciones el analisis de LPC puede realizarse usando el metodo de autocovarianza.
El metodo de autocovarianza calcula la covarianza de una trama de audio a traves de un intervalo de diferentes retardos de muestra. El retardo maximo en terminos del numero de muestras se determina mediante el orden de prediccion. Los calculos de covarianza para los diferentes retardos de muestra pueden estar dispuestos en forma de una matriz cuyo orden se proporciona mediante el orden de prediccion de LPC.
Se ha de entender en el segundo grupo de realizaciones que la matriz de covarianza es simetrica alrededor de la diagonal principal. Sin embargo, a diferencia de la matriz de Toeplitz los valores en una diagonal dada no son necesariamente iguales. Como anteriormente, en estas realizaciones los coeficientes de LP pueden encontrarse tambien invirtiendo la matriz. Sin embargo, a diferencia de la matriz de Toeplitz del primer grupo de realizaciones la matriz puede invertirse usando descomposicion de Cholesky.
5
10
15
20
25
30
35
40
45
50
55
60
65
En otras palabras se proporcionan medios para determinar al menos dos coeficientes de prediction lineal para unas muestras de manera digital de trama de audio a una primera tasa de muestreo.
La salida desde el analizador de LPC, en otras palabras los coeficientes de LP pueden estar conectados al convertidor de LPC a LSF 314 junto con la senal de tasa de muestreo 305.
En las realizaciones convertidor de LPC a LSF 314 puede convertir los coeficientes de LP a coeficientes de LSF.
La conversion de los coeficientes de LPC a coeficientes de LSF puede realizarse descomponiendo el numerador del modelo de filtro de AR en dos polinomios, donde un primer polinomio puede observarse como que representa el tracto vocal con la glotis cerrada y el segundo polinomio puede observarse como que representa el tracto vocal con la glotis abierta. Los pares espectrales lineales (LSP) pueden determinarse a continuation calculando las raices de los dos polinomios, que radican el circulo unitario y tienen lugar en pares simetricos. Las raices pueden calcularse usando una cualquiera de un numero de tecnicas conocidas en la tecnica tales como; el metodo de series de Chebyshev, el metodo de filtro de relation, o el metodo cuadratico medio minimo adaptativo secuencial.
Una vez que se han calculado los LSP pueden convertirse a su representation de LSF. La conversion de LSP a LSF puede conseguirse senalando que se determina el LSF para que sea la position angular de las raices entre cero y pi.
Se ha de apreciar en las realizaciones que el numero de coeficientes de LSF en el conjunto de coeficientes de LSF sera el mismo que el numero de coeficientes de LP en el conjunto de coeficientes de LP. En otras palabras, el numero de LSF sera el mismo que el orden de prediccion. Por ejemplo, si se realizo un analisis de LPC de decimo orden a traves de la trama de audio de entrada entonces el conjunto de diez coeficientes de LP se transformarian en un conjunto de diez coeficientes de LSF.
En otras palabras se proporcionan medios para convertir al menos dos coeficientes de prediccion lineal a al menos dos coeficientes de frecuencia espectral lineal.
Se ha de apreciar adicionalmente en las realizaciones que el conjunto de coeficientes de LSF tiene la propiedad de que puede aumentar de manera monotonica. En otras palabras, las frecuencias angulares de coeficiente de LSF del conjunto de coeficientes de LSF satisface la siguiente ecuacion,
0 < O)0 < < COq-1 < 71,
donde q es el orden de prediccion, y m es la frecuencia angular del primer coeficiente de LSF, mi es la frecuencia angular del segundo coeficiente de LSF, y mq-1 es la frecuencia angular del coeficiente de LSF de orden mas alto.
Se ha de entender en la ecuacion anterior que pi es equivalente a la frecuencia a la mitad de la tasa de muestreo. Por ejemplo, si la trama de audio de entrada se muestrea mediante el ADC 14 a una tasa de muestreo de 8 kHz, entonces todos los coeficientes de LSF anteriores mo a m-1 radicaran en el intervalo de frecuencia de 0 a 4 kHz.
En las realizaciones puede observarse que puede haber o no solapamiento o muy poco solapamiento entre los intervalos de frecuencia de los coeficientes de LSF de orden mas alto para tramas de audio muestreadas a diferentes frecuencias de muestreo.
En otras palabras, cuando la frecuencia de muestreo de audio se varia entre un conjunto de tramas de audio y el siguiente puede observarse que hay o no solapamiento o muy poco solapamiento entre las distribuciones estadisticas de los respectivos coeficientes de LSF de orden mas alto.
Por ejemplo, en un primer grupo de realizaciones el codificador 104 puede estar dispuesto para operar en un modo de operation discontinua (DTX) en el cual el codificador 104 puede encargarse de producir tramas de actualization de ruido agradables como parte de un proceso de generation de ruido agradable (CNG). El codificador 104 puede estar dispuesto para operar con tramas de audio muestreadas en una de dos frecuencias de muestreo, 12,8 kHz y 16 KHz.
La Figura 4 presenta histogramas estadisticos del coeficiente de LSF de orden mas alto para tanto datos de audio muestreados a 12,8 kHz, como datos de audio muestreados a 16 kHz.
Con referencia a la figura 4 puede observarse que para datos de audio muestreados a 12,8 kHz y para datos de audio muestreados a 16 kHz hay muy poco solapamiento entre sus respectivos histogramas.
Por ejemplo, se ha observado que el coeficiente de LSF de orden mas alto para audio muestreado a 12,8 kHz puede radicar entre los limites 3950 kHz y 6328 kHz, y el coeficiente de LSF de orden mas alto para audio de muestras a 16 kHz puede radicar entre los limites 6380 kHz y 7950 kHz.
5
10
15
20
25
30
35
40
45
50
55
60
65
Se ha de apreciar en las realizaciones que cuanto mayor es la diferencia entre frecuencias de muestreo de la senal de audio muestreada mayor sera la distancia de frecuencia entre las distribuciones de los coeficientes de LSF de orden mas alto.
Se ha de apreciar adicionalmente que las realizaciones que monitorizan el valor del coeficiente de LSF de orden mas alto tienen la ventaja de que pueden distinguir entre diferentes frecuencias de muestreo de la trama de audio de entrada.
Algunas realizaciones pueden desplegar un enfoque de modo variable para codificar la trama de audio de entrada, en el cual el modo de codificacion puede cambiarse de una trama de audio a la siguiente de acuerdo con un cambio en la frecuencia de muestreo.
Normalmente, el enfoque de modo variable puede dar como resultado una codificacion de tasa de bits variable de la trama de audio de entrada, en la cual la tasa de bits puede variar de acuerdo con el modo de codificacion seleccionado.
Se ha de entender, por lo tanto, que el modo de operacion del codificador de audio puede identificarse mediante el valor del coeficiente de LSF de orden mas alto.
Se ha de entender adicionalmente que estas realizaciones pueden aprovecharse de que el modo de codificacion no necesita transmitirse o almacenarse como parte del flujo de bits codificado para el decodificador.
En un primer grupo de realizaciones el codificador puede operar como parte de un entorno de codificacion de capa embebida en el cual una capa principal se produce inicialmente. La senal codificada de la capa principal reconstruida se elimina a continuacion de la senal de audio de entrada para dejar una senal de audio residual que a continuacion se codifica posteriormente usando tecnicas de codificacion de audio adicionales, produciendo de esta manera capas de codificacion adicionales o superiores.
El codificador de capa principal puede comprender un analizador de LPC 312 y cuantificador de LPC a LSF 314 como se ha descrito anteriormente para las representaciones eficaces de las correlaciones a corto plazo en la senal. El codificador de capa principal puede comprender tambien la funcionalidad para variar el orden de prediccion del analizador de LPC 312, y por lo tanto el numero de coeficientes de LP usados en cualquier etapa de prediccion de LPC posterior. Adicionalmente, el codificador de capa de principal puede estar dispuesto para recibir tramas de audio en las cuales la frecuencia de muestreo puede ser diferente a traves de diferentes tramas de audio.
El orden de prediccion del analizador de LPC 312 y el convertidor de LPC a LSF 314 puede seleccionarse de acuerdo con la frecuencia de muestreo de la trama de audio de entrada. En consecuencia, el codificador de capa principal puede observarse como que tiene diferentes modos de codificacion en los cuales el modo varia de acuerdo con frecuencia de muestreo de entrada.
En este ejemplo del primer grupo de realizaciones el modo de operacion del codificador de capa principal puede identificarse mediante el valor del coeficiente de LSF de orden mas alto. En consecuencia existe la ventaja de que no hay requisito de incorporar una indicacion del modo de codificacion de capa principal en el flujo de bits codificado.
Se ha de apreciar que el ejemplo anterior comprende un sub conjunto de los componentes de codificacion que pueden encontrarse en un codificador de capa principal. El codificador de capa principal puede tener componentes de codificacion adicionales tales como un predictor a largo plazo y una excitacion de libro de codigos secundaria que pueden estar adaptados tambien de acuerdo con la frecuencia de muestreo de la senal de audio de entrada.
Con referencia a la Figura 3, la salida del convertidor de LPC a LSF 314 puede pasarse a la entrada de un cuantificador de LSF 316.
El cuantificador de LSF puede mapear cada coeficiente de LSF para la trama de audio a una de una serie de valores cuantificados definidos finitos para producir un valor de LSF cuantificado. El valor de LSF cuantificado puede a continuacion referenciarse mediante un valor de indice. El valor de indice puede convertirse a continuacion a un numero binario para facilitar su almacenamiento y transmision.
Como se ha establecido anteriormente la posicion de frecuencia del coeficiente de LSF de orden mas alto puede ser dependiente de la frecuencia de muestreo de la trama de audio de entrada.
Adicionalmente, el intervalo de frecuencias dentro de las que el coeficiente de LSF de orden mas alto a una frecuencia de muestreo particular puede ser diferente al intervalo de frecuencias del coeficiente de LSF de orden mas alto a una frecuencia de muestreo adicional.
En otras palabras, el intervalo de frecuencias de un LSF de orden mas alto a una primera frecuencia de muestreo puede distinguirse del intervalo de frecuencias de un LSF de orden mas alto a una segunda frecuencia de muestreo.
5
10
15
20
25
30
35
40
45
50
55
En algunas realizaciones el cuantificador de LSF 316 puede configurarse para tener un limite de frecuencia inferior y superior para un coeficiente de LSF de orden mas alto para una tasa de muestreo particular. Los limites de frecuencia pueden comprobarse a continuacion cuando se produce el valor cuantificado del coeficiente de LSF de orden mas alto. Si tras la comprobacion, se determina que el LSF de orden mas alto cuantificado esta fuera de los limites de frecuencia superior e inferior para la tasa de muestreo particular, entonces el LSF de orden mas alto puede delimitarse para que radique dentro de dicho intervalo de frecuencia.
En algunas realizaciones la operacion de delimitacion anterior puede tomar la forma de reasignar el LSF de orden mas alto a un valor cuantificado que radica en el intervalo de frecuencia asignado para la tasa de muestreo particular. El LSF de orden mas alto puede reasignarse a un valor cuantificado basandose en que el valor seleccionado es el valor cuantificado en el intervalo de frecuencias para la tasa de muestreo, y si hay mas de dos intervalos de cuantificacion en este intervalo, entonces el valor de cuantificacion seleccionado puede ser el mas cercano al limite de frecuencia superado por el LSF de orden mas alto.
Por ejemplo, si el valor de LSF de orden mas alto cuantificado originalmente es mayor que el limite de frecuencia superior para la frecuencia de muestreo particular entonces el cuantificador de LSF 316 puede reasignar el LSF de orden mas alto al valor cuantificado que cumple tanto el criterio de estar dentro del intervalo de frecuencia como de ser el mas cercano al limite de frecuencia superior.
Como alternativa, el valor de coeficiente de LSF de orden mas alto cuantificado puede ser menor que el limite de frecuencia inferior para la frecuencia de muestreo particular. En este caso el cuantificador de LSF 316 puede reasignar el LSF de orden mas alto al valor cuantificado que cumple tanto el criterio de estar dentro del intervalo de frecuencia como de ser el mas cercano al limite de frecuencia inferior.
En algunas realizaciones el coeficiente de LSF de orden mas alto para una frecuencia de muestreo particular puede confinarse a un intervalo de frecuencia de acuerdo con la Tabla 1 a continuacion.
La Tabla 1 representa los limites de frecuencia alta y baja para el LSF de orden mas alto a diferentes frecuencias de
muestreo de la senal de audio de entrada.
Frecuencia de muestreo (Hz)
Limite de frecuencia inferior para LSF de orden mas alto (Hz) Limite de frecuencia superior para LSF de orden mas alto (Hz)
8000
2000 3950
12800
3950 6350
16000
6350 7950
25600
7950 12750
32000
12750 15950
48000
15950 23950
Se ha de entender que los limites de frecuencia alta y baja en la Tabla 1 se han determinado experimentalmente para proporcionar un resultado ventajoso.
Se ha de entender adicionalmente que los limites de frecuencia alta y baja para cada coeficiente de LSF de orden mas alto pueden seleccionarse de manera que los intervalos de frecuencia no solapen para diferentes frecuencias de muestreo.
Se ha de apreciar que la salida del cuantificador de LSF 316 puede ser los indices de cuantificacion de LSF para los coeficientes de LSF cuantificados de la trama de audio actual.
En otras palabras se proporcionan medios para cuantificar cada uno de al menos dos coeficientes de frecuencia espectral lineales para producir al menos dos coeficientes de frecuencia espectral lineales cuantificados, en el que un coeficiente de frecuencia espectral lineal cuantificado de orden mas alto de los al menos dos coeficientes de frecuencia espectral lineales cuantificados radica en un primer intervalo de frecuencia de al menos dos intervalos de frecuencia, en el que el primer intervalo de frecuencia esta asociado a la primera tasa de muestreo, y en el que el primer intervalo de frecuencia es distinguible de un segundo intervalo de frecuencia de los al menos dos intervalos de frecuencia, en el que el segundo intervalo de frecuencia esta asociado a una frecuencia espectral lineal cuantificada de orden mas alto para una trama de audio muestreada digitalmente a una segunda tasa de muestreo.
Con referencia a la Figura 3, tras la finalizacion de la cuantificacion de los coeficientes de LSF los indices de cuantificacion de LSF para la trama de audio actual pueden pasarse fuera del cuantificador de LSF 316 mediante la conexion 307.
Se ha de entender en las realizaciones que los indices de cuantificacion de LSF pueden combinarse con parametros de codificacion del habla o de audio adicionales.
En un primer grupo de realizaciones los indices de cuantificacion de LSF pueden formar parte del conjunto de parametros codificados de un codificador de capa principal. En otras palabras los indices de cuantificacion de LSF
5
10
15
20
25
30
35
40
45
50
55
60
65
pueden combinarse con otros parametros del habla o de audio codificados como parte del conjunto de parametros codificados de la capa principal. Adicionalmente, en el primer grupo de realizaciones el conjunto de parametros codificados de la capa principal puede combinarse con conjuntos de parametros codificados adicionales que estan relacionados con capas de codificacion superior de una estructura de codificacion del habla o de audio de tasa variable embebida.
Se ha de entender que la codificacion del audio o del habla de tasa variable embebida indica un esquema de codificacion de audio o del habla, en el que un flujo de bits resultante de la operacion de codificacion se distribuye en capas sucesivas. Una capa de base o principal que esta comprendida de datos codificados primarios generados mediante un codificador principal esta formada de los elementos binarios esenciales para la decodificacion del flujo binario, y determina una calidad minima de decodificacion. Las capas posteriores hacen posible mejorar progresivamente la calidad de la senal que surge desde la operacion de decodificacion, donde cada nueva capa proporciona nueva information. Una de las caracteristicas particulares de la codificacion basada en capas es la posibilidad ofrecida de intervenir en cualquier nivel sea cual sea la transmision o cadena de almacenamiento, para borrar una parte de flujo binario sin tener que incluir ninguna indication particular al decodificador.
En un primer grupo de realizaciones el codec de la capa principal puede basarse en la tecnologia de prediction lineal con excitation por codigo algebraico (ACELP).
La informacion codificada cuantificada puede a continuation enviarse a un formateador de flujo de bits para crear el flujo de bits de salida 112 desde el codificador 104.
El decodificador 108 puede recibir el flujo de senal codificada 112 que comprende al menos en parte informacion codificada que representa los indices de coeficientes de LSF cuantificados junto con otros parametros del habla o de audio codificados y emite una senal de audio reconstruida 114.
Las partes del decodificador 108 que implementan las realizaciones se muestran en la Figura 5.
Con referencia a la Figura 5, el decodificador comprende una entrada 502 mediante la cual puede recibirse el flujo de bits codificado 112. Como parte del flujo de bits recibido 112 puede haber indices de coeficientes de LSF cuantificados que forman parte del conjunto de parametros codificados para un decodificador del habla o de audio.
El decodificador del habla o de audio en las realizaciones puede estar dispuesto para operar a numero de muestras variables por trama de audio de salida y a frecuencia de muestreo de salida variable. En otras palabras, el decodificador 108 puede estar dispuesto para emitir una trama de una senal de audio reconstruida en la cual el numero de muestras y la tasa de muestreo de la trama pueden variarse de una trama a la siguiente.
Adicionalmente el decodificador 108 puede estar dispuesto para operar con un numero de diferentes modos de decodificacion, donde el modo de decodificacion usado puede ser dependiente de la frecuencia de muestreo de la trama de audio.
Aun mas, la tasa de bits del conjunto de parametros codificados puede ser diferente de acuerdo con el modo de codificacion usado mediante el codificador.
En algunas realizaciones el decodificador del habla o de audio puede ser un decodificador de capa principal cuya salida de audio reconstruida puede combinarse con salidas de senal de audio reconstruidas adicionales desde decodificadores de capa superior. Los bits de capa superior codificados pueden enviarse al decodificador junto con los correspondientes bits de capa principal codificados.
Con referencia a la Figura 5, los indices de LSF cuantificados recibidos como parte del flujo de bits codificado 112 pueden estar dispuestos para pasarse a la entrada de un decuantificador de LSF 510.
En otras palabras pueden proporcionarse medios para recibir un conjunto de parametros de audio codificados, en el que el conjunto comprende indices que representan al menos dos coeficientes de frecuencia espectral lineales cuantificados, en el que la trama de audio cuando se decodifica comprende muestras de audio muestreadas digitalmente a una frecuencia de muestreo, en el que la frecuencia de muestreo es una de una pluralidad de frecuencias de muestreo para un decodificador de audio.
En las realizaciones el decuantificador de LSF 510 puede estar configurado para convertir los indices de LSF cuantificados recibidos a coeficientes de LSF cuantificados.
Se ha de apreciar en las realizaciones que el decuantificador de LSF 510 puede producir un numero de coeficientes de LSF cuantificados para cada trama de audio. El numero de coeficientes de LSF cuantificados puede predeterminarse en el codificador como el orden de prediccion del analizador de LPC 312. Por ejemplo, en el caso del analizador de LPC 312 de un orden de prediccion de la magnitud 10, entonces el numero de coeficientes de LSF cuantificados producidos mediante el decuantificador de LSF 502 seria tambien diez.
5
10
15
20
25
30
35
40
45
50
55
60
65
En otras palabras se pueden proporcionar medios para convertir los mdices a los al menos dos coeficientes de frecuencia espectral lineales cuantificados.
En las realizaciones el decuantificador de LSF 502 puede estar dispuesto para comprobar el valor del LSF cuantificado de orden mas alto para determinar el modo de decodificacion.
En el primer grupo de realizaciones en las que la senal de audio de entrada se codifica desplegando un regimen de codificacion en capas, y donde el codec de capa principal puede operar a diferentes tasas de muestreo que corresponde a diferentes modos de codificacion. La tasa de muestreo particular y el modo de codificacion usado mediante el codec de capa principal pueden identificarse inspeccionando en primer lugar el valor del LSF de orden mas alto, y a continuacion asignando el valor a un intervalo de frecuencia particular.
En otras palabras, el modo de decodificacion de un decodificador multimodo puede determinarse mediante el valor del LSF de orden mas alto.
En un ejemplo del primer grupo de realizaciones en las que el codec de capa principal puede estar dispuesto para operar en uno de dos modos de operacion. El primer modo de operacion puede ser a una frecuencia de muestreo trama de audio de 12800 Hz, y el segundo modo de operacion puede ser a una frecuencia de muestreo de 16000 Hz. Con referencia a la Tabla 1, si el LSF cuantificado de orden mas alto recibido para una trama de audio se ha de determinar para que este en el intervalo de frecuencia de 3950 Hz a 6350 Hz entonces el modo de operacion del decodificador de capa principal puede ser el modo para decodificar los parametros de una trama de audio
muestreada a 12800 Hz. Sin embargo, si el LSF cuantificado de orden mas alto recibido para una trama de audio se
determina que esta en el intervalo de frecuencia de 6350 Hz a 7950 Hz entonces el modo de operacion del
decodificador de capa principal puede ser el modo para decodificar los parametros de una trama de audio
muestreada a 16000 Hz.
En otras palabras se proporcionan medios para determinar la frecuencia de muestreo para una trama de audio comprobando el valor de un coeficiente de frecuencia espectral lineal cuantificado de orden mas alto de los coeficientes de frecuencia espectral lineales cuantificados recibidos.
La comprobacion del valor del coeficiente de frecuencia espectral lineal cuantificado de orden mas alto puede comprender medios para comparar la comparacion del coeficiente de frecuencia espectral lineal cuantificado de orden mas alto con cada uno de una pluralidad de intervalos de frecuencia, en el que un primer intervalo de frecuencia de la pluralidad de intervalos de frecuencia esta asociado a una primera frecuencia de muestreo, y en el que un segundo intervalo de frecuencia de la pluralidad de intervalos de frecuencia esta asociado a una segunda frecuencia de muestreo;
medios para determinar la frecuencia de muestreo de la trama de audio para que sea la primera frecuencia de muestreo cuando el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto radica en el primer intervalo de frecuencia; y medios para determinar la frecuencia de muestreo de la trama de audio para que sea la segunda frecuencia de muestreo cuando el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto radica en el segundo intervalo de frecuencia.
Se ha de entender por lo tanto que el decuantificador de LSF 514 puede configurarse para tener dos salidas.
La primera salida puede estar dispuesta para estar conectada a la entrada de un convertidor de LSF a LPC 512 y puede comprender el conjunto de valores de coeficiente de LSF cuantificados.
La segunda salida del decuantificador de LSF 510 puede comprender la linea de senalizacion 504 que puede usarse para transportar el modo de codificacion y/o tasa de muestreo a componentes de decodificacion posteriores en el decodificador 108.
Se ha de entender en las realizaciones que el modo de operacion del decodificador puede ser dependiente de la tasa de muestreo de la trama de audio. Por lo tanto, la linea de senalizacion 504 puede transportar el modo de decodificacion llevando directamente el modo de codificacion o como alternativa la tasa de muestreo.
En las realizaciones los valores de coeficiente de LSF cuantificados pueden recibirse mediante el convertidor de LSF a LPC 512 y convertirse posteriormente a un conjunto de coeficientes de LP.
Para ayudar con el proceso de conversion el convertidor de LSF a LPC 512 puede estar dispuesto para recibir la linea de senalizacion 504 como una entrada adicional. La linea de senalizacion puede indicar la frecuencia de muestreo de la trama de audio codificado y por lo tanto determinar el orden del proceso de conversion de LSF a LPC.
Como alternativa, en otras realizaciones la linea de senalizacion puede llevar el modo de codificacion que puede usarse para determinar el orden del proceso de conversion de LSF a LPC.
5
10
15
20
25
30
35
40
45
50
55
60
65
El numero de elementos en el conjunto de coeficientes de LP sera equivalente al orden de prediction.
Se ha de entender que los coeficientes de LP producidos mediante el convertidor de LSF a LPC 512 corresponderan con una trama de audio de salida.
Se ha de entender adicionalmente que la salida del convertidor de LSF a LPC 512 puede usarse para decodificar adicionalmente componentes en el decodificador 108. Por ejemplo, los coeficientes de LP pueden usarse como los coeficientes de filtro para cualquier filtro de LP posterior.
Adicionalmente, la linea de senalizacion 504 puede usarse tambien mediante componentes de decodificacion adicionales para seleccionar el modo de decodificacion apropiado para los componentes de decodificacion adicionales en el decodificador 108.
Los componentes de decodificacion del decodificador 108 pueden formar a continuation la senal de audio de salida 114.
Aunque los ejemplos anteriores describen realizaciones de la invention que operan en un codec en un aparato 10, deberia apreciarse que la invencion como se describe a continuacion puede implementarse como parte de cualquier codec de audio (o del habla), incluyendo cualquier codec de audio (o del habla) de tasa variable/tasa adaptativa. Por lo tanto, por ejemplo, las realizaciones de la invencion pueden implementarse en un codec de audio que puede implementar codification de audio a traves de trayectorias de comunicacion fijas o cableadas.
Por lo tanto el equipo de usuario puede comprender un codec de audio tal como aquellos descritos en las realizaciones de la invencion anterior.
Debera apreciarse que el termino equipo de usuario se pretende para cubrir cualquier tipo de equipo de usuario inalambrico, tal como telefonos moviles, dispositivos de procesamiento de datos portatiles o exploradores web portatiles.
Elementos adicionales de una red movil terrestre publica (PLMN) pueden comprender tambien codec de audio como se ha descrito anteriormente.
En general, las diversas realizaciones de la invencion pueden implementarse en hardware o circuitos de fin especial, software, logica o cualquier combination de los mismos. Por ejemplo, algunos aspectos pueden implementarse en hardware, mientras otros aspectos pueden implementarse en firmware o software que puede ejecutarse mediante un controlador, microprocesador u otro dispositivo informatico, aunque la invencion no esta limitada a lo mismo. Aunque pueden ilustrarse y describirse diversos aspectos de la invencion como diagramas de bloques, diagramas de flujo, o usando alguna otra representation grafica, es bien entendido que estos bloques, aparatos, sistemas, tecnicas o metodos descritos en el presente documento pueden implementarse en, como ejemplos no limitantes, hardware, software, firmware, circuitos o logica de fin especial, hardware o controlador de fin general u otros dispositivos informaticos, o alguna combinacion de los mismos.
Por lo tanto al menos algunas realizaciones del codificador pueden ser un aparato que comprende al menos un procesador y al menos una memoria que incluye codigo de programa informatico, la al menos una memoria y el codigo de programa informatico configurados para, con el al menos un procesador, provocar que el aparato al menos realice: determinar al menos dos coeficientes de prediccion lineal para una trama de audio muestreada digitalmente a una primera tasa de muestreo; convertir los al menos dos coeficientes de prediccion lineal a al menos dos coeficientes de frecuencia espectral lineales; y cuantificar cada uno de los al menos dos coeficientes de frecuencia espectral lineales para producir al menos dos coeficientes de frecuencia espectral lineales cuantificados, en el que un coeficiente de frecuencia espectral lineal cuantificado de orden mas alto de los al menos dos coeficientes de frecuencia espectral lineales cuantificados radican en un primer intervalo de frecuencia de al menos dos intervalos de frecuencia, en el que el primer intervalo de frecuencia esta asociado a la primera tasa de muestreo, y en el que el primer intervalo de frecuencia es distinguible de un segundo intervalo de frecuencia de los al menos dos intervalos de frecuencia, en el que el segundo intervalo de frecuencia esta asociado a una frecuencia espectral lineal cuantificada de orden mas alto para una trama de audio muestreada digitalmente a una segunda tasa de muestreo.
En algunas realizaciones del decodificador puede haber un aparato que comprende al menos un procesador y al menos una memoria que incluye codigo de programa informatico la al menos una memoria y el codigo de programa informatico configurados para, con el al menos un procesador, provocar que el aparato al menos realice: recibir, un conjunto de parametros de audio codificado para una trama de audio, en el que el conjunto comprende indices que representan al menos dos coeficientes de frecuencia espectral lineales cuantificados, en el que la trama de audio cuando se decodifica comprende muestras de audio muestreadas digitalmente a una frecuencia de muestreo, en el que la frecuencia de muestreo es una de una pluralidad de frecuencias de muestreo para un decodificador de audio; convertir los indices a los al menos dos coeficientes de frecuencia espectral lineales cuantificados; y determinar la frecuencia de muestreo para la trama de audio comprobando el valor de un coeficiente de frecuencia espectral lineal
5
10
15
20
25
30
35
40
45
50
55
60
65
cuantificado de orden mas alto de los al menos dos coeficientes de frecuencia espectral lineales cuantificados.
Las realizaciones de esta invencion pueden implementarse mediante software informatico ejecutable mediante un procesador de datos del dispositivo movil, tal como en la entidad de procesador, o mediante hardware, o mediante una combination de software y hardware. Ademas en este sentido deberia indicarse que cualquier bloque del flujo logico como en las figuras puede representar etapas de programa, o circuitos, bloques y funciones logicos interconectados, o una combinacion de etapas de programa y circuitos, bloques y funciones logicos.
Por tanto al menos algunas realizaciones del codificador pueden ser un medio de almacenamiento legible por ordenador no transitorio que tiene almacenado en el mismo informatica legible, que, cuando se ejecuta mediante un aparato informatico, provoca que el aparato informatico realice un metodo que comprende: determinar al menos dos coeficientes de prediction lineal para una trama de audio muestreada digitalmente a una primera tasa de muestreo; convertir los al menos dos coeficientes de prediccion lineal a al menos dos coeficientes de frecuencia espectral lineales; y cuantificar cada uno de los al menos dos coeficientes de frecuencia espectral lineales para producir al menos dos coeficientes de frecuencia espectral lineales cuantificados, en el que un coeficiente de frecuencia espectral lineal cuantificado de orden mas alto de los al menos dos coeficientes de frecuencia espectral lineales cuantificados radica en un primer intervalo de frecuencia de al menos dos intervalos de frecuencia, en el que el primer intervalo de frecuencia esta asociado a la primera tasa de muestreo, y en el que el primer intervalo de frecuencia es distinguible de un segundo intervalo de frecuencia de los al menos dos intervalos de frecuencia, en el que el segundo intervalo de frecuencia esta asociado a una frecuencia espectral lineal cuantificada de orden mas alto para una trama de audio muestreada digitalmente a una segunda tasa de muestreo.
Adicionalmente al menos algunas de las realizaciones del decodificador pueden proporcionarse en un medio de almacenamiento legible por ordenador no transitorio que tiene almacenado en el mismo codigo legible por ordenador, que, cuando se ejecuta mediante un aparato informatico, provoca que el aparato informatico realice un metodo que comprende: recibir, un conjunto de parametros de audio codificado para una trama de audio, en el que el conjunto comprende indices que representan al menos dos coeficientes de frecuencia espectral lineales cuantificados, en el que la trama de audio cuando se decodifica comprende muestras de audio muestreadas digitalmente a una frecuencia de muestreo, en el que la frecuencia de muestreo es una de una pluralidad de frecuencias de muestreo para un decodificador de audio; convertir los indices a los al menos dos coeficientes de frecuencia espectral lineales cuantificados; y determinar la frecuencia de muestreo para la trama de audio comprobando el valor de un coeficiente de frecuencia espectral lineal cuantificado de orden mas alto de los al menos dos coeficientes de frecuencia espectral lineales cuantificados.
La memoria puede ser de cualquier tipo adecuado al entorno tecnico local y puede implementarse usando cualquier tecnologia de almacenamiento de datos, tal como dispositivos de memoria basados en semiconductores, dispositivos y sistemas de memoria magnetica, dispositivos y sistemas de memoria optica, memoria fija y memoria extraible, en otras palabras un medio de almacenamiento legible por ordenador no transitorio. Los procesadores de datos pueden ser de cualquier tipo adecuado al entorno tecnico local, y pueden incluir uno o mas de ordenadores de fin general, ordenadores de fin especial, microprocesadores, procesadores de senales digitales (DSP), circuitos integrados especificos de la aplicacion (ASIC), circuitos de nivel de puertas y procesadores basados en arquitectura de procesador multi-nucleo, como ejemplos no limitantes.
Las realizaciones de las invenciones pueden ponerse en practica en diversos componentes tales como modulos de circuitos integrados. El diseno de circuitos integrados es en terminos generales un proceso altamente automatizado. Estan disponibles herramientas de software complejas y potentes para convertir un diseno de nivel logico en un diseno de circuito de semiconductores para grabarse y formarse en un sustrato de semiconductor.
Programas, tales como aquellos proporcionados mediante Synopsys, Inc. de Mountain View, California y Cadence Design, de San Jose, California encaminan automaticamente los conductores y localizan componentes en un chip de semiconductores usando reglas de diseno bien establecidas asi como bibliotecas de modulos de diseno pre- almacenados. Una vez que se ha completado el diseno para un circuito de semiconductores, el diseno resultante, en un formato electronico normalizado (por ejemplo, Opus, GDSII, o similares) puede transmitirse a una instalacion de fabrication de semiconductores o “laboratorio de fabrication” para la fabrication.
Como se usa en esta solicitud, el termino ‘circuiteria' se refiere a todo lo siguiente:
(a) implementaciones de circuitos de hardware unicamente (tales como implementaciones en circuiteria unicamente analogica y/o digital) y
(b) a combinaciones de circuitos y software (y/o firmware), tales como: (i) a una combinacion de procesador o procesadores o (ii) a porciones de procesador o procesadores/software (incluyendo procesador o procesadores de senales digitales), software, y memoria memorias que funcionan juntos para provocar que un aparato, tal como un telefono movil o servidor, realice diversas funciones y
(c) a circuitos, tales como un microprocesador o microprocesadores o una portion de un microprocesador o microprocesadores, que requieren software o firmware para operation, incluso si el software o firmware no esta fisicamente presente.
Esta definicion de ‘circuited se aplica a todos los usos de este termino en esta solicitud, incluyendo cualquier reivindicacion. Como un ejemplo adicional, como se usa en esta solicitud, el termino ‘circuiteria' cubriria tambien una implementacion de meramente un procesador (o multiples procesadores) o porcion de un procesador y sus (o su) software y/o firmware adjunto. El termino ‘circuiteria' cubriria tambien, por ejemplo y si fuera aplicable al elemento de 5 reivindicacion particular, un circuito integrado de banda base o circuito integrado de procesador de aplicaciones para un telefono movil o circuito integrado similar en servidor, un dispositivo de red celular u otro dispositivo de red.
La description anterior ha proporcionado a modo de ejemplos ejemplares y no limitantes una description completa e informativa de la realization ejemplar de esta invention. Sin embargo, diversas modificaciones y adaptaciones 10 pueden hacerse evidentes para los expertos en la materia en las tecnicas relevantes en vista de la anterior descripcion, cuando se lee en conjunto con los dibujos adjuntos y las reivindicaciones adjuntas. Sin embargo, el alcance de esta invencion se define en las reivindicaciones adjuntas.

Claims (10)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    1. Un metodo que comprende:
    recibir, un conjunto de parametros de audio codificado para una trama de audio, en donde el conjunto comprende indices que representan al menos dos coeficientes de frecuencia espectral lineales cuantificados, en donde la trama de audio cuando se decodifica comprende muestras de audio muestreadas digitalmente a una frecuencia de muestreo, en donde la frecuencia de muestreo es una de una pluralidad de frecuencias de muestreo para un decodificador de audio;
    convertir los indices a los al menos dos coeficientes de frecuencia espectral lineales cuantificados; y determinar la frecuencia de muestreo para la trama de audio comprobando el valor de un coeficiente de frecuencia espectral lineal cuantificado de orden mas alto de los al menos dos coeficientes de frecuencia espectral lineales cuantificados.
  2. 2. El metodo de acuerdo con la reivindicacion 1, en el que la comprobacion del valor del coeficiente de frecuencia espectral lineal cuantificado de orden mas alto comprende:
    comparar el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto con cada uno de una pluralidad de intervalos de frecuencia, en donde un primer intervalo de frecuencia de la pluralidad de intervalos de frecuencia esta asociado a una primera frecuencia de muestreo, y en donde un segundo intervalo de frecuencia de la pluralidad de intervalos de frecuencia esta asociado a una segunda frecuencia de muestreo; determinar la frecuencia de muestreo de la trama de audio para que sea la primera frecuencia de muestreo cuando el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto esta en el primer intervalo de frecuencia; y
    determinar la frecuencia de muestreo de la trama de audio para que sea la segunda frecuencia de muestreo cuando el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto esta en el segundo intervalo de frecuencia.
  3. 3. El metodo de acuerdo con la reivindicacion 2, en el que el primer intervalo de frecuencia de la pluralidad de intervalos de frecuencia abarca las frecuencias entre un primer limite de baja frecuencia y un primer limite de alta frecuencia, y en donde el segundo intervalo de frecuencia de la pluralidad de intervalos de frecuencia abarca las frecuencias entre un segundo limite de baja frecuencia y un segundo limite de alta frecuencia, y en donde las frecuencias abarcadas por el primer intervalo de frecuencia son diferentes del intervalo de frecuencias abarcado por el segundo intervalo de frecuencia.
  4. 4. El metodo de acuerdo con las reivindicaciones 1 a 3, en el que cada una de la pluralidad de frecuencias de muestreo esta asociada cada una a uno de una pluralidad de diferentes modos de operacion del decodificador de audio, y en donde la frecuencia de muestreo determinada de la trama de audio esta asociada a uno de la pluralidad de diferentes modos de operacion del decodificador de audio.
  5. 5. El metodo de acuerdo con las reivindicaciones 3 y 4, en el que la pluralidad de frecuencias de muestreo comprende 12,8 kHz y 16 kHz, en donde el intervalo de frecuencia para la frecuencia de muestreo de 12,8 kHz tiene un limite de baja frecuencia de 3950 Hz y un limite de alta frecuencia de 6350 Hz, y en donde el intervalo de frecuencia para la frecuencia de muestreo de 16 kHz tiene un limite de baja frecuencia de 6350 Hz y un limite de alta frecuencia de 7950 Hz respectivamente.
  6. 6. Un aparato que comprende:
    medios para recibir un conjunto de parametros de audio codificado para una trama de audio, en donde el conjunto comprende indices que representan al menos dos coeficientes de frecuencia espectral lineales cuantificados, en donde la trama de audio cuando se decodifica comprende muestras de audio muestreadas digitalmente a una frecuencia de muestreo, en donde la frecuencia de muestreo es una de una pluralidad de frecuencias de muestreo para un decodificador de audio;
    medios para convertir los indices a los al menos dos coeficientes de frecuencia espectral lineales cuantificados; y medios para determinar la frecuencia de muestreo para la trama de audio teniendo medios para comprobar el valor de un coeficiente de frecuencia espectral lineal cuantificado de orden mas alto de los al menos dos coeficientes de frecuencia espectral lineales cuantificados.
  7. 7. El aparato de acuerdo con la reivindicacion 6, en el que los medios para comprobar el valor del coeficiente de frecuencia espectral lineal cuantificado de orden mas alto comprenden:
    medios para comparar el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto con cada uno de una pluralidad de intervalos de frecuencia, en donde un primer intervalo de frecuencia de la pluralidad de intervalos de frecuencia esta asociado a una primera frecuencia de muestreo, y en donde un segundo intervalo de frecuencia de la pluralidad de intervalos de frecuencia esta asociado a una segunda frecuencia de muestreo; medios para determinar la frecuencia de muestreo de la trama de audio para que sea la primera frecuencia de
    muestreo cuando el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto esta en el primer intervalo de frecuencia; y
    medios para determinar la frecuencia de muestreo de la trama de audio para que sea la segunda frecuencia de muestreo cuando el coeficiente de frecuencia espectral lineal cuantificado de orden mas alto esta en el segundo 5 intervalo de frecuencia.
  8. 8. El aparato de acuerdo con la reivindicacion 7, en el que el primer intervalo de frecuencia de la pluralidad de intervalos de frecuencias abarca las frecuencias entre un primer limite de baja frecuencia y un primer limite de alta frecuencia, en donde el segundo intervalo de frecuencia de la pluralidad de intervalos de frecuencia abarca las
    10 frecuencias entre un segundo limite de baja frecuencia y un segundo limite de alta frecuencia, y en donde las frecuencias abarcadas por el primer intervalo de frecuencia son diferentes del intervalo de frecuencias abarcado por el segundo intervalo de frecuencia.
  9. 9. El aparato de acuerdo con las reivindicaciones 6 a 8, en el que cada una de la pluralidad de frecuencias de 15 muestreo esta asociada cada una a uno de una pluralidad de diferentes modos de operacion del decodificador de
    audio, y en donde la frecuencia de muestreo determinada de la trama de audio esta asociada a uno de la pluralidad de diferentes modos de operacion del decodificador de audio.
  10. 10. El aparato de acuerdo con las reivindicaciones 8 y 9, en el que la pluralidad de frecuencias de muestreo 20 comprende 12,8 kHz y 16 kHz, en donde el intervalo de frecuencia para la frecuencia de muestreo de 12,8 kHz tiene
    un limite de baja frecuencia de 3950 Hz y un limite de alta frecuencia de 6350 Hz, y en donde el intervalo de frecuencia para la frecuencia de muestreo de 16 kHz tiene un limite de baja frecuencia de 6350 Hz y un limite de alta frecuencia de 7950 Hz respectivamente.
ES11875412.6T 2011-11-10 2011-11-10 Un método y un aparato para detectar tasa de muestreo de audio Active ES2575693T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FI2011/050998 WO2013068634A1 (en) 2011-11-10 2011-11-10 A method and apparatus for detecting audio sampling rate

Publications (1)

Publication Number Publication Date
ES2575693T3 true ES2575693T3 (es) 2016-06-30

Family

ID=48288584

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11875412.6T Active ES2575693T3 (es) 2011-11-10 2011-11-10 Un método y un aparato para detectar tasa de muestreo de audio

Country Status (5)

Country Link
US (1) US9542149B2 (es)
EP (1) EP2777041B1 (es)
ES (1) ES2575693T3 (es)
PL (1) PL2777041T3 (es)
WO (1) WO2013068634A1 (es)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9589570B2 (en) 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
EP4336500A3 (en) * 2014-04-17 2024-04-03 VoiceAge EVS LLC Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
KR102244612B1 (ko) 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
KR101920297B1 (ko) * 2014-04-25 2018-11-20 가부시키가이샤 엔.티.티.도코모 선형 예측 계수 변환 장치 및 선형 예측 계수 변환 방법
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
KR102480710B1 (ko) 2016-09-28 2022-12-22 후아웨이 테크놀러지 컴퍼니 리미티드 다중 채널 오디오 신호 처리 방법, 장치 및 시스템
CN111341302B (zh) * 2020-03-02 2023-10-31 苏宁云计算有限公司 一种语音流采样率确定方法及装置
CN114067814B (zh) * 2022-01-18 2022-04-12 北京百瑞互联技术有限公司 基于蓝牙音频接收器的啸叫检测和抑制方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2111290C (en) * 1993-12-13 1997-09-23 Hughes Electronics Corporation Robust vector quantization of line spectral frequencies
US5774849A (en) * 1996-01-22 1998-06-30 Rockwell International Corporation Method and apparatus for generating frame voicing decisions of an incoming speech signal
JP4308345B2 (ja) 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
GB0326262D0 (en) 2003-11-11 2003-12-17 Nokia Corp Speech codecs
RU2007108288A (ru) 2004-09-06 2008-09-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство масштабируемого кодирования и способ масштабируемого кодирования
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter

Also Published As

Publication number Publication date
EP2777041A1 (en) 2014-09-17
US20140330415A1 (en) 2014-11-06
PL2777041T3 (pl) 2016-09-30
WO2013068634A1 (en) 2013-05-16
EP2777041A4 (en) 2015-07-08
US9542149B2 (en) 2017-01-10
EP2777041B1 (en) 2016-05-04

Similar Documents

Publication Publication Date Title
ES2575693T3 (es) Un método y un aparato para detectar tasa de muestreo de audio
ES2339257T3 (es) Procedimiento y aparato para la codificacion/decodificacion de audio sin perdida.
ES2797525T3 (es) Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC
US11721349B2 (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
ES2639747T3 (es) Dispositivo y método para cuantificar filtros de LPC en una súper-trama
ES2508590T3 (es) Método de codificación, método de decodificación, aparato codificador, aparato decodificador, programa y medio de grabación
ES2558508T3 (es) Método de codificación, codificador, método de determinación de la cantidad de una característica periódica, aparato de determinación de la cantidad de una característica periódica, programa y medio de grabación
KR100718712B1 (ko) 복호장치와 방법 및 프로그램 제공매체
ES2705223T3 (es) Un método y aparato para cuantificación de vector flexible
ES2618258T3 (es) Sistemas y procedimientos para realizar el control de ganancia
US20080027719A1 (en) Systems and methods for modifying a window with a frame associated with an audio signal
BRPI0518004B1 (pt) Método para codificar um sinal de fala, dispositivo de codificação, decodificador e sistema de comunicação
JP2011528134A (ja) 音声/オーディオ統合信号の符号化/復号化装置
ES2657802T3 (es) Decodificación de audio basada en una representación eficiente de coeficientes autoregresivos
US20160111100A1 (en) Audio signal encoder
ES2911515T3 (es) Codificación de audio
ES2946235T3 (es) Codificador de señal de audio estéreo
US20100292986A1 (en) encoder
US20160064004A1 (en) Multiple channel audio signal encoder mode determiner
US9620139B2 (en) Adaptive linear predictive coding/decoding
US10580416B2 (en) Bit error detector for an audio signal decoder
US20140114653A1 (en) Pitch estimator
ES2786198T3 (es) Codificador de señal de audio