ES2952973T3 - Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal - Google Patents

Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal Download PDF

Info

Publication number
ES2952973T3
ES2952973T3 ES19204786T ES19204786T ES2952973T3 ES 2952973 T3 ES2952973 T3 ES 2952973T3 ES 19204786 T ES19204786 T ES 19204786T ES 19204786 T ES19204786 T ES 19204786T ES 2952973 T3 ES2952973 T3 ES 2952973T3
Authority
ES
Spain
Prior art keywords
weighting function
coefficient
subframe
frequency
lsf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19204786T
Other languages
English (en)
Inventor
Ho Sang Sung
Eun-Mi Oh
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of ES2952973T3 publication Critical patent/ES2952973T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/15Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Un método de determinación de la función de ponderación incluye obtener un coeficiente de frecuencia espectral de línea (LSF) o un coeficiente de frecuencia espectral de inmitancia (ISF) a partir de un coeficiente de codificación predictiva lineal (LPC) de una señal de entrada y determinar una función de ponderación combinando una primera función de ponderación basada en información de análisis espectral y una segunda función de ponderación basada en información de posición del coeficiente LSF o el coeficiente ISF. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal
Campo técnico
Una o más realizaciones ejemplares se refieren a un aparato y procedimiento de determinación de la función de ponderación, por lo tanto, la importancia de un coeficiente de codificación predictiva lineal (LPC) puede reflejarse con mayor precisión para cuantificar el coeficiente LPC, y un aparato y procedimiento de cuantificación que utiliza el mismo.
Técnica antecedente
En la técnica relacionada, la codificación predictiva lineal se ha aplicado para codificar una señal de voz y una señal de audio. Se ha empleado una tecnología de codificación de predicción lineal excitada por código (CELP) para la predicción lineal. La tecnología de codificación CELP puede utilizar una señal de excitación y un coeficiente de codificación predictiva lineal (LPC) con respecto a una señal de entrada. Cuando se codifica la señal de entrada, el coeficiente LPC se puede cuantificar. Sin embargo, la cuantificación del LPC puede tener un intervalo dinámico estrecho y puede tener dificultades en la verificación de una estabilidad.
Además, se puede seleccionar un índice de libro de códigos para reconstruir una señal de entrada en una etapa de decodificación. Cuando todos los coeficientes LPC se cuantifican con la misma importancia, se puede producir un deterioro en la calidad de la señal de entrada sintetizada finalmente. Es decir, dado que todos los coeficientes LPC tienen una importancia diferente, la calidad de la señal de entrada puede mejorar cuando el error de un coeficiente LPC importante es pequeño. Sin embargo, cuando se realiza la cuantificación aplicando la misma importancia sin tener en cuenta que los coeficientes LPC tienen una importancia diferente, la calidad de la señal de entrada puede deteriorarse.
En consecuencia, se necesita un procedimiento que cuantifique eficazmente un coeficiente LPC y mejore la calidad de una señal sintetizada al reconstruir una señal de entrada utilizando un decodificador. Además, se desea una tecnología que pueda tener un excelente rendimiento de codificación en una complejidad similar.
Se conoce de acuerdo con la solicitud de patente WO2012/053798A2 un procedimiento y aparato para determinar una función de ponderación para cuantificar un coeficiente de codificación predictiva lineal.
Divulgación
Problema Técnico
Una o más realizaciones ejemplares incluyen un aparato y un procedimiento de determinación de la función de ponderación, los cuales reflejan con mayor precisión la importancia de un coeficiente LPC para cuantificar el coeficiente LPC, y un aparato y un procedimiento de cuantificación que utiliza el mismo.
Solución técnica
La invención proporciona un procedimiento de acuerdo con la reivindicación 1, un aparato de acuerdo con la reivindicación 6 y un medio de almacenamiento no transitorio legible por ordenador de acuerdo con la reivindicación 11. Las realizaciones preferentes se definen por las reivindicaciones dependientes.
Efectos ventajosos
De acuerdo con una realización ejemplar, es posible mejorar la eficiencia de cuantificación de un coeficiente LPC convirtiendo el coeficiente LPC en un coeficiente LSF y, por lo tanto, cuantificando el coeficiente LSF.
De acuerdo con una realización ejemplar, es posible mejorar la calidad de una señal sintetizada en base a la importancia de un coeficiente LPC determinando una función de ponderación asociada con la importancia del coeficiente LPC.
De acuerdo con una realización ejemplar, no cubierta por la invención reivindicada, es posible mejorar una calidad de una señal sintetizada con unos pocos bits cuantificando un parámetro de ponderación para obtener un promedio ponderado entre el coeficiente LPC cuantificado de una trama actual y el coeficiente LPC cuantificado de una trama anterior, en lugar de cuantificar directamente un coeficiente LPC de una subtrama media.
De acuerdo con una realización ejemplar, es posible mejorar una eficiencia de cuantificación de un coeficiente LPC, e inducir con precisión una ponderación del coeficiente LPC combinando una función de ponderación de magnitud, una función de ponderación de frecuencia y una función de ponderación en base a información de posición del coeficiente LSF.
La función de ponderación de magnitud indica que un LSF afecta sustancialmente a una envolvente espectral de una señal de entrada. La función de ponderación de frecuencia puede utilizar una característica de percepción en un dominio de frecuencia y una distribución de formantes.
Breve descripción de los dibujos
Estos y/u otros aspectos serán evidentes y se apreciarán más fácilmente a partir de la siguiente descripción de las realizaciones ejemplares, tomadas en conjunto con los dibujos adjuntos en los cuales:
La Figura 1 ilustra una configuración de un aparato de codificación de la señal de audio de acuerdo con una realización ejemplar;
La Figura 2 ilustra una configuración de un cuantificador de coeficientes de codificación predictiva lineal (LPC) de acuerdo con una realización ejemplar;
La Figura 3 ilustra un procedimiento de cuantificación de un coeficiente LPC de acuerdo con una realización ejemplar;
La Figura 4 ilustra un procedimiento de determinación, mediante una unidad de determinación de la función de ponderación de la Figura 2, una función de ponderación de acuerdo con una realización ejemplar;
La Figura 5 ilustra un procedimiento de determinación de una función de ponderación en base a un modo de codificación e información de ancho de banda de una señal de entrada de acuerdo con una realización ejemplar;
La Figura 6 ilustra una frecuencia espectral de inmitancia (ISF) obtenida mediante la conversión de un coeficiente LPC de acuerdo con una realización ejemplar (no cubierta por la invención reivindicada);
La Figura 7 ilustra una función de ponderación en base a un modo de codificación de acuerdo con una realización ejemplar;
La Figura 8 ilustra un procedimiento de determinación, mediante la unidad de determinación de la función de ponderación de la Figura 2, una función de ponderación de acuerdo con otra realización ejemplar;
La Figura 9 es un diagrama para describir un esquema de codificación LPC en una subtrama media, de acuerdo con una realización ejemplar;
La Figura 10 es un diagrama de bloques que ilustra una configuración de un aparato de determinación de la función de ponderación de acuerdo con una realización de la invención reivindicada;
La Figura 11 es un diagrama de bloques que ilustra una configuración detallada de un primer generador de la función de ponderación de la Figura 10 de acuerdo con una realización ejemplar; y
La Figura 12 es un diagrama que ilustra una operación de determinación de una función de ponderación utilizando un modo de codificación e información de ancho de banda de una señal de entrada, de acuerdo con una realización ejemplar.
Modo para la invención
Ahora se hará referencia en detalle a las realizaciones ejemplares, cuyos ejemplos se ilustran en los dibujos adjuntos, en los que los números de referencia similares se refieren a elementos similares a lo largo de todo. En este sentido, las presentes realizaciones ejemplares pueden tener diferentes formas y no se deben interpretar como limitadas a las descripciones expuestas en la presente memoria. En consecuencia, las realizaciones ejemplares se describen simplemente más adelante, con referencia a las figuras, para explicar aspectos de la presente descripción. Los números de referencia similares se refieren a elementos similares a lo largo de todo.
La Figura 1 ilustra una configuración de un aparato 100 de codificación de la señal de audio de acuerdo con una realización ejemplar.
Con referencia a la Figura 1, el aparato 100 de codificación de la señal de audio puede incluir una unidad 101 de preprocesamiento, un analizador 102 de espectro, una unidad 103 de extracción de coeficientes de codificación predictiva lineal (LPC) y de análisis de tono de bucle abierto, un selector 104 de modo de codificación, un cuantificador 105 de coeficiente LPC, un codificador 106, una unidad 107 de recuperación de error, y un generador 108 de flujo de bits. El aparato 100 de codificación de la señal de audio puede aplicarse a una señal de voz o a un contenido dominado por voz. Además, en algunas configuraciones de bitrates bajos, el aparato 100 de codificación de la señal de audio se puede aplicar al audio genérico.
La unidad 101 de preprocesamiento puede preprocesar una señal de entrada. A través del preprocesamiento, se puede completar una preparación de la señal de entrada para la codificación. De manera específica, la unidad 101 de preprocesamiento puede preprocesar la señal de entrada a través del filtrado de paso alto, preénfasis, y conversión de muestreo.
El analizador 102 de espectro puede analizar una característica de la señal de entrada en un dominio de frecuencia a través de un procedimiento de mapeo de tiempo a frecuencia. El analizador 102 de espectro puede determinar si la señal de entrada es una señal activa o muda a través de un procedimiento de detección de actividad de voz. El analizador 102 de espectro puede eliminar el ruido de fondo en la señal de entrada.
La unidad 103 de extracción de coeficientes LPC y de análisis de tono de bucle abierto puede extraer un coeficiente LPC a través de un análisis de predicción lineal de la señal de entrada. El coeficiente LPC puede indicar una envolvente espectral. En general, el análisis de predicción lineal se realiza una vez por trama, sin embargo, se puede realizar al menos dos veces para una mejora adicional en la calidad del sonido. En este caso, se puede realizar una predicción lineal para un final de trama que es un análisis de predicción lineal existente durante un tiempo, y se puede realizar adicionalmente una predicción lineal para una subtrama media para una mejora de la calidad del sonido durante un tiempo restante. Un final de trama de una trama actual indica una última subtrama entre las subtramas que constituyen la trama actual, un final de trama de una trama anterior indica una última subtrama entre las subtramas que constituyen la última trama.
Una subtrama media indica al menos una subtrama presente entre las subtramas entre la última subtrama que es el final de trama de la trama anterior y la última subtrama que es el final de trama de la trama actual. En consecuencia, la unidad 103 de extracción de coeficientes LPC y de análisis de tono de bucle abierto puede extraer un total de al menos dos conjuntos de coeficientes LPC.
La unidad 103 de extracción de coeficientes LPC y de análisis de tono de bucle abierto puede analizar un tono de la señal de entrada a través de un bucle abierto. La información de tono analizada se puede utilizar para buscar un libro de códigos adaptativo.
El selector 104 de modo de codificación puede seleccionar un modo de codificación de la señal de entrada en base a información de tono, información de análisis en el dominio de la frecuencia, y similares. En una realización ejemplar, la señal de entrada puede codificarse en base al modo de codificación que se clasifica en un modo genérico, un modo con voz, un modo sin voz, o un modo de transición. Como otra realización ejemplar, se puede utilizar una codificación de excitación diferente para codificar tramas de voz con o sin voz, tramas de audio, tramas inactivas, etc.
El cuantificador 105 de coeficiente LPC puede cuantificar un coeficiente LPC extraído por la unidad 103 de extracción de coeficientes LPC y de análisis de tono de bucle abierto. El cuantificador 105 de coeficiente LPC se describirá con más detalle con referencia a la Figura 2 a través de la Figura 12
El codificador 106 puede codificar una señal de excitación del coeficiente LPC en base al módulo de codificación seleccionado. Los parámetros para codificar la señal de excitación del coeficiente LPC pueden incluir un índice de libro de códigos adaptativo, un libro de códigos adaptativo de nuevo, un índice de libro de códigos fijo, una ganancia de libro de códigos fija, y similares. El codificador 106 puede codificar la señal de excitación del coeficiente LPC en unidades de una subtrama.
Cuando hay una trama de error o una trama perdida en la señal de entrada, la unidad 107 de recuperación de error puede generar información lateral para reconstruir u ocultar la trama de error o la trama perdida para una mejora total de la calidad del sonido.
El generador 108 de flujo de bits puede generar un flujo de bits utilizando la señal codificada. En este caso, el flujo de bits se puede utilizar para el almacenamiento o transmisión.
La Figura 2 ilustra una configuración de un cuantificador de coeficiente LPC de acuerdo con una realización ejemplar.
Con referencia a la Figura 2, se puede realizar un procedimiento de cuantificación que incluya dos operaciones. Una operación se refiere a la realización de una predicción lineal para un final de trama de una trama actual o de una trama anterior. Otra operación se refiere a la realización de una predicción lineal para una subtrama media para mejorar la calidad del sonido.
Un cuantificador 200 de coeficiente LPC con respecto al final de trama de la trama actual o de la trama anterior incluye un primer convertidor 202 de coeficiente, una unidad 203 de determinación de la función de ponderación, un cuantificador 204, y un segundo convertidor 205 de coeficiente.
El primer convertidor 202 de coeficiente convierte un coeficiente LPC que se extrae realizando un análisis de predicción lineal del final de trama de la trama actual o de la trama anterior de la señal de entrada. Por ejemplo, el primer convertidor 202 de coeficiente puede convertir, a un formato de uno de un coeficiente de frecuencia espectral de línea (LSF) (de acuerdo con la invención) y un coeficiente de frecuencia espectral de inmitancia (ISF) (no cubierto por la invención reivindicada); el coeficiente LPC con respecto al final de trama de la trama actual o de la trama anterior. El coeficiente ISF o el coeficiente LSF indican un formato que puede cuantificar más fácilmente el coeficiente LPC.
La unidad 203 de determinación de la función de ponderación determina una función de ponderación asociada con una importancia del coeficiente LPC con respecto al final de trama de la trama actual y el final de trama de la trama anterior, en base al coeficiente ISF o al coeficiente LSF convertido a partir del coeficiente LPC. En una realización ejemplar, la unidad 203 de determinación de la función de ponderación determina una función de ponderación de magnitud y una función de ponderación de frecuencia. Además, la unidad 203 de determinación de la función de ponderación determina una función de ponderación en base a la información de posición del coeficiente LSF o del coeficiente ISF. La unidad 203 de determinación de la función de ponderación puede determinar una función de ponderación en base a al menos uno de un ancho de banda, un modo de codificación, e información de análisis espectral.
En una realización ejemplar, la unidad 203 de determinación de la función de ponderación puede inducir una función de ponderación óptima para cada modo de codificación. La unidad 203 de determinación de la función de ponderación puede inducir una función de ponderación óptima en base a un ancho de banda de la señal de entrada. La unidad 203 de determinación de la función de ponderación puede inducir una función de ponderación óptima en base a la información de análisis de frecuencia de la señal de entrada. La información de análisis de frecuencia puede incluir información de inclinación de espectro.
Para una subtrama media, una unidad 207 de determinación de la función de ponderación para determinar una función de ponderación asociada con un coeficiente ISF o con un coeficiente LSF de la subtrama media puede operar de la misma manera que la unidad 203 de determinación de la función de ponderación.
Una operación de la unidad 203 de determinación de la función de ponderación se describirá más adelante con referencia a la Figura 4 y la Figura 8.
El cuantificador 204 cuantifica el coeficiente ISF o el coeficiente LSF convertido utilizando la función de ponderación con respecto al coeficiente ISF o al coeficiente LSF que se convierte a partir del coeficiente LPC del final de trama de la trama actual o del coeficiente LPC del final de trama de la trama anterior. Como resultado de la cuantificación, se puede inducir un índice del coeficiente ISF o del coeficiente LSF cuantificado con respecto al final de trama de la trama actual o al final de trama de la trama anterior.
El segundo convertidor 205 convierte el coeficiente ISF cuantificado o el coeficiente LSF cuantificado en el coeficiente LPC cuantificado. El coeficiente LPC cuantificado que se induce utilizando el segundo convertidor 205 de coeficiente puede indicar no una simple información de espectro sino un coeficiente de reflexión y, por lo tanto, se puede utilizar un peso fijo.
Con referencia a la Figura 2, un cuantificador 201 de coeficiente LPC con respecto a la subtrama media incluye un primer convertidor 206 de coeficiente, la unidad 207 de determinación de la función de ponderación y un cuantificador 208.
El primer convertidor 206 de coeficiente convierte un coeficiente LPC de la subtrama media en uno de un coeficiente ISF o un coeficiente LSF.
La unidad 207 de determinación de la función de ponderación determina una función de ponderación asociada con una importancia del coeficiente LPC de la subtrama media utilizando el coeficiente ISF o el coeficiente LSF convertido. La unidad 207 de determinación de la función de ponderación puede operar de la misma manera que la unidad 203 de determinación de la función de ponderación.
La unidad 207 de determinación de la función de ponderación determina una función de ponderación del coeficiente ISF o del coeficiente LSF utilizando una magnitud espectral correspondiente a una frecuencia del coeficiente ISF o del coeficiente LSF obtenida a partir del coeficiente LPC de la subtrama media. En detalle, la unidad 207 de determinación de la función de ponderación puede determinar una función de ponderación del coeficiente ISF o del coeficiente LSF utilizando magnitudes espectrales correspondientes a una frecuencia del coeficiente ISF o del coeficiente LSF obtenida a partir del coeficiente LPC y una frecuencia vecina del mismo. La unidad 207 de determinación de la función de ponderación determina una función de ponderación en base a un valor máximo, una media, o un valor intermedio de las magnitudes espectrales correspondientes a una frecuencia del coeficiente ISF o del coeficiente LSF obtenido a partir del coeficiente LPC y una frecuencia vecina del mismo.
El procedimiento de determinación de una función de ponderación de la subtrama media puede explicarse con referencia a la Figura 8 y la función de ponderación de la subtrama media se puede determinar de la misma manera que la subtrama de final de trama que se muestra en la Figura 4.
La unidad 207 de determinación de la función de ponderación puede determinar una función de ponderación en base a al menos uno de un ancho de banda, un modo de codificación, e información de análisis espectral de la subtrama media. La información de análisis de frecuencia puede incluir información de inclinación de espectro.
La unidad 207 de determinación de la función de ponderación puede determinar una función de ponderación final combinando una función de ponderación de magnitud determinada en base a magnitudes espectrales y una función de ponderación de frecuencia. La función de ponderación de frecuencia puede indicar una función de ponderación correspondiente a una frecuencia del coeficiente ISF o del coeficiente LSF obtenido a partir del coeficiente LPC de la subtrama media y se puede expresar mediante una escala de corteza.
El cuantificador 208 cuantifica el coeficiente ISF o el coeficiente LSF convertido utilizando la función de ponderación con respecto al coeficiente ISF o al coeficiente LSF que se convierte a partir del coeficiente LPC de la subtrama media. Como resultado de la cuantificación, se puede inducir un índice del coeficiente ISF o el coeficiente LSF cuantificado con respecto a la subtrama media.
El segundo convertidor 209 convierte el coeficiente ISF cuantificado o el coeficiente LSF cuantificado en el coeficiente LPC cuantificado. El coeficiente LPC cuantificado que se induce utilizando el segundo convertidor 209 de coeficiente puede indicar no una simple información de espectro sino un coeficiente de reflexión y, por lo tanto, se puede utilizar un peso fijo.
Como otra realización ejemplar, se puede cuantificar un parámetro de ponderación para obtener un promedio ponderado entre el coeficiente LPC cuantificado de una trama actual y el coeficiente LPC cuantificado de una trama anterior, en lugar de cuantificar directamente un coeficiente LPC de la subtrama media. El parámetro de ponderación puede corresponder a un índice capaz de minimizar un error de cuantificación de la subtrama media. En este caso, no es necesario el segundo convertidor 209.
Tanto la unidad 203 de determinación de la función de ponderación como la unidad 207 de determinación de la función de ponderación determinan además una función de ponderación en base a la información de posición de los coeficientes ISF o los coeficientes LSF, por ejemplo, información de intervalo entre los coeficientes ISF o los coeficientes LSF, para luego ser combinada con al menos una de la función de ponderación de magnitud y la función de ponderación de frecuencia. Se describirá un procedimiento de determinación de la función de ponderación con referencia a la Figura 10.
De aquí en adelante, se describirá adicionalmente una relación entre un coeficiente LPC y una función de ponderación.
Una de las tecnologías disponibles al codificar una señal de voz y una señal de audio en un dominio de tiempo puede incluir una tecnología de predicción lineal. La tecnología de predicción lineal indica una predicción a corto plazo. Un resultado de predicción lineal se puede expresar mediante una correlación entre muestras adyacentes en el dominio de tiempo, y se puede expresar mediante una envolvente de espectro en un dominio de frecuencia.
La tecnología de predicción lineal puede incluir una tecnología de predicción lineal excitada por código (CELP). Una tecnología de codificación de voz que utiliza la tecnología CELP puede incluir G.729, una tasa múltiple adaptativa (AMR), una AMR de banda ancha (WB), un códec de tasa variable mejorado (EVRC), y similares. Para codificar una señal de voz y una señal de audio utilizando la tecnología CELP, se puede utilizar un coeficiente LPC y una señal de excitación.
El coeficiente LPC puede indicar la correlación entre muestras adyacentes, y se puede expresar mediante un pico del espectro. Cuando el coeficiente LPC tiene un orden de 16, se puede inducir una correlación entre un máximo de 16 muestras. Un orden del coeficiente LPC se puede determinar en base a un ancho de banda de una señal de entrada, y se puede determinar generalmente en base a una característica de una señal de voz. Una vocalización principal de la señal de entrada se puede determinar en base a una magnitud y una posición de un formante. Para expresar el formante de la señal de entrada, se puede utilizar el orden 10 de un coeficiente LPC con respecto a una señal de entrada de 300 a 3400 Hz que sea una banda estrecha. El orden 16 a 20 de los coeficientes LPC se puede utilizar con respecto a una señal de entrada de 50 a 7000 Hz que sea de banda ancha.
Un filtro de síntesis H(z) se puede expresar mediante la Ecuación 1. En este caso, aj denota el coeficiente LPC y p denota el orden del coeficiente LPC.
Figure imgf000007_0001
Una señal sintetizada, sintetizada por un decodificador se puede expresar mediante la Ecuación 2.
Figure imgf000007_0002
En este caso, SA(n) denota la señal sintetizada, uA(n) denota la señal de excitación, y N denota el tamaño de una trama de codificación utilizando el mismo coeficiente. La señal de excitación se puede determinar utilizando un índice de un libro de códigos adaptativo y un libro de códigos fijo. Un aparato decodificador puede generar la señal sintetizada utilizando la señal de excitación decodificada y el coeficiente LPC cuantificado.
El coeficiente LPC puede expresar información de formantes de un espectro que se expresa como un pico de espectro, y se puede utilizar para codificar una envolvente de un espectro total. En este caso, un aparato de codificación puede convertir el coeficiente LPC en un coeficiente ISF o un coeficiente LSF con el fin de aumentar la eficacia del coeficiente LPC.
El coeficiente ISF puede evitar que se produzca una divergencia debida a la cuantificación a través de una simple verificación de estabilidad. Cuando se produce un problema de estabilidad, el problema de estabilidad se puede resolver ajustando un intervalo de coeficientes ISF cuantificados. El coeficiente LSF puede tener las mismas características que el coeficiente ISF, excepto que un último coeficiente de los coeficientes LSF es un coeficiente de reflexión, el cual es diferente del coeficiente ISF. El ISF o el LSF es un coeficiente que se convierte a partir del coeficiente LPC y, por lo tanto, puede mantener la información de formantes del espectro del coeficiente LPC por igual.
De manera específica, la cuantificación del coeficiente LPC se puede realizar después de convertir el coeficiente LPC en un par espectral de inmitancia (ISP) o un par espectral de línea (LSP) que puede tener un intervalo dinámico estrecho, verificar fácilmente la estabilidad, y realizar fácilmente la interpolación. El ISP o el LSP se pueden expresar mediante el coeficiente ISF o el coeficiente LSF. Una relación entre el coeficiente ISF y el ISP o una relación entre el coeficiente LSF y el LSP se puede expresar mediante la Ecuación 3.
Figure imgf000007_0003
En este caso, qi denota el LSP o el ISP y w¡ denota el coeficiente LSF o el coeficiente ISF. El coeficiente LSF puede ser cuantificado por vectores para una eficacia de cuantificación. El coeficiente LSF puede ser cuantificado por el vector de predicción para mejorar la eficacia de cuantificación. Cuando se realiza una cuantificación por vector, y cuando aumenta una dimensión, se puede mejorar una tasa de bits, mientras que el tamaño de un libro de códigos puede aumentar, disminuyendo una tasa de procesamiento. En consecuencia, el tamaño del libro de códigos puede disminuir a través de una cuantificación por vector multietapa o una cuantificación por vector dividida.
La cuantificación por vector indica un procedimiento de considerar que todas las entidades dentro de un vector tienen la misma importancia, y seleccionar un índice de libro de códigos que tenga el menor error utilizando una medida de distancia de error al cuadrado. Sin embargo, en el caso de los coeficientes LPC, todos los coeficientes tienen una importancia diferente y, por lo tanto, se puede mejorar la calidad perceptiva de una señal sintetizada finalmente disminuyendo el error de un coeficiente importante. Cuando se cuantifican los coeficientes LSF, el aparato decodificador puede seleccionar un índice de libro de códigos óptimo aplicando, a la medida de distancia de error al cuadrado, una función de ponderación que exprese una importancia de cada coeficiente LPC. En consecuencia, se puede mejorar el rendimiento de la señal sintetizada.
De acuerdo con una realización ejemplar, se puede determinar una función de ponderación de magnitud con respecto a un efecto sustancial de cada coeficiente ISF o coeficiente LSF dado a una envolvente espectral, en base a información sustancial de magnitud y frecuencia espectral del coeficiente ISF o del coeficiente LSF. Además, se puede obtener una eficiencia de cuantificación adicional combinando una función de ponderación de frecuencia y una función de ponderación de magnitud. La función de ponderación de frecuencias se basa en una característica de percepción de un dominio de frecuencias y una distribución de formantes. Además, se puede obtener una eficiencia de cuantificación adicional combinando una función de ponderación que considere la información de intervalo o la información de posición de los coeficientes ISF o los coeficientes LSF con la función de ponderación de frecuencia y la función de ponderación de magnitud. Además, dado que se utiliza una magnitud real en el dominio de frecuencia, la información de envolvente de todas las frecuencias se puede utilizar bien, y se puede inducir con precisión un peso de cada coeficiente ISF o coeficiente LSF.
De acuerdo con una realización ejemplar, cuando un coeficiente ISF o un coeficiente LSF convertido a partir de un coeficiente LPC es cuantificado por vector, y cuando una importancia de cada coeficiente es diferente, se puede determinar una función de ponderación que indique una entrada relativamente importante dentro de un vector. La precisión de la codificación puede mejorarse analizando el espectro de una trama que se desea codificar, y determinando una función de ponderación que pueda dar un peso relativamente grande a una porción con una gran energía. Que la energía del espectro sea grande puede indicar que la correlación en un dominio de tiempo es alta.
La Figura 3 ilustra un procedimiento de cuantificación de un coeficiente LPC de acuerdo con una realización ejemplar.
La Figura 3 ilustra dos tipos de procedimientos de cuantificación del coeficiente LPC. A de la Figura 3 se puede aplicar cuando una variabilidad de una señal de entrada es grande y B de Figura 3 se puede aplicar cuando la variabilidad de una señal de entrada es pequeña. A y B de Figura 3 pueden conmutarse y, por lo tanto, aplicarse dependiendo de una característica de la señal de entrada. C de Figura 3 ilustra un procedimiento de cuantificación de un coeficiente LPC de una subtrama media.
Un cuantificador 301 de coeficiente LPC puede cuantificar un coeficiente ISF utilizando una cuantificación escalar (SQ), una cuantificación por vector (VQ), una cuantificación por vector dividida (SVQ), y una cuantificación por vector multietapa (MSVQ), las cuales pueden ser aplicables a un coeficiente LSF por igual.
Un predictor 302 puede realizar una predicción autorregresiva (AR) o una predicción de promedio móvil (MA). En este caso, un orden de predicción denota un entero mayor que o igual a '1'.
Una función de error para buscar un índice de libro de códigos a través de un coeficiente ISF cuantificado de A de la Figura 3 puede estar dada por la Ecuación 4. Una función de error para buscar un índice de libro de códigos a través de un coeficiente ISF cuantificado de B de la Figura 3 se puede expresar mediante la Ecuación 5. El índice del libro de códigos denota un valor mínimo de la función de error.
Una función de error inducida a través de la cuantificación de una subtrama media que se utiliza en el sector de Normalización de las Telecomunicaciones de la Unión Internacional de Telecomunicaciones ((ITU-T) G.718 de C de la Figura 3 se puede expresar mediante la Ecuación 6. Con referencia a la Ecuación. 6, un índice de un conjunto de pesos de interpolación que minimiza un error con respecto a un error de cuantificación de la subtrama media se puede inducir utilizando un valor ISF que se cuantifica con respecto a un final de trama de una trama actual, y un valor ISF que se cuantifica con respecto a un final de trama de una trama anterior.
Figure imgf000008_0001
En este caso, w(n) denota una función de ponderación, z(n) denota un vector en el cual se elimina un valor medio a partir de ISF(n) como se muestra en la Figura 3, c(n) denota un libro de códigos, y p denota un orden de un coeficiente ISF y utiliza 10 en una banda estrecha y de 16 a 20 en una banda ancha.
De acuerdo con una realización ejemplar, un aparato de codificación puede determinar una función de ponderación óptima combinando una función de ponderación de magnitud utilizando una magnitud de espectro correspondiente a una frecuencia del coeficiente ISF o del coeficiente LSF que se convierte a partir del coeficiente LPC, y una función de ponderación de frecuencia utilizando una característica de percepción de una señal de entrada y una distribución de formantes.
La Figura 4 ilustra un procedimiento de determinación, mediante la unidad 203 de determinación de la función de ponderación de la Figura 2, una función de ponderación de acuerdo con una realización ejemplar (que no comprende todas las características de la invención reivindicada, pero que es útil para comprender la invención).
La Figura 4 ilustra una configuración detallada del analizador 102 de espectro. El analizador 102 de espectro puede incluir un mapeador 401 de frecuencia y un calculador 402 de magnitud.
El mapeador 401 de frecuencia puede mapear un coeficiente LPC de la subtrama de final de trama en una señal de dominio de frecuencia. En una realización ejemplar, el mapeador 401 de frecuencia puede transformar el coeficiente LPC de la subtrama de final de trama en la señal de dominio de frecuencia utilizando una transformada Rápida de Fourier (FFT) o una Transformada de Coseno Discreta Modificada (MDCT) y determinar la información espectral LPC de la subtrama de final de trama. Si se aplica una FFT de 64 puntos en lugar de una FFT de 256 puntos al mapeador 401 de frecuencia, la transformación a un dominio de frecuencia se puede realizar con una complejidad muy baja. El mapeador 401 de frecuencia puede determinar una magnitud espectral de la subtrama de final de trama en base a la información espectral LPC.
El calculador 402 de magnitud puede calcular una magnitud de una casilla de espectro de frecuencia en base a la magnitud espectral de la subtrama de final de trama. Con el fin de normalizar el coeficiente ISF o el coeficiente LSF, se puede determinar que un número de casillas espectrales de frecuencia sea igual a un número de casillas espectrales de frecuencia correspondiente a un intervalo establecido por la unidad 207 de determinación de la función de ponderación.
La magnitud de la casilla espectral de frecuencia que es información de análisis espectral inducida por el calculador 402 de magnitud se puede utilizar cuando la unidad 207 de determinación de la función de ponderación determina la función de ponderación de magnitud.
La unidad 203 de determinación de la función de ponderación puede normalizar el coeficiente ISF o el coeficiente LSF convertido a partir del coeficiente LPC de la subtrama de final de trama. Durante este procedimiento, un último coeficiente de los coeficientes ISF es un coeficiente de reflexión y, por lo tanto, puede aplicarse el mismo peso. El esquema anterior no puede aplicarse al coeficiente LSF. En el orden p de ISF, el presente procedimiento se puede aplicar a un intervalo de 0 a p-2. Para emplear la información de análisis espectral, la unidad 203 de determinación de la función de ponderación puede realizar una normalización utilizando el mismo número K que el número de casillas espectrales de frecuencia inducidas por el calculador 402 de magnitud.
La unidad 203 de determinación de la función de ponderación puede determinar una función W-i(n) de ponderación por magnitud del coeficiente ISF o del coeficiente LSF que afecta a una envolvente espectral con respecto a la subtrama de final de trama, en base a la información de análisis espectral transferida a través del calculador 402 de magnitud. Por ejemplo, la unidad 203 de determinación de la función de ponderación puede determinar la función de ponderación de magnitud en base a la información de frecuencia del coeficiente ISF o del coeficiente LSF y en una magnitud espectral real de una señal de entrada. La función de ponderación de magnitud se puede determinar para el coeficiente ISF o el coeficiente LSF convertido a partir del coeficiente LPC.
La unidad 203 de determinación de la función de ponderación puede determinar la función de ponderación de magnitud en base a una magnitud de una casilla espectral de frecuencia correspondiente a cada frecuencia del coeficiente ISF o del coeficiente LSF.
La unidad 203 de determinación de la función de ponderación puede determinar la función de ponderación de magnitud en base a la magnitud de la casilla espectral correspondiente a cada frecuencia del coeficiente ISF o del coeficiente LSF, y una magnitud de al menos una casilla espectral vecina adyacente a la casilla espectral. En este caso, la unidad 203 de determinación de la función de ponderación puede determinar una función de ponderación de magnitud asociada con una envolvente espectral extrayendo un valor representativo de la casilla espectral y de al menos una casilla espectral vecina. Por ejemplo, el valor representativo puede ser un valor máximo, una media, o un valor intermedio de las casillas espectrales correspondientes a cada frecuencia del coeficiente ISF o del coeficiente LSF y al menos una casilla espectral vecina adyacente a la casilla espectral.
Por ejemplo, la unidad 203 de determinación de la función de ponderación puede determinar una función W2(n) de ponderación de frecuencia en base a la información de frecuencia del coeficiente ISF o del coeficiente LSF. De manera específica, la unidad 203 de determinación de la función de ponderación puede determinar la función de ponderación de frecuencia en base a una característica de percepción de una señal de entrada y una distribución de formantes. La unidad 207 de determinación de la función de ponderación puede extraer la característica de percepción de la señal de entrada mediante una escala de corteza. La unidad 207 de determinación de la función de ponderación puede determinar la función de ponderación de frecuencia en base a un primer formante de la distribución de formantes.
Como un ejemplo, la función de ponderación de frecuencia puede mostrar un peso relativamente bajo en una frecuencia extremadamente baja y una frecuencia alta, y mostrar el mismo peso en una banda de frecuencia predeterminada de una frecuencia baja, por ejemplo, una banda correspondiente al primer formante.
La unidad 203 de determinación de la función de ponderación puede determinar una función de ponderación basada en FFT combinando la función de ponderación de magnitud y la función de ponderación de frecuencia. La unidad 207 de determinación de la función de ponderación puede determinar la función de ponderación basada en FFT multiplicando o sumando la función de ponderación de magnitud y la función de ponderación de frecuencia.
Como otro ejemplo, la unidad 207 de determinación de la función de ponderación puede determinar la función de ponderación de magnitud y la función de ponderación de frecuencia en base a un modo de codificación de una señal de entrada e información de ancho de banda, el cual se describirá más adelante con referencia a la Figura 5.
La Figura 5 ilustra un procedimiento de determinación de una función de ponderación en base a un modo de codificación e información de ancho de banda de una señal de entrada de acuerdo con una realización ejemplar.
En la operación S501, la unidad 207 de determinación de la función de ponderación puede verificar un ancho de banda de una señal de entrada. En la operación S502, la unidad 207 de determinación de la función de ponderación puede determinar si el ancho de banda de la señal de entrada corresponde a una banda ancha. Cuando el ancho de banda de la señal de entrada no corresponde a la banda ancha, la unidad 207 de determinación de la función de ponderación puede determinar si el ancho de banda de la señal de entrada corresponde a una banda estrecha en la operación S511. Cuando el ancho de banda de la señal de entrada no corresponde a la banda estrecha, la unidad 207 de determinación de la función de ponderación puede no determinar la función de ponderación. Por el contrario, cuando el ancho de banda de la señal de entrada corresponde a la banda estrecha, la unidad 207 de determinación de la función de ponderación puede procesar un subbloque correspondiente, por ejemplo, una subtrama media en base al ancho de banda, en la operación S512 utilizando un procedimiento a través de las operaciones S503 a S510.
Cuando el ancho de banda de la señal de entrada corresponde a la banda ancha, la unidad 207 de determinación de la función de ponderación puede verificar un modo de codificación de la señal de entrada en la operación S503. En la operación S504, la unidad 207 de determinación de la función de ponderación puede determinar si el modo de codificación de la señal de entrada es un modo sin voz. Cuando el modo de codificación de la señal de entrada es el modo sin voz, la unidad 207 de determinación de la función de ponderación puede determinar una función de ponderación de magnitud con respecto al modo sin voz en la operación S505, determinar una función de ponderación de frecuencia con respecto al modo sin voz en la operación S506, y combinar la función de ponderación de magnitud y la función de ponderación de frecuencia en la operación S507.
Por el contrario, cuando el modo de codificación de la señal de entrada no es el modo sin voz, la unidad 207 de determinación de la función de ponderación puede determinar una función de ponderación de magnitud con respecto a un modo con voz en la operación S508, determinar una función de ponderación de frecuencia con respecto al modo con voz en la operación S509, y combinar la función de ponderación de magnitud y la función de ponderación de frecuencia en la operación S510. Cuando el modo de codificación de la señal de entrada es un modo genérico o un modo de transición, la unidad 207 de determinación de la función de ponderación puede determinar la función de ponderación a través del mismo procedimiento que el modo con voz.
Por ejemplo, cuando la señal de entrada es una frecuencia convertida de acuerdo con el esquema FFT, la función de ponderación de magnitud utilizando una magnitud espectral de un coeficiente FFT se puede determinar de acuerdo con la Ecuación 7.
Figure imgf000010_0001
La Figura 6 ilustra un ISF obtenido mediante la conversión de un coeficiente LPC de acuerdo con una realización ejemplar (que no comprende todas las características de la invención reivindicada, pero que es útil para comprender la invención).
De manera específica, la Figura 6 ilustra un resultado espectral cuando una señal de entrada se convierte a un dominio de frecuencia de acuerdo con una FFT, el coeficiente LPC inducido a partir de un espectro, y un coeficiente ISF convertido a partir del coeficiente LPC. Cuando se obtienen 256 muestras aplicando la FFT a la señal de entrada, y cuando se realiza la predicción lineal de 16 órdenes, se pueden inducir 16 coeficientes LPC, los 16 coeficientes LPC pueden convertirse en 16 coeficientes ISF.
La Figura 7 ilustra una función de ponderación en base a un modo de codificación de acuerdo con una realización ejemplar.
De manera específica, la Figura 7 ilustra una función de ponderación de frecuencia que se determina en base al modo de codificación de la Figura 5. Un gráfico 701 muestra una función de ponderación de frecuencia en un modo con voz, y un gráfico 702 muestra una función de ponderación de frecuencia en un modo sin voz.
Por ejemplo, el gráfico 701 se puede determinar de acuerdo con la Ecuación 8, y el gráfico 702 se puede determinar de acuerdo con la Ecuación 9. Una constante de las Ecuaciones 8 y 9 puede modificarse en base a una característica de la señal de entrada.
Figure imgf000011_0001
Si el número de los coeficientes LSF se amplía a 160 en una frecuencia de muestreo interna de 16 KHz, [21,127] y [6,127] pueden cambiarse a [21,159] y [6,159], respectivamente, en las Ecuaciones 8 y 9.
Una función de ponderación inducida finalmente combinando la función de ponderación de magnitud y la función de ponderación de frecuencia se puede determinar de acuerdo con la Ecuación 10.
Figure imgf000011_0002
La Figura 8 ilustra un procedimiento de determinación, mediante la unidad 207 de determinación de la función de ponderación de la Figura 2, una función de ponderación de acuerdo con otra realización ejemplar (que no comprende todas las características de la invención reivindicada, pero que es útil para comprender la invención).
La Figura 8 ilustra una configuración detallada del analizador 102 de espectro. El analizador 102 de espectro puede incluir un mapeador 801 de frecuencia y un calculador 802 de magnitud.
El mapeador 801 de frecuencia puede mapear un coeficiente LPC de una subtrama media a una señal de dominio de frecuencia. Por ejemplo, el mapeador 801 de frecuencia puede convertir en frecuencia el coeficiente LPC de la subtrama media utilizando la FFT, la MDCT, o similares, y puede determinar la información espectral LPC sobre la subtrama media. En este caso, cuando el mapeador 801 de frecuencia utiliza una FFT de 64 puntos en lugar de utilizar una FFT de 256 puntos, la conversión de frecuencia se puede realizar con una complejidad significativamente pequeña. El mapeador 801 de frecuencia puede determinar una magnitud espectral de frecuencia de la subtrama media en base a la información espectral LPC.
El calculador 802 de magnitud puede calcular una magnitud de una casilla espectral de frecuencia en base a la magnitud espectral de frecuencia de la subtrama media. Se puede determinar que un número de casillas espectrales de frecuencia sea el mismo que un número de casillas espectrales de frecuencia correspondientes a un intervalo establecido por la unidad 207 de determinación de la función de ponderación para normalizar un coeficiente ISF o un coeficiente LSF.
La magnitud de la casilla espectral de frecuencia que es información de análisis espectral inducida por el calculador 802 de magnitud se puede utilizar cuando la unidad 207 de determinación de la función de ponderación determina una función de ponderación de magnitud.
Un procedimiento de determinación, por la unidad 207 de determinación de la función de ponderación, de la función de ponderación se describe anteriormente con referencia a la Figura 5 y, por lo tanto, en este caso se omitirá una descripción más detallada.
La Figura 9 ilustra un esquema de codificación LPC de una subtrama media de acuerdo con una realización ejemplar.
Se utiliza una tecnología de codificación CELP para la predicción lineal y una señal excitada y un coeficiente LPC para codificar una señal de entrada. Cuando la señal de entrada está codificada, el coeficiente LPC se puede cuantificar. Sin embargo, en el caso de la cuantificación del coeficiente LPC, el intervalo dinámico es amplio, y es difícil verificar la estabilidad de cuantificación. Por lo tanto, se puede codificar el coeficiente LPC convirtiendo el coeficiente LPC en un coeficiente de frecuencia espectral de línea (LSF) (o un LSP) o un coeficiente de frecuencia espectral de inmitancia (ISF) (o un ISP) que tenga un intervalo dinámico estrecho y permita verificar fácilmente su estabilidad.
En este caso, el coeficiente LPC convertido en coeficiente ISF o el coeficiente LSF se cuantifica mediante un vector para aumentar la eficiencia de la cuantificación. En un tal procedimiento, cuando todos los coeficientes LPC se cuantifican con la misma importancia, se degrada la calidad de la señal de entrada sintetizada. Es decir, la importancia de todos los coeficientes LPC difieren y, por lo tanto, cuando el error de un coeficiente LPC importante es pequeño, la calidad de una señal de entrada sintetizada mejora. Cuando se realiza la cuantificación aplicando la misma importancia sin tener en cuenta la importancia de los coeficientes LPC, la calidad de la señal de entrada se degrada inevitablemente. Por lo tanto, se necesita una función de ponderación para determinar la importancia.
De manera general, un codificador de voz de comunicación está configurado con una subtrama de 5 ms y una subtrama de 20 ms. AMR y AMR-WB, los cuales son un codificador de voz del sistema global de comunicación móvil (GSM) y un codificador de voz del proyecto de asociación de tercera generación (3GPP), están configurados con una trama de 20 ms la cual incluye cuatro subtramas de 5 ms.
Como se muestra en la Figura 9, se puede realizar una cuantificación de un coeficiente LPC para una cuarta subtrama (un final de trama), la cual es una última trama entre las subtramas que configuran una trama anterior y una trama actual, una vez. Un coeficiente LPC para una primera, segunda, o tercera subtrama de una trama actual no se cuantifica directamente y, en su lugar, se puede transmitir un índice que indica una tasa asociada con una suma o un promedio ponderados de coeficientes LPC cuantificados para un final de trama de una trama anterior y un final de trama de una trama actual.
La Figura 10 es un diagrama de bloques que ilustra una configuración de un aparato de determinación de la función de ponderación de acuerdo con una realización de la invención reivindicada.
El aparato de determinación de la función de ponderación de la Figura 10 puede incluir un analizador 1001 de espectro, incluye un analizador 1002 LP, e incluye un determinador de la función de ponderación. El determinador de la función de ponderación incluye un primer generador 1003 de la función de ponderación, un segundo generador 1004 de la función de ponderación, y un combinador 1005. Cada uno de los elementos puede estar integrado en al menos un procesador.
Con referencia a la Figura 10, el analizador 1001 de espectro puede analizar una característica de una señal de entrada en un dominio de frecuencia a través de una operación de mapeo de tiempo a frecuencia. En este caso, la señal de entrada puede ser una señal preprocesada, y la operación de mapeo de tiempo a frecuencia se puede realizar utilizando una transformada Rápida de Fourier (FFT). Sin embargo, la realización ejemplar no se limita a ello. El analizador 1001 de espectro puede proporcionar información de análisis espectral, por ejemplo, una magnitud espectral la cual se obtiene como resultado de una FFT. En este caso, la magnitud espectral puede tener una escala lineal. En detalle, el analizador 1001 de espectro puede realizar una FFT de 128 puntos para generar la magnitud espectral. En este caso, un ancho de banda de la magnitud espectral puede corresponder a un intervalo de 0 Hz a 6.400 Hz. Cuando una frecuencia de muestreo interna es de 16 kHz, el número de magnitudes espectrales puede ampliarse a 160. En este caso, se puede omitir una magnitud espectral para un intervalo de 6,400 Hz a 8,000 Hz, y la magnitud espectral omitida puede ser generada por un espectro de entrada. En detalle, la magnitud espectral omitida para el intervalo de 6,400 Hz a 8,000 Hz se puede sustituir utilizando las treinta y dos últimas magnitudes espectrales correspondientes a un ancho de banda de 4,800 Hz a 6,400 Hz. Por ejemplo, se puede utilizar un valor promedio de las últimas treinta y dos magnitudes espectrales.
El analizador 1002 LP puede realizar un análisis LP en la señal de entrada para generar un coeficiente LPC. El analizador 1002 LP genera un coeficiente LSF a partir del coeficiente LPC.
El determinador de la función de ponderación determina una función de ponderación final, la cual se utiliza para una cuantificación del coeficiente LSF, a partir de una primera función “Wf(n)” de ponderación la cual se genera en base a la información de análisis espectral para el coeficiente LSF y una segunda función “Ws(n)” de ponderación la cual se genera en base al coeficiente LSF. Por ejemplo, la primera función de ponderación se puede determinar utilizando una magnitud de una frecuencia correspondiente a cada coeficiente LSF o coeficiente LSF, después de que la información de análisis espectral, es decir, una magnitud espectral, se normalice para que coincida con una banda LSF. La segunda función de ponderación se determina en base a información sobre un intervalo entre coeficientes LSF adyacentes, o una posición de los coeficientes LSF adyacentes.
El primer generador 1003z de la función de ponderación está dispuesto para obtener una función de ponderación de magnitud y una función de ponderación de frecuencia y para combinar la función de ponderación de magnitud y la función de ponderación de frecuencia para generar la primera función de ponderación. La primera función de ponderación se puede obtener en base a una FFT, y a medida que una magnitud espectral aumenta, se puede asignar un valor de ponderación mayor.
El segundo generador 1004 de la función de ponderación genera la segunda función de ponderación asociada con la sensibilidad espectral a partir de dos coeficientes LSF adyacentes a cada coeficiente LSF. De manera general, un coeficiente LSF se dispone en un círculo unitario del dominio Z, y cuando un intervalo entre coeficientes LSF adyacentes es más estrecho que una periferia del mismo, el coeficiente LSF aparece como un pico de espectro. Como resultado, la segunda función de ponderación puede aproximar las sensibilidades espectrales de los coeficientes LSF, en base a las posiciones de los coeficientes LSF adyacentes. Es decir, se puede predecir una densidad de los coeficientes LSF midiendo la proximidad entre coeficientes LSF adyacentes, y un espectro de señal puede tener un valor pico alrededor de una frecuencia en la que hay coeficientes LSF densos, por lo tanto, se puede asignar un valor de ponderación grande. En este caso, se pueden utilizar de manera adicional diversos parámetros para los coeficientes LSF para determinar la segunda función de ponderación, para aumentar la precisión de la aproximación de la sensibilidad espectral.
De acuerdo con la descripción anterior, un intervalo entre coeficientes LSF puede ser inversamente proporcional a una función de ponderación. Se pueden implementar diversas realizaciones ejemplares utilizando una relación entre el intervalo y la función de ponderación. Por ejemplo, el intervalo se puede expresar como un número negativo, o se puede marcar en un denominador. Como otro ejemplo, con el fin de enfatizar aún más un valor de ponderación calculado, cada elemento de una función de ponderación puede multiplicarse por una constante, o se puede calcular el cuadrado de cada elemento. Como otro ejemplo, una función de ponderación calculada secundariamente se puede reflejar aún más realizando una operación aritmética adicional (por ejemplo, la potencia o la potencia de 3) sobre una función de ponderación calculada primariamente.
Un ejemplo de cálculo de una función de ponderación utilizando un intervalo entre coeficientes LSF es el siguiente.
Por ejemplo, la segunda función “Ws(n)” de ponderación se puede calcular mediante la siguiente Ecuación 11.
Figure imgf000013_0001
En este caso cada uno de lsfi-1 y lsfi+1 denota un coeficiente LSF adyacente a un coeficiente LSF actual “ lsfi”.
Por ejemplo, la segunda función “Ws(n)” de ponderación se puede calcular mediante la siguiente Ecuación 12.
Figure imgf000013_0002
En este caso, f denota un coeficiente LSF actual, y cada uno de lsfn-i y lsfn+i denota un coeficiente LSF adyacente, y M es 16 como orden de un modelo LP. Por ejemplo, un coeficiente LSF puede estar comprendido entre 0 y n y, por lo tanto, se pueden calcular un primer valor de ponderación y un último valor de ponderación en base a “ lsf0=0” and “ lsfM=n”.
El combinador 1005 está dispuesto para combinar la primera función de ponderación y la segunda función de ponderación para determinar una función de ponderación final la cual se utiliza para cuantificar un coeficiente LSF. En este caso, los ejemplos de un esquema de combinación pueden incluir diversos esquemas, tales como un esquema que multiplica las funciones de ponderación, un esquema que multiplica las funciones de ponderación con una relación adecuada y luego realiza la suma, y un esquema que multiplica cada valor de ponderación por un valor determinado mediante el uso de una tabla de consulta y luego realiza la suma.
La Figura 11 es un diagrama de bloques que ilustra una configuración detallada del primer generador 1003 de función de ponderación de la Figura 10 de acuerdo con una realización ejemplar.
El primer generador 1003 de la función de ponderación de la Figura 11 incluye una unidad 1101 de normalización, una unidad 1102 generadora de la función de ponderación de magnitud, una unidad 1103 generadora de la función de ponderación de frecuencia, y una unidad 1104 de combinación. En este caso, por conveniencia de una descripción, se describirá un coeficiente LSF como un ejemplo de una señal de entrada del primer generador 1003 de la función de ponderación.
Con referencia a la Figura 11, la unidad 1101 de normalización está dispuesta para normalizar un coeficiente LSF a un intervalo de 0 a K-1. El coeficiente LSF puede tener un intervalo entre 0 y n. En el caso de una frecuencia de muestreo interna de 12,8 kHz, K es 128. En el caso de una frecuencia de muestreo interna de 16,4 kHz, K es 160.
La unidad 1102 generadora de la función de ponderación de magnitud está dispuesta para generar una función “W 1(n)” de ponderación de magnitud para un coeficiente LSF normalizado, en base a la información de análisis espectral. De acuerdo con una realización ejemplar, la función de ponderación de magnitud se puede determinar en base a una magnitud espectral del coeficiente LSF normalizado.
En detalle, la función de ponderación de magnitud se determina utilizando una magnitud de una casilla espectral correspondiente a una frecuencia del coeficiente LSF normalizado y magnitudes de una izquierda y una derecha de una casilla espectral correspondiente, por ejemplo, magnitudes de dos casillas espectrales adyacentes las cuales están dispuestas en una posición anterior o en una posición siguiente. La función “W 1(n)” de ponderación de magnitud asociada con una envolvente espectral se puede determinar extrayendo un valor máximo de entre las magnitudes de tres casillas de espectro, en base a la siguiente Ecuación 13.
Figure imgf000014_0001
En este caso, Mín denota un valor mínimo de Wf(n), y Wf(n) se define como 10log(Emáx(n))(donde, n=0,...,M-1). En este caso, M es 16, y Emáx(n) denota un valor máximo de magnitudes de tres casillas espectrales para cada coeficiente LSF.
La unidad 1103 generadora de la función de ponderación de frecuencia está dispuesta para generar una función “W2(n)” de ponderación de frecuencia para el coeficiente LSF normalizado, en base a la información de frecuencia. De acuerdo con una realización ejemplar, la función de ponderación de frecuencia se puede determinar utilizando un gráfico de ponderación que el cual se selecciona utilizando un ancho de banda de entrada y un modo de codificación. Un ejemplo del gráfico de ponderación se muestra en la Figura 7. El gráfico de ponderación se puede obtener en base a una característica de percepción, tal como una escala de corteza, o una distribución de formantes de una señal de entrada. La función “W2(n)” de ponderación de frecuencia se puede determinar cómo se expresa en las Ecuaciones 8 y 9 para un modo con voz y un modo sin voz.
La unidad 1104 de combinación está dispuesta para combinar la función “W 1(n)” de ponderación de magnitud y la función “W2(n)” de ponderación de frecuencia para determinar una función “Wf(n)” de ponderación basada en FFT. La función “Wf(n)” de ponderación basada en FFT para una cuantificación de un coeficiente LSF para un final de trama se puede calcular en base a la siguiente Ecuación 14.
Figure imgf000014_0002
La Figura 12 es un diagrama que ilustra una operación de determinación de una función de ponderación utilizando un modo de codificación e información de ancho de banda de una señal de entrada, de acuerdo con una realización ejemplar. En comparación con la Figura 5, se añade además la operación S1213 de verificación de una frecuencia de muestreo interna.
Con referencia a la Figura 12, en la operación S1213, el aparato de determinación de la función de ponderación puede verificar una frecuencia de muestreo interna y ajustar la información de análisis espectral obtenida a través del análisis de espectro de acuerdo con la frecuencia de muestreo interna o generar una señal. En la operación S1213, el aparato de determinación de la función de ponderación puede determinar el número de casillas de espectro de acuerdo con la frecuencia de muestreo interna para la codificación. Por ejemplo, el número de casillas de espectro en base a la frecuencia de muestreo interna se puede determinar como se muestra en la siguiente Tabla 1.
[Tabla 1]
Figure imgf000015_0001
En detalle, una señal a la que se hace referencia en un coeficiente ISF o LSF normalizado en una función de ponderación de magnitud y una función de ponderación de frecuencia se puede cambiar de acuerdo con si una banda de una señal de entrada para el análisis de espectro es de 12,8 kHz o 16 kHz o si una banda realmente codificada es de 12,8 kHz o 16 kHz. De acuerdo con la Tabla 1, cuando la frecuencia de muestreo de la señal de entrada para el análisis de espectro es de 16 kHz, no se produce ningún problema. Por lo tanto, en la operación S1213, se realiza el mapeo para que coincida con la frecuencia de muestreo interna para la codificación. En este caso, para facilitar el cálculo, se puede seleccionar el número de casillas espectrales entre 128 y 160.
Cuando la frecuencia de muestreo de la señal de entrada para el análisis de espectro es de 12,8 kHz y la frecuencia de muestreo interna para la codificación es de 16 kHz, no hay señal analizada a la que referirse entre 12,8 kHz y 16 kHz, y, por lo tanto, se puede generar una señal utilizando la información de análisis espectral ya obtenida. Para este propósito, en la operación S1213, se determina el número de casillas espectrales en base a la frecuencia de muestreo interna para la codificación. Posteriormente, se genera una señal correspondiente a una banda de 12,8 kHz a 16 kHz. En este caso, se puede obtener una señal de una parte omitida utilizando la información de análisis espectral obtenida. Por ejemplo, se puede obtener la señal de la parte omitida utilizando información estadística sobre una determinada parte de la información de análisis espectral ya obtenida. Los ejemplos de la información estadística pueden incluir un valor promedio y un valor intermedio, y un ejemplo de la determinada parte puede ser K piezas de información de espectro de una determinada parte de una banda de 0 kHz a 12,8 kHz. En detalle, se pueden utilizar treinta y dos valores promedio correspondientes a una parte posterior de una magnitud espectral calculada entre 12,8 kHz y 16 kHz.
Con respecto a la cuantificación de una subtrama, de acuerdo con las realizaciones ejemplares, en una subtrama de final de trama, se puede cuantificar directamente un coeficiente ISF o un coeficiente LSF, y se puede aplicar una función de ponderación. En una subtrama media, sin cuantificar directamente un coeficiente ISF o un coeficiente LSF, se puede cuantificar un parámetro de ponderación para obtener un promedio ponderado de coeficientes ISF o coeficientes LSF cuantificados de subtramas de final de trama de una trama anterior y una trama actual. En detalle, se puede ponderar un coeficiente ISF no cuantificado o un coeficiente LSF de una subtrama media utilizando una función de ponderación, y se puede obtener un parámetro de ponderación para obtener un promedio ponderado de coeficientes ISF o coeficientes LSF cuantificados de subtramas de final de trama de una trama anterior y una trama actual a partir de un libro de códigos, en base al coeficiente ISF ponderado o el coeficiente LSF de la subtrama media. Se puede buscar el libro de códigos en bucle cerrado, y se puede buscar un índice correspondiente a un parámetro de ponderación en el libro de códigos de modo que minimice un error entre un coeficiente ISF o LSF cuantificado de la subtrama media y un coeficiente ISF o LSF ponderado de la subtrama media. En la subtrama media se transmite un índice del libro de códigos, y, por lo tanto, se utiliza un número de bits mucho más pequeño que en la subtrama de final de trama.
El procedimiento de acuerdo con las realizaciones ejemplares puede implementarse como códigos legibles por ordenador en un medio legible por ordenador. El medio de grabación legible por ordenador puede incluir una instrucción de programa, un archivo de datos local, una estructura de datos local, o una combinación de los mismos.
El medio de grabación legible por ordenador puede ser específico de las realizaciones ejemplares o comúnmente conocido por aquellos con conocimientos ordinarios en software de ordenador. Los ejemplos del medio de grabación legible por ordenador incluyen un medio magnético, tal como un disco duro, un disquete y una cinta magnética, un medio óptico, tal como un CD-ROM y un DVD, un medio magneto-óptico, tal como un disquete, y una memoria de hardware, tal como una ROM, una RAM y una memoria flash, configurada específicamente para almacenar y ejecutar instrucciones de programa. Además, el medio de grabación legible por ordenador puede ser un medio de transmisión que transmite una señal que designa una instrucción de programa, una estructura de datos, o similares. Los ejemplos de la instrucción de programa incluyen el código de máquina, el cual se genera mediante un compilador, y un lenguaje de alto nivel, el cual se ejecuta mediante un ordenador utilizando un intérprete, etc.
Se debe entender que las realizaciones ejemplares descritas en la presente memoria se deben considerar en un sentido descriptivo únicamente y no con fines de limitación. Las descripciones de características o aspectos dentro de cada realización ejemplar deben considerarse típicamente como disponibles para otras características o aspectos similares en otras realizaciones ejemplares. A la vez que una o más realizaciones ejemplares se describen con referencia a las figuras, se entenderá por aquellos expertos en la técnica que se pueden hacer diversos cambios en la forma y los detalles en el mismo sin apartarse del ámbito como se define mediante las siguientes reivindicaciones.

Claims (11)

REIVINDICACIONES
1. Un procedimiento de codificación de un coeficiente de codificación predictiva lineal, LPC, para un dispositivo de codificación, comprendiendo el procedimiento:
obtención (200, 206, 1002) de un coeficiente de frecuencia espectral de línea, LSF, a partir del coeficiente LPC de una subtrama en una señal de audio;
normalizando el coeficiente LSF;
obtención de una función de ponderación de magnitud de la subtrama en base a un valor máximo de una magnitud de una casilla espectral correspondiente a una frecuencia del coeficiente LSF normalizado y magnitudes de casillas espectrales vecinas adyacentes a la casilla espectral correspondiente; obtención de una función de ponderación de frecuencia de la subtrama en base a la información de frecuencia del coeficiente LSF normalizado;
combinación de la función de ponderación de magnitud de la subtrama y la función de ponderación de frecuencia de la subtrama para determinar una primera función (1003) de ponderación de la subtrama; obtención de una segunda función (1004) de ponderación de la subtrama asociada con la sensibilidad espectral en base a un intervalo entre el coeficiente LSF obtenido y un coeficiente LSF adyacente al coeficiente LSF obtenido;
combinación (1005) de la primera función de ponderación de la subtrama y la segunda función de ponderación de la subtrama para determinar la función de ponderación de la subtrama;
cuantificación (204, 208) del coeficiente LSF utilizando la función de ponderación de la subtrama; y conversión (205, 209) del coeficiente LSF cuantificado en un coeficiente LPC cuantificado.
2. El procedimiento de la reivindicación 1, en el que la función de ponderación de magnitud es relevante para una envolvente espectral de la señal de audio.
3. El procedimiento de la reivindicación 1, en el que la función de ponderación de frecuencia de la subtrama se determina utilizando al menos una seleccionada entre una característica de percepción y una distribución de formantes de la señal de audio.
4. El procedimiento de la reivindicación 1, en el que la función de ponderación de frecuencia se determina utilizando un gráfico de ponderación seleccionado utilizando un ancho de banda de entrada y un modo de codificación.
5. El procedimiento de la reivindicación 4, en el que el modo de codificación comprende un modo con voz y un modo sin voz.
6. Un aparato de cuantificación de una frecuencia espectral de línea, LSF, un coeficiente para un dispositivo de codificación, comprendiendo el aparato:
al menos un procesador configurado para:
obtener un coeficiente LSF a partir de un coeficiente de codificación lineal predictiva, LPC, de una subtrama en una señal de audio;
normalizar el coeficiente LSF;
obtener una función de ponderación de magnitud de la subtrama en base a un valor máximo de una magnitud de una casilla espectral correspondiente a una frecuencia del coeficiente LSF normalizado y magnitudes de casillas espectrales vecinas adyacentes a la casilla espectral correspondiente;
obtener una función de ponderación de frecuencia de la subtrama en base a la información de frecuencia del coeficiente LSF normalizado;
combinar la función de ponderación de magnitud de la subtrama y la función de ponderación de frecuencia de la subtrama para determinar una primera función de ponderación de la subtrama;
obtener una segunda función de ponderación de la subtrama asociada con la sensibilidad espectral en base a un intervalo entre el coeficiente LSF obtenido y un coeficiente LSF adyacente al coeficiente LSF obtenido; combinar la primera función de ponderación de la subtrama y la segunda función de ponderación de la subtrama para determinar una función de ponderación de la subtrama; y
cuantificar el coeficiente LSF utilizando la función de ponderación de la subtrama; y
convertir el coeficiente LSF cuantificado en un coeficiente LPC cuantificado.
7. El procedimiento de la reivindicación 6, en el que la función de ponderación de magnitud es relevante para una envolvente espectral de la señal de audio.
8. El procedimiento de la reivindicación 6, en el que la función de ponderación de frecuencia de la subtrama se determina utilizando al menos una seleccionada entre una característica de percepción y una distribución de formantes de la señal de audio.
9. El procedimiento de la reivindicación 6, en el que la función de ponderación de frecuencia se determina utilizando un gráfico de ponderación seleccionado utilizando un ancho de banda de entrada y un modo de codificación.
10. El procedimiento de la reivindicación 9, en el que el modo de codificación comprende un modo con voz y un modo sin voz.
11. Un medio de almacenamiento no transitorio legible por ordenador que almacena un programa que comprende instrucciones las cuales, cuando son ejecutadas por un ordenador, hacen que el ordenador lleve a cabo las etapas del procedimiento de la reivindicación 1.
ES19204786T 2014-01-15 2015-01-15 Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal Active ES2952973T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20140005318 2014-01-15

Publications (1)

Publication Number Publication Date
ES2952973T3 true ES2952973T3 (es) 2023-11-07

Family

ID=53543180

Family Applications (1)

Application Number Title Priority Date Filing Date
ES19204786T Active ES2952973T3 (es) 2014-01-15 2015-01-15 Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal

Country Status (7)

Country Link
US (2) US10074375B2 (es)
EP (3) EP3621074B1 (es)
KR (2) KR102357291B1 (es)
CN (3) CN111105807B (es)
ES (1) ES2952973T3 (es)
SG (1) SG11201606512TA (es)
WO (1) WO2015108358A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
ES2952973T3 (es) * 2014-01-15 2023-11-07 Samsung Electronics Co Ltd Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal
US11955138B2 (en) * 2019-03-15 2024-04-09 Advanced Micro Devices, Inc. Detecting voice regions in a non-stationary noisy environment
BR112021021928A2 (pt) * 2019-06-13 2021-12-21 Ericsson Telefon Ab L M Método para gerar um subquadro de áudio de ocultação, dispositivo decodificador, programa de computador, e, produto de programa de computador
KR20220117019A (ko) 2021-02-16 2022-08-23 한국전자통신연구원 학습 모델을 이용한 오디오 신호의 부호화 및 복호화 방법과 그 학습 모델의 트레이닝 방법 및 이를 수행하는 부호화기 및 복호화기
KR20220151953A (ko) 2021-05-07 2022-11-15 한국전자통신연구원 부가 정보를 이용한 오디오 신호의 부호화 및 복호화 방법과 그 방법을 수행하는 부호화기 및 복호화기

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3308764B2 (ja) * 1995-05-31 2002-07-29 日本電気株式会社 音声符号化装置
US6393391B1 (en) * 1998-04-15 2002-05-21 Nec Corporation Speech coder for high quality at low bit rates
US6889185B1 (en) * 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
JPH11143498A (ja) * 1997-08-28 1999-05-28 Texas Instr Inc <Ti> Lpc係数のベクトル量子化方法
FR2774827B1 (fr) * 1998-02-06 2000-04-14 France Telecom Procede de decodage d'un flux binaire representatif d'un signal audio
EP1860650A1 (en) * 2000-11-30 2007-11-28 Matsushita Electric Industrial Co., Ltd. Vector quantizing device for LPC parameters
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
KR100579797B1 (ko) 2004-05-31 2006-05-12 에스케이 텔레콤주식회사 음성 코드북 구축 시스템 및 방법
KR100647290B1 (ko) * 2004-09-22 2006-11-23 삼성전자주식회사 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
EP2054882B1 (en) * 2006-08-15 2011-01-19 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information
WO2008056775A1 (fr) * 2006-11-10 2008-05-15 Panasonic Corporation Dispositif de décodage de paramètre, dispositif de codage de paramètre et procédé de décodage de paramètre
KR100788706B1 (ko) * 2006-11-28 2007-12-26 삼성전자주식회사 광대역 음성 신호의 부호화/복호화 방법
CN101197577A (zh) * 2006-12-07 2008-06-11 展讯通信(上海)有限公司 一种用于音频处理框架中的编码和解码方法
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
JP4999757B2 (ja) 2008-03-31 2012-08-15 日本電信電話株式会社 音声分析合成装置、音声分析合成方法、コンピュータプログラム、および記録媒体
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
CN101770777B (zh) * 2008-12-31 2012-04-25 华为技术有限公司 一种线性预测编码频带扩展方法、装置和编解码系统
CN102067211B (zh) 2009-03-11 2013-04-17 华为技术有限公司 一种线性预测分析方法、装置及系统
ES2441069T3 (es) * 2009-10-08 2014-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación
EP2315358A1 (en) * 2009-10-09 2011-04-27 Thomson Licensing Method and device for arithmetic encoding or arithmetic decoding
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
KR101660843B1 (ko) * 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
KR101501576B1 (ko) * 2010-10-20 2015-03-11 한국생명공학연구원 Hif-1 활성을 저해하는 아릴옥시페녹시아세틸계 화합물, 이의 제조방법 및 이를 유효성분으로 함유하는 약학적 조성물
WO2012144878A2 (en) * 2011-04-21 2012-10-26 Samsung Electronics Co., Ltd. Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium
CN103137135B (zh) * 2013-01-22 2015-05-06 深圳广晟信源技术有限公司 Lpc系数量化方法和装置及多编码核音频编码方法和设备
CN103971694B (zh) * 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
ES2952973T3 (es) * 2014-01-15 2023-11-07 Samsung Electronics Co Ltd Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal

Also Published As

Publication number Publication date
CN106104682B (zh) 2020-03-24
CN111105807B (zh) 2023-09-15
US20190019524A1 (en) 2019-01-17
EP3091536B1 (en) 2019-12-11
CN111312265B (zh) 2023-04-28
EP3091536A4 (en) 2017-05-31
KR20220019246A (ko) 2022-02-16
US20160336018A1 (en) 2016-11-17
KR102357291B1 (ko) 2022-02-03
US10074375B2 (en) 2018-09-11
EP3091536A1 (en) 2016-11-09
KR102461280B1 (ko) 2022-11-01
KR20150085489A (ko) 2015-07-23
WO2015108358A1 (ko) 2015-07-23
EP3621074C0 (en) 2023-07-12
CN111312265A (zh) 2020-06-19
EP3621074B1 (en) 2023-07-12
CN106104682A (zh) 2016-11-09
EP4095854A1 (en) 2022-11-30
SG11201606512TA (en) 2016-09-29
CN111105807A (zh) 2020-05-05
EP3621074A1 (en) 2020-03-11
US10249308B2 (en) 2019-04-02

Similar Documents

Publication Publication Date Title
ES2947874T3 (es) Determinación de una función de ponderación de baja complejidad para la cuantificación de coeficientes de codificación lineal predictiva (LPC)
ES2952973T3 (es) Dispositivo de determinación de la función de ponderación y procedimiento para cuantificar el coeficiente de codificación de predicción lineal
ES2950794T3 (es) Detección y codificación de altura tonal muy débil
KR102626320B1 (ko) 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
ES2774334T3 (es) Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta
CN112927703A (zh) 对线性预测系数量化的方法和装置及解量化的方法和装置
KR20110130290A (ko) Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법