MX2011000557A - Metodo y aparato de codificacion y decodificacion de señal de audio/voz. - Google Patents

Metodo y aparato de codificacion y decodificacion de señal de audio/voz.

Info

Publication number
MX2011000557A
MX2011000557A MX2011000557A MX2011000557A MX2011000557A MX 2011000557 A MX2011000557 A MX 2011000557A MX 2011000557 A MX2011000557 A MX 2011000557A MX 2011000557 A MX2011000557 A MX 2011000557A MX 2011000557 A MX2011000557 A MX 2011000557A
Authority
MX
Mexico
Prior art keywords
signal
unit
audio
high frequency
voice
Prior art date
Application number
MX2011000557A
Other languages
English (en)
Inventor
Eun Mi Oh
Jung-Hoe Kim
Ki Hyun Choo
Mi Young Kim
Ho Sang Sung
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=41505940&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=MX2011000557(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of MX2011000557A publication Critical patent/MX2011000557A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un método y aparato de codificación y decodificación de señal de audio/voz son proporcionados. Una señal de audio o señal de voz entrada podría ser transformada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta. La señal podría ser codificada al determinar una resolución adecuada, la señal codificada podría ser decodificada y de esta manera, la señal de audio, la señal de voz y una señal mezclada de la señal de audio y la señal de voz podrían ser procesadas.

Description

y METODO Y APARATO DE CODIFICACION Y DECODIFICACION DE SEÑAL DE AUDIO/VOZ Campo de la Invención Las modalidades de ejemplo se refieren a un método y aparato de codificación y decodificación de una señal de audio/voz .
Antecedentes de la Invención Un códec podría ser clasificado en un códec de voz y un códec de audio. Un códec de voz podría codificar/decodificar una señal en una banda de frecuencia en un intervalo de 50 Hz a 7 kHz utilizando un modelo de voz. En general, el códec de voz podría extraer un parámetro de una señal de voz mediante el modelo de las cuerdas vocales y los tractos vocales para realizar la codificación y la decodificación. Un códec de audio podría codificar/decodificar una señal en una banda de frecuencia en el intervalo de 0 a 24 Hz mediante la aplicación de un modelo psicoacústico tal como la Codificación Avanzada de Audio de Alta Eficiencia (HE-AAC) . El códec de audio podría realizar la codificación y decodificación removiendo o eliminando una señal menos perceptible en función de las características dé la audición humana.
Aunque un códec de voz es adecuado para la codificación/decodificación de una señal de voz, no es REF.217150 adecuado para la codificación/decodificación de una señal de audio debido a la degradación de la calidad del sonido. Asimismo, la eficiencia de compresión de la señal podría ser reducida cuando un códec de audio realice la codificación/decodificación de una señal de voz.
Breve Descripción de la Invención Las modalidades de ejemplo podrían proporcionar un método y aparato de codificación y decodificación de una señal de audio/voz que podría codificar y decodificar, de manera eficiente, una señal de voz, una señal de audio y una señal mezclada de la señal de voz y la señal de audio.
Las características y utilidades adicionales del presente concepto inventivo general serán señaladas en parte en la descripción que sigue, y en parte, serán obvias a partir de la descripción, o podrían ser aprendidos por la práctica del concepto inventivo general.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo general, podría proporcionarse un aparato que codifica una señal de audio/voz, el aparato incluye una unidad de transformación de señal que transforma una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta, una unidad de modelo psicoacústico que controla la unidad de transformación de señal, una unidad de codificación de dominio de tiempo que codifica la señal, transformada a través de la unidad de transformación de señal, en función del modelo de voz, y una unidad de cuantificación que cuantifica la señal salida al menos a partir de una de la unidad de transformación de señal y la unidad de codificación de dominio de tiempo.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo general, también podría proporcionarse un aparato que codifica una señal de audio/voz, el aparato incluye una unidad de procesamiento de estéreo paramétrico que procesa la información de estéreo de una señal de audio o señal de voz entrada, una unidad que procesa una señal de frecuencia alta de la señal de audio o señal de voz entrada, una unidad de transformación de señal que transforma la señal de audio o señal de voz entrada al menos en una de la señal de resolución de frecuencia alta y una señal de resolución temporal alta, una unidad de modelo psicoacústico que controla la unidad de transformación de señal, una unidad de codificación de dominio de tiempo que codifica la señal, transformada a través de la unidad de transformación dé señal, en función de un modelo de voz, y una unidad de cuantificación que cuantifica la señal salida al menos a partir de una de la unidad de transformación de señal y la unidad de codificación de dominio de tiempo.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo general, también podría proporcionarse un aparato que codifica una señal de audio/voz, el aparato incluye una unidad de transformación de señal que transforma una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta, una unidad de modelo psicoacústico que controla la unidad de transformación de señal, una unidad de determinación de baja velocidad que determina si la señal transformada se encuentra en una baja velocidad, una unidad de codificación de dominio de tiempo que codifica la señal transformada en función de un modelo de voz cuando la señal transformada se encuentra en la baja velocidad, una unidad de configuración de ruido temporal que configura la señal transformada, una unidad de estéreo de alta velocidad que codifica la información de estéreo de la señal configurada, y una unidad de cuantificación que cuantifica al menos una de la señal salida a partir de la unidad de estéreo de alta velocidad y una señal salida a partir de la unidad de codificación de dominio de tiempo.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo general, también podría proporcionarse un aparato que decodifica una señal de audio/voz, el aparato incluye una unidad de decisión de resolución que determina si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta en función de la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia, la información es incluida en un flujo de bits, una unidad de proceso inverso de cuantificación que realiza el proceso inverso de cuantificación del flujo de bits cuando la unidad de decisión de resolución determina que la señal es la señal de resolución de frecuencia alta, una unidad de decodificación de dominio de tiempo que decodifica la información adicional para la predicción lineal inversa del flujo de bits, y que restaura la señal de resolución temporal alta utilizando la información adicional, y una unidad de transformación de señal inversa que realiza la transformación inversa al menos de una de la señal de salida y una señal salida a partir de la unidad de proceso inverso de cuantificación hacia una señal de audio o señal de voz del dominio de tiempo.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo' general, también podría proporcionarse un aparato que decodifica una señal de audio/voz, el aparato incluye una unidad de proceso inverso de cuantificación que realiza el proceso inverso de cuantificación de un flujo de bits, un estéreo/decodificador de alta velocidad que decodifica la señal sometida al proceso inverso de cuantificación, un formador/decodificador de ruido temporal que procesa la señal decodificada a través del estéreo/decodificador de alta velocidad y una unidad de transformación de señal inversa que realiza la transformada inversa de la señal procesada en una señal de audio o señal de voz del dominio de tiempo, en donde el flujo de bits es generado mediante la transformación de la señal de audio o señal de voz entrada al menos en una de la señal de resolución de frecuencia alta y la señal de resolución temporal alta.
De acuerdo con las modalidades de ejemplo del presente concepto inventivo general, un método y aparato de codificación y decodificación de señal de audio/voz podrían codificar y decodificar, de manera efectiva, una señal de voz, una señal de audio y una señal mezclada de la señal de voz y la señal de audio.
Asimismo, de acuerdo con las modalidades de ejemplo del presente concepto inventivo general, un método y aparato de codificación y decodificación de señal de audio/voz podrían realizar la codificación y decodificación con menos bits, y con lo cual, podría mejorar la calidad del sonido.
Las utilidades adicionales de las modalidades de ejemplo serán señaladas en parte en la descripción que sigue, y en parte, serán aparentes a partir de la descripción, o podrían ser aprendidas por la práctica de las modalidades.
Las modalidades de ejemplo del presente concepto inventivo general también proporcionan un método de · codificación de señales de audio y voz, el método incluye recibir al menos una señal de audio y al menos una señal de voz, transformar al menos una de la señal de audio recibida y la señal de voz recibida por lo menos en una de una señal de resolución de frecuencia y una señal de resolución temporal, codificar la señal transformada y cuantificar al menos una de la señal transformada y la señal codificada.
Las modalidades de ejemplo del presente concepto inventivo general también proporcionan, un método de decodificación de señales de audio y voz, el método incluye determinar si una señal de cuadro actual es una señal de resolución de frecuencia o una señal de resolución temporal con la información en el flujo de bits de una señal recibida acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia, realizar el proceso inverso de cuantificación del flujo de bits cuando la señal recibida sea la señal de resolución de frecuencia, realizar la predicción lineal inversa a partir de la información en el flujo de bits y restaurar la señal de resolución temporal utilizando la información, y realizar la transformación inversa al menos de una de la señal sometida al proceso inverso de cuantificación y la señal de resolución temporal restaurada en una señal de audio o señal de voz del dominio de tiempo.
Breve Descripción de las Figuras Estas y/u otras características y utilidades del g presente concepto inventivo general serán aparentes y apreciadas con mayor facilidad a partir de la siguiente descripción de las modalidades de ejemplo, tomadas en conjunto con las figuras que la acompañan, de las cuales: La Figura 1 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general; La Figura 2 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 3 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 4 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 5 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 6 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 7 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 8 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 9 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 10 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 11 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 12 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 13 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 14 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con. las modalidades de ejemplo del presente concepto inventivo general; La Figura 15 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general ; La Figura 16 es un diagrama de flujo que ilustra un método de codificación de una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general; y La Figura 17 es un diagrama de flujo que ilustra un método de decodificación de una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general.
Descripción Detallada de la Invención A continuación, se hará referencia en detalle a las modalidades de ejemplo, los ejemplos de las cuales se ilustran en las figuras que la acompañan, en donde los mismos números de referencia se refieren a los mismos elementos a través de todas las. vistas. Las modalidades de ejemplo son descritas más adelante para explicar la presente descripción con referencia a las figuras.
La Figura 1 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 1, el aparato que codifica una señal de audio/voz podría incluir una unidad de transformación de señal 110, una unidad de modelo psicoacústico 120, una unidad de codificación de dominio de tiempo 130, una unidad de cuantificación 140, una unidad de procesamiento de estéreo paramétrico 150, una unidad de procesamiento de señal de frecuencia alta 160 y una unidad de multiplexión 170.
La unidad de transformación de señal 110 podría transformar una señal de audio o señal de voz entrada en una señal de resolución de frecuencia alta y/o una señal de resolución temporal alta.
La unidad de modelo psicoacústico 120 podría controlar la unidad de transformación de señal 110 para transformar la señal de audio o señal de voz entrada en la señal de resolución de frecuencia alta y/o la señal de resolución temporal alta.
De manera específica, la unidad de modelo psicoacústico 120 podría calcular un umbral de enmascaramiento para la cuantificación, y podría controlar la unidad de transformación de señal 110 para transformar la señal de audio o señal de voz entrada en la señal de resolución de frecuencia alta y/o señal de resolución temporal alta al menos con el umbral de enmascaramiento calculado.
I La unidad de codificación de; dominio de tiempo 130 podría codificar la señal, transformada a través de la unidad de transformación de señal 110, al menos con un modelo de voz .
En particular, la unidad de modelo psicoacústico 120 podría proporcionar a la unidad de codificación de dominio de tiempo 130 una señal de información para controlar la unidad de codificación de dominio de tiempo 130.
En esta instancia, la unidad de codificación de dominio de tiempo 130 podría incluir una unidad de predicción (no se ilustra) . La unidad de predicción podría codificar los datos mediante la aplicación del modelo de voz a la señal transformada a través de la unidad de transformación de señal 110, y realizar la remoción de la información de correlación. Asimismo, la unidad de predicción podría incluir un previsor de corto plazo y un previsor de largo plazo.
La unidad de cuantificación 140 podría cuantificar y codificar la señal salida a partir de la unidad de transformación de señal 110 y/o la unidad de codificación de dominio de tiempo 130.
En esta instancia, la unidad de cuantificación 140 podría incluir una unidad de Predicción Lineal de Excitación de Código (CELP) para modelar una señal en donde es removida la información de correlación. La unidad CELP no es ilustrada en la Figura 1.
La unidad de procesamiento de estéreo paramétrico 150 podría procesar la información de estéreo de la señal de audio o señal de voz entrada. La unidad de procesamiento de señal de frecuencia alta 160 podría procesar la información de frecuencia alta de la señal de audio o señal de voz entrada.
El aparato que codifica una señal de audio/voz es descrito en mayor detalle más adelante.
La unidad de transformación de señal 110 podría dividir los coeficientes de espectro en una pluralidad de bandas de frecuencia. La unidad de modelo psicoacústico 120 podría analizar una característica de espectro y determinar la resolución temporal o la resolución de frecuencia de cada una de la pluralidad de bandas de frecuencia.
Cuando una resolución temporal alta es adecuada para una banda de frecuencia particular, el coeficiente de espectro en la banda de frecuencia particular podría ser transformado a través de la unidad de transformación inversa utilizando un esquema de transformada tal como una unidad de Transformada de Solapado Modulado Inverso (IMLT) , y la señal transformada podría ser codificada a través de la unidad de codificación de dominio de tiempo 130. La unidad de transformación inversa podría ser incluida en la unidad de transformación de señal 110.
En esta instancia, la unidad de codificación de dominio de tiempo 130 podría incluir el previsor de corto plazo y el previsor de largo plazo.
Cuando la señal entrada es una señal de voz , la unidad de codificación de dominio de tiempo 130 podría reflejar, de manera eficiente, una característica de la unidad de generación de voz debido al incremento de la resolución temporal. De manera específica, el previsor de corto plazo podría procesar los datos recibidos a partir de la unidad de transformación de señal 110, y podría remover la información de correlación de corto plazo de las muestras en el dominio de tiempo. Asimismo, el previsor de largo plazo podría procesar los datos de señal residual en donde ha sido realizada la predicción de corto plazo, y con lo cual, podría remover la información de correlación de largo plazo.
La unidad de cuantificación 140 podría calcular el tamaño por etapa de una velocidad entrada de bits. Las muestras cuantificadas y la información adicional de la unidad de cuantificación 140 podrían ser procesadas para remover la información de correlación estadística que podría incluir, por ejemplo, la codificación aritmética o la codificación de Huffman.
La unidad de procesamiento de estéreo paramétrico 150 podría ser operada a una velocidad de bits menor de 32 kbps. Asimismo, una unidad de procesamiento estéreo extendida del Grupo de Expertos de Imagen en Movimiento (MPEG) podría ser utilizada como la unidad de procesamiento de estéreo paramétrico 150. La unidad de procesamiento de señal de frecuencia alta 160 podría codificar, de manera eficiente, la señal de frecuencia alta.
La unidad de multiplexión 170 podría dar salida a una señal de salida de una o más de las unidades descritas con anterioridad como un flujo de bits. El flujo de bits podría ser generado utilizando un esquema de compresión tal como la codificación aritmética, o la codificación de Huffman, o cualquier otra codificación adecuada de compresión.
La Figura 2 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 2, el aparato que decodifica una señal de audio/voz podría incluir una unidad de decisión de resolución 210, una unidad de decodificación de dominio de tiempo 220, una unidad de proceso inverso de cuantificación 230, una unidad de transformación de señal inversa 240, una unidad de procesamiento de señal de frecuencia alta 250 y una unidad de procesamiento de estéreo paramét ico 260.
La unidad de decisión de resolución 210 podría determinar si la señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta, en función de la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia. La información podría ser incluida en un flujo de bits.
La unidad de proceso inverso de cuantificación 230 podría realizar el proceso inverso de cuantificación del flujo de bits en función de una señal salida de la unidad de decisión de resolución 210.
La unidad de decodificación de dominio de tiempo.220 podría recibir la señal sometida al proceso inverso de cuantificación a partir de la unidad de proceso inverso de cuantificación 230, podría decodificar la información adicional para la predicción lineal inversa del flujo de bits y podría restaurar la señal de resolución temporal alta al menos con la información adicional y la señal sometida al proceso inverso de cuantificación.
La unidad de transformación de señal inversa 240 podría realizar la transformada* inversa de una señal salida a partir de la unidad de decodificación de dominio de tiempo 220 y/o la señal sometida al proceso inverso de cuantificación que proviene de la unidad de proceso inverso de cuantificación 230 en una señal de audio o señal de voz del dominio de tiempo.
Una Transformada Solapada Modulada de Variación de Frecuencia Inversa (FV-MLT) podría ser la unidad de transformación de señal inversa 240.
La unidad de procesamiento de señal de frecuencia alta 250 podría procesar una señal de frecuencia alta de la señal transformada inversa, y la unidad de procesamiento de estéreo paramétrico 260 podría procesar la información de estéreo de la señal transformada inversa.
El flujo de bits podría ser entrado a la unidad de proceso inverso de cuantificación 230, la unidad de procesamiento de señal de frecuencia alta 250, y la unidad de procesamiento de estéreo paramétrico 260 para que sea decodificada .
La Figura 3 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 3 , el aparato que codifica una señal de audio/voz podría incluir una unidad de transformación de señal 310, una unidad de modelo psicoacústico 320, una unidad de configuración de ruido temporal 330, una unidad de estéreo de velocidad alta 340, una unidad de cuantificación 350, una unidad de procesamiento de señal de frecuencia alta 360 y una unidad de multiplexión 370.
La unidad de transformación de señal 310 podría transformar una señal de audio o señal de voz entrada en una señal de resolución de frecuencia alta y/o señal de resolución temporal alta.
Una Transformada del Coseno Discreto Modificado (MDCT) podría ser utilizada como la unidad de transformación de señal 310.
La unidad de modelo psicoacústico 320 podría controlar la unidad de transformación de señal 310 para transformar la señal de audio o señal de voz entrada en la señal de resolución de frecuencia alta y/o la señal de resolución temporal alta.
La unidad de configuración de ruido temporal 330 podría configurar el ruido temporal de la señal transformada.
La unidad de estéreo de velocidad alta 340 podría codificar la información de estéreo de la señal transformada.
La unidad de cuantificación 350 podría cuantificar la señal salida a partir de la unidad de configuración de ruido temporal 330 y/o la unidad de estéreo de velocidad alta 340.
La unidad de procesamiento de señal de frecuencia alta 360 podría procesar una señal de frecuencia alta de la señal de audio o la señal de voz .
La unidad de multiplexión 370 podría dar salida a una señal de salida de cada una de las unidades descritas con anterioridad como un flujo de bits. El flujo de bits podría ser generado utilizando un esquema de compresión tal¦ como la codificación aritmética, o la codificación de Huffman, o cualquier otra codificación adecuada.
La Figura 4 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 4, el aparato que decodifica una señal de audio/voz podría incluir una unidad de proceso inverso de cuantificación 410, un estéreo/decodificador de velocidad alta 420, un formador/decodificador de ruido temporal 430, una unidad de transformación de señal inversa 440 y una unidad de procesamiento de señal de frecuencia alta 450.
La unidad de proceso inverso de cuantificación 410 podría realizar el proceso inverso de cuantificación de un flujo de bits.
El estéreo/decodificador de velocidad alta 420 podría decodificar la señal sometida al proceso inverso de cuantificación. El formador/decodificador de ruido temporal 430 podría decodificar una señal en donde la configuración temporal es realizada en un aparato que codifica una señal de audio/voz .
La unidad de transformación de señal inversa 440 podría realizar la transformada inversa de la señal decodificada. en una señal de audio o señal de voz del dominio de tiempo. Una MDCT inversa podría ser. utilizada como la unidad de transformación de señal inversa 440.
La unidad de procesamiento de señal de frecuencia alta 450 podría procesar una señal de frecuencia alta de la señal decodificada transformada inversa.
La Figura 5 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 5, una unidad CELP podría ser incluida en la unidad de codificación de dominio de tiempo 520 del aparato que codifica una señal de audio/voz, mientras que la unidad CELP podría ser incluida en la unidad de cuantificación 140 en la Figura 1.
Es decir, la unidad de . codificación de dominio de tiempo 520 podría incluir un previsor de corto plazo, un previsor de largo plazo y la unidad CELP . La unidad CELP podría indicar el módulo de modelo de excitación para modelar una señal en donde es removida la información de correlación.
Cuando una unidad de transformación de señal transforma una señal de audio o señal de voz entrada en una señal de resolución temporal alta bajo el control de una unidad de modelo psicoacústico, la unidad de codificación de dominio de tiempo 130 podría codificar la señal de resolución temporal alta transformada sin cuantificar ¦ la señal de resolución temporal alta en la unidad de cuantificación de espectro 510 o, de manera alternativa, minimizando la cuantificación de la señal de resolución temporal alta en la unidad de cuantificación de espectro 510.
La unidad CELP incluida en la unidad de codificación de dominio de tiempo 520 podría codificar una señal residual de la información de correlación de corto plazo y la información de correlación de largo plazo.
La Figura 6 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 6, el aparato que codifica una señal de audio/voz ilustrado en la Figura 1, además podría incluir una unidad de cambio 610.
La unidad de cambio 610 podría seleccionar cualquiera una o más cuantificaciones de la unidad de cuantificación 620 y la codificación de la unidad de codificación de dominio de tiempo 630 al menos con la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia. La unidad de cuantificación 620 podría ser la unidad de cuantificación de espectro .
La Figura 7 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 7, el aparato que decodifica una señal de audio/voz ilustrado en la Figura 2 además podría incluir una unidad de cambio 710. La unidad de cambio 710 podría controlar un cambio en la unidad de decodificación de dominio de tiempo 730 o en la unidad de proceso inverso de cuantificación de espectro 720 en función al menos de la determinación de la unidad de decisión de resolución.
La Figura 8 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 8, el aparato que codifica una señal de audio/voz ilustrado en la Figura 1, además podría incluir una unidad de muestreo descendente 810.
La unidad de muestreo descendente 810 podría muestrear hacia abajo una señal entrada en una señal de frecuencia baja. La señal de frecuencia baja podría ser generada a través del muestreo descendente, y el muestreo descendente podría ser realizado cuando la señal de frecuencia baja se encuentre a una velocidad doble de una alta velocidad y baja velocidad. Es decir, la señal de frecuencia baja podría ser utilizada cuando una frecuencia de muestreo del esquema de codificación de señal de frecuencia baja es operada a una baja velocidad de muestreo que corresponde con la mitad o una cuarta parte de la velocidad de muestreo de la unidad de procesamiento de señal de frecuencia alta. Cuando la unidad de procesamiento de estéreo paramétrico es incluida en el aparato que codifica una señal de audio/voz, el muestreo descendente podría ser realizado cuando la unidad de procesamiento de estéreo paramétrico realice la síntesis de Filtro de Espejo de Cuadratura (QMF) .
En esta instancia, la alta velocidad podría estar a una velocidad más grande de 64 kbps , y la baja velocidad podría estar a una velocidad menor de 64 kbps.
La Figura 9 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Una unidad de decisión de resolución 910 podría determinar si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta, en función al menos en parte de la información 5 acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia. La información podría ser incluida en un flujo de bits.
Una unidad de proceso inverso de cuantificación 920 podría realizar el proceso inverso de cuantificación al flujo 10 de bits en función de una . señal salida de la unidad de decisión de resolución 910. > Una unidad de decodificación de dominio de tiempo 930 podría recibir una señal residual codificada a partir de la unidad de proceso inverso de cuantificación 920, podría 15 decodificar la información adicional para la predicción lineal inversa del flujo de bits y podría restaurar la señal de resolución de frecuencia alta utilizando la información adicional y la señal residual.
Una unidad de transformación de señal inversa 940 20 podría realizar la transformada inversa de una señal de salida de la unidad de decodificación de dominio de tiempo 930 y/o la señal sometida al proceso inverso de cuantificación de la unidad de proceso inverso de cuantificación 920 en una señal de audio o señal de voz del ! 25 dominio de tiempo.
En esta instancia, una unidad de procesamiento de señal de frecuencia alta 950 podría realizar el muestreo ascendente en el aparato que decodifica una señal de audio/voz de la Figura 9.
La Figura 10 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general . .
Con referencia a la Figura 10, el aparato que codifica una señal de audio/voz ilustrado en la Figura 5 además podría incluir una unidad de muestreo descendente 1010. Es decir, una señal de frecuencia baja podría ser generada a través del muestreo descendente.
Cuando una unidad de procesamiento de estéreo paramétrico 1020 es aplicada, la unidad de muestreo descendente 1010 podría realizar el muestreo descendente cuando la unidad de procesamiento de estéreo paramétrico 1020 podría realizar la síntesis QMF para la generación de una señal de mezclado descendente. Una unidad de codificación de dominio de tiempo 1030 podría incluir un previsor de corto plazo, un previsor de largo plazo y una unidad CELP.
La Figura 11 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general.
Una unidad de decisión de resolución 1110 podría determinar si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta, en función de la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia. La información podría ser incluida en un flujo de bits.
Una unidad de proceso inverso de cuantificación de espectro 1130 podría realizar el proceso inverso de cuantificación del flujo de bits en función al menos en parte de una señal de salida de la unidad de decisión de resolución 1110, cuando la unidad de decisión de resolución 1110 determine que la señal de cuadro actual es la señal de resolución de frecuencia alta.
Cuando la unidad de decisión de resolución 1110 determine que la señal de cuadro actual es la señal de resolución temporal alta, una unidad de decodificación de dominio de tiempo 1120 podría restaurar la señal de resolución temporal alta.
Una unidad de transformación de señal inversa 1140 podría realizar la transformada inversa de una señal de salida de la unidad de decodificación de dominio de tiempo 1120 y/o la señal sometida al proceso inverso de cuantificación de la unidad de proceso inverso de cuantificación de espectro 1130 en una señal de audio o señal de voz del dominio de tiempo.
Asimismo, una unidad de procesamiento de señal de frecuencia alta 1150 podría realizar el muestreo ascendente en el aparato que decodifica una señal de audio/voz de la Figura 11.
La Figura 12 es un diagrama de bloque que ilustra un aparato que codifica una señal- de audio/voz de acuerdo con las · modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 12, el aparato que codifica una señal de audio/voz ilustrado en la Figura 6 podría incluir una unidad de muestreo descendente 1210. Es decir, una señal de frecuencia baja podría ser generada a través del muestreo descendente.
Cuando la unidad de procesamiento de estéreo paramétrico 1220 es aplicada, la unidad de muestreo descendente 1210 podría realizar el muestreo descendente cuando la unidad de procesamiento de estéreo paramétrico 1220 realice una síntesis Q F.
Un factor de muestreo ascendente/descendente del aparato que codifica una señal de audio/voz de la Figura 12 podría ser por ejemplo, una mitad o una cuarta parte de la velocidad de muestreo de una¡ unidad de procesamiento de señal de frecuencia alta. Es decir, cuando una señal es entrada en 48, 24 ó 12 kHz, podría estar disponible a través del muestreo ascendente/descendente.
La Figura 13 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general . : Con referencia a la Figura 13, el aparato que decodifica una señal de audio/voz ilustrado en la Figura 2 además podría incluir una unidad de cambio. Es decir, la unidad de cambio podría controlar el cambio en una unidad de decodificación de dominio de tiempo 1320 o en una unidad de proceso inverso de cuantificación de espectro 1310.
La Figura 14 es un diagrama de bloque que ilustra un aparato que codifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general.
Con referencia a la Figura 14, el aparato que codifica una señal de audio/voz ilustrado en la Figura 1 y el aparato que codifica una señal de audio/voz ilustrado en la Figura 3 podrían ser combinados al menos en parte .
Es decir, cuando una señal transformada se encuentra a una baja velocidad como resultado de la determinación a través de la unidad de determinación de baja velocidad 1430 en función de una baja velocidad o alta velocidad predeterminada, la unidad de transformación de señal 1410, la unidad de codificación de dominio de tiempo 1440 y la unidad de cuantificación 1470 podrían ser operadas. Cuando la señal transformada se encuentra en la alta velocidad, la unidad de transformación de señal 1410, la unidad de configuración de ruido temporal 1450 y la unidad de estéreo de alta velocidad 1460 podrían ser operadas.
Una unidad de procesamiento de estéreo paramétrico 1481 y una unidad de procesamiento de señal de frecuencia alta 1491 podrían ser encendidas/apagadas en función de un estándar predeterminado. Asimismo, la unidad de estéreo de alta velocidad 1460 y la unidad de procesamiento de estéreo paramétrico 1481 no podrían ser operadas de manera simultánea. Asimismo, la unidad de procesamiento de señal de frecuencia alta 1491 y la unidad de procesamiento de estéreo paramétrico 1481 -podrían ser operadas, de manera respectiva, bajo el control de una unidad de determinación de procesamiento de señal de frecuencia alta 1490 y una unidad de determinación de procesamiento de estéreo paramétrico 1480 en función de la información predeterminada.
La Figura 15 es un diagrama de bloque que ilustra un aparato que decodifica una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
Con referencia a la Figura 15, el aparato que decodifica una señal de audio/voz ilustrado en la Figura 2 y el aparato que decodifica una señal de audio/voz ilustrado en la Figura 4 podrían ser combinados, al menos en parte.
Es decir, cuando una señal transformada se encuentra en una alta velocidad como resultado de la determinación de la unidad de determinación de baja velocidad 1510, un estéreo/decodificador de alta velocidad 1520, un ormador/decodificador de ruido temporal 1530 y una unidad de transformación . de señal inversa 1540 podrían ser operadas. Cuando la señal transformada se encuentra en una baja velocidad, una unidad de decisión de resolución 1550, una unidad de decodificación de dominio de tiempo 1560 y una unidad de procesamiento de señal de frecuencia alta 1570 podrían ser operadas. Asimismo, la unidad de procesamiento de señal de frecuencia alta 1570 y la unidad de procesamiento de estéreo paramétrico 1580 podrían ser operadas bajo el control de una unidad de determinación de procesamiento de señal de frecuencia alta y una unidad de determinación de procesamiento de estéreo paramétrico en función de la información predeterminada, de manera respectiva.
La Figura 16 es un diagrama de flujo que ilustra un método de codificación de una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general.
En la operación S1610, una señal de audio o señal de voz entrada podría ser transformada en el dominio de frecuencia. En la operación S1620, podría determinarse si una transformada en el dominio de tiempo será realizada.
Una operación del muestreo descendente de la señal de audio o señal de voz entrada además podría ser incluida.
De acuerdo al menos con . el resultado de la determinación en la operación S1620, la señal de audio o señal de voz entrada podría ser transformada en una señal de resolución de frecuencia alta y/o una señal de resolución temporal alta en la operación S1630.
Es decir, cuando la transformada en el dominio de tiempo vaya a ser efectuada, la señal de audio o señal de voz entrada podría ser transformada en la señal de resolución temporal alta y podría ser cuantificada en la operación S1630. Cuando la transformada en el dominio de tiempo no sea realizada, la señal de audio o señal de voz entrada podría ser cuantificada y codificada en la operación S1640.
La Figura 17 es un diagrama de flujo que ilustra un método de decodificación de una señal de audio/voz de acuerdo con las modalidades de ejemplo del presente concepto inventivo general .
En la operación S1710, podría determinarse si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta.
En esta instancia, la determinación podría estar basada en la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia, y la información podría ser incluida en un flujo de bits. ^ _ En la operación S1720, el flujo de bits podría ser sometido al proceso inverso de cuantificación.
En la operación S1730, la señal sometida al proceso 5 inverso de cuantificación podría ser recibida, la información adicional para la predicción lineal inversa podría ser decodificada a partir del flujo de bits, y la señal de resolución temporal podría ser restaurada utilizando la información adicional y la señal residual codificada. 10 En la operación S1740, la señal salida a partir de la unidad de decodificación de dominio de tiempo y/o la señal ; sometida al proceso inverso de cuantificación de una unidad de proceso inverso de cuantificación podría ser transformada inversa en una señal de audio o señal de voz del dominio de 15 tiempo.
El presente concepto inventivo, general también puede ser incluido como códigos susceptibles de ser leídos por computadora en un medio susceptible de ser leído por computadora. El medio susceptible de ser . leído por 20 computadora puede incluir un medio de grabación susceptible de ser leído por computadora y un medio de transmisión susceptible de ser leído por computadora. El medio de grabación susceptible de ser leído por computadora es cualquier dispositivo de almacenamiento de datos que puede 25 almacenar datos como un programa que puede ser posteriormente leído por un sistema de computadora. Los ejemplos del medio de grabación susceptible de ser leído por computadora incluyen una memoria sólo de lectura (ROM) , una memoria de acceso aleatorio (RAM) , CD-ROMs, cintas magnéticas, discos flexibles y dispositivos ópticos de almacenamiento de datos. El medio de grabación susceptible de ser leído por computadora también puede ser distribuido a través de la red conectada con sistemas de computadora, de modo que el código susceptible de ser leído por computadora es almacenado y ejecutado en un modo distribuido. El medio de transmisión susceptible de ser leído por computadora puede transmitirse a través de ondas portadoras o señales (por ejemplo, la transmisión alambrada o inalámbrica de datos a través de la Internet) . Asimismo, programas funcionales, códigos y segmentos de código para conseguir el presente concepto inventivo general, pueden ser interpretados con facilidad por programadores expertos en la técnica a la cual se refiere él presente concepto inventivo general.
Aunque varias modalidades de ejemplo del presente concepto inventivo general han sido ilustradas y descritas, sería apreciado por aquellas personas expertas en la técnica que podrían realizarse cambios en estas modalidades de ejemplo sin apartarse de los principios y espíritu del concepto inventivo general, el alcance del cual es definido en las reivindicaciones y sus equivalentes .
Se hace constar que con relación a esta fecha el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (1)

  1. REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones: 1. Un aparato que codifica una señal de audio/voz, caracterizado porque comprende: una unidad de transformación de señal que transforma una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta; una unidad de modelo psicoacústico que controla la unidad de transformación de señal; una unidad de codificación de dominio de tiempo que codifica la señal, transformada a través de la unidad de transformación de señal, en función del modelo de voz; y una unidad de cuantificación que cuantifica la señal salida al menos a partir de una de la unidad de transformación de señal y la unidad de codificación de dominio de tiempo. 2. El aparato de conformidad con la reivindicación 1, caracterizado porque la unidad de cuantificación incluye una Predicción Lineal de Excitación de Código (CELP, por sus siglas en inglés) para modelar una señal en donde la información de correlación es removida. 3. Un aparato que codifica una señal de audio/voz, caracterizado porque comprende: una unidad de procesamiento de estéreo paramétrico que procesa la información de estéreo de una señal de audio o señal de voz entrada; una unidad de procesamiento de señal de frecuencia alta que procesa una señal de frecuencia alta de la señal de audio o señal de voz entrada; una unidad de transformación de señal que transforma la señal de audio o señal de voz entrada al menos en una de la señal de resolución de frecuencia alta y una señal de resolución temporal alta; una unidad de modelo psicoacústico que controla la unidad de transformación de señal; una unidad de codificación de dominio de tiempo que codifica la señal, transformada a través de la unidad de transformación de señal, en función de un modelo de voz; y una unidad de cuantificación que cuantifica la señal salida al menos a partir de una de la unidad de transformación de señal y la unidad de codificación de dominio de tiempo. 4. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de codificación de dominio de tiempo incluye una CELP para modelar una señal en donde la información de correlación es removida. 5. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de cuantificación es una unidad de cuantificación de espectro, y además comprende: una unidad de cambio que selecciona cualquiera una de las señales salidas a partir de la unidad de cuantificación de espectro y la unidad de codificación de dominio de tiempo en función de si la señal de audio o señal de voz transformada es la señal de resolución de frecuencia alta o la señal de resolución temporal alta. 6. El aparato de conformidad con la reivindicación 3, caracterizado además porque comprende: una unidad de muestreo descendente que realiza el muestreo descendente a la señal de audio o señal de voz . 7. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de transformación de señal incluye al menos una de una Transformada Solapada Modulada Variable de Frecuencia (FV-MLT, por sus siglas en inglés) y una Transformada del Coseno Discreto Modificado (MDCT, por sus siglas en inglés) . 8. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de modelo psicoacústico proporciona la unidad de cuantificación con la información acerca de un ruido durante la cuantificación. 9. El aparato de conformidad con la reivindicación 3, caracterizado porque la unidad de codificación de dominio de tiempo además comprende: una unidad de predicción que aplica el modelo de voz en la señal transformada a través de la unidad de transformación de señal y que remueve la información de correlación. 10. Un aparato que decodifica una señal de audio/voz, caracterizado porque comprende: una unidad de decisión de resolución que determina si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta en función de la información acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia, la información es incluida en un flujo de bits; una unidad de proceso inverso de cuantificación que realiza el proceso inverso de cuantificación del flujo de bits cuando la unidad de decisión de resolución determina que la señal es la señal de resolución de frecuencia alta; una unidad de decodificación de dominio de tiempo que decodifica la información adicional para la predicción lineal inversa del flujo de bits, y que restaura la señal de resolución temporal alta utilizando la información adicional; y una unidad de transformación de señal inversa que realiza la transformada inversa al menos de una de la señal de salida a partir de la unidad de decodificación de dominio de tiempo y una señal de salida a partir de la unidad de proceso inverso de cuantificación hacia una señal de audio o señal de voz del dominio de tiempo. 11. El aparato de conformidad con la reivindicación 10, caracterizado además porque comprende al menos una de: una unidad de decodificación de señal de frecuencia alta que procesa una señal de frecuencia alta de la señal transformada inversa; y una unidad de procesamiento de estéreo paramétrico que procesa la información de estéreo de la señal transformada inversa. 12. Un aparato que codifica una señal de audio/voz, caracterizado porque comprende: una unidad de transformación de señal que transforma una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta; una unidad de modelo psicoacústico que controla la unidad de transformación de señal; una unidad de configuración de ruido temporal que configura al menos una de la señal de resolución de frecuencia alta transformada y la señal de resolución temporal alta transformada; una unidad de estéreo de alta velocidad que codifica la información de estéreo de la señal transformada; y una unidad de cuantificación que cuantifica la señal salida a partir al menos de una de la unidad de configuración i de ruido temporal y la unidad de estéreo de alta velocidad, i 13. El aparato de conformidad con la reivindicación 12, caracterizado porque además comprende: 5 una unidad de procesamiento de señal de frecuencia alta que procesa una señal de frecuencia alta de la señal de audio o la señal de voz . 1 . Un aparato que decodifica una señal de audio/voz , caracterizado porque comprende : 10 una unidad de proceso inverso de cuantificación que realiza el proceso inverso de cuantificación de un flujo de bits; un estéreo/decodificador de alta velocidad que decodifica la señal sometida al proceso inverso de cuantificación; 15 un formador/decodificador de ruido temporal que procesa la señal decodificada a través del estéreo/decodificador de alta velocidad; y una unidad de transformación de señal inversa que realiza la transformada inversa de la señal procesada en una 20 señal de audio o señal de voz del dominio de tiempo, en donde el flujo de bits es generado mediante la transformación de la señal de audio o señal de voz entrada al menos en una de la señal de resolución de frecuencia alta y la señal de resolución temporal alta. 25 15. El aparato de conformidad con la reivindicación 14, caracterizado además porque comprende: una unidad de procesamiento de señal de frecuencia alta que procesa una señal de frecuencia alta de la señal transformada inversa. 16. Un aparato que codifica una señal de audio/voz, caracterizado porque comprende: una unidad de transformación de señal que transforma una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta; una unidad de modelo psicoacústico que controla la unidad de transformación de señal; una unidad de determinación de baja velocidad que determina si la señal transformada tiene una baja velocidad; una unidad de codificación de dominio de tiempo que codifica la señal transformada en función de un modelo de voz cuando la señal transformada tiene la baja velocidad; una unidad de configuración de ruido temporal que configura la señal transformada; una unidad de estéreo de alta velocidad que codifica la información de estéreo de la señal configurada; y una unidad de cuantificación que cuantifica al menos una de la señal salida a partir de la unidad de estéreo de alta velocidad y una señal salida a partir de la unidad de codificación de dominio de tiempo. 17. El aparato de conformidad con la reivindicación 16, caracterizado además porque comprende: una unidad de determinación de procesamiento de estéreo parametrico que determina si opera una unidad de procesamiento de estéreo paramétrico en función de la información predeterminada; la unidad de procesamiento de estéreo paramétrico procesa la información de estéreo de una señal de frecuencia alta entrada cuando se determina que la unidad de procesamiento de estéreo paramétrico será operada; una unidad de determinación de procesamiento de señal de frecuencia alta que determina si opera una unidad de procesamiento de señal de frecuencia alta en función de otra información predeterminada; y la unidad de procesamiento de señal de frecuencia alta procesa una señal de frecuencia alta entrada . cuando se determina que la unidad de procesamiento de señal de frecuencia alta será operada. 18. Un método de codificación de una señal de audio/voz , caracterizado porque comprende : transformar una señal de audio o señal de voz entrada al menos en una de una señal de resolución de frecuencia alta y una señal de resolución temporal alta, y controlar la señal transformada en función de un modelo psicoacústico; codificar por tiempo la señal transformada en función al menos en parte de un modelo de voz; y cuantificar al menos una de la señal transformada y la señal codificada por tiempo. 19. Un método de decodificación de una señal de audio/voz, caracterizado porque comprende: determinar si una señal de cuadro actual es una señal de resolución de frecuencia alta o una señal de resolución temporal alta, en función al menos en parte de la información incluida en el flujo de bits acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia; realizar el proceso inverso de cuantificación del flujo de bits cuando la señal es determinada como la señal de resolución de frecuencia alta decodificar la información adicional para la predicción lineal inversa a partir del flujo de bits y restaurar la señal de resolución temporal alta utilizando la información adicional; y realizar la transformación inversa al menos de una de la señal restaurada y la señal sometida al proceso inverso de cuantificación en una señal de audio o señal de voz del dominio de tiempo. 20. Un método de codificación de una señal de audio/voz, caracterizado porque comprende: recibir al menos una señal de audio y al menos una señal de voz ; transformar al menos una de la señal de audio recibida y la señal de voz recibida por lo menos en una de una señal de resolución de frecuencia y una señal de resolución temporal; codificar la señal transformada; y cuantificar al menos una de la señal transformada y la señal codificada. 21. Un método de decodificación de una señal de audio/voz, caracterizado porque comprende: determinar si una señal de cuadro actual es una señal de resolución de frecuencia o una señal de resolución temporal con la información en el flujo de bits de una señal recibida acerca de la codificación de dominio de tiempo o la codificación de dominio de frecuencia; realizar el proceso inverso de cuantificación del flujo de bits cuando la señal recibida sea la señal de resolución de frecuencia; realizar la predicción lineal inversa a partir de la información en el flujo de bits y restaurar la señal de resolución temporal utilizando la información; y realizar la transformación inversa al menos de una de la señal sometida al proceso inverso de cuantificación y la señal de resolución temporal restaurada en una señal de audio o señal de voz del dominio de tiempo. ,
MX2011000557A 2008-07-14 2009-07-14 Metodo y aparato de codificacion y decodificacion de señal de audio/voz. MX2011000557A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020080068377A KR101756834B1 (ko) 2008-07-14 2008-07-14 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
PCT/KR2009/003870 WO2010008185A2 (en) 2008-07-14 2009-07-14 Method and apparatus to encode and decode an audio/speech signal

Publications (1)

Publication Number Publication Date
MX2011000557A true MX2011000557A (es) 2011-03-15

Family

ID=41505940

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2011000557A MX2011000557A (es) 2008-07-14 2009-07-14 Metodo y aparato de codificacion y decodificacion de señal de audio/voz.

Country Status (10)

Country Link
US (3) US8532982B2 (es)
EP (1) EP2313888A4 (es)
JP (1) JP2011528135A (es)
KR (1) KR101756834B1 (es)
CN (3) CN105957532B (es)
BR (1) BRPI0916449A8 (es)
IL (1) IL210664A (es)
MX (1) MX2011000557A (es)
MY (1) MY154100A (es)
WO (1) WO2010008185A2 (es)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
KR101756834B1 (ko) 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
TWI433137B (zh) * 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
CA3045686C (en) 2010-04-09 2020-07-14 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
KR101790641B1 (ko) 2013-08-28 2017-10-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 하이브리드 파형-코딩 및 파라미터-코딩된 스피치 인핸스
CN103473836B (zh) * 2013-08-30 2015-11-25 福建星网锐捷通讯股份有限公司 一种面向安全的具有声音变调功能的室内机及其智能楼宇对讲系统
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
CN105957533B (zh) * 2016-04-22 2020-11-10 杭州微纳科技股份有限公司 语音压缩方法、语音解压方法及音频编码器、音频解码器
US10141009B2 (en) 2016-06-28 2018-11-27 Pindrop Security, Inc. System and method for cluster-based audio event detection
US9824692B1 (en) 2016-09-12 2017-11-21 Pindrop Security, Inc. End-to-end speaker recognition using deep neural network
CA3179080A1 (en) 2016-09-19 2018-03-22 Pindrop Security, Inc. Channel-compensated low-level features for speaker recognition
US10325601B2 (en) 2016-09-19 2019-06-18 Pindrop Security, Inc. Speaker recognition in the call center
WO2018053531A1 (en) 2016-09-19 2018-03-22 Pindrop Security, Inc. Dimensionality reduction of baum-welch statistics for speaker recognition
US10397398B2 (en) 2017-01-17 2019-08-27 Pindrop Security, Inc. Authentication using DTMF tones
CN108768587B (zh) * 2018-05-11 2021-04-27 Tcl华星光电技术有限公司 编码方法、设备及可读存储介质
WO2020159917A1 (en) 2019-01-28 2020-08-06 Pindrop Security, Inc. Unsupervised keyword spotting and word discovery for fraud analytics
WO2020163624A1 (en) 2019-02-06 2020-08-13 Pindrop Security, Inc. Systems and methods of gateway detection in a telephone network
WO2020164752A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs
WO2020198354A1 (en) 2019-03-25 2020-10-01 Pindrop Security, Inc. Detection of calls from voice assistants
US12015637B2 (en) 2019-04-08 2024-06-18 Pindrop Security, Inc. Systems and methods for end-to-end architectures for voice spoofing detection
CN111341330B (zh) * 2020-02-10 2023-07-25 科大讯飞股份有限公司 音频编解码方法、存取方法及其相关设备及存储装置
CN116018642A (zh) * 2020-08-28 2023-04-25 谷歌有限责任公司 在音频编解码器中维持感觉不和谐和声音定位提示的不变性

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
JP3158932B2 (ja) * 1995-01-27 2001-04-23 日本ビクター株式会社 信号符号化装置及び信号復号化装置
JP3342996B2 (ja) * 1995-08-21 2002-11-11 三星電子株式会社 多チャネルオーディオ符号化器及び符号化方法
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19730129C2 (de) * 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
CA2246532A1 (en) * 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
AU754877B2 (en) * 1998-12-28 2002-11-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method and devices for coding or decoding an audio signal or bit stream
JP4907826B2 (ja) * 2000-02-29 2012-04-04 クゥアルコム・インコーポレイテッド 閉ループのマルチモードの混合領域の線形予測音声コーダ
US6947888B1 (en) 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP4399185B2 (ja) * 2002-04-11 2010-01-13 パナソニック株式会社 符号化装置および復号化装置
WO2003085644A1 (en) * 2002-04-11 2003-10-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
JP2005141121A (ja) * 2003-11-10 2005-06-02 Matsushita Electric Ind Co Ltd オーディオ再生装置
JP2007528025A (ja) * 2004-02-17 2007-10-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法
EP1873753A1 (en) * 2004-04-01 2008-01-02 Beijing Media Works Co., Ltd Enhanced audio encoding/decoding device and method
CN1677490A (zh) 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
WO2005096508A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Equipement de codage et de decodage audio ameliore, procede associe
KR101037931B1 (ko) 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
KR100634506B1 (ko) * 2004-06-25 2006-10-16 삼성전자주식회사 저비트율 부호화/복호화 방법 및 장치
CN101010726A (zh) * 2004-08-27 2007-08-01 松下电器产业株式会社 音频解码器、方法以及程序
RU2007107348A (ru) * 2004-08-31 2008-09-10 Мацусита Электрик Индастриал Ко., Лтд. (Jp) Устройство и способ генерирования стереосигнала
US7548853B2 (en) 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
CN100561576C (zh) 2005-10-25 2009-11-18 芯晟(北京)科技有限公司 一种基于量化信号域的立体声及多声道编解码方法与系统
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
KR101237413B1 (ko) * 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
CN101395881B (zh) * 2005-12-16 2012-06-27 杜比国际公司 用于产生和解释具有带有指定入口点的一系列段的数据流的设备、方法和计算机程序
US7809018B2 (en) * 2005-12-16 2010-10-05 Coding Technologies Ab Apparatus for generating and interpreting a data stream with segments having specified entry points
CN101136202B (zh) * 2006-08-29 2011-05-11 华为技术有限公司 音频信号处理系统、方法以及音频信号收发装置
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR100964402B1 (ko) 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR100883656B1 (ko) 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
MY146431A (en) * 2007-06-11 2012-08-15 Fraunhofer Ges Forschung Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
EP2201566B1 (en) * 2007-09-19 2015-11-11 Telefonaktiebolaget LM Ericsson (publ) Joint multi-channel audio encoding/decoding
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
KR101756834B1 (ko) * 2008-07-14 2017-07-12 삼성전자주식회사 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치

Also Published As

Publication number Publication date
MY154100A (en) 2015-04-30
US8532982B2 (en) 2013-09-10
IL210664A0 (en) 2011-03-31
EP2313888A2 (en) 2011-04-27
WO2010008185A2 (en) 2010-01-21
US20140012589A1 (en) 2014-01-09
CN105913851B (zh) 2019-12-24
US20160254005A1 (en) 2016-09-01
CN105913851A (zh) 2016-08-31
US9728196B2 (en) 2017-08-08
BRPI0916449A8 (pt) 2017-11-28
KR101756834B1 (ko) 2017-07-12
JP2011528135A (ja) 2011-11-10
US20100010807A1 (en) 2010-01-14
CN105957532A (zh) 2016-09-21
CN105957532B (zh) 2020-04-17
KR20100007651A (ko) 2010-01-22
CN102150202B (zh) 2016-08-03
EP2313888A4 (en) 2016-08-03
CN102150202A (zh) 2011-08-10
WO2010008185A3 (en) 2010-05-27
IL210664A (en) 2014-07-31
US9355646B2 (en) 2016-05-31

Similar Documents

Publication Publication Date Title
US9728196B2 (en) Method and apparatus to encode and decode an audio/speech signal
JP6173288B2 (ja) マルチモードオーディオコーデックおよびそれに適応されるcelp符号化
RU2608878C1 (ru) Регулировка уровня во временной области для декодирования или кодирования аудиосигналов
CN105264597B (zh) 感知转换音频编码中的噪声填充
EP2186087A1 (en) Improved transform coding of speech and audio signals
AU2003243441B2 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US20100268542A1 (en) Apparatus and method of audio encoding and decoding based on variable bit rate
CN109074812B (zh) 用于具有全局ild和改进的中/侧决策的mdct m/s立体声的装置和方法
EP2122615A1 (en) Apparatus and method for encoding an information signal
US20080140428A1 (en) Method and apparatus to encode and/or decode by applying adaptive window size
KR20150110708A (ko) 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조
KR102622804B1 (ko) 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합
CN111344784B (zh) 控制编码器和/或解码器中的带宽
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
US20170206905A1 (en) Method, medium and apparatus for encoding and/or decoding signal based on a psychoacoustic model
KR101847076B1 (ko) 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치
Leegaard et al. Practical design of delta-sigma multiple description audio coding
KR20240066586A (ko) 복소수 양자화를 이용하는 오디오 신호의 부호화 및 복호화 방법 및 장치
Mandal et al. Digital Audio Compression
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
FG Grant or registration