ES2960089T3 - Procedimiento y aparato para la ocultación de errores de trama y procedimiento y aparato para la decodificación de audio - Google Patents

Procedimiento y aparato para la ocultación de errores de trama y procedimiento y aparato para la decodificación de audio Download PDF

Info

Publication number
ES2960089T3
ES2960089T3 ES13800914T ES13800914T ES2960089T3 ES 2960089 T3 ES2960089 T3 ES 2960089T3 ES 13800914 T ES13800914 T ES 13800914T ES 13800914 T ES13800914 T ES 13800914T ES 2960089 T3 ES2960089 T3 ES 2960089T3
Authority
ES
Spain
Prior art keywords
frame
error
unit
signal
current frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13800914T
Other languages
English (en)
Inventor
Ho-Sang Sung
Nam-Suk Lee
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of ES2960089T3 publication Critical patent/ES2960089T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Un método para ocultar un error de trama comprende: una etapa de seleccionar un modo FEC basado en el estado de la trama actual y el estado de la trama antes de la trama actual en la señal en el dominio del tiempo generada después de un proceso de transformación inversa de tiempo-frecuencia; y una etapa de realizar, basándose en el modo FEC seleccionado, un proceso de ocultación de errores en el dominio del tiempo correspondiente a la trama actual que es una trama de error o a la trama actual que es una trama normal con una trama de error anterior. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Procedimiento y aparato para la ocultación de errores de trama y procedimiento y aparato para la decodificación de audio
Campo técnico
Las realizaciones ejemplares se refieren a la ocultación de errores de trama y, más particularmente, a un procedimiento y aparato de ocultación de errores de trama y a un procedimiento y aparato de decodificación de audio capaces de minimizar el deterioro de la calidad del sonido reconstruido cuando se produce un error en tramas parciales de una señal de audio decodificada en la codificación y decodificación de audio utilizando el procesamiento de transformada de tiempo-frecuencia.
Técnica antecedente
Cuando una señal de audio codificada se transmite a través de una red por cable/inalámbrica, si se dañan o distorsionan paquetes parciales debido a un error de transmisión, puede producirse un error en tramas parciales de una señal de audio decodificada. Si el error no se corrige adecuadamente, la calidad del sonido de la señal de audio decodificada puede degradarse en una duración que incluye una trama en la cual se ha producido el error (de aquí en adelante, denominada “trama de error”) y una trama adyacente.
Con respecto a la codificación de la señal de audio, se conoce que un procedimiento de realización de un procesamiento de transformada de tiempo-frecuencia en una señal específica y luego realización de un procedimiento de compresión en un dominio de frecuencia proporciona una buena calidad de sonido reconstruido. En el procesamiento de transformada de tiempo-frecuencia, se utiliza ampliamente la transformada discreta de coseno modificada (MDCT). En este caso, para la decodificación de la señal de audio, la señal de dominio de frecuencia se transforma en una señal de dominio de tiempo utilizando MDCT inversa (IMDCT), y se puede realizar un procesamiento de superposición y adición (OLA) para la señal de dominio de tiempo. En el procesamiento OLA, si se produce un error en una trama actual, la siguiente trama también puede verse afectada. En particular, una señal final de dominio de tiempo se genera añadiendo un componente de solapamiento entre una trama anterior y una trama posterior a una parte de superposición en la señal de dominio de tiempo, y si se produce un error, no existe un componente de solapamiento preciso y, por lo tanto, puede producirse ruido, resultando así en un deterioro considerable de la calidad del sonido reconstruido.
Cuando una señal de audio se codifica y decodifica utilizando el procesamiento de transformada de tiempo-frecuencia, en un procedimiento de análisis de regresión para obtener un parámetro de una trama de error analizando por regresión un parámetro de una trama buena anterior (PGF) de entre los procedimientos para la ocultación de un error de trama, la ocultación es posible considerando algo la energía original para la trama de error, pero una eficacia de ocultación de error puede degradarse en una porción en la que se aumenta una señal gradualmente o se fluctúa severamente. Además, el procedimiento de análisis de regresión tiende a producir un aumento de la complejidad cuando aumenta el número de tipos de parámetros que se van a aplicar. En un procedimiento de repetición para restaurar una señal en una trama de error reproduciendo repetidamente un PGF de la trama de error, puede ser difícil minimizar el deterioro de la calidad de sonido reconstruido debido a una característica del procesamiento OLA. Un procedimiento de interpolación para predecir un parámetro de una trama de error interpolando parámetros de un PGF y una siguiente trama buena (NGF) necesita un retardo adicional de una trama y, por lo tanto, no es adecuado emplear el procedimiento de interpolación en un códec de comunicación sensible a un retardo.
Por lo tanto, cuando una señal de audio se codifica y decodifica utilizando el procesamiento de transformada de tiempofrecuencia, existe la necesidad de un procedimiento para la ocultación de un error de trama sin un retardo de tiempo adicional o un aumento excesivo de la complejidad para minimizar el deterioro de la calidad del sonido reconstruido debido al error de trama.
El documento US 2008/0033718 A1 divulga la selección de diferentes técnicas de ocultación de borrado de tramas en base a si una trama actual es una trama buena o una trama borrada.
Divulgación
Problema técnico
Las realizaciones ejemplares proporcionan un procedimiento y aparato de ocultación de error de trama para la ocultación de un error de trama con baja complejidad sin un retardo de tiempo adicional cuando se codifica y decodifica una señal de audio utilizando el procesamiento de transformada de tiempo-frecuencia.
Las realizaciones ejemplares también proporcionan un procedimiento y un aparato de decodificación de audio para minimizar el deterioro de la calidad del sonido reconstruido debido a un error de trama cuando se codifica y descodifica una señal de audio utilizando el procesamiento de transformada de tiempo-frecuencia.
Las realizaciones ejemplares también proporcionan un procedimiento y aparato de codificación de audio para detectar con mayor precisión la información en una trama transitoria utilizada para la ocultación del error de trama en un aparato de decodificación de audio.
Las realizaciones ejemplares también proporcionan un medio de almacenamiento no transitorio legible por ordenador que tiene almacenadas instrucciones de programa, las cuales cuando son ejecutadas por un ordenador, realizan el procedimiento de ocultación de error de trama, el procedimiento de codificación de audio, o el procedimiento de decodificación de audio.
Las realizaciones ejemplares también proporcionan un dispositivo multimedia que emplea el aparato de ocultación de error de trama, el aparato de codificación de audio, o el aparato de decodificación de audio
Solución técnica
De acuerdo con un aspecto de la realización ejemplar, se proporciona un procedimiento de ocultación de error de trama (FEC) de acuerdo con la reivindicación 1.
Efectos ventajosos
De acuerdo con realizaciones ejemplares, en la codificación y decodificación de audio utilizando el procesamiento de transformada de tiempo-frecuencia, cuando se produce un error en tramas parciales en una señal de audio decodificada, realizando el procesamiento de ocultación de error en un procedimiento óptimo de acuerdo con una característica de señal en el dominio de tiempo, una fluctuación rápida de señal debida a una trama de error en la señal de audio decodificada puede suavizarse con baja complejidad sin un retardo adicional.
En particular, una trama de error que sea una trama transitoria o una trama de error que constituya un error de ráfaga puede ser reconstruida con mayor precisión y, como resultado, se puede minimizar la influencia afectada a una trama normal siguiente a la trama de error.
Descripción de los dibujos
Las Figuras 1A y 1B son diagramas de bloques de un aparato de codificación de audio y un aparato de decodificación de audio de acuerdo con una realización ejemplar, respectivamente;
Las Figuras 2A y 2B son diagramas de bloques de un aparato de codificación de audio y un aparato de decodificación de audio de acuerdo con otra realización ejemplar, respectivamente;
Las Figuras 3A y 3B son diagramas de bloques de un aparato de codificación de audio y un aparato de decodificación de audio de acuerdo con otra realización ejemplar, respectivamente;
Las Figuras 4A y 4B son diagramas de bloques de un aparato de codificación de audio y un aparato de decodificación de audio de acuerdo con otra realización ejemplar, respectivamente;
La Figura 5 es un diagrama de bloques de un aparato de codificación de audio de dominio de frecuencia de acuerdo con una realización ejemplar;
La Figura 6 es un diagrama para describir una duración en la cual una bandera de resaca se establece en 1 cuando se utiliza una ventana de transformación que tiene una duración de superposición menor que 50 %; La Figura 7 es un diagrama de bloques de una unidad de detección transitoria en el aparato de codificación de audio de dominio de frecuencia de la Figura 5, de acuerdo con una realización ejemplar;
La Figura 8 es un diagrama para describir una operación de una segunda unidad de determinación transitoria de la Figura 7, de acuerdo con una realización ejemplar;
La Figura 9 es un diagrama de flujo para describir una operación de una unidad de generación de información de señalización de la Figura 7, de acuerdo con una realización ejemplar;
La Figura 10 es un diagrama de bloques de un aparato de decodificación de audio de dominio de frecuencia de acuerdo con una realización ejemplar;
La Figura 11 es un diagrama de bloques de una unidad de decodificación de espectro de la Figura 10, de acuerdo con una realización ejemplar;
La Figura 12 es un diagrama de bloques de una unidad de decodificación de espectro de la Figura 10, de acuerdo con otra realización ejemplar;
La Figura 13 es un diagrama para describir una operación de una unidad de desintercalado de la Figura 12, de acuerdo con una realización ejemplar;
La Figura 14 es un diagrama de bloques de una unidad de superposición y adición (OLA) de la Figura 10, de acuerdo con una realización ejemplar;
La Figura 15 es un diagrama de bloques de una unidad de ocultación de errores y OLA de la Figura 10, de acuerdo con una realización ejemplar;
La Figura 16 es un diagrama de bloques de una primera unidad de ocultación de error de la Figura 15, de acuerdo con una realización ejemplar;
La Figura 17 es un diagrama de bloques de una segunda unidad de ocultación de error de la Figura 15, de acuerdo con una realización ejemplar;
La Figura 18 es un diagrama de bloques de una unidad de tercera unidad de ocultación de error de la Figura 15, de acuerdo con una realización ejemplar;
Las Figuras 19A y 19B son diagramas para describir un ejemplo de procesamiento de ventana realizado por un aparato de codificación y un aparato de decodificación para eliminar el solapamiento de dominio de tiempo cuando se utiliza una ventana de transformación que tiene una duración de superposición menor que 50 %; Las Figuras 20A y 20B son diagramas para describir un ejemplo de procesamiento OLA utilizando una señal de dominio de tiempo de una NGF de la Figura 18;
La Figura 21 es un diagrama de bloques de un aparato de decodificación de audio de dominio frecuencia de acuerdo con otra realización ejemplar;
La Figura 22 es un diagrama de bloques de una unidad de detección estacionaria de la Figura 21, de acuerdo con una realización ejemplar;
La Figura 23 es un diagrama de bloques de una unidad de ocultación de error y OLA de la Figura 21, de acuerdo con una realización ejemplar;
La Figura 24 es un diagrama de flujo para describir una operación de una unidad de selección de modo FEC de la Figura 21 cuando una trama actual es una trama de error, de acuerdo con una realización ejemplar; La Figura 25 es un diagrama de flujo para describir una operación de la unidad de selección de modo FEC de la Figura 21 cuando una trama anterior es una trama de error y una trama actual no es una trama de error, de acuerdo con una realización ejemplar;
La Figura 26 es un diagrama de bloques que ilustra una operación de una primera unidad de ocultación de error de la Figura 23, de acuerdo con una realización ejemplar;
La Figura 27 es un diagrama de bloques que ilustra una operación de una segunda unidad de ocultación de error de la Figura 23, de acuerdo con una realización ejemplar;
La Figura 28 es un diagrama de bloques que ilustra una operación de una segunda unidad de ocultación de error de la Figura 23, de acuerdo con otra realización ejemplar;
La Figura 29 es un diagrama de bloques para describir un procedimiento de ocultación de error cuando una trama actual es una trama de error en la Figura 26, de acuerdo con una realización ejemplar;
La Figura 30 es un diagrama de bloques para describir un procedimiento de ocultación de error para una siguiente trama buena (NGF) que es una trama transitoria cuando una trama anterior es una trama de error en la Figura 28, de acuerdo con una realización ejemplar;
La Figura 31 es un diagrama de bloques para describir un procedimiento de ocultación de error para una NGF que no es una trama transitoria cuando una trama anterior es una trama de error en la Figura 27 o 28, de acuerdo con una realización ejemplar;
Las Figuras 32A a 32D son diagramas para describir un ejemplo de procesamiento OLA cuando una trama actual es una trama de error en la Figura 26;
Las Figuras 33A a 33C son diagramas para describir un ejemplo de procesamiento OLA en una trama siguiente cuando la trama anterior es una trama de error aleatoria en la Figura 27;
La Figura 34 es un diagrama para describir un ejemplo de procesamiento OLA en una trama siguiente cuando una trama anterior es una trama de error de ráfaga en la Figura 27;
La Figura 35 es un diagrama para describir el concepto de un procedimiento de coincidencia de fase, de acuerdo con una realización ejemplar;
La Figura 36 es un diagrama de bloques de un aparato de ocultación de error de acuerdo con una realización ejemplar;
La Figura 37 es un diagrama de bloques de un módulo FEC de coincidencia de fase o un módulo FEC de dominio de tiempo de la Figura 36, de acuerdo con una realización ejemplar;
La Figura 38 es un diagrama de bloques de una primera unidad de ocultación de error de coincidencia de fase o de una segunda unidad de ocultación de error de coincidencia de fase de la Figura 37, de acuerdo con una realización ejemplar;
La Figura 39 es un diagrama para describir una operación de una unidad de suavizado de la Figura 38, de acuerdo con una realización ejemplar;
La Figura 40 es un diagrama para describir una operación de la unidad de suavizado de la Figura. 38, de acuerdo con otra realización ejemplar;
La Figura 41 es un diagrama de bloques de un dispositivo multimedia que incluye un módulo de codificación, de acuerdo con una realización ejemplar;
La Figura 42 es un diagrama de bloques de un dispositivo multimedia que incluye un módulo de decodificación, de acuerdo con una realización ejemplar; y
La Figura 43 es un diagrama de bloques de un dispositivo multimedia que incluye un módulo de codificación y un módulo de decodificación, de acuerdo con una realización ejemplar.
Modo para la invención
El presente concepto inventivo puede permitir diversos tipos de cambio o modificación y diversos cambios en la forma, y las realizaciones ejemplares específicas se ilustrarán en los dibujos y se describirán en detalle en la presente memoria descriptiva. En la siguiente descripción, las funciones o construcciones conocidas no se describen en detalle dado que puede oscurecer la invención con detalles innecesarios.
Aunque se pueden utilizar términos como “primero” y “segundo” para describir diversos elementos, los elementos no están limitados por los términos. Los términos se pueden utilizar para clasificar un elemento determinado de otro elemento.
La terminología utilizada en la solicitud se utiliza únicamente para describir realizaciones ejemplares específicas y no tiene ninguna intención de limitar el presente concepto inventivo. Aunque se seleccionan términos generales ampliamente utilizados actualmente como sea posible como los términos utilizados en el presente concepto inventivo a la vez que se tienen en cuenta las funciones en el presente concepto inventivo, pueden variar de acuerdo con la intención de los expertos en la técnica, los precedentes judiciales, o la aparición de nuevas tecnologías. Además, en casos específicos, pueden utilizarse términos seleccionados intencionadamente por el solicitante, y en este caso, el significado de los términos se divulgara en la descripción correspondiente de la invención. En consecuencia, los términos utilizados en el presente concepto inventivo deben definirse no por los simples nombres de los términos, sino por el significado de los términos y el contenido sobre el presente concepto inventivo.
Una expresión en el singular incluye una expresión en el plural a menos que sean claramente diferentes entre sí en un contexto. En la presente solicitud, se debe entender que términos, tales como “incluir” y “tener” se utilizan para indicar la existencia de una característica, número, etapa, operación, elemento, parte, o combinación de ellos implementada sin excluir previamente la posibilidad de existencia o adición de una o más de otras características, números, etapas, operaciones, elementos, partes, o combinaciones de los mismos.
Ahora se describirán en detalle las realizaciones ejemplares con referencia a los dibujos adjuntos. Las realizaciones descritas con referencia a las Figuras 21 a 40 no están abarcadas por la redacción de las reivindicaciones, pero se consideran útiles para comprender la invención.
Las Figuras 1A y 1B son diagramas de bloques de un aparato 110 de codificación de audio y un aparato 130 de decodificación de audio de acuerdo con una realización ejemplar, respectivamente.
El aparato 110 de decodificación de audio que se muestra en la Figura 1A puede incluir una unidad 112 de preprocesamiento, una unidad 114 de codificación de dominio de frecuencia, y una unidad 116 de codificación de parámetro. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra).
En la Figura 1A, la unidad 112 de preprocesamiento puede realizar el filtrado, muestreo descendente, o similares para una señal de entrada, pero no se limita a ello. La señal de entrada puede incluir una señal de voz, una señal de música, o una señal mixta de voz y música. De aquí en adelante, para facilitar la descripción, la señal de entrada se denominará señal de audio.
La unidad 114 de codificación de dominio de frecuencia puede realizar una transformada de tiempo-frecuencia en la señal de audio proporcionada por la unidad 112 de preprocesamiento, seleccionar una herramienta de codificación en correspondencia con el número de canales, una banda de codificación, y una tasa de bits de la señal de audio, y codificar la señal de audio utilizando la herramienta de codificación seleccionada. La transformada de tiempofrecuencia utiliza una transformada discreta de coseno modificada (MDCT), una transformada traslapada modulada (MLT), o una transformada rápida de Fourier (FFT), pero no se limita a ellas. Cuando el número de bits dados es suficiente, se puede aplicar un esquema de codificación de transformación general a todas las bandas, y cuando el número de bits dados no es suficiente, se puede aplicar un esquema de extensión del ancho de banda a las bandas parciales. Cuando la señal de audio es un canal estéreo o multicanal, si el número de bits dados es suficiente, se realiza la codificación para cada canal, y si el número de bits dados no es suficiente, se puede aplicar un esquema de mezcla descendente. La unidad 114 de codificación de dominio de frecuencia genera un coeficiente espectral codificado.
La unidad 116 de codificación de parámetro puede extraer un parámetro a partir del coeficiente espectral codificado proporcionado a partir de la unidad 114 de codificación de dominio de frecuencia y codificar el parámetro extraído. El parámetro puede extraerse, por ejemplo, para cada subbanda, la cual es una unidad de agrupación de coeficientes espectrales, y puede tener una longitud uniforme o no uniforme reflejando una banda crítica. Cuando cada subbanda tiene una longitud no uniforme, una subbanda existente en una banda de baja frecuencia puede tener una longitud relativamente corta en comparación con una subbanda existente en una banda de alta frecuencia. El número y una longitud de las subbandas incluidas en una trama varían de acuerdo con los algoritmos del códec y pueden afectar al rendimiento de la codificación. El parámetro puede incluir, por ejemplo, un factor de escala, potencia, energía media, o Norma, pero no está limitado a ello. Los coeficientes espectrales y los parámetros obtenidos como resultado de la codificación forman un flujo de bits, y el flujo de bits puede almacenarse en un medio de almacenamiento o transmitirse en forma de, por ejemplo, paquetes a través de un canal.
El aparato 130 de decodificación de audio que se muestra en la Figura 1B puede incluir una unidad 132 de decodificación de parámetro, una unidad 134 de decodificación de dominio de frecuencia, y una unidad 136 de post procesamiento. La unidad 134 de decodificación de dominio de frecuencia puede incluir un algoritmo de ocultación de error de trama. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra).
En la Figura 1B, la unidad 132 de decodificación de parámetro puede decodificar parámetros de un flujo de bits recibido y comprobar si se ha producido un error en unidades de trama a partir de los parámetros decodificados. Para la comprobación de errores se pueden utilizar diversos procedimientos bien conocidos, y la información sobre si una trama actual es una trama normal o una trama de error se proporciona a la unidad 134 de decodificación de dominio de frecuencia.
Cuando la trama actual es una trama normal, la unidad 134 de decodificación de dominio de frecuencia puede generar coeficientes espectrales sintetizados realizando la decodificación a través de un procedimiento general de decodificación de transformada. Cuando la trama actual es una trama de error, la unidad 134 de decodificación de dominio de frecuencia puede generar coeficientes espectrales sintetizados escalando los coeficientes espectrales de una trama buena (PGF) anterior a través de un algoritmo de ocultación de error. La unidad 134 de decodificación de dominio de frecuencia puede generar una señal de dominio de tiempo realizando una transformada de frecuenciatiempo en los coeficientes espectrales sintetizados.
La unidad 136 de post-procesamiento puede realizar el filtrado, muestreo ascendente, o similares para mejorar la calidad del sonido con respecto a la señal de dominio de tiempo proporcionada a partir de la unidad 134 de decodificación de dominio de frecuencia, pero no se limita a ello. La unidad 136 de post-procesamiento proporciona una señal de audio reconstruida como señal de salida.
Las Figuras 2A y 2B son diagramas de bloques de un aparato 210 de codificación de audio y un aparato 230 de decodificación de audio, de acuerdo con otra realización ejemplar, respectivamente, los cuales tienen una estructura de conmutación.
El aparato 210 de decodificación de audio que se muestra en la Figura 2A puede incluir una unidad 212 de preprocesamiento, una unidad 213 de determinación de modo, una unidad 214 de codificación de dominio de frecuencia, una unidad 215 de codificación de dominio de tiempo, y una unidad 216 de codificación de parámetro. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra).
En la Figura 2A, dado que la unidad 212 de preprocesamiento es sustancialmente la misma que la unidad 112 de preprocesamiento de la Figura 1A, no se repite la descripción de la misma.
La unidad 213 de determinación de modo puede determinar un modo de codificación refiriéndose a una característica de una señal de entrada. La unidad 213 de determinación de modo puede determinar de acuerdo con la característica de la señal de entrada si un modo de codificación adecuado para una trama actual es un modo de voz o un modo de música y también puede determinar si un modo de codificación eficiente para la trama actual es un modo de dominio de tiempo o un modo de dominio de frecuencia. La característica de la señal de entrada puede percibirse utilizando una característica a corto plazo de una trama o una característica a largo plazo de una pluralidad de tramas, pero no se limita a ello. Por ejemplo, si la señal de entrada corresponde a una señal de voz, el modo de codificación puede determinarse como el modo de voz o el modo de dominio de tiempo, y si la señal de entrada corresponde a una señal distinta de una señal de voz, es decir, una señal de música o una señal mixta, el modo de codificación puede determinarse como el modo de música o el modo de dominio de frecuencia. La unidad 213 de determinación de modo puede proporcionar una señal de salida de la unidad 212 de preprocesamiento a la unidad 214 de codificación de dominio de frecuencia cuando la característica de la señal de entrada corresponde al modo de música o al modo de dominio de frecuencia y puede proporcionar una señal de salida de la unidad 212 de preprocesamiento a la unidad 215 de codificación de dominio de tiempo cuando la característica de la señal de entrada corresponde al modo de voz o al modo de dominio de tiempo.
Dado que la unidad 214 de codificación de dominio de frecuencia es sustancialmente la misma que la unidad 114 de codificación de dominio de frecuencia de la Figura 1A, no se repite la descripción de la misma.
La unidad 215 de codificación de dominio de tiempo puede realizar codificación de predicción lineal excitada por código (CELP) para una señal de audio proporcionada a partir de la unidad 212 de preprocesamiento. En detalle, se puede utilizar una CELP algebraica para la codificación CELP, pero la codificación CELP no se limita a ello. La unidad 215 de codificación de dominio de tiempo genera un coeficiente espectral codificado.
La unidad 216 de codificación de parámetro puede extraer un parámetro a partir del coeficiente espectral codificado proporcionado a partir de la unidad 214 de codificación de dominio de frecuencia o la unidad 215 de codificación de dominio de tiempo y codifica el parámetro extraído. Dado que la unidad 216 de codificación de parámetro es sustancialmente la misma que la unidad 116 de codificación de parámetro de la Figura 1A, no se repite la descripción de la misma. Los coeficientes espectrales y los parámetros obtenidos como resultado de la codificación pueden formar un flujo de bits junto con información de modo de codificación, y el flujo de bits puede transmitirse en forma de paquetes a través de un canal o puede almacenarse en un medio de almacenamiento.
El aparato 230 de decodificación de audio que se muestra en la Figura 2B puede incluir una unidad 232 de decodificación de parámetro, una unidad 233 de determinación de modo, una unidad 234 de decodificación de dominio de frecuencia, una unidad 235 de decodificación de dominio de tiempo, y una unidad 236 de post-procesamiento. Cada una de la unidad 234 de decodificación de dominio de frecuencia y la unidad 235 de decodificación de dominio de tiempo puede incluir un algoritmo de ocultación de error de trama en cada dominio correspondiente. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra).
En la Figura 2B, la unidad 232 de decodificación de parámetro puede decodificar parámetros a partir de un flujo de bits transmitido en forma de paquetes y comprobar si se ha producido un error en unidades de trama a partir de los parámetros decodificados. Para la comprobación del error se pueden utilizar diversos procedimientos bien conocidos, y la información sobre si una trama actual es una trama normal o una trama de error se proporciona a la unidad 234 de decodificación de dominio de frecuencia o a la unidad 235 de decodificación de dominio de tiempo.
La unidad 233 de determinación de modo puede comprobar la información de modo de codificación incluida en el flujo de bits y proporcionar una trama actual a la unidad 234 de decodificación de dominio de frecuencia o a la unidad 235 de decodificación de dominio de tiempo.
La unidad 234 de decodificación de dominio de frecuencia puede operar cuando un modo de codificación es el modo de música o el modo de dominio de frecuencia y generar coeficientes espectrales sintetizados realizando la decodificación a través de un procedimiento de decodificación de transformada general cuando la trama actual es una trama normal. Cuando la trama actual es una trama de error, y un modo de codificación de una trama anterior es el modo de música o el modo de dominio de frecuencia, la unidad 234 de decodificación de dominio de frecuencia puede generar coeficientes espectrales sintetizados escalando coeficientes espectrales de un PGF a través de un algoritmo de ocultación de error de trama. La unidad 234 de decodificación de dominio de frecuencia puede generar una señal de dominio de tiempo realizando una transformada de frecuencia-tiempo en los coeficientes espectrales sintetizados.
La unidad 235 de decodificación de dominio de tiempo puede operar cuando el modo de codificación es el modo de voz o el modo de dominio de tiempo y generar una señal de dominio de tiempo realizando la decodificación a través de un procedimiento de decodificación CELP general cuando la trama actual es una trama normal. Cuando la trama actual es una trama de error, y el modo de codificación de la trama anterior es el modo de voz o el modo de dominio de tiempo, la unidad 235 de decodificación de dominio de tiempo puede realizar un algoritmo de ocultación de error de trama en el dominio de tiempo.
La unidad 236 de post-procesamiento puede realizar el filtrado, muestreo ascendente, o similares para la señal de dominio de tiempo proporcionada a partir de la unidad 234 de decodificación de dominio de frecuencia o la unidad 235 de decodificación de dominio de tiempo, pero no está limitada a ello. La unidad 236 de post-procesamiento proporciona una señal de audio reconstruida como señal de salida.
Las Figuras 3A y 3B son diagramas de bloques de un aparato 310 de codificación de audio y un aparato 320 de decodificación de audio de acuerdo con otra realización ejemplar, respectivamente.
El aparato 310 de decodificación de audio que se muestra en la Figura 3A puede incluir una unidad 312 de preprocesamiento, una unidad 313 de análisis de predicción lineal (LP), una unidad 314 de determinación de modo, una unidad 315 de codificación de excitación de dominio de frecuencia, una unidad 316 de codificación de excitación de dominio de tiempo, y una unidad 317 de codificación de parámetro. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra).
En la Figura 3A, dado que la unidad 312 de preprocesamiento es sustancialmente la misma que la unidad 112 de preprocesamiento de la Figura 1A, no se repite la descripción de la misma.
La unidad 313 de análisis LP puede extraer coeficientes LP realizando un análisis LP para una señal de entrada y generar una señal de excitación a partir de los coeficientes LP extraídos. La señal de excitación puede proporcionarse a una de la unidad 315 de codificación de excitación de dominio de frecuencia y la unidad 316 de codificación de excitación de dominio de tiempo de acuerdo con un modo de codificación.
Dado que la unidad 314 de determinación de modo es sustancialmente la misma que la unidad 213 de determinación de modo de la Figura 2A, no se repite la descripción de la misma.
La unidad 315 de codificación de excitación de dominio de frecuencia puede operar cuando el modo de codificación es el modo de música o el modo de dominio de frecuencia, y dado que la unidad 315 de codificación de excitación de dominio de frecuencia es sustancialmente la misma que la unidad 114 de codificación de dominio de frecuencia de la Figura 1A excepto que una señal de entrada es una señal de excitación, la descripción de la misma no se repite.
La unidad 316 de codificación de excitación de dominio de tiempo puede operar cuando el modo de codificación es el modo de voz o el modo de dominio de tiempo, y dado que la unidad 316 de codificación de excitación de dominio de tiempo es sustancialmente la misma que la unidad 215 de codificación de dominio de tiempo de la Figura 2A, no se repite la descripción de la misma.
La unidad 317 de codificación de parámetro puede extraer un parámetro a partir de un coeficiente espectral codificado proporcionado a partir de la unidad 315 de codificación de excitación de dominio de frecuencia o la unidad 316 de codificación de excitación de dominio de tiempo y codificar el parámetro extraído. Dado que la unidad 317 de codificación de parámetro es sustancialmente la misma que la unidad 116 de codificación de parámetro de la Figura 1A, no se repite la descripción de la misma. Los coeficientes espectrales y los parámetros obtenidos como resultado de la codificación pueden formar un flujo de bits junto con información de modo de codificación, y el flujo de bits puede transmitirse en forma de paquetes a través de un canal o puede almacenarse en un medio de almacenamiento.
El aparato 330 de decodificación de audio que se muestra en la Figura 3B puede incluir una unidad 332 de decodificación de parámetros, una unidad 333 de determinación de modo, una unidad 334 de decodificación de excitación de dominio de frecuencia, una unidad 335 de decodificación de excitación de dominio de tiempo, una unidad 336 de síntesis LP, y una unidad 337 de post-procesamiento. Cada una de la unidad 334 de decodificación de excitación de dominio de frecuencia y la unidad 335 de decodificación de excitación de dominio de tiempo puede incluir un algoritmo de ocultación de error de trama en cada dominio correspondiente. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra).
En la Figura 3B, la unidad 332 de decodificación de parámetros puede decodificar parámetros a partir de un flujo de bits transmitido en forma de paquetes y comprobar si se ha producido un error en unidades de trama a partir de los parámetros decodificados. Para la comprobación del error se pueden utilizar diversos procedimientos bien conocidos, y la información sobre si una trama actual es una trama normal o una trama de error se proporciona a la unidad 334 de decodificación de excitación de dominio de frecuencia o a la unidad 335 de decodificación de excitación de dominio de tiempo.
La unidad 333 de determinación de modo puede comprobar la información de modo de codificación incluida en el flujo de bits y proporcionar una trama actual a la unidad 334 de decodificación de excitación de dominio de frecuencia o a la unidad 335 de decodificación de excitación de dominio de tiempo.
La unidad 334 de decodificación de excitación de dominio de frecuencia puede operar cuando un modo de codificación es el modo de música o el modo de dominio de frecuencia y generar coeficientes espectrales sintetizados realizando la decodificación a través de un procedimiento de decodificación de transformada general cuando la trama actual es una trama normal. Cuando la trama actual es una trama de error, y un modo de codificación de una trama anterior es el modo de música o el modo de dominio de frecuencia, la unidad 334 de decodificación de excitación de dominio de frecuencia puede generar coeficientes espectrales sintetizados escalando coeficientes espectrales de un PGF a través de un algoritmo de ocultación de error de trama. La unidad 334 de decodificación de excitación de dominio de frecuencia puede generar una señal de excitación que es una señal de dominio de tiempo realizando una transformada de frecuencia-tiempo en los coeficientes espectrales sintetizados.
La unidad 335 de decodificación de excitación de dominio de tiempo puede operar cuando el modo de codificación es el modo de voz o el modo de dominio de tiempo y generar una señal de excitación que es una señal de dominio de tiempo realizando la decodificación a través de un procedimiento de decodificación CELP general cuando la trama actual es una trama normal. Cuando la trama actual es una trama de error, y el modo de codificación de la trama anterior es el modo de voz o el modo de dominio de tiempo, la unidad 335 de decodificación de excitación de dominio de tiempo puede realizar un algoritmo de ocultación de error de trama en el dominio de tiempo.
La unidad 336 de síntesis LP puede generar una señal de dominio de tiempo realizando síntesis LP para la señal de excitación proporcionada a partir de la unidad 334 de decodificación de excitación de dominio de frecuencia o la unidad 335 de decodificación de excitación de dominio de tiempo.
La unidad 337 de post-procesamiento puede realizar el filtrado, muestreo ascendente, o similares para la señal de dominio de tiempo proporcionada a partir de la unidad 336 de síntesis LP, pero no está limitada a ello. La unidad 337 de post-procesamiento proporciona una señal de audio reconstruida como señal de salida.
Las Figuras 4A y 4B son diagramas de bloques de un aparato 410 de codificación de audio y un aparato 430 de decodificación de audio de acuerdo con otra realización ejemplar, respectivamente, los cuales tienen una estructura de conmutación.
El aparato 410 de decodificación de audio que se muestra en la Figura 4A puede incluir una unidad 412 de preprocesamiento, una unidad 413 de determinación de modo, una unidad 414 de codificación de dominio de frecuencia, una unidad 415 de análisis LP, una unidad 416 de codificación de excitación de dominio de frecuencia, una unidad 417 de codificación de excitación de dominio de tiempo, y una unidad 418 de codificación de parámetro. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra). Dado que se puede considerar que el aparato 410 de codificación de audio que se muestra en la Figura 4A se obtiene combinando el aparato 210 de codificación de audio de la Figura 2A y el aparato 310 de decodificación de audio de la Figura 3A, no se repite la descripción de las operaciones de las partes comunes, y ahora se describirá una operación de la unidad 413 de determinación de modo.
La unidad 413 de determinación de modo puede determinar un modo de codificación de una señal de entrada haciendo referencia a una característica y a una tasa de bits de la señal de entrada. La unidad 413 de determinación de modo puede determinar el modo de codificación como un modo CELP u otro modo en base a si una trama actual es el modo de voz o el modo de música de acuerdo con la característica de la señal de entrada y en base a si un modo de codificación eficiente para la trama actual es el modo de dominio de tiempo o el modo de dominio de frecuencia. La unidad 413 de determinación de modo puede determinar el modo de codificación como el modo CELP cuando la característica de la señal de entrada corresponde al modo de voz, determinar el modo de codificación como el modo de dominio de frecuencia cuando la característica de la señal de entrada corresponde al modo de música y una tasa de bits alta, y determinar el modo de codificación como un modo de audio cuando la característica de señal de entrada corresponde al modo de música y una tasa de bits baja. La unidad 413 de determinación de modo puede proporcionar la señal de entrada a la unidad 414 de codificación de dominio de frecuencia cuando el modo de codificación es el modo de dominio de frecuencia, proporcionar la señal de entrada a la unidad 416 de codificación de excitación de dominio de frecuencia a través de la unidad 415 de análisis LP cuando el modo de codificación es el modo de audio, y proporcionar la señal de entrada a la unidad 417 de codificación de excitación de dominio de tiempo a través de la unidad 415 de análisis LP cuando el modo de codificación es el modo CELP.
La unidad 414 de codificación de dominio de frecuencia puede corresponder a la unidad 114 de codificación de dominio de frecuencia en el aparato 110 de codificación de audio de la Figura 1A o la unidad 214 de codificación de dominio de frecuencia en el aparato 210 de codificación de audio de la Figura 2A, y la unidad 416 de codificación de excitación de dominio de frecuencia o la unidad 417 de codificación de excitación de dominio de tiempo pueden corresponder a la unidad 315 de codificación de excitación de dominio de frecuencia o la unidad 316 de codificación de excitación de dominio de tiempo en el aparato 310 de codificación de audio de la Figura 3A.
El aparato 430 de decodificación de audio de la Figura 4B puede incluir una unidad 432 de decodificación de parámetro, una unidad 433 de determinación de modo, una unidad 434 de decodificación de dominio de frecuencia, una unidad 435 de decodificación de excitación de dominio de frecuencia, una unidad 436 de decodificación de excitación de dominio de tiempo, una unidad 437 de síntesis LP, y una unidad 438 de post-procesamiento. Cada una de la unidad 434 de decodificación de dominio de frecuencia, la unidad 435 de decodificación de excitación de dominio de frecuencia, y la unidad 436 de decodificación de excitación de dominio de tiempo puede incluir un algoritmo de ocultación de error de trama en cada dominio correspondiente. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra). Dado que se puede considerar que el aparato 430 de decodificación de audio que se muestra en la Figura 4B se obtiene combinando el aparato 230 de decodificación de audio de la Figura 2B y el aparato 330 de decodificación de audio de la Figura 3B, no se repite la descripción de las operaciones de las partes comunes, y ahora se describirá una operación de la unidad 433 de determinación de modo.
La unidad 433 de determinación de modo puede comprobar la información de modo de codificación incluida en un flujo de bits y proporcionar una trama actual a la unidad 434 de decodificación de dominio de frecuencia, a la unidad 435 de decodificación de excitación de dominio de frecuencia, o a la unidad 436 de decodificación de excitación de dominio de tiempo.
La unidad 434 de decodificación de dominio de frecuencia puede corresponder a la unidad 134 de decodificación de dominio de frecuencia en el aparato 130 de decodificación de audio de la Figura 1B o la unidad 234 de decodificación de dominio de frecuencia del aparato 330 de codificación de audio de la Figura 2B, y la unidad 435 de decodificación de excitación de dominio de frecuencia o la unidad 436 de decodificación de excitación de dominio de tiempo pueden corresponder a la unidad 334 de decodificación de excitación de dominio de frecuencia o la unidad 335 de decodificación de excitación de dominio de tiempo en el aparato 330 de codificación de audio de la Figura 3B.
La Figura 5 es un diagrama de bloques de un aparato 510 de codificación de audio de dominio de frecuencia, de acuerdo con una realización ejemplar.
El aparato 510 de codificación de audio de dominio de frecuencia que se muestra en la Figura 5 puede incluir una unidad 511 de detección transitoria, una unidad 512 de transformación, una unidad 513 de clasificación de señal, una unidad 514 de codificación de Norma, una unidad 515 de normalización de espectro, una unidad 516 de asignación de bits, una unidad 517 de codificación de espectro, y una unidad 518 de multiplexación. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra). El aparato 510 de codificación de audio de dominio de frecuencia puede realizar todas las funciones de la unidad 214 de codificación de audio de dominio de frecuencia y funciones parciales de la unidad 216 de codificación de parámetro que se muestra en la Figura 2. El aparato 510 de codificación de audio de dominio de frecuencia puede sustituirse por una configuración de un codificador divulgado en la norma ITU-T G.719, excepto la unidad 513 de clasificación de señal, y la unidad 512 de transformación puede utilizar una ventana de transformación que tenga una duración de superposición del 50 %. Además, el aparato 510 de codificación de audio de dominio de frecuencia puede sustituirse por una configuración de un codificador divulgado en la norma ITU-T G.719, excepto la unidad 511 de detección transitoria y la unidad 513 de clasificación de señal. En cada caso, aunque no se muestra, puede incluirse además una unidad de estimación del nivel de ruido en un extremo posterior de la unidad 517 de codificación de espectro, como en la norma ITU-T G.719, para estimar un nivel de ruido para un coeficiente espectral al cual no se asigna un bit en un procedimiento de asignación de bits e insertar el nivel de ruido estimado en un flujo de bits.
Con referencia a la Figura 5, la unidad 511 de detección transitoria puede detectar una duración que presente una característica transitoria mediante el análisis de una señal de entrada y generar información de señalización transitoria para cada trama en respuesta a un resultado de la detección. Para la detección de una duración transitoria se pueden utilizar diversos procedimientos bien conocidos. De acuerdo con una realización ejemplar, cuando la unidad 512 de transformación puede utilizar una ventana que tenga una duración de superposición inferior al 50 %, la unidad 511 de detección transitoria puede determinar en primer lugar si una trama actual es una trama transitoria y, en segundo lugar, verificar la trama actual que se ha determinado como una trama transitoria. La información de señalización transitoria puede ser incluida en un flujo de bits por la unidad 518 de multiplexación y puede ser proporcionada a la unidad 512 de transformación.
La unidad 512 de transformación puede determinar un tamaño de ventana por utilizar para una transformación de acuerdo con un resultado de la detección de una duración transitoria y realizar una transformada de tiempo-frecuencia en base al tamaño de ventana determinado. Por ejemplo, se puede aplicar una ventana corta a una subbanda a partir de la cual se ha detectado una duración transitoria, y una ventana larga a una subbanda a partir de la cual no se ha detectado una duración transitoria. Como otro ejemplo, se puede aplicar una ventana corta a una trama que incluya una duración transitoria.
La unidad 513 de clasificación de señal puede analizar un espectro proporcionado a partir de la unidad 512 de transformación para determinar si cada trama corresponde a una trama armónica. Para la determinación de una trama armónica se pueden utilizar diversos procedimientos bien conocidos. De acuerdo con una realización ejemplar, la unidad 513 de clasificación de señal puede dividir el espectro proporcionado a partir de la unidad 512 de transformación a una pluralidad de subbandas y obtener un valor de energía pico y un valor de energía medio para cada subbanda. A continuación, la unidad 513 de clasificación de señal puede obtener el número de subbandas cuyo valor de energía pico es mayor que un valor de energía medio por una relación predeterminada o superior para cada trama y determinar, como trama armónica, una trama en la cual el número de subbandas obtenido es mayor que o igual a un valor predeterminado. La relación y el valor predeterminados pueden determinarse previamente a través de experimentos o simulaciones. La información de señalización armónica puede ser incluida en el flujo de bits por la unidad 518 de multiplexación.
La unidad 514 de codificación de Norma puede obtener un valor de Norma correspondiente a la energía espectral media en cada unidad de subbanda y cuantificar y codificar sin pérdidas el valor de Norma. El valor de Norma de cada subbanda puede ser proporcionado a la unidad 515 de normalización de espectro y a la unidad 516 de asignación de bits y puede ser incluido en el flujo de bits por la unidad 518 de multiplexación.
La unidad 515 de normalización de espectro puede normalizar el espectro utilizando el valor de Norma obtenido en cada unidad de subbanda.
La unidad 516 de asignación de bits puede asignar bits en unidades enteras o unidades de punto decimal utilizando el valor de Norma obtenido en cada unidad de subbanda. Además, la unidad 516 de asignación de bits puede calcular un umbral de enmascaramiento utilizando el valor de Norma obtenido en cada unidad de subbanda y estimar el número de bits perceptivamente requerido, es decir, el número de bits permitido, utilizando el umbral de enmascaramiento. La unidad 516 de asignación de bits puede limitar que el número de bits asignados no excede el número de bits permitido para cada subbanda. La unidad 516 de asignación de bits puede asignar secuencialmente bits a partir de una subbanda que tenga un valor de Norma mayor y ponderar el valor de Norma de cada subbanda de acuerdo con la importancia perceptual de cada subbanda para ajustar el número de bits asignados de modo que se asigne un mayor número de bits a una subbanda perceptualmente importante. El valor de Norma cuantificado proporcionado a partir de la unidad 514 de codificación de Norma a la unidad 516 de asignación de bits puede utilizarse para la asignación de bits después de haber sido ajustado previamente para considerar la ponderación psicoacústica y un efecto de enmascaramiento como en la norma ITU-T G.719.
La unidad 517 de codificación de espectro puede cuantificar el espectro normalizado utilizando el número asignado de bits de cada subbanda y codificar sin pérdidas un resultado de la cuantificación. Por ejemplo, se puede utilizar la codificación de pulso factorial (FPC) para la codificación del espectro, pero la codificación del espectro no se limita a ello. De acuerdo con el FPC, la información, tal como la ubicación de un pulso, la magnitud del pulso, y un signo del pulso, dentro del número de bits asignado puede representarse en un formato factorial. La información sobre el espectro codificada por la unidad 517 de codificación de espectro puede ser incluida en el flujo de bits por la unidad 518 de multiplexación.
La Figura 6 es un diagrama para describir una duración en la cual se requiere una bandera de resaca cuando se utiliza una ventana que tenga una duración de superposición menor que 50 %.
Con referencia a la Figura 6, cuando una duración que es de una trama n+1 actual y se ha detectado que es transitoria corresponde a una duración 610 en la cual no se realiza una superposición, una ventana para una trama transitoria, por ejemplo, una ventana corta, no tiene que ser utilizada para una siguiente trama n. Sin embargo, cuando la duración que es de una trama n+1 actual y se ha detectado que es transitoria corresponde a la duración 610 en la cual se produce una superposición, se puede esperar la mejora de la calidad del sonido reconstruido para el cual se ha considerado una característica de señal utilizando una ventana para una trama transitoria con respecto a la siguiente trama n. Como se ha descrito anteriormente, cuando se utiliza una ventana que tenga una duración de superposición menor que 50 %, si se genera la bandera de resaca se puede determinar de acuerdo con una ubicación en la cual se detecta que es transitoria en una trama.
La Figura 7 es un diagrama de bloques de la unidad 511 de detección transitoria (denominada 710 en la Figura 7) como se muestra en la Figura 5, de acuerdo con una realización ejemplar.
La unidad 710 de detección transitoria que se muestra en la Figura 7 puede incluir una unidad 712 de filtrado, una unidad 713 de cálculo de energía a corto plazo, una unidad 714 de cálculo de energía a largo plazo, una primera unidad 715 de determinación transitoria, una segunda unidad 716 de determinación transitoria, y una unidad 717 de generación de información de señalización. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra). La unidad 710 de detección transitoria puede sustituirse por una configuración divulgada en la norma ITU-T G.719, excepto la unidad 713 de cálculo de energía a corto plazo, la segunda unidad 716 de determinación transitoria y la unidad 717 de generación de información de señalización.
Con referencia a la Figura 7, la unidad 712 de filtrado puede realizar el filtrado de paso alto de una señal de entrada muestreada a, por ejemplo, 48 KHz.
La unidad 713 de cálculo de energía a corto plazo puede recibir una señal filtrada por la unidad 712 de filtrado, dividir cada trama en, por ejemplo, cuatro subtramas, es decir, cuatro bloques, y calcular la energía a corto plazo de cada bloque. Además, la unidad 713 de cálculo de energía a corto plazo también puede calcular la energía a corto plazo de cada bloque en unidades de trama para la señal de entrada y proporcionar la energía a corto plazo calculada de cada bloque a la segunda unidad 716 de determinación transitoria.
La unidad 714 de cálculo de energía a largo plazo puede calcular la energía a largo plazo de cada bloque en unidades de trama.
La primera unidad 715 de determinación transitoria puede comparar la energía a corto plazo con la energía a largo plazo para cada bloque y determinar que una trama actual es una trama transitoria si, en un bloque de la trama actual, la energía a corto plazo es mayor que la energía a largo plazo en una relación predeterminada o superior.
La segunda unidad 716 de determinación transitoria puede realizar un procedimiento de verificación adicional y puede determinar de nuevo si la trama actual que ha sido determinada como una trama transitoria es una trama transitoria. Esto es para evitar un error de determinación transitorio el cual se puede producir debido a la eliminación de energía en una banda de baja frecuencia que resulta a partir del filtrado de paso alto en la unidad 712 de filtrado.
Ahora se describirá una operación de la segunda unidad 716 de determinación transitoria con un caso donde una trama consiste en cuatro bloques, es decir, donde cuatro subtramas, 0, 1, 2, y 3 son asignadas a los cuatro bloques, y la trama es detectada como transitoria en base a un segundo bloque 1 de una trama n como se muestra en la Figura 8.
En primer lugar, en detalle, una primera media de energía a corto plazo de una primera pluralidad de bloques L 810 existentes antes del segundo bloque 1 de la trama n puede compararse con una segunda media de energía a corto plazo de una segunda pluralidad de bloques H 830 que incluye el segundo bloque 1 y bloques existentes posteriormente en la trama n. En este caso, de acuerdo con una ubicación detectada como transitoria, el número de bloques incluidos en la primera pluralidad de bloques L 810 y el número de bloques incluidos en la segunda pluralidad de bloques H 830 puede variar. Es decir, se puede calcular una relación entre una media de energía a corto plazo de una primera pluralidad de bloques que incluye un bloque el cual se ha detectado como transitorio a partir del mismo y bloques existentes posteriormente, es decir, la segunda media, y una media de energía a corto plazo de una segunda pluralidad de bloques existentes antes del bloque el cual se ha detectado como transitorio a partir del mismo, es decir, la primera media.
A continuación, se puede calcular una relación de una tercera media de energía a corto plazo de una trama n antes del filtrado de paso alto y una cuarta media de energía a corto plazo de la trama n después del filtrado de paso alto.
Finalmente, si la relación de la segunda media y la primera media está entre un primer umbral y un segundo umbral, y la relación de la tercera media y la cuarta media es mayor que un tercer umbral, incluso, aunque la primera unidad 715 de determinación transitoria haya determinado principalmente que la trama actual es una trama transitoria, la segunda unidad 716 de determinación transitoria puede hacer una determinación final de que la trama actual es una trama normal.
Los umbrales primero a tercero pueden establecerse previamente a través de experimentos o simulaciones. Por ejemplo, el primer umbral y el segundo umbral pueden establecerse en 0,7 y 2,0, respectivamente, y el tercer umbral puede establecerse en 50 para una señal de banda superancha y en 30 para una señal de banda ancha.
Los dos procedimientos de comparación realizados por la segunda unidad 716 de determinación transitoria pueden evitar un error en el cual una señal que tiene una amplitud temporalmente grande es detectada como transitoria.
De nuevo con referencia a la Figura 7, la unidad 717 de generación de información de señalización puede determinar si un tipo de trama de la trama actual se actualiza de acuerdo con una bandera de resaca de una trama anterior a partir de un resultado de la determinación en la segunda unidad 716 de determinación transitoria, establecer de manera diferente una bandera de resaca de la trama actual de acuerdo con una ubicación de un bloque el cual es de la trama actual y se ha detectado que es transitorio, y generar un resultado del mismo como información de señalización transitoria. Esto se describirá en detalle con referencia a la Figura 9.
La Figura 9 es un diagrama de flujo para describir una operación de la unidad 717 de generación de información de señalización que se muestra en la Figura 7, de acuerdo con una realización ejemplar. La Figura 9 ilustra un caso en el que una trama está construida como en la Figura 8, se utiliza una ventana de transformación que tenga una duración de superposición menor que 50 %, y se produce una superposición en los bloques 2 y 3.
Con referencia a la Figura 9, en la operación 912, se puede recibir a partir de la segunda unidad 716 de determinación transitoria un tipo de trama finalmente determinado de la trama actual.
En la operación 913, se puede determinar, en base al tipo de trama de la trama actual, si la trama actual es una trama transitoria.
Si se determina en la operación 913 que el tipo de trama de la trama actual no indica una trama transitoria, entonces en la operación 914, se puede comprobar una bandera de resaca establecida para una trama anterior.
En la operación 915, se puede determinar si la bandera de resaca de la trama anterior es 1, y, si como resultado de la determinación en la operación 915, la bandera de resaca de la trama anterior es 1, es decir, si la trama anterior es una trama transitoria que afecta la superposición, la trama actual que no es una trama transitoria puede actualizarse a una trama transitoria, y la bandera de resaca de la trama actual puede entonces establecerse en 0 para una trama siguiente en la operación 916. El establecimiento de la bandera de resaca de la trama actual a 0 indica que la trama siguiente no se ve afectada por la trama actual, dado que la trama actual es una trama transitoria actualizada debido a la trama anterior.
Si la bandera de resaca de la trama anterior es 0 como resultado de la determinación en la operación 915, entonces en la operación 917, la bandera de resaca de la trama actual puede establecerse en 0 sin actualizar el tipo de trama. Es decir, se mantiene que el tipo de trama de la trama actual no es una trama transitoria.
Si el tipo de trama de la trama actual indica una trama transitoria como resultado de la determinación en la operación 913, entonces en la operación 918, un bloque el cual ha sido detectado en la trama actual y determinado como transitorio puede ser recibido.
En la operación 919, se puede determinar si el bloque el cual ha sido detectado en la trama actual y determinado como transitorio corresponde a una duración de superposición, por ejemplo, en la Figura 8, se determina si el número del bloque el cual ha sido detectado en la trama actual y determinado como transitorio es mayor que 1, es decir, es 2 o 3. Si en la operación 919 se determina que el bloque el cual se ha detectado en la trama actual y que se ha determinado que es transitorio no corresponde a 2 o 3, lo cual indica una duración de superposición, la bandera de resaca de la trama actual puede establecerse en 0 sin actualizar el tipo de trama en la operación 917. Es decir, si el número del bloque el cual se ha detectado en la trama actual y se ha determinado que es transitorio es 0, el tipo de trama de la trama actual puede mantenerse como trama transitoria, y la bandera de resaca de la trama actual puede establecerse en 0 de modo que no afecte a la siguiente trama.
Si, como resultado de la determinación en la operación 919, el bloque el cual ha sido detectado en la trama actual y determinado como transitorio corresponde a 2 o 3, indicando una duración de superposición, entonces en la operación 920, la bandera de resaca de la trama actual puede establecerse en 1 sin actualizar el tipo de trama. Es decir, aunque el tipo de trama de la trama actual se mantiene como una trama transitoria, la trama actual puede afectar a la trama siguiente. Esto indica que, si la bandera de resaca de la trama actual es 1, incluso, aunque se determine que la siguiente trama no es una trama transitoria, la siguiente trama puede actualizarse como una trama transitoria.
En la operación 921, la bandera de resaca de la trama actual y el tipo de trama de la trama actual pueden formarse como información de señalización transitoria. En particular, el tipo de trama de la trama actual, es decir, la información de señalización que indica si la trama actual es una trama transitoria, puede proporcionarse a un aparato de decodificación de audio.
La Figura 10 es un diagrama de bloques de un aparato 1030 de decodificación de audio de dominio de frecuencia de acuerdo con una realización ejemplar, el cual puede corresponder a la unidad 134 de decodificación de dominio de frecuencia de la Figura 1B, la unidad 234 de decodificación de dominio de frecuencia de la Figura 2B, la unidad 334 de decodificación de excitación de dominio de frecuencia de la Figura 3B, o la unidad 434 de decodificación de dominio de frecuencia de la Figura 4B.
El aparato 1030 de decodificación de audio de dominio de frecuencia que se muestra en la Figura 10 puede incluir un módulo 1032 de ocultación de error de trama (FEC) de dominio de frecuencia, una unidad 1033 de decodificación de espectro, una primera unidad 1034 de actualización de memoria, una unidad 1035 de transformación inversa, una unidad 1036 de superposición y adición general (OLA), y un módulo 1037 de FEC de dominio de tiempo. Los componentes excepto una memoria (no se muestra) incorporada en la primera unidad 1034 de actualización de memoria pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra). Las funciones de la primera unidad 1034 de actualización de memoria pueden distribuirse a e incluirse en el módulo 1032 de dominio de frecuencia FEC y la unidad 1033 de decodificación de espectro.
Con referencia a la Figura 10, una unidad 1010 de decodificación de parámetro puede decodificar parámetros a partir de un flujo de bits recibido y comprobar a partir de los parámetros decodificados si se ha producido un error en unidades de trama. La unidad 1010 de decodificación de parámetro puede corresponder a la unidad 132 de decodificación de parámetro de la Figura 1B, la unidad 232 de decodificación de parámetro de la Figura 2B, la unidad 332 de decodificación de parámetro de la Figura 3B, la unidad 432 de decodificación de parámetro de la Figura 4B. La información proporcionada por la unidad 1010 de decodificación de parámetro puede incluir una bandera de error que indica si una trama actual es una trama de error y el número de tramas de error las cuales se han producido continuamente hasta el momento. Si se determina que se ha producido un error en la trama actual, una bandera de error, tal como un indicador de trama defectuosa (BFI), puede establecerse en 1, indicando que no existe información para la trama de error.
El módulo 1032 de dominio de frecuencia FEC puede tener un algoritmo de ocultación de error de dominio de frecuencia en el mismo y operar cuando la bandera BFI de error proporcionada por la unidad 1010 de decodificación de parámetro es 1, y un modo de decodificación de una trama anterior es el modo de dominio de frecuencia. De acuerdo con una realización ejemplar, el módulo 1032 de dominio de frecuencia FEC puede generar un coeficiente espectral de la trama de error repitiendo un coeficiente espectral sintetizado de un PGF almacenado en una memoria (no se muestra). En este caso, el procedimiento de repetición puede realizarse considerando un tipo de trama de la trama anterior y el número de tramas de error las cuales se han producido hasta el momento. Para facilitar la descripción, cuando el número de tramas de error las cuales se han producido de manera continua es de dos o más, esta ocurrencia corresponde a un error de ráfaga.
De acuerdo con una realización ejemplar, cuando la trama actual es una trama de error que forma un error de ráfaga y la trama anterior no es una trama transitoria, el módulo 1032 de dominio de frecuencia FEC puede reducir forzosamente un coeficiente espectral decodificado de un PGF mediante un valor fijo de 3 dB a partir de, por ejemplo, una quinta trama de error. Es decir, si la trama actual corresponde a una quinta trama de error de entre las tramas de error que se han producido continuamente, el módulo 1032 de dominio de frecuencia FEC puede generar un coeficiente espectral disminuyendo la energía del coeficiente espectral decodificado de la PGF y repitiendo el coeficiente espectral de energía disminuida para la quinta trama de error.
De acuerdo con otra realización ejemplar, cuando la trama actual es una trama de error que forma un error de ráfaga y la trama anterior es una trama transitoria, el módulo 1032 de dominio de frecuencia FEC puede reducir forzosamente un coeficiente espectral decodificado de una PGF en un valor fijo de 3 dB a partir de, por ejemplo, una segunda trama de error. Es decir, si la trama actual corresponde a una segunda trama de error de entre las tramas de error las cuales se han producido continuamente, el módulo 1032 de dominio de frecuencia FEC puede generar un coeficiente espectral disminuyendo la energía del coeficiente espectral decodificado del PGF y repitiendo el coeficiente espectral de energía disminuida para la segunda trama de error.
De acuerdo con otra realización ejemplar, cuando la trama actual es una trama de error que forma un error de ráfaga, el módulo 1032 de dominio de frecuencia FEC puede disminuir el ruido de modulación generado debido a la repetición de un coeficiente espectral para cada trama cambiando de manera aleatoria un signo de un coeficiente espectral generado para la trama de error. Una trama de error a la cual se comienza a aplicar un signo aleatorio en un grupo de tramas de error que forma una ráfaga de error puede variar de acuerdo con una característica de señal. De acuerdo con una realización ejemplar, una posición de una trama de error a la cual se comienza a aplicar un signo aleatorio puede establecerse de manera diferente de acuerdo con si la característica de señal indica que la trama actual es transitoria, o una posición de una trama de error a partir de la cual se comienza a aplicar un signo aleatorio puede establecerse de manera diferente para una señal estacionaria de entre las señales que no son transitorias. Por ejemplo, cuando se determina que existe un componente armónico en una señal de entrada, la señal de entrada puede determinarse como una señal estacionaria cuya fluctuación de señal no es severa, y se puede realizar un algoritmo de ocultación de error correspondiente a la señal estacionaria. Comúnmente, la información transmitida a partir de un codificador puede utilizarse para la información armónica de una señal de entrada. Cuando no es necesaria una baja complejidad, la información armónica puede obtenerse utilizando una señal sintetizada por un decodificador.
Se puede aplicar un signo aleatorio a todos los coeficientes espectrales de una trama de error o a los coeficientes espectrales en una banda de frecuencia mayor que una banda de frecuencia predefinida ya que se puede esperar un mejor rendimiento no aplicando un signo aleatorio en una banda de frecuencia muy baja que sea igual a o menor que, por ejemplo, 200 Hz. Esto se debe a que, en la banda de baja frecuencia, una forma de onda o energía puede cambiar considerablemente debido a un cambio en el signo.
De acuerdo con otra realización ejemplar, el módulo 1032 de dominio de frecuencia FEC puede aplicar la reducción de escala o el signo aleatorio no sólo para las tramas de error que forman un error de ráfaga, sino también en un caso en el que una de cada otra trama es una trama de error. Es decir, cuando una trama actual es una trama de error, una trama anterior de una trama es una trama normal, y una trama anterior de dos tramas es una trama de error, se puede aplicar la reducción de escala o el signo aleatorio.
La unidad 1033 de decodificación de espectro puede operar cuando la bandera BFI de error proporcionada por la unidad 1010 de decodificación de parámetro es 0, es decir, cuando una trama actual es una trama normal. La unidad 1033 de decodificación de espectro puede sintetizar coeficientes espectrales realizando la decodificación de espectro utilizando los parámetros decodificados por la unidad 1010 de decodificación de parámetro. La unidad 1033 de decodificación de espectro se describirá más adelante en más detalle con referencia a las Figuras 11 y 12.
La primera unidad 1034 de actualización de memoria puede actualizar, para una trama siguiente, los coeficientes espectrales sintetizados, la información obtenida utilizando los parámetros decodificados, el número de tramas de error las cuales se han producido continuamente hasta el momento, la información sobre una característica de señal o tipo de trama de cada trama, y similares con respecto a la trama actual que es una trama normal. La característica de señal puede incluir una característica transitoria o una característica estacionaria, y el tipo de trama puede incluir una trama transitoria, una trama estacionaria, o una trama armónica.
La unidad 1035 de transformada inversa puede generar una señal de dominio de tiempo realizando una transformada inversa de tiempo-frecuencia sobre los coeficientes espectrales sintetizados. La unidad 1035 de transformada inversa puede proporcionar la señal de dominio de tiempo de la trama actual a uno de la unidad 1036 OLA general y el módulo 1037 FEC de dominio de tiempo en base a una bandera de error de la trama actual y una bandera de error de la trama anterior.
La unidad 1036 OLA general puede operar cuando tanto la trama actual como la trama anterior son tramas normales. La unidad 1036 OLA general puede realizar un procesamiento OLA general utilizando una señal de dominio de tiempo de la trama anterior, generar una señal de dominio de tiempo final de la trama actual como resultado del procesamiento OLA general, y proporcionar la señal de dominio de tiempo final a una unidad 1050 de post-procesamiento.
El módulo 1037 FEC de dominio de tiempo puede operar cuando la trama actual es una trama de error o cuando la trama actual es una trama normal, la trama anterior es una trama de error, y un modo de decodificación del último PGF es el modo de dominio de frecuencia. Es decir, cuando la trama actual es una trama de error, el procesamiento de ocultación de error puede ser realizado por el módulo 1032 de dominio de frecuencia FEC y el módulo 1037 FEC de dominio de tiempo, y cuando la trama anterior es una trama de error y la trama actual es una trama normal, el procesamiento de ocultación de error puede ser realizado por el módulo 1037 FEC de dominio de tiempo.
La Figura 11 es un diagrama de bloques de la unidad 1033 decodificadora de espectro (denominada 1110 en la Figura 11) que se muestra en la Figura 10, de acuerdo con una realización ejemplar.
La unidad 1110 de decodificación de espectro que se muestra en la Figura 11 puede incluir una unidad 1112 de decodificación sin pérdidas, una unidad 1113 de decuantización de parámetro, una unidad 1114 de asignación de bits, una unidad 1115 de decuantización de espectro, una unidad 1116 de relleno de ruido, y una unidad 1117 de conformación de espectro. La unidad 1116 de relleno de ruido puede estar en un extremo posterior de la unidad 1117 de conformación de espectro. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra).
Con referencia a la Figura 11, la unidad 1112 de decodificación sin pérdidas puede realizar una decodificación sin pérdidas sobre un parámetro para el cual se ha realizado una decodificación sin pérdidas en un procedimiento de decodificación, por ejemplo, un valor de Norma o un coeficiente espectral.
La unidad 1113 de decuantización de parámetro puede decuantizar el valor de Norma decodificado sin pérdidas. En el procedimiento de decodificación, el valor de Norma puede ser cuantificado utilizando uno de diversos procedimientos, por ejemplo, cuantificación vectorial (VQ), cuantificación escalar (SQ), cuantificación codificada de Trellis (TCQ), cuantificación vectorial de Lattice (LVQ), y similares, y decuantificado utilizando un procedimiento correspondiente.
La unidad 1114 de asignación de bits puede asignar los bits requeridos en unidades de subbanda en base al valor cuantificado de Norma o al valor decuantificado de Norma. En este caso, el número de bits asignados en unidades de subbanda puede ser el mismo que el número de bits asignados en el procedimiento de codificación.
La unidad 1115 de decuantización de espectro puede generar coeficientes espectrales normalizados realizando un procedimiento de decuantización utilizando el número de bits asignados en unidades de subbanda.
La unidad 1116 de relleno de ruido puede generar una señal de ruido y rellenar la señal de ruido en una parte que requiera relleno de ruido en unidades de subbanda de entre los coeficientes espectrales normalizados.
La unidad 1117 de conformación de espectro puede conformar los coeficientes espectrales normalizados utilizando el valor decuantificado de Norma. Por último, los coeficientes espectrales decodificados pueden obtenerse a través del procedimiento de conformación de espectro.
La Figura 12 es un diagrama de bloques de la unidad 1033 decodificadora de espectro (denominada 1210 en la Figura 12) que se muestra en la Figura 10, de acuerdo con otra realización ejemplar, la cual puede aplicarse preferentemente a un caso en el que se utiliza una ventana corta para una trama cuya fluctuación de señal es severa, por ejemplo, una trama transitoria.
La unidad 1210 de decodificación de espectro que se muestra en la Figura 12 puede incluir una unidad 1212 de decodificación sin pérdidas, una unidad 1213 de decuantización de parámetro, una unidad 1214 de asignación de bits, una unidad 1215 de decuantización de espectro, una unidad 1216 de relleno de ruido, una unidad 1217 de conformación de espectro, y una unidad 1218 de desentrelazado. La unidad 1216 de relleno de ruido puede estar en un extremo posterior de la unidad 1217 de conformación de espectro. Los componentes pueden estar integrados en al menos un módulo y pueden implementarse como al menos un procesador (no se muestra). En comparación con la unidad 1110 de decodificación de espectro que se muestra en la Figura 11, se adiciona además la unidad 1218 de desentrelazado, y, por lo tanto, no se repite la descripción de las operaciones de los mismos componentes.
En primer lugar, cuando una trama actual es una trama transitoria, la ventana de transformación que se va a utilizar debe ser más corta que una ventana de transformación (véase 1310 de la Figura 13) utilizada para una trama estacionaria. De acuerdo con una realización ejemplar, la trama transitoria puede dividirse en cuatro subtramas, y un total de cuatro ventanas cortas (véase 1330 de la Figura 13) puede utilizarse como una para cada subtrama. Antes de la descripción de una operación de la unidad 1218 de desentrelazado, se describirá ahora el procesamiento de entrelazado en un extremo de codificador.
Se puede establecer de tal manera que una suma de coeficientes espectrales de cuatro subtramas, las cuales se obtienen utilizando cuatro ventanas cortas cuando una trama transitoria se divide en las cuatro subtramas, sea la misma que una suma de coeficientes espectrales obtenidos utilizando una ventana larga para la trama transitoria. En primer lugar, se realiza una transformación aplicando las cuatro ventanas cortas y, como resultado, pueden obtenerse cuatro conjuntos de coeficientes espectrales. A continuación, el entrelazado puede realizarse de manera continua en un orden de coeficientes espectrales de cada conjunto. En detalle, si se supone que los coeficientes espectrales de una primera ventana corta son c01, c02,..., c0n, los coeficientes espectrales de una segunda ventana corta son c11, c12,...., c1n, los coeficientes espectrales de una tercera ventana corta son c21, c22,..., c2n, y los coeficientes espectrales de una cuarta ventana corta son c31, c32,..., c3n, entonces un resultado del entrelazado puede ser c01, c11, c21, c31,..., c0n, c1n, c2n, c3n.
Como se ha descrito anteriormente, mediante el procedimiento de entrelazado, una trama transitoria puede actualizarse igual que en el caso en el que se utiliza una ventana larga, y puede realizarse un procedimiento de codificación posterior, tal como la cuantificación y la codificación sin pérdidas.
De nuevo con referencia a la Figura 12, la unidad 1218 de desentrelazado puede utilizarse para actualizar los coeficientes espectrales reconstruidos proporcionados por la unidad 1217 de conformación de espectro a un caso en el que originalmente se utilizan ventanas cortas. Una trama transitoria tiene la característica de que la fluctuación de energía es severa y comúnmente tiende a tener baja energía en una parte inicial y a tener alta energía en una parte final. Por lo tanto, cuando un PGF es una trama transitoria, si los coeficientes espectrales reconstruidos de la trama transitoria se utilizan repetidamente para una trama de error, dado que las tramas cuya fluctuación de energía es severa existen continuamente, el ruido puede ser muy grande. Para evitar esto, cuando un PGF es una trama transitoria, los coeficientes espectrales de una trama de error pueden generarse utilizando coeficientes espectrales decodificados que utilizan las ventanas cortas tercera y cuarta en lugar de coeficientes espectrales decodificados que utilizan las ventanas cortas primera y segunda.
La Figura 14 es un diagrama de bloques de la unidad 1036 OLA general (denominada 1410 en la Figura 14) que se muestra en la Figura 10, de acuerdo con una realización ejemplar, en la que la unidad 1036 OLA general (denominada 1410 en la Figura 14) puede operar cuando una trama actual y una trama anterior son tramas normales y realizar el procesamiento OLA en la señal de dominio de tiempo, es decir, una señal IMDCT, proporcionada por la unidad de transformación inversa (1035 de la Figura 10).
La unidad 1410 OLA general que se muestra en la Figura 14 puede incluir una unidad 1412 de ventana y una unidad 1414 OLA.
Con referencia a la Figura 14, la unidad 1412 de ventana puede realizar un procesamiento de ventana en una señal IMDCT de un cuadro actual para eliminar el solapamiento de dominio de tiempo. Un caso en el que una ventana tiene una duración de superposición inferior al 50 % se describirá a continuación con referencia a las Figuras 19A y 19B.
La unidad 1414 OLA puede realizar el procesamiento OLA en la señal IMDCT con ventana.
Las Figuras 19A y 19B son diagramas que describen un ejemplo de procesamiento de ventana realizado por un aparato de codificación y un aparato de decodificación para eliminar el solapamiento de dominio de tiempo cuando se utiliza una ventana que tenga una duración de superposición menor que 50 %.
Con referencia a las Figuras 19A y 19B, un formato de ventana utilizado por el aparato de codificación y un formato de ventana utilizado por el aparato de decodificación pueden representarse en direcciones mutuamente inversas. El aparato de codificación aplica la ventana utilizando una señal almacenada en el pasado cuando se recibe una nueva entrada. Cuando se reduce el tamaño de una duración de superposición para evitar un retardo, la duración de superposición puede situarse en ambos extremos de una ventana. El aparato de decodificación deriva una señal de salida de audio realizando un procesamiento OLA sobre una señal de salida de audio antigua de la Figura 19A en una trama n actual, donde una región de la trama n actual es la misma que la de una antigua señal de salida IMDCT con ventana. Una región futura de la señal de salida de audio se utiliza para un procedimiento OLA en una trama siguiente. La Figura 19B ilustra un formato de una ventana para la ocultación de una trama de error de acuerdo con una realización ejemplar. Cuando se produce un error en la codificación de dominio de frecuencia, los coeficientes espectrales pasados se repiten normalmente, y, por lo tanto, puede ser imposible eliminar el solapamiento de dominio de tiempo en la trama de error. Por lo tanto, se puede utilizar una ventana modificada para ocultar los artefactos debidos al solapamiento de dominio de tiempo. En particular, cuando se utiliza una ventana que tiene una duración de superposición menor que 50 %, para reducir el ruido debido a la corta duración de superposición, la superposición puede suavizarse ajustando una longitud de una duración 1930 de superposición para que sea J ms (0 < J < tamaño de trama).
La Figura 15 es un diagrama de bloques del módulo 1037 FEC de dominio de tiempo que se muestra en la Figura 10, de acuerdo con una realización ejemplar.
El módulo 1510 FEC de dominio de tiempo que se muestra en la Figura 15 puede incluir una unidad 1512 de selección de modo FEC, unidades 1513, 1514 y 1515 de ocultación de error de dominio de tiempo primera a tercera, y una segunda unidad 1516 de actualización de memoria. Las funciones de la segunda unidad 1516 de actualización de memoria pueden estar incluidas en las unidades 1513, 1514 y 1515 de ocultación de error de dominio de tiempo primera a tercera.
Con referencia a la Figura 15, la unidad 1512 de selección de modo FEC puede seleccionar un modo FEC en el dominio de tiempo recibiendo una bandera BFI de error de una trama actual, una bandera Anterior_BFI de error de una trama anterior, y el número de tramas de error continuas. Para las banderas de error, 1 puede indicar una trama de error, y 0 puede indicar una trama normal. Cuando el número de tramas de error continuas es igual a o mayor que, por ejemplo, 2, puede determinarse que se ha formado un error de ráfaga. Como resultado de la selección en la unidad 1512 de selección de modo FEC, puede proporcionarse una señal de dominio de tiempo de la trama actual a una de las unidades 1513, 1514 y 1515 de ocultación de error de dominio de tiempo primera a tercera.
La primera unidad 1513 de ocultación de error de dominio de tiempo realiza el procesamiento de ocultación de error cuando la trama actual es una trama de error.
La segunda unidad 1514 de ocultación de error de dominio de tiempo realiza el procesamiento de ocultación de error cuando la trama actual es una trama normal y la trama anterior es una trama de error que forma un error aleatorio.
La tercera unidad 1515 de ocultación de dominio de tiempo realiza el procesamiento de ocultación de error cuando la trama actual es una trama normal y la trama anterior es una trama de error que forma un error de ráfaga.
La segunda unidad 1516 de actualización de memoria puede actualizar diversos tipos de información utilizada para el procesamiento de ocultación de error en la trama actual y almacenar la información en una memoria (no se muestra) para una trama siguiente.
La Figura 16 es un diagrama de bloques de la primera unidad 1513 de ocultación de error de dominio de tiempo que se muestra en la Figura 15, de acuerdo con una realización ejemplar. Cuando una trama actual es una trama de error, si se utiliza generalmente un procedimiento de repetición de coeficientes espectrales pasados obtenidos en el dominio de frecuencia, si el procesamiento OLA se realiza después de IMDCT y con ventanas, un componente de solapamiento de dominio de tiempo en una parte inicial de la trama actual varía, y por lo tanto la reconstrucción perfecta puede ser imposible, resultando así en un ruido inesperado. La primera unidad 1513 de ocultación de error de dominio de tiempo puede utilizarse para minimizar la aparición de ruido incluso, aunque se utilice el procedimiento de repetición.
La primera unidad 1610 de ocultación de error de dominio de tiempo que se muestra en la Figura 16 puede incluir una unidad 1612 de ventana, una unidad 1613 de repetición, una unidad 1614 OLA, una unidad 1615 de selección de tamaño de superposición, y una unidad 1616 de suavizado.
Con referencia a la Figura 16, la unidad 1612 de ventana puede realizar la misma operación que la unidad 1412 de ventana de la Figura 14.
La unidad 1613 de repetición puede aplicar una señal IMDCT repetida de dos tramas anteriores (denominada “anterior antigua”) a una parte inicial de una trama actual que es de una trama de error.
La unidad 1614 OLA puede realizar procesamiento OLA en la señal repetida por la unidad 1613 de repetición y una señal IMDCT de la trama actual. Como resultado, puede generarse una señal de salida de audio de la trama actual, y la aparición de ruido en una parte inicial de la señal de salida de audio puede reducirse utilizando la señal anterior de dos tramas. Incluso cuando se aplica el escalado junto con la repetición de un espectro de una trama anterior en el dominio de frecuencia, la posibilidad de que se produzca ruido en la parte inicial de la trama actual puede reducirse mucho.
La unidad 1615 de selección de tamaño de superposición puede seleccionar una longitud ov_tamaño de una duración de superposición de una ventana de suavizado por aplicar en el procesamiento de suavizado, en la que ov_tamaño puede ser siempre un mismo valor, por ejemplo, 12 ms para un tamaño de trama de 20 ms, o puede ajustarse de manera variable de acuerdo con condiciones específicas. Las condiciones específicas pueden incluir información armónica de la trama actual, una diferencia de energía, y similares. La información armónica indica si la trama actual tiene una característica armónica y puede ser transmitida a partir del aparato de codificación u obtenida por el aparato de decodificación. La diferencia de energía indica un valor absoluto de una diferencia de energía normalizada entre la energía Eactual de la trama actual y una media móvil E<ma>de energía por trama. La diferencia de energía puede representarse mediante la Ecuación 1.
En la Ecuación 1, E<ma>= 0,8 * E<ma>+ 0,2 * Eactual.
La unidad 1616 de suavizado puede aplicar la ventana de suavizado seleccionada entre una señal de una trama anterior (salida de audio antigua) y una señal de la trama actual (denominada “salida de audio actual”) y realizar el procesamiento OLA. La ventana de suavizado puede formarse de tal manera que una suma de duraciones de superposición entre ventanas adyacentes sea 1. Los ejemplos de una ventana que satisface esta condición son una ventana de onda sinusoidal, una ventana que utiliza una función primaria, y una ventana de Hanning, pero la ventana de suavizado no se limita a ellas. De acuerdo con una realización ejemplar, puede utilizarse la ventana de onda sinusoidal y, en este caso, una función de ventana w(n) puede representarse mediante la Ecuación 2.
En la Ecuación 2, ov_tamaño denota una longitud de una duración de superposición por ser utilizada en el procesamiento de suavizado, la cual es seleccionada por la unidad 1615 de selección de tamaño de superposición.
Al realizar el procesamiento de suavizado como se ha descrito anteriormente, cuando la trama actual es una trama de error, puede evitarse la discontinuidad entre la trama anterior y la trama actual, lo cual puede producirse al utilizar una señal IMDCT copiada a partir de la trama anterior de dos tramas en lugar de una señal IMDCT almacenada en la trama anterior.
La Figura 17 es un diagrama de bloques de la segunda unidad 1514 de ocultación de error de dominio de tiempo que se muestra en la Figura 15, de acuerdo con una realización ejemplar.
La segunda unidad 1710 de ocultación de error de dominio de tiempo que se muestra en la Figura 17 puede incluir una unidad 1712 de selección de tamaño de superposición y una unidad 1713 de suavizado.
Con referencia a la Figura 17, la unidad 1712 de selección de tamaño de superposición puede seleccionar una longitud ov_tamaño de una duración de superposición de una ventana de suavizado que se aplicará en el procesamiento de suavizado como en la unidad 1615 de selección de tamaño de superposición de la Figura 16.
La unidad 1713 de suavizado puede aplicar la ventana de suavizado seleccionada entre una señal IMDCT antigua y una señal IMDCT actual y realizar el procesamiento OLA. Asimismo, la ventana de suavizado puede formarse de tal manera que una suma de duraciones de superposición entre ventanas adyacentes sea 1.
Es decir, cuando una trama anterior es una trama de error aleatoria y una trama actual es una trama normal, dado que la ventana normal es imposible, es difícil eliminar el solapamiento de dominio de tiempo en una duración de superposición entre una señal IMDCT de la trama anterior y una señal IMDCT de la trama actual. Por lo tanto, el ruido puede minimizarse realizando un procesamiento de suavizado en lugar de un procesamiento OLA.
La Figura 18 es un diagrama de bloques de la tercera unidad 1515 de ocultación de error de dominio de tiempo que se muestra en la Figura 15, de acuerdo con una realización ejemplar.
La tercera unidad 1810 de ocultación de error de dominio de tiempo que se muestra en la Figura 18 puede incluir una unidad 1812 de repetición, una unidad 1813 de escalado, una primera unidad 1814 de suavizado, una unidad 1815 de selección de tamaño de superposición, y una segunda unidad 1816 de suavizado.
Con referencia a la Figura 18, la unidad 1812 de repetición puede copiar, en una parte inicial de una trama actual, una parte correspondiente a una trama siguiente en una señal IMDCT de la trama actual que es una trama normal.
La unidad 1813 de escalado puede ajustar una escala de la trama actual para evitar un aumento repentino de la señal. De acuerdo con una realización ejemplar, la unidad 1813 de escalado puede realizar un escalado descendente de 3 dB. La unidad 1813 de escalado puede ser opcional.
La primera unidad 1814 de suavizado puede aplicar una ventana de suavizado a una señal IMDCT de una trama anterior y a una señal IMDCT copiada a partir de una trama futura y realizar un procesamiento OLA. Asimismo, la ventana de suavizado puede formarse de tal manera que una suma de duraciones de superposición entre ventanas adyacentes sea 1. Es decir, cuando se copia una señal futura, es necesario una ventana para eliminar la discontinuidad la cual puede producirse entre la trama anterior y el actual, y una señal pasada puede sustituirse por la señal futura mediante el procesamiento OLA.
Como la unidad 1615 de selección de tamaño de superposición de la Figura 16, la unidad 1815 de selección de tamaño de superposición puede seleccionar una longitud ov_tamaño de una duración de superposición de una ventana de suavizado que se aplicará en el procesamiento de suavizado.
La segunda unidad 1816 de suavizado puede realizar el procesamiento OLA a la vez que elimina la discontinuidad aplicando la ventana de suavizado seleccionada entre una señal IMDCT antigua que es una señal sustituida y una señal IMDCT actual que es una señal de trama actual. Asimismo, la ventana de suavizado puede formarse de tal manera que una suma de duraciones de superposición entre ventanas adyacentes sea 1.
Es decir, cuando la trama anterior es una trama de error de ráfaga y la trama actual es una trama normal, dado que la ventana normal es imposible, el solapamiento de dominio de tiempo en la duración de superposición entre la señal IMDCT de la trama anterior y la señal IMDCT de la trama actual no puede ser eliminado. En la trama de error de ráfaga, dado que se puede producir ruido o similares debido a una disminución de la energía o a repeticiones continuas, se puede aplicar un procedimiento de copia de una señal futura para la superposición de la trama actual. En este caso, el procesamiento de suavizado puede realizarse dos veces para eliminar el ruido el cual pueda producirse en la trama actual y, simultáneamente, eliminar la discontinuidad la cual pueda producirse entre la trama anterior y la trama actual.
Las Figuras 20A y 20B son diagramas para describir un ejemplo de procesamiento OLA utilizando una señal de dominio de tiempo de un NGF de la Figura 18.
La Figura 20A ilustra un procedimiento para realizar la repetición o el escalado de ganancia utilizando una trama anterior cuando la trama anterior no es una trama de error. Con referencia a la Figura 20B, de modo que no se utiliza un retardo adicional, se realiza la superposición repitiendo una señal de dominio de tiempo decodificada en una trama actual que es un NGF al pasado únicamente para una parte la cual no se ha decodificado a través de superposición, y se realiza además el escalado de ganancia. Un tamaño de una señal por repetir puede seleccionarse como un valor que es menor que o igual a un tamaño de una parte de superposición. De acuerdo con una realización ejemplar, el tamaño de la parte de superposición puede ser 13*L/20, donde L es, por ejemplo, 160 para una banda estrecha (NB), 320 para una banda ancha (WB), 640 para una banda superancha (SWB), y 960 para la banda completa (FB).
Ahora se describirá un procedimiento de obtención de una señal de dominio de tiempo de un NGF a través de la repetición para derivar una señal que se utilizará para un procedimiento de superposición de tiempo.
En la Figura 20B, el ajuste de escala puede realizarse copiando un bloque que tiene un tamaño de 13*L/20, el cual está marcado en una parte futura de una trama n+2, a una parte futura de una trama n+1, la cual corresponde a la misma ubicación que la parte futura de la trama n+2, para sustituir un valor existente de la parte futura de la trama n+1 por un valor de la parte futura de la trama n+2. El valor escalado es, por ejemplo, -3 dB. Para eliminar la discontinuidad entre la trama n+2 y la trama n+1 en la copia, se pueden superponer linealmente una señal de dominio de tiempo obtenida a partir de la trama n+1 de la Figura 20B que es un valor de trama anterior y una señal copiada a partir de la parte futura entre sí en el primer bloque que tenga el tamaño de 13*L/20. Mediante este procedimiento, se puede obtener una señal final de superposición, y cuando la señal n+1 actualizada y la señal n+2 se superponen entre sí, se puede emitir una señal final de dominio de tiempo de la trama n+2.
La Figura 21 es un diagrama de bloques de un aparato 2130 de decodificación de audio de dominio de frecuencia de acuerdo con otra realización ejemplar. En comparación con la realización que se muestra en la Figura 10, se puede incluir además una unidad 2138 de detección estacionaria. Por lo tanto, la descripción detallada de las operaciones de los mismos componentes que los de la Figura 10 no se repite.
Con referencia a la Figura 21, la unidad 2138 de detección estacionaria puede detectar si una trama actual es estacionaria analizando una señal de dominio de tiempo proporcionada por una unidad 2135 de transformación inversa. Un resultado de la detección en la unidad 2138 de detección estacionaria puede ser proporcionado a un módulo 2136 FEC de dominio de tiempo.
La Figura 22 es un diagrama de bloques de la unidad 2138 de detección estacionaria (denominada 2210 en la Figura 22) que se muestra en la Figura 21, de acuerdo con una realización ejemplar. La unidad 2210 de detección estacionaria que se muestra en la Figura 21 puede incluir una unidad 2212 de detección de trama estacionaria y una unidad 2213 de aplicación de histéresis.
Con referencia a la Figura 22, la unidad 2212 de detección de trama estacionaria puede determinar si una trama actual es estacionaria recibiendo información que incluye la envolvente delta env_delta, un modo estacionario modo_estacionario_antiguo de una trama anterior, una diferencia de energía diferencia_energía, y similares. La envolvente delta env_delta se obtiene utilizando información en el dominio de frecuencia e indica la energía media de las diferencias de valor de Norma por banda entre la trama anterior y la trama actual. La envolvente delta env_delta puede representarse mediante la Ecuación 3.
<?-1
E Ed= /.(norrn<antigúala ->nonnik)'}'inb_sfm
k=Q
E EdMA = ENV.SMF*Ee¿1 (1-ENV.SMF)*
En la Ecuación 3, norm_antigua(k) denota un valor de Norma de una banda k de la trama anterior, norm(k) denota un valor de Norma de la banda k de la trama actual, nb_sfm denota el número de bandas, EEd denota el delta de envolvente de la trama actual, EEd_MA se obtiene aplicando un factor de suavizado a EEd y puede establecerse como delta de envolvente que se utilizará para la determinación estacionaria, y ENV_SMF denota el factor de suavizado del delta de envolvente y puede ser 0,1 de acuerdo con una realización de la presente invención. En detalle, un modo estacionario estacionario_modo_actual de la trama actual puede establecerse en 1 cuando la diferencia de energía diferencia_energía es menor que un primer umbral y la env_delta delta es menor que un segundo umbral. El primer umbral y el segundo umbral pueden ser 0,032209 y 1,305974, respectivamente, pero no están limitados a ello.
Si se determina que la trama actual es estacionaria, la unidad 2213 de aplicación de histéresis puede generar la información estacionaria final estacionario_modo_salida de la trama actual aplicando el modo estacionario modo_estacionario_antiguo de la trama anterior para evitar un cambio frecuente en la información estacionaria de la trama actual. Es decir, si se determina en la unidad 2212 de detección de trama estacionaria que la trama actual es estacionaria y la trama anterior es estacionaria, la trama actual se detecta como una trama estacionaria.
La Figura 23 es un diagrama de bloques del módulo 2136 FEC de dominio de tiempo que se muestra en la Figura 21, de acuerdo con una realización ejemplar.
El módulo 2310 FEC de dominio de tiempo que se muestra en la Figura 23 puede incluir una unidad 2312 de selección de modo FEC, primeras y segundas unidades 2313 y 2314 de ocultación de error de dominio de tiempo, y una primera unidad 2315 de actualización de memoria. Las funciones de la primera unidad 2315 de actualización de memoria pueden estar incluidas en la primera y segunda unidades 2313 y 2314 de ocultación de error de dominio de tiempo.
Con referencia a la Figura 23, la unidad 2312 de selección de modo FEC puede seleccionar un modo FEC en el dominio de tiempo recibiendo una bandera de error BFI de una trama actual, una bandera Anterior_BFI de error de una trama anterior, y diversos parámetros. Para las banderas de error, 1 puede indicar una trama de error, y 0 puede indicar una trama normal. Como resultado de la selección en la unidad 2312 de selección de modo FEC, puede proporcionarse una señal de dominio de tiempo de la trama actual a una de las unidades 2313 y 2314 de ocultación de error de dominio de tiempo primera y segunda.
La primera unidad 2313 de ocultación de error de dominio de tiempo puede realizar el procesamiento de ocultación de error cuando la trama actual es una trama de error.
La segunda unidad 2314 de ocultación de error de dominio de tiempo puede realizar el procesamiento de ocultación de error cuando la trama actual es una trama normal y la trama anterior es una trama de error.
La primera unidad 2315 de actualización de memoria puede actualizar diversos tipos de información utilizada para el procesamiento de ocultación de error en la trama actual y almacenar la información en una memoria (no se muestra) para una trama siguiente.
En el procesamiento OLA realizado por la primera y segunda unidades 2313 y 2314 de ocultación de error de dominio de tiempo, puede aplicarse un procedimiento óptimo de acuerdo con si una señal de entrada es transitoria o estacionaria o de acuerdo con un nivel estacionario cuando la señal de entrada es estacionaria. De acuerdo con una realización ejemplar, cuando una señal es estacionaria, una longitud de una duración de superposición de una ventana de suavizado se establece para ser larga, de lo contrario, una longitud utilizada en el procesamiento OLA general se puede utilizar tal como está.
La Figura 24 es un diagrama de flujo para describir una operación de la unidad 2312 de selección de modo FEC de la Figura 23 cuando una trama actual es una trama de error, de acuerdo con una realización ejemplar.
En la Figura 24, los tipos de parámetros utilizados para seleccionar un modo FEC cuando una trama actual es una trama de error son los siguientes: una bandera de error de la trama actual, una bandera de error de una trama anterior, información armónica de un PGF, información armónica de un NGF, y el número de tramas de error continuas. El número de tramas de error continuas puede restablecerse cuando la trama actual es una trama normal. Además, los parámetros pueden incluir información estacionaria del PGF, una diferencia de energía, y un delta de envolvente. Cada pieza de la información armónica puede ser transmitida a partir de un codificador o generada de manera separada por un decodificador.
Con referencia a la Figura 24, en la operación 2411, se puede determinar si la señal de entrada es estacionaria utilizando los diversos parámetros. En detalle, cuando el PGF es estacionario, la diferencia de energía es menor que un primer umbral, y el delta de envolvente del PGF es menor que un segundo umbral, se puede determinar que la señal de entrada es estacionaria. Los umbrales primero y segundo se pueden establecer previamente a través de experimentos o simulaciones.
Si se determina en la operación 2411 que la señal de entrada es estacionaria, entonces en la operación 2413, se puede realizar el procesamiento de repetición y suavizado. Si se determina que la señal de entrada es estacionaria, una longitud de una duración de superposición de una ventana de suavizado puede establecerse para ser más larga, por ejemplo, a 6 ms.
Si se determina en la operación 2411 que la señal de entrada no es estacionaria, entonces en la operación 2415, se puede realizar un procesamiento OLA general.
La Figura 25 es un diagrama de flujo para describir una operación de la unidad 2312 de selección de modo FEC de la Figura 23 cuando una trama anterior es una trama de error y una trama actual no es una trama de error, de acuerdo con una realización ejemplar.
Con referencia a la Figura 25, en la operación 2512, se puede determinar si la señal de entrada es estacionaria utilizando los diversos parámetros. Se pueden utilizar los mismos parámetros que en la operación 2411 de la Figura 24.
Si se determina en la operación 2512 que la señal de entrada no es estacionaria, entonces en la operación 2513, se puede determinar si la trama anterior es una trama de error de ráfaga comprobando si el número de tramas de error continuas es mayor que 1.
Si se determina en la operación 2512 que la señal de entrada es estacionaria, entonces en la operación 2514, el procesamiento de ocultación de error, es decir, el procesamiento de repetición y suavizado, en un NGF se puede realizar en respuesta a la trama anterior que es una trama de error. Cuando se determina que la señal de entrada es estacionaria, una longitud de una duración de superposición de una ventana de suavizado puede establecerse para ser más larga, por ejemplo, a 6 ms.
Si se determina en la operación 2513 que la señal de entrada no es estacionaria y la trama anterior es una trama de error de ráfaga, entonces en la operación 2515, el procesamiento de ocultación de error en un NGF se puede realizar en respuesta a la trama anterior que es una trama de error de ráfaga.
Si se determina en la operación 2513 que la señal de entrada no es estacionaria y la trama anterior es una trama de error aleatoria, entonces en la operación 2516, se puede realizar el procesamiento OLA general.
La Figura 26 es un diagrama de flujo que ilustra una operación de la primera unidad 2313 de ocultación de error de dominio de tiempo de la Figura 23, de acuerdo con una realización ejemplar.
Con referencia a la Figura 26, en la operación 2601, cuando una trama actual es una trama de error, se puede repetir una señal de una trama anterior, y se puede realizar un procesamiento de suavizado. De acuerdo con una realización ejemplar, se puede aplicar una ventana de suavizado que tenga una duración de superposición de 6 ms.
En la operación 2603, la energía Pow1 de una duración predeterminada en una región de superposición puede compararse con la energía Pow2 de una duración predeterminada en una región de no superposición. En detalle, cuando la energía de la región de superposición disminuye o aumenta mucho después del procesamiento de ocultación de error, se puede realizar el procesamiento OLA general, ya que la disminución de la energía puede ocurrir cuando se invierte una fase en la superposición, y el aumento de la energía puede ocurrir cuando se mantiene una fase en la superposición. Cuando una señal es algo estacionaria, dado que el rendimiento de ocultación de error en la operación 2601 es excelente, si una diferencia de energía entre la región de superposición y la región de no superposición es grande como resultado de la operación 2601, indica que se genera un problema debido a una fase en superposición.
Si la diferencia de energía entre la región de superposición y la región de no superposición es grande como resultado de la comparación en la operación 2601, el resultado de la operación 2601 no se selecciona, y se puede realizar el procesamiento OLA general en la operación 2604.
Si la diferencia de energía entre la región de superposición y la región de no superposición no es grande como resultado de la comparación en la operación 2601, se puede seleccionar el resultado de la operación 2601.
La Figura 27 es un diagrama de flujo que ilustra una operación de la segunda unidad 2314 de ocultación de error de dominio de tiempo de la Figura 23, de acuerdo con una realización ejemplar. Las operaciones 2701, 2702, y 2703 de la Figura 27 pueden corresponder a la operación 2514, operación 2515, y operación 2516 de la Figura 25, respectivamente.
La Figura 28 es un diagrama de flujo que ilustra una operación de la segunda unidad 2314 de ocultación de error de dominio de tiempo de la Figura 23, de acuerdo con una realización ejemplar. En comparación con la realización de la Figura 27, la realización de la Figura 28 difiere con respecto al procesamiento de ocultación de error (operación 2801) cuando una trama actual que es un NGF es una trama transitoria y el procesamiento de ocultación de error (operaciones 2802 y 2803) utilizando una ventana de suavizado que tenga una longitud diferente de una duración de superposición cuando la trama actual que es un NGF no es una trama transitoria. Es decir, la realización de la Figura 28 puede aplicarse a un caso en el que el procesamiento OLA en una trama transitoria se incluya además del procesamiento OLA general.
La Figura 29 es un diagrama de bloques para describir un procedimiento de ocultación de error cuando una trama actual es una trama de error en la Figura 26, de acuerdo con una realización ejemplar. En comparación con la realización de la Figura 16, la realización de la Figura 29 difiere en que un componente correspondiente a la unidad de selección de tamaño de superposición (1615 de la Figura 16) está excluido, a la vez que se incluye además una unidad 2916 de comprobación de energía. Es decir, una unidad 2915 de suavizado puede aplicar una ventana de suavizado predeterminada, y la unidad 2916 de comprobación de energía puede realizar una función correspondiente a las operaciones 2603 y 2604 de la Figura 26.
La Figura 30 es un diagrama de bloques para describir un procedimiento de ocultación de error para un NGF que es una trama transitoria cuando una trama anterior es una trama de error en la Figura 28, de acuerdo con una realización de la presente invención. La realización de la Figura 30 puede aplicarse preferentemente cuando un tipo de trama de la trama anterior es transitorio. Es decir, dado que la trama anterior es transitoria, se puede realizar el procesamiento de ocultación de error en el NGF mediante un procedimiento de ocultación de error utilizado en una trama anterior.
Con referencia a la Figura 30, una unidad 3012 de actualización de ventana puede actualizar una longitud de una duración de superposición de una ventana que se utilizará para el procesamiento de suavizado en una trama actual considerando una ventana de la trama anterior.
Una unidad 3013 de suavizado puede realizar el procesamiento de suavizado aplicando la ventana de suavizado actualizada mediante la unidad 3012 de actualización de ventana a la trama anterior y a la trama actual que es un NGF.
La Figura 31 es un diagrama de bloques para describir un procedimiento de ocultación de error para un NGF que no es una trama transitoria cuando una trama anterior es una trama de error en la Figura 27 o 28, de acuerdo con una realización de la presente invención, la cual corresponde a las realizaciones de las Figuras 17 y 18. Es decir, de acuerdo con el número de tramas de error continuas, el procesamiento de ocultación de error correspondiente a una trama de error aleatoria puede realizarse como en la Figura 17, o se puede realizar el procesamiento de ocultación de error correspondiente a una trama de error de ráfaga como en la Figura 18. Sin embargo, en comparación con las realizaciones de las Figuras 17 y 18, la realización de la Figura 31 difiere en que el tamaño de superposición se establece previamente.
Las Figuras 32A a 32D son diagramas que describen un ejemplo de procesamiento OLA cuando una trama actual es una trama de error en la Figura 26. La Figura 32A es un ejemplo de trama transitoria. La Figura 32B ilustra el procesamiento OLA en una trama muy estacionaria, en la que una longitud de M es mayor que N, y una longitud de una duración de superposición en el procesamiento de suavizado es larga. La Figura 32C ilustra el procesamiento OLA en una trama estacionaria menor que en el caso de Figura 32B, y la Figura 32D ilustra el procesamiento OLA general. El procesamiento OLA puede utilizarse independientemente del procesamiento OLA en un NGF.
Las Figuras 33A a 33C son diagramas para describir un ejemplo de procesamiento OLA en un NGF cuando una trama anterior es una trama de error aleatoria en la Figura 27. La Figura 33A ilustra el procesamiento OLA en una trama muy estacionaria, en la que una longitud de K es mayor que L, y una longitud de una duración de superposición en el procesamiento de suavizado es larga. La Figura 33B ilustra el procesamiento OLA en una trama estacionaria menor que en el caso de la Figura 33A, y la Figura 33C ilustra el procesamiento OLA general. El procesamiento OLA puede utilizarse independientemente del procesamiento OLA en una trama de error. Por lo tanto, en el procesamiento OLA son posibles diversas combinaciones entre una trama de error y un NGF.
La Figura 34 es un diagrama para describir un ejemplo de procesamiento OLA en un NGF n+2 cuando una trama anterior es una trama de error de ráfaga en la Figura 27. En comparación con las Figuras 18 y 20, la Figura 34 difiere en que el procesamiento de suavizado puede realizarse ajustando una longitud 3412 o 3413 de una duración de superposición de una ventana de suavizado.
La Figura 35 es un diagrama para describir el concepto de un procedimiento de coincidencia de fase el cual se aplica a una realización ejemplar.
Con referencia a la Figura 35, cuando se produce un error en una trama n en una señal de audio decodificada, puede buscarse un segmento 3513 coincidente, el cual sea el más similar a un segmento 3512 de búsqueda adyacente a la trama n, a partir de una señal decodificada en una trama n-1 anterior de entre N tramas normales pasadas almacenadas en un tampón. En este momento, un tamaño del segmento 3512 de búsqueda y un intervalo de búsqueda en el tampón pueden determinarse de acuerdo con una longitud de onda de una frecuencia mínima correspondiente a un componente tonal por buscar. Para minimizar la complejidad de una búsqueda, el tamaño del segmento 3512 de búsqueda es preferentemente pequeño. Por ejemplo, el tamaño del segmento 3512 de búsqueda puede establecerse mayor que la mitad de la longitud de onda de la frecuencia mínima y menor que la longitud de onda de la frecuencia mínima. El intervalo de búsqueda en el tampón puede ser igual a o mayor que la longitud de onda de la frecuencia mínima por buscar. En detalle, se puede buscar el segmento 3513 coincidente que tenga la mayor correlación cruzada con el segmento 3512 de búsqueda entre las señales decodificadas anteriores dentro del intervalo de búsqueda, se puede obtener la información de ubicación correspondiente al segmento 3513 coincidente, y se puede establecer una duración 3514 predeterminada que comienza a partir de un extremo del segmento 3513 coincidente considerando una longitud de ventana, por ejemplo, una longitud obtenida sumando una longitud de trama y una longitud de una duración de superposición, y copiarse a la trama n en la cual se ha producido un error.
La Figura 36 es un diagrama de bloques de un aparato 3610 de ocultación de error de acuerdo con una realización ejemplar.
El aparato 3610 de ocultación de error que se muestra en la Figura 36 puede incluir una unidad 3611 de generación de bandera de coincidencia de fase, una primera unidad 3612 de selección de modo FEC, un módulo 3613 FEC de coincidencia de fase, un módulo 3614 FEC de dominio de tiempo, y una unidad 3615 de actualización de memoria.
Con referencia a la Figura 36, la unidad 3611 de generación de bandera de coincidencia de fase puede generar una bandera de coincidencia de fase para determinar si el procesamiento de ocultación de error de coincidencia de fase se utiliza en cada trama normal cuando se produce un error en una trama siguiente. Para este fin, se pueden utilizar la energía y los coeficientes espectrales de cada subbanda. La energía puede obtenerse a partir a partir de un valor de Norma, pero no está limitada a ello. En detalle, cuando una subbanda que tiene la máxima energía en una trama actual que es una trama normal pertenece a una banda de baja frecuencia predeterminada, y un cambio de energía dentro de una trama o entre tramas no es grande, la bandera de coincidencia de fase se puede establecer en 1. De acuerdo con una realización ejemplar, cuando una subbanda que tiene la energía máxima en una trama actual pertenece a 75 Hz a 1000 Hz, y un índice de la trama actual es el mismo que un índice de una trama anterior con respecto a una subbanda correspondiente, el procesamiento de ocultación de error de coincidencia de fase puede aplicarse a una trama siguiente en la cual se ha producido un error. De acuerdo con otra realización ejemplar, cuando una subbanda que tiene la energía máxima en una trama actual pertenece a 75 Hz a 1000 Hz, y una diferencia entre un índice de la trama actual y un índice de una trama anterior con respecto a una subbanda correspondiente es 1 o menor, el procesamiento de ocultación de error de coincidencia de fase puede aplicarse a una trama siguiente en la cual se ha producido un error. De acuerdo con otra realización ejemplar, cuando una subbanda que tiene la energía máxima en una trama actual pertenece a 75 Hz a 1000 Hz, un índice de la trama actual es el mismo que un índice de una trama anterior con respecto a una subbanda correspondiente, la trama actual es una trama estacionaria de la cual un cambio de energía es pequeño, y N tramas anteriores almacenadas en un tampón son tramas normales y no son tramas transitorias, el procesamiento de ocultación de error de coincidencia de fase puede aplicarse a una trama siguiente en la cual se ha producido un error. De acuerdo con otra realización ejemplar, cuando una subbanda que tiene la energía máxima en una trama actual pertenece a 75 Hz a 1000 Hz, una diferencia entre un índice de la trama actual y un índice de una trama anterior con respecto a una subbanda correspondiente es 1 o menor, la trama actual es una trama estacionaria de la cual un cambio de energía es pequeño, y N tramas anteriores almacenadas en el tampón son tramas normales y no son tramas transitorias, el procesamiento de ocultación de error de coincidencia de fase puede aplicarse a una trama siguiente en la cual se ha producido un error. Se puede determinar si la trama actual es una trama estacionaria comparando la diferencia de energía con un umbral utilizado en el procedimiento de detección de trama estacionaria descrito anteriormente. Además, se puede determinar si las tres últimas tramas entre una pluralidad de tramas anteriores almacenadas en el tampón son tramas normales, y se puede determinar si las dos últimas tramas de las mismas son tramas transitorias, pero la presente realización no se limita a ello.
El procesamiento de ocultación de error de coincidencia de fase puede aplicarse si se produce un error en una trama siguiente cuando la bandera de coincidencia de fase generada por la unidad 3611 de generación de bandera de coincidencia de fase se establece en 1.
La primera unidad 3612 de selección de modo FEC puede seleccionar uno de una pluralidad de modos FEC considerando la bandera de coincidencia de fase y los estados de la trama anterior y la trama actual. La bandera de coincidencia de fase puede indicar el estado de un PGF. Los estados de la trama anterior y de la trama actual pueden incluir si la trama anterior o la trama actual es una trama de error, si la trama actual es una trama de error aleatoria o una trama de error de ráfaga, o si se ha realizado el procesamiento de ocultación de error de coincidencia de fase en una trama de error anterior. De acuerdo con una realización ejemplar, la pluralidad de modos FEC puede incluir un primer modo FEC principal que utiliza el procesamiento de ocultación de error de coincidencia de fase y un segundo modo FEC principal que utiliza el procesamiento de ocultación de error de dominio de tiempo. El primer modo FEC principal puede incluir un primer modo sub FEC para una trama actual cuya bandera de coincidencia de fase esté establecida en 1 y la cual sea una trama de error aleatoria, un segundo modo sub FEC para una trama actual que sea un NGF cuando una trama anterior sea una trama de error y se haya realizado el procesamiento de ocultación de error de coincidencia de fase en la trama anterior, y un tercer modo sub FEC para una trama actual que forme una trama de error de ráfaga cuando se haya realizado el procesamiento de ocultación de error de coincidencia de fase en la trama anterior. De acuerdo con una realización ejemplar, el segundo modo FEC principal puede incluir un cuarto modo sub FEC para una trama actual cuya bandera de coincidencia de fase esté establecida en 0 y la cual sea una trama de error y un quinto modo sub FEC para una trama actual cuya bandera de coincidencia de fase esté establecida en 0 y que sea un NGF de una trama de error anterior. De acuerdo con una realización ejemplar, el cuarto o quinto modo sub FEC puede seleccionarse en el mismo procedimiento como se ha descrito con respecto a la Figura 23, y se puede realizar el mismo procesamiento de ocultación de error en correspondencia con el modo FEC seleccionado.
El módulo 3613 FEC de coincidencia de fase puede operar cuando el modo FEC seleccionado por la primera unidad 3612 de selección de modo FEC es el primer modo FEC principal y generar una señal de dominio de tiempo de ocultación de error realizando un procesamiento de ocultación de error de coincidencia de fase correspondiente a cada uno de los modos FEC primero a tercero. En la presente memoria, por conveniencia de descripción, se muestra que la señal de dominio de tiempo de ocultación de error se emite a través de la unidad 3615 de actualización de memoria.
El módulo 3614 FEC de dominio de tiempo puede operar cuando el modo FEC seleccionado por la primera unidad 3612 de selección de modo FEC es el segundo modo FEC principal y generar una señal de dominio de tiempo de ocultación de error realizando un procesamiento de ocultación de error de coincidencia de fase correspondiente a cada uno de los modos sub FEC cuarto y quinto. Asimismo, por conveniencia de la descripción, se muestra que la señal de dominio de tiempo de ocultación de error se emite a través de la unidad 3615 de actualización de memoria.
La unidad 3615 de actualización de memoria puede recibir un resultado de la ocultación de error en el módulo 3613 FEC de coincidencia de fase o el módulo 3614 FEC de dominio de tiempo y actualizar una pluralidad de parámetros para el procesamiento de ocultación de error en una trama siguiente. De acuerdo con una realización ejemplar, las funciones de la unidad 3615 de actualización de memoria pueden incluirse en el módulo 3613 FEC de coincidencia de fase y en el módulo 3614 FEC de dominio de tiempo.
Como se ha descrito anteriormente, al repetir una señal de coincidencia de fase de dominio de tiempo en lugar de repetir coeficientes espectrales obtenidos de dominio de frecuencia para una trama de error, cuando se utiliza una ventana que tiene una duración de superposición de una longitud menor que 50 %, el ruido, el cual puede generarse en la duración de superposición en una banda de baja frecuencia, puede restringirse eficientemente.
La Figura 37 es un diagrama de bloques del módulo 3613 FEC de coincidencia de fase o del módulo 3614 FEC de dominio de tiempo de la Figura 36, de acuerdo con una realización ejemplar.
El módulo 3710 FEC de coincidencia de fase que se muestra en la Figura 37 puede incluir una segunda unidad 3711 de selección de modo FEC y unidades 3712, 3713 y 3714 de ocultación de error de coincidencia de fase primera a tercera, y el módulo 3730 FEC de dominio de tiempo que se muestra en la Figura 37 puede incluir una tercera unidad 3731 de selección de modo FEC y primeras y segundas unidades 3732 y 3733 de ocultación de error de dominio de tiempo. De acuerdo con una realización ejemplar, la segunda unidad 3711 de selección de modo FEC y la tercera unidad 3731 de selección de modo FEC pueden incluirse en la primera unidad 3612 de selección de modo FEC de la Figura 36.
Con referencia a la Figura 37, la primera unidad 3712 de ocultación de error de coincidencia de fase puede realizar el procesamiento de ocultación de error de coincidencia de fase en una trama actual que es una trama de error aleatoria cuando un PGF tiene la energía máxima en una banda de baja frecuencia predeterminada y un cambio en la energía es menor que un umbral predeterminado. De acuerdo con una realización de la presente invención, incluso aunque se cumpla la condición anterior, se obtiene una escala de correlación accA, y el procesamiento de ocultación de error de coincidencia de fase o el procesamiento OLA general puede realizarse en de acuerdo con si la escala de correlación accA está dentro de un intervalo predeterminado. Es decir, si se realiza el procesamiento de ocultación de error de coincidencia de fase se determina preferentemente considerando una correlación entre segmentos existentes en un intervalo de búsqueda y una correlación cruzada entre un segmento de búsqueda y los segmentos existentes en el intervalo de búsqueda. Esto se describirá ahora en más detalle.
La escala de correlación accA puede obtenerse mediante la Ecuación 4.
En la Ecuación 4, d denota el número de segmentos existentes en un intervalo de búsqueda, Rxy denota una correlación cruzada utilizada para buscar el segmento 3513 coincidente que tiene la misma longitud que el segmento 3512 de búsqueda (señal x) con respecto a las N tramas normales pasadas (señal y) almacenadas en el tampón con referencia a la Figura 35, y Ryy denota una correlación entre segmentos existentes en las N tramas normales pasadas (señal y) almacenadas en el tampón.
A continuación, puede determinarse si la escala de correlación accA está dentro del intervalo predeterminado, y si la escala de correlación accA está dentro del intervalo predeterminado, se puede realizar el procesamiento de ocultación de error de coincidencia de fase en una trama actual que es una trama de error, de lo contrario, se puede realizar el procesamiento OLA general en la trama actual. De acuerdo con una realización ejemplar, si la escala de correlación accA es menor que 0,5 o mayor que 1,5, se puede realizar el procesamiento OLA general, de lo contrario, se puede realizar el procesamiento de ocultación de error de coincidencia de fase. En la presente memoria, el valor límite superior y el valor límite inferior son sólo ilustrativos, y pueden establecerse previamente como valores óptimos a través de experimentos o simulaciones.
La segunda unidad 3713 de ocultación de error de coincidencia de fase puede realizar el procesamiento de ocultación de error de coincidencia de fase en una trama actual que es un PGF cuando una trama anterior es una trama de error y se ha realizado el procesamiento de ocultación de error de coincidencia de fase en la trama anterior.
La tercera unidad 3714 de ocultación de error de coincidencia de fase puede realizar el procesamiento de ocultación de error de coincidencia de fase en una trama actual que forma una trama de error de ráfaga cuando una trama anterior es una trama de error y se ha realizado el procesamiento de ocultación de error de coincidencia de fase en la trama anterior.
La primera unidad 3732 de ocultación de error de dominio de tiempo puede realizar un procesamiento de ocultación de error de dominio de tiempo en una trama actual que es una trama de error cuando un PGF no tiene la energía máxima en una banda de baja frecuencia predeterminada.
La segunda unidad 3733 de ocultación de errores de dominio de tiempo puede realizar el procesamiento de ocultación de error de dominio de tiempo en una trama actual que es un NGF de una trama de error anterior cuando un PGF no tiene la energía máxima en la banda de baja frecuencia predeterminada.
La Figura 38 es un diagrama de bloques de la primera o segunda unidad 3712 o 3713 de ocultación de error de coincidencia de fase de la Figura 37, de acuerdo con una realización ejemplar.
La unidad 3810 de ocultación de error de coincidencia de fase que se muestra en la Figura 38 puede incluir una unidad 3812 de búsqueda de correlación máxima, una unidad 3813 de copiado, y una unidad 3814 de suavizado.
Con referencia a la Figura 38, la unidad 3812 de búsqueda de correlación máxima puede buscar un segmento coincidente, el cual tenga la máxima correlación con, es decir, que sea más similar a, un segmento de búsqueda adyacente a una trama actual, a partir de una señal decodificada en un PGF de entre N tramas normales pasadas almacenadas en un tampón. Un índice de ubicación del segmento coincidente obtenido como resultado de la búsqueda puede proporcionarse a la unidad 3813 de copiado. La unidad 3812 de búsqueda de correlación máxima puede operar de la misma manera para una trama actual que es una trama de error aleatoria o una trama actual que es una trama normal cuando una trama anterior es una trama de error aleatoria y se ha realizado el procesamiento de ocultación de error de coincidencia de fase en la trama anterior. Cuando la trama actual es una trama de error, el procesamiento de ocultación de error de dominio de frecuencia se puede realizar preferentemente previamente. De acuerdo con una realización ejemplar, la unidad 3812 de búsqueda de correlación máxima puede obtener una escala de correlación para la trama actual que es una trama de error para la cual se ha determinado que se va a realizar un procesamiento de ocultación de error de coincidencia de fase y determinar de nuevo si el procesamiento de ocultación de error de coincidencia de fase es adecuado.
La unidad 3813 de copiado puede copiar una duración predeterminada que comienza a partir de un final del segmento coincidente a la trama actual que es una trama de error haciendo referencia al índice de ubicación del segmento coincidente. Además, la unidad 3813 de copiado puede copiar la duración predeterminada que comienza a partir del final del segmento coincidente a la trama actual que es una trama normal haciendo referencia al índice de ubicación del segmento coincidente cuando la trama anterior es una trama de error aleatoria y se ha realizado el procesamiento de ocultación de error de coincidencia de fase en la trama anterior. En este momento, se puede copiar en la trama actual una duración correspondiente a una longitud de ventana. De acuerdo con una realización ejemplar, cuando una duración copiable que comienza a partir del final del segmento coincidente es más corta que la longitud de ventana, la duración copiable que comienza a partir del final del segmento coincidente puede copiarse repetidamente en la trama actual.
La unidad 3814 de suavizado puede generar una señal de dominio de tiempo en la trama actual de ocultación de error realizando un procesamiento de suavizado a través de OLA para minimizar la discontinuidad entre la trama actual y las tramas adyacentes. Se describirá en detalle una operación de la unidad 3814 de suavizado con referencia a las Figuras 39 y 40.
La Figura 39 es un diagrama para describir una operación de la unidad 3814 de suavizado de la Figura 38, de acuerdo con una realización ejemplar.
Con referencia a la Figura 39, se puede buscar un segmento 3913 coincidente, el cual es el más similar a un segmento 3912 de búsqueda adyacente a una trama n actual que es una trama de error, a partir de una señal decodificada en una trama n-1 anterior de entre N tramas normales pasadas almacenadas en un tampón. A continuación, se puede copiar una duración predeterminada que comienza a partir de un final del segmento 3913 coincidente a la trama n actual en la cual se ha producido un error, considerando una longitud de ventana. Cuando se completa el procedimiento de copia, la superposición en una señal 3914 copiada y una señal 3915 Oldauout almacenada en la trama n-1 anterior para la superposición se puede realizar en una parte inicial de la trama n actual por una primera duración 3916 de superposición. Una longitud de la primera duración 3916 de superposición puede ser más corta que una longitud utilizada en el procesamiento OLA general, dado que las fases de las señales coinciden entre sí. Por ejemplo, si se utilizan 6 ms en el procesamiento OLA general, la primera duración 3916 de superposición puede utilizar 1 ms, pero no está limitada a ello. Cuando una duración copiable que comienza a partir de un final del segmento 3913 coincidente es más corta que la longitud de ventana, la duración copiable que comienza a partir del final del segmento 3913 coincidente se puede superponer parcialmente y copiarse repetidamente en la trama n actual. De acuerdo con una realización ejemplar, la duración de superposición puede ser la misma que la primera duración 3916 de superposición. En este caso, la superposición en una parte superpuesta en dos señales 3914 y 3917 copiadas y una señal 3918 Oldauout almacenada en la trama n actual para la superposición puede realizarse en una parte inicial de una siguiente trama n+1 mediante una segunda duración 3919 de superposición. Una longitud de la segunda duración 3919 de superposición puede ser más corta que una longitud utilizada en el procesamiento OLA general, dado que las fases de las señales coinciden entre sí. Por ejemplo, la longitud de la segunda duración 3919 de superposición puede ser la misma que la longitud de la primera duración 3916 de superposición. Es decir, cuando la duración copiable que comienza a partir del final del segmento 3913 coincidente es igual a o mayor que la longitud de ventana, se puede realizar únicamente la superposición con respecto a la primera duración 3916 de superposición. Como se ha descrito anteriormente, al realizar la superposición en la señal 3914 copiada y la señal 3915 Oldauout almacenada en la trama n-1 anterior para la superposición, la discontinuidad con la trama n-1 anterior en la parte inicial de la trama n actual puede minimizarse. Como resultado, se puede generar una señal 3920 la cual corresponde a la longitud de ventana y para la cual se ha realizado un procesamiento de suavizado entre la trama n actual y la trama n-1 anterior y se ha ocultado un error.
La Figura 40 es un diagrama para describir una operación de la unidad 3814 de suavizado de la Figura 38, de acuerdo con una realización ejemplar.
Con referencia a la Figura 40, se puede buscar un segmento 4013 coincidente, el cual sea el más similar a un segmento 4012 de búsqueda adyacente a una trama n actual que es una trama de error, a partir de una señal decodificada en una trama n-1 anterior de entre N tramas normales pasadas almacenadas en un tampón. A continuación, se puede copiar una duración predeterminada que comienza a partir de un final del segmento 4013 coincidente a la trama n actual en la cual se ha producido un error, considerando una longitud de ventana. Cuando se completa el procedimiento de copia, la superposición en una señal 4014 copiada y una señal 4015 Oldauout almacenada en la trama n-1 anterior para la superposición se puede realizar en una parte inicial de la trama n actual por una primera duración 4016 de superposición. Una longitud de la primera duración 4016 de superposición puede ser más corta que una longitud utilizada en el procesamiento OLA general, dado que las fases de las señales coinciden entre sí. Por ejemplo, si se utilizan 6 ms en el procesamiento OLA general, la primera duración 4016 de superposición puede utilizar 1 ms, pero no está limitada a ello. Cuando una duración copiable que comienza a partir de un final del segmento 4013 coincidente es más corta que la longitud de ventana, la duración copiable que comienza a partir del final del segmento 4013 coincidente puede superponerse parcialmente y copiarse repetidamente en la trama n actual. En este caso, se puede realizar la superposición en una parte 4019 de superposición en dos señales 4014 y 4017 copiadas. Una longitud de la parte 4019 de superposición puede ser preferentemente la misma que la longitud de la primera duración 4016 de superposición. Es decir, cuando la duración copiable a partir del final del segmento 4013 coincidente es igual a o mayor que la longitud de ventana, se puede realizar la superposición con respecto a la primera duración 4016 de superposición. Como se ha descrito anteriormente, al realizar la superposición en la señal 4014 copiada y la señal 4015 Oldauout almacenada en la trama n-1 anterior para la superposición, se puede minimizar la discontinuidad con la trama n-1 anterior en la parte inicial de la trama n actual. Como resultado, se puede generar una primera señal 4020 la cual corresponde a la longitud de ventana y para la cual se ha realizado un procesamiento de suavizado entre la trama n actual y la trama n-1 anterior y se ha ocultado un error. A continuación, realizando, en una duración 4022 de superposición, una superposición sobre una señal correspondiente a la duración 4022 de superposición y una señal 4018 Oldauout almacenada en la trama n actual para la superposición, se puede generar una segunda señal 4023 para la cual se minimiza la discontinuidad entre la trama n actual que es una trama de error y una trama siguiente n+1 en la duración 4022 de superposición.
En consecuencia, cuando una frecuencia principal, por ejemplo, una frecuencia fundamental, de una señal varía en cada trama, o cuando la señal varía rápidamente, aunque el desajuste de fase se produce en una parte final de una señal copiada, es decir, en una duración de superposición con la siguiente trama n+1, la discontinuidad entre la trama n actual y la siguiente trama n+1 puede minimizarse realizando un procesamiento de suavizado.
La Figura 41 es un diagrama de bloques de un dispositivo multimedia que incluye un módulo de codificación, de acuerdo con una realización ejemplar.
Con referencia a la Figura 41, el dispositivo 4100 multimedia puede incluir una unidad 4110 de comunicación y el módulo 4130 de codificación. Además, el dispositivo 4100 multimedia puede incluir además una unidad 4150 de almacenamiento para almacenar un flujo de bits de audio obtenido como resultado de la codificación de acuerdo con el uso del flujo de bits de audio. Además, el dispositivo 4100 multimedia puede incluir un micrófono 4170. Es decir, la unidad 4150 de almacenamiento y el micrófono 4170 pueden incluirse opcionalmente. El dispositivo 4100 multimedia puede incluir además un módulo de decodificación arbitrario (no se muestra), por ejemplo, un módulo de decodificación para realizar una función de decodificación general o un módulo de decodificación de acuerdo con una realización ejemplar. El módulo 4130 de codificación puede ser implementado por al menos un procesador, por ejemplo, una unidad de procesamiento (no se muestra) integrándose con otros componentes (no se muestran) incluidos en el dispositivo 4100 multimedia como un cuerpo.
La unidad 4110 de comunicación puede recibir al menos una de una señal de audio o un flujo de bits codificado proporcionado a partir del exterior o transmitir al menos una de una señal de audio reconstruida o un flujo de bits codificado obtenido como resultado de la codificación mediante el módulo 4130 de codificación.
La unidad 4110 de comunicación está configurada para transmitir y recibir datos hacia y a partir de un dispositivo multimedia externo a través de una red inalámbrica, tal como Internet inalámbrico, intranet inalámbrico, una red telefónica inalámbrica, una red de área local inalámbrica (LAN), Wi-Fi, Wi-Fi Directo (WFD), tercera generación (3G), cuarta generación (4G), Bluetooth, Asociación de Datos por Infrarrojos (IrDA), Identificación por Radiofrecuencia (RFID), Banda Ultra Ancha (UWB), Zigbee, o Comunicación de Campo Cercano (NFC), o una red cableada, tal como una red telefónica por cable o Internet por cable.
De acuerdo con una realización ejemplar, el módulo 4130 de codificación puede establecer una bandera de resaca para una trama siguiente en consideración de si una duración en la cual se detecta un transitorio en una trama actual pertenece a una duración de superposición, en una señal de dominio de tiempo, la cual se proporciona a través de la unidad 4110 de comunicación o el micrófono 4170.
La unidad 4150 de almacenamiento puede almacenar el flujo de bits codificado generado por el módulo 4130 de codificación. Además, la unidad 4150 de almacenamiento puede almacenar diversos programas necesarios para operar el dispositivo 4100 multimedia.
El micrófono 4170 puede proporcionar una señal de audio desde un usuario o desde el exterior al módulo 4130 de codificación.
La Figura 42 es un diagrama de bloques de un dispositivo multimedia que incluye un módulo de decodificación, de acuerdo con una realización ejemplar.
El dispositivo 4200 multimedia de la Figura 42, puede incluir una unidad 4210 de comunicación y el módulo 4230 de codificación. Además, de acuerdo con el uso de una señal de audio reconstruida obtenida como resultado de la decodificación, el dispositivo 4200 multimedia de la Figura 42 puede incluir además una unidad 4250 de almacenamiento para almacenar la señal de audio reconstruida. Además, el dispositivo 4200 multimedia de la Figura 42 puede incluir además un altavoz 4270. Es decir, la unidad 4250 de almacenamiento y el altavoz 4270 son opcionales. El dispositivo 4200 multimedia de la Figura 42 puede incluir además un módulo de codificación (no se muestra), por ejemplo, un módulo de codificación para realizar una función de codificación general o un módulo de codificación de acuerdo con una realización ejemplar. El módulo 4230 de decodificación puede estar integrado con otros componentes (no se muestran) incluidos en el dispositivo 4200 multimedia e implementado por al menos un procesador, por ejemplo, una unidad central de procesamiento (CPU).
Con referencia a la Figura 42, la unidad 4210 de comunicación puede recibir al menos una de una señal de audio o un flujo de bits codificado proporcionado desde el exterior o puede transmitir al menos una de una señal de audio reconstruida obtenida como resultado de la decodificación en el módulo 4230 de decodificación o un flujo de bits de audio obtenido como resultado de la codificación. La unidad 4210 de comunicación puede implementarse sustancialmente y de manera similar a la unidad 4110 de comunicación de la Figura 41.
De acuerdo con una realización ejemplar, el módulo 4230 de decodificación puede recibir un flujo de bits proporcionado a través de la unidad 4210 de comunicación, realizar el procesamiento de ocultación de error en un dominio de frecuencia cuando una trama actual es una trama de error, decodificar coeficientes espectrales cuando la trama actual es una trama normal, realizar el procesamiento de transformación inversa de frecuencia de tiempo en la trama actual que es una trama de error o una trama normal, y seleccionar un modo FEC, en base a los estados de la trama actual y de una trama anterior de la trama actual en una señal de dominio de tiempo generada después del procesamiento de transformación inversa de frecuencia de tiempo y realizando el correspondiente procesamiento de ocultación de error de dominio de tiempo en la trama actual en base al modo FEC seleccionado, en el que la trama actual es una trama de error o la trama actual es una trama normal cuando la trama anterior es una trama de error.
La unidad 4250 de almacenamiento puede almacenar la señal de audio reconstruida generada por el módulo 4230 de decodificación. Además, la unidad 4250 de almacenamiento puede almacenar diversos programas necesarios para operar el dispositivo 4200 multimedia.
El altavoz 4270 puede emitir al exterior la señal de audio reconstruida generada por el módulo 4230 de decodificación.
La Figura 43 es un diagrama de bloques de un dispositivo multimedia que incluye un módulo de codificación y un módulo de decodificación, de acuerdo con una realización ejemplar.
El dispositivo 4300 multimedia que se muestra en la Figura 43 puede incluir una unidad 4310 de comunicación, un módulo 4320 de codificación, y un módulo 4330 de decodificación. Además, el dispositivo 4300 multimedia puede incluir además una unidad 4340 de almacenamiento para almacenar un flujo de bits de audio obtenido como resultado de la codificación o una señal de audio reconstruida obtenida como resultado de la decodificación de acuerdo con el uso del flujo de bits de audio o la señal de audio reconstruida. Además, el dispositivo 4300 multimedia puede incluir además un micrófono 4350 y/o un altavoz 4360. El módulo 4320 de codificación y el módulo 4330 de decodificación pueden ser implementados por al menos un procesador, por ejemplo, la unidad central de procesamiento (CPU) (no se muestra) integrándose con otros componentes (no se muestran) incluidos en el dispositivo 4300 multimedia como un cuerpo.
Dado que los componentes del dispositivo 4300 multimedia que se muestra en la Figura 43 corresponden a los componentes del dispositivo 4100 multimedia que se muestra en la Figura 41 o los componentes del dispositivo 4200 multimedia que se muestra en la Figura 42, se omite una descripción detallada de la misma.
Cada uno de los dispositivos 4100, 4200, y 4300 multimedia que se muestran en las Figuras 41, 42, y 43 pueden incluir un único terminal de comunicación de voz, tal como un teléfono o un teléfono móvil, un único dispositivo de radiodifusión o de música, tal como un televisor o un reproductor de MP3, o un dispositivo terminal híbrido de un único terminal de comunicación de voz y un único dispositivo de radiodifusión o de música, pero no se limitan a ello. Además, cada uno de los dispositivos 4100, 4200, y 4300 multimedia puede ser utilizado como un cliente, un servidor, o un transductor desplazado entre un cliente y un servidor.
Cuando el dispositivo 4100, 4200, o 4300 multimedia es, por ejemplo, un teléfono móvil, aunque no se muestra, el dispositivo 4100, 4200, o 4300 multimedia puede incluir además una unidad de entrada del usuario, tal como un teclado, una unidad de visualización para visualizar información procesada por una interfaz de usuario o el teléfono móvil, y un procesador para controlar las funciones del teléfono móvil. Además, el teléfono móvil puede incluir además una unidad de cámara que tiene una función de captación de imágenes y al menos un componente para realizar una función necesaria para el teléfono móvil.
Cuando el dispositivo 4100, 4200, o 4300 multimedia es, por ejemplo, un televisor, aunque no se muestra, el dispositivo 4100, 4200, o 4300 multimedia puede incluir además una unidad de entrada del usuario, tal como un teclado, una unidad de visualización para visualizar la información de radiodifusión recibida, y un procesador para controlar todas las funciones del televisor. Además, el televisor puede incluir además al menos un componente para realizar una función del televisor.
Los procedimientos de acuerdo con las realizaciones pueden ser escritos como programas ejecutables por ordenador y pueden implementarse en ordenadores digitales de uso general que ejecutan los programas utilizando un medio de registro no transitorio legible por ordenador. Además, las estructuras de datos, las instrucciones de programa, o los archivos de datos, los cuales pueden utilizarse en las realizaciones, pueden registrarse en un medio de registro no transitorio legible por ordenador de diversas maneras. El medio de registro no transitorio legible por ordenador es cualquier dispositivo de almacenamiento de datos que puede almacenar datos los cuales luego pueden ser leídos por un sistema de ordenador. Entre los ejemplos del medio de registro no transitorio legible por ordenador se incluyen los medios de almacenamiento magnético, tal como los discos duros, los disquetes, y las cintas magnéticas, los medios de registro óptico, tal como los CD-ROMs y los DVDs, los medios magneto-ópticos, tal como los discos ópticos, y los dispositivos de hardware, tal como ROM, RAM, y la memoria flash, especialmente configurados para almacenar y ejecutar instrucciones de programa. Además, el medio de registro no transitorio legible por ordenador puede ser un medio de transmisión para transmitir la señal que designa las instrucciones del programa, las estructuras de datos, o similares. Los ejemplos de las instrucciones del programa pueden incluir no solo códigos de lenguaje mecánico creados por un compilador sino también códigos de lenguaje de alto nivel ejecutables por un ordenador usando un intérprete o similares.
Si bien las realizaciones ejemplares se han mostrado y descrito en particular, los expertos en la técnica entenderán que se pueden realizar diversos cambios en la forma y los detalles sin apartarse del ámbito de las reivindicaciones adjuntas.

Claims (7)

REIVINDICACIONES
1. Un procedimiento de ocultación de error, mediante un módulo (1510) de ocultación de error de trama, FEC, de dominio de tiempo, de una señal de audio, comprendiendo el procedimiento:
comprobación, por una unidad (1512) de selección del modo FEC, de si una trama actual es una trama de error o una trama buena, en una señal de dominio de tiempo transformada a partir de una señal de dominio de frecuencia;
comprobación, por la unidad (1512) de selección del modo FEC, de si una trama anterior es una trama de error de ráfaga o una trama de error aleatoria, cuando la trama actual es una trama buena;
selección, por la unidad (1512) de selección del modo FEC, de un modo de entre una pluralidad de modos asociados con el suavizado, cuando la trama actual se clasifica como una trama de error, una trama buena después de una trama de error de ráfaga o una trama buena después de una trama de error aleatoria; y aplicación, por una primera unidad (1513) de ocultación de error de dominio de tiempo, de una segunda unidad (1514) de ocultación de error de dominio de tiempo y una tercera unidad (1515) de ocultación de errores de dominio de tiempo, un procesamiento de ocultación de error diferente a la trama actual, en base al modo seleccionado,
en el que la pluralidad de modos incluye un primer modo cuando la trama actual es una trama de error, un segundo modo cuando la trama actual es una trama buena después de una trama de error de ráfaga, y un tercer modo cuando la trama actual es una trama buena después de una trama de error aleatoria.
2. El procedimiento de la reivindicación 1, que comprende además realizar el procesamiento de ocultación de error de dominio de frecuencia en la trama actual cuando la trama actual es una trama de error antes del procesamiento de transformada inversa de tiempo-frecuencia.
3. El procedimiento de la reivindicación 1, en el que la aplicación cuando la trama actual es una trama de error comprende:
realizar un procesamiento de ventana en una señal de la trama de error actual después del procesamiento de transformada inversa de tiempo-frecuencia;
repetir una señal de una trama que son dos tramas anteriores a la trama actual en una parte inicial de la trama actual;
realizar un procesamiento de superposición y adición, OLA, en la señal repetida en la parte inicial de la trama de error actual y la señal de la trama de error actual; y
realizar un procesamiento de suavizado aplicando una ventana de suavizado que tenga una duración de superposición predeterminada entre una señal de una trama anterior y la señal de la trama de error actual.
4. El procedimiento de la reivindicación 1, en el que la aplicación cuando la trama actual es una trama buena después de una trama de error aleatoria comprende:
realizar un procesamiento de superposición y adición, OLA, aplicando una ventana de suavizado entre una señal de una trama anterior y una señal de la trama actual.
5. El procedimiento de la reivindicación 1, en el que la aplicación cuando la trama actual es una trama buena después de una trama de error de ráfaga comprende:
copiar una señal para la superposición y adición, OLA, el procesamiento de una trama siguiente de la trama actual a una parte inicial de la trama actual;
realizar un procesamiento de suavizado en una señal de una trama anterior y la señal copiada para generar una señal sustituida de la trama anterior; y
realizar un procesamiento de suavizado en la señal sustituida y una señal de la trama actual.
6. El procedimiento de la reivindicación 5, en el que la aplicación cuando la trama actual es una trama buena después de una trama de error de la ráfaga comprende además reducir la escala de la trama actual obtenida por un resultado de la copia.
7. El procedimiento de la reivindicación 2, que además comprende:
coeficientes espectrales de decodificación cuando la trama actual es una buena trama;
realizar el procesamiento de transformada inversa de tiempo-frecuencia en la trama actual que es una trama de error o una trama buena.
ES13800914T 2012-06-08 2013-06-10 Procedimiento y aparato para la ocultación de errores de trama y procedimiento y aparato para la decodificación de audio Active ES2960089T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261657348P 2012-06-08 2012-06-08
US201261672040P 2012-07-16 2012-07-16
US201261704739P 2012-09-24 2012-09-24
PCT/KR2013/005095 WO2013183977A1 (ko) 2012-06-08 2013-06-10 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치

Publications (1)

Publication Number Publication Date
ES2960089T3 true ES2960089T3 (es) 2024-02-29

Family

ID=49712305

Family Applications (1)

Application Number Title Priority Date Filing Date
ES13800914T Active ES2960089T3 (es) 2012-06-08 2013-06-10 Procedimiento y aparato para la ocultación de errores de trama y procedimiento y aparato para la decodificación de audio

Country Status (10)

Country Link
US (3) US9558750B2 (es)
EP (2) EP4235657A3 (es)
JP (2) JP6088644B2 (es)
KR (2) KR102102450B1 (es)
CN (3) CN104718571B (es)
ES (1) ES2960089T3 (es)
HU (1) HUE063724T2 (es)
PL (1) PL2874149T3 (es)
TW (2) TWI626644B (es)
WO (1) WO2013183977A1 (es)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2697920C (en) 2007-08-27 2018-01-02 Telefonaktiebolaget L M Ericsson (Publ) Transient detector and method for supporting encoding of an audio signal
SG11201510513WA (en) 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals
KR102653849B1 (ko) 2014-03-24 2024-04-02 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
JP6402487B2 (ja) * 2014-05-13 2018-10-10 セイコーエプソン株式会社 音声処理装置および音声処理装置の制御方法
KR101929782B1 (ko) 2014-06-10 2018-12-17 엘지전자 주식회사 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법
EP3155616A1 (en) * 2014-06-13 2017-04-19 Telefonaktiebolaget LM Ericsson (publ) Burst frame error handling
WO2016016724A2 (ko) * 2014-07-28 2016-02-04 삼성전자 주식회사 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
US9916835B2 (en) * 2015-01-22 2018-03-13 Sennheiser Electronic Gmbh & Co. Kg Digital wireless audio transmission system
US10008214B2 (en) * 2015-09-11 2018-06-26 Electronics And Telecommunications Research Institute USAC audio signal encoding/decoding apparatus and method for digital radio services
WO2017129270A1 (en) * 2016-01-29 2017-08-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improving a transition from a concealed audio signal portion to a succeeding audio signal portion of an audio signal
BR112018067944B1 (pt) * 2016-03-07 2024-03-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema
CN109313905B (zh) * 2016-03-07 2023-05-23 弗劳恩霍夫应用研究促进协会 隐藏音频帧丢失的错误隐藏单元、音频解码器及相关方法
CN109155134B (zh) 2016-03-07 2023-05-23 弗劳恩霍夫应用研究促进协会 隐藏音频帧丢失的错误隐藏单元、音频解码器和相关方法
JP7159538B2 (ja) * 2017-06-28 2022-10-25 株式会社三洋物産 遊技機
JP7159539B2 (ja) * 2017-06-28 2022-10-25 株式会社三洋物産 遊技機
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
JP7224832B2 (ja) 2018-10-01 2023-02-20 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
WO2020164752A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs
WO2020253941A1 (en) * 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
JP7228908B2 (ja) * 2020-07-07 2023-02-27 株式会社三洋物産 遊技機

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5729556A (en) * 1993-02-22 1998-03-17 Texas Instruments System decoder circuit with temporary bit storage and method of operation
WO1999050828A1 (en) 1998-03-30 1999-10-07 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6952668B1 (en) 1999-04-19 2005-10-04 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US7117156B1 (en) * 1999-04-19 2006-10-03 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
JP2001228896A (ja) 2000-02-14 2001-08-24 Iwatsu Electric Co Ltd 欠落音声パケットの代替置換方式
US6968309B1 (en) * 2000-10-31 2005-11-22 Nokia Mobile Phones Ltd. Method and system for speech frame error concealment in speech decoding
US7590525B2 (en) * 2001-08-17 2009-09-15 Broadcom Corporation Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
KR20050076155A (ko) * 2004-01-19 2005-07-26 삼성전자주식회사 영상 프레임의 에러 은닉 장치 및 방법
SG124307A1 (en) 2005-01-20 2006-08-30 St Microelectronics Asia Method and system for lost packet concealment in high quality audio streaming applications
US8693540B2 (en) 2005-03-10 2014-04-08 Qualcomm Incorporated Method and apparatus of temporal error concealment for P-frame
US7930176B2 (en) * 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
KR100686174B1 (ko) * 2005-05-31 2007-02-26 엘지전자 주식회사 오디오 에러 은닉 방법
KR100723409B1 (ko) 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
US8620644B2 (en) 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US7805297B2 (en) 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
US8798172B2 (en) 2006-05-16 2014-08-05 Samsung Electronics Co., Ltd. Method and apparatus to conceal error in decoded audio signal
KR101261528B1 (ko) * 2006-05-16 2013-05-07 삼성전자주식회사 복호화된 오디오 신호의 오류 은폐 방법 및 장치
DE102006032545B3 (de) 2006-07-13 2007-11-08 Siemens Ag Verfahren und Anordnungen zur Bestimmung des optischen Signal-Rausch-Verhältnisses für ein optisches Übertragungssystem
US8015000B2 (en) 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
CN101155140A (zh) 2006-10-01 2008-04-02 华为技术有限公司 音频流错误隐藏的方法、装置和系统
JP5123516B2 (ja) * 2006-10-30 2013-01-23 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法及び符号化方法
WO2008056775A1 (fr) 2006-11-10 2008-05-15 Panasonic Corporation Dispositif de décodage de paramètre, dispositif de codage de paramètre et procédé de décodage de paramètre
KR101292771B1 (ko) * 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
KR100862662B1 (ko) 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
KR101291193B1 (ko) * 2006-11-30 2013-07-31 삼성전자주식회사 프레임 오류은닉방법
KR20080075050A (ko) 2007-02-10 2008-08-14 삼성전자주식회사 오류 프레임의 파라미터 갱신 방법 및 장치
CN101046964B (zh) * 2007-04-13 2011-09-14 清华大学 基于重叠变换压缩编码的错误隐藏帧重建方法
US7869992B2 (en) 2007-05-24 2011-01-11 Audiocodes Ltd. Method and apparatus for using a waveform segment in place of a missing portion of an audio waveform
CN101833954B (zh) * 2007-06-14 2012-07-11 华为终端有限公司 一种实现丢包隐藏的方法和装置
CN101325631B (zh) * 2007-06-14 2010-10-20 华为技术有限公司 一种估计基音周期的方法和装置
CN100524462C (zh) * 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
KR101448630B1 (ko) * 2008-01-16 2014-10-08 엘지전자 주식회사 보조의류처리장치
CN101261833B (zh) 2008-01-24 2011-04-27 清华大学 一种使用正弦模型进行音频错误隐藏处理的方法
KR100931487B1 (ko) * 2008-01-28 2009-12-11 한양대학교 산학협력단 노이지 음성 신호의 처리 장치 및 그 장치를 포함하는 음성기반 어플리케이션 장치
WO2009097574A2 (en) 2008-01-30 2009-08-06 Process Manufacturing Corp. Small footprint drilling rig
US9357233B2 (en) 2008-02-26 2016-05-31 Qualcomm Incorporated Video decoder error handling
CN101588341B (zh) 2008-05-22 2012-07-04 华为技术有限公司 一种丢帧隐藏的方法及装置
US9076439B2 (en) 2009-10-23 2015-07-07 Broadcom Corporation Bit error management and mitigation for sub-band coding
TWI426785B (zh) 2010-09-17 2014-02-11 Univ Nat Cheng Kung 於可調式影像解碼的全畫面錯誤掩蓋方法

Also Published As

Publication number Publication date
US10096324B2 (en) 2018-10-09
CN108711431B (zh) 2023-07-18
CN104718571B (zh) 2018-09-18
EP4235657A2 (en) 2023-08-30
JP2017126072A (ja) 2017-07-20
CN108806703B (zh) 2023-07-18
US10714097B2 (en) 2020-07-14
JP6346322B2 (ja) 2018-06-20
EP2874149A4 (en) 2016-08-17
JP6088644B2 (ja) 2017-03-01
JP2015527765A (ja) 2015-09-17
US9558750B2 (en) 2017-01-31
TWI585748B (zh) 2017-06-01
EP2874149C0 (en) 2023-08-23
TW201413707A (zh) 2014-04-01
WO2013183977A1 (ko) 2013-12-12
KR20200004917A (ko) 2020-01-14
EP2874149A1 (en) 2015-05-20
EP4235657A3 (en) 2023-10-18
TWI626644B (zh) 2018-06-11
PL2874149T3 (pl) 2024-01-29
US20190051311A1 (en) 2019-02-14
WO2013183977A4 (ko) 2014-01-30
KR102102450B1 (ko) 2020-04-20
EP2874149B1 (en) 2023-08-23
CN108711431A (zh) 2018-10-26
HUE063724T2 (hu) 2024-01-28
US20170140762A1 (en) 2017-05-18
KR102063902B1 (ko) 2020-01-08
US20150142452A1 (en) 2015-05-21
CN108806703A (zh) 2018-11-13
TW201724085A (zh) 2017-07-01
KR20150021034A (ko) 2015-02-27
CN104718571A (zh) 2015-06-17

Similar Documents

Publication Publication Date Title
ES2960089T3 (es) Procedimiento y aparato para la ocultación de errores de trama y procedimiento y aparato para la decodificación de audio
US10140994B2 (en) Frame error concealment method and apparatus, and audio decoding method and apparatus
US20200066284A1 (en) Frame error concealment method and apparatus, and audio decoding method and apparatus