ES3052673T3

ES3052673T3 - Method and apparatus for processing an audio signal, computer readable medium, audio decoder and audio encoder

Info

Publication number: ES3052673T3
Application number: ES24198100T
Authority: ES
Inventors: Emmanuel Ravelli; Manuel Jander; Grzegorz Pietrzyk; Martin Dietz; Marc Gayer
Original assignee: Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority date: 2014-07-28
Filing date: 2015-07-03
Publication date: 2026-01-12
Anticipated expiration: 2035-07-03
Also published as: HK1259289A1; EP4235667B1; CA2955674A1; SG11201700684YA; MX362737B; JP7736866B2; BR112017001362A2; ES2994941T3; MX2017001245A; TW201606754A; PL4030426T3; EP4235667A2; ES2960422T3; EP4447048B1; US12014746B2; WO2016015950A1; EP4447048A3; US20170133028A1; JP2025186274A; TWI595480B

Abstract

Un método para procesar una señal de audio (100) incluye recibir una señal de audio codificada y generar una señal de audio decodificada mediante el procesamiento de tramas consecutivas de la señal para evitar discontinuidades. El procesamiento de tramas consecutivas de la señal para evitar discontinuidades incluye el uso de filtrado predictivo lineal para eliminar (S102, S104, S300-S308, S400-S402) una discontinuidad (106a, 106b) entre una trama anterior filtrada y una trama actual filtrada de la señal de audio. El método incluye el filtrado de la trama actual de la señal de audio y la eliminación de la discontinuidad modificando una porción inicial de la trama actual filtrada con una señal obtenida mediante filtrado predictivo lineal de una señal predefinida con estados iniciales del filtro predictivo lineal definidos a partir de una última parte de la trama anterior sin filtrar, filtrada mediante el conjunto de parámetros de filtro para la trama actual. (Traducción automática con Google Translate, sin valor legal)

Description

[0001] DESCRIPCIÓN

[0002] Método y aparato para procesar una señal de audio, medio legible por ordenador, decodificador de audio y codificador de audio

[0003] La presente invención está relacionada con el campo de las señales de audio, más específicamente, con un enfoque para procesar una señal de audio que incluye una pluralidad de cuadros de audio, donde se reducen o se eliminan las discontinuidades entre cuadros de audio filtrados consecutivos.

[0004] En el campo de procesamiento de señales de audio, una señal de audio puede filtrarse por diversos motivos, por ejemplo, un filtro de predicción a largo plazo puede usarse en un codificador de señales de audio para atenuar o hasta suprimir por completo un conjunto de armónicos en la señal de audio.

[0005] La señal de audio incluye una pluralidad de cuadros de audio y los cuadros se filtran usando el filtro de predicción a largo plazo. Cuando se toman en cuenta dos cuadros consecutivos de una señal de audio, un cuadro anterior y un cuadro actual, un filtro lineal H(z) que tiene un conjunto de parámetros c se usa para filtrar la señal de audio. En particular, el cuadro anterior se filtra con el filtro H(z) usando un primer conjunto de parámetrosc0que producirá un cuadro llamado cuadro anterior filtrado. El cuadro actual se filtra con el filtro H(z) usando un conjunto de parámetrosc1que producirá un cuadro actual filtrado. La Fig. 1 muestra un diagrama de bloques para procesar cuadros consecutivos de una señal de audio de acuerdo con un enfoque conocido. Se proporciona una señal de audio 100 que incluye una pluralidad de cuadros de audio. La señal de audio 100 se suministra a un bloque de filtro 102 y un cuadro actual n de la señal de audio 100 se filtra. El bloque de filtro, además de la señal de audio 100, recibe un conjunto de parámetros de filtrocnpara el cuadro actual de la señal de audio. El bloque de filtro 102 filtra el cuadro actual n de la señal de audio y envía una señal de audio filtrada 104 que incluye cuadros filtrados consecutivos. En la Fig. 1, el cuadro actual filtrado n, el cuadro anterior filtrado n-1 y el segundo último cuadro filtrado n-2 se ilustran de manera esquemática. Los cuadros filtrados se representan en forma esquemática en la Fig.1 con respectivos espacios entre ellos para indicar esquemáticamente una discontinuidad 106a, 106b que puede ser introducida por el proceso de filtrado entre los cuadros filtrados. El bloque de filtro 102 provoca el filtrado de los cuadros de la señal de audio usando respectivos parámetros de filtroc0yc1para un cuadro anterior n-1 y un cuadro actual n. En general, el bloque de filtro 102 puede ser un filtro lineal H(z); un ejemplo de dicho filtro lineal H(z) es el filtro de predicción a largo plazo mencionado más arriba

[0007]

[0009] donde los parámetros de filtro son la ganancia “g” y el retardo de altura tonal “T”. De un modo más general, el filtro de predicción a largo plazo puede describirse de la siguiente manera:

[0011]

[0013] donde A(z) es un filtro FIR (por sus siglas en inglés, filtro de respuesta finita al impulso). Un filtro de predicción a largo plazo puede usarse para atenuar o hasta suprimir por completo un conjunto de armónicos en una señal de audio. Sin embargo, existe una alta probabilidad de introducir una discontinuidad 106a, 106b (ver Fig.1) entre el cuadro anterior filtrado n-1 y el cuadro actual filtrado n cuando se usa dicho filtro de predicción a largo plazo y cuando los parámetros de filtro del cuadro anteriorc0son distintos de los parámetros de filtro del cuadro actualc1. Esta discontinuidad puede producir una fallo en la señal de audio filtrada 104, por ejemplo, un “clic”.

[0014] En consecuencia, teniendo en cuenta los problemas descritos más arriba con el filtrado de cuadros consecutivos que resultan en discontinuidades que, a su vez, pueden provocar fallas no deseadas, se necesita una técnica que elimine una posible discontinuidad. En la técnica se conocen diversos enfoques de la técnica anterior que tratan la eliminación de una discontinuidad de cuadros filtrados de una señal de audio.

[0015] En el caso en que el filtro lineal H(z) sea un filtro FIR, el cuadro actual se filtra con los parámetros de filtroc1del cuadro actual para producir un cuadro actual filtrado. Además, una porción de inicio del cuadro actual se filtra con los parámetros de filtro del cuadro anteriorc0para producir una porción de cuadro filtrada, y luego se lleva a cabo una operación de adición de superposición o atenuación cruzada sobre la porción de inicio del cuadro actual filtrado y la porción de cuadro filtrada. La Fig.2 muestra un diagrama de bloques de dicho enfoque convencional para procesar cuadros de audio consecutivos a fin de eliminar una discontinuidad. Cuando se compara con la Fig. 1, el bloque de filtro 102 incluye otro bloque de procesamiento 108 para llevar a cabo la operación de adición de superposición o atenuación cruzada. En la señal de audio filtrada 104, no habrá discontinuidad o habrá una discontinuidad reducida entre los cuadros filtrados consecutivos, como se indica esquemáticamente en la Fig. 2 que muestra los cuadros filtrados consecutivos n, n-1 y n-2 sin los espacios de la Fig.1.

[0016] En otros enfoques de la técnica anterior, el filtro H(z) puede ser un filtro que tiene una parte recursiva, por ejemplo, un filtro IIR. En ese caso, el enfoque como el que se describió más arriba respecto de la Fig.2 se aplica sobre una base muestra por muestra. En una primera etapa, el proceso comienza con la primera muestra de la porción de inicio del cuadro actual n siendo filtrada con los parámetros de filtroc0del cuadro anterior n-1 para dar como resultado una primera muestra filtrada. La muestra también se filtra con los parámetros de filtroc1del cuadro actual n produciendo una segunda muestra filtrada. Luego, la operación de adición de superposición o atenuación cruzada se lleva a cabo en base a la primera y segunda muestras filtradas, lo cual produce la muestra correspondiente del cuadro actual filtrado n. Luego se procesa la siguiente muestra y las etapas mencionadas más arriba se repiten hasta que la última muestra de la porción de inicio del cuadro actual n ha sido procesada. Las muestras restantes del cuadro actual n se filtran con los parámetros de filtroc1del cuadro actual n.

[0017] Algunos ejemplos de los enfoques conocidos mencionados más arriba para eliminar una discontinuidad de los cuadros filtrados consecutivos se describen, por ejemplo, en US 5.012.517 A en el contexto de un codificador por transformada, en EP 0732687 A2 en el contexto de un expansor de ancho de banda para voz, en US 5.999.899 A en el contexto de un codificador de audio por transformada o en US 7.353.168 B2 en el contexto de un posfiltro de voz decodificada. Si bien los enfoques mencionados anteriormente son eficaces para eliminar las discontinuidades de señal no deseadas, dado que estos enfoques operan sobre una porción específica del cuadro actual, la porción de inicio, para que sean eficaces, la longitud de la porción de cuadro debe ser suficientemente larga; por ejemplo, en el caso de una longitud de cuadro de 20 ms, la longitud de la porción de cuadro o la porción de inicio podría ser de hasta 5 ms. En determinados casos, esta puede ser demasiado larga, especialmente en situaciones en las cuales los parámetros de filtro del cuadro anteriorc0no se aplique bien al cuadro actual y esto podría provocar fallas adicionales. Un ejemplo es una señal de audio armónica con altura tonal rápidamente cambiante, y un filtro de predicción a largo plazo que está diseñado para reducir la amplitud de los armónicos. En ese caso, el retardo tonal es diferente de un cuadro a otro. El filtro de predicción a largo plazo con la altura tonal estimada en el cuadro actual efectivamente reduciría la amplitud de los armónicos en el cuadro actual, pero no reduciría la amplitud de los armónicos si se usara en otro cuadro (por ejemplo, porción de inicio del cuadro siguiente) donde la altura tonal de la señal de audio sería distinta. Podría empeorar más las cosas, al reducir la amplitud de componentes no relacionados con armónicos en la señal, introduciendo una distorsión en la señal.

[0018] El documento WO 2011/085483 A1 describe un método para producir parámetros de cancelación de solapamiento delantero (FAC) para cancelar el solapamiento de dominio de tiempo provocado en una señal de audio codificada en un primer cuadro codificado por transformada mediante una transición entre el primer cuadro codificado por transformada usando un primer modo de codificación con ventana de superposición y un segundo cuadro que usa un segundo modo de codificación con ventana de no superposición. El método incluye calcular un objetivo FAC representativo de una diferencia entre la señal de audio del primer cuadro antes de la codificación y una síntesis de la señal de audio codificada del primer cuadro codificado por transformada; y ponderar el objetivo FAC para producir los parámetros FAC. En un decodificador, los parámetros de cancelación de solapamiento delantero (FAC) ponderados se reciben y se ponderan a la inversa para producir una síntesis FAC. Tras la síntesis de la señal de audio codificada en el primer cuadro, se cancela el solapamiento de dominio de tiempo desde la síntesis de señal de audio usando la síntesis FAC.

[0019] El documento US 2009/083047 A1 describe circuitos y métodos para proporcionar reproducción de cero huecos de corrientes de datos consecutivas en dispositivos electrónicos portátiles, tal como reproductores de medios. Un circuito incluye un circuito decodificador configurado para recibir datos de audio codificados y para enviar datos de audio decodificados que incluyen corrientes de datos asociados con un archivo de datos y un archivo de datos posterior. Además, un circuito predictivo, que se acopla eléctricamente al circuito decodificador, se configura para generar selectivamente muestras adicionales en función de muestras en el archivo de datos, donde las muestras adicionales corresponden a momentos después del final de una corriente de datos asociados con el archivo de datos. Adicionalmente, un circuito de filtro, que se acopla eléctricamente al circuito decodificador y se acopla eléctrica y selectivamente al circuito predictivo, se configura para combinar o mezclar selectivamente muestras en un comienzo del archivo de datos posterior con las muestras adicionales.

[0020] Es un objetivo de la presente invención proporcionar un enfoque mejorado para eliminar discontinuidades entre cuadros de audio filtrados sin producir ninguna distorsión potencial en la señal de audio filtrada.

[0021] Este objetivo se consigue mediante un método para procesar una señal de audio según la reivindicación 1, mediante un aparato para procesar una señal de audio de acuerdo con la reivindicación 12, mediante un decodificador de audio de acuerdo con la reivindicación 13 y mediante un codificador de audio de acuerdo con la reivindicación 14.

[0022] La presente invención proporciona un método para procesar una señal de audio, comprendiendo el método eliminar una discontinuidad entre un cuadro anterior y una cuadro actual filtrado de la señal de audio usando filtrado predictivo lineal.

[0023] El filtro predictivo lineal puede definirse como

[0024]

[0026] conMel orden de filtro yamlos coeficientes de filtro (cona0

= 1). Este tipo de filtro también se conoce como Codificación Predictiva Lineal (LPC, por sus siglas en inglés).

[0027] De acuerdo con la presente invención, el método comprende filtrar el cuadro actual de la señal de audio y eliminar la discontinuidad modificando una porción de inicio del cuadro actual filtrado por una señal obtenida mediante el filtrado predictivo lineal de una señal predefinida con estados iniciales del filtro predictivo lineal definidos sobre la base de una última parte del cuadro anterior.

[0028] De acuerdo con la presente invención, los estados iniciales del filtro de predictiva lineal se definen sobre la base de una última parte del cuadro anterior no filtrado usando el conjunto de parámetros de filtro para el cuadro actual. De acuerdo con realizaciones, el método comprende estimar el filtro predictivo lineal sobre la señal de audio filtrada o no filtrada.

[0029] De acuerdo con realizaciones, estimar el filtro predictivo lineal comprende estimar el filtro en base al cuadro anterior o actual de la señal de audio o en base al cuadro filtrado anterior de la señal de audio usando el algoritmo de Levinson-Durbin.

[0030] De acuerdo con realizaciones, el filtro predictivo lineal comprende un filtro predictivo lineal de un códec de audio. De acuerdo con realizaciones, eliminar la discontinuidad comprende procesar la porción de inicio del cuadro actual filtrado, donde la porción de inicio del cuadro actual tiene una cantidad predefinida de muestras que es menor o igual a la cantidad total de muestras en el cuadro actual, y donde procesar la porción de inicio del cuadro actual comprende sustraer una porción de inicio de una respuesta de entrada de cero (ZIR, por sus siglas en inglés) de la porción de inicio del cuadro actual filtrado.

[0031] De acuerdo con realizaciones, el método comprende filtrar el cuadro actual de la señal de audio usando un filtro no recursivo, como un filtro FIR, para producir el cuadro actual filtrado.

[0032] De acuerdo con las realizaciones, el método comprende procesar el cuadro actual no filtrado de la señal de audio muestra por muestra utilizando un filtro recursivo, como un filtro IIR, y en donde el procesamiento de una muestra de la parte inicial del cuadro actual comprende:

[0033] filtrar la muestra con el filtro recursivo usando los parámetros de filtro del marco actual para producir una muestra filtrada, y

[0034] sustraer una muestra ZIR correspondiente de la muestra filtrada para producir la muestra correspondiente del cuadro actual filtrado.

[0035] De acuerdo con realizaciones, el filtrado y la sustracción se repiten hasta que se procesa la última muestra en la porción inicial del cuadro actual, y en el que el método comprende además filtrar las muestras restantes en el cuadro actual con el filtro recursivo usando los parámetros de filtro de cuadro actual.

[0036] De acuerdo con realizaciones, el método comprende la generación de la ZIR, en donde la generación de la ZIR comprende:

[0037] filtrar las últimas muestras M del cuadro anterior no filtrado con el filtro y los parámetros de filtro usados para filtrar el cuadro actual para producir una primera porción de señal filtrada, donde M es el orden de filtro predictivo lineal, sustraer de la primera porción de señal filtrada las últimas muestras M del cuadro anterior filtrado, que se filtra usando los parámetros de filtro del cuadro anterior, para generar una segunda porción de señal filtrada, y

[0038] generar una ZIR de un filtro predictivo lineal filtrando un cuadro de cero muestras con el filtro predictivo lineal y estados iniciales iguales a la segunda porción de señal filtrada.

[0039] De acuerdo con realizaciones, el método comprende generar ventanas para la ZIR de manera que su amplitud disminuya más rápidamente a cero.

[0040] La presente invención se basa en los hallazgos del inventor acerca de que los problemas que han sido reconocidos en enfoques convencionales para eliminar las discontinuidades de señal que provocan la distorsión adicional no deseada mencionada más arriba, se deben principalmente al procesamiento del cuadro actual o por lo menos una porción del mismo sobre la base de los parámetros de filtro para el cuadro anterior. De acuerdo con el enfoque inventivo, esto se evita, es decir, el enfoque inventivo no filtra una porción del cuadro actual con los parámetros de filtro del cuadro anterior y así evitar los problemas mencionados más arriba. De acuerdo con la presente invención, para eliminar la discontinuidad, se utiliza un filtro LPC (filtro predictivo lineal) para eliminar la discontinuidad. El filtro LPC puede estimarse sobre la señal de audio y, por consiguiente, es un buen modelo de la forma espectral de la señal de audio, de manera que, cuando se usa el filtro LPC, la forma espectral de la señal de audio enmascarará la discontinuidad. En una realización, el filtro LPC puede estimarse sobre la base de la señal de audio no filtrada o sobre la base de una señal de audio que ha sido filtrada por un filtro lineal H(z) mencionado más arriba. De acuerdo con realizaciones, el filtro LPC puede estimarse usando la señal de audio, por ejemplo, el cuadro actual y/o el cuadro anterior, y el algoritmo de Levinson-Durbin. También puede computarse solo sobre la base de la señal de cuadro anterior filtrada usando el algoritmo de Levinson-Durbin.

[0041] En otras realizaciones más, un códec de audio para procesar la señal de audio puede utilizar un filtro lineal H(z) y también puede utilizar un filtro LPC, ya sea cuantificado o no, por ejemplo, para formar el ruido de cuantificación en un códec de audio en base a transformada. En dicha realización, este filtro LPC existente puede usarse directamente para atenuar la discontinuidad sin la complejidad adicional necesaria para estimar un nuevo filtro LPC.

[0042] A continuación, se describirán realizaciones para ilustrar la presente invención con referencia a los dibujos adjuntos, en los cuales:

[0043] la figura 1 muestra un diagrama de bloques para procesar cuadros consecutivos de una señal de audio de acuerdo con un enfoque convencional,

[0044] la figura 2 muestra un diagrama de bloques de otro enfoque convencional para procesar cuadros de audio consecutivos a fin de eliminar una discontinuidad,

[0045] la figura 3 muestra un diagrama de bloques simplificado de un sistema para transmitir señales de audio implementando el enfoque inventivo a fin de eliminar una discontinuidad entre cuadros consecutivos de una señal de audio del lado del codificador y/o del lado del decodificador,

[0046] la figura 4 muestra un diagrama de flujo que ilustra el enfoque inventivo para eliminar una discontinuidad entre cuadros consecutivos de una señal de audio de acuerdo con una realización,

[0047] la figura 5 muestra un diagrama de bloques esquemático para procesar un cuadro de audio actual de acuerdo con realizaciones de la presente invención evitando la distorsión no deseada en la señal de salida a pesar de la eliminación de las discontinuidades,

[0048] la figura 6 muestra un diagrama de flujo que representa la funcionalidad del bloque en la Fig.5 para generar la ZIR, la figura 7 muestra un diagrama de flujo que representa la funcionalidad del bloque en la Fig.5 para procesar la porción de inicio del cuadro actual filtrado en el caso en que el bloque de filtro comprende un filtro recursivo, como un filtro IIR, y

[0049] la figura 8 muestra un diagrama de flujo que representa la funcionalidad del bloque en la Fig.5 para procesar la porción de inicio del cuadro actual filtrado en el caso en que el bloque de filtro comprende un filtro no recursivo, como un filtro FIR.

[0050] A continuación, se describirán realizaciones del enfoque inventivo más detalladamente; cabe señalar que en el dibujo adjunto los elementos que tienen la misma función o una función similar están representados por los mismos signos de referencia.

[0051] La Fig.3 muestra un diagrama de bloques simplificado de un sistema para transmitir señales de audio que implementa el enfoque inventivo en el lado del codificador y/o en el lado del decodificador. El sistema de la Fig.3 comprende un codificador 200 que recibe en una entrada 202 una señal de audio 204. El codificador incluye un procesador de codificación 206 que recibe la señal de audio 204 y genera una señal de audio codificada que se proporciona en una entrada 208 del codificador. El procesador de codificación puede programarse o construirse para implementar el enfoque inventivo a fin de procesar cuadros de audio consecutivos de la señal de audio recibida para evitar discontinuidades. En otras realizaciones, no es necesario que el codificador sea parte de un sistema de transmisión; sin embargo, puede ser un dispositivo independiente que genera señales de audio codificadas o puede ser parte de un transmisor de señales de audio. De acuerdo con una realización, el codificador 200 puede comprender una antena 210 que permite una transmisión inalámbrica de la señal de audio, como se indica en 212. En otras realizaciones, el codificador 200 puede enviar la señal de audio codificada proporcionada en la salida 208 usando una línea de conexión cableada, como se indica por ejemplo en el signo de referencia 214.

[0052] El sistema de la Fig.3 también comprende un decodificador 250 que tiene una entrada 252 que recibe una señal de audio codificada para ser procesada por el decodificador 250, por ejemplo, mediante la línea cableada 214 o mediante una antena 254. El decodificador 250 comprende un procesador de decodificación 256 que opera sobre la señal codificada y proporciona una señal de audio decodificada 258 en una salida 260. El procesador de decodificación 256 puede implementarse para operar de acuerdo con el enfoque inventivo sobre cuadros consecutivos que se filtran de manera tal que se evitan las discontinuidades. En otras realizaciones, no es necesario que el decodificador sea parte de un sistema de transmisión; en cambio, puede ser un dispositivo independiente para decodificar señales de audio codificadas o puede ser parte de un receptor de señales de audio.

[0054] A continuación, se describirán con más detalle las realizaciones del enfoque inventivo que se implementan en al menos uno del procesador de codificación 206 en el procesador de decodificación 256. La Fig. 4 muestra un diagrama de flujo para procesar un cuadro actual de la señal de audio de acuerdo con una realización del enfoque inventivo. Se describirá el procesamiento del cuadro actual, y se asume que el cuadro anterior ya está procesado con la misma técnica que se describe a continuación. De acuerdo con la presente invención, en la etapa S100 se recibe un cuadro actual de la señal de audio. El cuadro actual se filtra en la etapa S102, por ejemplo, de un modo como el que se describió más arriba respecto de las Figs.1 y 2 (véase el bloque de filtro 102). De acuerdo con el enfoque inventivo, una discontinuidad entre el cuadro anterior filtrado n-1 y el cuadro actual filtrado n (véase la Fig. 1 o 2) se eliminará usando un filtrado predictivo lineal como se indica en la etapa S104. De acuerdo con una realización, el filtro predictivo lineal puede definirse como

[0057]

[0060] conMel orden de filtro yamlos coeficientes de filtro (cona0

= 1). Este tipo de filtro también se conoce como Codificación Predictiva Lineal (LPC, por sus siglas en inglés). De acuerdo con realizaciones, el cuadro actual filtrado se procesa aplicando un filtrado predictivo lineal a por lo menos una parte del cuadro actual filtrado. La discontinuidad puede eliminarse modificando una porción de inicio del cuadro actual filtrado por una señal obtenida mediante filtrado predictivo lineal de una señal predefinida con estados iniciales del filtro de codificación predictiva lineal definidos sobre la base de una última parte del cuadro anterior. Los estados iniciales del filtro de codificación predictiva lineal pueden definirse sobre la base de una última parte del cuadro anterior filtrado usando el conjunto de parámetros de filtro para el cuadro actual. El enfoque inventivo es ventajoso ya que no requiere filtrar el cuadro actual de una señal de audio con un coeficiente de filtro que se usa para el cuadro anterior y así evitar problemas que surgen de la falta de concordancia de los parámetros de filtro para el cuadro actual y para el cuadro anterior como la que se experimenta en los enfoques de la técnica anterior descritos más arriba con referencia a la Fig.2.

[0062] La Fig.5 muestra un diagrama de bloques esquemático para procesar un cuadro de audio actual de la señal de audio de acuerdo con realizaciones de la presente invención, evitando la distorsión no deseada en la señal de salida a pesar de la eliminación de las discontinuidades. En la Fig.5, se usan los mismos signos de referencia que en las Figs.1 y 2. Se recibe un cuadro actual n de la señal de audio 100, teniendo cada cuadro de la señal de audio 100 una pluralidad de muestras. El cuadro actual n de la señal de audio 100 es procesado por el bloque de filtro 102. Cuando se compara con los enfoques de la técnica anterior de las Figs.1 y 2, de acuerdo con realizaciones como las descritas respecto de la Fig. 5, el cuadro actual filtrado se procesa luego sobre la base de muestras de ZIR como lo muestra esquemáticamente el bloque 110. De acuerdo con una realización sobre la base del cuadro anterior n-1, y sobre la base de un filtro LPC se producen las muestras de ZIR como lo muestra esquemáticamente el bloque 112.

[0064] A continuación, se describirá de manera detallada la funcionalidad de los bloques de proceso 110 y 112. La Fig. 6 muestra un diagrama de flujo que representa la función del bloque de proceso 112 para generar las muestras de ZIR. Como se mencionó más arriba, los cuadros de una señal de audio 100 son filtrados con un filtro lineal H(z) usando parámetros de filtro c seleccionados o determinados para el respectivo cuadro. El filtro H(z) puede ser un filtro recursivo, por ejemplo, un filtro IIR, o puede ser un filtro no recursivo, por ejemplo, un filtro FIR. En el bloque de proceso 112 se usa un filtro LPC que puede ser cuantificado o no. El filtro LPC es del orden M y puede ser ya sea estimado sobre la señal de audio filtrada o no filtrada o puede ser el filtro LPC que también se usa en un códec de audio. En una primera etapa S200, las últimas muestras M (M = el orden del filtro LPC) del cuadro anterior n-1 son filtradas con el filtro H(z) usando, no obstante, los parámetros de filtro o coeficientesc1del cuadro actual n. La etapa S200 produce de este modo una primera porción de señal filtrada. En la etapa S202 las últimas muestras M del cuadro anterior filtrado n-1 (las últimas muestras M del cuadro anterior filtradas usando los parámetros de filtro o coeficientesc0del cuadro anterior n-1) se sustraen de la primera porción de señal filtrada proporcionada por la etapa S200, produciendo así una segunda porción de señal filtrada. En la etapa S204, se aplica el filtro LPC que tiene el orden M, más específicamente se genera una respuesta de entrada de cero (ZIR) del filtro LPC en la etapa S204 filtrando un cuadro de cero muestras, donde los estados iniciales del filtro son iguales a la segunda porción de señales filtradas, generando así la ZIR. De acuerdo con realizaciones, se pueden generar ventanas para la ZIR de manera tal que su amplitud disminuya más rápidamente hasta 0.

[0065] La ZIR, como se describió más arriba respecto de la Fig.5, se aplica en el bloque de proceso 110, cuya funcionalidad se describe con referencia al diagrama de flujo de la Fig. 7 para el caso de usar, como el filtro lineal H(z), un filtro recursivo, como un filtro IIR. De acuerdo con la realización descrita respecto de la Fig.5, para eliminar discontinuidades entre el cuadro actual y el cuadro anterior al mismo tiempo que se evitan distorsiones no deseadas, el filtrado del cuadro actual n comprende procesar (filtrar) el cuadro actual n sobre una base muestra por muestra, donde las muestras de la porción de inicio son tratadas de acuerdo con el enfoque inventivo. Más específicamente, se procesan muestras M de una porción de inicio del cuadro actual n, y en una primera etapa S300 las variables m se fijan en 0. En una siguiente etapa S302, la muestra m del cuadro actual n se filtra usando el filtro H(z) y los coeficientes de filtro o parámetrosc1para el cuadro actual n. De este modo, a diferencia de los enfoques convencionales, el cuadro actual, de acuerdo con el enfoque inventivo, no se filtra usando coeficientes del cuadro anterior, sino solo coeficientes del cuadro actual, lo cual, en consecuencia, evita la distorsión no deseada que existe en enfoques convencionales a pesar de que se eliminan las discontinuidades. La etapa S302 produce una muestra filtrada m, y en la etapa S304 la muestra de ZIR correspondiente a la muestra m se sustrae de la muestra filtrada m produciendo la muestra correspondiente del cuadro actual filtrado n. En la etapa S306 se determina si la última muestra M de la porción de inicio del cuadro actual n es procesada. En caso de que no todas las muestras M de las porciones de inicio hayan sido procesadas, la variable m se incrementa y las etapas del método S302 a S306 se repiten para la siguiente muestra del cuadro actual n. Una vez que todas las muestras M de las porciones de inicio han sido procesadas, en la etapa S308 las muestras restantes del cuadro actual n se filtran usando los parámetros de filtro del cuadro actualc1, proporcionando así el cuadro actual filtrado n procesado de acuerdo con el enfoque inventivo evitando la distorsión no deseada al eliminar las discontinuidades entre cuadros consecutivos.

[0067] De acuerdo con otra realización, el filtro lineal H(z) es un filtro no recursivo, como un filtro FIR, y la ZIR, como se describió anteriormente con respecto a la Fig. 5, se aplica en el bloque de proceso 110. La funcionalidad de esta realización se describe con referencia al diagrama de flujo de la Fig.8. El cuadro actual n, en la etapa S400, se filtra con el filtro H(z) usando los coeficientes de filtro o parámetrosc1para el cuadro actual. De este modo, al contrario de los enfoques convencionales, el cuadro actual, de acuerdo con el enfoque inventivo, no se filtra usando coeficientes del cuadro anterior, sino solo coeficientes del cuadro actual, lo cual como consecuencia evita la distorsión no deseada que existe en enfoques convencionales a pesar de que se eliminan las discontinuidades. En la etapa S402, una porción de inicio de la ZIR se sustrae de una porción de inicio correspondiente del cuadro actual filtrado, proporcionando así el cuadro actual filtrado n que tiene la porción de inicio filtrada/procesada de acuerdo con el enfoque inventivo y la parte restante solamente filtrada usando coeficientes o parámetros de filtroc1para el cuadro actual, evitando así la distorsión no deseada luego de la eliminación de las discontinuidades entre cuadros consecutivos.

[0069] El enfoque inventivo puede aplicarse en situaciones como se describió anteriormente cuando se filtra la señal de audio. De acuerdo con realizaciones, el enfoque inventivo también puede aplicarse en el lado del decodificador, por ejemplo, cuando se usa un posfiltro de códec de audio para reducir el nivel de ruido de codificación entre los armónicos de la señal. Para procesar los cuadros de audio en el decodificador, el posfiltro, de acuerdo con una realización, puede ser de la siguiente manera:

[0072]

[0075] donde B(z) y A(z) son dos filtros FIR y los parámetros de filtro H(z) son los coeficientes de los filtros FIR B(z) y A(z), y T indica el retardo de altura tonal. En dicho escenario, el filtro también puede introducir una discontinuidad entre los dos cuadros filtrados, por ejemplo, cuando los parámetros de filtro del cuadro anteriorc0son distintos de los parámetros de filtroc1del cuadro actual, y dicha discontinuidad podría provocar una fallo en la señal de audio filtrada 104, por ejemplo, un “clic”. Esta discontinuidad se elimina procesando el cuadro actual filtrado como se describió más arriba de manera detallada.

[0077] Si bien algunos aspectos del concepto detallado han sido descritos en el contexto de un aparato, cabe señalar que estos aspectos también representan una descripción del método correspondiente, donde un bloque o dispositivo corresponde a una etapa de método o una característica de una etapa de método. De manera análoga, los aspectos descritos en el contexto de una etapa del método también representan una descripción de un bloque o elemento correspondiente o de una característica de un aparato correspondiente.

[0079] Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención se pueden implementar en hardware o en software. La implementación se puede realizar empleando un medio de almacenamiento digital, por ejemplo un disco blando, un DVD, un Blu–Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene almacenadas en la misma señales control legibles electrónicamente, que cooperan (o tienen capacidad para cooperar) con un sistema de informático programable de tal manera que se ejecute el método respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.

[0081] Algunas realizaciones de acuerdo con la invención comprenden un transportador no transitorio de datos que comprende señales de control legibles electrónicamente, con capacidad para cooperar con un sistema informático programable de tal manera que se ejecute uno de los métodos descritos en el presente documento.

[0082] En general, las realizaciones de la presente invención pueden ser implementadas en forma de producto de programa informático con un código de programa, donde el código de programa cumple la función de ejecutar uno de los métodos al ejecutarse el programa informático en un ordenador. El código de programa puede ser almacenado, por ejemplo, en un portador legible por una máquina.

[0083] Otras realizaciones comprenden el programa informático para ejecutar uno de los métodos aquí descritos, almacenado en un portador legible por una máquina.

[0084] En otras palabras, una realización del método inventivo es, por lo tanto, un programa informático que tiene un código de programa para realizar uno de los métodos descritos en el presente documento, cuando el programa informático se ejecuta en un ordenador.

[0085] Una realización adicional de los métodos inventivos es, por lo tanto, un portador de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para realizar uno de los métodos descritos en el presente documento.

[0086] Otra realización del método inventivo es, por lo tanto, un flujo de datos o una secuencia de señales que representan el programa informático para realizar uno de los métodos descritos en el presente documento. El flujo de datos o la secuencia de señales pueden estar configurados, por ejemplo, para ser transferida a través de una conexión de comunicación de datos, por ejemplo a través de Internet.

[0087] Otra realización comprende un medio de procesamiento, por ejemplo un ordenador o un dispositivo lógico programable, configurado o adaptado para realizar uno de los métodos descritos en el presente documento.

[0088] Otra realización comprende un ordenador que tiene instalado en él el programa informático para realizar uno de los métodos descritos en el presente documento.

[0089] En algunas realizaciones, se puede utilizar un dispositivo lógico programable (por ejemplo, una matriz de puertas programable en campo) para realizar algunas o todas las funcionalidades de los métodos descritos en el presente documento. En algunas realizaciones, una matriz de puertas programables en campo puede cooperar con un microprocesador para realizar uno de los métodos descritos en el presente documento. Por lo general, los métodos son ejecutados preferentemente por cualquier aparato de hardware.

[0090] Las realizaciones anteriormente descritas son meramente ilustrativas de los principios de la presente invención. Se entiende que modificaciones y variaciones de las disposiciones y los detalles aquí descritos resultarán evidentes para los expertos en la técnica. Es la intención, por consiguiente, limitarse sólo por el alcance de las reivindicaciones de patente que siguen y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en el presente documento.

Claims

1. REIVINDICACIONES

1. Un método para procesar una señal de audio (100), comprendiendo el método:

recibir una señal de audio codificada; y

generar una señal de audio decodificada procesando cuadros de audio consecutivos de la señal de audio para evitar discontinuidades;

en el que el procesamiento de cuadros de audio consecutivos de la señal de audio para evitar discontinuidades comprende usar filtrado predictivo lineal para eliminar (S102, S104, S300-S308, S400-S402) una discontinuidad (106a, 106b) entre un cuadro anterior filtrado y un cuadro actual filtrado de la señal de audio,

en el que el método comprende filtrar el cuadro actual de la señal de audio y eliminar la discontinuidad modificando una porción de inicio del cuadro actual filtrado por una señal obtenida mediante el filtrado predictivo lineal de una señal predefinida con estados iniciales del filtro predictivo lineal definidos sobre la base de una última parte del cuadro anterior no filtrado usando el conjunto de parámetros de filtrado para filtrar el cuadro actual.

2. El método de la reivindicación 1, que comprende además estimar el filtro predictivo lineal sobre la señal de audio filtrada o no filtrada(100).

3. El método de la reivindicación 2, en el que estimar el filtro predictivo lineal comprende estimar el filtro en base al cuadro anterior y/o actual de la señal de audio (100) o en base al cuadro anterior filtrado de la señal de audio (100) usando el algoritmo de Levinson-Durbin.

4. El método de la reivindicación 1, en el que el filtro predictivo lineal comprende un filtro predictivo lineal de un códec de audio.

5. El método de una de las reivindicaciones 1 a 4, en el que eliminar la discontinuidad comprende procesar la porción de inicio del cuadro actual filtrado, en el que la porción de inicio del cuadro actual tiene una cantidad predefinida de muestras que son menos o iguales a la cantidad total de muestras en el cuadro actual, y donde procesar la porción de inicio del cuadro actual comprende sustraer (S304, S402) una porción de inicio de una respuesta de entrada de cero (ZIR) de la porción de inicio del cuadro actual filtrado.

6. El método de la reivindicación 5, que comprende filtrar (S400) el cuadro actual de la señal de audio utilizando un filtro no recursivo, como un filtro FIR, para producir el cuadro actual filtrado.

7. El método de la reivindicación 5, que comprende procesar el cuadro actual no filtrado de la señal de audio muestra por muestra utilizando un filtro recursivo, como un filtro IIR, y en donde el procesamiento de una muestra de la parte inicial del cuadro actual comprende:

filtrar (S302) la muestra con el filtro recursivo usando los parámetros de filtro del marco actual para producir una muestra filtrada, y

sustraer (S304) una muestra ZIR correspondiente de la muestra filtrada para producir la muestra correspondiente del cuadro actual filtrado.

8. El método de la reivindicación 7, en donde el filtrado (S302) y la sustracción (S304) se repiten hasta que se procesa la última muestra en la porción inicial del cuadro actual, y en el que el método comprende además filtrar (S306) las muestras restantes en el cuadro actual con el filtro recursivo usando los parámetros de filtro de cuadro actual.

9. El método de una de las reivindicaciones 5 a 8, que comprende la generación de la ZIR, en donde la generación de la ZIR comprende:

filtrar (S200) las últimas muestras M del cuadro anterior no filtrado con el filtro y los parámetros de filtrado usados para filtrar el cuadro actual para producir una primera porción de señal filtrada, en donde M es el orden del filtro predictivo lineal,

sustraer (S202) de la primera porción de señal filtrada las últimas muestras M del cuadro anterior filtrado, que se filtra usando los parámetros de filtro del cuadro anterior, para generar una segunda porción de señal filtrada, y

generar (S204) una ZIR de un filtro predictivo lineal filtrando un cuadro de cero muestras con el filtro predictivo lineal y estados iniciales iguales a la segunda porción de señal filtrada.

10. El método de la reivindicación 9, que comprende generar ventanas para la ZIR de manera que su amplitud disminuya más rápidamente a cero.

11. Un medio legible por ordenador que comprende instrucciones que, cuando son ejecutadas en un ordenador, llevan a cabo el método de una de las reivindicaciones 1 a 10.

12. Aparato para procesar una señal de audio (100), comprendiendo el aparato:

un procesador (102, 110, 112) configurado para recibir una señal de audio codificada y generar una señal de audio decodificada mediante el procesamiento de cuadros de audio consecutivos de la señal de audio para evitar discontinuidades;

en donde, para procesar los cuadros de audio consecutivos de la señal de audio para evitar discontinuidades, el procesador (102, 110, 112) está configurado para usar filtrado predictivo para eliminar una discontinuidad entre un cuadro anterior filtrado y un cuadro actual filtrado de la señal de audio,

en donde el procesador (102, 110, 112) configurado para filtrar el cuadro actual de la señal de audio y eliminar la discontinuidad modificando una porción de inicio del cuadro actual filtrado por una señal obtenida mediante el filtrado predictivo lineal de una señal predefinida con estados iniciales del filtro predictivo lineal definidos sobre la base de una última parte del cuadro anterior no filtrado usando el conjunto de parámetros de filtrado para filtrar el cuadro actual.

13. Decodificador de audio (250), que comprende un aparato de la reivindicación 12.

14. Codificador de audio (200), que comprende un aparato de la reivindicación 12.