ES3052673T3 - Method and apparatus for processing an audio signal, computer readable medium, audio decoder and audio encoder - Google Patents
Method and apparatus for processing an audio signal, computer readable medium, audio decoder and audio encoderInfo
- Publication number
- ES3052673T3 ES3052673T3 ES24198100T ES24198100T ES3052673T3 ES 3052673 T3 ES3052673 T3 ES 3052673T3 ES 24198100 T ES24198100 T ES 24198100T ES 24198100 T ES24198100 T ES 24198100T ES 3052673 T3 ES3052673 T3 ES 3052673T3
- Authority
- ES
- Spain
- Prior art keywords
- filter
- filtered
- frame
- audio signal
- current frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/038—Cross-faders therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/06—Receivers
- H04B1/10—Means associated with receiver for limiting or suppressing noise or interference
- H04B1/1027—Means associated with receiver for limiting or suppressing noise or interference assessing signal quality or detecting noise/interference for the received signal
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
- Stereophonic System (AREA)
Abstract
Un método para procesar una señal de audio (100) incluye recibir una señal de audio codificada y generar una señal de audio decodificada mediante el procesamiento de tramas consecutivas de la señal para evitar discontinuidades. El procesamiento de tramas consecutivas de la señal para evitar discontinuidades incluye el uso de filtrado predictivo lineal para eliminar (S102, S104, S300-S308, S400-S402) una discontinuidad (106a, 106b) entre una trama anterior filtrada y una trama actual filtrada de la señal de audio. El método incluye el filtrado de la trama actual de la señal de audio y la eliminación de la discontinuidad modificando una porción inicial de la trama actual filtrada con una señal obtenida mediante filtrado predictivo lineal de una señal predefinida con estados iniciales del filtro predictivo lineal definidos a partir de una última parte de la trama anterior sin filtrar, filtrada mediante el conjunto de parámetros de filtro para la trama actual. (Traducción automática con Google Translate, sin valor legal)
Description
[0001] DESCRIPCIÓN
[0002] Método y aparato para procesar una señal de audio, medio legible por ordenador, decodificador de audio y codificador de audio
[0003] La presente invención está relacionada con el campo de las señales de audio, más específicamente, con un enfoque para procesar una señal de audio que incluye una pluralidad de cuadros de audio, donde se reducen o se eliminan las discontinuidades entre cuadros de audio filtrados consecutivos.
[0004] En el campo de procesamiento de señales de audio, una señal de audio puede filtrarse por diversos motivos, por ejemplo, un filtro de predicción a largo plazo puede usarse en un codificador de señales de audio para atenuar o hasta suprimir por completo un conjunto de armónicos en la señal de audio.
[0005] La señal de audio incluye una pluralidad de cuadros de audio y los cuadros se filtran usando el filtro de predicción a largo plazo. Cuando se toman en cuenta dos cuadros consecutivos de una señal de audio, un cuadro anterior y un cuadro actual, un filtro lineal H(z) que tiene un conjunto de parámetros c se usa para filtrar la señal de audio. En particular, el cuadro anterior se filtra con el filtro H(z) usando un primer conjunto de parámetrosc0que producirá un cuadro llamado cuadro anterior filtrado. El cuadro actual se filtra con el filtro H(z) usando un conjunto de parámetrosc1que producirá un cuadro actual filtrado. La Fig. 1 muestra un diagrama de bloques para procesar cuadros consecutivos de una señal de audio de acuerdo con un enfoque conocido. Se proporciona una señal de audio 100 que incluye una pluralidad de cuadros de audio. La señal de audio 100 se suministra a un bloque de filtro 102 y un cuadro actual n de la señal de audio 100 se filtra. El bloque de filtro, además de la señal de audio 100, recibe un conjunto de parámetros de filtrocnpara el cuadro actual de la señal de audio. El bloque de filtro 102 filtra el cuadro actual n de la señal de audio y envía una señal de audio filtrada 104 que incluye cuadros filtrados consecutivos. En la Fig. 1, el cuadro actual filtrado n, el cuadro anterior filtrado n-1 y el segundo último cuadro filtrado n-2 se ilustran de manera esquemática. Los cuadros filtrados se representan en forma esquemática en la Fig.1 con respectivos espacios entre ellos para indicar esquemáticamente una discontinuidad 106a, 106b que puede ser introducida por el proceso de filtrado entre los cuadros filtrados. El bloque de filtro 102 provoca el filtrado de los cuadros de la señal de audio usando respectivos parámetros de filtroc0yc1para un cuadro anterior n-1 y un cuadro actual n. En general, el bloque de filtro 102 puede ser un filtro lineal H(z); un ejemplo de dicho filtro lineal H(z) es el filtro de predicción a largo plazo mencionado más arriba
[0007]
[0009] donde los parámetros de filtro son la ganancia “g” y el retardo de altura tonal “T”. De un modo más general, el filtro de predicción a largo plazo puede describirse de la siguiente manera:
[0011]
[0013] donde A(z) es un filtro FIR (por sus siglas en inglés, filtro de respuesta finita al impulso). Un filtro de predicción a largo plazo puede usarse para atenuar o hasta suprimir por completo un conjunto de armónicos en una señal de audio. Sin embargo, existe una alta probabilidad de introducir una discontinuidad 106a, 106b (ver Fig.1) entre el cuadro anterior filtrado n-1 y el cuadro actual filtrado n cuando se usa dicho filtro de predicción a largo plazo y cuando los parámetros de filtro del cuadro anteriorc0son distintos de los parámetros de filtro del cuadro actualc1. Esta discontinuidad puede producir una fallo en la señal de audio filtrada 104, por ejemplo, un “clic”.
[0014] En consecuencia, teniendo en cuenta los problemas descritos más arriba con el filtrado de cuadros consecutivos que resultan en discontinuidades que, a su vez, pueden provocar fallas no deseadas, se necesita una técnica que elimine una posible discontinuidad. En la técnica se conocen diversos enfoques de la técnica anterior que tratan la eliminación de una discontinuidad de cuadros filtrados de una señal de audio.
[0015] En el caso en que el filtro lineal H(z) sea un filtro FIR, el cuadro actual se filtra con los parámetros de filtroc1del cuadro actual para producir un cuadro actual filtrado. Además, una porción de inicio del cuadro actual se filtra con los parámetros de filtro del cuadro anteriorc0para producir una porción de cuadro filtrada, y luego se lleva a cabo una operación de adición de superposición o atenuación cruzada sobre la porción de inicio del cuadro actual filtrado y la porción de cuadro filtrada. La Fig.2 muestra un diagrama de bloques de dicho enfoque convencional para procesar cuadros de audio consecutivos a fin de eliminar una discontinuidad. Cuando se compara con la Fig. 1, el bloque de filtro 102 incluye otro bloque de procesamiento 108 para llevar a cabo la operación de adición de superposición o atenuación cruzada. En la señal de audio filtrada 104, no habrá discontinuidad o habrá una discontinuidad reducida entre los cuadros filtrados consecutivos, como se indica esquemáticamente en la Fig. 2 que muestra los cuadros filtrados consecutivos n, n-1 y n-2 sin los espacios de la Fig.1.
[0016] En otros enfoques de la técnica anterior, el filtro H(z) puede ser un filtro que tiene una parte recursiva, por ejemplo, un filtro IIR. En ese caso, el enfoque como el que se describió más arriba respecto de la Fig.2 se aplica sobre una base
muestra por muestra. En una primera etapa, el proceso comienza con la primera muestra de la porción de inicio del cuadro actual n siendo filtrada con los parámetros de filtroc0del cuadro anterior n-1 para dar como resultado una primera muestra filtrada. La muestra también se filtra con los parámetros de filtroc1del cuadro actual n produciendo una segunda muestra filtrada. Luego, la operación de adición de superposición o atenuación cruzada se lleva a cabo en base a la primera y segunda muestras filtradas, lo cual produce la muestra correspondiente del cuadro actual filtrado n. Luego se procesa la siguiente muestra y las etapas mencionadas más arriba se repiten hasta que la última muestra de la porción de inicio del cuadro actual n ha sido procesada. Las muestras restantes del cuadro actual n se filtran con los parámetros de filtroc1del cuadro actual n.
[0017] Algunos ejemplos de los enfoques conocidos mencionados más arriba para eliminar una discontinuidad de los cuadros filtrados consecutivos se describen, por ejemplo, en US 5.012.517 A en el contexto de un codificador por transformada, en EP 0732687 A2 en el contexto de un expansor de ancho de banda para voz, en US 5.999.899 A en el contexto de un codificador de audio por transformada o en US 7.353.168 B2 en el contexto de un posfiltro de voz decodificada. Si bien los enfoques mencionados anteriormente son eficaces para eliminar las discontinuidades de señal no deseadas, dado que estos enfoques operan sobre una porción específica del cuadro actual, la porción de inicio, para que sean eficaces, la longitud de la porción de cuadro debe ser suficientemente larga; por ejemplo, en el caso de una longitud de cuadro de 20 ms, la longitud de la porción de cuadro o la porción de inicio podría ser de hasta 5 ms. En determinados casos, esta puede ser demasiado larga, especialmente en situaciones en las cuales los parámetros de filtro del cuadro anteriorc0no se aplique bien al cuadro actual y esto podría provocar fallas adicionales. Un ejemplo es una señal de audio armónica con altura tonal rápidamente cambiante, y un filtro de predicción a largo plazo que está diseñado para reducir la amplitud de los armónicos. En ese caso, el retardo tonal es diferente de un cuadro a otro. El filtro de predicción a largo plazo con la altura tonal estimada en el cuadro actual efectivamente reduciría la amplitud de los armónicos en el cuadro actual, pero no reduciría la amplitud de los armónicos si se usara en otro cuadro (por ejemplo, porción de inicio del cuadro siguiente) donde la altura tonal de la señal de audio sería distinta. Podría empeorar más las cosas, al reducir la amplitud de componentes no relacionados con armónicos en la señal, introduciendo una distorsión en la señal.
[0018] El documento WO 2011/085483 A1 describe un método para producir parámetros de cancelación de solapamiento delantero (FAC) para cancelar el solapamiento de dominio de tiempo provocado en una señal de audio codificada en un primer cuadro codificado por transformada mediante una transición entre el primer cuadro codificado por transformada usando un primer modo de codificación con ventana de superposición y un segundo cuadro que usa un segundo modo de codificación con ventana de no superposición. El método incluye calcular un objetivo FAC representativo de una diferencia entre la señal de audio del primer cuadro antes de la codificación y una síntesis de la señal de audio codificada del primer cuadro codificado por transformada; y ponderar el objetivo FAC para producir los parámetros FAC. En un decodificador, los parámetros de cancelación de solapamiento delantero (FAC) ponderados se reciben y se ponderan a la inversa para producir una síntesis FAC. Tras la síntesis de la señal de audio codificada en el primer cuadro, se cancela el solapamiento de dominio de tiempo desde la síntesis de señal de audio usando la síntesis FAC.
[0019] El documento US 2009/083047 A1 describe circuitos y métodos para proporcionar reproducción de cero huecos de corrientes de datos consecutivas en dispositivos electrónicos portátiles, tal como reproductores de medios. Un circuito incluye un circuito decodificador configurado para recibir datos de audio codificados y para enviar datos de audio decodificados que incluyen corrientes de datos asociados con un archivo de datos y un archivo de datos posterior. Además, un circuito predictivo, que se acopla eléctricamente al circuito decodificador, se configura para generar selectivamente muestras adicionales en función de muestras en el archivo de datos, donde las muestras adicionales corresponden a momentos después del final de una corriente de datos asociados con el archivo de datos. Adicionalmente, un circuito de filtro, que se acopla eléctricamente al circuito decodificador y se acopla eléctrica y selectivamente al circuito predictivo, se configura para combinar o mezclar selectivamente muestras en un comienzo del archivo de datos posterior con las muestras adicionales.
[0020] Es un objetivo de la presente invención proporcionar un enfoque mejorado para eliminar discontinuidades entre cuadros de audio filtrados sin producir ninguna distorsión potencial en la señal de audio filtrada.
[0021] Este objetivo se consigue mediante un método para procesar una señal de audio según la reivindicación 1, mediante un aparato para procesar una señal de audio de acuerdo con la reivindicación 12, mediante un decodificador de audio de acuerdo con la reivindicación 13 y mediante un codificador de audio de acuerdo con la reivindicación 14.
[0022] La presente invención proporciona un método para procesar una señal de audio, comprendiendo el método eliminar una discontinuidad entre un cuadro anterior y una cuadro actual filtrado de la señal de audio usando filtrado predictivo lineal.
[0023] El filtro predictivo lineal puede definirse como
[0024]
[0026] conMel orden de filtro yamlos coeficientes de filtro (cona0
= 1). Este tipo de filtro también se conoce como Codificación Predictiva Lineal (LPC, por sus siglas en inglés).
[0027] De acuerdo con la presente invención, el método comprende filtrar el cuadro actual de la señal de audio y eliminar la discontinuidad modificando una porción de inicio del cuadro actual filtrado por una señal obtenida mediante el filtrado predictivo lineal de una señal predefinida con estados iniciales del filtro predictivo lineal definidos sobre la base de una última parte del cuadro anterior.
[0028] De acuerdo con la presente invención, los estados iniciales del filtro de predictiva lineal se definen sobre la base de una última parte del cuadro anterior no filtrado usando el conjunto de parámetros de filtro para el cuadro actual. De acuerdo con realizaciones, el método comprende estimar el filtro predictivo lineal sobre la señal de audio filtrada o no filtrada.
[0029] De acuerdo con realizaciones, estimar el filtro predictivo lineal comprende estimar el filtro en base al cuadro anterior o actual de la señal de audio o en base al cuadro filtrado anterior de la señal de audio usando el algoritmo de Levinson-Durbin.
[0030] De acuerdo con realizaciones, el filtro predictivo lineal comprende un filtro predictivo lineal de un códec de audio. De acuerdo con realizaciones, eliminar la discontinuidad comprende procesar la porción de inicio del cuadro actual filtrado, donde la porción de inicio del cuadro actual tiene una cantidad predefinida de muestras que es menor o igual a la cantidad total de muestras en el cuadro actual, y donde procesar la porción de inicio del cuadro actual comprende sustraer una porción de inicio de una respuesta de entrada de cero (ZIR, por sus siglas en inglés) de la porción de inicio del cuadro actual filtrado.
[0031] De acuerdo con realizaciones, el método comprende filtrar el cuadro actual de la señal de audio usando un filtro no recursivo, como un filtro FIR, para producir el cuadro actual filtrado.
[0032] De acuerdo con las realizaciones, el método comprende procesar el cuadro actual no filtrado de la señal de audio muestra por muestra utilizando un filtro recursivo, como un filtro IIR, y en donde el procesamiento de una muestra de la parte inicial del cuadro actual comprende:
[0033] filtrar la muestra con el filtro recursivo usando los parámetros de filtro del marco actual para producir una muestra filtrada, y
[0034] sustraer una muestra ZIR correspondiente de la muestra filtrada para producir la muestra correspondiente del cuadro actual filtrado.
[0035] De acuerdo con realizaciones, el filtrado y la sustracción se repiten hasta que se procesa la última muestra en la porción inicial del cuadro actual, y en el que el método comprende además filtrar las muestras restantes en el cuadro actual con el filtro recursivo usando los parámetros de filtro de cuadro actual.
[0036] De acuerdo con realizaciones, el método comprende la generación de la ZIR, en donde la generación de la ZIR comprende:
[0037] filtrar las últimas muestras M del cuadro anterior no filtrado con el filtro y los parámetros de filtro usados para filtrar el cuadro actual para producir una primera porción de señal filtrada, donde M es el orden de filtro predictivo lineal, sustraer de la primera porción de señal filtrada las últimas muestras M del cuadro anterior filtrado, que se filtra usando los parámetros de filtro del cuadro anterior, para generar una segunda porción de señal filtrada, y
[0038] generar una ZIR de un filtro predictivo lineal filtrando un cuadro de cero muestras con el filtro predictivo lineal y estados iniciales iguales a la segunda porción de señal filtrada.
[0039] De acuerdo con realizaciones, el método comprende generar ventanas para la ZIR de manera que su amplitud disminuya más rápidamente a cero.
[0040] La presente invención se basa en los hallazgos del inventor acerca de que los problemas que han sido reconocidos en enfoques convencionales para eliminar las discontinuidades de señal que provocan la distorsión adicional no
deseada mencionada más arriba, se deben principalmente al procesamiento del cuadro actual o por lo menos una porción del mismo sobre la base de los parámetros de filtro para el cuadro anterior. De acuerdo con el enfoque inventivo, esto se evita, es decir, el enfoque inventivo no filtra una porción del cuadro actual con los parámetros de filtro del cuadro anterior y así evitar los problemas mencionados más arriba. De acuerdo con la presente invención, para eliminar la discontinuidad, se utiliza un filtro LPC (filtro predictivo lineal) para eliminar la discontinuidad. El filtro LPC puede estimarse sobre la señal de audio y, por consiguiente, es un buen modelo de la forma espectral de la señal de audio, de manera que, cuando se usa el filtro LPC, la forma espectral de la señal de audio enmascarará la discontinuidad. En una realización, el filtro LPC puede estimarse sobre la base de la señal de audio no filtrada o sobre la base de una señal de audio que ha sido filtrada por un filtro lineal H(z) mencionado más arriba. De acuerdo con realizaciones, el filtro LPC puede estimarse usando la señal de audio, por ejemplo, el cuadro actual y/o el cuadro anterior, y el algoritmo de Levinson-Durbin. También puede computarse solo sobre la base de la señal de cuadro anterior filtrada usando el algoritmo de Levinson-Durbin.
[0041] En otras realizaciones más, un códec de audio para procesar la señal de audio puede utilizar un filtro lineal H(z) y también puede utilizar un filtro LPC, ya sea cuantificado o no, por ejemplo, para formar el ruido de cuantificación en un códec de audio en base a transformada. En dicha realización, este filtro LPC existente puede usarse directamente para atenuar la discontinuidad sin la complejidad adicional necesaria para estimar un nuevo filtro LPC.
[0042] A continuación, se describirán realizaciones para ilustrar la presente invención con referencia a los dibujos adjuntos, en los cuales:
[0043] la figura 1 muestra un diagrama de bloques para procesar cuadros consecutivos de una señal de audio de acuerdo con un enfoque convencional,
[0044] la figura 2 muestra un diagrama de bloques de otro enfoque convencional para procesar cuadros de audio consecutivos a fin de eliminar una discontinuidad,
[0045] la figura 3 muestra un diagrama de bloques simplificado de un sistema para transmitir señales de audio implementando el enfoque inventivo a fin de eliminar una discontinuidad entre cuadros consecutivos de una señal de audio del lado del codificador y/o del lado del decodificador,
[0046] la figura 4 muestra un diagrama de flujo que ilustra el enfoque inventivo para eliminar una discontinuidad entre cuadros consecutivos de una señal de audio de acuerdo con una realización,
[0047] la figura 5 muestra un diagrama de bloques esquemático para procesar un cuadro de audio actual de acuerdo con realizaciones de la presente invención evitando la distorsión no deseada en la señal de salida a pesar de la eliminación de las discontinuidades,
[0048] la figura 6 muestra un diagrama de flujo que representa la funcionalidad del bloque en la Fig.5 para generar la ZIR, la figura 7 muestra un diagrama de flujo que representa la funcionalidad del bloque en la Fig.5 para procesar la porción de inicio del cuadro actual filtrado en el caso en que el bloque de filtro comprende un filtro recursivo, como un filtro IIR, y
[0049] la figura 8 muestra un diagrama de flujo que representa la funcionalidad del bloque en la Fig.5 para procesar la porción de inicio del cuadro actual filtrado en el caso en que el bloque de filtro comprende un filtro no recursivo, como un filtro FIR.
[0050] A continuación, se describirán realizaciones del enfoque inventivo más detalladamente; cabe señalar que en el dibujo adjunto los elementos que tienen la misma función o una función similar están representados por los mismos signos de referencia.
[0051] La Fig.3 muestra un diagrama de bloques simplificado de un sistema para transmitir señales de audio que implementa el enfoque inventivo en el lado del codificador y/o en el lado del decodificador. El sistema de la Fig.3 comprende un codificador 200 que recibe en una entrada 202 una señal de audio 204. El codificador incluye un procesador de codificación 206 que recibe la señal de audio 204 y genera una señal de audio codificada que se proporciona en una entrada 208 del codificador. El procesador de codificación puede programarse o construirse para implementar el enfoque inventivo a fin de procesar cuadros de audio consecutivos de la señal de audio recibida para evitar discontinuidades. En otras realizaciones, no es necesario que el codificador sea parte de un sistema de transmisión; sin embargo, puede ser un dispositivo independiente que genera señales de audio codificadas o puede ser parte de un transmisor de señales de audio. De acuerdo con una realización, el codificador 200 puede comprender una antena 210 que permite una transmisión inalámbrica de la señal de audio, como se indica en 212. En otras realizaciones, el codificador 200 puede enviar la señal de audio codificada proporcionada en la salida 208 usando una línea de conexión cableada, como se indica por ejemplo en el signo de referencia 214.
[0052] El sistema de la Fig.3 también comprende un decodificador 250 que tiene una entrada 252 que recibe una señal de audio codificada para ser procesada por el decodificador 250, por ejemplo, mediante la línea cableada 214 o mediante una antena 254. El decodificador 250 comprende un procesador de decodificación 256 que opera sobre la señal codificada y proporciona una señal de audio decodificada 258 en una salida 260. El procesador de decodificación 256 puede implementarse para operar de acuerdo con el enfoque inventivo sobre cuadros consecutivos que se filtran de manera tal que se evitan las discontinuidades. En otras realizaciones, no es necesario que el decodificador sea parte de un sistema de transmisión; en cambio, puede ser un dispositivo independiente para decodificar señales de audio codificadas o puede ser parte de un receptor de señales de audio.
[0054] A continuación, se describirán con más detalle las realizaciones del enfoque inventivo que se implementan en al menos uno del procesador de codificación 206 en el procesador de decodificación 256. La Fig. 4 muestra un diagrama de flujo para procesar un cuadro actual de la señal de audio de acuerdo con una realización del enfoque inventivo. Se describirá el procesamiento del cuadro actual, y se asume que el cuadro anterior ya está procesado con la misma técnica que se describe a continuación. De acuerdo con la presente invención, en la etapa S100 se recibe un cuadro actual de la señal de audio. El cuadro actual se filtra en la etapa S102, por ejemplo, de un modo como el que se describió más arriba respecto de las Figs.1 y 2 (véase el bloque de filtro 102). De acuerdo con el enfoque inventivo, una discontinuidad entre el cuadro anterior filtrado n-1 y el cuadro actual filtrado n (véase la Fig. 1 o 2) se eliminará usando un filtrado predictivo lineal como se indica en la etapa S104. De acuerdo con una realización, el filtro predictivo lineal puede definirse como
[0057]
[0060] conMel orden de filtro yamlos coeficientes de filtro (cona0
= 1). Este tipo de filtro también se conoce como Codificación Predictiva Lineal (LPC, por sus siglas en inglés). De acuerdo con realizaciones, el cuadro actual filtrado se procesa aplicando un filtrado predictivo lineal a por lo menos una parte del cuadro actual filtrado. La discontinuidad puede eliminarse modificando una porción de inicio del cuadro actual filtrado por una señal obtenida mediante filtrado predictivo lineal de una señal predefinida con estados iniciales del filtro de codificación predictiva lineal definidos sobre la base de una última parte del cuadro anterior. Los estados iniciales del filtro de codificación predictiva lineal pueden definirse sobre la base de una última parte del cuadro anterior filtrado usando el conjunto de parámetros de filtro para el cuadro actual. El enfoque inventivo es ventajoso ya que no requiere filtrar el cuadro actual de una señal de audio con un coeficiente de filtro que se usa para el cuadro anterior y así evitar problemas que surgen de la falta de concordancia de los parámetros de filtro para el cuadro actual y para el cuadro anterior como la que se experimenta en los enfoques de la técnica anterior descritos más arriba con referencia a la Fig.2.
[0062] La Fig.5 muestra un diagrama de bloques esquemático para procesar un cuadro de audio actual de la señal de audio de acuerdo con realizaciones de la presente invención, evitando la distorsión no deseada en la señal de salida a pesar de la eliminación de las discontinuidades. En la Fig.5, se usan los mismos signos de referencia que en las Figs.1 y 2. Se recibe un cuadro actual n de la señal de audio 100, teniendo cada cuadro de la señal de audio 100 una pluralidad de muestras. El cuadro actual n de la señal de audio 100 es procesado por el bloque de filtro 102. Cuando se compara con los enfoques de la técnica anterior de las Figs.1 y 2, de acuerdo con realizaciones como las descritas respecto de la Fig. 5, el cuadro actual filtrado se procesa luego sobre la base de muestras de ZIR como lo muestra esquemáticamente el bloque 110. De acuerdo con una realización sobre la base del cuadro anterior n-1, y sobre la base de un filtro LPC se producen las muestras de ZIR como lo muestra esquemáticamente el bloque 112.
[0064] A continuación, se describirá de manera detallada la funcionalidad de los bloques de proceso 110 y 112. La Fig. 6 muestra un diagrama de flujo que representa la función del bloque de proceso 112 para generar las muestras de ZIR. Como se mencionó más arriba, los cuadros de una señal de audio 100 son filtrados con un filtro lineal H(z) usando parámetros de filtro c seleccionados o determinados para el respectivo cuadro. El filtro H(z) puede ser un filtro recursivo, por ejemplo, un filtro IIR, o puede ser un filtro no recursivo, por ejemplo, un filtro FIR. En el bloque de proceso 112 se usa un filtro LPC que puede ser cuantificado o no. El filtro LPC es del orden M y puede ser ya sea estimado sobre la señal de audio filtrada o no filtrada o puede ser el filtro LPC que también se usa en un códec de audio. En una primera etapa S200, las últimas muestras M (M = el orden del filtro LPC) del cuadro anterior n-1 son filtradas con el filtro H(z) usando, no obstante, los parámetros de filtro o coeficientesc1del cuadro actual n. La etapa S200 produce de este modo una primera porción de señal filtrada. En la etapa S202 las últimas muestras M del cuadro anterior filtrado n-1 (las últimas muestras M del cuadro anterior filtradas usando los parámetros de filtro o coeficientesc0del cuadro anterior n-1) se sustraen de la primera porción de señal filtrada proporcionada por la etapa S200, produciendo así una segunda porción de señal filtrada. En la etapa S204, se aplica el filtro LPC que tiene el orden M, más específicamente se genera una respuesta de entrada de cero (ZIR) del filtro LPC en la etapa S204 filtrando un cuadro de cero muestras, donde los estados iniciales del filtro son iguales a la segunda porción de señales filtradas, generando así la ZIR. De acuerdo con realizaciones, se pueden generar ventanas para la ZIR de manera tal que su amplitud disminuya más rápidamente hasta 0.
[0065] La ZIR, como se describió más arriba respecto de la Fig.5, se aplica en el bloque de proceso 110, cuya funcionalidad
se describe con referencia al diagrama de flujo de la Fig. 7 para el caso de usar, como el filtro lineal H(z), un filtro recursivo, como un filtro IIR. De acuerdo con la realización descrita respecto de la Fig.5, para eliminar discontinuidades entre el cuadro actual y el cuadro anterior al mismo tiempo que se evitan distorsiones no deseadas, el filtrado del cuadro actual n comprende procesar (filtrar) el cuadro actual n sobre una base muestra por muestra, donde las muestras de la porción de inicio son tratadas de acuerdo con el enfoque inventivo. Más específicamente, se procesan muestras M de una porción de inicio del cuadro actual n, y en una primera etapa S300 las variables m se fijan en 0. En una siguiente etapa S302, la muestra m del cuadro actual n se filtra usando el filtro H(z) y los coeficientes de filtro o parámetrosc1para el cuadro actual n. De este modo, a diferencia de los enfoques convencionales, el cuadro actual, de acuerdo con el enfoque inventivo, no se filtra usando coeficientes del cuadro anterior, sino solo coeficientes del cuadro actual, lo cual, en consecuencia, evita la distorsión no deseada que existe en enfoques convencionales a pesar de que se eliminan las discontinuidades. La etapa S302 produce una muestra filtrada m, y en la etapa S304 la muestra de ZIR correspondiente a la muestra m se sustrae de la muestra filtrada m produciendo la muestra correspondiente del cuadro actual filtrado n. En la etapa S306 se determina si la última muestra M de la porción de inicio del cuadro actual n es procesada. En caso de que no todas las muestras M de las porciones de inicio hayan sido procesadas, la variable m se incrementa y las etapas del método S302 a S306 se repiten para la siguiente muestra del cuadro actual n. Una vez que todas las muestras M de las porciones de inicio han sido procesadas, en la etapa S308 las muestras restantes del cuadro actual n se filtran usando los parámetros de filtro del cuadro actualc1, proporcionando así el cuadro actual filtrado n procesado de acuerdo con el enfoque inventivo evitando la distorsión no deseada al eliminar las discontinuidades entre cuadros consecutivos.
[0067] De acuerdo con otra realización, el filtro lineal H(z) es un filtro no recursivo, como un filtro FIR, y la ZIR, como se describió anteriormente con respecto a la Fig. 5, se aplica en el bloque de proceso 110. La funcionalidad de esta realización se describe con referencia al diagrama de flujo de la Fig.8. El cuadro actual n, en la etapa S400, se filtra con el filtro H(z) usando los coeficientes de filtro o parámetrosc1para el cuadro actual. De este modo, al contrario de los enfoques convencionales, el cuadro actual, de acuerdo con el enfoque inventivo, no se filtra usando coeficientes del cuadro anterior, sino solo coeficientes del cuadro actual, lo cual como consecuencia evita la distorsión no deseada que existe en enfoques convencionales a pesar de que se eliminan las discontinuidades. En la etapa S402, una porción de inicio de la ZIR se sustrae de una porción de inicio correspondiente del cuadro actual filtrado, proporcionando así el cuadro actual filtrado n que tiene la porción de inicio filtrada/procesada de acuerdo con el enfoque inventivo y la parte restante solamente filtrada usando coeficientes o parámetros de filtroc1para el cuadro actual, evitando así la distorsión no deseada luego de la eliminación de las discontinuidades entre cuadros consecutivos.
[0069] El enfoque inventivo puede aplicarse en situaciones como se describió anteriormente cuando se filtra la señal de audio. De acuerdo con realizaciones, el enfoque inventivo también puede aplicarse en el lado del decodificador, por ejemplo, cuando se usa un posfiltro de códec de audio para reducir el nivel de ruido de codificación entre los armónicos de la señal. Para procesar los cuadros de audio en el decodificador, el posfiltro, de acuerdo con una realización, puede ser de la siguiente manera:
[0072]
[0075] donde B(z) y A(z) son dos filtros FIR y los parámetros de filtro H(z) son los coeficientes de los filtros FIR B(z) y A(z), y T indica el retardo de altura tonal. En dicho escenario, el filtro también puede introducir una discontinuidad entre los dos cuadros filtrados, por ejemplo, cuando los parámetros de filtro del cuadro anteriorc0son distintos de los parámetros de filtroc1del cuadro actual, y dicha discontinuidad podría provocar una fallo en la señal de audio filtrada 104, por ejemplo, un “clic”. Esta discontinuidad se elimina procesando el cuadro actual filtrado como se describió más arriba de manera detallada.
[0077] Si bien algunos aspectos del concepto detallado han sido descritos en el contexto de un aparato, cabe señalar que estos aspectos también representan una descripción del método correspondiente, donde un bloque o dispositivo corresponde a una etapa de método o una característica de una etapa de método. De manera análoga, los aspectos descritos en el contexto de una etapa del método también representan una descripción de un bloque o elemento correspondiente o de una característica de un aparato correspondiente.
[0079] Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención se pueden implementar en hardware o en software. La implementación se puede realizar empleando un medio de almacenamiento digital, por ejemplo un disco blando, un DVD, un Blu–Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene almacenadas en la misma señales control legibles electrónicamente, que cooperan (o tienen capacidad para cooperar) con un sistema de informático programable de tal manera que se ejecute el método respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.
[0081] Algunas realizaciones de acuerdo con la invención comprenden un transportador no transitorio de datos que comprende señales de control legibles electrónicamente, con capacidad para cooperar con un sistema informático programable de tal manera que se ejecute uno de los métodos descritos en el presente documento.
[0082] En general, las realizaciones de la presente invención pueden ser implementadas en forma de producto de programa informático con un código de programa, donde el código de programa cumple la función de ejecutar uno de los métodos al ejecutarse el programa informático en un ordenador. El código de programa puede ser almacenado, por ejemplo, en un portador legible por una máquina.
[0083] Otras realizaciones comprenden el programa informático para ejecutar uno de los métodos aquí descritos, almacenado en un portador legible por una máquina.
[0084] En otras palabras, una realización del método inventivo es, por lo tanto, un programa informático que tiene un código de programa para realizar uno de los métodos descritos en el presente documento, cuando el programa informático se ejecuta en un ordenador.
[0085] Una realización adicional de los métodos inventivos es, por lo tanto, un portador de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para realizar uno de los métodos descritos en el presente documento.
[0086] Otra realización del método inventivo es, por lo tanto, un flujo de datos o una secuencia de señales que representan el programa informático para realizar uno de los métodos descritos en el presente documento. El flujo de datos o la secuencia de señales pueden estar configurados, por ejemplo, para ser transferida a través de una conexión de comunicación de datos, por ejemplo a través de Internet.
[0087] Otra realización comprende un medio de procesamiento, por ejemplo un ordenador o un dispositivo lógico programable, configurado o adaptado para realizar uno de los métodos descritos en el presente documento.
[0088] Otra realización comprende un ordenador que tiene instalado en él el programa informático para realizar uno de los métodos descritos en el presente documento.
[0089] En algunas realizaciones, se puede utilizar un dispositivo lógico programable (por ejemplo, una matriz de puertas programable en campo) para realizar algunas o todas las funcionalidades de los métodos descritos en el presente documento. En algunas realizaciones, una matriz de puertas programables en campo puede cooperar con un microprocesador para realizar uno de los métodos descritos en el presente documento. Por lo general, los métodos son ejecutados preferentemente por cualquier aparato de hardware.
[0090] Las realizaciones anteriormente descritas son meramente ilustrativas de los principios de la presente invención. Se entiende que modificaciones y variaciones de las disposiciones y los detalles aquí descritos resultarán evidentes para los expertos en la técnica. Es la intención, por consiguiente, limitarse sólo por el alcance de las reivindicaciones de patente que siguen y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones en el presente documento.
Claims (14)
1. REIVINDICACIONES
1. Un método para procesar una señal de audio (100), comprendiendo el método:
recibir una señal de audio codificada; y
generar una señal de audio decodificada procesando cuadros de audio consecutivos de la señal de audio para evitar discontinuidades;
en el que el procesamiento de cuadros de audio consecutivos de la señal de audio para evitar discontinuidades comprende usar filtrado predictivo lineal para eliminar (S102, S104, S300-S308, S400-S402) una discontinuidad (106a, 106b) entre un cuadro anterior filtrado y un cuadro actual filtrado de la señal de audio,
en el que el método comprende filtrar el cuadro actual de la señal de audio y eliminar la discontinuidad modificando una porción de inicio del cuadro actual filtrado por una señal obtenida mediante el filtrado predictivo lineal de una señal predefinida con estados iniciales del filtro predictivo lineal definidos sobre la base de una última parte del cuadro anterior no filtrado usando el conjunto de parámetros de filtrado para filtrar el cuadro actual.
2. El método de la reivindicación 1, que comprende además estimar el filtro predictivo lineal sobre la señal de audio filtrada o no filtrada(100).
3. El método de la reivindicación 2, en el que estimar el filtro predictivo lineal comprende estimar el filtro en base al cuadro anterior y/o actual de la señal de audio (100) o en base al cuadro anterior filtrado de la señal de audio (100) usando el algoritmo de Levinson-Durbin.
4. El método de la reivindicación 1, en el que el filtro predictivo lineal comprende un filtro predictivo lineal de un códec de audio.
5. El método de una de las reivindicaciones 1 a 4, en el que eliminar la discontinuidad comprende procesar la porción de inicio del cuadro actual filtrado, en el que la porción de inicio del cuadro actual tiene una cantidad predefinida de muestras que son menos o iguales a la cantidad total de muestras en el cuadro actual, y donde procesar la porción de inicio del cuadro actual comprende sustraer (S304, S402) una porción de inicio de una respuesta de entrada de cero (ZIR) de la porción de inicio del cuadro actual filtrado.
6. El método de la reivindicación 5, que comprende filtrar (S400) el cuadro actual de la señal de audio utilizando un filtro no recursivo, como un filtro FIR, para producir el cuadro actual filtrado.
7. El método de la reivindicación 5, que comprende procesar el cuadro actual no filtrado de la señal de audio muestra por muestra utilizando un filtro recursivo, como un filtro IIR, y en donde el procesamiento de una muestra de la parte inicial del cuadro actual comprende:
filtrar (S302) la muestra con el filtro recursivo usando los parámetros de filtro del marco actual para producir una muestra filtrada, y
sustraer (S304) una muestra ZIR correspondiente de la muestra filtrada para producir la muestra correspondiente del cuadro actual filtrado.
8. El método de la reivindicación 7, en donde el filtrado (S302) y la sustracción (S304) se repiten hasta que se procesa la última muestra en la porción inicial del cuadro actual, y en el que el método comprende además filtrar (S306) las muestras restantes en el cuadro actual con el filtro recursivo usando los parámetros de filtro de cuadro actual.
9. El método de una de las reivindicaciones 5 a 8, que comprende la generación de la ZIR, en donde la generación de la ZIR comprende:
filtrar (S200) las últimas muestras M del cuadro anterior no filtrado con el filtro y los parámetros de filtrado usados para filtrar el cuadro actual para producir una primera porción de señal filtrada, en donde M es el orden del filtro predictivo lineal,
sustraer (S202) de la primera porción de señal filtrada las últimas muestras M del cuadro anterior filtrado, que se filtra usando los parámetros de filtro del cuadro anterior, para generar una segunda porción de señal filtrada, y
generar (S204) una ZIR de un filtro predictivo lineal filtrando un cuadro de cero muestras con el filtro predictivo lineal y estados iniciales iguales a la segunda porción de señal filtrada.
10. El método de la reivindicación 9, que comprende generar ventanas para la ZIR de manera que su amplitud disminuya más rápidamente a cero.
11. Un medio legible por ordenador que comprende instrucciones que, cuando son ejecutadas en un ordenador, llevan a cabo el método de una de las reivindicaciones 1 a 10.
12. Aparato para procesar una señal de audio (100), comprendiendo el aparato:
un procesador (102, 110, 112) configurado para recibir una señal de audio codificada y generar una señal de audio decodificada mediante el procesamiento de cuadros de audio consecutivos de la señal de audio para evitar discontinuidades;
en donde, para procesar los cuadros de audio consecutivos de la señal de audio para evitar discontinuidades, el procesador (102, 110, 112) está configurado para usar filtrado predictivo para eliminar una discontinuidad entre un cuadro anterior filtrado y un cuadro actual filtrado de la señal de audio,
en donde el procesador (102, 110, 112) configurado para filtrar el cuadro actual de la señal de audio y eliminar la discontinuidad modificando una porción de inicio del cuadro actual filtrado por una señal obtenida mediante el filtrado predictivo lineal de una señal predefinida con estados iniciales del filtro predictivo lineal definidos sobre la base de una última parte del cuadro anterior no filtrado usando el conjunto de parámetros de filtrado para filtrar el cuadro actual.
13. Decodificador de audio (250), que comprende un aparato de la reivindicación 12.
14. Codificador de audio (200), que comprende un aparato de la reivindicación 12.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP14178821.6A EP2980796A1 (en) | 2014-07-28 | 2014-07-28 | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES3052673T3 true ES3052673T3 (en) | 2026-01-12 |
Family
ID=51224879
Family Applications (6)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES23179786T Active ES2994941T3 (en) | 2014-07-28 | 2015-07-03 | Method and apparatus for processing an audio signal, computer readable medium and audio decoder |
| ES19209351T Active ES2914632T3 (es) | 2014-07-28 | 2015-07-03 | Método para procesar una señal de audio y decodificador de audio |
| ES15732290.0T Active ES2685984T3 (es) | 2014-07-28 | 2015-07-03 | Método y aparato para procesar una señal de audio, decodificador de audio y codificador de audio |
| ES18182785T Active ES2773690T3 (es) | 2014-07-28 | 2015-07-03 | Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio |
| ES24198100T Active ES3052673T3 (en) | 2014-07-28 | 2015-07-03 | Method and apparatus for processing an audio signal, computer readable medium, audio decoder and audio encoder |
| ES22160064T Active ES2960422T3 (es) | 2014-07-28 | 2015-07-03 | Método y aparato para procesar una señal de audio, decodificador de audio y codificador de audio |
Family Applications Before (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES23179786T Active ES2994941T3 (en) | 2014-07-28 | 2015-07-03 | Method and apparatus for processing an audio signal, computer readable medium and audio decoder |
| ES19209351T Active ES2914632T3 (es) | 2014-07-28 | 2015-07-03 | Método para procesar una señal de audio y decodificador de audio |
| ES15732290.0T Active ES2685984T3 (es) | 2014-07-28 | 2015-07-03 | Método y aparato para procesar una señal de audio, decodificador de audio y codificador de audio |
| ES18182785T Active ES2773690T3 (es) | 2014-07-28 | 2015-07-03 | Métodos para codificar y decodificar una señal de audio, decodificador de audio y codificador de audio |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES22160064T Active ES2960422T3 (es) | 2014-07-28 | 2015-07-03 | Método y aparato para procesar una señal de audio, decodificador de audio y codificador de audio |
Country Status (17)
| Country | Link |
|---|---|
| US (6) | US20170133028A1 (es) |
| EP (7) | EP2980796A1 (es) |
| JP (6) | JP6503051B2 (es) |
| KR (6) | KR20250008957A (es) |
| CN (2) | CN113012704B (es) |
| AR (1) | AR101287A1 (es) |
| AU (1) | AU2015295709B2 (es) |
| CA (6) | CA2955674C (es) |
| ES (6) | ES2994941T3 (es) |
| MX (1) | MX362737B (es) |
| MY (1) | MY179016A (es) |
| PL (6) | PL4030426T3 (es) |
| PT (3) | PT3175452T (es) |
| RU (1) | RU2665282C1 (es) |
| SG (1) | SG11201700684YA (es) |
| TW (1) | TWI595480B (es) |
| WO (1) | WO2016015950A1 (es) |
Families Citing this family (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
| EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
| EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
| WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
| EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
| EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
| EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
| EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
| EP3483884A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
| WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
| BR112022018082A2 (pt) * | 2020-04-24 | 2022-11-01 | Ericsson Telefon Ab L M | Método e decodificador para decodificação de áudio, programa de computador, e, produto de programa de computador |
| CN117040487B (zh) * | 2023-10-08 | 2024-01-02 | 武汉海微科技有限公司 | 音频信号处理的滤波方法、装置、设备及存储介质 |
Family Cites Families (49)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
| US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
| DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
| US5784532A (en) * | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
| DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
| JP3653826B2 (ja) * | 1995-10-26 | 2005-06-02 | ソニー株式会社 | 音声復号化方法及び装置 |
| US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
| SE9700772D0 (sv) | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
| FR2762464B1 (fr) * | 1997-04-16 | 1999-06-25 | France Telecom | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" |
| GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
| US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
| GB2356538A (en) * | 1999-11-22 | 2001-05-23 | Mitel Corp | Comfort noise generation for open discontinuous transmission systems |
| US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
| US7512535B2 (en) | 2001-10-03 | 2009-03-31 | Broadcom Corporation | Adaptive postfiltering methods and systems for decoding speech |
| US20040098255A1 (en) * | 2002-11-14 | 2004-05-20 | France Telecom | Generalized analysis-by-synthesis speech coding method, and coder implementing such method |
| US7145484B2 (en) | 2002-11-21 | 2006-12-05 | Nippon Telegraph And Telephone Corporation | Digital signal processing method, processor thereof, program thereof, and recording medium containing the program |
| US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
| CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
| US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
| JP4606264B2 (ja) * | 2005-07-19 | 2011-01-05 | 三洋電機株式会社 | ノイズキャンセラ |
| JP2009539132A (ja) * | 2006-05-30 | 2009-11-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号の線形予測符号化 |
| CN101197134A (zh) * | 2006-12-05 | 2008-06-11 | 华为技术有限公司 | 消除编码模式切换影响的方法和装置以及解码方法和装置 |
| US8000969B2 (en) * | 2006-12-19 | 2011-08-16 | Nuance Communications, Inc. | Inferring switching conditions for switching between modalities in a speech application environment extended for interactive text exchanges |
| CN101231850B (zh) * | 2007-01-23 | 2012-02-29 | 华为技术有限公司 | 编解码方法及装置 |
| US8069051B2 (en) * | 2007-09-25 | 2011-11-29 | Apple Inc. | Zero-gap playback using predictive mixing |
| CN101527138B (zh) | 2008-03-05 | 2011-12-28 | 华为技术有限公司 | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 |
| EP3296992B1 (en) | 2008-03-20 | 2021-09-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for modifying a parameterized representation |
| BR122021009252B1 (pt) * | 2008-07-11 | 2022-03-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador e decodificador de áudio para estruturas de codificação de sinais de áudio amostrados |
| EP2301020B1 (en) * | 2008-07-11 | 2013-01-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
| EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
| EP2346029B1 (en) * | 2008-07-11 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and corresponding computer program |
| KR20100007738A (ko) * | 2008-07-14 | 2010-01-22 | 한국전자통신연구원 | 음성/오디오 통합 신호의 부호화/복호화 장치 |
| CN101355692B (zh) * | 2008-07-30 | 2013-03-20 | 浙江大学 | 一种实时跟踪运动目标区域的智能监控装置 |
| US8831958B2 (en) * | 2008-09-25 | 2014-09-09 | Lg Electronics Inc. | Method and an apparatus for a bandwidth extension using different schemes |
| JP5699141B2 (ja) * | 2009-06-23 | 2015-04-08 | ヴォイスエイジ・コーポレーション | 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し |
| KR101734948B1 (ko) * | 2009-10-09 | 2017-05-12 | 삼성전자주식회사 | 파워 헤드룸 보고, 자원 할당 및 전력 제어 방법 |
| EP4571739A1 (en) * | 2009-10-20 | 2025-06-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
| WO2011085483A1 (en) * | 2010-01-13 | 2011-07-21 | Voiceage Corporation | Forward time-domain aliasing cancellation using linear-predictive filtering |
| US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
| EP4398248B1 (en) * | 2010-07-08 | 2025-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder using forward aliasing cancellation |
| CN101976566B (zh) * | 2010-07-09 | 2012-05-02 | 瑞声声学科技(深圳)有限公司 | 语音增强方法及应用该方法的装置 |
| US8738385B2 (en) * | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
| FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
| US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
| CN102368385B (zh) * | 2011-09-07 | 2013-08-14 | 中科开元信息技术(北京)有限公司 | 后向块自适应Golomb-Rice编解码方法及装置 |
| US9043201B2 (en) * | 2012-01-03 | 2015-05-26 | Google Technology Holdings LLC | Method and apparatus for processing audio frames to transition between different codecs |
| CN103548080B (zh) * | 2012-05-11 | 2017-03-08 | 松下电器产业株式会社 | 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法 |
| EP2980797A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
| EP2980796A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
-
2014
- 2014-07-28 EP EP14178821.6A patent/EP2980796A1/en not_active Withdrawn
-
2015
- 2015-07-03 PT PT15732290T patent/PT3175452T/pt unknown
- 2015-07-03 PT PT181827858T patent/PT3407351T/pt unknown
- 2015-07-03 PL PL22160064.6T patent/PL4030426T3/pl unknown
- 2015-07-03 KR KR1020247042711A patent/KR20250008957A/ko active Pending
- 2015-07-03 PT PT192093516T patent/PT3654333T/pt unknown
- 2015-07-03 CN CN202110100360.9A patent/CN113012704B/zh active Active
- 2015-07-03 SG SG11201700684YA patent/SG11201700684YA/en unknown
- 2015-07-03 MY MYPI2017000131A patent/MY179016A/en unknown
- 2015-07-03 ES ES23179786T patent/ES2994941T3/es active Active
- 2015-07-03 CA CA2955674A patent/CA2955674C/en active Active
- 2015-07-03 RU RU2017105447A patent/RU2665282C1/ru active
- 2015-07-03 KR KR1020217029645A patent/KR102459857B1/ko active Active
- 2015-07-03 ES ES19209351T patent/ES2914632T3/es active Active
- 2015-07-03 KR KR1020227036973A patent/KR102615475B1/ko active Active
- 2015-07-03 CA CA3193309A patent/CA3193309A1/en active Pending
- 2015-07-03 MX MX2017001245A patent/MX362737B/es active IP Right Grant
- 2015-07-03 ES ES15732290.0T patent/ES2685984T3/es active Active
- 2015-07-03 ES ES18182785T patent/ES2773690T3/es active Active
- 2015-07-03 PL PL18182785T patent/PL3407351T3/pl unknown
- 2015-07-03 WO PCT/EP2015/065219 patent/WO2016015950A1/en not_active Ceased
- 2015-07-03 EP EP15732290.0A patent/EP3175452B1/en active Active
- 2015-07-03 KR KR1020197018895A patent/KR102304326B1/ko active Active
- 2015-07-03 ES ES24198100T patent/ES3052673T3/es active Active
- 2015-07-03 AU AU2015295709A patent/AU2015295709B2/en active Active
- 2015-07-03 ES ES22160064T patent/ES2960422T3/es active Active
- 2015-07-03 CN CN201580040572.5A patent/CN106575507B/zh active Active
- 2015-07-03 CA CA3193316A patent/CA3193316A1/en active Pending
- 2015-07-03 KR KR1020237043141A patent/KR102748357B1/ko active Active
- 2015-07-03 PL PL23179786.1T patent/PL4235667T3/pl unknown
- 2015-07-03 EP EP22160064.6A patent/EP4030426B1/en active Active
- 2015-07-03 CA CA3193319A patent/CA3193319A1/en active Pending
- 2015-07-03 EP EP23179786.1A patent/EP4235667B1/en active Active
- 2015-07-03 PL PL24198100.0T patent/PL4447048T3/pl unknown
- 2015-07-03 EP EP18182785.8A patent/EP3407351B1/en active Active
- 2015-07-03 JP JP2017504689A patent/JP6503051B2/ja active Active
- 2015-07-03 PL PL15732290T patent/PL3175452T3/pl unknown
- 2015-07-03 PL PL19209351T patent/PL3654333T3/pl unknown
- 2015-07-03 EP EP24198100.0A patent/EP4447048B1/en active Active
- 2015-07-03 CA CA3193302A patent/CA3193302A1/en active Pending
- 2015-07-03 EP EP19209351.6A patent/EP3654333B1/en active Active
- 2015-07-03 KR KR1020177005450A patent/KR101997006B1/ko active Active
- 2015-07-03 CA CA3193306A patent/CA3193306A1/en active Pending
- 2015-07-13 TW TW104122578A patent/TWI595480B/zh active
- 2015-07-23 AR ARP150102337A patent/AR101287A1/es active IP Right Grant
-
2017
- 2017-01-23 US US15/412,920 patent/US20170133028A1/en active Granted
-
2019
- 2019-03-22 JP JP2019054137A patent/JP6864382B2/ja active Active
-
2021
- 2021-03-26 JP JP2021052578A patent/JP7202545B2/ja active Active
-
2022
- 2022-01-20 US US17/580,578 patent/US12014746B2/en active Active
- 2022-02-03 US US17/592,423 patent/US11869525B2/en active Active
- 2022-12-08 JP JP2022196100A patent/JP7509859B2/ja active Active
-
2023
- 2023-06-22 US US18/339,915 patent/US12033648B2/en active Active
- 2023-12-12 US US18/537,655 patent/US12165665B2/en active Active
-
2024
- 2024-06-20 JP JP2024099693A patent/JP7736866B2/ja active Active
- 2024-11-06 US US18/939,370 patent/US20250078850A1/en active Pending
-
2025
- 2025-08-28 JP JP2025141900A patent/JP2025186274A/ja active Pending
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES3052673T3 (en) | Method and apparatus for processing an audio signal, computer readable medium, audio decoder and audio encoder | |
| HK40115863B (en) | Method and apparatus for processing an audio signal, computer readable medium, audio decoder and audio encoder | |
| HK40098015B (en) | Method and apparatus for processing an audio signal, computer readable medium and audio decoder | |
| HK40098015A (en) | Method and apparatus for processing an audio signal, computer readable medium and audio decoder | |
| HK40076902B (en) | Method and apparatus for processing an audio signal, audio decoder and audio encoder | |
| HK1259289B (en) | Methods for encoding and decoding an audio signal, audio decoder and audio encoder | |
| HK1236275B (en) | Method and apparatus for processing an audio signal, audio decoder, and audio encoder | |
| HK1236275A1 (en) | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |