ES2967262T3 - Aparato y procesador de señal de audio, para proporcionar una representación de la señal de audio procesada, decodificador de audio, codificador de audio, procedimientos y programas informáticos - Google Patents

Aparato y procesador de señal de audio, para proporcionar una representación de la señal de audio procesada, decodificador de audio, codificador de audio, procedimientos y programas informáticos Download PDF

Info

Publication number
ES2967262T3
ES2967262T3 ES19795246T ES19795246T ES2967262T3 ES 2967262 T3 ES2967262 T3 ES 2967262T3 ES 19795246 T ES19795246 T ES 19795246T ES 19795246 T ES19795246 T ES 19795246T ES 2967262 T3 ES2967262 T3 ES 2967262T3
Authority
ES
Spain
Prior art keywords
audio signal
representation
processed
input audio
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19795246T
Other languages
English (en)
Inventor
Stefan Bayer
Pallavi Maben
Emmanuel Ravelli
Guillaume Fuchs
Eleni Fotopoulou
Markus Multrus
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2967262T3 publication Critical patent/ES2967262T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Circuits Of Receivers In General (AREA)
  • Amplifiers (AREA)

Abstract

Un aparato para proporcionar una representación de señal de audio procesada sobre la base de la representación de la señal de audio de entrada configurado para aplicar una ventana, con el fin de proporcionar la representación de la señal de audio procesada sobre la base de la representación de la señal de audio de entrada. El aparato está configurado para adaptar la apertura de ventanas dependiendo de una o más características de la señal y/o dependiendo de uno o más parámetros de procesamiento usados para proporcionar la representación de la señal de audio de entrada. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Aparato y procesador de señal de audio, para proporcionar una representación de la señal de audio procesada, decodificador de audio, codificador de audio, procedimientos y programas informáticos
Campo técnico
[0001] Realizaciones según la invención relacionadas con un aparato y un procesador de señal de audio, para proporcionar una representación de la señal de audio procesada, un decodificador de audio, un codificador de audio, procedimientos y programas informáticos.
Observaciones introductorias
[0002] A continuación se describirán diferentes realizaciones inventivas y aspectos. Además, mediante las reivindicaciones adjuntas se definirán realizaciones adicionales.
[0003] Cabe destacar que cualquiera de las realizaciones definidas por las reivindicaciones se puede suplementar con cualquiera de los detalles (características y funcionalidades) descritas en las realizaciones y aspectos mencionados.
[0004] Además, las realizaciones descritas en esta invención se pueden usar individualmente, y también se pueden suplementar con cualquiera de las características incluidas en las reivindicaciones.
[0005] Además, cabe destacar que los aspectos individuales descritos en esta invención se pueden usar individualmente o en combinación. Por lo tanto, se pueden añadir detalles a cada uno de dichos aspectos individuales sin añadir detalles a otro de dichos aspectos.
[0006] También cabe destacar que la presente descripción describe, explícita o implícitamente, características utilizables en un codificador de audio (aparato y/o procesador de señal de audio para proporcionar una representación de la señal de audio procesada) y en un decodificador de audio. Por lo tanto, cualquiera de las características descritas en esta invención se puede usar en el contexto de un codificador de audio y en el contexto de un decodificador de audio.
[0007] Además, las características y funcionalidades descritas en esta invención relacionadas con un procedimiento también se pueden utilizar en un aparato (configurado para llevar a cabo dicha funcionalidad). Asimismo, cualquiera de las características y funcionalidades descritas en esta invención con respecto a un aparato también se pueden emplear en un procedimiento correspondiente. En otras palabras, los procedimientos descritos en esta invención se pueden suplementar con cualquiera de las características y funcionalidades descritas con respecto a los aparatos.
[0008] Además, cualquiera de las características y funcionalidades descritas en esta invención se pueden implementar en hardware o en software, usando una combinación de hardware y software, como se describirá en la sección "alternativas de implementación".
Antecedentes de la invención
[0009] El procesamiento de señales de tiempo discreto usando la DFT (Discrete Fourier Transform -Transformada Discreta de Fourier) es una estrategia ampliamente difundida para el procesamiento de señales digitales, en primer lugar debido a posibles ahorros de complejidad debido a las implementaciones eficientes de la DFT o de la FFT (Fast Fourier Transform - Transformada Rápida de Fourier) y en segundo lugar por la representación de la señal en el dominio de la frecuencia después de la DFT lo que permite el procesamiento más fácil en función de la frecuencia de la señal de tiempo. Si la señal procesada se transforma de nuevo al dominio del tiempo generalmente para evitar las consecuencias de la propiedad de convolución circular de la DFT, las partes solapadas de la señal de tiempo se transforman y para asegurar una buena reconstrucción después del procesamiento los segmentos individuales (tramas) se forman en ventanas antes y/o después la cadena DFT directa/procesamiento/DFT inversa y las partes solapadas añadidas para formar la señal de tiempo procesada. Este enfoque se muestra, por ejemplo, en la Fig. 6.
[0010] Los sistemas con bajo retardo comunes usan la eliminación de ventanas para generar la aproximación de una señal de tiempo discreto sin la disponibilidad de una trama siguiente para adición por solapamiento simplemente al eliminar ventanas al dividir la porción derecha formada en ventanas de una trama procesada con un banco de filtros DFT por la ventana aplicada antes de la DFT directa en la cadena de procesamiento, por ejemplo, WO 2017/161315 A1. En la Fig. 7 se muestra el ejemplo de una trama formada en ventanas de una señal en el dominio del tiempo antes de la DFT directa y la forma de ventana correspondiente aplicada.
yr [n] = y , n < n s
yr \n] =y [ ? l,n 6 [ns; n e ],
wa [n]
dondenses el índice de la primera muestra de la región de solapamiento con la trama siguiente aún no disponible ynees el índice de la última muestra de la región de solapamiento con la trama siguiente ywaes la ventana aplicada a la trama actual de la señal antes de la DFT directa.
[0011] Según el procesamiento y la ventana empleada, no está garantizado que se preserve la forma de la envolvente de la ventana de análisis y especialmente hacia el extremo de la ventana las muestras de ventanas tienen valores cercanos a cero, y por lo tanto, las muestras procesadas se multiplican por valores >> 1 que pueden llevar a grandes desvíos en las últimas muestras de las señales no formadas en ventanas en comparación con la señal producida mediante OLA (adición por solapamiento) con una trama siguiente. En la Fig. 8 se muestra un ejemplo de desajuste entre aproximación con eliminación de ventana estática y OLA con una trama siguiente tras el procesamiento en el dominio DFT y la DFT inversa.
[0012] Estos desvíos podrían llevar a degradaciones comparadas con una OLA con la trama siguiente si la aproximación de la señal no formada en ventanas se emplea en una etapa adicional de procesamiento, por ejemplo, cuando se usa la porción de señal aproximada en un análisis LPC (Linear Prediction Coding - Codificación por Predicción Lineal). En la Fig. 9 se muestra un ejemplo de análisis LPC realizado en la porción de la señal aproximada del ejemplo previo.
[0013] El documento “Time-varying transform for high quality audio communication codecs” (Transformada variable en el tiempo para códecs de comunicación de audio de alta calidad) por Pierrick Philippe y col., publicado en la convención AES 124, describe una transición directa entre dos tamaños de MDCT (transformada por coseno discreta modificada) sin ventanas de transición, en el que la transformada inversa va seguida de una operación post procesamiento que elimina el componente de solapamiento para conseguir la reconstrucción perfecta.
[0014] El documento US2012/0022880A1 describe una cancelación de solapamiento por dominio de tiempo hacia delante utilizando el filtrado predictivo lineal para una señal de audio en una primera trama codificada por transformada, en el que el solapamiento de dominio de tiempo está causado por una transición entre la primera trama codificada por transformada utilizando un primer modo de codificación con ventana de superposición y una segunda trama utilizando un segundo modo de codificación con ventana de no superposición.
[0015] Por lo tanto, se desea obtener un concepto que proporcione un equilibrio mejorado entre integridad de la señal, complejidad y retardo que pueda emplearse cuando se reconstruye la representación de una señal en el dominio del tiempo sobre la base de la representación en el dominio de la frecuencia sin realizar una adición por solapamiento.
[0016] Esto se logra mediante la materia de las reivindicaciones independientes de la presente solicitud.
[0017] Mediante la materia de las reivindicaciones dependientes de la presente solicitud se definen realizaciones adicionales según la invención.
Resumen de la invención
[0018] Una realización según esta invención está relacionada con un aparato para proporcionar una representación de la señal de audio procesada sobre la base de la representación de la señal de audio de entrada según la reivindicación 1. Según una realización, la provisión de la representación de la señal de audio de entrada puede realizarse, por ejemplo, mediante un dispositivo o unidad de procesamiento diferente. La única o las varias características de la señal son, por ejemplo, características de la representación de la señal de audio de entrada o de una representación intermedia a partir de la cual se deriva la representación de la señal de audio de entrada. Según una realización, la única o las varias características de la señal comprenden, por ejemplo, un componente DC (Direct Current - Corriente Continua) d. El único o los varios parámetros de procesamiento pueden comprender, por ejemplo, parámetros usados para una generación de ventanas de análisis, una transformada de frecuencia directa, un procesamiento en el dominio de la frecuencia y/o una transformada tiempo-frecuencia inversa de la representación de la señal de audio de entrada o de una representación intermedia a partir de la cual se deriva la representación de la señal de audio de entrada.
[0019] Esta realización se basa en la idea de que se puede lograr una representación de la señal de audio procesada muy precisa al adaptar la eliminación de ventanas en función de las características de la señal y/o los parámetros de procesamiento usados para la provisión de la representación de la señal de audio de entrada. Con la dependencia de las características de la señal y los parámetros de procesamiento, es posible adaptar la eliminación de ventanas según el procesamiento individual usado para la provisión de la representación de la señal de audio de entrada. Asimismo, con la adaptación de la eliminación de ventanas, la representación de la señal de audio procesada proporcionada puede representar una aproximación mejorada de una señal procesada y con adición por solapamiento real, sobre la base de la representación de la señal de audio de entrada, por ejemplo, al menos en un área de una parte solapada derecha, es decir, en una porción del extremo de la representación de la señal de audio procesada proporcionada, cuando aún no está disponible ninguna trama a continuación. Por ejemplo, usando este concepto, es posible adaptar la eliminación de ventanas para así reducir una degradación no deseada de una envolvente de la señal en una región del tiempo cuando la eliminación de ventanas provoca un pronunciado escalamiento ascendente (por ejemplo, por un factor mayor que 5 o mayor que 10).
[0020]Según una realización, el aparato está configurado para adaptar la eliminación de ventanas en función de los parámetros de procesamiento determinando un procesamiento usado para derivar la representación de la señal de audio de entrada. Los parámetros de procesamiento determinan, por ejemplo, el procesamiento de una unidad de procesamiento o trama actual, y/o el procesamiento de una o varias unidades de procesamiento previo o tramas. Según una realización, el procesamiento determinado por los parámetros de procesamiento comprende una generación de ventanas de análisis, una transformada de frecuencia directa, un procesamiento en el dominio de la frecuencia y/o una transformada tiempo-frecuencia inversa de la representación de la señal de audio de entrada o de una representación intermedia a partir de la cual se deriva la representación de la señal de audio de entrada. La lista de los procedimientos de procesamiento usados para la provisión de la señal de audio de entrada no es exhaustiva y queda claro que se pueden usar más procedimientos de procesamiento diferentes. La invención no está limitada a la lista de procedimientos de procesamiento propuestos en esta invención. Esta influencia del procesamiento en la eliminación de ventanas puede dar como resultado un aumento en la exactitud de la representación de la señal de audio procesada proporcionada.
[0021]Según una realización, el aparato está configurado para adaptar la eliminación de ventanas en función de las características de la señal de la representación de la señal de audio de entrada y/o de una representación de señal intermedia a partir de la cual se deriva la representación de la señal de audio de entrada. Las características de la señal se pueden representar mediante parámetros. La representación de la señal de audio de entrada es, por ejemplo, una señal en el dominio del tiempo de una unidad de procesamiento o trama actual, por ejemplo, después de un procesamiento en un dominio de la frecuencia y una conversión del dominio de la frecuencia al dominio del tiempo. La representación de la señal intermedia es, por ejemplo, una representación en el dominio de la frecuencia procesada a partir de la cual se deriva la representación de la señal de audio de entrada usando una conversión del dominio de la frecuencia al dominio del tiempo. La conversión del dominio de la frecuencia al dominio del tiempo se puede realizar opcionalmente en esta realización y/o en una de las siguientes realizaciones usando una cancelación del efecto aliasing o no usando una cancelación del efecto aliasing (por ejemplo, usando una transformada inversa que es una transformada solapada que puede comprender características de cancelación del efecto aliasing al realizar una adición por solapamiento, como, por ejemplo, una transformada MDCT (Modified Discrete Cosine Transform -Transformada Discreta de Coseno Modificada)). Según una realización, la diferencia entre los parámetros de procesamiento y las características de la señal es que los parámetros de procesamiento determinan, por ejemplo, un procesamiento, como una generación de ventanas de análisis, una transformada de frecuencia directa, un procesamiento en el dominio espectral, una transformada tiempo-frecuencia inversa, etc., y las características de la señal determinan, por ejemplo, la representación de una señal, tal como un desplazamiento, una amplitud, una fase, etc. Las características de la señal de la representación de la señal de audio de entrada y/o de la representación de la señal intermedia pueden resultar en una adaptación de la eliminación de ventanas de tal forma que no sea necesaria la adición por solapamiento con una trama siguiente para proporcionar la representación de la señal de audio procesada. Según una realización, el aparato está configurado para aplicar la eliminación de ventanas a la representación de la señal de audio de entrada para proporcionar la representación de la señal de audio procesada proporcionada, donde por ejemplo, resulta ventajoso adaptar la eliminación de ventanas en función de las características de la señal de la representación de la señal de audio de entrada, para reducir un desvío entre la representación de la señal de audio procesada proporcionada y una representación de señal de audio que se obtendría usando una adición por solapamiento con una trama siguiente. Adicional o alternativamente, la consideración de las características de la señal de la representación de la señal intermedia puede además mejorar la eliminación de ventanas, de forma tal que, por ejemplo, el desvío se reduce considerablemente. Por ejemplo, se pueden considerar características de la señal que indican problemas potenciales de una eliminación de ventanas convencional, como, por ejemplo, características de la señal que indican un desplazamiento DC o una convergencia a cero lenta o insuficiente en un extremo de una unidad de procesamiento.
[0022]Según una realización, el aparato está configurado para obtener uno o más parámetros que describen características de la señal de una representación en el dominio del tiempo de una señal, a la cual se le aplica la eliminación de ventanas. La representación en el dominio del tiempo representa, por ejemplo, una señal original a partir de la cual se deriva la representación de la señal de audio de entrada o una señal intermedia, tras una conversión del dominio de la frecuencia al dominio del tiempo, lo cual representa la representación de la señal de audio de entrada o a partir de la cual deriva la representación de la señal de audio de entrada. La señal, a la que se aplica la eliminación de ventanas es, por ejemplo, la representación de la señal de audio de entrada o una señal en el dominio del tiempo de una unidad de procesamiento o trama actual, por ejemplo, después de un procesamiento en un dominio de la frecuencia y una conversión del dominio de la frecuencia al dominio del tiempo. Según una realización, el único o los varios parámetros describen características de la señal, por ejemplo, de la representación de la señal de audio de entrada o una señal en el dominio del tiempo de una unidad de procesamiento o trama actual, por ejemplo, después de un procesamiento en un dominio de la frecuencia y una conversión del dominio de la frecuencia al dominio del tiempo. Adicional o alternativamente, el aparato está configurado para obtener uno o varios parámetros que describen características de la señal de una representación en el dominio de la frecuencia de una señal intermedia a partir de la cual se deriva una señal de audio de entrada en el dominio del tiempo, a la cual se aplica la eliminación de ventanas. La señal de audio de entrada en el dominio del tiempo representa, por ejemplo, la representación de la señal de audio de entrada. El aparato puede estar configurado para adaptar la eliminación de ventanas en función de uno o varios parámetros descritos anteriormente. La señal intermedia es, por ejemplo, una señal que se va a procesar para determinar la señal descrita anteriormente y la representación de la señal de audio de entrada. La representación en el dominio del tiempo y la representación en el dominio de la frecuencia representan, por ejemplo, la representación de la señal de audio de entrada en etapas importantes del procesamiento, que pueden tener influencia positiva sobre la eliminación de ventanas para minimizar defectos (o errores) en la representación de la señal de audio procesada sobre la base del abandono de un procesamiento con adición por solapamiento para proporcionar la representación de la señal de audio procesada. Por ejemplo, los parámetros que describen características de la señal pueden indicar cuándo la aplicación de una eliminación de ventanas original (no adaptada) resultaría (o es probable que resulte) en error. Así, la adaptación de la eliminación de ventanas (por ejemplo, para derivar a partir de una eliminación de ventanas convencional) se puede controlar eficientemente sobre la base de dichos parámetros.
[0023]Según la invención, el aparato está configurado para adaptar la eliminación de ventanas para revertir al menos parcialmente una generación de ventanas de análisis usada para la provisión de la representación de la señal de audio de entrada. La generación de ventanas de análisis se aplica, por ejemplo, a una primera señal para obtener una señal intermedia que, por ejemplo, se procesa ulteriormente para la provisión de la representación de la señal de audio de entrada. Así, la representación de la señal de audio procesada proporcionada por el aparato mediante la aplicación de la eliminación de ventanas adaptada representa al menos parcialmente la primera señal en una forma procesada. Así, se puede realizar un procesamiento con bajo retardo muy preciso y mejorado de la primera señal mediante la adaptación de la eliminación de ventanas.
[0024]Según una realización, el aparato está configurado para adaptar la eliminación de ventanas para compensar al menos parcialmente la falta de valores de la señal de una unidad de procesamiento subsiguiente, por ejemplo, una trama subsiguiente o una trama a continuación. Por lo tanto, no existe la necesidad de una adición por solapamiento con una trama a continuación para obtener una señal de tiempo, por ejemplo, la representación de la señal de audio procesada, que es una buena aproximación de la señal completamente procesada que se obtendría usando una adición por solapamiento con una trama a continuación. Esto lleva a un retardo más bajo para un sistema de procesamiento de señales donde una señal de tiempo se procesa ulteriormente tras un procesamiento usando un banco de filtros, dado que se puede omitir la adición por solapamiento. Así, con esta característica, no es necesario ya procesar la unidad de procesamiento subsiguiente para proporcionar la representación de la señal de audio procesada.
[0025]Según una realización, la eliminación de ventanas está configurada para proporcionar una unidad de procesamiento dada, por ejemplo, un segmento de tiempo, una trama o un segmento de tiempo actual, de la representación de la señal de audio procesada antes de que una unidad de procesamiento subsiguiente, la cual al menos temporalmente de manera parcial se solapa con la unidad de procesamiento dada, esté disponible. La representación de la señal de audio procesada puede comprender una pluralidad de unidades de procesamiento previo, por ejemplo, cronológicamente antes de la unidad de procesamiento dada, por ejemplo, un segmento de tiempo procesado actualmente, y una pluralidad de unidades de procesamiento subsiguientes, por ejemplo, cronológicamente después de la unidad de procesamiento dada y la representación de la señal de audio de entrada, sobre la cual se basa la provisión de la representación de la señal de audio procesada, representa, por ejemplo, una señal de tiempo con una pluralidad de segmentos de tiempo. Alternativamente, la representación de la señal de audio procesada representa una señal de tiempo procesada en la unidad de procesamiento dada y la representación de la señal de audio de entrada, sobre la cual se basa la provisión de la representación de la señal de audio procesada, representa, por ejemplo, una señal de tiempo en la unidad de procesamiento dada. Para recibir una señal de tiempo procesada en la unidad de procesamiento dada se aplica, por ejemplo, una generación de ventanas a la representación de la señal de audio de entrada o a una primera señal de tiempo que se va a procesar para la provisión de la representación de la señal de audio de entrada, luego se puede aplicar un procesamiento a la señal, por ejemplo, una señal intermedia, del segmento de tiempo actual, o la unidad de procesamiento dada, y tras el procesamiento, se aplica la eliminación de ventanas, donde, por ejemplo, un segmento de solapamiento de la unidad de procesamiento dada con una unidad de procesamiento previo se suma mediante una adición por solapamiento pero no se suma ningún segmento de solapamiento de la unidad de procesamiento dada con una unidad de procesamiento subsiguiente mediante una adición por solapamiento. La unidad de procesamiento dada puede comprender segmentos de solapamiento con una unidad de procesamiento previo y la unidad de procesamiento subsiguiente. Así, la eliminación de ventanas se adapta, por ejemplo, de tal forma que segmentos de solapamiento temporal de la unidad de procesamiento dada con la unidad de procesamiento subsiguiente se pueden aproximar mediante una eliminación de ventanas muy precisa (sin realizar una adición por solapamiento). Así, la representación de la señal de audio se puede procesar con retardo reducido debido a que solo la unidad de procesamiento dada y una unidad de procesamiento previo, por ejemplo, se consideran, sin incluir la unidad de procesamiento subsiguiente.
[0026]Según una realización, el aparato está configurado para adaptar la eliminación de ventanas para limitar un desvío entre la representación de la señal de audio procesada dada y el resultado de una adición por solapamiento entre unidades de procesamiento subsiguientes de la representación de la señal de audio de entrada o, por ejemplo, de una representación de la señal de audio de entrada procesada. En este caso, especialmente un desvío entre la representación de la señal de audio procesada dada y un resultado de una adición por solapamiento entre una unidad de procesamiento dada, una unidad de procesamiento previo y una unidad de procesamiento subsiguiente de la representación de la señal de audio de entrada está limitado, por ejemplo, por la eliminación de ventanas. La unidad de procesamiento previo es conocida, por ejemplo, por el aparato, por lo cual la eliminación de ventanas de la unidad de procesamiento dada se puede adaptar para aproximar, por ejemplo, un segmento de tiempo de solapamiento temporal de la unidad de procesamiento dada con una unidad de procesamiento subsiguiente (sin realizar realmente una adición por solapamiento), para limitar el desvío. Con esta adaptación de la eliminación de ventanas, se logra, por ejemplo, una desviación muy pequeña, con lo cual el aparato es muy preciso para proporcionar la representación de la señal de audio procesada sin el procesamiento (ni la adición por solapamiento) de una unidad de procesamiento subsiguiente.
[0027]Una realización según esta invención se refiere a un aparato para proporcionar una representación de señal de audio procesada sobre la base de la representación de señal de audio de entrada según la reivindicación 29.
[0028]Según una realización, el aparato está configurado para adaptar la eliminación de ventanas a valores límite de la representación de la señal de audio procesada. La eliminación de ventanas, por ejemplo, se adapta de tal forma que los valores están, por ejemplo, limitados al menos en una porción final de una unidad de procesamiento, por ejemplo, de una unidad de procesamiento dada, de la representación de la señal de audio de entrada. El aparato está configurado, por ejemplo, para usar valores de ponderación para realizar una no ponderación (o eliminación de ventanas) que son menores que los inversos multiplicativos para valores correspondientes de una generación de ventanas de análisis usada para la provisión de la representación de la señal de audio de entrada, por ejemplo, al menos para escalar una porción final de una unidad de procesamiento de la representación de la señal de audio de entrada. Si, por ejemplo, la porción final de la unidad de procesamiento de la representación de la señal de audio de entrada no tiende (o converge) suficientemente hacia cero, una eliminación de ventanas sin una adaptación con una limitación de los valores puede resultar en demasiada amplificación de los valores de la porción final de la representación de la señal de audio procesada. La limitación de los valores puede resultar (por ejemplo, mediante el uso de valores de ponderación "reducidos") en una provisión muy exacta de la representación de la señal de audio procesada debido a que se pueden evitar los grandes desvíos causados por la amplificación, causados por una inapropiada eliminación de ventanas.
[0029]Según una realización, el aparato está configurado para adaptar la eliminación de ventanas de tal forma que para una representación de la señal de audio de entrada que no converge, por ejemplo, de modo uniforme, hacia cero en una porción final de una unidad de procesamiento de la señal de audio de entrada, un escalamiento que se aplica mediante la eliminación de ventanas en la porción final de la unidad de procesamiento se reduce en comparación con un caso en el cual la representación de la señal de audio de entrada, converge, por ejemplo, de manera uniforme, hacia cero en la porción final de la unidad de procesamiento. Por ejemplo, con el escalamiento, se amplifican los valores en la porción final de la unidad de procesamiento de la señal de audio de entrada. Para evitar una amplificación demasiado grande de los valores en la porción final de la unidad de procesamiento de la señal de audio de entrada, el escalamiento aplicado mediante la eliminación de ventanas en la porción final de la unidad de procesamiento se reduce cuando la representación de la señal de audio de entrada no converge hacia cero.
[0030]Según una realización, el aparato está configurado para adaptar la eliminación de ventanas, para así limitar un intervalo dinámico de la representación de la señal de audio procesada. La eliminación de ventanas se adapta, por ejemplo, de forma tal que el intervalo dinámico está limitado al menos en una porción final de una unidad de procesamiento de la representación de la señal de audio de entrada, o selectivamente en la porción final de la unidad de procesamiento de la representación de la señal de audio de entrada, por lo cual también se limita el intervalo dinámico de la representación de la señal de audio procesada. La eliminación de ventanas se adapta, por ejemplo, de forma tal que una gran amplificación provocada por una eliminación de ventanas sin una adaptación, se reduce para limitar el intervalo dinámico de la representación de la señal de audio procesada. Por lo tanto, se puede lograr una desviación muy pequeña o casi nula entre la representación de la señal de audio procesada dada y el resultado de una adición por solapamiento entre las unidades de procesamiento subsiguientes de la representación de la señal de audio de entrada, donde la representación de la señal de audio de entrada representa, por ejemplo, una señal en el dominio del tiempo después de un procesamiento en el dominio espectral y una conversión del dominio espectral al dominio en el tiempo.
[0031]Según una realización, el aparato está configurado para adaptar la eliminación de ventanas en función de un componente DC, por ejemplo, un desplazamiento, de la representación de la señal de audio de entrada. Según una realización, un procesamiento de representación de una primera señal o una señal intermedia para proporcionar la representación de la señal de audio de entrada puede añadir el desplazamiento DC d a una trama procesada de la primera señal o la señal intermedia, donde la trama procesada representa, por ejemplo, la representación de la señal de audio de entrada. Con este componente DC, la representación de la señal de audio de entrada, por ejemplo, no converge suficientemente hacia cero, por lo cual se puede producir un error en la eliminación de ventanas. Con la adaptación de la eliminación de ventanas en función de un componente DC, este error se puede minimizar.
[0032] Según una realización, el aparato está configurado para al menos parcialmente eliminar un componente DC, por ejemplo, un desplazamiento, por ejemplo, d, de la representación de la señal de audio de entrada. Según una realización, el componente DC se elimina antes de aplicar (o justo antes de aplicar) un escalamiento que revierta una generación de ventanas, por ejemplo, antes de la división por un valor de ventana. El componente DC se elimina, por ejemplo, selectivamente en la región de solapamiento con una unidad de procesamiento o trama subsiguiente. En otras palabras, el componente DC es al menos parcialmente removido en una porción final de la representación de la señal de audio de entrada. Según una realización el componente DC solo se elimina en la porción final de la representación de la señal de audio de entrada. Esto se basa, por ejemplo, en la idea de que solo en la porción final la falta de una unidad de procesamiento subsiguiente (para realizar una adición por solapamiento) da por resultado un error en la representación de la señal de audio procesada provocado por la eliminación de ventanas, lo cual se puede minimizar eliminando el componente DC en la porción final. Así, se elimina al menos parcialmente un factor que influye en la eliminación de ventanas, para mejorar la precisión del aparato.
[0033] Según una realización, la eliminación de ventanas está configurada para escalar una versión con eliminación de DC o reducción de DC de una representación de la señal de audio de entrada en función de un valor de ventana (o valores de ventana) con el fin de obtener la representación de la señal de audio procesada. Es valor de la ventana, por ejemplo, es un valor de una función ventana que representa una generación de ventanas de una primera señal o una señal intermedia, usado para la provisión de la representación de la señal de audio de entrada. Por lo tanto, los valores de ventana pueden comprender valores, por ejemplo, para todos tiempos de la trama de tiempo actual de la representación de la señal de audio de entrada, los cuales se multiplicaron, por ejemplo, por la primera señal o la señal intermedia para proporcionar la representación de la señal de audio de entrada. Por lo tanto, el escalamiento de la versión con eliminación de DC o reducción de DC de la representación de la señal de audio de entrada se puede realizar en función de una función ventana o valor de ventana, por ejemplo, dividiendo la versión con eliminación de DC o reducción de DC de una representación de la señal de audio de entrada por el valor de ventana o por valores de la función ventana. Así, la eliminación de ventanas deshace la formación de ventanas aplicada a la primera señal o la señal intermedia para una provisión de la representación de la señal de audio de entrada muy eficazmente. Debido al uso de la versión con eliminación de DC o reducción de DC, la eliminación de ventanas resulta en un desvío pequeño o casi nulo de la representación de la señal de audio procesada a partir del resultado de una adición por solapamiento entre unidades de procesamiento subsiguientes de la representación de la señal de audio de entrada.
[0034] Según una realización, la eliminación de ventanas está configurada para volver a introducir al menos parcialmente un componente DC, por ejemplo, un desplazamiento, tras un escalamiento de una versión con eliminación de DC o reducción de DC de una representación de la señal de audio de entrada. El escalamiento puede estar basado en el valor de la ventana, como se explicó anteriormente. En otras palabras, el escalamiento puede representar una eliminación de ventanas realizada por el aparato. Con la re-introducción del componente DC, se puede proporcionar mediante la eliminación de ventanas una representación de la señal de audio procesada muy exacta. Esto se basa en la idea de que es más eficiente y preciso escalar primero una versión con eliminación de DC o reducción de DC de la señal de audio de entrada sobre la base de una generación de ventanas empleada para la provisión de la señal de audio de entrada antes de volver a introducir el componente DC, debido a que el escalamiento de una versión de la señal de audio de entrada con el componente DC puede resultar en una gran amplificación de la señal de audio de entrada y así en una elevada falta de precisión de una provisión de la representación de la señal de audio procesada mediante la eliminación de ventanas.
[0035] Según una realización, la eliminación de ventanas está configurada para determinar la representación de la señal de audio procesada y r[n] sobre la base de la representación de la señal de audio de entrada y[n] según yr [n ] = ---------- d ,n 6 [ns; n ej, donde d es un componente DC. Alternativamente, el valor d puede representarw a \V-]
un desplazamiento DC, por ejemplo, como se explicó anteriormente. El componente DC d representa, por ejemplo, un desplazamiento DC en una unidad de procesamiento o trama actual de la representación de la señal de audio de entrada, o en una porción de esta, tal como una porción final. El valor n es un índice de tiempo donde ns es un índice de tiempo de una primera muestra de una región de solapamiento, por ejemplo, entre una unidad de procesamiento o trama actual y una unidad de procesamiento o trama subsiguiente y el valor ne es un índice de tiempo de una última muestra de la región de solapamiento. El valor de la función wa[n] es una ventana de análisis usada para una provisión de la representación de la señal de audio de entrada, por ejemplo, en una trama de tiempo entre ns y ne. Según una realización, la ventana de análisis wa[n] representa un valor de ventana según se describió anteriormente. Así, según la ecuación introducida, el componente DC se elimina de la representación de la señal de audio de entrada y esta versión de la representación de la señal de audio de entrada se escala mediante la ventana de análisis y luego, se vuelve a introducir el componente DC mediante una adición. Por lo tanto, la eliminación de ventanas se adapta al componente DC para minimizar errores en una provisión de la representación de la señal de audio procesada. Según una realización, el aparato está configurado para realizar la eliminación de ventanas según la ecuación mencionada anteriormente solo en la porción final de una unidad de procesamiento actual, es decir. una unidad de procesamiento dada, y para realizar una eliminación de ventanas diferente, por ejemplo, una eliminación de ventanas común como una eliminación de ventanas estática o una eliminación de ventanas adaptativa, y posiblemente una funcionalidad de adición por solapamiento en el resto de las tramas de tiempo actuales.
[0036]Según una realización, el aparato está configurado para determinar el componente DC usando uno o varios valores de la representación de la señal de audio de entrada, por ejemplo, de la señal en el dominio del tiempo a la cual se le va a aplicar la eliminación de ventanas, la cual reside en una porción de tiempo en la cual una ventana de análisis usada en una provisión de la representación de la señal de audio de entrada comprende uno o varios valores cero. Estos valores cero pueden representar, por ejemplo, un relleno con ceros de la ventana de análisis usada en la provisión de la representación de la señal de audio de entrada. Una ventana de análisis completada con ceros se emplea, por ejemplo, en la provisión de la señal de audio de entrada, antes, por ejemplo, de realizar una conversión del dominio del tiempo al dominio de la frecuencia, un procesamiento en el dominio de la frecuencia y una conversión del dominio de la frecuencia al dominio del tiempo, lo cual proporciona la señal de audio de entrada. La conversión del dominio del tiempo al dominio de la frecuencia descrita y/o la conversión del dominio de la frecuencia al dominio del tiempo descrita se puede realizar opcionalmente en esta realización y/o en una de las realizaciones a continuación usando una cancelación del efecto aliasing o no usando una cancelación del efecto aliasing. Según una realización,se emplea como un valor aproximado del componente DC un valor de la representación de la señal de audio de entrada que reside en una porción de tiempo en la cual la ventana de análisis usada en la provisión de la representación de la señal de audio de entrada comprende un valor cero. Alternativamente, un promedio de una pluralidad de valores de la representación de la señal de audio de entrada que residen en la porción de tiempo en la cual la ventana de análisis usada en la provisión de la representación de la señal de audio de entrada comprende un valor cero se usa como el valor aproximado del componente DC. Así, el componente DC que resulta de la generación de ventanas y el procesamiento de una señal para proporcionar la señal de audio de entrada se puede determinar de una forma muy sencilla y eficaz y se puede usar para mejorar la eliminación de ventanas realizada por el aparato.
[0037]Según una realización, el aparato está configurado para obtener la representación de la señal de audio de entrada usando una conversión del dominio espectral al dominio del tiempo. La conversión del dominio espectral al dominio del tiempo también se puede entender como, por ejemplo, una conversión del dominio de la frecuencia al dominio del tiempo. Según una realización, el aparato está configurado para usar un banco de filtros como la conversión del dominio espectral al dominio del tiempo. Alternativamente, el aparato está configurado, por ejemplo, para usar una transformada de Fourier discreta inversa o una Transformada de coseno discreta inversa como la conversión del dominio espectral al dominio del tiempo. Así, el aparato está configurado para realizar un procesamiento de una señal intermedia para obtener la representación de la señal de audio de entrada. Según una realización, el aparato está configurado para usar parámetros de procesamiento relacionados con la conversión del dominio espectral al dominio del tiempo para la provisión de la representación de la señal de audio de entrada. Por lo tanto, los parámetros de procesamiento que influyen en la eliminación de ventanas realizada por el aparato se pueden determinar mediante el aparato con mucha rapidez y precisión dado que el aparato está configurado para realizar el procesamiento y no es necesario que el aparato reciba los parámetros de procesamiento desde un aparato diferente que realice el procesamiento para proporcionar la representación de la señal de audio de entrada al aparato de la invención.
[0038]Una realización según esta invención está relacionada con un procesador de señal de audio para proporcionar una representación de la señal de audio procesada sobre la base de una señal de audio que se va a procesar. El procesador de señal de audio está configurado para aplicar una formación de ventanas de análisis a una representación en el dominio del tiempo de una unidad de procesamiento, por ejemplo, una trama o un segmento de tiempo, de una señal de audio que se va a procesar, para obtener una versión formada en ventanas de la representación en el dominio del tiempo de la unidad de procesamiento de la señal de audio que se va a procesar. Asimismo, el procesador de señal de audio está configurado para obtener una representación en el dominio espectral, por ejemplo, una representación en el dominio de la frecuencia, de una señal de audio que se va a procesar sobre la base de la versión formada en ventanas. Así, por ejemplo, se usa una transformada de frecuencia directa, como por ejemplo, una DFT, para obtener la representación en el dominio espectral. Por ejemplo, la transformada de frecuencia se aplica a la versión formada en ventanas de la señal de audio que se va a procesar para obtener la representación en el dominio espectral. El procesador de señal de audio está configurado para aplicar un procesamiento en el dominio espectral, por ejemplo, un procesamiento en el dominio de la frecuencia, a la representación en el dominio espectral obtenida, para obtener una representación en el dominio espectral procesada. Sobre la base de la representación en el dominio espectral procesada, el procesador de señal de audio está configurado para obtener una representación en el dominio del tiempo procesada usando, por ejemplo, una transformada tiempo-frecuencia inversa. El procesador de señal de audio comprende un aparato como se describe en esta invención, donde el aparato está configurado para obtener la representación en el dominio del tiempo procesada como su representación de la señal de audio de entrada, y para proporcionar, sobre la base de esta, la representación de la señal de audio procesada y, por ejemplo, no formada en ventanas. Según una realización, el aparato está configurado para recibir el único o los varios parámetros de procesamiento usados para la adaptación de la eliminación de ventanas desde el procesador de señal de audio. Así, el único o los varios parámetros de procesamiento pueden comprender parámetros relacionados con la formación de ventanas de análisis realizada por el procesador de señal de audio, los parámetros de procesamiento relacionados, por ejemplo, con una transformada de frecuencia para obtener la representación en el dominio espectral de la señal de audio que se va a procesar, los parámetros relacionados con un procesamiento en el dominio espectral realizado mediante el procesador de señal de audio y/o parámetros relacionados con una transformada tiempo-frecuencia inversa para obtener la representación en el dominio del tiempo procesada mediante el procesador de señal de audio.
[0039]Según una realización, el aparato está configurado para adaptar la eliminación de ventanas usando valores de ventana de la formación de ventanas de análisis. Los valores de ventana representan, por ejemplo, parámetros de procesamiento. Los valores de ventana representan, por ejemplo, la formación de ventanas de análisis aplicada a la representación en el dominio de tiempo de la unidad de procesamiento.
[0040]Una realización está relacionada con un decodificador de audio para proporcionar una representación de audio decodificada sobre la base de una representación de audio codificada. El decodificador de audio está configurado para obtener una representación en el dominio espectral, por ejemplo, una representación en el dominio de la frecuencia, de una señal de audio codificada sobre la base de la representación de audio codificada. Asimismo, el decodificador de audio está configurado para obtener una representación en el dominio del tiempo de la señal de audio codificada sobre la base de la representación en el dominio espectral usando, por ejemplo, una conversión del dominio de la frecuencia al dominio del tiempo. El decodificador de audio comprende un aparato según una de las realizaciones descritas en esta invención, donde el aparato está configurado para obtener la representación en el dominio del tiempo como su representación de la señal de audio de entrada, y para proporcionar, sobre la base de esta, la representación de la señal de audio procesada y, por ejemplo, no formada en ventanas como la representación de audio decodificada.
[0041]Según una realización, el decodificador de audio está configurado para proporcionar, por ejemplo, la representación de la señal de audio completa de una unidad de procesamiento dada, por ejemplo, una trama o segmento de tiempo, antes de que una unidad de procesamiento subsiguiente, por ejemplo, una trama o segmento de tiempo, que se solapa temporalmente con la unidad de procesamiento dada, se decodifique. Así, con el decodificador de audio es posible decodificar solamente la unidad de procesamiento dada, sin la necesidad de decodificar unidades subsiguientes, es decir, unidades de procesamiento subsiguientes, de la representación de audio codificada. También se puede obtener un bajo retardo.
[0042]Una realización está relacionada con un codificador de audio para proporcionar una representación de audio codificada sobre la base de una representación de la señal de audio de entrada. El codificador de audio comprende un aparato según una de las realizaciones descritas en esta invención, donde el aparato está configurado para obtener una representación de la señal de audio procesada sobre la base de la representación de la señal de audio de entrada. El codificador de audio está configurado para codificar la representación de la señal de audio procesada. De este modo se propone un codificador ventajoso, que puede realizar la codificación con un retardo breve, debido a que una eliminación de ventanas mejorada, aplicada por el aparato, se emplea para codificar, por ejemplo, una unidad de procesamiento dada, ya sin procesar una unidad de procesamiento subsiguiente.
[0043]Según una realización el codificador de audio está configurado para obtener opcionalmente una representación en el dominio espectral sobre la base de la representación de la señal de audio procesada. La representación de la señal de audio procesada es, por ejemplo, una representación en el dominio del tiempo. El codificador de audio está configurado para codificar la representación en el dominio espectral y/o la representación en el dominio del tiempo, para obtener la representación de audio codificada. Así, por ejemplo, la eliminación de ventanas descrita en esta invención realizada por el aparato, puede resultar en una representación en el dominio del tiempo, y la codificación de la representación en el dominio del tiempo es ventajosa, dado que la representación codificada resulta en un retardo más breve que, por ejemplo, el de un codificador que usa una adición por solapamiento completa para proporcionar la representación de la señal de audio procesada. Según una realización, el codificador, por ejemplo, en un sistema es un codificador que conmuta entre el dominio del tiempo y el dominio de la frecuencia.
[0044]Según una realización, el aparato está configurado para realizar una mezcla en forma descendente de una pluralidad de señales de audio de entrada, que forman la representación de la señal de audio de entrada, en un dominio espectral, y para proporcionar una señal mezclada en forma descendente como la representación de la señal de audio procesada.
[0045]Una realización según la invención está relacionada con un procedimiento para proporcionar una representación de la señal de audio procesada sobre la base de la representación de la señal de audio de entrada según las reivindicaciones 25 y 30. La única o las varias características de la señal son, por ejemplo, de la representación de la señal de audio de entrada o de una representación intermedia a partir de la cual se deriva la representación de la señal de audio de entrada. Las características de la señal pueden comprender un componente DC d.
[0046]El procedimiento se basa en las mismas consideraciones que el aparato mencionado anteriormente. El procedimiento, opcionalmente, se puede suplementar con cualquiera de las características, funcionalidades y detalles descritos en esta invención también con respecto al aparato. Dichas características, funcionalidades y detalles se pueden usar tanto individualmente como combinados.
[0047]Una realización está relacionada con un procedimiento para proporcionar una representación de la señal de audio procesada sobre la base de una señal de audio que se va a procesar. El procedimiento comprende aplicar una generación de ventanas de análisis a una representación en el dominio del tiempo de una unidad de procesamiento, por ejemplo, una trama o un segmento de tiempo, de una señal de audio que se va a procesar, para obtener una versión formada en ventanas de la representación en el dominio del tiempo de la unidad de procesamiento de la señal de audio que se va a procesar. Asimismo, el procedimiento comprende obtener una representación en el dominio espectral, por ejemplo, una representación en el dominio de la frecuencia, de una señal de audio que se va a procesar sobre la base de la versión formada en ventanas. Según una realización, se usa una transformada de frecuencia directa, como por ejemplo, una DFT, para obtener la representación en el dominio espectral. La transformada de frecuencia, por ejemplo, se aplica a la versión formada en ventanas de la señal de audio que se va a procesar para obtener la representación en el dominio espectral. El procedimiento comprende aplicar un procesamiento en el dominio espectral, por ejemplo, un procesamiento en el dominio de la frecuencia, a la representación en el dominio espectral obtenida, para obtener una representación en el dominio espectral procesada. Asimismo, el procedimiento comprende obtener una representación en el dominio del tiempo procesada sobre la base de la representación en el dominio espectral procesada, por ejemplo, usando una transformada tiempo-frecuencia inversa, y proporcionar la representación de la señal de audio procesada usando un procedimiento descrito en esta invención, donde la representación en el dominio del tiempo procesada se usa como la señal de audio de entrada para llevar a cabo el procedimiento.
[0048]El procedimiento se basa en las mismas consideraciones que el procesador de señal de audio y/o el aparato mencionados anteriormente. El procedimiento, opcionalmente, se puede suplementar con cualquiera de las características, funcionalidades y detalles descritos en esta invención también con respecto al procesador de señal de audio y/o el aparato. Dichas características, funcionalidades y detalles se pueden usar tanto individualmente como en combinación.
[0049]Una realización según la invención está relacionada con un procedimiento para proporcionar una representación de audio decodificada sobre la base de una representación de audio codificada. El procedimiento comprende obtener una representación en el dominio espectral, por ejemplo, una representación en el dominio de la frecuencia, de una señal de audio codificada sobre la base de la representación de audio codificada. Asimismo, el procedimiento comprende obtener una representación en el dominio del tiempo de la señal de audio codificada sobre la base de la representación en el dominio espectral y proporcionar una representación de la señal de audio procesada usando un procedimiento descrito en esta invención, donde la representación en el dominio del tiempo se usa como la señal de audio de entrada para llevar a cabo el procedimiento, y donde la representación de la señal de audio procesada puede constituir la representación de audio decodificada.
[0050]El procedimiento se basa en las mismas consideraciones que el decodificador de audio y/o el aparato mencionados anteriormente. El procedimiento, opcionalmente, se puede suplementar con cualquiera de las características, funcionalidades y detalles descritos en esta invención también con respecto al decodificador de audio y/o el aparato. Dichas características, funcionalidades y detalles se pueden usar tanto individualmente como en combinación.
[0051]Una realización según la invención está relacionada con un programa informático que tiene un código de programa para realizar, cuando se ejecuta en un ordenador, un procedimiento descrito en esta invención.
Breve descripción de los dibujos
[0052]Los dibujos no están realizados necesariamente a escala, sino que el énfasis se ha puesto en representar los principios de la invención. En la descripción a continuación, se describen varias realizaciones de la invención con referencia a los siguientes dibujos, en los cuales:
La Fig. 1a muestra un diagrama de bloques esquemático de un aparato según una realización de la presente invención; La Fig. 1b muestra un diagrama esquemático de una generación de ventanas de una señal de audio para la provisión de una representación de la señal de audio de entrada, a la cual se le pueden eliminar las ventanas mediante un aparato, según una realización de la presente invención;
La Fig. 1c muestra un diagrama esquemático de una eliminación de ventanas, por ejemplo, una aproximación de señal, aplicada por un aparato según una realización de la presente invención;
La Fig. 1d muestra un diagrama esquemático de una eliminación de ventanas, por ejemplo, una reparación, aplicada por un aparato según una realización de la presente invención;
La Fig. 2 muestra un diagrama de bloques esquemático de un procesador de señal de audio según una realización de la presente invención;
La Fig. 3 muestra una vista esquemática de un decodificador de audio según una realización de la presente invención; La Fig. 4 muestra una vista esquemática de un codificador de audio según una realización de la presente invención; La Fig. 5a muestra un diagrama de flujo de un procedimiento para proporcionar una representación de la señal de audio procesada según una realización de la presente invención;
La Fig. 5b muestra un diagrama de flujo de un procedimiento para proporcionar una representación de la señal de audio procesada sobre la base de una señal de audio que se va a procesar según una realización de la presente invención;
La Fig. 5c muestra un diagrama de flujo de un procedimiento para proporcionar una representación decodificada de audio según una realización de la presente invención;
La Fig. 5d muestra un diagrama de flujo de un procedimiento para proporcionar una representación de audio codificada sobre la base de una representación de la señal de audio de entrada;
La Fig. 6 muestra un diagrama de flujo de un procesamiento común de una señal de audio;
La Fig. 7 muestra un ejemplo de una trama formada en ventanas de una señal en el dominio del tiempo antes de la DFT directa y la forma de ventana correspondiente aplicada;
La Fig. 8 muestra un ejemplo de desajuste entre aproximación con eliminación de ventana estática y OLA con una trama siguiente tras el procesamiento en el dominio DFT y la DFT inversa; y
La Fig. 9 muestra un ejemplo de análisis LPC realizado en la porción de la señal aproximada del ejemplo previo.Descripción detallada de las realizaciones
[0053]En la descripción a continuación los elementos iguales o equivalentes o los elementos con funcionalidades iguales o equivalentes se denotan mediante números de referencia iguales o equivalentes inclusive si aparecen en figuras diferentes.
[0054]En la descripción a continuación, se establece una pluralidad de detalles para proporcionar una explicación más minuciosa de las realizaciones de la presente invención. No obstante, se tornará evidente a los expertos en la técnica que las realizaciones de la presente invención se pueden llevar a la práctica sin estos detalles específicos. En otros casos, las estructuras y los dispositivos ampliamente conocidos se muestran en forma de diagrama de bloques en lugar de detalladamente con el fin de no dificultar la comprensión de la presente invención. Además, las características de las diferentes realizaciones descritas en esta invención se pueden combinar entre sí, a menos que se indique específicamente lo contrario.
[0055]La Fig. 1a muestra una vista esquemática de un aparato 100 para proporcionar una representación de la señal de audio procesada 110 sobre la base de una representación de la señal de audio de entrada 120. La representación de la señal de audio de entrada 120 puede ser proporcionada por un dispositivo opcional 200, donde el dispositivo 200 procesa una señal 122 para proporcionar la representación de la señal de audio de entrada 120. Según una realización, el dispositivo 200 puede realizar un entramado, una generación de ventanas de análisis, una transformada de frecuencia directa, un procesamiento en un dominio de la frecuencia y/o una transformada tiempofrecuencia inversa de la señal 122 para proporcionar la representación de la señal de audio de entrada 120.
[0054]Según una realización, el aparato 100 puede estar configurado para obtener la representación de la señal de audio de entrada 120 desde un dispositivo externo 200. Alternativamente, el dispositivo opcional 200 puede ser parte del aparato 100, donde la señal opcional 122 puede representar la representación de la señal de audio de entrada 120 o donde una señal procesada, sobre la base de la señal 122, proporcionada por el dispositivo 200 puede representar la representación de la señal de audio de entrada 120.
[0055]Según una realización, la representación de la señal de audio de entrada 120 representa una señal en el dominio del tiempo después de un procesamiento en un dominio espectral y una conversión del dominio espectral al dominio del tiempo.
[0056]El aparato 100 está configurado para aplicar una eliminación de ventanas 130, por ejemplo, una eliminación de ventanas adaptativa, para proporcionar la representación de la señal de audio procesada 110 sobre la base de la representación de la señal de audio de entrada 120. La eliminación de ventanas 130, por ejemplo, revierte al menos parcialmente la generación de ventanas de análisis usada para la provisión de la representación de la señal de audio de entrada 120. Alternativa o adicionalmente, el aparato está configurado, por ejemplo, para adaptar la eliminación de ventanas 130 para revertir al menos parcialmente la generación de ventanas de análisis usada para la provisión de la representación de la señal de audio de entrada 120. Así, por ejemplo, el dispositivo opcional 200 puede aplicar la generación de ventanas a la señal 122 para obtener la representación de la señal de audio de entrada 120, que puede revertirse mediante la eliminación de ventanas 130 (por ejemplo, al menos parcialmente).
[0057]El aparato 100 está configurado para adaptar la eliminación de ventanas 130 en función de una o más características de la señal 140 y/o en función de uno o más parámetros de procesamiento 150 usados para una provisión de la representación de la señal de audio de entrada 120. Según una realización, el aparato 100 está configurado para obtener la única o las varias características 140 de la representación de la señal de audio de entrada 120 y/o del dispositivo 200, donde el dispositivo 200 puede proporcionar una o varias características de la señal 140 de la señal opcional 122 y/o de señales intermedias obtenidas a partir de un procesamiento de la señal 122 para la provisión de la representación de la señal de audio de entrada 120. Así, el aparato 100 está configurado, por ejemplo, no solo para usar características de la señal 140 de la representación de la señal de audio de entrada 120 sino alternativamente o además también de las señales intermedias o de una señal original 122, de la cual se deriva, por ejemplo, la representación de la señal de audio de entrada 120. Las características de la señal 140, por ejemplo, pueden comprender amplitudes, fases, frecuencias, componentes DC, etc. de señales pertinentes a la representación de la señal de audio procesada 110. Según una realización, los parámetros de procesamiento 150 se pueden obtener del dispositivo opcional 200 mediante el aparato 100. Los parámetros de procesamiento, por ejemplo, definen configuraciones de procedimientos o etapas de procesamiento aplicados a las señales, por ejemplo, a la señal original 122 o a una o varias señales intermedias, para la provisión de la representación de la señal de audio de entrada 120. Así, los parámetros de procesamiento 150 pueden representar o definir un procesamiento experimentado por la representación de la señal de audio de entrada 120.
[0058]Según una realización, las características de la señal 140 pueden comprender uno o varios parámetros que describen características de la señal de una representación en el dominio del tiempo de una señal en el dominio del tiempo, es decir, la representación de la señal de audio de entrada 120, de una unidad de procesamiento o trama actual, por ejemplo, una unidad de procesamiento dada, donde la señal en el dominio del tiempo resulta, por ejemplo, después de un procesamiento en un dominio de la frecuencia y una conversión del dominio de la frecuencia al dominio del tiempo de una versión formada en ventanas y procesada de la señal 122. Adicional o alternativamente, las características de la señal 140 pueden comprender uno o varios parámetros que describen características de la señal de una representación en el dominio de la frecuencia de una señal intermedia, a partir de la cual se deriva una señal de audio de entrada en el dominio del tiempo, por ejemplo la representación de la señal de audio de entrada 120 a la cual se aplica la eliminación de ventanas.
[0059]Según una realización, las características de la señal 140 y/o los parámetros de procesamiento 150 como se describen en esta invención pueden ser usados por el aparato 100 para adaptar la eliminación de ventanas 130 según se describe en las realizaciones a continuación. Las características de la señal se pueden obtener, por ejemplo, usando un análisis de señal de la señal 120, o de cualquier señal a partir de la cual se deriva la señal 120.
[0060]Según una realización, el aparato 100 está configurado para adaptar la eliminación de ventanas 130 para compensar al menos parcialmente la falta de valores de la señal de una unidad de procesamiento subsiguiente, por ejemplo, una trama subsiguiente. La señal opcional 122, por ejemplo, está formada en ventanas mediante el dispositivo opcional 200 en unidades de procesamiento, donde se pueden eliminar las ventanas de una unidad de procesamiento dada mediante el aparato 100. Con una estrategia común, una unidad de procesamiento dada con eliminación de ventanas experimenta una adición por solapamiento con una unidad de procesamiento previa y una unidad de procesamiento subsiguiente. Con la adaptación propuesta en esta invención de eliminación de ventanas 130, la unidad de procesamiento subsiguiente no resulta necesaria debido a que la eliminación de ventanas 130 puede aproximar la representación de la señal de audio procesada 110, como si se realizara la adición por solapamiento con una trama subsiguiente sin llevar a cabo realmente una adición por solapamiento con la trama subsiguiente.
[0061]A continuación, con respecto a la Fig. 1b a la Fig. 1d se presenta una descripción más completa de las tramas, es decir, las unidades de procesamiento, y sus regiones solapadas para un aparato que se muestra en la Fig. 1a según una realización.
[0062]En la Fig. 1b se muestra la formación de ventanas de análisis, que se puede realizar mediante el dispositivo opcional 200 como una de las etapas para obtener la señal intermedia 123 según una realización de la presente invención. Según una realización, la señal intermedia 123 se puede procesar además mediante el dispositivo opcional 200 para proporcionar la representación de la señal de audio de entrada, como se muestra en la Fig. 1c y/o en la Fig. 1d.
[0063]La Fig. 1b es solo una vista esquemática para mostrar una versión formada en ventanas de una unidad de procesamiento previa 124m , una versión formada en ventanas de una unidad de procesamiento dada 124i y una versión formada en ventanas de una unidad de procesamiento subsiguiente 124i+1, donde el índice i representa un número natural que es al menos 2. Según una realización, la unidad de procesamiento previo 124m, la unidad de procesamiento dada 124i y la unidad de procesamiento subsiguiente 124i+1 se pueden lograr mediante una formación de ventanas 132 aplicada a una señal en el dominio del tiempo 122. Según una realización, la unidad de procesamiento dada 124i se puede solapar con la unidad de procesamiento previa 124<m>durante un período de fea t-i y se puede solapar con la unidad de procesamiento subsiguiente 124i+1 durante un período de t2 a t3. Está claro que la Fig. 1b es solo esquemática y que las señales después de la generación de ventanas de análisis puede lucir diferente a la que se muestra en la Fig. 1b. Cabe destacar que las unidades de procesamiento formadas en ventanas 124m a 124i+1 se pueden transformar al dominio de la frecuencia, procesar en el dominio de la frecuencia, y volver a transformar al dominio del tiempo. En la Fig. 1c se muestran la unidad de procesamiento previa 124<m>, la unidad de procesamiento dada 124i y la unidad de procesamiento subsiguiente 124i+1y en la Fig. 1d se muestran la unidad de procesamiento previo 124i-1 y la unidad de procesamiento dada 124i, donde la eliminación de ventanas aplicada mediante el aparato se puede basar en las unidades de procesamiento 124. Según una realización, la unidad de procesamiento previo 124i-i puede estar asociada con una trama pasada y la unidad de procesamiento dada 124i puede estar asociada con una trama actual.
[0064]Comúnmente, se realiza una adición por solapamiento para las tramas que comprenden las regiones de solapamiento fe a t1 y/o t2 a t3 (t2 a t3 pueden asociarse con ns a ne en la Fig. 1d) después de una formación de ventanas de síntesis (que generalmente se aplica después de una transformación de vuelta al dominio del tiempo o incluso junto con dicha transformación de vuelta al dominio del tiempo ) para proporcionar una representación de la señal de audio procesada. Por el contrario, el aparato de la invención 100, que se muestra en la Fig. 1a, se puede configurar para aplicar una eliminación de ventanas 130 (es decir, deshacer la formación de ventanas de análisis), por lo cual no es necesaria una adición por solapamiento de la unidad de procesamiento dada 124i con una unidad de procesamiento subsiguiente 124i+1 en el período t2 a t3, ver Fig. 1c y Fig. 1d. Esto se logra, por ejemplo, mediante la adaptación de la eliminación de ventanas para compensar al menos parcialmente una falta de valores de señal de la unidad de procesamiento subsiguiente 124i+1, como se muestra en la Fig. 1c. Así, por ejemplo, los valores de señal en el período t2 a t3 de la unidad de procesamiento subsiguiente 124i+1 no son necesarios y un error, que puede ocurrir debido a esta falta de los valores de señal, se puede compensar mediante la eliminación de ventanas 130 por el aparato 100 (por ejemplo, usando un escalamiento de valores de la señal 120 en una porción final de la unidad de procesamiento dada, que está adaptada a las características de la señal y/o a los parámetros de procesamiento para evitar o reducir defectos. Esto puede resultar en una reducción adicional del retardo de la aproximación de la señal.
[0065]Si se aplica la eliminación de ventanas, por ejemplo, a la representación de la señal de audio de entrada proporcionada por un procesamiento de la señal intermedia 123, la eliminación de ventanas está configurada para proporcionar una versión reconstruida de una unidad de procesamiento dada 124i, es decir, un segmento de tiempo, una trama, de la representación de la señal de audio procesada 110 antes de que esté disponible una unidad de procesamiento subsiguiente 124i+1, la cual se solapa temporalmente al menos parcialmente con la unidad de procesamiento dada, en el período t2 a t3, véase la Fig. 1c y/o la Fig. 1d. Así, no es necesario que el aparato 100 vea hacia delante, dado que es suficiente tan solo eliminar ventanas en la unidad de procesamiento dada 124i.
[0066]Según una realización, el aparato 100 está configurado para aplicar una adición por solapamiento de la unidad de procesamiento dada 124i y la unidad de procesamiento previo 124<m>en el período tü a t-i, dado que la unidad de procesamiento previo 124m está, por ejemplo, ya procesada por el aparato 100.
[0067]Según una realización, el aparato 100 está configurado para adaptar la eliminación de ventanas 130 para reducir o limitar un desvío entre una representación de la señal de audio procesada (por ejemplo, una versión con ventanas eliminadas de la unidad de procesamiento dada 124i de la representación de la señal de audio de entrada) y un resultado de una adición por solapamiento entre unidades de procesamiento subsiguientes de la representación de la señal de audio de entrada. Por lo tanto, la eliminación de ventanas se adapta de tal forma que casi no se producen desvíos entre la representación de la señal de audio procesada, por ejemplo, de la unidad de procesamiento dada 124i, y una representación de la señal de audio procesada que se obtendría usando una adición por solapamiento convencional con la unidad de procesamiento subsiguiente, donde la nueva eliminación de ventanas por el aparato 100 tiene menos retardo que los procedimientos comunes, dado que la unidad de procesamiento subsiguiente 124i+1 no tiene que considerarse en la eliminación de ventanas, lo cual resulta en una optimización del retardo necesario para procesar una señal para proporcionar la representación de la señal de audio procesada 110.
[0068]Según una realización, el aparato 100, que se muestra en la Fig. 1a, está configurado para adaptar la eliminación de ventanas 130 a valores límite de la representación de la señal de audio procesada 110. Así, por ejemplo, valores elevados, por ejemplo, al menos en una porción final 126, véase la Fig. 1b o la Fig. 8, de una unidad de procesamiento, por ejemplo, en un período t2 a t3 de la unidad de procesamiento dada 124i, se puede limitar mediante la eliminación de ventanas (por ejemplo, mediante una reducción selectiva de un factor de escalamiento, por ejemplo, en el caso de una convergencia lenta hacia cero de la representación de la señal de audio de entrada en un extremo 126 de la unidad de procesamiento dada 124i. Así, se puede evitar que se produzca una gran desviación como podría ocurrir entre una señal de salida 1121 con una porción aproximada obtenida mediante eliminación de ventanas estática y una señal de salida 1122 obtenida usando OLA con una trama siguiente, véase la Fig. 8. Según una realización, el aparato 100 está configurado para usar valores de ponderación para realizar la no ponderación que son menores que los inversos multiplicativos para valores correspondientes de una generación de ventanas de análisis 132 usada para obtener la señal intermedia 123, que se puede procesar ulteriormente para una provisión de la representación de la señal de audio de entrada 120, por ejemplo, al menos para escalar una porción final 126 de una unidad de procesamiento de la representación de la señal de audio de entrada 120.
[0069]Según una realización, la eliminación de ventanas 130 puede aplicar un escalamiento a la representación de la señal de audio de entrada 120, donde el escalamiento en la porción final 126 en el período t2 a t3, véase la Fig. 1b, de la unidad de procesamiento dada 124i de la representación de la señal de audio de entrada 120 se reduce en algunas situaciones cuando se compara con un caso en el cual la representación de la señal de audio de entrada 120, por ejemplo, de manera uniforme, converge hacia cero en la porción final 126 de la unidad de procesamiento dada 124i. Por lo tanto, la eliminación de ventanas 130 puede adaptarse mediante el aparato 100 de tal forma que la representación de la señal de audio de entrada 120 puede experimentar diferentes escalamientos para diferentes períodos en la unidad de procesamiento dada 124i. Así, por ejemplo, al menos en la porción final 126 de la unidad de procesamiento dada 124i de la representación de la señal de audio de entrada 120, la eliminación de ventanas se adapta, para así limitar un intervalo dinámico de la representación de la señal de audio procesada 110. Por lo tanto, se pueden evitar valores elevados como se muestran para la señal de salida 1121 en la porción final 126 en la Fig. 8 mediante el aparato de la invención 100, que está configurado para adaptar la eliminación de ventanas 130.
[0070]Según una realización, se pueden eliminar ventanas en diferentes unidades de procesamiento dadas 124i, es decir, en porciones diferentes de la representación de la señal de audio de entrada 120, mediante diferentes escalamientos, con lo cual se realiza una eliminación de ventanas adaptativa. Así, por ejemplo, la señal 122 se puede formar en ventanas mediante el dispositivo 200 en una pluralidad de unidades de procesamiento 124 y el aparato 100 puede estar configurado para realizar una eliminación de ventanas para cada unidad de procesamiento 124 (por ejemplo, usando diferentes parámetros para eliminación de ventanas) para proporcionar la representación de la señal de audio procesada 110.
[0071]Según una realización, la representación de la señal de audio de entrada 120 puede comprender un componente DC, por ejemplo, un desplazamiento, que puede ser empleado por el aparato 100 para adaptar la eliminación de ventanas 130. El componente DC de la representación de la señal de audio de entrada puede resultar, por ejemplo, del procesamiento realizado por el dispositivo opcional 200 para proporcionar la representación de la señal de audio de entrada 120. Según una realización, el aparato 100 está configurado para al menos parcialmente eliminar el componente DC de la representación de la señal de audio de entrada, mediante, por ejemplo, la aplicación de una eliminación de ventanas 130 y/o antes de aplicar un escalamiento, es decir, la eliminación de ventanas 130, que revierte la generación de ventanas, por ejemplo, la generación de ventanas de análisis. Según una realización, el componente DC de la representación de la señal de audio de entrada se puede eliminar mediante el aparato antes de una división por un valor de ventana, lo cual representa, por ejemplo, la eliminación de ventanas. Según una realización, el componente DC se puede eliminar al menos parcialmente de forma selectiva en la región de solapamiento, representada, por ejemplo, por la porción final 126, con la unidad de procesamiento subsiguiente 124i+1. Según una realización, la eliminación de ventanas 130 se aplica a una versión con eliminación de DC o reducción de DC de la representación de la señal de audio de entrada 120, donde la eliminación de ventanas puede representar un escalamiento en función de un valor de ventana con el fin de obtener la representación de la señal de audio procesada 110. El escalamiento se aplica, por ejemplo, dividiendo la versión con eliminación de DC o reducción de DC de la representación de la señal de audio de entrada 120 por el valor de ventana. El valor de ventana se representa, por ejemplo, mediante la ventana 132, que se muestra en la Fig. 1b, donde, por ejemplo, para cada etapa de tiempo en la unidad de procesamiento dada 124i existe un valor de ventana.
[0072]El componente DC de la representación de la señal de audio de entrada 120 se puede volver a introducir, por ejemplo, al menos parcialmente, tras el escalamiento, por ejemplo, un escalamiento basado en el valor de ventana, de la versión con eliminación de DC o reducción de DC de la representación de la señal de audio de entrada 120. Esto se basa en la idea de que el componente DC puede resultar en un error que aparece en la eliminación de ventanas, y al eliminarlo antes de la eliminación de ventanas y la re-introducción del componente DC después de la eliminación de ventanas, este error se minimiza.
[0073]Según una realización, la eliminación de ventanas 130 está configurada para determinar la representación de la señal de audio procesada y r[n] 110 sobre la base de la representación de la señal de audio de entrada y[n] 120 segúnyr \nj= -(-y-w--a-— [nj - d , n6\ns;n ej. El componente DC o el desplazamiento DC, por ejemplo, en una unidad de procesamiento o trama actual de la representación de la señal de audio de entrada, o en una porción de esta, se puede representar mediante el valor d. El Índice n es un índice de tiempo, que representa, por ejemplo, etapas de tiempo o un tiempo continuo en un intervalo de tiempo ns a ne (véase la Fig. 1d), donde ns es un índice de tiempo de una primera muestra de una región de solapamiento, por ejemplo, entre una unidad de procesamiento o trama actual y una unidad de procesamiento o trama subsiguiente, y donde ne es un índice de tiempo de una última muestra de la región de solapamiento. El valor de la función wa[n] es una ventana de análisis 132 usada para una provisión de la representación de la señal de audio de entrada 120, por ejemplo, en una trama de tiempo entre ns y ne.
[0074]En otras palabras, en una realización preferida se asume que las sumas de procesamiento, por ejemplo, un desplazamiento DCda la trama procesada de la señal, y la reparación (o eliminación de ventanas) se adapta a este componente DC.
(y[n] - d )
yr \n] =-------- — —+ d ,n 6 \ns; n e ]
wa \n\
[0075]En una realización preferida adicional, este componente DC es aproximado, por ejemplo, empleando una ventana de análisis completada con ceros y toma el valor de una muestra dentro del intervalo completado con ceros después del procesamiento y la DFT inversa como un valor aproximadod parael componente DC añadido.
[0076]Según una realización, el aparato 100 está configurado para determinar el componente DC usando uno o varios valores de la representación de la señal de audio de entrada 120, que reside en una porción de tiempo 134, véase la Fig. 1b, en la cual una ventana de análisis 132 usada en una provisión de la representación de la señal de audio de entrada 120 comprende uno o varios valores cero. Esta porción de tiempo 134 puede representar un relleno con ceros (por ejemplo, un relleno con ceros contiguo), que opcionalmente se puede aplicar para determinar el componente DC de la representación de la señal de audio de entrada 120. Mientras que el relleno con ceros en la porción de tiempo 134 de la ventana de análisis 132 resultará en valores cero de una señal formada en ventanas en esta porción de tiempo 134, un procesamiento de esta señal formada en ventanas puede resultar en un desplazamiento DC en esta porción de tiempo 134, definiendo el componente DC. Según una realización, el componente DC puede representar un desplazamiento medio de la representación de la señal de audio de entrada 120 en la porción de tiempo 134 (véase la Fig. 1b).
[0077]En otras palabras el aparato 100 descrito en el contexto de la Fig. 1a a la Fig. 1d puede realizar una eliminación de ventanas adaptativa para el procesamiento en el dominio de la frecuencia con bajo retardo según una realización. Esta invención describe un novedoso enfoque para la eliminación de ventanas o la reparación (véase la Fig. 1c o la Fig. 1d) de una señal de tiempo tras, por ejemplo, el procesamiento con un banco de filtros sin la necesidad de adición por solapamiento con una trama siguiente para obtener una señal de tiempo que es una buena aproximación de la señal completamente procesada después de la adición por solapamiento con una trama siguiente, lo que lleva, por ejemplo, a un retardo más bajo para un sistema de procesamiento de señales donde una señal de tiempo es procesada ulteriormente tras un procesamiento empleando un banco de filtros.
[0078]La Fig. 1c y la Fig. 1d pueden mostrar la misma eliminación de ventanas o una alternativa mediante el aparato propuesto en esta invención 100, donde se puede realizar una adición por solapamiento (OLA) entre la trama pasada y la trama actual y no se necesita ninguna unidad de procesamiento subsiguiente 124i+1.
[0079]Para asegurar una buena aproximación de la porción de la señal reparada (por ejemplo, una representación de la señal de audio procesada en la porción final 126) y evitar en cambio una eliminación de ventanas estática con la inversa de la ventana de análisis aplicada, proponemos, por ejemplo, una reparación adaptativa.
yr [n] = f ( y [n ],w a [n ]),n 6 [ns;ne]
[0080]La adaptación (por ejemplo, del mapeo de la función para eliminación de ventanas y[n] enyr [n])se basa preferentemente en la ventana de análisisway por ejemplo en uno o varios de los siguientes parámetros - Parámetros disponibles y usados en el procesamiento en el dominio de la frecuencia de las tramas actuales y posiblemente las tramas pasadas.
- Parámetros derivados de la representación en el dominio de la frecuencia de la trama actual.
- Parámetros derivados de la señal de tiempo de la trama actual después del procesamiento en el dominio de la frecuencia y la transformada de frecuencia inversa.
[0081]Las ventajas del nuevo procedimiento y aparato son una mejor aproximación de la señal real procesada y adicionada por solapamiento en el área de la parte de solapamiento derecha cuando aún no está disponible una trama a continuación.
[0082]El aparato 100 y procedimiento propuestos en esta invención se pueden usar en las siguientes áreas de aplicación:
- Sistemas de procesamiento con bajo retardo que utilizan procesamiento adicional de una señal tras procesarla en el dominio de la frecuencia usando una transformada de frecuencia directa e inversa con adición por solapamiento.
- Para el uso en un sistema codificador estéreo paramétrico o decodificador estéreo o codificador/decodificador estéreo donde en el codificador se crea una mezcla en forma descendente mediante el procesamiento de las señales de entrada estéreo en el dominio de la frecuencia y la mezcla en forma descendente en el dominio de la frecuencia se transforma de nuevo al dominio del tiempo para una ulterior codificación mono usando un codificador mono de voz/música del estado de la técnica tal como EVS.
- Para el uso en una extensión estéreo futura del estándar de codificación EVS, a saber, en una parte estéreo DFT de este sistema.
- Una realización se puede usar en un aparato o sistema 3GPP (3rd. Generation Partnership Project - Proyecto Asociación de Tercera Generación) IVAS (Immersive Voice and Audio Services - Servicios Inmersivos de Voz y Audio).
[0083]La Fig. 2 muestra un procesador de señal de audio 300 para proporcionar una representación de la señal de audio procesada 110 sobre la base de una señal de audio 122, es decir, una primera señal, que se va a procesar. Según una realización, la primera señal 122 x[n] se puede entramar y/o formar en ventanas de análisis 210 para proporcionar una primera señal intermedia 1231, la primera señal intermedia 1231 puede experimentar una transformada de frecuencia directa 220 para proporcionar una segunda señal intermedia 1232, la segunda señal intermedia 1232 puede experimentar un procesamiento 230 en un dominio de la frecuencia para proporcionar una tercera señal intermedia 1233 y la tercera señal intermedia 1233 puede experimentar una transformada tiempofrecuencia inversa 240 para proporcionar una cuarta señal intermedia 1234. La generación de ventanas de análisis 210 se aplica, por ejemplo, mediante el procesador de señal de audio 300 a una representación en el dominio del tiempo de una unidad de procesamiento, por ejemplo, una trama, de la señal de audio 122. La primera señal intermedia así obtenida 1231 representa, por ejemplo, una versión formada en ventanas de la representación en el dominio del tiempo de la unidad de procesamiento de la señal de audio 122. La segunda señal intermedia 1232 puede representar una representación en el dominio espectral o una representación en el dominio de la frecuencia de la señal de audio 122 obtenida sobre la base de la versión formada en ventanas, es decir la primera señal intermedia 1231. El procesamiento 230 en el dominio de la frecuencia también puede representar un procesamiento en el dominio espectral y puede comprender, por ejemplo, un filtrado y/o un suavizado y/o una traducción de frecuencia y/o un procesamiento con efecto de sonido tal como la inserción de eco o similar y/o una extensión de ancho de banda y/o la extracción de señales de efecto ambiental y/o separación de fuentes. Por lo tanto, la tercera señal intermedia 1233 puede representar una representación en el dominio espectral procesada y la cuarta señal intermedia 1234 puede representar una representación en el dominio del tiempo procesada opcional sobre la base de la representación en el dominio espectral procesada, es decir, la tercera señal intermedia 1233.
[0084]Según una realización, el procesador de señal de audio 200 comprende un aparato 100 como, por ejemplo, el descrito con respecto a la Fig. 1a y/o la Fig. 1b, que está configurado para obtener la representación en el tiempo procesada 1234 y[n] como su representación de la señal de audio de entrada, y para proporcionar, sobre esta base, la representación de la señal de audio procesada yr[n] 110. La transformada tiempo-frecuencia inversa 240 puede representar una conversión del dominio espectral al dominio del tiempo, por ejemplo, usando un banco de filtros, usando una transformada de Fourier discreta inversa o una transformada de coseno discreta inversa. Por lo tanto, el aparato 100 está configurado para, por ejemplo, obtener la representación de la señal de audio de entrada, representada por la cuarta señal intermedia 1234, usando una conversión del dominio espectral al domino del tiempo.
[0085]El aparato está configurado para realizar una eliminación de ventanas para proporcionar la representación de la señal de audio procesada 110 yr[n] sobre la base de la representación de la señal de audio de entrada 1234. Según una realización, la eliminación de ventanas se aplica a la cuarta señal intermedia 1234. Una adaptación de la eliminación de ventanas 130 mediante el aparato 100 puede comprender características y/o funcionalidades según se describió con respecto a la Fig. 1a y/o la Fig. 1b. Según una realización, el aparato 100 puede estar configurado para adaptar la eliminación de ventanas 130 en función de las características de la señal 1401 a 1404 de las señales intermedias 1231 a 1234 y/o en función de los parámetros de procesamiento 1501 a 1504 de las respectivas etapas de procesamiento 210, 220, 230 y/o 240 usadas para una provisión de la representación de la señal de audio de entrada. Por ejemplo, se puede concluir a partir de los parámetros de procesamiento si es de esperar que la representación de la señal de audio de entrada en la eliminación de ventanas comprenda un desplazamiento DC o es probable que comprenda un desplazamiento DC o que comprenda una lenta divergencia hacia cero en un extremo de la trama. Por consiguiente, los parámetros de procesamiento se pueden usar para decidir si y/o cómo se debería adaptar la eliminación de ventanas.
[0086]Según una realización, el aparato 100 está configurado para adaptar la eliminación de ventanas usando valores de ventana de la generación de ventanas de análisis 210 realizada por el procesador de señal de audio 200.
[0087]Según una realización, el aparato está configurado para realizar una eliminación de ventanas para determinar la representación de la señal de audio procesada y r[n] 110 sobre la base de la representación de la señal( y [ n ] - d )
de audio de entrada y[n] 1234 segúnyr [n\ =w a [n\+ d ,n 6 [ns;n e ].El valor d puede representar un componente DC o un desplazamiento DC de la cuarta señal intermedia 1234 y wa[n] puede representar una ventana de análisis usada para una provisión de la representación de la señal de audio de entrada 1234 en la etapa de procesamiento 210. Esta eliminación de ventanas se realiza, por ejemplo, en un período ns a ne para todos los tiempos n.
[0088]La Fig. 3 muestra una vista esquemática de un decodificador de audio 400 para proporcionar una representación de audio decodificada 410 sobre la base de una representación de audio codificada 420. El decodificador de audio 400 está configurado para obtener una representación en el dominio espectral 430 de una señal de audio codificada sobre la base de la representación de audio codificada 420. Asimismo, el decodificador de audio 400 está configurado para obtener una representación en el dominio del tiempo 440 de la señal de audio codificada sobre la base de la representación en el dominio espectral 430. Asimismo, el decodificador de audio 400 comprende un aparato 100, que puede comprender características y/o funcionalidades según se describieron con respecto a la Fig. 1a y/o la Fig. 1b. El aparato 100 está configurado para obtener la representación en el dominio del tiempo 440 como su representación de la señal de audio de entrada, y para proporcionar, sobre la base de esta, la representación de la señal de audio procesada 410 como la representación de audio codificada. La representación de la señal de audio procesada 410 es, por ejemplo, una representación de señal de audio con ventanas eliminadas, debido a que el aparato 100 está configurado para eliminar ventanas en la representación en el dominio del tiempo 440.
[0089]Según una realización el decodificador de audio 400 está configurado para proporcionar, por ejemplo, la representación de la señal de audio decodificada completa 410 de una unidad de procesamiento dada, por ejemplo, una trama, antes de que una unidad de procesamiento subsiguiente, por ejemplo, una trama, que se solapa temporalmente con la unidad de procesamiento dada, sea decodificada.
[0090]La Fig. 4 muestra una vista esquemática de un codificador de audio 800 para proporcionar una representación de audio codificada 810 sobre la base de una representación de la señal de audio de entrada 122, donde la representación de la señal de audio de entrada 122 comprende, por ejemplo, una pluralidad de señales de audio de entrada. La representación de la señal de audio de entrada 122 opcionalmente está previamente procesada 200 para proporcionar una segunda representación de la señal de audio de entrada 120 para un aparato 100. El procesamiento previo 200 puede comprender un entramado, una generación de ventanas de análisis, una transformada de frecuencia directa, un procesamiento en un dominio de la frecuencia y/o una transformada tiempofrecuencia inversa de la señal 122 para proporcionar la segunda representación de la señal de audio de entrada 120. Alternativamente, la representación de la señal de audio de entrada 122 puede ya representar la segunda representación de la señal de audio de entrada 120.
[0091]El aparato 100 puede comprender características y funcionalidades como se describe en esta invención, por ejemplo, con respecto a la Fig. 1a a la Fig.2. El aparato 100 está configurado para obtener una representación de la señal de audio procesada 820 sobre la base de la representación de la señal de audio de entrada 122. Según una realización, el aparato 100 está configurado para realizar una mezcla en forma descendente de una pluralidad de señales de audio de entrada, que forman la representación de la señal de audio de entrada 122 o la segunda representación de la señal de audio de entrada 120, en un dominio espectral, y para proporcionar una señal mezclada en forma descendente como la representación de la señal de audio procesada 820. Según una realización, el aparato 100 puede realizar un primer procesamiento 830 de la representación de la señal de audio de entrada 122 o de la segunda representación de la señal de audio de entrada 120. El primer procesamiento 830 puede comprender características y funcionalidades según se describió con respecto al procesamiento previo 200. A la señal obtenida por el primer procesamiento opcional 830 se le pueden eliminar las ventanas y/o procesarla ulteriormente 840 para proporcionar la representación de la señal de audio procesada 820. La representación de la señal de audio procesada 820 es, por ejemplo, una señal en el dominio del tiempo.
[0092]Según una realización el codificador 800 comprende un codificador en el dominio espectral 870 y/o un codificador en el dominio del tiempo 872. Como se muestra en la Fig. 4 el codificador 800 puede comprender al menos un conmutador 8801, 8802 para cambiar un modo de codificación entre la codificación en el dominio espectral 870 y la codificación en el dominio del tiempo 872 (por ejemplo, cambio de codificación). El codificador conmuta, por ejemplo, en una forma adaptada a la señal. Alternativamente, el codificador puede comprender el codificador en el dominio espectral 870 o el codificador en el dominio del tiempo 872, sin conmutar entre estos dos modos de codificación.
[0093]En la codificación en el dominio espectral 870 la representación de la señal de audio procesada 820 se puede transformar 850 en una señal en el dominio espectral. Esta transformación es opcional. Según una realización, la representación de la señal de audio procesada 820 ya representa una señal en el dominio espectral, por lo cual no se necesita transformación 850.
[0094]El codificador de audio 800 está configurado, por ejemplo, para codificar 8601 la representación de la señal de audio procesada 820. Como se describió anteriormente, el codificador de audio puede estar configurado para codificar la representación en el dominio espectral, para obtener la representación de audio codificada 810.
[0095]En la codificación en el dominio del tiempo 872, el codificador de audio 800 está configurado, por ejemplo, para codificar la representación de la señal de audio procesada 820 usando una codificación en el dominio del tiempo para obtener la representación de audio codificada 810. Según una realización, se puede usar una codificación basada en LPC, que determina y codifica coeficientes de predicción lineal y que determina y codifica una excitación.
[0096]La Fig. 5a muestra un diagrama de flujo de un procedimiento 500 para proporcionar una representación de la señal de audio procesada sobre la base de la representación de la señal de audio de entrada y[n], que se puede considerar como la señal de audio de entrada de un aparato como se describe en esta invención. El procedimiento comprende aplicar una eliminación de ventanas 510, por ejemplo, una eliminación de ventanas adaptativa, para proporcionar la representación de la señal de audio procesada, por ejemplo, yr[n], sobre la base de la representación de la señal de audio de entrada. La eliminación de ventanas, por ejemplo, revierte al menos parcialmente la generación de ventanas de análisis usada para una provisión de la representación de la señal de audio de entrada y está definida, por ejemplo, por f(y[n],wa[n]). El procedimiento 500 comprende adaptar 520 la eliminación de ventanas en función de una o más características de la señal y/o en función de uno o más parámetros de procesamiento usados para una provisión de la representación de la señal de audio de entrada. La única o las varias características de la señal son, por ejemplo, características de la representación de la señal de audio de entrada o de una representación intermedia a partir de la cual se deriva la representación de la señal de audio de entrada y pueden comprender, por ejemplo, un componente DC d.
[0097]La Fig. 5b muestra un diagrama de flujo de un procedimiento 600 para proporcionar una representación de la señal de audio procesada sobre la base de una señal de audio que se va a procesar, que comprende aplicar 610 una generación de ventanas de análisis a una representación en el dominio del tiempo de una unidad de procesamiento, por ejemplo, una trama, de una señal de audio que se va a procesar, para obtener una versión circunscripta en ventanas de la representación en el dominio del tiempo de la unidad de procesamiento de la señal de audio que se va a procesar. Asimismo, el procedimiento 600 comprende obtener 620 una representación en el dominio espectral, por ejemplo, una representación en el dominio de la frecuencia, de la señal de audio que se va a procesar sobre la base de la versión formada en ventanas usando, por ejemplo, una transformada de frecuencia directa, como, por ejemplo, una DFT. El procedimiento comprende aplicar 630 un procesamiento en el dominio espectral, por ejemplo, un procesamiento en el dominio de la frecuencia, a la representación en el dominio espectral obtenida, para obtener una representación en el dominio espectral procesada. Además, el procedimiento comprende obtener 640 una representación en el dominio del tiempo procesada sobre la base de la representación en el dominio espectral procesada, por ejemplo, usando una transformada tiempo-frecuencia inversa, y proporcionar 650 la representación de la señal de audio procesada usando el procedimiento 500, donde la representación en el dominio del tiempo procesada se usa como la señal de audio de entrada para llevar a cabo el procedimiento 500.
[0098]La Fig. 5c muestra un diagrama de flujo de un procedimiento 700 para proporcionar una representación de audio decodificada sobre la base de una representación de audio codificada que comprende obtener 710 una representación en el dominio espectral, por ejemplo, una representación en el dominio de la frecuencia, de una señal de audio codificada sobre la base de la representación de audio codificada. Asimismo, el procedimiento comprende obtener 720 una representación en el dominio del tiempo de la señal de audio codificada sobre la base de la representación en el dominio espectral y proporcionar 730 la representación de la señal de audio procesada usando el procedimiento 500, donde la representación en el dominio del tiempo se usa como la señal de audio de entrada para llevar a cabo el procedimiento 500.
[0099]La Fig. 5d muestra un diagrama de flujo de un procedimiento 900 para proporcionar 930 una representación de audio codificada sobre la base de una representación de la señal de audio de entrada. El procedimiento comprende obtener 910 una representación de la señal de audio procesada sobre la base de la representación de la señal de audio de entrada usando el procedimiento 500. El procedimiento 900 comprende codificar 920 la representación de la señal de audio procesada.
Alternativas de implementación:
[0100]Aunque algunos aspectos se describen en el contexto de un aparato, está claro que estos aspectos también representan una descripción del procedimiento correspondiente, donde un bloque o dispositivo corresponde a una etapa del procedimiento o una característica de una etapa del procedimiento. De manera análoga, los aspectos descritos en el contexto de una etapa de un procedimiento también representan una descripción de un bloque o ítem o característica de un aparato correspondiente. Todas o algunas de las etapas del procedimiento se pueden ejecutar mediante (o a través del uso de) un aparato de hardware, como, por ejemplo, un microprocesador, un ordenador programable o un circuito electrónico. En algunas realizaciones, una o varias de las etapas más importantes del procedimiento se pueden ejecutar mediante dicho aparato.
[0101]Según ciertos requisitos de la implementación, las realizaciones de la invención se pueden implementar en hardware o en software. La implementación se puede realizar usando un medio de almacenamiento digital, por ejemplo, un disco flexible, un disco versátil digital (DVD), un Blu-Ray, un disco compacto (CD), una memoria de solo lectura (ROM), una memoria programable de solo lectura (PROM), una memoria programable de solo lectura borrable (EPROM), una memoria programable de solo lectura borrable eléctricamente (EEPROM) o una memoria FLASH, que contiene almacenadas señales de control legibles electrónicamente, que cooperan (o son capaces de cooperar) con un sistema informático programable tal que el procedimiento respectivo se lleva a cabo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.
[0102]Algunas realizaciones según la invención comprenden un soporte de datos que tiene señales de control legibles electrónicamente, que son capaces de cooperar con un sistema informático programable, de tal forma que se lleva a cabo uno de los procedimientos descritos en esta invención.
[0103]Generalmente, las realizaciones de la presente invención se pueden implementar como un producto de programa informático con un código de programa, siendo el código de programa operativo para realizar uno de los procedimientos cuando el producto de programa informático se ejecuta en un ordenador. El código del programa se puede almacenar, por ejemplo, en un soporte legible por una máquina.
[0104]Otras realizaciones comprenden el programa informático para realizar uno de los procedimientos descritos en esta invención, almacenados en un soporte legible por una máquina.
[0105]En otras palabras, una realización del procedimiento de la invención es, por lo tanto, un programa informático con un código de programa para realizar uno de los procedimientos descritos en esta invención, cuando se ejecuta el programa en un ordenador.
[0106]Una realización adicional de los procedimientos de la invención es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en él, el programa informático para realizar uno de los procedimientos descritos en esta invención. El soporte de datos, el medio de almacenamiento digital o el medio grabado son generalmente tangibles y/o no transitorios.
[0107]Una realización adicional del procedimiento de la invención es, por lo tanto, una corriente de datos o una secuencia de señales que representan el programa informático para llevar a cabo uno de los procedimientos descritos en esta invención. La corriente de datos o la secuencia de señales pueden estar configuradas, por ejemplo, para ser transferidas por medio de una conexión de comunicación de datos, por ejemplo, mediante Internet.
[0108]Una realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador, o un dispositivo lógico programable, configurado o adaptado para llevar a cabo uno de los procedimientos descritos en esta invención.
[0109]Una realización adicional comprende un ordenador que tiene instalado el programa informático para llevar a cabo uno de los procedimientos descritos en esta invención.
[0110]Una realización adicional según la invención comprende un aparato o un sistema configurado para transferir (por ejemplo, electrónica u ópticamente) un programa informático para llevar a cabo uno de los procedimientos descritos en esta invención a un receptor. El receptor puede ser, por ejemplo, un ordenador, un dispositivo móvil, un dispositivo de memoria o similar. El aparato o el sistema pueden, por ejemplo, comprender un servidor de archivos para transferir el programa informático al receptor.
[0111]En algunas realizaciones, se puede usar un dispositivo lógico programable (por ejemplo, una matriz de puertas programables por campo) para realizar algunas o todas las funcionalidades de los procedimientos descritos en esta invención. En algunas realizaciones, una matriz de puertas programables por campos puede colaborar con un microprocesador para realizar algunos de los procedimientos descritos en esta invención. Generalmente, los procedimientos se llevan a cabo preferentemente mediante cualquier aparato de hardware.
[0112]El aparato descrito en esta invención se puede implementar usando un aparato de hardware, o usando un ordenador, o usando una combinación de aparato de hardware y un ordenador.
[0113]El aparato descrito en esta invención, o cualquier componente de los aparatos descritos en esta invención, se pueden implementar al menos parcialmente en hardware y/o en software.
[0114]Los procedimientos descritos en esta invención se pueden implementar usando un aparato de hardware, o usando un ordenador, o usando una combinación de aparato de hardware y un ordenador.
[0115]Los procedimientos descritos en esta invención, o cualquier componente de los aparatos descritos en esta invención, se pueden implementar al menos parcialmente en hardware y/o en software.
[0116]Las realizaciones descritas en esta invención son meramente ilustrativas de los principios de la presente invención. Se entiende que a otros expertos en la técnica se les tornarán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en esta invención. Por lo tanto, se pretende solamente quedar limitados por el alcance de las reivindicaciones de patente a continuación y no por los detalles específicos presentados a modo de descripción y explicación de las reivindicaciones en esta invención.

Claims (31)

  1. REIVINDICACIONES 1. Un aparato (100) para proporcionar una representación de señal de audio procesada (110) sobre la base de una representación de señal de audio de entrada (120), donde el aparato (100) se configura para aplicar una eliminación de ventanas (130), para proporcionar la representación de señal de audio procesada (110) sobre la base de la representación de señal de audio de entrada (120), donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) en función de una o más características de señal (140, 1401 a 1404) y/o en función de uno o varios parámetros de procesamiento (150, 1501 a 1504) utilizados para una provisión de la representación de señal de audio de entrada (120); y donde la eliminación de ventanas (130) revierte al menos parcialmente una generación de ventana de análisis utilizada para una provisión de la representación de señal de audio de entrada; y donde la eliminación de ventanas (130) se configura para proporcionar una unidad de procesamiento determinada (124i) de la representación de señal de audio procesada (110) antes de que una unidad de procesamiento subsiguiente (124i+1), la cual al menos parcialmente de manera temporal se solapa (126) con la unidad de procesamiento determinada (124) esté disponible.
  2. 2. El aparato (100) según la reivindicación 1, donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) en función de los parámetros de procesamiento (150, 1501 a 1504) que determinan un procesamiento utilizado para derivar la representación de señal de audio de entrada (120).
  3. 3. El aparato (100) según la reivindicación 1 o 2, donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) en función de las características de señal (140, 1401 a 1404) de la representación de señal de audio de entrada (120) y/o de una representación de señal intermedia (1231 a 1232) a partir de la cual se deriva la representación de señal de audio de entrada (120).
  4. 4. El aparato (100) según la reivindicación 3, donde el aparato (100) se configura para obtener uno o más parámetros que describen características de señal (140, 1401 a 1404) de una representación en dominio de tiempo de una señal, a la cual se aplica la eliminación de ventanas (130); y/o donde el aparato (100) se configura para obtener uno o más parámetros que describen características de señal (140, 1401 a 1404) de una representación en el dominio de frecuencia de una señal intermedia (1231 a 1232) a partir de la cual se deriva una señal de audio de entrada en el dominio de tiempo, a la cual se aplica la eliminación de ventanas (130); y donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) con dependencia en el uno o más parámetros.
  5. 5. El aparato (100) según una de las reivindicaciones 1 a 4, donde el aparato (100) se configura para adaptar a eliminación de ventanas (130) para compensar al menos parcialmente la falta de valores de señal de una unidad de procesamiento subsiguiente (124i+1).
  6. 6. El aparato (100) según una de las reivindicaciones 1 a 5, donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) para limitar un desvío entre la representación de señal de audio procesada determinada (110) y un resultado de una adición por solapamiento entre unidades de procesamiento subsiguientes (124¡+1) de la representación de señal de audio de entrada (120).
  7. 7. El aparato (100) según una de las reivindicaciones 1 a 6, donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) a valores límites de la representación de señal de audio procesada (110).
  8. 8. El aparato (100) según una de las reivindicaciones 1 a 7, donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) tal que para una representación de señal de audio de entrada (120) que no converge a cero en una porción final (126) de una unidad de procesamiento (124i) de la señal de audio de entrada (120), un escalamiento que se aplica mediante la eliminación de ventanas (130) en la porción final (126) de la unidad de procesamiento (124i) se reduce en comparación a un caso en el cual la representación de señal de audio de entrada (120) converge a cero en la porción final (126) de la unidad de procesamiento (124i).
  9. 9. El aparato (100) según una de las reivindicaciones 1 a 8, donde el aparato (100) se configura para adaptar la eliminación de ventanas (130), para limitar de esta manera un intervalo dinámico de la representación de señal de audio procesada (110).
  10. 10. El aparato (100) según una de las reivindicaciones 1 a 9, donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) en función de un componente DC de la representación de señal de audio de entrada (120).
  11. 11. El aparato (100) según una de las reivindicaciones 1 a 10, donde el aparato (100) se configura para eliminar al menos parcialmente un componente DC de la representación de señal de audio de entrada (120).
  12. 12. El aparato (100) según una de las reivindicaciones 1 a 11, donde la eliminación de ventanas (130) se configura para escalar una versión con eliminación de DC o reducción de DC de la representación de señal de audio de entrada (120) en función de un valor de ventana (132) con el fin de obtener la representación de señal de audio procesada (110).
  13. 13. El aparato (100) según una de las reivindicaciones 1 a 12, donde la eliminación de ventanas (130) se configura para volver a introducir al menos parcialmente un componente DC después de un escalamiento de una versión con eliminación de DC o reducción de DC de la señal de audio de entrada (120).
  14. 14. El aparato (100) según una de las reivindicaciones 1 a 13, donde la eliminación de ventanas (130) se configura para determinar la representación de señal de audio procesada (110) yr[n] sobre la base de la representación de señal de audio de entrada (120) y[n] según
    donde d es un componente DC; donde n es un índice de tiempo; donde ns es un índice de tiempo de una primera muestra de una región de solapamiento; donde ne es un índice de tiempo de una última muestra de la región de solapamiento (126); y donde wa[n] es una ventana de análisis (132) utilizada para una provisión de la representación de señal de audio de entrada (120).
  15. 15. El aparato (100) según una de las reivindicaciones 1 a 14, donde el aparato (100) se configura para determinar el componente DC utilizando uno o varios valores de la representación de señal de audio de entrada (120), que reside en una porción de tiempo (134), en la cual una ventana de análisis (132) utilizada en una provisión de la representación de señal de audio de entrada (120) comprende uno o varios valores cero.
  16. 16. El aparato (100) según una de las reivindicaciones 1 a 15, donde el aparato (100) se configura para obtener la representación de señal de audio de entrada (120) utilizando una conversión del dominio espectral al dominio de tiempo (240).
  17. 17. Procesador de señal de audio (300) para proporcionar una representación de señal de audio procesada (110) sobre la base de una señal de audio (122) que se va a procesar, donde el procesador de señal de audio (300) se configura para aplicar una generación de ventanas de análisis (210) a una representación en dominio de tiempo de una unidad de procesamiento de una señal de audio (122) que se va a procesar, para obtener una versión formada en ventanas (1231) de la representación en dominio de tiempo de la unidad de procesamiento de la señal de audio (122) que se va a procesar, y donde el procesador de señal de audio (300) se configura para obtener una representación en dominio espectral (1232) de la señal de audio (122) que se va a procesar sobre la base de la versión formada en ventanas (123i), donde el procesador de señal de audio (300) se configura para aplicar un procesamiento en dominio espectral (230) a la representación en dominio espectral obtenida (1232), para obtener una representación en dominio espectral procesada (1233), donde el procesador de señal de audio (300) se configura para obtener una representación en dominio de tiempo procesada (1234) sobre la base de la representación en dominio espectral procesada (1233), y donde el procesador de señal de audio (300) comprende un aparato (100) según una de las reivindicaciones 1 a 16, donde el aparato (100) se configura para obtener la representación en dominio de tiempo procesada (1233) como su representación de señal de audio de entrada (120), y para proporcionar, sobre la base de la misma, la representación de señal de audio procesada (110).
  18. 18. El procesador de señal de audio (300) según la reivindicación 17, donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) utilizando valores de ventana de la generación de ventanas de análisis (210).
  19. 19. Un decodificador de audio (400) para proporcionar una representación de audio decodificada (410) sobre la base de una representación de audio codificada (420), donde el decodificador de audio (400) se configura para obtener una representación en dominio espectral (430) de una señal de audio codificada (420) sobre la base de la representación de audio codificada (420), donde el decodificador de audio (400) se configura para obtener una representación en dominio de tiempo (440) de la señal de audio codificada (420) sobre la base de la representación en dominio espectral (430), y donde el decodificador de audio comprende un aparato (100) según una de las reivindicaciones 1 a 16, donde el aparato (100) se configura para obtener la representación en dominio de tiempo (440) como su representación de señal de audio de entrada (120), y para proporcionar, sobre la base de la misma, la representación de señal de audio procesada (110).
  20. 20. Un codificador de audio para proporcionar una representación de audio codificada sobre la base de una representación de señal de audio de entrada, donde el codificador de audio comprende un aparato según una de las reivindicaciones 1 a 16, donde el aparato se configura para obtener una representación de señal de audio procesada sobre la base de la representación de señal de audio de entrada, y donde el codificador de audio se configura para codificar la representación de señal de audio procesada.
  21. 21. El codificador de audio según la reivindicación 20, donde el codificador de audio se configura para obtener una representación en dominio espectral sobre la base de la representación de señal de audio procesada, donde la representación de señal de audio procesada es una representación en dominio de tiempo, y donde el codificador de audio se configura para utilizar una codificación en dominio espectral para codificar la representación en dominio espectral, para obtener la representación de audio codificada.
  22. 22. El codificador de audio según la reivindicación 20 o 21, donde el codificador de audio se configura para codificar la representación de señal de audio procesada utilizando una codificación en dominio de tiempo para obtener la representación de audio codificada.
  23. 23. El codificador de audio según una de las reivindicaciones 20 a 22, donde el codificador de audio se configura para codificar la representación de señal de audio procesada utilizando una codificación conmutada que conmuta entre una codificación en dominio espectral y una codificación en dominio de tiempo.
  24. 24. El codificador de audio según una de las reivindicaciones 20 a 23, donde el aparato se configura para realizar una mezcla en forma descendente de una pluralidad de señales de audio de entrada, que forman la representación de señal de audio de entrada, en un dominio espectral, y para proporcionar una señal mezclada en forma descendente como la representación de señal de audio procesada.
  25. 25. Un procedimiento (500) para proporcionar una representación de señal de audio procesada sobre la base de una representación de señal de audio de entrada, donde el procedimiento comprende aplicar (510) una eliminación de ventanas, con el fin de proporcionar la representación de señal de audio procesada sobre la base de la representación de señal de audio de entrada, donde el procedimiento comprende adaptar (520) la eliminación de ventanas en función de una o más características de señal (140, 1401 a 1404) y/o en función de uno o varios parámetros de procesamiento (150, 1501 a 1504) utilizados para una provisión de la representación de señal de audio de entrada, donde la eliminación de ventanas revierte al menos parcialmente una generación de ventana de análisis utilizada para una provisión de la representación de señal de audio de entrada; y donde la eliminación de ventanas (130) proporciona una unidad de procesamiento determinada (124i) de la representación de señal de audio procesada (110) antes de que una unidad de procesamiento subsiguiente (124i+1), la cual al menos parcialmente de manera temporal se solapa (126) con la unidad de procesamiento determinada (124i), esté disponible.
  26. 26. Un procedimiento (600) para proporcionar una representación de señal de audio procesada sobre la base de una señal de audio que se va a procesar, donde el procedimiento comprende aplicar (610) una generación de ventanas de análisis a una representación en dominio de tiempo de una unidad de procesamiento de una señal de audio que se va a procesar, para obtener una versión formada en ventanas de la representación en dominio de tiempo de la unidad de procesamiento de la señal de audio que se va a procesar, y donde el procedimiento comprende obtener (620) una representación en dominio espectral de una señal de audio que se va a procesar sobre la base de la versión formada en ventanas, donde el procedimiento comprende aplicar (630) un procesamiento en dominio espectral a la representación en dominio espectral obtenida, para obtener una representación en dominio espectral procesada, donde el procedimiento comprende obtener (640) una representación en dominio de tiempo procesada sobre la base de la representación en dominio espectral procesada, y donde el procedimiento comprende proporcionar (650) la representación de señal de audio procesada utilizando el procedimiento según la reivindicación 25, donde la representación en dominio de tiempo procesada se utiliza como la señal de audio de entrada para realizar el procedimiento según la reivindicación 25.
  27. 27. Un procedimiento (700) para proporcionar una representación de audio decodificada sobre la base de una representación de audio codificada, donde el procedimiento comprende obtener (710) una representación en dominio espectral de una señal de audio codificada sobre la base de la representación de audio codificada, donde el procedimiento comprende obtener (720) una representación en dominio de tiempo de la señal de audio codificada sobre la base de la representación en dominio espectral, y donde el procedimiento comprende proporcionar (730) la representación de señal de audio procesada utilizando el procedimiento según la reivindicación 25, donde la representación en dominio de tiempo se utiliza como la señal de audio de entrada para realizar el procedimiento según la reivindicación 25.
  28. 28. Un procedimiento (900) para proporcionar (930) una representación de audio codificada sobre la base de una representación de una señal de audio de entrada, donde el procedimiento comprende obtener (910) una representación de señal de audio procesada sobre la base de la representación de señal de audio de entrada utilizando el procedimiento según la reivindicación 25, y donde el procedimiento comprende codificar (920) la representación de señal de audio procesada.
  29. 29. Un aparato (100) para proporcionar una representación de señal de audio procesada (110) sobre la base de una representación de señal de audio de entrada (120), donde el aparato (100) se configura para aplicar una eliminación de ventanas (130) para proporcionar la representación de señal de audio procesada (110) sobre la base de la representación de señal de audio de entrada (120), donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) en función de una o más características de señal (140, 1401 a 1404) y/o en función de uno o varios parámetros de procesamiento (150, 1501 a 1504) utilizados para una provisión de la representación de señal de audio de entrada (120); y donde el aparato (100) se configura para adaptar la eliminación de ventanas (130) tal que para una representación de señal de audio de entrada (120) que no converge a cero en una porción final (126) de una unidad de unidad de procesamiento (124i) de la señal de audio de entrada (120), un escalamiento que se aplica mediante la eliminación de ventanas (130) en la porción final (126) de la unidad de procesamiento (124i) se reduce en comparación a un caso en el cual la representación de señal de audio de entrada (120) converge a cero en la porción final (126) de la unidad de procesamiento (124) y donde la eliminación de ventanas (130) revierte al menos parcialmente una generación de ventana de análisis utilizada para una provisión de la representación de señal de audio de entrada.
  30. 30. Un procedimiento (500) para proporcionar una representación de señal de audio procesada sobre la base de una representación de señal de audio de entrada, donde el procedimiento comprende aplicar (510) una eliminación de ventanas, con el fin de proporcionar la representación de señal de audio procesada sobre la base de la representación de señal de audio de entrada, donde el procedimiento comprende adaptar (520) la eliminación de ventanas en función de una o más características de señal (140, 1401 a 1404) y/o en función de uno o varios parámetros de procesamiento (150, 1501 a 1504) utilizados para una provisión de la representación de señal de audio de entrada, en donde la adaptación de la eliminación de ventanas (130) se realiza tal que para una representación de señal de audio de entrada (120) que no converge a cero en una porción final (126) de unidad de procesamiento (124i) de la señal de audio de entrada (120), un escalamiento que se aplica mediante la eliminación de ventanas (130) en la porción final (126) de la unidad de procesamiento (124i) se reduce en comparación a un caso en el cual la representación de señal de audio de entrada (120) converge a cero en la porción final (126) de la unidad de procesamiento (124i), y donde la eliminación de ventanas revierte al menos parcialmente una generación de ventana de análisis utilizada para una provisión de la representación de señal de audio de entrada.
  31. 31. Un programa informático que tiene un código de programa para realizar, cuando se ejecuta en un ordenador, un procedimiento según la reivindicación 25, la reivindicación 26, la reivindicación 27, la reivindicación 28 o la reivindicación 30.
ES19795246T 2018-11-05 2019-11-05 Aparato y procesador de señal de audio, para proporcionar una representación de la señal de audio procesada, decodificador de audio, codificador de audio, procedimientos y programas informáticos Active ES2967262T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18204445 2018-11-05
PCT/EP2019/063693 WO2020094263A1 (en) 2018-11-05 2019-05-27 Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
PCT/EP2019/080285 WO2020094668A1 (en) 2018-11-05 2019-11-05 Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs

Publications (1)

Publication Number Publication Date
ES2967262T3 true ES2967262T3 (es) 2024-04-29

Family

ID=64277495

Family Applications (1)

Application Number Title Priority Date Filing Date
ES19795246T Active ES2967262T3 (es) 2018-11-05 2019-11-05 Aparato y procesador de señal de audio, para proporcionar una representación de la señal de audio procesada, decodificador de audio, codificador de audio, procedimientos y programas informáticos

Country Status (16)

Country Link
US (4) US11990146B2 (es)
EP (3) EP4207191A1 (es)
JP (3) JP7258135B2 (es)
KR (1) KR20210093930A (es)
CN (1) CN113272896B (es)
AR (1) AR116991A1 (es)
AU (4) AU2019374400B2 (es)
BR (1) BR112021008802A2 (es)
CA (3) CA3179294A1 (es)
ES (1) ES2967262T3 (es)
MX (1) MX2021005233A (es)
PL (1) PL3877976T3 (es)
SG (1) SG11202104612TA (es)
TW (1) TWI738106B (es)
WO (2) WO2020094263A1 (es)
ZA (1) ZA202103740B (es)

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB914802A (en) 1958-04-16 1963-01-02 Emi Ltd Improvements in or relating to multi-speed mechanisms
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US6594628B1 (en) * 1995-09-21 2003-07-15 Qualcomm, Incorporated Distributed voice recognition system
ATE315863T1 (de) 2000-10-30 2006-02-15 Texas Instruments Inc Verfahren zur schätzung und entfernung eines zeitvarianten dc-offsets
US7529661B2 (en) * 2002-02-06 2009-05-05 Broadcom Corporation Pitch extraction methods and systems for speech coding using quadratically-interpolated and filtered peaks for multiple time lag extraction
DE102004049457B3 (de) * 2004-10-11 2006-07-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zur Extraktion einer einem Audiosignal zu Grunde liegenden Melodie
US7929627B2 (en) * 2005-03-01 2011-04-19 Panasonic Corporation OFDM receiver, integrated circuit and receiving method
TW200733062A (en) * 2005-10-21 2007-09-01 Qualcomm Inc Signal coding and decoding based on spectral dynamics
JP2007316254A (ja) * 2006-05-24 2007-12-06 Sony Corp オーディオ信号補間方法及びオーディオ信号補間装置
US7809559B2 (en) 2006-07-24 2010-10-05 Motorola, Inc. Method and apparatus for removing from an audio signal periodic noise pulses representable as signals combined by convolution
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
CN101521010B (zh) * 2008-02-29 2011-10-05 华为技术有限公司 一种音频信号的编解码方法和装置
JP5773124B2 (ja) * 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
TWI449442B (zh) 2009-01-14 2014-08-11 Dolby Lab Licensing Corp 用於無回授之頻域主動矩陣解碼的方法與系統
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
US8374139B2 (en) 2009-03-27 2013-02-12 Mediatek Inc. Low latency synchronization scheme for wireless OFDMA systems
EP2273493B1 (en) * 2009-06-29 2012-12-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Bandwidth extension encoding and decoding
GB2472992A (en) * 2009-08-25 2011-03-02 Zarlink Semiconductor Inc Reduction of clicking sounds in audio data streams
US20110087494A1 (en) 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
JP5247937B2 (ja) * 2009-10-20 2013-07-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号符号器、オーディオ信号復号器、エイリアシング消去を用いたオーディオ信号の符号化又は復号化方法
ES2706061T3 (es) * 2010-01-13 2019-03-27 Voiceage Corp Decodificación de audio con cancelación directa de distorsión por repliegue espectral en el dominio del tiempo usando filtrado predictivo lineal
CA2804548C (en) * 2010-07-08 2016-06-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Coder using forward aliasing cancellation
WO2013056388A1 (en) * 2011-10-18 2013-04-25 Telefonaktiebolaget L M Ericsson (Publ) An improved method and apparatus for adaptive multi rate codec
US20140058737A1 (en) * 2011-10-28 2014-02-27 Panasonic Corporation Hybrid sound signal decoder, hybrid sound signal encoder, sound signal decoding method, and sound signal encoding method
US20140046670A1 (en) 2012-06-04 2014-02-13 Samsung Electronics Co., Ltd. Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same
JP5740362B2 (ja) * 2012-07-31 2015-06-24 日本電信電話株式会社 雑音抑圧装置、方法、及びプログラム
EP2959482B1 (en) * 2013-02-20 2019-05-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap
CN107835483B (zh) 2014-01-03 2020-07-28 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
US9634624B2 (en) 2014-12-24 2017-04-25 Stmicroelectronics S.R.L. Method of operating digital-to-analog processing chains, corresponding device, apparatus and computer program product
CN107517593B (zh) * 2015-02-26 2021-03-12 弗劳恩霍夫应用研究促进协会 用于使用目标时域包络来处理音频信号以获得经处理的音频信号的装置和方法
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3067887A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US10504525B2 (en) * 2015-10-10 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive forward error correction redundant payload generation
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
US9959877B2 (en) * 2016-03-18 2018-05-01 Qualcomm Incorporated Multi channel coding
US20230123620A1 (en) 2016-09-15 2023-04-20 Circlesx Llc System and Method for Trading Emissions Units
US10210874B2 (en) 2017-02-03 2019-02-19 Qualcomm Incorporated Multi channel coding
US10380989B1 (en) * 2018-02-22 2019-08-13 Cirrus Logic, Inc. Methods and apparatus for processing stereophonic audio content

Also Published As

Publication number Publication date
US11804229B2 (en) 2023-10-31
CA3179294A1 (en) 2020-05-14
CA3118786A1 (en) 2020-05-14
JP7275217B2 (ja) 2023-05-17
JP7341194B2 (ja) 2023-09-08
US20210256983A1 (en) 2021-08-19
CN113272896B (zh) 2024-06-28
ZA202103740B (en) 2022-06-29
AU2022279391A1 (en) 2023-01-19
AR116991A1 (es) 2021-06-30
JP2022511682A (ja) 2022-02-01
CA3179298A1 (en) 2020-05-14
EP3877976A1 (en) 2021-09-15
WO2020094668A1 (en) 2020-05-14
PL3877976T3 (pl) 2024-04-08
JP7258135B2 (ja) 2023-04-14
CN113272896A (zh) 2021-08-17
AU2022279390B2 (en) 2024-02-29
SG11202104612TA (en) 2021-06-29
AU2019374400A1 (en) 2021-06-24
EP3877976C0 (en) 2023-11-15
JP2022014459A (ja) 2022-01-19
AU2022279391B2 (en) 2024-06-13
AU2019374400B2 (en) 2023-01-19
TWI738106B (zh) 2021-09-01
US11990146B2 (en) 2024-05-21
MX2021005233A (es) 2021-06-18
WO2020094263A1 (en) 2020-05-14
EP4207191A1 (en) 2023-07-05
US11948590B2 (en) 2024-04-02
EP3877976B1 (en) 2023-11-15
EP4207190A1 (en) 2023-07-05
AU2022279390A1 (en) 2023-01-19
US20240013794A1 (en) 2024-01-11
KR20210093930A (ko) 2021-07-28
US20210256984A1 (en) 2021-08-19
BR112021008802A2 (pt) 2021-08-10
TW202025140A (zh) 2020-07-01
JP2022014460A (ja) 2022-01-19
CA3118786C (en) 2024-03-12
AU2024202899A1 (en) 2024-05-23
US20210256982A1 (en) 2021-08-19

Similar Documents

Publication Publication Date Title
ES2930103T3 (es) Codificador que utiliza cancelación del efecto de solapamiento hacia delante
ES2774492T3 (es) Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de error que modifica una señal de excitación de dominio de tiempo
ES2825032T3 (es) Cancelación de solapamiento de dominio de tiempo directo con aplicación en dominio de señal original o ponderado
EP2901446B1 (en) Position-dependent hybrid domain packet loss concealment
ES2746034T3 (es) Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de error sobre la base de una señal de excitación de dominio de tiempo
ES2874629T3 (es) Unidad de ocultación de error, decodificador de audio y método y programa informático relacionados que desvanecen una trama de audio ocultada según factores de amortiguamiento diferentes para bandas de frecuencia diferentes
ES2870959T3 (es) Unidad de ocultación de error, decodificador de audio y método relacionado y programa informático que usa características de una representación decodificada de una trama de audio decodificada apropiadamente
JP7128151B2 (ja) スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム
ES2967262T3 (es) Aparato y procesador de señal de audio, para proporcionar una representación de la señal de audio procesada, decodificador de audio, codificador de audio, procedimientos y programas informáticos
ES2922975T3 (es) Codificador, decodificador y procedimientos para la conmutación de señal adaptable de la relación de superposición en la codificación por transformada de audio
RU2575809C2 (ru) Кодер, использующий прямое подавление помех дискретизации