ES2965741T3 - Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha - Google Patents

Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha Download PDF

Info

Publication number
ES2965741T3
ES2965741T3 ES18742830T ES18742830T ES2965741T3 ES 2965741 T3 ES2965741 T3 ES 2965741T3 ES 18742830 T ES18742830 T ES 18742830T ES 18742830 T ES18742830 T ES 18742830T ES 2965741 T3 ES2965741 T3 ES 2965741T3
Authority
ES
Spain
Prior art keywords
pass filter
signal
channel
schroeder
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18742830T
Other languages
English (en)
Inventor
Jan Büthe
Franz Reutelhuber
Sascha Disch
Guillaume Fuchs
Markus Multrus
Ralf Geiger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2965741T3 publication Critical patent/ES2965741T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Filters And Equalizers (AREA)

Abstract

Un aparato para decodificar una señal multicanal codificada comprende: un decodificador de canal base (700) para decodificar un canal base codificado para obtener un canal base decodificado; un filtro de descorrelación (800) para filtrar al menos una parte del canal base decodificado para obtener una señal de llenado; y un procesador multicanal (900) para realizar un procesamiento multicanal usando una representación espectral del canal base decodificado y una representación espectral de la señal de llenado, en donde el filtro de descorrelación (800) es un filtro de banda ancha y el procesador multicanal (900) es configurado para aplicar un procesamiento de banda estrecha a la representación espectral del canal base decodificado y la representación espectral de la señal de llenado. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha
[0001] La presente invención está relacionada con el procesamiento de audio y, en particular, con el procesa miento de audio multicanal dentro de un aparato o un procedimiento para decodificar una señal multicanal codificada.
[0002] El códec del estado de la técnica para la codificación paramétrica de señales estéreo a baja tasa de bits es el códec MPEG xhE-AAC. Este presenta un modo de codificación totalmente estéreo paramétrico en base a una diferencia de nivel entre canales (ILD) de parámetros mono de mezcla descendente y estéreo y una coherencia entre canales (ICC) que se estiman en sub-bandas. La salida se sintetiza a partir de la mezcla descendente mono mediante la formación de matrices en cada sub-banda con la señal de sub-banda de mezcla descendente y una versión decorrelacionada de esta señal de sub-banda de mezcla descendente que se obtiene por la aplicación de filtros de sub-banda dentro del banco de filtros QMF.
[0003] Existen algunos inconvenientes relacionados con xHE-AAC para codificar elementos de habla. Los filtros mediante los cuales se genera la segunda señal sintética producen una versión muy reverberante de la señal de entrada, lo que requiere un atenuador. Por lo tanto, el procesamiento dispersa en gran medida la forma espectral de la señal de entrada a lo largo del tiempo. Esto funciona bien para muchos tipos de señales, excepto para las señales de habla, donde la envolvente espectral cambia rápidamente, esto provoca una colo ración no natural y artefactos audibles, tales comodoble vozovoz fantasma.Además, los filtros dependen de la resolución temporal del banco de filtros QMF subyacente, que cambia con la tasa de muestreo. Por lo tanto, la señal de salida no es uniforme para diferentes tasas de muestreo.
[0004] Además de esto, el códec 3GPP AMR-WB+ incorpora un modo estéreo semi-paramétrico que soporta tasas de bits de 7 a 48kbit/s. Está basado en una transformación centro/lateral del canal de entrada izquierdo y derecho. En el intervalo de bajas frecuencias, la señal lateral s es predicha por la señal centralmpara obtener una ganancia de equilibrio ymy el residual de predicción se codifican y transmiten, junto con el coeficiente de predicción, al decodificador. En el intervalo de medias frecuencias, sólo la señal de mezcla des cendentemse codifica y la señal que falta s se predice a partir demusando un filtro FIR de bajo orden, que se calcula en el codificador. Esto se combina con una extensión del ancho de banda para ambos canales. El códec produce generalmente un sonido más natural que xHE-AAC para el habla, pero se enfrenta a varios problemas. El procedimiento de predicción de s mediantempor un filtro FIR de bajo orden no funciona muy bien si los canales de entrada están sólo débilmente correlacionados, tal y como es el caso, por ejemplo, de las señales de habla con eco o dobles. Asimismo, el códec no es capaz de manejar señales fuera de fase, lo que puede llevar a pérdidas sustanciales de calidad, y se observa que la imagen estéreo de la salida decodificada está usualmente muy comprimida. Además, el procedimiento no es completamente paramétrico y, por lo tanto, no es eficiente en términos de tasa de bits.
[0005] Generalmente, un procedimiento completamente paramétrico puede resultar en degradaciones en la calidad del audio debido a que cualquier parte de señal perdida debido a la codificación paramétrica no se reconstruye en el lado del decodificador.
[0006] Por otra lado, los procedimientos para preservar la forma de onda, tales como la codificación centro/lateral o similares, no permiten ahorros sustanciales de tasas de bits como los que se pueden obtener a partir de codificadores multicanal paramétricos.
[0007] Para decorrelacionar una señal de audio, la publicación BALIK M: "Optimized structure for multichannel digital reverberation", WSEAS TRANSACTIONS ON ACOUSTICS AND MUSIC, vol. 1, n° 1, con fecha de 1 de Enero de 2004 (2004-01-01), páginas 62-68, XP008093459, ISSN: 1109-9577, propone varias arqui tecturas que utilizan filtros paso-todo en cascada y anidados. Para el mismo fin, el documento de patente EP 3 046339 A1 (HUAWEI TECH CO LTD [CN]) con fecha de 20 de Julio de 2016 (2016-07-20) describe una cas cada de filtros paso-todo y proporciona además indicaciones sobre la manera de establecer los valores de retraso de estos filtros.
[0008] Es un objeto de la presente invención proporcionar un concepto mejorado para decorrelacionar una señal de audio.
[0009] Este objeto se logra mediante un decorrelador de señal audio según la reivindicación 1, un pro cedimiento para decorrelacionar una señal de entrada de audio según la reivindicación 10 o un programa de ordenador según la reivindicación 35.
[0010] La presente invención se basa en la constatación de que un enfoque mixto es útil para decodificar una señal multicanal codificada. Este enfoque mixto se basa en el uso de una señal de relleno generada por un filtro de decorrelación, y esta señal de relleno es utilizada entonces por un procesador multicanal, como un procesador multicanal paramétrico u otro, para generar la señal multicanal decodificada. En particular, el filtro de decorrelación es un filtro de banda ancha y el procesador multicanal está configurado para aplicar un pro cesamiento de banda estrecha a la representación espectral. Por lo tanto, la señal de relleno generada preferiblemente en el dominio del tiempo por un procedimiento de filtro pasa-todo, por ejemplo, y el procesamiento multicanal tiene lugar en el dominio espectral mediante la representación espectral de la señal de relleno gene rada a partir de la señal de relleno calculada en el dominio del tiempo.
[0011]Por lo tanto, las ventajas del procesamiento multicanal en el dominio de la frecuencia, por un lado, y la decorrelación en el dominio del tiempo, por otro lado, se combinan de forma útil para obtener una señal multicanal decodificada que presenta una alta calidad de audio. No obstante, la tasa de bits para transmitir la señal multicanal codificada se mantiene tan baja como sea posible debido a que la señal multicanal codificada no es típicamente un formato de codificación que preserva la forma de onda, sino, por ejemplo, un formato de codificación multicanal paramétrico. Por lo tanto, para generar la señal de relleno, sólo se utilizan datos disponibles en el decodificador, como el canal de base decodificado y, en ciertas realizaciones, parámetros estéreo adicionales, como un parámetro de ganancia o un parámetro de predicción o, alternativamente, ILD, ICC o cualquier otro parámetro estéreo conocido en la técnica.
[0012]A continuación, se exponen varias realizaciones preferidas. La forma más eficaz de codificar señales estéreo consiste en utilizar los procedimientos paramétricos, como Codificación de Indicación Binaural o Estéreo Paramétrico. Estos procedimientos tienen como objetivo reconstruir la impresión espacial a partir de una mezcla descendente mono mediante la restauración de varias indicaciones espaciales en sub-bandas y, como tal, se basan en la psicoacústica. Existe otra forma de mirar los procedimientos paramétricos: se trata simplemente de modelar de forma paramétrica un canal por otro, tratando de explotar la redundancia entre canales. De esta manera, se puede recuperar parte del canal secundario a partir del canal primario, pero uno generalmente se queda con un componente residual. Si se omite este componente, esto lleva usualmente a una imagen estéreo inestable de la salida decodificada. Por lo tanto, es necesario rellenar con un reemplazo adecuado tales componentes residuales. Dado que tal reemplazo esciego,es más seguro tomar dichas partes de una segunda señal que presenta propiedades temporales y espectrales similares a aquellas de la señal de mezcla descendente.
[0013]Por lo tanto, las realizaciones de la presente invención son particularmente útiles en el contexto del codificador de audio paramétrico y, en particular, el decodificador de audio paramétrico donde los reemplazos de partes residuales que faltan se extraen de una señal artificial generada por un filtro de decorrelación en el lado del decodificador.
[0014]Otras realizaciones están relacionadas con procedimientos para generar la señal artificial. Las realiza ciones se refieren a procedimientos para generar un segundo canal artificial del cual se extraen los reemplazos para las partes residuales que faltan y su uso en un codificador estéreo completamente paramétrico, denominado Relleno Estéreo mejorado. La señal es más adecuada para codificar señales de habla que la señal xHE-AAC, dado que su forma espectral es temporalmente más cercana a la señal de entrada. Esta se genera en el dominio del tiempo aplicando una estructura de filtro especial, y por lo tanto, independiente del banco de filtros en el cual se realiza la mezcla ascendente estéreo. Por lo tanto, se puede utilizar en diferentes procedimientos de mezcla ascendente. Po dría utilizarse, por ejemplo, en xHE-AAC para reemplazar las señales artificiales después de la transformación al dominio QMF, lo que mejoraría el rendimiento para el habla, así como en el intervalo central de AMR-WB+ para representar el residual en la predicción centro/lateral, lo cual mejoraría el rendimiento de canales de entrada débil mente correlacionados y mejoraría la imagen estéreo. Esto es de especial interés para los códecs que presentan diferentes modos estéreo (como el procesamiento estéreo en el dominio del tiempo y en el dominio de la frecuencia).
[0015]En realizaciones preferidas, el filtro de decorrelación comprende al menos una célula de filtro pasa-todo, donde la al menos una célula de filtro pasa-todo comprende dos células de filtro pasa-todo de Schroeder anidadas en un tercer filtro pasa-todo de Schroeder, y/o el filtro pasa-todo comprende al menos una célula de filtro pasa-todo, donde la célula de filtro pasa-todo comprende dos filtros pasa-todo de Schroeder en cascada, donde una entrada en el primer filtro pasa-todo de Schroeder en cascada y una salida del segundo filtro pasa-todo de Schroeder en cascada están conectadas, en la dirección del flujo de la señal, antes de una fase de retraso del tercer filtro pasa-todo de Schroeder.
[0016]En otra realización, varias de tales células de filtro pasa-todo que comprenden tres filtros pasatodo de Schroeder anidados están dispuestas en cascada para obtener un filtro pasa-todo específicamente útil que presenta una buena respuesta al impulso a los fines de la decodificación estéreo o multicanal.
[0017]Cabe hacer hincapié en que, si bien diversos aspectos de la presente invención se exponen con respecto a la decodificación estéreo que genera, a partir de un canal de base mono, un canal izquierdo de mezcla ascendente y un canal derecho de mezcla ascendente, la presente invención se puede aplicar también a la decodificación multicanal, donde una señal de, por ejemplo, cuatro canales se codifica mediante dos cana les de base, donde los primeros dos canales de mezcla ascendente se generan a partir del primer canal de base y el tercer y el cuarto canal de mezcla ascendente se generan a partir del segundo canal de base. En otras alternativas, la presente invención también resulta útil para generar, a partir un solo canal de base, tres o más canales de mezcla ascendente preferiblemente mediante la misma señal de relleno. En todos estos pro cedimientos, sin embargo, la señal de relleno se genera al modo de banda ancha, es decir, preferiblemente en el dominio del tiempo, y el procesamiento multicanal para generar, a partir del canal de base decodificado, los dos o más canales de mezcla ascendente se realiza en el dominio de la frecuencia.
[0018]El filtro de decorrelación funciona preferiblemente completamente en el dominio del tiempo. No obstante, otros enfoques híbridos resultan también útiles cuando, por ejemplo, la decorrelación se realiza me diante la decorrelación de una parte de banda baja, por un lado, y una parte de banda alta, por otro lado, mientras que, por ejemplo, el procesamiento multicanal se realiza en una resolución espectral mucho más alta. Por lo tanto, a modo de ejemplo, la resolución espectral del procesamiento multicanal puede ser, por ejemplo, tan alta como al procesar cada línea DFT o FFT individualmente, y se proporcionan los datos paramétricos para varias bandas, donde cada banda comprende, por ejemplo, dos, tres o muchas más líneas DFT/FFT/MDCT, y el filtrado del canal de base decodificado para obtener la señal de relleno se realiza al modo de banda ancha, es decir, en el dominio del tiempo o al modo de banda semi-ancha, por ejemplo, dentro de una banda baja y una banda alta o, probablemente dentro de tres bandas distintas. Por lo tanto, en cualquier caso, la resolución espectral del procesamiento estéreo que se realiza típicamente para líneas individuales o señales de sub-banda es la más alta resolución espectral. Típicamente, los parámetros estéreo generados en un codificador y trans mitidos y utilizados por el decodificador preferido presentan una resolución espectral media. Por lo tanto, los parámetros se proporcionan para bandas, las bandas pueden tener anchos de banda variables, pero cada banda comprende al menos dos o más líneas o señales de sub-banda generadas y utilizadas por los procesadores multicanal. Y, la resolución espectral del filtrado de decorrelación es muy baja y, en el caso del filtrado en el dominio del tiempo, extremadamente baja o es media, en el caso de generar diferentes señales decorrela cionadas para diferentes bandas, pero esta resolución espectral media sigue siendo más baja que la resolución en la cual se proporcionan los parámetros para el procesamiento paramétrico.
[0019]En una realización preferida, la característica de filtro del filtro de decorrelación es un filtro pasatodo que presenta una región de magnitud constante sobre la totalidad del intervalo espectral de interés. No obstante, también son útiles otros filtros de decorrelación que no tienen este comportamiento de filtro pasa-todo ideal, siempre y cuando, en una realización preferida, una región de magnitud constante de la característica del filtro sea mayor que una granularidad espectral de la representación espectral del canal de base decodificado y la granularidad espectral de la representación espectral de la señal de relleno.
[0020]Por lo tanto, se asegura que la granularidad espectral de la señal de relleno o del canal de base decodificado sobre el cual se realiza el procesamiento multicanal no ejerce ninguna influencia sobre el filtrado de decorrelación, de modo que se genera una señal de relleno de alta calidad, preferiblemente ajustada mediante un factor de normalización de energía y utilizada para generar los dos o más canales de mezcla ascen dente.
[0021]Además, cabe destacar que la generación de una señal decorrelacionada, tal y como se describió con respecto a las Figs. 4, 5 o 6 que se comentan a continuación, se puede utilizar en el contexto de un decodificador multicanal, pero también se puede utilizar en cualquier otra aplicación, donde una señal decorrelacio nada es útil, como en cualquier representación de señal de audio, cualquier operación de reverberación, etc.
[0022]A continuación se describen las realizaciones preferidas con respecto a los dibujos adjuntos, en los que:
La Fig. 1a ilustra la generación de una señal artificial cuando se utiliza con un codificador de núcleo EVS; La Fig. 1b ilustra la generación de una señal artificial cuando se utiliza con un codificador de núcleo EVS según una realización diferente;
La Fig. 2a ilustra la integración en un procesamiento estéreo DFT que incluye la mezcla ascendente de extensión de ancho de banda en el dominio del tiempo;
La Fig. 2b ilustra una integración en un procesamiento estéreo DFT que incluye la mezcla ascendente de ex tensión de ancho de banda en el dominio del tiempo según una realización diferente;
La Fig. 3 ilustra una integración en un sistema que presenta múltiples unidades de procesamiento estéreo; La Fig. 4 ilustra una unidad pasa-todo básica;
La Fig. 5 ilustra una unidad de filtro pasa-todo;
La Fig. 6 ilustra una respuesta al impulso de un filtro pasa-todo preferido;
La Fig. 7a ilustra un aparato para decodificar una señal multicanal codificada;
La Fig. 7b ilustra una implementación preferida de un filtro de decorrelación;
La Fig. 7c ilustra una combinación de un decodificador de canal de base y un convertidor espectral;
La Fig. 8 ilustra una implementación preferida de un procesador multicanal;
La Fig. 9a ilustra otra implementación del aparato para decodificar una señal multicanal codificada mediante un procesamiento de extensión de ancho de banda;
La Fig. 9b ilustra realizaciones preferidas para generar un factor de normalización de energía comprimido; La Fig. 10 ilustra un aparato para decodificar una señal multicanal codificada según otra realización que funciona mediante una transformación de canal en el decodificador de canal de base;
La Fig. 11 ilustra la cooperación entre un remuestreador para el decodificador de canal de base y el filtro de decorrelación conectado a continuación;
La Fig. 12 ilustra un ejemplo de codificador multicanal paramétrico útil con el aparato para decodificar según la presente invención;
La Fig. 13 ilustra una implementación preferida del aparato para decodificar una señal multicanal codificada; y La Fig. 14 ilustra otra implementación preferida del procesador multicanal.
[0023]La Fig. 7a ilustra una realización preferida de un aparato para decodificar una señal multicanal codificada. La señal multicanal codificada comprende un canal de base codificado que se introduce en un decodificador de canal de base 700 para decodificar el canal de base codificado para obtener un canal de base decodificado.
[0024]Además, el canal de base decodificado se introduce en un filtro de decorrelación 800 para filtrar al menos una parte del canal de base decodificado para obtener una señal de relleno.
[0025]Tanto el canal de base decodificado como la señal de relleno se introducen en un procesador multicanal 900 para realizar un procesamiento multicanal mediante una representación espectral del canal de base decodificado y, además, una representación espectral de la señal de relleno. El procesador multicanal emite la señal multicanal decodificada que comprende, por ejemplo, un canal de mezcla ascendente izquierdo y un canal de mezcla ascendente derecho en el contexto del procesamiento estéreo de tres o más canales de mezcla ascendente en el caso de que el procesamiento multicanal abarque más de dos canales de salida.
[0026]El filtro de decorrelación 800 está configurado como un filtro de banda ancha, y el procesador multicanal 900 está configurado para aplicar un procesamiento de banda estrecha a la representación espectral del canal de base decodificado y la representación espectral de la señal de relleno. Es importante destacar que se realiza también el filtrado de banda ancha cuando la señal que se debe filtrar se sub-muestrea desde una tasa de muestreo más elevada, tal como sub-muestreada a 16 kHz o 12,8 kHz desde una tasa de muestreo más elevada, tal como 22 kHz o inferior.
[0027]Por lo tanto, el procesador multicanal opera en una granularidad espectral que es significativa mente más elevada que una granularidad espectral con la cual se genera la señal de relleno. En otras palabras, una característica de filtro del filtro de decorrelación se selecciona de modo que la región de una magnitud constante de la característica de filtro sea mayor que una granularidad espectral de la representación espectral del canal de base decodificado y una granularidad espectral de la representación espectral de la señal de relleno.
[0028]Por lo tanto, por ejemplo, cuando la granularidad espectral del procesador multicanal es tal que, para cada línea espectral de, por ejemplo, un espectro DFT de 1024 líneas se realiza el procesamiento de mezcla ascendente, el filtro de decorrelación se define de modo que la región de magnitud constante de la característica de filtro del filtro de decorrelación tenga un ancho de frecuencia que es mayor que dos o más líneas espectrales del espectro DFT. Típicamente, el filtro de decorrelación opera en el dominio del tiempo, y la banda espectral utilizada, por ejemplo, de 20 Hz a 20 kHz. Tales filtros son conocidos como filtros pasa-todo, y cabe destacar que típicamente no se puede obtener un intervalo de magnitud perfectamente constante donde la magnitud es perfectamente constante mediante filtros pasa-todo, pero también se puede constatar que variaciones de una magnitud constante de /- 10 % de un valor promedio pueden ser útiles para un filtro pasatodo y, por lo tanto, también representan una "magnitud constante de la característica de filtro".
[0029]La Fig. 7b ilustra una implementación del filtro de decorrelación 800 con una fase de filtro en el dominio del tiempo 802 y el convertidor espectral 804 conectado a continuación que genera una representación espectral de la señal de relleno. El convertidor espectral 804 se implementa típicamente como un procesador FFT o DFT, aunque otros algoritmos de conversión en el dominio de tiempo-frecuencia también resultan ser útiles.
[0030]La Fig. 7c ilustra una implementación preferida de la cooperación entre el decodificador de canal de base 700 y un convertidor espectral de canal de base 902. Típicamente, el decodificador de canal de base está configurado para operar como un decodificador de canal de base en el dominio del tiempo que genera una señal de canal de base en el dominio del tiempo, mientras que el procesador multicanal 900 opera en el dominio espectral. Por lo tanto, el procesador multicanal 900 de la Fig. 7a presenta, como una fase de entrada, el con vertidor espectral de canal de base 902 de la Fig. 7c, y la representación espectral del convertidor espectral de canal de base 902 se envía entonces a los elementos de procesamiento de procesador multicanal ilustrados, por ejemplo, en la Fig. 8, Fig. 13, Fig.14, Fig. 9a o la Fig. 10. En este contexto, cabe destacar que, en general, los números de referencia que empiezan por "7" representan elementos que pertenecen preferiblemente al decodificador de canal de base 700 de la Fig. 7a. Los elementos que tienen un número de referencia que empieza por "8" pertenecen preferiblemente al filtro de decorrelación 800 de la Fig. 7a, y los elementos con un número de referencia que empieza por "9" en las figuras pertenecen preferiblemente al procesador multicanal 900 de la Fig. 7a. No obstante, cabe destacar aquí que las separaciones entre los elementos individuales sólo se realizan para describir la presente invención, pero que cualquier implementación real puede tener bloques de procesamiento típicamente hardware o alternativamente software o hardware/software mezclados que se separan de una forma diferente de la separación lógica ilustrada en la Fig. 7a y otras figuras.
[0031]La Fig. 4 ilustra una implementación preferida de la fase de filtro 802 que se indica como 802'. En particular, la Fig. 4 ilustra una unidad pasa-todo básica que se puede incluir en el filtro de decorrelación sola o junto con más de tales unidades pasa-todo en cascada, tal y como viene ilustrado, por ejemplo, en la Fig. 5. La Fig. 5 ilustra el filtro de decorrelación 802 con cinco ejemplares de unidades pasa-todo básicas en cascada 502, 504, 506, 508, 510, mientras que cada una de las unidades pasa-todo básicas se puede implementar como viene señalado en la Fig. 4. Alternativamente, sin embargo, el filtro de decorrelación puede incluir una sola unidad pasa-todo básica 403 de la Fig. 4 y, por lo tanto, representa una implementación alternativa de la fase del filtro de decorrelación 802'.
[0032]Preferiblemente, cada unidad pasa-todo básica comprende dos filtros pasa-todo de Schroeder 401, 402 anidados en un tercer filtro pasa-todo de Schroeder 403. En esta implementación, la célula de filtro pasa-todo 403 está conectada con dos filtros pasa-todo de Schroeder en cascada 401, 402, donde la entrada en el primer filtro pasa-todo de Schroeder en cascada 401 y una salida del segundo filtro pasa-todo de Schroe der en cascada 402 se conectan en la dirección del flujo de la señal, antes de una fase de retraso 423 del tercer filtro pasa-todo de Schroeder.
[0033]En particular, el filtro pasa-todo ilustrado en la Fig. 4 comprende: un primer sumador 411, un se gundo sumador 412, un tercer sumador 413, un cuarto sumador 414, un quinto sumador 415 y un sexto sumador 416; una primera fase de retraso 421, una segunda fase de retraso 422 y una tercera fase de retraso 423; una primera alimentación hacia delante 431 con una primera ganancia hacia delante, una primera alimentación hacia atrás 441 con una primera ganancia hacia atrás, una segunda alimentación hacia delante 442 con una segunda ganancia hacia delante y una segunda alimentación hacia atrás 432 con una segunda ganancia hacia atrás; y una tercera alimentación hacia delante 443 con una tercera ganancia hacia delante y una tercera ali mentación hacia atrás 433 con una tercera ganancia hacia atrás.
[0034]Las conexiones se ilustran en la Fig. 4 y son como sigue: La entrada en el primer sumador 411 representa una entrada en el filtro pasa-todo 802, donde una segunda entrada en el primer sumador 411 está conectada con una salida de la tercera fase de filtro de retraso 423 y comprende la tercera alimentación hacia atrás 433 con una tercera ganancia hacia atrás. La salida del primer sumador 411 está conectada con una entrada en el segundo sumador 412 y está conectada con una entrada del sexto sumador 416 mediante la tercera alimentación hacia delante 443 con la tercera ganancia hacia delante. La entrada en el segundo suma dor 412 está conectada con la primera fase de retraso 421 mediante una primera alimentación hacia atrás 441 con la primera ganancia hacia atrás. La salida del segundo sumador 412 está conectada con una entrada de la primera fase de retraso 421 y está conectada con una entrada del tercer sumador 413 mediante la primera alimentación hacia delante 431 con la primera ganancia hacia delante. La salida de la primera fase de retraso 421 está conectada con otra entrada del tercer sumador 413. La salida del tercer sumador 413 está conectada con una entrada del cuarto sumador 414. La otra entrada en el cuarto sumador 414 está conectada con una salida de la segunda fase de retraso 422 mediante la segunda alimentación hacia atrás 432 con la segunda ganancia hacia atrás. La salida del cuarto sumador 414 está conectada con una entrada en la segunda fase de retraso 422 y está conectada con una entrada en el quinto sumador 415 mediante la segunda alimentación hacia delante 442 con la segunda ganancia hacia delante. La salida de la segunda fase de retraso 421 está conectada con otra entrada en el quinto sumador 415. La salida del quinto sumador 415 está conectada con una entrada de la tercera fase de retraso 423. La salida de la tercera fase de retraso 423 está conectada con una entrada en el sexto sumador 416. La otra entrada en el sexto sumador 416 está conectada con una salida del primer sumador 411 mediante la tercera alimentación hacia delante 443 con la tercera ganancia hacia de lante. La salida del sexto sumador 416 representa una salida del filtro pasa-todo 802.
[0035]Preferiblemente, tal y como se ilustra en la Fig. 8, el procesador multicanal 900 está configurado para determinar un primer canal de mezcla ascendente y un segundo canal de mezcla ascendente mediante diferentes combinaciones ponderadas de bandas espectrales del canal de base decodificado y de las corres pondientes bandas espectrales de la señal de relleno. En particular, las diferentes combinaciones ponderadas dependen de un factor de predicción y/o de un factor de ganancia derivado de la información paramétrica codi ficada incluida dentro de la señal multicanal codificada. Además, las combinaciones ponderadas dependen preferiblemente de un factor de normalización de la envolvente o, preferiblemente de un factor de normalización de energía calculado mediante una banda espectral del canal de base decodificado y de la correspondiente banda espectral de la señal de relleno. Por lo tanto, el procesador 904 de la Fig. 8 recibe la representación espectral del canal de base decodificado y la representación espectral de la señal de relleno y emite, preferi blemente en el dominio del tiempo, un primer canal de mezcla ascendente y un segundo canal de mezcla ascendente, y el factor de predicción, el factor de ganancia, y el factor de normalización de energía se introducen de una manera por banda y estos factores se utilizan entonces para todas las líneas espectrales dentro de una banda, pero cambian para una banda diferente, donde esta información se recupera de la señal codificada o determinada localmente en el decodificador.
[0036] En particular, el factor de predicción y el factor de ganancia representan típicamente parámetros codificados que se decodifican en el lado del decodificador y, a continuación, se utilizan en la mezcla ascen dente estéreo paramétrica. Al contrario, el factor de normalización de energía se calcula en el lado del decodi ficador típicamente mediante una banda espectral del canal de base decodificado y la banda espectral de la señal de relleno. Lo mismo vale para el factor de normalización de la envolvente. Preferiblemente, la normali zación de la envolvente corresponde a una normalización de energía por banda.
[0037] Aunque la presente invención viene expuesta con el codificador de referencia específico ilustrado en la Fig. 12 y el decodificador específico ilustrado en la Fig. 13 o la Fig. 14, cabe destacar, no obstante, que también se puede aplicar la generación de una señal de relleno de banda ancha y la aplicación de la señal de relleno de banda ancha en el decodificador estéreo multicanal que opera en un dominio espectral de banda estrecha a cualquier otra técnica de codificación estéreo paramétrica conocida en la técnica. Estas son herra mientas de codificación estéreo paramétrica conocidas de la norma HE-AAC o de la norma MPEG envolvente o de Codificación de Indicación Binaural (codificación BCC) o cualquier otra herramienta de codificación/decodificación estéreo o cualquier otra herramienta de codificación/decodificación multicanal.
[0038] La Fig. 9a ilustra otra realización preferida del decodificador multicanal que comprende una fase de procesador multicanal 904 que genera un primer canal de mezcla ascendente y un segundo canal de mezcla ascendente y elementos de extensión de ancho de banda en el dominio del tiempo conectados posteriormente 908, 910 que realizan de forma individual una extensión del ancho de banda en el dominio del tiempo de forma guiada o no guiada al primer canal de mezcla ascendente y al segundo canal de mezcla ascendente. Típicamente, se prevé un formador en ventanas y calculador de factor de normalización de energía 912 para calcular un factor de normalización de energía que va a ser utilizado por el procesador multicanal 904. En realizaciones alternativas que se exponen con respecto a la Fig. 1a o la Fig. 1b y la Fig. 2a o la Fig. 2b, no obstante, la extensión del ancho de banda se realiza con la señal de núcleo mono o decodificada, y sólo un único elemento de procesamiento estéreo 960 de la Fig. 2a o la Fig. 2b está previsto para generar, a partir de la señal mono de banda alta, una señal de canal izquierdo de banda alta y una señal de canal derecho de banda alta que se añaden a la señal de canal izquierdo de banda baja y a la señal de canal derecho de banda baja con el uso de los sumadores 994a y 994b.
[0039] Esta adición que se ilustra en la Fig. 2a o 2b puede, por ejemplo, realizarse en el dominio del tiempo. A continuación, el bloque 960 genera una señal en el dominio del tiempo. Esta es la implementación preferida. No obstante, alternativamente, el procesamiento estéreo 904 en la Fig. 2a o 2b y las señales de canal izquierdo y de canal derecho del bloque 960 se pueden generar en el dominio espectral, y los sumadores 994a y 994b son implementados, por ejemplo, por un banco de filtros de síntesis de modo que los datos de banda baja del bloque 904 se introducen en la entrada de banda baja del banco de filtros de síntesis y la salida de banda alta del bloque 960 se introduce en la entrada de banda alta del banco de filtros de síntesis y la salida del banco de filtros de síntesis es la señal del canal izquierdo en el dominio del tiempo correspondiente o una señal del canal derecho en el dominio del tiempo.
[0040] Preferiblemente, el formador en ventanas y calculador de factor 912 en la Fig. 9a genera y calcula un valor de energía de la señal de banda alta, como, por ejemplo, viene también ilustrado en 961 en la Fig. 1a o la Fig. 1b y utiliza esta estimación de energía para generar el primer y el segundo canal de mezcla ascendente de banda alta, tal y como se verá más adelante con respecto a las ecuaciones 28 a 31 en una realización preferida.
[0041] Preferiblemente, el procesador 904 para calcular la combinación ponderada recibe, como entrada, el factor de normalización de energía por banda. En una realización preferida, no obstante, se realiza una com presión del factor de normalización de energía y las diferentes combinaciones ponderadas se calculan mediante el factor de normalización de energía comprimido. Por lo tanto, con respecto a la Fig. 8, el procesador 904 recibe, en lugar del factor de normalización de energía no comprimido, un factor de normalización de energía comprimido. Este procedimiento se ilustra, con respecto a diferentes realizaciones, en la Fig. 9b. El bloque 920 recibe una energía de la señal residual o de relleno por bin de tiempo/frecuencia y una energía del canal de base decodificado por bin de tiempo y frecuencia, y calcula entonces un factor de normalización de energía absoluto para una banda que comprende diversos bins de tiempo/frecuencia. A continuación, en el bloque 921, se realiza una compresión del factor de normalización de energía, y esta compresión puede, por ejemplo, ser el uso de una función logarítmica, tal y como se expondrá, por ejemplo, más adelante con respecto a la ecuación 22.
[0042]En base al factor de normalización de energía comprimido generado en el bloque 921, se presen tan diferentes procedimientos para generar el factor de normalización de energía comprimido. En la primera alternativa, se aplica al factor comprimido una función, tal y como ilustrado en 922, y esta función es preferible mente una función no lineal. A continuación, en el bloque 923 el factor evaluado se expande para obtener un factor de normalización de energía comprimido específico. Por consiguiente, el bloque 922, por ejemplo, puede implementarse para la expresión de la función en la ecuación (22) que se presentará más adelante, y el bloque 923 es realizado por la función "exponencial" dentro de la ecuación (22). No obstante, en los bloques 924 y 925 viene presentada una alternativa diferente que resulta en un factor de normalización de energía comprimido similar. En el bloque 924 se determina un factor de evaluación y, en el bloque 925, el factor de evaluación se aplica al factor de normalización de energía obtenido en el bloque 920. Por lo tanto, la aplicación del factor al factor de normalización de energía, tal y como se delinea en el bloque 912, se puede implementar, por ejemplo, mediante la ecuación 27 que se ilustra a continuación.
[0043]Por lo tanto, tal y como se ilustra por ejemplo en la ecuación 27 más adelante, se determina el factor de evaluación y este factor es simplemente un factor que se puede multiplicar por el factor de normaliza ción de energíagnormsegún se determina por el bloque 920 sin realizar realmente evaluaciones de funciones especiales. Por lo tanto, también se puede prescindir del cálculo del bloque 925, es decir, el cálculo específico del factor de normalización de energía comprimido no es necesario, tan pronto como el factor de normalización de energía no comprimido original, y el factor de evaluación y otro operando dentro de una multiplicación, tal como un valor espectral de la señal de relleno, se multiplican entre sí para obtener una línea espectral de la señal de relleno normalizada.
[0044]La Fig. 10 ilustra otra implementación, donde la señal multicanal codificada no es simplemente una señal mono, sino que comprende una señal central codificada y una señal lateral codificada, por ejemplo. En tal situación, el decodificador de canal de base 700 no solo decodifica la señal central codificada y la señal lateral codificada o, en general, la primera señal codificada y la segunda señal codificada, sino que además realiza una transformación de canal 705, por ejemplo, en forma de una transformación centro/lateral y de una transformación centro/lateral inversa para calcular un canal primario tal como L y un canal secundario tal como R, o la transformación es una transformación de Karhunen Loeve.
[0045]Sin embargo, el resultado de la transformación de canal y, en particular, el resultado de la opera ción de decodificación es que el canal primario es un canal de banda ancha, mientras que el canal secundario es un canal de banda estrecha. El canal de banda ancha se introduce entonces en el filtro de decorrelación 800 y, se realiza un filtrado de paso alto en el bloque 930 para generar una señal de paso alto decorrelacionada y esta señal de paso alto decorrelacionada se añade al canal secundario de banda estrecha en el combinador de bandas 934 para obtener el canal secundario de banda ancha, de modo que, al final, se emiten el canal primario de banda ancha y el canal secundario de banda ancha.
[0046]La Fig. 11 ilustra otra implementación, donde un canal de base decodificado obtenido por el de codificador del canal de base 700 con una determinada tasa de muestreo asociada con el canal de base codi ficado se introduce en un remuestreador 710 para obtener un canal de base remuestreado que se utiliza en el procesador multicanal que opera sobre el canal remuestreado.
[0047]La Fig. 12 ilustra una implementación preferida de una codificación estéreo de referencia. En el bloque 1200, se calcula una diferencia de fase entre canales IPD para el primer canal, tal como L, y el segundo canal, tal como R. Este valor de IPD se cuantifica y emite, típicamente, para cada banda en cada trama de tiempo como dato de salida de codificador 1206. Además, los valores de<i>P<d>se utilizan para calcular los datos paramétricos para la señal estéreo, tales como un parámetro de prediccióngtbpara cada bandaben cada trama de tiempoty un parámetro de gananciart bpara cada bandaben cada trama de tiempot.
[0048]Además, tanto el primer canal como el segundo también se utilizan en un procesador centro/lateral 1203 para calcular, para cada banda, una señal central y una señal lateral.
[0049]En función de la implementación, sólo la señal centralMse puede enviar a un codificador 1204, y la señal lateral no se envía al codificador 1204, de modo que los datos de salida 1206 sólo comprenden el canal de base codificado, los datos paramétricos generados por el bloque 1202 y la información de IPD generada por el bloque 1200.
[0050]A continuación, se expone una realización preferida con respecto a un codificador de referencia, pero cabe destacar que, como se señaló anteriormente, también se puede utilizar cualquier otro codificador estéreo.
UN CODIFICADOR ESTÉREO DE REFERENCIA
[0051]A modo de referencia, se especifica un codificador estéreo en base a DFT. Como de costumbre, los vectores de tiempo-frecuencia simultáneamenteLtyRtdel canal izquierdo y derecho se generan al aplicar una ventana de análisis seguida de una Transformada Discreta de Fourier. A continuación, los bins de DFT son agrupados en sub-bandas(Lt,k)keIbrespectivamente.(Rt,k)ke Ib, donde Ib designa el conjunto de índices de sub-banda.
[0052] Cálculo de los IPD y Mezcla Descendente.Para la mezcla descendente, se calcula una diferencia de fase entre canales (IPD) por banda como
(1)IPD = arg('Zk£¡b LtkR *t,k),
[0053]Donde z designa el conjugado complejo de z. Esto se utiliza para generar una señal central y lateral por banda
(2)Mtk =e<i^ L t ,fc+ e il>(lPDt,b-k)R
72
y
parakelb,donde p es un parámetro absoluto de rotación de fase, por ejemplo, dado por
(4)p = atan2^ sen{lPDtb),cos{lPDtb)+<2 1 y ¿ ^>.
[0054] Cálculo de parámetros.Además de los IPD por banda, se extraen dos parámetros estéreo adiciona les. El coeficiente óptimo para predecirStbmedianteMtb,es decir, el númerogtbde modo que la energía del resto (5)p t ,k = s t ,k - g t , b M t ,k
sea mínima, y un factor de ganancia relativart bque, si se aplica a la señal central Mt,iguala la energía deptyMten cada banda, es decir,
(6)
[0055]El coeficiente óptimo de predicción puede calcularse a partir de las energías en las sub-bandas
y el valor absoluto del producto interior deLtyRt
( 8 )% L /R , t , b = \ T . k e i b P t , k P * t , k \
como
[0056]De aquí resulta quegtbse sitúa en [-1, 1]. La ganancia residual se puede calcular de modo similar a partir de las energías y del producto interior como
1/2
+ B t , b ) E R , t , b - 2 X L /R, t ,b
<(10) n,b =>(( i - g t ,b )EL,t,b+ { 1
Eíf,b+ E R , t , b 2 X L/ R, t ,b
lo que implica
( i i )0 <n,b < J 1 - g2t,b .
[0057]La Fig. 13 ilustra una implementación preferida del lado del decodificador. En el bloque 700, que representa el decodificador de canal de base de la Fig. 7a, se decodifica el canal de base codificadoM.
[0058]A continuación, en el bloque 940a, se calcula el canal primario de mezcla ascendente, tal como L. Además, en el bloque 940b, se calcula el canal secundario de mezcla ascendente que es, por ejemplo, el canalR.
[0059]Ambos bloques 940a y 940b están conectados con el generador de señal de relleno 800 y reciben los datos paramétricos generados por el bloque 1200 en la Fig. 12 o 1202 en la Fig. 12.
[0060]Preferiblemente, los datos paramétricos se dan en bandas que presentan la segunda resolución espectral y los bloques 940a, 940b operan con una granularidad de resolución espectral elevada y generan líneas espectrales con una primera resolución espectral que es más elevada que la segunda resolución espec tral.
[0061]Las salidas de los bloques 940a, 940b se introducen, por ejemplo, en los convertidores frecuenciatiempo 961, 962. Estos convertidores pueden ser una DFT o cualquier otra transformada, y típicamente comprenden también un procesamiento posterior de ventanas de síntesis y una operación adicional de adición por solapamiento.
[0062]Además, el generador de señal de relleno recibe el factor de normalización de energía y, preferi blemente, el factor de normalización de energía comprimido, y este factor se utiliza para generar una línea espectral de la señal de relleno correctamente nivelada/ponderada para los bloques 940a y 940b.
[0063]A continuación, se proporciona una implementación preferida de los bloques 940a, 940b. Ambos bloques comprenden el cálculo 941a del factor de rotación de fase, el cálculo de un primer peso para la línea espectral del canal de base decodificado, tal y como se indica por 942a y 942b. Además, ambos bloques comprenden el cálculo 943a y 943b para el cálculo del segundo peso para la línea espectral de la señal de relleno.
[0064]Además, el generador de señal de relleno 800 recibe el factor de normalización de energía gene rado por el bloque 945. Este bloque 945 recibe la señal de relleno por banda y la señal de canal de base por banda, y calcula entonces el mismo factor de normalización de energía utilizado para todas las líneas en una banda.
[0065]Finalmente, estos datos se envían al procesador 946 para calcular las líneas espectrales para el primer y el segundo canal de mezcla ascendente. A tal fin, el procesador 946 recibe los datos de los bloques 941a, 941b, 942a, 942b, 943a, 943b y la línea espectral para el canal de base decodificado y la línea espectral para la señal de relleno. La salida del bloque 946 es entonces una línea espectral correspondiente para el primer y el segundo canal de mezcla ascendente.
[0066]A continuación, se proporcionan implementaciones preferidas de un decodificador.
Descodificador de referencia
[0067]Se especifica como referencia un decodificador a base de DFT que corresponde con el codificador descrito más arriba. Se aplica una transformada tiempo-frecuencia de ambos codificadores a la mezcla descendente decodificada que produce los vectores tiempo-frecuenciaMt¡b.Mediante los valores descuantificados /TO^,g-tby ~,6, se calculan el canal izquierdo y el derecho como
(■¡2) ~ (.Mt,k{.1+S't,b)+’' l ,bSnormP't,k)
( )t , k — j 2
y
parakelb,donde ~£,fc es un sustituto del residual que faltaptkdel codificador, ygnormes el factor de normalización de energía
<(>14<)>
que convierte la ganancia de predicción residual relativartben una ganancia absoluta. Una elección simple para p£,fc sería
(15)Pí,k = Mt-dbk,
dondedb >designa un retraso de trama por banda, pero esto presenta ciertos inconvenientes, a saber
• Pt y!Ptpueden tener formas espectrales y temporales muy distintas,
• incluso en el caso de emparejar las envolventes espectral y temporal, el uso de (15) en (12) y (13) induce una ILD y una IPD dependientes de la frecuencia, la cual varía sólo lentamente en el intervalo de frecuencias bajas a medias. Esto ocasiona problemas, por ejemplo, con los elementos tonales,
• para señales de habla, el retraso deberá ser elegido pequeño para permanecer por debajo del umbral de eco, pero esto provoca una fuerte coloración debido al filtro de peine.
[0068]Por lo tanto, es mejor usar los bins de tiempo-frecuencia de la señal artificial que se describen a conti nuación.
[0069]El factor de rotación de fase p se calcula de nuevo como
(16)p=atan2 {sen{lP'Dtb'),cos(lPp)t,b')2-1+p¿j.
Generación de la Señal Sintética
[0070]Para reemplazar las partes residuales que faltan en la mezcla ascendente estéreo, se genera una segunda señal a partir de la señal de entrada en el dominio del tiempom,emitiendo una segunda señalmF.La restricción en el diseño para este filtro consiste en tener una respuesta al impulso corta y densa. Esto se logra apli cando diversas fases de filtros pasa-todo básicos obtenidas mediante el anidado de dos filtros pasa-todo de Schroeder en un tercer filtro de Schroeder, es decir,
(17) B(z) =H ( ( z - d* S ( z ) y J),
donde
(18) g1+z-d< g2+z-1¡2
^ J 1- g lZ- “ 11- g i z - * 2
y
(19)H(z) =9 3 ^ 1
1 - 93 2 - 1'
Estos filtros pasa-todo elementales
<(>20<) 9 2 '>
1- 92 -han sido propuestos por Schroeder en el contexto de la generación de reverberación artificial, donde se aplican tanto con ganancias grandes como con retrasos grandes. Dado que no es deseable en este contexto tener una señal de salida reverberante, las ganancias y los retrasos se seleccionan para que sean más bien pequeños. De modo similar al caso de la reverberación, se obtiene mejor una respuesta al impulso de tipo aleatorio y denso mediante la selección de retrasos que son co-primos por par para todos los filtros pasa-todo.
[0071]El filtro funciona con una tasa de muestreo fija, independientemente del ancho de banda o de la tasa de muestreo de la señal que es suministrada por el codificador de núcleo. Cuando se utiliza con el codifica dor EVS, esto es necesario dado que el ancho de banda puede ser cambiado por un detector de ancho de banda durante la operación y la tasa de muestreo fija garantiza una salida uniforme. La tasa de muestreo preferida para el filtro pasa-todo es de 32 kHz, la tasa de muestreo de banda ultra ancha nativa, dado que la ausencia de partes residuales por encima de 16 kHz usualmente ya no son más audibles. Cuando se utiliza con el codificador EVS, la señal se construye directamente desde el núcleo, lo que incorpora varias rutinas de remuestreo, tal y como se muestra en la Figura 1.
[0072] Un filtro del que se constató que funciona bien con una tasa de muestreo de 32 kHz es
(21)F(z) = nf=i Bt(z)
donde son filtros pasa-todo básicos con las ganancias y los retrasos que se muestran en la Tabla 1. La respuesta al impulso de este filtro se ilustra en la Figura 6. Por motivos de complejidad, sólo se puede aplicar tal filtro con tasas de muestreo inferiores y/o reducir el número de unidades de filtro pasa-todo básico.
[0073] La unidad de filtro pasa-todo también proporciona la funcionalidad de reemplazar partes de la señal de entrada con ceros, lo cual está controlado por el codificador. Esto puede, por ejemplo, utilizarse para eliminar ataques desde la entrada del filtro.
COMPRESIÓN DEL FACTORgnorm
[0074] Para obtener una salida más suave se constató que es beneficioso aplicar un compresor a la ganancia de ajuste de energíagnormque comprime los valores hacia uno. Esto también compensa un poco el hecho de que parte del efecto ambiental se pierde típicamente después de codificar la mezcla descendente con tasas de bits más bajas.
[0075] Tal compresor puede construirse tomando
(22)S-norm = exp
donde,
(23)f(t) = t-¡0c(T)dr
y la funciónccumple
(24)0 < c(t) < 1.
[0076] El valor decalrededor detespecifica cuán fuertemente se comprime esta región, donde el valor 0 corresponde a ninguna compresión y el valor 1 corresponde a la compresión total. Además, el esquema de compre sión es simétrico sicse iguala, es decir,c(t) = c (- t) . Un ejemplo es
(25)c(t) ={¿- a < t < a ,
sino,
lo que da lugar a
(26)f ( t ) = t — max[min{a,t],—a].
[0077] En este caso, (22) se puede simplificar a
(27)
9nonti=dnormmin{Tnax{exp(-a) , 1/¿Jnorm}, exp(a)},
y se pueden ahorrar las evaluaciones de funciones especiales.
USO EN COMBINACION CON UNA MEZCLA ASCENDENTE ESTEREO EN EL DOMINIO DEL TIEMPO DE LA EXTENSIÓN DEL ANCHO DE BANDA PARA TRAMAS DE ACELP
[0078] Cuando se usa con el códec EVS, un códec de audio con bajo retraso para escenarios de comunicación, es deseable realizar la mezcla ascendente estéreo de extensión del ancho de banda en el dominio del tiempo, para salvar el retraso inducido por la extensión de ancho de banda en el dominio del tiempo (TBE). La mezcla ascendente estéreo de ancho de banda tiene por objetivo restaurar el paneo correcto en el intervalo de extensión de ancho de banda, pero no añade un sustituto del residual que falta. Por lo tanto, es deseable añadir el sustituto en el procesamiento estéreo en el dominio de la frecuencia, tal y como se ilustra en la Figura 2.
[0079] Se utilizan las anotacionesmpara la señal de entrada en el decodificador,mFpara la señal de entrada filtrada,Mtkpara los bins de tiempo-frecuencia demy ~£,fc para los bins de tiempo-frecuencia demF .
[0080] Entonces se enfrenta el problema queMtkno es conocido en el intervalo de extensión de ancho de banda, por lo tanto, el factor de normalización de energía
(28)d n o r m
N,
no se puede calcular directamente si algunos de los índiceskelbse sitúan en el intervalo de extensión de banda ancha. Este problema se soluciona como sigue: supongamos queIHByILBdesignan respectivamente los índi ces de banda alta y de banda baja de los bins de frecuencia. Entonces se obtiene una estimaciónEMHBdeT.ke¡HB\Mt,k\mediante el cálculo de la energía de la señal de banda alta formada en ventanas en el dominio del tiempo. Ahora bien, siIb LByIb HBdesignan los índices de banda baja y banda alta enIb, los índices de bandab,entonces tenemos
[0081] Ahora los sumandos en la segunda suma en el lado derecho son desconocidos, pero dado quemFse obtiene a partir demmediante un filtro pasa-todo, se puede suponer que la energía de ymt kestá distribuida de forma similar y por lo tanto se tiene
(30)
[0082] Por lo tanto, la segunda suma en el lado derecho de (29) se puede estimar como
(31)
USO CON CODIFICADORES QUE CODIFICAN UN CANAL PRIMARIO Y UN CANAL SECUNDARIO
[0083] La señal artificial también es útil para codificadores estéreo que codifican un canal primario y un canal secundario. En este caso, el canal primario sirve como entrada para la unidad de filtro pasa-todo. La salida filtrada se puede utilizar entonces para sustituir partes residuales en el procesamiento estéreo, posiblemente después de aplicarle un filtro de conformación. En la configuración más simple, el canal primario y el canal secundario podrían ser una transformación de los canales de entrada, tal como una transformación centro/lateral o una transformada KL, y el canal secundario se podría limitar a un ancho de banda más pequeño. La parte que falta del canal secundario podría entonces ser reemplazada por el canal primario filtrado después de aplicar un filtro pasa-alto.
USO CON UN DESCODIFICADOR QUE ES CAPAZ DE CONMUTAR ENTRE MODOS ESTÉREO
[0084] Un caso particularmente interesante para la señal artificial es cuando el decodificador presenta diferentes procedimientos de procesamiento estéreo, tal y como se ilustra en la Figura 3. Los procedimientos se pueden aplicar simultáneamente (por ejemplo, separados por ancho de banda) o exclusivamente (por ejemplo, procesamiento en el dominio de la frecuencia frente al procesamiento en el dominio del tiempo) y conec tados a una decisión de conmutación. El uso de la misma señal artificial en todos los procedimientos de pro cesamiento estéreo suaviza las discontinuidades tanto en el caso de la conmutación como en el caso simultá neo.
BENEFICIOS Y VENTAJAS DE LAS REALIZACIONES PREFERIDAS
[0085] El nuevo procedimiento presenta muchos beneficios y ventajas sobre los Procedimientos del Es tado de la Técnica, tal y como aquellos aplicados, por ejemplo, en xHE-AAC.
[0086] El procesamiento en el dominio del tiempo permite una resolución en el tiempo mucho más elevada como procesamiento de sub-bandas que se aplica en Estéreo Paramétrico, lo que hace posible diseñar un filtro cuya respuesta al impulso es densa y decae rápidamente. Esto lleva a que la envolvente espectral de las señales de entrada se vuelva menos dispersa a lo largo del tiempo, o a que la señal de salida tenga menos color y por lo tanto suene más natural.
[0087] Mejor adecuación para el habla, donde la región pico óptima de la respuesta al impulso del filtro de bería estar comprendida entre 20 y 40 ms.
[0088] La unidad de filtro presenta una funcionalidad de remuestreo para señales de entrada con diferentes tasas de muestreo. Esto permite operar el filtro con una tasa de muestreo fija, lo que resulta beneficioso dado que garantiza una salida similar con diferentes tasas de muestreo; o suaviza las discontinuidades cuando se conmuta entre señales con diferentes tasas de muestreo. Por motivos de complejidad, la tasa de muestreo interna debería elegirse de tal forma que la señal filtrada cubra sólo el intervalo de frecuencias perceptualmente pertinente.
[0089] Dado que la señal se genera en la entrada del decodificador y no está conectada con un banco de filtros, esta se puede utilizar en diferentes unidades de procesamiento estéreo. Esto ayuda a suavizar las discontinuidades cuando se conmuta entre diferentes unidades, o cuando se operan diferentes unidades en partes diferentes de la señal.
[0090] Esto también ahorra complejidad, dado que no es necesaria la reinicialización cuando se conmuta entre unidades.
[0091] El esquema de compresión de ganancia ayuda a compensar la pérdida del efecto ambiental debida a la codificación de núcleo.
[0092] El procedimiento relacionado con la extensión de ancho de banda de tramas de ACELP mitiga la falta de componentes residuales que faltan en una mezcla ascendente de extensión de ancho de banda en el dominio del tiempo a base de paneo, lo que aumenta la estabilidad cuando se conmuta entre el procesamiento de la banda alta en el dominio de DFT y en el dominio del tiempo.
[0093] La entrada se puede reemplazar con ceros en una escala de tiempo muy fina, lo que es beneficiosa para manejar ataques.
[0094] A continuación, se exponen detalles adicionales con respecto a la Fig. 1a o 1b, la Fig. 2a o 2b y la Fig. 3.
[0095] La Fig. 1a o la Fig. 1b ilustra el decodificador de canal de base 700 que comprende una primera rama decodificadora que presenta un decodificador de banda baja 721 y un decodificador de extensión de ancho de banda 720 para generar una primera parte del canal de base decodificado. Además, el decodificador de canal de base 700 comprende una segunda rama decodificadora 722 que presenta un decodificador de banda completa para generar una segunda parte del canal de base decodificado.
[0096] La conmutación entre ambos elementos se realiza mediante un controlador 713 ilustrado como un conmutador controlado por un parámetro de control incluido en la señal multicanal codificada para alimentar una parte del canal de base codificado ya sea en la primera rama decodificadora que comprende el bloque 720, 721 o en la segunda rama decodificadora 722. El decodificador de banda baja 721 se implementa, por ejemplo, como un codificador de predicción lineal excitada por código algebraico de ACELP y el segundo decodificador de banda completa se implementa como un decodificador de núcleo con excitación de codificación por transformada (TCX) / de alta calidad (HQ).
[0097] La mezcla descendente decodificada del bloque 722 o la señal de núcleo decodificada del bloque 721 y, adicionalmente, la señal de extensión de ancho de banda del bloque 720 se toman y envían al procedi miento en la Fig. 2a o 2b. Además, el filtro de decorrelación conectado a continuación comprende remuestreadores 810, 811, 812 y, de ser necesario y si resulta apropiado, elementos de compensación de retraso 813, 814. Un sumador combina la señal de extensión de banda ancha en el dominio del tiempo del bloque 720 y la señal de núcleo del bloque 721 y las envía a un conmutador 815 controlado por datos multicanal codificados en forma de un controlador de conmutación para conmutar entre la primera rama de codificación o la segunda rama de codificación en función de la señal que está disponible.
[0098] Además, se configura una decisión de conmutación 817 que se implementa, por ejemplo, como un detector de transitorios. No obstante, el detector de transitorios no necesariamente tiene que ser un detector real para detectar un transitorio mediante un análisis de señal, sino que el detector de transitorios se puede configurar también para determinar una información lateral o un parámetro de control específico en la señal multicanal codificada que indica un transitorio en el canal de base.
[0099] La decisión de conmutación 817 configura un conmutador para alimentar la señal de salida del conmutador 815 a la unidad de filtro pasa-todo 802 o una entrada cero que resulta en realidad en desactivar la adición de señal de relleno en el procesador multicanal para ciertas regiones de tiempo seleccionables de forma muy específica, dado que el generador de señal pasa-todo EVS (APSG) indicado en 1000 en la Fig. 1a o 1b opera completamente en el dominio del tiempo. Por lo tanto, se puede seleccionar la entrada cero en base a muestra sin tomar referencia alguna a longitudes de ventana que reducen la resolución espectral, tal y como esto se requiere para el procesamiento en el dominio espectral.
[0100]El dispositivo ilustrado en la Fig. 1a difiere del dispositivo ilustrado en la Fig. 1b en que los remuestreadores y las etapas de retraso se omiten en la Fig. 1b, es decir, en el dispositivo de la Fig. 1b no se requieren los elementos 810, 811, 812, 813, 814. Por lo tanto, en la realización de la Fig. 1b, las unidades de filtro pasa-todo operan a 16 kHz en vez de a 32 kHz como en la Fig. 1a
[0101]La Fig. 2a o la Fig. 2b ilustra la integración del generador de señal pasa-todo 1000 en el procesa miento estéreo de DFT que incluye una mezcla ascendente de extensión de ancho de banda en el dominio del tiempo. El bloque 1000 emite la señal de extensión de ancho de banda generada por el bloque 720 hacia un mezclador ascendente de banda alta 960 (mezcla ascendente TBE - mezcla ascendente de extensión de ancho de banda (dominio del tiempo)) para generar una señal izquierda de banda alta y una señal derecha de banda alta a partir de la señal de extensión de ancho de banda mono generada por el bloque 720. Además, se prevé un remuestreador 821 conectado antes de una DFT para la señal de relleno indicada en 804. Además, se prevé una DFT 922 para el canal de base decodificado que es una mezcla descendente decodificada (de banda completa) o la señal de núcleo decodificada (de banda baja).
[0102]En función de la implementación, cuando está disponible la señal de mezcla descendente deco dificada del decodificador de banda completa 722, el bloque 960 se desactiva, y el bloque de procesamiento estéreo 904 emite las señales de mezcla ascendente de banda completa como un canal derecho e izquierdo de banda completa.
[0103]No obstante, cuando la señal de núcleo decodificada se introduce en el bloque DFT 922, el bloque 960 se activa y se añaden una señal de canal izquierdo y una señal de canal derecho mediante los sumadores 994a y 994b. Sin embargo, la adición de la señal de relleno se realiza no obstante en el dominio espectral indicado por el bloque 904 según los procedimientos expuestos, por ejemplo, dentro de una realización preferida en base a las ecuaciones 28 a 31. Por lo tanto, en tal situación, la señal emitida por el bloque DFT 902 correspondiente a la señal central de banda baja no presenta ningún dato de banda alta. Sin embargo, la señal emitida por el bloque 804, es decir, la señal de relleno, presenta datos de banda baja y datos de banda alta.
[0104]En el bloque de procesamiento estéreo, la salida de datos de banda baja del bloque 904 se genera por el canal de base decodificado y la señal de relleno, pero la salida de datos de banda alta del bloque 904 sólo consiste en la señal de relleno y no presenta ninguna información de banda alta del canal de base decodi ficado, dado que el canal de base decodificado era de banda limitada. La información de banda alta del canal de base decodificado se genera por el bloque de extensión de ancho de banda 720, se mezcla de forma as cendente para obtener un canal de banda alta izquierdo y un canal de banda alta derecho por el bloque 960 y se añade entonces a los sumadores 994a, 994b.
[0105]El dispositivo ilustrado en la Fig. 2a es distinto del dispositivo ilustrado en la Fig. 2b en que el remuestreador se omite en la Fig. 2b, es decir, en el dispositivo de la Fig. 2b no se requiere el elemento 821.
[0106]La Fig. 3 ilustra una implementación preferida de un sistema que presenta múltiples unidades de procesamiento estéreo 904a a 904b, 904c según se expuso anteriormente con respecto a la conmutación entre modos estéreo. Cada bloque de procesamiento estéreo recibe información lateral y, además, una determinada señal primaria, pero exactamente la misma señal de relleno, independientemente de si cierta parte de tiempo de la señal de entrada se procesa usando el algoritmo de procesamiento estéreo 904a, un algoritmo de procesa miento estéreo 904b u otro algoritmo de procesamiento estéreo 904c.
[0107]Aunque algunos aspectos se han descrito en el contexto de un aparato, está claro que estos aspectos también representan una descripción del procedimiento correspondiente, donde un bloque o dispositivo corresponde a una etapa del procedimiento o a una característica de una etapa del procedimiento. De forma análoga, los aspectos descritos en el contexto de una etapa del procedimiento representan también una descripción de un bloque o elemento o característica de un aparato correspondiente. Algunas o todas las etapas del procedimiento pueden ser ejecutadas por (o usando) un aparato de hardware, tal como por ejemplo, un microprocesador, un ordenador programable o un circuito electrónico. En algunas realizaciones, una o varias de las etapas más importantes del procedimiento se pueden ejecutar mediante dicho aparato.
[0108]La señal de audio codificada de la invención se puede almacenar en un medio de almacenamiento digital o se puede transmitir en un medio de transmisión, tal como un medio de transmisión inalámbrica o un medio de transmisión por cable, tal como Internet.
[0109]En función de ciertos requisitos de implementación, las realizaciones de la invención se pueden implementar en hardware o en software. La implementación puede realizarse utilizando un medio de almacenamiento no transitorio o medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un Blu-Ray, un CD, una memoria ROM, una memoria PROM, una memoria EPROM, una memoria EEPROM o una memoria FLASH, que tienen alma cenadas señales de control legibles electrónicamente, que cooperan (o son capaces de cooperar) con un sistema de ordenador programable de modo que se lleve a cabo el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.
[0110]Algunas realizaciones según la invención comprenden un soporte de datos que tiene señales de control legibles electrónicamente, que son capaces de cooperar con un sistema de ordenador programable de modo que se lleve a cabo uno de los procedimientos descritos en esta invención.
[0111]Generalmente, las realizaciones de la presente invención se pueden implementar como un producto de programa de ordenador con un código de programa, donde el código de programa es operativo para realizar uno de los procedimientos cuando el producto de programa de ordenador se ejecuta en un ordenador. El código de programa puede almacenarse, por ejemplo, en un soporte legible por una máquina.
[0112]Otras realizaciones comprenden el programa de ordenador para realizar uno de los procedimientos descritos en esta invención, el cual está almacenado en un soporte legible por una máquina.
[0113]En otras palabras, una realización del procedimiento según la invención es, por lo tanto, un programa de ordenador que tiene un código de programa para realizar uno de los procedimientos descritos en esta invención cuando el programa de ordenador es ejecutado por un ordenador.
[0114]Otra realización de los procedimientos de la invención es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, grabado en él, el programa de ordenador para realizar uno de los procedimientos descritos en esta invención. El soporte de datos, el medio de almacena miento digital o el medio grabado generalmente son tangibles y/o no transitorios.
[0115]Otro modo de realización del procedimiento de la invención es, por lo tanto, un flujo de datos o una secuencia de señales que representan el programa de ordenador para realizar uno de los procedimientos descritos en esta invención. El flujo de datos o la secuencia de señales se puede configurar, por ejemplo, para ser transferido mediante una conexión de comunicación de datos, por ejemplo, a través de Internet.
[0116]Otra realización comprende un medio de procesamiento, por ejemplo, un ordenador o un dispositivo lógico programable, configurado o adaptado para realizar uno de los procedimientos descritos en esta invención.
[0117]Otra realización comprende un ordenador que tiene instalado el programa de ordenador para realizar uno de los procedimientos descritos en esta invención.
[0118]Otra realización según la invención comprende un aparato o un sistema configurado para transferir (por ejemplo, electrónicamente o de forma óptica) a un receptor un programa de ordenador para realizar uno de los proce dimientos descritos en esta invención. El receptor puede ser, por ejemplo, un ordenador, un dispositivo móvil, un dispositivo de memoria u otro similar. El aparato o el sistema puede comprender, por ejemplo, un servidor de archivos para transferir el programa de ordenador al receptor.
[0119]En algunas realizaciones, se puede utilizar un dispositivo lógico programable (por ejemplo, una matriz de puertas programable por campo) para realizar algunas o todas las funcionalidades de los procedimientos descritos en esta invención. En algunas realizaciones, una matriz de puertas programable por campo puede cooperar con un microprocesador para realizar uno de los procedimientos descritos en esta invención. Generalmente, los procedimien tos se realizan preferiblemente mediante cualquier aparato de hardware.
[0120]El aparato descrito en esta invención se puede implementar usando un aparato de hardware, o usando un ordenador, o usando una combinación de un aparato de hardware y un ordenador.
[0121]El aparato descrito en esta invención, o cualquiera de los componentes del aparato descrito en esta invención, se puede implementar al menos parcialmente en hardware y/o en software.
[0122]Los procedimientos descritos en esta invención se pueden implementar usando un aparato de hardware, o usando un ordenador, o usando una combinación de un aparato de hardware y un ordenador.
[0123]Los procedimientos descritos en esta invención, o cualquiera de los componentes del aparato descrito en esta invención, se pueden implementar al menos parcialmente en hardware y/o en software.
[0124]Las realizaciones descritas más arriba son meramente ilustrativas de los principios de la presente in vención. Se entiende que modificaciones y variaciones de las disposiciones y los detalles descritos en esta invención serán evidentes para otros expertos en la técnica. Por lo tanto, se considera que la presente invención está limitada sólo por el alcance de las reivindicaciones de patente adjuntas y no por los detalles específicos presentados en esta invención a modo de descripción y explicación de las realizaciones.
[0125]En la descripción anterior, se puede observar que diversas características se agrupan en realizaciones con el fin de simplificar la descripción. Este procedimiento de descripción no se debe interpretar como el reflejo de la intención de que las realizaciones reivindicadas requieran más características que las expresamente mencionadas en cada reivindicación. Más bien, tal y como lo reflejan las reivindicaciones que siguen, el tema de la invención puede estar comprendido en una cantidad menor que todas las características de una única realización descrita. Por lo tanto, las reivindicaciones que siguen son incorporadas, por el presente documento, a la Descripción Detallada, donde cada reivindicación puede valer por sí misma como una realización separada. Mientras que cada reivindicación puede valer por sí misma como una realización separada, cabe destacar que - aunque una reivindicación dependiente puede referirse en las reivindicaciones a una combinación específica con una o varias otras reivindicaciones - otras realiza ciones pueden incluir también una combinación de la reivindicación dependiente con el tema de cada una de las otras reivindicaciones dependientes o una combinación de cada característica con otras reivindicaciones dependientes o independientes. Tales combinaciones se proponen aquí, a menos que se indique que una combinación específica no está considerada. Además, se consideran incluidas también las características de una reivindicación en cualquier otra reivindicación independiente, incluso si esta reivindicación no está formulada directamente como dependiente de la reivindicación independiente.
[0126]Además cabe destacar que los procedimientos descritos en la memoria descriptiva o en las reivindica ciones se pueden implementar mediante un dispositivo que presenta los medios para realizar cada una de las respec tivas etapas de estos procedimientos.
[0127]Además, en algunas realizaciones, una sola etapa puede incluir o puede estar segmentada en múltiples sub-etapas. Tales sub-etapas pueden estar incluidas y ser parte de la descripción de esta única etapa, a menos que estén explícitamente excluidas.

Claims (35)

REIVINDICACIONES
1. Decorrelador de señal de audio (800) para decorrelacionar una señal de entrada de audio para obtener una señal decorrelacionada, que comprende:
un filtro pasa-todo (802) que comprende dos o más células de filtro pasa-todo (502, 504, 506, 508, 510), donde una célula de filtro pasa-todo de las dos o más células de filtro pasa-todo (502, 504, 506, 508, 510) com prende un primer filtro pasa-todo de Schroeder (401), un segundo filtro pasa-todo de Schroeder (402) en cascada con el primer filtro pasa-todo de Schroeder (401), y un tercer filtro pasa-todo de Schroeder (403) que presenta un sumador (411) y una fase de retraso (423), donde una entrada en el primer filtro pasa-todo de Schroeder (401) está conectada con una salida del sumador (411) del tercer filtro pasa-todo de Schroeder (403), y donde una salida del segundo filtro pasa-todo de Schroeder (402) está conectada con la fase de retraso (423) del tercer filtro pasatodo de Schroeder (403), y
donde los valores de retraso de los retrasos de las dos o más células de filtro pasa-todo (502, 504, 506, 508, 510) son mutuamente primos.
2. Decorrelador de señal de audio (800) según la reivindicación 1,
donde el al menos uno de entre el primer filtro pasa-todo de Schroeder (401), el segundo filtro pasa-todo de Schroeder (402) y el tercer filtro pasa-todo de Schroeder (403) presenta un primer sumador (412, 414, 411), una fase de retraso (421,422, 423), un segundo sumador (413, 415, 416), una alimentación hacia delante (441,442, 443) con una ganan cia hacia delante y una alimentación hacia atrás (431, 432, 433) con una ganancia hacia atrás.
3. Decorrelador de señal de audio (800) según la reivindicación 1, donde el primer filtro pasa-todo de Schroeder (401) comprende un segundo sumador (412), un tercer sumador (413), una primera fase de retraso (421), una primera alimentación hacia delante (441) con una primera ganancia hacia delante, y una primera alimentación hacia atrás (431) con una primera ganancia hacia atrás,
donde el segundo filtro pasa-todo de Schroeder (402) comprende un cuarto sumador (414), un quinto sumador (415), una segunda fase de retraso (422), una segunda alimentación hacia delante (442) con una segunda ganan cia hacia delante, y una segunda alimentación hacia atrás (432) con una segunda ganancia hacia atrás, y donde el tercer filtro pasa-todo de Schroeder (403) comprende un primer sumador (411), que es el sumador (411) del filtro pasa-todo de Schroeder (403), un sexto sumador (416), una tercera fase de retraso (423), que es la fase de retraso (423) del tercer filtro pasa-todo de Schroeder (403), una tercera alimentación hacia delante (443) con una tercera ganancia hacia delante, y una tercera alimentación hacia atrás (433) con una tercera ganancia hacia atrás.
4. Decorrelador de señal de audio (800) según la reivindicación 3,
donde una entrada en el primer sumador (411) representa una entrada en la célula de filtro pasa-todo de los dos o más filtros pasa-todo (502, 504, 506, 508, 510), donde una segunda entrada en el primer sumador (411) está conectada con una salida de la tercera fase de retraso (423) y comprende la tercera alimentación hacia atrás (433) con una tercera ganancia hacia atrás,
donde una salida del primer sumador (411) está conectada con una entrada en el segundo sumador (412) y está conectada con una entrada del sexto sumador (416) a través de la tercera alimentación hacia delante (443) con la tercera ganancia hacia delante (433),
donde otra entrada en el segundo sumador (412) está conectada con la primera fase de retraso (421) a través de una primera alimentación hacia atrás (431) con la primera ganancia hacia atrás,
donde una salida del segundo sumador (412) está conectada con una entrada de la primera fase de retraso (421) y está conectada con una entrada del tercer sumador (413) a través de la primera alimentación hacia delante (441) con la primera ganancia hacia delante,
donde una salida de la primera fase de retraso (421) está conectada con otra entrada del tercer sumador (413), donde una salida del tercer sumador (413) está conectada con una entrada del cuarto sumador (414), donde otra entrada en el cuarto sumador (414) está conectada con una salida de la segunda fase de retraso (422) a través de la segunda alimentación hacia atrás (432) con la segunda ganancia hacia atrás,
donde una salida del cuarto sumador (414) está conectada con una entrada en la segunda fase de retraso (422) y está conectada con una entrada en el quinto sumador (415) a través de la segunda alimentación hacia delante (442) con la segunda ganancia hacia delante,
donde una salida de la segunda fase de retraso (422) está conectada con otra entrada en el quinto sumador (415), donde una salida del quinto sumador (415) está conectada con una entrada de la tercera fase de retraso (423), donde la salida de la tercera fase de retraso (423) está conectada con una entrada en el sexto sumador (416), donde otra entrada en el sexto sumador (416) está conectada con una salida del primer sumador (411) a través de la tercera alimentación hacia delante (443) con la tercera ganancia hacia delante, y
donde la salida del sexto sumador (416) representa una salida de la célula de filtro pasa-todo de los dos o más filtros pasa-todo (502, 504, 506, 508, 510).
5. Decorrelador de señal de audio (800) según una de las reivindicaciones 1 a 4,
donde una ganancia hacia delante y una ganancia hacia atrás de al menos uno de entre el primer filtro pasa-todo de Schroeder (401), el segundo filtro pasa-todo de Schroeder (402) y el tercer filtro pasa-todo de Schroeder (403) son iguales o diferentes entre sí de menos del 10 % de un mayor valor de ganancia de la ganancia hacia delante y de la ganancia hacia atrás.
6. Decorrelador de señal de audio (800) según una de las reivindicaciones 1 a 5,
donde una de las dos o más células de filtro pasa-todo (502, 504, 506, 508, 510) presenta dos ganancias positivas y una ganancia negativa y otra de las dos o más células de filtro pasa-todo (502, 504, 506, 508, 510) presenta una ganancia positiva y dos ganancias negativas.
7. Decorrelador de señal de audio (800) según una de las reivindicaciones 1 a 6,
donde un valor de retraso de una primera fase de retraso (421) es menor que un valor de retraso de una segunda fase de retraso (422), y donde el valor de retraso de la segunda fase de retraso (422) es menor que un valor de retraso de la fase de retraso (423) del tercer filtro pasa-todo de Schroeder (403) de la célula de filtro pasa-todo de las dos o más células de filtro pasa-todo (502, 504, 506, 508, 510), donde la célula de filtro pasa-todo comprende el primer filtro pasa-todo de Schroeder (401), el segundo filtro pasa-todo de Schroeder (402), y el tercer filtro pasatodo de Schroeder (403), o
donde la suma de un valor de retraso de una primera fase de retraso (421) y un valor de retraso de una segunda fase de retraso (422) es menor que un valor de retraso de la fase de retraso (423) del tercer filtro pasa-todo de Schroeder (403) de la célula de filtro pasa-todo de las dos o más células de filtro pasa-todo (502, 504, 506, 508, 510), donde la célula de filtro pasa-todo comprende el primer filtro pasa-todo de Schroeder (401), el segundo filtro pasa-todo de Schroeder (402), y el tercer filtro pasa-todo de Schroeder (403).
8. Decorrelador de señal de audio (800) según una de las reivindicaciones 1 a 8,
donde el filtro pasa-todo (802) comprende las dos o más células de filtro pasa-todo (502, 504, 506, 508, 510) en cascada, donde el valor de retraso más pequeño de una célula de filtro pasa-todo en la cascada es más pequeño que el valor de retraso más alto o el segundo valor más alto de una célula de filtro pasa-todo ubicada antes en la cascada.
9. Decorrelador de señal de audio (800) según una de las reivindicaciones 1 a 8,
donde el filtro pasa-todo (802) comprende las dos o más células de filtro pasa-todo (502, 504, 506, 508, 510) en cascada,
donde cada célula de filtro pasa-todo (802) de las dos a más células de filtro pasa-todo (502, 504, 506, 508, 510) presenta una primera ganancia hacia delante o una primera ganancia hacia atrás, una segunda ganancia hacia delante o una segunda ganancia hacia atrás, y una tercera ganancia hacia delante o una tercera ganancia hacia atrás, una primera fase de retraso (421), una segunda fase de retraso (422) y una tercera fase de retraso (423) del tercer filtro pasa-todo de Schroeder (403),
donde los valores de las ganancias y los retrasos se establecen dentro de una gama de tolerancia de ± 20 % de los valores indicados en la siguiente tabla:
Filtro g1 d1 g2 d2 ga d3
B-i(z) 0,5 2 -0,2 73 0,5 83
B2(z) -0,4 11 0,2 67 -0,5 97
B3(z) 0,4 19 -0,3 61 0,5 103
B4(z) -0,4 29 0,3 47 -0,5 109
B5(z) 0,3 37 -0,3 41 0,5 127
donde B-i(z) es una primera célula de filtro pasa-todo en la cascada,
donde B2(z) es una segunda célula de filtro pasa-todo en la cascada,
donde B3(z) es una tercera célula de filtro pasa-todo en la cascada,
donde B4(z) es una cuarta célula de filtro pasa-todo en la cascada, y
donde Bs(z) es una quinta célula de filtro pasa-todo en la cascada,
donde la cascada comprende solo la primera célula de filtro pasa-todo B1 y la segunda célula de filtro pasa-todo B2 o cualesquiera otras dos células de filtro pasa-todo del grupo de células de filtro pasa-todo de las que se componen las células de filtro pasa-todo B1 a B5, o
donde la cascada comprende tres células de filtro pasa-todo seleccionadas del grupo de cinco células de filtro pasa-todo Bi a B5, o
donde la cascada comprende cuatro células de filtro pasa-todo seleccionadas del grupo de células de filtro pasatodo que se compone de las células de filtro pasa-todo Bi a B5, o
donde la cascada comprende el total de las cinco células de filtro pasa-todo B1 a B5,
dondeg1representa la primera ganancia hacia delante o ganancia hacia atrás de la célula de filtro pasa-todo, donde g2 representa una segunda ganancia hacia atrás o ganancia hacia delante de la célula de filtro pasa-todo, y donde g3 representa la tercera ganancia hacia delante o ganancia hacia atrás de la célula de filtro pasa-todo, donde d representa un retraso de la primera fase de retraso (421) de la célula de filtro pasa-todo, donde efe representa un retraso de la segunda fase de retraso (422) de la célula de filtro pasa-todo, y donde efe representa un retraso de una tercera fase de retraso (423) del tercer filtro pasa-todo de Schroeder (403) de la célula de filtro pasatodo, o
donde g1 representa la segunda ganancia hacia delante o ganancia hacia atrás de la célula de filtro pasa-todo, donde g2 representa una primera ganancia hacia atrás o ganancia hacia delante de la célula de filtro pasa-todo, y donde g3 representa la tercera ganancia hacia delante o ganancia hacia atrás de la célula de filtro pasa-todo, donded1representa un retraso de la segunda fase de retraso (422) de la célula de filtro pasa-todo, donde efe representa un retraso de la primera fase de retraso (421) de la célula de filtro pasa-todo, y donde d3 representa un retraso de la fase de retraso (423) del tercer filtro pasa-todo de Schroeder (403) de la célula de filtro pasa-todo.
10. Procedimiento para decorrelacionar una señal de entrada de audio para obtener una señal decorrelcionada, que comprende el hecho de:
filtrar pasa-todo mediante dos o más células de filtro pasa-todo (502, 504, 506, 508, 510),
donde una célula de filtro pasa-todo de las dos o más células de filtro pasa-todo (502, 504, 506, 508, 510) comprende un primer filtro pasa-todo de Schroeder (401), un segundo filtro pasa-todo de Schroeder (402) en cascada con el primer filtro pasa-todo de Schroeder (401), y un tercer filtro pasa-todo de Schroeder (403) que presenta un sumador (411) y una fase de retraso (423), donde una entrada en el primer filtro pasa-todo de Schroeder (401) está conectada con una salida del sumador (411) del tercer filtro pasa-todo de Schroeder (403), y donde una salida del segundo filtro pasa-todo de Schroeder (402) está conectada con la fase de retraso (423) del tercer filtro pasatodo de Schroeder (403), y
donde los valores de retraso de los retrasos de las dos o más células de filtro pasa-todo (502, 504, 506, 508, 510) son mutuamente primos.
11. Aparato para decodificar una señal multicanal codificada, que comprende:
un decodificador de canal de base (700) para decodificar un canal de base para obtener un canal de base decodi ficado,
un decorrelador de señal de audio (800) según una de las reivindicaciones 1 a 9, donde el decorrelador de señal de audio (800) está configurado para filtrar al menos una parte del canal de base decodificado como señal de entrada de audio para obtener una señal de relleno como señal decorrelada; y
un procesador multicanal (900) para realizar un procesamiento multicanal mediante una representación espectral del canal de base decodificado y una representación espectral de la señal de relleno,
donde el decorrelador de señal de audio (800) es un filtro de banda ancha y el procesador multicanal (900) está configurado para aplicar un procesamiento de banda estrecha a la representación espectral del canal de base decodificado y a la representación espectral de la señal de relleno.
12. Aparato según la reivindicación 11,
que comprende además un convertidor espectral de canal de base (902) para convertir el canal de base decodificado en la representación espectral del canal de base decodificado.
13. Aparato según una de las reivindicaciones 11 a 12,
donde el procesador multicanal (900) está configurado para determinar (946) un primer canal de mezcla ascendente y un segundo canal de mezcla ascendente mediante diferentes combinaciones ponderadas de bandas espectrales del canal de base decodificado y una banda espectral correspondiente de la señal de relleno, donde las diferentes com binaciones ponderadas dependen de un factor de predicción y/o un factor de ganancia y/o una envolvente o un factor de normalización de energía calculado mediante una banda espectral del canal de base decodificado y una banda espectral correspondiente de la señal de relleno.
14. Aparato según la reivindicación 13,
donde el procesador multicanal (900) está configurado para comprimir (945) el factor de normalización de energía y para calcular las diferentes combinaciones ponderadas mediante el factor de normalización de energía comprimido.
15. Aparato según la reivindicación 14, donde el factor de normalización de energía se comprime: calculando (921) un logaritmo del factor de normalización de energía;
sometiendo (922) el logaritmo a una función no lineal; y
calculando (923) un resultado de exponenciación de un resultado de la función no lineal.
16. Aparato según la reivindicación 15,
donde la función no lineal se define en base af ( t ) = t — c(f) di,
donde la funcióncse basa en0 < c(t) <1,
dondetes un número real, y donde<t>es una variable de integración.
17. Aparato según la reivindicación 13 o 15,
donde el procesador multicanal (900) está configurado para comprimir (921) el factor de normalización de energía y para calcular las diferentes combinaciones ponderadas mediante el factor de normalización de energía compri mido y mediante una función no lineal,
donde la función no lineal se define en base af ( t ) = t — max[min[a,£},—a},
donde a es un valor límite predeterminado, y dondetes un valor comprendido entre -a y a.
18. Aparato según una de las reivindicaciones 11 a 17,
donde el procesador multicanal (900) está configurado para calcular (904) un primer canal de mezcla ascendente de banda baja y un segundo canal de mezcla ascendente de banda baja, y
donde el aparato comprende además un ampliador de banda ancha en el dominio del tiempo (960) para expandir el primer canal de mezcla ascendente de banda baja y el segundo canal de mezcla ascendente de banda baja, o un canal de base de banda baja,
donde el procesador multicanal (900) está configurado para determinar (946) un primer canal de mezcla ascen dente y un segundo canal de mezcla ascendente mediante diferentes combinaciones ponderadas de bandas espectrales del canal de base decodificado y la correspondiente banda espectral de la señal de relleno, donde las diferentes combinaciones ponderadas dependen de un factor de normalización de energía calculado (945) me diante una energía de la banda espectral del canal de base decodificado y de una banda espectral de la señal de relleno,
donde el factor de normalización de energía se calcula mediante una estimación de energía derivada (961) de una energía de una señal de banda alta formada en ventanas.
19. Aparato de la reivindicación 18,
donde el ampliador de banda ancha en el dominio del tiempo (960) está configurado para utilizar la señal de banda alta sin la operación de formación en ventanas utilizada para el cálculo del factor de normalización de energía.
20. Aparato de una de las reivindicaciones 11 a 19,
donde el decodificador de canal de base (700) está configurado para proporcionar un canal de base primario decodificado y un canal de base secundario decodificado,
donde el decorrelador de señal de audio (800) está configurado para filtrar el canal de base primario decodificado para obtener la señal de relleno,
donde el procesador multicanal (900) está configurado para realizar un procesamiento multicanal al sintetizar una o varias partes residuales en el procesamiento multicanal mediante la señal de relleno, o
donde se aplica un filtro de conformación (930) a la señal de relleno.
21. Aparato de la reivindicación 20,
donde el canal de base primario y el secundario son el resultado de una transformación de canales de entrada originales, donde la transformación es, por ejemplo, una transformación centro/lateral o una transformación de Karhunen Loeve (KL), y donde el canal de base secundario decodificado se limita a un ancho de banda más pequeño,
donde el procesador multicanal (900) está configurado para el filtrado paso alto (930) de la señal de relleno y para utilizar la señal de relleno filtrada paso alto como canal secundario para un ancho de banda no incluido en el canal de base secundario decodificado de ancho de banda limitado.
22. Aparato de una de las reivindicaciones 11 a 21,
donde el procesador multicanal (900) está configurado para realizar diferentes procedimientos de procesamientos multicanal (904a, 904b, 904c), y
donde el procesador multicanal (900) está configurado además para realizar los diferentes procedimientos de pro cesamiento multicanal (904a, 904b, 904c) simultáneamente, por ejemplo, separados por ancho de banda, o exclu sivamente, por ejemplo con procesamiento en el dominio del tiempo versus procesamiento en el dominio de la frecuencia y conectado a una decisión de conmutación, y
donde el procesador multicanal (900) está configurado para utilizar la misma señal de relleno en todos los proce dimientos de procesamiento multicanal (904a, 904b, 904c).
23. Aparato según una de las reivindicaciones 11 a 22,
donde el decorrelador de señal de audio (800) comprende un filtro en el dominio del tiempo como filtro pasa-todo (802) que presenta una región pico óptima de la respuesta al impulso del filtro en el dominio del tiempo comprendida entre 20 ms y 40 ms.
24. Aparato según una de las reivindicaciones 11 a 23,
donde el decorrelador de señal de audio (800) está configurado para remuestrear (811, 812) el canal de base decodificado a una tasa de muestreo objetivo predefinida o que depende de la entrada,
donde el decorrelador de señal de audio (800) está configurado para filtrar un canal de base decodificado remuestreado mediante el filtro pasa-todo (802), y
donde el procesador multicanal (900) está configurado para convertir (710) un canal de base decodificado durante otra parte de tiempo a la misma tasa de muestreo, de modo que el procesador multicanal (900) opere mediante representaciones espectrales del canal de base decodificado y de la señal de relleno que están basadas en la misma tasa de muestreo independientemente de las diferentes tasas de muestreo del canal de base decodificado para diferentes partes de tiempo, o
donde el aparato está configurado para realizar un remuestreo antes de, o durante, la conversión (804, 702) a un dominio de la frecuencia o posteriormente a la conversión (804, 702) al dominio de la frecuencia.
25. Aparato según una de las reivindicaciones 11 a 24,
que comprende además un detector de transitorios para encontrar un transitorio en el canal de base codificado o decodificado,
donde el decorrelador de señal de audio (800) está configurado para alimentar hacia el filtro pasa-todo (802) ruido o valores cero (816) en una parte de tiempo en la cual el detector de transitorios ha encontrado muestras de señales transitorias, donde el decorrelador de señal de audio (800) está configurado para alimentar hacia el filtro pasa-todo (802) muestras del canal de base decodificado en otra parte de tiempo en la cual el detector de transi torios no ha encontrado un transitorio en el canal de base codificado o decodificado.
26. Aparato según una de las reivindicaciones 11 a 25,
donde el decodificador de canal de base (700) comprende:
una primera rama decodificadora que comprende un decodificador de banda baja (721) y un decodificador de extensión de ancho de banda (720) para generar una primera parte del canal decodificado;
una segunda rama decodificadora (722) que presenta un decodificador de banda completa para generar una se gunda parte del canal de base decodificado; y
un controlador (713) para alimentar una parte del canal de base codificado ya sea hacia la primera rama decodifi cadora o la segunda rama decodificadora según la señal de control.
27. Aparato según una de las reivindicaciones 11 a 26, donde el decorrelador de señal de audio (800) com prende:
un primer remuestreador (810, 811) para remuestrear una primera parte a una tasa de muestreo predeterminada; un segundo remuestreador (812) para remuestrear una segunda parte a la tasa de muestreo predeterminada; y el filtro pasa-todo (802) para el filtrado pasa-todo de la señal de entrada de filtro pasa-todo para obtener la señal de relleno; y
un controlador (815) para alimentar una primera parte remuestreada o una segunda parte remuestreada hacia el filtro pasa-todo (802).
28. Aparato según la reivindicación 27,
donde el controlador (815) está configurado para alimentar, en respuesta a una señal de control, la primera parte remuestreada o la segunda parte remuestreada o datos cero (816) hacia el filtro pasa-todo (802).
29. Aparato según una de las reivindicaciones 11 a 28, donde el decorrelador de señal de audio (800) com prende:
un convertidor tiempo-espectral (804) para convertir la señal de relleno en una representación espectral que comprende líneas espectrales con una primera resolución espectral,
donde el procesador multicanal (900) comprende un convertidor tiempo-espectral (902) para convertir el canal de base decodificado en una representación espectral mediante líneas espectrales con la primera resolución espec tral,
donde el procesador multicanal (900) está configurado para generar líneas espectrales para un primer canal de mezcla ascendente o un segundo canal de mezcla ascendente, donde las líneas espectrales presentan la primera resolución espectral, mediante, para una determinada línea espectral, una línea espectral de la señal de relleno, una línea espectral del canal de base decodificado y uno o varios parámetros,
donde los uno o varios parámetros presentan, asociados a los mismos, una segunda resolución espectral que es menor que la primera resolución espectral, y
donde los uno o varios parámetros se utilizan para generar un grupo de líneas espectrales, donde el grupo de líneas espectrales comprende la determinada línea espectral y al menos una línea espectral adyacente en frecuen cia.
30. Aparato según una de las reivindicaciones 11 a 29, donde el procesador multicanal (900) está configurado para generar una línea espectral para el primer canal de mezcla ascendente o el segundo canal de mezcla ascendente mediante:
un factor de rotación de fase (941a, 941b) que depende de uno o varios parámetros transmitidos;
una línea espectral del canal de base decodificado;
un primer peso (942a, 942b) para la línea espectral del canal de base decodificado, donde el primer peso (942a, 942b) depende de un parámetro transmitido;
una línea espectral de la señal de relleno;
un segundo peso (943a, 943b) para la línea espectral de la señal de relleno, donde el segundo peso (943a, 943b) depende de un parámetro transmitido; y
un factor de normalización de energía (945).
31. Aparato según la reivindicación 30,
donde, para calcular el segundo canal de mezcla ascendente, un signo del segundo peso (943a, 943b) es diferente del signo del segundo peso (943a, 943b) utilizado para calcular el primer canal de mezcla ascendente, o donde, para calcular el segundo canal de mezcla ascendente, el factor de rotación de fase (941a, 941b) es diferente de un factor de rotación de fase (941a, 941b) utilizado para calcular el primer canal de mezcla ascendente, o donde, para calcular el segundo canal de mezcla ascendente, el primer peso (942a, 942b) es diferente del primer peso (942a, 942b) utilizado para calcular el primer canal de mezcla ascendente.
32. Aparato según una de las reivindicaciones 11 a 31, donde el decodificador de canal de base (700) está configurado para obtener el canal de base decodificado con un primer ancho de banda,
donde el procesador multicanal (900) está configurado para generar una representación espectral de un primer canal de mezcla ascendente y un segundo canal de mezcla ascendente, donde la representación espectral pre senta el primer ancho de banda y un segundo ancho de banda adicional que comprende una banda superior al primer ancho de banda en cuanto a la frecuencia,
donde el primer ancho de banda se genera mediante el canal de base decodificado y la señal de relleno, donde el segundo ancho de banda se genera mediante la señal de relleno sin el canal de base decodificado, donde el procesador multicanal (900) está configurado para convertir el primer canal de mezcla ascendente o el segundo canal de mezcla ascendente en una representación en el dominio del tiempo,
donde el procesador multicanal (900) comprende además un procesador de extensión de ancho de banda en el dominio del tiempo (960) para generar una señal de extensión en el dominio del tiempo para la primera señal de mezcla ascendente o la segunda señal de mezcla ascendente o el canal de base, donde la señal de extensión en el dominio del tiempo comprende el segundo ancho de banda; y
un combinador (994a, 994b) para combinar la señal de extensión en el dominio del tiempo y la representación en el tiempo del primer o segundo canal de mezcla ascendente o del canal de base para obtener un canal de mezcla ascendente de banda ancha.
33. Aparato según la reivindicación 32, donde el procesador multicanal (900) está configurado para calcular (945) un factor de normalización de energía utilizado para calcular el primer canal de mezcla ascendente o el segundo canal de mezcla ascendente en el segundo ancho de banda
mediante una energía del canal de base decodificado en el primer ancho de banda,
mediante una energía de una versión formada en ventanas de una señal de extensión en el tiempo para el primer canal o el segundo canal o para una señal de mezcla descendente de ancho de banda extendido, y mediante una energía de la señal de relleno en el segundo ancho de banda.
34. Procedimiento para decodificar una señal multicanal codificada, que comprende el hecho de: decodificar (700) un canal de base codificado para obtener un canal de base decodificado;
un procedimiento que consiste en pasar por un filtro de decorrelación (800) según la reivindicación 10, donde el procedimiento filtra al menos una parte del canal de base decodificado como señal de entrada de audio para obtener una señal de relleno como señal decorrelada; y
realizar (900) un procesamiento multicanal mediante una representación espectral del canal de base decodificado y una representación espectral de la señal de relleno,
donde el procedimiento que consiste en pasar por un filtro de decorrelación (800) es una filtración de banda ancha y el procesamiento multicanal (900) comprende el hecho de aplicar un procesamiento de banda estrecha a la representación espectral del canal de base decodificado y a la representación espectral de la señal de relleno.
35. Programa informático que comprende instrucciones que, cuando son ejecutadas por un ordenador, llevan al ordenador o al procesador a realizar el procedimiento según la reivindicación 10 o la reivindicación 34.
ES18742830T 2017-07-28 2018-07-26 Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha Active ES2965741T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17183841 2017-07-28
PCT/EP2018/070326 WO2019020757A2 (en) 2017-07-28 2018-07-26 APPARATUS FOR ENCODING OR DECODING A MULTI-CHANNEL SIGNAL ENCODED USING A FILLING SIGNAL GENERATED BY A BROADBAND FILTER

Publications (1)

Publication Number Publication Date
ES2965741T3 true ES2965741T3 (es) 2024-04-16

Family

ID=59655866

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18742830T Active ES2965741T3 (es) 2017-07-28 2018-07-26 Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha

Country Status (15)

Country Link
US (3) US11341975B2 (es)
EP (2) EP4243453A3 (es)
JP (5) JP7161233B2 (es)
KR (1) KR102392804B1 (es)
CN (4) CN117854515A (es)
AR (1) AR112582A1 (es)
AU (2) AU2018308668A1 (es)
BR (1) BR112020001660A2 (es)
CA (1) CA3071208A1 (es)
ES (1) ES2965741T3 (es)
PL (1) PL3659140T3 (es)
RU (1) RU2741379C1 (es)
SG (1) SG11202000510VA (es)
TW (2) TWI695370B (es)
WO (1) WO2019020757A2 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2017357454B2 (en) * 2016-11-08 2021-02-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
US11031024B2 (en) * 2019-03-14 2021-06-08 Boomcloud 360, Inc. Spatially aware multiband compression system with priority
MX2023002255A (es) * 2020-09-03 2023-05-16 Sony Group Corp Dispositivo y método de procesamiento de señales, dispositivo y método de aprendizaje y programa.
EP4226367A2 (en) 2020-10-09 2023-08-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing
MX2023003965A (es) * 2020-10-09 2023-05-25 Fraunhofer Ges Forschung Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando una extension de ancho de banda.
AU2021358432A1 (en) 2020-10-09 2023-05-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, or computer program for processing an encoded audio scene using a parameter conversion

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6111958A (en) 1997-03-21 2000-08-29 Euphonics, Incorporated Audio spatial enhancement apparatus and methods
US6928168B2 (en) * 2001-01-19 2005-08-09 Nokia Corporation Transparent stereo widening algorithm for loudspeakers
ATE354161T1 (de) 2002-04-22 2007-03-15 Koninkl Philips Electronics Nv Signalsynthese
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
ATE390683T1 (de) * 2004-03-01 2008-04-15 Dolby Lab Licensing Corp Mehrkanalige audiocodierung
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
SE0402649D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
KR101228630B1 (ko) * 2005-09-02 2013-01-31 파나소닉 주식회사 에너지 정형 장치 및 에너지 정형 방법
WO2009045649A1 (en) 2007-08-20 2009-04-09 Neural Audio Corporation Phase decorrelation for audio processing
US20090052676A1 (en) 2007-08-20 2009-02-26 Reams Robert W Phase decorrelation for audio processing
US20100040243A1 (en) 2008-08-14 2010-02-18 Johnston James D Sound Field Widening and Phase Decorrelation System and Method
BR122020009732B1 (pt) * 2008-05-23 2021-01-19 Koninklijke Philips N.V. Método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de downmix mono com base em parâmetros espaciais, meio legível por computador não transitório, aparelho de downmix estéreo paramétrico para a geração de um sinal de downmix mono a partir de um sinal esquerdo e de um sinal direito com base em parâmetros espaciais e método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base em parâmetros espaciais
JP5711555B2 (ja) 2010-02-15 2015-05-07 クラリオン株式会社 音像定位制御装置
AU2015201672B2 (en) 2010-08-25 2016-12-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for generating a decorrelated signal using transmitted phase information
SG187950A1 (en) * 2010-08-25 2013-03-28 Fraunhofer Ges Forschung Apparatus for generating a decorrelated signal using transmitted phase information
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
EP2686848A1 (en) 2011-03-18 2014-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frame element positioning in frames of a bitstream representing audio content
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830336A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderer controlled spatial upmix
TWI579831B (zh) 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
EP3061089B1 (en) 2013-10-21 2018-01-17 Dolby International AB Parametric reconstruction of audio signals
CN104581610B (zh) 2013-10-24 2018-04-27 华为技术有限公司 一种虚拟立体声合成方法及装置
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor

Also Published As

Publication number Publication date
KR20200041312A (ko) 2020-04-21
JP7401625B2 (ja) 2023-12-19
CN110998721B (zh) 2024-04-26
EP3659140C0 (en) 2023-09-20
SG11202000510VA (en) 2020-02-27
CN117854515A (zh) 2024-04-09
EP4243453A3 (en) 2023-11-08
CN117612542A (zh) 2024-02-27
EP3659140A2 (en) 2020-06-03
AU2021221466B2 (en) 2023-07-13
US11790922B2 (en) 2023-10-17
PL3659140T3 (pl) 2024-03-11
CA3071208A1 (en) 2019-01-31
AU2021221466A1 (en) 2021-09-16
JP2022180652A (ja) 2022-12-06
EP4243453A2 (en) 2023-09-13
US11341975B2 (en) 2022-05-24
JP2024023572A (ja) 2024-02-21
JP2020528580A (ja) 2020-09-24
US20200152209A1 (en) 2020-05-14
US20220093113A1 (en) 2022-03-24
AR112582A1 (es) 2019-11-13
WO2019020757A2 (en) 2019-01-31
EP3659140B1 (en) 2023-09-20
RU2741379C1 (ru) 2021-01-25
CN110998721A (zh) 2020-04-10
JP2024023574A (ja) 2024-02-21
TW202004735A (zh) 2020-01-16
JP2024023573A (ja) 2024-02-21
BR112020001660A2 (pt) 2021-03-16
TWI697894B (zh) 2020-07-01
JP7161233B2 (ja) 2022-10-26
WO2019020757A3 (en) 2019-03-07
CN117690442A (zh) 2024-03-12
TW201911294A (zh) 2019-03-16
TWI695370B (zh) 2020-06-01
KR102392804B1 (ko) 2022-04-29
AU2018308668A1 (en) 2020-02-06
US20230419976A1 (en) 2023-12-28

Similar Documents

Publication Publication Date Title
ES2965741T3 (es) Aparato para codificar o decodificar una señal multicanal codificada mediante una señal de relleno generada por un filtro de banda ancha
US11107483B2 (en) Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US11322161B2 (en) Audio encoder with selectable L/R or M/S coding
ES2810824T3 (es) Sistema decodificador, método de decodificación y programa informático respectivo
ES2698023T3 (es) Decodificador de audio y método relacionado que usan procesamiento de dos canales dentro de un marco de relleno inteligente de huecos
ES2934646T3 (es) Sistema de procesamiento de audio
ES2953084T3 (es) Decodificador de audio para procesar audio estéreo usando una dirección de predicción variable
ES2587853T3 (es) Dispositivo de decodificación de habla, método de decodificación de habla y programa de decodificación de habla
RU2644135C2 (ru) Устройство и способ декодирования кодированного аудиосигнала с низкими вычислительными ресурсами
KR20180125475A (ko) 멀티 채널 코딩