MX2015002509A - Aparato y metodo para la reproduccion de una señal de audio, aparato y metodo para la generacion de una señal de audio codificada, programa de computadora y señal de audio codificada. - Google Patents

Aparato y metodo para la reproduccion de una señal de audio, aparato y metodo para la generacion de una señal de audio codificada, programa de computadora y señal de audio codificada.

Info

Publication number
MX2015002509A
MX2015002509A MX2015002509A MX2015002509A MX2015002509A MX 2015002509 A MX2015002509 A MX 2015002509A MX 2015002509 A MX2015002509 A MX 2015002509A MX 2015002509 A MX2015002509 A MX 2015002509A MX 2015002509 A MX2015002509 A MX 2015002509A
Authority
MX
Mexico
Prior art keywords
audio signal
signal
frequency band
information
patch
Prior art date
Application number
MX2015002509A
Other languages
English (en)
Other versions
MX347592B (es
Inventor
Sascha Disch
Markus Multrus
Christian Helmrich
Konstantin Schmidt
Benjamin Schubert
Original Assignee
Fraunhofer Ges Zur Förderung Der Angewandten Forschung E V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Zur Förderung Der Angewandten Forschung E V filed Critical Fraunhofer Ges Zur Förderung Der Angewandten Forschung E V
Publication of MX2015002509A publication Critical patent/MX2015002509A/es
Publication of MX347592B publication Critical patent/MX347592B/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

Un aparato para la reproducción de una señal de audio sobre la base de una primera información que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y una segunda información que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia; y que comprende un primer reproductor configurado para reproducir la primera porción de la señal de audio sobre la base de la primera información. Un proveedor está configurado para proporcionar una señal de parche en la segunda banda de frecuencia, donde la señal de parche está al menos parcialmente no correlacionada con respecto a la primera porción de la señal de audio, o es al menos parcialmente una versión descorrelacionada de la primera porción de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia. Un segundo reproductor está configurado para reproducir la segunda porción de la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información y la señal de parche. Una combinadora está configurada para combinar la primera porción reproducida de la señal de audio y la señal de parche antes de que la segunda porción de la señal de audio es reproducida por el segundo reproductor, o para combinar la primera porción reproducida de la señal de audio y la segunda porción reproducida de la señal de audio.

Description

APARATO Y MÉTODO PARA LA REPRODUCCIÓN DE UNA SEÑAL DE AUDIO APARATO Y MÉTODO PARA LA GENERACIÓN DE UNA SEÑAL DE AUDIO CODIFICADA, PROGRAMA DE COMPUTADORA Y SEÑAL DE AÜDIO CODIFICADA Descripción La presente invención se refiere a un aparato, un método y un programa de computadora para la reproducción de una señal de audio, y, en particular, a un aparato, un método y un programa de computadora para la reproducción de una señal de audio en situaciones en las cuales la tasa de datos disponible es reducida. Además, la presente invención se refiere a un aparato, un método y un programa de computadora para la generación de una señal de audio codificada, y a una correspondiente señal de audio codificada.
La codificación perceptualmente adaptada de señales de audio, para el eficiente almacenamiento y transmisión de estas señales de reducida tasa de datos, ha ganado aceptación en muchos campos. Se conocen algoritmos de codificación, en particular, como MPEG-l/2 [MPEG: Moving Pictures Experts Group, grupo de trabajo de expertos para el establecimiento de estándares para el audio y la transmisión de video], capa 3 "MP3", MPEG-2/4 Codificación de Audio Avanzada (AAC, según su sigla en inglés) o MPEG-H Codificación de Audio y Discurso Unificados (USAC según su sigla en inglés). Las téenicas de codificación subyacentes, en particular, cuando se logran las menores tasas de bits, conducen a una reducción de la calidad del audio. El deterioro con frecuencia es producido principalmente por una limitación del lado del codificador, del ancho de banda de la señal de audio por ser transmitida.
En dicha situación, es estado del arte conocido el sometimiento de la señal de audio a una limitación de banda del lado del codificador, y la codificación de solo una banda inferior de la señal de audio por medio de un codificador de audio de alta calidad. La banda superior, sin embargo, solo es caracterizada muy groseramente por un conjunto de parámetros, que proporcionan, por ejemplo, la envoltura espectral de la banda superior. Del lado del decodificador, la banda superior es luego sintetizada mediante el emparche de la señal de banda inferior decodificada, en la banda superior de otra forma vacía, y la realización de subsiguientes ajustes con control de parámetros.
Los métodos convencionales para una extensión de ancho de banda de señales de audio con limitación de banda utilizan una función de copiado de porciones de señal de baja frecuencia (LF, según su sigla en inglés) hacia el rango de alta frecuencia (HF, según su sigla en inglés), a fin de aproximarse a la información faltante debido a la limitación de banda. En principio, dicha función de copiado es téenicamente equivalente a un desplazamiento espectral computado en el dominio de tiempo por medio de la modulación en banda lateral única (SSB, según su sigla en inglés), si bien computacionalmente mucho menos compleja. Dichos métodos, como la Replicación de Banda Espectral (SBR, según su sigla en inglés), se describen en la referencia de M. Dietz, L. Liljeryd, K. Kjórling y O. Kunz, "Spectral Band Replication, a novel approach in audio coding", en la 112th AES Convention, Munich, May 2002; S. Meltzer, R. Bóhm y F. Henn, "SBR enhanced audio codees for digital broadeasting such as "Digital Radio Mondiale" (DRM) ", 112th AES Convention, Munich, May 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm", en la 112th AES Convention, Munich, May 2002; Norma Internacional ISO/IEC 14496-3:2001/FPDAM 1, "Extensión de ancho de banda ", ISO/IEC, 2002, o "Speech bandwidth extensión method and apparatus" (Método y aparato de extensión de ancho de banda de discurso), Vasu Iyengar et al . Patente de los Estados Unidos Nro. 5.455.888.
En estos métodos, no se realiza transposición armónica, si bien se introducen sucesivas señales de paso banda de la banda inferior, en sucesivos canales de banco de filtro de la banda superior. De este modo, se logra una aproximación grosera de la banda superior de la señal de audio. Esta aproximación grosera de la señal es luego aproximada, en una etapa posterior, a la original, por medio de un procesamiento posterior usando información de control obtenida de la señal original. Aquí, por ejemplo, los factores de escala sirven para adaptar la envoltura espectral, una filtración inversa y la adición de un piso de ruido para adaptar la tonalidad y una suplementación por porciones de señal sinusoidal, como se describe además en la Norma MPEG-4.
Se sabe, por las téenicas de extensiones de ancho de banda armónico descriptas en las referencias de Nagel, F.; Disch, S. A Harmonio Bandwidth Extensión Method for Audio Codees, IEEE Int. Conf. on Acoustics, Speech and Signal Processing (ICASSP), 2009; Nagel, F.; Disch, S.; Rettelbach, N. A Phase Vocoder Driven Bandwidth Extensión Method with Novel Transient Handling for Audio Codees, 126th AES Convention, 2009; Zhong, H.; Villemoes, L.; Ekstrand, P. et al. Q F Based Harmonic Spectral Band Replication, 131st Audio Engineering Society Convention, 2011; Villemoes, L.; Ekstrand, P.; Hedelin, P. Methods for enhanced harmonic transposition, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, (WASPAA), 2011, que, en la síntesis de la banda superior, podría introducirse indeseada aspereza auditiva en la señal. Una causa (de muchas) de dicha aspereza es la mala alineación espectral del parche y/o los efectos de disonancia en las regiones de transición entre la banda inferior y el primer parche, o entre parches consecutivos. Las téenicas de extensiones de ancho de banda armónico son diseñadas de manera de mejorar estos dos aspectos, no obstante, a expensas de la complejidad computacional.
Los cálculos de banco de filtro y el emparche en el dominio de banco de filtro, en especial, en la extensión de ancho de banda armónico, pueden convertirse, de hecho, en un alto esfuerzo computacional. En la Solicitud WO 98/57436, se describe una técnica de emparche avanzada que puede, hasta cierto alcance limitado, evitar los efectos de disonancia mediante la introducción de las así denominadas bandas de guardia entre diferentes parches espectrales, y la realización de un emparchado modificado de copia de respaldo a fin de disminuir la mala alineación espectral y, a la vez, mantener la moderada complejidad computacional.
Además, existen otros métodos tales como la así denominada "extensión de ancho de banda ciega", que se describe en la referencia de E. Larsen, R. M. Aarts, y M. Danessis, "Efficient high-frequency bandwidth extensión of music and speech", en AES 112th Convention, Munich, Germany, May 2002, donde no se usa información sobre el rango HF original. Aun más, existe también el método de la así denominada "extensión de ancho de banda artificial", que se describe en la referencia de K. Kyhkó, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.
En la referencia de J. M kinen et al . : AMR-WB+: a new audio coding standard for 3rd generation mobile audio Services Broadcasts, IEEE, ICASSP '05, se describe un método para la extensión de ancho de banda, donde la operación de copiado de la extensión de ancho de banda con un copiado de respaldo de sucesivas señales de paso banda de acuerdo con la teenología SBR es reemplazada por el espejado, por ejemplo, por el muestreado ascendente.
Otras tecnologías para la extensión de ancho de banda se describen en los siguientes documentos. R. M. Aarts, E. Larsen, y O. Ouweltjes, "A unified approach to low- and high frequency bandwidth extensión", AES 115th Convention, New York, USA, October 2003; E. Larsen y R. M. Aarts, "Audio Bandwidth Extensión - Application to psychoacoustics, Signal Processing and Loudspeaker Design", John Wilcy & Sons, Ltd., 2004; E. Larsen, R. M. Aarts, y M. Danessis, "Efficient high-frequency bandwidth extensión of music and speech", AES 112th Convention, Munich, May 2002; J. Makhoul, "Spectral Analysis of Speech by Linear Prediction", IEEE Transactions on Audio and Electroacoustics , AU-21 (3) , June 1973; Solicitud de Patente de los Estados Unidos Nro.08/951.029; Patente de los Estados Unidos Nro.6.895.375.
Los métodos conocidos de extensión de banda armónica muestran vina alta complejidad. Por otra parte, los métodos de extensión de ancho de banda con reducida complejidad muestran pérdidas de calidad. En particular con una baja tasa de bits y en combinación con un bajo ancho de banda del rango LF, pueden producirse artefactos tales como aspereza y un timbre percibido como desagradable. Una razón para esto es principalmente el hecho de que la porción HF aproximada se sustenta en una o más operaciones de copia directa o espejo de la porción LF del espectro.
Es el objeto de la invención proporcionar un aparato y un método para la reproducción de una señal de audio de una manera mejorada. Además, es un objeto de la invención proporcionar un aparato y un método para la generación de una señal de audio codificada que puede ser reproducida de manera mejorada. Es un objeto adicional de la invención proporcionar un correspondiente programa de computadora y una correspondiente señal de audio codificada.
Este objeto es logrado por un aparato para la reproducción de una señal de audio de acuerdo con la reivindicación 1, un método para la reproducción de una señal de audio de acuerdo con la reivindicación 13, un aparato para la generación de una señal de audio codificada de acuerdo con la reivindicación 12, un método para la generación de una señal de audio codificada de acuerdo con la reivindicación 13, un programa de computadora de acuerdo con la reivindicación 14 y una señal de audio codificada de acuerdo con la reivindicación 15.
Las formas de realización de la invención proporcionan un aparato para la reproducción de una señal de audio sobre la base de una primera información que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y una segunda información que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, donde el dispositivo comprende: un primer reproductor configurado para reproducir la primera porción de la señal de audio sobre la base de la primera información; un proveedor configurado para proporcionar una señal de parche en la segunda banda de frecuencia, donde la señal de parche está no correlacionada con respecto a la primera porción de la señal de audio, o es una versión descorrelacionada de la primera porción de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia,- un segundo reproductor configurado para reproducir la segunda porción de la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información y la señal de parche; y una combinadora para combinar la primera porción reproducida de la señal de audio y la señal de parche antes de que la segunda porción de la señal de audio es reproducida por el segundo reproductor, o para combinar la primera porción reproducida de la señal de audio y la segunda porción reproducida de la señal de audio.
Las formas de realización de la invención proporcionan un método para la reproducción de una señal de audio, sobre la base de una primera información que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia y una segunda información que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, donde el método comprende: la reproducción de la señal de audio en la primera banda de frecuencia sobre la base de la primera información; la provisión de una señal de parche en la segunda banda de frecuencia, donde la señal de parche está no correlacionada con respecto a la primera porción de la señal de audio, o es una versión descorrelacionada de la primera porción de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia; la reproducción de la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información y la señal de parche; y la combinación de la primera porción reproducida de la señal de audio y la señal de parche antes de que la segunda porción de la señal de audio es reproducida, o la combinación de la primera porción reproducida de la señal de audio y la segunda porción reproducida de la señal de audio.
Las formas de realización de la invención se refieren a una reproducción de una señal de audio que proporciona una extensión de ancho de banda usando señales de audio de sub banda descorrelacionadas. En contraste a los métodos ya existentes, la mayoría de las distorsiones de señal y artefactos, que actualmente son típicos para las extensiones de ancho de banda, pueden evitarse mediante el uso de señales de audio de sub-banda descorrelacionadas para la extensión de ancho de banda, en lugar de señales de audio de sub-banda correlacionadas (copiadas a modo de respaldo o espejadas). Esto se logra mediante la provisión de la señal de audio, que forma la base para una reproducción de una porción de alta frecuencia de la señal de audio, no correlacionada o descorrelacionada con respecto a la primera porción (porción LF) de la señal de audio. Las formas de realización de la invención se basan en el reconocimiento de que la correlación entre la porción de baja frecuencia y la porción de alta frecuencia no necesariamente debe mantenerse cuando se reproduce la segunda porción de señal de la señal de audio. En cambio, los inventores reconocieron que los artefactos, tales como la aspereza y un timbre percibido como desagradable, pueden evitarse mediante el uso de una señal de parche descorrelacionada o completamente no correlacionada.
Las formas de realización de la invención proporcionan un aparato para la generación de una señal de audio codificada, donde la señal de audio codificada comprende una primera información que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y una segunda información que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, donde el aparato comprende: un añadidor de información de descorrelación configurado para añadir a la señal de audio codificada, información sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción de la señal de audio es reproducida cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada.
Las formas de realización de la invención proporcionan un método para la generación de una señal de audio codificada, donde la señal de audio codificada comprende una primera información que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y una segunda información que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, donde el metodo comprende: la añadidura a la señal de audio codificada, de información sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche sobre la base de lo cual la segunda porción de la señal de audio es reproducida cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada.
Las formas de realización de la invención proporcionan una señal de audio codificada que comprende: una primera información que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia; una segunda información que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia; e información sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche sobre la base de lo cual la segunda porción de la señal de audio es reproducida cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada.
Por lo tanto, las formas de realización de la invención permiten la generación de una señal de audio codificada de modo tal que permite la decodificación de la señal de audio codificada de manera apropiada usando un grado apropiado de descorrelación. El grado apropiado de descorrelación puede ser determinado del lado del codificador, sobre la base de las propiedades de la primera porción y/o la segunda porción de la señal de audio.
En lo que sigue, las formas de realización de la presente invención se explican en más detalle, con referencia a los dibujos adjuntos, en los cuales: la Fig. la muestra un diagrama de bloques de una forma de realización de un aparato para la reproducción de una señal de audio; la Fig. Ib muestra un diagrama de bloques de otra forma de realización de un aparato para la reproducción de una señal de audio; la Fig.2 muestra un diagrama de bloques de una forma de realización adicional de un aparato para la reproducción de una señal de audio; la Fig.3 muestra un diagrama de bloques de una forma de realización de un aparato para la generación de una señal de audio codificada; la Fig. 4a muestra una ilustración esquemática de un lado del codificador en el contexto de las formas de realización de la invención; la Fig. 4b muestra una ilustración esquemática de un lateral de decodificador en el contexto de las formas de realización de la invención; las Figs.5a y 5b muestran diagramas que ilustran las ventajas de las formas de realización de la invención; la Fig.6 muestra un diagrama de bloques de un aparato para la reproducción de una señal de audio a partir de la cual se inicia la invención; y las Fig.7a a 7d muestran diagramas de señal útiles en la explicación de la operación del aparato que se muestra en la Fig.6.
Antes de la explicación de las formas de realización de la invención en detalle, se considera de valor la breve descripción de los conceptos teóricos que sustentan la invención.
Como se explica con anterioridad, las extensiones de ancho de banda sobre la base de operaciones de copia (u operaciones de espejo), tales como SBR (SBR = replicación de banda espectral, según su sigla en inglés), copian grandes partes de un espectro LF directamente en el rango HF.
Un ejemplo de un aparato SBR se describe con referencia a las Figs.6 y 7Aa-7d. La envoltura de una señal de audio 2 se muestra en la Fig.7a. La señal de audio 2 comprende una porción de baja frecuencia (o banda de baja frecuencia) 4 y una porción de alta frecuencia (o banda de alta frecuencia) 6. Usualmente, en la codificación perceptual de señales de audio, la porción de baja frecuencia 4 es codificada por medio de un codificador de audio de alta calidad, tal como un codificador PCM (PCM = modulación por impulsos codificados, según su sigla en inglés), mientras que la banda superior solo es muy groseramente caracterizada por la información lateral. La información que representa la porción de baja frecuencia codificada y la información que representa la información lateral son transmitidas usando un correspondiente códec núcleo. La Fig.6 muestra una señal de banda base 8 de un códec núcleo, que representa la porción de baja frecuencia 4 que se muestra en la Fig.7b. Esta señal 8 se aplica a una unidad de modulación de banda lateral única/copia de respaldo, en la cual la señal 8 es desplazada al rango de frecuencia de la porción de alta frecuencia 6. Esta señal desplazada se muestra como la señal 10 en la Fig. 7c. La señal desplazada 10 y la señal 8 se aplican a una unidad de emparche 12, en la cual ambas señales son combinadas (añadidas) para obtener el espectro que se muestra en la Fig.7c. La porción de señal 8 puede ser desplazada hacia p diferentes rangos de frecuencia más altos, donde p ³ 1. Por lo tanto, puede tener lugar una combinación de una o más señales desplazadas (p) y la señal 8 en la unidad de emparche 12.
La señal de salida de la unidad de emparche 12 se aplica a una unidad de posprocesamiento 14, que además recibe información lateral 16 que representa la señal de audio en la porción de alta frecuencia 6. Por lo tanto, la porción de alta frecuencia 10' de la señal de audio 6 es reproducida sobre la base de la información lateral 16 y la señal de audio de la porción de baja frecuencia 4. La señal de audio resultante se muestra en la Fig. 7d. La unidad de posprocesamiento 14 da salida a la salida de banda completa que cubre los rangos de frecuencia de la porción de baja frecuencia 4 y la porción de alta frecuencia 6.
En consecuencia, las extensiones de ancho de banda sobre la base de operaciones de copia (u operaciones de espejo), tales como SBR, copian grandes partes de un espectro de baja frecuencia directamente en el rango de alta frecuencia. Esto puede lograrse mediante el empleo de una modulación de banda lateral única de la representación de dominio de tiempo de la señal de audio, o mediante un proceso de copia directo (copia de respaldo) en la representación espectral de la señal de audio. Esta etapa de procesamiento habitualmente se denomina "emparche".
Generalmente, puede haber una pluralidad de parches copiados en diferentes bandas de alta frecuencia. Las respectivas bandas de frecuencia pueden superponerse o no superponerse. Cada uno de los correspondientes parches de HF, de este modo, se correlaciona por completo con el rango de baja frecuencia del cual se he extraído. Los inventores reconocieron que, de esta manera, pueden producirse modulaciones de envolturas temporales mediante la superposición de ambas señales con una frecuencia que depende de la distancia espectral entre la banda LF y la ubicación espectral del respectivo parche HF.
Desde el punto de vista teórico del sistema, este fenómeno debe considerarse dual con respecto a la operación de un filtro peine de respuesta de impulso finito (FIR, según su sigla en inglés) que comprende un retardo de n muestras, con Fs como frecuencia de muestra. Ese filtro tiene una respuesta de frecuencia de magnitud con un ancho de peine (distancia espectral entre dos máximas de la respuesta de frecuencia de magnitud) de l/n*Fs. Por lo tanto, la dualidad teórica del sistema tiene las siguientes correspondencias directas: retardo de tiempo <-> traducción de frecuencia respuesta de frecuencia de magnitud <-> envoltura temporal.
Los inventores reconocieron que las modulaciones temporales que resultan de allí son audibles de una manera alterante, y pueden hacerse visibles en la función de autocorrelación de la magnitud de forma de onda en la forma de máximas laterales de repetición periódica. Dichas máximas laterales de repetición periódica en la secuencia de autocorrelación de una envoltura de señal de ruido para SBR de copia de respaldo se muestran en la Fig.5a. La Fig.5a muestra la función de autocorrelación de la envoltura de magnitud de ruido blanco, donde el ancho de banda es extendido con tres parches de copia de respaldo directos que están completamente correlacionados entre sí, y con la banda LF.
Solo cuando la señal LF y la señal HF muestran la misma amplitud, se logra una máxima profundidad de modulación. En la práctica, el efecto de modulación, por lo tanto, con frecuencia es levemente menor, ya que, habitualmente, el rango HF es notablemente más silencioso (menos ruido) que el rango LF. Las señales de tipo ruido o señales cuasiestacionarias con una pronunciada estructura de sobretono deben considerarse particularmente decisivas con respecto a los artefactos de modulación.
Para la presencia de varios parches (p en la Fig.6) que se correlacionan enteramente entre sí, naturalmente, es válida también la dualidad mencionada con anterioridad. Aparece una modulación temporal de la envoltura de magnitud que es dual con respecto a la respuesta de frecuencia de magnitud de un correspondiente filtro FIR.
Por lo tanto, de acuerdo con las formas de realización de la invención, el parche o los parches son descorrelacionados entre sí y con respecto a la banda LF. En las formas de realización de la invención, se usan uno o más descorrelacionadores que descorrelacionan la señal derivada de los componentes de señal de baja frecuencia, respectivamente, antes de la inserción en los rangos de frecuencia más alta y, según el caso, posteriormente al procesamiento.
Las formas de realización de la invención evitan los problemas explicados que se producen debido a una operación de copia o una operación de espejo, mediante el uso de parches mutuamente descorrelacionados. En las formas de realización de la invención, los respectivos parches HF son descorrelacionados de la banda LF de un modo individual usando descorrelacionadores, por ejemplo, por medio de filtros paso todo u otros métodos de descorrelación conocidos, o de manera de crear los parches sintéticamente de una manera naturalmente descorrelacionada directamente.
En las formas de realización de la invención, el grado de descorrelación puede ser determinado fijamente o puede ser ajustado del lado del decodificador, o puede transmitirse como un parámetro desde el codificador hasta el decodificador. Además, el parche entero puede ser descorrelacionado, o solo porciones específicas del parche. Las porciones del parche por descorrelacionar también pueden ser transmitidas como un parámetro desde el codificador hasta el decodificador como parte de la correspondiente información añadida a la señal de audio codificada.
El enfoque de la invención es beneficioso en comparación con los enfoques convencionales para la extensión de ancho de banda, ya que las distorsiones y las coloraciones de sonido por las modulaciones de envoltura parasitarias o de alteración, tal como existen con los métodos actuales sobre la base de la modulación de banda lateral única/copia de respaldo de la banda LF, son inherentemente evitadas con el enfoque de la invención. Esto se logra mediante el uso de parches HF que son versiones descorrelacionadas de la porción de señal LF, o que son completamente no correlacionadas con respecto a la porción de señal LF.
Un escenario en el cual las formas de realización de la invención pueden implementarse se describe ahora con referencia a las Figs.4a y 4b.
Un lado del codificador se muestra en la Fig.4a, y un lado del decodificador se muestra en la Fig.4b. Se alimenta una señal de audio en una combinación de bajo paso/alto paso en una entrada 700. La combinación de bajo paso/alto paso, por una parte, incluye un bajo paso (LP, según su sigla en inglés), para generar una versión filtrada de bajo paso de la señal de audio, ilustrado en 703 en la Fig.7a. Esta señal de audio filtrada de bajo paso es codificada con un codificador de audio 704. El codificador de audio es, por ejemplo, un codificador de MP3 (MPEG-1/2 capa 3) o un codificador de AAC, descripto en la norma MPEG-2/4. Pueden usarse codificadores de audio alternativos que proporcionen una representación transparente o, de modo conveniente, perceptualmente transparente de la señal de audio con limitación de banda 703, en el codificador 704, para generar una señal de audio completamente codificada o perceptualmente codificada y perceptualmente transparentemente codificada 705, respectivamente. La banda superior de la señal de audio sale en una salida 706 por la porción de paso alto del filtro 702, designada por "HP". La porción de paso alto de la señal de audio, es decir, la banda superior o banda HF, tambien designada como la porción HF, es suministrada a un calculador de parámetros 707 que se implementa para calcular los diferentes parámetros (que representan información lateral que representa la porción de alta frecuencia de la señal de audio). Estos parámetros son, por ejemplo, la envoltura espectral de la banda superior 706 en una resolución relativamente grosera, por ejemplo, por representación de un factor de escala para cada grupo de frecuencia sobre una escala perceptualmente adaptada (bandas críticas), por ejemplo, para cada banda Bark en la escala de Bark. Un parámetro adicional que puede ser calculado por el calculador de parámetros 707 es el piso de ruido en la banda superior, cuya energía por banda puede relacionarse con la energía de la envoltura en esta banda. Otros parámetros que puede ser calculados por el calculador de parámetros 707 incluyen una medida de tonalidad para cada banda parcial de la banda superior, que indica la manera en que la energía espectral está distribuida en una banda, es decir, si la energía espectral en la banda se distribuye de manera relativamente uniforme, donde, entonces, existe una señal no tonal en esta banda, o si la energía en esta banda está concentrada en forma relativamente fuerte en una cierta ubicación en la banda, donde, entonces, existe en cambio una señal tonal para esta banda. Otros parámetros consisten en picos explícitamente codificadores que sobresalen en forma relativamente fuerte en la banda superior con respecto a su altura y su frecuencia, ya que el concepto de extensión de ancho de banda, en la reconstrucción sin dicha codificación explícita de porciones sinusoidales prominentes en la banda superior, solo hará una recuperación en forma muy rudimentaria, o en forma totalmente nula.
En cualquier caso, el calculador de parámetros 707 se implementa para generar solamente los parámetros 708 para la banda superior, que puede someterse a etapas de reducción de entropía similares como también pueden efectuarse en el codificador de audio 704 para valores espectrales cuantificados, tales como la codificación diferencial, la predicción o la codificación Huffman, etc. La representación de parámetros 708 y la señal de audio 705 entonces se suministran a un formateador de corriente de datos 709, que se implementa para proporcionar una corriente de datos lateral de salida 710, que, típicamente, es una corriente de bits de acuerdo con un cierto formato, como, por ejemplo, es normalizado en la norma MPEG4.
El lado del decodificador, como puede ser adecuado para la presente invención, se muestra en la Fig.7b. La corriente de datos 710 entre en un interpretador de corriente de datos 711, que se implementa para separar la porción de parámetros 708 de la porción de señal de audio 705. La porción de parámetro 708 es decodificada por un decodificador de parámetros 712, a fin de obtener parámetros decodificados 713. En forma paralela, la porción de señal de audio 705 es decodificada por un decodificador de audio 714, de manera de obtener la señal de audio 777 que se ilustra, por ejemplo, en 8 en la Fig.6.
De acuerdo con la implementación, la señal de audio 777 puede salir por medio de una primera salida 715. En la salida 715, puede obtenerse entonces una señal de audio con un ancho de banda pequeño y, en consecuencia, además, con una baja calidad. Sin embargo, para un mejoramiento de la calidad, puede efectuarse la extensión de ancho de banda 720 haciendo uso del enfoque de la invención como se describe en lo que sigue con referencia a las Figs. la, Ib y 2, a fin de obtener la señal de audio 112 del lado de la salida con un ancho de banda extendido o alto, respectivamente, y una alta calidad.
Una forma de realización de un aparato de la invención para la reproducción de una señal de audio y, por lo tanto, la extensión de su ancho de banda, se muestra en la Fig. la. El aparato comprende un primer reproductor 100, un proveedor 102, una combinadora 104 y un segundo reproductor 106. Opcionalmente, puede proporcionarse un detector de transición 108. El primer reproductor 100 recibe, en una de sus entradas, primera información 120 que representa una versión codificada de una primera porción de información de audio en una primera banda de frecuencia. Por ejemplo, la primera información 120 puede corresponder a la porción de señal de audio 705 que se muestra en la Fig.4b. El primer reproductor 100 reproduce la señal de audio en la primera banda de frecuencia sobre la base de la primera información 120. Por ejemplo, el primer reproductor 100 puede estar formado por el decodificador de audio 714 expuesto en la Fig.4b. El primer reproductor 110 da salida a la señal de audio en la primera banda de frecuencia, que puede corresponder a la señal de audio 777 que se muestra en la Fig.4b. La señal de audio 777 se aplica al proveedor 102, que provee una señal de parche 122 en la segunda banda de frecuencia. La señal de parche 122 está al menos parcialmente no correlacionada con respecto a la primera porción de la señal de audio 777, o es al menos parcialmente una versión descorrelacionada de la primera porción de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia. La señal de audio 777 y la señal de parche 122 se combinan, por ejemplo, se añaden, en la combinadora 104. La señal combinada 124 sale y se aplica al segundo reproductor 106. El segundo reproductor 106 recibe la señal combinada 124 y la segunda información 126 que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia. Por ejemplo, la segunda información 126 puede corresponder a parámetros decodificados 713 descriptos con anterioridad con respecto a la Fig.4b. El segundo reproductor 106 reproduce la señal de audio en la segunda banda de frecuencia sobre la base de la señal de parche (dentro de la señal combinada 124) y sobre la base de la segunda información 126.
En las formas de realización de la invención, la primera banda de frecuencia puede corresponder al rango de frecuencia asociado con la primera porción de la señal de audio que se muestra en la Fig.7a, y la segunda banda de frecuencia puede corresponder al rango de frecuencia asociado con la segunda porción de la señal de audio que se muestra en la Fig.7a.
De acuerdo con la forma de realización que se muestra en la Fig. la, el segundo reproductor 106 da salida a una señal de audio reproducida 128 con un alto ancho de banda.
En la forma de realización alternativa que se muestra en la Fig. Ib, la salida del proveedor 102 se acopla con el segundo reproductor 106, y la salida del segundo reproductor 106 se acopla a la combinadora 104. Por lo tanto, de acuerdo con la forma de realización que se muestra en la Fig. Ib, una señal de audio 130 en la segunda banda de frecuencia es reproducida desde la señal de parche provista por el proveedor 102 antes de la combinación de la señal de parche con la primera porción 777 de la señal de audio. Nuevamente, el segundo reproductor reproduce la señal de audio 130 en la segunda banda de frecuencia, sobre la base de la segunda información 126 y la señal de parche 122. De acuerdo con la forma de realización que se muestra en la Fig. Ib, la combinadora 104 da salida a la señal de audio reproducida 128.
En las formas de realización de la invención, el proveedor comprende una unidad de desplazamiento y un descorrelacionador, que están configurados para generar la señal de parche como una versión descorrelacionada de la primera porción de la señal de audio desplazada hacia la segunda banda de frecuencia. En las formas de realización de la invención, el proveedor está configurado para proporcionar una señal de parche sintética que está no correlacionada con respecto a la primera porción de la señal de audio. En las formas de realización de la invención, el proveedor está configurado para proporcionar una pluralidad de señales de parche para una pluralidad de bandas de frecuencia más alta. En dichas formas de realización, el segundo reproductor y la segunda combinadora se adaptan para reproducir una pluralidad de segundas porciones de señal y para combinar la pluralidad de porciones de señal en la señal de audio reproducida.
Una forma de realización de un aparato para la reproducción de una señal de audio usando extensión de ancho de banda, que utiliza señales de audio de sub-banda descorrelacionadas, se muestra en la Fig. 2. El aparato recibe una señal de banda base desde el códec núcleo, que puede ser la señal 777 que se muestra en la Fig.4b. La señal 777 se aplica a una unidad de desplazamiento 200. La unidad de desplazamiento 200 está configurada para desplazar la señal 777 desde el rango de baja frecuencia hasta un rango de alta frecuencia, tal como un rango de frecuencia asociado con la porción de baja frecuencia 4 en la Fig.7a al rango de frecuencia asociado con la porción de alta frecuencia 6 en la Fig. 7a.
La unidad de desplazamiento 200 puede estar configurada para simplemente copiar en forma de respaldo la porción de señal 777 al rango de alta frecuencia en el dominio de frecuencia. Alternativamente, la unidad de desplazamiento 200 puede implementarse como una unidad de modulación de banda lateral única configurada para realizar una modulación de banda lateral única en el dominio de tiempo a fin de desplazar la primera porción de la señal de audio desde la primera banda de frecuencia hasta la segunda banda de frecuencia.
La primera porción desplazada de la señal de audio se aplica a una unidad de descorrelación 202a. La primera porción descorrelacionada desplazada de la señal de audio sale de la unidad de descorrelación 202a como una señal de parche 204. La señal de parche 204 se aplica a una unidad de emparche 206, en la cual la señal de parche 204 se combina con la primera porción 777 de la señal de audio. Por ejemplo, la señal de parche y la primera porción de la señal de audio son concatenadas o añadidas en la unidad de emparche 206. La señal combinada sale de la unidad de emparche 206 y se aplica a una unidad de posprocesamiento 210.
La unidad de posprocesamiento 210 recibe la segunda información 212 y representa un segundo reproductor configurado para reproducir la segunda porción de la señal de audio en una segunda banda de frecuencia sobre la base de la segunda información 212 y la señal de parche 204 (que se incluye en la señal combinada 208). Nuevamente, la segunda información 212 representa información lateral, y puede corresponder a parámetros decodificados 713 explicados con anterioridad con respecto a la Fig.4b. Una salida de banda completa 214 de la unidad de posprocesamiento 210 representa la señal de audio reproducida.
En la forma de realización que se muestra en la Fig.2, la unidad de desplazamiento 200 y la unidad de descorrelación 202a representan un proveedor configurado para proporcionar una señal de parche 204.
En las formas de realización de la invención, la unidad de desplazamiento 200 puede estar configurada para desplazar la primera porción 777 de la señal de audio en una pluralidad de p diferentes bandas de frecuencia. Una unidad de descorrelación 202a-202p puede proporcionarse para cada versión desplazada, a fin de proporcionar p señales de parche. En el caso de usar más de un parche (tal como p parches), los p parches deben estar no correlacionados entre sí y la banda LF. Luego, las versiones desplazadas asociadas con cada banda de frecuencia se combinan dentro de la unidad de emparche 206. Una segunda información que representa información lateral para cada una de las bandas de frecuencia más alta puede proporcionarse a la unidad de posprocesamiento 210, de modo que una pluralidad de porciones de frecuencia más alta de la señal de audio son reproducidas en la unidad de posprocesamiento 210.
En las formas de realización de la invención, la primera y segunda bandas de frecuencia (y las bandas de frecuencia adicionales opcionales) pueden superponerse, o pueden no superponerse en la dirección de frecuencia.
Por lo tanto, en las formas de realización de la invención, el proveedor comprende una unidad de desplazamiento configurada para desplazar una primera porción de una señal de audio en una primera banda de frecuencia a una segunda banda de frecuencia o a una pluralidad de diferentes segundas bandas de frecuencia, y un descorrelacionador para descorrelacionar la versión desplazada de la primera porción de la señal de audio, de la primera porción de la señal de audio. En las formas de realización de la invención, el descorrelacionador puede tener las mismas propiedades que aquellas conocidas, por ejemplo, de la descorrelación de codificación de audio espacial. En las formas de realización de la invención, el descorrelacionador puede proporcionar una descorrelación suficiente para evitar las distorsiones de señal y los artefactos típicos de extensiones de ancho de banda convencionales usando la replicación de banda espectral. El descorrelacionador puede proporcionar una preservación de la envoltura espectral de la primera porción de la señal de audio, y/o puede proporcionar una preservación de la envoltura temporal, es decir, los transientes, de la primera porción de la señal de audio. El diseño de un descorrelacionador apropiado, en consecuencia, podría involucrar típicamente un trueque por realizar entre la preservación de transiente y la descorrelación.
En las formas de realización de la invención, el descorrelacionador puede implementarse como un filtro IIR (IIR= respuesta de impulso infinito) en el dominio de tiempo o el dominio de tiempo de sub-banda, por ejemplo, un filtro paso todo, donde la descorrelación se logra por medio de variaciones de retardo de grupo. En las formas de realización de la invención, el descorrelacionador puede configurarse de manera de proporcionar la aleatorización de fase de los coeficientes espectrales en una compleja (sobremuestreada) representación transformada/banco de filtro (representación DFT, QMF) (DFT = transformada Fourier discreta; QMF = filtro espejo de cuadratura). En las formas de realización de la invención, el descorrelacionador puede configurarse a fin de proporcionar una aplicación de un retardo de tiempo dependiente de la frecuencia, en una representación de banco de filtro.
Las formas de realización de la invención pueden comprender un descorrelacionador adaptador de señal, que varía el grado de descorrelación a fin de preservar transientes. Puede proporcionarse una alta descorrelación para señales cuasiestacionarias, y puede proporcionarse una baja descorrelación para señales transientes. En consecuencia, en las formas de realización de la invención, el proveedor para la provisión de la señal de parche puede ser desplazable entre diferentes grados de descorrelación.
En las formas de realización, el proveedor para la provisión de la señal de parche puede ser desplazable entre diferentes grados de descorrelación, según si la primera porción de señal comprende un indicador para una fuerte correlación entre la primera porción de la señal de audio y la segunda porción de señal de audio. Las formas de realización para dicho indicador son un transiente en la primera porción de la señal de audio, discurso de voz que consiste en ondas de pulso en la primera porción de la señal de audio y/o el sonido de instrumentos de viento metal en la primera porción de la señal de audio. En lo que sigue, se describen las formas de realización, en las cuales el indicador es un transiente en la primera porción de la señal de audio.
En las formas de realización de la invención, el aparato puede comprender un detector configurado para detectar si la primera porción de la señal de audio comprende un transiente. Dicho detector 108 se muestra esquemáticamente en las Figs. la y Ib. De acuerdo con la señal de salida del detector 108, el proveedor 102 puede configurarse de manera de proporcionar la señal de parche con una alta descorrelación para señales cuasiestacionarias, es decir, cuando la primera porción de la señal de audio no tiene un transiente), y una baja descorrelación, si la primera porción de la señal de audio tiene señales transientes.
En formas de realización alternativas de la invención, el aparato puede comprender un descorrelacionador adaptador de señal que es activado para señales cuasiestacionarias y desactivado para porciones de señales transientes. En otras palabras, el proveedor puede estar configurado para dar salida a la primera porción de señal desplazada sin su descorrelación, en el caso de que la primera porción de señal comprenda porciones de señal transiente, y para dar salida a la señal de parche descorrelacionada solamente, en el caso de que la primera porción de señal no comprenda transientes o porciones de señal transiente. En dichas formas de realización, el segundo reproductor está configurado para reproducir la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información y la señal de parche, si la primera porción de la señal de audio no comprende un transiente, y está configurado para reproducir la señal de audio en una segunda banda de frecuencia sobre la base de la segunda información y una versión de la primera porción de la señal de audio que se ha desplazado hacia la segunda banda de frecuencia y que no se ha descorrelacionado, si la primera porción de la señal de audio comprende un transiente.
Puede considerarse que un transiente o porciones de transientes consisten en el hecho de que la señal de audio cambia mucho en total, es decir, que, por ejemplo, la energía de la señal de audio cambia más del 50% desde una porción temporal hacia la siguiente porción temporal, es decir, incrementa o disminuye. El umbral de 50% es solo un ejemplo; sin embargo, también puede ser valores menores o mayores. Alternativamente, para una detección de transiente, el cambio de distribución de energía también puede considerarse, por ejemplo, en la transición de una vocal a una sibilante.
En las formas de realización de la invención, el proveedor puede estar configurado para proporcionar una señal de parche sintético que está no correlacionada con respecto a la primera porción de la señal de audio. En otras palabras, el emparche con una señal de parche sintético no correlacionada (tal como ruido sintético) ya podría ser suficiente si el procesamiento posterior paramétrico es granular fino (escenario de codee de alta tasa de bits) o si la banda HF de la señal, de todos modos, es de tipo ruidosa.
En las formas de realización de la invención, una correlación de la banda LF y la banda HF dentro de una extensión de ancho de banda (como SBR), sin embargo, es útil para mejorar una cuadrícula de tiempo demasiado gruesa de procesamiento posterior paramétrico (por ejemplo, debido a un escenario de códec de baja tasa de bits), una reproducción exacta de transientes, y una preservación de tonos que tienen una rica estructura de sobretono (habitualmente, la tonalidad no es afectada por la descorrelación, y en consecuencia, la preservación de la tonalidad no presenta un problema en el diseño de un descorrelacionador).
En términos de los descorrelacionadores conocidos, por ejemplo, de la descorrelación de codificación de audio espacial, se hace referencia, por ejemplo, a la Solicitud Internacional WO 2007/118583 Al.
En las formas de realización de la invención, el proveedor 102 puede comprender un descorrelacionador adaptador, que ajusta la descorrelación de los parches HF sobre la base de un parámetro transmitido desde un codificador hacia el decodificador. En dichas formas de realización, el aparato está configurado para la reproducción de una señal de audio sobre la base de la primera información, la segunda información y tercera información que comprende información sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción es reproducida cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada. Dicha tercera información puede ser añadida a la información de audio codificada en el lado del codificador, tal como por medio de un añadidor de información de descorrelación 300 que se muestra en la Fig.3 de la presente solicitud. El aparato que se muestra en la Fig.3 corresponde al aparato que se muestra en la Fig. 4a, excepto el añadidor de información de descorrelación.
El añadidor de información de descorrelación 300 recibe la salida del filtro de paso bajo 702, y puede detectar propiedades de la señal de salida del filtro de bajo paso 702. Por ejemplo, el añadidor de información de descorrelación puede detectar transientes en la señal de salida del filtro de bajo paso 702. De acuerdo con las propiedades de la salida del filtro de bajo paso 702, el añadidor de información de descorrelación añade a la señal de audio codificada 710 información sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción es reproducida cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada. Por ejemplo, la información de descorrelación puede instruir al proveedor del lado del decodificador, para la realización de una baja descorrelación, o para la no realización de ninguna descorrelación, en el caso de que haya porciones transientes en la porción de baja frecuencia de la señal de audio.
En las formas de realización de la invención, el añadidor de información de descorrelación además puede recibir la porción de alta frecuencia 706 de la señal de audio, y puede estar configurado para derivar propiedades desde allí. Por ejemplo, en el caso de que el añadidor de información de descorrelación detecta que la banda HF es de tipo ruido, puede advertir al proveedor del lado del decodificador que proporcione la señal de parche sobre la base de una señal de ruido sintético.
En dichas formas de realización, la señal de audio codificada 320 representada por la corriente de datos 710 comprende primera información 321 que representa una versión codificada de una primera porción de una señal de audio; segunda información 322 que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia; e información 323 sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción es reproducida cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada.
Por consiguiente, las formas de realización de la invención proporcionan un enfoque mejorado para la reproducción de una señal de audio, es decir, para una extensión, del lado del decodificador, del ancho de banda de la señal de audio. En otras formas de realización, la invención provee un aparato para la generación de una señal de audio codificada. En aun otras formas de realización, la invención se refiere a dichas señales de audio codificadas.
El efecto conveniente logrado por el enfoque de la invención puede hacerse visible mediante una comparación de la secuencia de autocorrelación de la envoltura de señal de ruido para SBR de copia de respaldo (que se muestra en la Fig. 5a), con la secuencia de autocorrelación de la envoltura de señal de ruido de parches descorrelacionados como se muestra en la Fig.5b de la presente solicitud. La Fig.5b es la función de autocorrelación de la envoltura de magnitud de ruido blanco, donde el ancho de banda es extendido con tres parches no correlacionados entre sí y con la banda LF. La Fig. 5b muestra claramente la desaparición de las máximas laterales indeseadas que se muestran en la Fig.5a.
La presente solicitud es aplicable o adecuada para todas las aplicaciones de audio en las cuales el ancho de banda completo no está disponible. El enfoque de la invención puede hallar uso en la distribución o transmisión de contenido de audio, por ejemplo, con aplicaciones de radio digital, lectura en continuo ( strea ing) de Internet y comunicación de audio. Las formas de realización de la invención se refieren a una extensión de ancho de banda usando señales de audio de sub-banda descorrelacionadas.
Si bien algunos aspectos se han descripto en el contexto de un aparato, es claro que estos aspectos también representan una descripción del correspondiente método, donde un bloque o dispositivo corresponde a una etapa de método o un rasgo de una etapa de método. En forma análoga, los aspectos descriptos en el contexto de una etapa de método también representan una descripción de un correspondiente bloque, ítem o rasgo de un correspondiente aparato.
De acuerdo con ciertos requerimientos de implementación, las formas de realización de la invención pueden implementarse en soporte físico o en soporte lógico. La implementación puede realizarse usando un medio de almacenamiento digital, por ejemplo, un disquete, un DVD (disco versátil digital, según su sigla en inglés), un CD (disco compacto, según su sigla en inglés), una ROM (memoria de solo lectura, según su sigla en inglés), una PROM (memoria de solo lectura programable, según su sigla en inglés), una EPROM (memoria de solo lectura programable borrable, según su sigla en inglés), una EEPROM (memoria de solo lectura programable y borrable eléctricamente, según su sigla en inglés) o una memoria FLASH, con señales de control legibles electrónicamente allí almacenadas, que cooperan (o son capaces de cooperar) con un sistema de computadora programable de modo tal que se lleva a cabo el respectivo método.
Algunas formas de realización de acuerdo con la invención comprenden un portador de datos que tiene señales de control legibles electrónicamente, que son capaces de cooperar con un sistema de computadora programable, de manera tal que se lleva a cabo uno de los métodos descriptos en la presente solicitud.
Generalmente, las formas de realización de la presente invención pueden implementarse como un producto de programa de computadora con un código de programa, donde el código de programa es operativo para la realización de uno de los metodos cuando el producto de programa de computadora se ejecuta en una computadora. El código de programa, por ejemplo, puede ser almacenado en un portador legible por una máquina tangible.
Otras formas de realización comprenden el programa de computadora para la realización de uno de los métodos descriptos en esta solicitud, almacenado en un portador legible por una máquina, o en un medio de almacenamiento no transitorio.
En otras palabras, una forma de realización del método de la invención, por lo tanto, es un programa de computadora que tiene un código de programa para la realización de uno de los métodos descriptos en esta solicitud, cuando el programa de computadora se ejecuta en una computadora.
Una forma de realización adicional de los métodos de la invención, por lo tanto, es un portador de datos (o un medio de almacenamiento digital, o un medio de lectura por computadora) que comprende, allí grabado, el programa de computadora para la realización de uno de los métodos descriptos en esta solicitud.
Otra forma de realización del método de la invención es, por lo tanto, una corriente de datos o una secuencia de señales que representan el programa de computadora para la realización de uno de los métodos descriptos en esta solicitud. La corriente de datos o la secuencia de señales, por ejemplo, puede configurarse para ser transferida por medio de una conexión de comunicación de datos, por ejemplo, por medio de la Internet.
Una forma de realización adicional comprende un medio de procesamiento, por ejemplo, una computadora, o un dispositivo lógico programable, configurado o adaptado para llevar a cabo uno de los métodos descriptos en esta solicitud.
Otra forma de realización comprende una computadora que tiene instalado el programa de computadora para la realización de uno de los métodos descriptos en esta solicitud.
En algunas formas de realización, un dispositivo lógico programable (por ejemplo, una matriz de puertas programable de campo) puede usarse para realizar algunas o la totalidad de las funcionalidades de los métodos descriptos en esta solicitud. En algunas formas de realización, una matriz de puertas programable de campo puede cooperar con un microprocesador a fin de llevar a cabo uno de los métodos que se describen en la presente solicitud. En general, los métodos son realizados, preferentemente, por cualquier aparato de soporte físico.
Las formas de realización descriptas con anterioridad son meramente ilustrativas de los principios de la presente invención. Debe entenderse que las modificaciones y variaciones de las disposiciones y los detalles que se describen en la presente solicitud serán evidentes para los expertos en la téenica. Por lo tanto, se tiene la intención de limitación solo por el alcance de las reivindicaciones de patente inminentes, y no por los detalles específicos presentados a modo de descripción y explicación de las formas de realización de esta solicitud.

Claims (15)

REIVINDICACIONES
1. Un aparato para la reproducción de una señal de audio sobre la base de primera información (120; 321; 705) que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y segunda información (126; 322; 708) que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, donde dicho dispositivo comprende: un primer reproductor (100) configurado para reproducir la primera porción (777) de la señal de audio sobre la base de la primera información (120; 321; 705); un proveedor (102; 200, 202a) configurado para proporcionar una señal de parche (122; 204) en la segunda banda de frecuencia, donde la señal de parche (122; 204) está al menos parcialmente no correlacionada con respecto a la primera porción (777) de la señal de audio, o es al menos parcialmente una versión descorrelacionada de la primera porción (777) de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia; un segundo reproductor (106) (106) que representa un post-procesador y configurado para reproducir la segunda porción de la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información (126; 322; 708) y la señal de parche (122; 204), en donde una envoltura espectral de la segunda porción de la señal de audio, un piso de ruido en la segunda porción de la señal de audio, una medida de tonalidad para cada banda parcial en la segunda porción de la señal de audio, y una codificación explícita de porciones sinusoidales prominentes en la segunda porción de la señal de audio representa información lateral representada por la segunda información; y una combinadora (104) para combinar la primera porción reproducida (777) de la señal de audio y la señal de parche (122; 204) antes de que la segunda porción de la señal de audio es reproducida por el segundo reproductor, o para combinar la primera porción reproducida (777) de la señal de audio y la segunda porción reproducida de la señal de audio.
2. El aparato de la reivindicación 1, donde el segundo reproductor (106) está configurado para reproducir la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información (126; 322; 708) y la señal de parche (122; 204), si la primera porción (777) de la señal de audio no comprende un indicador para una correlación entre la primera porción de la señal de audio y la segunda porción de la señal de audio, y donde el segundo reproductor (106) está configurado para reproducir la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información (126; 322; 708) y una versión de la primera porción de la señal de audio que se ha desplazado hacia la segunda banda de frecuencia y que no se ha descorrelacionado, si la primera porción (777) de la señal de audio comprende un indicador para una correlación entre la primera porción de la señal de audio y la segunda porción de la señal de audio.
3. El aparato de la reivindicación 1 o 2, donde el proveedor (102) está configurado para proporcionar una señal de parche sintético que está no correlacionada con respecto a la primera porción de la señal de audio.
4. El aparato de la reivindicación 3, donde la señal de parche sintético es una señal de ruido.
5. El aparato de la reivindicación 1 o 2, donde el proveedor (102) comprende a unidad de desplazamiento (200) y un descorrelacionador (202a ....202p), que están configurados para generar la señal de parche (122; 204) como una versión descorrelacionada de la primera porción (777) de la señal de audio desplazada hacia la segunda banda de frecuencia.
6. El aparato de la reivindicación 5, donde el descorrelacionador (202a ... 202p) está configurado para preservar por lo menos una de una envoltura espectral de la primera porción (777) de la señal de audio y una envoltura temporal de la primera porción (777) de la señal de audio.
7. El aparato de la reivindicación 5 o 6, donde el descorrelacionador (202a ...202p) comprende uno de: un filtro paso todo configurado para causar variaciones de retardo de grupo en la primera porción de la señal de audio; un aleatorizador de fase configurado para causar la aleatorización de fase de coeficientes espectrales de la primera porción de la señal de audio; y un aplicador configurado para aplicar un retardo de tiempo dependiente de la frecuencia a subporciones de la primera porción de la señal de audio.
8. El aparato de una de las reivindicaciones 5 a 7, donde el descorrelacionador (202a ... 202p) comprende un descorrelacionador adaptador de señal configurado para variar el grado de descorrelación a fin de aplicar una descorrelación más alta si la primera porción (777) de la señal de audio no comprende un indicador para una correlación entre la primera porción de la señal de audio y la segunda porción de la señal de audio, y para aplicar una menor descorrelación o no aplicar una descorrelación si la primera porción (777) de la señal de audio comprende un indicador para una correlación entre la primera porción de la señal de audio y la segunda porción de la señal de audio.
9. El aparato de una de las reivindicaciones 2 a 8, que comprende un detector (108) configurado para detectar si la primera porción de señal (777) de la señal de audio comprende un indicador para una correlación entre la primera porción de la señal de audio y la segunda porción de la señal de audio.
10. El aparato de una de las reivindicaciones 1 a 9, donde el proveedor (200, 202a ...202p) está configurado para proporcionar una segunda señal de parche en una tercera banda de frecuencia, donde la segunda señal de parche está no correlacionada con respecto a la primera porción de la señal de audio o es una versión descorrelacionada de la primera porción de la señal de audio, que se ha desplazado hacia la tercera banda de frecuencia, donde la segunda señal de parche está no correlacionada o está descorrelacionada con respecto a la primera señal de parche, donde el aparato comprende un tercer reproductor, donde el tercer reproductor está configurado para reproducir una tercera porción de la señal de audio sobre la base de la segunda señal de parche y la tercera información que representa información lateral sobre la tercera porción de la señal de audio en la tercera banda de frecuencia, donde la tercera banda de frecuencia comprende frecuencias superiores a la segunda banda de frecuencia.
11. Un método para la reproducción de una señal de audio sobre la base de la primera información (120; 321; 705) que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y segunda información (126; 322; 708) que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, donde dicho método comprende: reproducir la señal de audio (777) en la primera banda de frecuencia sobre la base de la primera información (120; 321; 705); proveer una señal de parche (122; 204) en la segunda banda de frecuencia, donde la señal de parche (122; 204) está al menos parcialmente no correlacionada con respecto a la primera porción (777) de la señal de audio o es al menos parcialmente una versión descorrelacionada de la primera porción (777) de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia; reproducir la segunda porción de la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información (126; 322; 708) y la señal de parche (122; 204) por medio de un post-procesador, en donde una envoltura espectral de la segunda porción de la señal de audio, un piso de ruido en la segunda porción de la señal de audio, una medida de tonalidad para cada banda parcial en la segunda porción de la señal de audio, y una codificación explícita de porciones sinusoidales prominentes en la segunda porción de la señal de audio representa información lateral representada por la segunda información; y combinar la primera porción reproducida (777) de la señal de audio y la señal de parche (122; 204) antes de que la segunda porción de la señal de audio es reproducida, o combinar la primera porción reproducida (777) de la señal de audio y la segunda porción reproducida de la señal de audio.
12. Un aparato para la generación de una señal de audio codificada (320), donde la señal de audio codificada (320) comprende primera información (321) que representa una versión codificada de una primera porción (703) de la señal de audio en una primera banda de frecuencia, y segunda información (322) que representa información lateral sobre una segunda porción (706) de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, que comprende: un añadidor de información de descorrelación (300) configurado para añadir a la señal de audio codificada (320) además de la primera información (321) y la segunda información (322), información (323) sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción de la señal de audio es reproducida por medio de un post-procesador cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada, en donde una envoltura espectral de la segunda porción de la señal de audio, un piso de ruido en la segunda porción de la señal de audio, una medida de tonalidad para cada banda parcial en la segunda porción de la señal de audio, y una codificación explícita de porciones sinusoidales prominentes en la segunda porción de la señal de audio representa información lateral representada por la segunda información.
13. Un método para la generación de una señal de audio codificada (320), donde la señal de audio codificada (320) comprende primera información (321) que representa una versión codificada de una primera porción (703) de la señal de audio en una primera banda de frecuencia, y segunda información (322) que representa información lateral sobre una segunda porción (706) de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia, que comprende: añadir a la señal de audio codificada (320), además de la primera información (321) y la segunda información (322), información (323) sobre un grado de descorrelación para ser usado entre la primera porción de la señal de audio y una señal de parche, sobre la base de lo cual la segunda porción de la señal de audio es reproducida por medio de un post-procesador cuando se realiza la reproducción de la señal de audio desde la señal de audio codificada (320), en donde una envoltura espectral de la segunda porción de la señal de audio, un piso de ruido en la segunda porción de la señal de audio, una medida de tonalidad para cada banda parcial en la segunda porción de la señal de audio, y una codificación explícita de porciones sinusoidales prominentes en la segunda porción de la señal de audio representa información lateral representada por la segunda información.
14. Un medio legible por computadora para reproducir una señal de audio sobre la base de primera información (120; 321; 705) que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y segunda información (126; 322; 708) que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia que comprende el método de la reivindicación 11.
15. Un medio legible por computadora para la generación de una señal de audio codificada (320), donde la señal de audio codificada (320) comprende primera información (321) que representa una versión codificada de una primera porción (703) de la señal de audio en una primera banda de frecuencia, y segunda información (322) que representa información lateral sobre una segunda porción (706) de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia que comprende el método de la reivindicación 13. RESUMEN Un aparato para la reproducción de una señal de audio sobre la base de una primera información que representa una versión codificada de una primera porción de la señal de audio en una primera banda de frecuencia, y una segunda información que representa información lateral sobre una segunda porción de la señal de audio en una segunda banda de frecuencia, donde la segunda banda de frecuencia comprende frecuencias más altas que la primera banda de frecuencia; y que comprende un primer reproductor configurado para reproducir la primera porción de la señal de audio sobre la base de la primera información. Un proveedor está configurado para proporcionar una señal de parche en la segunda banda de frecuencia, donde la señal de parche está al menos parcialmente no correlacionada con respecto a la primera porción de la señal de audio, o es al menos parcialmente una versión descorrelacionada de la primera porción de la señal de audio, que se ha desplazado hacia la segunda banda de frecuencia. Un segundo reproductor está configurado para reproducir la segunda porción de la señal de audio en la segunda banda de frecuencia sobre la base de la segunda información y la señal de parche. Una combinadora está configurada para combinar la primera porción reproducida de la señal de audio y la señal de parche antes de que la segunda porción de la señal de audio es reproducida por el segundo reproductor, o para combinar la primera porción reproducida de la señal de audio y la segunda porción reproducida de la señal de audio.
MX2015002509A 2012-08-27 2013-08-27 Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de computadora y señal de audio codificada. MX347592B (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261693575P 2012-08-27 2012-08-27
EP12187265.9A EP2704142B1 (en) 2012-08-27 2012-10-04 Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
PCT/EP2013/067730 WO2014033131A1 (en) 2012-08-27 2013-08-27 Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal

Publications (2)

Publication Number Publication Date
MX2015002509A true MX2015002509A (es) 2015-06-10
MX347592B MX347592B (es) 2017-05-03

Family

ID=47010331

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2015002509A MX347592B (es) 2012-08-27 2013-08-27 Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de computadora y señal de audio codificada.

Country Status (15)

Country Link
US (1) US9305564B2 (es)
EP (2) EP2704142B1 (es)
JP (1) JP6229957B2 (es)
KR (1) KR101711312B1 (es)
CN (1) CN104603872B (es)
AR (1) AR092228A1 (es)
BR (1) BR112015004556B1 (es)
CA (1) CA2882775C (es)
ES (2) ES2549953T3 (es)
MX (1) MX347592B (es)
PL (1) PL2888737T3 (es)
PT (1) PT2888737T (es)
RU (1) RU2607262C2 (es)
TW (1) TWI523004B (es)
WO (1) WO2014033131A1 (es)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
US9830917B2 (en) * 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2015017223A1 (en) * 2013-07-29 2015-02-05 Dolby Laboratories Licensing Corporation System and method for reducing temporal artifacts for transient signals in a decorrelator circuit
US9831843B1 (en) 2013-09-05 2017-11-28 Cirrus Logic, Inc. Opportunistic playback state changes for audio devices
US9774342B1 (en) 2014-03-05 2017-09-26 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US10284217B1 (en) 2014-03-05 2019-05-07 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US10785568B2 (en) 2014-06-26 2020-09-22 Cirrus Logic, Inc. Reducing audio artifacts in a system for enhancing dynamic range of audio signal path
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
US9596537B2 (en) 2014-09-11 2017-03-14 Cirrus Logic, Inc. Systems and methods for reduction of audio artifacts in an audio system with dynamic range enhancement
CN104195726B (zh) * 2014-09-23 2016-04-13 宜兴市华恒高性能纤维织造有限公司 一种自动化2.5d立体编织装置
US9503027B2 (en) 2014-10-27 2016-11-22 Cirrus Logic, Inc. Systems and methods for dynamic range enhancement using an open-loop modulator in parallel with a closed-loop modulator
CA2991913C (en) * 2015-06-11 2020-06-02 Interactive Intelligence Group, Inc. System and method for outlier identification to remove poor alignments in speech synthesis
US9959856B2 (en) 2015-06-15 2018-05-01 Cirrus Logic, Inc. Systems and methods for reducing artifacts and improving performance of a multi-path analog-to-digital converter
US9955254B2 (en) 2015-11-25 2018-04-24 Cirrus Logic, Inc. Systems and methods for preventing distortion due to supply-based modulation index changes in an audio playback system
US9543975B1 (en) 2015-12-29 2017-01-10 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system with low-pass filter between paths
US9880802B2 (en) 2016-01-21 2018-01-30 Cirrus Logic, Inc. Systems and methods for reducing audio artifacts from switching between paths of a multi-path signal processing system
US9998826B2 (en) 2016-06-28 2018-06-12 Cirrus Logic, Inc. Optimization of performance and power in audio system
US10545561B2 (en) 2016-08-10 2020-01-28 Cirrus Logic, Inc. Multi-path digitation based on input signal fidelity and output requirements
US10263630B2 (en) 2016-08-11 2019-04-16 Cirrus Logic, Inc. Multi-path analog front end with adaptive path
US9813814B1 (en) 2016-08-23 2017-11-07 Cirrus Logic, Inc. Enhancing dynamic range based on spectral content of signal
US9780800B1 (en) 2016-09-19 2017-10-03 Cirrus Logic, Inc. Matching paths in a multiple path analog-to-digital converter
US9929703B1 (en) 2016-09-27 2018-03-27 Cirrus Logic, Inc. Amplifier with configurable final output stage
US9967665B2 (en) * 2016-10-05 2018-05-08 Cirrus Logic, Inc. Adaptation of dynamic range enhancement based on noise floor of signal
EP3382703A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
US10321230B2 (en) 2017-04-07 2019-06-11 Cirrus Logic, Inc. Switching in an audio system with multiple playback paths
US10008992B1 (en) 2017-04-14 2018-06-26 Cirrus Logic, Inc. Switching in amplifier with configurable final output stage
US9917557B1 (en) 2017-04-17 2018-03-13 Cirrus Logic, Inc. Calibration for amplifier with configurable final output stage
EP3435376B1 (en) * 2017-07-28 2020-01-22 Fujitsu Limited Audio encoding apparatus and audio encoding method
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
GB202203733D0 (en) * 2022-03-17 2022-05-04 Samsung Electronics Co Ltd Patched multi-condition training for robust speech recognition

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5757973A (en) * 1991-01-11 1998-05-26 Sony Corporation Compression of image data seperated into frequency component data in a two dimensional spatial frequency domain
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
EP1944759B1 (en) * 2000-08-09 2010-10-20 Sony Corporation Voice data processing device and processing method
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
ES2237706T3 (es) * 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
JP4227772B2 (ja) * 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
ATE355590T1 (de) * 2003-04-17 2006-03-15 Koninkl Philips Electronics Nv Audiosignalsynthese
DE602004005846T2 (de) 2003-04-17 2007-12-20 Koninklijke Philips Electronics N.V. Audiosignalgenerierung
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP4821131B2 (ja) * 2005-02-22 2011-11-24 沖電気工業株式会社 音声帯域拡張装置
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
WO2007118583A1 (en) 2006-04-13 2007-10-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decorrelator
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
CN102089816B (zh) * 2008-07-11 2013-01-30 弗朗霍夫应用科学研究促进协会 音频信号合成器及音频信号编码器
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
WO2010003544A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft Zur Förderung Der Angewandtern Forschung E.V. An apparatus and a method for generating bandwidth extension output data
KR101182258B1 (ko) * 2008-07-11 2012-09-14 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스펙트럼 기울기 제어 프레이밍을 이용한 대역폭 확장 데이터를 계산하는 장치 및 방법
BR122017003818B1 (pt) * 2008-07-11 2024-03-05 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. Instrumento e método para geração de sinal estendido de largura de banda
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP5812998B2 (ja) * 2009-11-19 2015-11-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
JP5651980B2 (ja) * 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
SG185606A1 (en) * 2010-05-25 2012-12-28 Nokia Corp A bandwidth extender
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
CN103548077B (zh) * 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测

Also Published As

Publication number Publication date
JP6229957B2 (ja) 2017-11-15
PL2888737T3 (pl) 2016-12-30
BR112015004556A2 (pt) 2017-07-04
RU2607262C2 (ru) 2017-01-10
CA2882775A1 (en) 2014-03-06
EP2888737A1 (en) 2015-07-01
EP2704142A1 (en) 2014-03-05
EP2888737B1 (en) 2016-06-22
US20150170663A1 (en) 2015-06-18
EP2704142B1 (en) 2015-09-02
US9305564B2 (en) 2016-04-05
MX347592B (es) 2017-05-03
CN104603872B (zh) 2017-08-11
CA2882775C (en) 2017-08-29
BR112015004556B1 (pt) 2021-10-13
CN104603872A (zh) 2015-05-06
RU2015110702A (ru) 2016-10-20
AR092228A1 (es) 2015-04-08
PT2888737T (pt) 2016-10-04
KR101711312B1 (ko) 2017-02-28
TWI523004B (zh) 2016-02-21
TW201419269A (zh) 2014-05-16
JP2015526769A (ja) 2015-09-10
ES2549953T3 (es) 2015-11-03
WO2014033131A1 (en) 2014-03-06
KR20150047607A (ko) 2015-05-04
ES2593072T3 (es) 2016-12-05

Similar Documents

Publication Publication Date Title
CA2882775C (en) Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
JP6568566B2 (ja) 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム
CA2856587C (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder
JP6483805B2 (ja) 周波数ドメインプロセッサ、時間ドメインプロセッサ及び連続的な初期化のためのクロスプロセッサを使用するオーディオ符号器及び復号器
RU2671997C2 (ru) Кодер и декодер аудиосигнала, использующие процессор частотной области с заполнением промежутка в полной полосе и процессор временной области
RU2452044C1 (ru) Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
AU2014201331A1 (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder

Legal Events

Date Code Title Description
FG Grant or registration