MX2014010098A - Control de coherencia de fase para señales armonicas en codecs de audio perceptual. - Google Patents

Control de coherencia de fase para señales armonicas en codecs de audio perceptual.

Info

Publication number
MX2014010098A
MX2014010098A MX2014010098A MX2014010098A MX2014010098A MX 2014010098 A MX2014010098 A MX 2014010098A MX 2014010098 A MX2014010098 A MX 2014010098A MX 2014010098 A MX2014010098 A MX 2014010098A MX 2014010098 A MX2014010098 A MX 2014010098A
Authority
MX
Mexico
Prior art keywords
audio signal
control information
phase
signal
vpc
Prior art date
Application number
MX2014010098A
Other languages
English (en)
Other versions
MX338526B (es
Inventor
Sascha Disch
Jürgen Herre
Bernd Edler
Frederik Nagel
Original Assignee
Fraunhofer Ges Zur Förderung Der Angewandten Forschung E V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Zur Förderung Der Angewandten Forschung E V filed Critical Fraunhofer Ges Zur Förderung Der Angewandten Forschung E V
Publication of MX2014010098A publication Critical patent/MX2014010098A/es
Publication of MX338526B publication Critical patent/MX338526B/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

Se provee un descodificador para descodificar una señal de audio codificada para obtener una señal de audio fase-ajustada. El descodificador comprende una unidad de descodificación (110) y una unidad de ajuste de fase (120). La unidad de descodificación (110) es apta para descodificar la señal de audio descodificada para obtener una señal de audio descodificada. La unidad de ajuste de fase (120) es apta para ajustar la señal de audio descodificada para obtener la señal de audio fase-ajustada. La unidad de ajuste de fase (120) está configurada para recibir información de control dependiendo de la coherencia de fase vertical de la señal de audio codificada. Además, la unidad de ajuste de fase (120) es apta para ajustar la señal de audio descodificada en base a información de control.

Description

CONTROL DE COHERENCIA DE FASE PARA SEÑALES ARMÓNICAS EN CODECS DE AUDIO PERCEPTUAL DESCRIPCIÓN DE LA INVENCIÓN La presente invención es concerniente con un aparato y método para generar una señal de salida de audio y en particular con un aparato y método para implementar control de coherencia de fase para señales armónicas en codees de audio perceptual .
El procesamiento de señal de audio se vuelve más y más importante. En particular, la codificación de audio perceptual ha proliferado como corriente principal habilitando la tecnología digital para todos los tipos de aplicaciones que proveen audio y multimedia a consumidores utilizando canales de transmisión o almacenamiento con capacidad limitada. Se requiere que los codees de audio perceptual modernos proporcionen calidad de audio satisfactoria a proporciones de bits incrementadamente bajas. A su vez, se tiene que tratar con ciertos artefactos de codificación que son más tolerables para la mayoría de los escuchas.
Uno de estos artefactos es la pérdida de coherencia de fase con respecto a la frecuencia (coherencia de fase "vertical"), véase [8]. Para muchas señales estacionarias, el deterioro resultante en la calidad de señal de audio subjetiva usualmente es más bien pequeño. Sin embargo, en los sonidos tonales armónicos que consisten de muchos componentes espectrales que son percibidos por el sistema auditivo humano como una sola combinación, la distorsión perceptual resultante es objecionable .
Las señales típicas, en donde la conservación de coherencia de fase vertical (VPC) es importante, son habla de voz, instrumentos de latón o cuerdas arqueadas, por ejemplo "instrumentos" que, por la naturaleza de su producción de sonido física, producen sonido que es rico en su contenido de sobretono y fase-bloqueado entre los sobretonos armónicos. Especialmente a muy bajas velocidades de bits, en donde el presupuesto de bits es extremadamente limitado, el uso de los codees del estado del arte frecuentemente debilita de manera sustancial la VPC de los componentes espectrales. Sin embargo, en las señales mencionadas anteriormente, la VPC es una guía auditiva perceptual importante y una alta VPC de la señal debe ser conservada.
En lo siguiente, se considera la codificación de audio perceptual de acuerdo con el estado del arte. En el estado del arte, la codificación de audio perceptual sigue varios temas comunes, incluyendo el procesamiento de uso de tiempo/frecuencia-dominio, reducción de redundancia (codificación de entropía) y remoción de irrelevancia a través del aprovechamiento pronunciado de efectos perceptuales (véase [1] ) . Comúnmente, la señal de entrada es analizada mediante un banco de filtros de análisis que convierten la señal de dominio de tiempo a una representación espectral, por ejemplo, una representación de tiempo/frecuencia. La conversión a coeficientes espectrales permite procesar selectivamente los componentes de señal dependiendo de su contenido de frecuencia, por ejemplo, diferentes instrumentos con sus estructuras de sobretono individuales .
En paralelo, la señal de entrada es analizada con respecto a sus propiedades perceptuales . Por ejemplo, se puede calcular un umbral de enmascaramiento tiempo- y frecuencia-dependiente. El umbral de enmascaramiento tiempo/frecuencia dependiente puede ser alimentado a una unidad de codificación por medio de un umbral de codificación objetivo en forma de un valor de energía absoluto o una proporción de mascara a señal (MSR) para cada banda de frecuencia y cuadro de tiempo de codificación.
Los coeficientes espectrales alimentados por el banco de filtro de análisis son cuantificados para reducir la velocidad de datos necesaria para representar la señal. Esta etapa implica una pérdida de información e introduce una distorsión de codificación (error, ruido) a la señal. Con el fin de minimizar el impacto audible de este ruido de codificación, los tamaños de etapa del codificador son controlados de acuerdo con los umbrales de codificación objetivos para cada banda de frecuencia y cuadro. Idealmente, el ruido de codificación inyectado a cada banda de frecuencia es más bajo que el umbral de codificación (enmascaramiento) y así ninguna degradación en audio subjetivo es perceptible (remoción de irrelevancia) . Este control del ruido de cuantificación con respecto a la frecuencia y tiempo de acuerdo con requerimientos psicoacústicos conduce a un efecto de formación de ruido sofisticado y es lo que hace al codificador un codificador de audio perceptual .
Subsecuentemente, los codificadores de audio moderno efectúan codificación de entropía, por ejemplo, codificación de Huffman o codificación aritmética sobre los datos espectrales cuantificados . La codificación de entropía es una etapa de codificación sin pérdidas que ahorra además velocidad de bits.
Finalmente, todos los datos espectrales codificados y parámetros adicionales relevantes, por ejemplo, información lateral, como por ejemplo, los ajustes del cuantificador para cada banda de frecuencia, son empacados conjuntamente a una corriente de bits, que es la representación codificada final destinada para almacenamiento o transmisión de archivos.
Ahora, se considera la extensión de ancho de banda de acuerdo con el estado del arte. En la codificación de audio perceptual basada en bancos de filtros, la parte principal de la velocidad de bits consumida es usualmente gastada en los coeficientes espectrales cuantificados . Así, a velocidades de bits muy bajas, no suficientes bits pueden estar disponibles para representar todos los coeficientes con la precisión requerida para obtener reproducción perceptualmente sin deteriorar. Mediante esto, los requerimientos de baja velocidad de bits establecen efectivamente un límite al ancho de banda de audio que puede ser obtenido mediante codificación de audio perceptual .
La extensión de ancho de banda (véase [2] ) remueve esta limitación fundamental de hace mucho tiempo. La idea central de la extensión de ancho de banda es complementar un códec perceptual banda-limitado mediante un procesador de alta frecuencia adicional que transmite y restaura el contenido de alta frecuencia faltante en una forma paramétrica compacta. El contenido de alta frecuencia puede ser generado en base a una sola modulación de banda lateral de la señal de banda base, véase, por ejemplo [3] o en la aplicación de técnicas de desplazamiento de tono como por ejemplo el vocoder en [4] .
Especialmente para bajas velocidades de bits, se han diseñado esquemas de codificación paramétricos que codifican los componentes sinusoidales (sinusoides) mediante una representación paramétrica compacta (véase, por ejemplo [9] , [10], [11] y [12]). Dependiendo del codificador individual, el residuo restante es sometido además a codificación paramétrica o es codificado por forma de onda.
En lo siguiente, se considera la codificación de audio espacial paramétrica de acuerdo con el estado del arte. Como la extensión de ancho de banda de las señales de audio, la codificación de audio espacial (SAC) sale del dominio de codificación de forma de onda y en lugar de esto se enfoca en la entrega de una réplica perceptualmente satisfactoria de la imagen de sonido espacial original . Una escena de sonido percibida por un escucha humano es determinada esencialmente por las diferencias entre las señales del oído del escucha (las llamadas diferencias inter-aurales) sin consideración de si la escena consiste de fuentes de audio reales o si es reproducida vía dos o más altavoces que proyectan sonido fantasma. En lugar de codificar discretamente las señales de canal de entrada de audio individuales, un sistema basado en SAC captura la imagen espacial de una señal de audio de multi-canal a un conjunto compacto de parámetros que pueden ser usados para sintetizar una representación de multi-canal de alta calidad a partir de una señal de mezcla descendente transmitida (véase, por ejemplo, [5] , [6] y [7] ) .
Debido a su naturaleza paramétrica, la codificación de audio espacial no conserva la forma de onda. Como consecuencia, es difícil obtener una calidad totalmente sin deteriorar para todos los tipos de señales de audio. No obstante, la codificación de audio espacial es un procedimiento extremadamente poderoso que provee ganancia sustancial a velocidades de bits bajas e intermedias.
Los efectos de audio digital tales como efectos de estiramiento de tiempo o efectos de desplazamiento de tono son usualmente obtenidos mediante la aplicación de técnicas de dominio de tiempo como traslapo-adición sincronizados (SOLA) o mediante la aplicación de técnicas de dominio de frecuencia, por ejemplo, al emplear un vocoder. Además, sistemas híbridos han sido propuestos en el estado del arte que aplican un procesamiento de SOLA en la sub-bandas. Los vocoders y sistemas híbridos usualmente sufren de un artefacto llamado "phasiness" que puede ser atribuido a la pérdida de coherencia de fase vertical. Algunas publicaciones son concernientes con mejoras en la calidad de sonido de algoritmos de estiramiento de tiempo al conservar la coherencia de fase vertical en donde es importante (véase, por ejemplo [14] y [15] ) .
El uso de los codees de audio perceptual del estado del arte frecuentemente debilita la coherencia de fase vertical (VPC) de los componentes espectrales de una señal de audio, especialmente a bajas velocidades de bits, en donde se aplican técnicas de codificación paramétricas . Sin embargo, en ciertas señales, VPC es una guía perceptual importante. Como resultado, la calidad perceptual de tales sonidos es deteriorada .
Los codificadores de audio del estado del arte usualmente comprometen la calidad perceptual de las señales de audio al menospreciar propiedades de fase importantes de la señal a ser codificadas (véase, por ejemplo [1] ) . La codificación burda de los coeficientes espectrales transmitidos en un codificador de audio ya puede alterar la VPC de la señal descodificada. Además, especialmente debido a la aplicación de técnicas de codificación paramétricas , tales como extensión de ancho de banda (véase [2] , [3] y [4] ) , la codificación de multicanal paramétrica (véase, por ejemplo [5] , [6] y [7] ) o codificación paramétrica de componentes sinusoidales (véase [9] , [10] , [11] y [12] ) , la coherencia de fase con respecto a la frecuencia es frecuentemente deteriorada.
El resultado es un sonido sordo que parece proceder de una distancia lejana y así evoca poca involucración del escucha [13] . Existen muchos tipos de componentes de señal en donde la coherencia de fase vertical es importante. Las señales típicas en donde VPC es importante son, por ejemplo tonos con un contenido de sobre tono armónico rico, tal como habla de voz, instrumentos de latón o cuerdas arqueadas.
El objeto de la presente invención es proveer conceptos mejorados para el procesamiento de señal de audio y en particular proveer conceptos mejorados para el control de coherencia de fase para señales armónicas en codees de audio perceptual. El objeto de la presente invención es resuelto por un descodificador de acuerdo con la reivindicación 1, por un codificador de acuerdo con la reivindicación 8, por un aparato de acuerdo con la reivindicación 14, por un sistema de acuerdo con la reivindicación 15, por un método para descodificación de acuerdo con la reivindicación 16, por un método para codificación de acuerdo con la reivindicación 17, por un método para procesar una señal de audio de acuerdo con la reivindicación 18 y por un programa de computadora de acuerdo con la reivindicación 19.
Se provee un descodificador para descodificar una señal de audio codificada para obtener una señal de audio fase-ajustada. El descodificador comprende una unidad de descodificación y una unidad de ajuste de fase. La unidad de descodificación es apta para descodificar la señal de audio codificada para obtener una señal de audio descodificada. La unidad de ajuste de fase es apta para ajustar la señal de audio descodificada para obtener la señal de audio fase-ajustada. La unidad de ajuste de fase está configurada para recibir información de control dependiendo de la coherencia de fase vertical de la señal de audio codificada. Además, la unidad de ajuste de fase es apta para ajustar la señal de audio descodificada en base a la información de control.
En una modalidad, la unidad de ajuste de fase puede estar configurada para ajustar la señal de audio descodificada cuando la información de control indica que el ajuste de fase está activado. La unidad de ajuste de fase puede estar configurada para no ajustar la señal de audio descodificada cuando la información de control indica que el ajuste de fase esta desactivado.
En otra modalidad, la unidad de ajuste de fase puede estar configurada para recibir la información de control, la información de control comprende un valor de intensidad que indica una intensidad de un ajuste de fase. Además, la unidad de ajuste de fase puede estar configurada para ajustar la señal de audio descodificada en base al valor de intensidad.
De acuerdo con una modalidad adicional, el descodificador puede comprender además un banco de filtros de análisis para descomponer la señal de audio descodificada a una pluralidad de señales de sub-banda de una pluralidad de sub-bandas. La unidad de ajuste de fase puede estar configurada para determinar una pluralidad de primeros valores de fase de la pluralidad de señales de sub-banda. Además, la unidad de ajuste de fase puede ser apta para ajustar la señal de audio codificada al modificar por lo menos algunos de la pluralidad de los primeros valores de fase para obtener segundos valores de fase de la señal de audio fase-ajustada.
En otra modalidad, la unidad de ajuste de fase puede ser configurada para ajustar por lo menos algunos de los valores de fase al aplicar la fórmula: ??· (f) = px(f) - dp(f) y dp(f) = a * (pO(f) + const) , en donde f es una frecuencia que indica una de las sub-bandas que tiene la frecuencia f como una frecuencia central, en donde px(f) es uno de los primeros valores de fase de una de las señales de sub-banda de una de las sub-bandas que tiene la frecuencia f como la frecuencia central, en donde px' (f ) es uno de los segundos valores de fase de una de las señales de sub-banda de una de las sub-bandas que tiene la frecuencia f como la frecuencia central, en donde const es un primer ángulo en el intervalo -n = const = n, en donde . es un número real en el intervalo 0 = = 1 y en donde p0(f) es un segundo ángulo en el intervalo -n = pO(f) = n, en donde el segundo ángulo p0(f) es asignado a una de las sub-bandas que tiene la frecuencia f como la frecuencia central . Alternativamente, el ajuste de fase anterior también se puede llevar a cabo mediante multiplicación de una señal de sub-banda compleja (por ejemplo, los coeficientes espectrales complejos de una transformada de Fourier discreta) por un término de fase exponencial e"jdp(f), en donde j es el número imaginario unitario.
De acuerdo con otra modalidad, el descodificador puede comprender además un banco de filtros de síntesis. La señal de audio fase-ajustada puede ser una señal de audio de dominio espectral fase-ajustada que es representada en un dominio espectral. El banco de filtro de síntesis puede estar configurado para transformar la señal de audio de dominio espectral fase-ajustada del dominio espectral a un dominio de tiempo para obtener una señal de audio de dominio de tiempo fase-ajustada.
En una modalidad, el descodificador puede estar configurado para descodificar información de control de VPC.
Además, de acuerdo con otra modalidad, el descodificador puede estar configurado para aplicar información de control para obtener una señal descodificada con una VPC mejor conservada que en los sistemas convencionales.
Además, el descodificador puede estar configurado para manipular la VPC direccionada mediante mediciones en el descodificador y/o información de activación contenida en la corriente de bits .
Además, se provee un codificador para codificar información de control basada en una señal de audio de entrada. El codificador comprende una unidad de transformación, un generador de información de control y una unidad de codificación. La unidad de transformación es apta para transformar la señal de entrada de audio de un dominio de tiempo a un dominio espectral para obtener una señal de audio transformada que comprende una pluralidad de señales de sub-banda que son asignadas a una pluralidad de sub-bandas. El generador de información de control es apto para generar la información de control de tal manera que la información de control indica una coherencia de fase vertical de la señal de audio transformada. La unidad de codificación es apta para codificar la señal de audio transformada y la información de control .
En una modalidad, la unidad de transformación del codificador comprende un banco de filtros de cochlear para transformar la señal de entrada de audio del dominio de tiempo al dominio espectral para obtener la señal de audio transformada que comprende la pluralidad de señales de sub-banda .
De acuerdo con una modalidad adicional, el generador de información de control puede estar configurado para determinar una envolvente de sub-banda para cada una de la pluralidad de señales de sub-banda para obtener una pluralidad de envolventes de señal de sub-banda. Además, el generador de información de control puede estar configurado para generar una envolvente combinada en base a la pluralidad de envolventes de señal de sub-banda. Además, el generador de información de control puede estar configurado para generar la información de control en base a la envolvente combinada.
En otra modalidad, el generador de información de control puede estar configurado para generar un número caracterizante en base a la envolvente combinada. Además, el generador de información de control puede estar configurado para generar la información de control, de tal manera que la información de control indica que el ajuste de fase está activado cuando el número caracterizante es mayor que un valor de umbral. Además, el generador de información de control puede estar configurado para generar la información de control de tal manera que la información de control indica que el ajuste de fase esta desactivado cuando el número caracterizante es menor o igual que el valor de umbral.
De acuerdo con una modalidad adicional, el generador de información de control puede estar configurado para generar la información de control al calcular una proporción de la media geométrica de la envolvente de combinada con una media aritmética de la envolvente combinada.
Alternativamente, el valor máximo de la envolvente combinada puede ser comparado con un valor medio de la envolvente combinada. Por ejemplo, se puede formar una proporción de máxima/media, por ejemplo una proporción del valor máximo de la envolvente combinada con el valor medio de la envolvente combinada.
En una modalidad, el generador de información de control puede estar configurado para generar la información de control de tal manera que la información de control comprende un valor de intensidad que indica el grado de coherencia de fase vertical de las señales de sub-banda.
Un codificador de acuerdo con una modalidad puede estar configurado para llevar a cabo una medición de la VPC en el lado del codificador, por medio, por ejemplo de mediciones fase y/o derivados de fase con respecto a la frecuencia.
Además, el codificador de acuerdo con una modalidad puede estar configurado para llevar a cabo una medición de la saliencia perceptual de la corriente de fase vertical.
Además, el codificador de acuerdo con una modalidad puede estar configurado para llevar a cabo una derivación de información de activación de la saliencia de coherencia de fase y/o mediciones de VPC.
Además, el codificador de acuerdo con una modalidad puede estar configurado para extraer pistas de VPC adaptables tiempo-frecuencia o información de control.
Además, el codificador de acuerdo con una modalidad puede estar configurado para determinar una representación compacta de información de control de VPC.
En modalidades, la información de control de VPC puede ser transmitida en una corriente de bits .
Además , se provee un aparato para procesamiento de una primera señal de audio para obtener una segunda señal de audio. El aparato comprende un generador de información de control y una unidad de ajuste de fase. El generador de información de control es apto para generar información de control de tal manera que la información de control indica una coherencia de fase vertical de la primera señal de audio.
La unidad de ajuste de fase es apta para ajustar la primera señal de audio para obtener la segunda señal de audio. Además, la unidad de ajuste de fase es apta para ajustar la primera señal de audio en base a la información de control .
Además, se provee un sistema. El sistema comprende un codificador de acuerdo con una de las modalidades descritas anteriormente y por lo menos un descodificador de acuerdo con una de las modalidades descritas anteriormente. El codificador está configurado para transformar una señal de entrada de audio para obtener una señal de audio transformada. Además, el codificador está configurado para codificar la señal de audio transformada para obtener una señal de audio codificada. Además, el codificador está configurado para codificar información de control que indica una coherencia de fase vertical de la señal de audio transformada. Además, el codificador es dispuesto para alimentar la señal de audio codificada y la información de control a por lo menos un descodificador. El por lo menos un descodificador está configurado para descodificar la señal de audio codificada para obtener una señal de audio descodificada. Además, el por lo menos un descodificador está configurado para ajustar la señal de audio descodificada en base a la información de control codificada para obtener una señal de audio fase-ajustada.
En modalidades, la VPC puede ser medida en el lado del codificador, transmitida como información lateral compacta apropiada junto con la señal de audio codificada y la VPC de la señal es restaurada en el descodificador . De acuerdo con modalidades alternativas, la VPC es manipulada en el descodificador direccionado por la información de control generada en el descodificador y/o guiada por información de activación transmitida del codificador en la información lateral. El procesamiento de VPC puede ser tiempo-frecuencia selectivo de tal manera que la VPC es solamente restaurada en donde es perceptualmente benéfico. Además, se provee un método para descodificar una señal de audio codificada para obtener una señal de audio fase-ajustada. El método para descodificación comprende.
Recibir información de control, en donde la información de control indica una coherencia de fase vertical de la señal de audio codificada.
Descodificación de señal de audio codificada para obtener una señal de audio descodificada y Ajustar la señal de audio descodificada para obtener la señal de audio de fase-ajustada en base a la información de control .
Además, se provee un método para codificar información de control en base a una señal de entrada de audio. El método para codificación comprende: Transformar la señal de entrada de audio de un dominio de tiempo a un dominio espectral para obtener una señal de audio transformada que comprende una pluralidad de señales de sub-banda que son asignadas a una pluralidad de sub-bandas, Generar la información de control de tal manera que la información de control indica una coherencia de fase vertical de la señal de audio transformada y Codificación de la señal de audio transformada y la información de control .
Además, se provee un método para procesamiento de una primera señal de audio para obtener una segunda señal de audio. El método para procesamiento comprende: Generar información de control de tal manera que la información de control indica una coherencia de fase vertical de la primera señal de audio y Ajustar la primera señal de audio en base a la información de control para obtener la segunda señal de audio .
Además , se provee un programa de computadora para implementar uno de los métodos descritos anteriormente cuando el programa de computadora es ejecutado en una computadora o un procesador de señal .
En modalidades, se proveen medios para conservar la coherencia de fase vertical (VPC) de las señales cuando la VPC ha sido comprometida por un procesamiento de señal, codificación o proceso de transmisión.
En algunas modalidades, el sistema de la invención mide la VPC de la señal de entrada antes de su codificación, transmite información lateral compacta apropiada junto con la señal de audio codificada y restaura la VPC de la señal en el descodificador en base a la información lateral compacta transmitida. Alternativamente, el método de la invención manipula la VPC en el descodificador direccionada por información de control generada en el descodificador y/o guiada por información de activación transmitida del codificador en la información lateral.
En otras modalidades, la VPC de una señal deteriorada puede ser procesada para restaurar su VPC original al usar un proceso de ajuste de VPC que es controlado al analizar la señal deteriorada misma.
En ambos casos, dicho procesamiento puede ser tiempo-frecuencia selectivo de tal manera que la VPC es solamente restaurada en donde es perceptualmente benéfico.
La calidad de sonido mejorada de los codificadores de audio perceptual es provista a costos de información lateral moderados. Además de los codificadores de audio perceptual, la medición y restauración de la VPC es también benéfica para efectos de audio digital basados en vocoders de fase, como estiramiento de tiempo o desplazamiento de tono.
Modalidades son provistas en las reivindicaciones dependientes .
En lo siguiente, se describen modalidades con respecto a las figuras en las cuales: La figura la ilustra un descodificador para descodificar una señal de audio codificada para obtener una señal de audio fase-ajustada de acuerdo con una modalidad.
La figura Ib ilustra un descodificador para descodificar una señal de audio descodificada para obtener una señal de audio fase-ajustada de acuerdo con otra modalidad.
La figura 2 ilustra un codificador para codificar información de control basada en una señal de entrada de audio de acuerdo con una modalidad, La figura 3 ilustra un sistema de acuerdo con una modalidad que comprende un codificador y por lo menos un descodificador, La figura 4 ilustra un sistema de procesamiento de audio con procesamiento de VPC de acuerdo con una modalidad, La figura 5 ilustra un codificador de audio perceptual al descodificar de acuerdo con una modalidad, La figura 6 ilustra un generador de control de VPC de acuerdo con una modalidad y La figura 7 ilustra un aparato para procesar una señal de audio para obtener una segunda señal de audio de acuerdo con una modalidad, La figura 8 ilustra un sistema de procesamiento de audio de procesamiento de VPC de acuerdo con otra modalidad.
La figura la ilustra un descodificador para descodificar una señal de audio codificada para obtener una señal de audio fase-ajustada de acuerdo con una modalidad. El descodificador comprende una unidad de descodificación 110 y una unidad de ajuste de fase 120. La unidad de descodificación 110 es apta para descodificar la señal de audio codificada para obtener una señal de audio descodificada. La unidad de ajuste de fase 120 es apta para ajustar la señal de audio descodificada para obtener la señal de audio fase-ajustada. Además, la unidad de ajuste de fase 120 está configurada para recibir información de control dependiendo de la coherencia de fase vertical (VPC) de la señal de audio codificada. Además, la unidad de ajuste de fase 120 es apta para ajustar la señal de audio descodificada en base a la información de control.
La modalidad de la figura la toma en cuenta que, para ciertas señales de audio, es importante restaurar la coherencia de fase vertical de la señal codificada. Por ejemplo, cuando la porción de señal de audio comprende habla de voz, instrumentos de latón o cuerdas arqueadas, la conservación de coherencia de fase vertical es importante . Para ese propósito, la unidad de ajuste de fase 120 es apta para recibir información de control que depende de la VPC de la señal de audio codificada.
Por ejemplo, cuando las porciones de señal codificadas comprenden habla de voz, instrumentos de latón o cuerdas arqueadas, entonces la VPC de la señal codificada es alta. En tales casos, la información de control puede indicar que el ajuste de fase está activado.
Otras porciones de señal pueden no comprender señales tonales impulso-semejantes o transitorios y la VPC de tales porciones de señal puede ser baja. En tales casos, la información de control puede indicar que el ajuste de fase esta desactivado.
En otras modalidades, la información de control puede comprender un valor de intensidad. Tal valor de intensidad puede indicar la intensidad del ajuste d fase que debe ser efectuado. Por ejemplo, el valor de intensidad puede ser un valor alfa con 0 = a = 1. Si a = 1 o cercano a 1, esto puede indicar un alto valor de intensidad. Ajustes de fase significativos serán llevados a cabo por la unidad de ajuste de fase 120. Si o¡ es cercano a 0, solamente ajustes de fase menores serán llevados a cabo por la unidad de ajuste de fase 120. Si OÍ = 0, ningún ajuste de fase será llevado a cabo.
La figura Ib ilustra un descodificador para descodificar una señal de audio codificada para obtener una señal de audio fase-ajustada de acuerdo con otra modalidad. Además de la unidad de descodificación 110 y la unidad de ajuste de fase 120, el descodificador de la figura Ib comprende un banco de filtros de análisis 115 y un banco de filtro de síntesis 125.
El banco de filtro de análisis 115 está configurado para descomponer la señal de audio descodificada en una pluralidad de señales de sub-banda de una pluralidad de señales de sub-banda. La unidad de ajuste de fase 120 de la figura Ib puede estar configurada para determinar una pluralidad de primeros valores de fase de la pluralidad de señales de sub-banda. Además, la unidad de ajuste de fase 120 puede ser apta para ajustar la señal de audio codificada al modificar por lo menos algunos de la pluralidad de los primeros valores de fase para obtener segundos valores de fase de la señal de audio fase-ajustada.
La señal de audio fase-ajustada puede ser una señal de audio de dominio espectral fase-a ustada que es representada en un dominio espectral . El banco de filtros de síntesis de la figura Ib puede estar configurado para transformar la señal de audio de dominio espectral fase-ajustada del dominio espectral a un dominio de tiempo para obtener una señal de audio de dominio de tiempo fase-ajustada.
La figura 2 ilustra un codificador correspondiente para codificar información de control en base a una señal de entrada de audio de acuerdo con una modalidad. El codificador comprende una unidad de transformación 210, un generador de información de control 220 y una unidad de codificación 230. La unidad de transformación 210 es apta para transformar la señal de entrada de audio de un dominio de tiempo a un dominio espectral para obtener una señal de audio transformada que comprende una pluralidad de señales de sub-banda que son asignadas a una pluralidad de sub-bandas. El generador de información de control 220 es apto para generar la información de control de tal manera que la información de control indica una coherencia de fase vertical (VPC) de la señal de audio transformada. La unidad de codificación 230 es apta para codificar la señal de audio transformada y la información de control .
El codificador de la figura 2 es apto para codificar información de control que depende de la coherencia de fase vertical de la señal de audio a ser codificada. Para generar la información de control, la unidad de transformación 210 del codificador transforma la señal de entrada de audio a un dominio espectral, de tal manera que la señal de audio transformada resultante comprende una pluralidad de señales de sub-banda de una pluralidad de sub-bandas .
Después de esto, el generador de información de control 220 determina luego información que depende de la coherencia de fase vertical de la señal de audio transformada.
Por ejemplo, el generador de información de control 220 puede clasificar una porción de señal de audio particular como una porción de señal en donde la VPC es alta y por ejemplo, establecida a un valor de a=l. Para otras porciones de señal, el generador de información de control 220 puede clasificar una porción de señal de audio particular como una porción de señal en donde la VPC es baja y por ejemplo, ajustada a un valor o¡=0.
En otras modalidades, el generador de información de control 220 puede determinar un valor de intensidad que depende de la VPC de la señal de audio transformada. Por ejemplo, el generador de información de control puede asignar un valor de intensidad con respecto a una porción de señal examinada, en donde el valor de intensidad depende de la VPC de la porción de señal. En el lado del descodificador, el valor de intensidad puede luego ser empleado para determinar si solamente pequeños ajustes de fase serán llevados a cabo o si fuertes ajustes de fase serán llevados a cabo con respecto a los valores de fase de sub-banda de una señal de audio descodificada para restaurar la VPC original de la señal de audio .
La figura 3 ilustra otra modalidad. En la figura 3, se provee un sistema. El sistema comprende un codificador 310 y por lo menos un descodificador . Mientras que la figura 3 ilustra solamente un solo descodificador 320, otras modalidades pueden comprender más de un descodificador . El codificador 310 de la figura 3 puede ser un codificador de la modalidad de la figura 2. El descodificador 320 de la figura 3 puede ser el descodificador de la modalidad de la figura la o de la modalidad de la figura ib. El codificador 310 de la figura 3 está configurado para transformar una señal de entrada de audio para obtener una señal de audio transformada (no mostrada) . Además, el codificador 310 está configurado para codificar la señal de audio transformada para obtener una señal de audio codificada. Además, el codificador está configurado para codificar información de control que indica una coherencia de fase vertical de la señal de audio transformada. El codificador está dispuesto para alimentar la señal de audio codificada y la información de control al por lo menos un descodificador.
El descodificador 320 de la figura 3 está configurado para descodificar la señal de audio codificada para obtener una señal de audio descodificada (no mostrada) . Además, el descodificador 320 está configurado para ajustar la señal de audio descodificada en base a la información de control codificada para obtener una señal de audio fase-ajustada.
Resumiendo lo anterior, las modalidades descritas anteriormente tienen como objetivo conservar la coherencia de fase vertical de las señales especialmente en porciones de señal con un alto grado de coherencia de fase vertical.
Los conceptos propuestos mejoran la calidad perceptual que es alimentada por un sistema de procesamiento de audio, en lo siguiente, también referido como "sistema de audio", al medir las características de VPC de la señal de entrada al sistema de procesamiento de audio y al ajustar la VPC de la señal recibida producida por el sistema de audio en base a las características de VPC medidas para formar una señal de salida final, de tal manera que la VPC propuesta de la señal de la salida final es obtenida.
La figura 4 muestra un sistema de procesamiento de audio general que es mejorado por la modalidad descrita anteriormente. En particular, la figura 4 ilustra un sistema para procesamiento de VPC. De la señal de entrada de un sistema de audio 410, un generador de control de VPC 420 mide la VPC y/o su saliencia perceptual y genera una información de control de VPC. La salida del sistema de audio 410 es alimentada a una unidad de ajuste de VPC 430 y la información de control de VPC es mostrada en la unidad de ajuste de VPC 430 con el fin de restablecer la VPC.
Como un caso práctico importante, este concepto puede ser aplicado por ejemplo a codees de audios convencionales al medir la VPC y/o la saliencia perceptual de corriente de fase y el lado del codificador, transmitir información lateral compacta apropiada junto con la señal de audio codificada y restaurar la señal de la VPC en el descodificador, en base a la información lateral compacta transmitida.
La figura 5 ilustra un codificador y descodificador de audio perceptual de acuerdo con una modalidad. En particular, la figura 5 ilustra un códec de audio perceptual que implementa un procesamiento de VPC de dos lados .
En el lado del codificador se ilustran una unidad de codificación 510, un generador de control de VPC 520 y una unidad de multiplex de corrientes de luz 530. En el lado del descodificador se ilustran una unidad de desmúltiplex de corriente de bit 540, una unidad de descodificación 550 y una unidad de ajuste de VPC 560.
En el lado del codificador, se genera información de control de control de VPC por el generador de control de VPC 520 y es codificada como información lateral compacta que es multiplexada por la unidad de multiplexión 530 a la corriente de bits junto con la señal de audio codificada. La generación de información de control de VPC puede ser tiempo-frecuencia selectiva de tal manera que la VPC es solamente medida y la información de control es solamente codificada en donde es perceptualmente benéfico.
En el lado del descodificador, la información de control de VPC es extraída por la unidad de desmultiplexión de corriente de bits 540 de la corriente de bits y es aplicada en la unidad de ajuste de VPC 560 con el fin de restablecer la VPC apropiada.
La figura 6 ilustra algunos detalles de una implementación posible de un generador de control de VPC 600. En la señal de audio de entrada, la VPC es medida por una unidad de medición de VPC 610 y la saliencia perceptual de la VPC es medida por una unidad de medición de saliencia de VPC 620. De estas, se deriva la información de control de VPC por una unidad de derivación de información de control de VPC 630. La entrada de audio puede comprender más de una señal de audio, por ejemplo, además de la primera entrada de audio, una segunda entrada de audio que comprende una versión procesada de la primera señal de entrada (véase figura 5) puede ser aplicada al generador de control de VPC.
En algunas modalidades, el lado del codificador puede comprender un generador de control de VPC para medir la VPC de la señal de entrada y/o medición de la saliencia perceptual de la VPC de la señal de entrada. El generador de control de VPC puede proveer información de control de VPC para controlar el ajuste de la VPC en el lado del descodificador . Por ejemplo, la información de control puede señalar la habilitación o deshabilitación del ajuste de VPC del lado del descodificador o la información de control puede determinar la intensidad del ajuste de la VPC del lado del descodificador .
Ya que la coherencia de fase vertical es importante para la calidad subjetiva de la señal de audio, si la señal es tonal y/o armónica y si su tono no cambia demasiado rápidamente, una implementación típica de una unidad de control de VPC puede incluir un detector de tono o un detector de armonía o por lo menos un detector de variación de tono, proporcionando una medida de la intensidad de tono.
Además, la información de control generada por el generador de control de VPC puede señalar la intensidad de la VPC de la señal original. De otra manera, la información de control puede señalar un parámetro de modificación que acciona el ajuste de la VPC del descodificador de tal manera que, después del ajuste de la VPC del lado del descodificador, la VPC percibida de la señal original es restaurada aproximadamente. Alternativa o adicionalmente, uno o varios valores de VPC objetivo a ser restablecidos pueden ser señalados .
La información de control de VPC puede ser transmitida compactamente del codificador al lado del descodificador, por ejemplo, al incrustarla a la corriente de bits como información lateral adicional.
En modalidades, el descodificador puede estar configurado para leer la información de control de VPC provista por el generador de control de VPC del lado del codificador. Para este propósito, el descodificador puede leer la información de control de VPC de la corriente de bits. Además, el descodificador puede estar configurado para procesar la salida del descodificador de audio regular dependiendo de la información de control de VPC al emplear una unidad de ajuste de VPC. Además, el descodificador puede estar configurado para integrar la señal de audio procesada como la señal de audio de salida.
En lo siguiente, se provee un generador de control de VPC del lado del codificador de acuerdo con una modalidad.
Señales periódicas casi estacionarias que exhiben una alta VPC pueden ser identificadas mediante el uso de un detector de tono (como son bien conocidos de por ejemplo codificación de habla o análisis de señal de música) que alimenta una medición de la intensidad de tono y/o el grado de periodicidad. La VPC real puede ser medida mediante la aplicación de un banco de filtros de cochlear, una detección de envolvente de sub-banda subsecuente seguida por una suma de envolventes de cochlear a través de la frecuencia. Si por ejemplo, las envolventes de sub-banda son coherentes, la suma alimenta una señal no plana temporalmente, mientras que las envolventes de sub-banda no coherentes se suman a una señal temporalmente más planas . A partir de la evaluación combinada (por ejemplo, al comparar con umbrales predefinidos, respectivamente) de la intensidad de tono y/o grado de periodicidad y medida de VPC, la información de control de VPC puede ser derivada, que consiste de por ejemplo una bandera de señal que denota "ajuste de VPC encendido" o de otra manera "ajuste de VPC apagado" .
Los eventos semejantes a impulso en un dominio de tiempo exhiben una coherencia de fase fuerte a pesar de sus representaciones espectrales. Por ejemplo, un impulso de Dirac Fourier-transformado tiene un espectro plano con fases que se incrementan linealmente. Lo mismo es cierto para una serie de impulsos periódicos que tienen una frecuencia base de f_0. Aquí, el espectro es un espectro de línea. Estas líneas individuales que tienen una distancia de frecuencia de f_0 son también coherentes de fase . Cuando su coherencia de fase es alterada (las magnitudes permanecen sin modificar) , la señal de dominio de tiempo resultante ya no es una serie de impulsos de Dirac, sino que en lugar de esto, los impulsos han sido ampliados significativamente en el tiempo. Esta modificación es audible y es particularmente relevante para sonidos que son similares a una serie de impulsos, por ejemplo, habla de voz, instrumentos de latón o cuerdas arqueadas .
Por consiguiente, la VPC puede ser medida indirectamente al determinar la no llanura local de una envolvente de una señal de audio en el tiempo (los valores absolutos de la envolvente pueden ser considerados) .
Al sumar las envolventes de sub-banda a través de la frecuencia, se puede determinar si las envolventes se suman hasta una envolvente combinada plana (baja VPC) o a una envolvente combinada no plana (alta VPC) . El concepto propuesto es particularmente ventajoso si las envolventes sumadas se relacionan con bandas de frecuencia auralmente exactas adaptadas perceptualmente .
La información de control puede luego por ejemplo ser generada al calcular una proporción de una media geométrica de la envolvente combinada con una media aritmética de la envolvente combinada .
Alternativamente, el valor máximo de la envolvente combinada puede ser comparado con un valor medio de la envolvente combinada. Por ejemplo, una proporción máxima/media puede ser formada, por ejemplo una proporción del valor máximo de la envolvente combinada al valor medio de la envolvente combinada.
En lugar de formar una envolvente combinada, por ejemplo, una suma de envolventes, los valores de fase del espectro de la señal de audio que serán codificados por sí mismos ser examinados en cuanto a predictibilidad. Una alta predictibilidad indica una alta VPC. Una baja predictibilidad indica una baja VPC.
El uso de un banco de filtros de cochlear es particularmente ventajoso con respecto a señales de audio, si la VPC o la saliencia de VPC será definida como una medida psicoacústica. Puesto que la elección de un ancho de banda de filtro particular define, cuales tonos parciales del espectro se relacionan con una sub-banda común y así contribuyen conjuntamente para formar una cierta envolvente de sub-banda, los filtros adaptados perceptualmente pueden modelar el procesamiento interno del sistema auditivo humano más exactamente .
La diferencia en percepción aural entre una señal fase- coherente y una señal fase-incoherente que tiene los mismos espectros de magnitud es además dependiente de la dominancia de los componentes espectrales armónicos en la señal (o en la pluralidad de señales) . Una baja frecuencia base, por ejemplo de 100 Hz de aquellos componentes armónicos incrementa la diferencia que una alta frecuencia base reduce la diferencia, debido a que una frecuencia base baja da como resultado más sobretonos siendo asignados a la misma sub-banda. Aquellos sobretonos en la misma sub-banda otra vez se suman y su envolvente de sub-banda puede ser examinado.
Además, la amplitud de los sobretonos es relevante. Si la amplitud de los sobretonos es alta, el incremento de la envolvente de dominio de tiempo se vuelve más agudo. La señal se vuelve más semejante a impulso y así, la VPC se vuelve incrementadamente importante, por ejemplo, la VPC se vuelve más alta.
En lo siguiente, se provee una unidad de ajuste de VPC del lado del descodificador de acuerdo con una modalidad. Tal unidad de ajuste de VPC puede comprender información de control que comprende una bandera de información de control de VPC.
Si la bandera de información de control de VPC denota "ajuste de VPC apagado" ningún procesamiento de VPC dedicado es aplicado ("pasante" o alternativamente un simple retardo) si la bandera dice "ajuste de VPC encendido" el segmento de señal es descompuesto por un banco de filtro de análisis y se inicia una medición de la fase pO(f) de cada línea espectral a la frecuencia f. A partir de esto, desplazamientos de ajuste de fase dp(f) = a * (pO(f) + const) son calculados en donde "const" denota un ángulo en radianes entre -n y n. Para dicho segmento de señal y los siguientes segmentos consecutivos, en donde "ajuste de VPC encendido" es señalado, las fases px(f) de las líneas espectrales x(f) son luego ajustadas para ser px' (f) = px(f) - dp(f) . La señal ajustada en VPC es finalmente convertida al dominio de tiempo por un banco de filtros de síntesis.
El concepto está basado en la idea de llevar a cabo una medición inicial para determinar la desviación de una respuesta de fase ideal . Esta desviación es compensada más tarde, puede ser un ángulo en el intervalo de 0 = a = 1, = 0 significa ninguna compensación, o¡= 1 significa plena compensación con respecto a la respuesta de fase ideal . La respuesta de fase ideal puede por ejemplo ser la respuesta de fases resultante en una respuesta de fase con una llanura máxima, "const" es un ángulo aditivo fijo que no cambia la coherencia de fase, pero que permite direccionar fases absolutas alternativas y así generar señales correspondientes, por ejemplo la transformada de Hilbert de la señal cuando const es 90° .
La figura 7 ilustra un aparato para procesar una primera señal de audio para obtener una segunda señal de audio de acuerdo con otra modalidad. El aparato comprende un generador de información de control 710 y una unidad de ajuste de fase 720. El generador de información de control 710 es apto para generar información de control, de tal manera que la información de control indica una coherencia de fase vertical de la primera señal de audio. La unidad de ajuste de fase es apta para ajustar la primera señal de audio para obtener la segunda señal de audio. Además, la unidad de ajuste de fase 720 es apta para ajustar la primera señal de audio en base a la información de control .
La figura 7 es una modalidad de un solo lado. La determinación de la información de control y los ajustes de fase llevados a cabo no son divididos entre el codificador (señalación de información de control) y el descodificador (ajuste de fase) . En lugar de esto, la generación de información de control y el ajuste de fase son llevados cabo por un solo aparato o sistema.
En la figura 8, la VPC es manipulada en el descodificador direccionado por la información de control también generada en el lado del descodificador ("sistema de un solo lado" ) , en donde la información de control es generada al analizar la señal de audio descodificada. En la figura 8, se ilustra un codee de audio perceptual con un procesamiento de VPC de un solo lado de acuerdo con una modalidad.
Un sistema de un solo lado de acuerdo con modalidades, por ejemplo se ilustra por la figura 7 y la figura 8 puede tener las siguientes características: La salida de cualquier proceso de procesamiento de señal existente o de un sistema de audio, por ejemplo, la señal de salida de un descodificador de audio, es procesada sin tener acceso a información de control de VPC que es generada con acceso a una señal sin deteriorar/original (por ejemplo, en el lado del codificador) . En lugar de esto, la información de control de VPC puede ser generada directamente de la señal dada, por ejemplo de la salida de un sistema de audio, por ejemplo un descodificador (la información de control de VPC puede ser generada "ciegamente").
La información de control de VPC para controlar el ajuste de VPC puede comprender por ejemplo señales para habilitar/deshabilitar la unidad de ajuste de VPC o para determinar la intensidad de ajuste de VPC o la información de control de VPC puede comprender uno o varios valores de VPC objetivos a ser restablecidos.
Además, el procesamiento puede ser efectuado en una etapa de ajuste de VPC (una unidad de ajuste de VPC) que usa la información de control de VPC generada ciegamente y la alimenta a la salida como la salida del sistema.
En lo siguiente, se provee una modalidad de un generador de control de VPC del lado del descodificador . El generador de control del lado del descodificador puede ser bastante similar al generador de control del lado del codificador. Puede comprender por ejemplo un detector de tono que alimenta una medición de la intensidad de tono y/o el grado de periodicidad y una comparación con un umbral predefinido. Sin embargo, el umbral puede ser diferente del usado en el generador de control del lado del codificador puesto que el generador de VPC del lado del descodificador opera en la señal ya distorsionada de VPC. Si la distorsión de VPC es suave, también la VPC restante puede ser medida y comparada con un umbral dado con el fin de generar información de control de VPC.
De acuerdo con una modalidad preferida, si la VPC medida es alta, se aplica modificación de VPC con el fin de incrementar adicionalmente la VPC de la señal de salida y si la VPC medida es baja, no se aplica ninguna modificación de VPC. Puesto que la conservación de la VPC es más importante para señales tonales y armónicas, tal procesamiento de VPC de acuerdo con una modalidad preferida, un detector de tono o por lo menos un detector de variación de tono puede ser usado, proporcionando una medida de la intensidad del tono dominante .
Finalmente, el procedimiento de dos lados y el procedimiento de un solo lado pueden ser combinados, en donde el proceso de ajuste de VPC es controlado tanto por la información de control de VPC transmitida derivada de una señal original/sin deteriorar como información extraída de los procesos de la señal de audio (por ejemplo, descodificada) . Por ejemplo, un sistema combinado resulta de tal combinación.
Aunque algunos aspectos han sido descritos en el contexto de un aparato, es claro que estos aspectos también representan una descripción del método correspondiente, en donde un bloque o dispositivo corresponde a una etapa del método o un elemento de la etapa del método. Análogamente, los aspectos descritos del contexto de una etapa del método también representan una descripción de un bloque o ítem o elemento correspondiente de un aparato correspondiente.
Dependiendo de ciertos requerimientos de implementación, las modalidades de la invención pueden ser implementadas en elementos físicos o en elementos de programación. La implementación puede ser efectuada utilizando un medio de almacenamiento digital, por ejemplo disco floppy, un DVD, un CD, un ROM, un PROM, un EPROM, un EEPROM o una memoria instantánea que tiene señales de control que se pueden leer electrónicamente almacenadas en el mismo que cooperan (o son aptas de cooperar con un sistema de computadora programable de tal manera que el método respectivo es efectuado) .
Algunas modalidades de acuerdo con la invención comprenden un portador de datos que tiene señales de control que se pueden leer electrónicamente, que son aptas de cooperar con un sistema de computadora programable, de tal manera que uno de los métodos descritos en la presente es efectuado.
En general, las modalidades de la presente invención pueden ser implementadas como un producto de programa de computadora con un código de programa, el código del programa es operativo para efectuar uno de los métodos cuando el producto de programa de computadora se ejecuta en una computadora. El código de programa puede por ejemplo ser almacenado en un portador que se puede leer por la máquina.
Otras modalidades comprenden el programa de computadora para efectuar uno o de los métodos descritos en la presente, almacenados en un portador que se puede leer por la máquina o un medio de almacenamiento no transitorio.
En otras palabras, una modalidad del método de la invención es por consiguiente un programa de computadora que tiene un código de programa para efectuar uno de los métodos descritos en la presente, cuando el programa de computadora se ejecuta en una computadora.
Una modalidad adicional de los métodos de la invención es por consiguiente un portador de datos (o un medio de almacenamiento digital o un medio que se puede leer por computadora) que comprende, grabado en el mismo, el programa de computadora para efectuar uno de los métodos de la presente .
Una modalidad adicional del método de la invención es por consiguiente, una corriente de datos o una secuencia de señales que representan el programa de computadora para efectuar uno de los métodos descritos en la presente . La corriente de datos o la secuencia de señales puede por ejemplo estar configurada para ser transferida vía una conexión de comunicación de datos, por ejemplo vía internet.
Una modalidad adicional comprende un medio de procesamiento, por ejemplo una computadora o un dispositivo lógico programable, configurado para o apto para efectuar uno de los métodos descritos en la presente .
Una modalidad adicional comprende una computadora que tiene instalado en la misma el programa de computadora para efectuar uno de los métodos descritos en la presente .
En algunas modalidades, un dispositivo lógico programable (por ejemplo, un arreglo de compuerta programable en el campo) puede ser usado para efectuar algunas o todas las f ncionalidades de los métodos descritos en la presente. En algunas modalidades, un arreglo de compuerta programable en el campo puede cooperar con un microprocesador con el fin de efectuar uno de los métodos descritos en la presente . En general, los métodos son efectuados preferiblemente por cualquier aparato de elementos físicos.
Las modalidades descritas anteriormente son solamente ilustrativas para los principios de la presente invención. Se comprenderá que modificaciones y variaciones de los arreglos y los detalles son descritos en la presente serán evidentes a otros experimentados en el arte . Se pretende por consiguiente estar limitado solamente por el alcance de las reivindicaciones de patente pendientes y no por los detalles específicos presentados a manera de descripción y explicación de las modalidades en la presente.
Referencias [1] Painter, T.; Spanias, A. Perceptual coding of digital audio, Proceedings of the IEEE, 88(4), 2000; pp. 451-513. [2] Larsen, E.; Aarts, R. Audio Bandwidth Extensión: Application of psychoacoustics, signal processing and loudspeaker design, John Wiley and Sons Ltd, 2004, Chapters 5, 6. [3] Dietz, M . ; Liljeryd, L. ; Kjorling, K. ; Kunz, 0 . Spectral Band Replication, a Novel Approach in Audio Coding, 112th AES Convention, April 2002, Preprint 5553. [4] Nagel, F. ; Disch, S. ; Rettelbach, N. A Phase Vocoder Driven Bandwidth Extensión Method with Novel Transient Handling for Audio Codees, 126th AES Convention, 2009. [5] Faller, C; Baumgarte, F. Binaural Cue Coding- Part II: Schemes and applications, IEEE Trans . On Speech and Audio Processing, Vol . 11, No. 6, Nov. 2003. [6] Schuijers, E. ; Breebaart, J.; Purnhagen, H. ; Engdegard, J. Low complexity parametric stereo coding, 116th AES Convention, Berlin, Germany, 2004; Preprint 6073. [7] Herré, J. ; Kjórling, K. ; Breebaart, J. et al. MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multichannel Audio Coding, Journal of the AES, Vol. 56, No. 11, November 2008; pp. 932-955. [8] Laroche, J.; Dolson, M . , "Phase-vocoder : about this phasiness business," Applications of Signal Processing to Audio and Acoustics, 1997. 1997 IEEE ASSP Workshop on, vol., no., pp.4 pp., 19-22, Oct 1997 [9] Purnhagen, H. ; Meine, . ; , "HILN-the MPEG-4 parametric audio coding tools," Circuits and Systems, 2000. Proceedings. ISCAS 2000 Geneva. The 2000 IEEE International Symposium on, vol.3, no., pp.201-204 vol.3, 2000 [10] Oomen, Werner; Schuijers, Erik; den Brinker, Bert; Breebaart, Jeroen:," Advances in Parametric Coding for High-Quality Audio, " Audio Engineering Society Convention 114, preprint, Amsterdam/NL, March 2003 [11] van Schijndel, N.H. ; van de Par, S.; , "Rate-distortion optimized hybrid sound coding, " Applications of Signal Processing to Audio and Acoustics, 2005. IEEE Workshop on, vol., no., p. 235-238, 16-19 Oct. 2005 [12] http://people.xiph.org/-xiphmont/demo/ghost/demo . html [13] D. Griesinger 'The Relationship between Audience Engagement and the ability to Perceive Pitch, Timbre, Azimuth and Envelopment of Múltiple Sources 1 Tonmeister Tagung 2010. [14] D. Dorran and R. Lawlor, "Time-scale modification of music using a synchronized subband/timedomain approach, " IEEE International Conference on Acoustics, Speech and Signal Processing, pp. IV 225- IV 228, Montreal, May 2004. [15] J. Laroche, "Frequency-domain techniques for high quality voice modification, " Proceedings of the International Conference on Digital Audio Effects, pp. 328-322, 2003.

Claims (19)

REIVINDICACIONES
1. Un descodificador para descodificar una señal de audio codificada para obtener una señal de audio fase-ajustada, que comprende: una unidad de descodificación (110) , para descodificar la señal de audio codificada para obtener una señal de audio descodificada y una unidad de ajuste de fase (120; 430; 560) para ajustar la señal de audio descodificada para obtener la señal de audio fase-ajustada, en donde la unidad de ajuste de fase (120; 430; 560) está configurada para recibir información de control dependiendo de la coherencia de fase vertical de la señal de audio codificada y en donde la unidad de ajuste de fase (120; 430; 560) es apta para ajustar la señal de audio descodificada en base a la información de control.
2. El descodificador de acuerdo con la reivindicación 1, en donde la unidad de ajuste de fase (120; 430; 560) está configurada para ajustar la señal de audio descodificada cuando la información de control indica que el ajuste de fase está activado y en donde la unidad de ajuste de fase (120; 430; 560) está configurada para no ajustar la señal de audio descodificada cuando la información de control indica que el ajuste de fase esta desactivado.
3. El descodificador de acuerdo con la reivindicación 1, en donde la unidad de ajuste de fase (120; 430; 560) está configurada para recibir la información de control, en donde la información de control comprende un valor de intensidad que indica la intensidad del ajuste de fase y en donde la unidad de ajuste de fase (120; 430; 560) está configurada para ajustar la señal de audio descodificada en base al valor de la intensidad.
4. El descodificador de acuerdo con una de las reivindicaciones 1 a 3 , en donde el descodificador comprende además un banco de filtro de análisis para descomponer la señal de audio descodificada en una pluralidad de señales de sub-banda de una pluralidad de sub-bandas, en donde la unidad de ajuste de fase (120; 430; 560) está configurada para determinar una pluralidad de primeros valores de fase de la pluralidad de señales de sub-banda y en donde la unidad de ajuste de fase (120; 430; 560) es apta para ajustar la señal de audio codificada al modificar por lo menos algunos de la pluralidad de los primeros valores de fase para obtener segundos valores de fase de la señal de audio fase-ajustada.
5. El descodificador de acuerdo con la reivindicación 4, en donde la unidad de ajuste de fase (120; 430; 560) está configurada para ajustar por lo menos algunos de los valores de fase al aplicar las fórmulas: px' (f ) = px(f) - dp(f) y dp(f) = OÍ * (pO(f) + const) , en donde f es una frecuencia que indica la una de la sub-bandas que tiene la frecuencia f como una frecuencia central . en donde px(f) es uno de los primeros valores de fase de una de las señales de sub-banda de una de las sub-bandas que tienen la frecuencia f como la frecuencia central, en donde p 1 (f) es uno de los segundos valores de fase de una de las señales de sub-banda de una de las sub-bandas que tienen la frecuencia f como la frecuencia central, en donde const es un primer ángulo en el intervalo -n = const = n, en donde ex es un número real en el intervalo 0 = = 1; y en donde p0(f) es un segundo ángulo en el intervalo de -n = pO(f) = n, en donde el segundo ángulo p0(f) es asignado a una de las sub-bandas que tiene la frecuencia f como la frecuencia central .
6. El descodificador de acuerdo con la reivindicación 4, en donde la unidad de ajuste de fase (120; 430; 560) está configurada para ajustar por lo menos algunos de los valores de fase al multiplicar por lo menos algunas de la pluralidad de señales de sub-banda por un término de fase exponencial , en donde el término de fase exponencial es definido por la fórmula e"jdp(f) en donde la pluralidad de señales de sub-banda son señales de sub-banda complejas y en donde j es el número imaginario unitario.
7. El descodificador de acuerdo con una de las reivindicaciones precedentes, en donde el descodificador comprende además un banco de filtros de síntesis (125) , en donde la señal de audio fase-ajustada es una señal de audio de dominio espectral fase-ajustada siendo representada en un dominio espectral y en donde el banco de filtros de síntesis (125) está configurado para transformar la señal de audio de dominio espectral fase-ajustada del dominio espectral a un dominio de tiempo para obtener una señal de audio de dominio de tiempo fase-ajustada.
8. Un codificador para codificar información de control en base a una señal de entrada de audio, que comprende: una unidad de transformación (210) para transformar la señal de entrada de audio de un dominio de tiempo a un dominio espectral para obtener una señal de audio transformada que comprende una pluralidad de señales de sub- banda siendo asignadas a una pluralidad de sub-bandas, un generador de información de control (220; 420; 520; 600) para generar la información de control, de tal manera que la información de control indica una coherencia de fase vertical de la señal de audio transformada y una unidad de codificación (230) para codificar la señal de audio transformada y la información de control.
9. El codificador de acuerdo con la reivindicación 8, en donde la unidad de transformación (210) comprende un banco de filtro de cochlear para transformar la señal de entrada de audio del domino de tiempo al dominio espectral para obtener la señal de audio transformada que comprende la pluralidad de señales de sub-banda.
10. El codificador de acuerdo con la reivindicación 8 o 9, en donde el generador de información de control (220; 420; 520; 600) está configurado para determinar una envolvente de sub-banda para cada una de la pluralidad de señales de sub-banda para obtener una pluralidad de envolventes de señal de sub-banda, en donde el generador de información de control (220; 420; 520; 600) está configurado para generar una envolvente combinada basada en la pluralidad de envolventes de señal de sub-banda y en donde el generador de información de control (220; 420; 520; 600) está configurado para generar la información de control en base a la envolvente combinada .
11. El codificador de acuerdo con la reivindicación 10, en donde el generador de información de control (220; 420; 520; 600) está configurado para generar un número caracterizante basado en la envolvente combinada y en donde el generador de información de control (220; 420; 520; 600) está configurado para generar la información de control, de tal manera que la información de control indica que el ajuste de fase está activado cuando el número caracterizante es mayor que un valor de umbral y en donde el generador de información de control (220; 420; 520; 600) está configurado para generar la información de control, de tal manera que la información de control indica que el ajuste de fase esta desactivado cuando el número caracterizante es menor o igual al valor de umbral.
12. El codificador de acuerdo con la reivindicación 10 u 11, en donde el generador de información de control (220; 420; 520; 600) está configurado para generar la información de control al calcular la proporción de una media geométrica de la envolvente combinada con una media aritmética de la envolvente combinada.
13. El codificador de acuerdo con una de las reivindicaciones 8 a 12, en donde el generador de información de control (220; 420; 520; 600) está configurado para generar la información de control, de tal manera que la información de control comprende un valor de intensidad que indica el grado de coherencia de fase vertical de las señales de sub-banda.
14. Un aparato para procesar una primera señal de audio para obtener una segunda señal de audio, que comprende: un generador de información de control (710; 820) para generar información de control, de tal manera que la información de control indica una coherencia de fase vertical de la primera señal de audio y una unidad de ajuste de fase (710; 830) para ajustar la primera señal de audio para obtener la segunda señal de audio, en donde la unidad de ajuste de fase (720; 830) es apta para ajustar la primera señal de audio en base a la información de control .
15. Un sistema que comprende, el codificador (310) de acuerdo con una de las reivindicaciones 8 a 13 y por lo menos un descodificador (320) de acuerdo con una de las reivindicaciones 1 a 7, en donde el codificador (310) está configurado para transformar una señal de entrada de audio para obtener una señal de audio transformada, en donde el codificador (310) está configurado para codificar la señal de audio transformada para obtener una señal de audio codificada, en donde el codificador (310) está configurado para codificar información de control que indica una coherencia de fase vertical de la señal de audio transformada, en donde el codificador (310) está dispuesto para alimentar la señal de audio codificada y la información de control a por lo menos un descodificador, en donde el por lo menos un descodificador (320) está configurado para descodificar la señal de audio codificada para obtener una señal de audio descodificada y en donde el por lo menos un descodificador (320) está configurado para ajustar la señal de audio descodificada en base a la información de control codificada para obtener una señal de audio fase-ajustada.
16. Un método para descodificar una señal de audio codificada para obtener una señal de audio fase-ajustada, que comprende : recibir información de control, en donde la información de control indica una coherencia de fase vertical de la señal de audio codificada, descodificar la señal de audio codificada para obtener una seña de audio descodificada y ajustar la señal de audio descodificada para obtener la señal de audio fase-ajustada en base a la información de control .
17. Un método para codificar información de control basada en una señal de entrada de audio, que comprende: transformar la señal de entrada de audio de un dominio de tiempo a un dominio espectral para obtener una señal de audio transformada que comprende una pluralidad de señales de sub-banda que son asignadas a una pluralidad de sub-bandas, generar la información de control, de tal manera que la información de control indica una coherencia de fase vertical y la señal de audio transformada y codificar la señal de audio transformada y la información de control.
18. Un método para procesar una primera señal de audio para obtener una segunda señal de audio, que comprende: generar información de control, de tal manera que la información de control indica una coherencia de fase vertical de la primera señal de audio y ajustar la primera señal de audio en base a la información de control para obtener la segunda señal de audio .
19. Un programa de computadora para implementar el método de acuerdo con una de las reivindicaciones 16 a 18, cuando es ejecutado por una computadora o procesador de señal .
MX2014010098A 2012-02-27 2013-02-26 Control de coherencia de fase para señales armonicas en codecs de audio perceptual. MX338526B (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261603773P 2012-02-27 2012-02-27
EP12178265.0A EP2631906A1 (en) 2012-02-27 2012-07-27 Phase coherence control for harmonic signals in perceptual audio codecs
PCT/EP2013/053831 WO2013127801A1 (en) 2012-02-27 2013-02-26 Phase coherence control for harmonic signals in perceptual audio codecs

Publications (2)

Publication Number Publication Date
MX2014010098A true MX2014010098A (es) 2014-09-16
MX338526B MX338526B (es) 2016-04-20

Family

ID=47076051

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2014010098A MX338526B (es) 2012-02-27 2013-02-26 Control de coherencia de fase para señales armonicas en codecs de audio perceptual.

Country Status (14)

Country Link
US (1) US10818304B2 (es)
EP (2) EP2631906A1 (es)
JP (1) JP5873936B2 (es)
KR (1) KR101680953B1 (es)
CN (1) CN104170009B (es)
AU (1) AU2013225076B2 (es)
BR (1) BR112014021054B1 (es)
CA (1) CA2865651C (es)
ES (1) ES2673319T3 (es)
IN (1) IN2014KN01766A (es)
MX (1) MX338526B (es)
RU (1) RU2612584C2 (es)
TR (1) TR201808452T4 (es)
WO (1) WO2013127801A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101589623B (zh) 2006-12-12 2013-03-13 弗劳恩霍夫应用研究促进协会 对表示时域数据流的数据段进行编码和解码的编码器、解码器以及方法
WO2015077641A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Selective phase compensation in high band coding
EP2963646A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
EP3262639B1 (en) 2015-02-26 2020-10-07 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for processing an audio signal to obtain a processed audio signal using a target time-domain envelope
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016046421A1 (en) * 2015-11-19 2016-03-31 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for voiced speech detection
CN106653004B (zh) * 2016-12-26 2019-07-26 苏州大学 感知语谱规整耳蜗滤波系数的说话人识别特征提取方法
CA3098064A1 (en) 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency audio reconstruction techniques
WO2019210068A1 (en) 2018-04-25 2019-10-31 Dolby Laboratories Licensing Corporation Integration of high frequency reconstruction techniques with reduced post-processing delay
CN110728970B (zh) * 2019-09-29 2022-02-25 东莞市中光通信科技有限公司 一种数字辅助隔音处理的方法及装置
EP4276824A1 (en) 2022-05-13 2023-11-15 Alta Voce Method for modifying an audio signal without phasiness

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
RU2009585C1 (ru) * 1991-06-19 1994-03-15 Евгений Николаевич Пестов Способ ударного возбуждения фазовой когерентности одновременно по крайней мере в двух квантовых системах
FR2692091B1 (fr) * 1992-06-03 1995-04-14 France Telecom Procédé et dispositif de dissimulation d'erreurs de transmission de signaux audio-numériques codés par transformée fréquentielle.
US6766300B1 (en) * 1996-11-07 2004-07-20 Creative Technology Ltd. Method and apparatus for transient detection and non-distortion time scaling
JPH11251918A (ja) * 1998-03-03 1999-09-17 Takayoshi Hirata 音声信号波形符号化伝送方式
US6397175B1 (en) * 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
KR100348790B1 (ko) * 1999-12-21 2002-08-17 엘지전자주식회사 큐에이엠 수신기
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4313993B2 (ja) * 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
CN1231889C (zh) * 2002-11-19 2005-12-14 华为技术有限公司 多通道声码器的语音处理方法
SE0303498D0 (sv) * 2003-12-19 2003-12-19 Ericsson Telefon Ab L M Spectral loss conccalment in transform codecs
SE527669C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Förbättrad felmaskering i frekvensdomänen
JP4513556B2 (ja) * 2003-12-25 2010-07-28 カシオ計算機株式会社 音声分析合成装置、及びプログラム
CN101015000A (zh) * 2004-06-28 2007-08-08 皇家飞利浦电子股份有限公司 无线音频
JP4734961B2 (ja) * 2005-02-28 2011-07-27 カシオ計算機株式会社 音響効果付与装置、及びプログラム
US7856355B2 (en) * 2005-07-05 2010-12-21 Alcatel-Lucent Usa Inc. Speech quality assessment method and system
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
US9697844B2 (en) * 2006-05-17 2017-07-04 Creative Technology Ltd Distributed spatial audio decoder
EP1918911A1 (en) * 2006-11-02 2008-05-07 RWTH Aachen University Time scale modification of an audio signal
KR101453732B1 (ko) * 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
CN102789784B (zh) * 2008-03-10 2016-06-08 弗劳恩霍夫应用研究促进协会 操纵具有瞬变事件的音频信号的方法和设备
EP2237266A1 (en) * 2009-04-03 2010-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a plurality of local center of gravity frequencies of a spectrum of an audio signal
WO2011039668A1 (en) * 2009-09-29 2011-04-07 Koninklijke Philips Electronics N.V. Apparatus for mixing a digital audio
WO2011048792A1 (ja) * 2009-10-21 2011-04-28 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
SG183966A1 (en) * 2010-03-09 2012-10-30 Fraunhofer Ges Forschung Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
JP6037156B2 (ja) * 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences

Also Published As

Publication number Publication date
RU2014138820A (ru) 2016-04-20
US10818304B2 (en) 2020-10-27
TR201808452T4 (tr) 2018-07-23
WO2013127801A1 (en) 2013-09-06
KR101680953B1 (ko) 2016-12-12
CN104170009B (zh) 2017-02-22
RU2612584C2 (ru) 2017-03-09
JP5873936B2 (ja) 2016-03-01
IN2014KN01766A (es) 2015-10-23
CN104170009A (zh) 2014-11-26
US20140372131A1 (en) 2014-12-18
ES2673319T3 (es) 2018-06-21
AU2013225076A1 (en) 2014-09-04
MX338526B (es) 2016-04-20
KR20140130225A (ko) 2014-11-07
CA2865651A1 (en) 2013-09-06
EP2820647B1 (en) 2018-03-21
EP2631906A1 (en) 2013-08-28
JP2015508911A (ja) 2015-03-23
BR112014021054B1 (pt) 2022-04-26
BR112014021054A2 (pt) 2021-05-25
CA2865651C (en) 2017-05-02
AU2013225076B2 (en) 2016-04-21
EP2820647A1 (en) 2015-01-07

Similar Documents

Publication Publication Date Title
US10818304B2 (en) Phase coherence control for harmonic signals in perceptual audio codecs
US10192561B2 (en) Audio processor and method for processing an audio signal using horizontal phase correction
US8817992B2 (en) Multichannel audio coder and decoder
JP5426680B2 (ja) 信号処理方法及び装置
KR101785187B1 (ko) 객체 특정 시간/주파수 분해능들을 이용한 혼합 신호로부터의 오디오 객체 분리
JP5752134B2 (ja) 最適化された低スループットパラメトリック符号化/復号化
CA2887228A1 (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
CN117542365A (zh) 用于具有全局ild和改进的中/侧决策的mdct m/s立体声的装置和方法
KR101837686B1 (ko) 공간적 오디오 객체 코딩에 오디오 정보를 적응시키기 위한 장치 및 방법
Herre et al. Perceptual audio coding
KR20080033840A (ko) 믹스 신호의 처리 방법 및 장치
KR100891665B1 (ko) 믹스 신호의 처리 방법 및 장치
KR100891668B1 (ko) 믹스 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
FG Grant or registration