ES2875416T3 - Aparato para generar una señal de audio multicanal - Google Patents

Aparato para generar una señal de audio multicanal Download PDF

Info

Publication number
ES2875416T3
ES2875416T3 ES08875078T ES08875078T ES2875416T3 ES 2875416 T3 ES2875416 T3 ES 2875416T3 ES 08875078 T ES08875078 T ES 08875078T ES 08875078 T ES08875078 T ES 08875078T ES 2875416 T3 ES2875416 T3 ES 2875416T3
Authority
ES
Spain
Prior art keywords
section
signal
audio signal
input audio
upmix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES08875078T
Other languages
English (en)
Inventor
Andreas Walther
Oliver Hellmuth
Falko Ridderbusch
Christian Stöcklmeier
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2875416T3 publication Critical patent/ES2875416T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

Aparato (100) para generar una señal de audio multicanal (142) basada en una señal de audio de entrada (102), que comprende: un medio de mezclado ascendente de señal principal (110) configurado para proporcionar una señal de audio multicanal principal (112) basada en la señal de audio de entrada (102); un selector de sección (120) configurado para seleccionar una sección de la señal de audio de entrada (102) basándose en un análisis de la señal de audio de entrada (102) para obtener una sección seleccionada de la señal de audio de entrada (102), en el que la sección seleccionada de la señal de audio de entrada (102), una sección seleccionada procesada de la señal de audio de entrada (102) o una señal de referencia asociada a la sección seleccionada de la señal de audio de entrada (102) y que sustituye a la sección seleccionada de la señal de audio de entrada (102) se proporciona como una señal de sección (122); un medio de mezclado ascendente de señal de sección (130) configurado para proporcionar una señal de mezcla ascendente de sección (132) basada en la señal de sección (122); y un combinador (140) configurado para superponer la señal de audio multicanal principal (112) y la señal de mezcla ascendente de sección (132) para obtener la señal de audio multicanal (142), en el que el aparato comprende además una memoria de señal de sección (920) configurada para almacenar la señal de sección (122) o una señal de sección procesada, en el que el medio de mezclado ascendente de señal de sección (130) está configurado para proporcionar un número definido de señales de mezcla ascendente de sección (132) basadas en la señal de sección (122) almacenada o en la señal de sección procesada almacenada, en el que el número definido de señales de mezcla ascendente de sección (132) está determinado por un parámetro de densidad, o en el que el aparato comprende además un controlador (910) configurado para desactivar el selector de sección (120), el medio de mezclado ascendente de señal de sección (130) o el combinador (140), de modo que la señal de audio multicanal (142) sea igual a la señal de audio multicanal principal (112), en el que el controlador (910) está controlado por un parámetro de control (912) contenido en la señal de audio de entrada (102) o controlado por una interfaz de usuario.

Description

DESCRIPCIÓN
Aparato para generar una señal de audio multicanal
Las realizaciones según la invención se refieren a un aparato y a un método para generar una señal de audio multicanal basándose en una señal de audio de entrada.
Algunas realizaciones según la invención se refieren a un procesamiento de señal de audio, especialmente relacionado con conceptos para generar señales multicanal, en el que no se transmitió una señal propia para cada altavoz.
Cuando una señal con N canales de audio se reproduce por un sistema de audio con M canales de reproducción (M>N), por ejemplo, existen las siguientes posibilidades:
1) únicamente se usa una parte de los altavoces disponibles
2) se genera una señal, que utiliza el sistema de reproducción disponible completo.
La segunda posibilidad es la solución preferida y también se denomina mezcla ascendente en el siguiente texto.
En el contexto del mezclado ascendente existen dos tipos diferentes de métodos para generar una señal multicanal. Por ejemplo, una señal multicanal existente se simplifica a un número más pequeño de canales con el fin de regenerar la señal original en el receptor basándose en los datos adicionales. Este método también se denomina mezcla ascendente guiada.
La otra posibilidad es el denominado método de mezcla ascendente ciega. Esto se refiere a una extensión multicanal sin conocimiento previo. No existen datos adicionales que controlen el proceso. Tampoco existe ninguna impresión de sonido original o impresión de sonido de referencia, que tenga que ser reproducida o lograda mediante la mezcla ascendente ciega.
Por ello, existen diferentes enfoques para realizar una mezcla ascendente ciega.
Un posible enfoque se conoce como concepto de ambiente directo. En este caso, las fuentes de sonido directo se reproducen preferiblemente por los tres canales frontales (por ejemplo, por el denominado sistema de cine en casa 5.1), de modo que las fuentes de sonido directo se escuchen por un oyente en las mismas posiciones que en la versión original de dos canales (por ejemplo, cuando la señal de entrada es una señal estéreo).
La figura 2 muestra una ilustración esquemática de una reproducción de señal de audio 200 para un sistema de dos canales. Se muestra una versión original de dos canales, por ejemplo, con tres fuentes de sonido directo S1, S2, S3, 240. La señal de audio se reproduce por un oyente 210 mediante un altavoz izquierdo 220 y un altavoz derecho 230 y comprende porciones de señal de las tres fuentes de sonido directo y una porción de ambiente 250 indicada por el área circundada. Esto es, por ejemplo, una reproducción estéreo de dos canales estándar (3 fuentes y ambiente).
La figura 3 muestra una ilustración esquemática de una reproducción de señal de audio 300 de una mezcla ascendente ciega según el concepto de ambiente directo. Cinco altavoces (central 310, frontal izquierdo 320, frontal derecho 330, posterior izquierdo 340 y posterior derecho 350) se muestran para reproducir una señal de audio multicanal.
Las fuentes de sonido directo 240 se reproducen por los tres altavoces 310, 320, 330 en frente. Las porciones de ambiente 250 contenidas en la pista de audio se reproducen por los canales frontales y los canales envolventes con el fin de envolver a un oyente 210.
Las porciones de ambiente son porciones de la señal, que no pueden asignarse a una fuente simple, sino que se asignan a una combinación de todos los componentes de sonido, lo que crea una impresión de entorno audible. Las porciones de ambiente pueden comprender, por ejemplo, reflexiones de ambiente y reverberaciones de ambiente, pero también sonidos del público, por ejemplo, aplausos, sonidos naturales, por ejemplo, lluvia o efectos de sonidos artificiales, por ejemplo, sonidos de rotura de vinilo.
Otro posible concepto a menudo se menciona como concepto en la banda. La figura 4 muestra una ilustración esquemática de una reproducción de señal de audio 400 según el concepto en la banda. La disposición de los altavoces corresponde a la disposición de los altavoces en la figura 3. Sin embargo, cada tipo de sonido, por ejemplo, fuentes de sonido directo y sonidos de tipo ambiente son posiciones alrededor del oyente.
Debido a que todas las señales de salida se generan a partir de la misma señal de entrada, las señales de salida deben estar decorrelacionadas adicionalmente. Para esto, pueden usarse muchos métodos conocidos como, por ejemplo, retardo temporal o el uso de un filtro de todo paso. Los métodos sencillos mencionados a menudo muestran, además del efecto de decorrelación, desventajas preocupantes.
Por ejemplo, una desventaja es que casi todos los métodos de decorrelación distorsionan la estructura temporal de las señales de entrada, de modo que las estructuras transitorias pierden su carácter transitorio. Esto lleva, por ejemplo, al efecto de que una señal de ambiente de tipo aplauso únicamente pueda lograr un efecto envolvente, pero no de inmersión.
Los tipos de señal especiales, tales como aplauso o lluvia, toman una posición excepcional entre las señales de ambiente. Son señales de ambiente, que no necesariamente dan una impresión de ambiente. En su lugar, crean una sensación envolvente por el gran número de superposiciones temporales y espaciales de porciones simples, que comprenden su propio carácter de sonido directo, como, por ejemplo, aplausos simples o gotas de lluvia simples.
Mediante la superposición, la señal total resultante adquiere principalmente las mismas propiedades estadísticas conocidas de la reverberación de ambiente.
Especialmente estos tipos de señales son difíciles de manipular con un método de mezcla ascendente (mediante mezcla ascendente guiada, así como mediante mezcla ascendente ciega). También, a menudo conducen a una mezcla ascendente defectuoso, por ejemplo, puede escucharse un efecto del tipo filtro de peine.
Métodos conocidos de mezcla ascendente ciega, que crean las porciones de señal para los canales posteriores, de modo que estos artefactos no se produzcan, generan una impresión de sonido, que está limitada a una impresión, por ejemplo, en la que el público aplaude en frente del oyente y los canales envolventes únicamente generan una impresión del ambiente en el que se realiza el aplauso (ambiente envolvente). Pero especialmente en estos ambientes es deseable que sea parte del público que aplaude o que permanezca en la lluvia (ambiente inmersivo). Para esto, todas las porciones (similares al concepto en la banda) deben ser distribuidas alrededor del oyente, pero sin ninguna medición esto conduciría nuevamente a una impresión de sonido con artefactos.
En "A. Wagner, A. Walther, F. Melchior, M. StraulJ; "Generation of Highly Immersive Atmospheres for Wave Field Synthesis Reproduction"; Presentada en la 116a Convención de AES, Berlín 2004", se describe un método de cómo puede generarse un ambiente inmersivo para una síntesis de campo de ondas. Para ello, un oyente está rodeado por un campo de sonido envolvente decorrelacionado de 360°, el cual da una impresión del ambiente acústico representado.
Para lograr un efecto de inmersión, se agregan las denominadas fuentes de enfoque. Una fuente de enfoque es una fuente de sonido de punto, que es perceptible como una fuente simple y representa sonidos característicos simples del campo de sonido envolvente.
Según la publicación, las fuentes simples (partículas de sonido) deben estar disponibles para cada ambiente en grandes números y pueden ser o bien sonidos grabados por separado o bien sonidos artificiales generados por un sintetizador.
Este enfoque orientado a objetos tiene el inconveniente de que diferentes señales de audio para cada tipo de ambiente deben estar ya disponibles. Por un lado, las señales de ambiente envolvente como pistas simples decorrelacionadas y, por otro lado, las fuentes de sonido simples como archivos de audio separados. Una alternativa mencionada es generar (por ejemplo, con un software de sintetizador) esto para cada tipo de ambiente (si se sabe) artificialmente, que incluye el riesgo de que no se adapten al ambiente reproducido. Adicionalmente, para una generación de este tipo, por ejemplo, es necesario un modelo matemático de los sonidos de partícula y una gran cantidad de tiempo de cálculo. En general, el esfuerzo para una síntesis de campo de ondas es muy alto.
En "Gerard Hotho; Steven van de Par; Jeroen Breebart; "Multichannel Coding of Applause Signals"; artículo de investigación" se describe un método para codificación multicanal de señales de aplausos, que incluye especialmente un método para una decorrelación de ambientes aleatorios (denominados: aplausos, lluvia, crujidos).
En el presente documento, se menciona que un codificador selectivo de frecuencia empeora la calidad de las señales y, por ello, se presenta únicamente un codificador basado en el dominio del tiempo.
Con respecto a esto, únicamente debe realizarse una decorrelación, lo cual significa que básicamente todas las señales suenan igual (o como en la entrada). Se introduce un método de decorrelación con el que debería ser exitosa una reproducción de un sonido de referencia.
En una primera solicitud de patente europea sin pre-publicar con el número de solicitud EP 08018793 se introduce un método que descompone una señal de tipo aplauso en un sonido de primer plano y en un sonido de fondo. También se hace referencia a "A. Wagner, A. Walther, F. Melchior, M. StraulJ; "Generation of Highly Immersive Atmospheres for Wave Field Synthesis Reproduction"; Presentada en la 116a Convención de AES, Berlín 2004". Un ambiente envolvente se separa de los sonidos simples perceptibles, en los cuales el ambiente consiste y, entonces, estas dos partes pueden ser manipuladas de forma separada entre sí.
En la solicitud de patente sin pre-publicar mencionada, se describe un método que incluye una realización (modo guiado) que intenta reproducir el ambiente original. En principio, los sonidos de fondo (diferentes a los sonidos de primer plano) son únicamente decorrelacionados y los sonidos de primer plano únicamente se colocan en diferentes tiempos en diferentes posiciones. Puede decirse que únicamente se refiere a un método de decorrelación.
La señal total se descompone en una señal de primer plano y una de fondo. Puede asumirse que únicamente una reproducción común de las partes separadas sonará bien de nuevo, pero ambas por sí mismas pueden comprender artefactos.
Además, los métodos conocidos de mezcla ascendente se describen, por ejemplo, en "Roy Irwan y Ronaldus Aarts, "Multi-Channel Audio Converter", Número de Publicación Internacional: WO 02/052896 A2", en "Carlos Avendano y Jean-Marc Jot, "Stream Segregation For Stereo Signals", Pub. n.° US 2007/0041592 A1", en "David Griesinger, "Multichannel Active Matrix Encoder And Decoder With Maximum Lateral Separation", número de patente US005870480A y en "Jan Petersen, "Multi-Channel Sound Reproduction System For Stereophonic Signals", publicación internacional n.° WO 01/62045 A1", que no diferencian entre las diferentes señales de entrada.
El documento US 2008/205676 A1 da a conocer un decodificador envolvente de matriz de amplitud de fase. Un método en el dominio de la frecuencia para la decodificación envolvente de matriz de amplitud de fase de pistas de sonido y grabaciones estéreo de dos canales se basa en el análisis espacial de señales de dirección en 2-D o 3-D en la grabación y resíntesis de estas señales para la reproducción en cualquier sistema de reproducción de auriculares o altavoces.
El documento WO 2005/101905 A da a conocer un esquema para generar una representación paramétrica para aplicaciones de baja tasa de bits. La ubicación del máximo de la energía de sonido dentro de una configuración de reproducción se codifica y se transmite usando información de parámetros de dirección. Para la reconstrucción multicanal, la distribución de energía de los canales de salida identificados por la información de parámetros de dirección se controla por la información de parámetros de dirección, mientras que la distribución de energía en el resto de canales de ambiente no se controla por la información de parámetros de dirección.
Sumario de la invención
El objetivo de la presente invención es proporcionar un aparato para generar una señal de audio multicanal que permita una mejora de la flexibilidad y la calidad de sonido.
Este objetivo se resuelve mediante un aparato según la reivindicación 1 y un método según la reivindicación 17 o un programa informático según la reivindicación 21.
Una realización de la invención proporciona un aparato para generar una señal de audio multicanal basándose en una señal de audio de entrada. El aparato comprende un medio de mezclado ascendente de señal principal, un selector de sección, un medio de mezclado ascendente de señal de sección y un combinador.
El medio de mezclado ascendente de señal principal está configurado para proporcionar una señal de audio multicanal principal basándose en la señal de audio de entrada.
El selector de sección está configurado para seleccionar una sección de la señal de audio de entrada basándose en un análisis de la señal de audio de entrada. La sección seleccionada de la señal de audio de entrada, una sección seleccionada procesada de la señal de audio de entrada o una señal de referencia asociada con la sección seleccionada de la señal de audio de entrada y que sustituye a la sección seleccionada de la señal de audio de entrada se proporciona como señal de sección.
El medio de mezclado ascendente de señal de sección está configurado para proporcionar una señal de mezcla ascendente de sección basándose en la señal de sección, y el combinador está configurado para superponer la señal de audio multicanal principal y el canal de mezcla ascendente de sección para obtener la señal de audio multicanal.
Las realizaciones según la presente invención se basan en la idea central de que la señal de audio multicanal principal generada por el medio de mezclado ascendente de señal principal se actualiza mediante una señal de audio adicional en términos de la señal de mezcla ascendente de sección. Esta señal de audio adicional se basa en una selección de una sección de la señal de audio de entrada.
La señal de audio multicanal puede estar influida de una forma muy flexible por el selector de sección y el medio de mezclado ascendente de señal de sección.
Debido a la mejora de flexibilidad y al uso de una selección inteligente de la señal de sección y una regla de mezclado ascendente de señal de sección adecuada, puede mejorarse la calidad de sonido.
Debido a que la señal de audio multicanal es una señal artificial de cualquier manera, dado que se genera basándose en la señal de audio de entrada con menos canales que la señal de audio multicanal, y no proporciona la impresión de sonido original, la calidad de sonido de la señal de audio multicanal puede mejorarse para obtener una señal, que pueda generar una impresión de sonido tan igual como sea posible a la impresión de sonido original mediante un uso flexible del selector de sección y del medio de mezclado ascendente de señal de sección.
El medio de mezclado ascendente de señal principal puede generar una señal de audio multicanal principal que ya suena bien, que se mejora por la superposición con la mezcla ascendente de señal de sección.
Pueden evitarse artefactos, generados, por ejemplo, al separar la señal de audio de entrada en una señal de primer plano y una señal de fondo.
Según la invención, la señal de sección seleccionada se almacena y se usa varias veces para mezclado ascendente y superposición con el fin de obtener una señal de audio multicanal mejorada. De este modo, puede variarse el número de señales de sección en la señal de audio multicanal. Por ejemplo, la señal de sección corresponde a gotas de lluvia simples que golpean el suelo. Por esto, puede variarse la densidad de las gotas de lluvia simples audibles en un chubasco de lluvia.
Según la invención, la señal de audio de entrada se analiza con el fin de identificar la sección de la señal de audio de entrada. Por ejemplo, puede identificarse una señal de ambiente específica, como un aplauso o lluvia, y dentro de estas señales, puede aislarse un aplauso o gota de lluvia simple.
Breve descripción de los dibujos
Las realizaciones según la invención se detallarán posteriormente haciendo referencia a los dibujos adjuntos, en los que:
la figura 1 es un diagrama de bloques de un aparato para generar una señal de audio multicanal;
la figura 2 es una ilustración esquemática de una reproducción de señal de audio de un sistema de dos canales; la figura 3 es una ilustración esquemática de una reproducción de señal de audio de una mezcla ascendente ciega según el concepto de ambiente directo;
la figura 4 es una ilustración esquemática de una reproducción de una señal de audio de una mezcla ascendente ciega según el concepto en la banda;
la figura 5 es una ilustración esquemática de una reproducción de señal de audio de una señal de tipo aplauso que comprende una pluralidad de fuentes simples;
la figura 6 es una ilustración esquemática de una influencia de los parámetros de posición para una reproducción de señal de audio;
la figura 7 es una ilustración esquemática de una influencia del parámetro de distribución para una reproducción de señal de audio;
la figura 8 es un diagrama de bloques de un aparato para generar una señal de audio multicanal;
la figura 9 es un diagrama de bloques de un aparato para generar una señal de audio multicanal; y
la figura 10 es un diagrama de flujo de un método para generar una señal de audio multicanal.
Descripción detallada de la invención
Por simplificación, muchas de las realizaciones a continuación mencionan o muestran una señal de audio de entrada con dos canales (N=2) y una señal de audio multicanal generada con cinco canales (M=5). Esto corresponde al caso común en el que los medios de dos canales (por ejemplo, CD) deben reproducirse por un sistema de cinco canales (a menudo denominado sistema de cine en casa 5.1, en el que el .1 es para un canal de efecto con ancho de banda reducido). Sin embargo, los conceptos descritos son fácilmente transferibles a cualquier número de canales o reproducciones orientadas a objetos para un experto en la técnica.
La figura 1 muestra un diagrama de bloques de un aparato 100 para generar una señal de audio multicanal 142 basándose en una señal de audio de entrada 102. El aparato 100 comprende un medio de mezclado ascendente de señal principal 110, un selector de sección 120, un medio de mezclado ascendente de señal de sección 130 y un combinador 140. El medio de mezclado ascendente de señal principal 110 está conectado al combinador 140, el selector de sección 120 está conectado al medio de mezclado ascendente de señal de sección 130 y el medio de mezclado ascendente de señal de sección 130 también está conectado al combinador 140.
El medio de mezclado ascendente de señal principal 110 está configurado para proporcionar una señal de audio multicanal principal 112 basándose en la señal de audio de entrada 102.
El selector de sección 120 está configurado para seleccionar una sección de la señal de audio de entrada 102 basándose en un análisis de la señal de audio de entrada 102. La sección seleccionada de la señal de audio de entrada 102, una sección seleccionada procesada de la señal de audio de entrada 102 o una señal de referencia asociada con la sección seleccionada de la señal de audio de entrada 102 se proporciona como señal de sección 122.
El medio de mezclado ascendente de señal de sección 130 está configurado para proporcionar una señal de mezcla ascendente de sección 132 basándose en la señal de sección 122.
El combinador 140 está configurado para superponer la señal de audio multicanal principal 112 y la señal de mezclado ascendente de sección 132 para obtener la señal de audio multicanal 142.
Por ejemplo, una sección representativa de la señal de audio de entrada para un ambiente específico, como un aplauso o lluvia, se selecciona basándose en un análisis de la señal de audio de entrada. Esta sección seleccionada 122 puede procesarse o sustituirse por una señal de referencia. La sección seleccionada 122, la sección seleccionada procesada o la señal de referencia se mezcla entonces de manera ascendente y se superpone con la señal de audio multicanal principal 112 para obtener una señal de audio multicanal mejorada 142.
Por ello, puede ser posible agregar, por ejemplo, una señal transitoria en términos de una señal de mezcla ascendente de sección 132 a la señal de audio multicanal principal 112.
La mezcla ascendente de señal de sección y la superposición pueden hacerse de modo que la señal de audio multicanal 142 pueda generar un ambiente inmersivo para un oyente y, por ello, una señal de audio multicanal mejorada.
El medio de mezclado ascendente de señal principal 110 puede funcionar en principio según cualquier método de mezcla ascendente. Con el fin de obtener una impresión de sonido de tipo ambiente homogéneo en la distancia de audición entre los altavoces frontales y los altavoces envolventes, todas las señales de altavoz y especialmente el sonido frontal con respecto al sonido envolvente deben decorrelacionarse. Durante una mezcla ascendente ciega, por ejemplo, únicamente las N señales de entrada están disponibles, a partir de lo cual las nuevas señales de salida con otras propiedades deben generarse mediante una ponderación de las porciones individuales de las señales. De esta forma, por ejemplo, las fuentes de sonido directas pueden enfatizarse por atenuación de la porción de ambiente o al revés.
Normalmente puede suponerse que un efecto de mezcla ascendente común generaría una impresión de sonido envolvente para señales de tipo aplauso.
El selector de sección 120 también puede denominarse separador de partículas y seleccionar una sección de la señal de entrada también puede describirse por una separación de una partícula.
El selector de sección 120 selecciona, por ejemplo, mediante corte, una sección de la señal de entrada (que también se denomina partícula o recorte de sonido), que es típico o característico para la señal de entrada. Esto puede hacerse de formas diferentes.
Por ejemplo, puede cortarse una sección pequeña de la forma de onda (representación en el dominio del tiempo) de la señal de entrada.
Una alternativa puede ser una selección, opcionalmente un procesamiento y una retransformación de bloques individuales o un grupo de bloques a partir del dominio de la frecuencia del tiempo al dominio del tiempo.
Una alternativa adicional es marcar bloques en el dominio del tiempo y/o dominio de la frecuencia, que se manipulan especialmente en el siguiente procesamiento y se agregan a la señal total nuevamente justo antes de la retransformación. Por ejemplo, una sección temporal de la señal de audio de entrada puede seleccionarse y dividirse en una pluralidad de bandas de frecuencia, por ejemplo, mediante un banco de filtros. Una o más de las diferentes bandas de frecuencia pueden procesarse y, entonces, si es necesario, retransformarse y, por ejemplo, superponerse con la sección seleccionada no procesada de la señal de audio de entrada.
Al procesar la sección seleccionada de la señal de audio de entrada, puede mejorarse la calidad de la partícula de sonido (sección seleccionada). Por ejemplo, el aplauso de un oyente de un público puede aislarse al procesar la sección seleccionada. El aplauso aislado puede modificarse para generar, por ejemplo, un aplauso que suena mejor o diversos aplausos que suenan ligeramente diferentes.
Una alternativa adicional puede ser sustituir la sección seleccionada mediante una señal de referencia. Por ejemplo, la sección seleccionada contiene un aplauso de un oyente de un público y se sustituye por una señal de referencia que contiene un aplauso perfecto.
El combinador 140, por ejemplo, agrega una o más partículas separadas contenidas en una o más señales de mezcla ascendente de sección a la señal de audio multicanal principal (también denominada mezcla ascendente por defecto). La señal de audio multicanal principal y la señal de mezcla ascendente de sección pueden, por ejemplo, agregarse directamente o agregarse con amplitudes y/o fases adaptadas.
La figura 5 muestra una ilustración esquemática de una reproducción de señal de audio 500 de una señal de tipo aplauso que comprende una pluralidad de fuentes simples. Esta realización muestra un sistema de dos canales con un altavoz izquierdo 220 y un altavoz derecho 230 y una pluralidad de fuentes simples 510, que corresponden a las partículas, que deben separarse, distribuirse entre los dos altavoces, en el que la posición entre los dos altavoces depende de la porción de la señal reproducida por el altavoz izquierdo y el altavoz derecho.
El medio de mezclado ascendente de señal de sección 130 puede generar una señal de mezcla ascendente de sección 132, que contiene, por ejemplo, una o más partículas de sonido. Este proceso de mezclado ascendente puede basarse en un parámetro de posición, en el que el parámetro de posición, por ejemplo, indica en qué posición un oyente escuchará una partícula específica. El parámetro de posición puede estar determinado por la información de posición contenida por la señal de audio de entrada o puede generarse aleatoriamente mediante, por ejemplo, un generador de posición aleatorio.
Las porciones de señal de una partícula en los diferentes canales de la señal de audio multicanal pueden determinarse por un método de panoramización de amplitud, por ejemplo, basándose en un parámetro de posición de la partícula.
La figura 6 muestra una ilustración esquemática 600 de una influencia del parámetro de posición para una reproducción de señal de audio. La figura muestra cinco altavoces correspondientes a una señal de audio de cinco canales. En este ejemplo, los altavoces están dispuestos en una circunferencia 610 de un círculo.
Cuando una señal de una partícula de sonido se envía al altavoz, una posición virtual en la cual un oyente escucharía esta partícula de sonido específica depende de la porción de la señal enviada a cada altavoz. Por ejemplo, cuando la señal se envía únicamente a un altavoz, un oyente pensaría que la fuente de sonido está ubicada en este altavoz específico. Este caso se muestra para la partícula 630 ubicada en el altavoz izquierdo frontal 320. Si la señal se comparte entre dos altavoces, una posición virtual de la partícula de sonido se ubicaría entre estos dos altavoces. Esto se muestra por las partículas 640 y 650. Una señal distribuida aproximadamente igual entre los cinco altavoces aparecería aproximadamente en medio del conjunto de altavoces, mostrado en el número de referencia 660. De este modo, la posición virtual de una partícula de sonido puede ubicarse en cualquier punto (por ejemplo, mostrado en el número de referencia 670 y 680) dentro del área delimitada por la línea 620 entre cada dos altavoces colindantes.
Una señal o partícula de sección puede agregarse en posiciones aleatorias y/o tiempos aleatorios. El medio de mezclado ascendente de señal de sección 130 también puede denominarse medio de mezclado ascendente de partícula.
Esta adición puede depender del tipo de ambiente (aplauso, lluvia u otros) en posiciones estáticas, en trayectorias dadas o en posiciones completamente aleatorias, cada una con tiempos establecidos posiblemente de forma aleatoria.
Algunas realizaciones según la invención comprenden una memoria de señal de sección (o memoria intermedia o memoria tampón). Esta memoria puede almacenar partículas separadas simples o señales de sección, señales de sección procesadas o señales de referencia que pueden usarse varias veces. Para cambiar o variar el sonido de las partículas de sonido extraídas, puede usarse un filtro o etapas de proceso de alta calidad, como, por ejemplo, el método de formación de transitorios descrito en "M. Goodwin, C. Avendano, "Frequency-domain algorithms for audio signal enhancement based on transient modification", Journal of the Audio Engineering Society 54 (2006) n.° 9, 827­ 840".
En algunas realizaciones según la invención, la adición de la señal de mezcla ascendente de sección a la señal de audio multicanal principal, también denominada adición de partículas a la mezcla ascendente por defecto, puede controlarse por parámetros como un parámetro de densidad y/o, según una realización adicional, un parámetro de propagación.
El parámetro de densidad, por ejemplo, indica cuántos sonidos o partículas simples (por tiempo) se agregan a la señal de audio multicanal principal (mezcla ascendente por defecto). Estas partículas pueden corresponder a diferentes secciones seleccionadas de la señal de audio de entrada o a una partícula separada específica, almacenada en una memoria y usada varias veces.
El parámetro de propagación, por ejemplo, determina en qué área del sonido provocado por la señal de audio multicanal (sonido de mezcla ascendente), las partículas deben agregarse a la señal de audio multicanal principal (mezcla ascendente por defecto).
La figura 7 muestra una ilustración esquemática 700 de una influencia del parámetro de propagación a una reproducción de señal de audio. En la figura 7, la influencia del parámetro de propagación está indicada por la línea discontinua 710. Por ejemplo, para algunas impresiones de sonido puede ser deseable que las partículas se agreguen únicamente en frente de un oyente 210, y para otras impresiones de sonido puede ser mejor propagar las partículas sobre el área completa o únicamente en la parte trasera.
El parámetro de propagación, por ejemplo, puede influir una generación aleatoria de un parámetro de posición para cada una de una pluralidad de partículas. En los ejemplos mostrados en la figura 7, la probabilidad de una posición de una partícula en frente del oyente es mayor que en la parte posterior del oyente.
La densidad y/o propagación del ambiente pueden variarse por parámetros, por ejemplo, también independientes de la densidad y de la propagación de la señal de audio de entrada.
La figura 7 muestra un ejemplo de una mezcla ascendente de las señales mostradas en la figura 5 al aplicar el concepto descrito.
En algunas realizaciones según la invención, las partículas separadas se reproducen únicamente por un altavoz simple con el fin de evitar un efecto de duplicación, por ejemplo, si se usa un retardo entre diferentes altavoces.
Algunas realizaciones según la invención comprenden un analizador, también denominado bloque de clasificación, configurado para realizar el análisis de la señal de audio de entrada con el fin de identificar la sección de la señal de audio de entrada que será seleccionada. El analizador puede ser una parte del selector de sección o un bloque separado independiente.
La figura 8 muestra un diagrama de bloques de un aparato 800 para generar una señal de audio multicanal 142 basándose en una señal de audio de entrada 102 según una realización de la invención. En este caso, el analizador 810 se muestra como un bloque separado.
El analizador 810 puede configurarse para identificar una sección que será seleccionada basándose en un parámetro de identificación contenido en la señal de audio de entrada, una comparación de la señal de audio de entrada con una señal de referencia, un análisis de frecuencia de la señal de audio de entrada o un método similar. Por ejemplo, de este modo puede identificarse una señal de tipo ambiente en la señal de audio de entrada. Un ejemplo puede ser un detector de aplauso o un detector de lluvia.
El analizador 810 o unidad de clasificación puede decidir si la señal de audio de entrada o una sección de la señal de audio de entrada puede procesarse de la forma descrita. Dependiendo de los resultados del análisis o de la clasificación, pueden modificarse los valores de parámetro de los bloques adicionales, por ejemplo, el medio de mezclado ascendente de señal principal, el selector de sección, el medio de mezclado ascendente de señal de sección o el combinador.
Por ejemplo, el analizador avisa al selector de sección mediante un parámetro (de análisis) qué sección de la señal de audio de entrada debe seleccionarse, o avisa al medio de mezclado ascendente de señal principal que atenúe la sección que será seleccionada en la señal de audio multicanal principal.
El combinador 140 muestra en este caso una conexión directa entre la salida del medio de mezclado ascendente de señal principal 110 y la salida del medio de mezclado ascendente de señal de sección 130, que puede ser una posibilidad para combinar la señal de audio multicanal principal y la señal de mezcla ascendente de sección. Una alternativa puede ser un ajuste de fase y/o amplitud de la señal de audio multicanal principal y/o la señal de mezcla ascendente de sección.
Algunas realizaciones según la invención comprenden un controlador configurado para desactivar el selector de sección, el medio de mezclado ascendente de señal de sección o el combinador. Al alternar una de estas tres unidades de un estado activado a uno desactivado, se detiene la superposición de la señal de audio multicanal principal y la señal de mezcla ascendente de sección. Por ello, la señal de audio multicanal es básicamente (por ejemplo, excepto por diferencias de amplitud y fase) igual que la señal de audio multicanal principal.
Una alternativa no reivindicada puede ser que el controlador se configure para alternar continuamente entre un estado completamente activado y uno desactivado del selector de sección, el medio de mezclado ascendente de señal de sección o el combinador. Esto puede proporcionar la posibilidad de un desvanecimiento continuo entre dos atmósferas diferentes para obtener una impresión de sonido inmersivo o más envolvente.
El controlador puede controlarse por un parámetro de control contenido en la señal de audio de entrada o controlarse por una interfaz de usuario. Esto puede dar a un productor (mediante un parámetro de control contenido en la señal de audio de entrada) o a un oyente (mediante una interfaz de usuario) la posibilidad de ajustar la impresión de sonido según su agrado o instrucciones.
El controlador puede proporcionar un desvanecimiento continuo posiblemente a partir de una envolvente (puede ser una por defecto o la alternativa) para una impresión de sonido inmersivo o a partir de uno inmersivo para una impresión de sonido envolvente.
En algunos ejemplos, pueden atenuarse secciones o partículas seleccionadas, que aparecen en la señal envolvente, en la señal frontal. Esto puede generar un efecto de inmersión de sensación muy discreta. Entonces, puede ser imposible un cambio temporal de las partículas comparadas con la señal de entrada y la reutilización de una partícula. Solamente puede cambiarse la posición.
En algunas realizaciones según la invención, básicamente se genera una impresión de sonido que suena bien mediante el medio de mezclado ascendente de señal principal (mezcla ascendente por defecto), que únicamente representa una característica y se actualiza por las partículas separadas. Por ello, puede ser posible que los mismos sonidos de entrada aparezcan en una porción envolvente, decorrelacionada, así como en la porción directa inmersiva. Esto puede ser posible debido a que, por ejemplo, no debe reproducirse ninguna señal, porque se genera una nueva señal de cualquier manera mediante la mezcla ascendente.
En algunos ejemplos no reivindicados la secuencia temporal de los elementos simples del sonido de primer plano pueden cambiarse y puede ser posible una transición desde una envolvente hasta un ambiente inmersivo. También, puede usarse una clasificación de señal automática.
La densidad temporal del ambiente, el timbre deseado y la propagación espacial (en el modo guiado) pueden establecerse independientes de la señal original.
Algunos ejemplos no reivindicados se refieren a un medio de mezclado ascendente de señal de sección que usa una regla de mezclado ascendente diferente de una regla de mezclado ascendente del medio de mezclado ascendente de señal principal.
La figura 9 muestra un diagrama de bloques de un aparato 900 para generar una señal de audio multicanal 142 basándose en una señal de audio de entrada 102 según una realización de la invención.
El aparato 900 corresponde al aparato mostrado en la figura 8. Sin embargo, el analizador 810 (unidad de clasificación) en este ejemplo es parte del selector de sección 120 y se proporciona un parámetro de análisis 902 al medio de mezclado ascendente de señal principal 110 y/o el medio de mezclado ascendente de señal de sección 130.
Adicionalmente, tal como se mencionó como alternativa anteriormente, se muestran un controlador 910, una memoria de señal de sección 920 y un generador de posición aleatorio 930.
La memoria de señal de sección 920 en este ejemplo está conectada al selector de sección 120 y está configurada para almacenar una señal de sección 122 proporcionada por el selector de sección 120 y está configurada para proporcionar una señal de sección almacenada al selector de sección 120. Alternativamente la memoria de señal de sección 920 puede proporcionar una señal de sección almacenada directamente al medio de mezclado ascendente de señal de sección 130.
El generador de posición aleatoria 930 está, por ejemplo, conectado al medio de mezclado ascendente de señal de sección 130 y está configurado para proporcionar un parámetro de posición aleatoria al medio de mezclado ascendente de señal de sección 130. Alternativamente, el generador de posición aleatorio 930 puede conectarse al selector de sección 120 y puede proporcionar un parámetro de posición aleatorio cuando se selecciona una señal de sección 122.
El controlador 910 en este ejemplo está controlado por el parámetro de control 912 y está conectado (mostrado en el número de referencia 914) al selector de sección 120, al medio de mezclado ascendente de señal de sección 130 y/o al combinador 140. El controlador 910 puede desactivar el selector de sección 120, el medio de mezclado ascendente de señal de sección 130 y/o el combinador 140.
En general, la invención descrita puede proporcionar una mezcla ascendente que suena mejor y más realista de una señal de ambiente de tipo aplauso o una señal de ambiente similar con menos artefactos.
La figura 10 muestra un diagrama de flujo de un método 1000 para generar una señal de audio multicanal basándose en una señal de audio de entrada. El método 1000 comprende proporcionar 1010 una señal de audio multicanal principal, seleccionar 1020 o no seleccionar una sección de la señal de audio de entrada, proporcionar 1030 una señal de mezcla ascendente de sección y superponer 1040 la señal de audio multicanal principal y la señal de mezclado ascendente de sección.
La señal de audio multicanal principal proporcionada se basa en la señal de audio de entrada.
La selección 1020 de una sección de la señal de audio de entrada se basa en un análisis de la señal de audio de entrada, en el que la sección seleccionada de la señal de audio de entrada, una sección seleccionada procesada de la señal de audio de entrada o una señal de referencia asociada con la sección seleccionada de la señal de audio de entrada se proporciona como señal de sección.
La señal de mezcla ascendente de sección proporcionada se basa en la señal de sección.
Al superponer 1040 la señal de audio multicanal principal y la señal de mezcla ascendente de sección, se obtiene la señal de audio multicanal.
Algunas realizaciones según la invención se refieren a un método que proporciona la posibilidad de mezclar de manera ascendente fuentes de sonido de tipo aplausos sin información adicional (mezcla ascendente no guiada) sin los artefactos convencionales. Adicionalmente, el método descrito puede proporcionar la posibilidad de un desvanecimiento continuo entre dos conceptos diferentes para obtener o bien una envolvente o bien una impresión de sonido inmersivo.
Algunas realizaciones adicionales según la invención se refieren a un efecto de mezcla ascendente controlable.
Algunas realizaciones según la invención se refieren a un método que proporciona la posibilidad de desvanecimiento entre dos impresiones de sensación distinta de un ambiente y/o atmósfera en una mezcla ascendente, que puede denominarse ambiente envolvente y ambiente inmersivo.
Algunas realizaciones según la invención se refieren a un medio de mezclado ascendente de señal principal que se basa en un método de mezcla ascendente conocido. Esta mezcla ascendente puede ser el punto de funcionamiento por defecto, si la mezcla ascendente no se extiende por una superposición de una señal de mezcla ascendente de sección. Este puede ser el caso, por ejemplo, si un controlador desactiva el selector de sección, el medio de mezclado ascendente de señal de sección o el combinador.
En general, el concepto descrito también puede aplicarse también a otros tipos de señal distintos a las señales de tipo aplauso usadas a modo de ejemplo. Por ejemplo, es posible aplicar sonidos que se originan de la lluvia, una bandada de aves, una playa, caballos galopando, una división de soldados marchando y así sucesivamente.
En la presente solicitud, los mismos números de referencia se usan en parte para objetos y unidades funcionales que tienen las mismas o propiedades funcionales similares.
En particular, se señala que, dependiendo de las condiciones, el esquema de la invención también puede implementarse en software. La implementación puede ser en un medio de almacenamiento digital, particularmente un disco flexible o un CD con señales de control electrónicamente legibles, capaces de actuar conjuntamente con un sistema informático programable de modo que se ejecute el método correspondiente. En general, la invención también consiste, por tanto, en un producto de programa informático con un código de programa almacenado en un soporte legible por máquina para realizar el método de la invención, cuando el producto de programa informático se ejecuta en un ordenador. Dicho de otro modo, la invención también puede realizarse, por tanto, como un programa informático con un código de programa para realizar el método, cuando el producto de programa informático se ejecuta en un ordenador.

Claims (17)

REIVINDICACIONES
1. Aparato (100) para generar una señal de audio multicanal (142) basada en una señal de audio de entrada (102), que comprende:
un medio de mezclado ascendente de señal principal (110) configurado para proporcionar una señal de audio multicanal principal (112) basada en la señal de audio de entrada (102);
un selector de sección (120) configurado para seleccionar una sección de la señal de audio de entrada (102) basándose en un análisis de la señal de audio de entrada (102) para obtener una sección seleccionada de la señal de audio de entrada (102), en el que la sección seleccionada de la señal de audio de entrada (102), una sección seleccionada procesada de la señal de audio de entrada (102) o una señal de referencia asociada a la sección seleccionada de la señal de audio de entrada (102) y que sustituye a la sección seleccionada de la señal de audio de entrada (102) se proporciona como una señal de sección (122);
un medio de mezclado ascendente de señal de sección (130) configurado para proporcionar una señal de mezcla ascendente de sección (132) basada en la señal de sección (122); y
un combinador (140) configurado para superponer la señal de audio multicanal principal (112) y la señal de mezcla ascendente de sección (132) para obtener la señal de audio multicanal (142), en el que el aparato comprende además una memoria de señal de sección (920) configurada para almacenar la señal de sección (122) o una señal de sección procesada, en el que el medio de mezclado ascendente de señal de sección (130) está configurado para proporcionar un número definido de señales de mezcla ascendente de sección (132) basadas en la señal de sección (122) almacenada o en la señal de sección procesada almacenada, en el que el número definido de señales de mezcla ascendente de sección (132) está determinado por un parámetro de densidad, o
en el que el aparato comprende además un controlador (910) configurado para desactivar el selector de sección (120), el medio de mezclado ascendente de señal de sección (130) o el combinador (140), de modo que la señal de audio multicanal (142) sea igual a la señal de audio multicanal principal (112), en el que el controlador (910) está controlado por un parámetro de control (912) contenido en la señal de audio de entrada (102) o controlado por una interfaz de usuario.
2. Aparato (100) según la reivindicación 1, que comprende un analizador (810) configurado para realizar el análisis de la señal de audio de entrada (102) con el fin de identificar la sección de la señal de audio de entrada (102) que va a seleccionarse.
3. Aparato (100) según la reivindicación 2, en el que el analizador (810) está configurado para identificar la sección de la señal de audio de entrada (102) basándose en un parámetro de identificación contenido en la señal de audio de entrada (102), una comparación de la señal de audio de entrada con la señal de referencia, un análisis de frecuencia de la señal de audio de entrada (102), una identificación de una señal de tipo ambiente en la señal de audio de entrada (102), una detección de aplausos o una detección de lluvia.
4. Aparato (100) según la reivindicación 2 o 3, en el que el analizador (810) proporciona un parámetro de análisis, en el que el medio de mezclado ascendente de señal principal (110) proporciona la señal de audio multicanal principal (112) basándose en el parámetro de análisis, o en el que el medio de mezclado ascendente de señal de sección (130) proporciona la señal de mezcla ascendente de sección (132) basándose en el parámetro de análisis.
5. Aparato (100) según una de las reivindicaciones 1 a 4, en el que la señal de mezcla ascendente de sección (132) contiene una o más partículas de sonido (122), en el que una partícula de sonido (122) representa una fuente de sonido simple, en el que el medio de mezclado ascendente de señal de sección (130) está configurado para proporcionar la señal de mezcla ascendente de sección (132) basándose en un parámetro de posición, en el que una porción de la señal de audio multicanal, que se basa en la señal de sección, para cada canal de la señal de audio multicanal se basa en el parámetro de posición, en el que el parámetro de posición indica en qué posición un oyente escuchará una partícula de sonido específica (122) de las una o más partículas de sonido (122).
6. Aparato (100) según la reivindicación 5, que comprende un generador de posición aleatoria (930) configurado para generar un parámetro de posición aleatoria.
7. Aparato (100) según la reivindicación 5 o 6, en el que el medio de mezclado ascendente de señal de sección (130) está configurado para proporcionar la pluralidad de señales de mezcla ascendente de sección (132) basándose en un parámetro de propagación, en el que cada señal de mezcla ascendente de sección (132) de la pluralidad de señales de mezcla ascendente de sección (132) se basa en un parámetro de posición individual, en el que una pluralidad de parámetros de posición individual se basa en el parámetro de propagación.
8. Aparato (100) según una de las reivindicaciones 1 a 7, en el que el medio de mezclado ascendente de señal principal (110) está configurado para atenuar una porción de la señal de audio de entrada (102) asociada a la sección seleccionada de la señal de audio de entrada (102).
9. Aparato (100) según la reivindicación 1, en el que la sección seleccionada de la señal de audio de entrada (102) contiene un aplauso de un oyente de un público, y en el que la señal de referencia asociada a la sección seleccionada y que sustituye a la sección seleccionada de la señal de audio de entrada (102) contiene diversos aplausos que suenan diferentes.
10. Aparato (100) según la reivindicación 2, en el que el analizador (810) está configurado para identificar, en la señal de audio de entrada (102), una señal de aplauso o una señal de lluvia, y en el que, dentro de la señal de aplauso o de la señal de lluvia, se aísla un aplauso o gota de lluvia simple.
11. Aparato (100) según la reivindicación 1, en el que el selector de sección (120) está configurado para seleccionar una sección representativa de la señal de audio de entrada (102) para un ambiente específico basado en el análisis de la señal de audio de entrada (102).
12. Aparato (100) según la reivindicación 1, en el que el medio de mezclado ascendente de señal de sección (130) está configurado para proporcionar una señal transitoria como señal de mezcla ascendente de sección (132).
13. Aparato (100) según la reivindicación 1, en el que el selector de sección (120) está configurado para realizar, en el procesamiento para obtener la sección seleccionada procesada de la señal de audio de entrada (102), la selección de una sección temporal de la señal de audio de entrada (102), la división de la sección temporal en una pluralidad de bandas de frecuencia, el procesamiento de una o más de las bandas de frecuencia, la retransformación de una o más bandas de frecuencia procesadas y la superposición con la sección seleccionada no procesada de la señal de audio de entrada (102).
14. Aparato (100) según la reivindicación 1, en el que el medio de mezclado ascendente de señal de sección (130) está configurado para determinar las porciones de señal de una o más partículas de sonido (122) que representan fuentes únicas en diferentes canales de la señal de audio multicanal (142) mediante un método de panoramización de amplitud basado en un parámetro de posición para la una o más partículas de sonido (122).
15. Aparato (100) según la reivindicación 1, en el que el selector de sección (120) está configurado para separar una partícula de sonido (122) en la selección de la sección de la señal de audio de entrada (104), representando la partícula de sonido (122) una fuente simple.
16. Aparato (100) según la reivindicación 1, en el que el selector de sección (120) está configurado para obtener la sección seleccionada de la señal de audio de entrada (102) cortando una sección de una forma de onda de la representación en el dominio del tiempo de la sección identificada de la señal de audio de entrada (102) o seleccionando, opcionalmente procesando, y retransformando bloques individuales o un grupo de bloques desde un dominio de la frecuencia del tiempo hasta un dominio del tiempo, o marcando bloques en un dominio del tiempo o en un dominio de la frecuencia.
17. Método (1000) para generar una señal de audio multicanal (142) basada en una señal de audio de entrada (102), comprendiendo el método:
proporcionar (1010) una señal de audio multicanal principal (112) basada en la señal de audio de entrada (102);
seleccionar (1020) una sección de la señal de audio de entrada basada en un análisis de la señal de audio de entrada (102) para obtener una sección seleccionada de la señal de audio de entrada (102), en el que la sección seleccionada de la señal de audio de entrada (102), una sección seleccionada procesada de la señal de audio de entrada, o una señal de referencia asociada a la sección seleccionada de la señal de audio de entrada (102) y que sustituye a la sección seleccionada de la señal de audio de entrada (102) se proporciona como una señal de sección (122);
proporcionar (1030) una señal de mezcla ascendente de sección (132) basada en la señal de sección (122); y
superponer (1040) la señal de audio multicanal principal (112) y la señal de mezcla ascendente de sección (132) para obtener la señal de audio multicanal (142),
en el que el método comprende además utilizar una memoria de señal de sección (920) configurada para almacenar la señal de sección (122) o una señal de sección procesada, en el que proporcionar (1030) la señal de mezcla ascendente de sección (132) proporciona un número definido de señales de mezcla ascendente de sección (132) basado en la señal de sección (122) almacenada o en la señal de sección procesada almacenada, en el que el número definido de señales de mezcla ascendente de sección (132) se determina mediante un parámetro de densidad,
o
en el que el método (1000) comprende además el uso de un controlador (910) configurado para desactivar la selección (1020), el suministro (1030) de la señal de mezclado ascendente de sección o la superposición (1040), de modo que la señal de audio multicanal (142) sea igual a la señal de audio multicanal principal (112), en el que el controlador (910) está controlado por un parámetro de control (912) contenido en la señal de audio de entrada (102) o está controlado por una interfaz de usuario.
Método (1000) según la reivindicación 17, que comprende realizar el análisis de la señal de audio de entrada (102) con el fin de identificar una sección de la señal de audio de entrada (102) que va a seleccionarse basándose en un parámetro de identificación contenido en la señal de audio de entrada (102), una comparación de la señal de audio de entrada (102) con una señal de referencia, un análisis de frecuencia de la señal de audio de entrada (102), una identificación de una señal de tipo ambiente en la señal de audio de entrada (102), una detección de aplausos o una detección de lluvia.
Método (1000) según la reivindicación 17, en el que la selección obtiene una sección seleccionada de la señal de audio de entrada (102) cortando una sección de una forma de onda de la representación en el dominio del tiempo de la sección identificada de la señal de audio de entrada (102) o seleccionando, opcionalmente procesando, y retransformando bloques individuales o un grupo de bloques desde un dominio de la frecuencia del tiempo hasta un dominio del tiempo, o marcando bloques en un dominio del tiempo o en un dominio de la frecuencia.
Método (1000) según la reivindicación 17, en el que la señal de mezcla ascendente de sección (132) contiene una o más partículas de sonido (122), en el que una partícula de sonido (122) representa una fuente de sonido simple, en el que el suministro de la señal de mezcla ascendente de sección (132) se realiza basándose en un parámetro de posición, en el que una porción de la señal de audio multicanal (142) que se basa en la señal de sección (122), para cada canal de la señal de audio multicanal (142) se basa en el parámetro de posición, en el que el parámetro de posición indica en qué posición un oyente escuchará una partícula de sonido específica (122) de la una o más partículas de sonido (122).
Programa informático con un código de programa para realizar el método según la reivindicación 17, cuando el programa informático se ejecuta en un ordenador o en un microcontrolador.
ES08875078T 2008-12-11 2008-12-11 Aparato para generar una señal de audio multicanal Active ES2875416T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2008/010553 WO2010066271A1 (en) 2008-12-11 2008-12-11 Apparatus for generating a multi-channel audio signal

Publications (1)

Publication Number Publication Date
ES2875416T3 true ES2875416T3 (es) 2021-11-10

Family

ID=41076767

Family Applications (1)

Application Number Title Priority Date Filing Date
ES08875078T Active ES2875416T3 (es) 2008-12-11 2008-12-11 Aparato para generar una señal de audio multicanal

Country Status (12)

Country Link
US (1) US8781133B2 (es)
EP (1) EP2359608B1 (es)
JP (1) JP5237463B2 (es)
KR (1) KR101271972B1 (es)
CN (1) CN102246543B (es)
AU (1) AU2008365129B2 (es)
BR (1) BRPI0823033B1 (es)
CA (1) CA2746507C (es)
ES (1) ES2875416T3 (es)
MX (1) MX2011006186A (es)
RU (1) RU2498526C2 (es)
WO (1) WO2010066271A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2360681A1 (en) * 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
CN103135147B (zh) * 2013-01-23 2015-07-29 江汉大学 一种识别雨滴谱的方法及装置
CN105612767B (zh) * 2013-10-03 2017-09-22 杜比实验室特许公司 音频处理方法和音频处理设备
KR102231755B1 (ko) * 2013-10-25 2021-03-24 삼성전자주식회사 입체 음향 재생 방법 및 장치
EP2892250A1 (en) 2014-01-07 2015-07-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of audio channels
CN113611064A (zh) * 2021-08-10 2021-11-05 厦门市弘威崇安科技有限公司 一种无人值守的震动-磁-声传感器节点

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870480A (en) 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
AU2000226583A1 (en) 2000-02-18 2001-08-27 Bang And Olufsen A/S Multi-channel sound reproduction system for stereophonic signals
JP2004517538A (ja) 2000-12-22 2004-06-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多チャネル・オーディオ変換器
US7257231B1 (en) * 2002-06-04 2007-08-14 Creative Technology Ltd. Stream segregation for stereo signals
US6937737B2 (en) 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
US7412380B1 (en) * 2003-12-17 2008-08-12 Creative Technology Ltd. Ambience extraction and modification for enhancement and upmix of audio signals
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
MX2007005262A (es) 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y decodificacion de senales de audio de varios canales.
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
JP5222279B2 (ja) * 2006-03-28 2013-06-26 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチチャネルオーディオ再構成における信号整形のための改善された方法
DE102006017280A1 (de) * 2006-04-12 2007-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals
US9014377B2 (en) * 2006-05-17 2015-04-21 Creative Technology Ltd Multichannel surround format conversion and generalized upmix
US8345899B2 (en) * 2006-05-17 2013-01-01 Creative Technology Ltd Phase-amplitude matrixed surround decoder
WO2008046530A2 (en) * 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
KR20080058871A (ko) * 2006-12-22 2008-06-26 에스케이텔레시스 주식회사 채널 모델링 방법 및 장치
KR20080082916A (ko) * 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal

Also Published As

Publication number Publication date
BRPI0823033A2 (pt) 2015-07-28
AU2008365129A1 (en) 2011-07-07
EP2359608A1 (en) 2011-08-24
BRPI0823033B1 (pt) 2020-12-29
CN102246543A (zh) 2011-11-16
KR20110102446A (ko) 2011-09-16
US20110261967A1 (en) 2011-10-27
CA2746507A1 (en) 2010-06-17
CN102246543B (zh) 2014-06-18
KR101271972B1 (ko) 2013-06-10
MX2011006186A (es) 2011-08-04
RU2498526C2 (ru) 2013-11-10
US8781133B2 (en) 2014-07-15
AU2008365129B2 (en) 2013-09-12
RU2011126333A (ru) 2013-01-10
EP2359608B1 (en) 2021-05-05
WO2010066271A1 (en) 2010-06-17
WO2010066271A8 (en) 2011-07-21
CA2746507C (en) 2015-07-14
JP2012511845A (ja) 2012-05-24
JP5237463B2 (ja) 2013-07-17

Similar Documents

Publication Publication Date Title
JP6804495B2 (ja) 空間的に拡散したまたは大きなオーディオ・オブジェクトの処理
JP7033170B2 (ja) 適応オーディオ・コンテンツのためのハイブリッドの優先度に基づくレンダリング・システムおよび方法
ES2545220T3 (es) Un aparato para determinar una señal de audio de multi-canal de salida espacial
ES2871224T3 (es) Sistema y método para la generación, codificación e interpretación informática (o renderización) de señales de audio adaptativo
KR102294767B1 (ko) 고채널 카운트 멀티채널 오디오에 대한 멀티플렛 기반 매트릭스 믹싱
US9299353B2 (en) Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
ES2875416T3 (es) Aparato para generar una señal de audio multicanal
US20060165247A1 (en) Ambient and direct surround sound system
BR112015028337B1 (pt) Aparelho de processamento de áudio e método
CN104054126A (zh) 空间音频渲染和编码
Bates The composition and performance of spatial music
WO2012163445A1 (en) Method for generating a surround audio signal from a mono/stereo audio signal
Fellgett Ambisonic reproduction of directionality in surround-sound systems
Rumsey Surround Sound 1
JP5743003B2 (ja) 波面合成信号変換装置および波面合成信号変換方法
Griesinger Surround: The current technological situation
RU2820838C2 (ru) Система, способ и постоянный машиночитаемый носитель данных для генерирования, кодирования и представления данных адаптивного звукового сигнала
CN117119369A (zh) 音频生成方法、计算机设备和计算机可读存储介质
KR20110102708A (ko) 오디오 업믹싱 장치 및 방법
KR20110102719A (ko) 오디오 업믹싱 장치 및 방법