ES2434995T3

ES2434995T3 - Sistema de micrófonos de conferencias

Info

Publication number: ES2434995T3
Application number: ES09779010T
Authority: ES
Inventors: Morgan KJØLERBAKKEN
Original assignee: SquareHead Tech AS
Current assignee: SquareHead Tech AS
Priority date: 2009-02-03
Filing date: 2009-02-03
Publication date: 2013-12-18
Anticipated expiration: 2029-02-03
Also published as: CN102308597A; PL2394444T3; DK2394444T3; CN102308597B; EA201190153A1; WO2010088952A1; EP2394444B1; EP2394444A1

Abstract

Método para controlar la salida de audio selectiva de sonido capturado, desde cualquier ubicación en unaaudiencia (50), por medio de un sistema que comprende por lo menos un conjunto de micrófonos (100) ubicado porencima o delante de dicha audiencia (50), estando por lo menos una cámara (150) enfocada a la audiencia (50), yllevando a cabo el método las siguientes etapas en un dispositivo de procesado de señales (200): - recibir una imagen general (250) de la audiencia (50) desde dicha cámara (150), y sonido desde dichaaudiencia (50) por medio de dicho conjunto de micrófonos (100); - presentar dicha imagen general (250) de la audiencia (50) junto con unos objetos de control (300) en undispositivo de visualización (350) que puede detectar la presencia y ubicación de una entrada táctil en unaubicación x,y dentro del área del dispositivo de visualización (350); - recibir unas entrada(s) táctil(es) en una o más ubicación(es) x,y en dicho dispositivo de visualización (350),que ordenan la ejecución de una acción específica en una ubicación(es) correspondiente(s) en la audiencia(50), y - aplicar un procesado de la señal en dicho dispositivo de procesado de señales (200) para llevar a cabo dichaacción controlando la orientación, la focalización y el nivel de sonido correspondiente al sonido provenientede los micrófonos de dicho conjunto de micrófonos (100), controlando de este modo uno o más micrófonosvirtuales en una o más ubicación(es) de la audiencia (50), correspondiéndose dicha(s) ubicación(es) con la(s)ubicación(es) de entrada en el dispositivo de visualización (350).

Description

Sistema de micrófonos de conferencias

Campo técnico

5 La presente invención se refiere al control direccional de sonido grabado. Más específicamente, la invención se refiere a un método y un sistema para controlar sonido proveniente de una audiencia proporcionando y controlando micrófonos virtuales.

10 Técnica anterior

Cuando tiene lugar una conferencia o una reunión, típicamente uno o más oradores se dirigen a una audiencia con varios participantes situados en un área delante del(de los) orador(es).

15 Cuando uno o más participantes desean decir algo, debe pasarse un micrófono a esa persona para que su voz sea oída por todos los participantes. Este método es engorroso y consume mucho tiempo.

No obstante, existen sistemas que comprenden conjuntos de micrófonos para captar y amplificar sonido proveniente de ubicaciones específicas.

20 La publicación propiedad de los solicitantes PCT/NO2006/000334 describe un método y un sistema para focalizar y orientar digitalmente, de forma direccional, sonido muestreado dentro de un área objetivo con el fin de producir una salida de audio selectiva para acompañar al vídeo. Esto se lleva a cabo mediante la recepción de datos de posición y de focalización desde una o más cámaras que filman un evento, y mediante el uso de estos datos de entrada para

25 generar sonido pertinente al que se da salida junto con la imagen.

Este sistema no resultará práctico para controlar sonido con facilidad, proveniente de una o más ubicaciones específicas en una audiencia. Cuando se está trabajando con una cámara, únicamente se puede señalar una ubicación al mismo tiempo, es decir, la ubicación a la que está apuntando y en la que está haciendo zoom la lente.

30 Además, el uso de este tipo de interfaz cuando el control del sonido es la finalidad principal no se considera cómodo para el usuario.

El documento EP-1 578 057 A da a conocer un sistema con un dispositivo de control, software de control y módulos de control de la infraestructura. Los módulos se pueden activar individualmente para controlar terminales extremos

35 multimedia, por ejemplo, proyectores, basándose en el software de control por medio de pantallas táctiles que están conectadas con interfaces serie RS232. Sobre la pantalla táctil se presenta información referente a posibles posiciones predefinidas de participantes.

La presente invención describe un método y un sistema cómodos para el usuario, para controlar uno o más

40 micrófonos “virtuales”. Un micrófono virtual se puede crear llevando a cabo un procesado de DSP (Procesador de señal digital) simultáneo de las señales provenientes de una combinación de los elementos individuales del conjunto de micrófonos. Esto se describe adicionalmente en la publicación antes citada.

El problema a solucionar por la presente invención se puede considerar que consiste en cómo proporcionar un 45 método y un sistema para un acceso y control sencillos de micrófonos virtuales.

Según la invención, este problema se ha solucionado proporcionando un dispositivo de visualización sensible al tacto, que muestra una imagen general de la audiencia, y usando este dispositivo de visualización para controlar uno

o más micrófonos virtuales. 50

Sumario

La presente invención comprende un método para controlar la salida de audio selectiva de sonidos capturados, desde cualquier ubicación en una audiencia, por medio de un sistema que comprende por lo menos un conjunto de 55 micrófonos ubicado por encima o delante de dicha audiencia, estando por lo menos una cámara enfocada a la audiencia. El método comprende las siguientes etapas llevadas a cabo en un dispositivo de procesado de señales:

-: recibir una imagen general de la audiencia desde dicha cámara, y sonido desde dicha audiencia por medio de

dicho conjunto de micrófonos; 60

-: presentar dicha imagen general de la audiencia junto con objetos de control sobre un dispositivo de visualización que puede detectar la presencia y ubicación de una entrada táctil en una ubicación (x, y) dentro del área del dispositivo de visualización;

-: recibir entrada(s) táctil(es) en una o más ubicación(es) (x, y) en dicho dispositivo de visualización, ordenando la ejecución de una acción específica en una ubicación(es) correspondiente(s) de la audiencia, y

-: aplicar un procesado de la señal en dicho dispositivo de procesado de señales para llevar a cabo dicha acción controlando la orientación, la focalización y el nivel de sonido correspondiente al sonido proveniente de los micrófonos de dicho conjunto de micrófonos, de manera que se controlan así uno o más micrófonos virtuales en una o más ubicación(es) de la audiencia, correspondiéndose dicha(s) ubicación(es) con la(s) ubicación(es) de entrada en el dispositivo de visualización.

La invención se describe también mediante un dispositivo de procesado y un sistema para llevar a cabo el mismo. Esto se define adicionalmente en las reivindicaciones principales.

En las reivindicaciones dependientes adjuntas se definen otras características.

Descripción detallada

A continuación se describirá detalladamente la invención en referencia a los dibujos, en donde:

la Fig. 1 muestra el sistema para controlar un conjunto de micrófonos;

la Fig. 2 muestra el dispositivo de visualización para controlar micrófonos virtuales para una audiencia;

la Fig. 3 muestra un sistema para controlar varios conjuntos de micrófonos.

La invención se describe por medio de un sistema para controlar la salida de audio selectiva de sonidos capturados, desde cualquier ubicación en una audiencia.

La Fig. 1 muestra el sistema para controlar un conjunto de micrófonos con el fin de permitir la salida de audio selectiva.

El sistema comprende un dispositivo de procesado 200, por lo menos un conjunto de micrófonos 100 ubicado por encima o delante de la audiencia 50, y por lo menos una cámara 150 enfocada a la audiencia 50, y un dispositivo de visualización 350 que puede detectar la presencia y ubicación de una entrada táctil, usada para controlar uno o más micrófonos virtuales en una o más ubicación(es) de la audiencia 50. Dichas unidades están conectadas entre sí todas ellas, o bien por cable, o bien de forma inalámbrica, o en una combinación de las mismas.

El dispositivo de procesado 200 se usa para controlar la salida de audio selectiva de los sonidos capturados, desde cualquier ubicación en una audiencia 50, y comprende medios para recibir una imagen general 250 de la audiencia 50 desde dicha cámara 150, junto con sonido de dicha audiencia 50 por medio de dicho conjunto de micrófonos 100. La imagen recibida se procesará antes de presentarla en el dispositivo de visualización 350.

El sonido es capturado por una unidad que comprende un conjunto de micrófonos de banda ancha ubicado por encima o delante de la audiencia.

Se pueden usar una o más cámaras 150 para capturar imágenes de la audiencia 50. Una o más cámaras pueden estar integradas en una unidad que comprenda dicho conjunto de micrófonos 100, o las cámaras se pueden posicionar en otras ubicaciones para capturar imágenes de la audiencia 50.

Las cámaras usadas pueden ser tanto videocámaras como cámaras fotográficas, o una combinación de las mismas.

Se obtiene un sistema compacto y robusto para grabar tanto sonido como imagen, integrando la(s) cámara(s) en la unidad que comprende el conjunto de micrófonos 100.

Para capturar todos los participantes en una audiencia con solamente una cámara, la cámara puede estar equipada con una lente de ojo de pez. Se sabe que las imágenes resultantes de una lente de este tipo producirán una distorsión de barril. Esta se corregirá en el dispositivo de procesado 200 antes de que las imágenes no distorsionadas resultantes se presenten en el dispositivo de visualización 350.

Para audiencias mayores, se pueden usar dos o más conjuntos de micrófonos 100 ubicados en ubicaciones diferentes por encima o delante de la audiencia 50. Esta configuración se describirá de forma más detallada posteriormente.

A continuación se describirá el control del sistema. El dispositivo de procesado 200 coordinará y controlará la salida de audio selectiva de sonidos capturados desde cualquier ubicación de una audiencia 50. Aunque según la invención pueden usarse más de una cámara 150 y un conjunto de micrófonos 100, en la descripción sucesiva del dispositivo de procesado 200 se incluirán, para simplificar, únicamente una cámara y un conjunto de micrófonos.

El dispositivo de procesado 200 comprende medios para recibir una imagen general 250 de la audiencia 50 desde una cámara 150, junto con sonido de una audiencia 50 por medio de un conjunto de micrófonos 100.

A continuación, el dispositivo de procesado 200 procesará la imagen dándole unas dimensiones tales que encaje en el dispositivo de visualización 350, eliminando artefactos, fondos y distorsiones no deseados antes de presentar la imagen sobre el dispositivo de visualización 350 como una imagen general 250 de la audiencia 50 junto con objetos de control 300.

Usando un dispositivo de visualización 350 que puede detectar la presencia y la ubicación de una entrada táctil en una ubicación (x, y) dentro del área del dispositivo de visualización 350, es posible controlar el procesado de la señal correspondiente a las señales de cada micrófono del conjunto de micrófonos 100. Este procesado de señales se lleva a cabo en el dispositivo de procesado 200.

El dispositivo de procesado 200 comprende medios para detectar una entrada(s) táctil(es) en una o más ubicación(es) (x, y) sobre dicho dispositivo de visualización 350, que le ordenan que lleve a cabo una acción específica en la(s) ubicación(es) correspondiente(s) de la audiencia 50.

La acción específica a llevar a cabo dependerá de la naturaleza de la(s) entrada(s) táctil(es) específica(es), y de la(s) ubicación(es) (x, y) sobre el dispositivo de visualización 350.

Basándose en esto, el dispositivo de procesado 200 llevará a cabo el procesado necesario de la señal para controlar la orientación, la focalización y el nivel de sonido correspondiente al sonido proveniente de los micrófonos de dicho conjunto de micrófonos 100, controlando así uno o más micrófonos virtuales en una o más ubicación(es) en la audiencia 50. Este procesado de la señal se describe en dicho documento PCT/NO2006/000334.

El control de la orientación y la focalización en una o más ubicaciones específicas de la audiencia 50 se realiza implementando un posicionamiento tridimensional (x, y, z) de una o más ubicaciones con respecto al conjunto de micrófonos 100. Z se calcula por medio del dispositivo de procesado 200 a partir de la ubicación (x, y) dentro de la audiencia y de la altura y el posible ángulo de inclinación conocidos del conjunto de micrófonos 100 por encima o delante de la audiencia 50.

El dispositivo de procesado 200 comprende también medios para ajustar aspectos geométricos que influyen en la propagación del sonido y la acústica de la sala en la que está ubicada la audiencia 50. Comprende también medios para ajustar la distorsión de barril producida por una lente de ojo de pez usada en una cámara 150.

El dispositivo de procesado 200 puede ser una unidad autónoma conectada a dicho dispositivo de visualización 350 y al conjunto de micrófonos 100. También puede ser una unidad integrada en dicho dispositivo de visualización 350 ó en el conjunto de micrófonos 100.

La Figura 2 muestra el dispositivo de visualización para controlar micrófonos virtuales para una audiencia. A la persona que controla el dispositivo de visualización 350 se le presentará una imagen general 250 de la audiencia 50 junto con objetos de control 300 sobre un dispositivo de visualización 350. Se proporcionará una entrada u orden tocando el dispositivo de visualización 350 en una o más ubicación(es) (x, y). Esto dará como resultado la ejecución de una acción específica en una ubicación(es) correspondiente(s) en la audiencia 50. El dispositivo de procesado 200 ejecutará la orden aplicando un procesado de señales para llevar a cabo la acción de acuerdo con la orden introducida mediante el control de la orientación, la focalización y el nivel de sonido correspondientes al sonido proveniente de los micrófonos de dicho conjunto de micrófonos 100. Esto controlará uno o más micrófonos virtuales en una o más ubicación(es) dentro de la audiencia 50.

Cuando se ejecuta una entrada táctil, es decir, se presiona la pantalla con un dedo o un dispositivo de puntero, en una ubicación sobre dicho dispositivo de visualización 350 que muestra la imagen 250 de la audiencia 50, la focalización en o desde esa ubicación cambiará haciendo que la ubicación sea un área activa 260 en caso de que la misma estuviera en ese momento inactiva, o, por el contrario, inactiva si la misma fuera en ese momento un área activa 260. Cuando un área del dispositivo de visualización 350 es un área activa 260, esto se indicará sobre el dispositivo de visualización 350, y el dispositivo de procesado 200 controlará el conjunto de micrófonos 100 para focalizarlos en esa área, proporcionando así un micrófono virtual para el área activa 260. Cuando se presione nuevamente el área activa, la misma se volverá inactiva, eliminando así el micrófono virtual.

Se pueden activar al mismo tiempo más de un área de la audiencia 50, proporcionando de este modo más de un micrófono virtual.

Cuando se presiona el objeto de control 300, el dispositivo de procesado 200 controlará el nivel de sonido del micrófono(s) virtual(es) activo(s). Al presionar el signo + se añadirá un área activa 260, y al presionar el – se eliminará un área activa 260.

Un movimiento de presión y arrastre de un área activa 260 trasladará esta área a otra ubicación sobre dicho dispositivo de visualización 350. Esto provocará que el dispositivo de procesado de señales 200 cambie la orientación y la focalización del sonido desde una ubicación correspondiente dentro de la audiencia a otra, dando como resultado un efecto de fundido.

5 La Figura 3 muestra un sistema para controlar varios conjuntos de micrófonos. En esta implementación de la invención, el sistema comprende dos o más conjuntos de micrófonos 100 ubicados en ubicaciones diferentes por encima o delante de la audiencia 50. Los mismos están conectados todos ellos al dispositivo de procesado 200.

10 La Figura 3A muestra una audiencia 50 cubierta por cuatro conjuntos de micrófonos 100 con cámaras integradas

150.

En este caso, el dispositivo de procesado 200 comprenderá medios para recibir señales de sonido desde varios conjuntos de micrófonos 100, concretamente cuatro, junto con imágenes de las cámaras 50, con el fin de presentar 15 imágenes procesadas de las cámaras sobre el dispositivo de visualización 350 junto con dicho objeto de control 300.

Las diferentes cámaras 150 y conjuntos de micrófonos 100 cubrirán, cada uno de ellos, diferentes áreas de una audiencia 50. A continuación estas áreas se presentarán sobre el dispositivo de visualización 350.

20 La Figura 3B muestra una primera forma de presentar la audiencia. Muestra que un área focalizada está visualizada en un tamaño mayor que las otras áreas. La ejecución de una entrada táctil sobre una de las áreas más pequeñas cambiará la focalización a esa área para controlar los micrófonos virtuales.

La Figura 3C muestra una segunda forma de presentar la audiencia. Todas las áreas se presentan con las mismas

25 dimensiones sobre el dispositivo de visualización 350. Esto permitirá el control sencillo del sonido proveniente de un micrófono virtual desde una primera ubicación en un área a una segunda ubicación en otra área ejecutando una acción de toque y arrastre.

La Figura 3D muestra la totalidad de las cuatro áreas de la fig. 3A, cubiertas por los diferentes conjuntos de

30 micrófonos y cámaras, en forma de una imagen de área total resultante que cubre la audiencia 50. Esto se obtiene en el dispositivo de procesado 200 procesando las imágenes mediante la unión entre sí sin costuras de las imágenes 250 de cada área.

Claims

REIVINDICACIONES

1. Método para controlar la salida de audio selectiva de sonido capturado, desde cualquier ubicación en una audiencia (50), por medio de un sistema que comprende por lo menos un conjunto de micrófonos (100) ubicado por encima o delante de dicha audiencia (50), estando por lo menos una cámara (150) enfocada a la audiencia (50), y llevando a cabo el método las siguientes etapas en un dispositivo de procesado de señales (200):

-

recibir una imagen general (250) de la audiencia (50) desde dicha cámara (150), y sonido desde dicha audiencia (50) por medio de dicho conjunto de micrófonos (100);

-

presentar dicha imagen general (250) de la audiencia (50) junto con unos objetos de control (300) en un dispositivo de visualización (350) que puede detectar la presencia y ubicación de una entrada táctil en una ubicación x,y dentro del área del dispositivo de visualización (350);

-

recibir unas entrada(s) táctil(es) en una o más ubicación(es) x,y en dicho dispositivo de visualización (350), que ordenan la ejecución de una acción específica en una ubicación(es) correspondiente(s) en la audiencia (50), y

-

aplicar un procesado de la señal en dicho dispositivo de procesado de señales (200) para llevar a cabo dicha acción controlando la orientación, la focalización y el nivel de sonido correspondiente al sonido proveniente de los micrófonos de dicho conjunto de micrófonos (100), controlando de este modo uno o más micrófonos virtuales en una o más ubicación(es) de la audiencia (50), correspondiéndose dicha(s) ubicación(es) con la(s) ubicación(es) de entrada en el dispositivo de visualización (350).
2. Método según la reivindicación 1, caracterizado porque la recepción de una entrada táctil en una ubicación sobre dicho dispositivo de visualización (350) que muestra la imagen (250) de la audiencia (50) cambiará la focalización a

o desde esa ubicación, haciendo que la ubicación sea un área activa (260) en caso de que la misma estuviera en ese momento inactiva, o un área inactiva (260) en caso de que fuera en ese momento un área activa (260), y siendo un área activa (260) un área (260) provista de un micrófono virtual, y no estando un área inactiva provista de ningún micrófono virtual.
3.

Método según la reivindicación 1 y 2, caracterizado porque la recepción de una entrada táctil en una ubicación en dicho dispositivo de visualización (350) que muestra un objeto de control (300), ejercerá un control sobre el nivel de sonido de micrófono(s) virtual(es) activo(s), y añadirá o eliminará micrófonos virtuales.
4.

Método según la reivindicación 1, caracterizado porque la recepción de una entrada táctil en una ubicación x,y en dicho dispositivo de visualización (350), seguida por un movimiento de arrastre a otra ubicación sobre dicho dispositivo de visualización (350), provocará que el dispositivo de procesado de señales (200) cambie la orientación y la focalización del sonido desde una ubicación correspondiente en la audiencia a otra.
5.

Método según la reivindicación 1, caracterizado porque la orientación y focalización en una o más ubicaciones específicas en la audiencia (50) se lleva a cabo implementando un posicionamiento tridimensional para una o más ubicaciones con respecto al conjunto de micrófonos (100), siendo la focalización calculada a partir de dicha ubicación x,y y de la altura y el posible ángulo de inclinación conocidos del conjunto de micrófonos (100) por encima

o delante de la audiencia (50).
6.

Método según la reivindicación 5, caracterizado porque el procesado de señales que incluye el posicionamiento tridimensional incluye también ajustar los aspectos geométricos de la sala que influyen en la propagación del sonido en la sala en la que está ubicada la audiencia (50).
7.

Método según la reivindicación 1, caracterizado porque el método comprende el uso de varias cámaras (150) y conjuntos de micrófonos (100) que cubren, cada uno de ellas, áreas diferentes de una audiencia (50), en donde estas áreas son presentadas en el dispositivo de visualización (350), estando visualizada en un tamaño mayor que las otras un área focalizada, y en donde una entrada táctil sobre una de las áreas más pequeñas cambiará la focalización hacia esa área para controlar los micrófonos virtuales.
8.

Método según la reivindicación 1 y 4, caracterizado porque el método comprende el uso de varias cámaras (150) y conjuntos de micrófonos (100) que cubren, cada uno de ellos, áreas diferentes de una audiencia (50), y siendo estas áreas presentadas con las mismas dimensiones en el dispositivo de visualización (350), permitiendo así el control del sonido de los micrófonos virtuales desde una primera ubicación en un área o una segunda ubicación en otra área, llevando a cabo una acción de toque y arrastre.
9.

Método según la reivindicación 1 y 8, caracterizado porque el método comprende el uso de varias cámaras (150) y conjuntos de micrófonos (100) que cubren, cada uno de ellos, áreas diferentes de una audiencia (50), y siendo estas áreas presentadas en el dispositivo de visualización (350) en forma de un área total que cubre la audiencia

(50) mediante la unión entre sí sin costuras de las imágenes (250) de cada área.
10. Dispositivo de procesado (200) para controlar la salida de audio selectiva de sonidos capturados, desde cualquier ubicación en una audiencia (50), por medio de un sistema que comprende por lo menos un conjunto de micrófonos (100) ubicado por encima o delante de la audiencia (50), estando por lo menos una cámara (150) enfocada a la audiencia (50), comprendiendo el dispositivo de procesado (200):

-

unos medios para recibir una imagen general (250) de la audiencia (50) desde la cámara (150), y sonido de dicha audiencia (50) desde el conjunto de micrófonos (100);

-

unos medios para presentar dicha imagen general (250) de la audiencia (50) junto con objetos de control

(300) en un dispositivo de visualización (350) para detectar la presencia y ubicación de una entrada táctil en una ubicación x,y dentro del área del dispositivo de visualización (350);

-

unos medios para recibir una o más ubicación(es) x,y de entrada(s) táctil(es) en dicho dispositivo de visualización (350), que ordenan al dispositivo de procesado de señales (200) que ejecute una acción específica en una ubicación(es) correspondiente(s) dentro de la audiencia (50), y

-

unos medios para llevar a cabo dicha acción específica controlando la orientación, la focalización y el nivel de sonido correspondiente al sonido proveniente de los micrófonos de dicho conjunto de micrófonos (100), controlando de este modo uno o más micrófonos virtuales en una o más ubicación(es) dentro de la audiencia (50), correspondiéndose dicha(s) ubicación(es) con la(s) ubicación(es) de entrada en el dispositivo de visualización (350).
11. Dispositivo de procesado (200) según la reivindicación 10, caracterizado porque el dispositivo de procesado

(200)

para controlar la orientación y la focalización en una o más ubicaciones específicas dentro de la audiencia (50) comprende unos medios para implementar un posicionamiento tridimensional de una o más ubicaciones con respecto al conjunto de micrófonos (100), siendo la focalización calculada por medio del dispositivo de procesado

(200)

a partir de dicha ubicación x,y y de la altura y el posible ángulo de inclinación conocidos del conjunto de micrófonos (100) por encima o delante de la audiencia (50).
12.

Dispositivo de procesado (200) según la reivindicación 10, caracterizado porque comprende unos medios para ajustar aspectos geométricos de la sala que influyen en la propagación del sonido en la sala en la que está ubicada la audiencia (50).
13.

Dispositivo de procesado (200) según la reivindicación 10, caracterizado porque comprende unos medios para ajustar la distorsión de barril producida por una lente de ojo de pez usada en dicha cámara (150) con el fin de presentar una imagen no distorsionada en el dispositivo de visualización (350).
14.

Dispositivo de procesado (200) según la reivindicación 10, caracterizado porque comprende unos medios para recibir señales de sonido desde dos o más conjuntos de micrófonos (100) e imágenes desde dos o más cámaras

(50) para presentar las imágenes de las cámaras en dicho dispositivo de visualización (350) junto con dichos objetos de control (300).
15.

Dispositivo de procesado (200) según la reivindicación 10, caracterizado porque está integrado en dicho dispositivo de visualización (350).
16.

Dispositivo de procesado (200) según la reivindicación 10, caracterizado porque está integrado en dicho conjunto de micrófonos (100).
17.

Dispositivo de procesado (200) según la reivindicación 10, caracterizado porque es una unidad autónoma conectada a dicho dispositivo de visualización (350) y al conjunto de micrófonos (100).
18.

Sistema para controlar la salida de audio selectiva de sonidos capturados, de cualquier ubicación dentro de una audiencia (50), caracterizado porque comprende un dispositivo de procesado (200) según la reivindicación 10, por lo menos un conjunto de micrófonos (100) ubicado por encima o delante de la audiencia (50), y por lo menos una cámara (150) enfocada a la audiencia (50), y un dispositivo de visualización (350) que puede detectar la presencia y la ubicación de una entrada táctil, usada para controlar uno o más micrófonos virtuales en una o más ubicación(es) en la audiencia (50).
19.

Sistema según la reivindicación 18, caracterizado porque dicha cámara (150) está integrada en una unidad con dicho conjunto de micrófonos (100).
20.

Sistema según la reivindicación 18, caracterizado porque comprende dos o más conjuntos de micrófonos (100) ubicados en ubicaciones diferentes por encima o delante de la audiencia (50), y conectados a dicho dispositivo de procesado (200).