ES2292441T3 - Metodo y aparato para determinar una fuente de sonido. - Google Patents

Metodo y aparato para determinar una fuente de sonido. Download PDF

Info

Publication number
ES2292441T3
ES2292441T3 ES00935570T ES00935570T ES2292441T3 ES 2292441 T3 ES2292441 T3 ES 2292441T3 ES 00935570 T ES00935570 T ES 00935570T ES 00935570 T ES00935570 T ES 00935570T ES 2292441 T3 ES2292441 T3 ES 2292441T3
Authority
ES
Spain
Prior art keywords
sound
mentioned
aforementioned
information
stage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES00935570T
Other languages
English (en)
Inventor
Hiroshi Okuno
Hiroaki Kitano
Yukiko Nakagawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Application granted granted Critical
Publication of ES2292441T3 publication Critical patent/ES2292441T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Aparato para detectar una fuente de sonido (A, B, C), que comprende: un medio de recogida de sonido (11) que incluye un par de micrófonos de recogida de sonido (11a, 11b) yuxtapuestos entre sí a través de una separación preseleccionada (D) y opuestos a la fuente de sonido (A, B, C); un medio de representación por imágenes (12) que está adaptado para representar consecutivamente por imágenes, un objeto que puede ser la mencionada fuente de sonido (A, B, C); un medio de procesamiento de sonido (14) para determinar una dirección de la mencionada fuente de sonido (A, B, C); un medio de procesamiento de imágenes (13) para determinar una dirección del mencionado objeto que posiblemente es la mencionada fuente de sonido (A, B, C), a partir de información de imágenes gráficas representada por el mencionado medio de representación por imágenes (12); y un medio de control (15) para controlar el funcionamiento del mencionado medio de recogida de sonido (11), del mencionado medio de representación por imágenes (12), del mencionado medio de procesamiento de imagen (13) y del mencionado medio de procesamiento de sonido (14).

Description

Método y aparato para determinar una fuente de sonido.
Campo técnico
La presente invención trata de un aparato que identifica una fuente de sonido, y de un método para identificar de forma individual diversos sonidos, basándose en información de imagen e información de sonido derivada de una pluralidad de tales fuentes de sonido.
Arte previo
Hasta ahora se ha llevado a cabo investigaciones para resolver, a partir de sonidos mezclados, un sonido concreto tal como una voz o un sonido musical, incluido en las fuentes mezcladas. Por ejemplo, se conoce un sistema de reconocimiento de sonido que asume que su sonido de entrada es un discurso, o bien voces. Y, en la medida en la en que hay involucrados imágenes o procesamiento de imágenes, se conoce un sistema que, en la determinación de un objeto toma conocimiento de su color, su forma y/o su movimiento con el propósito de caracterizarlo.
Un sistema de reconocimiento de sonido, que asocia el reconocimiento de sonido con procesamiento de imágenes, se conoce a partir del documento JP 11 018 194 y su traducción US 6 317 501, o partir del documento WO 79 43 856. Por otra parte el sistema asume que el discurso, o las voces, se llevan a cabo sólo cuando el micrófono está cerca de la boca, o cuando no hay otra fuente de sonido.
Además si bien se propone un sistema para diferenciar, en base a una estructura armónica, una señal de sonido concreta entre una pluralidad de fuentes de sonido, y para después encontrar la dirección en la que está localizada su fuente de sonido, la precisión con la que de ese modo puede hallarse la dirección de la fuente de sonido, es tan imprecisa como de \pm 10º, y no es posible resolver la fuente de sonido si esta queda próxima a una o varias fuentes de sonido adyacentes.
También se ha propuesto un método que utilice una pluralidad de micrófonos de recogida de sonido, en número igual al de fuentes de sonido, y que en base a la información de sonido procedente de los diversos micrófonos de recogida de sonido, identifique una fuente de sonido concreta. Si bien este método está diseñado para identificar la intensidad del sonido y la posición de su fuente, es un hecho que su información de frecuencia se dispersa en torno al eje que define la dirección en la que está localizada la fuente de sonido, dificultando de ese modo una identificación precisa de la fuente de sonido. Además, si bien este método hace posible incrementar la velocidad de reconocimiento de una fuente de sonido, el requisito de disponer micrófonos de recogida de sonido en número idéntico a las fuentes de sonido que existen independientes unas de las otras, hace el método costoso.
Dirigida a evitar las dificultades implicadas en el arte previo según han sido descritas arriba, la presente invención tiene como primer objetivo proporcionar un aparato de identificación de fuente de sonido, que sea capaz de identificar un objeto como fuente de un sonido, entre sonidos mezclados, en términos de su localización, con mayor precisión, mediante utilizar tanto información sobre el sonido como información sobre la fuente de sonido como imagen de este, e información sobre la posición, para resolver con la debida precisión el sonido de entre los sonidos mezclados.
Además, la presente invención tiene como su segundo objetivo el proporcionar un método de identificación de fuente de sonido, que sea capaz de identificar un objeto como una fuente de sonido entre sonidos mezclados, en términos de su posición, con mayor precisión, mediante el uso tanto de información sobre el sonido, como información sobre la fuente de sonido como una imagen de este, e información sobre tal posición, para aislar con la debida precisión el sonido de entre los sonidos mezclados.
Revelación de la invención
Para conseguir el primer objetivo mencionado arriba, de acuerdo con la presente invención se proporciona un aparato de identificación y separación de una fuente de sonido, acorde con la reivindicación 1. Además, el aparato está caracterizado porque la dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido, se determina mediante el mencionado medio de procesamiento, en base a uno o más elementos de entre el color, la forma y la altura de este.
Además, el aparato está caracterizado porque el mencionado medio de detección está adaptado para medir los mencionados objetos que posiblemente son las mencionadas fuentes de sonido, en respuesta al magnetismo de estos.
Además, el aparato está caracterizado porque el mencionado medio de detección está adaptado para medir los mencionados objetos que posiblemente son las mencionadas fuentes de sonido, en respuesta a los rayos infrarrojos que estos emiten.
Además, el aparato está caracterizado porque los mencionados objetos que posiblemente son las mencionadas fuentes de sonido, tienen cada uno un material de conducción magnética unido a sí mismo.
Además, el aparato está caracterizado porque el mencionado medio de procesamiento de imágenes tiene la función de determinar la dirección de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido, en base a un color de un mencionado objeto.
Además, el aparato está caracterizado porque el mencionado medio de procesamiento de imágenes tiene la función de determinar direcciones de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido, en base conjuntamente a un color, una forma y una altura del mencionado objeto.
Con una construcción como la mencionada arriba, el aparato de identificación y resolución de la fuente de sonido, de la presente invención, en la localización de las fuentes de sonido según la información de sonido adquirida desde los micrófonos de recogida de sonido, está diseñado para limitar las direcciones de las fuentes de sonido, en relación con la información de posición basada en la información de representaciones de la imagen, representadas por los medios de representación de imágenes, y la información sobre las direcciones adquirida por los medios de detección. Por consiguiente, el aparato de identificación y resolución de una fuente de sonido de la presente invención, está construido de modo que es capaz de especificar los objetos que pueden ser las fuentes de sonido, mediante el uso de imágenes gráficas y de información direccional de los objetos y para, al mismo tiempo, resolver individualmente y de forma fiable las fuentes de sonido, mediante utilizar la información de su posición y la información de su sonido.
Para conseguir el segundo objetivo mencionado arriba, de acuerdo con la presente invención se proporciona además un método de identificación y resolución de una fuente de sonido, acorde con la reivindicación 8.
Además, el método está caracterizado porque la dirección de cada uno, de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido, está determinada por el mencionado medio de procesamiento de imágenes, en base a uno o más de entre un color, una forma y una altura de este.
Además, el método está caracterizado porque la detección de la dirección mediante el mencionado medio de detección, se lleva a cabo en respuesta a un rayo de infrarrojos.
Además, el método está caracterizado porque la detección de la dirección mediante el mencionado medio de detección, se lleva a cabo en respuesta a magnetismo.
Además, el método está caracterizado porque la dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido, se determina mediante el mencionado medio de procesamiento de imágenes, en base a un color de estos.
Además, el método está caracterizado porque la dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido, se determina mediante el mencionado medio de procesamiento de imágenes, en base a una forma de estos.
Además, el método está caracterizado por la dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido, se determina mediante el mencionado medio de procesamiento de imágenes, en base a un color, una forma y una altura de este.
Además, el método está caracterizado porque la determinación de la dirección de cada uno de la totalidad de las mencionadas fuentes de sonido, mediante el mencionado medio de procesamiento de sonido, en base a la información de sonido para una diferencia entre fases y una diferencia entre intensidades, se lleva a cabo mediante determinar una posición de cada una de las mencionadas fuentes, en base una señal de cada una de las bandas de frecuencia en las que se divide arbitrariamente.
Además, el método está caracterizado porque la mencionada información de posición de un mencionado objeto que posiblemente es una mencionada fuente de sonido, está derivada de un movimiento del mencionado objeto.
Organizado como se ha mencionado arriba, el método de identificación de la fuente de sonido, acorde con la presente invención, permite no sólo que se derive la información de sonido de una pluralidad de fuentes de sonido, a partir de un medio de recogida de sonido fabricado a partir de dos micrófonos de recogida de sonido opuestos a las fuentes de sonido, sino que además la información de imagen de estas fuentes de sonido se deriva a partir de imágenes gráficas de esta, realizadas por un medio de representación de imágenes. Además, la detección de las direcciones de las fuentes de sonido mediante magnetismo o por rayos infrarrojos, da lugar a información para la detección de la dirección. Y cuando el medio de procesamiento de sonido está localizando las localizaciones de las fuentes de sonido, en base a la información de sonido, por ejemplo en base una diferencia entre fases y una diferencia entre intensidades, en la información de sonido adquirida por los micrófonos de recogida de sonido para cada una de las fuentes de sonido, la dirección de cada una de las fuentes de sonido se reduce con referencia a la información de posición derivada para cada uno de los objetos que posiblemente son las fuentes de sonido, mediante el medio de procesamiento de imágenes, por ejemplo partir de su color, su forma y/o su movimiento, en base a cualquiera, o ambos, de la información de detección de la dirección y la información de imagen derivada del medio de formación de imágenes, permitiendo de este modo que las fuentes de sonido sean localizadas en sus posiciones, en base a las señales en diversas bandas de frecuencia, por ejemplo estructuras armónicas. Por consiguiente, el método hace innecesario procesar la información de sonido de forma omnidireccional, o sobre la totalidad de las direcciones, en la identificación de fuentes de sonido, hace posible identificar la fuente de sonido con mayor certeza, hace que sea suficiente una cantidad menor de información procesable, y hace posible reducir el tiempo de procesamiento.
En este caso, la capacidad de identificar tres o más fuentes de sonido con dos micrófonos de recogida de sonido, en el medio de recogida de sonido, hace posible efectuar una identificación precisa de las posiciones de las fuentes de sonido, en una construcción sencilla.
Además, puesto que el método se lleva a cabo como se ha enunciado arriba, estando incluida la tercera etapa de derivación de información sobre localizaciones aproximadas de las fuentes de sonido, sólo a partir de la información de sonido de los sonidos recogidos en la primera etapa, e incluyendo la cuarta etapa limitar por adelantado las direcciones de las fuentes de sonido, en base a la información de posición aproximada derivada de la tercera etapa, derivando de ese modo la información de la posición de los objetos que posiblemente son las fuentes de sonido, se tiene como resultado una reducción en la cantidad de información para el procesamiento, con el propósito de derivar la información de posición de los objetos que posiblemente son las fuentes de sonido, en base a información de imágenes de la tercera etapa, lo que simplifica el procesamiento.
Breve descripción de los dibujos
La presente invención se comprenderá mejor a partir de la siguiente descripción detallada y de los dibujos anexos a esta, que muestran ciertas formas ilustrativas de realizaciones de la presente invención. A este respecto, debe observarse que no se pretende que tales formas de realización ilustradas en los dibujos anexos limiten en modo alguno la presente invención, sino que faciliten una explicación y la comprensión de esta.
En los dibujos:
la figura 1 es una vista diagramática que ilustra la composición de una primera forma de realización del aparato de identificación de una fuente de sonido, acorde con la presente invención;
la figura 2 es una vista diagramática de la representación de una imagen a modo de ejemplo tomada, o creada, por un medio de imágenes gráficas, en el aparato de identificación de fuente de sonido mostrado en la figura 1;
la figura 3 es una vista explicativa para la imagen gráfica del aparato de identificación de la fuente de sonido, de la figura 1, donde (A) muestra las direcciones aproximadas A0, B0 y C0 de las fuentes de sonido determinadas por un medio de procesamiento de sonido, (B) muestra imágenes A1, B1 y C1 de objetos que posiblemente son las fuentes de sonido, determinados por un medio de procesamiento de imágenes, y (C) muestra trozos de la información de posición A3, B3 y C3 de los objetos que posiblemente son las fuentes de sonido, determinados por el medio de procesamiento de imágenes;
la figura 4 es una vista explicativa que ilustra una diferencia en distancia, entre una fuente de sonido y dos micrófonos de recogida de sonido incluidos en un medio de recogida de sonido, en el aparato de identificación de fuentes de sonido de la figura 1;
la figura 5 es un gráfico que ilustra el funcionamiento de un filtro direccional incluido en el medio de procesamiento de sonido, en el aparato de identificación de fuente de sonido de la figura 1;
la figura 6 es un gráfico que ilustra la extracción de dos porciones de información de sonido, para un sonido, a partir de una sola fuente de sonido, llevada a cabo en el medio de procesamiento de sonido que hay en el aparato de identificación de fuente de sonido de la figura 1;
la figura 7 es una vista explicativa, que ilustra la extracción de información de sonido a partir de cada fuente de sonido, llevada a cabo por el filtro direccional en el medio de procesamiento de sonido, en el aparato de identificación de fuente de sonido de la figura 1;
la figura 8 es un diagrama de flujo que ilustra un método de funcionamiento del aparato de identificación de fuente de sonido de la figura 1;
la figura 9 es un diagrama ilustrado, que muestra la parte de imágenes gráficas consecutivas tomadas por el medio de formación de imágenes, en el aparato de identificación de fuente de sonido de la figura 1; y
la figura 10 es un gráfico que ilustra la información relativa a las posiciones determinadas por el medio de procesamiento de imágenes, sobre una variedad de bases de un objeto que puede ser una fuente de sonido, en el aparato de identificación de fuente de sonido de la figura 1.
Mejores modos de llevar a cabo la invención
En lo que sigue se describirá en detalle la presente invención para un método y un aparato de identificación de la fuente de sonido, con respecto a las formas actualmente mejores de realizaciones de estos, ilustradas en los dibujos.
La figura 1 muestra una forma de realización del aparato de identificación de fuente de sonido acorde con la presente invención.
En referencia a la figura 1, el aparato de identificación de fuente de sonido 10 incluye un medio de recogida de sonido 11, un medio de representación por imágenes 12, un medio de procesamiento de imágenes 13, un medio de procesamiento de sonido 14 y un medio de control 15.
El medio de recogida de sonido 11 está diseñado para capturar sonidos a partir una pluralidad de fuentes de sonido, por ejemplo tres hablantes, con un par de micrófonos de recogida de sonido 11a y 11b yuxtapuestos entre sí a través de una separación D preseleccionada como se indica en la figura 1, y opuestos a las fuentes de sonido, y para procesar los sonidos capturados. Si bien la disposición de estos micrófonos de recogida de sonido puede configurarse de cualquier forma adecuada, en el ejemplo mostrado están provistos en lados opuestos del medio de representación por imágenes 12, es decir en sus lados derecho e izquierdo.
El medio de representación por imágenes 12 consta, por ejemplo, de una cámara CCD (charge coupled device, dispositivo acoplado por carga), y está diseñado como se muestra la figura 2, para producir consecutivamente imágenes gráficas de una pluralidad de fuentes de sonido, por ejemplo tres hablantes A, B y C.
El medio de procesamiento de imágenes 13 está diseñado para derivar información sobre las localizaciones de objetos que pueden ser fuentes de sonido, en imágenes tomadas por el medio de representación por imágenes 12, y basándose en su color, su forma o su movimiento. Debe notarse aquí que el término "movimiento" incluye vibraciones.
En este caso, el medio de procesamiento de imagen 13 genera en, y para, la imagen gráfica tomada por el medio de representación por imágenes 12, las imágenes A1, B1 y C1 para los tres hablantes A, B y C de acuerdo con el color (es decir, el color de la piel de un ser humano) y la altura, como se muestra la figura 3(B). Después, como se muestra la figura 3(C), el medio de procesamiento de imágenes 13 selecciona puntos centrales A2, B2 y C2 de estas imágenes A1, B1 y C1 (en la figura 3 indicados mediante marcas "+"), como localizaciones respectivas de los objetos que posiblemente son las fuentes de sonido, y toma sus respectivas coordenadas horizontales A3, B3 y C3 como información de estas posiciones.
En este punto, debe observarse que la razón por la que se utiliza aquí las palabras "objetos" "que pueden ser", "posiblemente son" o "posiblemente como" "fuentes de sonido", es que hasta ahora no ha estado claro necesariamente a partir sólo del reconocimiento de la imagen, si indudablemente son, o no, fuentes de sonido.
Para simplificar el anterior procesamiento de imagen, el medio de procesamiento de imagen 13 previo a este, debe tener introducidas direcciones aproximadas A0, B0 y C0 de estas fuentes de sonido (véase la figura 3(A)), que son determinadas mediante el medio de procesamiento de sonido 14 que se describirá en detalle más abajo. Así, habiendo limitado las respectivas regiones de procesamiento de imagen de las fuentes de sonido en las direcciones aproximadas A0, B0 y C0, el medio de procesamiento de imagen deriva información A3, B3 y C3 sobre las respectivas localizaciones, como se menciona arriba, de los objetos que pueden ser fuentes de sonido, mediante llevar a cabo el procesamiento de imágenes dentro de las regiones limitadas de las direcciones aproximadas A0, B0 y C0.
El medio de procesamiento de sonido 14 está diseñado para ubicar las localizaciones de las fuentes de sonido basándose, por ejemplo, en la información de sonido derivada a partir de los micrófonos del medio de recogida de sonido 11 y la información de posición A3, B3 y C3 derivada por el medio de procesamiento de imagen 13.
En la identificación de las posiciones de las fuentes de sonido, la información de sonido puede basarse en una diferencia en fase y una diferencia en intensidad, entre dos porciones de información de sonido recibidas respectivamente por los micrófonos de recogida de sonido del lado derecho y del lado izquierdo 11a y 11b.
Así, en la derivación de información de sonido a partir de una fuente de sonido dada, como se muestra en la figura 4, puede hacerse el uso del hecho de que, cambiando en función de la dirección \theta en la que un sonido procedente de la fuente de sonido se propaga llegando a los micrófonos de recogida de sonido 11a y 11b (\theta = 0 cuando la fuente de sonido está delante, es igual a un signo menos cuando está la izquierda, y es igual a un signo más cuando está a la derecha), la diferencia d entre las distancias desde la fuente de sonido a los dos micrófonos 11a y 11b (expresada por la ecuación: d = D sen \theta) provoca que el sonido varíe en fase y, además, de que mediante el amortiguamiento varíe en intensidad cuando llega a estos.
Además, debido a que la localización de la fuente de sonido no está clara aún, el medio de procesamiento de sonido 14 lleva a cabo aquí el procesamiento tal como se ha mencionado arriba, sobre el rango completo de ángulos: -90 grados \leq \theta \leq +90 grados. En este caso la operación de procesamiento puede aligerarse, por ejemplo mediante procesar cada intervalo angular, por ejemplo 5 grados de \theta.
El medio de procesamiento de sonido 14 primero selecciona o determina las direcciones aproximadas A0, B0 y C0 de las fuentes de sonido, basándose en información del sonido a izquierda y a derecha, desde el medio de recogida de sonido. Esto sigue la técnica convencional de identificación de una fuente de sonido (véase JP 9-33 330 A), que proporciona una precisión de \pm 10 grados.
Y el medio de procesamiento de sonido 15 entrega estas direcciones aproximadas A0, B0 y C0, para su introducción en el medio de procesamiento de imagen 13.
Además, el medio de procesamiento de sonido 14 con referencia a la información de posición A3, B3 y C3 introducida desde el medio de procesamiento de imagen 13, determina las localizaciones de las fuentes de sonido basándose en la información de sonido limitada a los rangos de la información de posición A3, B3 y C3, es decir, en los rangos de la información de posición A3, B3 y C3.
En este caso el medio de procesamiento de sonido 14 localiza las localizaciones de las fuentes de sonido mediante adoptar una elección apropiada de lo que se denomina filtros direccionales para las fuentes de sonido A, B y C, respectivamente.
Aquí, preparados para extraer selectivamente información de sonido sólo en un momento concreto t0, tales filtros direccionales son almacenados en una tabla de control para las direcciones de las fuentes de sonido, en un medio auxiliar de almacenamiento (no mostrado) en el medio de control 15, y son identificados y seleccionados apropiadamente por el medio de procesamiento de sonido 14, a partir del medio de almacenamiento auxiliar, en base a información de posición A3, B3 y C3 procedente del medio de procesamiento de imagen 13.
Esto permite la adquisición de porciones de formación de sonido emitidas simultáneamente desde las fuentes de sonido, y recogidas por los micrófonos de recogida de sonido 11a y 11b cuando, como se muestra en la figura 6, se tiene una porción de información de sonido en el lado derecho en el momento 1, y después se extrae otra porción de formación de sonido en el lado izquierdo en el momento t2, que es posterior en un subsiguiente tiempo de retardo \Deltat (t2 = t1 + \Deltat). No obstante, debe observarse que \Deltat puede ser negativo.
De este modo, la selección de filtros direccionales concretos por el medio de procesamiento de sonido 14, con respecto a cada una de las fuentes de sonido A, B y C, que poseen una información direccional que es precisa en cierta medida, permite la obtención de sus respectivas porciones de información de sonido desde la mezcla de sonidos, como se muestra en la figura 7.
En este punto debe notarse que, limitar los respectivos rangos de las direcciones de las fuentes de sonido, mediante las porciones de información de posición A3, B3 y C3, hace innecesario que el medio de procesamiento de sonido 14 lleve a cabo procesos sobre todo el rango de ángulos de \theta (-90 grados \leq \theta \leq +90 grados), y hace que para el mismo proceso sea suficiente cierto rango limitado de ángulos en torno a las porciones de información de posición A3, B3 y C3.
El medio de control 15 puede, por ejemplo, consistir en un ordenador que esté diseñado para controlar las operaciones del medio de recogida de sonido 11, el medio de representación por imágenes 12, el medio de procesamiento de imágenes 13 y el medio de procesamiento de sonido 14. El medio de control 15 mencionado arriba, tiene los filtros direccionales almacenados según el preajuste en el medio de almacenamiento auxiliar (no mostrado).
Construido como se ha indicado arriba, el aparato de identificación de fuentes de sonido 10 acorde con la presente forma de la realización, funciona según se describe más abajo de acuerdo con el diagrama de flujo mostrado en la figura 8.
En referencia a la figura 8, en la etapa ST1 el medio de control 15 actúa sobre el medio de recogida de sonido 11, para provocar que cada uno de los micrófonos de recogida de sonido 11a y 11b recoja sonidos desde las fuentes de sonido A, B y C, mientras que el medio de control 15 actúa también a la vez sobre el medio de representación por imágenes 12, para provocar que represente consecutivamente en imágenes las fuentes de sonido, en la etapa ST2.
A continuación, en la etapa ST3 el medio de control 15 actúa sobre el medio de procesamiento de sonido 14, para provocar que seleccione o determine direcciones aproximadas A0, B0 y C0, en las que las fuentes de sonido están localizadas, respectivamente (véase la figura 3(A)), basándose en porciones de información de sonido para una diferencia entre las fases y una diferencia entre las intensidades, que tiene el sonido procedente de cada una de las fuentes de sonido cuando es recogido respectivamente por los dos micrófonos, en el medio de recogida de sonido 11. Después se examina todas las estructuras armónicas en las que existe cualquier diferencia de fase, para resolver aproximadamente las fuentes de sonido respecto del sonido mezclado. Para terminar, se determina una estructura armónica estándar, como ejemplo de la señal para cada una de las bandas de frecuencia divididas arbitrariamente.
Posteriormente, en la etapa ST4 el medio de control 15 actúa sobre el medio de procesamiento de imagen 13, para provocar que seleccione o determine la información de posición A3, B3 y C3 (véase la figura 3(C)) sobre objetos que son posibles fuentes de sonido, de acuerdo con el color y/o la forma de estos, en imágenes gráficas recibidas desde el medio de representación por imágenes 12, y dentro de los rangos de direcciones aproximadas recibidos desde el medio de procesamiento de sonido 14.
A continuación, en la etapa ST5 el medio de control 15 actúa sobre el medio de procesamiento de sonido 14 para provocar que localice las localizaciones de las fuentes de sonido A, B y C, de acuerdo con la información de sonido recibida desde el medio de recogida de sonido, dentro de un rango dado de ángulos, para la información de posición A3, B3 y C3 recibida desde el medio de procesamiento de imagen 14.
Finalmente, en la tapa ST6 el medio de procesamiento de sonido 14 selecciona un filtro direccional concreto para extraer selectivamente información de sonido, de un mismo sonido procedente de una misma fuente de sonido, y con un retardo temporal concreto. De este modo se verá que el aparato de identificación de fuente de sonido 10 acorde con la forma ilustrada de realización de la presente mención, en el que en la identificación de la fuente de sonido se hace que el medio de procesamiento de sonido 14 funcione, basándose no sólo en la información de sonido recibida desde el medio de recogida de sonido 11 sino también en una imagen gráfica representada mediante el medio de representación por imágenes 12, de forma que mientras se refiere a la posición de información A3, B3 y C3 de un objeto que puede ser la fuente de sonido, tiene la capacidad de identificar una fuente de sonido con una precisión incrementada respecto de la precisión aproximada de \pm 10 grados que se obtenía con el sistema convencional que se basaba sólo en información procedente del medio de recogida de sonido 11.
Además se ve que, mediante mejorar la precisión para localizar la ubicación de la fuente de sonido, mediante refinar la información de sonido que por anticipado separa aproximadamente la fuente de sonido respecto de otra fuente de sonido, con la información de posición derivada a partir de la información de imágenes, hace su identificación fiable incluso si estas están próximas entre sí.
Más en concreto, si se representa tres hablantes como fuentes de sonido representadas consecutivamente mediante el medio de representación por imágenes 12, puede obtenerse por ejemplo las imágenes gráficas como se muestra la figura 9, donde son las imágenes número 7, 51, 78 y 158, de la totalidad de las imágenes representadas consecutivamente.
Aquí, las caras de estos hablantes quedan realmente como se muestra en la figura 10(A), a partir de la cual es evidente que los hablantes están posicionados a aproximadamente -30 grados, 0 grados y +20 grados de ángulo direccional, respectivamente.
Después, si determina localizar estos objetos como posibles fuentes de sonido a través del medio de procesamiento de imágenes 13, procesando las imágenes sólo en función del color como se muestra en el gráfico de la figura 10(B), se ve que se reconoce además por error otros objetos como fuentes de sonido en las imágenes gráficas. Sin embargo, si el procesamiento de imágenes se basa tanto el color como en la altura, se ve que el error disminuye como se muestra en el gráfico de la figura 10(C).
Además, si se hace que el medio de procesamiento de imágenes 13 procese las imágenes basándose en el color sólo en referencia a las direcciones aproximadas A0, B0 y C0 recibidas desde el medio de procesamiento de sonido 14, se ve que el error se reduce aún más, como se muestra en el gráfico de la figura 10(D).
Es más, si se hace que el medio de procesamiento de imágenes 13 procese las imágenes basándose tanto en el color como en la altura, en referencia a las direcciones aproximadas A0, B0 y C0 recibidas desde el medio de procesamiento de sonido 14, es evidente que puede resolverse la posición de las fuentes de sonido con una precisión comparativamente mejor, en relación con la posición real de la cara mostrada la figura 10(A), es decir con una precisión considerable.
Si bien en el ejemplo mencionado arriba, se utiliza las coordenadas horizontales A3, B3 y C3 de las posiciones centrales A2, B2 y C2 en las imágenes A1, B1 y C1 en los dibujos de los objetos representados consecutivamente, que pueden ser fuente de sonido, para proporcionar información sobre sus localizaciones, puede hacerse el uso de las coordenadas verticales y horizontales para proporcionar información sobre las localizaciones de estos.
Además, en el ejemplo mencionado arriba, el medio de procesamiento de imágenes 13 está diseñado para seleccionar o determinar información sobre las localizaciones de los objetos que pueden ser fuentes de sonido, en función del color y la forma (por ejemplo la altura) de los objetos, en las imágenes representadas consecutivamente.
Es más, mientras que en el ejemplo mencionado arriba el medio de procesamiento de imágenes 13 está diseñado para llevar a cabo el procesamiento de imágenes con referencia a las direcciones aproximadas A0, B0 y C0 recibidas desde el medio de procesamiento de sonido 14, en general la invención no está limitada a esto, sino que puede tener información seleccionada, o determinada, sobre las localizaciones de los objetos que pueden ser fuentes de sonido, en base sólo a la información gráfica recibida desde el medio de representación por imágenes 12.
Para detectar la dirección en la que está localizada una fuente de sonido, un elemento activo como por ejemplo en la forma de una chapa portadora de magnetismo, puede unirse a la fuente de sonido para determinar la dirección en la que se emite el magnetismo, mediante utilizar un dispositivo de detección magnética como medio de detección. La dirección detectada por el medio de detección magnética puede retroalimentarse en el medio de procesamiento de sonido, y ser utilizada por este último para preparar un filtro direccional, resolviendo de ese modo la fuente de sonido.
En el caso de que la fuente de sonido sea una persona, su emisión de radiación térmica permite el uso de un detector de infrarrojos para detectar la dirección en la que está localizada la fuente de sonido.
Como se ha descrito en lo precedente se ve que la presente mención, de acuerdo con la cual, en la identificación de una fuente de sonido en base a la información de sonido, la dirección en la que está localizada la fuente de sonido se limita, en función de información sobre su imagen y de información sobre su dirección localizada detectada, y a la vez en referencia a la información sobre la localización del objeto que puede ser la fuente de sonido, hace innecesario procesar la información de sonido de forma unidireccional, o sobre todas las direcciones, en la identificación de la fuente de sonido, se hace posible identificar la fuente de sonido con gran certeza, se hace suficiente una menor cantidad de información procesable, y se hace posible reducir el tiempo de procesamiento. Por consiguiente, se proporciona un aparato y un método de identificación de fuentes de sonido, altamente ventajosos de acuerdo con la presente mención, los cuales hacen posible identificar una pluralidad de fuentes de sonido con la debida precisión, mediante un par de micrófonos.
Debe entenderse que la invención no pretende limitarse a las formas específicas de realizaciones de esta enunciadas abajo, sino que pretende incluir todas las posibles formas de realizaciones de esta, que puedan realizarse dentro del alcance en relación con las características enunciadas específicamente en las reivindicaciones anexas, y abarcar todos sus equivalentes.
Aplicabilidad industrial
Como se aprecia de la descripción precedente, un aparato y un método de identificación de fuentes de sonido, acordes con la presente mención, son extremadamente útiles como aparato y método dispositivo de identificación de fuentes de sonido, mediante lo que se identifica la localización del objeto como fuente de sonido con la debida precisión, en función de información tanto de imagen como de sonido, y el uso de la información de su posición permite que cada una de tales fuentes de sonido se separe de entre sonidos mezclados, con la debida precisión.
\vskip1.000000\baselineskip
Referencias citadas en la descripción La lista de referencias citadas por el solicitante es solo para comodidad del lector. No forma parte del documento de Patente Europea. Incluso aunque se ha tomado especial cuidado en recopilar las referencias, no puede descartarse errores u omisiones y la EPO rechaza toda responsabilidad a este respecto. Documentos de patente citados en la descripción
\bullet JP11018194B [0003]
\bullet US6317501B [0003]
\bullet WO9743856A [0003]
\bullet JP9033330A [0043].

Claims (16)

1. Aparato para detectar una fuente de sonido (A, B, C), que comprende:
un medio de recogida de sonido (11) que incluye un par de micrófonos de recogida de sonido (11a, 11b) yuxtapuestos entre sí a través de una separación preseleccionada (D) y opuestos a la fuente de sonido (A, B, C);
un medio de representación por imágenes (12) que está adaptado para representar consecutivamente por imágenes, un objeto que puede ser la mencionada fuente de sonido (A, B, C);
un medio de procesamiento de sonido (14) para determinar una dirección de la mencionada fuente de sonido (A, B, C);
un medio de procesamiento de imágenes (13) para determinar una dirección del mencionado objeto que posiblemente es la mencionada fuente de sonido (A, B, C), a partir de información de imágenes gráficas representada por el mencionado medio de representación por imágenes (12); y
un medio de control (15) para controlar el funcionamiento del mencionado medio de recogida de sonido (11), del mencionado medio de representación por imágenes (12), del mencionado medio de procesamiento de imagen (13) y del mencionado medio de procesamiento de sonido (14),
caracterizado porque
comprende además:
filtros direccionales; y
donde puede ser identificada y separada una pluralidad de fuentes de sonido (A, B, C);
los mencionados dos micrófonos (11a, 11b) son opuestos a la pluralidad de fuentes de sonido (A, B, C), cada uno de los mencionados dos micrófonos (11a, 11b) captura individualmente sonidos mezclados procedentes de las mencionadas fuentes de sonido (A, B, C);
el mencionado medio de procesamiento de sonido (14) estando adaptado para determinar las direcciones de todas las fuentes de sonido (A, B, C), en base a información de sonido para una diferencia entre fases y una diferencia entre intensidades que, cada uno de los mencionados sonidos mezclados procedentes de las mencionadas fuentes de sonido (A, B, C), tiene cuando ha sido capturado por los mencionados dos micrófonos de recogida de sonido (11a, 11b), respectivamente;
donde las operaciones del mencionado medio de recogida de sonido (11), el mencionado medio de representación por imágenes (12), el mencionado medio de procesamiento de imagen (13) y el mencionado medio de procesamiento de sonido (14), están controlados por el mencionado medio de control (15) de forma que:
el mencionado medio de procesamiento de sonido (14) predetermina direcciones aproximadas (A0, B0, C0) de las mencionadas fuentes de sonido (A, B, C), a partir de información para los mencionados sonidos capturados por el mencionado medio de recogida de sonido (11), y el mencionado medio de procesamiento de imágenes (13) determina la dirección de cada uno de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), dentro de un rango definido por las mencionadas direcciones aproximadas predeterminadas (A0, B0, C0), y el mencionado medio de procesamiento de sonido (14) selecciona los mencionados filtros direccionales correspondientes a las mencionadas direcciones predeterminadas de las fuentes de sonido (A, B, C),
mediante lo que se hace posible identificar las direcciones de la totalidad de las fuentes de sonido (A, B, C), y separarlas entre sí incluso si las que son vecinas están próximas.
2. Aparato como el enunciado en la reivindicación 1, caracterizado porque comprende:
un medio de detección, que detecta direcciones en las que están localizados los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C);
donde el mencionado medio de procesamiento de imágenes (13) determina la dirección de cada uno de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), a partir de información
para las imágenes gráficas representadas por el mencionado medio de representación por imágenes (12), e
información direccional para cada uno de los mencionados objetos detectados por el mencionado medio de detec-
tor.
\newpage
3. Aparato como el enunciado en la reivindicación 2, caracterizado porque el mencionado medio detector esta adaptado para medir los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), en respuesta al magnetismo de estas.
4. Aparato como el enunciado en la reivindicación 2, caracterizado porque el mencionado medio detector está adaptado para detectar los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), en respuesta a los rayos infrarrojos que estos emiten.
5. Aparato como el enunciado en cualquiera de las reivindicaciones 1 a 4, caracterizado porque el mencionado medio de procesamiento de imágenes (13) tiene la función de determinar la dirección de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), en base a un color de un mencionado objeto.
6. Aparato como el enunciado en cualquiera de las reivindicaciones 1 a 4, caracterizado porque el mencionado medio de procesamiento de imágenes (13) tiene la función de determinar direcciones de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), en base a una forma de un mencionado objeto.
7. Aparato como el enunciado en cualquiera de las reivindicaciones 1 a 4, caracterizado porque el mencionado medio de procesamiento de imágenes (13) tiene la función de determinar la dirección de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), en base conjuntamente a un color, una forma y una altura de un mencionado objeto.
8. Método para detectar una fuente de sonido (A, B, C), que comprende:
una primera etapa de captura de sonido procedente de una fuente de sonido (A, B, C), con un par de micrófonos de recogida de sonido (11a, 11b) yuxtapuestos entre sí a través de una separación preseleccionada (D), y opuestos a la fuente de sonido (A, B, C);
ejecutada simultáneamente a la primera etapa, una segunda etapa en la que un medio de representación por imágenes (12), representa consecutivamente por imágenes objetos que pueden ser la mencionada fuente de sonido (A, B, C), para producir imágenes gráficas de estos;
una tercera etapa en la que un medio de procesamiento de sonido (14) determina la dirección de la mencionada fuente de sonido (A, B, C), a partir de información del sonido;
una cuarta etapa en la que un medio de procesamiento de imágenes (13) determina una dirección del mencionado objeto que posiblemente es la mencionada fuente de sonido (A, B, C), a partir de información para las imágenes gráficas producida en la segunda etapa;
una quinta etapa en la que el mencionado medio de procesamiento de imágenes (13) determina una dirección de la mencionada fuente de sonido (A, B, C);
caracterizado porque
en la primera etapa se captura individualmente sonidos mezclados procedentes de una pluralidad de fuentes de sonido (A, B, C), mediante los dos micrófonos de recogida de sonido (11a, 11b);
en la tercera etapa, se determina una dirección aproximada (A0, B0, C0) para cada una de la totalidad de las fuentes de sonido (A, B, C), a partir de la información de sonido para los mencionados sonidos mezclados capturados en la primera etapa, y en base a la información contenida en la mencionada información de sonido para la diferencia entre fases y la diferencia entre intensidades;
determinar en la cuarta etapa, una dirección de cada uno de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), dentro de un rango definido por tales direcciones aproximadas (A0, B0, C0) determinadas en la tercera etapa;
en la quinta etapa, determinar una dirección de cada una de la totalidad de las mencionadas fuentes de sonido (A, B, C), en base a la mencionada información de sonido, de una diferencia entre fases y una diferencia entre intensidades, dentro de un rango de ángulos definido por tales direcciones determinadas en la cuarta etapa;
proporcionando además
una sexta etapa en la que el mencionado medio de procesamiento de sonido (14) selecciona un filtro direccional concreto, de acuerdo con la dirección determinada en la quinta etapa, de cada una de la totalidad de las mencionadas fuentes de sonido (A, B, C), para separar entre sí la totalidad de las mencionadas fuentes de sonido (A, B, C);
una séptima etapa en la que el mencionado medio de procesamiento de imagen (13) determina una dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), en base a información para las imágenes gráficas producidas en la segunda etapa, y el mencionado medio de procesamiento de sonido (14) determina una dirección de cada una de la totalidad de las mencionadas fuentes de sonido (A, B, C), en base a la mencionada información de sonido para una diferencia entre fases y una diferencia entre intensidades, como se ha indicado, dentro de un rango de ángulos definidos por tales direcciones determinadas, y selecciona un filtro direccional concreto de acuerdo con la dirección, así determinada, de cada una de la totalidad de las mencionadas fuentes (A, B, C), para separar entre sí la totalidad de las mencionadas fuentes de sonido (A, B, C); y
una octava etapa en la que el mencionado medio de procesamiento de sonido (14) selecciona tales filtros concretos de acuerdo con tales direcciones aproximadas (A0, B0, C0), determinadas en la tercera etapa, para separar entre sí la totalidad de las mencionadas fuentes de sonido (A, B, C).
9. Método como el enunciado en la reivindicación 8, caracterizado porque
la mencionada segunda etapa incluye que un medio detector, detecta direcciones en las que están localizados los mencionados objetos;
la mencionada cuarta etapa en la que el mencionado medio de procesamiento de imágenes (13) determina una dirección de cada uno de los mencionados objetos que posiblemente son la totalidad de las mencionadas fuentes de sonido (A, B, C), a partir de información para las imágenes gráficas producidas y la información para la dirección detectada en la segunda etapa, dentro de un rango definido por tales direcciones aproximadas (A0, B0, C0) determinadas en la tercera etapa;
la mencionada séptima etapa en la que el mencionado medio de procesamiento de imágenes (13) determina una dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), en base a información para las imágenes gráficas producidas y a la información para la dirección detectada en la segunda etapa por los mencionados medios detectores.
10. Método como el enunciado en la reivindicación 9, caracterizado porque la detección de dirección mediante el mencionado medio detector, se lleva a cabo en respuesta a un rayo de infrarrojos.
11. Método como el enunciado la reivindicación 9, caracterizado porque la detección de la dirección mediante el mencionado medio detector, se lleva a cabo en respuesta a magnetismo.
12. Método como el enunciado la reivindicación 8, caracterizado porque la dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), se determina mediante el mencionado medio de procesamiento de imágenes (13), en base a un color de estas.
13. Método como el enunciado en la reivindicación 8, caracterizado porque la dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), es determinada por el mencionado medio de procesamiento de imágenes (13) en base a una forma de estas.
14. Método como el enunciado en la reivindicación 8, caracterizado porque la dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), es determinada por el mencionado medio de procesamiento de imágenes (13) en base a un color, una forma y una altura de estas.
15. Método como el enunciado en cualquiera de las reivindicaciones 8 a 14, caracterizado porque la determinación de la dirección de cada una de la totalidad de las mencionadas fuentes de sonido (A, B, C), mediante el mencionado medio de procesamiento de sonido (14), en base a información de sonido para una diferencia entre fases y una diferencia entre intensidades, se lleva a cabo mediante determinar una posición de cada una de las mencionadas fuentes de sonido (A, B, C), en base a una señal para cada una de las bandas de frecuencia divididas arbitrariamente.
16. Método como el enunciado la reivindicación 8, caracterizado porque la mencionada información de posición del mencionado objeto que posiblemente es una mencionada fuente de sonido (A, B, C), está derivada del movimiento de un mencionado objeto.
ES00935570T 1999-06-11 2000-06-07 Metodo y aparato para determinar una fuente de sonido. Expired - Lifetime ES2292441T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP11-165182 1999-06-11
JP16518299A JP3195920B2 (ja) 1999-06-11 1999-06-11 音源同定・分離装置及びその方法

Publications (1)

Publication Number Publication Date
ES2292441T3 true ES2292441T3 (es) 2008-03-16

Family

ID=15807412

Family Applications (1)

Application Number Title Priority Date Filing Date
ES00935570T Expired - Lifetime ES2292441T3 (es) 1999-06-11 2000-06-07 Metodo y aparato para determinar una fuente de sonido.

Country Status (6)

Country Link
US (1) US7035418B1 (es)
EP (1) EP1205762B1 (es)
JP (1) JP3195920B2 (es)
DE (1) DE60036216T2 (es)
ES (1) ES2292441T3 (es)
WO (1) WO2000077537A1 (es)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE517765C2 (sv) * 2000-11-16 2002-07-16 Ericsson Telefon Ab L M Registrering av rörliga bilder medelst en portabel kommunikationsenhet samt en tillbehörsanordning vilken är samlokaliserad med objektet
JP2004266343A (ja) * 2003-02-05 2004-09-24 Matsushita Electric Ind Co Ltd 画像サーバーと画像サーバーシステム、そのプログラム及び記録媒体
JP3925734B2 (ja) * 2003-03-17 2007-06-06 財団法人名古屋産業科学研究所 対象音検出方法、信号入力遅延時間検出方法及び音信号処理装置
JP4269883B2 (ja) * 2003-10-20 2009-05-27 ソニー株式会社 マイクロホン装置、再生装置及び撮像装置
JP4516527B2 (ja) * 2003-11-12 2010-08-04 本田技研工業株式会社 音声認識装置
GB0330253D0 (en) 2003-12-31 2004-02-04 Mitel Networks Corp Self-discovery method
JP2006245725A (ja) * 2005-03-01 2006-09-14 Yamaha Corp マイクロフォンシステム
JP4441879B2 (ja) * 2005-06-28 2010-03-31 ソニー株式会社 信号処理装置および方法、プログラム、並びに記録媒体
JP4757786B2 (ja) * 2006-12-07 2011-08-24 Necアクセステクニカ株式会社 音源方向推定装置、音源方向推定方法、及びロボット装置
IL188156A0 (en) * 2007-12-16 2008-11-03 Maly Edelman A method and system for protecting an area
US20100098258A1 (en) * 2008-10-22 2010-04-22 Karl Ola Thorn System and method for generating multichannel audio with a portable electronic device
US20100123785A1 (en) * 2008-11-17 2010-05-20 Apple Inc. Graphic Control for Directional Audio Input
CN102804806A (zh) * 2009-06-23 2012-11-28 诺基亚公司 用于处理音频信号的方法及装置
TWI402531B (zh) * 2009-06-29 2013-07-21 Univ Nat Cheng Kung 音源辨位方法與應用此音源辨位方法之音源辨位系統和電腦程式產品
US9094645B2 (en) * 2009-07-17 2015-07-28 Lg Electronics Inc. Method for processing sound source in terminal and terminal using the same
TWI417563B (zh) * 2009-11-20 2013-12-01 Univ Nat Cheng Kung 遠距離音源定位晶片裝置及其方法
US9955209B2 (en) 2010-04-14 2018-04-24 Alcatel-Lucent Usa Inc. Immersive viewer, a method of providing scenes on a display and an immersive viewing system
US9294716B2 (en) 2010-04-30 2016-03-22 Alcatel Lucent Method and system for controlling an imaging system
US8754925B2 (en) * 2010-09-30 2014-06-17 Alcatel Lucent Audio source locator and tracker, a method of directing a camera to view an audio source and a video conferencing terminal
US8185387B1 (en) 2011-11-14 2012-05-22 Google Inc. Automatic gain control
US9008487B2 (en) 2011-12-06 2015-04-14 Alcatel Lucent Spatial bookmarking
JP6216169B2 (ja) * 2012-09-26 2017-10-18 キヤノン株式会社 情報処理装置、情報処理方法
JP2014143678A (ja) * 2012-12-27 2014-08-07 Panasonic Corp 音声処理システム及び音声処理方法
CN103902963B (zh) * 2012-12-28 2017-06-20 联想(北京)有限公司 一种识别方位及身份的方法和电子设备
KR101997449B1 (ko) * 2013-01-29 2019-07-09 엘지전자 주식회사 이동 단말기 및 이의 제어 방법
EP2879047A3 (en) * 2013-11-28 2015-12-16 LG Electronics Inc. Mobile terminal and controlling method thereof
CN104683933A (zh) 2013-11-29 2015-06-03 杜比实验室特许公司 音频对象提取
JP6297858B2 (ja) * 2014-02-25 2018-03-20 株式会社熊谷組 音源推定用画像の作成装置
CN104914409B (zh) * 2014-03-10 2017-11-07 李文嵩 智能住宅定位装置
DE102014217598A1 (de) * 2014-09-03 2016-03-03 Gesellschaft zur Förderung angewandter Informatik e.V. Verfahren und Anordnung zur Erfassung von akustischen und optischen Informationen sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium
CN105070304B (zh) * 2015-08-11 2018-09-04 小米科技有限责任公司 实现对象音频录音的方法及装置、电子设备
CN109696658B (zh) 2017-10-23 2021-08-24 京东方科技集团股份有限公司 采集设备、声音采集方法、声源跟踪系统及其方法
JP6589041B1 (ja) * 2018-01-16 2019-10-09 ハイラブル株式会社 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3232608B2 (ja) * 1991-11-25 2001-11-26 ソニー株式会社 収音装置、再生装置、収音方法および再生方法、および、音信号処理装置
JPH05244587A (ja) 1992-02-26 1993-09-21 Mitsubishi Electric Corp テレビ会議用カメラ制御装置
US5402499A (en) * 1992-08-07 1995-03-28 Lsi Logic Corporation Multimedia controller
JPH06105306A (ja) * 1992-09-16 1994-04-15 Funai Denki Kenkyusho:Kk テレビ会議システム
JPH0739000A (ja) 1992-12-05 1995-02-07 Kazumoto Suzuki 任意の方向からの音波の選択的抽出法
JP2937009B2 (ja) * 1994-03-30 1999-08-23 ヤマハ株式会社 音像定位制御装置
CA2148631C (en) 1994-06-20 2000-06-13 John J. Hildin Voice-following video system
JP3714706B2 (ja) * 1995-02-17 2005-11-09 株式会社竹中工務店 音抽出装置
JP2947113B2 (ja) 1995-03-09 1999-09-13 日本電気株式会社 画像通信端末用ユーザインタフェース装置
JPH0933330A (ja) 1995-07-17 1997-02-07 Nippon Telegr & Teleph Corp <Ntt> 音響信号分離方法およびこの方法を実施する装置
GB2309105A (en) * 1996-01-12 1997-07-16 Ibm Intuitive GUI in the form of a representation of a physical environment
AUPN988996A0 (en) * 1996-05-16 1996-06-06 Unisearch Limited Compression and coding of audio-visual services
JP3537962B2 (ja) * 1996-08-05 2004-06-14 株式会社東芝 音声収集装置及び音声収集方法
EP1016002A4 (en) * 1996-09-04 2000-11-15 David A Goldberg METHOD AND DEVICE FOR PRODUCING PERSONAL-SPECIFIC IMAGES IN A PUBLIC SPACE
JP3355598B2 (ja) * 1996-09-18 2002-12-09 日本電信電話株式会社 音源分離方法、装置及び記録媒体
US6021206A (en) * 1996-10-02 2000-02-01 Lake Dsp Pty Ltd Methods and apparatus for processing spatialised audio
TW379309B (en) * 1997-05-16 2000-01-11 Samsung Electronics Co Ltd Signal management apparatus and method using on screen display
US6072522A (en) * 1997-06-04 2000-06-06 Cgc Designs Video conferencing apparatus for group video conferencing
JP3541339B2 (ja) * 1997-06-26 2004-07-07 富士通株式会社 マイクロホンアレイ装置
JPH1141577A (ja) 1997-07-18 1999-02-12 Fujitsu Ltd 話者位置検出装置
US6192134B1 (en) * 1997-11-20 2001-02-20 Conexant Systems, Inc. System and method for a monolithic directional microphone array
US5940118A (en) * 1997-12-22 1999-08-17 Nortel Networks Corporation System and method for steering directional microphones
US6005610A (en) * 1998-01-23 1999-12-21 Lucent Technologies Inc. Audio-visual object localization and tracking system and method therefor
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications

Also Published As

Publication number Publication date
DE60036216D1 (de) 2007-10-11
EP1205762B1 (en) 2007-08-29
US7035418B1 (en) 2006-04-25
JP2000356674A (ja) 2000-12-26
DE60036216T2 (de) 2008-05-15
EP1205762A1 (en) 2002-05-15
EP1205762A4 (en) 2005-07-06
WO2000077537A1 (fr) 2000-12-21
JP3195920B2 (ja) 2001-08-06

Similar Documents

Publication Publication Date Title
ES2292441T3 (es) Metodo y aparato para determinar una fuente de sonido.
CN105659287B (zh) 图像处理装置、图像处理方法和成像系统
US20190075284A1 (en) Stereo camera and method of controlling stereo camera
KR20210030359A (ko) 촬상 장치 및 차량 제어 시스템
JP5731529B2 (ja) 複数の検出器アレイを備えた多重解像度デジタル大判カメラ
ES2881320T3 (es) Dispositivo de generación, procedimiento de generación y programa para modelo tridimensional
ES2302750T3 (es) Alineamiento preciso de imagenes en sistemas de imagenes digitales emparejando puntos en las imagenes.
KR20160129779A (ko) 비-라이트 필드 이미징 디바이스를 사용하여 라이트 필드 데이터를 획득하는 방법, 대응하는 디바이스, 컴퓨터 프로그램 제품 및 비일시적 컴퓨터 판독가능 캐리어 매체
WO2019106999A1 (ja) 撮像装置および方法、並びに、撮像素子
JP2004504631A (ja) 少なくとも2つの第1カメラと第2カメラを有するカメラシステム
US20130223679A1 (en) Movement analysis and/or tracking system
CN104333690B (zh) 摄影装置以及摄影方法
JPWO2011013179A1 (ja) 移動体位置検出装置および移動体位置検出方法
JP2018006785A (ja) 信号処理装置、撮像装置、及び信号処理方法
CN105922268A (zh) 信息处理装置、处理系统、物体移动系统和物体移动方法
Pringle et al. Topics: Virtual geological outcrops–fieldwork and analysis made less exhaustive?
CN110441737A (zh) 一种采用鱼眼镜头的声源定位方法及其设备
JP2017005395A (ja) 撮像装置、撮像制御方法及びプログラム
US20200128188A1 (en) Image pickup device and image pickup system
US20180143410A1 (en) Device and method for imaging an object
JP2016048825A (ja) 撮像装置
JP2016048824A (ja) 追尾装置、追尾システム、及び表示装置
JP2012169811A (ja) 撮像装置、マイクロホン装置、撮像システム及びプログラム
KR101705715B1 (ko) 항공촬영정보를 대상물별로 실행한 3차원 도화이미지를 합성하는 영상도화장치
Phelps et al. Herbig-Haro Flows in Ophiuchus