ES2292441T3 - Metodo y aparato para determinar una fuente de sonido. - Google Patents
Metodo y aparato para determinar una fuente de sonido. Download PDFInfo
- Publication number
- ES2292441T3 ES2292441T3 ES00935570T ES00935570T ES2292441T3 ES 2292441 T3 ES2292441 T3 ES 2292441T3 ES 00935570 T ES00935570 T ES 00935570T ES 00935570 T ES00935570 T ES 00935570T ES 2292441 T3 ES2292441 T3 ES 2292441T3
- Authority
- ES
- Spain
- Prior art keywords
- sound
- mentioned
- aforementioned
- information
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Aparato para detectar una fuente de sonido (A, B, C), que comprende: un medio de recogida de sonido (11) que incluye un par de micrófonos de recogida de sonido (11a, 11b) yuxtapuestos entre sí a través de una separación preseleccionada (D) y opuestos a la fuente de sonido (A, B, C); un medio de representación por imágenes (12) que está adaptado para representar consecutivamente por imágenes, un objeto que puede ser la mencionada fuente de sonido (A, B, C); un medio de procesamiento de sonido (14) para determinar una dirección de la mencionada fuente de sonido (A, B, C); un medio de procesamiento de imágenes (13) para determinar una dirección del mencionado objeto que posiblemente es la mencionada fuente de sonido (A, B, C), a partir de información de imágenes gráficas representada por el mencionado medio de representación por imágenes (12); y un medio de control (15) para controlar el funcionamiento del mencionado medio de recogida de sonido (11), del mencionado medio de representación por imágenes (12), del mencionado medio de procesamiento de imagen (13) y del mencionado medio de procesamiento de sonido (14).
Description
Método y aparato para determinar una fuente de
sonido.
La presente invención trata de un aparato que
identifica una fuente de sonido, y de un método para identificar de
forma individual diversos sonidos, basándose en información de
imagen e información de sonido derivada de una pluralidad de tales
fuentes de sonido.
Hasta ahora se ha llevado a cabo investigaciones
para resolver, a partir de sonidos mezclados, un sonido concreto
tal como una voz o un sonido musical, incluido en las fuentes
mezcladas. Por ejemplo, se conoce un sistema de reconocimiento de
sonido que asume que su sonido de entrada es un discurso, o bien
voces. Y, en la medida en la en que hay involucrados imágenes o
procesamiento de imágenes, se conoce un sistema que, en la
determinación de un objeto toma conocimiento de su color, su forma
y/o su movimiento con el propósito de caracterizarlo.
Un sistema de reconocimiento de sonido, que
asocia el reconocimiento de sonido con procesamiento de imágenes,
se conoce a partir del documento JP 11 018 194 y su traducción US 6
317 501, o partir del documento WO 79 43 856. Por otra parte el
sistema asume que el discurso, o las voces, se llevan a cabo sólo
cuando el micrófono está cerca de la boca, o cuando no hay otra
fuente de sonido.
Además si bien se propone un sistema para
diferenciar, en base a una estructura armónica, una señal de sonido
concreta entre una pluralidad de fuentes de sonido, y para después
encontrar la dirección en la que está localizada su fuente de
sonido, la precisión con la que de ese modo puede hallarse la
dirección de la fuente de sonido, es tan imprecisa como de \pm
10º, y no es posible resolver la fuente de sonido si esta queda
próxima a una o varias fuentes de sonido adyacentes.
También se ha propuesto un método que utilice
una pluralidad de micrófonos de recogida de sonido, en número igual
al de fuentes de sonido, y que en base a la información de sonido
procedente de los diversos micrófonos de recogida de sonido,
identifique una fuente de sonido concreta. Si bien este método está
diseñado para identificar la intensidad del sonido y la posición de
su fuente, es un hecho que su información de frecuencia se dispersa
en torno al eje que define la dirección en la que está localizada la
fuente de sonido, dificultando de ese modo una identificación
precisa de la fuente de sonido. Además, si bien este método hace
posible incrementar la velocidad de reconocimiento de una fuente de
sonido, el requisito de disponer micrófonos de recogida de sonido
en número idéntico a las fuentes de sonido que existen
independientes unas de las otras, hace el método costoso.
Dirigida a evitar las dificultades implicadas en
el arte previo según han sido descritas arriba, la presente
invención tiene como primer objetivo proporcionar un aparato de
identificación de fuente de sonido, que sea capaz de identificar un
objeto como fuente de un sonido, entre sonidos mezclados, en
términos de su localización, con mayor precisión, mediante utilizar
tanto información sobre el sonido como información sobre la fuente
de sonido como imagen de este, e información sobre la posición, para
resolver con la debida precisión el sonido de entre los sonidos
mezclados.
Además, la presente invención tiene como su
segundo objetivo el proporcionar un método de identificación de
fuente de sonido, que sea capaz de identificar un objeto como una
fuente de sonido entre sonidos mezclados, en términos de su
posición, con mayor precisión, mediante el uso tanto de información
sobre el sonido, como información sobre la fuente de sonido como
una imagen de este, e información sobre tal posición, para aislar
con la debida precisión el sonido de entre los sonidos
mezclados.
Para conseguir el primer objetivo mencionado
arriba, de acuerdo con la presente invención se proporciona un
aparato de identificación y separación de una fuente de sonido,
acorde con la reivindicación 1. Además, el aparato está
caracterizado porque la dirección de cada uno de la totalidad de los
mencionados objetos que posiblemente son las mencionadas fuentes de
sonido, se determina mediante el mencionado medio de procesamiento,
en base a uno o más elementos de entre el color, la forma y la
altura de este.
Además, el aparato está caracterizado porque el
mencionado medio de detección está adaptado para medir los
mencionados objetos que posiblemente son las mencionadas fuentes de
sonido, en respuesta al magnetismo de estos.
Además, el aparato está caracterizado porque el
mencionado medio de detección está adaptado para medir los
mencionados objetos que posiblemente son las mencionadas fuentes de
sonido, en respuesta a los rayos infrarrojos que estos emiten.
Además, el aparato está caracterizado porque los
mencionados objetos que posiblemente son las mencionadas fuentes de
sonido, tienen cada uno un material de conducción magnética unido a
sí mismo.
Además, el aparato está caracterizado porque el
mencionado medio de procesamiento de imágenes tiene la función de
determinar la dirección de la totalidad de los mencionados objetos
que posiblemente son las mencionadas fuentes de sonido, en base a
un color de un mencionado objeto.
Además, el aparato está caracterizado porque el
mencionado medio de procesamiento de imágenes tiene la función de
determinar direcciones de la totalidad de los mencionados objetos
que posiblemente son las mencionadas fuentes de sonido, en base
conjuntamente a un color, una forma y una altura del mencionado
objeto.
Con una construcción como la mencionada arriba,
el aparato de identificación y resolución de la fuente de sonido,
de la presente invención, en la localización de las fuentes de
sonido según la información de sonido adquirida desde los
micrófonos de recogida de sonido, está diseñado para limitar las
direcciones de las fuentes de sonido, en relación con la
información de posición basada en la información de representaciones
de la imagen, representadas por los medios de representación de
imágenes, y la información sobre las direcciones adquirida por los
medios de detección. Por consiguiente, el aparato de identificación
y resolución de una fuente de sonido de la presente invención, está
construido de modo que es capaz de especificar los objetos que
pueden ser las fuentes de sonido, mediante el uso de imágenes
gráficas y de información direccional de los objetos y para, al
mismo tiempo, resolver individualmente y de forma fiable las fuentes
de sonido, mediante utilizar la información de su posición y la
información de su sonido.
Para conseguir el segundo objetivo mencionado
arriba, de acuerdo con la presente invención se proporciona además
un método de identificación y resolución de una fuente de sonido,
acorde con la reivindicación 8.
Además, el método está caracterizado porque la
dirección de cada uno, de la totalidad de los mencionados objetos
que posiblemente son las mencionadas fuentes de sonido, está
determinada por el mencionado medio de procesamiento de imágenes,
en base a uno o más de entre un color, una forma y una altura de
este.
Además, el método está caracterizado porque la
detección de la dirección mediante el mencionado medio de detección,
se lleva a cabo en respuesta a un rayo de infrarrojos.
Además, el método está caracterizado porque la
detección de la dirección mediante el mencionado medio de detección,
se lleva a cabo en respuesta a magnetismo.
Además, el método está caracterizado porque la
dirección de cada uno de la totalidad de los mencionados objetos
que posiblemente son las mencionadas fuentes de sonido, se determina
mediante el mencionado medio de procesamiento de imágenes, en base
a un color de estos.
Además, el método está caracterizado porque la
dirección de cada uno de la totalidad de los mencionados objetos
que posiblemente son las mencionadas fuentes de sonido, se determina
mediante el mencionado medio de procesamiento de imágenes, en base
a una forma de estos.
Además, el método está caracterizado por la
dirección de cada uno de la totalidad de los mencionados objetos
que posiblemente son las mencionadas fuentes de sonido, se determina
mediante el mencionado medio de procesamiento de imágenes, en base
a un color, una forma y una altura de este.
Además, el método está caracterizado porque la
determinación de la dirección de cada uno de la totalidad de las
mencionadas fuentes de sonido, mediante el mencionado medio de
procesamiento de sonido, en base a la información de sonido para
una diferencia entre fases y una diferencia entre intensidades, se
lleva a cabo mediante determinar una posición de cada una de las
mencionadas fuentes, en base una señal de cada una de las bandas de
frecuencia en las que se divide arbitrariamente.
Además, el método está caracterizado porque la
mencionada información de posición de un mencionado objeto que
posiblemente es una mencionada fuente de sonido, está derivada de un
movimiento del mencionado objeto.
Organizado como se ha mencionado arriba, el
método de identificación de la fuente de sonido, acorde con la
presente invención, permite no sólo que se derive la información de
sonido de una pluralidad de fuentes de sonido, a partir de un medio
de recogida de sonido fabricado a partir de dos micrófonos de
recogida de sonido opuestos a las fuentes de sonido, sino que
además la información de imagen de estas fuentes de sonido se deriva
a partir de imágenes gráficas de esta, realizadas por un medio de
representación de imágenes. Además, la detección de las direcciones
de las fuentes de sonido mediante magnetismo o por rayos
infrarrojos, da lugar a información para la detección de la
dirección. Y cuando el medio de procesamiento de sonido está
localizando las localizaciones de las fuentes de sonido, en base a
la información de sonido, por ejemplo en base una diferencia entre
fases y una diferencia entre intensidades, en la información de
sonido adquirida por los micrófonos de recogida de sonido para cada
una de las fuentes de sonido, la dirección de cada una de las
fuentes de sonido se reduce con referencia a la información de
posición derivada para cada uno de los objetos que posiblemente son
las fuentes de sonido, mediante el medio de procesamiento de
imágenes, por ejemplo partir de su color, su forma y/o su
movimiento, en base a cualquiera, o ambos, de la información de
detección de la dirección y la información de imagen derivada del
medio de formación de imágenes, permitiendo de este modo que las
fuentes de sonido sean localizadas en sus posiciones, en base a las
señales en diversas bandas de frecuencia, por ejemplo estructuras
armónicas. Por consiguiente, el método hace innecesario procesar la
información de sonido de forma omnidireccional, o sobre la
totalidad de las direcciones, en la identificación de fuentes de
sonido, hace posible identificar la fuente de sonido con mayor
certeza, hace que sea suficiente una cantidad menor de información
procesable, y hace posible reducir el tiempo de procesamiento.
En este caso, la capacidad de identificar tres o
más fuentes de sonido con dos micrófonos de recogida de sonido, en
el medio de recogida de sonido, hace posible efectuar una
identificación precisa de las posiciones de las fuentes de sonido,
en una construcción sencilla.
Además, puesto que el método se lleva a cabo
como se ha enunciado arriba, estando incluida la tercera etapa de
derivación de información sobre localizaciones aproximadas de las
fuentes de sonido, sólo a partir de la información de sonido de los
sonidos recogidos en la primera etapa, e incluyendo la cuarta etapa
limitar por adelantado las direcciones de las fuentes de sonido, en
base a la información de posición aproximada derivada de la tercera
etapa, derivando de ese modo la información de la posición de los
objetos que posiblemente son las fuentes de sonido, se tiene como
resultado una reducción en la cantidad de información para el
procesamiento, con el propósito de derivar la información de
posición de los objetos que posiblemente son las fuentes de sonido,
en base a información de imágenes de la tercera etapa, lo que
simplifica el procesamiento.
La presente invención se comprenderá mejor a
partir de la siguiente descripción detallada y de los dibujos
anexos a esta, que muestran ciertas formas ilustrativas de
realizaciones de la presente invención. A este respecto, debe
observarse que no se pretende que tales formas de realización
ilustradas en los dibujos anexos limiten en modo alguno la presente
invención, sino que faciliten una explicación y la comprensión de
esta.
En los dibujos:
la figura 1 es una vista diagramática que
ilustra la composición de una primera forma de realización del
aparato de identificación de una fuente de sonido, acorde con la
presente invención;
la figura 2 es una vista diagramática de la
representación de una imagen a modo de ejemplo tomada, o creada,
por un medio de imágenes gráficas, en el aparato de identificación
de fuente de sonido mostrado en la figura 1;
la figura 3 es una vista explicativa para la
imagen gráfica del aparato de identificación de la fuente de
sonido, de la figura 1, donde (A) muestra las direcciones
aproximadas A0, B0 y C0 de las fuentes de sonido determinadas por
un medio de procesamiento de sonido, (B) muestra imágenes A1, B1 y
C1 de objetos que posiblemente son las fuentes de sonido,
determinados por un medio de procesamiento de imágenes, y (C)
muestra trozos de la información de posición A3, B3 y C3 de los
objetos que posiblemente son las fuentes de sonido, determinados
por el medio de procesamiento de imágenes;
la figura 4 es una vista explicativa que ilustra
una diferencia en distancia, entre una fuente de sonido y dos
micrófonos de recogida de sonido incluidos en un medio de recogida
de sonido, en el aparato de identificación de fuentes de sonido de
la figura 1;
la figura 5 es un gráfico que ilustra el
funcionamiento de un filtro direccional incluido en el medio de
procesamiento de sonido, en el aparato de identificación de fuente
de sonido de la figura 1;
la figura 6 es un gráfico que ilustra la
extracción de dos porciones de información de sonido, para un
sonido, a partir de una sola fuente de sonido, llevada a cabo en el
medio de procesamiento de sonido que hay en el aparato de
identificación de fuente de sonido de la figura 1;
la figura 7 es una vista explicativa, que
ilustra la extracción de información de sonido a partir de cada
fuente de sonido, llevada a cabo por el filtro direccional en el
medio de procesamiento de sonido, en el aparato de identificación
de fuente de sonido de la figura 1;
la figura 8 es un diagrama de flujo que ilustra
un método de funcionamiento del aparato de identificación de fuente
de sonido de la figura 1;
la figura 9 es un diagrama ilustrado, que
muestra la parte de imágenes gráficas consecutivas tomadas por el
medio de formación de imágenes, en el aparato de identificación de
fuente de sonido de la figura 1; y
la figura 10 es un gráfico que ilustra la
información relativa a las posiciones determinadas por el medio de
procesamiento de imágenes, sobre una variedad de bases de un objeto
que puede ser una fuente de sonido, en el aparato de identificación
de fuente de sonido de la figura 1.
En lo que sigue se describirá en detalle la
presente invención para un método y un aparato de identificación de
la fuente de sonido, con respecto a las formas actualmente mejores
de realizaciones de estos, ilustradas en los dibujos.
La figura 1 muestra una forma de realización del
aparato de identificación de fuente de sonido acorde con la
presente invención.
En referencia a la figura 1, el aparato de
identificación de fuente de sonido 10 incluye un medio de recogida
de sonido 11, un medio de representación por imágenes 12, un medio
de procesamiento de imágenes 13, un medio de procesamiento de
sonido 14 y un medio de control 15.
El medio de recogida de sonido 11 está diseñado
para capturar sonidos a partir una pluralidad de fuentes de sonido,
por ejemplo tres hablantes, con un par de micrófonos de recogida de
sonido 11a y 11b yuxtapuestos entre sí a través de una separación D
preseleccionada como se indica en la figura 1, y opuestos a las
fuentes de sonido, y para procesar los sonidos capturados. Si bien
la disposición de estos micrófonos de recogida de sonido puede
configurarse de cualquier forma adecuada, en el ejemplo mostrado
están provistos en lados opuestos del medio de representación por
imágenes 12, es decir en sus lados derecho e izquierdo.
El medio de representación por imágenes 12
consta, por ejemplo, de una cámara CCD (charge coupled device,
dispositivo acoplado por carga), y está diseñado como se muestra la
figura 2, para producir consecutivamente imágenes gráficas de una
pluralidad de fuentes de sonido, por ejemplo tres hablantes A, B y
C.
El medio de procesamiento de imágenes 13 está
diseñado para derivar información sobre las localizaciones de
objetos que pueden ser fuentes de sonido, en imágenes tomadas por el
medio de representación por imágenes 12, y basándose en su color,
su forma o su movimiento. Debe notarse aquí que el término
"movimiento" incluye vibraciones.
En este caso, el medio de procesamiento de
imagen 13 genera en, y para, la imagen gráfica tomada por el medio
de representación por imágenes 12, las imágenes A1, B1 y C1 para los
tres hablantes A, B y C de acuerdo con el color (es decir, el color
de la piel de un ser humano) y la altura, como se muestra la figura
3(B). Después, como se muestra la figura 3(C), el
medio de procesamiento de imágenes 13 selecciona puntos centrales
A2, B2 y C2 de estas imágenes A1, B1 y C1 (en la figura 3 indicados
mediante marcas "+"), como localizaciones respectivas de los
objetos que posiblemente son las fuentes de sonido, y toma sus
respectivas coordenadas horizontales A3, B3 y C3 como información
de estas posiciones.
En este punto, debe observarse que la razón por
la que se utiliza aquí las palabras "objetos" "que pueden
ser", "posiblemente son" o "posiblemente como"
"fuentes de sonido", es que hasta ahora no ha estado claro
necesariamente a partir sólo del reconocimiento de la imagen, si
indudablemente son, o no, fuentes de sonido.
Para simplificar el anterior procesamiento de
imagen, el medio de procesamiento de imagen 13 previo a este, debe
tener introducidas direcciones aproximadas A0, B0 y C0 de estas
fuentes de sonido (véase la figura 3(A)), que son
determinadas mediante el medio de procesamiento de sonido 14 que se
describirá en detalle más abajo. Así, habiendo limitado las
respectivas regiones de procesamiento de imagen de las fuentes de
sonido en las direcciones aproximadas A0, B0 y C0, el medio de
procesamiento de imagen deriva información A3, B3 y C3 sobre las
respectivas localizaciones, como se menciona arriba, de los objetos
que pueden ser fuentes de sonido, mediante llevar a cabo el
procesamiento de imágenes dentro de las regiones limitadas de las
direcciones aproximadas A0, B0 y C0.
El medio de procesamiento de sonido 14 está
diseñado para ubicar las localizaciones de las fuentes de sonido
basándose, por ejemplo, en la información de sonido derivada a
partir de los micrófonos del medio de recogida de sonido 11 y la
información de posición A3, B3 y C3 derivada por el medio de
procesamiento de imagen 13.
En la identificación de las posiciones de las
fuentes de sonido, la información de sonido puede basarse en una
diferencia en fase y una diferencia en intensidad, entre dos
porciones de información de sonido recibidas respectivamente por
los micrófonos de recogida de sonido del lado derecho y del lado
izquierdo 11a y 11b.
Así, en la derivación de información de sonido a
partir de una fuente de sonido dada, como se muestra en la figura
4, puede hacerse el uso del hecho de que, cambiando en función de la
dirección \theta en la que un sonido procedente de la fuente de
sonido se propaga llegando a los micrófonos de recogida de sonido
11a y 11b (\theta = 0 cuando la fuente de sonido está delante, es
igual a un signo menos cuando está la izquierda, y es igual a un
signo más cuando está a la derecha), la diferencia d entre las
distancias desde la fuente de sonido a los dos micrófonos 11a y 11b
(expresada por la ecuación: d = D sen \theta) provoca que el
sonido varíe en fase y, además, de que mediante el amortiguamiento
varíe en intensidad cuando llega a estos.
Además, debido a que la localización de la
fuente de sonido no está clara aún, el medio de procesamiento de
sonido 14 lleva a cabo aquí el procesamiento tal como se ha
mencionado arriba, sobre el rango completo de ángulos: -90 grados
\leq \theta \leq +90 grados. En este caso la operación de
procesamiento puede aligerarse, por ejemplo mediante procesar cada
intervalo angular, por ejemplo 5 grados de \theta.
El medio de procesamiento de sonido 14 primero
selecciona o determina las direcciones aproximadas A0, B0 y C0 de
las fuentes de sonido, basándose en información del sonido a
izquierda y a derecha, desde el medio de recogida de sonido. Esto
sigue la técnica convencional de identificación de una fuente de
sonido (véase JP 9-33 330 A), que proporciona una
precisión de \pm 10 grados.
Y el medio de procesamiento de sonido 15 entrega
estas direcciones aproximadas A0, B0 y C0, para su introducción en
el medio de procesamiento de imagen 13.
Además, el medio de procesamiento de sonido 14
con referencia a la información de posición A3, B3 y C3 introducida
desde el medio de procesamiento de imagen 13, determina las
localizaciones de las fuentes de sonido basándose en la información
de sonido limitada a los rangos de la información de posición A3, B3
y C3, es decir, en los rangos de la información de posición A3, B3
y C3.
En este caso el medio de procesamiento de sonido
14 localiza las localizaciones de las fuentes de sonido mediante
adoptar una elección apropiada de lo que se denomina filtros
direccionales para las fuentes de sonido A, B y C,
respectivamente.
Aquí, preparados para extraer selectivamente
información de sonido sólo en un momento concreto t0, tales filtros
direccionales son almacenados en una tabla de control para las
direcciones de las fuentes de sonido, en un medio auxiliar de
almacenamiento (no mostrado) en el medio de control 15, y son
identificados y seleccionados apropiadamente por el medio de
procesamiento de sonido 14, a partir del medio de almacenamiento
auxiliar, en base a información de posición A3, B3 y C3 procedente
del medio de procesamiento de imagen 13.
Esto permite la adquisición de porciones de
formación de sonido emitidas simultáneamente desde las fuentes de
sonido, y recogidas por los micrófonos de recogida de sonido 11a y
11b cuando, como se muestra en la figura 6, se tiene una porción de
información de sonido en el lado derecho en el momento 1, y después
se extrae otra porción de formación de sonido en el lado izquierdo
en el momento t2, que es posterior en un subsiguiente tiempo de
retardo \Deltat (t2 = t1 + \Deltat). No obstante, debe
observarse que \Deltat puede ser negativo.
De este modo, la selección de filtros
direccionales concretos por el medio de procesamiento de sonido 14,
con respecto a cada una de las fuentes de sonido A, B y C, que
poseen una información direccional que es precisa en cierta medida,
permite la obtención de sus respectivas porciones de información de
sonido desde la mezcla de sonidos, como se muestra en la figura
7.
En este punto debe notarse que, limitar los
respectivos rangos de las direcciones de las fuentes de sonido,
mediante las porciones de información de posición A3, B3 y C3, hace
innecesario que el medio de procesamiento de sonido 14 lleve a cabo
procesos sobre todo el rango de ángulos de \theta (-90 grados
\leq \theta \leq +90 grados), y hace que para el mismo
proceso sea suficiente cierto rango limitado de ángulos en torno a
las porciones de información de posición A3, B3 y C3.
El medio de control 15 puede, por ejemplo,
consistir en un ordenador que esté diseñado para controlar las
operaciones del medio de recogida de sonido 11, el medio de
representación por imágenes 12, el medio de procesamiento de
imágenes 13 y el medio de procesamiento de sonido 14. El medio de
control 15 mencionado arriba, tiene los filtros direccionales
almacenados según el preajuste en el medio de almacenamiento
auxiliar (no mostrado).
Construido como se ha indicado arriba, el
aparato de identificación de fuentes de sonido 10 acorde con la
presente forma de la realización, funciona según se describe más
abajo de acuerdo con el diagrama de flujo mostrado en la figura
8.
En referencia a la figura 8, en la etapa ST1 el
medio de control 15 actúa sobre el medio de recogida de sonido 11,
para provocar que cada uno de los micrófonos de recogida de sonido
11a y 11b recoja sonidos desde las fuentes de sonido A, B y C,
mientras que el medio de control 15 actúa también a la vez sobre el
medio de representación por imágenes 12, para provocar que
represente consecutivamente en imágenes las fuentes de sonido, en la
etapa ST2.
A continuación, en la etapa ST3 el medio de
control 15 actúa sobre el medio de procesamiento de sonido 14, para
provocar que seleccione o determine direcciones aproximadas A0, B0 y
C0, en las que las fuentes de sonido están localizadas,
respectivamente (véase la figura 3(A)), basándose en
porciones de información de sonido para una diferencia entre las
fases y una diferencia entre las intensidades, que tiene el sonido
procedente de cada una de las fuentes de sonido cuando es recogido
respectivamente por los dos micrófonos, en el medio de recogida de
sonido 11. Después se examina todas las estructuras armónicas en las
que existe cualquier diferencia de fase, para resolver
aproximadamente las fuentes de sonido respecto del sonido mezclado.
Para terminar, se determina una estructura armónica estándar, como
ejemplo de la señal para cada una de las bandas de frecuencia
divididas arbitrariamente.
Posteriormente, en la etapa ST4 el medio de
control 15 actúa sobre el medio de procesamiento de imagen 13, para
provocar que seleccione o determine la información de posición A3,
B3 y C3 (véase la figura 3(C)) sobre objetos que son
posibles fuentes de sonido, de acuerdo con el color y/o la forma de
estos, en imágenes gráficas recibidas desde el medio de
representación por imágenes 12, y dentro de los rangos de
direcciones aproximadas recibidos desde el medio de procesamiento
de sonido 14.
A continuación, en la etapa ST5 el medio de
control 15 actúa sobre el medio de procesamiento de sonido 14 para
provocar que localice las localizaciones de las fuentes de sonido A,
B y C, de acuerdo con la información de sonido recibida desde el
medio de recogida de sonido, dentro de un rango dado de ángulos,
para la información de posición A3, B3 y C3 recibida desde el medio
de procesamiento de imagen 14.
Finalmente, en la tapa ST6 el medio de
procesamiento de sonido 14 selecciona un filtro direccional concreto
para extraer selectivamente información de sonido, de un mismo
sonido procedente de una misma fuente de sonido, y con un retardo
temporal concreto. De este modo se verá que el aparato de
identificación de fuente de sonido 10 acorde con la forma ilustrada
de realización de la presente mención, en el que en la
identificación de la fuente de sonido se hace que el medio de
procesamiento de sonido 14 funcione, basándose no sólo en la
información de sonido recibida desde el medio de recogida de sonido
11 sino también en una imagen gráfica representada mediante el
medio de representación por imágenes 12, de forma que mientras se
refiere a la posición de información A3, B3 y C3 de un objeto que
puede ser la fuente de sonido, tiene la capacidad de identificar una
fuente de sonido con una precisión incrementada respecto de la
precisión aproximada de \pm 10 grados que se obtenía con el
sistema convencional que se basaba sólo en información procedente
del medio de recogida de sonido 11.
Además se ve que, mediante mejorar la precisión
para localizar la ubicación de la fuente de sonido, mediante
refinar la información de sonido que por anticipado separa
aproximadamente la fuente de sonido respecto de otra fuente de
sonido, con la información de posición derivada a partir de la
información de imágenes, hace su identificación fiable incluso si
estas están próximas entre sí.
Más en concreto, si se representa tres hablantes
como fuentes de sonido representadas consecutivamente mediante el
medio de representación por imágenes 12, puede obtenerse por ejemplo
las imágenes gráficas como se muestra la figura 9, donde son las
imágenes número 7, 51, 78 y 158, de la totalidad de las imágenes
representadas consecutivamente.
Aquí, las caras de estos hablantes quedan
realmente como se muestra en la figura 10(A), a partir de la
cual es evidente que los hablantes están posicionados a
aproximadamente -30 grados, 0 grados y +20 grados de ángulo
direccional, respectivamente.
Después, si determina localizar estos objetos
como posibles fuentes de sonido a través del medio de procesamiento
de imágenes 13, procesando las imágenes sólo en función del color
como se muestra en el gráfico de la figura 10(B), se ve que
se reconoce además por error otros objetos como fuentes de sonido en
las imágenes gráficas. Sin embargo, si el procesamiento de imágenes
se basa tanto el color como en la altura, se ve que el error
disminuye como se muestra en el gráfico de la figura
10(C).
Además, si se hace que el medio de procesamiento
de imágenes 13 procese las imágenes basándose en el color sólo en
referencia a las direcciones aproximadas A0, B0 y C0 recibidas desde
el medio de procesamiento de sonido 14, se ve que el error se
reduce aún más, como se muestra en el gráfico de la figura
10(D).
Es más, si se hace que el medio de procesamiento
de imágenes 13 procese las imágenes basándose tanto en el color
como en la altura, en referencia a las direcciones aproximadas A0,
B0 y C0 recibidas desde el medio de procesamiento de sonido 14, es
evidente que puede resolverse la posición de las fuentes de sonido
con una precisión comparativamente mejor, en relación con la
posición real de la cara mostrada la figura 10(A), es decir
con una precisión considerable.
Si bien en el ejemplo mencionado arriba, se
utiliza las coordenadas horizontales A3, B3 y C3 de las posiciones
centrales A2, B2 y C2 en las imágenes A1, B1 y C1 en los dibujos de
los objetos representados consecutivamente, que pueden ser fuente
de sonido, para proporcionar información sobre sus localizaciones,
puede hacerse el uso de las coordenadas verticales y horizontales
para proporcionar información sobre las localizaciones de
estos.
Además, en el ejemplo mencionado arriba, el
medio de procesamiento de imágenes 13 está diseñado para seleccionar
o determinar información sobre las localizaciones de los objetos
que pueden ser fuentes de sonido, en función del color y la forma
(por ejemplo la altura) de los objetos, en las imágenes
representadas consecutivamente.
Es más, mientras que en el ejemplo mencionado
arriba el medio de procesamiento de imágenes 13 está diseñado para
llevar a cabo el procesamiento de imágenes con referencia a las
direcciones aproximadas A0, B0 y C0 recibidas desde el medio de
procesamiento de sonido 14, en general la invención no está limitada
a esto, sino que puede tener información seleccionada, o
determinada, sobre las localizaciones de los objetos que pueden ser
fuentes de sonido, en base sólo a la información gráfica recibida
desde el medio de representación por imágenes 12.
Para detectar la dirección en la que está
localizada una fuente de sonido, un elemento activo como por ejemplo
en la forma de una chapa portadora de magnetismo, puede unirse a la
fuente de sonido para determinar la dirección en la que se emite el
magnetismo, mediante utilizar un dispositivo de detección magnética
como medio de detección. La dirección detectada por el medio de
detección magnética puede retroalimentarse en el medio de
procesamiento de sonido, y ser utilizada por este último para
preparar un filtro direccional, resolviendo de ese modo la fuente
de sonido.
En el caso de que la fuente de sonido sea una
persona, su emisión de radiación térmica permite el uso de un
detector de infrarrojos para detectar la dirección en la que está
localizada la fuente de sonido.
Como se ha descrito en lo precedente se ve que
la presente mención, de acuerdo con la cual, en la identificación
de una fuente de sonido en base a la información de sonido, la
dirección en la que está localizada la fuente de sonido se limita,
en función de información sobre su imagen y de información sobre su
dirección localizada detectada, y a la vez en referencia a la
información sobre la localización del objeto que puede ser la fuente
de sonido, hace innecesario procesar la información de sonido de
forma unidireccional, o sobre todas las direcciones, en la
identificación de la fuente de sonido, se hace posible identificar
la fuente de sonido con gran certeza, se hace suficiente una menor
cantidad de información procesable, y se hace posible reducir el
tiempo de procesamiento. Por consiguiente, se proporciona un
aparato y un método de identificación de fuentes de sonido,
altamente ventajosos de acuerdo con la presente mención, los cuales
hacen posible identificar una pluralidad de fuentes de sonido con
la debida precisión, mediante un par de micrófonos.
Debe entenderse que la invención no pretende
limitarse a las formas específicas de realizaciones de esta
enunciadas abajo, sino que pretende incluir todas las posibles
formas de realizaciones de esta, que puedan realizarse dentro del
alcance en relación con las características enunciadas
específicamente en las reivindicaciones anexas, y abarcar todos sus
equivalentes.
Como se aprecia de la descripción precedente, un
aparato y un método de identificación de fuentes de sonido, acordes
con la presente mención, son extremadamente útiles como aparato y
método dispositivo de identificación de fuentes de sonido, mediante
lo que se identifica la localización del objeto como fuente de
sonido con la debida precisión, en función de información tanto de
imagen como de sonido, y el uso de la información de su posición
permite que cada una de tales fuentes de sonido se separe de entre
sonidos mezclados, con la debida precisión.
\vskip1.000000\baselineskip
\bullet JP11018194B [0003]
\bullet US6317501B [0003]
\bullet WO9743856A [0003]
\bullet JP9033330A [0043].
Claims (16)
1. Aparato para detectar una fuente de sonido
(A, B, C), que comprende:
- un medio de recogida de sonido (11) que incluye un par de micrófonos de recogida de sonido (11a, 11b) yuxtapuestos entre sí a través de una separación preseleccionada (D) y opuestos a la fuente de sonido (A, B, C);
- un medio de representación por imágenes (12) que está adaptado para representar consecutivamente por imágenes, un objeto que puede ser la mencionada fuente de sonido (A, B, C);
- un medio de procesamiento de sonido (14) para determinar una dirección de la mencionada fuente de sonido (A, B, C);
- un medio de procesamiento de imágenes (13) para determinar una dirección del mencionado objeto que posiblemente es la mencionada fuente de sonido (A, B, C), a partir de información de imágenes gráficas representada por el mencionado medio de representación por imágenes (12); y
- un medio de control (15) para controlar el funcionamiento del mencionado medio de recogida de sonido (11), del mencionado medio de representación por imágenes (12), del mencionado medio de procesamiento de imagen (13) y del mencionado medio de procesamiento de sonido (14),
caracterizado porque
comprende además:
filtros direccionales; y
donde puede ser identificada y separada una
pluralidad de fuentes de sonido (A, B, C);
los mencionados dos micrófonos (11a, 11b) son
opuestos a la pluralidad de fuentes de sonido (A, B, C), cada uno
de los mencionados dos micrófonos (11a, 11b) captura individualmente
sonidos mezclados procedentes de las mencionadas fuentes de sonido
(A, B, C);
el mencionado medio de procesamiento de sonido
(14) estando adaptado para determinar las direcciones de todas las
fuentes de sonido (A, B, C), en base a información de sonido para
una diferencia entre fases y una diferencia entre intensidades que,
cada uno de los mencionados sonidos mezclados procedentes de las
mencionadas fuentes de sonido (A, B, C), tiene cuando ha sido
capturado por los mencionados dos micrófonos de recogida de sonido
(11a, 11b), respectivamente;
donde las operaciones del mencionado medio de
recogida de sonido (11), el mencionado medio de representación por
imágenes (12), el mencionado medio de procesamiento de imagen (13) y
el mencionado medio de procesamiento de sonido (14), están
controlados por el mencionado medio de control (15) de forma
que:
el mencionado medio de procesamiento de sonido
(14) predetermina direcciones aproximadas (A0, B0, C0) de las
mencionadas fuentes de sonido (A, B, C), a partir de información
para los mencionados sonidos capturados por el mencionado medio de
recogida de sonido (11), y el mencionado medio de procesamiento de
imágenes (13) determina la dirección de cada uno de los mencionados
objetos que posiblemente son las mencionadas fuentes de sonido (A,
B, C), dentro de un rango definido por las mencionadas direcciones
aproximadas predeterminadas (A0, B0, C0), y el mencionado medio de
procesamiento de sonido (14) selecciona los mencionados filtros
direccionales correspondientes a las mencionadas direcciones
predeterminadas de las fuentes de sonido (A, B, C),
mediante lo que se hace posible identificar las
direcciones de la totalidad de las fuentes de sonido (A, B, C), y
separarlas entre sí incluso si las que son vecinas están
próximas.
2. Aparato como el enunciado en la
reivindicación 1, caracterizado porque comprende:
- un medio de detección, que detecta direcciones en las que están localizados los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C);
donde el mencionado medio de procesamiento de
imágenes (13) determina la dirección de cada uno de los mencionados
objetos que posiblemente son las mencionadas fuentes de sonido (A,
B, C), a partir de información
para las imágenes gráficas representadas por el mencionado medio de representación por imágenes (12), e
información direccional para cada uno de los mencionados objetos detectados por el mencionado medio de detec-
tor.
para las imágenes gráficas representadas por el mencionado medio de representación por imágenes (12), e
información direccional para cada uno de los mencionados objetos detectados por el mencionado medio de detec-
tor.
\newpage
3. Aparato como el enunciado en la
reivindicación 2, caracterizado porque el mencionado medio
detector esta adaptado para medir los mencionados objetos que
posiblemente son las mencionadas fuentes de sonido (A, B, C), en
respuesta al magnetismo de estas.
4. Aparato como el enunciado en la
reivindicación 2, caracterizado porque el mencionado medio
detector está adaptado para detectar los mencionados objetos que
posiblemente son las mencionadas fuentes de sonido (A, B, C), en
respuesta a los rayos infrarrojos que estos emiten.
5. Aparato como el enunciado en cualquiera de
las reivindicaciones 1 a 4, caracterizado porque el
mencionado medio de procesamiento de imágenes (13) tiene la función
de determinar la dirección de la totalidad de los mencionados
objetos que posiblemente son las mencionadas fuentes de sonido (A,
B, C), en base a un color de un mencionado objeto.
6. Aparato como el enunciado en cualquiera de
las reivindicaciones 1 a 4, caracterizado porque el
mencionado medio de procesamiento de imágenes (13) tiene la función
de determinar direcciones de la totalidad de los mencionados objetos
que posiblemente son las mencionadas fuentes de sonido (A, B, C),
en base a una forma de un mencionado objeto.
7. Aparato como el enunciado en cualquiera de
las reivindicaciones 1 a 4, caracterizado porque el
mencionado medio de procesamiento de imágenes (13) tiene la función
de determinar la dirección de la totalidad de los mencionados
objetos que posiblemente son las mencionadas fuentes de sonido (A,
B, C), en base conjuntamente a un color, una forma y una altura de
un mencionado objeto.
8. Método para detectar una fuente de sonido (A,
B, C), que comprende:
- una primera etapa de captura de sonido procedente de una fuente de sonido (A, B, C), con un par de micrófonos de recogida de sonido (11a, 11b) yuxtapuestos entre sí a través de una separación preseleccionada (D), y opuestos a la fuente de sonido (A, B, C);
- ejecutada simultáneamente a la primera etapa, una segunda etapa en la que un medio de representación por imágenes (12), representa consecutivamente por imágenes objetos que pueden ser la mencionada fuente de sonido (A, B, C), para producir imágenes gráficas de estos;
- una tercera etapa en la que un medio de procesamiento de sonido (14) determina la dirección de la mencionada fuente de sonido (A, B, C), a partir de información del sonido;
- una cuarta etapa en la que un medio de procesamiento de imágenes (13) determina una dirección del mencionado objeto que posiblemente es la mencionada fuente de sonido (A, B, C), a partir de información para las imágenes gráficas producida en la segunda etapa;
- una quinta etapa en la que el mencionado medio de procesamiento de imágenes (13) determina una dirección de la mencionada fuente de sonido (A, B, C);
caracterizado porque
- en la primera etapa se captura individualmente sonidos mezclados procedentes de una pluralidad de fuentes de sonido (A, B, C), mediante los dos micrófonos de recogida de sonido (11a, 11b);
- en la tercera etapa, se determina una dirección aproximada (A0, B0, C0) para cada una de la totalidad de las fuentes de sonido (A, B, C), a partir de la información de sonido para los mencionados sonidos mezclados capturados en la primera etapa, y en base a la información contenida en la mencionada información de sonido para la diferencia entre fases y la diferencia entre intensidades;
- determinar en la cuarta etapa, una dirección de cada uno de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), dentro de un rango definido por tales direcciones aproximadas (A0, B0, C0) determinadas en la tercera etapa;
- en la quinta etapa, determinar una dirección de cada una de la totalidad de las mencionadas fuentes de sonido (A, B, C), en base a la mencionada información de sonido, de una diferencia entre fases y una diferencia entre intensidades, dentro de un rango de ángulos definido por tales direcciones determinadas en la cuarta etapa;
proporcionando además
- una sexta etapa en la que el mencionado medio de procesamiento de sonido (14) selecciona un filtro direccional concreto, de acuerdo con la dirección determinada en la quinta etapa, de cada una de la totalidad de las mencionadas fuentes de sonido (A, B, C), para separar entre sí la totalidad de las mencionadas fuentes de sonido (A, B, C);
- una séptima etapa en la que el mencionado medio de procesamiento de imagen (13) determina una dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), en base a información para las imágenes gráficas producidas en la segunda etapa, y el mencionado medio de procesamiento de sonido (14) determina una dirección de cada una de la totalidad de las mencionadas fuentes de sonido (A, B, C), en base a la mencionada información de sonido para una diferencia entre fases y una diferencia entre intensidades, como se ha indicado, dentro de un rango de ángulos definidos por tales direcciones determinadas, y selecciona un filtro direccional concreto de acuerdo con la dirección, así determinada, de cada una de la totalidad de las mencionadas fuentes (A, B, C), para separar entre sí la totalidad de las mencionadas fuentes de sonido (A, B, C); y
- una octava etapa en la que el mencionado medio de procesamiento de sonido (14) selecciona tales filtros concretos de acuerdo con tales direcciones aproximadas (A0, B0, C0), determinadas en la tercera etapa, para separar entre sí la totalidad de las mencionadas fuentes de sonido (A, B, C).
9. Método como el enunciado en la reivindicación
8, caracterizado porque
- la mencionada segunda etapa incluye que un medio detector, detecta direcciones en las que están localizados los mencionados objetos;
- la mencionada cuarta etapa en la que el mencionado medio de procesamiento de imágenes (13) determina una dirección de cada uno de los mencionados objetos que posiblemente son la totalidad de las mencionadas fuentes de sonido (A, B, C), a partir de información para las imágenes gráficas producidas y la información para la dirección detectada en la segunda etapa, dentro de un rango definido por tales direcciones aproximadas (A0, B0, C0) determinadas en la tercera etapa;
- la mencionada séptima etapa en la que el mencionado medio de procesamiento de imágenes (13) determina una dirección de cada uno de la totalidad de los mencionados objetos que posiblemente son las mencionadas fuentes de sonido (A, B, C), en base a información para las imágenes gráficas producidas y a la información para la dirección detectada en la segunda etapa por los mencionados medios detectores.
10. Método como el enunciado en la
reivindicación 9, caracterizado porque la detección de
dirección mediante el mencionado medio detector, se lleva a cabo en
respuesta a un rayo de infrarrojos.
11. Método como el enunciado la reivindicación
9, caracterizado porque la detección de la dirección mediante
el mencionado medio detector, se lleva a cabo en respuesta a
magnetismo.
12. Método como el enunciado la reivindicación
8, caracterizado porque la dirección de cada uno de la
totalidad de los mencionados objetos que posiblemente son las
mencionadas fuentes de sonido (A, B, C), se determina mediante el
mencionado medio de procesamiento de imágenes (13), en base a un
color de estas.
13. Método como el enunciado en la
reivindicación 8, caracterizado porque la dirección de cada
uno de la totalidad de los mencionados objetos que posiblemente son
las mencionadas fuentes de sonido (A, B, C), es determinada por el
mencionado medio de procesamiento de imágenes (13) en base a una
forma de estas.
14. Método como el enunciado en la
reivindicación 8, caracterizado porque la dirección de cada
uno de la totalidad de los mencionados objetos que posiblemente son
las mencionadas fuentes de sonido (A, B, C), es determinada por el
mencionado medio de procesamiento de imágenes (13) en base a un
color, una forma y una altura de estas.
15. Método como el enunciado en cualquiera de
las reivindicaciones 8 a 14, caracterizado porque la
determinación de la dirección de cada una de la totalidad de las
mencionadas fuentes de sonido (A, B, C), mediante el mencionado
medio de procesamiento de sonido (14), en base a información de
sonido para una diferencia entre fases y una diferencia entre
intensidades, se lleva a cabo mediante determinar una posición de
cada una de las mencionadas fuentes de sonido (A, B, C), en base a
una señal para cada una de las bandas de frecuencia divididas
arbitrariamente.
16. Método como el enunciado la reivindicación
8, caracterizado porque la mencionada información de
posición del mencionado objeto que posiblemente es una mencionada
fuente de sonido (A, B, C), está derivada del movimiento de un
mencionado objeto.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11-165182 | 1999-06-11 | ||
JP16518299A JP3195920B2 (ja) | 1999-06-11 | 1999-06-11 | 音源同定・分離装置及びその方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2292441T3 true ES2292441T3 (es) | 2008-03-16 |
Family
ID=15807412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES00935570T Expired - Lifetime ES2292441T3 (es) | 1999-06-11 | 2000-06-07 | Metodo y aparato para determinar una fuente de sonido. |
Country Status (6)
Country | Link |
---|---|
US (1) | US7035418B1 (es) |
EP (1) | EP1205762B1 (es) |
JP (1) | JP3195920B2 (es) |
DE (1) | DE60036216T2 (es) |
ES (1) | ES2292441T3 (es) |
WO (1) | WO2000077537A1 (es) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE517765C2 (sv) * | 2000-11-16 | 2002-07-16 | Ericsson Telefon Ab L M | Registrering av rörliga bilder medelst en portabel kommunikationsenhet samt en tillbehörsanordning vilken är samlokaliserad med objektet |
JP2004266343A (ja) * | 2003-02-05 | 2004-09-24 | Matsushita Electric Ind Co Ltd | 画像サーバーと画像サーバーシステム、そのプログラム及び記録媒体 |
JP3925734B2 (ja) * | 2003-03-17 | 2007-06-06 | 財団法人名古屋産業科学研究所 | 対象音検出方法、信号入力遅延時間検出方法及び音信号処理装置 |
JP4269883B2 (ja) * | 2003-10-20 | 2009-05-27 | ソニー株式会社 | マイクロホン装置、再生装置及び撮像装置 |
JP4516527B2 (ja) * | 2003-11-12 | 2010-08-04 | 本田技研工業株式会社 | 音声認識装置 |
GB0330253D0 (en) | 2003-12-31 | 2004-02-04 | Mitel Networks Corp | Self-discovery method |
JP2006245725A (ja) * | 2005-03-01 | 2006-09-14 | Yamaha Corp | マイクロフォンシステム |
JP4441879B2 (ja) * | 2005-06-28 | 2010-03-31 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びに記録媒体 |
JP4757786B2 (ja) * | 2006-12-07 | 2011-08-24 | Necアクセステクニカ株式会社 | 音源方向推定装置、音源方向推定方法、及びロボット装置 |
IL188156A0 (en) * | 2007-12-16 | 2008-11-03 | Maly Edelman | A method and system for protecting an area |
US20100098258A1 (en) * | 2008-10-22 | 2010-04-22 | Karl Ola Thorn | System and method for generating multichannel audio with a portable electronic device |
US20100123785A1 (en) * | 2008-11-17 | 2010-05-20 | Apple Inc. | Graphic Control for Directional Audio Input |
CN102804806A (zh) * | 2009-06-23 | 2012-11-28 | 诺基亚公司 | 用于处理音频信号的方法及装置 |
TWI402531B (zh) * | 2009-06-29 | 2013-07-21 | Univ Nat Cheng Kung | 音源辨位方法與應用此音源辨位方法之音源辨位系統和電腦程式產品 |
US9094645B2 (en) * | 2009-07-17 | 2015-07-28 | Lg Electronics Inc. | Method for processing sound source in terminal and terminal using the same |
TWI417563B (zh) * | 2009-11-20 | 2013-12-01 | Univ Nat Cheng Kung | 遠距離音源定位晶片裝置及其方法 |
US9955209B2 (en) | 2010-04-14 | 2018-04-24 | Alcatel-Lucent Usa Inc. | Immersive viewer, a method of providing scenes on a display and an immersive viewing system |
US9294716B2 (en) | 2010-04-30 | 2016-03-22 | Alcatel Lucent | Method and system for controlling an imaging system |
US8754925B2 (en) * | 2010-09-30 | 2014-06-17 | Alcatel Lucent | Audio source locator and tracker, a method of directing a camera to view an audio source and a video conferencing terminal |
US8185387B1 (en) | 2011-11-14 | 2012-05-22 | Google Inc. | Automatic gain control |
US9008487B2 (en) | 2011-12-06 | 2015-04-14 | Alcatel Lucent | Spatial bookmarking |
JP6216169B2 (ja) * | 2012-09-26 | 2017-10-18 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
JP2014143678A (ja) * | 2012-12-27 | 2014-08-07 | Panasonic Corp | 音声処理システム及び音声処理方法 |
CN103902963B (zh) * | 2012-12-28 | 2017-06-20 | 联想(北京)有限公司 | 一种识别方位及身份的方法和电子设备 |
KR101997449B1 (ko) * | 2013-01-29 | 2019-07-09 | 엘지전자 주식회사 | 이동 단말기 및 이의 제어 방법 |
EP2879047A3 (en) * | 2013-11-28 | 2015-12-16 | LG Electronics Inc. | Mobile terminal and controlling method thereof |
CN104683933A (zh) | 2013-11-29 | 2015-06-03 | 杜比实验室特许公司 | 音频对象提取 |
JP6297858B2 (ja) * | 2014-02-25 | 2018-03-20 | 株式会社熊谷組 | 音源推定用画像の作成装置 |
CN104914409B (zh) * | 2014-03-10 | 2017-11-07 | 李文嵩 | 智能住宅定位装置 |
DE102014217598A1 (de) * | 2014-09-03 | 2016-03-03 | Gesellschaft zur Förderung angewandter Informatik e.V. | Verfahren und Anordnung zur Erfassung von akustischen und optischen Informationen sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium |
CN105070304B (zh) * | 2015-08-11 | 2018-09-04 | 小米科技有限责任公司 | 实现对象音频录音的方法及装置、电子设备 |
CN109696658B (zh) | 2017-10-23 | 2021-08-24 | 京东方科技集团股份有限公司 | 采集设备、声音采集方法、声源跟踪系统及其方法 |
JP6589041B1 (ja) * | 2018-01-16 | 2019-10-09 | ハイラブル株式会社 | 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3232608B2 (ja) * | 1991-11-25 | 2001-11-26 | ソニー株式会社 | 収音装置、再生装置、収音方法および再生方法、および、音信号処理装置 |
JPH05244587A (ja) | 1992-02-26 | 1993-09-21 | Mitsubishi Electric Corp | テレビ会議用カメラ制御装置 |
US5402499A (en) * | 1992-08-07 | 1995-03-28 | Lsi Logic Corporation | Multimedia controller |
JPH06105306A (ja) * | 1992-09-16 | 1994-04-15 | Funai Denki Kenkyusho:Kk | テレビ会議システム |
JPH0739000A (ja) | 1992-12-05 | 1995-02-07 | Kazumoto Suzuki | 任意の方向からの音波の選択的抽出法 |
JP2937009B2 (ja) * | 1994-03-30 | 1999-08-23 | ヤマハ株式会社 | 音像定位制御装置 |
CA2148631C (en) | 1994-06-20 | 2000-06-13 | John J. Hildin | Voice-following video system |
JP3714706B2 (ja) * | 1995-02-17 | 2005-11-09 | 株式会社竹中工務店 | 音抽出装置 |
JP2947113B2 (ja) | 1995-03-09 | 1999-09-13 | 日本電気株式会社 | 画像通信端末用ユーザインタフェース装置 |
JPH0933330A (ja) | 1995-07-17 | 1997-02-07 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号分離方法およびこの方法を実施する装置 |
GB2309105A (en) * | 1996-01-12 | 1997-07-16 | Ibm | Intuitive GUI in the form of a representation of a physical environment |
AUPN988996A0 (en) * | 1996-05-16 | 1996-06-06 | Unisearch Limited | Compression and coding of audio-visual services |
JP3537962B2 (ja) * | 1996-08-05 | 2004-06-14 | 株式会社東芝 | 音声収集装置及び音声収集方法 |
EP1016002A4 (en) * | 1996-09-04 | 2000-11-15 | David A Goldberg | METHOD AND DEVICE FOR PRODUCING PERSONAL-SPECIFIC IMAGES IN A PUBLIC SPACE |
JP3355598B2 (ja) * | 1996-09-18 | 2002-12-09 | 日本電信電話株式会社 | 音源分離方法、装置及び記録媒体 |
US6021206A (en) * | 1996-10-02 | 2000-02-01 | Lake Dsp Pty Ltd | Methods and apparatus for processing spatialised audio |
TW379309B (en) * | 1997-05-16 | 2000-01-11 | Samsung Electronics Co Ltd | Signal management apparatus and method using on screen display |
US6072522A (en) * | 1997-06-04 | 2000-06-06 | Cgc Designs | Video conferencing apparatus for group video conferencing |
JP3541339B2 (ja) * | 1997-06-26 | 2004-07-07 | 富士通株式会社 | マイクロホンアレイ装置 |
JPH1141577A (ja) | 1997-07-18 | 1999-02-12 | Fujitsu Ltd | 話者位置検出装置 |
US6192134B1 (en) * | 1997-11-20 | 2001-02-20 | Conexant Systems, Inc. | System and method for a monolithic directional microphone array |
US5940118A (en) * | 1997-12-22 | 1999-08-17 | Nortel Networks Corporation | System and method for steering directional microphones |
US6005610A (en) * | 1998-01-23 | 1999-12-21 | Lucent Technologies Inc. | Audio-visual object localization and tracking system and method therefor |
US6311155B1 (en) * | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
-
1999
- 1999-06-11 JP JP16518299A patent/JP3195920B2/ja not_active Expired - Fee Related
-
2000
- 2000-06-07 US US09/926,673 patent/US7035418B1/en not_active Expired - Lifetime
- 2000-06-07 EP EP00935570A patent/EP1205762B1/en not_active Expired - Lifetime
- 2000-06-07 DE DE60036216T patent/DE60036216T2/de not_active Expired - Lifetime
- 2000-06-07 ES ES00935570T patent/ES2292441T3/es not_active Expired - Lifetime
- 2000-06-07 WO PCT/JP2000/003695 patent/WO2000077537A1/ja active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
DE60036216D1 (de) | 2007-10-11 |
EP1205762B1 (en) | 2007-08-29 |
US7035418B1 (en) | 2006-04-25 |
JP2000356674A (ja) | 2000-12-26 |
DE60036216T2 (de) | 2008-05-15 |
EP1205762A1 (en) | 2002-05-15 |
EP1205762A4 (en) | 2005-07-06 |
WO2000077537A1 (fr) | 2000-12-21 |
JP3195920B2 (ja) | 2001-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2292441T3 (es) | Metodo y aparato para determinar una fuente de sonido. | |
CN105659287B (zh) | 图像处理装置、图像处理方法和成像系统 | |
US20190075284A1 (en) | Stereo camera and method of controlling stereo camera | |
KR20210030359A (ko) | 촬상 장치 및 차량 제어 시스템 | |
JP5731529B2 (ja) | 複数の検出器アレイを備えた多重解像度デジタル大判カメラ | |
ES2881320T3 (es) | Dispositivo de generación, procedimiento de generación y programa para modelo tridimensional | |
ES2302750T3 (es) | Alineamiento preciso de imagenes en sistemas de imagenes digitales emparejando puntos en las imagenes. | |
KR20160129779A (ko) | 비-라이트 필드 이미징 디바이스를 사용하여 라이트 필드 데이터를 획득하는 방법, 대응하는 디바이스, 컴퓨터 프로그램 제품 및 비일시적 컴퓨터 판독가능 캐리어 매체 | |
WO2019106999A1 (ja) | 撮像装置および方法、並びに、撮像素子 | |
JP2004504631A (ja) | 少なくとも2つの第1カメラと第2カメラを有するカメラシステム | |
US20130223679A1 (en) | Movement analysis and/or tracking system | |
CN104333690B (zh) | 摄影装置以及摄影方法 | |
JPWO2011013179A1 (ja) | 移動体位置検出装置および移動体位置検出方法 | |
JP2018006785A (ja) | 信号処理装置、撮像装置、及び信号処理方法 | |
CN105922268A (zh) | 信息处理装置、处理系统、物体移动系统和物体移动方法 | |
Pringle et al. | Topics: Virtual geological outcrops–fieldwork and analysis made less exhaustive? | |
CN110441737A (zh) | 一种采用鱼眼镜头的声源定位方法及其设备 | |
JP2017005395A (ja) | 撮像装置、撮像制御方法及びプログラム | |
US20200128188A1 (en) | Image pickup device and image pickup system | |
US20180143410A1 (en) | Device and method for imaging an object | |
JP2016048825A (ja) | 撮像装置 | |
JP2016048824A (ja) | 追尾装置、追尾システム、及び表示装置 | |
JP2012169811A (ja) | 撮像装置、マイクロホン装置、撮像システム及びプログラム | |
KR101705715B1 (ko) | 항공촬영정보를 대상물별로 실행한 3차원 도화이미지를 합성하는 영상도화장치 | |
Phelps et al. | Herbig-Haro Flows in Ophiuchus |