DE60036216T2 - Verfahren und gerät zur bestimmung einer tonquelle - Google Patents

Verfahren und gerät zur bestimmung einer tonquelle Download PDF

Info

Publication number
DE60036216T2
DE60036216T2 DE60036216T DE60036216T DE60036216T2 DE 60036216 T2 DE60036216 T2 DE 60036216T2 DE 60036216 T DE60036216 T DE 60036216T DE 60036216 T DE60036216 T DE 60036216T DE 60036216 T2 DE60036216 T2 DE 60036216T2
Authority
DE
Germany
Prior art keywords
sound
processing means
sound sources
information
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60036216T
Other languages
English (en)
Other versions
DE60036216D1 (de
Inventor
Hiroshi Okuno
Hiroaki Kawagoe-shi KITANO
Yukiko Kawasaki-shi NAKAGAWA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Publication of DE60036216D1 publication Critical patent/DE60036216D1/de
Application granted granted Critical
Publication of DE60036216T2 publication Critical patent/DE60036216T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung bezieht sich auf eine Vorrichtung und ein Verfahren zur Schallquellen-Identifizierung zum einzelnen Identifizieren verschiedener Schalle anhand von Bildinformationen und Schallinformationen, die aus mehreren derartigen Schallquellen abgeleitet werden.
  • Stand der Technik
  • Bislang wurden Forschungen dazu unternommen, aus gemischten Schallen einen bestimmten Schall, wie etwa einen Sprach- oder einen Musikschall, der in den gemischten Schallen enthalten ist, zu trennen. Beispielsweise ist ein Schallerkennungssystem bekannt, das annimmt, dass sein Eingangsschall aus Sprache oder Stimmen besteht. Und hinsichtlich Bildern oder der Bildverarbeitung ist ein System bekannt, das beim Extrahieren eines Objekts dessen Farbe, Form und oder Bewegung annimmt, um es zu charakterisieren.
  • Ein Schallerkennungssystem, das eine Schallerkennung mit einer Bildverarbeitung verknüpft, ist aus JP 11018194 und dessen Übersetzung US 6.317.501 oder aus WO 97 43856 bekannt. Andererseits wird das System, das Sprache oder Stimmen annimmt, nur ausgeführt, wenn sich ein Mikrofon in der Nähe des Mundes befindet oder wenn keine andere Schallquelle vorhanden ist.
  • Ferner wurde zwar ein System vorgeschlagen, um anhand einer harmonischen Struktur aus den Schallsignalen von mehreren Schallquellen ein bestimmtes zu trennen und dann die Richtung zu finden, in der sich dessen Schallquelle befindet, doch ist die Genauigkeit, mit der die Richtung der Schallquelle dadurch gefunden werden kann, nur bis auf etwa ±10° genau, und es ist nicht möglich, die Schallquelle zu trennen, wenn sie sich in der Nähe einer oder mehrerer benachbarter Schallquellen befindet.
  • Ferner wurde ein Verfahren vorgeschlagen, das mehrere Schallsammelmikrofone in gleicher Anzahl wie der der Schallquellen verwendet, um anhand von Schallinformationen von den verschiedenen Schallsammelmikrofonen eine bestimmte Schallquelle zu identifizieren. Obwohl dieses Verfahren dazu entworfen ist, die Intensität eines Schalls und die Position von dessen Quelle zu identifizieren, stellt sich heraus, dass seine Frequenzinformationen sich um die Achse ausbreiten, die die Richtung definiert, in der sich die Schallquelle befindet, sodass es schwierig wird, die Schallquelle deutlich zu identifizieren. Ferner ermöglicht es dieses Verfahren zwar, die Erkennungsrate einer Schallquelle zu steigern, doch wird das Verfahren kostspielig, da Schallsammelmikrophone in gleicher Anzahl wie der der Schallquellen erforderlich sind, die unabhängig voneinander vorliegen.
  • Darauf gerichtet, die sich nach dem Stand der Technik, wie oben beschrieben, ergebenden Schwierigkeiten zu vermeiden, hat die vorliegende Erfindung als ihre erste Aufgabe, eine Schallquellen-Identifizierungs-Vorrichtung zu schaffen, die in der Lage ist, ein Objekt als eine Quelle eines Schalls in gemischten Schallen mit größerer Genauigkeit im Hinblick auf seinen Ort zu identifizieren, indem Informationen bezüglich des Schalls und Informationen bezüglich der Schallquelle als ein Bild hiervon sowie Informationen bezüglich dieser Position verwendet werden, um den Schall aus den gemischten Schallen mit angemessener Genauigkeit zu trennen.
  • Die vorliegende Erfindung hat ferner als ihre zweite Aufgabe, ein Schallquellen-Identifizierungs-Verfahren zu schaffen, das in der Lage ist, ein Objekt als eine Quelle eines Schalls in gemischten Schallen mit größerer Genauigkeit im Hinblick auf seine Position zu identifizieren, indem Informationen bezüglich des Schalls und Informationen bezüglich der Schallquelle als ein Bild hiervon sowie Informationen bezüglich dieser Position verwendet werden, um den Schall aus den gemischten Schallen mit angemessener Genauigkeit zu isolieren.
  • Offenbarung der Erfindung
  • Um die erste oben erwähnte Aufgabe zu lösen, wird in Übereinstimmung mit der vorliegenden Erfindung eine Schallquellen-Identifizierungs- und -Trennungs-Vorrichtung in Übereinstimmung mit Anspruch 1 geschaffen.
  • Die Vorrichtung ist ferner dadurch gekennzeichnet, dass die Richtung jedes der sämtlichen Objekte, die möglicherweise die Schallquellen sind, durch das Bildverarbeitungsmittel anhand einer Farbe und/oder einer Form und/oder einer Höhe hiervon bestimmt wird.
  • Die Vorrichtung ist ferner dadurch gekennzeichnet, dass das Erfassungsmittel so beschaffen ist, dass es die Objekte, die möglicherweise die Schallquellen sind, in Reaktion auf einen Magnetismus hiervon erfasst.
  • Die Vorrichtung ist ferner dadurch gekennzeichnet, dass das Erfassungsmittel so beschaffen ist, dass es die Objekte, die möglicherweise die Schallquellen sind, in Reaktion auf Infrarotstrahlen, die sie emittieren, erfasst.
  • Die Vorrichtung ist ferner dadurch gekennzeichnet, dass die Objekte, die möglicherweise die Schallquellen sind, jeweils ein daran befestigtes Material aufweisen, das Magnetismus überträgt.
  • Die Vorrichtung ist ferner dadurch gekennzeichnet, dass das Bildverarbeitungsmittel eine Funktion zum Bestimmen der Richtung sämtlicher Objekte, die möglicherweise die Schallquellen sind, anhand einer Farbe eines solchen Objekts besitzt.
  • Die Vorrichtung ist ferner dadurch gekennzeichnet, dass das Bildverarbeitungsmittel eine Funktion zum Bestimmen der Richtung sämtlicher Objekte, die möglicherweise die Schallquellen sind, anhand einer Form eines solchen Objekts besitzt.
  • Die Vorrichtung ist ferner dadurch gekennzeichnet, dass das Bildverarbeitungsmittel eine Funktion zum Bestimmen von Richtungen sämtlicher Objekte, die möglicherweise die Schallquellen sind, anhand einer Farbe, einer Form und einer Höhe zusammen eines solchen Objekts besitzt.
  • Mit einer Konstruktion wie der oben erwähnten ist die Schallquellen-Identifizierungs- und -Trennungs-Vorrichtung der vorliegenden Erfindung beim Lokalisieren der Orte von Schallquellen gemäß den von den Schallsammelmikrofonen erfassten Schallinformationen so entworfen, dass sie die Richtungen der Schallquellen in Bezug auf die Positionsinformationen anhand der Informationen bezüglich von dem Abbildungsmittel abgebildeter Bilder und der Informationen bezüglich der von dem Erfassungsmittel erfassten Richtungen einengt. Dementsprechend wird die Schallquellen-Identifizierungs- und -Trennungs-Vorrichtung der vorliegenden Erfindung in die Lage versetzt, die Objekte zu bestimmen, die die Schallquellen sein können, wobei animierte Bilder und Richtungsinformationen der Objekte verwendet werden, sowie gleichzeitig die Schallquellen zuverlässig einzeln zu trennen, wobei deren Positionsinformationen und Schallinformationen verwendet werden.
  • Um die zweite oben erwähnte Aufgabe zu lösen, wird in Übereinstimmung mit der vorliegenden Erfindung ferner ein Schallquellen-Identifizierungs- und -Trennungs-Verfahren in Übereinstimmung mit Anspruch 8 geschaffen.
  • Das Verfahren ist ferner dadurch gekennzeichnet, dass die Richtung sämtlicher Objekte, die möglicherweise die Schallquellen sind, durch das Bildverarbeitungsmittel anhand einer Farbe und/oder einer Form und/oder einer Höhe hiervon bestimmt wird.
  • Das Verfahren ist ferner dadurch gekennzeichnet, dass die Richtungserfassung durch das Erfassungsmittel in Reaktion auf einen Infrarotstrahl erfolgt.
  • Das Verfahren ist ferner dadurch gekennzeichnet, dass die Richtungserfassung durch das Erfassungsmittel in Reaktion auf Magnetismus erfolgt.
  • Das Verfahren ist ferner dadurch gekennzeichnet, dass die Richtung sämtlicher Objekte, die möglicherweise die Schallquellen sind, durch das Bildverarbeitungsmittel anhand einer Farbe hiervon bestimmt wird.
  • Das Verfahren ist ferner dadurch gekennzeichnet, dass die Richtung jedes der Objekte, die möglicherweise die Schallquellen sind, durch das Bildverarbeitungsmittel anhand einer Form hiervon bestimmt wird.
  • Das Verfahren ist ferner dadurch gekennzeichnet, dass die Richtung jedes der Objekte, die möglicherweise die Schallquellen sind, durch das Bildverarbeitungsmittel anhand einer Farbe, einer Form und einer Höhe hiervon bestimmt wird.
  • Das Verfahren ist ferner dadurch gekennzeichnet, dass die Bestimmung der Richtung jeder der Schallquellen durch das Schallverarbeitungsmittel anhand von Schallinformationen für eine Phasen- und eine Intensitätsdifferenz durch Bestimmen einer Position jeder der Schallquellen anhand eines Signals für jedes von Frequenzbändern, in die sie beliebig unterteilt sind, erfolgt.
  • Das Verfahren ist ferner dadurch gekennzeichnet, dass die Positionsinformationen des Objekts, das möglicherweise die Schallquelle ist, aus einer Bewegung des Objekts abgeleitet werden.
  • Indem es wie oben erwähnt organisiert ist, ermöglicht es das Schallquellen-Identifizierungs-Verfahren in Übereinstimmung mit der vorliegenden Erfindung nicht nur, dass Schallinformationen von mehreren Schallquellen von einem Schallsammelmittel, das aus den zwei Schallsammelmikrofonen gegenüber den Schallquellen besteht, abgeleitet werden, sondern auch, dass Bildinformationen dieser Schallquellen aus Bildern hiervon, die von einem Abbildungsmittel abgebildet werden, abgeleitet werden. Ferner führt ein Erfassen der Richtungen der Schallquellen durch Magnetismus oder einen Infrarotstrahl zu Richtungserfassungsinformationen. Und wenn das Schallverarbeitungsmittel die Orte der Schallquellen anhand von Schallinformationen, z. B. anhand einer Phasendifferenz und einer Intensitätsdifferenz in Schallinformationen, die von den Schallsammelmikrofonen für jede der Schallquellen erfasst werden, lokalisiert, wird die Richtung jeder der Schallquellen in Bezug auf Positionsinformationen, die für jedes der Objekte, die möglicherweise die Schallquellen sind, von einem Bildverarbeitungsmittel z. B. anhand seiner Farbe, Form und/oder Bewegung auf der Grundlage der Richtungserfassungsinformationen und/oder der von dem Abbildungsmittel abgeleiteten Bildinformationen abgeleitet werden, eingeengt, wodurch es möglich wird, die Schallquellen bezüglich ihrer Orte anhand von Signalen in verschiedenen Frequenzbändern, z. B. von harmonischen Strukturen, zu lokalisieren. Folglich macht das Verfahren es unnötig, die Schallinformationen beim Identifizieren der Schallquellen omnidirektional oder über sämtliche Richtungen zu verarbeiten, und ermöglicht es, die Schallquelle mit größerer Sicherheit zu identifizieren, sowie bewirkt, dass eine geringere Menge an verarbeitbaren Informationen ausreicht, und ermöglicht es, die Verarbeitungszeit zu verringern.
  • In diesem Fall ermöglicht es die Fähigkeit, drei oder mehr Schallquellen mit zwei Schallsammelmikrofonen im Schallsammelmittel zu identifizieren, eine genaue Identifizierung der Positionen von Schallquellen in einer einfachen Konstruktion auszuführen.
  • Ferner ergibt sich, da das Verfahren, wie oben dargelegt, so ausgeführt wird, dass der dritte Schritt, bei dem Informationen bezüglich grober Orte der Schallqueller nur aus den Schallinformationen der im ersten Schritt gesammelten Schalle abgeleitet werden, einbezogen ist, und dass der vierte Schritt im Voraus ein Einengen von Richtungen der Schallquellen anhand der groben, im dritten Schritt abgeleiteten Positionsinformationen, wobei die Positionsinformationen der Objekte, die möglicherweise die Schallquellen sind, abgeleitet werden, umfasst, eine Verringerung der Informationsmenge zum Verarbeiten beim Ableiten der Positionsinformationen der Objekte, die möglicherweise die Schallquellen sind, anhand von Bildinformationen im dritten Schritt, wodurch die Verarbeitung vereinfacht wird.
  • Kurzbeschreibung der Zeichnungen
  • Die vorliegende Erfindung wird anhand der nachstehenden ausführlichen Beschreibung und der hier beigefügten Zeichnungen besser verstanden, die bestimmte veranschaulichende Formen der Ausführungsform der vorliegenden Erfindung zeigen. Im Zusammenhang damit ist anzumerken, dass derartige Formen der Ausführungsform, die in den beigefügten Zeichnungen hiervon veranschaulicht sind, in keiner Weise dazu bestimmt sind, die vorliegende Erfindung einzuschränken, sondern dazu, ihre Erläuterung und ihr Verständnis zu erleichtern.
  • In den Zeichnungen ist:
  • 1 eine graphische Darstellung, die den Aufbau einer ersten Form der Ausführungsform der Schallquellen-Identifizierungs-Vorrichtung in Übereinstimmung mit der vorliegenden Erfindung veranschaulicht;
  • 2 eine graphische Darstellung eines beispielhaft Bildes, das von einem Abbildungsmittel in der in 1 gezeigten Schallquellen-Identifizierungs- Vorrichtung aufgenommen oder abgebildet wird;
  • 3 eine erläuternde Ansicht für das Bild in der Schallquellen-Identifizierungs-Vorrichtung von 1 ist, wobei (A) grobe, von einem Schallverarbeitungsmittel bestimmte Richtungen A0, B0 und C0 von Schallquellen zeigt, (B) Rahmen A1, B1 und C1 von Objekten zeigt, die als die von einem Bildverarbeitungsmittel bestimmten Schallquellen in Frage kommen, und (C) Teile von Positionsinformationen A3, B3 und C3 der Objekte zeigt, die als die von einem Bildverarbeitungsmittel bestimmten Schallquellen in Frage kommen;
  • 4 eine erläuternde Ansicht, die eine Differenz im Abstand zwischen einer Schallquelle und zwei Schallsammelmikrofonen veranschaulicht, die in einem Schallsammelmittel in der Schallquellen-Identifizierungs-Vorrichtung von 1 enthalten sind;
  • 5 ein Diagramm, das eine Operation eines Richtungsfilters veranschaulicht, das in dem Schallverarbeitungsmittel in der Schallquellen-Identifizierungs-Vorrichtung von 1 enthalten ist;
  • 6 ein Diagramm, das das Extrahieren von zwei Teilen von Schallinformationen für einen Schall von einer einzelnen Schallquelle veranschaulicht, das in dem Schallverarbeitungsmittel in der Schallquellen-Identifizierungs-Vorrichtung von 1 ausgeführt wird;
  • 7 eine erläuternde Ansicht, die das Extrahieren von Schallinformationen von jeder Schallquelle veranschaulicht, das von dem Richtungsfilter in dem Schallverarbeitungsmittel in der Schallquellen-Identifizierungs-Vorrichtung von 1 ausgeführt wird;
  • 8 ein Ablaufplan, der ein Verfahren zum Betrieb der Schallquellen-Identifizierungs-Vorrichtung von 1 veranschaulicht;
  • 9 ein graphisches Schaubild, das einen Abschnitt von aufeinander folgenden Bildern veranschaulicht, die von dem Abbildungsmittel in der Schallquellen-Identifizierungs-Vorrichtung von 1 aufgenommen werden; und
  • 10 ein Diagramm, das Informationen bezüglich Positionen veranschaulicht, die von dem Bildverarbeitungsmittel auf vielfältiger Grundlage eines Objekts bestimmt werden, das eine Schallquelle in der Schallquellen-Identifizierungs-Vorrichtung von 1 sein kann.
  • Beste Arten zum Ausführen der Erfindung
  • Im Folgenden wird die vorliegende Erfindung für eine Vorrichtung und ein Verfahren zur Schallquellen-Identifizierung mit Bezug auf derzeit beste Formen der Ausführungsformen hiervon ausführlich beschrieben, die in den Figuren der Zeichnung veranschaulicht sind.
  • 1 zeigt eine Form der Ausführungsform der Schallquellen-Identifizierungs-Vorrichtung in Übereinstimmung mit der vorliegenden Erfindung.
  • Wie in 1 gezeigt ist, umfasst die Schallquellen-Identifizierungs-Vorrichtung 10 ein Schallsammelmittel 11, ein Abbildungsmittel 12, ein Bildverarbeitungsmittel 13, ein Schallverarbeitungsmittel 14 und ein Steuermittel 15.
  • Das Schallsammelmittel 11 ist so entworfen, dass es Schalle von mehreren Schallquellen, beispielsweise drei Sprechern, mit einem Paar Schallsammelmikrofone 11a und 11b einfängt, die über einen im Voraus gewählten Abstand D nebeneinander angeordnet sind, wie in 1 gezeigt ist, und sich gegenüber den Schallquellen befinden, und dass es die eingefangen Schalle verarbeitet. Während die Anordnung dieser Schallsammelmikrofone auf irgendeine geeignete Art und Weise eingerichtet sein kann, sind diese in dem gezeigten Beispiel an gegenüberliegenden Seiten des Abbildungsmittels 12 vorgesehen, und zwar an der rechten und an der linken Seite.
  • Das Abbildungsmittel 12 wird beispielsweise von einer CCD-Kamera (einer Kamera mit ladungsgekoppeltem Bauelement) gebildet und ist, wie in 2 gezeigt ist, so entworfen, dass es aufeinander folgend Bilder von mehreren Schallquellen, z. B. drei Sprechern A, B und C, aufnimmt.
  • Das Bildverarbeitungsmittel 13 ist so entworfen, dass es Informationen bezüglich der Orte von Objekten, die Schallquellen sein können, in von dem Abbildungsmittel 12 aufgenommenen Bildern und anhand ihrer Farbe, Form oder Bewegung ableitet. Hier ist anzumerken, dass der Begriff "Bewegung" dazu bestimmt ist, auch Vibrationen zu umfassen.
  • In diesem Fall erstellt das Bildverarbeitungsmittel 13 in dem und für das vom Abbildungsmittel 12 aufgenommene Bild für die drei Sprecher A, B und C gemäß der Farbe (d. h. der Hautfarbe eines Menschen) und der Höhe, wie in 3(B) gezeigt ist, Rahmen A1, B1 und C1. Dann wählt das Bildverarbeitungsmittel 13, wie in 3(C) gezeigt ist, Zentralpunkte A2, B2 und C2 dieser Rahmen A1, B1 und C1 (in 3 durch die Markierungen + dargestellt) als die jeweiligen Orte der Objekte aus, die möglicherweise Schallquellen sein können, und verwendet ihre jeweiligen horizontalen Koordinaten A3, B3 und C3 als Informationen über diese Positionen.
  • An diesem Punkt muss angemerkt werden, dass der Grund für die Verwendung der Begriffe "Objekte", die "Schallquellen" "sein können", "möglicherweise sind" oder als solche "in Frage kommen" darin liegt, dass es anhand der Bilderkennung allein nicht klar ist, ob sie tatsächlich Schallquellen sind oder nicht.
  • Um die oben erwähnte Bildverarbeitung zu vereinfachen, sollte das Bildverarbeitungsmittel 13 zuvor über darin eingegebene grobe Richtungen A0, B0 und C0 dieser Schallquellen verfügen (siehe 3(A)), die von dem Schallverarbeitungsmittel 14 bestimmt werden, das weiter unten ausführlich beschrieben wird. Dadurch leitet das Bildverarbeitungsmittel 13, nachdem es die jeweiligen Bereiche der Bildverarbeitung der Schallquellen in die groben Richtungen A0, B0 und C0 eingeengt hat, wie oben erwähnt Informationen A3, B3 und C3 bezüglich der jeweiligen Orte der Objekte, die die Schallquellen sein können, ab, indem die Bildverarbeitung innerhalb der eingeengten Bereiche der groben Richtungen A0, B0 und C0 ausgeführt wird.
  • Das Schallverarbeitungsmittel 14 ist so entworfen, dass es die Orte der Schallquellen beispielsweise anhand der von den Mikrofonen in dem Schallsammelmittel 11 abgeleiteten Schallinformationen und der Positionsinformationen A3, B3 und C3 lokalisiert, die von dem Bildverarbeitungsmittel 13 abgeleitet werden.
  • Bei der Identifizierung der Positionen der Schallquellen können die Schallinformationen auf einer Phasendifferenz und einer Intensitätsdifferenz zwischen zwei Teilen von Schallinformationen beruhen, die durch die Schallsammelmikrofone 11a und 11b an der rechten bzw. an der linken Seite empfangen werden.
  • Dadurch kann hier beim Ableiten von Schallinformationen aus einer gegebenen Schallquelle, wie es in 4 gezeigt ist, die Tatsache ausgenutzt werden, dass bei einer Veränderung in Abhängigkeit von der Richtung θ, in der sich ein Schall von der Schallquelle ausbreitet, der an den zwei Schallsammelmikrofonen 11a und 11b ankommt (wobei θ = 0 ist, wenn sich die Schallquelle davor befindet, und negativ ist, wenn sie sich links von ihnen befindet, und positiv ist, wenn sie sich rechts von ihnen befindet), eine Differenz d zwischen Abständen von der Schallquelle zu den zwei Mikrofonen 11a und 11b (durch die Gleichung d = D sin θ ausgedrückt) bewirkt, dass der Schall in der Phase variiert und außerdem infolge Dämpfung in der Intensität variiert, wenn er bei ihnen ankommt.
  • Da außerdem der Ort der Schallquelle noch nicht klar ist, führt das Schallverarbeitungsmittel 14 hier eine Verarbeitung, wie oben erwähnt, über die gesamten Winkelbereiche aus: –90 Grad ≤ θ ≤ +90 Grad. In diesem Fall kann der Verarbeitungsvorgang dadurch erleichtert werden, dass beispielsweise jedes Winkelintervall, zum Beispiel 5 Grad in θ, verarbeitet wird.
  • Das Schallverarbeitungsmittel 14 wählt oder bestimmt zunächst grobe Richtungen A0, B0 und C0 der Schallquellen anhand von Schallinformationen links und rechts von dem Schallsammelmittel 11. Dies folgt dem herkömmlichen Verfahren der Schallquellen-Identifizierung (siehe JP 9-33330 A ) und liefert eine Genauigkeit von ±10 Grad.
  • Außerdem gibt das Schallverarbeitungsmittel 15 diese groben Richtungen A0, B0 und C0 für die Eingabe in das Bildverarbeitungsmittel 13 aus.
  • Ferner lokalisiert das Schallverarbeitungsmittel 14 mit Bezug auf die von dem Bildverarbeitungsmittel 13 darin eingegebenen Positionsinformationen A3, B3 und C3 die Orte der Schallquellen, wiederum anhand der Schallinformationen, die in die Bereiche der Positionsinformationen A3, B3 und C3 eingeengt wurden, und zwar in den Bereichen der Positionsinformationen A3, B3 und C3.
  • In diesem Fall lokalisiert das Schallverarbeitungsmittel 14 die Orte der Schallquellen, indem es eine geeignete Auswahl aus so genannten Richtungsfiltern für die Schallquellen A, B bzw. C trifft.
  • Hier werden derartige Richtungsfilter, die erstellt wurden, um Schallinformationen nur zu einer bestimmten Zeit t0 selektiv zu extrahieren, in einer Steuerungstabelle für die Richtungen von Schallquellen in einem (nicht gezeigten) Hilfsspeichermittel im Steuermittel 15 gespeichert und werden durch das Schallverarbeitungsmittel 14 aus dem Hilfsspeichermittel anhand der Positionsinformationen A3, B3 und C3 aus dem Bildverarbeitungsmittel 13 als geeignet identifiziert sowie ausgewählt.
  • Dies ermöglicht es, dass von Schallquellen konkurrent emittierte und von den Schallsammelmikrophonen 11a und 11b gesammelte Teile von Schallinformationen erfasst werden, wenn, wie in 6 gezeigt ist, zur Zeit t1 ein Teil von Schallinformationen an der rechten Seite gegeben ist und dann ein anderer Teil von Informationen an der linke Seite zur Zeit t2 herausgenommen wird, die um eine Verzögerungszeit Δt später liegt (t2 = t1 + Δt). Es ist jedoch zu beachten, dass Δt trotzdem negativ sein kann.
  • Auf diese Weise ermöglicht es die Auswahl bestimmter Richtungsfilter durch das Schallverarbeitungsmittel 14 in Bezug auf jede der Schallquellen A, B und C, die Richtungsinformationen mit einem gewissen Grad von Genauigkeit besitzen, dass ihre jeweiligen Teile von Schallinformationen aus der Mischung von Schallen erhalten werden, wie es in 7 gezeigt ist.
  • An diesem Punkt muss angemerkt werden, dass ein Einengen der jeweiligen Bereiche der Richtungen der Schallquellen durch die Teile von Positionsinformationen A3, B3 und C3 es für das Schallverarbeitungsmittel 14 unnötig macht, eine Verarbeitung über den gesamten Winkelbereich von für θ (mit –90 Grad ≤ θ ≤ +90 Grad) auszuführen, und dass es ausreicht, dass es einen bestimmten eingeengten Winkelbereich um die Teile von Positionsinformationen A3, B3 und C3 verarbeitet.
  • Das Steuermittel 15, das beispielsweise aus einem Computer bestehen kann, ist so entworfen, dass es die Operationen des Schallsammelmittels 11, des Abbildungsmittels 12, des Bildverarbeitungsmittels 13 und des Schallverarbeitungsmittels 14 steuert. Das Steuermittel 15, wie es oben erwähnt ist, besitzt die Richtungsfilter, die in dem (nicht gezeigten) Hilfsspeichermittel so gespeichert sind, wie sie voreingestellt wurden.
  • Indem sie so wie oben erwähnt konstruiert ist, arbeitet die Schallquellen-Identifizierungs-Vorrichtung 10 in Übereinstimmung mit der vorliegenden Form der Ausführungsform gemäß dem in 8 gezeigten Ablaufplan so, wie es nachstehend beschrieben wird.
  • Wie in 8 gezeigt ist, wirkt das Steuermittel 15 im Schritt ST1 auf das Schallsammelmittel 11 so ein, dass jedes der Schallsammelmikrofone 11a und 11b dazu veranlasst wird, Schall aus Schallquellen A, B und C zu sammeln, während das Steuermittel 15 zwischenzeitlich außerdem auf das Abbildungsmittel 12 so einwirkt, dass dieses dazu veranlasst wird, im Schritt ST2 die Schallquellen aufeinander folgend abzubilden.
  • Danach wirkt das Steuermittel 15 im Schritt ST3 auf das Schallverarbeitungsmittel 14 so ein, dass dieses dazu veranlasst wird, anhand von Teilen von Schallinformationen für eine Phasendifferenz und eine Intensitätsdifferenz, die der Schall von jeder der Schallquellen aufweist, wenn er durch die zwei entsprechenden Mikrofone im Schallsammelmittel 11 gesammelt wird, grobe Richtungen A0, B0 und C0 auszuwählen oder zu bestimmen, in denen die entsprechenden Schallquellen lokalisiert sind (siehe 3(A)). Dann werden sämtliche harmonischen Strukturen, in denen irgendeine Phasendifferenz vorliegt, untersucht, um die Schallquellen aus der Schallmischung grob zu trennen. Hier ist nachzutragen, dass eine harmonische Struktur als ein Standard eines Beispiels für ein Signal für jedes der Frequenzbänder erstellt wird, in die es beliebig unterteilt ist.
  • Anschließend wirkt das Steuermittel 15 im Schritt ST4 auf das Bildverarbeitungsmittel 13 so ein, dass dieses dazu veranlasst wird, bezüglich Objekten als möglichen Schallquellen gemäß einer Farbe und/oder einer Form hiervon in von dem Abbildungsmittel 12 empfangenen Bildern sowie innerhalb der Bereiche der von dem Schallverarbeitungsmittel 14 empfangenen groben Richtungen, Positionsinformationen A3, B3 und C3 auszuwählen oder zu bestimmen (siehe 3(C)).
  • Danach wirkt das Steuermittel 15 im Schritt ST5 auf das Schallverarbeitungsmittel 14 so ein, dass dieses dazu veranlasst wird, die Orte der Schallquellen A, B und C gemäß den Schallinformationen zu lokalisieren, die von dem Schallsammelmittel innerhalb eines gegebenen Winkelbereichs für die von dem Bildverarbeitungsmittel 14 empfangenen Positionsinformationen A3, B3 und C3 empfangen werden.
  • Schließlich wählt das Schallverarbeitungsmittel 14 im Schritt ST6 einen bestimmten Richtungsfilter aus, um Schallinformationen aus einem gleichen Schall von einer gleichen Schallquelle und mit einer bestimmten Verzögerungszeit selektiv zu extrahieren. Auf diese Weise ist zu erkennen, dass die Schallquellen-Identifizierungs-Vorrichtung 10 in Übereinstimmung mit der veranschaulichten Form der Ausführungsform der vorliegenden Erfindung – bei der das Schallverarbeitungsmittel 14 beim Identifizieren einer Schallquelle dazu veranlasst wird, nicht nur anhand von vom Schallsammelmittel 11 empfangenen Schallinformationen, sondern auch anhand eines durch das Abbildungsmittel 12 abgebildeten Bildes zu arbeiten – trotz des Bezugs auf Positionsinformationen A3, B3, C3 eines Objekts, das die Schallquelle sein kann, die Fähigkeit hat, eine Schallquelle mit einer Genauigkeit zu identifizieren, die gegenüber der von etwa ±10 Grad gesteigert ist, die mit dem herkömmlichen System erreichbar ist, bei dem nur auf Schallinformationen vom Schallsammelmittel 11 Bezug genommen wird.
  • Es ist außerdem zu erkennen, dass ein Steigern der Genauigkeit des Lokalisierens des Orts einer Schallquelle durch Verfeinern von Schallinformationen, die im Voraus die Schallquelle von einer anderen Schallquelle mit aus Bildinformationen abgeleiteten Positionsinformationen grob trennen, ihre Identifizierung auch dann zuverlässig macht, wenn sie sich nahe beieinander befinden.
  • Genauer gesagt sind, wenn drei Sprecher durch das Abbildungsmittel 12 aufeinander folgend als Schallquellen abgebildet werden, beispielsweise Bilder wie in 9 gezeigt verfügbar, in denen sie zum 7., 51., 78. und 158. Rahmen sämtlicher aufeinander folgend abgebildeter Bilder gehören.
  • Hier sind die Gesichter dieser Sprecher so positioniert, wie es in 10(A) gezeigt ist, woraus hervorgeht, dass sich die Sprecher bei einem Richtungswinkel von etwa –30 Grad, 0 Grad bzw. +20 Grad befinden.
  • Wenn danach, um durch das Bildverarbeitungsmittel 13 diese Objekte als die möglichen Schallquellen zu lokalisieren, eine Bestimmung durchgeführt wird, wobei die Bilder nur anhand der Farbe verarbeitet werden, dann ist im Diagramm von 10(B) zu erkennen, dass verschiedene andere Objekte in den Bildern fälschlich ebenfalls als Schallquellen erkannt werden. Wenn jedoch bei der Bildverarbeitung sowohl auf die Farbe als auch auf die Höhe Bezug genommen wird, dann wird der Fehler abgeschwächt, wie aus dem Diagramm von 10(C) hervorgeht.
  • Wenn das Bildverarbeitungsmittel 13 außerdem dazu veranlasst wird, die Bilder nur anhand der Farbe zu verarbeiten, während es sich auf die von dem Schallverarbeitungsmittel 14 empfangenen groben Richtungen A0, B0 und C0 bezieht, wird der Fehler weiter abgeschwächt, wie im Diagramm von 10(D) gezeigt ist.
  • Wenn das Bildverarbeitungsmittel 13 außerdem dazu veranlasst wird, die Bilder anhand der Farbe wie auch der Höhe zu verarbeiten, während es sich auf die von dem Schallverarbeitungsmittel 14 empfangenen groben Richtungen A0, B0 und C0 bezieht, ist es offensichtlich, dass die Schallquellen als ihre Positionsinformationen mit einer Genauigkeit bestimmt werden können, die mit den tatsächlichen Positionen der Gesichter, wie sie in 10(A) gezeigt sind, recht gut übereinstimmen; das bedeutet, die Bestimmung erfolgt mit beträchtlicher Sicherheit.
  • Obwohl bei dem oben erwähnten Beispiel die horizontalen Koordinaten A3, B3 und C3 der Zentralpositionen A2, B2 und C2 der Rahmen A1, B1 und C1 in den aufeinander folgend abgebildeten Bildern der Objekte, die die Schallquellen sein können, verwendet werden, um Informationen bezüglich ihrer Orte bereitzustellen, können horizontale und vertikale Koordinaten verwendet werden, um Informationen bezüglich ihrer Orte bereitzustellen.
  • Bei dem oben erwähnten Beispiel ist das Bildverarbeitungsmittel 13 ferner so entworfen, dass es Informationen bezüglich der Orte der Objekte, die die Schallquellen sein können, anhand der Farbe und der Form (z. B. der Höhe) der Objekte auswählt oder bestimmt, die in den Bildern aufeinander folgend abgebildet werden.
  • Obwohl beim oben erwähnten Beispiel das Bildverarbeitungsmittel 13 ferner so entworfen ist, dass es eine Bildverarbeitung mit Bezug auf die von dem Schallverarbeitungsmittel 14 empfangenen groben Richtungen A0, B0 und C0 durchführt, ist die Erfindung allgemein nicht darauf beschränkt, sondern es können bei ihr Informationen bezüglich der Orte der Objekte, die die Schallquellen sein können, lediglich anhand von vom Abbildungsmittel 12 empfangenen Bildinformationen ausgewählt oder bestimmt werden.
  • Um die Richtung zu erfassen, in der sich eine Schallquelle befindet, kann an der Schallquelle ein aktives Element befestigt sein, etwa in Form einer Markierung, die Magnetismus überträgt, damit die Richtung bestimmt werden kann, in der der Magnetismus emittiert wird, wobei als ihr Erfassungsmittel eine magnetische Erfassungsvorrichtung verwendet wird. Die von dem magnetischen Erfassungsmittel erfasste Richtung kann zum Schallverarbeitungsmittel zurück übertragen werden und vom Letztgenannten dazu verwendet werden, ein Richtungsfilter zu erstellen, wodurch die Schallquelle getrennt wird.
  • Falls die Schallquelle eine Person ist, ermöglicht es die von ihr abgestrahlte Wärme, dass ein Infrarotdetektor verwendet werden kann, um die Richtung zu erfassen, in der sich die Schallquelle befindet.
  • Aus dem vorstehend Beschriebenen ist ersichtlich, dass es die vorliegende Erfindung – gemäß der beim Identifizieren einer Schallquelle anhand von Schallinformationen die Richtung, in der sich die Schallquelle befindet, anhand von Informationen bezüglich ihres Bildes und von Informationen bezüglich ihrer lokalisierten Richtung eingeengt wird, während diese mit Bezug auf Informationen bezüglich des Orts eines Objekts, das die Schallquellen sein kann, erfasst wird – unnötig macht, die Schallinformationen beim Identifizieren der Schallquelle omnidirektional oder über sämtliche Richtungen zu verarbeiten, es ermöglicht, die Schallquelle mit größerer Sicherheit zu identifizieren, es bewirkt, dass eine geringere Menge an verarbeitbaren Informationen ausreicht, und es ermöglicht, die Verarbeitungszeit zu verringern. Dementsprechend werden in Übereinstimmung mit der vorliegenden Erfindung eine sehr vorteilhafte Vorrichtung und ein sehr vorteilhaftes Verfahren zur Schallquellen-Identifizierung geschaffen, wodurch es möglich wird, mehrere Schallquellen mithilfe eines Paars Mikrofone mit angemessener Genauigkeit zu identifizieren.
  • Selbstverständlich ist die Erfindung nicht dazu bestimmt, auf die nachstehend dargelegten bestimmten Formen ihrer Ausführungsform beschränkt zu sein, sondern dazu, sämtliche möglichen Formen ihrer Ausführungsform einzuschließen, die innerhalb des Umfangs mit Bezug auf die in den beigefügten Ansprüchen im Einzelnen dargelegten Merkmale ausgeführt werden können, sowie sämtliche ihrer Entsprechungen einzuschließen.
  • Industrielle Anwendbarkeit
  • Wie anhand der vorstehenden Beschreibung klar ist, sind eine Vorrichtung und ein Verfahren zur Schallquellen-Identifizierung in Übereinstimmung mit der vorliegenden Erfindung sehr vorteilhaft als eine Vorrichtung und ein Verfahren zur Schallquellen-Identifizierung, wodurch der Ort eines Objekts als eine Schallquelle anhand von Schall- wie auch von Bildinformationen mit angemessener Sicherheit identifiziert wird und wobei es die Verwendung ihrer Positionsinformationen ermöglicht, jede von derartigen Schallquellen aus gemischten Schallen mit angemessener Genauigkeit abzutrennen.

Claims (16)

  1. Vorrichtung zum Erfassen einer Schallquelle (A, B, C), die umfasst: ein Schallsammelmittel (11), das ein Paar Schallsammelmikrophone (11a, 11b) enthält, die über einen im Voraus gewählten Abstand (D) nebeneinander angeordnet sind und sich gegenüber der Schallquelle (A, B, C) befinden; ein Abbildungsmittel (12), das so beschaffen ist, dass es ein Objekt, das die Schallquelle (A, B, C) sein kann, aufeinanderfolgend abbilden kann; ein Schallverarbeitungsmittel (14) zum Bestimmen einer Richtung der Schallquelle (A, B, C); ein Bildverarbeitungsmittel (13) zum Bestimmen einer Richtung des Ojekts, das möglicherweise die Schallquelle (A, B, C) ist, aus Informationen für Bilder, die durch das Abbildungsmittel (12) abgebildet werden; und ein Steuermittel (15) zum Steuern von Operationen des Schallsammelmittels (11), des Abbildungsmittels (12) und des Bildverarbeitungsmittels (13) sowie des Schallverarbeitungsmittels (14), dadurch gekennzeichnet, dass es ferner Richtungsfilter umfasst; und mehrere Schallquellen (A, B, C) identifiziert und getrennt werden können; die beiden Mikrophone (11a, 11b) sich gegenüber den mehreren Schallquellen (A, B, C) befinden, wobei die beiden Mikrophone (11a, 11b) jeweils gemischte Schalle von den Schallquellen (A, B, C) einzeln einfangen; das Schallverarbeitungsmittel (14) so beschaffen ist, dass es die Richtungen aller Schallquellen (A, B, C) anhand von Schallinformationen für eine Phasendifferenz und eine Intensitätsdifferenz, die jeder der gemischten Schalle von den Schallquellen (A, B, C) besitzt, wenn er durch das Entsprechende der zwei Schallsammelmikrophone (11a, 11b) eingefangen wird, bestimmen kann; die Operationen des Schallsammelmittels (11), des Abbildungsmittels (12), des Bildverarbeitungsmittels (13) und des Schallverarbeitungsmittels (14) durch das Steuermittel (15) in der Weise gesteuert werden, dass: das Schallverarbeitungsmittel (14) grobe Richtungen (A0, B0, C0) der Schallquellen (A, B, C) aus Informationen für die durch das Schallsammelmittel (11) eingefangenen Schalle vorgibt und das Bildverarbeitungsmittel (13) die Richtung jedes der Objekte, die möglicherweise die Schallquellen (A, B, C) sind, innerhalb eines durch die vorgegebenen groben Richtungen (A0, B0, C0) definierten Bereichs bestimmt und das Schallverarbeitungsmittel (14) die Richtungsfilter, die den vorgegebenen Richtungen der Schallquellen (A, B, C) entsprechen, auswählt, wodurch ermöglicht wird, die Richtungen aller Schallquellen (A, B, C) zu identifizieren und sie voneinander zu trennen, falls benachbarte Schallquellen nahe beieinander liegen.
  2. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, dass sie umfasst: ein Erfassungsmittel zum Erfassen von Richtungen, in denen die Objekte, die möglicherweise die Schallquellen (A, B, C) sind, lokalisiert sind; wobei das Bildverarbeitungsmittel (13) die Richtung jedes der Objekte, die möglicherweise die Schallquellen (A, B, C) sind, aus Informationen für Bilder, die durch das Abbildungsmittel (12) abgebildet werden, und aus Richtungsinformationen für jedes der Objekte, die durch das Erfassungsmittel erfasst werden, bestimmt.
  3. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet, dass das Erfassungsmittel so beschaffen ist, dass es die Objekte, die möglicherweise die Schallquellen (A, B, C) sind, in Reaktion auf einen Magnetismus hiervon erfasst.
  4. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet, dass das Erfassungsmittel so beschaffen ist, dass es die Objekte, die möglicherweise die Schallquellen (A, B, C) sind, in Reaktion auf Infrarotstrahlen, die sie emittieren, erfasst.
  5. Vorrichtung nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass das Bildverarbeitungsmittel (13) eine Funktion zum Bestimmen der Richtung sämtlicher Objekte, die möglicherweise die Schallquellen (A, B, C) sind, anhand einer Farbe eines solchen Objekts besitzt.
  6. Vorrichtung nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass das Bildverarbeitungsmittel (13) eine Funktion zum Bestimmen von Richtungen sämtlicher Objekte, die möglicherweise die Schallquellen (A, B, C) sind, anhand einer Form eines solchen Objekts besitzt.
  7. Vorrichtung nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass das Bildverarbeitungsmittel (13) eine Funktion zum Bestimmen der Richtung sämtlicher Objekte, die möglicherweise die Schallquellen (A, B, C) sind, anhand einer Farbe, einer Form und einer Höhe zusammen des Objekts besitzt.
  8. Verfahren zum Erfassen einer Schallquelle (A, B, C), das umfasst: einen ersten Schritt, bei dem Schall von einer Schallquelle (A, B, C) mit einem Paar Schallsammelmikrophone (11a, 11b), die über einen im Voraus gewählten Abstand (D) nebeneinander angeordnet sind und sich gegenüber der Schallquelle (A, B, C) befinden, eingefangen wird; einen gleichzeitg mit dem ersten Schritt ausgeführten zweiten Schritt, bei dem ein Abbildungsmittel (12) Objekte, die die Schallquelle (A, B, C) sein können, nacheinander abbildet, um Bilder hiervon zu erzeugen; einen dritten Schritt, bei dem ein Schallverarbeitungsmittel (14) eine Richtung der Schallquelle (A, B, C) aus Schallinformationen bestimmt; einen vierten Schritt, bei dem ein Bildverarbeitungsmittel (13) eine Richtung des Objekts, das möglicherweise die Schallquelle (A, B, C) ist, aus Informationen für die im zweiten Schritt erzeugten Bilder bestimmt; einen fünften Schritt, bei dem das Schallverarbeitungsmittel (13) eine Richtung der Schallquelle (A, B, C) bestimmt; dadurch gekennzeichnet, dass im ersten Schritt gemischte Schalle von mehreren Schallquellen (A, B, C) durch die zwei Schallsammelmikrophone (11a, 11b) einzeln eingefangen werden; im dritten Schritt eine grobe Richtung (A0, B0, C0) jeder der Schallquellen (A, B, C) aus Schallinformationen für die im ersten Schritt eingefangenen gemischten Schalle und anhand von Informationen in den Schallinformationen für eine Phasen- und eine Intensitätsdifferenz bestimmt wird; im vierten Schritt eine Richtung jedes der Objekte, die möglicherweise die Schallquellen (A, B, C) sind, innerhalb eines Bereichs, der durch die im dritten Schritt bestimmten groben Richtungen (A0, B0, C0) definiert ist, bestimmt wird; im fünften Schritt eine Richtung jeder der Schallquellen (A, B, C) anhand der Schallinformationen für eine Phasen- und eine Intensitätsdifferenz innerhalb eines Winkelbereichs, der durch Richtungen, die im vierten Schritt bestimmt werden, definiert ist, bestimmt wird; ferner vorgesehen sind: ein sechster Schritt, bei dem das Schallverarbeitungsmittel (14) ein bestimmtes Richtungsfilter in Übereinstimmung mit der im fünften Schritt bestimmten Richtung jeder der Schallquellen (A, B, C) auswählt, um alle Schallquellen (A, B, C) voneinander zu trennen; ein siebter Schritt, bei dem das Bildverarbeitungsmittel (13) eine Richtung sämtlicher Objekte, die möglicherweise die Schallquellen (A, B, C) sind, anhand von Informationen für die im zweiten Schritt erzeugten Bilder bestimmt und das Schallverarbeitungsmittel (14) eine Richtung jeder der Schallquellen (A, B, C) anhand der Schallinformationen für eine Phasen- und eine Intensitätsdifferenz wie oben erwähnt innerhalb eines Winkelbereichs, der durch die so bestimmten Richtungen definiert ist, bestimmt und ein bestimmtes Richtungsfilter in Übereinstimmung mit der so bestimmten Richtung jeder der Schallquellen (A, B, C) auswählt, um sämtliche Schallquellen (A, B, C) voneinander zu trennen; und ein achter Schritt, bei dem das Schallverarbeitungsmittel (14) derartige bestimmte Filter in Übereinstimmung mit derartigen groben Richtungen (A0, B0, C0), die im dritten Schritt bestimmt werden, auswählt, um sämtliche Schallquellen (A, B, C) voneinander zu trennen.
  9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass der zweite Schritt umfasst, dass ein Erfassungsmittel Richtungen erfasst, in denen sich die Objekte befinden; der vierte Schritt umfasst, dass das Bildverarbeitungsmittel (13) eine Richtung jedes der Objekte, die möglicherweise all die Schallquellen (A, B, C) sind, aus Informationen für die erzeugten Bilder und aus Informationen für die im zweiten Schritt erfasste Richtung innerhalb eines durch die im dritten Schritt bestimmten groben Richtungen (A0; B0, C0) definierten Bereichs bestimmt; der siebte Schritt umfasst, dass das Bildverarbeitungsmittel (13) eine Richtung jedes der Objekte, die möglicherweise die Schallquellen (A, B, C) sind, anhand von Informationen für die erzeugten Bilder und von Informationen für die durch das Erfassungsmittel im zweiten Schritt erfasste Richtung bestimmt.
  10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass die Richtungserfassung durch das Erfassungsmittel in Reaktion auf einen Infrarotstrahl erfolgt.
  11. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass die Richtungserfassung durch das Erfassungsmittel in Reaktion auf Magnetismus erfolgt.
  12. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass die Richtung sämtlicher Objekte, die möglicherweise die Schallquellen (A, B, C) sind, durch das Bildverarbeitungsmittel (13) anhand einer Farbe hiervon bestimmt wird.
  13. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass die Richtung jedes der Objekte, die möglicherweise die Schallquellen (A, B, C) sind, durch das Bildverarbeitungsmittel (13) anhand einer Form hiervon bestimmt wird.
  14. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass die Richtung jedes der Objekte, die möglicherweise die Schallquellen (A, B, C) sind, durch das Bildverarbeitungsmittel (13) anhand einer Farbe, einer Form und einer Höhe bestimmt wird.
  15. Verfahren nach einem der Ansprüche 8 bis 14, dadurch gekennzeichnet, dass die Bestimmung der Richtung jeder der Schallquellen (A, B, C) durch das Schallverarbeitungsmittel (14) anhand von Schallinformationen für eine Phasen- und eine Intensitätsdifferenz durch Bestimmen einer Position jeder der Schallquellen (A, B, C) anhand eines Signals für jedes von Frequenzbändern, in die sie beliebig unterteilt sind, erfolgt.
  16. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass die Positionsinformation des Objekts, das möglicherweise die Schallquelle (A, B, C) ist, aus einer Bewegung des Objekts abgeleitet wird.
DE60036216T 1999-06-11 2000-06-07 Verfahren und gerät zur bestimmung einer tonquelle Expired - Lifetime DE60036216T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP16518299 1999-06-11
JP16518299A JP3195920B2 (ja) 1999-06-11 1999-06-11 音源同定・分離装置及びその方法
PCT/JP2000/003695 WO2000077537A1 (fr) 1999-06-11 2000-06-07 Procede et appareil de determination d'une source sonore

Publications (2)

Publication Number Publication Date
DE60036216D1 DE60036216D1 (de) 2007-10-11
DE60036216T2 true DE60036216T2 (de) 2008-05-15

Family

ID=15807412

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60036216T Expired - Lifetime DE60036216T2 (de) 1999-06-11 2000-06-07 Verfahren und gerät zur bestimmung einer tonquelle

Country Status (6)

Country Link
US (1) US7035418B1 (de)
EP (1) EP1205762B1 (de)
JP (1) JP3195920B2 (de)
DE (1) DE60036216T2 (de)
ES (1) ES2292441T3 (de)
WO (1) WO2000077537A1 (de)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE517765C2 (sv) * 2000-11-16 2002-07-16 Ericsson Telefon Ab L M Registrering av rörliga bilder medelst en portabel kommunikationsenhet samt en tillbehörsanordning vilken är samlokaliserad med objektet
JP2004266343A (ja) * 2003-02-05 2004-09-24 Matsushita Electric Ind Co Ltd 画像サーバーと画像サーバーシステム、そのプログラム及び記録媒体
WO2004084187A1 (ja) * 2003-03-17 2004-09-30 Nagoya Industrial Science Research Institute 対象音検出方法、信号入力遅延時間検出方法及び音信号処理装置
JP4269883B2 (ja) * 2003-10-20 2009-05-27 ソニー株式会社 マイクロホン装置、再生装置及び撮像装置
JP4516527B2 (ja) * 2003-11-12 2010-08-04 本田技研工業株式会社 音声認識装置
GB0330253D0 (en) 2003-12-31 2004-02-04 Mitel Networks Corp Self-discovery method
JP2006245725A (ja) * 2005-03-01 2006-09-14 Yamaha Corp マイクロフォンシステム
JP4441879B2 (ja) * 2005-06-28 2010-03-31 ソニー株式会社 信号処理装置および方法、プログラム、並びに記録媒体
JP4757786B2 (ja) * 2006-12-07 2011-08-24 Necアクセステクニカ株式会社 音源方向推定装置、音源方向推定方法、及びロボット装置
IL188156A0 (en) * 2007-12-16 2008-11-03 Maly Edelman A method and system for protecting an area
US20100098258A1 (en) * 2008-10-22 2010-04-22 Karl Ola Thorn System and method for generating multichannel audio with a portable electronic device
US20100123785A1 (en) * 2008-11-17 2010-05-20 Apple Inc. Graphic Control for Directional Audio Input
CN107071688B (zh) 2009-06-23 2019-08-23 诺基亚技术有限公司 用于处理音频信号的方法及装置
TWI402531B (zh) * 2009-06-29 2013-07-21 Univ Nat Cheng Kung 音源辨位方法與應用此音源辨位方法之音源辨位系統和電腦程式產品
US9094645B2 (en) * 2009-07-17 2015-07-28 Lg Electronics Inc. Method for processing sound source in terminal and terminal using the same
TWI417563B (zh) * 2009-11-20 2013-12-01 Univ Nat Cheng Kung 遠距離音源定位晶片裝置及其方法
US9955209B2 (en) 2010-04-14 2018-04-24 Alcatel-Lucent Usa Inc. Immersive viewer, a method of providing scenes on a display and an immersive viewing system
US9294716B2 (en) 2010-04-30 2016-03-22 Alcatel Lucent Method and system for controlling an imaging system
US8754925B2 (en) * 2010-09-30 2014-06-17 Alcatel Lucent Audio source locator and tracker, a method of directing a camera to view an audio source and a video conferencing terminal
US8185387B1 (en) 2011-11-14 2012-05-22 Google Inc. Automatic gain control
US9008487B2 (en) 2011-12-06 2015-04-14 Alcatel Lucent Spatial bookmarking
JP6216169B2 (ja) * 2012-09-26 2017-10-18 キヤノン株式会社 情報処理装置、情報処理方法
JP2014143678A (ja) * 2012-12-27 2014-08-07 Panasonic Corp 音声処理システム及び音声処理方法
CN103902963B (zh) * 2012-12-28 2017-06-20 联想(北京)有限公司 一种识别方位及身份的方法和电子设备
KR101997449B1 (ko) * 2013-01-29 2019-07-09 엘지전자 주식회사 이동 단말기 및 이의 제어 방법
EP2879047A3 (de) * 2013-11-28 2015-12-16 LG Electronics Inc. Mobiles Endgerät und Steuerungsverfahren dafür
CN104683933A (zh) 2013-11-29 2015-06-03 杜比实验室特许公司 音频对象提取
JP6297858B2 (ja) * 2014-02-25 2018-03-20 株式会社熊谷組 音源推定用画像の作成装置
CN104914409B (zh) * 2014-03-10 2017-11-07 李文嵩 智能住宅定位装置
DE102014217598A1 (de) * 2014-09-03 2016-03-03 Gesellschaft zur Förderung angewandter Informatik e.V. Verfahren und Anordnung zur Erfassung von akustischen und optischen Informationen sowie ein entsprechendes Computerprogramm und ein entsprechendes computerlesbares Speichermedium
CN105070304B (zh) * 2015-08-11 2018-09-04 小米科技有限责任公司 实现对象音频录音的方法及装置、电子设备
CN109696658B (zh) 2017-10-23 2021-08-24 京东方科技集团股份有限公司 采集设备、声音采集方法、声源跟踪系统及其方法
WO2019142232A1 (ja) * 2018-01-16 2019-07-25 ハイラブル株式会社 音声分析装置、音声分析方法、音声分析プログラム及び音声分析システム
CN114339113A (zh) * 2021-12-01 2022-04-12 科大讯飞股份有限公司 视频通话方法及相关装置、设备和存储介质

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3232608B2 (ja) * 1991-11-25 2001-11-26 ソニー株式会社 収音装置、再生装置、収音方法および再生方法、および、音信号処理装置
JPH05244587A (ja) * 1992-02-26 1993-09-21 Mitsubishi Electric Corp テレビ会議用カメラ制御装置
US5402499A (en) * 1992-08-07 1995-03-28 Lsi Logic Corporation Multimedia controller
JPH06105306A (ja) * 1992-09-16 1994-04-15 Funai Denki Kenkyusho:Kk テレビ会議システム
JPH0739000A (ja) 1992-12-05 1995-02-07 Kazumoto Suzuki 任意の方向からの音波の選択的抽出法
JP2937009B2 (ja) * 1994-03-30 1999-08-23 ヤマハ株式会社 音像定位制御装置
CA2148631C (en) * 1994-06-20 2000-06-13 John J. Hildin Voice-following video system
JP3714706B2 (ja) 1995-02-17 2005-11-09 株式会社竹中工務店 音抽出装置
JP2947113B2 (ja) 1995-03-09 1999-09-13 日本電気株式会社 画像通信端末用ユーザインタフェース装置
JPH0933330A (ja) * 1995-07-17 1997-02-07 Nippon Telegr & Teleph Corp <Ntt> 音響信号分離方法およびこの方法を実施する装置
GB2309105A (en) * 1996-01-12 1997-07-16 Ibm Intuitive GUI in the form of a representation of a physical environment
AUPN988996A0 (en) 1996-05-16 1996-06-06 Unisearch Limited Compression and coding of audio-visual services
JP3537962B2 (ja) 1996-08-05 2004-06-14 株式会社東芝 音声収集装置及び音声収集方法
EP1016002A4 (de) * 1996-09-04 2000-11-15 David A Goldberg Verfahren und vorrichtung zur herstellung von personen-spezifische bildern in einem offentlichen platz
JP3355598B2 (ja) * 1996-09-18 2002-12-09 日本電信電話株式会社 音源分離方法、装置及び記録媒体
US6021206A (en) * 1996-10-02 2000-02-01 Lake Dsp Pty Ltd Methods and apparatus for processing spatialised audio
TW379309B (en) * 1997-05-16 2000-01-11 Samsung Electronics Co Ltd Signal management apparatus and method using on screen display
US6072522A (en) * 1997-06-04 2000-06-06 Cgc Designs Video conferencing apparatus for group video conferencing
JP3541339B2 (ja) * 1997-06-26 2004-07-07 富士通株式会社 マイクロホンアレイ装置
JPH1141577A (ja) 1997-07-18 1999-02-12 Fujitsu Ltd 話者位置検出装置
US6192134B1 (en) * 1997-11-20 2001-02-20 Conexant Systems, Inc. System and method for a monolithic directional microphone array
US5940118A (en) * 1997-12-22 1999-08-17 Nortel Networks Corporation System and method for steering directional microphones
US6005610A (en) * 1998-01-23 1999-12-21 Lucent Technologies Inc. Audio-visual object localization and tracking system and method therefor
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications

Also Published As

Publication number Publication date
EP1205762A4 (de) 2005-07-06
EP1205762A1 (de) 2002-05-15
JP2000356674A (ja) 2000-12-26
EP1205762B1 (de) 2007-08-29
WO2000077537A1 (fr) 2000-12-21
ES2292441T3 (es) 2008-03-16
DE60036216D1 (de) 2007-10-11
US7035418B1 (en) 2006-04-25
JP3195920B2 (ja) 2001-08-06

Similar Documents

Publication Publication Date Title
DE60036216T2 (de) Verfahren und gerät zur bestimmung einer tonquelle
DE69428686T2 (de) Bildaufnahmevorrichtung und verfahren zur bestimmung von fokusinformationen
EP3408719B1 (de) Verfahren zum erstellen einer umgebungskarte für ein selbsttätig verfahrbares bearbeitungsgerät
DE69032326T2 (de) Dynamisches verfahren um gegenstände zu erkennen und bildverarbeitungsgerät dafür
DE102007013971B4 (de) Verfahren und Vorrichtung zur Ermittlung einer Zellkontur einer Zelle
DE112005000929B4 (de) Automatisches Abbildungsverfahren und Vorrichtung
DE69107267T2 (de) Verfahren und vorrichtung zur modifizierung einer zone sukzessiver bilder.
DE2831582C2 (de) Verfahren zur Identifizierung einer Person und Vorrichtung zur Durchführung des Verfahrens
DE69938173T2 (de) Automatische voreingestellte teilnehmerpositionsbestimmung für videokonferenzsysteme
DE68926680T2 (de) Durch sinnesfunktion gesteuerter regler
DE69727612T2 (de) Ultraschall-Abbildungssystem mit Lauf-Extraktionsmitteln zur Extraktion des Punktes, der am dichtesten am Anfangspunkt der Abtastzeilen liegt
DE69811667T2 (de) Vorrichtung und verfahren zur erkennung und bestimmung der position eines tierteils
DE69225303T2 (de) Abbildungsvorrichtung
DE4406020C1 (de) Verfahren zur automatisierten Erkennung von Objekten
DE102006034911B4 (de) Verfahren zur Erstellung von Panorama-Bildern des Augenhintergrundes
WO2000010119A1 (de) Verfahren zum erkennen von objekten in digitalisierten abbildungen
DE69631475T2 (de) Kontrolle einer Mikroskopblende
DE69738287T2 (de) Verfahren zum Anzeigen eines sich bewegenden Objekts, dessen Bahn zu identifizieren ist, Anzeigesystem unter Verwendung dieses Verfahrens und Programmaufzeichnungsmedium dafür
DE102005059209A1 (de) Verfahren und Vorrichtung zur Visualisierung einer Folge von tomographischen Bilddatensätzen
DE4130010A1 (de) Fahrzeugbeobachtungs-vorrichtung mit abstandsmess-funktion
DE102005058240A1 (de) Trackingsystem und Verfahren zur Posenbestimmung
DE102022201279B3 (de) Verfahren zum Erfassen einer Umgebung eines Fahrzeugs, Kameravorrichtung und Fahrzeug
EP1481371B1 (de) Verfahren zur trennung einer in einem bild einer probe enthaltenen zellgruppe in einzelzellen
EP1751508A1 (de) Verfahren und vorrichtung zur detektierung optischer spektren
DE602004001909T2 (de) Verfahren und Instrument zur Kontrolle der Verbindung von Wänden einer wabenförmigen Struktur mit einem Substrat

Legal Events

Date Code Title Description
8364 No opposition during term of opposition