DE102019132544B4 - Umgebungserkennung über zeitsynchronisierte vernetzte lautsprecher - Google Patents

Umgebungserkennung über zeitsynchronisierte vernetzte lautsprecher Download PDF

Info

Publication number
DE102019132544B4
DE102019132544B4 DE102019132544.7A DE102019132544A DE102019132544B4 DE 102019132544 B4 DE102019132544 B4 DE 102019132544B4 DE 102019132544 A DE102019132544 A DE 102019132544A DE 102019132544 B4 DE102019132544 B4 DE 102019132544B4
Authority
DE
Germany
Prior art keywords
arrival
coordinator
test pulse
time
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE102019132544.7A
Other languages
English (en)
Other versions
DE102019132544A1 (de
Inventor
Levi Gene Pearson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harman International Industries Inc
Original Assignee
Harman International Industries Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/209,814 external-priority patent/US10412532B2/en
Application filed by Harman International Industries Inc filed Critical Harman International Industries Inc
Publication of DE102019132544A1 publication Critical patent/DE102019132544A1/de
Application granted granted Critical
Publication of DE102019132544B4 publication Critical patent/DE102019132544B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/0635Clock or time synchronisation in a network
    • H04J3/0638Clock or time synchronisation among nodes; Internode synchronisation
    • H04J3/0658Clock or time synchronisation among packet nodes
    • H04J3/0661Clock or time synchronisation among packet nodes using timestamps
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/40Visual indication of stereophonic sound image
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/10Arrangements for producing a reverberation or echo sound using time-delay networks comprising electromechanical or electro-acoustic devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04JMULTIPLEX COMMUNICATION
    • H04J3/00Time-division multiplex systems
    • H04J3/02Details
    • H04J3/06Synchronising arrangements
    • H04J3/0635Clock or time synchronisation in a network
    • H04J3/0638Clock or time synchronisation among nodes; Internode synchronisation
    • H04J3/0658Clock or time synchronisation among packet nodes
    • H04J3/0661Clock or time synchronisation among packet nodes using timestamps
    • H04J3/0667Bidirectional timestamps, e.g. NTP or PTP for compensation of clock drift and for compensation of propagation delays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2400/00Loudspeakers
    • H04R2400/01Transducers used as a loudspeaker to generate sound aswell as a microphone to detect sound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/23Direction finding using a sum-delay beam-former
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Verfahren, das durch einen Prozessor (112; 712) mit einem nicht transitorischen Speichermedium zum Speichern von Programmcode ausgeführt wird, wobei das Verfahren die folgenden Schritte umfasst:a. Festlegen einer Lautsprecherkomponente (100; 200; 302; 602; 700) als einen Koordinator (304) in einer Hörumgebung mit einem Netzwerk (300) aus Audio-Video Bridging/Time Synchronized Network (AVB-/TSN)-Lautsprecherkomponenten (100; 200; 302; 602; 700), wobei jede Lautsprecherkomponente (100; 200; 302; 602; 700) eine erste Anordnung von Mikrofonen (106; 206; 706a) in einer ersten Ebene und mindestens eine zweite Anordnung von Mikrofonen (106; 206; 706b) in einer zweiten Ebene, die senkrecht zu der ersten Ebene ist, aufweist, und wobei ein Standort jeder Lautsprecherkomponente (100; 200; 302; 602; 700) in der Hörumgebung jeder der anderen Lautsprecherkomponenten (100) bekannt ist;b. Zuweisen (902) eines Startzeitpunkts zu einer der Lautsprecherkomponenten (100; 200; 302) in dem Netzwerk (300) aus Audio-Video Bridging/Time Synchronized Network (AVB/TSN)-Lautsprecherkomponenten durch den Koordinator;c. Emittieren (904) eines Testimpulses (306) zu dem zugewiesenen Startzeitpunkt durch die eine Lautsprecherkomponente (304);d. Aufzeichnen (906) eines genauen Ankunftszeitpunkts des Testimpulses (306) an jeder Lautsprecherkomponente (100; 200; 302; 602; 700);e. Weiterleiten (906) des genauen Ankunftszeitpunkts des Testimpulses (306), der an jeder Lautsprecherkomponente (100; 200; 302; 602; 700) aufgezeichnet wurde, an den Koordinator;f. Bestimmen eines Ankunftswinkels des Testimpulses (306) an jeder Lautsprecherkomponente (100; 200; 302; 602; 700);g. Weiterleiten des Ankunftswinkels des Testimpulses (306), der an jeder Lautsprecherkomponente (100; 200; 302; 602; 700) bestimmt wurde, an den Koordinator (304);h. Aufzeichnen (908) eines genauen Ankunftszeitpunkts für jedes Echo des Testimpulses (306) an jeder Lautsprecherkomponente (100; 200; 302; 602; 700);i. Weiterleiten (908) des genauen Ankunftszeitpunkts jedes Echos des Testimpulses (306), der an jeder Lautsprecherkomponente (100; 200; 302; 602; 700) aufgezeichnet wurde, an den Koordinator (304);j. Bestimmen (910) eines Ankunftswinkels jedes Echos des Testimpulses (306) an jeder Lautsprecherkomponente (100; 200; 302; 602; 700);k. Weiterleiten (910) des Ankunftswinkels jedes Echos, der an jeder Lautsprecherkomponente (100; 200; 302; 602; 700) bestimmt wurde, an den Koordinator (304); 1. Fortführen der Schritte des Aufzeichnens eines genauen Ankunftszeitpunkts für jedes Echo des Testimpulses (306) und des Bestimmens eines Ankunftswinkels für jedes Echo des Testimpulses (306) für einen vorbestimmten Zeitraum, der es ermöglicht, den genauen Ankunftszeitpunkt jedes Echos aufzuzeichnen und an den Koordinator weiterzuleiten und den Ankunftswinkel jedes Echos zu bestimmen und an den Koordinator weiterzuleiten;m. Wiederholen (918) der Schritte (a) - (1) bis jeder Lautsprecher (100; 200; 302; 602; 700) in dem Netzwerk (300) aus Audio-Video Bridging/Time Synchronized Network (AVB/TSN)-Lautsprechem (100; 200; 302; 602; 700) einen Testimpuls (306) emittiert hat und alle der aufgezeichneten genauen Ankunftszeitpunkte und der bestimmten Ankunftswinkel an den Koordinator (304) weitergeleitet wurden;n. Bestimmen, bei dem Koordinator (304), von Komplanarität und Schätzen einer Orientierung der Echos unter Verwendung des aufgezeichneten genauen Ankunftszeitpunkts, der bestimmten Ankunftswinkel und der bekannten Standorte jeder Lautsprecherkomponente (100; 200; 302; 602; 700);o. Gruppieren (924), bei dem Koordinator (304), von Reflexionspunkten in planare Bereiche auf Grundlage von Komplanarität und geschätzten Orientierungen, um einen Standort jeder Reflexionsfläche in der Hörumgebung zu bestimmen (926); undp. Erzeugen (928), bei dem Koordinator (304), eines Modells aller Reflexionsflächen in der Hörumgebung.

Description

  • QUERVERWEIS
  • Diese Anmeldung ist eine Continuation-in-Part der ebenfalls anhängigen US-Anmeldung mit der Nr. 15/690,322 , die am 30. August 2017 eingereicht wurde.
  • TECHNISCHES GEBIET
  • Der Gegenstand der Erfindung bezieht sich auf ein System und ein Verfahren zum Bestimmen eines Standorts von Flächen, die Audiowellen eines Systems vernetzter Lautsprecher reflektieren.
  • ALLGEMEINER STAND DER TECHNIK
  • Hochentwickelte dreidimensionale Audioeffekte, wie etwa jene, die in Systemen virtueller Realität (VR - virtual reality) und/oder erweiterter Realität (AR - augmented reality) verwendet werden, erfordern eine detaillierte Darstellung einer Umgebung, in der sich Lautsprecher befinden, um eine korrekte Transferfunktion zu generieren, die durch Effektalgorithmen in den VR/AR- Systemen verwendet werden. Auch erfordert das Reproduzieren der dreidimensionalen Audioeffekte typischerweise eine ziemlich genaue Kenntnis der relativen Standorte und Orientierungen der verwendeten Lautsprecher. Momentan erfordern die bekannten Verfahren manuellen Aufwand, um eine Anzahl von aufgezeichneten Messungen aufzunehmen und dann die Ergebnisse zu analysieren und zu ordnen. Diese komplizierte Einstellungsprozedur erfordert Fachwissen und Fertigkeiten, was eine eigene Einstellung durch einen durchschnittlichen Verbraucher verhindert und auch zu menschlichen Fehlern führen kann. Eine solche Einstellungsprozedur erfordert auch teure Ausrüstung, was eine eigene Einstellung durch den durchschnittlichen Verbraucher weiter verhindert. Alternativ greifen die bekannten Verfahren auf einfache Schätzungen zurück, die zu einem verschlechterten Erlebnis führen können. Zusätzlich kann ein genaues Modell jeglicher Flächen in der Umgebung, die Audiowellen reflektieren, ein genaueres Strahlformen von dreidimensionalen Audioeffekten begünstigen.
  • Die EP 3148224 A2 beschreibt ein Verfahren zur Bestimmung räumlicher Beziehungen in einem Lautsprechersystem mit einer zentralen Steuereinheit, mehreren Lautsprechern und mehreren Mikrofonen. Das Verfahren umfasst die Verwendung der Mehrfachlautsprecher zur Erzeugung von Schall zu erzeugen und die mehreren Mikrofone zur Messung des des erzeugten Schalls. Die räumlichen Beziehungen zwischen den Lautsprechern werden auf der Grundlage des gemessenen Schalls bestimmt, und die mehreren Lautsprecher werden auf der Grundlage der ermittelten Lautsprechern zugewiesen, basierend auf den ermittelten räumlichen Beziehungen. Der Ton der Mehrfachlautsprecher wird entsprechend der zugewiesenen den zugewiesenen Lautsprecherzonen gesteuert. Weiter, ein Verfahren zur Verifizierung der Installation eines solchen Lautsprechersystems Lautsprechersystems und ein Lautsprechersystem mit Zonierung und/oder Verifizierung.
  • Die EP 2 375 779 A2 beschreibt eine Vorrichtung zur Messung einer Vielzahl von Lautsprechern, die an verschiedenen Positionen angeordnet sind, umfassend: einen Prüfsignalgenerator zur Erzeugung eines Prüfsignals für einen Lautsprecher; eine Mikrofonvorrichtung, die für den Empfang einer Vielzahl von unterschiedlichen Schallsignalen konfiguriert ist, die von einem Lautsprecher der Mehrzahl von Lautsprechern als Reaktion auf das Testsignal emittiert werden; eine Steuereinrichtung zum Steuern der Emissionen der Lautsprechersignale durch die Vielzahl von Lautsprechern und zum Verarbeiten der Vielzahl unterschiedlicher Schallsignale, so dass ein Satz von Schallsignalen, die von der Mikrofoneinrichtung in Reaktion auf das Testsignal aufgenommen wurde, mit jedem Lautsprecher der Vielzahl von Lautsprechern zugeordnet wird; und einen Auswerter zum Auswerten des Satzes von Schallsignalen für jeden Lautsprecher, um mindestens eine Lautsprechereigenschaft für jeden Lautsprecher zu bestimmen und zum Anzeigen eines Lautsprecherzustands unter Verwendung der mindestens einen Lautsprechereigenschaft des Lautsprechers.
  • Es besteht ein Bedarf für eine vernetzte Lautsprecherplattform, die die Messung einer unmittelbaren Umgebung eines Systems von vernetzten Lautsprechern koordiniert, um Standorte von Reflexionsflächen und reflektierenden Objekten in der Umgebung zu generieren und um ein Modell von Reflexionsflächen und reflektierenden Objekten in der Umgebung zu erzeugen.
  • KURZDARSTELLUNG
  • Ein Verfahren zum Erzeugen eines Modells aller Reflexionsflächen in einer Hörumgebung, das auf ein Rauschunterdrückungssystem in einem Netzwerk aus Lautsprechern in der Hörumgebung angewandt werden kann. Das Verfahren wird durch einen Prozessor mit einem nicht-flüchtigen Speichermedium zum Speichern von Programmcode ausgeführt und beinhaltet die Schritte des Bestimmens eines Vorhandenseins und einer Fähigkeit von Netzwerklautsprecherteilnehmern in einer Hörumgebung und des Einrichtens einer Priorität von Netzwerklautsprecherteilnehmern, wobei jeder Netzwerklautsprecherteilnehmer eine erste Mikrofonanordnung in einer ersten Ebene und eine zweite Mikrofonanordnung in einer zweiten Ebene, die senkrecht zu der ersten Ebene ist, und mindestens einen zusätzlichen Sensor, der eine Schwerkraftvektorrichtung in Bezug auf mindestens eine Anordnung von Mikrofonelementen misst, aufweist. Ein Koordinator wird aus den Netzwerklautsprecherteilnehmern auf Grundlage der Priorität gewählt. Mindestens ein Netzwerklautsprecherteilnehmer generiert zu einem Zeitpunkt ein Testimpulssignal und teilt den genauen Zeitpunkt mit, zu welchem das Testimpulssignal generiert wird, und jeder Netzwerklautsprecherteilnehmer zeichnet genaue Start- und Endzeitstempel des Testimpulssignals auf.
  • Jeder Netzwerklautsprecherteilnehmer zeichnet genaue Ankunftszeitpunkte jedes Echos des Testimpulssignals für eine vorbestimmte Zeit auf und jeder Netzwerklautsprecherteilnehmer bestimmt einen Ankunftswinkel jedes Echos des Testimpulssignals. Der Ankunftswinkel wird in jeder Mikrofonanordnungsebene bestimmt. Der Koordinator schätzt Standorte der Netzwerklautsprecherteilnehmer innerhalb des Netzwerks und das Verfahren wird wiederholt, bis jeder Netzwerklautsprecherteilnehmer der Reihe nach ein Testimpulssignal generiert hat und die anderen Netzwerklautsprecherteilnehmer dessen Ankunftszeitpunkt und einen Ankunftszeitpunkt jedes Echos aufgezeichnet haben sowie Ankunftswinkel jedes Echos bestimmt wurden.
  • Der Koordinator bestimmt Komplanarität und schätzt eine Orientierung der Echos unter Verwendung der aufgezeichneten genauen Ankunftszeitpunkte, der bestimmten Ankunftswinkel und der geschätzten Standorte jedes Netzwerklautsprecherteilnehmers durch Gruppieren von Reflexionspunkten in planare Bereiche auf Grundlage von Komplanarität und geschätzter Orientierungen, um einen Standort jeder Reflexionsfläche in der Hörumgebung zu bestimmen. Das Ergebnis ist ein Modell aller Reflexionsflächen in der Hörumgebung, das dann auf das Rauschunterdrückungssystem angewandt werden kann.
  • Figurenliste
    • 1 ist ein Blockdiagramm eines beispielhaften Lautsprechers einer oder mehrerer Ausführungsformen des Gegenstands der Erfindung;
    • 2 ist ein Blockdiagramm der beispielhaften Lautsprechermikrofonanordnung;
    • 3 ist ein Blockdiagramm eines beispielhaften Netzwerks aus Lautsprechern;
    • 4 ist ein Ablaufdiagramm eines Verfahrens zur Messung und Kalibrierung eines beispielhaften Netzwerks aus Lautsprechern;
    • 5 ist ein Ablaufdiagramm eines Verfahrens zur automatischen Erkennung einer Lautsprecherplatzierung für ein beispielhaftes Netzwerk aus Lautsprechern;
    • 6 ist ein zweidimensionales Diagramm von Mikrofonelementpositionsvektoren für das beispielhafte Netzwerk aus Lautsprechern;
    • 7A ist ein Blockdiagramm eines einzelnen Lautsprechers in dem Netzwerk aus Lautsprechern;
    • 7B ist ein Beispiel einer kreisförmigen Mikrofonanordnung, die ein Ereignis einer ebenen Welle auf der Anordnung zeigt;
    • Die 8A 8D sind Darstellungen von Schallwellen für ein oder mehrere Testimpulsquellsignale, Echowege und in planare Bereiche gruppierte Reflexionspunkte, wenn jeder Lautsprecher an der Reihe ist, einen Testimpuls zu emittieren; und
    • Die 9A und 9B sind Ablaufdiagramme eines Verfahrens zum Modellieren jeglicher Flächen in einer Hörumgebung, die Audiowellen reflektieren, und zum Anwenden des Modells, um ein genaues Strahlformen von dreidimensionalen Audioeffekten zu erzeugen.
  • In den Figuren sind Elemente und Schritte der Einfachheit und der Klarheit wegen veranschaulicht und wurden nicht notwendigerweise gemäß einer konkreten Sequenz gestaltet. Zum Beispiel sind Schritte in den Figuren veranschaulicht, die gleichzeitig oder in einer anderen Reihenfolge durchgeführt werden können, um dabei zu unterstützen, das Verständnis von Ausführungsformen des Gegenstands der Erfindung zu verbessern.
  • BESCHREIBUNG DER ERFINDUNG
  • Während verschiedene Aspekte des Gegenstands der Erfindung unter Bezugnahme auf eine konkrete veranschaulichende Ausführungsform beschrieben sind, ist der Gegenstand der Erfindung nicht auf solche Ausführungsformen beschränkt, und zusätzliche Modifizierungen, Anwendungen und Ausführungsformen können umgesetzt werden, ohne von dem Gegenstand der Erfindung abzuweichen. In den Figuren werden gleiche Bezugszeichen verwendet, um die gleichen Komponenten zu veranschaulichen. Der Fachmann wird erkennen, dass die verschiedenen hierin dargelegten Komponenten verändert werden können, ohne vom Umfang des Gegenstands der Erfindung abzuweichen.
  • Hierin wird ein System und ein Verfahren zum Selbstorganisieren einer vernetzten Lautsprecherplattform ohne menschliche Einwirkung über das Anfordern einer Einstellungsprozedur hinaus dargestellt. 1 ist ein Blockdiagramm einer beispielhaften Lautsprecherkomponente oder eines beispielhaften Lautsprecherteilnehmers 100 einer oder mehrerer Ausführungsformen des Gegenstands der Erfindung. In 1 ist eine Lautsprecherkomponente 100 gezeigt, wie sie in der vernetzten Lautsprecherplattform verwendet wird. Die Lautsprecherkomponente 100 weist eine Netzwerkschnittstelle 102 mit einer Fähigkeit zum Audio Video Bridging/Time Sensitive Networking (AVB/TSN), eine anpassbare Medientaktgeberquelle 104, eine Mikrofonanordnung 106, zusätzliche Sensoren 108, einen Lautsprechertreiber 110 und einen Prozessor 112 auf, der zur digitalen Signalverarbeitung und Steuerungsverarbeitung in der Lage ist. Der Prozessor 112 ist eine Rechenvorrichtung, die computerausführbare Anweisungen beinhaltet, die von Computerprogrammen zusammengestellt oder interpretiert werden können, die unter Verwendung einer Vielfalt von Programmiersprachen und/oder -technologien erzeugt werden. Der Prozessor (wie etwa ein Mikroprozessor) empfängt im Allgemeinen Anweisungen, zum Beispiel von einem Speicher, einem computerlesbaren Medium oder dergleichen, und führt die Anweisungen aus. Der Prozessor beinhaltet ein nicht-flüchtiges computerlesbares Speichermedium, das dazu in der Lage ist, Anweisungen eines Softwareprogramms auszuführen. Das computerlesbare Speichermedium kann eine elektronische Speichervorrichtung, eine magnetische Speichervorrichtung, eine optische Speichervorrichtung, eine elektromagnetische Speichervorrichtung, eine Halbleiterspeichervorrichtung oder eine beliebige geeignete Kombination davon sein, ist jedoch nicht darauf beschränkt. Die durch den Prozessor 112 ausgeführten Anweisungen beinhalten digitale Signalverarbeitungsalgorithmen zum Generieren eines Audiosignals, zum Strahlformen von Audio, das von der Mikrofonanordnung 106 aufgezeichnet wurde, sowie Steueranweisungen, um Taktgeber zu synchronisieren, Messprozeduren zu koordinieren und um Ergebnisse zusammenzustellen, um einen gemeinsamen Referenzrahmen und eine gemeinsame Zeitbasis für jeden Lautsprecher in dem Netzwerk aus Lautsprechern bereitzustellen. Abhängig von den Systemanforderungen kann der Prozessor 112 ein einzelner Prozessor oder eine Kombination aus einem separaten Steuerungs- und DSP-Prozessor sein.
  • Der Prozessor 112 hat entweder intern oder über eine interne Unterstützung einer peripheren Vorrichtung Zugriff auf die Fähigkeit zur digitalen Audioausgabe an einen Digital-Analog-Wandler (DAC - digital analog converter) und einen Verstärker, der die Lautsprechertreiber speist. Die digitale Audioausgabe kann eine Pulscodemodulation (PCM) sein, bei der analoge Audiosignale in digitale Audiosignale umgewandelt werden. Der Prozessor hat entweder intern oder über eine interne Unterstützung einer peripheren Vorrichtung Zugriff auf die Fähigkeit zur PCM oder Pulsdichtemodulation (PDM). Der Prozessor 112 hat entweder intern oder über eine interne Unterstützung einer peripheren Vorrichtung Zugriff auf die Fähigkeit zur genauen feinkörnigen Anpassung einer Phasenregelschleife (PLL - phase locked loop), die einen Abtasttaktgeber für den DAC und die Mikrofonanordnungsschnittstelle bereitstellt. Digitale PDM-Mikrofone können bei einem feststehenden Vielfachen des Abtasttaktgebers laufen. Der Prozessor 110 hat entweder intern oder über eine interne Unterstützung einer peripheren Vorrichtung Zugriff auf die Fähigkeit zur hochauflösenden Zeitstempelaufnahme für mediale Taktflanken. Die Zeitstempel können präzise zu dem gPTP (generalized Precision Timing Protocol - generalisierten Precision Time Protocol) umwandelbar sein und zu den Abtastungen zurückverfolgt werden, die an der Zeitstempeltaktflanke ein- und ausgetaktet werden.
  • Der Prozessor 112 hat entweder intern oder über eine interne Unterstützung einer peripheren Vorrichtung Zugriff auf die Fähigkeit einer oder mehrerer AVB/TSN-fähiger Netzwerkschnittstellen. Eine beispielhafte Konfiguration beinhaltet ein Paar von Schnittstellen, das in einem AVB/TSN-fähigen Dreikanalschalter integriert ist, der einen verketteten Satz von Lautsprecherkomponenten ermöglicht. Andere Beispiele sind eine einzelne Schnittstelle, die eine Sterntopologie mit einem externen AVB/TSN-Schalter nutzt, oder die Verwendung von drahtlosen oder anderen gemeinsam genutzten Medien-AVB/TSN-Schnittstellen.
  • Fähigkeiten der AVB/TSN-Netzwerkschnittstelle können genaues Zeitstempeln von übertragenen und empfangenen Paketen in Übereinstimmung mit der gPTP-Spezifikation und einen Mechanismus beinhalten, bei dem der integrierte Zeitgeber mit einem hochauflösendem Systemzeitgeber auf dem Prozessor derart korreliert werden kann, dass genaue Umwandlungen zwischen einem beliebigen ursprünglichen Zeitgeber und der gPTP-Grandmasterzeit durchgeführt werden können.
  • 2 ist ein Blockdiagramm der Mikrofonanordnung für eine Seite der Lautsprecherkomponente 200. Jede Lautsprecherkomponente 200 weist eine Anordnung 206 von Mikrofonelementen 214 auf, die in einem vorbestimmten geometrischen Muster angebracht sind, wie etwa ein in 2 gezeigter Kreis. Das vorbestimmte geometrische Muster ist derart über den dreidimensionalen Raum verteilt, dass Strahlformungsalgorithmen dazu in der Lage sind, eine relative Richtung und Höhe eines aufgezeichneten Audios auf Grundlage von Messungen, wie etwa einer Ankunftszeitdifferenz einer Wellenfront eines Tons an unterschiedlichen Mikrofonelementen 214, zu bestimmen. Eine Konfiguration für die Mikrofonanordnung kann zum Beispiel ein Satz aus insgesamt sechzehn Mikrofonelementen 214 sein. Ein erster Kreis aus acht Elementen 214 ist an einer Seite, zum Beispiel einer Oberseite, des Lautsprechers angebracht, wie in 2 gezeigt, und ein zweiter Kreis (nicht in 2 gezeigt) aus acht Mikrofonelementen 214 würde sich an einer anderen Seite des Lautsprechers in einer Ebene befinden, die senkrecht zu der Ebene, oder zu der Oberseite des in dem in 2 gezeigten Beispiels, des ersten Kreises aus Mikrofonelementen 214 ist. Es ist anzumerken, dass die Anzahl von Mikrofonelementen in der Anordnung und dem in 2 gezeigten vorbestimmten geometrischen Muster nur als Beispiel dient. Variationen der Anzahl und des Musters von Mikrofonelementen in der Anordnung von 206 sind möglich und zu zahlreich, um hierin erwähnt zu werden. Die Konfiguration von geometrischen Mustern und die Anzahl von Mikrofonelementen in der Anordnung können Abwägungen zwischen Richtung und Höhe ergeben.
  • Zusätzlich zu den Mikrofonelementen 214 können Sensoren 208 Sensoren beinhalten, die Luftdichte und Entfernung erfassen. Da die Ausbreitungsgeschwindigkeit von Schallwellen in Luft basierend auf der Luftdichte variiert, können zusätzliche Sensoren 208 enthalten sein, um das Schätzen einer Luftdichte einer aktuellen Umgebung zu unterstützen und somit die Entfernungsschätzungen zu verbessern. Die zusätzlichen Sensoren 208 können eine Kombination aus Temperatur-, Feuchtigkeits- und Luftdrucksensoren sein. Es ist anzumerken, dass die zusätzlichen Sensoren 208 dem Zweck des Verbesserns der Entfernungsschätzungen dienen. Die zusätzlichen Sensoren 208 können auf Grundlage von Leistungsanforderungen im Vergleich zu den Kosten des Systems weggelassen werden.
  • Eine minimale Anzahl von Lautsprecherkomponenten 200 in einem Netzwerk stellt Messungen von den Mikrofonanordnungen 206 bereit, die zum Bestimmen von relativen Standorten und Orientierungen der Lautsprecherkomponenten in dem Netzwerk ausreichend sind. Insbesondere zusätzliche Sensoren 208, die Orientierungssensoren, wie etwa MEMS-Beschleunigungsmesser, Gyroskope und Magnetometer (digitale Kompasse), beinhalten, können wertvolle Datenpunkte in Positionserkennungsalgorithmen bereitstellen.
  • 3 ist ein Beispiel eines Netzwerks 300 aus Lautsprecherkomponenten 302, das um einen Umfang eines Raums 308 angebracht ist. Eine der Lautsprecherkomponenten 302 ist als ein Koordinator 304 festgelegt. Der Koordinator 304 initiiert eine Testprozedur, indem er mindestens eine der Lautsprecherkomponenten 302 anweist, einen Testimpuls 306 zu genieren und wiederzugeben. Das Verfahren wird nachfolgend ausführlich beschrieben.
  • 4 ist ein Ablaufdiagramm eines Verfahrens 400 zur Messung und Kalibrierung eines zeitsynchronisierten Netzwerks aus Lautsprechern mit Mikrofonanordnungen. Unter Bezugnahme auf 4 beginnt das Verfahren 400 mit einer Erkennungsphase 402, die Netzwerkpeers bestimmt und eine Priorität einrichtet. Beim Anschalten und Erfassen eines Verbindungsereignisses des Netzwerks tritt das Verfahren in die Erkennungsphase ein. Die Erkennungsphase beinhaltet das Initiieren von AVB/TSN-Standardprotokollvorgängen 404, wie etwa das Bestimmen eines gPTP-Grandmasters und von Domänenattributen des Stream Reservation Protocols (SRP). Die Erkennungsphase beinhaltet auch das Bestimmen des Vorhandenseins und der Fähigkeiten anderer Teilnehmer 406 (d. h. vernetzter Lautsprecher) in dem Netzwerk. Teilnehmer können wie hierin beschriebene Lautsprecher, aber auch angemessen ausgerüstete PCs, interaktive Steuertafeln usw. beinhalten, sofern sie die Anforderungen zur AVB/TSN-Teilnahme erfüllen und mit den computerlesbaren Anweisungen für das Verfahren in dieser Schrift ausgerüstet sind.
  • Das Wählen eines einzelnen Teilnehmers als einen Koordinator des Netzwerks 408 wird ebenfalls während der Erkennungsphase 402 durchgeführt. Die Wahl des Koordinators basiert auf konfigurierbaren Prioritätsniveaus zusammen mit merkmalbasierten Standardprioritäten. Eine Vorrichtung mit einem Medientaktgeber höherer Qualität oder größerer Verarbeitungsleistung kann zum Beispiel eine höhere Standardpriorität aufweisen. Prioritätsfestlegungen können durch Ordnen einzigartiger Vorrichtungskennungen, wie etwa MAC-Netzwerkadressen, aufgeteilt werden. Falls ein gewählter Koordinator aus dem Netzwerk fällt, wird ein neuer Koordinator gewählt. Der Koordinator stellt einen einzelnen Schnittstellenpunkt des Lautsprechernetzwerks dar.
  • Bei der Wahl eines Koordinators 408 richtet der Koordinator mittels eines Stream Reservation Protocols (SRP) einen Medientaktgebersynchronisationsstrom in dem Netzwerk ein und übermittelt 410 diesen. Aus dem Wahlprotokoll ist anderen Teilnehmern (d. h. den Lautsprechern) die Wahl bekannt und sie hören dem Strom aktiv zu, sobald sie die Übermittlung 410 hören. Die anderen Teilnehmer empfangen den Synchronisationsstrom und verwenden ihn, um ihre eigene Abtasttaktgeberphasenregelschleife anzupassen, bis sie sowohl an der Frequenz als auch der Phase des Koordinatormedientaktgebers ausgerichtet ist. Sobald dies eingetreten ist, teilt jeder Teilnehmer dem Koordinator mit, dass seine Synchronisation abgeschlossen ist. Sobald alle der Teilnehmer in dem Netzwerk dem Koordinator ihre Synchronisation gemeldet haben, teilt der Koordinator mit, dass das System einsatzbereit ist.
  • Auf Grundlage einer Benutzereingabe, wie etwa von einer Steuerfläche, einem Hostsystem oder einer anderen Quelle, oder auf Grundlage einer vorbestimmten Situation, wie etwa eines ersten Einschaltens, verstrichener Laufzeit usw. initiiert 414 der Koordinator eine Messprozedur, indem sie den Netzwerklautsprecherteilnehmern mitgeteilt wird. Einer oder mehrere der Lautsprecherteilnehmer können einen Testimpuls 416 generieren. Der Testimpuls ist ein Audiosignal, das durch die festgelegten Lautsprecherteilnehmer generiert und wiedergegeben wird. Nach dem Generieren des Testimpulsereignisses teilen 418 die festgelegten Lautsprecherteilnehmer den in gPTP-Zeit übersetzten genauen Zeitpunkt, zu dem sie das Testimpulsereignis generiert haben, mit. Im Allgemeinen wird zu einem Zeitpunkt ein Testimpuls durch einen Lautsprecherteilnehmer generiert, für einige Testprozeduren kann der Koordinator jedoch mehrere Lautsprecherteilnehmer anweisen, gleichzeitig einen Testimpuls zu generieren. Die Teilnehmer zeichnen 420 die Sensordaten, die für die Testprozedur von Bedeutung sind, mit genauen Start- und Endzeitstempeln auf. Die Zeitstempel werden in gPTP-Zeit übersetzt.
  • Sensordaten, die bei einer Messprozedur 414 aufgenommen wurden, können als Eingabe in weitere Prozeduren verwendet werden. Zum Beispiel kann zuerst eine Messprozedur 414 initiiert werden, um Daten von den Sensoren zu erhalten, die mit der Umgebung und der Orientierung assoziiert sind. Für diese konkrete Messprozedur 414 ist kein Testimpuls erforderlich, aber alle Lautsprecherteilnehmer melden Informationen, wie etwa ihre Orientierung, Lokaltemperatur, Luftdruckmessungen usw. Anschließend kann der Reihe nach jeder Lautsprecherteilnehmer festgelegt werden, um einen Testimpuls zu erzeugen, der aus einem Hochfrequenzton, einem „Chirp“, besteht, woraufhin alle anderen Lautsprecherteilnehmer dem Koordinator den Zeitstempel melden, bei dem die erste Reaktionsabtastung an jedem ihrer Mikrofonelemente aufgezeichnet wurde. Die zuvor erhaltenen Umgebungsdaten können dann mit der Zeitdifferenz zwischen jedem Testimpuls und jeder Reaktion verwendet werden, um die Entfernung aus der Ausbreitungszeit, für den lokalen Luftdruck korrigiert, zu berechnen.
  • Sobald die Messprozeduren abgeschlossen sind, werden die Ergebnisse zuerst lokal zusammengestellt 422 und dann an den Koordinator kommuniziert. Abhängig von der angeforderten Messprozedur kann die Zusammenstellung 422 sowohl an dem Messpunkt als auch an dem Koordinator erfolgen, bevor ein Melden auftritt. Wenn ein Lautsprecherteilnehmer zum Beispiel die lokale Reaktion auf einen Hochfrequenz-„Chirp“-Testimpuls aufzeichnet, kann er eine Analyse der Signale lokal bei dem Lautsprecherteilnehmer durchführen. Die Analyse kann das Strahlformen eines ersten Reaktionssignals über die Mikrofonanordnung beinhalten, um einen Ankunftswinkel zu bestimmen. Die Analyse kann ferner die Analyse weiterer Reaktionen in dem Abtaststrom beinhalten, die ein Echo angeben, das Strahlformen ausgesetzt sein kann. Die Ergebnisse lokaler Analyse können abhängig von der Anforderung von dem Koordinator anstelle der oder zusammen mit Rohabtastdaten weitergeleitet werden.
  • Die Ergebnisse können auch durch den Koordinator zusammengestellt werden. Wenn der Koordinator Berichte von anderen Lautsprechern empfängt, kann er auch eine Zusammenstellung 422 durchführen. Er kann zum Beispiel die geschätzten Entfernungen und Winkel, die von den Lautsprecherteilnehmern in dem System gemeldet werden, zusammen mit den Ergebnissen von Orientierungssensoren mittels Triangulation oder Multilateration in einen Satz von dreidimensionalen Koordinaten kombinieren, die die geschätzten Standorte der Lautsprecher in ihrer Umgebung ergeben.
  • Ein weiteres Beispiel von Zusammenstellung 422 kann darin bestehen, dass ein Lautsprecher einfach die einzelnen Abtastströme von seiner Mikrofonanordnung in eine einzelne Mehrkanaldarstellung kombiniert, bevor er sie an den Koordinator weiterleitet. Der Koordinator kann dann die Abtastungen, die er von jedem Lautsprecherteilnehmer empfängt, zusammenstellen, markieren und zeitausrichten, bevor er sie an einen Host weiterleitet. Der Host empfängt dann einen Satz von Daten mit einer hohen Anzahl von Kanälen, als ob eine einzelne Mehrkanalaufzeichnungsvorrichtung aufnimmt.
  • Nach der Zusammenstellung 422 werden die zusammengestellten Ergebnisse übertragen 424. Wenn die Messprozedur von einem Hostsystem angefordert wurde und der Host angefordert hat, die Ergebnisse zu empfangen, wird der Koordinator die erforderliche Sequenz von Testimpulsen und das Sammeln von Reaktionsdaten vornehmen. Nach dem Durchführen einer beliebigen angeforderten Zusammenstellung leitet der Koordinator die Daten an das Hostsystem, das die Anforderung initiiert hat, weiter und teilt die Einsatzfähigkeit des Systems zur Messung oder zur Wiedergabe mit.
  • Der Koordinator kann die Ergebnisse einer Messprozedur, entweder auf Anforderung oder automatisch, für späteres Melden an ein Hostsystem, wenn dies angefordert wird, auch speichern, sodass der Prozess nicht wiederholt werden muss, wenn der Host die Ergebnisse vergessen sollte oder ein anderer Host sie anfordert.
  • Zusätzlich oder alternativ können die Lautsprecherteilnehmer mit bestimmten vordefinierten Messprozeduren konfiguriert sein, deren Zusammenstellungsprozeduren zu Konfigurationsdaten über konkrete Lautsprecherteilnehmer und/oder das System als Ganzes führen. Die Prozeduren können automatisch oder als Reaktion auf einfache Benutzerschnittstellenelemente oder Hostbefehle durchgeführt werden. Basismessungen als Teil einer Systemeinstellung können zum Beispiel durch einen einfachen Hostschnittstellenbefehl ausgelöst werden, wie etwa das Berühren einer Taste.
  • In einem solchen Fall kann der Koordinator die relevanten Daten an alle Lautsprecherteilnehmer in dem Netzwerk weiterleiten, sobald er die Sequenz der Testimpulse abgeschlossen und die Reaktionen zusammengestellt hat. Für Konfigurationszwecke können die Lautsprecherteilnehmer diese Daten jeweils speichern.
  • Eine Messprozedur kann zum Beispiel in einen Satz von Entzerreranpassungen (EQ-Anpassungen) (EQ - equalizer) und Zeitverzögerungsparametern für jeden Lautsprecherteilnehmer in dem System führen. Die Ergebnisse können ein kalibriertes Referenzwiedergabeprofil für jeden Lautsprecherteilnehmer bilden. Eine andere Prozedur kann zu dreidimensionalen Koordinaten für den Standort des Lautsprecherteilnehmers führen. Die Koordinaten können gespeichert und als Ergebnis zukünftiger Anfragen wieder zurückgeführt werden.
  • Wie vorstehend erörtert, erfordert das Reproduzieren von dreidimensionalen Audioeffekten ziemlich genaue Kenntnis von relativen Standorten und Orientierungen von Lautsprecherteilnehmern, die zum Reproduzieren der 3-D-Effekte verwendet werden. Unter Verwendung der vernetzten Lautsprecherplattform mit den unter Bezugnahme auf die 1-4 vorstehend erörterten zeitsynchronisierten Netzwerk- und Mikrofonanordnungen wird hierin ein Verfahren zum automatischen Bestimmen des genauen relativen Standorts von Lautsprecherteilnehmern innerhalb eines VR/AR-Raums ohne menschliche Einwirkung dargestellt. Die Kombination aus genauer Zeitsynchronisation, Mikrofonanordnungen mit bekannter Geometrie an den Lautsprecherteilnehmern und zusätzlichen Orientierungssensoren stellt adäquate Daten bereit, um alle der Lautsprecherteilnehmer in einem relativen 3-D-Raum nach Abschluss des Verfahrens 400 zu lokalisieren. Die genauen Raumkoordinaten der Lautsprecherteilnehmer ermöglichen die Reproduktion von 3-D-Audioeffekten und zusätzliche Messgenauigkeit für Verwirklichungen, wie etwa die Echtzeitpositionsverfolgung von Audioquellen.
  • Unter erneuter Bezugnahme auf 3 sind die vernetzten Lautsprecherteilnehmer 302 um den Umfang des Raums 308 angebracht, der eine innere Form aufweist, die ein konvexes Polygon bildet. Es ist ein direkter Schallausbreitungsweg zwischen jedem Paar von Lautsprecherteilnehmern in dem Raum nötig. Wenngleich in dem vorliegenden Beispiel ein konvexes Polygon dargestellt ist, können auch andere Formen möglich sein, sofern die Lautsprecherteilnehmer selbst in der Form eines konvexen Polygons angebracht sind und keine Barrieren, d. h. Wände, in die Kanten des Polygons hineinragen. Räume mit einer unüblichen Geometrie können angepasst werden, indem die Lautsprecherteilnehmer in Gruppen (d. h. zwei Gruppen) positioniert werden, bei denen die Bedingung, direkte Schallausbreitungswege zwischen Lautsprechern aufzuweisen, erfüllt wird und mindestens ein Lautsprecher in beiden Gruppen enthalten ist.
  • Unter Bezugnahme auf 5 wird ein Ablaufdiagramm beschrieben, das ein Verfahren 500 zum automatischen Erkennen eines Lautsprecherteilnehmers darstellt. Es wird ein Testimpuls generiert und aufgezeichnet 502. Jede Lautsprecherkomponente oder jeder Lautsprecherteilnehmer in dem Netzwerk emittiert der Reihe nach ein Signal, wie etwa ein Audiosignal, das von allen Lautsprecherteilnehmern in dem Netzwerk gleichzeitig gemessen wird. Ein akzeptables Signal muss ein solches sein, gegenüber dem die Mikrofonanordnungen empfindlich sind und das die Lautsprecher produzieren können. Das Signal kann zum Beispiel im Ultraschallbereich liegen. Im Allgemeinen wäre jeder beliebige monochromatische Schallimpuls mit einer Frequenz akzeptabel, die in der Nähe eines oberen Endes eines Bereichs liegt, der durch das System auflösbar ist. Der genaue Zeitpunkt des Testimpulssignals wird durch den Koordinator bereitgestellt und alle Lautsprecherteilnehmer beginnen zu diesem Zeitpunkt das Aufzeichnen von Abtastungen von ihren Mikrofonanordnungen. Der Lautsprecherteilnehmer, der für das Generieren des Testimpulses verantwortlich ist, zeichnet ebenfalls auf, sodass jegliche Latenz zwischen der Anweisung zum Generieren des Testimpulses und der tatsächlichen Schallemission des Testimpulses durch den Lautsprecherteilnehmer subtrahiert werden kann. Der Lautsprecherteilnehmer, der für das Generieren des Testimpulses verantwortlich ist, sendet den genauen Zeitstempel der ersten Audioabtastung, in dem er den Testimpulston aufzeichnet, an die anderen Lautsprecherteilnehmer. Die anderen Teilnehmer in dem System setzen das Aufzeichnen 502 fort, bis das Testimpulssignal von allen Mikrofonelementen in den Mikrofonanordnungen 504 aufgezeichnet wurde. Wenn ein Ton nicht aufgezeichnet werden kann, gibt dies einen Systemfehler 506 an. Daher kann ein Systemfehler identifiziert werden, sollte ein ausreichender Zeitraum ohne bestätigte Aufzeichnung verstreichen.
  • Die aufgezeichneten Daten werden durch die aufzeichnenden Vorrichtungen 508 zusammengestellt. Jeder Lautsprecherteilnehmer bestimmt die Differenz zwischen dem Zeitstempel der ersten aufgezeichneten Abtastung des Testimpulssignals und dem Zeitstempel, der von dem Lautsprecherteilnehmer empfangen wird, der das Testimpulssignal generiert hat. Diese Differenz stellt eine Laufzeit oder die Zeit dar, die die Testimpulsschallwelle benötigt hat, um sich durch die Luft zu den aufzeichnenden Mikrofonen in dem Lautsprecherteilnehmer, der das Testimpulssignal empfängt, auszubreiten. Der Wert der Flugzeit wird in eine Entfernung zwischen dem Sender (dem Lautsprecherteilnehmer, der den Testimpuls generiert hat) und dem Empfänger (dem Lautsprecher, der den Testimpuls empfangen und aufgezeichnet hat) umgewandelt, indem er mit einer Ausbreitungsgeschwindigkeit von Schall in Luft multipliziert wird.
  • Wie vorstehend unter Bezugnahme auf 2 erörtert, hat jeder Lautsprecherteilnehmer seine Mikrofonanordnungen in senkrechten Ebenen angebracht. Eine erste Mikrofonanordnung befindet sich in einer Ebene, die parallel zu einer Decke und einem Boden eines Raums sein kann. Eine zweite Mikrofonanordnung befindet sich in einer Ebene, die senkrecht zu der ersten Mikrofonanordnung ist. Für den Fall, dass der Lautsprecherteilnehmer geneigt ist, können Korrekturen an den Messungen vorgenommen werden. Ein Lautsprecherteilnehmer mit einem zusätzlichen Sensor, wie etwa einem Beschleunigungsmesser, ist zum Beispiel dazu in der Lage, eine Schwerkraftvektorrichtung in Bezug auf die Anordnung zu messen, die parallel zu der Decke oder dem Boden des Raums ist, wobei bekannt ist, dass die zweite Anordnung senkrecht dazu ist.
  • Unter Verwendung eines Strahlformungsalgorithmus, wie etwa eines klassischen verzögerten Summenstrahlformers, kann in jeder Mikrofonanordnungsebene ein Ankunftswinkel bestimmt werden. Dies ergibt Azimut- und Höhenmessungen in 3-D in Bezug auf eine Weisungsrichtung des Lautsprecherteilnehmers. Die absolute Weisungsrichtung der Lautsprecherteilnehmer ist noch unbekannt, wenn der Lautsprecherteilnehmer jedoch mit dem zusätzlichen Sensor ausgerüstet ist, der ein digitaler Kompass ist, kann dieser dazu verwendet werden, die absolute Weisungsrichtung zu schätzen.
  • Jedes der Mikrofone in den Mikrofonanordnungen der Lautsprecherteilnehmer weist eine Entfernung und einen 3-D-Richtungsvektor zu dem Testimpuls-Lautsprecherteilnehmer auf und identifiziert somit einen Standort im 3-D-Raum, der an jedem Mikrofon (jeder Zuhörvorrichtung) zentriert ist. Siehe 6 für ein Diagramm, das eine zweidimensionale Darstellung 600 der Lautsprecherteilnehmer 602 und der Positionsvektoren 604 zeigt, die die zusammengestellten Ergebnisse für jedes Mikrofon darstellen. Jeder Vektor 604 ist eine Ausgabe des vorstehend beschriebenen Prozesses, da er sich auf die gesamte Anordnung von Mikrofonen an dem Lautsprecher bezieht. Jeder Vektor 604(1-5) stellt die Ausgabe der Mikrofonanordnung für ein Testimpulsereignis an jedem anderen Lautsprecher 602(1-6) in der Vielzahl von Lautsprechern dar. Der Lautsprecher 602(1) zeigt als messender Lautsprecher zum Beispiel die Vektoren 604(2-6), die Messwerte der Mikrofonanordnung an dem Lautsprecher 602(1) darstellen, wenn die Lautsprecher 602(2-6) ihren Testimpuls emittieren.
  • Unter erneuter Bezugnahme auf 5 werden die Positionsinformationen zusammen mit allen zusätzlichen Sensorinformationen, wie etwa Temperatur-, Druck- oder Orientierungssensordaten, an den Koordinator übertragen. Der Koordinator wählt den nächsten Lautsprecherteilnehmer aus, um das Testimpulssignal 502 zu generieren, und die Schritte 504-508 werden wiederholt, bis alle Lautsprecherteilnehmer an der Reihe waren, um das Testimpulssignal zu generieren, und alle Reaktionen gesammelt wurden.
  • Die Ergebnisse werden durch den Koordinator zusammengestellt 510. Der Koordinator weist nun Daten für ein hochgradig überbestimmtes geometrisches System auf. Jeder Lautsprecherteilnehmer in einem System mit n Lautsprechern weist n - 1 Positionsschätzungen auf. Jede absolute Position einer Schätzung wird jedoch durch eine absolute Position beeinflusst, die dem Lautsprecherteilnehmer zugewiesen ist, der sie gemessen hat. Alle Positionsschätzungen müssen auf eine Weise in ein gemeinsames Koordinatensystem gebracht werden, das auch als ein globaler Koordinatenraum bezeichnet wird, dass die Messungen, die von jeder Positionsschätzung aufgenommen werden, mit anderen Messungen des gleichen Testimpulses harmonieren. Dies läuft auf ein Optimierungsproblem hinaus, dessen objektive Funktion darin besteht, die quadrierte Summe der Fehler in den gemessenen Positionen gegenüber den zugewiesenen Positionen zu minimieren, sobald alle Teilnehmer und Messungen in das gemeinsame Koordinatensystem übersetzt wurden. In dem Algorithmus wird den gemessenen Entfernungen eine größere Zuverlässigkeit zugewiesen, als den gemessenen Winkeln zugewiesen wird.
  • Die zusammengestellten Ergebnisse werden gespeichert und verteilt 512. Sobald ein optimaler Satz von Positionen zusammengestellt wurde, werden die Positionen jedes Lautsprechers in dem Netzwerk als eine Gruppe an alle Teilnehmer in dem Netzwerk gesendet. Jeder Lautsprecherteilnehmer speichert seine eigene Position in dem globalen Koordinatenraum und übersetzt aktualisierte Positionen von allen anderen Teilnehmern in seinen eigenen lokalen Referenzrahmen zur leichteren Verwendung in beliebigen lokalen Berechnungen, zu deren Ausführung er aufgefordert werden kann.
  • Eine Verwaltungsvorrichtung, wie etwa ein PC, ein Mobiltelefon oder ein Tablet, die in Kommunikation mit dem Lautsprechernetzwerk steht, kann dazu verwendet werden, das globale Koordinatensystem zu ändern, damit es besser zu einem Benutzer des Systems passt. Ein übersetzter Satz von Koordinaten kann zum Beispiel an die Lautsprecher kommuniziert werden und die Lautsprecher müssen nur ihre eigene Position aktualisieren, da der Rest in Bezug darauf gespeichert ist.
  • Eine Verwaltungsvorrichtung, der aktuelle Koordinaten der Lautsprecherteilnehmer in dem Netzwerk unbekannt sind, kann anfordern, dass die Koordinatorvorrichtung Koordinaten in dem aktuellen Koordinatensystem bereitstellt. Der Koordinator fordert an, dass alle Lautsprecherteilnehmer in dem Netzwerk ihre eigenen Koordinaten senden, stellt diese in einer Liste zusammen und führt sie zu der Verwaltungsvorrichtung zurück.
  • Für ein genaueres Strahlformen von dreidimensionalem Audioinhalt ist es hilfreich, nicht nur die Standorte der Lautsprecher zu kennen, sondern auch die Standorte jeglicher Flächen in dem Raum, die Audiowellen reflektieren. Ein genaues Modell der Reflexionsflächen in der Umgebung kann generiert werden, um Reflexionen für einen Zielzuhörer aufzuheben und eine bessere Wahrnehmung einer veränderten Umgebung für den Hörer bereitzustellen. 7 ist ein Beispiel einer Lautsprecher- und Mikrofonanordnungsanbringung, die in einem Verfahren verwendet wird, um Messungen der unmittelbaren Umgebung des Systems zu koordinieren und um aus den Messungen die Standorte von reflektierenden Objekten in der Umgebung zu generieren.
  • Zum Zwecke der Einfachheit weist die hierin beschriebene Hörumgebung standardmäßig vier Wände, eine Decke und einen geebneten Boden auf, wobei die Decke parallel zu dem Boden ist. Die Wände sind gerade und erstrecken sich senkrecht vom Boden zur Decke und fügen sich zu einer standardmäßigen Eckenkonfiguration zusammen. Wenngleich ein typischer Raum mit 6 Flächen hierin modelliert wird, ist anzumerken, dass der hierin beschriebene Gegenstand der Erfindung auf jede beliebige Raumkonfiguration angewandt werden kann. Die Hörumgebung kann zum Beispiel ein Raum sein, der Wände, Teilwände, einen unebenen Boden, eine Traydecke oder eine Kassettendecke, nicht standardmäßige oder irreguläre Ecken, Türen und Fenster aufweist und auch Möbel und Menschen enthalten kann. In dem hierin beschriebenen Beispiel ist die Hörumgebung ein Raum mit sechs Flächen und standardmäßigen Wänden und einem standardmäßigen Boden sowie einer standardmäßigen Decke. Die Hörumgebung weist Lautsprecher auf, die wie vorstehend beschrieben um die Grenzen der Hörumgebung angebracht sind. Jeder Lautsprecher ist mit AVB/TSN-fähigen Netzwerkschnittstellen, zwei planaren Anordnungen von Mikrofonen, die in senkrechten Ebenen angebracht sind, ausgerüstet und kennt den relativen Standort jedes Lautsprechers in Bezug auf die anderen, etwa durch Verwendung der vorstehend in Bezug auf die 1-6 erörterten Messprozedur, wobei ein Verfahren zum Koordinieren der Messung der Umgebung des Systems verwendet wird, um aus den Messungen Standorte von reflektierenden Objekten in der Umgebung zu generieren. Anstatt wie vorstehend beschrieben nur die erste ankommende Schallwelle zu analysieren, wird ein Ankunftszeitpunkt und ein Ankunftswinkel jedes Echos für jeden Lautsprecher bestimmt und analysiert. Durch Anwenden geometrischer Analyse wird ein Standort eines Reflexionspunkts für jedes Echo bestimmt und ausgewählte Reflexionspunkte werden in einen Satz von möglichen Reflexionsebenen kombiniert.
  • Jeder Lautsprecherteilnehmer 700 ist mit einer AVB/TSN-fähigen Netzwerkschnittstelle 702, zwei ebenen Anordnungen von Mikrofonen 706a, 706b, die in senkrechten Ebenen angebracht sind, einem Taktgeber 704, zusätzlichen Sensoren 708 und einem Prozessor 712 ausgerüstet, wie in 7A gezeigt. Die Anordnung von Mikrofonen 706a, 706b für jeden Lautsprecherteilnehmer ist in einem vorbestimmten geometrischen Muster angebracht. In 7A ist ein kreisförmiges Muster gezeigt. Das Muster kann derart über den dreidimensionalen Raum verteilt sein, dass Strahlformungsalgorithmen dazu in der Lage sein können, die relative Richtung und Höhe eines aufgezeichneten Tons auf Grundlage von Messungen, wie etwa der Ankunftszeitdifferenz einer Wellenfront des Tons an unterschiedlichen Mikrofonelementen, zu bestimmen. Da die Ausbreitungsgeschwindigkeit von Schallwellen in Luft basierend auf der Luftdichte variiert, können zusätzliche Sensoren 708 enthalten sein, um das Schätzen einer aktuellen Luftdichte in der Umgebung zu unterstützen, wodurch Entfernungsschätzungen verbessert werden können. Die zusätzlichen Sensoren 708 können einen beliebigen einen oder beliebige mehrere von Temperatur-, Feuchtigkeits- und Luftdrucksensoren beinhalten, sind jedoch nicht darauf beschränkt. Die Lautsprecher können um die Grenzen der Umgebung angebracht sein, sodass sie ziemlich gleichmäßig um eine Region verteilt sind, in dem sich ein Zielzuhörer aufhalten kann. Es wurden Synchronisations- und Wahlprozeduren durchgeführt und ein relativer Standort jedes Lautsprechers ist bekannt.
  • 7B ist eine Darstellung der Geometrie, die mit einer ebenen Welle assoziiert ist, die an einem Mittelpunkt einer kreisförmigen Mikrofonanordnung 706 ankommt. Mikrofone 720-730 sind radial um den Mittelpunkt positioniert und eine Projektion einer radialen Komponente r zeigt die ankommende Welle. In der Praxis gibt es mindestens zwei Mikrofonanordnungen für jeden Lautsprecherteilnehmer, die senkrecht zueinander positioniert sind, und der Standort jedes Lautsprecherteilnehmers in Bezug auf die anderen Lautsprecherteilnehmer in dem vernetzten System ist bekannt.
  • Der Klarheit und Einfachheit wegen sind der Testimpuls und die Echowege als eine einzelne Linie zu und von jedem Lautsprecherteilnehmer und jeder Reflexionsfläche gezeigt. Unter Bezugnahme auf die 8A-8D sind Beispiele der Lautsprecheranbringung in der Umgebung gezeigt, die geometrische Informationen über Echowege (in gestrichelten Linien gezeigt) darstellt, die eine Schallwelle (in durchgezogener Linie gezeigt) von einem ersten Lautsprecher 802, der als Testimpulsquelle S1s, fungiert, zu jedem der anderen Lautsprecher 806, 808, 810 einschließlich der Quelle 802 zurückgelegt hat. Einer der Lautsprecher 802 der Vielzahl von Lautsprechern 802, 804, 806, 808 wurde als ein Koordinator 812 festgelegt, wie vorstehend unter Bezugnahme auf die 3 und 4 erörtert. Jeder Lautsprecher 802, 804, 806, 808 wird an der Reihe sein, eine Testimpulsquelle zu emittieren. Dies ist in 8A gezeigt, wobei der Lautsprecher 802 die Quelle S1s ist. In der 8B ist der Lautsprecher 804 die Quelle S2s. In der 8C ist der Lautsprecher 806 die Quelle S3s und in der 8D ist der Lautsprecher 808 die Quelle S4s.
  • Der Koordinator 812 ist für das Zuweisen von Startzeitpunkten, das Festlegen eines Lautsprechers, um seine Testimpulsquelle zu emittieren, das Empfangen aller aufgezeichneten genauen Zeitpunkte, die mit den Testimpulsquellen assoziiert sind, die an jeder Mikrofonanordnung in jedem Lautsprecher ankommen, sowie der Echopfade, die mit jedem Lautsprecher assoziiert sind, wie auch für das Kombinieren von Reflexionspunkten, um den Standort von Reflexionsflächen in der Umgebung zu modellieren und das Anwenden von Rauschunterdrückung, um die Reflexionsflächen zu kompensieren, wie nachfolgend ausführlicher in Bezug auf die 9A und 9B beschrieben, verantwortlich.
  • Unter Bezugnahme auf 9A ist ein Verfahren 900 für eine Messprozedur gezeigt, die damit beginnt, dass der Koordinator einem ersten Lautsprecher, der als eine Quelle festgelegt werden soll und dessen relativer Standort allen anderen Lautsprechern in der Hörumgebung bekannt ist, einen Startzeitpunkt zuweist 902. Der festgelegte Quellenlautsprecher emittiert 904 einen Testimpuls, oder einen Testton, und alle anderen Lautsprecher in der Umgebung hören zu, um zunächst den Testimpuls und jegliche Echos des Testimpulses zu erfassen. Wenn der Startzeitpunkt erreicht wird, emittiert 904 der Quellenlautsprecher den Testimpuls. Das Ankommen der ursprünglichen Welle des Testimpulses wird erfasst und ein genauer Zeitpunkt, zu dem er das Ankommen der ursprünglichen Welle des Testimpulses erfasst, wird aufgezeichnet 906. Der Schritt des Aufzeichnens eines genauen Zeitpunkts wird für das Ankommen jedes Echos fortgesetzt 908, das zu dem Quellenlautsprecher zurückkehrt. Für jedes Echo, das zu dem Quellenlautsprecher zurückkehrt, wird auch ein Winkel bestimmt 910, in dem das Echo ankommt.
  • Die Bestimmung eines Ankunftswinkels kann durch Durchführen eines Strahlformungsvorgangs an jedem Echo erreicht werden. Das Aufzeichnen 908, 910 wird für einen vorbestimmten Zeitraum oder bis zu einem Zeitpunkt fortgesetzt, bei dem die Echos abgeklungen 912 sind. Der Zeitraum, in dem das Aufzeichnen stattfindet, kann auf einer Zeit basieren, die als ausreichend betrachtet wird, oder darauf, dass ein vorbestimmter Zeitraum verstrichen ist, um eine ungefähre Größe der Umgebung zu berücksichtigen.
  • Zu dem zugewiesenen Startzeitpunkt erfolgt ebenfalls, dass jeder der Lautsprecher in der Umgebung damit beginnt, zuzuhören und aufzuzeichnen 914. Jeder der zuhörenden Lautsprecher erfasst einen genauen Zeitpunkt des ersten Ankommens des Testimpulses, der durch den Quellenlautsprecher emittiert wird, und einen genauen Ankunftszeitpunkt für jedes Echo 908 und zeichnet 906 diese auf. Es wird auch eine Bestimmung eines Winkels vorgenommen, in dem jedes Echo an jedem der zuhörenden Lautsprecher angekommen 910 ist. Erneut kann diese Bestimmung durch Durchführen eines Strahlformungsvorgangs an jedem Echo erreicht werden. Die zuhörenden Lautsprecher in der Umgebung setzen auch das Aufzeichnen 908 fort und bestimmen einen Ankunftswinkel 910 für jedes Echo für einen ausreichenden oder vorbestimmten Zeitraum 912, der eine ungefähre Größe der Umgebung berücksichtigen sollte.
  • Die Verfahrensschritte 902-914 werden wiederholt 916, bis jedem Lautsprecher durch den Koordinator sein Platz in der Reihe zugewiesen wurde, um als der Quellenlautsprecher einen Testimpuls zu emittieren 904. Unter Bezugnahme auf 9B fährt das Verfahren damit fort, dass jede der Lautsprechervorrichtungen ihre Zeitstempel des Ankommens der ursprünglichen Welle des Testimpulses und jedes der Echos zusammen mit dem dreidimensionalen Ankunftswinkel (der etwa durch Strahlformungsanordnungen für jedes Echo bestimmt wird) weiterleitet, die durch den Koordinator kombiniert 920 werden sollen. Der Koordinator kombiniert 920 das geometrische Wissen der bekannten relativen Standorte jedes der Lautsprecher mit den neu erhaltenen geometrischen Informationen, die die Reflexionsflächen der Hörumgebung darstellen. Der Koordinator weist bereits geometrisches Wissen über die relativen Standorte der Lautsprecher auf. Dieses Wissen kann mit den gesammelten geometrischen Informationen über die Echowege kombiniert werden, die jeder Testimpuls von seinem Quellenlautsprecher zu jedem der Lautsprecher (einschließlich der Quelle) in der Umgebung zurückgelegt hat. Während dieses Prozesses müssen einige Reflexionspunkte möglicherweise verworfen 922 werden. Bestimmte Reflexionspunkte können zum Beispiel das Ergebnis von Reflexionen höherer Ordnung oder andere fehlerhafte Echoerkennungsereignisse sein. Solche Reflexionspunkte sollten aus der Kombination ausgeschlossen werden.
  • Eine Differenz zwischen dem aufgezeichneten Zeitpunkt, zu dem der Quellenlautsprecher seinen ursprünglichen Testimpuls hört, und dem aufgezeichneten Zeitpunkt, zu dem jeder zuhörende Lautsprecher ein oder mehrere Echos hört, stellt eine zurückgelegte Entfernung dar. Für eine einzelne Reflexion zwischen zwei Lautsprechern bildet die Geometrie des Echos ein Dreieck, sodass der Standort der Reflexionsfläche durch die Entfernung und den Ankunftswinkel bestimmt werden kann. Zwei der anderen Punkte des Dreiecks sind bereits bekannt (der Standort der Quelle und der Standort des zuhörenden Lautsprechers in Bezug auf die Quelle). Der Ankunftswinkel für jedes Echo unterstützt bei dem Bestimmen, ob die Reflexionsfläche eine horizontale Fläche oder eine vertikale Fläche ist und Reflexionspunkte darstellen.
  • Der Koordinator nimmt alle verbliebenen Reflexionspunkte und gruppiert sie 924 auf Grundlage einer geschätzten Orientierung und Komplanarität in planare Bereiche. Die Gruppierungen bestimmen 926 einen Standort jeglicher Reflexionsflächen in der Umgebung 926. Aus dieser Bestimmung wird ein Modell der Reflexionsflächen innerhalb der Umgebung erzeugt 928. Das Modell stellt Wissen über den Standort der Lautsprecher bereit und der Standort jeglicher Reflexionsflächen in der Umgebung stellt ein genaueres Strahlformen des dreidimensionalen Audioinhalts 930 bereit, wobei Schall generiert werden kann, um Reflexionen für einen Zielzuhörer aufzuheben und eine bessere Wahrnehmung einer veränderten Umgebung für den Zielzuhörer bereitzustellen.
  • In der vorstehenden Beschreibung wurde der Gegenstand der Erfindung unter Bezugnahme auf bestimmte beispielhafte Ausführungsformen beschrieben. Es können jedoch verschiedene Modifikationen und Änderungen vorgenommen werden, ohne vom Umfang des Gegenstands der Erfindung abzuweichen, wie er in den Ansprüchen dargelegt ist. Die Beschreibung und die Figuren sind veranschaulichend und nicht einschränkend und es ist beabsichtigt, dass Modifikationen in den Umfang des Gegenstands der Erfindung fallen. Demnach sollte der Umfang des Gegenstands der Erfindung durch die Ansprüche und deren rechtliche Äquivalente und nicht nur durch die beschriebenen Beispiele bestimmt werden.
  • Die genannten Schritte in einem beliebigen Verfahren oder einem beliebigen Prozess können zum Beispiel in einer beliebigen Reihenfolge ausgeführt werden und sind nicht auf eine bestimmte Reihenfolge, die in den Ansprüchen dargestellt ist, beschränkt. Messungen können mit einem Filter umgesetzt sein, um Effekte von Signalrauschen zu minimieren. Zusätzlich können die in allen Vorrichtungsansprüchen genannten Komponenten und/oder Elemente in einer Vielfalt von Permutationen zusammengesetzt oder anderweitig betriebsmäßig konfiguriert werden und sind demnach nicht auf die bestimmte in den Ansprüchen genannte Konfiguration beschränkt.
  • Vorzüge, andere Vorteile und Lösungen für Probleme wurden vorstehend in Bezug auf konkrete Ausführungsformen beschrieben; jeder Vorzug, jeder Vorteil oder jede Lösung für ein Problem oder jedes Element, das das Auftreten oder Hervorheben irgendeines konkreten Vorzugs, irgendeines konkreten Vorteils oder irgendeiner konkreten Lösung bewirkt, sind jedoch nicht als entscheidende, erforderliche oder wesentliche Merkmale oder Komponenten eines beliebigen oder sämtlicher Ansprüche auszulegen.
  • Mit den Begriffen „umfassen“, „umfasst“, „umfassend“, „aufweisend“, „beinhaltend“, „beinhaltet“, „enthalten“ oder einer beliebigen anderen Variation derselben soll ein nicht ausschließlicher Einschluss derart abgedeckt werden, dass ein Prozess, ein Verfahren, ein Artikel, eine Zusammensetzung oder eine Vorrichtung, der/das/die eine Liste von Elementen umfasst, nicht nur diese genannten Elemente einschließt, sondern auch andere nicht ausdrücklich aufgelistete oder für einen solchen Prozess, ein solches Verfahren, einen solchen Artikel, eine solche Zusammensetzung oder eine solche Vorrichtung inhärente Elemente einschließen kann. Andere Kombinationen und/oder Modifikationen der vorstehend beschriebenen Strukturen, Anbringungen, Anwendungen, Proportionen, Elemente, Materialen oder Komponenten, die in der Praxis des Gegenstands der Erfindung zusätzlich zu den nicht konkret genannten verwendet werden, können variiert oder auf andere Weise konkret an bestimmte Umgebungen, Fertigungsspezifikationen, Gestaltungsparameter oder andere Betriebsanforderungen angepasst werden, ohne von den allgemeinen Prinzipien derselben abzuweichen.

Claims (12)

  1. Verfahren, das durch einen Prozessor (112; 712) mit einem nicht transitorischen Speichermedium zum Speichern von Programmcode ausgeführt wird, wobei das Verfahren die folgenden Schritte umfasst: a. Festlegen einer Lautsprecherkomponente (100; 200; 302; 602; 700) als einen Koordinator (304) in einer Hörumgebung mit einem Netzwerk (300) aus Audio-Video Bridging/Time Synchronized Network (AVB-/TSN)-Lautsprecherkomponenten (100; 200; 302; 602; 700), wobei jede Lautsprecherkomponente (100; 200; 302; 602; 700) eine erste Anordnung von Mikrofonen (106; 206; 706a) in einer ersten Ebene und mindestens eine zweite Anordnung von Mikrofonen (106; 206; 706b) in einer zweiten Ebene, die senkrecht zu der ersten Ebene ist, aufweist, und wobei ein Standort jeder Lautsprecherkomponente (100; 200; 302; 602; 700) in der Hörumgebung jeder der anderen Lautsprecherkomponenten (100) bekannt ist; b. Zuweisen (902) eines Startzeitpunkts zu einer der Lautsprecherkomponenten (100; 200; 302) in dem Netzwerk (300) aus Audio-Video Bridging/Time Synchronized Network (AVB/TSN)-Lautsprecherkomponenten durch den Koordinator; c. Emittieren (904) eines Testimpulses (306) zu dem zugewiesenen Startzeitpunkt durch die eine Lautsprecherkomponente (304); d. Aufzeichnen (906) eines genauen Ankunftszeitpunkts des Testimpulses (306) an jeder Lautsprecherkomponente (100; 200; 302; 602; 700); e. Weiterleiten (906) des genauen Ankunftszeitpunkts des Testimpulses (306), der an jeder Lautsprecherkomponente (100; 200; 302; 602; 700) aufgezeichnet wurde, an den Koordinator; f. Bestimmen eines Ankunftswinkels des Testimpulses (306) an jeder Lautsprecherkomponente (100; 200; 302; 602; 700); g. Weiterleiten des Ankunftswinkels des Testimpulses (306), der an jeder Lautsprecherkomponente (100; 200; 302; 602; 700) bestimmt wurde, an den Koordinator (304); h. Aufzeichnen (908) eines genauen Ankunftszeitpunkts für jedes Echo des Testimpulses (306) an jeder Lautsprecherkomponente (100; 200; 302; 602; 700); i. Weiterleiten (908) des genauen Ankunftszeitpunkts jedes Echos des Testimpulses (306), der an jeder Lautsprecherkomponente (100; 200; 302; 602; 700) aufgezeichnet wurde, an den Koordinator (304); j. Bestimmen (910) eines Ankunftswinkels jedes Echos des Testimpulses (306) an jeder Lautsprecherkomponente (100; 200; 302; 602; 700); k. Weiterleiten (910) des Ankunftswinkels jedes Echos, der an jeder Lautsprecherkomponente (100; 200; 302; 602; 700) bestimmt wurde, an den Koordinator (304); 1. Fortführen der Schritte des Aufzeichnens eines genauen Ankunftszeitpunkts für jedes Echo des Testimpulses (306) und des Bestimmens eines Ankunftswinkels für jedes Echo des Testimpulses (306) für einen vorbestimmten Zeitraum, der es ermöglicht, den genauen Ankunftszeitpunkt jedes Echos aufzuzeichnen und an den Koordinator weiterzuleiten und den Ankunftswinkel jedes Echos zu bestimmen und an den Koordinator weiterzuleiten; m. Wiederholen (918) der Schritte (a) - (1) bis jeder Lautsprecher (100; 200; 302; 602; 700) in dem Netzwerk (300) aus Audio-Video Bridging/Time Synchronized Network (AVB/TSN)-Lautsprechem (100; 200; 302; 602; 700) einen Testimpuls (306) emittiert hat und alle der aufgezeichneten genauen Ankunftszeitpunkte und der bestimmten Ankunftswinkel an den Koordinator (304) weitergeleitet wurden; n. Bestimmen, bei dem Koordinator (304), von Komplanarität und Schätzen einer Orientierung der Echos unter Verwendung des aufgezeichneten genauen Ankunftszeitpunkts, der bestimmten Ankunftswinkel und der bekannten Standorte jeder Lautsprecherkomponente (100; 200; 302; 602; 700); o. Gruppieren (924), bei dem Koordinator (304), von Reflexionspunkten in planare Bereiche auf Grundlage von Komplanarität und geschätzten Orientierungen, um einen Standort jeder Reflexionsfläche in der Hörumgebung zu bestimmen (926); und p. Erzeugen (928), bei dem Koordinator (304), eines Modells aller Reflexionsflächen in der Hörumgebung.
  2. Verfahren nach Anspruch 1, wobei der Schritt des Gruppierens von Reflexionspunkten ferner den Schritt des Entfernens von Reflexionspunkten umfasst, von denen bekannt ist, dass sie fehlerhaft sind.
  3. Verfahren nach Anspruch 1, ferner den Schritt des Anwendens des Modells aller Reflexionsflächen in der Hörumgebung auf ein Rauschunterdrückungssystem in dem Netzwerk (300) aus Audio-Video Bridging/Time Synchronized Network (AVB/TSN)-Lautsprechern (100; 200; 302; 602; 700) umfassend.
  4. Verfahren nach Anspruch 1, wobei der Schritt des Fortführens der Schritte des Aufzeichnens eines genauen Ankunftszeitpunkts für jedes Echo des Testimpulses (306) und des Bestimmens eines Ankunftswinkels für jedes Echo des Testimpulses (306) für einen vorbestimmten Zeitraum ferner einen vorbestimmten Zeitraum umfasst, der andauert, bis alle Echos abgeklungen sind.
  5. Verfahren nach Anspruch 1, wobei der Schritt des Fortführens der Schritte des Aufzeichnens eines genauen Ankunftszeitpunkts für jedes Echo des Testimpulses (306) und des Bestimmens eines Ankunftswinkels für jedes Echo des Testimpulses (306) für einen vorbestimmten Zeitraum ferner einen vorbestimmten Zeitraum umfasst, der eine Größe der Hörumgebung berücksichtigt.
  6. Verfahren nach Anspruch 1, wobei das Netzwerk (300 aus Audio-Video Bridging/Time Synchronized Network (AVB/TSN)-Lautsprecherkomponenten (100; 200; 302; 602; 700) ferner zusätzliche Sensoren (108; 208; 708) umfasst, die dazu in der Lage sind, Daten zu sammeln, die Temperatur, Feuchtigkeit und Luftdruck der Hörumgebung sowie die Orientierung jeder Lautsprecherkomponente innerhalb der Hörumgebung darstellen, und wobei die Schritte des Aufzeichnens der genauen Ankunftszeitpunkte und des Bestimmens der Ankunftswinkel ferner das Verwenden von Daten von den zusätzlichen Sensoren umfassen.
  7. Verfahren, das durch einen Prozessor (112) mit einem nicht-flüchtigen Speichermedium zum Speichern von Programmcode ausgeführt wird, wobei das Verfahren die folgenden Schritte umfasst: Bestimmen eines Vorhandenseins und einer Fähigkeit von Netzwerklautsprecherteilnehmern (100; 200; 302; 602; 700) in einer Hörumgebung und Einrichten einer Priorität von Netzwerklautsprecherteilnehmern (100; 200; 302; 602; 700), wobei jeder Netzwerklautsprecherteilnehmer (100; 200; 302; 602; 700) eine erste Mikrofonanordnung (706a) in einer ersten Ebene und eine zweite Mikrofonanordnung (706b) in einer zweiten Ebene, die senkrecht zu der ersten Ebene ist, und mindestens einen zusätzlichen Sensor (108; 208; 708), der eine Schwerkraftvektorrichtung in Bezug auf mindestens eine Anordnung von Mikrofonelementen misst, aufweist; Wählen eines Koordinators (304) aus den Netzwerklautsprecherteilnehmern (100; 200; 302; 602; 700) auf Grundlage der Priorität, wobei der Koordinator (304) einen Medientaktgeberstrom einrichtet und übermittelt; Empfangen des Medientaktgeberstroms an jedem Netzwerklautsprecherteilnehmer (100; 200; 302; 602; 700), wobei sich jeder Netzwerklautsprecherteilnehmer (100; 200; 302; 602; 700) mit dem von dem Koordinator (304) empfangenen Taktgeberstrom synchronisiert und dem Koordinator (304) Synchronisation mitteilt; Festlegen mindestens eines Netzwerklautsprecherteilnehmers (100; 200; 302; 602; 700), um aufeinanderfolgend ein Testimpulssignal (306) zu generieren und einen genauen Zeitpunkt mitzuteilen, zu dem das Testimpulssignal (306) generiert wird; Aufzeichnen von genauen Start- und Endzeitstempeln des Testimpulssignals (306) und anderer gesammelter verfügbarer Umgebungsdaten als Ergebnisse durch jeden Netzwerklautsprecherteilnehmer (100; 200; 302; 602; 700); Aufzeichnen genauer Ankunftszeitpunkte jedes Echos des Testimpulssignals (306) für eine vorbestimmte Zeit durch jeden Netzwerklautsprecherteilnehmer (100; 200; 302; 602; 700); Bestimmen eines Ankunftwinkels jedes Ankunftwinkels jedes Echos des Testimpulssignals (306) in jeder Mikrofonanordnungsebene für die vorbestimmte Zeit durch jeden Netzwerklautsprecherteilnehmer (100; 200; 302; 602; 700); Übertragen der Ergebnisse an den gewählten Koordinator (304); Wiederholen der Schritte des Empfangens, des Festlegens, des Aufzeichnens, des Bestimmens und des Übertragens bis jeder der Netzwerklautsprecherteilnehmer (100; 200; 302; 602; 700) der Reihe nach ein Testimpulssignal (306) generiert hat und der vorbestimmte Zeitraum verstrichen ist; Schätzen der Standorte der Netzwerklautsprecherteilnehmer (100; 200; 302; 602; 700) innerhalb des Netzwerks (300); Bestimmen von Komplanarität und Schätzen einer Orientierung der Echos unter Verwendung des aufgezeichneten genauen Ankunftszeitpunkts, der bestimmten Ankunftswinkel und der geschätzten Standorte jedes Netzwerklautsprecherteilnehmers (100; 200; 302; 602; 700); Gruppieren von Reflexionspunkten in planare Bereiche auf Grundlage von Komplanarität und geschätzter Orientierungen, um einen Standort jeder Reflexionsfläche in der Hörumgebung zu bestimmen; und Erzeugen eines Modells aller Reflexionsflächen in der Hörumgebung.
  8. Verfahren nach Anspruch 7, wobei der Schritt des Gruppierens von Reflexionspunkten ferner das Entfernen von Reflexionspunkten umfasst, von denen bekannt ist, dass sie fehlerhaft sind.
  9. Verfahren nach Anspruch 7, wobei die vorbestimmte Zeit ferner eine vorbestimmte Zeit umfasst, die andauert, bis alle Echos abgeklungen sind.
  10. Verfahren nach Anspruch 7, wobei die vorbestimmte Zeit ferner eine vorbestimmte Zeit umfasst, die eine Größe der Hörumgebung berücksichtigt.
  11. Verfahren nach Anspruch 7, wobei das Netzwerk ferner ein Rauschunterdrückungssystem umfasst und das Verfahren ferner den Schritt des Anwendens des Modells aller Reflexionsflächen in der Hörumgebung auf das Rauschunterdrückungssystem umfasst.
  12. Verfahren nach Anspruch 7, wobei die anderen Umgebungsdaten ferner Umgebungsdaten umfassen, die von Sensoren (108; 208; 708) in dem System gesammelt werden, die aus der Gruppe ausgewählt sind, die aus Temperatur-,Feuchtigkeits-, Luftdrucksensoren, MEMS-Beschleunigungsmessern, Gyroskopen und Magnetometern besteht, und wobei die Schritte des Aufzeichnens genauer Ankunftszeitpunkte und des Bestimmens von Ankunftswinkeln ferner das Verwenden anderer Umgebungsdaten umfasst.
DE102019132544.7A 2018-12-04 2019-11-29 Umgebungserkennung über zeitsynchronisierte vernetzte lautsprecher Active DE102019132544B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/209,814 US10412532B2 (en) 2017-08-30 2018-12-04 Environment discovery via time-synchronized networked loudspeakers
US16209814 2018-12-04

Publications (2)

Publication Number Publication Date
DE102019132544A1 DE102019132544A1 (de) 2020-06-04
DE102019132544B4 true DE102019132544B4 (de) 2023-04-27

Family

ID=70680998

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102019132544.7A Active DE102019132544B4 (de) 2018-12-04 2019-11-29 Umgebungserkennung über zeitsynchronisierte vernetzte lautsprecher

Country Status (2)

Country Link
CN (1) CN111277352B (de)
DE (1) DE102019132544B4 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11741093B1 (en) 2021-07-21 2023-08-29 T-Mobile Usa, Inc. Intermediate communication layer to translate a request between a user of a database and the database
US11924711B1 (en) 2021-08-20 2024-03-05 T-Mobile Usa, Inc. Self-mapping listeners for location tracking in wireless personal area networks

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2375779A2 (de) 2010-03-31 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Vorrichtung und Verfahren zum Messen einer Vielzahl von Lautsprechern und Mikrofonanordnung
EP3148224A2 (de) 2015-09-04 2017-03-29 Music Group IP Ltd. Verfahren zur bestimmung oder verifizierung räumlicher beziehungen in einem lautsprechersystem

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6577738B2 (en) * 1996-07-17 2003-06-10 American Technology Corporation Parametric virtual speaker and surround-sound system
EP1815713B1 (de) * 2004-11-18 2008-07-23 National University of Ireland Galway Synchronisierung von mehrkanallautsprechern über ein netzwerk
CN109691139B (zh) * 2016-09-01 2020-12-18 安特卫普大学 确定个性化头部相关传递函数和耳间时间差函数的方法和设备
US10075791B2 (en) * 2016-10-20 2018-09-11 Sony Corporation Networked speaker system with LED-based wireless communication and room mapping

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2375779A2 (de) 2010-03-31 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Vorrichtung und Verfahren zum Messen einer Vielzahl von Lautsprechern und Mikrofonanordnung
EP3148224A2 (de) 2015-09-04 2017-03-29 Music Group IP Ltd. Verfahren zur bestimmung oder verifizierung räumlicher beziehungen in einem lautsprechersystem

Also Published As

Publication number Publication date
CN111277352A (zh) 2020-06-12
DE102019132544A1 (de) 2020-06-04
CN111277352B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
US10412532B2 (en) Environment discovery via time-synchronized networked loudspeakers
US10425759B2 (en) Measurement and calibration of a networked loudspeaker system
US7558156B2 (en) Acoustic location and enhancement
DE102019132544B4 (de) Umgebungserkennung über zeitsynchronisierte vernetzte lautsprecher
US20210058700A1 (en) Array microphone and sound collection method
CN101567969B (zh) 基于麦克风阵列声音制导的智能视频导播方法
CN105451151B (zh) 一种处理声音信号的方法及装置
US9380400B2 (en) Optimizing audio systems
RU2543937C2 (ru) Оценка положений громкоговорителей
US20050254662A1 (en) System and method for calibration of an acoustic system
DE102019129330A1 (de) Konferenzsystem mit einem Mikrofonarray-System und Verfahren zur Spracherfassung in einem Konferenzsystem
JP4365857B2 (ja) アレイ型音響システムのセットアップ方法
US20160105758A1 (en) Sound source replication system
US9538156B2 (en) System and method for providing 3D sound
CN107820037B (zh) 音频信号、图像处理的方法、装置和系统
Sur et al. Autodirective audio capturing through a synchronized smartphone array
JP2012211910A (ja) 単一装置上の位置決定(pod)ならびにpodを利用する自律型超音波位置決定システムおよびその方法
US20100208903A1 (en) Audio module for the acoustic monitoring of a surveillance region, surveillance system for the surveillance region, method for generating a sound environment, and computer program
CN115019825A (zh) 面向地下隧道环境的声信道数字孪生方法、装置和系统
US20230232153A1 (en) A sound output unit and a method of operating it
CN105979469A (zh) 一种录音处理方法及终端
US10861465B1 (en) Automatic determination of speaker locations
DE102014200434A1 (de) Verfahren zum Abgleich eines Ortungssystems, Verfahren zum Orten eines Objekts und Ortungssystem
US8644520B2 (en) Morphing of aural impulse response signatures to obtain intermediate aural impulse response signals
DE102016011772A1 (de) Lokalisierungsverfahren, zugehörige Vorrichtung und Verwendung einer Software

Legal Events

Date Code Title Description
R163 Identified publications notified
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final